摘要: 本文主要介绍七本关于机器学习和数据科学数学基础的经典教材,是一份不可多得的书单整理。
首先要明确一点,我们为什么要为学习数据科学的数学基础而努力呢?以下是激励我的原因:
人工智能正在快速的改变着世界。Geoffrey Hinton大牛使得我们重新对BP算法有了新的思考。
理解背后的数学原理会帮助你更好地理解人工智能的变革。它将帮助你从深度上理解人工智能,与那些浅尝辄止的研究者区分开来。
它还将帮助你更好地了解人工智能知识产权(IP)的潜力。
最后,理解数据科学背后的数学知识也能引导你进入人工智能和数据科学更高端的工作。
1.统计学习理论的本质(The Nature Of Statistical Learning Theory)——Vladimir Vapnik
在数学界中,如果你想创建一个关于数学书的列表并不包括伟大的俄国数学家,那是不可能的。所以,在本文列表中的第一本书籍自然而然就是由Vladimir Vapnik编写的统计学习理论。该书是七本书中最难找到的一本,当然,在中国这都不是事儿。Vladimir Vapnik也是支持向量机(SVM)算法的创造者,其维基百科页面上介绍了很多关于他的工作。
2.模式分类(Pattern Classification)——Richard O Duda
类似于Vladimir Vapnik的书,Duda是另一个时代的经典书籍。首次发表于1973年,在25年后(2000年)得到更新,之后再也没有进行更新,但这并不妨碍本书成为一本重要的书籍。该书采用模式识别的方法,并涵盖了大量的算法。
3.机器学习:算法透视(Machine Learning: An Algorithmic Perspective,Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition))——Stephen Marsland
4.统计学习要素:数据挖掘、推理和预测(The Elements of Statistical Learning: Data Mining,Inference,and Prediction,Second Edition)——Trevor Hastie,Robert Tibshirani,Jerome Friedman
5.模式识别与机器学习(Pattern Recognition and Machine Learning (Information Science and Statistics))——Christopher M. Bishop
我喜欢Peter Flach的书籍,尽管购物网站上的一些评论说其有些冗长并缺少代码,但我喜欢其整本书的布局(算法的分组:逻辑模型、线性模型以及概率模型)和主题的整体处理。
7.深度学习(Deep Learning)——Goodfellow、Bengio和 Corville
该书也被称作“花书”,内容很详细且知识新,涵盖你能想到的一切知识点。
两个值得推荐的其它资源:
机器学习的第一门课程(A First Course in Machine Learning,Second Edition (Machine Learning & Pattern Recognition))——Simon Rogers、Mark Girolami
这本书有第一版和第二版,其中第一版是我得到的第一本书,但我不建议初学者看这本书,但这不妨碍该书是本好书(尤其是第二版)。
该书评价很高,但我没有亲自阅读它,因此没有放在列表中。
总结
书籍是永恒的,也是不会抛弃自己的朋友,一直在那里等着你去相遇、相识。Vladimir Vapnik现在已经81岁高龄,Duda这本书首次出版与1973年,我估计50年后,这个行业的从业者仍将阅读它们,就像经受住时间考验的老朋友一样。这展示了基于数学方法的寿命,永不褪色和凋零!
Ajit Jaokar,数据科学家、教师
文章原标题《7 Books to Grasp Mathematical Foundations of Data Science and Machine Learning》,译者:海棠,审校:Uncle_LLD。