#每日一书#

9.29 大数据时代的算法

大数据时代的算法:机器学习,人工智能及其典型实例

机器学习相关的书还介绍2本,10月开新坑,介绍其他方面的书。今天这本书我是2017年入手的,总体来说就是介绍各种算法,而且是传统的机器学习算法。

它并不分方向来介绍模型,而是只介绍算法,像最基础的各种距离,各种排序,到各种编码。然后就是数据查找算法,海量数据会使用的布隆过滤器,倒排,银行间和背包,感觉像是在刷题一样,哈哈。

除了最基础的算法外,这本书的一个特点就是有介绍一些机器学习的基础算法,像相似度算法,就介绍了Jaccard,MinHash,空间向量模型,cos相似度等等,这确实是做IR 必学的。

分类介绍了朴素贝叶斯,Adaboost,SVM,KNN,聚类介绍了距离和KM,DBSCAN等等,这些我几乎都实现过,也是一种蛮好的体验。

然后就到了数据预测和估算算法,这才算机器学习,介绍了KNN,隐马尔科夫,条件随机场,最后就是数据决策,包括了ID3,C4.5,分类回归树,随机森林和Apriori。然后本书最后还拿一章介绍推荐算法,主要是介绍协同过滤等

感觉这书介绍得蛮全面的,就是因为这种全面导致这200页的书,很不全面,基本都是一笔带过,也没有详细的例子,确实需要读者去扩展。

说实话,我对这些算法还有点了解,读这本书的时候才没有这么难,如果真的一个入门的人来说,肯定体验不会好。 我都见过专门介绍SVM,都能介绍一本书的,现在面试应该不会让你手写SVM公式了,但是基本的算法还是应该了解的。

这本书不推荐,基础的数据结构和算法有更好的书,机器学习基础也有更好的书,这本书确实有点杂糅了,如果真的一个一个的代码例子,那会好很多。
评论加载中...