#每日一书#

11.9 Python网络数据采集

Python网络数据采集

这本书我是在图灵买的电子书,还是比较方面。爬虫方面,感觉大家都可以学一下,当然不是为了当什么爬虫工程师,做数据采集确实可以用用。

这本书重点在采集上和数据清洗上,爬虫只是一部分。学了这个,应该可以入个门,爬虫主要是讲BeautifulSoup,然后就是接受怎么用API爬取,存储数据,最后是怎么做数据清洗。

最后也介绍采集的时候,需要注意的一些点。常见的防御措施和bypass措施。当然最重要的就是根据实际的需求去学和实践。 实际去爬的时候,你会遇到很多需要处理的事情,这也是一种攻防对抗,后面也变成了一种平衡。

这本书,做数据相关的人可以看下。
评论加载中...