#每日一书#
11.9 Python网络数据采集
Python网络数据采集
这本书我是在图灵买的电子书,还是比较方面。爬虫方面,感觉大家都可以学一下,当然不是为了当什么爬虫工程师,做数据采集确实可以用用。
这本书重点在采集上和数据清洗上,爬虫只是一部分。学了这个,应该可以入个门,爬虫主要是讲BeautifulSoup,然后就是接受怎么用API爬取,存储数据,最后是怎么做数据清洗。
最后也介绍采集的时候,需要注意的一些点。常见的防御措施和bypass措施。当然最重要的就是根据实际的需求去学和实践。 实际去爬的时候,你会遇到很多需要处理的事情,这也是一种攻防对抗,后面也变成了一种平衡。
这本书,做数据相关的人可以看下。
11.9 Python网络数据采集
Python网络数据采集
这本书我是在图灵买的电子书,还是比较方面。爬虫方面,感觉大家都可以学一下,当然不是为了当什么爬虫工程师,做数据采集确实可以用用。
这本书重点在采集上和数据清洗上,爬虫只是一部分。学了这个,应该可以入个门,爬虫主要是讲BeautifulSoup,然后就是接受怎么用API爬取,存储数据,最后是怎么做数据清洗。
最后也介绍采集的时候,需要注意的一些点。常见的防御措施和bypass措施。当然最重要的就是根据实际的需求去学和实践。 实际去爬的时候,你会遇到很多需要处理的事情,这也是一种攻防对抗,后面也变成了一种平衡。
这本书,做数据相关的人可以看下。