#每日一书#

9.13 社交网站的数据挖掘与分析

社交网站的数据挖掘与分析

这本书我我拿到手上2016年,其实原书出版是早于2012年的,这都10年时间了,内容还是社交网站的数据挖掘与分析,肯定是很过时了。

这本书是Mining the Social Web的中文版,翻译质量不敢恭维,我是为什么要看这本书呢,好像是当时在做微博数据相关的爬取和抽取,想看看案例就买了这本书。

这里其实有介绍爬取,还介绍了获取数据的更多方法,包括了官方API的使用等。

书中总共介绍了8个社交网络的数据挖掘,包括了Twitter,Facebook,linkedIn,Google+,博客,邮箱,Github和语义网(知识图谱)。

上面有的服务已经不在了,像Google+,还有的已经改了名字,像语义网。 不过,分析方法没多少的变化。我其实也见到了很多围绕这些社交网络做的数据分析平台,以前是微博,现在长视频和短视频。

其实很多时候,数据分析也可以成为做bugbounty一个非常重要的步骤,在Recon的时候,非常必要。比如,对github的针对性的挖掘,各大厂商都会定时的服务来扫描github,看看是否有信息泄露等风险。

当然,我们也可以用这些数据做其他的分析,包括个人的动态,公司的技术栈,非常多的东西都可以聚会起来,后面能干的事情就很多,我经常收到通过分析github来招聘的邮件,这也是针对性招聘的一个尝试,当然这也可以用来做营销推广等其他的事情。

你学了数据挖掘,你会发现,算法真的比你懂你。我还认为,做AI的,还是需要懂点数据爬取等技术,玩玩bs4和scrapy这些东西就好,当然优秀的数据处理能力是必须的。 总的来说,这本书有点过时,想学数据挖掘,可以跟进最新的一些书。
评论加载中...