Python网络数据采集---O'Reilly出版---穿山甲封面---经典入门教程
时间:2019-05-29
大小:16.7MB
阅读数:2138
查看他发布的资源
资料介绍
每时每刻,搜索引擎和网站都在采集大量信息,非原创即采集。采集信息用的程序一般被
称为网络爬虫(Web crawler)、网络铲(Web scraper,可类比考古用的洛阳铲)、网络蜘
蛛(Web spider),其行为一般是先“爬”到对应的网页上,再把需要的信息“铲”下来。
O’Reilly 这本书的封面图案是一只穿山甲,
图灵公司把这本书的中文版定名为“Python 网
络数据采集”。当我们看完这本书的时候,觉得网络数据采集程序也像是一只辛勤采蜜的
小蜜蜂,它飞到花(目标网页)上,采集花粉(需要的信息),经过处理(数据清洗、存
储)变成蜂蜜(可用的数据)。网络数据采集可以为生活加点儿蜜,亦如本书作者所说,
“网络数据采集是为普通大众所喜闻乐见的计算机巫术”
版权说明:本资料由用户提供并上传,仅用于学习交流;若内容存在侵权,请进行举报,或
联系我们 删除。