资料
  • 资料
  • 专题
Python网络数据采集---O'Reilly出版---穿山甲封面---经典入门教程
时间:2019-05-29
大小:16.7MB
阅读数:2138
上传用户:追忆流年寻梦少年
查看他发布的资源
下载次数
23
所需E币
1
ebi
新用户注册即送 300 E币
更多E币赚取方法,请查看
close
资料介绍
每时每刻,搜索引擎和网站都在采集大量信息,非原创即采集。采集信息用的程序一般被 称为网络爬虫(Web crawler)、网络铲(Web scraper,可类比考古用的洛阳铲)、网络蜘 蛛(Web spider),其行为一般是先“爬”到对应的网页上,再把需要的信息“铲”下来。 O’Reilly 这本书的封面图案是一只穿山甲, 图灵公司把这本书的中文版定名为“Python 网 络数据采集”。当我们看完这本书的时候,觉得网络数据采集程序也像是一只辛勤采蜜的 小蜜蜂,它飞到花(目标网页)上,采集花粉(需要的信息),经过处理(数据清洗、存 储)变成蜂蜜(可用的数据)。网络数据采集可以为生活加点儿蜜,亦如本书作者所说, “网络数据采集是为普通大众所喜闻乐见的计算机巫术”
版权说明:本资料由用户提供并上传,仅用于学习交流;若内容存在侵权,请进行举报,或 联系我们 删除。
相关评论 (下载后评价送E币 我要评论)
加载更多评论
  • 可能感兴趣
  • 关注本资料的网友还下载了
  • 技术白皮书