全部
  • 全部
  • 标题
  • 简介
  • TAG
Python网络数据采集---O'Reilly出版---穿山甲封面---经典入门教程
时间:2019-05-29
大小:16.7MB
阅读数:311
上传用户:追忆流年寻梦少年
查看他发布的资源
下载次数
12
所需E币
1
资料介绍
每时每刻,搜索引擎和网站都在采集大量信息,非原创即采集。采集信息用的程序一般被 称为网络爬虫(Web crawler)、网络铲(Web scraper,可类比考古用的洛阳铲)、网络蜘 蛛(Web spider),其行为一般是先“爬”到对应的网页上,再把需要的信息“铲”下来。 O’Reilly 这本书的封面图案是一只穿山甲, 图灵公司把这本书的中文版定名为“Python 网 络数据采集”。当我们看完这本书的时候,觉得网络数据采集程序也像是一只辛勤采蜜的 小蜜蜂,它飞到花(目标网页)上,采集花粉(需要的信息),经过处理(数据清洗、存 储)变成蜂蜜(可用的数据)。网络数据采集可以为生活加点儿蜜,亦如本书作者所说, “网络数据采集是为普通大众所喜闻乐见的计算机巫术”
3
收藏 举报
相关评论 (下载后评价送E币 我要评论)
  • 可能感兴趣
  • 关注本资料的网友还下载了
  • 技术白皮书