资料
  • 资料
  • 专题
Hadoop数据分析(英文版)
推荐星级:
时间:2019-06-14
大小:6.1MB
阅读数:387
上传用户:JC丶
查看他发布的资源
下载次数
1
所需E币
2
ebi
新用户注册即送 300 E币
更多E币赚取方法,请查看
close
资料介绍
通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;第二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。 书中主要内容如下: •Hadoop和集群计算背后的核心概念 •使用设计模式和并行分析算法创建分布式数据分析作业 •在分布式环境下使用Apache Hive和HBase进行数据管理、数据挖掘和数据仓储 •使用Sqoop和Apache Flum e从关系数据库采集数据 •使用Apache Pig和Spark DataFrame编写复杂的Hadoop和Spark应用程序 •通过Spark MLlib运用分类、聚类和协同过滤等机器学习技术
版权说明:本资料由用户提供并上传,仅用于学习交流;若内容存在侵权,请进行举报,或 联系我们 删除。
PARTNER CONTENT
相关评论 (下载后评价送E币 我要评论)
没有更多评论了
  • 可能感兴趣
  • 关注本资料的网友还下载了
  • 技术白皮书