云计算分布式大数据Hadoop企业级开发动手实战培训
一:课程简介:
Hadoop天生是解决大数据高并发问题的, 是一个能够对海量数据进行分布式处理的软件框架。互联网企业、金融机构、政府组织和云计算服务企业每天都会产生大量的数据并面临高并发的严峻考验,传统的关系型数据库已经无法满足大数据量高并发的要求,作为云计算实现规范和实施标准的Hadoop应运而生。
使用Hadoop,用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的、高效的、可伸缩的,能够使用普通的社区服务器出来PB级别的数据,是分布式大数据处理的存储的理想选择。
“云计算分布式大数据Hadoop企业级开发动手实战”基于实务经验萃取而成,站在初学者的角度循序渐进的在实验的基础上前进,带你轻松驾驭Hadoop
课程以MapReduce、HBase、Hive为主轴,想理解和使用Hadoop,就必须掌握这三大核心。
中国电子标准协会http://www.ways.org.cn
二:课程特色
三:适合对象:
软件工程师;
数据库开发人员;
网络后台开发人员;
运维人员;
四:基础要求
了解Linux系统;
了解网络;
了解Java;
五:培训内容
时间 |
内容 |
备注 |
第一天 |
第1个主题:Hadoop思考 1、 Hadoop产生背景 2、 Hadoop在大数据、云计算中的位置和关系 3、 国内外Hadoop应用案例介绍 4、 国内Hadoop的就业情况分析 5、 Hadoop生态圈以及各组成部分的简介 6、 Hadoop核心MapReduce例子说明
第2个主题: Hadoop安装和配置实战 1. 安装和配置单机版Hadoop实战 2. 安装和配置伪分布式Hadoop实战 3.安装和配置分布式Hadoop集群实战
第3个主题:HDFS
1、 分布式文件系统DFS简介
第4个主题: MapReduce
1、 如何理解map、reduce计算模型
|
|
时间 |
内容 |
备注 |
第二天 |
第1个主题:高级MapReduce
1、 使用压缩分隔减少输入规模 第2个主题:Hadoop集群与管理
1、 Hadoop集群的搭建
第3个主题:HBase
1、 HBase定义 |
|
时间 |
内容 |
备注 |
第三天 |
第1个主题:HBase集群及其管理
1、 集群的搭建过程讲解 第2个主题:HBase客户端
1、 HBase Shell以及演示
|
|
时间 |
内容 |
备注 |
第四天 |
第1个主题:Hive
1、 数据仓库基础知识
第2个主题:HiveQL
1、 HiveQL定义
第3个主题:Hadoop开发者之路 1. Hadoop技能模型 2. Hadoop开发者最佳学习路线和方式 3.Hadoop开发者最佳成长路线
|
|
文章评论(0条评论)
登录后参与讨论