原创 云计算分布式大数据Hadoop企业级开发动手实战培训

2013-6-8 16:35 1255 24 24 分类: 消费电子

云计算分布式大数据Hadoop企业级开发动手实战培训

一:课程简介:

Hadoop天生是解决大数据高并发问题的, 是一个能够对海量数据进行分布式处理的软件框架。互联网企业、金融机构、政府组织和云计算服务企业每天都会产生大量的数据并面临高并发的严峻考验,传统的关系型数据库已经无法满足大数据量高并发的要求,作为云计算实现规范和实施标准的Hadoop应运而生。

使用Hadoop,用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的、高效的、可伸缩的,能够使用普通的社区服务器出来PB级别的数据,是分布式大数据处理的存储的理想选择。

“云计算分布式大数据Hadoop企业级开发动手实战”基于实务经验萃取而成,站在初学者的角度循序渐进的在实验的基础上前进,带你轻松驾驭Hadoop

课程以MapReduce、HBase、Hive为主轴,想理解和使用Hadoop,就必须掌握这三大核心。

01.jpg

 

中国电子标准协会http://www.ways.org.cn

二:课程特色

  1. 案例驱动教学,全程项目实战训练;
  2. 全面掌握Hadoop的架构原理和使用场景,涵盖分布式计算的经典常用算法;
  3. 规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对Hadoop集群进行管理和优化。

三:适合对象:

   软件工程师;

    数据库开发人员;

    网络后台开发人员;

    运维人员;

四:基础要求

   了解Linux系统;

    了解网络;

    了解Java;

 

五:培训内容

 

 

时间

内容

备注

第一天

第1个主题:Hadoop思考

1、 Hadoop产生背景

2、 Hadoop在大数据、云计算中的位置和关系

3、 国内外Hadoop应用案例介绍

4、 国内Hadoop的就业情况分析

5、 Hadoop生态圈以及各组成部分的简介

6、 Hadoop核心MapReduce例子说明

 

第2个主题: Hadoop安装和配置实战

1. 安装和配置单机版Hadoop实战

2. 安装和配置伪分布式Hadoop实战

3.安装和配置分布式Hadoop集群实战

 

第3个主题:HDFS

1、 分布式文件系统DFS简介
2、 HDFS的系统组成介绍
3、 HDFS的组成部分详解
4、 副本存放策略及路由规则
5、 命令行接口
6、 Java接口
7、 客户端与HDFS的数据流讲解
8、 HDFS的可用性(HA)

 

第4个主题: MapReduce

1、 如何理解map、reduce计算模型
2、 剖析伪分布式下MapReduce作业的执行过程
3、 序列化
4、 MapReduce的类型与格式
5、 MapReduce开发环境搭建
6、 MapReduce应用开发
7、 更多示例讲解,熟悉MapReduce算法原理

 

 

时间

内容

备注

 

 

 

 

 

 

 

 

 

 

 

 

 

 

第二天

第1个主题:高级MapReduce

1、 使用压缩分隔减少输入规模
2、 利用Combiner减少中间数据
3、 编写Partitioner优化负载均衡
4、 MapReduce优化
5、 编程实战

第2个主题:Hadoop集群与管理

1、 Hadoop集群的搭建
2、 Hadoop集群的监控
3、 Hadoop集群的管理
4、 集群下运行MapReduce程序

 

第3个主题:HBase

1、 HBase定义
2、 HBase与RDBMS的对比
3、 数据模型
4、 系统架构
5、 HBase上的MapReduce
6、 表的设计

 

时间

内容

备注

第三天

第1个主题:HBase集群及其管理

1、 集群的搭建过程讲解
2、 集群的监控
3、 集群的管理

第2个主题:HBase客户端

1、 HBase Shell以及演示
2、 Java客户端以及代码演示

 

 

时间

内容

备注

第四天

第1个主题:Hive

1、 数据仓库基础知识
2、 Hive定义
3、 Hive体系结构简介
4、 Hive集群
5、 客户端简介

 

第2个主题:HiveQL

1、 HiveQL定义
2、 HiveQL与SQL的比较
3、 数据类型
4、 表与表分区概念
5、 表的操作与CLI客户端演示
6、 数据导入与CLI客户端演示
7、 查询数据与CLI客户端演示
8、 数据的连接与CLI客户端演示
9、 用户自定义函数(UDF)的开发与演示

 

第3个主题:Hadoop开发者之路

1. Hadoop技能模型

2. Hadoop开发者最佳学习路线和方式

3.Hadoop开发者最佳成长路线

 

 

 

 

文章评论0条评论)

登录后参与讨论
我要评论
0
24
关闭 站长推荐上一条 /2 下一条