原创 云计算分布式大数据Hadoop入门经典培训

2013-6-8 16:40 1234 27 27 分类: 消费电子

云计算分布式大数据Hadoop入门经典培训

一:课程简介:

Hadoop天生是解决大数据高并发问题的, 是一个能够对海量数据进行分布式处理的软件框架。互联网企业、金融机构、政府组织和云计算服务企业每天都会产生大量的数据并面临高并发的严峻考验,传统的关系型数据库已经无法满足大数据量高并发的要求,作为云计算实现规范和实施标准的Hadoop应运而生。

使用Hadoop,用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的、高效的、可伸缩的,能够使用普通的社区服务器出来PB级别的数据,是分布式大数据处理的存储的理想选择。

“云计算分布式大数据Hadoop入门经典”基于实务经验萃取而成,从零起步,Hadoop开发环境的搭建到到图片服务器、WordCount实现、HBase微博系统、话单查询与统计

课程以MapReduce、HBase为主轴,带你遨游于云计算的梦幻世界。

二:课程特色

  1. 案例驱动教学,全程项目实战训练;
  2. 从零起步,循序渐进,细致剖析每一个知识;
  3. 萃取出实际开发中最常用、最实用的内容并以深入浅出的方式把难点化于无形之中
01.jpg

 

中国电子标准协会http://www.ways.org.cn

三:适合对象:

   软件工程师;

    数据库开发人员;

    网络后台开发人员;

    运维人员;

四:基础要求

   了解Linux系统;

    了解网络;

    了解Java;

五:培训内容

 

 

时间

内容

备注

第一天

第1个主题:Hadoop思考

1.Hadoop的设计目标和适用场景

2.Hadoop架构解析

3.MapReduce工作原理和案例说明

 

第2个主题: Hadoop安装和配置实战

1. 安装和配置单机版Hadoop实战

2. 安装和配置伪分布式Hadoop实战

3.安装和配置分布式Hadoop集群实战

 

第3个主题:HDFS

1. HDFS命令行操作实战

2. HDFS的配置管理

3. NameNode的工作机制

 

第4个主题:HDFS案例实战

1. HDFS案例的分析和设计

2. 环境搭建

3.使用Hadoop Java API实现对HDFS写入、读取、删除文件等操作

 

第5个主题:MapReduce剖析

1. MapReduce的原理和运行过程  

2. 构建MapReduce的开发环境

 

第6个主题:MapReduce案例实战

1. 使用MapReduce的Java接口实现经典的WordCount 

2. wordcount运行过程解析

3. MapReduce实现数据去重操作

4. MapReduce实现数据排序

5. MapReduce实现数据平均数据的计算

 

 

时间

内容

备注

 

 

 

 

 

 

 

 

 

 

 

 

 

 

第二天

第1个主题:HBase架构设计和实现剖析

1. HBase架构设计

2. HBase中的表结构等

3. HBase:Master、Region、Region Server

 

第2个主题:HBase案例实战1---使用HBase实现微博系统

1. 项目架构和设计

2. 开发环境搭建

3. 实现用户登录和注销

4.“关注”功能的设计和实现

5.“发微博”功能的设计和实现

6.发布和运行整个基于HBase的微博系统

 

第3个主题:HBase与MapReduce

1. HBase与MapReduce的关系

2. HBase如何使用MapReduce

 

第4个主题:HBase案例实战2---话单查询与统计

1. 项目架构设计

2. 开发环境搭建

3. 话单入库和查询的设计与实现

4.统计功能的设计与实现

 

 

文章评论0条评论)

登录后参与讨论
我要评论
0
27
关闭 站长推荐上一条 /2 下一条