| Hadoop简介和生态系统介绍 | 
传统大规模数据分析存在的问题Hadoop概述Hadoop与分布式文件系统Hadoop生态系统Hadoop的行业应用案例分析Hadoop在云计算和大数据的位置和关系Hadoop版本介绍Hadoop与Google FS的关系Hadoop在国内的使用情况和未来 | 
| Hadoop安装和主要配置文件介绍 | 
Hadoop安装所需软件介绍Hadoop单机安装Hadoop伪分布式安装Hadoop完全分布式安装Hadoop三个节点安装的配置介绍Hahoop多节点ssh配置Hadoop格式化详解Hadoop核心配置文件介绍核心配置文件core-site.xmlHDFS配置文件hdfs-site.xmlMapreduce配置文件mapred-site.xmlmaster文件配置详解slave文件配置详解Hadoop启动和停止方法一
                            
start-all.sh详解stop-all.sh详解Hadoop的启动和停止方法二
                            
Hadoop安装的常见错误介绍和解决方案使用自带的wordcount和pi测试集群安装是否成功使用Streaming来测试集群安装是否成功 | 
| Hadoop组件介绍 | 
Hadoop NameNode 介绍Hadoop SecondaryNameNode介绍Hadoop DataNode 介绍Hadoop JobTracker 介绍Hadoop TaskTracker 介绍 | 
| Hadoop的HDFS模块 | 
HDFS架构介绍HDFS原理介绍NameNode功能详解DataNode功能详解SecondaryNameNode功能详解HSFD的fsimage和editslog详解HDFS的block详解HDFS的block的备份策略Hadoop的机架感知配置HDFS的shell命令介绍HDFS的thrift server服务介绍HDFS的API接口介绍HDFS的权限详解Hadoop的客服端接入案例 | 
| MapReducer入门 | 
Mapreduce原理MapReduce流程剖析一个MapReduce程序Mapper和Reducer抽象类详解Mapreduce的最小驱动类MapReduce自带的类型自定义Writables和WritableComparablesMapreduce的输入InputFormatsMapReduce的输出OutputFormatsCombiner详解Partitioner详解DistributeFileSystem详解Hadoop Tools工具介绍Counter计数器详解自定义Counter计数器基于Hadoop二次开发实战MapReduce的优化Map和Reduce的个数设置Hadoop小文件优化任务调度默认的任务调度公平任务调度能力任务调度使用 Hadoop MapReduce Streaming 编程MapReduce的单元测试 | 
| Hive | 
Hive和Pig基础Hive、Impala和presto的比较Hive的作用和原理说明Hadoop仓库和传统数据仓库的协作关系Hadoop/Hive仓库数据数据流Hive部署和安装HiveCli的基本用法Hive的server启动HQL基本语法Hive的加载数据本地加载和HDFS加载Hive的partition详解Hive的存储方式详解RCFILE、TEXTFILE和SEQUEUEFILEHive的UDF和UDAFHive的transform详解Hive的JDBC连接 | 
| Sqoop介绍 | 
Sqoop是什么Sqoop安装Sqoop把mysql数据导入HDFSSqoop把HDFS数据导入MysqlSqoop吧Mysql数据导入HiveSqoop吧Mysql数据导入Hive分区 | 
| Hadoop集群配置和维护 | 
Hadoop集群的部署要点NameNode和SecondaryNameNode和JobTracker机器的配置要求dataNode与tasktracker机器的配置要求Hadoop集群管理的工具介绍Ganglia和nigos监控Hadoop集群介绍Ambri介绍添加和删除节点演示Namenode的单点解决方案NameNode的NFS备份介绍集群所有dataNode挂掉的故障介绍集群NameNode的fsimage丢掉恢复方法Hadoop集群维护的注意点 | 
| Hbase使用 | 
Hbase原理Hmaster详解RegionServer详解Zookeeper介绍Hbase安装Hbase逻辑视图介绍Hbase物理视图介绍Hbase的二级索引介绍Hbase的DDL和DMLHbase表的设计案例Hbase的import功能介绍MapReduce操作HbaseHbase的thriftServer介绍Hbase的API介绍Hbase使用场景介绍Hbase案例分析 | 
| 大数据在国内的运用 | 
大数据在国内的使用介绍离线计算框架介绍流式计算框架介绍内存计算框架介绍内存流式计算介绍大数据实时请求框架介绍大数据在移动的案例介绍大数据在银行的案例介绍大数据在阿里的案例介绍 | 
| Spark生态介绍 | 
Spark产生背景Spark(内存计算框架)SparkSteaming(流式计算框架)SparkSQL(ad-hoc)Mllib(MachineLearning)GraphX(bagel将被代) | 
| spark安装部署 | 
Spark安装简介Spark的源码编译SparkStandalone安装SparkStandaloneHA安装Spark应用程序部署工具spark-submit | 
| Spark运行架构和解析 | 
Spark的运行架构基本术语运行架构SparkonStandalone运行过程SparkonYARN运行过程Spark运行实例解析SparkonStandalone实例解析SparkonYARN实例解析 | 
| SparkSQL原理和实践 | 
SparkSQL原理SparkSQL的Catalyst优化器SparkSQL内核SparkSQL和HiveSparkSQL的实例和编程SparkSQL的实例操作demoSparkSQL的编程  |