| 一、  大数据处理平台架构基础 | 1. 大数据的产生背景、发展历程 2.  大数据和云计算的关系
 3. 大数据应用需求以及潜在价值分析
 4. 业界最新的大数据技术发展态势与应用趋势
 5.  大数据项目的技术选型与大数据处理系统架构设计
 6.  “互联网+”时代下的电子商务、制造业、零售批发业、电信运营商、互联网金融业、网上银行、电子政务、移动互联网、教育信息化等行业应用实践与应用案例剖析
 | 
| 二、  业界主流的大数据技术产品与项目解决方案 | 7. 国内外主流的大数据解决方案介绍 8.  当前大数据解决方案与传统数据库方案的剖析比较
 9. Apache大数据平台方案剖析
 10. CDH大数据平台方案剖析
 11.  HDP大数据平台方案剖析
 12. 开源的大数据生态系统平台剖析
 | 
| 三、  Hadoop大数据平台核心技术剖析 | 13. Hadoop的发展历程以及产业界的实际应用介绍 14.  Hadoop大数据平台架构
 15. 基于Hadoop平台的PB级大数据存储管理与分析处理的工作原理与机制
 16.  Hadoop的核心组件剖析
 | 
| 四、  大数据分布式存储系统原理及其应用实践 | 17. 分布式文件系统HDFS的简介 18.  HDFS系统的主从式平台架构和工作原理
 19. HDFS核心组件技术讲解
 20. 基于HDFS的大型存储系统应用开发实战
 21.  HDFS集群的安装、部署、配置与性能优化实践
 22. HDFS与Linux NFS3交互技术以及本地化挂载部署应用实践
 23.  分布式键值存储系统的平台架构、核心技术以及应用开发
 24. PB及大数据存储系统的项目案例分析
 | 
| 五、  大数据并行处理框架MapReduce与Yarn技术实践 | 25. MapReduce并行计算模型 26.  MapReduce作业执行与调度技术
 27. 第二代大数据处理框架Yarn的工作原理及DAG并行执行机制
 28.  MapReduce应用开发环境的部署,以及大数据并行处理应用程序开发
 29. MapReduce高级编程技巧与性能优化实践
 30.  MapReduce与Yarn大数据分析处理案例分析
 | 
| 六、  Hadoop大数据处理高性能应用开发实践操作训练 | 31. 部署与配置HDFS,熟练操作HDFS  SHELL,HDFS与NFS操作,以及HDFS API开发实践 32. 部署与配置MapReduce与Yarn及其开发实践
 33.  Hadoop的Linux二次开发环境部署与配置
 | 
| 七、  HBase分布式数据库管理系统 | 34.  NoSQL数据库与NewSQL数据库技术介绍,及其在半结构化和非结构化大数据方面的应用实践 35.  HBase分布式数据库简介、数据模型以及工作原理
 36. HBase分布式数据库集群的平台架构和关键技术剖析
 37.  HBase应用项目开发技巧,以及客户端开发实战
 38. HBase表设计与数据操作以及数据库管理API调用
 39.  HBase集群的安装部署与配置优化
 40. ZooKeeper分布式协调服务系统的工作原理、平台架构、集群部署与配置应用实战
 41.  HBase集群的运维与监控管理
 
   | 
| 八、 HBase应用实践操作训练 | 42.  部署与配置HBase集群以及HBase的性能优化 43. 部署与配置ZooKeeper分布式集群
 44.  构建HBase开发环境
 45. HBase数据库二次开发项目实践
 | 
| 九、 大型数据仓库Hive集群平台 | 46.  基于Hadoop的大型分布式数据仓库基础知识,HIVE在行业中的数据仓库应用案例 47. Hive大数据仓库简介以及应用介绍
 48.  Hive数据仓库集群的平台体系结构、核心技术剖析
 49. Hive Server的工作原理、机制与应用
 50.  Hive数据仓库集群的安装部署与配置优化
 51. Hive应用开发技巧
 52. Hive SQL剖析与应用实践
 53.  Hive数据仓库表与表分区、表操作、数据导入导出、客户端操作技巧
 54. Hive数据仓库报表设计
 55. Hive  JDBC与ODBC的工作原理与实现机制
 56. Hive HWI、CLI客户端操作以及UDF应用实践
 
 | 
| 十、 Hive应用实践操作训练 | 57.  部署与配置HIVE集群,以及HIVE性能调优 58. 构建HIVE开发环境
 59. HIVE数据仓库操作项目实践
 | 
| 十一、  Spark大数据实时处理平台剖析 | 60.  Spark的发展历程以及业界的实际应用介绍 61. Spark实时大数据处理平台架构
 62. Spark  RDD内存弹性分布式数据集的工作原理与机制
 63. Spark的核心组件剖析
 64.  基于Spark的实时数据仓库与实时分析挖掘处理在行业中的应用实践案例
 | 
| 十二、 Spark应用实践操作训练 | 65.  部署与配置Spark集群,以及Spark性能调优 66. 构建Spark开发环境
 67. Spark程序运行以及操作
 | 
| 十三、  基于Spark的实时数据仓库和实时数据分析挖掘处理平台的实现机制, Spark SQL,Spark  Streaming,MLib,GraphX,SparkR的应用实践 | 68. 内存计算模型和实时处理技术介绍 69.  Spark中各个分布式组件的处理框架及工作原理
 70. Spark SQL实时数据仓库的实现原理机制及应用实践
 71. Spark  Streaming流式数据实时处理机制及应用实践
 72. Spark MLib实时机器学习算法应用实践与案例应用
 73. Spark  GraphX实时图数据处理应用实践与社交网络分析应用案例
 74. SparkR的实现原理与应用实践
 75.  Spark组件的应用编程开发实战
 76. Spark与Hadoop的集成解决方案实践
 | 
| 十四、  Spark核心组件功能运用的实践操作训练 | 77. Spark SQL应用操作实训 78.  Spark Streaming应用操作实训
 79. Spark MLib应用操作实训
 80. Spark GraphX应用操作实训
 81.  SparkR应用操作实训
 82. Spark与HBase集成数据分析实验实训
 | 
| 十五、  Mahout大数据分析挖掘平台 | 83.  大数据分析挖掘技术介绍,以及行业大数据挖掘应用案例 84 . Mahout大数据挖掘平台的体系架构和核心技术
 85 .  基于Mahout的数据分析挖掘算法应用,包括分类算法、聚类算法、关联规则挖掘算法、推荐与协同过滤分析算法、预测分析等算法的应用及其案例剖析
 86 .  基于Mahout的数据分析挖掘应用程序开发实战
 87 . 利用Mahout与Hadoop集成大数据挖掘平台应用实战
 | 
| 十六、  Mahout大数据分析挖掘项目的实践操作训练 | 88. Mahout集群的安装部署与配置优化 89.  Mahout实现客户分析,广告分析,日志分析,规律预测,关联分析,定向推荐等应用程序的开发与应用实战
 90.  Mahout性能优化与分析挖掘算法参数的优化,并结合Mahout实现交互式数据查询与分析挖掘的项目实践
 | 
| 十七、  Flink分布式数据流处理与计算 | 91.大数据处理引擎Flink基础概念 92.Flink体系架构
 93.Flink的部署和HA的实现。
 94.如何在Flink中实现流式处理和批处理的Demo。
 | 
| 十八、  Storm流式数据处理平台架构及其应用实践 | 95.  Storm流式处理系统的平台架构和工作原理 96. Storm关键技术剖析
 97. Storm集群安装部署与配置优化
 98.  Storm日志流数据分析项目应用实战
 99. Storm和Hadoop,Spark的应用集成项目实践
 | 
| 十九、  大数据智能化ETL操作工具以及Hadoop集群运维监控工具平台应用 | 100.  Hadoop与DBMS之间数据交互工具Sqoop导入导出数据的工作原理,以及Sqoop集群安装部署与配置 101.  Kettle集群的平台架构、核心技术工作原理以及应用案例
 102. Kettle大数据ETL工具的部署与配置,以及应用实战
 103.  利用Sqoop实现MySQL与Hadoop集群之间的数据导入导出交互程序
 104.  Hadoop大数据运维监控管理系统HUE平台的安装部署与应用配置
 105.  Hadoop运维管理监控系统Ambari平台的安装部署与应用配置
 106. Hadoop集群运维系统Ganglia,  Nagios的安装部署与应用配置
 | 
| 二十、 大数据的信息安全技术及其应用 | 107.  “互联网+APP”背景下的信息安全遇到的挑战,以及可行的信息安全策略和案例分析 108. 大数据隐私保护技术及其应用
 109.  大数据加密技术及其应用
 110. 大数据平台的安全认证技术及其应用
 111.  大数据平台的实时保护和监控、细粒度的数据访问审计、自动化的告警、数据级别的访问控制、数据漏洞管理,以及敏感数据的自动发现
 
 | 
| 二十一、  大数据平台项目应用完整实践与咨询讨论 | 112.  根据讲师布置的实际应用案例,开展大数据完整项目部署设计和应用开发实践、大数据项目的需求分析、应用实施以及解决方案分享咨询与交流讨论 |