
教学优势
  曙海教育的课程培养了大批受企业欢迎的工程师。大批企业和曙海
     建立了良好的合作关系。曙海集团的课程在业内有着广泛的美誉度和响亮的知名度。
秉承二十几年积累的教学品质,本课程以真实项目实战为导向,授课工程师将会与您分享设计的全流程及工具的综合使用技巧、经验。

l 掌握数据分析的流程
l 掌握python数据分析核心库的使用,如numpy、pandas、matplotlib
l 了解常用数据分析(挖掘)算法的原理,熟悉机器学习的各个环节,并能利用相应的算法建模
l 熟练使用sk-learn进行数据挖掘
 课程大纲
 课程大纲 
| 章节 | 主要授课内容 | ||
| 
 第1章 Python数据分析概述 | 1.数据分析的概念、流程、应用场景 2.数据分析常用的工具、python数据分析的优势、常用类库的介绍 3.Jupyter Notebook的安装及使用 | ||
| 
 
 第2章 Numpy数值计算基础 | 1.ndarray的创建、访问、常用属性 2.矩阵的创建 3.通用函数ufunc 4.广播机制 5.数学知识 6.简单统计分析,读写文件、排序、去重、常用统计函数 | ||
| 
 
 第3章 Pandas统计分析基础 | 1.Series常用操作 2.DataFrame常用操作 3.读写不同数据源 4.数据过滤与转换 5.时间序列操作 6.分组与聚合 7.透视与交叉表 | ||
| 
 
 第4章 利用pandas进行数据预处理 | 1.合并数据,堆叠合并、主键合并、重叠合并 2.清洗数据,处理重复值、缺失值、异常值的处理 3.标准化数据,离差标准化、标准差标准化、小数定标标准化 4.转化数据 ,类别型特征处理为哑变量,连续性特征离散化处理 | ||
| 
 
 第5章 数据可视化 | 1.数据可视化概述 2.常用图表,如柱状图、饼状图、直方图、箱线图等的介绍 3.matplotlib绘图基础,如基础语法、rc参数、标签刻度、子图等 4.matplotlib绘图实战 5.pandas绘图实战 | ||
| 第6章 机器学习与挖掘建模 | 1.机器学习概述 2.机器学习分类 3.机器学习流程 4.机器学习评估 5.经典机器学习算法原理剖析,如 knn、kmeans、朴素贝叶斯、决策树、线性回归、逻辑回归、支持向量机、关系分析等 6.关联规则算法 7.时序模式 8.物体推荐算法 9.使用sk-learn建模,包括数据集划分、数据预处理、模型训练、模型评估等 | ||
| 第7章 数据分析与挖掘实战案例 | |||