第一天上午:统计分析原理
1、 从最简单的案例开始
2、 统计基础
3、 描述性统计
4、 用SPSS实现描述性统计的案例
5、 回归分析:线性回归
6、 回归分析:logistics回归
7、 用SPSS实现回归分析的案例
8、 可视化工具
第一天下午:数据库与数据仓库介绍
1、 数据库概述
2、 SQL(基本的增、删、改、查)
3、 SQL(稍复杂的子句或嵌套)
4、 基于MySQL的上机操作SQL语言
5、 数据仓库:度量与维度
6、 数据仓库:星型模型、雪花模型
7、 ETL
8、 上机操作(构建一个cube)
第二天上午:数据挖掘方法(1)
1、 基本概念
2、 R语言简介
3、 特征提取
4、 决策树模型
5、 用R语言实现的决策树案例
6、 精确率、召回率与F1
7、 监督学习和无监督学习
第二天下午:数据挖掘方法(2)
1、 聚类分析
2、 用R语言实现的聚类分析案例
3、 关联规则
4、 用R语言实现的关联规则案例
5、 神经网络
6、 用R语言实现的神经网络案例