目录

  • 1 第01章 R语法详解
    1. 01-01.数据结构概述

      00:09:47

    2. 01-02.向量

      00:18:33

    3. 01-03.因子

      00:19:03

    4. 01-04.矩阵

      00:23:12

    5. 01-05.数据框

      00:18:47

    6. 01-06.列表和函数

      00:20:27

    7. 01-07.向量化计算和apply

      00:11:01

    2 第02章 数据组织和整理
    1. 02-01.数据整理概述

      00:13:35

    2. 02-02.数据导入导出和缺失值处理1

      00:20:50

    3. 02-03.缺失值处理2(发现缺失值)

      00:24:28

    4. 02-04.缺失值处理3(处理缺失值)

      00:15:59

    5. 02-05.数据转换(1)

      00:13:39

    6. 02-06.数据转换(2)

      00:21:21

    7. 02-07.数据规约和随机

      00:18:00

    3 第03章 建立数据分析的统计思维和可视化探索
    1. 03-01.数据分布

      00:22:25

    2. 03-02.集中趋势

      00:21:17

    3. 03-03.离散趋势和相关

      00:16:49

    4. 03-04.R中的描述统计

      00:19:47

    5. 03-05.分组统计

      00:15:51

    6. 03-06.单变量可视化

      00:24:31

    7. 03-07.双变量可视化

      00:21:28

    8. 03-08.分组统计可视化

      00:11:27

    4 第04章 用回归预测未来
    1. 04-01.线性回归的思想

      00:21:04

    2. 04-02.回归结果的检查

      00:10:30

    3. 04-03.决定系数 预测 和多元线性回归

      00:09:57

    4. 04-04.一元线性回归演示

      00:15:51

    5. 04-05.一元线性回归演示

      00:11:47

    6. 04-06.残差分析演示

      00:14:05

    7. 04-07.多元线性回归演示

      00:17:17

    5 第05章 聚类方法
    1. 05-01.概述和距离

      00:17:56

    2. 05-02.数据变换

      00:12:02

    3. 05-03.层次聚类法

      00:14:10

    4. 05-04.kmeans聚类1

      00:05:19

    5. 05-05.kmeans聚类2

      00:13:00

    6 第06章 数据降维-主成分分析和因子分析
    1. 06-01.概述

      00:14:05

    2. 06-02.相关性会导致无法求解或者不稳定

      00:14:11

    3. 06-03.逐步回归

      00:19:37

    4. 06-04.主成分分析

      00:24:18

    5. 06-05.主成分分析例子1

      00:13:20

    6. 06-06.主成分分析例子2

      00:08:31

    7. 06-07.因子分析

      00:20:03

    8. 06-08.因子分析例子

      00:11:17

    7 第07章 关联规则
    1. 07-01.关联规则介绍

      00:17:43

    2. 07-02.关联规则演示

      00:16:42

    8 第08章 决策树
    1. 08-01.决策树介绍

      00:26:43

    2. 08-02.几种分类算法介绍

      00:15:29

    3. 08-03.评价模型准确性

      00:18:19

    4. 08-04.C4.5 和混淆矩阵 ROC图

      00:18:10

    5. 08-05.CART演示

      00:19:37

零基础数据分析与挖掘R语言实战课程

1026人在学
公众号二维码

公众号

小程序二维码

小程序

课程详情

我要提问

 

随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析,挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑。于是善于学习的程序员们开始了R语言的学习之旅。对于有其他语言背景的程序员来说,学习R的语法小菜一碟,因为它的语法的确太简了,甚至有的同学说1周就能掌握R语言,的确如此。但是之后呢?……好像进行不下去了!死记硬背记住了两个分析模型却不明其意,输出结果如同天书不会解读,各种参数全部使用缺省值,任何调整都是战战兢兢、如履薄冰…

 

在大数据的生态系统中,很多技能是可以自学的,唯有数据分析是个异数,因为它要求一定的数学知识,比如高等数学、线性代数、概率统计学。而对于大多数同学来说,这些知识都是面目可憎的。

 

讲师本人之前和大部分同学都有着同样的经历,曾经做过开发、运维、管理,后因缘际会接触到数据分析行业并对此情有独钟,在十余年的工作、学习过程中经历过各种折磨并有了一定积累。最清楚真正用得着的知识是哪些、学员最喜欢的讲解风格是什么样的,对于有志于从事数据分析的同学来说,相信此视频能帮助你们快速跨过数据分析的门槛,预祝每位学员都能成为数据挖掘的行家里手。

 

 

1.课程研发环境 

开发环境:R3.2 

IDE:RStudio

    

2.内容简介

本课程面向从未接触过数据分析的学员,从最基础的R语法开始讲起,逐步进入到目前各行业流行的各种分析模型。整个课程分为基础和实战两个单元。

基础部分包括R语法和统计思维两个主题,R语法单元会介绍R语言中的各种特色数据结构,以及如何从外部抓去数据,如何使用包和函数,帮助同学快速通过语法关。统计思维单元会指导如何用统计学的思想快速的发现数据特点或者模式,并利用R强大的绘图能力做可视化展现。

在实战部分选择了回归、聚类、数据降维、关联规则、决策树这5中最基础的数据分析模型,详细介绍其思想原理,并通过案例讲解R中的实现方案,尤其是详细的介绍了对各种参数和输出结果的解读,让学员真正达到融会贯通、举一反三的效果。并应用到自己的工作环境中。

 

 

大圣,16年IT工作经验,10年的数据分析经验,曾就职阿里巴巴、雅虎,现为大数据独立顾问、北风网兼职讲师。

擅长技术:Hadoop、Oracle、R、Linux等。

 

 

一、R语法详解:

第一讲:R的核心数据结构之向量、因子的区别和使用技巧

第二讲:R的核心数据结构之矩阵、数据框、数组、列表的区别和使用技巧

第三讲:R的控制结构(包括分支结构和循环结构)、函数和包、以及向量化计算

 

二、数据组织和整理:

第四讲:数据导入,从多种数据源导入数据

第五讲:数据预处理之缺失值的处理

第六讲:数据预处理之数据转换,数据筛选

 

三、建立数据分析的统计思维和可视化探索:

第七讲:单变量数据特点的描述方法

第八讲:多变量数据特点的描述方法

第九讲:借助分组发现数据中的模式

第十讲:数据可视化建立对数据的感性认识

 

四、用回归预测未来:

第十一讲:线性回归的思想,代码、结果的详细解读;

第十二讲:多项式回归、多元线性回归

 

五、聚类方法:

第十三讲:层次聚类和k-means聚类方法

 

六、数据降维——主成分分析和因子分析:

第十四讲:维度过多会导致哪些问题

第十五讲:用逐步回归法筛除无用变量

第十六讲:用主成分分析法解决多重共线性问题

第十七讲:用因子分析法获得有业务意义的变量

 

七、关联规则:

第十八讲:用关联规则做购物车分析

 

八、决策树:

第十九讲、决策树算法ID.3、C4.5、CART算法区别和演示

第二十讲、分类效果的评价方式

 

 

 

 

 

 

 

 

 

目标一:熟练掌握R语言语法知识和使用技巧

 

目标二:全面掌握回归方法的背景知识和使用技巧,并知道如何评价回归模型的效果;

 

目标三:掌握两种典型的聚类方法包括层次聚类和k-means聚类原理、使用过程、注意事项和技巧

 

目标四:掌握决策树算法的原理和使用技巧,为以后学习高阶的组合算法奠定基础。

 

目标五:深刻理解数据降维的重要性和处理方法,掌握三种常用的降维方法。

 

目标六:掌握关联规则购物篮分析。

 

 

亮点一:本课程不要求学员有任何数学统计背景,课程中会对必须的数学知识会用最通俗的方式进行讲解,保证学员掌握其原理,即知其然也知其所以然。 

 

亮点二:理论与实战相结合,由浅入深。即照顾到基础学员,又照顾到有一定经验的学员,讲解过程中遇到难点会用板书的方式讲解.

 

亮点三:对于涉及到的分析模型R函数,会给出详细的参数说明和模型解读,不仅要让学员知道如何使用,还要知道如何解读、如何调整模型,做到手中有剑,心中也有。

 

亮点四:所有案例提供原始数据集,保证学员能够拷贝复现.

 

亮点五:个课程的选择的分析模型实用性超强.,都是目前互联网行业经典模型。也是很容易移植到大数据环境的算法。

 

 

1.课程针对人群:

本课程针对有志于从事数据分析的学员,不要求有任何数学背景(加减乘除能力还是要的)、统计学背景,对编程经验无要求。  

 

2.我该怎么学,如何才能学好这门课程,给些建议。

 4.1、时间上的安排建议:

 本课程共20讲,如果您时间上充分,建议以每周3-5讲的进度往前学习。 

 4.2、学习要求:

 如果您没有基础,建议还是中规中矩的按照课程进度一点一点仔细观看学习,并一定要把看完的视频中的代码自己手敲一遍,以加深理解和记忆

 如果您有基础,可不必按步就搬进行,可以拿你感兴趣的部分去学习,但一定要注意实践,并学会举一反三 

 4.3、讲师建议:

1.第6课《数据降维》的数学知识相对较有难度的,建议听不懂的同学多听几遍,或者也可以跳过,只弄明白其使用场景和R函数用法,但老师鼓励同学们掌握其数学背景,  因为是很多高级算法比如推荐算法的思想基础。

2.第4课的《回归分析》也涉及一点数学知识,这部分知识不难但是很基础,同学们一定要掌握。

3.其他单元涉及到的数学知识难度系数为加减乘除级别,学员们可以放心享用。

4.R中建模函数的使用都非常简单,最重要的是参数调整和模型结果的解读,同学们不要以会使用函数为目标,一定要把重点放在这两部分。

5.如果学习过程中遇到吃力的地方,多和老师或同学交流,自己钻牛角尖是很痛苦的事情。

6. 最后祝您学有所成


评价(0) 立即评论
0/150