目录

  • 1 大数据实战课程第二季基于Python机器学习、项目案例实战
    1. 01_01.什么是机器学习

      00:17:16

大数据实战课程第二季基于Python机器学习、项目案例实战

1013人在学
公众号二维码

公众号

小程序二维码

小程序

课程详情

我要提问

 

 

目前,机器学习可谓业界火热的一项技术。 随着计算机与网络的快速发展,机器学习在我们的生活和工作中起着越来越大的作用,正在改变着我们的生活和工作。从日常使用的相机,每天使用的搜索引擎,网上的每一次购物,到无人驾驶汽车,智能家居,智能机器人等,都有机器学习的影子。 继Facebook开源人工智能系统TensorFlow,2015年11月,谷歌、微软、IBM纷纷开源其机器学习工具包,以便加快机器学习的发展与应用。机器学习正在从少为人知的技术主题转变成更多人使用的管理工具。

 

大数据时代,数据是企业值钱的财富,但海量的数据并非都是有价值的,如何挖掘出有用的数据变成商业价值,就需要机器学习算法。大数据和机器学习势必颠覆传统行业的运营方式,必将驱动公司业务的发展。目前,越来越多的机器学习/数据挖掘算法被应用在电商、搜索、金融、游戏,医疗等领域中的分析、挖掘、推荐上。

 

但懂机器学习算法的人才却少之又少,物以稀为贵,致使这个行业的工资奇高。

 

 

1.课程研发环境

开发环境:Python 2.7

IDE:PyCharm 5

   

2.内容简介

本课作为深度学习系列课程的第一阶段,介绍机器学习的基本概念,原理,以及常用算法(如决策树,支持向量机,Adaboost、EM算法等)。以Python语言为工具对每种算法进行结合实例讲解。学生学完本课程后将会理解机器学习的常用算法原理,并会使用Python来对实际问题进行数据预处理,分类和回归分析。为开发机器学习相关应用打下必要基础,同时也为学习深度学习进阶课程打下必要基础。

 

 

大圣,16年IT工作经验,10年的数据分析经验,曾就职阿里巴巴、雅虎,现为大数据独立顾问、北风网兼职讲师。

 擅长技术:Hadoop、Oracle、R、Linux、Python等。

 

 

1.k最近邻算法

一、机器学习课程介绍

二、K最近邻算法的思想

三、机器学习中常用的距离指标解析

四、实战k最近邻算法

 

2.朴素贝叶斯分类算法

五、   概率论的基本知识(基本概念、加法公式、乘法公式)

六、   通过例子深入掌握概率的基本公式

七、   全概率公式和贝叶斯定理

八、   实战贝叶斯分类算法,智能手环推荐

 

3.聚类算法

九、   聚类算法概述

十、   Kmeans聚类

十一、       Kmeans实战,图片按照色彩聚类

 

4.决策树算法

十二、       决策树介绍

十三、       决策树的构造过程和各种算法

十四、       决策树中关键指标详解

十五、       实战决策树

 

5.线性回归和梯度下降算法

十六、     线性回归的相关概念(相关、独立和协方差)十七、     线性回归和最小二乘法十八、     梯度下降算法十九、     梯度的推导过程二十、     岭回归、lasso回归和弹性网 6.逻辑回归和极大似然估计二十一、                广义线性回归和逻辑回归二十二、                极大似然估计的思想二十三、                逻辑回归中的梯度推导二十四、                逻辑回归代码实战

 

7.支持向量机

二十五、                支持向量机原理介绍二十六、                线性可分的支持向量机二十七、                近似线性可分、非线性可分、核函数二十八、                坐标上升法、SMO算法、实战支持向量机 8.EM算法和GMM二十九、                EM算法思想三十、     EM算法的推导三十一、                实战EM算法,GMM

 

9.随机森林和Adaboost

三十二、                随机森林三十三、                Adaboost思想精髓三十四、                Adaboost算法流程介绍三十五、                实战Adaboost算法

 

10.机器学习思想精华和实战经验分享

三十六、                机器学习解决问题思想框架三十七、                理解方差和偏差、损失函数和过拟合三十八、                L1、L2正则化和常见的5种损失函数三十九、                如何选择模型和选择参数,交叉验证和ROC曲线四十、     自适应学习率和二分法精确搜索四十一、                自适应学习率和基于阿米霍准则的模糊搜索四十二、                经验分享

 

 

 

 

 

 

 

 

 

 

 

目标一. 可以让学员了解与理解主要的机器学习的原理。

 

目标二. 可以让学员迅速掌握各类常见分类、聚类算法的应用场景。

 

目标三. 可以让学员迅速掌握常见的算法的推导过程和使用方法。

 

目标四. 可以让学员对掌握机器学习常用算法的代码实现。

 

 

亮点一、本课程不要求学员有任何机器学习背景,课程中知识会用通俗的方式进行讲解,保证学员掌握其原理,即知其然也知其所以然。

 

亮点二、理论与实战相结合,由浅入深。通过对场景反复剖析,大大提升学员经验值,可以轻松做到学以己用。

 

亮点三、课程绝大多数代码均是一行一行手工敲入,手把手一步步带领学员从入门到精通。

 

亮点四、整个课程虽集数不多, 却涵盖了互联网行业经典模型,含金量极高。

 

 

1.课程针对人群

本课程针对有志于从事机器学习开发的学员,对数学基础无要求。

 

 

2.我该怎么学,如何才能学好这门课程,给些建议

(1)时间上的安排建议

本课程共25讲,如果您时间上充分,前四课基础部分建议以每周1-2课,后面六次课程可以适当加快进度。 

(2)学习要求

  如果您没有基础,建议还是中规中矩的按照课程进度一点一点仔细观看学习,并一定要把看完的视频中的代码自己手敲一遍,以加深理解和记忆。

如果您有基础,可不必按步就搬进行,可以拿你感兴趣的部分去学习,但一定要注意实践,并学会举一反三。

(3)讲师建议

1.一定要跟着课程实操一遍,勤动手、多思考,训练肌肉记忆。

2.建议边看视频,边做一些记录和笔记,这是一种非常好的学习习惯。

3.一定不要过于依赖视频,要学会看文档和使用网络,学会思考,学会举一反三。

4.如果学习过程中遇到吃力的地方,多和老师或同学交流,自己钻牛角尖是很痛苦的事情。

最后祝您学有所成!

 

机器学习是目前IT行业最热门职位,也是人才最紧缺的职位。基本上年薪30-40万没有悬念, 50-60万也是可能。

 

 

 


评价(0) 立即评论
0/150