目录
基于Python数据科学和分析入门到精通实战课程
Python语言是当下最最热门的开发语言和人工智能语言,结合当下热门项目,使用数据领域主流语言python作为课程的实战工具,旨在帮助同学们快速掌握python数据科学与人工智能领域最核心算法与案例实战。随着大数据与人工智能领域日益火爆,数据分析和机器学习建模成了当下最热门的技术,课程旨在帮助同学们快速掌握python数据分析包以及经典机器学习算法并通过对真实数据集分析进行实战演示。
1.课程研发环境
JDK版本: JDK1.8
Python工具:3.6
Anaconda工具:3.4
开发工具:Pycharm2018
Linux版本:CentOS 6.5
虚拟机:VMware Workstation16
课程基于windows环境进行讲解与代码演示,需要同学们搭建Python环境,推荐根据课时(使用Anaconda搭建python环境)来进行python和其依赖库的安装。
2.内容简介
本课程涵盖了几乎所有Python全部的功能。本课程在最开始讲解了Python语言的基础知识,以保证后面的课程中可以顺利进行。更多的Python语言的知识,需要学员自己去找更多的资料进行学习。
主体课程通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。算法课程注重于原理推导与流程解释,结合实例通俗讲解复杂的机器学习算法,并以实战为主,所有课时都结合代码演示。旨在帮助同学们快速上手如何使用python库来完整机器学习案例。
选择经典案例基于真实数据集,从数据预处理开始到建立机器学习模型以及效果评估,完整的讲解如何使用python及其常用库进行数据的分析和模型的建立。对于每一个面对的挑战,分析解决问题思路以及如何构造合适的模型并且给出合适评估方法。在每一个案例中,同学们可以快速掌握如何使用pandas进行数据的预处理和分析,使用matplotlib进行可视化的展示以及基于scikit-learn库的机器学习模型的建立。
本课程通过大量练习和案例对各个知识点技能进行详细讲解
Tony王老师:
在某高校任教的全职教师,多年大数据、人工智能、数据挖掘项目和授课经历,长期从事大数据相关的工作。在校连续4次拿到二等奖学金,多年的在校任教经验,曾经讲授《Java
语言程序设计》、《网络安全管理及应用》、《Python机器学习》、《Python案例和应用》。
擅长数据挖掘、机器学习、软件开发、图像处理等核心技术,擅长Python,C,Java,MATLAB,SQL等语言和工具。熟悉决策树、K-means、神经网络、Logistc线性回归、Apriori算法、协同过滤等算法。
曾经负责研究全球智库影响力评估算法,采用Python语言实现算法。曾经负责数据挖掘课程设计,采用Python语言设计实验。
01_01-Python语言简介
01_02-Python2与Python3的区别
01_03-Win Mac下的区别简单介绍
01_04-编写Python程序
01_05-Python基础语法
01_06-数据类型介绍
01_07-基本运算符
01_08-算术运算符
01_09-If条件控制
01_10-循环语句
01_11-列表元组集合
01_12-字典介绍
01_13-常用函数
01_14-类介绍
02_01-Python 常用的IDE简介
02_02-Anaconda
02_03-与命令行进行交互
02_04-读取文本文件
02_05-使用glob读取多个文本文件
02_06-写入文本文件
03_01-数据分析师的基本范畴
03_02-理解数据的性质
03_03-数据分析过程
03_04-定量和定性数据分析
03_05-开放数据和python与数据分析
04_01-基础python与pandas
04_02-读写csv文件
04_03-筛选特定的行
04_04-选取特定的列
04_06-添加标题行
04_07-读取多个CSV文件
04_08-从多个文件中连接数据
04_09-计算每个文件中值的总和与均值
04_10-练习
05_01-内省Excel工作簿
05_02-处理单个工作表
05_03-读取工作簿中的所有工作表
05_04-在Excel工作簿中读取一组工作表
05_05-处理多个工作簿
05_06-练习
06_01-python内置的sqlite3模块
06_02-MYSQL数据库
06_03-练习
07_01-numpy的ndarray
07_02-通用函数利用数组进行数据处理
07_03-用于数组的文件输入输出线性代数
07_04-随机数生成随机漫步模拟
08_01-Panda介绍和Series创建和操作
08_02-Dataframe的创建和简单操作和各种数据处理
08_03-分组计算和汇总
08_04-数据拆分
08_05-数据去重和缺失值处理
08_06-重复值处理和时间日期数据格式转换
08_07-时间日期格式转换
09_01-Matplotlib
09_02-各种统计图绘制(条形图、直方图)
09_03-各种统计图绘制(箱线图、饼图)
09_04-各种统计图绘制(折线图、散点图)
10_01-数据集(葡酒质量、客户流失)
10_02-描述性统计
10_03-分组、直方图与t检验
10_04-成对变量之间的关系和相关性
10_05-使用最小二乘估计进行线性回归和系数解释
10_06-自变量标准化和预测
10_07-逻辑斯蒂回归和系数解释
10_08-预测
11_01-任务计划程序
11_02-cron工具
目标1.动手实现Python的第1个程序
目标2.动手如何对复杂的数据进行预处理
目标3.掌握Python数据分析的4个神器(Numpy,Pandas,Matplotlib,Scikit-learn)
目标4.实际动手演示了葡萄酒的预测分析
目标5.掌握机器学习经典算法的原理、建模思路和流程
目标6.完整演示如何对数据进行分析处理与可视化展示
目标7.动手实操数据集的预处理的演示
目标8.掌握基于Python自动调度的技能
亮点一、从零基础开始讲起,包括数据挖掘的思路和方法
亮点二、通俗易懂,最接地气的讲解将复杂的问题简单化
亮点三、全程案例实战,丰富的实战内容更轻松入门
亮点四、本课程通过大量练习和案例对各个知识点技能进行详细讲解
1.课程针对人群
对Python语言感兴趣,想利用python进行数据分析,数据科学,数据挖掘的初学者。
数据运维人员,系统架构师,数据仓库管理人员、建模人员等
2.我该怎么学,如何才能学好这门课程,给些建议。
1、时间上的安排建议
本课程共23课时,如果您时间上充分,建议以每天3-4讲的进度往前学习,一定要进行操作,记笔记。
2、学习要求
持之以恒,每天都坚持学习(看视频、实际联系,多思考),有问题及时沟通交流解决,建议多看官方文档。
3、讲师建议
1)最好看完视频之后,抛开视频,独立自己去把上课中的示例写一遍,看自己是否理解,如果不正确,可以回过头看再看下视频,如果反复,达到真正理解和熟练掌握的目的。
2)对于项目实战部分,一定要自己亲自动手做一遍,不要满足听完就结束了
3)一定不要过于依赖视频,要学会使用百度,学会思考,学会举一反三
4) 最后祝大家学有所成
课程是属于某个特定的专业技术,掌握该技术后,你可以从事以下职位的相关工作
1、Python开发工程师
2、数据分析师
3、机器学习工程师
4、爬虫工程师
5、人工智能算法工程师