《机器学习实战》学习大纲

学习大纲

整个机器学习内容包括:基础、分类、预测、无监督式学习、降维与分布式几大块进行。总共计划 12 周时间。
基础:第 1 章
分类: 第 1~7 章
预测:第 8~9 章
无监督式学习:第 10~12 章
降维与分布式:第 13~15 章

01 机器学习基础(第一周)

https://blog.csdn.net/qq_34243930/article/details/84948770
1.1 Python 基础知识,Numpy、pandas、Matplotlib 等库的简介
1.2 开发环境的搭建:Python3 + Anaconda + Jupyter Notebook
1.3 Jupyter Notebook 使用简介

第一节学习内容
学习时间: 12/2
任务1题目: 观看机器学习实战绪论视频+天池o2o比赛完全流程解析PPT

04 朴素贝叶斯(第二周)

https://blog.csdn.net/qq_34243930/article/details/85016783
4.1 基于贝叶斯决策理论的分类方法
4.2 条件概率
4.3 使用条件概率来分类
4.4 使用朴素贝叶斯进行文档分类
4.5 使用 Python 进行文本分类
4.6 示例:使用朴素贝叶斯过滤垃圾邮件
4.7 示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向

学习内容
学习时间: 12/11-12/14
任务1题目: 书籍阅读
任务详解: 阅读《机器学习实战》书籍第四章
参考文献: 李航《统计学习方法》第4章
参考资料: [通俗易懂!白话朴素贝叶斯]
( https://mp.weixin.qq.com/s/7xRyZJpXmeB77MZNLqVf3w)
作业1: 概括朴素贝叶斯分类算法的原理,为什么称之为“朴素”br> 作业2:

比赛:天池O2O数据预测大赛(初级)

第二节学习内容
学习时长:12/25-12/28
任务1题目:天池o2o预测赛(初级)
任务详解:建立一个简单的线性模型,在线提交预测结果,查看成绩
视频不清晰也可以去荔枝微课看,地址: https://m.weike.fm/lecture/10234967 ;(观看密码:011220)
源码文件:链接: https://pan.baidu.com/s/1FwCcG0Pk1V_0mK1MCbkPlg ;;提取码:y5z6

作业1:使用简单模型,在线提交预测结果,查看成绩
提交日期:12/28
提交形式:代码截图打卡或git链接提交,比赛上传结果界面排名截图打卡上传

07 利用 AdaBoost 元算法提高分类性能(第五周)

7.1 基于数据 多重抽样的分类器
7.2 训练算法:基于错误提升分类器的性能
7.3 基于单层决策树构建弱分类器
7.4 完整 AdaBoost 算法的实现
7.5 测试算法:基于 AdaBoost 的分类
7.6 示例:在一个难数据集上应用 AdaBoost
7.7 非均衡分类问题

第一节学习内容
学习时长:12/30-01/02
任务1题目:书籍阅读
任务详解:阅读《机器学习实战》书籍第7章
参考文献:
李航《统计学习方法》第8章8.1/8.2/8.3节

作业1:AdaBoost选择分类器是弱分类器还是强分类器释原因。
提交日期:12/30
提交形式:文字或者截图打卡
作业2:将本章中“在一个难数据集上应用AdaBoost”完整代码键入jupyter notebook,并添加详细注释。若有可能,自己可以优化该代码。
提交日期:01/02
提交形式:代码截图打卡或git链接提交

作业参考答案
说明:当天作业参考答案隔天发布
1.1 弱分类器。若是强分类器,那么该分类器占的权重alpha会很大,相当于其它分类器不起作用了。所以,多个弱分类器起到“三个臭皮匠,赛过诸葛亮”的效果。
1.2 Jupyter Notebook 见GitHub

08 预测数值型数据:回归(第五周)

8.1 用线性回归找到最佳拟合直线
8.2 局部加权线性回归
8.3 示例:预测鲍鱼的年龄
8.4 缩减系数来“理解”数据
8.5 权衡偏差和方差
8.6 示例:预测乐高玩具套装的价格

第二节学习内容
学习时长:1/03-1/04
任务1题目:书籍阅读
任务详解:阅读《机器学习实战》书籍第8章
作业1:岭回归和Lasso回归有什么区别br> 提交日期:1/03
提交形式:代码截图打卡或git链接提交
作业2:将本章中“预测鲍鱼的年龄”完整代码键入jupyter notebook,并添加详细注释。若有可能,自己可以优化该代码。
提交日期:1/04
提交形式:代码截图打卡或git链接提交
作业参考答案
说明:当天作业参考答案隔天发布
2.1
2.1 使用的正则化不同,岭回归使用L2正则化,Lasso使用L1正则化。L2正则化优点是易于求导,简化计算,更加常用一些。L1正则化优点是能得到较稀疏的解,但缺点是不易求导。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年11月1日
下一篇 2018年11月1日

相关推荐