机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

以下内容是个人的随手记录,就是介绍了下简单的使用;

欢迎大家吐槽,接下来就是激情的时刻,准备好啤酒饮料矿泉水,开整!!!

 

统计学分类:

一、 描述统计学

1. 反映客观现象的数据

2. 处理并使用图标显示

3. 分析概括规律性的数量特征

二、推断统计学

1. 根据样本数据推断总体特征

2. 推断统计学在描述统计学基础之上

3. 分析概括规律性数量的特征

 

泛化误差公式: 

描述:

含义
测试样本
数据集

 

方差公式:

描述:度量了同样大小的训练集变动导致学习性能的变化,描述了数据扰动对统计(机器学习)所造成的影响

 

偏差公式:

描述:度量了期望预测与真是结果的偏离程度,描述了算法本身的拟合能力

 

噪声公式:

描述: 噪声真实标记与数据集中的实际标记间的偏差,算法能达到的期望泛化误差的下界,描述了学习问题本身的难度

 

泛化误差分解公式:

既: Err(x) = 方差值 + 偏差值 + 噪声值

 

欠拟合: 偏差大、方差小

造成原因: 所选特征不够,所选模型不符合

解决方案:加特征、换模型

 

过拟合:偏差小、方差大

造成原因:所选模型太拟合真实数据

解决方案:增加训练数据、降低维度、增加混合项

 

极差公式:max([1,2,3,4,5]) – min([1,2,3,4,5])

描述:同一组数据中的最大值 – 同一组数据中的最小值

 

离散程度–>方差公式:  

描述:

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年11月24日
下一篇 2018年11月24日

相关推荐