以下内容是个人的随手记录,就是介绍了下简单的使用;
欢迎大家吐槽,接下来就是激情的时刻,准备好啤酒饮料矿泉水,开整!!!
统计学分类:
一、 描述统计学
1. 反映客观现象的数据
2. 处理并使用图标显示
3. 分析概括规律性的数量特征
二、推断统计学
1. 根据样本数据推断总体特征
2. 推断统计学在描述统计学基础之上
3. 分析概括规律性数量的特征
泛化误差公式:
描述:
符 | 含义 |
测试样本 | |
数据集 | |
方差公式:
描述:度量了同样大小的训练集变动导致学习性能的变化,描述了数据扰动对统计(机器学习)所造成的影响
偏差公式:
描述:度量了期望预测与真是结果的偏离程度,描述了算法本身的拟合能力
噪声公式:
描述: 噪声真实标记与数据集中的实际标记间的偏差,算法能达到的期望泛化误差的下界,描述了学习问题本身的难度
泛化误差分解公式:
既: Err(x) = 方差值 + 偏差值 + 噪声值
欠拟合: 偏差大、方差小
造成原因: 所选特征不够,所选模型不符合
解决方案:加特征、换模型
过拟合:偏差小、方差大
造成原因:所选模型太拟合真实数据
解决方案:增加训练数据、降低维度、增加混合项
极差公式:max([1,2,3,4,5]) – min([1,2,3,4,5])
描述:同一组数据中的最大值 – 同一组数据中的最小值
离散程度–>方差公式:
描述: