格拉布斯准则的应用(Python)

格拉布斯准则的应用

  • 前言
  • 一、格拉布斯准则是什么li>
    • 1.Gi值
    • 2.格拉布斯临界值表
  • 二、使用步骤
    • 1.引入代码
    • 2.使用Outliers_Remover函数
    • 3.注意事项
  • 总结

前言

大家好,我又回来了ヽ( ̄▽ ̄)?

这次所带来的是格拉布斯(Grubbs)临界值表的应用

在我想比较两个数组的平均数的时候,发现一组数中非常大的数字会相当影响该组数的平均数,然后我也不想用中位数来进行代替 ̄へ ̄

所以,我就在想有什么科学的方法,能认定什么是一组数中非常大的数字(也就是异常值),然后我就可以把它剔除出去了( ̄▽ ̄)~*

果不其然,前人的智慧当中有“格拉布斯准则”这么一个很科学的方法剔除异常值

所以让我们话不多说,开始我们的讲解吧(* ̄︶ ̄)

一、格拉布斯准则是什么h1>

相信大家都可以在 络上找到相关的具体知识,在此就不在赘述。

总 络上的知识而言之,就是计算Gi值与格拉布斯临界值表上所对应的值GP(n)相比较,若Gi值大于GP(n)值则为异常,反之则不为异常

1.Gi值

Gi值的计算是该数字的残差除于标准差
Gi= x i ? x ˉs Gi = dfrac{x_i-bar{x}}{s}Gi=sxi??xˉ?

2.格拉布斯临界值表

我是在百度文库上找的图表,点击下方超链接浏览
格拉布斯临界值表

或复制链接自行浏览
https://wenku.baidu.com/view/cfce6d64c381e53a580216fc700abb68a882ad48.html

二、使用步骤

1.引入代码

2.使用Outliers_Remover函数

  • 首先创建个明显具有异常值的列表
  • 然后给该函数传入需要去除异常值的列表
  • 输出经过去除异常值操作的列表
  • 输出结果
    格拉布斯准则的应用(Python)

3.注意事项

  • 由于我个人的原因,该函数目前只支持长度为17的列表。

    因为我太懒了︿( ̄︶ ̄)︿

  • Outliers_Remover函数的第二个参数为置信等级为1至5的整数,可以不用传入,默认为1。

    • 置信等级为1,则是相对应格拉布斯临界值表的90.00%的置信概率
    • 置信等级为2,则是相对应格拉布斯临界值表的95.00%的置信概率
    • 置信等级为3,则是相对应格拉布斯临界值表的97.50%的置信概率
    • 置信等级为4,则是相对应格拉布斯临界值表的99.00%的置信概率
    • 置信等级为5,则是相对应格拉布斯临界值表的99.50%的置信概率

总结

以上就是我对于格拉布斯准则的理解与应用,希望能对你们有所帮助ヾ(????)?”

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树首页概览214813 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年8月16日
下一篇 2020年8月16日

相关推荐