数据面试题:正态分布、偏态分布及峰态分布

面试题1:(答案)右偏分布

面试题2:(答案)C,正态分布的偏度为0,峰度为3

面试题4:(答案)AC

如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解:

(1)、当相关系数为0时,X和Y两变量无关系。

(2)、当X的值增大(减小),Y值增大(减小),两个变量为正相关,相关系数在0.00与1.00之间。

(3)、当X的值增大(减小),Y值减小(增大),两个变量为负相关,相关系数在-1.00与0.00之间。

 

相关系数的绝对值越大,相关性越强,相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。

通常情况下通过以下取值范围判断变量的相关强度:
相关系数     0.8-1.0     极强相关
                 0.6-0.8     强相关
                 0.4-0.6     中等程度相关
                 0.2-0.4     弱相关
                 0.0-0.2     极弱相关或无相关

 

ARMA相关资料

 

 

正偏态与负偏态

在正偏态分布中,为什么平均数大于中位数大于众数偏态分布中,为什么众数大于中位数大于平均数p>

峰度系数的概念:峰度系数是用来反映频数分布曲线顶端尖峭或扁平程度的指标。有时两组数据的算术平均数、标准差和偏态系数都相同,但他们分布曲线顶端的高耸程度却不同。

峰度系数(Kurtosis)用来度量数据在中心聚集程度。

在正态分布情况下,峰度系数值是3(但是SPSS等软件中将正态分布峰度值定为0,是因为已经减去3,这样比较起来方便)。

>3的峰度系数说明观察量更集中,有比正态分布更短的尾部;

峰度系数的标准误用来判断分布的正态性。峰度系数与其标准误的比值用来检验正态性。如果该比值绝对值大于2,将拒绝正态性。

 

相关资源:求解偏微分方程的数学软件Fastflo-教育工具类资源

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2017年11月15日
下一篇 2017年11月15日

相关推荐