stata最大值最小值命令_用Stata实现数据标准化

技术总编:高金凤

重磅!!!爬虫俱乐部将于 2019年10月2日至10月5日在湖北武汉举行 Python编程技术培训,本次培训采用理论与案例相结合的方式,旨在帮助零基础学员轻松入门Python,由浅入深学习和掌握Python编程技术,尤其是爬虫技 术和文本分析技术。 该培训目前在火热招生中,点击《爬虫俱乐部2019十一Python编程技术培训 名啦!》或点击文末阅读原文,了解培训详细信息,抓紧时间 名吧! 在进行数据分析或模型估计时,经常需要对数据进行标准化处理(normalization)。 例如,在一个数据集中变量A的取值区间为[0,10],变量B的取值区间为[100,1000]。若直接采用原始数据进行分析,由于变量B量纲更大,这样可能造成模型估计偏误。   借助数据标准化处理,可以将原始数据转换为无量纲、无数量级差异的标准化数值。通过将数据按照一定比例缩放,使变量取值落于一个特定区间或服从特定分布,消除了量纲、变量自身变异和数值大小的影响,从而便于对不同变量和数据进行综合分析、比较。   在介绍Stata软件的数据标准化操作之前,首先了解两种常用的数据标准化方法。 (一)  数据标准化方法

1、离差标准化

离差标准化是令变量的观测值减去该变量的最小值,然后除以该变量的极差,把数值标准化至Z分数,即:

经过上述处理,变量约有一半取值小于0,一半取值大于0,近似服从N(0,1)的标准正态分布。但采用该种方法,原来数值较大的观测值依然可能对估计结果产生显著影响,需进一步消除变量间的差异性。

(二)Stata操作

1、离差标准化 假设存在某一变量data,其描述性统计结果如下:

通过观察可知,采用标准差标准化方法时,新生成变量的均值、方差并不严格为0、1。在实际操作中,还需依据变量自身特点,探索最适用的标准化方法。

相关资源:本草纲目下载李时珍本草纲目查询软件版v1.4_本草纲目pdf彩图版…

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年10月18日
下一篇 2020年10月18日

相关推荐