总体是由总体分布来刻画的,在实际问题中我们根据问题本身的专业知识或以往的经验或用适当的统计方法,有时可以判断总体分布的类型,但是总体分布的参数还是未知的,需要通过样本来估计。例如,为了研究人们的市场消费行为,要先弄清楚人们的收入情况,若假设某城市的人均年收入服从正态分布N(μ,σ^2),但参数μ、σ^2的具体取值并不知道,需要通过样本来估计。又如,假定某城市在单位时间内(一个月)内交通事故发生次数服从泊松分布P(λ),其中的λ也是未知的,同样需要用样本来估计。根据样本来估计总体分布所包含的未知参数,叫做参数估计,它是统计推断的一种重要形式。
如何根据样本的取值来寻找这些参数的估计呢?通常有两种形式:一种称为点估计,另一种称为区间估计。点估计就是用一个统计量来估计一个未知参数,点估计的优点是:能够明确地告诉人们“未知参数大致是多少”,其缺点是:不能反映出估计的可信程度。区间估计是用两个统计量所构成的区间来估计一个未知的参数,并同时指明此区间可以覆盖住这个参数的置信度。它的缺点是:不能直接地告诉人们“未知参数具体是多少”这一明确概念。
设总体X分布由有限个未知参数θ=(θ1,θ 2,…,θ m)^T所决定,记作Fθ,称θ可能取值的范围为参数空间。
记f(x:θ)为总体X的概率密度函数或分布率,若总体X分布为连续型的,则f(x:θ)是概率密度函数,总体X分布为离散型的,则f(x:θ)是分布律。例如,对于泊松分布P(λ),θ=λ是一维未知参数,对于正态分布N(μ,σ^2),θ=(μ,σ^2 )就是二维未知参数。
设总体X的分布中的未知参数为θ=(θ1,θ 2,…,θ m)^T,假定总体X的k阶原点矩
存在,我们令总体的k阶原点矩等于它样本的k阶原点矩
即
由此可以得到关于未知量θ的解
取θ’=(θ’1,θ’ 2,…,θ’ m)^T作为θ=(θ1,θ 2,…,θ m)^T的估计,则称θ’为θ的矩估计,用矩估计参数的方法称为矩法。
例子:设总体X的均值为μ,方差为σ^2,X1,X2,…,Xn是来自总体X的一个样本,试用矩方法估计均值μ和方差σ^2。
计算总体X的一阶、二阶原点矩
和样本的一阶、二阶原点矩
由此得到方程组
由此得到均值μ和方差σ^2 的矩估计
需要特别注意的是,方差的矩估计并不等于样本方差S^2,而是有如下关系:
从上面的计算可以看到,利用矩法估计均值和方差,等价于用样本的一阶原点矩估计均值,用样本的二阶中心矩估计方差。
例子:设总体X服从二项分布B(k,p),其中k、p为未知数,X1,,X2,…,Xn是总体X的一个样本,求参数k、p的矩估计k’、p’。
二项分布的均值(总体一阶原点矩)是kp,方差(总体二阶中心矩)是kp(1-p)建立方程组:
编写相应的R函数,程序名为”moment_fun.R”
moment_fun<-function(p){
f<-c(p[1]*p[2]-A1,p[1]*p[2]-p[1]*p[2]^2-M2)
j<-matrix(c(p[2],p[1],p[2]-p[2]^2,p[1]-2*p[1]*p[2]),nrow=2,byrow=T)
list(f=f,j=j)
}
考虑使用牛顿法求解上述非线性方程组,编写相应的R函数,程序名为“Newtons.R”
Newtons<-function (fun, x, ep=1e-5, it_max=100){
index<-0; k<-1
while (k<=it_max){
x1 <- x; obj <- fun(x);
x <- x – solve(obj$J, obj$f);
norm <- sqrt((x-x1) %*% (x-x1))
if (norm<ep){
index<-1; break
}
k<-k+1
}
obj <- fun(x);
list(root=x, it=k, index=index, FunVal= obj$f)
}
> x<-rbinom(100,20,0.7)
> n<-length(x)
> A1<-mean(x)
> M2<-(n-1)/n*var(x)
> source(“moment_fun.R”)
> source(“Newtons.R”)
> p<-c(10,0.5)
> Newtons(moment_fun,p)
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!