百科问答小站 logo
百科问答小站 font logo



数理统计中未知参数的置信区间估计方法中,存在最佳的枢轴量吗? 第1页

  

user avatar   sijichun 网友的相关建议: 
      

楼上回答的对了一半,也错了一半。

枢轴统计量,我通常翻译成基准统计量(pivotal statistic),意思是分布与任何未知参数无关的统计量。

比如,正态总体情况下,有:

以及:

这两个东西的分布都与未知参数无关,所以是基准统计量。

基准统计量有很多好处,首先是性质好,比如bootstrap做检验的时候一定要用基准统计量;还有就是因为基准统计量与未知参数无关,方便我们查表。

有了基准统计量之后,找到基准统计量分布的一个区间,让这个区间的概率是设定的置信水平,变换不等式就可以得到置信区间。

只不过在这里,这个区间的取法可以有很多。

在对称的情况下,比如上面的t分布,方法非常简单,比如我们要算95%的置信区间,左边右边各去2.5%,中间的区间就是95%。

到了不对称的分布,情况就有点微妙了。一般的课本上也都是按照上面的方法,左边右边各去2.5%,中间剩下的是95%,如下图所示:

然而这不是唯一的方法,比如,我们左边去1%,右边去4%可不可以?按照这个方法,中间的区间也是95%啊!

实际上也没有什么不可以,因为置信区间的定义只是要找到一个区间,这个区间包含真值的概率是95%就可以了,没有规定应该如何找这个区间。

那么那么多的区间里面,总有一个最好的吧?

首先应该定义什么是“好”。题主说的没错,置信区间越短越好。

那么怎么构造置信区间最短呢?我们无非是要找一个区间(a,b),使得F(b)-F(a)=0.95,其中F是分布的分布函数。那么,我们的问题可以转化为一个优化问题:

使用拉格朗日:

解出来,我们得到:

因而我们得到结论:如果需要得到最短的置信区间,我们需要让密度函数相等。什么意思呢,就是我们要找这样的置信区间:

之前构造的两边各去2.5%是红色的a'、b',现在构造的最优的置信区间应该是刚好使得密度函数相等,所以两边尾巴的概率很难说是多少了,只能说加起来是5%。

那既然这个是最优的,为啥不用呢?因为难计算啊!

特别是以前没有计算机的时候,都是靠查表来完成找这个区间的,而因为卡方分布有自由度,所以基本上都只给几个1% 2.5% 5% 95% 97.5% 99%之类的几个分位数,上面最优的方法根本查不出来!

比如,下面的代码实现了找一个自由度为5的卡方分布的最小置信区间:

       local df=5 di "传统方法下界: " invchi2(`df',0.025) di "传统方法上界: " invchi2(`df',0.975)  local error=1e10 forvalues t=1/1000{  local leftp=0.05*`t'/100  local rightp=1-(0.05-`leftp')  local ll=invchi2(`df',`leftp')  local ul=invchi2(`df',`rightp')  local new_error=abs(chi2den(`df',`ul')-chi2den(`df',`ll'))  if `new_error' <= `error' {   local error=`new_error'  }  else {   continue, break  } } di "最优方法下界: `ll'" di "最优方法上界: `ul'" di "置信区间概率:F(b)-F(a)=" chi2(`df',`ul')-chi2(`df',`ll')      

结果:

       传统方法下界: .83121161 传统方法上界: 12.832502 最优方法下界: .3318872319614707 最优方法上界: 11.23031364026668 置信区间概率:F(b)-F(a)=.95     

可以看到,新的置信区间同样保证是95%的置信区间,但是区间长度比之前小了1.1。其实收益没有那么大。

所以最佳的置信区间是存在的,仅仅是因为难算,收益小,还不如两边各去2.5%得了。




  

相关话题

  x^4+y^4+z^4+w^4=a^4有正整数解吗? 
  使用微积分能否计算出一个玉米棒上玉米粒的个数?(看问题描述,被怼怕了)? 
  大家知道的最长(复杂)的公式是什么? 
  在设计计量经济学模型时,怎么判断是否应该对变量取对数? 
  是否真的有那么多凤凰男? 
  数学到底有什么魅力,能让那么多数学家用一生去追求? 
  对任意无理数,都存在有理数列趋近于这个无理数,为什么,怎么找这个有理数列? 
  如果让你来编排义务教育阶段至高中的数学课本,你会怎么编排? 
  如何看待科学网发布文章称「我国数学家证明 NP=P」,是真的吗?如果是,会带来怎样的影响? 
  83,63,90,70,100,是什么规律? 

前一个讨论
求解Fejér积分有哪些方法?
下一个讨论
分布函数相同,概率密度一定相同吗?





© 2025-01-18 - tinynew.org. All Rights Reserved.
© 2025-01-18 - tinynew.org. 保留所有权利