1936年到1940年,伦敦大学学院统计系正处于鼎盛时期,皮尔逊退休后,由费歇任高尔顿实验室主任,皮尔逊当系主任。一些学者陆续前来访问,包括美国的多元分析专家霍太林,威尔克斯,频率曲线专家克莱格,概率专家费勒。教师中有内曼这样的教授,所以许宝騄很快就接触到数理统计方面科学前沿的情况。自30年代到40年代,正是N.P.理论(内曼-皮尔逊理论)的形成时期。对于点估计和假设检验,首次提出优良性的概念。如果说,N.P.理论形成以前,数理统计的研究主要是寻求解决问题的方法的话,那么N.P.理论就明确地提出了应该寻求优良的方法,而优良性有客观的标准。于是,马上就会提出的问题是:现有的一些方法如t、F检验等是否具有优良性呢?也就是要问,它们的功效函数是否在一定范围内就是最大的。1938年许宝騄导出了霍太林提出的T2检验在一定意义下是局部最优的,主要的困难是在零假设不成立时,如何导出T2的分布,通常称为非零分布,有了非零分布才能讨论功效函数的大小。他的这一工作在N.P.理论和多元统计分析中都是占有重要地位的先驱性工作。许宝騄的另一项重要工作是在1943年完成的,在讨论检验方法的优良性时,对于线性模型的线性假设,第一次证明了似然比检验的优良性,是对多参数假设检验第一个非局部优良性的工作,如用λ表示似然比检验非零分布中的非中心参数,他证明了:如果功效函数只依赖于λ,那么似然比检验就是一致最强的。后来的研究发现这个条件等价于要求检验具有某一种不变性——这种不变性的要求是问题本身很自然的、合理的要求,因而就相当于证明了似然比检验是一致最强不变检验。莱曼在纪念许宝騄的文章中写了如下的这一段话来论述这篇论文的意义:
'这篇文章开创了两个发展方向。一方面,他的学生席玛卡将许的方法用于多元问题(霍太林的T2及多元相关系数)……。另一方面,在这篇文章中,许提供了获得全部相似检验的新方法。在许的建议下,席玛卡和莱曼将这个方法用于其他问题,后来莱曼和谢飞形成了完备性的概念。'
这足以说明许宝騄在这一方面的工作对后来的研究有多大的影响。
在参数估计方面,当时大部分人关心的是均值估计的优良性,寻找极小方差的无偏估计。1938年许在论文中第一个讨论线性模型中参数б2的优良估计问题。在二次无偏的估计类中,如要求估计量的方差与期望值参数无关,他证明了通常的无偏估计S2具有一致最小方差的充分必要条件是4阶矩具有与正态相同的关系式(这一条件在现在的文献中称为准正态分布)。这个工作直到1952年,拉奥才从另一个角度——限定二次估计是非负的——重新讨论了这个问题,得出了另一种充分必要条件。到了70年代末期,方差分量的模型引起了统计界的广泛注意,许宝騄的工作是这个方向的起始点,而且他提出的方法仍然是处理更加复杂问题的有力工具,有的论文就用许氏模型这一名称来代表这类问题。
此外许宝騄在寻求统计量的极限分布,在次序统计量的极限律型方面,都有重要的贡献。在1949年的一篇论文中,他考虑了样本均值ū1,…,ūk的函数f(ū1,…,ūk),利用泰勒展开,就可以用线性函数或二次函数去近似。并且用许多例子说明,当零假设成立时,线性部分依概率收敛于零,极限分布是正态变量二次型的分布,在很多情况下,正好是x2分布;当零假设不成立时,线性部分是主要的,因此极限分布是正态。在这篇长达40多页的论文中,他给出了许多统计量(尤其是多元分析中常见的)的渐近分布。60年代初,许宝騄领导了一个讨论班,带动一批学生用类似的方法,获得了次序统计量的各种情况下的极限律型,无论是单项的还是多项的,是固定名次的边项还是非固定名次的边项,是正则的还是非正则的中项,发表了几篇论文。这些文章都是用笔名或他的学生的名义发表的,而基本的方法和思想都是他提出的。
- 欢迎来到文学艺术网!