混合导数测度的性质及其应用,本文主要内容关键词为:导数论文,及其应用论文,性质论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:O212.4
一、引 言
在数理统计中,随机变量间交互作用的大小是人们常常关心的问题。为了从不同方面度量这种交互作用,人们引进了各种各样的关联系数,如[2,3]中对离散随机变量引进的差积比,辅助交互作用等。在连续型随机变量间常用的是相关系数和条件相关系数。文献[4]在讨论图模型的分解理论时还引进了一种混合导数测度,它对图模型的选择与可分性的问题都是极为重要的(见[4]的第二章及第十二章)。这个度量也被其它一些方面的研究所采用如[5]。
近来有许多文献([3,6~8])都讨论了交互作用测度的可压缩性的问题。可压缩性的实质就是寻找一些条件从而去掉对交互作用“无关”的多余的变量,使研究者的注意力主要集中在若干重要的变量上。另一方面,如果不考虑可压缩性的条件,肆意用低维的交互作用测度代替高维的情况,往往导致象Simpson悖论一样的错误结论(见[2]P[,31])。[4]也讨论了混合导数测度的可压缩性问题,但它仅仅只给出可压缩性的某些充分条件,人们自然想得到对于这个测度而言,变量可压缩的充分必要条件。
本文试图就三维Bernoulli与正态分布讨论可压缩性的充分必要条件,然后我们利用混合导数测度与图模型分解之间的密切关系去证明[1]中提出的Gibbs分解问题,所要注意的是Gibbs分解在链图模型的极大似然估计方面是十分重要的,详细讨论见[1]。
二、基本概念
为了能使离散型随机变量和连续型随机变量有混合导数测度的统一定义形式,对于任何的离散变量或是属性变量,我们均假设它们的取值是非负整数。这个假定不是实质性的,主要是为了数学上描述的方便。另外本文讨论的前提是所有密度函数为正的,在图模型分析中,这一假设是必要的(见[4])。
称之关于交互作用ρ是可压缩的。
一个随机变量关于某种交互作用的可压缩性问题有许许多多的讨论,见[3,6~8]及其所引的文献。
引理1 设(X[,1],X[,2],…,X[,n])的密度函数是f(x[,1],x[,2],…,x[,n]),将X剖分成(X[,1],x[,2],X[,a]),则相对混合导数测度,X[,a]可压缩的充计条件是X[,a,]⊥X[,1]|X[,2]或X[,a]⊥X[,2]|X[,1]。
这里记号X[,a]⊥X[,1]|X[,2]表示:当给定X[,2]时,X[,a]与X[,1]条件独立。此引理的证明见[4]prop2.3.3。
这一结论表明:在混合导数测度下,一个随机变量是否可压缩是有必要讨论的。同时对于上述引理,人们立刻想要知道:引理中的条件是否是必要条件呢?对一般分布来回答这一点是困难的,因为从定义看,混合导数测度的计算与密度函数有十分的密切关系,不能一概而论。
三、两种分布的混合导数测度的可压缩性
这一段里,我们给出当随机变量服从Bernoulli分布和正态分布时,变量对混合导数测度可压缩的充分必要条件。
先讨论Bernoulli分布的情况。设(X,Y,Z)是离散的随机变向量,P(X=i,Y=j,Z=k)=p[,ijk]>0,i,j,k都取0、1二值,称(X,Y,Z)服从三维Bernoulli分布。实际上,它就是一个2×2×2的列联表,它是实际工作中最常用的分布之一。
定理1 若(X,Y,Z)服从三维Bernoulli分布,则在混合导数测度下,随机变量X是可压缩的充分必要条件是:
(1)X⊥Y|Z,
或
(2)X⊥Z|Y。
证明 充分性是引理1所保证了的。我们只证必要性(略)。
定理2 若(X,Y,Z)~N[,3](0,∑),则在混合导数测度下,X是可压缩的充要条件是X⊥Y|Z或X⊥Z|Y。
注意当正态分布高于三维时,定理2的条件可能不是必要的。
另一方面,从这个例子不难发现:引理1的条件不能肯定就是必要条件,需要根据不同的分布而确定。
四、Gibbs分解的一种证明
在这一节用到的图模型的概念和记号见[1,4],限于篇幅我们不再重述。
为了方便证明主要定理,先给出几条引理及其相关的概念。
定理3 (无向图的Gibbs分解)设G是一个无向图,概率测度P有G-Markov性,当与P对应的密度函数f(x)严格正且各阶混合偏导数存在时,f(x)相对图G有Gibbs分解。
最后要指出的是,[10]中证明Gauss图模型有Gibbs分解,这个结果显然是我们定理3的特例。
致谢:作者诚恳的感谢审稿人对原稿提出的建议,他使我们的结论更加完善。
标签:导数论文;