我国老年人残疾发展轨迹类型：基于群体发展模型的应用_分类变量论文

中国高龄老人残障发展轨迹的类型：组基发展建模的一个应用，本文主要内容关键词为：残障论文,高龄论文,建模论文,中国论文,轨迹论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

1 引言

日常生活能力直接影响到高龄老人的晚年生活质量和长期照料问题，因此，了解老年人的生活自理能力是认识中国老年照料问题的前提(杜鹏、武超，2006)。迄今为止，学者们已对中国老年人生活自理能力及其变化进行了不少研究(Liang等，2001；陶立群，2001；王树新等，2001；顾大男、曾毅，2004；张小曼，2004；Zimmer & Kwong，2004；Beydoun等，2005；杜鹏、武超，2006；尹德挺、陆杰华，2007)。在这些研究中，日常生活能力主要通过老人的残障状况来刻画。但是，残障是一个高度动态演化的过程，是随时间不断累积的结果。因此，要想把握和理解老人日常生活自理能力，研究老人残障的动态变化机制就显得尤为重要。这样，一方面，我们可以动态地掌握老人的照料需求及其变动；另一方面，更重要地，甚至可以更好地实施干预，从而降低或推迟老年期残障的发生。

实际上，一些研究已经开始关注中国老人残障动态过程(dynamic processes)或发展轨迹(development trajectory)(Liang等，2001；Zimmer等，1998，2002；顾大男、曾毅，2004；Beydoun等，2005)①，发现残障变化可以采用人口、社会经济、社会网络、健康行为等诸多因素进行解释。这构成了本文分析中国老人残障发展轨迹的理论基础。另一方面，尽管残障动态过程研究在不断进步，但是，在对老人的残障发展轨迹的建模方面仍然存在着方法上的挑战，这些挑战也存在于一般意义上的发展轨迹研究中。其中，最重要的就是对发展轨迹存在总体异质性的忽视。在阐明这些挑战的基础上，本文以前述成果作为理论基础，采用一种被称作组基发展建模(group—based modeling of development)(Nagin，1999，2005；Jones等，2001，2007)②的统计方法来对中国高龄老人残障发展轨迹进行研究，试图区分出不同的残障发展轨迹类型，概要描述不同类型的特征，并以一些人口和社会经济背景因素来对个体的轨迹类型归属加以解释。

2 发展轨迹研究中主要的方法挑战及解决途径

发展轨迹研究通常建立在追踪调查数据的基础上。追踪数据的最大优势是包含同一个体在多个时点上的重复测量，具备随时间变化的信息，从而有利于对变化及造成变化的因果机制进行研究。但是，这也增加了分析的技术难度，因为常规统计分析技术难以处理追踪数据中涉及到的复杂方差协方差结构。

发展模型(growth model)是对发展轨迹进行研究的统计模型的统称，目前常用的主要有两种：分层模型(hierarchical linear models)(Bryk & Raudenbush，1987，1992；Raudenbush & Bryk，2002/2007)③和潜在发展模型(latent growth model)(McArdle & Epstein，1987；Meredith & Tisak，1990；Muthén，1989；Willett & Sayer，1994)。这些统称常规发展建模技术。分层模型方法所做的其实就是将不同观测时点作为层—1分析单位、个体视为层—2分析单位，这就形成了分层模型要求的嵌套数据结构。此时，刻画个体发展轨迹的截距和斜率可以随个体变动。潜在发展模型也只不过是结构方程建模在追踪数据分析中的应用。其中，模型中的随机截距和斜率被视为连续潜在变量(continuous latent variable)，称作发展因子(growth factors)。当然，潜在发展模型现在已扩展为可纳入潜在分类变量(latent categorical variable)的一般化发展混合模型(generalized growth mixture model，简称LGMM)，因而可以处理发展轨迹的总体异质性(Muthén & Muthén，2000；Muthén，2001；Muthén &Muthén，1998-2007)。分层模型和潜在发展模型之间具有一些共同的特质，其中之一就是总体发展轨迹建模都是建立在连续分布函数基础上(Nagin，2005)，并且都致力于解释个体发展轨迹对总体平均发展轨迹的偏离或变异④。也就是说，常规发展建模技术内在的假定：样本中的所有个体来自同一个总体，具有相同的轨迹模式(pattern of trajectory)，但是个体特征上的差异造成了个体轨迹对平均发展轨迹的偏离。一句话，个体发展轨迹模式上相同(homogeneous)，而仅在水平上则各异(heterogeneous)。

但是，不管研究中已经考虑到了多少不同的特征，个体仍将在某些被忽略的特征上有所不同，这些不同几乎必然影响着个体在死亡、结婚、失业或其他转换中的可能性(Vaupel & Yashin，1985)，因此，社会科学研究中总是不可忽略总体异质性的存在。发展轨迹作为个体所经历生命事件的累积，更是具有不同忽略的异质性。这种异质性不仅体现在水平上，更重要的是体现在模式上。这就要求在发展轨迹研究中考虑总体中存在不同轨迹模式的情形。显然，这点是前述两类常规方法无法实现的，而目前的大多数发展轨迹研究都一直采用这些方法。如果忽略这种轨迹模式异质性的存在，得到的参数估计将是有偏的，统计推论肯定也不会是可靠和有效的。

处理发展轨迹异质性问题的常用思路就是使用潜在分类变量(latent categorical variable)。前面提到的Bengt O.Muthén及其同事提出的一般化发展混合模型正是采用该思路的方法之一⑤。该模型通过将具有相似发展轨迹的个体加以归类，能够区分出不同的轨迹类型。至于发展轨迹的模式，各类型内仍然存在个体变异，且其变异可以通过纳入反映个体特征的变量加以解释(王济川等，2007)。另一种思路是Nagin及其同事提出的组基发展建模(Grouped—Based Modeling of Development)。类似地，组基发展建模方法的目的也是区分出不同的轨迹类型，并考察个体特征如何影响着总体中各轨迹类型的模式及其分布情况。组基发展建模方法假定各轨迹类型内的个体具有相同的发展轨迹，而且通过不同类型之间的差异来描述发展轨迹中的个体变异(Nagin，2005)。

一般化发展混合模型和组基发展建模的分析重点在于将数据中的个体区分成不同的潜在类别，从而达到对总体发展轨迹中存在的异质性进行处理的目的。这种处理恰恰与发展轨迹研究中一个非常重要的问题相契合：识别或评估所研究的总体中是否存在若干具有不同发展轨迹的子总体(王济川等，2007)，这就避免了对发展轨迹做主观分类的问题。而且，通过概括出不同的发展轨迹类型，也有助于我们对总体发展轨迹的认识和把握。

组基发展建模相对比较简单，数据处理和模型估计都能够采用SAS统计软件来实现⑥。而潜在发展混合模型作为一个更为一般化的模型，目前需要采用能够处理结构方程建模的分析软件才能进行模型估计⑦。因此，出于简便的考虑，研究者中往往选择组基发展建模技术来处理发展轨迹中的总体异质性问题。高龄老人是一个具有非常强异质性的群体，由于人口、社会经济、健康行为和心理特征等诸多方面都具有显著差异，其健康状况的变化也很可能呈现出不同的发展轨迹。因此，本研究将尝试采用组基发展模型方法来对中国高龄老人残障发展轨迹进行研究。

3 组基模型简介

组基发展轨迹模型实际上是有限混合建模的专门化应用。目的是识别具有相似轨迹的个体的聚类，从而确定若干个具有不同轨迹类型的子群体。有关该模型原理的详细介绍，请参见Nagin(2005)的专著⑧。

组基发展建模涉及三个最基本的问题。

一是确定最佳的轨迹类型数。也就是如何确定一个能够拟合数据的恰当模型。因为合适的轨迹类型数和恰当的发展轨迹形态(即时间函数的形式)会共同影响到一个模型是否恰当。因此，一般需要首先根据现有理论确定合适的轨迹类型数；但在没有理论假设的情况下，研究者需要考虑轨迹类型数和时间函数形式的不同组合，运行出一系列模型，然后采用贝叶斯信息标准BIC来对这些模型加以比较，选取BIC值最接近于零的那个作为恰当模型(11)。

三是群体身份分派(Group Membership Assignment)，即计算每一个体属于特定轨迹类型的概率。在组基发展建模中，如果我们发现结果变量随时间变化的轨迹的确可以区分出J个类型或群体，那么根据下述公式，我们计算出每一个体被分派到不同轨迹类型j的后验概率估计值：

(5)

注意，如果发现存在J个类型，那么，对于每一个体，可以得到J个群体身份的后验概率估计值。然后根据最大概率分派原则将个体分派到其后验群体身份概率最大的那个组。由于总是无法避免错误分类，所以，个体被分派到某一类型的概率总是不等于1，分派到其他类型的概率也总是不等于0。因此，Nagin(2005)建议，当群体身份分派的正确概率不小于0.7时，模型是可接受的。

4 研究问题、数据来源及模型设定

4.1 研究问题

考虑到诸多研究表明高龄老人残障变化确实存在着不可忽略的异质性(Anderson—Ranberg等，1999；Evert等，2003；Hardy & Gill，2004；顾大男、曾毅，2004)，本文试图采用组基发展模型来对中国高龄老人的残障发展轨迹进行研究，首先识别出若干轨迹类型，然后纳入有关人口和社会经济背景变量来解释每位老人在轨迹类型归属上的差异，同时纳入随时间变动的人口、社会经济和健康行为因素以及患病状况来刻画不同残障发展轨迹之间的差别。

4.2 数据来源

所用数据来自北京大学老龄健康与家庭研究中心所做的中国高龄老人健康长寿追踪调查(Chinese Longitudinal Healthy Longevity Survey)项目1998年、2000年、2002年和2005年的4期调查。这是中国第一项针对高龄老人的全国性大规模追踪调查，覆盖了全国的22个省、市和自治区。1998年基线调查共调查8959名80岁以上的老人。在随后的2000年、2002年和2005年追踪调查中，8959名参加基线调查的高龄老人中，分别追踪到4744、2582和1010名老人。本文的分析将只针对参加全部四次调查的老人，而将那些在任意一次追踪调查中失访或死亡的老人加以排除。正如先前的一些研究(Zeng & Vaupel，2004；Gu & Zeng，2004)所述，考虑到没有足够的信息来证明那些极高龄老人所报告的年龄是正确的，我们排除了那些年龄超过105岁的高龄老人。此外，排除掉民族和上学年数两个背景变量上存在缺失值的4名老人，本研究用于分析的最终样本规模为1004名高龄老人。

该项目基线调查与跟踪调查问卷内容包括老人个人及家庭基本状况、社会经济背景及家庭结构、对本人健康状况与生活质量状况的自我评价、性格心理特征、认知功能、生活方式、日常活动能力(Ability of Daily Living，简称ADL)、经济来源、经济状况、生活照料、生病时的照料者、能否得到及时治疗与医疗费支付者等90多项问题共180多个子项。同时，担任调查员的医学院校学生或当地医护人员对老人进行了最基本的健康体检(体重、身高、血压、心跳、肢体活动能力和患病史)。

4.3 残障的界定

本研究根据有关日常活动能力的问项来界定残障的含义。中国高龄老人健康长寿追踪调查也采用Katz等(1963)编制的生活自理能力量表来测量老人的日常活动能力，包括洗澡、穿衣、室内活动、上厕所、大小便控制和吃饭等6项。存活者和死亡者就这些问项给出的回答的可靠性系数都在0.85以上(顾大男、曾毅，2004)。另外，老人自己报告的ADL情况的可靠性和有效性已经被国外的类似调查所确证(如见Magaziner等，1996；Smith等，1997)。因此，可以认为本样本数据对老人日常活动能力的测量结果也是可靠的。

考虑到大小便控制主要侧重于测量老年人生理功能方面的问题，而本研究侧重于日常活动能力方面的状况，因此排除大小便控制这一项。另外，由于日常活动能力的测量涉及到多项内容，因此，在针对日常活动能力所进行的现有研究中，研究者通常是综合考虑多个问项而采用一个简化的测量指标——是否自理(13)，将日常生活能力转换成一个二分变量进行处理(陶立群，2001；顾大男、曾毅，2004，2006；王德文等，2004；杜鹏、武超，2006；尹德挺、陆杰华，2007)。这种处理方式的好处是可以选择我们熟悉的logit模型来进行统计建模。这里不再沿用这一常规的操作化方式，我们将老人在洗澡、穿衣、室内活动、上厕所和吃饭等五项日常活动中每一个部分或完全需要帮助的项目分别定义为一项残障，然后得到每位老人在每次调查中残障项目的计数。因此，与现有的研究不同，本研究的因变量为残障项目计数。

4.4 组基发展模型设定

本研究所采用的因变量为计数变量，因此我们需要选用组基泊松发展模型(Group—Based Poisson Model of Development)进行数据分析。通过观察图1中给出的经验分布图，我们可以看到，残障计数变量在不同时点的分布上均存在零膨胀现象(即取0值的频数超出正常情况)(14)。因此，我们最终选择组基零膨胀泊松发展模型(Group—Based Zero—Inflated Poisson Model of Development)，此模型可以处理潜在发展轨迹类型的问题，还能对计数变量上的额外零值进行调节。

说明两点。第一，公式(7)和(8)都包含时间变量T的三次项，但实际研究中，并不一定把最高次项设定至三次，也可以将个别轨迹类型的最高次项定为一次或甚至只是截距项(15)。本研究将时间变量T编码成0、2、4、7以反映两次调查之间的时间间隔。第二，在数据信息允许的情况下，可以将随时间变动解释变量纳入到公式(8)中，但是，受方法本身的限制，这些变量目前无法纳入公式(7)中。系数解释与常规模型无二致。

在根据上述基准模型的探索得到恰当的轨迹类型或群体数量之后，我们将纳入有关的时间恒定变量来预测个体的残障发展轨迹类型归属、纳入随时间变动变量来揭示残障发展轨迹类型之间的差异。这些变量主要包括人口(比如婚姻状况、居住地类型)、社会经济(教育和职业)和健康行为(比如吸烟、喝酒和锻炼)。时间恒定协变量包括：1998基线调查时的年龄(以样本均值进行对中处理)、性别(男性=1，女性=0)、民族(汉族=1，少数民族=0)、出生地类型(城镇=1，农村=0)以及反映高龄老人社会经济地位的上学年数(以样本均值进行对中处理)和60岁前的职业(从事农业活动=1，从事非农业活动=0)。随时间变动的变量包括：居住安排(独居=1，非独居=0)、经济状况(经济独立=1，经济不独立=0)、婚姻状况(有配偶=1，无配偶=0)、居住地类型(城镇=1，农村=0)、目前所患疾病的数量(16)以及反映健康行为的吸烟史(过去吸烟=1，过去不吸烟=0)、饮酒史(过去饮酒=1，过去不饮酒=0)和身体锻炼史(过去锻炼=1，过去不锻炼=0)(17)。

图2 组基发展建模思路的示意图

注：这是结构方程建模情形下，组基础发展建模的图形示意。其中，I、L、Q和C分别表示时间变量的0、1、2、3次项斜率系数(如前所述，它们被当作潜在连续变量)，而J则是一个表示不同轨迹类型的潜在类别变量(latent class variable)，单箭头表示因果关系，双箭头表示相关关系。

5 模型结果与分析

5.1 残障发展轨迹的类型

为了确定最佳的轨迹类型数，我们根据公式(7)和(8)的设定，从单一类型模型(即j=1)开始，运行了包含不同轨迹类型数和不同时间函数形式组合情况下的组基零膨胀泊松模型，最大组数为J=6，时间多项式函数的最高次项限定为2次(18)。

图3给出了轨迹类型数和不同时间函数形式组合情况下的贝叶斯信息标准BIC变动的情况。将残障发展轨迹区分成3个类型之前，BIC一直持续下降，但是，之后开始缓慢上升。根据统计建模的简约原则，最终确定高龄老人残障发展轨迹类型的最佳数量为3类。

图3 BIC对轨迹类型或群体数：模型选择

5.2 残障发展轨迹的不同类型及其概貌特征描述

在确定3个轨迹类型情况下，我们考察了泊松模型和零膨胀logit模型中将时间函数设定成不同形式情况下的模型BIC情况，得到最佳的组合为：泊松模型中3个轨迹类型的时间函数均设为线性的，同时轨迹类型1中不存在零膨胀、轨迹类型2和轨迹类型3下发生的零膨胀与时间无关(即时间函数只含常数项)。此模型的BIC为—3380.13。

图4 观测和模型估计的高龄老人残障发展轨迹

图4给出了从样本中观测到的高龄老人残障发展的平均轨迹(图中粗实线)以及所得3个不同轨迹类型观测和估计的发展轨迹。可以看到，除了类型2之外，其他两个与观测到的平均发展轨迹无论是在形状还是在水平上都存在极大差异。3个轨迹类型之间区别非常明显。

轨迹类型1中老人的残障水平一直极低，大多数人直到年龄很大时仍未出现残障，只有少数一部分人随着年龄增长发生了不超过一项日常生活能力上的残障。因此，将该类型定义为“身体健全型”。轨迹类型2中老人的残障水平开始比较低，随着时间推移缓慢上升，经过一段时间之后突然猛升。该群体的残障水平一直处在发展上升过程中，因此，将该类型定义为“低起点快速发展型”。相对于类型1和类型2，轨迹类型3中老人的残障水平开始时就相对偏高，并且一直处在近似线性地平稳发展过程中。因此，将该类型定义为“高起点平稳发展型”。

接下来，我们可以结合样本数据中的个体特征信息，来进一步刻画不同轨迹类型的概貌(profile)。表1就所选的一些变量对3个轨迹类型的概貌加以描述，据此，可以更清晰地看到不同残障发展轨迹类型的特征。我们看到：“身体健全型”残障发展轨迹盛行于西部那些受教育年数相对多些、基线调查时年龄在85岁上下的出生在农村的少数民族男性高龄老人，“低起点快速发展型”盛行于中部那些受教育年数相对少些、基线调查时年龄在88岁上下的出生在城镇的女性高龄老人，而“高起点平稳发展型”则主要盛行于中部那些受教育水平居中、基线调查时年龄在89岁上下的出生在农村的汉族女性高龄老人。

5.3 模型拟合评价

前面提到，在运行设定的组基发展模型之后，我们可以得到个体后验轨迹类型身份概率的估计值，然后根据最大概率分派原则将该个体分派到概率估计值最大的那个轨迹类型。据此，我们可以将样本中的1004名高龄老人指派到上述3个轨迹类型中的一个中去。表2中的“样本成员分类”一行给出了这些老人在3个轨迹类型上的分布情况。可以看到，61.25％(n=615)的老人归属于“身体健全型”，26.49％(n=266)的老人归属于“低起点快速发展型”，剩下约12.25％(n=123)的老人则归属于“高起点平稳发展型”。我们看到，每一类型所包含老人的数量都比较大，表明3个发展轨迹类型的分类相对比较稳定。同时，这表明该模型是比较合理的。

表2还给出了成员正确分类的情况。类型1、类型2和类型3正确分类的比例分别为88.3％、83.6％和90.0％，各类型中成员正确分类的概率均明显超过0.7的经验标准(Nagin，2005)。因此，这一点也表明，所拟合的模型是可接受的。

BIC标准、类型规模的大小以及成员正确分类比例都表明，我们所拟合的包含3个轨迹类型的组基零膨胀泊松发展模型是可接受的。下面，我们将把前面提到的一些解释变量纳入模型，进一步考察不同轨迹类型如何受到随时间变动协变量的影响(19)以及时间恒定协变量如何影响着老人残障发展轨迹的类型归属。

5.4 轨迹类型归属的影响因素

在前述模型设定的基础上，我们将一些反映老人的人口、社会经济和健康行为特征的时间恒定和随时间变动的协变量纳入模型。其中，随时间变动的解释变量只能用来预测残障发展轨迹的形态，而时间恒定解释变量则被用来预测老人的残障发展轨迹属于哪一个类型。考虑到组基发展建模的目的之一在对个体发展轨迹的归类，所以，这里我们只列出与群体成员身份预测有关的模型参数估计结果，这其实是前面概貌描述工作的继续和深化。就好比统计中常常提到的单变量分析与多元分析之间的关系。从另一个角度来看，由于所得到的轨迹类别实际上对应着一个潜在类别变量(latent class variable)，代表着没有观测到或不可观测到的一个维度，那么，通过纳入时间恒定变量来对预测轨迹类型归属的过程实际上可以理解成综合考虑多个可观测维度将该潜在维度显在化的一个过程。这里，我们试图通过利用已有数据中包含的一些变量信息来综合多个维度进一步澄清轨迹类型。请注意，这个模型其实是一个多分类logit模型(multinomial logit model)，因变量为轨迹类型归属(1=类型1、2=类型2、3=类型3)，而且类型1被作为参照类。下表3给出了该多分类logit模型的参数估计结果。

首先看年龄的影响。我们看到，基线调查时的年龄会显著地影响老人被分派到“低起点快速发展型”和“高起点平稳发展型”轨迹的可能性。具体而言，在控制其他变量的情况下，老人在基线调查时的年龄每增加1岁，其被分派到该轨迹类型2相对于分派到类型1的发生比为原来的1.143倍(即e[0.143])；同样地，在控制其他变量的情况下，老人在基线调查时的年龄每增加1岁，其被分派到该轨迹类型3相对分派到轨迹类型1的发生比为原来的1.201倍(即e[0.183])。原因可能在于，这3个轨迹类型在调查基期时的年龄上本身就存在异质性，而这种异质性源于身体器官的功能本身会随着年龄增加而减弱的生物规律。因为，从表1中我们可以看到，类型1中老人的平均年龄最小，为85岁；其次是类型2，为88岁；而类型3的平均年龄最大，接近90岁(20)。

其次是性别的影响。我们看到，对应的回归系数均为负值，这意味着，男性老人残障发展轨迹呈“低起点快速发展型”和“高起点平稳发展型”特征的可能性均低于女性。实际上，王树新和曾宪新(2001)、顾大男和曾毅(2004)及Hayward等(1998)的研究就发现残障发生率存在很大的性别差异，女性高龄老人比男性更容易残障。这里我们进一步发现，高龄老人残障发展轨迹类型上也存在显著地性别差异。不过，性别差异的原因可能还有男女高龄老人的年龄结构差异影响，因为样本数据中女性老人中100岁以上所占的比例(8.8％)要高出男性的情况(1.2％)。若果真如此的话，那么这种性别差异也许只体现生物性的一面。虽然我们已经将一些社会经济特征考虑到模型中来，但是，考虑到我们这里的分析对象都出生在上个世纪20年代之前，这里我们仍不能排除其性别差异所隐含着的社会性一面，对此还有待进一步的探索与分析。

再次是民族的影响。我们发现，在控制其他变量的情况下，汉族老人比少数民族老人更可能呈现“高起点平稳发展型”残障发展轨迹，但民族对老人属于“身体健全型”还是“低起点快速发展型”发展轨迹不存在显著影响。这很可能是因为少数民族比汉族发生残障的可能性要小得多但恢复自理的可能性却又大得多(顾大男、曾毅，2004)。不过，由于该数据并不涵盖许多少数民族居住的省区，因此，这里的民族差异并不代表全国的情况。

最后，来看社会经济地位对老人残障发展轨迹类型归属的影响。我们发现，受教育程度对老人的轨迹归属并无显著影响。其实，现有研究表明，受教育程度甚至并不影响高龄老人短期内生活自理能力(Zimmer等，1998，2002；顾大男、曾毅，2004)。老人60岁之前的职业会对其残障发展轨迹的类属构成显著的影响。那些60岁之前务农的高龄老人的残障发展轨迹更可能属于“身体健全型”轨迹，而从事非农职业老人则更可能被归属于“低起点快速发展型”和“高起点平稳发展型”。这可能与务农者在老年时期仍参与务农活动从而使其自理能力在高龄时期仍能得以维持在相对较好的水平有关(顾大男、曾毅，2004)(21)。另外，非农职业的专业化分工在长时期内可能对劳动者造成特定的损伤，同时，离开农村本身可能意味遭工伤、交通事故以及其他伤害的更大可能性。

6 总结

由于采用常规分层模型和潜在发展模型方法进行发展轨迹建模无法处理异质性轨迹类型的问题，所以本文对中国高龄老人健康长寿追踪调查1998年、2000年、2002年和2005年前四轮数据进行分析时，应用了组基零膨胀发展模型，以便在考虑轨迹类型存在异质性的情况下来对高龄老人残障发展轨迹进行分析。研究发现，可以合理地将高龄老人的残障发展轨迹区分为3个明显异质的子类型——“身体健全型”、“低起点快速发展型”和“高起点平稳发展型”。在将高龄老人残障发展轨迹区分成3个合理类型的基础上，我们还纳入人口和社会经济变量来对老人残障发展轨迹归属进行解释。研究还发现，在控制其他变量的条件下，老人进入基线调查时的年龄、性别、民族以及60岁之前的职业类别都将显著地影响其残障发展轨迹的类型归属。

相对于常规发展轨迹建模发现，基础模型发展建模的优势在于可以处理总体中的发展轨迹形状存在异质性的情况，通过使用有限个潜在子群体(体现为模型中的潜在分类变量)来对总体进行近似地描述(Nagin，2005)，该建模技术可以处理发展轨迹形状上存在异质性的问题。采用这种以分组为目的的发展轨迹建模技术，我们可以将个体发展轨迹区分若干个有限类型，并可以通过纳入时间恒定的解释变量对个体所属的轨迹类型加以解释或预测。相对于常规发展轨迹建模技术(即分层模型和潜在发展模型)，这种将发展轨迹加以类型化的方式更有助于我们认识和把握研究对象的发展轨迹。而且，如果利用个体的人口、社会经济、心理和行为特征来描绘出轨迹类型的概貌，进一步明确轨迹类型盛行于其中的人群的可观测特征，那么所得到的分析结果将特别有助于提出和实施干预措施。不过，组基发展建模技术并不是对常规发展建模技术的替代。实际上，前者关注不同轨迹形状的识别以及轨迹类型的盛行和轨迹类型本身如何与个体背景因素相关联，后者则关注总体中的平均轨迹以及个体特征如何影响个体对该平均轨迹的偏离。因此，两者之间其实应当被认为是互补的而不是竞争的(Nagin，2005)。

当然，由于主要目的在于介绍一种新的发展轨迹建模方法，因此，本研究只是一个非常初步的尝试，所得到的也只是一些探索性的分析结果，需要谨慎对待。其中存在的问题和不足也需要在今后的研究中加以改进。比如，本研究只选取了那些四次调查都参与了的高龄老人作为分析样本，如果那些老人的失访或死亡和残障程度存在关联的话，那么将这些老人排除在外无疑肯定会造成估计上的偏差。另外，更为重要的一点，在使用追踪数据进行变化或发展研究的时候，时间测度可以是调查轮次(比如1、2、3、4)，也可以是个体在每次调查时的年龄或所在年龄组，而调查轮次在处理上最为简单但在分析上却用处最小(Singer & Willett，2003)。尽管我们在处理上还考虑了调查之间时间间隔不等的情形，但是考虑到残障发展其实与年龄之间的关系更为密切，如果换用年龄作为时间测度的话，我们肯定能够得到一些更具理论意义的结果(22)。这些都需要在以后的研究中进一步加以改进。

注释：

①尽管也存在一些明确表示对“变化”进行研究的文章，但由于使用的并非追踪调查数据，因此，所揭示的其实并非变化而是同一群体或队列随着时间而呈现出的差异(郭志刚，2001)。

②感谢郭志刚教授将group-based modeling of development简译成“组基发展建模”。

③也被称作多水平模型(Goldstein，1995)。

④总体中的平均发展轨迹由截距和斜率的固定系数来反映，而个体对该平均轨迹的偏离则由随机截距和随机斜率来刻画。

⑤他们发展出的Mplus软件可以处理这种模型，而且Mplus本身就是以进行包含潜在变量的统计分析为目的的统计软件，其优势在于对(分类的和连续的)潜在变量的处理。

⑥目前所用的SAS程序为Jones等(2001，2007)编制的Proc Traj模块。该模块可以从B.Jones的个人网页上下载：http://www.andrew.cmu.edu/user/bjones。

⑦其中最适用的是Mplus软件(Muthén & Muthén，1998-2007)。

⑧对该模型统计原理感兴趣的读者可以参阅Nagin & Land(1993)、Land等(1996)、Roeder(1999)、Nagin & Tremblay(1999)和Nagin(1999)。

⑨换句话讲，这有限个未观测到的群体混合构成了研究总体。在这一意义上，多层模型和潜在发展模型也是一种混合模型，只不过其混合分布是无限的。而且，如果这里j=1，那么，组基发展模型与常规发展模型并无二致。

⑩对于重复测量数据而言，无序列相关的假定显然太不现实了。那么，为什么仍然要这么假定呢？理解这个条件独立假定，需要考虑两点。第一，这样做的目的是为了简化模型估计；第二，所谓条件独立或结果变量的测量结果不存在序列相关，是针对个体轨迹偏离平均轨迹这一意义而言的，即相当于假定具体个体轨迹对平均轨迹的偏离之间不存在相关。

(11)但是，注意，基于嵌套模型的对数似然比检验并不适合对具有不同群体数量的模型进行比较。因为，此时包含不同群体数量的两个模型之间并不存在嵌套关系，因此，所得到对数似然值之差并不服从卡方分布。除BIC标准之外，贝叶斯因子的对数(Raftery，1996；Jones等，2001，2007)和正确模型概率(Nagin，1999，2005)也常被用来作为模型比较与选择的标准。

(12)请注意，协变量的下标中并没有包含表示不同测量时点的t，这意味着只能将那些时间恒定协变量纳入到多项logit模型中来对群体成员资格概率进行预测。

(13)通常的做法是，只要老人在各项目中有一项不能自理，即被定义为生活不能自理，而各项指标全部能够自理则被认为生活能够自理。

(14)对此可以进行正式的统计检验，表3底部给出了该检验的信息。

(15)注意，这里只是示意可将时间设定成多项式函数，目前Proc Traj模块的版本为2008年9月17日版，经测试，最高允许设定时间的6次项。

(16)类似的处理，见王德文等(2004)。

(17)限于篇幅，这里略去变量的描述性统计。

(18)根据经验规则，在发展轨迹建模中设定时间的多项式函数时，如果时间的最高阶项设为d次的话，那么，就需要d+2个观测时点。由于我们这里只有4个时点的观测，因此，最高只设定为时间的二次函数。

(19)我们发现，在三种发展轨迹类型中，体育锻炼均可预防或减缓残障化速度，而疾病则毫无例外地将会加剧残障化；对于类型1而言，独居对残障化也具有延缓效应，可能是由于独居本身要求老人身体相对健康；对于类型3而言，吸烟反而有助于延缓残障化。限于篇幅，这部分结果略去。

(20)当我们只观注一定时间内的变化时，很容易忽视不同年龄者具有不同变化特点，而这正是一种由年龄决定的异质性。同时其中还可能有队列效应。但时期效应则不应混杂在其中，因为所有案例都经历同时期的自然环境和社会变化。考虑得再复杂一点，可能还有年龄、时期、队列之间的互动效应。——感谢郭志刚教授向作者提示这一点。

(21)感谢郭志刚教授向作者提示这一点。

(22)感谢谢宇教授在对初稿的评论中指出本文在时间测度选择上考虑的不足。实际上，我们对时间变量的编码相当于进行了以基线调查时年龄进行对中的处理。

标签：分类变量论文; 概率计算论文; 群体行为论文; 能力模型论文; 异质性论文; 数据建模论文;

我国老年人残疾发展轨迹类型：基于群体发展模型的应用_分类变量论文

猜你喜欢