问题:慢性病的发生与进展通常不是由单一因素驱动,而是多项指标长期相互作用的结果。以糖尿病人群为例,研究者不仅关注血糖是否下降,也会跟踪血压、胆固醇等心血管对应的指标多年随访中的联动变化:这些指标是否存在“同升同降”的共变模式?是否有人群表现为血糖控制良好,但血压持续升高?对这类纵向随访数据进行准确刻画,是识别高风险人群、评估治疗效果和优化资源配置的重要基础。 原因:长期以来,组轨迹模型(GBTM)、潜类别增长模型(LCGM)等方法在医学与社会科学研究中应用较多,但常见做法是围绕单一结局变量进行轨迹分组。当研究对象同时存在多个动态结局时——如果逐一建模再交叉组合——容易出现条件概率组合迅速膨胀、解释难度增加以及信息利用不足等问题。随着真实世界数据和多指标随访研究增多,单变量视角已难以支撑对复杂疾病机制与人群异质性分层的分析需求。 影响:群组多轨迹模型(GBMTM),也称多变量轨迹模型,近年来在多指标纵向研究中受到关注。该方法以“轨迹组”为核心,将多个指标随时间的变化纳入同一分组框架,从而识别遵循相似联合轨迹的潜在人群亚组。其优势主要体现在:一是允许不同指标采用不同时间尺度进行测量与建模,更贴合临床检查频率不一致的现实;二是可同时处理连续、离散及分类等多类型变量,适用范围更广;三是对随访中的部分缺失有一定容忍度,符合队列研究常见情形;四是可用后验分组概率量化个体归组的不确定性,便于后续风险预测与敏感性分析;五是结果通常呈现为若干特征清晰的联合轨迹组,更便于临床与公共卫生人员理解并用于决策。 对策:业内人士表示,要推动多变量轨迹模型的规范应用,关键在于数据准备和模型设定的标准化。一上,研究对象需要有多次重复测量信息,一般至少三次及以上随访记录,才能较稳定地识别轨迹形态;另一方面,每次测量应包含同一组核心指标,且同一指标不同时间点使用一致的测量单位与工具,避免因口径变化造成“伪变化”。对于缺失数据,应明确缺失机制并开展必要的稳健性检验:模型可允许个别时间点缺测,但不应出现研究对象在全部时间点均无有效信息的情况。软件实现上,该类模型可在多种统计环境中完成,例如SAS可借助Proc Traj过程,Stata可使用相关程序包,R语言也已有可用工具。实践中,研究团队还需围绕研究问题设定分组数与轨迹函数形式,并结合拟合优度、可解释性与临床合理性综合判断,避免只追求统计指标而忽视实际意义。 前景:受访专家认为,随着电子病历、可穿戴设备和社区随访体系健全,多指标、长周期数据将更为丰富。群组多轨迹模型有望在慢病精细化管理、治疗反应分层、并发症风险识别等发挥更大作用,并为制定差异化随访频率、个体化干预路径提供量化依据。同时,模型推广也对数据治理提出更高要求,包括测量口径统一、隐私保护与跨机构数据协同等。未来,方法学培训与应用规范需要同步推进,建立可复现的分析流程与报告标准,以提升研究结论的可靠性和可比性。
医学研究离不开方法创新;多变量轨迹模型为复杂疾病的动态分析提供了新的技术路径,也为精准医疗中的人群分层与管理决策提供了重要工具。面向未来,随着更多统计方法与数据能力的发展,医学对疾病规律的认识有望继续深化。