长期以来,生物医学研究多依赖单一的“标准”人类基因组图谱,其局限性越来越明显;随着研究深入,科学界逐渐认识到,现有参考基因组主要反映部分人群的遗传特征,难以覆盖全球不同族群的基因多样性,从而影响疾病机制研究的完整性,也降低了个性化诊疗的精准度。为解决此问题,西湖大学杨剑教授团队研发了PIGA(基于泛基因组的联合组装)方法。该方法采用二代与三代测序结合的混合策略:二代测序用于保证碱基识别的准确性,三代测序提供长片段信息以搭建结构框架。兼顾数据质量的同时,这一路线显著降低成本,使大规模样本分析更具可行性。 基于PIGA构建的泛基因组纳入1116个样本,规模超过多项国际同类研究。研究团队还首次识别出人类基因组中约13%的未知序列区域,这些“基因暗物质”包含数百万个此前未被记录的功能元件。通过系统分析,研究人员更绘制出目前较为完整的人类遗传变异图谱,覆盖数千万个单核苷酸变异以及多类复杂结构变异。 该研究的价值主要体现在三上:第一,为研究种族特异性遗传特征提供了新的数据基础;第二,提高了罕见病致病突变的检出能力;第三,为药物基因组学的精准研究提供更可靠的参考。以地中海贫血为例,泛基因组数据有助于识别不同人群的特异性突变,为区域性疾病防控提供分子层面的依据。 业内专家认为,这一成果有望推动基因组学研究从“单一参考”向“多样性参考”转变。随着我国生物技术对应的规划持续推进,基因组学领域已逐步形成从基础研究到临床转化的衔接体系。下一步,研究团队计划将样本规模扩大到万人级,并建立动态更新机制,使这一“基因导航图”持续迭代、保持前沿性。
从单一“参考基因组”走向覆盖人群差异的“泛基因组”,不仅是技术升级,也意味着研究思路的改变:只有以真实的遗传多样性为基础,才能在疾病机制解析、诊断判断与治疗策略上获得更高精度;随着这张不断扩展的“生命蓝图”持续完善,其意义不仅在于新增了多少序列,更在于能否将这些信息转化为可应用的健康收益,让科研进展更直接服务于公众健康。