国际科研团队开发新型药物预测平台为肝癌与肺纤维化治疗提供突破性方案

问题——创新药研发效率与成功率长期承压；肿瘤、纤维化等复杂疾病往往牵涉多条通路和多种细胞类型异常，传统以单一靶点为核心的研发模式，常遇到靶点选择不确定、临床转化失败率高等难题。近年转录组学为理解疾病状态、评估药物整体效应提供了新路径，但基于转录组的药物重定位通常受限于“已有药物—已知表达谱”数据规模，难以覆盖数量庞大的未知化合物空间，从而限制了从头发现新药的效率。原因——数据噪声与规模瓶颈是关键约束。高通量表达数据来源多、批次差异明显，噪声和偏倚会削弱模型对新化合物的泛化能力；同时，逐个实验测定化合物诱导的表达变化成本高、周期长，难以支撑对海量候选结构的系统筛查。如何在可靠性可控的前提下，将“结构—表达—表型”的关联从少量实验样本扩展到大规模虚拟空间，成为加速药物发现的关键突破方向。影响——“结构推断表达”开辟大规模虚拟筛选新路径。研究团队在《Cell》发表的工作提出GPS平台：输入化合物结构指纹，即可预测其可能引起的基因表达上调、下调或无明显影响等整体特征。研究者用大规模药物诱导基因表达数据训练模型，并引入“鲁棒协作学习”的课程式训练框架，尽量降低高通量数据噪声对学习过程的影响，提高对未见化合物的预测稳定性。基于这个能力，团队为约700万类药化合物的虚拟库生成可比对的“推断转录组”，使原本依赖实验测定的小规模研究，扩展为面向海量结构的计算筛选。对策——以疾病特征为“标尺”锁定候选并生成机制线索。研究强调以疾病转录组特征作为筛选基准：先定义疾病状态下的基因表达模式，再计算化合物是否可能将其“拉回”向健康表型的方向，形成“逆转评分”。在肝细胞癌研究中，团队据此对虚拟库排序，优先选择逆转潜力更高的候选分子，并开展临床前验证与先导化合物优化。研究还显示，平台生成的表达信息不仅用于“找药”，也能帮助“懂药”：通过对候选化合物的表达特征进行聚类与关联分析，研究者观察到化合物效力与其对特定基因模块调控之间存在对应的性，为靶点验证、结构优化与安全性评估提供可追溯线索。在特发性肺纤维化方向，GPS平台被用于更复杂的疾病场景。特发性肺纤维化涉及肺组织中多类细胞的异常状态，单一总体转录组可能掩盖细胞类型差异。研究团队整合患者肺组织单细胞转录组数据，分别提取上皮细胞、成纤维细胞、巨噬细胞等关键细胞类型的疾病特征，再以“细胞类型特异性逆转”的思路筛选候选分子，说明了该方法在多细胞、多通路疾病中的适配性。业内认为，这一策略有助于在早期阶段兼顾不同细胞亚群的治疗指向，为后续联合用药或分层治疗提供参考。前景——从“筛得快”走向“筛得准”，仍需多维验证与规范化支撑。总体来看，GPS平台把计算化学、表达组学与疾病生物学串联成一条可规模化运行的发现链路，有望在早期缩短候选产生周期、扩大结构覆盖面，并为机制研究与先导优化提供统一的数据参照。同时，其深入走向应用仍需补齐关键环节：一是跨实验体系、跨细胞模型的预测一致性与可解释性需要系统评估；二是“逆转转录组”与真实临床获益之间的对应关系，仍需通过动物模型与后续临床研究逐步校准；三是对安全性、脱靶效应等风险，仍需与药代动力学、毒理学等传统评价体系结合，形成更完整的决策闭环。

这项研究为药物发现提供了新的可规模化思路，显示计算驱动的新药研发正加速落地。随着涉及的方法在数据质量、可解释性与临床验证路径上优化，未来有望更高效地挖掘潜在候选药物，并为复杂疾病带来更多可行的治疗选择，惠及患者。

国际科研团队开发新型药物预测平台 为肝癌与肺纤维化治疗提供突破性方案

国际科研团队开发新型药物预测平台为肝癌与肺纤维化治疗提供突破性方案