哈佛重磅突破！AI确定17000多种疾病候选药，罕见病孤儿药不再遥远？

真实自我 10-21 60

默认

摘要： 对于罕见病患者而言有药可用永远都是位的中国国际经济交流中心理事长毕井泉曾于年这样说罕见病顾名思义是患病相对较低的一类疾病由于患病人数少市场需求小以及研发难度大成本高周期长罕见病难度...

...

“对于罕见病患者而言，有药可用永远都是位的。”

中国国际经济交流中心理事长毕井泉曾于 2022 年这样说。

罕见病，顾名思义，是患病相对较低的一类疾病。由于患病人数少、市场需求小，以及研发难度大、成本高、周期长，罕见病难度居高不下，罕见病用药更被称为“孤儿药”。绝大多数罕见病患者都面临着困难、短缺的问题。

据世界卫生组织（WHO）报道，在全球发现的超过 7000 种的罕见病中，有获批的相应方案或的病种不到10%，且大多需要终身。在这一严峻背景下，如何为罕见病寻求有效是缓解罕见病患者困境的关键一步。

这一步，在人工智能（AI）的帮助下有望向前迈出“一小步”。

日前，来自哈佛医学院的研究团队及其合作者开发了一个名为 TxGNN 的 AI 模型，这是首个专门为识别罕见疾病和无药可治病症的候选而开发的新办法，它从现有中确定了 17000 多种疾病的候选，其中许多疾病没有任何现有方法。与用于再利用的同类 AI 模型相比，TxGNN 在识别候选方面平均提高了近 50%，在预测哪些会有禁忌症方面，准确率也高出 35%。

相关研究论文以“A found ion model for clinician-centered drug rep posing”为题，已发表在 N e 子刊 N e Medicine 上。

传统的再利用（drug rep posing）策略，虽然利用现有的安全性和有效性数据，可以加快新在临床中的应用，但这种方法往往是偶然的且机会性较强，很难系统地罕见病的研发问题。

在这种背景下，TxGNN 应运而生，为重新利用带来了革命性的突破，特别是在罕见病发现中展现出巨大的潜力。

TxGNN 是一种基于图神经网络（GNN）的基础模型，专门用于零样本再利用。与传统方法不同，TxGNN 并不局限于现有和疾病的已知关系，而是通过训练一个医学知识图谱（KG），将疾病和之间的复杂关系嵌入到一个潜在的表示空间中，从而能够针对任何给定的疾病预测潜在的。该知识图谱包含了 17080 种疾病、7957 种、27671 种蛋白质等医学概念，为 TxGNN 的训练提供了丰富的数据基础。

图｜TxGNN 是再利用的图基础模型，可为选择有限且分子数据有限的疾病确定候选。（来源：该论文）

在多次实验中，TxGNN 展现出了其强大的预测能力。与 8 种现有的方法进行对比，TxGNN 在零样本环境下表现出了显著的优势。根据论文中的实验数据，TxGNN 在指征预测的准确率上提高了 19%，在副作用预测上提高了 23.9%。

这些结果表明，TxGNN 不仅能够在现有方案中找到潜在的新用途，更能够在没有已知方案的情况下，准确地预测出可能的。这对于罕见病的具有重要意义，因为罕见病中超过 95% 没有现有的，而 TxGNN 为这些疾病快速发现新创造了可能性。

图｜TxGNN 可准确预测适应症和禁忌症。（来源：该论文）

除了预测能力，TxGNN 还特别设计了一个解释模块，用于帮助医生和研究人员理解模型的预测逻辑。这个模块通过多跳路径（multi-hop p hs），展示了与疾病之间的潜在联系。

解释模块不仅能够指出某种为何对特定疾病可能有效，还能提供详细的医学知识路径，让使用者能够追溯到预测背后的科学依据。通过这项功能，TxGNN 克服了许多 AI 模型在医学应用中的“黑箱问题”，大大提高了模型的可解释性和信任度。

图｜TxGNN Explainer 中多跳可解释路径的开发、可视化和评估。（来源：该论文）

研究团队对 TxGNN 在罕见病发现中的实际应用进行了验证，并取得了令人鼓舞的成果。在实验中，TxGNN 的许多预测与实际的临床非使用具有高度一致性。

例如，在对 1272085 名患者的电子病历数据分析中，研究人员发现，TxGNN 预测的在这些患者群体中的使用频率显著高于随机预测。log(OR)（共现比值）的分析显示，TxGNN 预测出的与罕见病的使用关联性比底层预测高出 107%，进一步证明了该模型在实际临床环境中的有效性。

图｜在大型医疗系统中评估 TxGNN 的预测结果。（来源：该论文）

一个具体的案例是，TxGNN 在预测 Wilson 病（一种导致铜代谢异常的罕见病）的潜在时，推荐了去铁酮（Deferasirox）作为最有前途的候选。该在临床中已被用于铁超载疾病，TxGNN 通过其解释模块展示了去铁酮可能通过代谢途径对 Wilson 病的产生积极作用。这一预测也与医学文献中的相关研究结果相符，显示了该模型的科学合理性。

在当前开发周期漫长、成本高昂的背景下，TxGNN 为现有的重新利用提供了系统化的方案。

未来，随着这一技术的不断完善，它有望成为加速开发、特别是使罕见病患者“有药可用”的关键驱动力。

除罕见病领域，AI 在其他医学领域也有着广泛的应用。

2019 年 9 月，AI 研发公司 Insilico Medicine 开发了一个名为 GENTRL 的生成式 AI ，该已用于设计用于纤维化和癌症等疾病的新药。通过使用 GENTRL，研究人员仅使用 21 天就发现了盘状蛋白结构域受体 1 （DDR1）的抑制剂，极大缩短了发现时间。

2022 年，伦敦癌症研究所的研究人员创建了一个原型，可以在 24-48 小时内预测哪些组合可能对癌症患者有效。他们使用 AI 分析来自肿瘤样本的大规模数据，可以比目前的方法更准确地预测患者对的反应。

2023 年，美国公司 Nuance Communic ions 推出一款新型 AI 驱动的语音软件应用程序——Dragon Ambient Expe ence (DAX) Express。该计划旨在通过利用自然语言处理技术，促进患者咨询期间医疗记实时转录，有效帮助减轻临床医生的管理负担。

2024 年，来自哈佛医学院的研究团队及其合作者提出了临床组织病理学成像评估基础（CHIEF）模型，用于提取病理成像特征以进行系统的癌症评估。在包含 11 种癌症类型的 15 个数据集上，CHIEF 在癌症检测方面实现了近 94% 的准确率，显著优于之前的 AI 方法。

毋庸置疑，AI 在改善罕见疾病检测、再利用以及临床流程优化方面的潜力将会越来越大，能够更好地帮助我们更好抗击疾病。

标签：罕见 TxGNN 预测