癌细胞表面的显微照片(细节清晰)。图片来源:DG | The Daily Galaxy -- Great Discoveries Channel © Daily Galaxy US
耶鲁大学与谷歌DeepMind的联合研究团队利用拥有270亿参数的人工智能大模型C2S-Scale,在没有任何预设生物学偏见的情况下,准确预测了一种已上市抗癌药物的全新用途:让免疫系统"看不见"的肿瘤暴露行踪。这一预测随后在人体细胞系实验中得到验证,抗原展示水平提升了50%。这项发表在生物预印本平台bioRxiv上的研究,标志着AI首次独立生成并验证了一个可行的癌症治疗假说。
“冷肿瘤"困局:免疫疗法的致命盲区
通过训练 LLM 对多样化、多模态数据执行单细胞分析任务,将 Scrna-Seq 数据与自然语言连接起来 © Daily Galaxy US
癌症免疫疗法近年来取得长足进步,通过激活患者自身免疫系统来攻击肿瘤细胞。然而,这种疗法并非对所有患者有效。研究显示,约70%至80%的实体瘤属于“冷肿瘤"——它们通过多种机制逃避免疫系统监视,导致免疫检查点抑制剂等疗法无效。
冷肿瘤的核心特征是免疫原性低下。这些肿瘤细胞表面缺乏足够的抗原展示,或其微环境中免疫细胞浸润极少,形成免疫抑制性微环境。正常情况下,癌细胞会通过主要组织相容性复合体I类分子将异常蛋白片段展示在细胞表面,作为“危险信号"被T细胞识别并清除。但冷肿瘤精心布局了一套伪装系统,通过下调抗原加工和呈递机制,让自己在免疫系统的"雷达"上隐形。
这一现象在临床上造成了严重后果。根据权威医学研究,大多数冷肿瘤对免疫检查点抑制剂治疗无应答,即便在联合治疗方案下,总体应答率也往往低于30%。如何将这些“冷肿瘤"转化为“热肿瘤"——即增强其免疫原性和T细胞浸润——成为肿瘤免疫学领域最紧迫的挑战之一。
传统的药物筛选方法依赖于对成千上万种化合物进行实验室测试,这一过程不仅耗时数年,资源消耗巨大,且结果难以预测。正是在这样的背景下,研究团队决定尝试一种全新的方法:让AI来模拟细胞行为。
解读“细胞语言"的270亿参数模型
C2S-Scale建立在Cell2Sentence框架之上,这是一种将单细胞转录组数据转化为自然语言的创新方法。与传统的语言模型学习人类文字不同,C2S-Scale学习的是细胞的“分子表达模式"——它接受了超过10亿条转录组数据、生物学文献以及来自5000多万个人类和小鼠细胞的注释训练。
该模型的核心创新在于将每个细胞的转录组——即特定时刻基因活性的快照——转换为所谓的“细胞句子"。通过这种方式,AI能够理解不同基因表达模式如何相互作用,以及药物如何改变这些模式。
根据发表在bioRxiv上的预印本论文,研究团队利用C2S-Scale模拟了超过4000种已知药物对癌细胞和健康细胞的影响。这些虚拟测试在“双情境虚拟患者"中进行——一个同时模拟疾病和健康生物学状态的系统,使研究人员能够直接比较药物的差异化影响。
在这场大规模的虚拟筛选中,一种名为silmitasertib的分子脱颖而出。这种激酶抑制剂此前主要因其阻断肿瘤生长的能力而被研究,但C2S-Scale预测它还具有另一个此前未被发现的作用:增加冷肿瘤表面的抗原展示,使其能被T细胞识别。
从AI预测到实验室验证
基于LLM的单细胞分析的扩展:C2s[14]框架的多维扩展。 © Daily Galaxy US
研究团队随即在实验室中检验了AI的假说。在此前从未被AI“见过"的人体细胞系中,研究人员观察到暴露于silmitasertib后,抗原展示增加了50%。这是一个显著的信号,足以表明该药物可能将某些冷肿瘤转化为"热肿瘤",使其对免疫疗法敏感。
Silmitasertib的化学名称为CX-4945,是一种酪蛋白激酶2抑制剂。该药物已经在多项临床试验中进行过评估,包括用于治疗胆管癌的研究。2011年的I期临床试验确立了该药物可以在两种不同给药方案下安全口服。近期研究还发现,silmitasertib通过调节PLK1和p53在胆管癌细胞中诱导细胞周期停滞和细胞死亡。
由谷歌DeepMind的谢科菲·阿齐齐和耶鲁大学的戴维·范迪克领导的这项研究,代表了AI在生物医学领域应用的一个罕见里程碑:AI不仅分析生物学数据,而且生成了一个可检验的生物学假说,并最终证明其正确性。阿齐齐在LinkedIn帖子中将这一成果描述为"来之不易"且"仅仅是第一步",但强调了该模型在传统方法陷入停滞的领域加速发现的潜力。
更重要的是,silmitasertib并非实验性化合物,而是一种已经在临床试验中被研究的药物。这意味着将其重新用于增强抗原展示的临床转化路径,可能比开发全新药物要短得多。目前该药物正在儿童和成人复发/难治性实体瘤患者中进行I/II期临床试验评估。
虚拟细胞时代的医学革命
这项研究的意义远不止发现了一种药物的新用途。C2S-Scale的成功预示着生物医学研究正在经历一场范式转变:AI系统不再只是支持科学研究的工具,而是开始驱动科学发现本身。
该模型的训练还为构建“虚拟细胞"打开了大门——即真实生物系统的详细数字孪生体,可用于模拟疗法、筛选毒性或测试在传统实验室中需要数年才能探索的药物组合。这种方法不仅能大幅降低药物研发成本,还能显著缩短从发现到临床应用的时间。
谷歌在官方博客中指出,C2S-Scale基于其开源的Gemma模型家族构建,专门设计用于解释单个细胞的分子“语言"。该模型能够执行细胞类型注释、基因网络分析、药物反应预测等多项任务,将单细胞RNA测序数据与自然语言处理相结合。
当然,下一阶段的工作仍需要进行体内实验——首先是动物模型,然后是人体临床试验。但这一发现已经为癌症免疫治疗领域带来了新的希望。如果silmitasertib在临床试验中被证实能够有效将冷肿瘤转化为热肿瘤,它可能成为与现有免疫检查点抑制剂联用的关键药物,使那些目前对免疫疗法无应答的患者重新获得治疗机会。
从更广阔的视角来看,这项研究展示了人工智能如何从根本上改变科学发现的速度和方式。当AI能够从海量生物学数据中识别出人类研究者可能需要数十年才能发现的模式时,医学进步的步伐将显著加快。这不仅仅是一次技术突破,更是科学方法论的演进——在这个新时代,机器智能与人类智慧的协作,正在重新定义我们对抗疾病的方式。