人工智能时代的药物靶点识别与评估
Target identification and assessment in the era of AI
论文基础发表信息
项目
核心信息
发表期刊
《自然综述:药物发现》(Nature Reviews Drug Discovery)
在线发表时间
2026年4月20日
录用时间
2026年2月25日
正式版本发布时间
2026年4月20日
永久数字对象标识符(DOI)
10.1038/s41573-026-01412-8
通讯作者
Alex Zhavoronkov
第一作者
Frank W. Pun
核心完成单位
英矽智能(Insilico Medicine)
作者与所属单位
Frank W. Pun¹, Dmitriy Podolskiy², Evgeny Izumchenko³, Andrew Mortlock⁴, Tudor I. Oprea⁵, Morten Scheibye-Knudsen⁶, Kristen Fortney⁷, Eric Morgen⁷, Feng Ren¹,⁸, Alex Zhavoronkov¹,⁸,⁹,¹⁰,¹¹
1.英矽智能香港有限公司,中国香港特别行政区
2.安斯泰来制药再生医学研究所,美国马萨诸塞州韦斯特伯勒市
3.芝加哥大学医学院血液学与肿瘤学系,美国伊利诺伊州芝加哥市
4.安斯泰来制药欧洲总部有限公司,英国阿德尔斯特恩市
5.Expert Systems Inc.,美国加利福尼亚州圣地亚哥市
6.哥本哈根大学细胞与分子医学系健康衰老研究中心,丹麦哥本哈根市
7.BioAge Labs,美国加利福尼亚州埃默里维尔市
8.英矽智能上海有限公司,中国上海市
9.英矽智能人工智能有限公司,阿联酋阿布扎比马斯达尔城
10.英矽智能美国有限公司,美国马萨诸塞州剑桥市
11.巴克衰老研究所,美国加利福尼亚州诺瓦托市
摘要
靶点识别与验证是创新药物研发的起点,也是决定临床转化成功率的核心环节。传统靶点发现模式高度依赖科研人员的经验积累与偶然性发现,存在研发周期长、转化失败率高、可成药靶点空间受限等核心瓶颈。近年来,人工智能(AI)技术的快速发展彻底重塑了靶点发现的底层逻辑,将原本经验驱动的随机化探索,转变为数据驱动的系统化、可预测化精准科学。
本综述系统梳理了AI时代药物靶点选择的核心评估框架,详细阐述了支撑靶点识别的多模态生物数据整合体系,全面拆解了从靶点预测、优先级排序到机制验证的全栈AI算法技术架构,并结合已进入临床阶段的管线案例,验证了AI驱动靶点发现全链路的可行性。最后,本综述总结了当前领域面临的核心挑战,并提出了未来的关键发展方向,为AI技术在药物靶点发现领域的落地应用与前沿探索提供了纲领性指导。
引言
在现代药物研发体系中,药物靶点是指能够被药物分子调控,进而干预疾病发生发展进程的生物分子(绝大多数为蛋白质)。能否筛选出兼具治疗有效性、成药性、安全性与商业价值的优质靶点,直接决定了一款创新药物从早期研发到最终上市的全生命周期成功率。
过去数十年间,人类基因组学、分子生物学与系统生物学的发展,为药物靶点发现奠定了坚实的科学基础。然而,行业仍面临着难以突破的效率瓶颈:人类基因组中约2万个蛋白编码基因里,仅有约4500个被认定具备成药潜力,而全球已获批的所有药物,仅作用于716个不同的人类靶点。传统靶点发现模式依赖于低通量的实验验证与科研人员的经验判断,一个全新靶点从提出治疗假设到完成临床前验证,往往需要数月甚至数十年的时间,且超过90%的候选靶点最终会在临床研发阶段因疗效不足或安全性问题宣告失败。
近年来,以机器学习、深度学习、生成式AI与大语言模型为代表的人工智能技术,在生物医药大数据处理、复杂生物机制解析、因果关系推断等方面展现出了前所未有的能力。AI技术能够整合多维度的生物医学数据,挖掘传统方法无法识别的疾病-靶点关联,实现靶点的高通量筛选、优先级排序与成药性评估,大幅缩短靶点发现周期,提升临床转化成功率。本综述将系统阐述AI时代药物靶点识别与评估的完整体系,为行业提供全面的技术框架与实践指导。
1 优质药物靶点选择的四大核心评估维度
本综述首次在AI技术框架下,系统性明确了创新药物靶点筛选与评估的四大核心维度。四大维度环环相扣,共同决定了靶点从早期发现到临床上市的全生命周期价值与成功率。
1.1 治疗假设的科学性与因果性
治疗假设是靶点成立的底层核心逻辑,必须清晰阐明“靶点调控如何影响疾病生物学进程”的完整分子机制与因果链条。与传统经验式的靶点筛选不同,AI时代的治疗假设构建,高度依赖人类遗传学证据、多组学数据与因果推断算法的支撑。
人类遗传学证据是靶点治疗假设最坚实的基础,已有研究证实,具备人类遗传学证据支持的药物靶点,其临床获批成功率是无遗传学证据靶点的2倍(原理:若某疾病相关基因变异,直接关联发病机制,以此基因为药物靶点,作用机制更精准、贴合疾病本质)。AI技术能够通过全基因组关联研究(GWAS)、表达数量性状位点(eQTL)分析、孟德尔随机化等方法,从海量基因组数据中挖掘疾病与靶点之间的因果关联,而非单纯的相关性,为治疗假设提供严谨的科学支撑。
全基因组关联研究( GWAS )、表达数量性状位点( eQTL )分析、孟德尔随机化1. 全基因组关联研究(GWAS)
核心:在全基因组范围,大规模比对病例 / 对照或不同性状人群的基因变异(SNP 等),目的:筛选与疾病、身高、代谢等复杂性状显著关联的遗传位点,局限:多为「相关性」,位点大多非功能基因,难解释致病机制。2. 表达数量性状位点(eQTL)分析
核心:关联基因遗传变异与基因表达量,目的:找到能调控基因转录水平的遗传位点,价值:打通「遗传变异→基因表达→性状 / 疾病」的中间环节,解释 GWAS 位点的功能机制。3. 孟德尔随机化(MR)
核心:以遗传变异为工具变量,利用基因随机分配的自然随机试验特性,目的:在观察性数据中,排除混杂、反向因果,推断暴露因素与疾病的因果关系,优势:弥补观察研究短板,低成本验证因果,衔接遗传 - 表型 - 疾病因果链。
三者串联逻辑:GWAS 找疾病相关遗传位点 → eQTL 解释位点如何影响基因表达 → MR 验证「分子 / 表型因素」是否真正导致疾病。
1.2 成药性与安全性
成药性与安全性是靶点实现临床转化的核心门槛。成药性评估的核心,是判断靶点是否具备可被药物分子有效结合并调控的结构基础,同时需评估不同药物 modality(小分子、抗体、反义寡核苷酸、mRNA、细胞治疗等)对靶点的可及性。
近年来,以AlphaFold为代表的蛋白质结构预测技术,彻底革新了靶点成药性评估的模式。AI技术能够精准预测靶点蛋白的三维结构、结合口袋与构象变化,实现对靶点可成药性的高通量预测,同时还能预判靶点的脱靶风险、组织分布特异性与潜在不良反应,为靶点的安全性评估提供全面的量化依据。
1.3 商业可行性
商业可行性评估的核心,是在靶点的研发风险与商业回报之间实现平衡。研发人员需权衡两类核心靶点的选择策略:一类是首创(first-in-class)靶点,即尚未有药物获批的全新靶点,具备突破性的临床价值与市场先发优势,但同时也伴随着更高的研发与转化风险;另一类是同类最优(best-in-class)靶点,即已有药物验证的成熟靶点,研发确定性更高,但需要面对激烈的市场竞争,需通过差异化的药物设计实现临床优势。
AI技术能够通过对科研文献、专利数据、临床试验进展、监管审批信息与市场格局的多维度分析,全面评估靶点的竞争格局、专利生命周期、临床未满足需求与商业回报潜力,为靶点的商业可行性决策提供数据支撑。
1.4 联合治疗与组合价值
联合治疗是当前复杂疾病治疗的核心发展方向,靶点的组合价值,已成为差异化竞争与提升临床获益的关键因素。靶点的组合价值评估,主要包括两个核心方向:一是与现有标准治疗方案的协同增效潜力,二是针对耐药机制的联合用药策略。
在肿瘤、纤维化、神经退行性疾病等复杂疾病领域,单一靶点调控往往难以实现理想的治疗效果,且易引发耐药性。AI技术能够通过生物网络分析、图神经网络与因果推断算法,预测靶点之间的合成致死性、协同调控作用与信号通路交叉影响,挖掘具备高临床价值的靶点组合,为联合治疗方案的开发提供科学依据。
评估维度
核心评估内容
AI技术的核心赋能价值
治疗假设
靶点-疾病的因果关联、分子机制清晰度、遗传学证据支撑
基于多组学数据与因果推断算法,挖掘疾病核心驱动因子,构建可验证的治疗假设
成药性与安全性
靶点结构可成药性、药物可及性、脱靶风险、潜在不良反应
基于蛋白质结构预测与深度学习模型,实现成药性与安全性的高通量、量化评估
商业可行性
临床未满足需求、竞争格局、专利生命周期、商业回报潜力
基于文本挖掘与大语言模型,整合文献、专利、临床与市场数据,实现商业价值的全景评估
组合价值
与现有疗法的协同性、耐药逆转潜力、联合用药临床价值
基于生物网络与图神经网络,预测靶点互作与协同效应,挖掘高价值靶点组合
2 AI驱动靶点识别的多模态数据整合体系
AI技术在靶点发现领域的核心价值,源于其对复杂多模态生物医学数据的超强处理与解析能力。通过对多维度、异质性生物数据的整合与融合,AI技术能够弥合分子活性与临床终点之间的鸿沟,挖掘传统方法无法识别的全新靶点。本章节系统梳理了支撑AI靶点识别的核心数据类型与应用模式。
2.1 多组学数据
多组学数据是AI靶点识别最核心的数据基础,涵盖基因组学、转录组学、蛋白质组学、代谢组学与表观遗传学等多个维度。多组学数据能够完整描绘疾病状态下的分子图谱变化,揭示疾病的核心驱动基因与通路。
AI技术能够对海量多组学数据进行整合分析,识别疾病相关的基因变异、差异表达基因、表观修饰变化与代谢异常,同时通过因果推断算法,区分疾病的“驱动因素”与“伴随现象”,锁定真正的疾病核心驱动靶点。目前,已有多款基于多组学的AI靶点发现平台实现了产业化应用,其中最具代表性的是英矽智能开发的PandaOmics平台,该平台已在多个疾病领域实现了全新靶点的发现与临床验证。
2.2 高内涵细胞成像数据
细胞成像数据能够直观反映细胞与细胞器的形态变化、表型特征与空间分布信息,是表型驱动靶点发现的核心数据来源。基于高内涵筛选的细胞表型成像,能够捕捉基因扰动或药物处理后细胞的细微表型变化,而这些变化往往与疾病的核心机制密切相关。
以卷积神经网络(CNN)为核心的深度学习技术,能够对海量细胞成像数据进行自动化、高通量的分析,精准识别细胞线粒体形态、细胞骨架结构、细胞核形态等细微的表型差异,通过表型-基因型关联分析,反向锁定调控疾病表型的核心靶点。目前,AI图像分析技术已在肠道纤维化、肌萎缩侧索硬化症(ALS)等疾病的靶点发现中实现了成功应用。
2.3 生物知识图谱与真实世界临床数据
生物知识图谱是整合了基因、蛋白、通路、疾病、药物等生物实体之间互作关系的结构化网络数据库,核心包括:
STRING、BioGRID、IntAct等蛋白互作数据库,
KEGG、Reactome等通路数据库,
以及DisGeNET、Open Targets等疾病-基因关联数据库。
图神经网络(GNN)技术能够基于知识图谱的固有网络结构,预测全新的生物实体相互作用、合成致死性与疾病-靶点关联,同时整合电子健康记录、临床试验数据等真实世界临床数据,搭建起基础研究与临床转化之间的桥梁,实现对靶点临床转化潜力的精准预判。
2.4 非结构化文本数据
生物医药领域的海量非结构化文本数据,包括科研文献、专利、临床试验报告、监管审批文件、科研经费数据等,蕴含了丰富的靶点相关信息,是验证靶点科学有效性、评估竞争格局与商业价值的核心资源。
以生物医药领域大语言模型为核心的自然语言处理(NLP)技术,能够对海量非结构化文本数据进行深度挖掘,提取基因-疾病关联、靶点作用机制、研究趋势与竞争格局等关键信息,同时能够模仿人类科研人员的推理逻辑,自主生成治疗假设,实现靶点发现的全流程智能化。
2.5 多模态数据的协同整合
当前AI靶点发现领域的核心发展趋势,是通过异构知识图谱、统一数据仓库与多模态深度学习架构,实现不同类型数据的协同整合与融合分析。多模态数据的整合,能够实现不同维度数据之间的交叉验证与信息互补,大幅提升靶点预测的准确性与可靠性,是AI靶点识别技术未来发展的核心基础。
3 靶点发现与评估的全栈AI算法框架
本综述系统性梳理了支撑现代AI靶点识别与评估的全栈算法技术体系,明确了不同技术路线的核心定位、应用场景与技术优势,形成了从靶点预测、优先级排序到机制验证的完整技术闭环。
3.1 监督学习算法
监督学习是当前AI靶点发现领域应用最广泛、技术最成熟的核心算法体系。该类算法基于已标注的药物-靶点配对、疾病-基因关联、靶点成药性等标注数据进行训练,实现对全新靶点的预测与优先级排序。
监督学习算法的核心应用场景包括:药物-靶点相互作用预测、疾病相关基因优先级排序、靶点成药性与安全性预测。代表性的技术成果包括英矽智能开发的PandaOmics靶点识别引擎、GeroScope衰老相关靶点挖掘算法、TargetPro临床阶段靶点特征学习模型,这些算法已在多个疾病领域实现了全新靶点的成功发现与验证。
3.2 无监督与半监督学习算法
无监督与半监督学习算法,是挖掘全新未知靶点的核心工具。该类算法能够在无标注或仅有部分标注数据的情况下,从海量生物数据中识别隐藏的疾病相关分子特征、基因网络模块与蛋白互作模式,突破标注数据不足的限制。
其核心应用场景包括:基因共表达网络中疾病相关模块识别、蛋白-蛋白相互作用特征提取、候选靶点成药性聚类分析与异常基因识别。在肿瘤、罕见病等标注数据稀缺的疾病领域,无监督与半监督学习算法展现出了独特的优势,能够挖掘传统监督学习方法无法识别的全新靶点。
3.3 深度学习与生物表示学习
表示学习是现代深度学习技术的核心,其能够将氨基酸序列、基因表达谱、蛋白质结构、细胞图像等各类生物实体,编码为高维数值嵌入向量,捕捉其上下文相关的生物学特性与功能信息,是AI解析复杂生物语义的核心底座。
其中,图神经网络(GNN) 是当前生物医学领域应用最广泛的深度学习架构之一。该类算法能够天然适配生物网络的图结构特征,精准捕捉基因、蛋白、疾病等实体之间的相互作用关系,预测多基因协同调控、合成致死性与疾病表型逆转的靶点组合,已成为靶点发现与网络药理学研究的核心工具。
3.4 生成式AI与生命科学基础模型
生成式AI与生命科学基础模型,是当前AI靶点发现领域最前沿的突破方向。该类模型基于数千万级的单细胞转录组、蛋白质序列、基因组等大规模生物数据进行预训练,能够精准捕捉基因调控网络的动态变化,模拟细胞对基因干扰的反应,高准确度锁定疾病的核心驱动因子。
代表性的生命科学基础模型包括:Geneformer、scGPT等单细胞预训练模型,以及英矽智能开发的PreciousGPT系列模型。其中,PreciousGPT系列模型不仅能够实现靶点的精准预测,还能够生成合成多组学数据,突破真实生物数据稀缺、隐私保护受限等行业瓶颈,为AI靶点发现模型的训练与优化提供了全新的数据来源。
3.5 生物医药大语言模型与AI智能体
以BioGPT、OriGene为代表的生物医药领域大语言模型,能够充当“虚拟生物学家”,模仿人类科研人员的完整科研推理逻辑。这类模型基于海量生物医药文献、专利、数据库信息进行预训练,能够自主完成文献挖掘、治疗假设生成、靶点优先级排序、实验方案设计等一系列靶点发现的核心步骤,实现靶点发现全流程的自动化与智能化。
当前,生物医药AI智能体的发展已进入全新阶段,其能够整合多模态数据处理、AI模型预测、自动化机器人实验验证等多个环节,形成“靶点预测-实验验证-数据反馈-模型优化”的完整闭环,是未来药物研发全流程智能化的核心载体。
4 AI靶点识别技术的临床转化验证案例
本综述以英矽智能的特发性肺纤维化(IPF)管线为核心临床证据,完整验证了AI驱动靶点识别技术从靶点发现、分子设计到临床转化的全链路可行性。该项目是全球首个由AI发现全新靶点、并设计全新小分子药物,成功推进至临床阶段的创新药项目,为AI驱动药物研发提供了里程碑式的实践范例。
4.1 靶点识别与验证
特发性肺纤维化是一种进展性、致死性的间质性肺疾病,患者确诊后的中位生存期仅2-3年,临床存在巨大的未满足治疗需求。研究团队通过英矽智能的PandaOmics AI靶点发现引擎,整合了IPF患者的多组学数据、单细胞测序数据、科研文献与知识图谱信息,通过深度学习算法与因果推断分析,最终锁定TNIK(TRAF2和NCK相互作用激酶) 为IPF的全新治疗靶点。
后续的体内外实验验证证实,TNIK是肺纤维化进程的核心驱动因子,抑制TNIK能够显著下调纤维化相关信号通路,改善肺组织纤维化病理表型,为治疗假设提供了充分的实验证据。
4.2 药物分子设计与临床前研发
在锁定TNIK靶点后,研究团队通过英矽智能的Chemistry42生成式化学AI平台,快速设计出了全球首创的高选择性、高活性小分子TNIK抑制剂——Rentosertib(研发代号:ISM001-055)。
该项目从靶点识别启动,到完成临床前候选化合物(PCC)的筛选与验证,仅耗时约18个月,研发成本远低于传统药物研发模式,大幅缩短了创新药的早期研发周期。
4.3 临床试验结果
Rentosertib已成功完成IIa期临床试验,研究结果证实,该药物在IPF患者中展现出良好的安全性与耐受性,且能够剂量依赖性地改善患者的用力肺活量(FVC)——这是IPF临床研发的核心疗效终点,也是评估抗纤维化药物临床获益的金标准。
该临床试验的成功,首次在人体中验证了AI发现的全新靶点的临床有效性,标志着AI驱动药物研发从技术概念,真正走向了临床转化的落地实践。
除IPF管线外,基于AI技术发现的靶点,目前已在肌萎缩侧索硬化症(ALS)、肿瘤、衰老相关疾病、子宫内膜异位症等多个疾病领域进入了临床前或临床研发阶段,充分证实了AI靶点识别技术的通用性与广泛应用前景。
5 领域现存挑战与未来发展方向
尽管AI技术在靶点识别与评估领域已取得了里程碑式的突破,但行业仍面临着一系列亟待解决的核心挑战。本综述在结尾系统梳理了当前领域的核心痛点,并提出了未来的关键发展方向,其终极目标是构建AI驱动的全自动化、闭环式药物研发平台。
5.1 领域现存核心挑战
1.高质量生物数据的稀缺与标准化问题:AI模型的性能高度依赖训练数据的质量与规模,而当前生物医药领域的多组学数据、临床数据存在样本量不足、异质性高、标准化程度低、数据孤岛严重等问题,同时还面临着严格的患者隐私保护限制,制约了AI模型的训练与优化。
2.AI模型的可解释性不足:当前多数深度学习模型属于“黑箱模型”,能够准确预测靶点与疾病的关联,但难以清晰阐明其背后的生物学机制,而机制的清晰度是靶点临床转化的核心前提,可解释性AI已成为领域亟待突破的关键方向。
3.行业缺乏统一的基准测试与评估框架:当前不同AI靶点发现模型的性能评估,缺乏统一的数据集、评价指标与验证标准,导致不同模型之间的性能难以进行客观对比,制约了技术的标准化发展与产业化落地。
4.计算预测与湿实验验证的脱节:当前多数AI靶点发现研究仍停留在计算预测层面,缺乏系统的实验验证与临床转化,如何实现AI预测与自动化实验平台的深度融合,形成完整的验证闭环,是行业面临的核心工程挑战。
5.2 未来核心发展方向
1.数据质量与可及性的提升:通过合成生物数据、联邦学习、隐私计算等技术,突破真实数据稀缺与隐私保护的限制,同时推动生物医药数据的标准化与共享体系建设,为AI模型的发展提供高质量的数据底座。
2.可解释性AI与生物学知情模型的开发:开发融合先验生物学知识的可解释性AI模型,让模型的预测结果能够对应清晰的生物学机制,实现“预测-机制解析-实验验证”的一体化,提升靶点预测的可靠性与临床转化成功率。
3.生命科学基础模型与数字孪生技术的规模化应用:基于大规模生物数据预训练的生命科学基础模型,能够实现对细胞、组织乃至器官的数字化孪生模拟,精准预测基因扰动对疾病表型的影响,为靶点发现提供全新的研究范式。
4.AI驱动的闭环式药物研发平台构建:整合AI靶点发现、生成式化学分子设计、自动化机器人湿实验验证、临床试验设计与数据分析等全链条环节,构建“计算预测-实验验证-数据反馈-模型迭代优化”的完整闭环,实现创新药物研发的全流程智能化、自动化,大幅提升研发效率,降低研发成本,最终让更多创新疗法更快惠及患者。
致谢
作者感谢英矽智能团队的J. Chen、X. Long、Y. Xin、B. H. M. Liu与H. Leung为本论文撰写提供的协助。Dmitriy Podolskiy同时感谢K. Tabata与S. Penrose提供的相关学术讨论支持。
作者贡献
Frank W. Pun与Alex Zhavoronkov完成了本研究的概念设计与项目统筹。所有作者均为本论文内容的学术讨论、撰写、审阅与修改做出了实质性贡献。
利益冲突声明
Frank W. Pun、Feng Ren与Alex Zhavoronkov任职于英矽智能——一家致力于开发并应用生成式人工智能及其他新一代AI技术与机器人平台,开展药物发现、研发与衰老相关研究的商业公司。Dmitriy Podolskiy为安斯泰来制药在职员工。Andrew Mortlock为安斯泰来制药欧洲总部在职员工。Tudor I. Oprea为Expert Systems Inc.在职员工。Kristen Fortney与Eric Morgen为BioAge Labs, Inc.在职员工。其余作者声明无相关利益冲突。
同行评审信息
《自然综述:药物发现》期刊感谢G. Doron、H. Fröhlich、S. Khader与N. Richmond为本论文同行评审工作做出的贡献。
出版说明
施普林格·自然(Springer Nature)对于已发表地图中的管辖权声明与机构隶属关系,保持中立立场。
术语表(Glossary)
英文术语与缩写
中文标准译法
术语定义
Artificial intelligence (AI)
人工智能(AI)
计算机科学的一个分支,致力于开发能够执行通常需要人类智能才能完成的任务的系统与算法。
Autoencoder
自编码器
一种用于无监督学习的神经网络,主要用于降维与特征学习。该网络由编码器与解码器两部分组成:编码器将输入数据压缩为低维潜空间表示,解码器基于该压缩表示重构原始输入。模型通过最小化输入与输出之间的重构损失进行训练,从而在保留核心特征的前提下,学习数据的高效表示。
Convolutional neural network
卷积神经网络
一种前馈架构的人工神经网络,信息从输入层经一个或多个隐藏层传递至输出层,核心通过卷积核实现对局部特征的提取,广泛应用于图像数据处理。
Generative adversarial networks (GANs)
生成对抗网络(GANs)
一类机器学习框架,由生成器与判别器两个神经网络通过对抗过程同步训练。生成器负责生成尽可能逼近真实数据的合成数据,判别器负责对输入数据进行评估,区分真实样本与生成样本。二者的对抗博弈推动生成器不断生成更具真实感的数据。
Large language models (LLMs)
大语言模型(LLMs)
一类基于海量文本数据训练的神经网络,能够生成类人文本、执行语言理解任务,并实现开放式对话交互。
Machine learning
机器学习
人工智能(AI)的一个分支,通过统计技术使计算机系统能够从数据中自主学习并优化性能,无需针对任务进行显式的编程。
Natural language processing (NLP)
自然语言处理(NLP)
人工智能(AI)的一个子领域,致力于实现计算机与人类之间的自然语言交互,开发能够让机器以符合语境的方式理解、解析、生成与响应人类语言的先进算法与计算模型。
Recurrent neural network (RNN)
循环神经网络(RNN)
一类专门处理序列数据(如文本、语音)的神经网络,通过内部状态的维护,实现对序列时间动态特征的捕捉与建模。
参考文献
[1] Finan, C. et al. The druggable genome and support for target identification and validation in drug development. Sci. Transl. Med. 9, eaag1166 (2017).中文译题:可成药基因组及其对药物研发中靶点识别与验证的支撑[2] Zhou, Y. et al. TTD: therapeutic target database describing target druggability information. Nucleic Acids Res. 52, D1465–D1477 (2024).中文译题:治疗靶点数据库(TTD):靶点成药性信息的整合与展示[3] Acharya, K. R., Sturrock, E. D., Riordan, J. F. & Ehlers, M. R. ACE revisited: a new target for structure-based drug design. Nat. Rev. Drug. Discov. 2, 891–902 (2003).中文译题:血管紧张素转换酶(ACE)的再研究:基于结构的药物设计新靶点[4] Zaman, M. A., Oparil, S. & Calhoun, D. A. Drugs targeting the renin–angiotensin–aldosterone system. Nat. Rev. Drug. Discov. 1, 621–636 (2002).中文译题:靶向肾素-血管紧张素-醛固酮系统的药物[5] Slamon, D. J. et al. Human breast cancer: correlation of relapse and survival with amplification of the HER-2/neu oncogene. Science 235, 177–182 (1987).中文译题:人乳腺癌中HER-2/neu癌基因扩增与患者复发和生存的相关性[6] Davies, H. et al. Mutations of the BRAF gene in human cancer. Nature 417, 949–954 (2002).中文译题:人类癌症中的BRAF基因突变[7] Sabatine, M. S. PCSK9 inhibitors: clinical evidence and implementation. Nat. Rev. Cardiol. 16, 155–165 (2019).中文译题:PCSK9抑制剂:临床证据与临床应用[8] Nelson, M. R. et al. The support of human genetic evidence for approved drug indications. Nat. Genet. 47, 856–860 (2015).中文译题:人类遗传学证据对已获批药物适应症的支撑作用[9] Pietzner, M. et al. Mapping the proteo-genomic convergence of human diseases. Science 374, eabj1541 (2021).中文译题:人类疾病的蛋白质组-基因组汇聚图谱绘制[10] McDonagh, E. M. et al. Human genetics and genomics for drug target identification and prioritization: Open Targets’ perspective. Annu. Rev. Biomed. Data Sci. 7, 59–81 (2024).中文译题:用于药物靶点识别与优先级排序的人类遗传学与基因组学:Open Targets的视角[11] Minikel, E. V., Painter, J. L., Dong, C. C. & Nelson, M. R. Refining the impact of genetic evidence on clinical success. Nature 629, 624–629 (2024).中文译题:遗传学证据对药物临床成功率影响的精准解析[12] Plenge, R. M., Scolnick, E. M. & Altshuler, D. Validating therapeutic targets through human genetics. Nat. Rev. Drug. Discov. 12, 581–594 (2013).中文译题:通过人类遗传学验证治疗靶点[13] Plenge, R. M. Disciplined approach to drug discovery and early development. Sci. Transl. Med. 8, 349ps315 (2016).中文译题:药物发现与早期研发的规范化方法[14] Michoel, T. & Zhang, J. D. Causal inference in drug discovery and development. Drug. Discov. Today 28, 103737 (2023).中文译题:药物研发中的因果推断[15] Zhu, Z. et al. Integration of summary data from GWAS and eQTL studies predicts complex trait gene targets. Nat. Genet. 48, 481–487 (2016).中文译题:整合GWAS与eQTL研究的汇总数据预测复杂性状的靶基因[16] Bretherick, A. D. et al. Linking protein to phenotype with Mendelian randomization detects 38 proteins with causal roles in human diseases and traits. PLoS Genet. 16, e1008785 (2020).中文译题:通过孟德尔随机化关联蛋白质与表型,识别38个在人类疾病和性状中发挥因果作用的蛋白质[17] Zhao, J. H. et al. Genetics of circulating inflammatory proteins identifies drivers of immune-mediated disease risk and therapeutic targets. Nat. Immunol. 24, 1540–1551 (2023).中文译题:循环炎症蛋白的遗传学研究识别免疫介导疾病的风险驱动因子与治疗靶点[18] Pavlidis, P. et al. Interleukin-22 regulates neutrophil recruitment in ulcerative colitis and is associated with resistance to ustekinumab therapy. Nat. Commun. 13, 5820 (2022).中文译题:白细胞介素22调控溃疡性结肠炎中的中性粒细胞募集,且与乌司奴单抗治疗耐药相关[19] Tsherniak, A. et al. Defining a cancer dependency map. Cell 170, 564–576.e16 (2017).中文译题:癌症依赖性图谱的构建[20] Gonzalez, G. et al. Combinatorial prediction of therapeutic perturbations using causally inspired neural networks. Nat. Biomed. Eng. https://doi.org/10.1038/s41551-025-01481-x (2025).中文译题:基于因果启发的神经网络实现治疗性扰动的组合预测[21] Cheng, A. C. et al. Structure-based maximal affinity model predicts small-molecule druggability. Nat. Biotechnol. 25, 71–75 (2007).中文译题:基于结构的最大亲和力模型预测小分子成药性[22] Bennett, C. F. Therapeutic antisense oligonucleotides are coming of age. Annu. Rev. Med. 70, 307–321 (2019).中文译题:治疗性反义寡核苷酸技术已走向成熟[23] Qin, S. et al. mRNA-based therapeutics: powerful and versatile tools to combat diseases. Signal. Transduct. Target. Ther. 7, 166 (2022).中文译题:mRNA疗法:对抗疾病的强大多功能工具[24] Sadelain, M., Riviere, I. & Riddell, S. Therapeutic T cell engineering. Nature 545, 423–431 (2017).中文译题:治疗性T细胞工程[25] Abramson, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature 630, 493–500 (2024).中文译题:基于AlphaFold 3实现生物分子相互作用的精准结构预测[26] Brennan, R. J. Target safety assessment: strategies and resources. Methods Mol. Biol. 1641, 213–228 (2017).中文译题:靶点安全性评估:策略与资源[27] Brennan, R. J. et al. The state of the art in secondary pharmacology and its impact on the safety of new medicines. Nat. Rev. Drug. Discov. https://doi.org/10.1038/s41573-024-00942-3 (2024).中文译题:次级药理学研究的技术现状及其对新药安全性的影响[28] Simonovsky, M. & Meyers, J. DeeplyTough: learning structural comparison of protein binding sites. J. Chem. Inf. Model. 60, 2356–2366 (2020).中文译题:DeeplyTough:基于深度学习的蛋白结合口袋结构比对算法[29] Pun, F. W., Ozerov, I. V. & Zhavoronkov, A. AI-powered therapeutic target discovery. Trends Pharmacol. Sci. 44, 561–572 (2023).中文译题:人工智能驱动的治疗靶点发现[30] Spring, L., Demuren, K., Ringel, M. & Wu, J. First-in-class versus best-in-class: an update for new market dynamics. Nat. Rev. Drug. Discov. 22, 531–532 (2023).中文译题:首创药物vs同类最优药物:新市场格局下的最新解读[31] Long, X. et al. AI-enabled cancer target prioritization with optimal profiles balancing novelty, confidence and commercial tractability. Future Medicine AI https://doi.org/10.2217/fmai-2023-0019 (2024).中文译题:基于AI实现兼顾创新性、可信度与商业可开发性的肿瘤靶点优先级排序[32] Hill, J. A. & Cowen, L. E. Using combination therapy to thwart drug resistance. Future Microbiol. 10, 1719–1726 (2015).中文译题:通过联合治疗克服耐药性[33] Wen, P. Y. et al. Dabrafenib plus trametinib in patients with BRAFV600E-mutant low-grade and high-grade glioma (ROAR): a multicentre, open-label, single-arm, phase 2, basket trial. Lancet Oncol. 23, 53–64 (2022).中文译题:达拉非尼联合曲美替尼治疗BRAFV600E突变型低级别和高级别胶质瘤(ROAR研究):一项多中心、开放标签、单臂、2期篮子试验[34] Subbiah, V. et al. Dabrafenib plus trametinib in BRAFV600E-mutated rare cancers: the phase 2 ROAR trial. Nat. Med. 29, 1103–1112 (2023).中文译题:达拉非尼联合曲美替尼治疗BRAFV600E突变罕见癌症:2期ROAR临床试验结果[35] Choueiri, T. K. et al. Cabozantinib plus nivolumab and ipilimumab in renal-cell carcinoma. N. Engl. J. Med. 388, 1767–1778 (2023).中文译题:卡博替尼联合纳武利尤单抗与伊匹木单抗治疗肾细胞癌[36] Owonikoko, T. K. et al. Nivolumab and ipilimumab as maintenance therapy in extensive-disease small-cell lung cancer: CheckMate 451. J. Clin. Oncol. 39, 1349–1359 (2021).中文译题:纳武利尤单抗联合伊匹木单抗用于广泛期小细胞肺癌的维持治疗:CheckMate 451研究[37] Lenz, H. J. et al. First-line nivolumab plus low-dose ipilimumab for microsatellite instability-high/mismatch repair-deficient metastatic colorectal cancer: the phase II CheckMate 142 study. J. Clin. Oncol. 40, 161–170 (2022).中文译题:纳武利尤单抗联合低剂量伊匹木单抗一线治疗微卫星不稳定性高/错配修复缺陷型转移性结直肠癌:2期CheckMate 142研究[38] Barry, M., Mulcahy, F. & Back, D. J. Antiretroviral therapy for patients with HIV disease. Br. J. Clin. Pharmacol. 45, 221–228 (1998).中文译题:HIV感染者的抗逆转录病毒治疗[39] Lathouwers, E. et al. Week 48 resistance analyses of the once-daily, single-tablet regimen darunavir/cobicistat/emtricitabine/tenofovir alafenamide (D/C/F/TAF) in adults living with HIV-1 from the phase III randomized AMBER and EMERALD trials. AIDS Res. Hum. Retroviruses 36, 48–57 (2020).中文译题:3期AMBER与EMERALD试验中,达芦那韦/考比司他/恩曲他滨/丙酚替诺福韦(D/C/F/TAF)每日一次单片方案治疗HIV-1感染成人患者48周的耐药性分析[40] Powles, T. et al. Enfortumab vedotin and pembrolizumab in untreated advanced urothelial cancer. N. Engl. J. Med. 390, 875–888 (2024).中文译题:恩诺单抗联合帕博利珠单抗一线治疗晚期尿路上皮癌[41] Hoimes, C. J. et al. Enfortumab vedotin plus pembrolizumab in previously untreated advanced urothelial cancer. J. Clin. Oncol. 41, 22–31 (2023).中文译题:恩诺单抗联合帕博利珠单抗一线治疗晚期尿路上皮癌[42] Eadie, A. L., Brunt, K. R. & Herder, M. Exploring the Food and Drug Administration’s review and approval of Entresto (sacubitril/valsartan). Pharmacol. Res. Perspect. 9, e00794 (2021).中文译题:美国食品药品监督管理局对沙库巴曲缬沙坦审评审批过程的解析[43] Mann, D. L. et al. Effect of treatment with sacubitril/valsartan in patients with advanced heart failure and reduced ejection fraction: a randomized clinical trial. JAMA Cardiol. 7, 17–25 (2022).中文译题:沙库巴曲缬沙坦治疗射血分数降低的晚期心力衰竭患者的疗效:一项随机临床试验[44] Vaduganathan, M. et al. Sacubitril/valsartan in heart failure with mildly reduced or preserved ejection fraction: a pre-specified participant-level pooled analysis of PARAGLIDE-HF and PARAGON-HF. Eur. Heart J. 44, 2982–2993 (2023).中文译题:沙库巴曲缬沙坦治疗射血分数轻度降低或保留的心力衰竭:PARAGLIDE-HF与PARAGON-HF研究的患者水平预设汇总分析[45] Zeng, Z. et al. Deep learning for cancer type classification and driver gene identification. BMC Bioinforma. 22, 491 (2021).中文译题:基于深度学习实现癌症分型与驱动基因识别[46] Kim, D. et al. An evolution-based machine learning to identify cancer type-specific driver mutations. Brief. Bioinform 24, bbac593 (2023).中文译题:基于进化的机器学习算法识别癌症类型特异性驱动突变[47] Chakraborty, S., Hosen, M. I., Ahmed, M. & Shekhar, H. U. Onco-multi-OMICS approach: a new frontier in cancer research. Biomed. Res. Int. 2018, 9836256 (2018).中文译题:肿瘤多组学方法:癌症研究的新前沿[48] Schulte-Sasse, R., Budach, S., Hnisz, D. & Marsico, A. Integration of multiomics data with graph convolutional networks to identify new cancer genes and their associated molecular mechanisms. Nat. Mach. Intell. 3, 513–526 (2021).中文译题:基于图卷积网络整合多组学数据识别全新癌症相关基因及其分子机制[49] Sidorenko, D. et al. Precious2GPT: the combination of multiomics pretrained transformer and conditional diffusion for artificial multi-omics multi-species multi-tissue sample generation. npj Aging 10, 37 (2024).中文译题:Precious2GPT:融合多组学预训练Transformer与条件扩散模型,实现跨物种、跨组织的合成多组学样本生成[50] Cui, H. et al. scGPT: toward building a foundation model for single-cell multi-omics using generative AI. Nat. Methods 21, 1470–1480 (2024).中文译题:scGPT:基于生成式AI构建单细胞多组学基础模型[51] Chandrasekaran, S. N., Ceulemans, H., Boyd, J. D. & Carpenter, A. E. Image-based profiling for drug discovery: due for a machine-learning upgrade? Nat. Rev. Drug. Discov. 20, 145–159 (2021).中文译题:基于图像的谱分析技术在药物发现中的应用:亟待机器学习技术的升级
[52] Phillip, J. M., Han, K.-S., Chen, W.-C., Wirtz, D. & Wu, P.-H. A robust unsupervised machine-learning method to quantify the morphological heterogeneity of cells and nuclei. Nat. Protoc. 16, 754–774 (2021).中文译题:一种可量化细胞与细胞核形态异质性的稳健无监督机器学习方法[53] Xue, Y., Wang, J., Ren, K. & Ji, J. Deep mining of subtle differences in cell morphology via deep learning. Adv. Theory Simul. 4, 2000172 (2021).中文译题:基于深度学习深度挖掘细胞形态的细微差异[54] Chandrasekaran, S. N. et al. JUMP Cell Painting dataset: morphological impact of 136,000 chemical and genetic perturbations. Preprint at bioRxiv https://doi.org/10.1101/2023.03.23.534023 (2023).中文译题:JUMP细胞绘画数据集:13.6万种化学与遗传扰动的细胞形态学影响[55] Rawat, W. & Wang, Z. Deep convolutional neural networks for image classification: a comprehensive review. Neural Comput. 29, 2352–2449 (2017).中文译题:用于图像分类的深度卷积神经网络:全面综述[56] Ektefaie, Y., Dasoulas, G., Noori, A., Farhat, M. & Zitnik, M. Multimodal learning with graphs. Nat. Mach. Intell. 5, 340–350 (2023).中文译题:基于图的多模态学习[57] Yu, S. et al. Integrating inflammatory biomarker analysis and artificial-intelligence-enabled image-based profiling to identify drug targets for intestinal fibrosis. Cell Chem. Biol. 30, 1169–1182.e8 (2023).中文译题:整合炎症生物标志物分析与AI赋能的图像谱分析技术,识别肠道纤维化的治疗靶点[58] Atmaramani, R. et al. Deep learning analysis on images of iPSC-derived运动神经元 carrying fALS-genetics reveals disease-relevant phenotypes. Preprint at bioRxiv https://doi.org/10.1101/2024.01.04.574270 (2024).中文译题:对家族性肌萎缩侧索硬化症相关基因突变的iPSC来源运动神经元图像进行深度学习分析,识别疾病相关表型[59] Szklarczyk, D. et al. The STRING database in 2023: protein–protein association networks and functional enrichment analyses for any sequenced genome of interest. Nucleic Acids Res. 51, D638–D646 (2023).中文译题:2023年STRING数据库:面向任意已测序基因组的蛋白-蛋白关联网络与功能富集分析[60] Oughtred, R. et al. The BioGRID database: a comprehensive biomedical resource of curated protein, genetic, and chemical interactions. Protein Sci. 30, 187–200 (2021).中文译题:BioGRID数据库:全面收录经整理的蛋白、遗传与化学相互作用的生物医学资源库[61] Del Toro, N. et al. The IntAct database: efficient access to fine-grained molecular interaction data. Nucleic Acids Res. 50, D648–D653 (2022).中文译题:IntAct数据库:高效获取精细化分子互作数据[62] Bader, G. D., Betel, D. & Hogue, C. W. BIND: the biomolecular interaction network database. Nucleic Acids Res. 31, 248–250 (2003).中文译题:BIND:生物分子相互作用网络数据库[63] Kanehisa, M., Furumichi, M., Sato, Y., Kawashima, M. & Ishiguro-Watanabe, M. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51, D587–D592 (2023).中文译题:KEGG数据库:用于基于分类学的通路与基因组分析[64] Milacic, M. et al. The Reactome pathway knowledgebase 2024. Nucleic Acids Res. 52, D672–D678 (2024).中文译题:2024年Reactome通路知识库[65] Pico, A. R. et al. WikiPathways: pathway editing for the people. PLoS Biol. 6, e184 (2008).中文译题:WikiPathways:面向大众的通路编辑平台[66] Gene Ontology, C. et al. The Gene Ontology knowledgebase in 2023. Genetics 224, iyad031 (2023).中文译题:2023年基因本体(Gene Ontology)知识库[67] Zhang, Y. et al. A comprehensive large-scale biomedical knowledge graph for AI-powered data-driven biomedical research. Nat. Mach. Intell. 7, 602–614 (2025).中文译题:面向AI赋能的生物医学研究的大规模综合生物医学知识图谱[68] Karki, R. et al. KGG: a fully automated workflow for creating disease-specific knowledge graphs. Bioinformatics 41, btaf383 (2025).中文译题:KGG:用于构建疾病特异性知识图谱的全自动化工作流[69] Chandak, P., Huang, K. & Zitnik, M. Building a knowledge graph to enable precision medicine. Sci. Data 10, 67 (2023).中文译题:构建支撑精准医疗的知识图谱[70] Dezso, Z. & Ceccarelli, M. Machine learning prediction of oncology drug targets based on protein and network properties. BMC Bioinforma. 21, 104 (2020).中文译题:基于蛋白与网络特征的机器学习算法预测肿瘤药物靶点[71] Zhao, W., Gu, X., Chen, S., Wu, J. & Zhou, Z. MODIG: integrating multi-omics and multi-dimensional gene network for cancer driver gene identification based on graph attention network model. Bioinformatics 38, 4901–4907 (2022).中文译题:MODIG:基于图注意力网络模型整合多组学与多维基因网络,识别癌症驱动基因[72] Kamya, P. et al. PandaOmics: an AI-driven platform for therapeutic target and biomarker discovery. J. Chem. Inf. Model. 64, 3961–3969 (2024).中文译题:PandaOmics:AI驱动的治疗靶点与生物标志物发现平台[73] Paliwal, S., de Giorgio, A., Neil, D., Michel, J. B. & Lacoste, A. M. Preclinical validation of therapeutic targets predicted by tensor factorization on heterogeneous graphs. Sci. Rep. 10, 18250 (2020).中文译题:基于异构图张量分解预测的治疗靶点的临床前验证[74] Wang, S. et al. KG4SL: knowledge graph neural network for synthetic lethality prediction in human cancers. Bioinformatics 37, i418–i425 (2021).中文译题:KG4SL:基于知识图神经网络预测人类癌症中的合成致死关系[75] Oliveira, A. L. Biotechnology, big data and artificial intelligence. Biotechnol. J. 14, e1800613 (2019).中文译题:生物技术、大数据与人工智能[76] Chia, S. et al. Phenotype-driven precision oncology as a guide for clinical decisions one patient at a time. Nat. Commun. 8, 435 (2017).中文译题:表型驱动的精准肿瘤学指导个体化临床决策[77] Bajwa, J., Munir, U., Nori, A. & Williams, B. Artificial intelligence in healthcare: transforming the practice of medicine. Future Healthc. J. 8, e188–e194 (2021).中文译题:医疗健康领域的人工智能:变革临床诊疗实践[78] Gao, Z. et al. Artificial intelligence-based drug repurposing with electronic health record clinical corroboration: a case for ketamine as a potential treatment for amphetamine-type stimulant use disorder. Addiction 120, 732–744 (2025).中文译题:基于人工智能的药物重定位及电子健康记录临床验证:以氯胺酮作为苯丙胺类兴奋剂使用障碍潜在治疗药物为例[79] Liu, R., Wei, L. & Zhang, P. A deep learning framework for drug repurposing via emulating clinical trials on real-world patient data. Nat. Mach. Intell. 3, 68–75 (2021).中文译题:基于真实世界患者数据模拟临床试验的深度学习药物重定位框架[80] Coudray, N. et al. Classification and mutation prediction from non-small cell lung cancer histopathology images using deep learning. Nat. Med. 24, 1559–1567 (2018).中文译题:基于深度学习从非小细胞肺癌组织病理图像实现分型与突变预测[81] Morselli Gysi, D. et al. Network medicine framework for identifying drug-repurposing opportunities for COVID-19. Proc. Natl Acad. Sci. USA 118, e2025581118 (2021).中文译题:用于识别COVID-19药物重定位机会的网络医学框架[82] Serrano Nájera, G., Narganes Carlón, D. & Crowther, D. J. TrendyGenes, a computational pipeline for the detection of literature trends in academia and drug discovery. Sci. Rep. 11, 15747 (2021).中文译题:TrendyGenes:用于识别学术研究与药物发现领域文献趋势的计算流程[83] Lee, B. Y., Bacon, K. M., Bottazzi, M. E. & Hotez, P. J. Global economic burden of Chagas disease: a computational simulation model. Lancet Infect. Dis. 13, 342–348 (2013).中文译题:恰加斯病的全球经济负担:计算模拟模型[84] Senger, S. Assessment of the significance of patent-derived information for the early identification of compound–target interaction hypotheses. J. Cheminform 9, 26 (2017).中文译题:专利来源信息对化合物-靶点相互作用假设早期识别的价值评估[85] van Rijn, T. & Timmis, J. K. Patent landscape analysis—contributing to the identification of technology trends and informing research and innovation funding policy. Microb. Biotechnol. 16, 683–696 (2023).中文译题:专利全景分析:助力技术趋势识别与科研创新资助政策制定[86] Kesselheim, A. S., Cook-Deegan, R. M., Winickoff, D. E. & Mello, M. M. Gene patenting—the supreme court finally speaks. N. Engl. J. Med. 369, 869–875 (2013).中文译题:基因专利——最高法院的最终裁决[87] Daluwatte, C., Schotland, P., Strauss, D. G., Burkhart, K. K. & Racz, R. Predicting potential adverse events using safety data from marketed drugs. BMC Bioinforma. 21, 163 (2020).中文译题:基于已上市药物的安全性数据预测潜在不良事件[88] Sterzi, V. Patent quality and ownership: an analysis of UK faculty patenting. Res. Policy 42, 564–576 (2013).中文译题:专利质量与所有权:英国高校教师专利申请情况分析[89] Ciray, F. & Dogan, T. Machine learning-based prediction of drug approvals using molecular, physicochemical, clinical trial, and patent-related features. Expert. Opin. Drug. Discov. 17, 1425–1441 (2022).中文译题:基于分子、理化性质、临床试验与专利相关特征,通过机器学习预测药物获批概率[90] Ekins, S., Mestres, J. & Testa, B. In silico pharmacology for drug discovery: applications to targets and beyond. Br. J. Pharmacol. 152, 21–37 (2007).中文译题:药物发现中的计算机药理学:靶点相关及更广泛的应用[91] Sudhahar, S. et al. An experimentally validated approach to automated biological evidence generation in drug discovery using knowledge graphs. Nat. Commun. 15, 5703 (2024).中文译题:基于知识图谱实现药物发现中生物学证据自动化生成的方法及实验验证[92] Piñero, J. et al. DisGeNET: a comprehensive platform integrating information on human disease-associated genes and variants. Nucleic Acids Res. 45, D833–D839 (2017).中文译题:DisGeNET:整合人类疾病相关基因与变异信息的综合平台[93] Chen, Y. A., Allendes Osorio, R. S. & Mizuguchi, K. TargetMine 2022: a new vision into drug target analysis. Bioinformatics 38, 4454–4456 (2022).中文译题:TargetMine 2022:药物靶点分析的全新视角[94] Chen, Y. A., Tripathi, L. P. & Mizuguchi, K. TargetMine, an integrated data warehouse for candidate gene prioritisation and target discovery. PLoS One 6, e17844 (2011).中文译题:TargetMine:用于候选基因优先级排序与靶点发现的整合数据仓库[95] Madhukar, N. S. et al. A Bayesian machine learning approach for drug target identification using diverse data types. Nat. Commun. 10, 5221 (2019).中文译题:基于多类型数据的贝叶斯机器学习方法用于药物靶点识别[96] Allen, J. E. et al. Dual inactivation of Akt and ERK by TIC10 signals Foxo3a nuclear translocation, TRAIL gene induction, and potent antitumor effects. Sci. Transl. Med. 5, 171ra117 (2013).中文译题:TIC10通过双重抑制Akt与ERK通路,诱导Foxo3a核转位与TRAIL基因表达,发挥强效抗肿瘤作用[97] Mountjoy, E. et al. An open approach to systematically prioritize causal variants and genes at all published human GWAS trait-associated loci. Nat. Genet. 53, 1527–1533 (2021).中文译题:对已发表的人类GWAS性状相关基因座的致病变异与基因进行系统性优先级排序的开源方法[98] Abedi, M. et al. Systems biology and machine learning approaches identify drug targets in diabetic nephropathy. Sci. Rep. 11, 23452 (2021).中文译题:基于系统生物学与机器学习方法识别糖尿病肾病的药物靶点[99] Binder, J. et al. Machine learning prediction and tau-based screening identifies potential Alzheimer’s disease genes relevant to immunity. Commun. Biol. 5, 125 (2022).中文译题:机器学习预测与tau蛋白相关筛选识别与免疫相关的阿尔茨海默病潜在靶基因[100] Buniello, A. et al. Open Targets Platform: facilitating therapeutic hypotheses building in drug discovery. Nucleic Acids Res. 53, D1467–D1475 (2025).中文译题:Open Targets平台:助力药物研发中治疗假设的构建
[101] Leung, H. et al. Advancing target discovery through disease-specific integration of multi-modal target identification models and comprehensive benchmarking system. Sci. Rep. https://doi.org/10.1038/s41598-026-47765-3 (2026).中文译题:通过疾病特异性多模态靶点识别模型与综合基准测试体系推动靶点发现[102] Choobdar, S. et al. Assessment of network module identification across complex diseases. Nat. Methods 16, 843–852 (2019).中文译题:复杂疾病网络模块识别方法的评估[103] Zeng, X. et al. Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework. Nat. Mach. Intell. 4, 1004–1016 (2022).中文译题:基于自监督图像表示学习框架实现分子性质与药物靶点的精准预测[104] Ling, C. et al. Predicting drug–target interactions using matrix factorization with self-paced learning and dual similarity information. Technol. Health Care 32, 49–64 (2024).中文译题:基于自步学习与双重相似性信息的矩阵分解方法预测药物-靶点相互作用[105] Liu, Y., Wu, M., Miao, C., Zhao, P. & Li, X. L. Neighborhood regularized logistic matrix factorization for drug–target interaction prediction. PLoS Comput. Biol. 12, e1004760 (2016).中文译题:基于邻域正则化逻辑矩阵分解的药物-靶点相互作用预测[106] Raies, A. et al. DrugnomeAI is an ensemble machine-learning framework for predicting druggability of candidate drug targets. Commun. Biol. 5, 1291 (2022).中文译题:DrugnomeAI:用于候选药物靶点成药性预测的集成机器学习框架[107] Muslu, O., Hoyt, C. T., Lacerda, M., Hofmann-Apitius, M. & Frohlich, H. GuiltyTargets: prioritization of novel therapeutic targets with network representation learning. IEEE/ACM Trans. Comput. Biol. Bioinform 19, 491–500 (2022).中文译题:GuiltyTargets:基于网络表示学习实现新型治疗靶点的优先级排序[108] Theodoris, C. V. et al. Transfer learning enables predictions in network biology. Nature 618, 616–624 (2023).中文译题:迁移学习赋能网络生物学预测[109] Kraus, O. et al. Masked autoencoders are scalable learners of cellular morphology. Preprint at 10.48550/arXiv.2309.16064 (2023).中文译题:掩码自编码器是细胞形态学的可扩展学习模型[110] Meier, J. et al. Language models enable zero-shot prediction of the effects of mutations on protein function. In Proc. 35th Int. Conf. Neural Information Processing Systems (eds Ranzato, M. et al.) 29287–29303 (Curran Associates, 2021).中文译题:语言模型实现蛋白质突变功能效应的零样本预测[111] Ngoi, N. Y. L. et al. Synthetic lethal strategies for the development of cancer therapeutics. Nat. Rev. Clin. Oncol. 22, 46–64 (2025).中文译题:用于癌症治疗药物开发的合成致死策略[112] He, R., Cao, J. & Tan, T. Generative artificial intelligence: a historical perspective. Natl Sci. Rev. 12, nwaf050 (2025).中文译题:生成式人工智能:历史视角[113] Urban, A. et al. Precious1GPT: multimodal transformer-based transfer learning for aging clock development and feature importance analysis for aging and age-related disease target discovery. Aging 15, 4649–4666 (2023).中文译题:Precious1GPT:基于多模态Transformer迁移学习构建衰老时钟,及衰老与衰老相关疾病靶点发现的特征重要性分析[114] Galkin, F. et al. Precious3GPT: multimodal multi-species multi-omics multi-tissue transformer for aging research and drug discovery. Preprint at bioRxiv https://doi.org/10.1101/2024.07.25.605062 (2024).中文译题:Precious3GPT:面向衰老研究与药物发现的多模态、跨物种、多组学、跨组织Transformer模型[115] Galkin, F., Ren, F. & Zhavoronkov, A. LLMs and AI life models for Traditional Chinese Medicine-derived geroprotector formulation. Aging Dis. https://doi.org/10.14336/ad.2024.1697 (2025).中文译题:大语言模型与AI生命模型在中药来源抗衰老药物配方开发中的应用[116] Zappia, L., Phipson, B. & Oshlack, A. Splatter: simulation of single-cell RNA sequencing data. Genome Biol. 18, 174 (2017).中文译题:Splatter:单细胞RNA测序数据的模拟工具[117] Marouf, M. et al. Realistic in silico generation and augmentation of single-cell RNA-seq data using generative adversarial networks. Nat. Commun. 11, 166 (2020).中文译题:基于生成对抗网络实现单细胞RNA测序数据的计算机模拟生成与数据增强[118] Lindenbaum, O., Stanley, J., Wolf, G. & Krishnaswamy, S. Geometry based data generation. In Advances in Neural Information Processing Systems Vol. 31, 1405–1416 (NeurIPS, 2018).中文译题:基于几何的数据生成方法[119] Zinati, Y., Takiddeen, A. & Emad, A. GRouNdGAN: GRN-guided simulation of single-cell RNA-seq data using causal generative adversarial networks. Nat. Commun. 15, 4055 (2024).中文译题:GRouNdGAN:基于基因调控网络引导的因果生成对抗网络,实现单细胞RNA测序数据模拟[120] Lotfollahi, M., Wolf, F. A. & Theis, F. J. scGen predicts single-cell perturbation responses. Nat. Methods 16, 715–721 (2019).中文译题:scGen:预测单细胞扰动响应[121] Achiam, J. et al. GPT-4 technical report. Preprint at https://doi.org/10.48550/arXiv.2303.08774 (2023).中文译题:GPT-4技术报告[122] Gururangan, S. et al. Don’t stop pretraining: adapt language models to domains and tasks. In Proc. 58th Annual Meeting of the Association for Computational Linguistics (eds Jurafsky, D. et al.) 8342–8360 (Association for Computational Linguistics, 2020).中文译题:持续预训练:让语言模型适配领域与任务[123] Qiu, X. et al. Pre-trained models for natural language processing: a survey. Sci. China Technol. Sci. 63, 1872–1897 (2020).中文译题:自然语言处理预训练模型综述[124] Luo, R. et al. BioGPT: generative pre-trained transformer for biomedical text generation and mining. Brief. Bioinform 23, bbac409 (2022).中文译题:BioGPT:面向生物医学文本生成与挖掘的生成式预训练Transformer模型[125] Zagirova, D. et al. Biomedical generative pre-trained based transformer language model for age-related disease target discovery. Aging 15, 9293–9309 (2023).中文译题:面向衰老相关疾病靶点发现的生物医学生成式预训练Transformer语言模型[126] Wang, E. et al. Txgemma: efficient and agentic LLMs for therapeutics. Preprint at https://arxiv.org/abs/2504.06196 (2025).中文译题:Txgemma:面向治疗学领域的高效智能体大语言模型[127] Gottweis, J. et al. Towards an AI co-scientist. Preprint at https://doi.org/10.48550/arXiv.2502.18864 (2025).中文译题:迈向AI协同科学家[128] Guan, Y. et al. AI-Assisted drug re-purposing for human liver fibrosis. Adv. Sci. 12, e08751 (2025).中文译题:AI辅助的肝纤维化药物重定位[129] Zhang, Z. et al. OriGene: a self-evolving virtual disease biologist automating therapeutic target discovery. Preprint at bioRxiv https://doi.org/10.1101/2025.06.03.657658 (2025).中文译题:OriGene:可自主进化的虚拟疾病生物学家,实现治疗靶点发现自动化[130] Pun, F. W. et al. Identification of therapeutic targets for amyotrophic lateral sclerosis using PandaOmics—an AI-enabled biological target discovery platform. Front. Aging Neurosci. 14, 914017 (2022).中文译题:基于AI赋能的生物靶点发现平台PandaOmics识别肌萎缩侧索硬化症的治疗靶点[131] Ren, F. et al. A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models. Nat. Biotechnol. https://doi.org/10.1038/s41587-024-02143-0 (2024).中文译题:小分子TNIK抑制剂在纤维化临床前模型与临床模型中的治疗作用[132] Lim, C. M. et al. Multiomic prediction of therapeutic targets for human diseases associated with protein phase separation. Proc. Natl Acad. Sci. USA 120, e2300215120 (2023).中文译题:基于多组学预测蛋白相分离相关人类疾病的治疗靶点[133] Mkrtchyan, G. V. et al. High-confidence cancer patient stratification through multiomics investigation of DNA repair disorders. Cell Death Dis. 13, 999 (2022).中文译题:通过DNA修复障碍的多组学研究实现高可信度的癌症患者分层[134] Pun, F. W. et al. A comprehensive AI-driven analysis of large-scale omic datasets reveals novel dual-purpose targets for the treatment of cancer and aging. Aging Cell 22, e14017 (2023).中文译题:基于AI对大规模组学数据集的综合分析,识别兼具癌症与衰老治疗价值的双用途靶点[135] Ranjbar, M. et al. Autophagy dark genes: can we find them with machine learning? Nat. Sci. 3, e20220067 (2023).中文译题:自噬相关未知基因:能否通过机器学习实现发现?[136] Hughes, J. P., Rees, S., Kalindjian, S. B. & Philpott, K. L. Principles of early drug discovery. Br. J. Pharmacol. 162, 1239–1249 (2011).中文译题:早期药物发现的基本原则[137] Ren, F. et al. AlphaFold accelerates artificial intelligence powered drug discovery: efficient discovery of a novel CDK20 small molecule inhibitor. Chem. Sci. 14, 1443–1452 (2023).中文译题:AlphaFold加速AI赋能的药物发现:高效发现新型CDK20小分子抑制剂[138] Zhang, S. et al. Genome-wide identification of the genetic basis of amyotrophic lateral sclerosis. Neuron 110, 992–1008.e11 (2022).中文译题:全基因组范围识别肌萎缩侧索硬化症的遗传基础[139] Liu, B. H. M. et al. Utilizing AI for the identification and validation of novel therapeutic targets and repurposed drugs for endometriosis. Adv. Sci. 12, e2406565 (2025).中文译题:基于AI实现子宫内膜异位症新型治疗靶点的识别验证与药物重定位[140] Tang, Q. et al. AI-driven robotics laboratory identifies pharmacological TNIK inhibition as a potent senomorphic agent. Aging Dis. https://doi.org/10.14336/ad.2024.1492 (2025).中文译题:AI驱动的机器人实验室发现TNIK药理学抑制是一种强效的衰老相关分泌表型抑制药物[141] Tsuji, S. et al. Artificial intelligence-based computational framework for drug-target prioritization and inference of novel repositionable drugs for Alzheimer’s disease. Alzheimers Res. Ther. 13, 92 (2021).中文译题:基于人工智能的计算框架,用于阿尔茨海默病药物靶点优先级排序与新型重定位药物推断[142] Yamaguchi, T. et al. Syk inhibitors reduce tau protein phosphorylation and oligomerization. Neurobiol. Dis. 201, 106656 (2024).中文译题:Syk抑制剂可减少tau蛋白的磷酸化与寡聚化[143] Pun, F. W. et al. Hallmarks of aging-based dual-purpose disease and age-associated targets predicted using PandaOmics AI-powered discovery engine. Aging 14, 2475–2506 (2022).中文译题:基于AI驱动的PandaOmics发现引擎,预测基于衰老标志的疾病与衰老相关双用途靶点[144] Sikder, S., Baek, S., McNeil, T. & Dalal, Y. Centromere inactivation during aging can be rescued in human cells. Mol. Cell 85, 692–707.e7 (2025).中文译题:衰老过程中的着丝粒失活可在人类细胞中被逆转[145] Deng, X. et al. Effects of MMP2 and its inhibitor TIMP2 on DNA damage, apoptosis and senescence of human lens epithelial cells induced by oxidative stress. J. Bioenerg. Biomembr. 56, 619–630 (2024).中文译题:MMP2及其抑制剂TIMP2对氧化应激诱导的人晶状体上皮细胞DNA损伤、凋亡与衰老的影响[146] Zhu, F. et al. What are next generation innovative therapeutic targets? Clues from genetic, structural, physicochemical, and systems profiles of successful targets. J. Pharmacol. Exp. Ther. 330, 304–315 (2009).中文译题:下一代创新治疗靶点的特征:来自成功靶点的遗传、结构、理化与系统特征线索[147] Zhu, F., Li, X. X., Yang, S. Y. & Chen, Y. Z. Clinical success of drug targets prospectively predicted by in silico study. Trends Pharmacol. Sci. 39, 229–231 (2018).中文译题:计算机模拟研究前瞻性预测的药物靶点的临床成功率[148] Aliper, A. et al. Prediction of clinical trials outcomes based on target choice and clinical trial design with multi-modal artificial intelligence. Clin. Pharmacol. Ther. 114, 972–980 (2023).中文译题:基于多模态人工智能,通过靶点选择与临床试验设计预测临床试验结果
[149] Jumper, J. et al. Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589 (2021).中文译题:基于AlphaFold实现蛋白质结构的高精准预测[150] Fraser, J. S. et al. Accessing protein conformational ensembles using room-temperature X-ray crystallography. Proc. Natl Acad. Sci. USA 108, 16247–16252 (2011).中文译题:基于室温X射线晶体学解析蛋白质构象系综[151] ww, P. D. B. c Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Res. 47, D520–D528 (2019).中文译题:蛋白质数据库(PDB):全球唯一的3D生物大分子结构数据存档[152] Steinegger, M., Mirdita, M. & Soding, J. Protein-level assembly increases protein sequence recovery from metagenomic samples manyfold. Nat. Methods 16, 603–606 (2019).中文译题:蛋白水平组装可将宏基因组样本的蛋白序列回收率提升数倍[153] Jumper, J. et al. Applying and improving AlphaFold at CASP14. Proteins 89, 1711–1721 (2021).中文译题:AlphaFold在CASP14竞赛中的应用与优化[154] Lee, C., Su, B. H. & Tseng, Y. J. Comparative studies of AlphaFold, RoseTTAFold and Modeller: a case study involving the use of G-protein-coupled receptors. Brief. Bioinform 23, bbac308 (2022).中文译题:AlphaFold、RoseTTAFold与Modeller的对比研究:以G蛋白偶联受体为例[155] Webb, B. & Sali, A. Protein structure modeling with MODELLER. Methods Mol. Biol. 1137, 1–15 (2014).中文译题:基于MODELLER的蛋白质结构建模[156] Stein, A. & Kortemme, T. Improvements to robotics-inspired conformational sampling in Rosetta. PLoS One 8, e63090 (2013).中文译题:Rosetta中机器人启发的构象采样方法的优化[157] Deane, C. M. & Blundell, T. L. CODA: a combined algorithm for predicting the structurally variable regions of protein models. Protein Sci. 10, 599–612 (2001).中文译题:CODA:一种预测蛋白质模型结构可变区的组合算法[158] Ahdritz, G. et al. OpenFold: retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization. Nat. Methods 21, 1514–1524 (2024).中文译题:OpenFold:重新训练AlphaFold2,揭示其学习机制与泛化能力[159] Baek, M. et al. Accurate prediction of protein structures and interactions using a three-track neural network. Science 373, 871–876 (2021).中文译题:基于三轨神经网络实现蛋白质结构与相互作用的精准预测[160] Passaro, S. et al. Boltz-2: towards accurate and efficient binding affinity prediction. Preprint at bioRxiv https://doi.org/10.1101/2025.06.14.659707 (2025).中文译题:Boltz-2:迈向精准高效的结合亲和力预测[161] Naddaf, M. Open-source protein structure AI aims to match AlphaFold. Nature https://doi.org/10.1038/d41586-025-03546-y (2025).中文译题:开源蛋白质结构AI有望比肩AlphaFold[162] Mosalaganti, S. et al. AI-based structure prediction empowers integrative structural analysis of human nuclear pores. Science 376, eabm9506 (2022).中文译题:基于AI的结构预测赋能人类核孔复合体的整合结构分析[163] Bryant, P., Pozzati, G. & Elofsson, A. Improved prediction of protein–protein interactions using AlphaFold2. Nat. Commun. 13, 1265 (2022).中文译题:基于AlphaFold2优化蛋白质-蛋白质相互作用预测[164] Hekkelman, M. L., de Vries, I., Joosten, R. P. & Perrakis, A. AlphaFill: enriching AlphaFold models with ligands and cofactors. Nat. Methods 20, 205–213 (2023).中文译题:AlphaFill:为AlphaFold模型补充配体与辅因子信息[165] Holcomb, M., Chang, Y. T., Goodsell, D. S. & Forli, S. Evaluation of AlphaFold2 structures as docking targets. Protein Sci. 32, e4530 (2023).中文译题:AlphaFold2结构作为分子对接靶点的适用性评估[166] Scardino, V., Di Filippo, J. I. & Cavasotto, C. N. How good are AlphaFold models for docking-based virtual screening? iScience 26, 105920 (2023).中文译题:AlphaFold模型在基于对接的虚拟筛选中的性能评估[167] Karelina, M., Noh, J. J. & Dror, R. O. How accurately can one predict drug binding modes using AlphaFold models? eLife 12, RP89386 (2023).中文译题:基于AlphaFold模型预测药物结合模式的准确度分析[168] Lyu, J. et al. AlphaFold2 structures guide prospective ligand discovery. Science 384, eadn6354 (2024).中文译题:AlphaFold2结构指导前瞻性配体发现[169] Lin, Z. et al. Evolutionary-scale prediction of atomic-level protein structure with a language model. Science 379, 1123–1130 (2023).中文译题:基于语言模型实现进化尺度的蛋白质原子级结构预测[170] Meller, A., Bhakat, S., Solieva, S. & Bowman, G. R. Accelerating cryptic pocket discovery using AlphaFold. J. Chem. Theory Comput. 19, 4355–4363 (2023).中文译题:基于AlphaFold加速隐藏结合口袋的发现[171] Meller, A. et al. Predicting locations of cryptic pockets from single protein structures using the PocketMiner graph neural network. Nat. Commun. 14, 1177 (2023).中文译题:基于PocketMiner图神经网络从单一蛋白质结构预测隐藏结合口袋的位置[172] Li, H. et al. Decoding the mitochondrial connection: development and validation of biomarkers for classifying and treating systemic lupus erythematosus through bioinformatics and machine learning. BMC Rheumatol. 7, 44 (2023).中文译题:解析线粒体相关机制:通过生物信息学与机器学习开发并验证系统性红斑狼疮分类与治疗的生物标志物[173] Pham, T. C. P. et al. TNIK is a conserved regulator of glucose and lipid metabolism in obesity. Sci. Adv. 9, eadf7119 (2023).中文译题:TNIK是肥胖症中葡萄糖与脂质代谢的保守调控因子[174] Xu, Z. et al. A generative AI-discovered TNIK inhibitor for idiopathic pulmonary fibrosis: a randomized phase 2a trial. Nat. Med. https://doi.org/10.1038/s41591-025-03743-2 (2025).中文译题:生成式AI发现的TNIK抑制剂治疗特发性肺纤维化:一项随机2a期临床试验[175] Zitnik, M. AI-enabled drug discovery reaches clinical milestone. Nat. Med. 31, 2490–2491 (2025).中文译题:AI赋能的药物发现迎来临床里程碑[176] Besse-Patin, A. et al. Effect of endurance training on skeletal muscle myokine expression in obese men: identification of apelin as a novel myokine. Int. J. Obes. 38, 707–713 (2014).中文译题:耐力训练对肥胖男性骨骼肌肌因子表达的影响:apelin作为新型肌因子的识别[177] Fujie, S. et al. Reduction of arterial stiffness by exercise training is associated with increasing plasma apelin level in middle-aged and older adults. PLoS One 9, e93545 (2014).中文译题:运动训练降低中老年人动脉僵硬度与血浆apelin水平升高相关[178] Vinel, C. et al. The exerkine apelin reverses age-associated sarcopenia. Nat. Med. 24, 1360–1371 (2018).中文译题:运动因子apelin可逆转衰老相关肌少症[179] Wang, Y. et al. Oral-096 The apelin receptor agonist azelaprag reduces weight gain & improves body composition in DIO mice. Obesity 32, 5–54 (2024).中文译题:apelin受体激动剂azelaprag可减少饮食诱导肥胖小鼠的体重增加并改善身体组成[180] Mejzini, R. et al. ALS genetics, mechanisms, and therapeutics: where are we now? Front. Neurosci. 13, 1310 (2019).中文译题:肌萎缩侧索硬化症的遗传学、机制与治疗:研究现状[181] Ilieva, H., Vullaganti, M. & Kwan, J. Advances in molecular pathology, diagnosis, and treatment of amyotrophic lateral sclerosis. BMJ 383, e075037 (2023).中文译题:肌萎缩侧索硬化症的分子病理学、诊断与治疗研究进展[182] Shi, Y. et al. Haploinsufficiency leads to neurodegeneration in C9ORF72 ALS/FTD human induced motor neurons. Nat. Med. 24, 313–325 (2018).中文译题:C9ORF72单倍剂量不足在家族性肌萎缩侧索硬化症/额颞叶痴呆iPSC来源运动神经元中引发神经退行性变[183] Hung, S. T. et al. PIKFYVE inhibition mitigates disease in models of diverse forms of ALS. Cell 186, 786–802.e28 (2023).中文译题:PIKFYVE抑制可在多种肌萎缩侧索硬化症模型中缓解疾病进展[184] Terstappen, G. C., Schlüpen, C., Raggiaschi, R. & Gaviraghi, G. Target deconvolution strategies in drug discovery. Nat. Rev. Drug. Discov. 6, 891–903 (2007).中文译题:药物发现中的靶点去卷积策略[185] Wang, X. et al. A novel approach for target deconvolution from phenotype-based screening using knowledge graph. Sci. Rep. 15, 2414 (2025).中文译题:基于知识图谱的表型筛选靶点去卷积新方法[186] Allen, J. E. et al. Discovery and clinical introduction of first-in-class imipridone ONC201. Oncotarget 7, 74380–74392 (2016).中文译题:首创咪唑酮类药物ONC201的发现与临床应用[187] Anderson, P. M. et al. Phase II study of ONC201 in neuroendocrine tumors including pheochromocytoma–paraganglioma and desmoplastic small round cell tumor. Clin. Cancer Res. 28, 1773–1782 (2022).中文译题:ONC201治疗神经内分泌肿瘤(包括嗜铬细胞瘤-副神经节瘤与促结缔组织增生性小圆细胞肿瘤)的2期临床研究[188] Ishizawa, J. et al. Mitochondrial ClpP-mediated proteolysis induces selective cancer cell lethality. Cancer Cell 35, 721–737.e9 (2019).中文译题:线粒体ClpP介导的蛋白水解诱导选择性的癌细胞死亡[189] Graves, P. R. et al. Mitochondrial protease ClpP is a target for the anticancer compounds ONC201 and related analogues. ACS Chem. Biol. 14, 1020–1029 (2019).中文译题:线粒体蛋白酶ClpP是抗肿瘤化合物ONC201及其类似物的作用靶点[190] Price, E. et al. What is the real value of omics data? Enhancing research outcomes and securing long-term data excellence. Nucleic Acids Res. 52, 12130–12140 (2024).中文译题:组学数据的真正价值:提升研究成果与保障长期数据质量[191] Bottini, S., Emmert-Streib, F. & Franco, L. Editorial: AI and multi-omics for rare diseases: challenges, advances and perspectives, volume II. Front. Mol. Biosci. 9, 986749 (2022).中文译题:编者按:罕见病研究中的AI与多组学:挑战、进展与展望(第二卷)[192] All of Us Research Program Genomics Investigators Genomic data in the All of Us Research Program. Nature 627, 340–346 (2024).中文译题:“我们所有人”研究计划中的基因组数据[193] O’Doherty, K. C. et al. Toward better governance of human genomic data. Nat. Genet. 53, 2–8 (2021).中文译题:迈向更完善的人类基因组数据治理体系[194] Sun, K. Y. et al. A deep catalogue of protein-coding variation in 983,578 individuals. Nature 631, 583–592 (2024).中文译题:983578例个体的蛋白编码变异深度目录[195] Errington, T. M. et al. Investigating the replicability of preclinical cancer biology. eLife 10, e71601 (2021).中文译题:临床前癌症生物学研究的可重复性调查[196] Rodgers, P. & Collings, A. What have we learned? eLife https://doi.org/10.7554/eLife.75830 (2021).中文译题:我们学到了什么?[197] Lu, K., Yang, G. & Wang, X. Topics emerged in the biomedical field and their characteristics. Technol. Forecast. Soc. Change 174, 121218 (2022).中文译题:生物医学领域的新兴主题及其特征[198] Krawczyk, B. Learning from imbalanced data: open challenges and future directions. Prog. Artif. Intell. 5, 221–232 (2016).中文译题:不平衡数据学习:开放挑战与未来方向[199] Oprea, T. I. et al. Unexplored therapeutic opportunities in the human genome. Nat. Rev. Drug. Discov. 17, 317–332 (2018).中文译题:人类基因组中尚未被探索的治疗机会[200] Picard, M., Scott-Boyer, M. P., Bodein, A., Périn, O. & Droit, A. Integration strategies of multi-omics data for machine learning analysis. Comput. Struct. Biotechnol. J. 19, 3735–3746 (2021).中文译题:面向机器学习分析的多组学数据整合策略[201] Adossa, N., Khan, S., Rytkönen, K. T. & Elo, L. L. Computational strategies for single-cell multi-omics integration. Comput. Struct. Biotechnol. J. 19, 2588–2596 (2021).中文译题:单细胞多组学整合的计算策略[202] Acosta, J. N., Falcone, G. J., Rajpurkar, P. & Topol, E. J. Multimodal biomedical AI. Nat. Med. 28, 1773–1784 (2022).中文译题:多模态生物医学人工智能
[203] Chen, T., Philip, M., Le Cao, K. A. & Tyagi, S. A multi-modal data harmonisation approach for discovery of COVID-19 drug targets. Brief. Bioinform 22, bbab185 (2021).中文译题:面向COVID-19药物靶点发现的多模态数据协调方法[204] Chaudhary, K., Poirion, O. B., Lu, L. & Garmire, L. X. Deep Learning-based multi-omics integration robustly predicts survival in liver cancer. Clin. Cancer Res. 24, 1248–1259 (2018).中文译题:基于深度学习的多组学整合可稳健预测肝癌患者生存情况[205] Hao, Y. et al. Integrated analysis of multimodal single-cell data. Cell 184, 3573–3587.e29 (2021).中文译题:多模态单细胞数据的整合分析[206] Elbadawi, M., Gaisford, S. & Basit, A. W. Advanced machine-learning techniques in drug discovery. Drug. Discov. Today 26, 769–777 (2021).中文译题:药物发现中的先进机器学习技术[207] Castelvecchi, D. Can we open the black box of AI? Nature 538, 20–23 (2016).中文译题:我们能否打开AI的黑箱?[208] Hie, B., Cho, H. & Berger, B. Realizing private and practical pharmacological collaboration. Science 362, 347–350 (2018).中文译题:实现隐私安全且实用的药理学合作[209] Jiménez-Luna, J., Grisoni, F. & Schneider, G. Drug discovery with explainable artificial intelligence. Nat. Mach. Intell. 2, 573–584 (2020).中文译题:基于可解释人工智能的药物发现[210] Patel, R. et al. Retrieve to explain: evidence-driven predictions for explainable drug target identification. In Proc. 63rd Annual Meeting of the Association for Computational Linguistics Vol. 1 (eds Che, W. et al.) 3328–3370 (Association for Computational Linguistics, 2025).中文译题:检索式解释:面向可解释药物靶点识别的证据驱动预测[211] Elmarakeby, H. A. et al. Biologically informed deep neural network for prostate cancer discovery. Nature 598, 348–352 (2021).中文译题:生物学信息知情的深度神经网络用于前列腺癌发现[212] Zong, N. et al. BETA: a comprehensive benchmark for computational drug-target prediction. Brief. Bioinform 23, bbac199 (2022).中文译题:BETA:面向计算药物靶点预测的综合基准测试集[213] Shayakhmetov, R. et al. Molecular generation for desired transcriptome changes with adversarial autoencoders. Front. Pharmacol. 11, 269 (2020).中文译题:基于对抗自编码器实现靶向转录组变化的分子生成[214] Vinas, R., Andres-Terre, H., Lio, P. & Bryson, K. Adversarial generation of gene expression data. Bioinformatics 38, 730–737 (2022).中文译题:基因表达数据的对抗生成[215] Dolezal, J. M. et al. Deep learning generates synthetic cancer histology for explainability and education. npj Precis. Oncol. 7, 49 (2023).中文译题:基于深度学习生成合成癌症组织学图像,用于模型可解释性与教学[216] Giuffrè, M. & Shung, D. L. Harnessing the power of synthetic data in healthcare: innovation, application, and privacy. npj Digit. Med. 6, 186 (2023).中文译题:驾驭医疗健康领域合成数据的力量:创新、应用与隐私保护[217] San, O. The digital twin revolution. Nat. Comput. Sci. 1, 307–308 (2021).中文译题:数字孪生革命[218] Ren, Y., Pieper, A.A., Cummings, J.L., Cheng, F. Single-cell digital twins identify drug targets and repurposable medicine in Alzheimer’s disease. Alzheimers Dement 21, e102982 (2025).中文译题:单细胞数字孪生识别阿尔茨海默病的药物靶点与可重定位药物
论文官方引用格式
Pun, F.W., Podolskiy, D., Izumchenko, E. et al. Target identification and assessment in the era of AI. Nat Rev Drug Discov (2026). https://doi.org/10.1038/s41573-026-01412-8
生物智能:在生物先进产业场景中构建“状态感知-实时认知-自主决策-精准执行-学习提升”的生物科学智能(Biology_and_AI);实现生物产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
生物产业+物理AI=生物智能
产业智能官:Science_and_AI
加入知识星球“生物智能研究院”:生物产业OT技术(自动化+机器人+工艺+精益)和新一代IT技术(云计算+物联网+区块链+大数据+人工智能)深度融合,在场景中构建“状态感知-实时认知-自主决策-精准执行-学习提升”的生物科学智能;实现生物产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
生物科学智能作为第四次工业革命的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎;重构设计、生产、供应链和服务等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态和新模式;引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。
生物产业智能化技术分支用来的今天,从业者必须了解如何将生物科学智能全面渗入整个公司、产品、业务等商业场景中,利用生物科学智能形成数字化、网络化和智能化力量,实现行业的重新布局、企业的重新构建和焕然新生。
版权声明:产业智能官(ID:Science_and_AI)发表的文章,除非确实无法确认,我们都会注明作者和来源,涉权请联系协商解决,联系、投稿邮箱:wolongzy@qq.com