会议推荐
2026第三届中国医药企业项目管理大会
2026第二届中国AI项目管理大会
2026第十五届中国PMO大会
2026第五届中国项目经理大会
本
文
目
录
1、Nature Machine Intelligence我国学者在人工智能生成式药物设计研究方面取得进展
2、人工智能在药物设计中的应用:机遇与挑战(一)
3、人工智能中的药物设计:应用与趋势
4、徐峻人工智能与药物设计学:新范式探索(5)
一、Nature Machine Intelligence我国学者在人工智能生成式药物设计研究方面取得进展
(生物力学仪器)
上海交通大学医学人工智能研究院张健教授课题组,在人工智能生成式药物设计研究方面取得进展。相关成果以“Electron-density-informed effective and reliable de novo molecular design and optimization with ED2Mol”为题,于2025年8月20日在Nature Machine Intelligence杂志在线发表,被该期刊选为封面故事推荐,并获Ana Laura Dias教授在News Highlight专文中的高度评价:药物开发中的人工智能面临的下一个重大挑战是证明其在真实世界环境中的价值。一种新技术不仅支持新化学实体的生成,还能加速一系列真实世界的分子设计任务。
图 人工智能药物设计方法ED2Mol的分子生成架构和工作流程
创新药物研发的核心在于发现具有生物活性的分子(“苗头分子”或“先导分子”)。传统方法主要依赖高通量筛选技术,从现有化合物库中搜寻候选分子。然而,现有化合物库的规模有限(仅约109个分子),结构多样性不足,难以覆盖庞大而复杂的化学空间,使得许多具备潜力的候选分子未被发掘。相比之下,从头设计(de novo)方法直接在估计约1050规模的化学空间中“无中生有”地生成分子,大大提高了发现全新、高效药物分子的可能性。
研究团队开发的电子云密度驱动分子生成模型——ED2Mol,正是这一方向的突破。结构生物学长期以来依赖电子密度图解析分子结构:它不仅宏观展示配体与靶点蛋白的空间匹配,更在微观层面反映原子间的电磁相互作用。ED2Mol首次将电子密度信息融入深度学习生成框架,既能把握结合口袋的整体结构环境,又可精准模拟原子级别的相互作用机制。在多项系统评估中,ED2Mol所生成的分子在结合能力、构象质量与稳定性方面均超越现有方法,同时表现出良好的可合成性、类药性以及丰富的结构多样性。研究团队在成纤维细胞生长因子受体3(FGFR3),细胞分裂控制蛋白42同源物(CDC42),葡萄糖激酶(GCK),视黄酸诱导蛋白(GPRC5A)等靶标体系的药物研发场景中验证了ED2Mol的应用潜力。
该研究开发了从苗头分子生成到先导化合物优化的统一智能框架,生成分子在可靠性与创新性上达到当前最优水平。ED2Mol不仅在常规正构位点表现出色,也能针对难以突破的变构位点生成高效分子,同时覆盖抑制剂与激动剂等多种药物类型,为创新药物研发提供了高效、可靠的人工智能驱动平台。
图1:ED2Mol的架构和工作流程。
图2:DGMS在DUD-E(蓝色)和更具有挑战性的ASB-E(红色)测试集上的性能对比。
图3 回顾先导优化案例研究。
图4 通过ED2Mol的实际应用发现的新型FGFR3正位激动剂抑制剂。
图5 通过ED2Mol的实际应用发现的新型CDC42非竞争性抑制剂和GCK非竞争性激活剂。
二、人工智能在药物设计中的应用:机遇与挑战(一)
(原创 我在西游你在红楼 AIDDPro)
摘要
人工智能(AI)近年来得到了快速的发展,并已成功地应用于药物设计等现实问题。在本章中,我们回顾了人工智能在药物设计中的应用,包括虚拟筛选、计算机辅助合成规划和从头分子生成,重点介绍了人工智能在其中应用的局限性和改进的机会。此外,我们还讨论了人工智能在将理论实践转化为现实世界的药物设计方面所带来的更广泛的挑战;包括量化预测的不确定性和解释模型行为。
药物设计面临着哪些挑战
候选药物进入临床试验的成功率自20世纪70 代以来一直在下降,导致FDA获批概率也逐渐低(2015-2017 年为 10%),每个获批药物的研发成本显着增加。为了降低制药行业的成本,提高临床试验的成功率至关重要。在药物设计过程中及早选择具有适当特性的化合物至关重要,阿斯利康最近的研究强调了开发基于 AI 的计算方法以帮助药物设计决策的重要性。本章讨论旨在协助药物设计决策以应对这些挑战的人工智能的发展。
图1:图1显示了在药物发现和开发的不同阶段,通过提高效率(时间、失败率或成本降低20%)可能节省的钱。
候选药物的设计需要在药物设计的早期阶段选择化合物,并通过有效的优化方法使其有合适的理化性质。药物设计的主要阶段如表1所示。苗头化合物或具有良好活性的化合物可以通过对大型化合物库进行筛选来获得;可以使用多种技术,包括在目标生物分子上的理化性质和在细胞或基于组织的模型系统中化合物的效能。现代的筛选库包含数百万种多样化的化合物;然而,无论使用哪种方法,找到具有适当属性的新型苗头化合物都非常困难。最近的分析表明,43%的临床候选药物是由已知的化合物如以前的临床候选药物派生而来的。具有良好的药效和吸收、分布、代谢、排泄和毒性(ADMET)特性的苗头化合物被选为先导化合物,然后这需要它在保持适当的ADMET特性的同时还进行效能和选择性的优化。从临床试验的成功率来看,很明显这个过程通常很难找到在患者身上具有很高的药效和很好的药代动力学特性的分子。基于靶点的筛选常常会因为它们的非靶点作用会产生一些具有意外药效特性的苗头化合物。此外,不管是哪种来源的苗头化合物在后期都可能会出现药代动力学不良或意外毒性等问题。因此,药物设计中计算方法的最重要目标应该是在整个药物设计过程中帮助选择患者中表现中庸的化合物(有效而且毒副作用小,ADMET的表现也很好)。
表1:关于药物设计的各个阶段的概述
阶段
目的
应用
靶点发现和验证
发现靶点生物分子或基于细胞/组织的分析,可用于检测化合物的潜在的治疗效果
使用本体论和知识图谱结合各种数据类型(如遗传和临床数据)进行靶点发现;使用机器学习进行诊断和患者分层
Library的设计和苗头化合物发现
设计、制造和测试具有进一步开发的合适的理化性质的化合物(ADMET等)。
虚拟筛选、从头分子生成、计算机辅助合成预测、表型筛选的靶点预测。
先导化合物的优化
选择最有希望的靶点;优化所选择的先导化合物,以达到针对预期靶点的效力,同时尽量减少脱靶生物活性,并确保合适的ADMET特性
从头分子生成(需要多目标优化),计算机辅助合成预测,主动学习,ADMET建模
临床前和临床研究
选择剂量、配方和给药方法;对模型生物和患者的有效性和安全性进行试验
使用因果推理估计对动物模型或患者的治疗效果
目前我们已经收集了很多关于化合物的性质、反应和相互作用的数据集,然而,这些数据集大多数集中在少数一些经过深入研究的问题上。虽然有些目标蛋白有数千种化合物的生物活性报告,但在ChEMBL中,7748个靶点中有5640个靶点只有不到100个相关化合物。此外,描述化合物体外活性的数据集远远超过描述其体内效果的数据集;ChEMBL包含了1600万个生物活性测量值,而描述肝毒性的DILIRank数据集仅包含1036个定性数据点。分子的生物活性取决于剂量、时间和测试系统的可变性,这使得一致地注释这些数据更加困难。尽管如此,这些数据集中所包含的信息依然是预测化合物体内行为的模型建立的重要资源。经验模型,如量化结构-活性/性质关系(QSAR/QSPR)方法,利用机器学习模型预测分子性质,已被广泛用于帮助设计新药,特别是通过优化ADMET性质和避免常见的毒性的模式。ML模型如随机森林和支持向量机常常与化学数据一起使用,它们被称为描述符向量(即化学指纹),在机器学习中作为输入。最近,深度神经网络流行了起来;这些模型的输入是SMILES字符串或分子图像,而不是化学指纹,深度神经网络可以执行更复杂的多任务学习等任务。然而,与其他模型一样,它们的性能往往受到可用数据的限制 。
这些机器学习模型可用于创建“人工智能”系统,以帮助专家在药物设计中的进行决策。在本章中,我们描述了处理药物设计中一些最紧迫问题的机器学习方法,重点关注三个关键领域:虚拟筛选、计算机辅助合成规划(CASP)以及通过生成模型进行全新分子生成。如果能够创建在这些领域做出有效决策的人工智能系统,它将显著有助于候选药物的设计。尽管如此,目前广泛使用的许多机器学习方法在没有专家介入的情况下无法提供在现实药物设计问题中做出决策所需的信息;经常遇到的限制是缺乏有效的预测置信度和机理推理与用户的沟通。这些问题将在本章的最后一节中探讨。
参考资料:
Thomas M, Boardman A, Garcia-Ortegon M, et al. Applications of artificial intelligence in drug design: opportunities and challenges[J]. Artificial Intelligence in Drug Design, 2022: 1-59.
注:英文原文中的Hits在本文中被翻译为了苗头化合物,Leads被翻译为了先导化合物。
三、人工智能中的药物设计:应用与趋势
(原创 三叶草 药渡)
据Simon Smith[1]的统计,截至2021年5月,全球共有43家制药公司明确在药物设计中使用人工智能,全球十大药企均榜上有名(如图1所示),足以见得人工智能在药物设计中的重要性。
图1. 全球明确使用人工智能的医药公司中的十大药企
人工智能(AI),特别是其中的深度学习,为创新药物的设计提供了机会。近几年出现了各种机器学习方法,其中一些被认为是特定领域的人工智能实例,并且许多人工智能已成功地用于药物设计。
本文先概述了4个有代表性的人工智能在药物设计中的应用,包括三种药物设计方法以及药物构效关系解释,接着讨论了人工智能中的药物设计趋势,希望可以为各位读者提供药物设计潜在未来方向的参考。
1
针对靶标蛋白的新药设计
近年来,基于深度学习的方法成为新药设计的一种很有前途的工具。这些方法大多是基于配体的,其中初始的靶标特定的配体数据集,对于设计具有优化性质的有效分子是必要的。尽管已经有人尝试开发另一种方法来设计靶标特定的配体数据集,但在设计针对新靶标蛋白的分子时,此类数据集的可用性仍然是一个挑战。
Sowmya, Navneet[4]等人提出了针对靶标蛋白活性部位的深度学习方法。首先,使用图形注意力模型来学习实验上已知的形成蛋白质−配体复合体的蛋白质活性部位,了解其氨基酸的结构和特征。接下来,将学习到的活性中心特征与预先训练的生成模型一起用于有条件地生成新分子。然后在强化学习框架中使用生物活性预测模型,来优化条件生成模型(如图2所示)。
图2. 基于蛋白质结构的药物设计流程,来源:参考文献4
最后,用两种蛋白质Janus kinase2(JAK2)和多巴胺受体D2(DRD2) 验证了方法,在这两种蛋白质中,产生了与已知抑制剂类似的分子。图形注意力模型可以识别可能的关键活性部位残基,从而影响条件分子生成器设计具有与已知抑制剂相似的药理特征的新分子。
2
基于配对多目标优化的新药设计
多目标优化解决了药物的自动化从头设计问题,这是人类创造过程的结果。Alberga, Gambacorta[5]等人设计了一种新的配对多目标方法,该方法在基于递归神经网络的自适应生成算法中实现,用于自动从头设计新药物分子,其总体特征通过在相关物理化学性质 (MW、logP、HBA、HBD) 和偏向特定生物靶标的约束之间找到最佳权衡来优化。
他们进行了针对SARS-CoV-2主要蛋白酶、乙酰胆碱酯酶、神经氨酸苷酶的药物分子的从头设计。采用几种质量指标(包括有效性、唯一性、内部多样性、过滤值、综合可达性)来评价药物的相似性、化学可行性、多样性和有效性。最后进行了分子对接,以进一步评估新生成的抑制剂对相应所需生物靶标的有效性情况(如图3所示)。
图3. 多目标优化方法流程图,来源:参考文献5
结果表明,多目标优化能够捕捉连接化学和生物方面的潜在联系,从而为可定制的设计策略提供易于使用的选择,这对线索生成和线索优化都特别有效。
3
深度学习与水药效团模型
相结合的药物设计
在确定了一个靶点后,寻找苗头化合物是基于结构的药物设计的重要第一步,常用的方法有虚拟筛选、组合化学、高通量筛选、DNA编码化合物库筛选等。Minsup, Kichul[6]等人设计了一种靶向特定的药物设计方法,该方法利用了基于深度学习算法和水药效团的seq2seq模型。
首先通过深度学习算法,设计出一系列满足类药五原则等诸多性质的苗头化合物,接着使用分子对接和药效团模型,评估这些苗头化合物的有效性,其中的药效团模型用的是水药效团模型,这个模型通过水分子的分子动力学模拟来构建药效团特征,其中药物靶点的水药效团特征如图4所示。
图4. 六种药物靶点的水药效团特征,来源:参考文献6
注:6 个药物靶点 (AR、GR、PR、PARP、AChE 和 PPAR ) 的水药效团特征。疏水特征,绿色球体;芳香特征,橙环;氢键受体,红色球体;氢键供体,蓝色球体;特征容差,透明球体;排除体积的结合部位,蓝色透明球体。
该方法可以自主产生一系列靶向有利的化合物,从大规模的化合物库中筛选出匹配药效团特征的分子,以这些分子作为输入,训练分子生成模型。最后用药效团筛选生成的分子,得到一批候选化合物。水药效团模型用于在大型化合物数据库中,筛选对给定目标有利的化合物,而seq2seq化合物生成器用于训练筛选出的化合物,并基于训练模型生成全新的化合物。
4
解释药物中的构效关系
DNN指的是由神经网络组成的、复杂的非线性统计模型[10],该网络具有多个用于预测的隐含层(如图5所示)。更快的计算机硬件、改进的算法,以避免神经网络过度匹配,再加上许多计算机平台上软件解决方案的可用性以及改进的训练算法,推动了 DNN在人工智能领域的成功应用,例如计算机视觉、语言处理以及药物设计。
在计算机领域,基于深度神经网络 (DNN) 的模型在预测新分子的活性和性质方面很有前途。不幸的是,它们固有的黑箱特征阻碍了我们对分子结构作用的理解。然而,这些信息对于研究构效关系(SAR) 以指导进一步优化至关重要。
图5. 卷积神经网络 (CNN) 示意图,来源:参考文献10
为了解决这一解释差异,“可解释人工智能”(XAI) 方法最近变得流行起来。Tobias, Hans[7]等人将多种XAI方法应用于SAR和X射线晶体结构的先导优化数据集的项目(如图 6 所示),并进行了比较,结果说明将DNN模型与一些强大的解释方法相结合,可以得到易于理解的、全面的解释。
图6. 解释构效关系的方法流程,来源:参考文献7
这些解释可以使用热图以一种全面的方式收集和呈现,以清楚地突出分子的哪些部分被认为对解释亲和力或任何其他目标性质有利或不利,这将激发计算化学家的创造力,以设计出具有前瞻性思维的药物。
5
未来改进趋势
方向合理的药物设计方法正在不断改进,这些方法正在接近更广泛的药物靶点,未来还可以预计会有各种各样的额外改进:
1. 改进的计算机硬件允许使用更严格的方法应用于大分子系统,如果在未来看到量子力学对接研究的出现也并不令人惊讶,此外还会促进混合方法的发展[2](遗传神经网络、近邻遗传算法等)和药物设计集成工具(设计与评估一体化)的开发。
2. 基于人工智能的蛋白质靶点结构、位点解析将会更加深入地渗透进药物设计中,即蛋白质结构建模的进展,促进了基于结构的药物设计在未结晶的药物靶点上的广泛使用,它们是化学设计的补充,并且在选择用于风险评估的实验系统时很重要。例如:AO底物类药物的设计[3](AO是醛氧化酶,结构作用如图7所示,包括催化氮杂杂环和醛的氧化、酰胺水解和多种还原),AO底物在上市药物中很少见,许多候选药物由于药代动力学活力差、种间差异和不良反应而失败。
图7. 醛氧化酶的结构及其结合位点,来源:参考文献3
由于大多数问题源于复杂且知之甚少的AO生物学结构,因此有效的解决方案是停止或减少AO代谢:早期考虑AO介导的代谢(例如,在苗头化合物和先导化合物优化中),但不是主动避免AO结构,其中许多是有价值的和常见的构建块(例如,各种氮杂杂环和酰胺),及时合理地应用药物设计来控制AO介导的代谢(例如,停止、减少或用于前药设计);
3. 与人工智能相结合的新实验方法将药物设计引向新的方向,有许多类似的例子:如果没有固相合成方法,组合化学[11](实例如图 8 所示)和高通量筛选将不会像今天这样有用;在催化剂设计等领域的改进,在催化剂设计等领域的改进,使我们可以快速访问更多的化学结构,使生物活性测定可以利用更广泛的生物靶标。
图8. 组合化学实例,来源:参考文献11
例如,结合人工智能和统计学方法对CADD的药物评估算法本身进行优化[8],定量方法仅对结构相似分子的抑制剂之间的相对结合亲和力提供准确预测,而定性方法为结构更多样化的一组化合物的相对结合亲和力提供定性趋势。
理想情况下,结合这两个特征将大大提高药物评估算法在药物设计中的效用(如图9所示)。即结合人工智能和统计学方法计算出包含上述许多特性的回归方程,然后将方程嵌入CADD的药物评估算法,将极大有利于药物设计。
图9. 定性、定量方法对CADD的影响
结语
人工智能不会是药物化学家的末日,但它会是不使用人工智能的药物化学家的末日。药物化学家自身设计的药物的复杂度即将达到极限,渐冻症、老年痴呆症以及癌症等复杂疾病始终无法被攻克就是最好的预兆,而将人工智能应用于药物设计将是解决这一问题的钥匙。并且医药领域的人工智能需要从计算化学的兴衰中吸取教训,避免从信任到不信任的灾难性衰退,最后才作为一个可靠而有用的工具从灰烬中重生的经历[9]。
总之,人工智能中的药物设计是一个令人兴奋且不断发展的研究领域,它对生活质量和健康的影响决定了该领域的活力。
参考资料(可向下滑动):
[1] https://blog.benchsci.com/pharma-companies-using-artificial-intelligence-in-drug-discovery
[2] Reddy M R , Parrill A L . Overview of Rational Drug Design[M]. 1999.
[3] Manevski N , King L , Pitt W R , et al. Metabolism by Aldehyde Oxidase: Drug Design and Complementary Approaches to Challenges in Drug Discovery[J]. Journal of Medicinal Chemistry, 2019, 62(24).
[4] Krishnan S R , Bung N , Vangala S R , et al. De Novo Structure-Based Drug Design Using Deep Learning[J]. 2021.
[5] Alberga D , Gambacorta N , Trisciuzzi D , et al. De Novo Drug Design of Targeted Chemical Libraries Based on Artificial Intelligence and Pair-Based Multiobjective Optimization[J]. Journal of Chemical Information and Modeling, 2020.
[6] Kim M , Park K , Kim W , et al. Target-Specific Drug Design Method Combining Deep Learning and Water Pharmacophore[J]. Journal of Chemical Information and Modeling, 2021, 61(1):36-45.
[7] Harren, Tobias et al. “Interpretation of Structure-Activity Relationships in Real-World Drug Design Data Sets Using Explainable Artificial Intelligence.”Journal of chemical information and modeling vol. 62,3 (2022): 447-462.
[8] Miljkovi F , R Rodríguez-Pérez, Bajorath J . Impact of Artificial Intelligence on Compound Dis- covery, Design, and Synthesis[J]. 2021.
[9] Jordan A M . Artificial Intelligence in Drug Design—The Storm Before the Calm[J]. Acs Medicinal Chemistry Letters, 2018.
[10] Yang X , Wang Y , Byrne R , et al. Concepts of Artificial Intelligence for Computer-Assisted Drug Discovery[J]. Chemical Reviews, 2019, 119(18).
[11] Struble T J , Alvarez J C , Brown S P , et al. Current and Future Roles of Artificial Intelligence in Medicinal Chemistry Synthesis[J]. 2020.
四、徐峻人工智能与药物设计学:新范式探索(5)
(原创 徐峻 智药邦)
随着信息技术的不断发展,药物设计方法学的新概念、新方法和新思路持续更新,药物发现范式也与时俱进。人工智能作为新工具,已应用于药物发现过程的多个方面,引起了制药行业的高度关注,也带来了对药物发现科学理论和方法学的新思考和新探索。
中山大学药物分子设计研究中心徐峻教授是人工智能与药物设计领域的知名学者。自上世纪 80 年代末,就长期在科研第一线从事分子信息学算法研究和药物发现实验研究,研究领域横跨化学、药学和信息科学。在本文中,徐峻教授对人工智能与药物设计学的发展进行了系统的回顾、梳理和展望,对药物发现新范式进行了深入的分析、解读和探讨。
本期连载主要讨论药物发现模式的发展演化过程。提出广义药物靶标的新概念。
全文概要、目录及前文见
徐峻|人工智能与药物设计学:新范式探索 (1)
徐峻|人工智能与药物设计学:新范式探索 (2)
徐峻|人工智能与药物设计学:新范式探索 (3)
徐峻|人工智能与药物设计学:新范式探索 (4)
本篇是第四节的内容。
第四节 药物发现新范式探索
一个世纪以来,药物发现一直徘徊在 PDD 和 TDD 两极范式之间,难分伯仲。显然的事实是:发现药物的新分子实体 (new molecular entity, NME) 的经济和时间代价居高不下。如果坚持TDD,成药性靶标数量将成为药物创新的瓶颈。因此,亟需探索药物发现的新范式,新一轮的人工智能辅助药物发现 (AI-aided drug discovery, AI-ADD) 就是这种探索的新尝试。
由于不可靠的药物靶标是导致药物发现项目失败的主要因素,人们逐渐不再认为 TDD 总是可靠无误的[31]。期望现在的人工智能方法 (主要是深度学习技术) 能够充分利用与疾病相关的表型数据以提高药物发现、靶标确证、毒性预测、患者分型的效率,以缩短药物研发的时间、降低成本。然而,在药物发现新范式的概念与理论方面的创新才能从根本上解决问题。
4.1 广义药物靶标
传统的药物靶标主要是那些引起疾病的关键生物大分子 (主要是蛋白质)。其它内源性生物分子如多糖、核酸、脂类等虽然也与人类疾病密切相关,由于种种原因 (如非特异性、毒性) 都未能成为现代创新药物的主要靶点。蛋白质是基因的产物,它可以被药物分子所调控 (激动或抑制) 而改变状态,导致疾病治愈或好转。因此,蛋白质成为药物的最主要的靶点类型。
图1、可能成为药物靶标的几类生物分子(多糖、脂、核酸、蛋白质)
例如,为了寻找抗新冠病毒 COVID-19 的靶标,人们发现该病毒的木瓜样蛋白酶、3CL 蛋白酶、RNA 依赖型 RNA 聚合酶是病毒在人体内繁殖的关键蛋白,它们都有形状特异的活性口袋,可能与配体小分子特异性地稳定结合,因此,可以作为抗新冠病毒的药物靶标。
传统的药物靶标有如下缺陷:
传统药物靶标的缺陷
(1) 配体与靶标的亲合力不能与药效简单划等号。例如,配体与核受体有强结合,不一定能产生强的激动效应;
(2) 很难找到与靶标专一地结合的配体,以激酶抑制剂为例,由于激酶家族有很多成员,ATP 是它们共同的配体,它们的活性位点也有很多的共性,找到高选择性的配体非常困难,副作用难避免;
(3) 靶标活性位点的残基变异难以避免,细菌、病毒和癌细胞为了躲避药物对它们的抑制,进化出同源蛋白的变异体,关键残基的变异弱化或破坏药物分子的结合,产生靶向药物的抗药性;
(4) 引起疾病的细胞信号通路上往往涉及很多蛋白,有的是关键蛋白,有的不是。因此,靶标的确定可能有误,一旦有误就导致药物开发失败。因此,虽然苗头化合物是基于靶标筛选发现的,仍然不能避免昂贵的寻靶 (target deconvolution) 过程。
因此,药物靶标的概念不应该局限于蛋白质,药物的靶标可以是:
广义的药物靶标
(1) 蛋白质或基因 (传统的靶标概念),
(2) 蛋白质-蛋白质之间的相互作用 (如,同源聚合体、蛋白质受体-蛋白质配体、分子伴侣等),
(3) 内源性小分子或多肽 (如,神经递质),
(4) 细胞内外的生物物理或生物化学环境 (如,pH、离子浓度),
(5) 体内代谢反应 (如,CYP 家族的代谢反应)。
因此,药物可以调控某个蛋白质分子的构象、调控蛋白质-蛋白质、蛋白质-核酸之间的相互作用 (如,PROTAC 技术协助两个蛋白质足够靠近而导致目标蛋白质的降解)、升高或降低内源性小分子的浓度、调节体内局部环境的 pH 值或离子浓度、促进或抑制细胞之间的黏附[130]、激活或抑制 CYP 家族的代谢反应而产生期望的药效。
例如,冠状病毒 (如 SARS、MERS,SARS-CoV-2 等) 在病毒-宿主细胞膜融合方面具有共同的机制。干预这种机制,就可能抑制各类冠状病毒对宿主的感染[131]。利用既亲病毒又亲宿主的某类小分子 (如聚胺糖、唾液酸、鞘糖脂、凝集素) 以克服病毒颗粒与宿主细胞的天然斥力,将二者拉在一起接触,使病毒表面的结构蛋白 (如 S-蛋白) 与宿主表面的糖蛋白有机会对接,以实现病毒-宿主细胞的识别与融合。这些小分子是病毒表面的糖蛋白和宿主细胞表面糖蛋白共同的天然配体。
冠状病毒入侵宿主的细胞融合机制分为 5 个主要阶段:
病毒蛋白成熟→非特异性接触→宿主细胞内吞→融合蛋白的构象变化→膜融合(如下图)。
(参照文献J. of Virology, 2018, 92(3), e01933-17重画,周晖皓教授绘制)
因此,可以有 5 类广谱冠状病毒的抑制剂:
(1) 病毒蛋白成熟抑制剂。冠状病毒与宿主细胞膜融合前,需要酸性 pH 值依赖的半胱氨酸组织蛋白酶 B/L 去除病毒表面 S 蛋白高度糖基化的 N-末端,暴露出关键的受体结合结构域 (RBD) [132],针对这些蛋白酶有望设计阻断病毒融合进入宿主细胞的广谱抗病毒药物。例如,MDL-28170 通过抑制半胱氨酸组织蛋白酶 L 阻止病毒蛋白成熟,表现出抑制病毒感染的活性[133];
(2) 非特异性相互作用抑制剂。扎那米韦 (zanamivir) 和奥司他韦 (oseltamivir) 取代唾液酸干扰膜融合。氰基丙烯酰胺 (cyanovirin-N) 和格里菲辛 (griffithsin) 与糖蛋白胞外的糖基修饰部分结合,阻止病毒颗粒的棘刺蛋白与宿主糖蛋白对接。巴维昔单抗 (bavituximab) 识别病毒包膜的脂质体 (如磷脂酰丝氨酸) 而抑制病毒与宿主细胞的结合。此外,两亲性的抗病毒肽 (AVP) 也可以发挥此类作用[134]。
(3) 内吞作用抑制剂。细胞松弛素 B (cytochalasin B) 通过抑制肌动蛋白单体聚合阻止细胞内吞病毒颗粒[135]。氯丙嗪 (chlorpromazine) 和氯喹降低内质体 pH 值抑制内吞作用。氨基脲抑制多种酸依赖性病毒进入宿主细胞。氯化铵和巴佛洛霉素 A1 (bafilomycin A1) 和 NH4Cl 等升高 pH 阻止内吞[136]。
(4) 融合蛋白的构象变化抑制剂。硝唑胺 (nitazoxanide) 抑制蛋白二硫异构酶[19]。阿比多尔(abidol)既阻止病毒内吞与融合[137],还抑制口蹄疫病毒的复制[138]。恩夫韦肽(enfuvirtide,HIV 融合抑制剂) 通过膜扰动诱导病毒融合蛋白过早活化,阻止病毒膜与宿主细胞膜融合[139]。
(5) 膜融合抑制剂。洛伐他汀 (lovastatin) 可以降低宿主细胞膜胆固醇含量,从而阻止 HCV、HBV 和 HIV 病毒与细胞膜的融合[140]。干预病毒-宿主细胞融合机制的策略的本质是调控对病毒-宿主细胞融合机制起关键作用的小分子群及其造成的特有的生物物理和生物化学环境,因此,应该采用基于表型的小分子药物发现技术。
Cell 子刊最近发表综述文章指出:传统的基于靶标的药物发现范式寻求在了解分子靶点和作用机制的基础上建立治疗效果。而基于表型的药物发现范式能明确显示潜在药物分子与核心生物学的直接相关性,这种相关性是改善治疗效果的主要决定因素[141]。
基于广义靶标原理,我们可以提出广谱抗病毒药物的研究策略如下:
广谱抗病毒药物的研究策略
(1) 阻止病毒颗粒接近宿主细胞:如属于亲脂极性化合物的粘多糖与糖蛋白结合,附着在病毒颗粒表面,促进病毒颗粒自聚,
(2) 引起病毒包膜的胶束化:脂质成分对膜的弯曲度和流动性至关重要,因此清除和添加脂质可以抗病毒,如阳离子、两亲性的抗病毒肽(AVPs)、表面活性剂可导致病毒包膜微孔形成、胶束化而崩溃,
(3) 消耗细胞膜和病毒膜表面的胆固醇:消耗胆固醇降低细胞膜的流动性,损害病毒膜和细胞膜融合所必需的负曲率转变,如多不饱化合物和内质网靶向的脂质体 (PERLs) 可以阻止病毒与宿主的膜融合,
(4) 增加病毒融合蛋白介导的膜融合所需的能垒:楔形或倒锥形分子和一些两亲性抗病毒肽 (AVP) 增加病毒膜脂双层的自发正曲率,阻止病毒与宿主的膜融合,
(5) 诱导病毒膜纳米结构的改变:膜靶向 II 型光敏剂在病毒膜平面内产生单线态氧,氧化不饱和磷脂,氧化磷脂的聚集导致脂质堆积差异、流动性降低、正曲率增加、脂质分子面积增加和膜厚度减小,阻止病毒与宿主的膜融合,
(6) 改变细胞膜外部 pH 环境:改变病毒表面电荷分布,迫使病毒颗粒聚集,提升胞外的 pH 值,形成碱性环境,解聚二硫键,将病毒库颗粒胶束化。
4.2 药物合成概念的拓展
如果药物分子设计被视为一种分子机器的设计,则传统的药物合成的概念应该被拓展为药物分子组装。传统的人工智能辅助合成设计寻求最佳可行合成路线[142],而分子组装的目标是为实现所设计的生物功能寻求最佳的分子机器的组装方案,它可以包括化学组装或物理组装。
药物分子可以由几个功能模块 (或片段) 组成,这些片段按照一定的规则组装 (或链接而成),功能模块和它们的组装规律合起来就是化学基元 (chemotypes)。这就是基于片段的药物发现 (fragment-based drug discovery/design, FBDD) 的主要思路[143]。
近年来,快速实现小分子功能片段的高效化学组装的技术有了快速发展,例如点击化学 (click chemistry),自从 Sharpless 首次报告以来,已经在药物化学乃至生命科学领域得到了广泛的应用[144, 145]。
分子组装 (molecular assembly) 引起学术和工业界的广泛重视。据 2022 年 3 月 26 日在 google scholar 数据库检索,"molecular assembly"词条有 4.17 万条。除了人工组装分子的技术之外,分子自组装 (molecular self-assembly) 也引起生命科学、化学、材料科学界的关注。分子自组装它涉及复杂的时空尺度、短期的微观事件和长时程的宏观结构。厘清微观体系的分子自组装机理才能最终理解生命体系的宏观行为。为了克服时空的复杂度,基于 AI 的计算机模拟非常重要。分子自组装涉及有机和无机界,例如晶体生长受杂质颗粒的调控、肽自组装过程环境介质的调控、生物分子形成超分子的机制及表面张力和构型熵的作用[146]。用基于点击化学的化学基元组装方法,人们成功地发现了纳摩尔级活性的骨质疏松抑制剂[147]。细胞是在自然环境下组装形成的,对分子组装机制的深入研究将加深对细胞自组装的理解[148],为模拟细胞的功能提供更多的启发[149]。最近,人们用分子组装技术合成了抗体笼 (antibody cage),它由一种死亡受体靶向抗体诱导的肿瘤细胞系凋亡形成,该肿瘤细胞系不受可溶性抗体或天然配体的影响。抗体笼对病毒中和作用得到增强[150]。
4.3 药物治疗概念的拓展
细胞本身也可以作为药物治疗的靶标。干细胞可以分化成多种不同的细胞类型,全能细胞 (totipotent cells) 可以分化成所有的细胞,包括滋养层细胞 (构成胎盘的胚泡外部细胞)、多能干细胞 (pluripotent stem cells) 可以从发育中胚胎的三个胚层分化成其它细胞类型。多能细胞 (multipotent cells) 可以分化成多种细胞类型,但组织的范围有限。寡效细胞 (oligopotent cells) 可以分化成几种不同的细胞类型,而单能细胞 (unipotent cells) 只能分化成一种细胞类型。重编程产生的诱导多能干细胞 (induced pluripotent stem cells, iPSC) 的起始细胞类型一般是体细胞,尽管也可用能力较弱的单能干细胞[151]。
2006 年,山中伸弥 (Shinya Yamanaka) 首次通过强制表达对胚胎干细胞功能非常重要的转录因子 (Oct-3/4、Sox2、c-Myc,Klf4),将小鼠成纤维细胞诱导成多能干细胞[152], 即 iPSC,并显示出与胚胎干细胞许多相似的功能 (如基因表达模式、染色质甲基化、细胞分裂率、形成类胚体 (胚胎发育的多细胞结构)、畸胎瘤 (胚胎发育中发现的由内胚层、外胚层和中胚层组成的肿瘤)、嵌合体 (chimera,含几种细胞类型的组织)。因此, iPSC 和胚胎干细胞(embryonic stem cell,ESC) 有相似的功能,可以分化为各种类型的细胞。干细胞除了能分裂成更多的干细胞之外,还能分化成其它细胞类型 (如心肌、肌肉、骨、神经细胞等)。
因此,退行性疾病 (如癌症、糖尿病和心脏病) 可能通过移植干细胞或实验室产生的分化干细胞来治疗。
细胞治疗要取得成功,就需要可靠的高质量干细胞来源。理论上,理想的来源是ECS。这些细胞是在植入子宫壁之前从胚泡的内部细胞团 (胚胎母细胞) 获得的多能干细胞。然而,将胚胎干细胞用于干细胞治疗有伦理问题。iPSC 成为潜在的替代方案,但重编程过程潜在致瘤性使 iPSC 尚未被接受为理想的干细胞来源。新的趋势是用小分子直接将容易获得的细胞类型重编程为临床有用的细胞 (如神经元和心脏细胞)[151]。
上世纪 90 年代末提出的化学生物学就是以小分子为工具,探索细胞的功能。与通过操纵基因来研究生物学的方法相比,小分子探针有如下优势:
小分子探针的优势
(1) 小分子可以通过调节特定的蛋白质功能或针对不同的蛋白质家族来调节细胞内的多种特定效应;
(2) 小分子可用于探测基因功能 (化学遗传学);
(3) 小分子的作用通常是可逆的,可控的 (如用不同小分子浓度) 。小分子能够调控蛋白质功能的作用时间、调节复杂的信号网络、控制分子间的相互作用;
(4) 小分子相对便宜、性质相对稳定,可能在细胞膜上自由扩散。
开发以细胞重编程为靶标的小分子药物的关键是弄清细胞重编程的机制。目前,我们对小分子诱导细胞重编程的知识总结如下[151]:
(1) 调控转化生长因子-β (TGFβ) 信号通路超家族:重编程成纤维细胞时,细胞的形态学发生了变化[153],细胞受体 E-钙粘蛋白的表达上调,转录因子 snail 的表达下调,这些变化与胚胎发育的关键−−间质-上皮转化 (mesenchymal–epithelial transition, MET) 过程的方向相反[154]。因此,EMT 的小分子抑制剂可以诱导细胞重编程,产生 iPSC。天然产物小分子芹菜素 (apigenin) 和木犀草素 (luteolin) 上调 E-钙粘素的表达,促进细胞重编程。TGF 受体小分子抑制剂促进细胞重编程,与 DNA 甲基化调节剂合用更好。多能性基因 Nanog 的诱导剂 (如 RepSox) 可以替代重编程因子 Sox2 以产生 iPSC,因为 TGFβ受体被抑制的结果是诱导了 Nanog 上调;
(2) 调控丝裂原活化蛋白激酶/细胞外信号调节激酶 (MAPK/ERK) 信号通路:小分子逆转素 (reversine) 通过靶向丝裂原激活的细胞外信号调节激酶-1 来增加人类骨骼肌前体细胞的细胞潜能。因此,人们认为调节 MAPK/ERK 可以诱导重编程。例如,
MAPK/ERK 通路的小分子抑制剂 PD0325901 与 TGFβ 受体小分子抑制剂 SB431542 联合,显著促进人成纤维细胞重编程。PD0325901 还与 Wnt 信号通路的小分子调节剂 CHIR99021 联用诱导细胞重编程。CHIR99021 导致 DNA 低甲基化维持培养中小鼠 ECS 的多能性;
(3) 调控蛋白质激酶 A 家族 (PKA) 的信号通路:PKA 调节胚胎干细胞的多能性,本身受第二信使分子环腺苷酸 (cAMP) 的浓度的调节。因此,cAMP 的小分子类似物 (8-Br-cAMP 将人类新生儿成纤维细胞重编程效率提高两倍。8-Br-cAMP 和丙戊酸 (VPA,HDAC 抑制剂) 协同将重编程效率提高 6.5 倍;
(4) 调控磷脂酰肌醇 3-激酶/Akt (PI3K/Akt) 信号通路:PI3K 通路调节细胞细胞死亡、免疫、分化、和代谢。PI3K 的小分子激活剂 PS48 与 Oct4 联用实现人类成年角质形成细胞的重编程[155]。PS48 上调了糖酵解相关基因的表达 (胚胎干细胞使用糖酵解而不是线粒体氧化磷酸化来代谢葡萄糖);
(5) 调控经典 Wnt 信号通路:胚胎发育和胚胎干细胞多能性维持的关键信号通路是 Wnt。Wnt 信号通路有三种:
经典 Wnt 通路、非经典 Wnt/钙通路、和非经典平面细胞极性通路。
经典的 Wnt 信号通路主要维持 ESC 多能性的核心转录通路。其中转录因子 3 (TCF3) 抑制关键多能性基因的表达,Wnt 信号的激活稳定化 β-连环蛋白 (β-catenin)。Wnt 信号通路靶向分子 CHIR99021 通过抑制糖原合成酶激酶 3β(GSK-3β) 促进细胞重编程。
CHIR99021 与 Oct4 和 Klf4 联用即可诱导小鼠胚胎成纤维细胞重编程为 iPSC。CHIR99021 与川基环丙胺 (DNA 甲基化调节因子) 联用诱导人类角质形成细胞重编程,增强胚胎干细胞多能性相关基因的表达。Wnt 信号通路的另一个调控剂 B6 的作用机制与 CHIR99021 (GSK-3 抑制剂) 不同。B6 是 Aurora A 激酶抑制剂,Aurora A 是细胞增殖的重要调节因子,并间接调控 Wnt 通路信号。天然产物小分子橙皮苷 (橙皮苷也是有近1500年历史的广东化州药食同源中药材化橘红的主要活性成分,《中国药典》规定化橘红的橙皮苷含量应大于3.5%) 也是 Aurora A 抑制剂,也能提高细胞重编程的效力。
(6) 调控 Src 激酶家族:Src 是非受体酪氨酸激酶,调节细胞质、细胞核和膜蛋白,对 ESC 分化起重要调节作用。Src 小分子调控剂 (如达沙替尼、PP1 和 iPY) 在细胞重编程中替代 Sox2。这些化合物在促进细胞重编程方面与 TGF通路抑制剂一样有效;
(7) 调控 Rho 相关蛋白激酶 (ROCK) 信号通路:ROCK 调节细胞骨架的各个方面,如细胞形态和迁移。Y27632 是干细胞研究中最常用的 ROCK 抑制剂,可以阻止细胞凋亡,已被用于建立悬浮培养和人类 iPSC 的长期扩增。ROCK 抑制剂 Y27632 已被用于人类 iPSC 的单细胞传代;
(8) 调控核受体信号通路:核受体是转录因子,最早用于细胞重编程。Nr5a2 是孤儿核受体,通过靶向多能性基因 Nanog,在重编程小鼠体细胞中取代因子 Oct4。强制表达核受体维甲酸受体α,β,γ (RAR α/β/γ) 和 Nr5a2,可以提高小鼠胚胎成纤维细胞中 iPSC 重编程的速度和效率。RAR 的小分子激动剂 (如维甲酸类似物) 也可以提高细胞重编程的效率;
(9) L 型钙通道抑制:钙离子是细胞内信使,其浓度的瞬时调控干细胞多个分化阶段的细胞信号通路。钙通道调节剂 Bay K8644 (BayK) 可以替代细胞重编程转录因子四元组中的 Sox2 和 c-Myc;
(10) 表观遗传调控:DNA 甲基化和组蛋白修饰是表观遗传的两大机制,在胚胎发生和细胞分化过程中影响基因表达。因此,可以设想小分子调节表观遗传过程可以诱导细胞潜能和诱导重编程;
DNA 甲基化转移酶 (DNMT) 抑制剂:DNMT 的小分子抑制剂可以诱导重编程。如 DNMT 抑制剂 RG108、组蛋白甲基化抑制剂 (BIX 01294) 联用可以促进重编程 DNMT 抑制剂 5’-氮杂-2’-胞苷 (地西他滨) 促进骨髓基质细胞转化为心肌细胞, 提高重编程效率。地西他滨治疗可以在不需要 c-Myc 的情况下进行重编程,不完全的表观遗传修饰会导致大量的“部分重编程”细胞, 地西他滨可以消除这种“表观遗传记忆”,并减少 DNA 甲基化多能性基因;
组蛋白甲基化转移酶 (HMT) 抑制剂:组蛋白染色质的结构蛋白,也是基因表达的表观遗传调节因子,对它们的修饰 (如甲基化) 决定了转录因子进入基因的位点。抑制组蛋白甲基化可提高体细胞核移植的效率;
组蛋白去乙酰化酶 (HDAC) 抑制剂:HDAC 抑制剂可提高体细胞核移植的重编程效率。常用的有 Suberoylanide、Trichostatin A 和丙戊酸。丙戊酸通过增加多能性相关基因的表达,允许在没有c-Myc 因子的情况下重编程细胞。丙戊酸仅与重编程因子 Oct4 和 Sox2 联用就能重编程小鼠胚胎成纤维细胞。丁酸钠与 TGFβ 抑制剂 (A-83-01)、MAPK/ERK 抑制剂 (PD0325901) 和 PI3K 抑制剂 (PS48) 加上 Oct4 就能重编程人体细胞;
(11) 小分子诱导代谢重编程促进 iPSC 重编程:体细胞通常依赖线粒体中的氧化磷酸化从葡萄糖获得能量生产 ATP。但 ESC 用厌氧糖酵解来代谢葡萄糖以代谢生物大分子,活性氧相对水平较低。细胞重编程的关键步骤是让细胞从氧化磷酸化代谢模式转变到糖酵解代谢模式。这种转变受缺氧诱导因子 1α(HIF-1α,一种对细胞氧水平敏感的转录因子) 的调控。天然产物槲皮素 (quercetin) 可增加 HIF-1α表达,促进人脐静脉内皮细胞重编程。槲皮素也可阻止移植的 iPSC 的肿瘤发生。其他促进糖酵解的小分子也促进细胞重编程;
(12) 细胞衰老抑制剂促进细胞重编程:细胞衰老的特点是细胞周期和细胞增殖的丧失、DNA 损伤 (如双链 DNA 断裂)、细胞周期抑制剂 (如 p53, p21 (细胞周期蛋白依赖性激酶抑制剂 1A/Cip1), p16 (细胞周期蛋白依赖性激酶抑制剂 2A)) 表达增加。阻断这些基因的表达可提高重编程的速度和效率。抗氧剂维生素 C 降低 p53 和 p21CIP1 的表达阻止细胞衰老,从而促进小鼠和人胚胎成纤维细胞重编程。一般认为,阻止细胞衰老的其它小分子也可能是细胞重编程促进剂。
(13) 体细胞的直接重编程 (转分化, transdifferentiation):常规的细胞重编程要经过产生干细胞样中间细胞才能产生功能性细胞,效率低而且有肿瘤发生的风险。上世纪 70 年代末,首次发现了直接重编程 (在不产生干细胞样中间细胞的情况下使一种细胞转化为另一种类型细胞的技术,称为“转分化”) 的例子:成纤维细胞中骨骼肌特异性转录因子 MyoD 的强制表达诱导其转化为成肌细胞 (骨骼肌前体细胞)[156]。后来发现,小分子可以诱导直接重编程。例如,地西他滨可将小鼠成纤维细胞转化为脂肪细胞和骨细胞;逆转素 (reversine) 诱导人成纤维细胞转化为肌肉细胞,肌隔嘌呤 (myoseverin)、逆转素和 BIO (糖原合成酶-3 激酶抑制剂) 的混合物将骨骼肌转化为多种细胞类型[157]。直接重编程不涉及去分化步骤。不完全重编程的细胞可以被诱导形成其它各种类型的细胞。
以细胞为靶标的小分子药物虽然尚未临床应用,它们已经受到广泛关注。与转录因子诱导细胞重编程相比,提高了细胞重新编程效率和质量,消除了对致癌重编程因子和 iPSC 克隆过程可能仍然存在的表观遗传“记忆”。小分子与重编程转录因子联用至少可以提高重编程能量,例如,槲皮素使用四种重编程因子将人类脐静脉上皮细胞的重编程效率提高约 2 倍、丙戊酸将小鼠胚胎成纤维细胞的重编程效率提高约 50 倍。
虽然未经临床验证,人们认为单独使用小分子产生的 iPSC 可能避免重要风险 (如细胞移植后引起的致瘤或免疫反应)[158]。简化细胞重编程小分子的种类是未来发展的方向。
直接细胞重编程是一个趋势,但从细胞治疗的角度,干细胞可能比直接重编程为分化细胞更好。干细胞移植到病灶后存活能力更强,它们有更强的生存能力。相信不久的将来,以修复或替换病变组织为目的体内生成 iPSC 或直接重编程小分子药物进入临床试验,它们可以是细胞重编程增强剂、或直接细胞转化的诱导剂,这将是令人振奋的颠覆性技术。
end
本公众号声明:
1、如您转载本公众号原创内容必须注明出处。
2、本公众号转载的内容是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请作者或发布单位与我们联系,我们将及时进行修改或删除处理。
3、本公众号文中部分图片来源于网络,版权归原作者所有,如果侵犯到您的权益,请联系我们删除。
4、本公众号发布的所有内容,并不意味着本公众号赞同其观点或证实其描述。其原创性以及文中陈述文字和内容未经本公众号证实,对本文全部或者部分内容的真实性、完整性、及时性我们不作任何保证或承诺,请浏览者仅作参考,并请自行核实。