AI制药：从靶点发现到临床爆发的投资元年每10个进入临床试验的候选药物中，只有1个最终获批上市。从靶点发现到最终商业化，一款新药的平均研发周期超过10年，成本超过26亿美元。这是制药行业著名的"反摩尔定律"——新药研发的生产率在持续下降，而非提升。当全球药企面对这一困境时，AI正在从根本上改变游戏规则。2026年，多款由AI设计的药物进入临床关键阶段，AI制药的商业化兑现周期正在大幅缩短。这是一个正在被重新定价的万亿级赛道。理解这场革命的深度与节奏，是把握下一个十年最具确定性产业趋势的关键。一，反摩尔定律：传统制药困局与AI破局理解AI制药的颠覆性价值，需要先理解传统药物研发的困境。全球制药行业的研发效率在过去30年间持续下滑。以美国FDA批准的新药数量为例，2010-2020年间，FDA年均批准新药约40个，峰值年份约60个，与数十亿美元计的研发投入相比，成功率并不乐观。造成这一困境的核心原因是多维度的：靶点发现越来越困难——已验证的有效靶点数量有限，且新靶点的生物学机制复杂，需要数年才能验证一个假说；化合物筛选的化学空间极为庞大（10^60量级），穷举式筛选不可行；临床试验周期长、费用高，且失败率居高不下；数据孤岛问题严重，不同实验室的数据难以共享和复用，形成了大量"数据孤岛"。 AI的核心价值在于：从海量生物学和化学数据中，发现人类难以识别的规律，预测候选分子的成药性和安全性，从而大幅缩短研发周期、降低失败率。麦肯锡全球研究院估算，AI每年可为制药行业节省超过700亿美元的研发成本。更重要的是，AI可以将10年以上的研发周期压缩到3-5年，这一效率提升意味着更多新药更快到达患者手中——这不仅是商业价值的释放，更关乎无数患者的生命。 2026年，AI制药迎来历史性拐点：Insilico Medicine的ISM001-055成为全球首个完成II期临床患者给药的AI设计药物，适应症为特发性肺纤维化（IPF）。这款药物从靶点发现到进入临床仅用了18个月，研发成本不足传统路径的十分之一。ISM001-055若最终获批，将是AI制药行业的历史性里程碑，意味着"AI-first drug"正式从概念走向商业化。二，技术路线：AI如何重塑药物研发全流程 AI对药物研发的全流程改造，正在各个关键环节取得突破，形成了一条完整的技术赋能链条。靶点发现阶段：AlphaFold系列工具（AlphaFold2、AlphaFold3）的出现，解决了困扰生物学界50年的"蛋白质折叠问题"。通过精确预测蛋白质三维结构，AI使靶点验证和药物-靶点相互作用研究的效率提升了数十倍。传统方法下，确定一个蛋白质结构可能需要数年和数百万美元的实验费用；AlphaFold在数小时内即可完成，且准确率与实验结果相当。2026年，DeepMind发布的AlphaFold3进一步将预测范围扩展到DNA、RNA以及小分子药物与靶点的相互作用预测，形成了完整的结构生物学AI工具链。这意味着，即便在没有实验数据的情况下，研究人员也可以通过AI预测来理解疾病机制、设计干预方案。分子设计阶段：生成式AI正在从"筛选已有化合物"升级为"从头设计新分子"。Recursion Pharma的Phenotypic generative models、晶泰科技的AI分子生成平台，可以从虚拟空间中快速生成和评估数十亿个候选结构。与传统的高通量筛选相比，AI引导的分子设计将"大海捞针"变成了"定向生成"，效率提升数百倍。Exscientia的DSP-0038是全球首个进入临床的AI设计多靶点小分子药物，用于治疗阿尔茨海默病，展现了AI在复杂神经系统疾病药物设计中的潜力。临床优化阶段：AI通过对大量历史临床试验数据的分析，可以预测候选药物在人体中的药代动力学和毒理学特征，优化给药剂量和方案，显著降低临床失败风险。Relay Therapeutics利用其Dynamo平台，对FXR激动剂进行了超过3000个分子变体的虚拟优化，将候选分子优化周期从传统的18个月压缩到6个月，且临床前到临床I期的推进时间缩短了40%。三，商业化进程：哪些药物即将兑现 2026-2028年，是AI制药行业数据兑现的密集期。多款AI设计的药物将披露关键临床数据，部分适应症有望获得FDA或NMPA批准。这段时间也被业界称为AI制药的"临床验证期"。 Insilico Medicine的ISM001-055（特发性肺纤维化）正在开展II期临床试验，若数据积极，有望在2027年启动III期关键注册研究。这将是全球AI-first药物的首次III期试验，具有里程碑意义。Insilico同时还有多条新药管线在推进，涵盖癌症、免疫性疾病等领域。值得注意的是，Insilico的AI平台Pharma.AI在2025年实现了一个重大突破：仅用12个月就完成了从靶点发现到PCC（临床前候选化合物）确认的全流程。 Exscientia的EXS-215467（A2A受体拮抗剂，用于免疫肿瘤治疗）正在进行I/II期临床，AI设计的高选择性A2A拮抗剂在多个临床前模型中展现出优于现有竞品的疗效信号。更重要的是，Exscientia的AI设计平台能够在3个月内完成候选分子的优化迭代，远快于行业平均的12-18个月。国内方面，英矽智能的ISM3091（USP1小分子抑制剂，针对BRCA1/2突变肿瘤）已获FDA临床试验批准，成为国内AI制药出海的代表性项目。ISM3091从靶点发现到PCC确认仅用了不到18个月，再次验证了AI在药物发现效率上的颠覆性优势。晶泰科技的AI药物发现平台已与超过50家药企建立合作，自主研发的多条新药管线进入临床前研究阶段。四，投资机会：三层结构的布局逻辑 AI制药产业链可分为上游工具层、中游平台层、下游应用层，三层结构的投资逻辑各有侧重，适合不同风险偏好的投资者。上游：AI药物研发工具与数据基础设施。药明康德、康龙化成、凯莱英等CXO企业正在积极布局AI能力，将AI工具整合到其一体化药物研发服务平台中。这类企业的优势在于：客户资源庞大、产能充足、数据积累深厚，AI转型具有较高的确定性。药明康德已在其WuXi AppTec的DEL（DNA编码化合物库）平台中引入AI进行虚拟筛选，将DEL库的筛选效率提升了一个数量级。康龙化成通过投资和自研，正在构建覆盖小分子和大分子的AI药物发现能力。中游：AI药物研发平台型企业。晶泰科技、英矽智能、腾迈医药等是这一环节的代表。这类企业的核心壁垒在于：AI算法能力、专有数据积累、药物化学know-how的融合。商业模式包括软件即服务（SaaS）费、药物研发里程碑付款、以及潜在的药物销售分成。投资风险在于：多数企业尚未盈利，估值较高；药物研发高度不确定性。下游：已采纳AI技术、研发管线丰富的传统药企。恒瑞医药、百济神州、石药集团等头部药企正在加大AI药物研发的投入。恒瑞医药已建立内部AI药物发现团队，并与多家AI制药公司建立合作。若这些企业的AI药物管线取得突破，股价弹性巨大。五，行业格局：中美欧三足鼎立，中国优势在工程化全球AI制药呈现三足鼎立格局：美国企业主导算法创新，欧洲企业在特定领域（肿瘤、免疫）有深厚积累，中国企业的优势在于工程化落地和规模化验证。美国方面：Recursion Pharma、Relay Therapeutics、Exscientia等企业均在纳斯达克上市，获得了二级市场的估值重估。Recursion Pharma拥有全球最大的细胞图像数据集（超过8PB），用于训练AI疾病模型。Relay Therapeutics于2023年在纳斯达克上市，其精准肿瘤学平台在2026年已有多条管线进入临床。NVIDIA也通过其BioNeMo平台深度参与AI制药基础设施赛道，为全球药企和AI制药公司提供GPU加速的药物发现工具。中国市场方面，国内AI制药企业正在快速追赶。晶泰科技已完成多轮融资，估值超过10亿美元，跻身全球AI制药独角兽行列。英矽智能在港交所上市后，持续推进其AI药物管线的临床进展。政策层面，国家药品监督管理局已出台AI辅助药物研发技术指导原则，为AI制药的监管框架奠定基础，行业发展环境日趋成熟。六，风险提示 AI制药投资的核心风险不容忽视。第一，监管风险：AI设计的药物在全球监管框架中仍属新事物，FDA和NMPA对AI辅助药物研发的审评标准尚在完善中，审批路径存在不确定性。第二，数据质量风险：AI模型的准确性高度依赖训练数据的质量，而药物研发数据往往分散、标准化程度低，数据质量问题可能导致AI预测偏差。第三，AI成药性预测的局限性：即便AI预测分子具有高成药性，实际的临床效果仍可能与预测不符——生物系统的复杂性超出了当前AI的预测能力边界，这是技术层面的根本约束。第四，高估值风险：部分AI制药上市公司在热情推动下估值过高，一旦关键临床数据不及预期，股价回调可能剧烈。结语 AI制药正在从概念走向临床验证。2026年，多款AI设计药物的关键临床数据将密集披露，这是行业从"讲故事"到"看数据"的关键一年。投资者应密切关注II/III期临床数据的读出情况，特别是Insilico的ISM001-055和Exscientia的管线路据。这场制药行业的AI革命，正在以超预期的速度从实验室走向临床。

2026-04-09

·医药企业项目管理大会

一文浅析计算机辅助药物设计CADD的起源、发展现状、与未来趋势

会议推荐 2026第三届中国医药企业项目管理大会 2026第二届中国AI项目管理大会 2026第十五届中国PMO大会 2026第五届中国项目经理大会本文目录 1、【热点研究】计算机辅助药物设计的数字前沿探索:现状、挑战与末来展望 2、跟我学药物设计 | 计算机辅助药物设计的起源及发展 3、计算机辅助药物设计的智能化与自动化发展 4、勃林格殷格翰的计算机辅助药物设计一、【热点研究】计算机辅助药物设计的数字前沿探索:现状、挑战与末来展望（天津市医药科学研究所）计算机辅助药物设计(CADD)自20世纪60年代起步以来，已经发展成为现代药物研发不可或缺的工具。随着计算机科学和生物化学的快速发展，计算机辅助药物设计已经彻底改变了新药研发的传统模式。尽管CADD的概念早在1960年代就已出现，但直到1980年代初才正式确立。在过去的几十年中，CADD已经发展成为一个能够显著提升药物设计效率、降低研发成本和缩短开发周期的关键技术平台。现代药物发现是一个复杂的跨学科过程，涉及计算化学、结构生物学、化学生物学、药理学和有机合成等多个领域。这个过程包含多个关键阶段：从靶点识别开始，经过靶点验证、先导化合物识别和优化，最终进入临床前和临床试验阶段。在这个漫长的过程中，CADD在每个环节都发挥着重要作用。基于结构的药物设计基于结构的药物设计（SBDD）是现代药物研发中的一个重要方法，主要通过研究目标分子（如蛋白质、受体或酶）的三维生物结构来设计和优化新药。通过深入理解目标分子的形状、电荷分布和结合位点，研究人员能够设计出与目标分子精确互作用的药物候选物。最近《自然通讯》(Nature Communications)上发表的一项突破性研究提出了"序列到药物"的创新概念，这种方法不再依赖传统的三维蛋白质结构，而是直接利用蛋白质序列信息进行药物设计。研究团队开发的Transformer CPI2.0作为核心工具，展示了出色的通用性，能够处理各种蛋白质和化合物的相互作用。SBDD最成功的应用之一是在抗HIV药物的开发中，通过分析病毒蛋白（如反转录酶和蛋白酶）的三维结构，科学家们成功开发出了利托那韦、沙奎那韦和洛匹那韦等药物，这些药物通过与病毒酶的特定位点结合，有效抑制了病毒的复制。另一个重要进展是基于片段的药物设计方法，这种方法从能与靶蛋白结合的小分子片段开始，通过逐步优化和扩展，最终开发出具有更好结合亲和力的更大分子化合物，已产生了30多个临床药物候选物，其中3个已获得FDA批准用于肿瘤治疗。这些进展表明，SBDD正在经历从传统方法到创新技术的转变，为药物研发提供了更多可能性和机会，推动着医药领域的持续发展。基于配体的药物设计基于配体的药物设计（LBDD）是一种重要的药物发现方法，它通过研究小分子（配体）与生物靶标的相互作用来指导药物开发。与基于结构的药物设计不同，LBDD主要利用配体的特性和相互作用，通过药效团建模来识别必要的特征，如氢键供体、受体或疏水区域。这种方法可以生成预测模型，用于优化先导化合物。近期的一个重要进展是CSP-SAR方法，它采用新型三维定量构效关系方法，通过构象采样药效团来生成预测模型。LBDD在多个治疗领域都取得了显著成功，其中最具代表性的是用于治疗类风湿性关节炎和骨关节炎的氟比洛芬，以及针对耐甲氧西林金黄色葡萄球菌（MRSA）感染的新型抗生素噁二唑类化合物。这些成功案例突显了LBDD在开发具有治疗价值的化合物方面的重要作用，展示了其在满足未满足医疗需求方面的巨大潜力。人工智能的融入与创新人工智能技术的引入为CADD带来了革命性的变化。深度学习架构如DeepCPI、DeepDTA等的应用，使得药物靶点识别和相互作用预测的准确性得到显著提升。机器学习算法如随机森林、支持向量机和梯度提升树的运用，则为特征选择和预测模型的构建提供了强有力的工具支持。面临的挑战尽管CADD取得了显著进展，但仍面临着多重挑战。首先是技术层面的挑战，包括生物系统的复杂性、计算资源的限制以及准确建模的难度等。其次是资源管理方面的问题，如何高效管理和利用大型化合物库、如何优化数据处理流程等。此外，在伦理层面，确保治疗效益大于风险、保护患者隐私等问题也需要认真考虑。未来发展趋势 CADD的未来发展主要集中在四个方向：首先是技术升级，特别是量子计算的引入有望带来突破性进展；其次是环境友好性的提升，包括发展生态友好的设计方法和提高能源效率；第三是人工智能的深度整合，进一步提升预测模型的准确性；最后是多靶点药物设计的发展，以应对复杂疾病的治疗需求。结论计算机辅助药物设计已经成为现代药物研发的核心驱动力，通过整合先进计算方法、人工智能技术和生物学知识，显著提高了药物设计的效率和准确性。尽管仍面临诸多挑战，但随着新技术的不断涌现，CADD的发展前景十分广阔。特别是在人工智能和量子计算等新兴技术的推动下，CADD必将在解决复杂疾病和开发创新治疗方案方面发挥更加重要的作用。参考文献： [1] Kumari N, Hasija Y. CADD:-Exploring the Digital Frontier in Drug Designing[C]//2024 3rd International Conference on Computational Modelling, Simulation and Optimization (ICCMSO). IEEE, 2024: 272-277. 二、跟我学药物设计 | 计算机辅助药物设计的起源及发展（原创氢键殷赋科技）殷赋科技团队从上一期开始推出了基础学习、经典阅读、计算方案、案例讨论、科研时事等主题专栏文章。让我们共同夯实基础，开拓思路，在殷赋云计算平台上做出更好的科研成果。本期是【跟我学药物设计】专栏第二篇文章，我们将对药物研究模式的转变、药物设计思想的起源、计算机辅助药物设计概述和计算机辅助药物设计的发展过程等方面展开介绍。 01 药物研究模式的转变回顾药物研究的历史，20世纪60年代，药物发现的最主要途径是药物筛选。研究人员通过在动物疾病模型上做实验，筛选出先导化合物，进行作用靶点研究、构效关系分析、结构优化与修饰，进而发现新的化学实体，并开发出新药。20世纪90年代中期至今，随着计算机技术及分子生物学、药物化学和计算化学等学科的发展，药物发现进入了理性设计阶段。药物化学家依据结构生物学、酶学、分子生物学及遗传学等生命科学的研究成果 , 针对这些基础研究中所揭示的与疾病过程相关的潜在药物作用靶标（酶、受体、离子通道及核酸等），参考药物作用靶点、内源性配体以及天然底物的化学结构特征 ,借助计算机和一些新理论、新方法进行药物分子设计 , 以发现选择性作用于靶点的新药。这些药物往往具有活性强、作用专一、副作用低的特点【1】。合理药物设计（Rational Drug Design）是目前新药研究的主要方向。 02 药物设计思想的起源药物设计的思想起源于19世纪末，在过去的一百多年，经历了四个里程碑式的发展阶段，现介绍如下： 1）德国化学家Emil Fischer。他在1894年提出锁钥模型（Lock-and-Key Model），即酶（锁）对底物（钥匙）的专一性源自其几何形状的互补性。这种“锁钥”模型是现代“分子对接”和“基于结构药物设计”思想的起源。图1. 锁钥模型示意图 2）德国细菌学家和免疫学家Paul Ehrlich。他在1908年研究细胞染色时，提出了受体（Receptor）的概念。Paul认为“魔弹”能专一性作用于引起疾病的细菌，并摧毁之，但对患者其它器官无害。这个思想是“化学疗法”的起源，现代“靶向药物”的概念也是由此发展而来的。 3）美国化学家Corwin Hansch。1964年，他在A. C. Brown和 T. R. Fraser 提出的“物质的生理作用是其化学组成和成分的函数”的设想之上提出了基于配体的药物设计思想——定量构效关系（Quantitative Structure-Activity Relationship，QSAR），并进一步阐述了这一方法，使得“基于配体的药物设计”成为现实。 4）美国药物化学家Irwin Kuntz。他针对小分子与大分子发生相互作用的方式率先提出了分子对接（Molecular Docking）的概念，并在1982年开发了第一个分子对接软件DOCK, 使得“基于结构的药物设计”成为现实。图2. UCSF DOCK 分子对接软件 03 计算机辅助药物设计概述计算机辅助药物设计（Computer-Aided Drug Design，CADD）是近年来发展起来的研究与开发新药的一种崭新技术，它大大加快了新药设计的速度，节省了创制新药工作的人力和物力，使药物学家能够以理论为指导，有目的地开发新药。CADD是一个相当大的论题，涉及到结构化学、药物化学、分子药理学、生物化学、结构生物学、分子生物学、化学生物学、细胞生物学、生理学、病理学、生物物理学、组合化学、量子化学、分子力学、分子动力学、分子图形学、计算化学、化学信息学、生物信息学、X射线晶体学、核磁共振技术、计算机图形技术、数据库技术和人工智能技术等基础学科和应用学科与技术。融合这些学科知识与技术，CADD在药物作用和药理活性预测、药效基团研究、药物构效分析、全新药物设计、高通量虚拟筛选及合成数据库设计等方面展示了强大的威力，大大地提高了药物设计水平，并趋向于定向化和合理化，开辟了广阔的前景【2】。目前，CADD技术几乎覆盖了从靶标识别与确证、先导化合物发现与优化到临床前药物研究与开发的全过程。图3. CADD 的部分应用场景 04 计算机辅助药物设计的发展过程计算机辅助药物设计的发展阶段起始于20世纪60年代Hansch提出的定量构效分析方法（QSAR）。早期，药物化学家对疾病靶标结构的知识了解有限，因此发现先导化合物的过程通常是依赖偶然发现和随机筛选。药物设计的思想在这个阶段主要用于对先导化合物进行定向结构修饰，然后进行QSAR分析，以便发现活性更好的衍生物。在这个阶段，药物化学家的经验对结构优化非常重要，因此被称为经验药物设计阶段。 20世纪90年代初期，随着计算机技术的发展和分子图形学的出现，加上结构生物学的兴起，药物设计虽然还是广泛应用于对先导化合物的优化阶段，但是已经发展到基于生物大分子三维结构的药物设计方式。药物化学家采用“锁钥模型”，把药物的化学和生物学特性有机结合起来，合理设计药物，因此这个阶段被称为合理药物设计阶段【3】。 20世纪90年代中期，组合化学和高通量筛选的发展使得药物设计从先导化合物的优化阶段进入到先导化合物的发现阶段。与此同时，计算机虚拟组合化学库设计以及基于分子对接（Molecular Docking）和药效团（Pharmacophore）的数据库虚拟筛选（Virtual Screening）技术使得大量数据可以在计算机上进行预筛选，减少了实验合成和筛选的化合物数量，显著提高了药物研发的成功率。在这个阶段，“类药性”（Drug-Likeness）概念、“五倍率”（Rule-of-Five）经验规则、ADMET（药物的吸收、分布、代谢、排出和毒性）性质也逐渐被发展出来并被广泛应用到药物分子设计的过程当中【4】。 20世纪90年代中期开始至21世纪初，基因组学、蛋白质组学、生物信息学的发展为药物化学家提供了大量潜在的疾病靶标，药物设计进入到生物学驱动的后基因组时代。药物化学家需要充分研究靶标的生物学功能，并寻找与之匹配的小分子化合物，以便迅速有效地发现新型靶标和新型先导化合物。2010年以来，系统生物学的快速发展，启发了网络药理学、系统药理学等新概念的诞生，为复杂疾病的精准治疗带来了希望。图4. 计算机辅助药物设计的流程【5】 05 总结从药物研究模式和设计思想的发展以及计算机辅助药物设计（CADD）的发展历程可以看出，从事药物设计研究需要具备丰富的药物化学相关知识和熟练的药物设计软件使用经验。工欲善其事，必先利其器。殷赋科技在生物医药计算领域积累了丰富的经验，并且开发出了简单易用、智能友好的云计算平台，让科研工作者足不出实验室，便能得到计算专家的倾力协助，突破药物设计过程中的计算关卡。参考文献 [1] Hubbard R E. Can drugs be designed. Curr Opin Biotech., 1997. 5:1139. [2] Bajorath J. Computer-aided drug discovery [version 1]. F1000Research 2015, 4:630 [3] Gane P J, Dean P M. Recent advances in structure-based rational drug design. Curr. Opin. Struct. Biol., 2000, 10:401-404. [4] Lipinski C A, Lombardo F, Dominy B W, et al. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv. Drug Del. Rev., 1997, 23: 3-25. [5] https://doi.org/10.1016/j.ejmech.2021.113705 三、计算机辅助药物设计的智能化与自动化发展（原创 LY-Drug NCS）一、引言传统药物研发周期长（10-15 年）、成本高（10-20 亿美元）、成功率低于 10%。计算机辅助药物设计（CADD）融合计算化学、生物学与计算机科学，随 AI 技术（深度学习、机器学习）发展升级为 AI 药物设计（AIDD），显著提升研发效率，加速靶点识别、候选药筛选等环节，降低风险与成本。本文聚焦 CADD 智能化自动化发展，涵盖历程、关键环节、理论框架、产业应用及趋势。二、计算机辅助药物设计的发展历程 2.1 早期发展阶段（20 世纪 70 年代 - 90 年代）核心为定量构效关系（QSAR）：1964 年 Hansch 与藤田稔夫开创 QSAR，用热力学参数建结构 - 活性回归方程；1988 年 Cramer III 提出比较分子场方法（CoMFA），1989 年提出 “3D-QSAR”。成功案例：日本杏林公司基于 Hansch - 藤田模型研发抗菌药诺氟沙星。 2.2 基于结构的药物设计阶段（20 世纪 90 年代 - 21 世纪初）依托 X 射线晶体学、核磁共振获生物大分子三维结构，推动基于结构的药物设计（SBDD）。理论方面，1994 年 Fisher “锁钥原理”、1959 年 Koshland “诱导契合” 学说奠定基础。成功案例：1996 年首款 SBDD 药物碳酸酐酶抑制剂上市；伊马替尼（首个靶向抗癌药）、多奈哌齐（阿尔茨海默病治疗药，3D-QSAR 辅助设计）。 2.3 人工智能融入药物设计阶段（21 世纪初至今） 2010 年后 Insilico 等公司推动 AIDD；2016-2019 年 ATOM、MLPDS 等联盟成立。关键突破：2020 年 AlphaFold2（蛋白结构预测）、DSP-1181（首个临床 AI 药物）；2021 年 ISM001-005（AI 全流程设计 IPF 药物）、halicin（AI 发现广谱抗菌药）；2023 年 “分子工厂”（中国药科大学 AI 设计流程）；2024 年 ADMET-AI（快速 ADMET 预测平台）。三、计算机辅助药物设计的关键环节与智能化进展 3.1 靶点发现与验证的智能化 •数据挖掘预测：SPiDER 模型（SOM 算法）识别靶点；MT-DTI 模型（DL）预测药物 - 靶点结合亲和力（如抗 SARS-CoV-2 药物）。 •深度学习结构预测：AlphaFold2（氨基酸序列→蛋白三维结构）、RGN 工具（键角预测）。 •相互作用预测：CNN、GNN 模型捕捉作用模式，MT-DTI 为典型案例。 3.2 分子对接的智能化与自动化 •方法演进：刚性→半柔性（主流）→柔性对接，工具含 AutoDock、GLIDE 等。 •深度学习对接：Q-N 对接（强化学习）、DSDP/Diffdock（2025 主流，直接预测结合构象），如 Xue 等用 AI 筛选曲古抑菌素 A。 •自动化流程：靶点预处理→结合位点预测→构象优化→对接计算→结果分析，AI 降低资源消耗。 3.3 分子生成的智能化方法 •核心模型：VAE（无监督生成）、GAN（对抗训练）、RNN/LSTM（序列处理）、Transformer（全局依赖）。 •工具平台：MolAIcal（3D 药物设计）、ReLeaSE（强化学习）、“分子工厂”（多模式设计）。 •案例：halicin（广谱抗菌）、RG-10（抗耐药 Menin 抑制剂，IC50 优化）。 3.4 虚拟筛选的智能化与自动化 •分类：基于受体（依赖靶点结构）、基于配体（依赖活性配体）、基于蛋白 - 配体相互作用。 •机器学习方法：SVM、随机森林等，速度达每日 10⁶分子（传统 10³），准确率超 80%。 •平台与案例：ADMET-AI（3.1 小时预测百万分子）、Schrödinger 平台（SGR-1505 筛选）；恩西曲韦（抗 COVID）、福尔索司他（NASH 治疗）。 3.5 多靶点优化的智能化方法 •挑战：计算复杂、数据稀缺、靶点互作复杂、多目标平衡。 •方法：多任务学习、多目标优化（NSGA-II）、GNN、强化学习。 •案例：DSP-0038（抗精神分裂双靶点药）、赛诺菲双特异性糖尿病药。四、计算机辅助药物设计的理论框架与方法 4.1 定量构效关系（QSAR） •基础：结构决定活性，步骤为数据准备→特征提取→特征选择→模型构建→验证。 •分类：按维度（1D-6D，如 3D-QSAR 含 CoMFA/CoMSIA）、按建模技术（线性 / 非线性）。 •AI 方法：ANN、SVM、GNN 等，如 GONG 等用 AI 筛选糖尿病候选药。 4.2 分子对接 •理论：分子识别原理，目标为结合自由能最低。 •分类：按柔性（刚性 / 半柔性 / 柔性）、搜索算法（系统 / 启发式 / 局部）、评分函数（力场 / 经验 / 知识型）。 •深度学习对接：CNN（图像表示）、GNN（图结构）、混合方法，如 Q-N 对接。 4.3 分子动力学模拟（MDS） •理论：牛顿运动定律，方程m_i\frac{d^2r_i}{dt^2} = -\nabla_{r_i}U。 •步骤：系统构建→能量最小化→平衡→生产运行→数据分析，应用于蛋白构象、结合机制研究。 •AI 加速：神经网络势函数（SchNOrb）、增强采样、模拟结果预测。 4.4 基于深度学习的药物设计 •模型：CNN（图像）、RNN/LSTM（序列）、GNN（分子图）、VAE/GAN（生成）、Transformer、强化学习。 •案例：AlphaFold2、halicin、“分子工厂”、ADMET-AI。五、计算机辅助药物设计的产业应用与案例 5.1 应用现状 •范围：靶点发现、先导药筛选 / 优化、ADMET 预测、临床试验设计、药物再利用等。 •模式：自主研发（大型药企）、合作研发（赛诺菲 - Exscientia）、技术授权（Schrödinger）、风险投资（NVIDIA-Recursion）。 •效益：周期缩短、成本降低 30%+、成功率提升、新机制药物发现。 5.2 AI 制药企业 •模式：全程自研（Recursion）、合作研发（Exscientia）、技术输出（Schrödinger）。 •案例：Exscientia（DSP-1181/DSP-0038）、Insilico（ISM001-005）、BenevolentAI（巴瑞替尼再利用）。 •平台：Centaur（Exscientia）、Prime/Maestro（Schrödinger）、PhenoGraph（Recursion）。 5.3 药企与 AI 公司合作 •模式：联合研发、技术授权、股权投资、多项目合作。 •案例：赛诺菲 - Exscientia（糖尿病药）、百时美施贵宝 - VantAI（分子胶）、罗氏 - Freenome（癌症早筛）。 5.4 重大疾病应用 •癌症：RG-10（Menin 抑制剂）、多靶点抗癌药。 •神经退行性疾病：Aβ/Tau 蛋白靶向药、血脑屏障优化。 •心血管疾病：他汀类似物、ACE 抑制剂。 •传染病：恩西曲韦（抗 COVID）、halicin（抗菌）。六、计算机辅助药物设计的未来发展趋势 6.1 发展方向 •深度学习：多模态学习、自监督学习、迁移学习。 •自动化平台：端到端自动化、人机协作、自动化实验、云平台。 •多尺度融合：量子力学 - 分子力学 - 粗粒化模拟、多学科交叉。 •个性化设计：个体基因组药物、疾病亚型药、数字孪生。 6.2 挑战与对策 •数据：质量（标准化流程）、稀缺（迁移学习）、孤岛（共享平台）。 •模型：可解释性（注意力机制）、泛化性（鲁棒架构）、效率（轻量模型）。 •实验：预测差距（多模型集成）、成本（优化实验设计）、多参数（Pareto 优化）。 •伦理监管：隐私（伦理审查）、标准（监管框架）、知识产权（法规完善）。 6.3 未来展望全流程自动化、多组学整合、AI 与传统方法融合、量子计算应用（加速模拟）、应用拓展（难成药靶点、新型药物、个性化医疗）。七、结论 CADD 已从传统方法升级为 AIDD，通过 AI 技术（AlphaFold2、“分子工厂” 等）实现全环节智能化，显著提升研发效率。产业中形成多元应用模式，虽面临数据、模型等挑战，但未来将通过技术融合实现全流程自动化，为创新药物研发提供高效解决方案，助力人类健康。四、勃林格殷格翰的计算机辅助药物设计（原创我在西游你在红楼 AIDD Pro）引言计算机辅助药物设计（CADD）是勃林格殷格翰（BI）研究机构药物发现项目的重要组成部分。CADD 科学家与不同治疗领域的药物化学家密切合作，应用从化学信息学到分子建模等一系列技术。他们的工作包括基于结构和配体的药物设计、预测建模、虚拟筛选、苗头化合物选择、组合库设计和毒性预测。计算机辅助设计与开发部门还为项目团队提供技术和决策支持解决方案。计算生物学小组负责处理生物信息学任务，而 CADD 主要侧重于小分子药物发现，偶尔也为生物制剂研究提供支持。除了为 BI 主要研究基地的特定项目提供支持外，计算机辅助设计与开发部还实施了一种全球方法，为所有基地制定战略、分享最佳实践、工作流程、协议和软件解决方案。这种全球视角体现在计算化学框架 (CCFW)、内部虚拟筛选平台和预测模型全球基础设施上。CADD 科学家积极推动项目进展，与药物化学家合作，并开发影响项目决策的技术。 CADD在药物设计中的作用勃林格殷格翰公司（BI）的 CADD 科学家在药物发现项目中扮演着三个关键角色：项目贡献者、数据分析师和技术推动者。作为项目贡献者，他们利用计算化学来识别新型化合物、指导寻找新药计划、分析筛选结果并帮助优化先导化合物。数据分析师的工作包括将实验数据转化为化合物发现和优化的假设。CADD 科学家使用 Pipeline Pilot 和 KNIME 等工具处理和分析数据，并采用机器学习和聚类等技术。他们还汇编项目相关数据，并进行跨项目数据分析，以确定潜在的非靶点，并对苗头化合物集进行分流。 CADD 科学家的第三个作用，也是越来越重要的一个作用，是让药物化学家能够独立使用计算机辅助药物设计工具。BI 的药物化学家与计算化学家合作设计化合物，并独立使用一些 CADD 设计工具。药物化学家接受了使用某些 CADD 工具的培训，并对相关方法有了充分的了解。这激发了有关化合物设计的新型计算工具的讨论，并简化了 CADD 与药物化学之间的协调。药物化学家手中的 CADD 工具可以在合成可及性和化合物概况要求的限制条件下快速迭代设计思路，从而加快总体设计周期。 BI 鼓励使用先进的 CADD 技术（如分子动力学模拟），并积极监测该领域的发展趋势。与学术合作伙伴的合作对于推动技术和方法的发展至关重要，通常会将学术界开发的工具整合到内部工作流程中。化合物设计与协作的通用平台 3.1 增强团队合作，提高效率勃林格殷格翰公司（BI）的 CADD 科学家、结构生物学家和药物化学家共享一个通用平台，作为协作和化合物设计的强大工具。该平台以通用格式促进了假设和想法的共享，从而简化了决策流程。虽然 MOE 等分子建模工具非常复杂，但它们具有广泛的定制能力，可以开发新的模块。然而，要充分利用这些工具，往往需要计算化学家和 IT 专家所掌握的专业技能。3.2 全球协调部署 MOE 生物研究所成立了一个全球 MOE 工作组，负责协调三个研究基地的 MOE 工具和功能的部署。标准化的部署程序确保了 MOE 版本和 BI 特定定制功能在全球范围内的高效分发。特定站点的设置是独立配置的，菜单和库是根据启动 MOE 会话的站点加载的。外部工具（如属性和 ADME 描述符）可通过通信元层无缝集成到 MOE 中。 BI 为药物化学家引入了计算工具，包括基于 DFT 的扭转分析工具，可交互式评估化合物构象。该工具在高性能计算集群上使用QM计算，并以MOE、MOE数据库和Excel格式提供结果。此外，还有一项服务是根据 ab initio 计算估算化合物的诱变潜力。这些工具使药物化学家有能力执行复杂的任务，前提是能将它们标准化为常规工作流程。 BI 提供的对接工具利用 GOLD 和 CORINA 进行 2D-3D 转换。计算化学专家可以准备和优化 GOLD 配置文件和预对齐的蛋白质结构。药物化学家可以通过网络界面选择各种对接协议，提交输入文件进行自动对接。对接结果会以可用格式返回，同时还会提供性质预测，以帮助决策。3.3 三维结构数据自动化工作流程 BI 建立了一个自动工作流程，用于在项目主文件中编译三维结构数据。该工作流程包括计算晶体学堆积环境、质子化结构和排列蛋白质链等任务。为了便于使用，我们对结构进行了注释、分组和定制，使药物化学家能够在化合物设计中随时访问和利用相关的结构信息。利用预测建模和 MMP 分析进行化合物设计 4.1 针对 ADMET 终点的预测建模在勃林格殷格翰公司（BI），针对吸收、分布、代谢、排泄和毒性（ADMET）终点的预测建模在加速化合物设计-学习周期方面具有重要意义。勃林格殷格翰公司构建和共享虚拟模型的方法遵循以下原则：频繁更新模型：模型会自动重新训练和更新，以纳入最新数据。这可确保使用最新数据进行预测，从而随着时间的推移提高预测的准确性。置信度估计：预测附有置信度估计，为管理预期提供了一种可解释的方法。在决策过程中，置信度低于一定阈值的预测通常会被忽略。早期人体剂量预测：人体剂量预测是根据体外稳定性和药效数据进行的。最初的预测包括分布容积、血浆蛋白结合力和有效剂量，之后再根据实验数据加以完善。与其他工具整合：预测的特性与其他建模输出（如对接结果）无缝集成，提高了其在化合物设计中的可用性。4.2 标准化模型部署虽然许多模型都是在各个站点为本地目的建立的，但 BI 通过元层实现了模型部署和访问的标准化。这样，模型就能在本地和全球使用之间轻松切换，并能集成到各种前端工具中，包括 MOE、Marvin、Knime 和 Pipeline Pilot。基于 Python 的模型构建框架针对速度进行了优化，化学家可以在几秒钟内获得预测结果，并将预测模型集成到交互式合成规划中。4.3 关注相关终点商业智能侧重于利用大量可用数据预测终点，采用随机森林和支持向量机等机器学习技术。最近的重点是改进对人体剂量预测至关重要的参数模型，如体外清除率、分布容积和血浆蛋白结合率。4.4 集成到决策工作流中生物技术研究所正积极致力于将预测模型整合到项目团队的决策工作流程中，以加快化合物的开发进度。虚拟模型与实验检测并行，指导化合物进入下一阶段的筛选级联。作为简化决策的整体标准，对早期人体剂量预测进行了探索。4.5 用于SAR和化合物设计的MMP分析通过采用匹配分子对（MMP）转换，BI 能够以更生动的方式挖掘内部数据。MMP 分析支持 SAR 分析和化合物设计，可显示特定项目的匹配分子系列，并提供分子转换统计分析及其对溶解度或代谢稳定性等参数的影响。这些分析使药物化学家能够将有利的虚拟转化应用到正在进行的设计活动中，而且 MMP 方法已扩展到肽。整合计算工具：计算化学框架 (CCFW) 将功能强大的计算工具无缝集成到药物化学应用中需要计算化学（CADD）和信息技术两方面的专业知识，以确保工作流程的稳健性和科学性。为了缩小这两个领域之间的差距，勃林格殷格翰公司（BI）开发了计算化学框架（CCFW），作为一个中心枢纽。5.1 灵活连接前端和后端 CCFW 作为中间层，可将药物化学家使用的前端应用程序（如 Marvin、Spotfire、D360）与后端计算化学计算引擎连接起来。CCFW 利用标准化参数和文件交换格式，将 CADD 任务封装到网络服务中，而不是创建一个单一的集成系统。5.2 独立于客户端和模块化 CCFW 独立于客户端和模块化 CCFW 与客户端无关，可通过应用程序接口或插件由选定的前端触发。这意味着可从不同的客户端应用程序访问房产计算器和其他服务，而无需为同一任务提供多个后端服务。标准化的调用和结果可确保后端修改无需对前端进行更改。5.3 效率与协作 CCFW 的开发需要 CADD 科学家、IT 专家和药物化学家的通力合作。通常基于命令行或工作流的后端引擎被集成到 CCFW 中，以提供自动化和标准化服务，从而提高药物化学社区和 CADD 科学家的效率。利用虚拟筛选和 BICLAIM扩大发现新药的范围在勃林格殷格翰公司（BI），虚拟筛选（VS）在发现新药方面发挥着至关重要的作用。勃林格殷格翰公司采用快速、适应性强的基于配体和结构的虚拟筛选工作流程来进行量身定制的初始发现和迭代跟进活动。这些工作流程旨在适应各种早期药物发现目标和检测。为了拓展内部和商业化合物数据库所涵盖的化学空间，BI 开发了 BI 可访问和创新分子综合库 (BICLAIM)。它包含从公司化合物数据库和商业资源中计算提取的库核和试剂，横跨广阔的组合化学领域。BICLAIM 包含近 90,000 个核心和数万种试剂，可提供超过 10^17 种化合物。为挖掘 BICLAIM 空间，我们开发了多种搜索方法。其中包括二维特征树和用于三维匹配的 ROCS。这些方法已成功鉴定出新型化学实体，如 GPR119 激动剂和 CDK2 抑制剂。此外，还可使用 PharmShapeCC 软件对 BICLAIM 空间进行直接三维搜索，从而进行药理和形状互补性搜索。BI 还利用 ROCS 在部分枚举的 BICLAIM 子空间中实现了三维搜索。库核和构件的选择是 CADD 科学家、组合化学专家和药物化学家共同努力的结果。 BICLAIM 是 BI 的全球资源，由所有研究机构共同维护和开发。其他内部开发成果，如从头设计程序 BiBuilder 和基于 Python的模型构建框架，可跨研究机构使用，促进了团队间的预测建模和工作流程交流。结束语与展望在化合物分析中使用新型预测模型的情况激增，影响了药物发现项目中有关化合物进展的决策。计算工具的普及改变了项目团队中 CADD 科学家与药物化学家之间的合作。越来越多与 CADD 相关的自动化任务变得可以为药物化学家所管理，同时又不影响建模结果的质量。这不仅简化了决策过程，还让 CADD 科学家有更多时间开发可应用于项目推进和创新设计理念的先进技术，或解决传统上不属于 CADD 范畴的问题。生物技术研究所采用的一项独特技术是将大规模组合化学与虚拟筛选相结合，以便在药物发现项目的早期确定药物的苗头化合物和先导化合物。虽然与其他行业相比，计算设计在制药行业中的作用较小，但对速度、效率和解决前所未有的目标的需求正在推动 CADD 在药物设计和发现中发挥更大的影响力。CADD 的影响力取决于将结果转化为可操作的见解，并为药物化学家提供有关化合物开发下一步的可靠建议。为了提高 CADD 的影响力，有必要在开发更准确、更强大的预测方法方面持续投资，并通过增加实验数据的获取来提供支持。将 ChEMBL 等公共数据源整合到内部数据中可进一步增强预测能力。此外，制药公司意识到共享竞争前数据的重要性，这为建立更准确、适用范围更广的预测模型提供了机会。云计算资源的可用性有望促进计算密集型方法的大规模开发和应用。与学术团体的合作仍将是扩大 CADD 工具箱和探索新方法的关键。众包计划为解决出现的具体挑战提供了获得不同科学人才的途径。现代药物发现越来越多地涉及前所未有的低可药性靶点，如蛋白质-蛋白质相互作用或 RNA 结合。这些挑战需要超越传统小分子的创新化学设计方法。有了 CCFW 这样强大的计算基础设施、强大的外部科学网络和明确的 CADD 科学家角色，BI 完全有能力应对药物发现领域不断变化的挑战。参考文献：Muegge, I., Bergner, A. & Kriegl, J.M. Computer-aided drug design at Boehringer Ingelheim. J Comput Aided Mol Des31, 275–285 (2017). https://doi.org/10.1007/s10822-016-9975-3 end 本公众号声明： 1、如您转载本公众号原创内容必须注明出处。 2、本公众号转载的内容是出于传递更多信息之目的，若有来源标注错误或侵犯了您的合法权益，请作者或发布单位与我们联系，我们将及时进行修改或删除处理。 3、本公众号文中部分图片来源于网络，版权归原作者所有，如果侵犯到您的权益，请联系我们删除。 4、本公众号发布的所有内容，并不意味着本公众号赞同其观点或证实其描述。其原创性以及文中陈述文字和内容未经本公众号证实，对本文全部或者部分内容的真实性、完整性、及时性我们不作任何保证或承诺，请浏览者仅作参考，并请自行核实。

2026-04-02

·医药企业项目管理大会

十分钟让你读懂CADD和AIDD发展的最新现状与未来趋势

会议推荐 2026第三届中国医药企业项目管理大会 2026第二届中国AI项目管理大会 2026第十五届中国PMO大会 2026第五届中国项目经理大会本文目录 1、RSC Medicinal Chemistry | 从CADD到AIDD的最新进展 2、专访 | 深势科技邓彧勍:从CADD历史放眼AIDD未来 3、GPT-4再掀AI研发热潮，从CADD到AIDD药物「智造」进展如何? 4、【JMC】关注，CADD和AIDD 在药物发现中的现状一、RSC Medicinal Chemistry | 从CADD到AIDD的最新进展（原创致富智网生化环一圈）分享一篇发表于2024年的一篇关于CADD和AIDD进展的综述文献。 01 全文速览文章是一篇关于计算机辅助药物设计（CADD）到人工智能药物设计（AIDD）的综述文章。1）文章首先介绍了CADD的起源和发展，强调了其在现代药物发现中的核心地位。2）文章通过展示近年来AIDD的成功案例，详细描述了人工智能在药物发现中的演变过程，包括化学库筛选、连接子生成和从头分子生成三个阶段。3）文章还比较了CADD和AIDD的特点，并总结了AIDD在药物设计中的潜力和未来发展方向。 02 CADD 和 AIDD 的发展趋势计算机辅助药物设计（CADD）起源于20世纪60年代，随着Hansch等人引入定量构效关系（QSAR）模型的概念而逐渐发展。到20世纪80年代，CADD已经成为药物研究中的强大工具，能够通过结构化和配体化方法预测分子结构与活性的关系，并与靶点相互作用。CADD主要分为基于结构的药物设计（SBDD）和基于配体的药物设计（LBDD），在药物发现的各个阶段都有广泛应用。然而，随着数据量的指数级增长，人工智能药物设计（AIDD）作为一种增强型的CADD迭代，在过去十年中蓬勃发展。AIDD在蛋白质折叠、性质预测和分子生成等方面展现出前所未有的机遇，并且能够加速药物发现过程，探索未知的化学空间。图1A. 展示了CADD的发展历程。从20世纪60年代QSAR模型的引入，到20世纪70年代CADD概念的形成，再到20世纪80年代成为药物研究的成熟工具。AIDD在近年来随着数据量的增加和模型优化而迅速发展。图1B. 展示了CADD和AIDD年度论文发表趋势。通过PubMed数据库检索关键词“（计算机辅助）和（药物设计）”以及“（人工智能）和（药物设计）”，可以看出AIDD近年来的关注度和研究热度逐渐超过CADD。 03 CADD 和 AIDD 的发展趋势 3.1 CADD 的主要流程和组成 CADD主要包含基于结构的药物设计（SBDD）和基于配体的药物设计（LBDD）。图2. CADD的主要流程和组成表1是在2021-2023年基于 CADD 成功发现的分子和所用的CADD方法，在此过程中，分子对接可能是最常用的方法之一，其他技术，如 FEP、MMPBSA 和 MM-GBSA，也至关重要。CADD 方法的使用，无论是单独使用还是组合使用，都已证明其有效性。 3.2 AI 的分类 & AIDD的一般流程早在 1950 年，图灵就提出了著名的图灵测试，表明机器可以思考。六年后，约翰·麦卡锡正式提出“人工智能”一词，将其定义为创造智能机器的科学与工程。这一过程通常涉及清理原始数据和构建与其应用相关的数据集，将输入数据转换为内部表示，辨别和学习这些表示，并根据已识别的模式生成输出。图3. AI 的介绍、分类以及 AIDD 的一般流程。(A) AI 的分类。(B) AIDD 的一般流程表2是基于 AIDD 成功发现的分子(预测的模型) AIDD 与 CADD 类似，也能预测分子特性并筛选化合物库。然而，与 CADD 不同的是，AIDD 利用深度学习模型自动提取抽象的分子表征。这使得 AI 能够识别传统方法可能忽略的化学数据中的复杂模式和关系。因此，AIDD 在高效筛选更大规模的化合物库方面拥有巨大潜力，能够在提高准确性的同时，降低计算成本和处理时间。例如，AI 通过大幅降低计算需求，促进了 Enamine REAL 等超大型化合物库的筛选。 04 案例 2023 年，Das 团队开发了一个全面的深度生成框架，该框架在以往的研究中脱颖而出（图 6）。该框架在包含蛋白质序列、小分子及其相互作用的大型数据集上进行了广泛的训练。这种方法确保了最终的设计不会偏向任何特定靶点。利用该框架，他们在生成基础模型上进行了条件蛋白质序列采样。他们成功设计了分别针对 SARS-CoV-2 中两个不同靶点 RBD 和 Mpro 的小分子抑制剂。后续的生物学实验表明，这些抑制剂表现出良好的活性。该案例在生成分子时并未依赖迁移学习或强化学习来使模型偏向靶标。相反，它不使用结合物信息，而是利用预测因子来帮助对目标分子进行采样。此外，本案例超越了先前讨论的仅使用配体的方法，在广义的基于结构的设计中加入了蛋白质靶标序列的结合预测因子。仅依赖靶标蛋白序列的优势在于无需详细描述靶标蛋白内的配体结合口袋。这种方法为设计针对未知靶标或理解程度较低的靶标结合口袋的抑制剂开辟了可能性。药物设计的最终目标是有效且高效地探索广阔的化学空间，发现具有最优性质的新型分子，同时最大限度地降低成本和时间。除了生成连接子之外，AIDD 还可以生成无需已知配体作为起始点的新型化合物。连接子生成模型可能需要时间来获得必要的起始结构，而从头分子生成模型则没有这种依赖性，从而通过消除昂贵且耗时的流程，在药物设计中提供了独特的优势。从头分子生成模型可以生成全新的结构。通过这种方式，AI 驱动的从头设计可以探索更广阔的化学空间，而不仅限于已知化学空间的附近。这些优势表明，从头分子生成模型可能有望超越连接子生成模型，为药物发现提供更简化的方法。 05 从CADD到AIDD的演变自 1956 年诞生以来，人工智能已逐渐在各个领域得到应用。随着化学和生物数据的扩展以及算法和模型的进步，机器学习（ML），尤其是深度学习（DL），在过去十年中在药物设计领域取得了长足的进步。值得注意的是，人工智能在 2020 年促成了 halicin 的发现，这是第一个通过这种方法识别的分子。此外，AlphaFold2 在 2021 年对蛋白质三维结构的高精度预测，引发了人工智能在生物学乃至制药领域的应用激增。近年来，各种药物设计模型应运而生，在分子性质预测、分子生成和合成路线预测等不同任务中都拥有无限的潜力。 CADD 已成为药物研发中常用且成熟的工具，有助于筛选化合物以识别药物先导（图 7）。人工智能 (AI) 的引入进一步缩短了药物研发所需时间，提高了效率。通过建立强大的预测模型并进行全面的训练和测试，AIDD 能够以更快的速度准确预测大量化合物的性质。值得一提的是，筛选超大型化合物库（传统上是一项资源密集且耗时的任务）可以通过人工智能显著提高效率。因此，可以说，基于先进预测模型的 AIDD 是 CADD 的增强版。此外，生成模型克服了仅从现有化合物库中识别合适化合物的限制。 06 总结二、专访 | 深势科技邓彧勍:从CADD历史放眼AIDD未来（原创会会药咖专访团队会会药咖）自1894年“锁钥模型”首次被提出，CADD（Computer Aided Drug Design，计算机辅助药物设计）的研究正在走向成熟，并逐步成为药物发现过程中的必备技术手段之一。6月8日，由深势科技与会会药咖共同推出的CADD领袖论坛，通过沙龙形式分享了国内外CADD研究进展及发展动向。会后，我们也有幸邀请到深势科技Uni-FEP首席科学家邓彧勍博士，就当前CADD领域的热门问题进行探讨。邓彧勍博士毕业于布朗大学化学系，先后在康奈尔大学医学院和阿尔贡国家实验室开展博士后研究，从事溶解、结合自由能的分子动力学模拟。曾在加拿大Zymeworks公司开发分子动力学和蒙特卡洛计算平台，也是前薛定谔FEP+算法科学家。 AI会为CADD带来哪些机遇？CADD能帮到药企什么？CADD能否由辅助变为驱动药物设计？让我们一起听听邓博士的见解。 01 关键词：突破会会药咖：过去一二十年CADD有了很大发展，您认为比较有代表性的突破成果有哪些呢？邓彧勍：在我看来，基于结构的药物设计发展非常巨大。尤其是在过去的十年中，自由能微扰（Free Energy Perturbation , FEP）计算实现了真正的工业化，这是非常大的成就。 FEP方法最早可以追溯到1954年，R. W. Zwanzig在那时就提出了计算公式，但是具体应用是在过了几十年才初试锋芒。因为FEP对力场和算力的要求都非常高，所以从学界真正走向业界，实现工业化进程，会有很多实际困难。此前FEP的应用还止步于几个经典体系，而在其他体系就很难给出比较精准快速的结果。最近这十年，FEP快速发展并取得了突破性成果——现在已经真正可以从结构出发，通过对化合物库进行筛选，对药物设计产生前瞻性的指导意义；虽然还不是超大规模的评估，但是已避免了沦为“事后诸葛”的纯验证性功用。对于从事有机合成的“劳工”们来说，一个好的FEP也许意味着可以省下几个月摇瓶子的时间。在此之前，有机化学的从业者们仍然不得不一个一个的合成出卤（氟/氯/溴）代物来做活性测试。（有了FEP以后，药化学家就可以只测其中一个，剩下两个就可以通过FEP来评估是否还有合成的必要性。） CADD除了能让实验室避免接触有毒有害的试剂，避免分析一些烧脑的反应机理，更重要的是为药物合成节省时间。药物研发对企业来说是一场速度的比拼，如果将CADD高效利用起来，对药企来说是有降能增效作用的。 02 关键词：机遇会会药咖：如何看待当前AIDD的发展现状，AI会为CADD带来哪些变革和机遇？邓彧勍：机器学习的确已经在很多方面的应用取得了成功，但是药物设计本身就比自然语言处理和简单的图像识别问题要复杂得多。我认为现阶段的AIDD（AI Drug Discovery & Design，AI驱动的药物发现与设计）还没有完全摆脱对数据的依赖，而在生命科学领域，高价值的数据还往往不足，所以如果我们单纯依靠深度学习，训练出的模型可能只适用于一些场景，用起来时灵时不灵。当然，“人力有时而穷”，我们首先要承认人类的感官有局限性的。比如药物设计过程中，我们在处理结构数据过程时，往往只能关注低维表象，一旦面临多维问题就会显得“黔驴技穷”。“君子性非异也，善假于物也。”我们应该将机器作为我们的工具，它可以帮我们挖掘到一些意想不到的东西或者触发我们的灵感。在某些方面，AI已经给传统的计算生物学带来了革命性的突破。比如蛋白质结构预测，大家之前用传统方法搞了几十年，最后用一个机器学习模型就超越了以往的所有工作。但是，这还只是第一步，因为单纯一个蛋白质的静态结构，虽然在科学上有比较深远的意义，但应用的意义还有限。最近，看到David Baker成立的新公司，专注在蛋白质和小分子结合物的结构，相信这会为更多下游场景带来实际的意义。我们知道复合物的形成往往伴随着构象变化，如果我们对构象变化做出准确的预测和计算，辅以机器学习在效率上的优势，那我们就可以在超大的化学空间、或者说蛋白-配体空间内进行高精度的批量筛选，从而找到真正全新的药物。 03 关键词：驱动会会药咖：如何看待未来CADD发挥的作用，是否能够实现辅助向驱动药物发现的转变？邓彧勍：CADD驱动药物设计已经开始逐步成为现实了。举个例子，之前在薛定谔我们有个合作项目，前几次用传统方法给客户推荐了一堆化合物，但活性都不是很高，所以客户最开始其实并不满意。但当时正好自由能微扰计算刚刚兴起，所以团队也是抱着“死马当做活马医”的心态，从头搭建了一套模型，给客户又做了一次，结果客户对推荐的化合物很满意。这后来，我们又紧接着做了“双盲实验”——让自由能计算和药化学家比试推荐出来的分子活性，结果（当时）“出人意料”，比试结果表明FEP已经超过药化专家几十年的经验判断。当然这只是一个案例，说明CADD在一定范围内已经具备了这种突破，并不是说所有的项目都能超越人为的经验，药物设计最终还是要保持充分严谨的。再到后来，随着FEP越来越成熟，我们再对客户进行随访调研的时候，发现预测失败的情况已经变成冰山一角了，冰山下面都是成功的例子。我们必须承认现在计算模型对生物体系的了解还不够全面，只是在一些局部问题上有了一点攻克，所以目前还达不到有任何临床需求都能直接把分子设计出来。但我相信未来只要我们沿着正确的方向一直往前走，是可以完全实现CADD驱动药物设计的。 04 关键词：人才会会药咖：结合您多年的海外经历，可否给国内关注CADD的企业和从业人员分享一些经验和建议？邓彧勍：CADD很大程度上是从受体和配体的结构出发，所以我认为CADD要发挥指导性作用首先有对结构的充分理解。其次，化合物库的建立也同样重要。拿最近新冠病毒主蛋白酶抑制剂的案例来说，耶鲁大学Jorgensen教授很早就在该靶点上利用自由能计算来优化分子，之前，他也通过筛选找到一个抑制剂分子。而对相同的蛋白，盐野义只做了对接实验，并没有做精细的自由能微扰计算。结果最后是耶鲁大学的化合物没有进入临床，而盐野义筛选出的化合物已进入到临床三期。从结构看，盐野义与耶鲁大学课题组的候选化合物骨架上是很像的，但在几个关键地方不一样，所以说做新药筛选的话，最开始的的起点——化合物库也很重要。不光对从业人员，对于公司来说，都应该积累自己的分子库，比如十几年前的非典病毒是与COVID-19同源的一个病毒，虽然现在病毒分子已经突变了，但那时候累积的一部分成果或经验，在新冠疫情之下能帮助我们很快投入疫苗研发中去。做CADD、AIDD还要具备药物化学的背景，不能光是拿了商业化的一个化合物库，就指望可以找到一个PCC。找到了苗头化合物以后，后续还需要做不同的优化，如果苗头起点好，比如低毒性、其他理化性质较好，就可以省去后续很多实验。所以说除了要具备计算化学能力外，还要具备毒理相关的知识，才能做好这个工作。 05 关键词：匠心会会药咖：针对目前AIDD和CADD尚且存在的问题与挑战，深势科技具有哪些优势，未来是如何研发布局的呢？邓彧勍：对于提高结合自由能微扰最关键的技术就是力场和结构。在力场方面，之前我们CADD计算用的比较多的都是半经验力场，可以说是计算精度的天花板。而这方面的突破，其实就在深势科技的名字里面——“深势”即深度势能。它的方法是用机器学习覆盖很多高精度的分子数据，然后构建新的模型，在遇到不准的数据仍然能继续训练模型迭代校正，这样用纯计算的方式就可以覆盖大量的未知空间，从而迁移到各种体系的计算上。这也体现了深势科技一直所引领的AI for Science新范式，即用AI先去学习科学原理，再进一步解决工业问题。对于结构，具体的说是蛋白质结构预测，去年深势推出了Uni-Fold结构预测工具，已经可以用来精确预测单体和多聚体的结构。相应解决方案已集成至深势科技自主研发的药物设计平台 Hermite™，供广大用户测试使用。未来，我们同样能够对构象变化以及跟小分子-蛋白结合的结构做出预测，从而对基于结构的药物设计做出指导性建议。同时，我们致力于将这些数据搭建为一个全自动化的平台，覆盖海量分子的化学空间。因为自由能计算是相对比较后期的一步，前期的苗头化合物还是要借助高通量虚拟筛选的方式获取——而对虚拟筛选而言，一天筛几千个化合物跟一天筛几千万个，是完全不同的概念。从基于纯组合方式的角度来看，待筛选的化合物空间非常巨大，但我们也在探索出一种方式，突破纯组合的概念，比如先把完全不可能的结构剔掉，这样空间便会缩小很多，而这中间就会涉及机器学习。当然具体要怎么走还很难说，但是这个方向肯定非常值得探索，很有可能在此实现突破性进展 Hermite™界面展示三、GPT-4再掀AI研发热潮，从CADD到AIDD药物「智造」进展如何? （原创费翔药智网）计算机辅助药物设计（CADD）始于20世纪70年代，当时科学家首次使用计算机来预测药物分子对生物系统的影响。如今，CADD已成为药物发现的一个重要工具，使研究人员能够快速分析大型数据集并识别潜在的药物靶点。随着最近ChatGPT、GPT-4等为代表的人工智能技术的发展，或再掀AI研发热潮！从CADD到AIDD，药物「智造」进展如何？ CADD的「前世今生」 CADD开发了虚拟筛选方法，可用于寻找有希望的化合物进行药物开发：结合人工智能（AI）、机器学习（ML）和深度学习（DL）等技术，可以处理大量的生物数据，从而在药物开发过程中减少时间和成本；根据蛋白质或配体的3D结构的可用性使用两种不同的技术，它们被称为基于结构的药物设计(SBDD)和基于配体的药物设计(LBDD)。在某些情况下，这两种技术的结合在寻找先导分子方面表现出不错的准确性。图1 CADD概览图片来源：综述论文1 下表列举了CADD常用的对接软件。表1 常用CADD对接工具列表注：增量构建是一种药物发现的方法，即通过添加与目标蛋白契合度高的片段，一步步构建药物分子。这种方法可以减少搜索空间，提高寻找最佳候选药物的效率。增量构建可以使用不同的算法，如FlexX，它使用一套规则，根据其结合亲和力和几何形状选择和放置片段。资料来源：参考论文1 目前流行的采样算法有三种：形状匹配、系统搜索（穷举搜索、分段搜索和构象集合）和随机搜索算法（如蒙特卡洛算法、遗传算法、禁忌搜索法和群体优化法）。而流行的评分函数主要可分为三类：力场、经验和基于知识的评分函数。作者发现商业对接软件，可能比学术对接软件有更好的性能。根据对1990年至2013年的所有分子对接文献的分析，AutoDock12、GOLD12和Glide12是最常用的对接软件。然而，这并不意味着这三个软件比其他软件更准确。更多关于分子对接程序的横向评测可以参考文献3。在文章里讨论了多种分子对接软件的效果，包括Autodock、Autodock Vina、Ledock、Rdock、UCSF DOCK、LigandFit、Glide、GOLD、MOE Dock、Surflex-dock等。其次，CADD在药物发现过程中仍存在一些问题。比如使用CADD预测结合亲和力的挑战，在过去三十年的研究中由于蛋白质柔性，水的行为，拥挤效应等影响依然无法仅仅依靠CADD做出可靠的、普遍的预测。另外，CADD只是产生想法，而药物发现和生物学仍然需要非常多的实验，和同行的交流中普遍感觉到目前药物研发行业还是趋向保守。因此，CADD仍然被视为药物发现过程的支持部门，而不是核心部门。 AI驱动药物设计的现状过去十年来，人工智能（AI）一直在药物发现领域取得进展：采用人工智能方法的生物技术公司，有150个小分子药物正在研发，超15个已经进入临床试验阶段。据Exscientia公司报告，第一个由人工智能设计的候选药物将在2020年初进入临床试验。该候选药物DSP-0038是一种双靶点5-HT1a受体激动剂和5-HT2a受体拮抗剂，是Exscientia和Sumitomo Dainippon Pharma之间合作的一部分。2021年5月宣布在美国启动DSP-0038的1期临床研究。近期涉及AI在药物研发中应用的公司交易整理如下：表2 人工智能应用于药物研发的部分交易资料来源：参考资料4 最近，笔者有幸聆听insilico medicine（英矽智能）团队介绍他们最新的Pharma AI平台，特别是引入了类似chatgpt的界面大大方便了没有深厚计算机基础的药物研发用户的使用门槛。图2 英硅智能公司的PHARMA AI药物研发平台如图所示，英硅智能公司致力于促进新药发现和研发的三个领域:疾病靶点识别、合成生物学的生成和新型分子数据的生成、以及临床试验结果的预测与传统药物研发流程相比，引入GPT的AI药物研发平台还可以通过在研究和开发过程中减少失败的尝试次数来节省时间和资源。此外，可以根据已知的蛋白质结构和化学反应，预测新的化合物和药物靶点。这意味着研究人员可以更快地进行药物筛选和评估，从而缩短药物研发周期。然而，这些技术仍处于早期阶段，需要进一步的发展和验证，以确保其在药物研发中的可靠性和安全性。然而，人工智能在药物发现中的方法需要在未来更好地考虑药物的体内相关特性，数据生成和分析需要向更快、更低成本地到达安全和有效的药物方向发展。未来已来： GPT打破壁垒 GPT-4和ChatGPT是人工智能技术发展的缩影，具有影响药物发现和开发的潜力。 GPT-4可以提出新的化合物，从而加快和提高药物发现的效率，也可能发现传统方法未能发现的新药。 ChatGPT是一款会话式聊天机器人，可以找到具有类似性质的化合物并对其进行修改，以确保它们没有被专利。这些技术有潜力释放海量数据的能量，加速药物发现和开发的进程。下面，笔者就使用GPT工具来尝试新药研发初期常见的靶点立项基础任务。笔者以正在研究的靶向河马通路下游TEAD开发治疗癌症新药为例，用GPT要求写一份已知化合物抑制剂的清单，并给出一个邮件模板方便笔者写信给CRO公司咨询合成报价。图3 ChatGPT关于TEAD抑制剂的回答为了比较，笔者尝试了谷歌最新的BARD，结果如下：图4 BARD关于相同问题的答案相比ChatGPT找到了CA3（CIL56）化合物，BARD提出了更多候选化合物，包括共价抑制剂TEAD347等。图5 CA3的化学结构两个GPT都提到了CA3这个化合物。通过Bing浏览器Edge dev版内置的Chat继续提问了解到CA3(CIL56)是一种小分子化合物，通过产生依赖铁的活性氧（ROS）诱导细胞铁死亡12。铁死亡是近年来发现的一种新型细胞死亡方式，通常在细胞死亡过程中伴随着大量铁积累和脂质过氧化反应。CA3(CIL56)对YAP1/Tead转录活性具有强烈的抑制作用，主要靶向具有CSC特性的YAP1高表达和治疗耐药性的食管腺癌细胞。图6 使用bing chat可以通过互联网更快找到可靠的参考来源英文邮件格式也很贴心的准备好，稍作修改即可发给CRO公司，大大提高了效率。图7 地道英文生成的咨询CRO公司合成目标化合物的商业邮件模板除了以上几款人工智能软件外，笔者还近距离体验了一款天然产物与AI完美结合的AI研发平台——药智NPAIEngine。据了解，NPAIEngine是一个天然产物+AI研发平台，由药智网与英国伯明翰大学何山教授等团队合作打造，特别适用于聚焦于天然产物与中药研发领域。据介绍该平台汇聚了全球约3.5万种植物、生物和矿物质的57万个天然产物，并应用了AIA Insights自主研发的核心AI算法。图8 NPAIEngine天然产物AI研发平台通过将天然产物中的化合物结构数据库、化合物生物活性数据库以及相应的疾病数据库有机地结合起来，NPAIEngine的强大功能使得用户能够筛选出天然产物中的有效成分，并预测这些成分对于特定靶点或疾病的作用。另外，基于输入的天然物化学结构利用药物AI从头设计算法，设计可合成性高、成药性好、具有新颖专利结构的先导化合物优化功能也即将年内上线。小结尽管AI在药物开发中展现出了巨大的潜力，但也面临着一些挑战和障碍：基于人工智能的方法通常是数据密集型的，需要大量的数据集以获得准确的结果。此外，基于人工智能的方法可能难以解释，使得基于人工智能的药物发现的结果难以解释。基于人工智能的药物发现可能是昂贵的，因为它往往需要专门的硬件和软件。不过笔者认为随着GPT技术的普及，通过聊天方式就可以高效解决以往需要费时费力才能搞定的问题指日可待。接下来传统药物研发团队，更多要关注新药开发过程中数据质量和可用性、算法可解释性和可靠性、知识产权和监管问题等。要充分利用AI在药物开发中的价值，需要投资数据、技术、新技能和行为，并实现整个研发过程的转型。传统制药公司需要及时跟上AI带来的变革，并与AI先驱公司进行合作或竞争。四、【JMC】关注，CADD和AIDD 在药物发现中的现状（原创 TSS转化医学谱 TSS转化医学谱） 2024年对于计算科学来说是激动人心的一年，“人工神经网络”获得诺贝尔物理学奖，“蛋白质结构预测与设计”获得诺贝尔化学奖。鉴于计算机辅助药物设计 (CADD，Computer-Aided Drug Design) 和药物发现人工智能 (AIDD，Artificial Intelligence in Drug Discovery) 的快速发展，JMC在最新一篇文章中总结其当前状况和未来方向。本文强调了这些领域之间的最新发展、主要挑战和潜在协同作用。近年来，计算机辅助药物设计（CADD）和人工智能药物发现（AIDD）取得了重大进展。这些领域利用基于物理的计算方法和机器学习来提高药物设计的效率和速度，旨在彻底改变新药物发现和优化方式。自从第一个分子对接软件 DOCK 发布以来 (J. Mol. Biol. 1991, DOI: 10.1016/0022-2836(91)80222-G)， CADD 已经有了很大的发展，小分子和大分子的力场开发和构象采样方法都得到了改进。分子对接和评分的新算法改进了配体-受体相互作用的预测，提高了虚拟筛选的命中率。药效团建模与定量构效关系（QSAR）方法的整合产生了更稳健的预测模型。Schrödinger、MOE、和 OpenEye Scientific 等平台均增强了云交互式模式和计算速度，使非计算化学专家的研究人员更容易使用。基于结构的虚拟筛选已成为识别早期药物发现“最先进”工具。“按需生产(make-on-demand)”化学库空间的不断增加将使得在未来几年内能够在几周内对多达万亿种化合物进行计算机筛选，为新的热门支架探索提供前所未有的机会。此外，通过深度学习(deep learning)准确预测蛋白质结构将越来越有助于虚拟筛选在新型生物靶标中的成功应用，而由于靶标可用的化学信息较少，仅通过机器学习进行配体发现不太可能成功。在过去的5年里，广泛覆盖的超大化学空间的化合物库虚拟筛选得到了广泛应用。Lyu 等人将 1.38 亿个化合物与多巴胺 D4 受体对接，将 9900 万个化合物与 AmpC β-内酰胺酶对接，从而针对这两个目标产生了多种新的命中分子(Nature 2019, DOI: 10.1038/s41586-019-0917-9)。将 13 亿种化合物对接在 KEAP1 氧化还原感知分子中，并通过表面等离子共振 (SPR) 验证结合物的命中率为 12% (Nature 2020, DOI: 10.1038/s41586-020-2117-z)。Sadybekov等人提出了一种“虚拟合成子分层枚举筛选”（V-SYNTHES，virtual synthon hierarchical enumeration screening）方法，该方法对一组集中的片段化合物进行对接计算，这些片段化合物代表了可用于文库合成的所有支架 (Nature 2022, DOI: 10.1038/s41586-021-04220-9) 。纳斯达克上市公司Recursion 使用 Enamine REAL Space（由大约 360 亿个按需生成的可搜索化学库）成功虚拟筛选了近 15,000 种人类蛋白质，其中包含超过 80,000 个潜在的结合口袋。同时，目前都还严重依赖对接的传统建模，需要开发更准确的基于物理的预测方法，例如自由能扰动（FEP，free energy perturbations）和热力学积分（TI，thermodynamic integration）。近年来，相对结合自由能 (RBFE，relative binding free energy) 计算在蛋白酶、激酶和 GPCR 等多种靶标的先导化合物优化过程中的功效已得到广泛验证。增强采样分子动力学方法已被开发用于检测隐秘结合口袋、并预测配体结合动力学、与体内功效相关的重要参数。由于计算方法的进步、高性能计算的可用性、GPU 加速模拟，CADD 工作流程的成功应用，目前已经产生了一些临床候选分子（图 1A）。Nimbus 与 Schrödinger 合作，采用基于结构的药物设计策略来推动潜在的同类最佳 TYK2 抑制剂的发现。 (J. Med. Chem. 2023, DOI: 10.1021/acs.jmedchem.3c00600) Morphic Therapeutic利用“数字化学（digital chemistry）”——FEP设计了一种新型α4β7整合素小分子抑制剂。Relay Therapeutics 进行了长时间的分子动力学模拟，并设计了正位结合剂，选择性地共价结合 FGFR2“P 环”中的 Cys 残基(Cancer Discov. 2023, DOI: 10.1158/2159-8290.CD-23-0475)。图 1. (A) CADD 的一般工作流程。在过去的十年中，随着机器学习machine learning和深度学习deep learning 在药物发现中应用的兴起，AIDD 获得了蓬勃发展的势头。有趣的是，“AIDD”一词在文学、公共演讲和媒体中获得了很高的“引用”。然而，必须了解 CADD 和 AIDD 之间的根本区别，以便更好地了解两者可能对药物发现项目做出贡献的最佳应用领域。AIDD 利用现有公共或专有数据存储库中的大型数据集，通过模式识别和预训练的机器学习模型来识别新的预测。一项革命性贡献是 Google DeepMind 的 Alphafold平台对蛋白 3 维结构进行了蛋白质组范围的预测，使得基于结构的虚拟配体发现的规模明显优于湿实验结构。另一方面，生成模型的开发和应用，例如变分自动编码器（VAE，variational autoencoders ）、生成对抗网络（GAN，generative adversarial networks）、化学语言模型（Chemical Language Model）、强化学习（reinforcement learning）、transformers和扩散模型(diffusion models)允许根据训练集的管理设计具有所需生物和物理化学特性的分子结构，机器学习算法可以从该训练集学习并生成新结构作为实验验证的假设（图 1B）。MOSES 和 GuacaMol 等基准数据集已发布，用于比较和验证生成模型。2019 年，Insilico Medicine 的研究人员发表了一篇开创性论文，描述了 DDR1 抑制剂的突破性发现，利用深度生成张量强化学习模型 (GENTRL，generative tensorial reinforcement learning model) 在短短 21 天内设计小分子。Insilico Medicine的AI靶点发现平台“PandaOmics”提出TNIK作为特发性肺纤维化（IPF）的新靶点。利用该公司的生成化学工具“Chemistry42”，一种新颖的结构生成和药物化学努力导致了INS018_055的发现和开发，该药物目前正处于II期试验中。图 1. (B) 通过深度学习进行分子生成。经过近十年的观望之后，我们也看到人工智能公司的几款候选药物“逐渐退出”：Exscientia-21546（一种高效、选择性的 A2AR 拮抗剂）的进一步进展在 I/II 期研究后被终止， BenevolentAI 在 2 期试验后终止了 BEN-2293，这是一种治疗特应性皮炎的泛 Trk 抑制剂。自 2012 年以来，十多家人工智能初创公司和生物技术公司在人工智能竞赛中经历了十多年的孵化和融资（图 1C）。从交易角度来看，新靶标和分子实体发现的加速吸引了大型生物制药公司和专注于人工智能的生物技术公司之间的重要合作伙伴关系。图 1. (C) 过去十年人工智能公司演变的示例（非详尽）。毫无疑问，未来AIDD会成为医药行业的主流（表1），但在“人工智能造（AI-made）”药浪潮到来之前，还有几个问题需要解决：第一，我们能否获得高质量的数据让人工智能模型学习有意义的模式并做出相应的预测？其次，人工智能真的能理解生物学吗？对于它自己的科学领域来说，生物学已经足够复杂了？这个基本问题涉及人工智能是否能够发现疾病适应症的真正新靶点的争议点。第三，生成化学（generative chemistry）真的能在训练空间之外设计出活性分子吗？基于蛋白质结合袋的分子从头生成可能会解决仅基于配体作为训练集的分子生成的问题(Nat. Commun. 2024, DOI: 10.1038/s41467-024-46569-1)。表 1. 人工智能发现/设计的处于临床阶段的小分子的示例（非详尽）尽管不断取得进步和成功案例，但 CADD 和 AIDD 都面临挑战。需要开发一种经济实惠的方法，让学术界和初创生物技术公司对来自超大型筛选的虚拟筛选命中进行排序，从而以经济的方式对虚拟命中进行优先排序，并且可以提高预测的准确性。最近，研究人员提出了溶剂化项的处理和 GBMV 方法，以消除虚拟筛选中的“作弊分子（cheating molecules）” (Nat. Commun. 2024, DOI: 10.1038/s41467-024-47613-w)。我们预计其他方法可以解决该领域的这些差距。CADD 和 AIDD 已被证明可以为通常适合计算方法的靶标提供新颖的分子（例如 FIC 或 BIC）（例如，具有良好成药性的高质量结构、经过充分研究的生物学、可用的训练集分子）。然而，当涉及到对靶标几乎一无所知（高度新颖的靶标）时，应用机器学习进行命中发现、命中先导和先导优化的适用性和成功率仍然是个谜。对于涉及传统小分子抑制剂以外的模式的药物发现计划来说，情况正是如此。例如，尽管该领域不断取得进展，但预测 RNA 的 3D 结构仍然是一项重大挑战。尽管 AlphaFold3 对蛋白质显示出突破性的预测性能，但由于蛋白质和 RNA 之间的根本差异以及可用作训练集的稀疏结构数据，对 RNA 的准确结构预测仍然具有挑战性。事实上，考虑到 RNA 的性质，由于 RNA 的高度极性和动态特征，靶向 RNA本身的小分子可能很棘手。适合小分子RNA对接的评分功能还有待改进。分子胶，包括异双功能分子 (PROTAC) 和单价降解剂（内在降解剂），在过去 5 年中越来越受到小分子药物发现的关注。Cherkasov 的团队开发了一种 3D 建模和深度学习的集成计算管线，用于 PROTAC从头设计的自动化。Monte Rosa 构建了名为 fAIceit 的人工智能算法，这是一种超快引擎，能够筛选数千种蛋白质，以确定具有称为“降解决定子”的结构特征的蛋白质，从而允许 E3 连接酶识别和降解它们。生成式人工智能（generative AI ）是否可以在不久的将来提供针对 RNA 和分子胶的有前景的小分子，还有待观察。展望未来，CADD 和 AIDD 的未来似乎充满希望，潜在的重点是利用 AIDD 技术补充此前的物理的特性，同时减轻这些计算方法带来的警告。有趣的是，2013 年诺贝尔化学奖授予了 Martin Karplus、Michael Levitt 和 Arieh Warshel，以表彰他们为复杂化学系统开发的多尺度模型(multiscale models)。今年，“人工智能教父”Geoffrey Hinton和John Hopfield因其在人工神经网络方面的工作而共同荣获 2024 年诺贝尔物理学奖。与此同时，2024 年诺贝尔化学奖被授予 David Baker、Demis Hassabis 和 John Jumper，以表彰他们在蛋白质设计和复杂蛋白质结构预测方面的贡献。对于科学领域的人工智能来说，这是非常重要的一年啊！未来几年，我们将见证CADD和AIDD“牵线搭桥”的浪潮，为加速药物发现和开发提供前所未有的机遇。参考：10.1021/acs.jmedchem.4c02462 end 本公众号声明： 1、如您转载本公众号原创内容必须注明出处。 2、本公众号转载的内容是出于传递更多信息之目的，若有来源标注错误或侵犯了您的合法权益，请作者或发布单位与我们联系，我们将及时进行修改或删除处理。 3、本公众号文中部分图片来源于网络，版权归原作者所有，如果侵犯到您的权益，请联系我们删除。 4、本公众号发布的所有内容，并不意味着本公众号赞同其观点或证实其描述。其原创性以及文中陈述文字和内容未经本公众号证实，对本文全部或者部分内容的真实性、完整性、及时性我们不作任何保证或承诺，请浏览者仅作参考，并请自行核实。

100 项与 DSP-0038 相关的药物交易

登录后查看更多信息