会议推荐
2026第三届中国医药企业项目管理大会
2026第二届中国AI项目管理大会
2026第十五届中国PMO大会
2026第五届中国项目经理大会
本
文
目
录
1、【热点研究】计算机辅助药物设计的数字前沿探索:现状、挑战与末来展望
2、跟我学药物设计 | 计算机辅助药物设计的起源及发展
3、计算机辅助药物设计的智能化与自动化发展
4、勃林格殷格翰的计算机辅助药物设计
一、【热点研究】计算机辅助药物设计的数字前沿探索:现状、挑战与末来展望
(天津市医药科学研究所)
计算机辅助药物设计(CADD)自20世纪60年代起步以来,已经发展成为现代药物研发不可或缺的工具。随着计算机科学和生物化学的快速发展,计算机辅助药物设计已经彻底改变了新药研发的传统模式。尽管CADD的概念早在1960年代就已出现,但直到1980年代初才正式确立。在过去的几十年中,CADD已经发展成为一个能够显著提升药物设计效率、降低研发成本和缩短开发周期的关键技术平台。
现代药物发现是一个复杂的跨学科过程,涉及计算化学、结构生物学、化学生物学、药理学和有机合成等多个领域。这个过程包含多个关键阶段:从靶点识别开始,经过靶点验证、先导化合物识别和优化,最终进入临床前和临床试验阶段。在这个漫长的过程中,CADD在每个环节都发挥着重要作用。
基于结构的药物设计
基于结构的药物设计(SBDD)是现代药物研发中的一个重要方法,主要通过研究目标分子(如蛋白质、受体或酶)的三维生物结构来设计和优化新药。通过深入理解目标分子的形状、电荷分布和结合位点,研究人员能够设计出与目标分子精确互作用的药物候选物。最近《自然通讯》(Nature Communications)上发表的一项突破性研究提出了"序列到药物"的创新概念,这种方法不再依赖传统的三维蛋白质结构,而是直接利用蛋白质序列信息进行药物设计。研究团队开发的Transformer CPI2.0作为核心工具,展示了出色的通用性,能够处理各种蛋白质和化合物的相互作用。SBDD最成功的应用之一是在抗HIV药物的开发中,通过分析病毒蛋白(如反转录酶和蛋白酶)的三维结构,科学家们成功开发出了利托那韦、沙奎那韦和洛匹那韦等药物,这些药物通过与病毒酶的特定位点结合,有效抑制了病毒的复制。另一个重要进展是基于片段的药物设计方法,这种方法从能与靶蛋白结合的小分子片段开始,通过逐步优化和扩展,最终开发出具有更好结合亲和力的更大分子化合物,已产生了30多个临床药物候选物,其中3个已获得FDA批准用于肿瘤治疗。这些进展表明,SBDD正在经历从传统方法到创新技术的转变,为药物研发提供了更多可能性和机会,推动着医药领域的持续发展。
基于配体的药物设计
基于配体的药物设计(LBDD)是一种重要的药物发现方法,它通过研究小分子(配体)与生物靶标的相互作用来指导药物开发。与基于结构的药物设计不同,LBDD主要利用配体的特性和相互作用,通过药效团建模来识别必要的特征,如氢键供体、受体或疏水区域。这种方法可以生成预测模型,用于优化先导化合物。近期的一个重要进展是CSP-SAR方法,它采用新型三维定量构效关系方法,通过构象采样药效团来生成预测模型。LBDD在多个治疗领域都取得了显著成功,其中最具代表性的是用于治疗类风湿性关节炎和骨关节炎的氟比洛芬,以及针对耐甲氧西林金黄色葡萄球菌(MRSA)感染的新型抗生素噁二唑类化合物。这些成功案例突显了LBDD在开发具有治疗价值的化合物方面的重要作用,展示了其在满足未满足医疗需求方面的巨大潜力。
人工智能的融入与创新
人工智能技术的引入为CADD带来了革命性的变化。深度学习架构如DeepCPI、DeepDTA等的应用,使得药物靶点识别和相互作用预测的准确性得到显著提升。机器学习算法如随机森林、支持向量机和梯度提升树的运用,则为特征选择和预测模型的构建提供了强有力的工具支持。
面临的挑战
尽管CADD取得了显著进展,但仍面临着多重挑战。首先是技术层面的挑战,包括生物系统的复杂性、计算资源的限制以及准确建模的难度等。其次是资源管理方面的问题,如何高效管理和利用大型化合物库、如何优化数据处理流程等。此外,在伦理层面,确保治疗效益大于风险、保护患者隐私等问题也需要认真考虑。
未来发展趋势
CADD的未来发展主要集中在四个方向:首先是技术升级,特别是量子计算的引入有望带来突破性进展;其次是环境友好性的提升,包括发展生态友好的设计方法和提高能源效率;第三是人工智能的深度整合,进一步提升预测模型的准确性;最后是多靶点药物设计的发展,以应对复杂疾病的治疗需求。
结论
计算机辅助药物设计已经成为现代药物研发的核心驱动力,通过整合先进计算方法、人工智能技术和生物学知识,显著提高了药物设计的效率和准确性。尽管仍面临诸多挑战,但随着新技术的不断涌现,CADD的发展前景十分广阔。特别是在人工智能和量子计算等新兴技术的推动下,CADD必将在解决复杂疾病和开发创新治疗方案方面发挥更加重要的作用。
参考文献:
[1] Kumari N, Hasija Y. CADD:-Exploring the Digital Frontier in Drug Designing[C]//2024 3rd International Conference on Computational Modelling, Simulation and Optimization (ICCMSO). IEEE, 2024: 272-277.
二、跟我学药物设计 | 计算机辅助药物设计的起源及发展
(原创 氢键 殷赋科技)
殷赋科技团队从上一期开始推出了基础学习、经典阅读、计算方案、案例讨论、科研时事等主题专栏文章。让我们共同夯实基础,开拓思路,在殷赋云计算平台上做出更好的科研成果。
本期是【跟我学药物设计】专栏第二篇文章,我们将对药物研究模式的转变、药物设计思想的起源、计算机辅助药物设计概述和计算机辅助药物设计的发展过程等方面展开介绍。
01
药物研究模式的转变
回顾药物研究的历史,20世纪60年代,药物发现的最主要途径是药物筛选。研究人员通过在动物疾病模型上做实验,筛选出先导化合物,进行作用靶点研究、构效关系分析、结构优化与修饰,进而发现新的化学实体,并开发出新药。20世纪90年代中期至今,随着计算机技术及分子生物学、药物化学和计算化学等学科的发展,药物发现进入了理性设计阶段。药物化学家依据结构生物学、酶学、分子生物学及遗传学等生命科学的研究成果 , 针对这些基础研究中所揭示的与疾病过程相关的潜在药物作用靶标(酶、受体、离子通道及核酸等),参考药物作用靶点、内源性配体以及天然底物的化学结构特征 ,借助计算机和一些新理论、新方法进行药物分子设计 , 以发现选择性作用于靶点的新药。这些药物往往具有活性强、作用专一 、副作用低的特点【1】。合理药物设计(Rational Drug Design)是目前新药研究的主要方向。
02
药物设计思想的起源
药物设计的思想起源于19世纪末,在过去的一百多年,经历了四个里程碑式的发展阶段,现介绍如下:
1) 德国化学家Emil Fischer。他在1894年提出锁钥模型(Lock-and-Key Model),即酶(锁)对底物(钥匙)的专一性源自其几何形状的互补性。这种“锁钥”模型是现代“分子对接”和“基于结构药物设计”思想的起源。
图1. 锁钥模型示意图
2)德国细菌学家和免疫学家Paul Ehrlich。他在1908年研究细胞染色时,提出了受体(Receptor)的概念。Paul认为“魔弹”能专一性作用于引起疾病的细菌,并摧毁之,但对患者其它器官无害。这个思想是“化学疗法”的起源,现代“靶向药物”的概念也是由此发展而来的。
3)美国化学家Corwin Hansch。1964年,他在A. C. Brown和 T. R. Fraser 提出的“物质的生理作用是其化学组成和成分的函数”的设想之上提出了基于配体的药物设计思想——定量构效关系(Quantitative Structure-Activity Relationship,QSAR),并进一步阐述了这一方法,使得“基于配体的药物设计”成为现实。
4)美国药物化学家Irwin Kuntz。他针对小分子与大分子发生相互作用的方式率先提出了分子对接(Molecular Docking)的概念,并在1982年开发了第一个分子对接软件DOCK, 使得“基于结构的药物设计”成为现实。
图2. UCSF DOCK 分子对接软件
03
计算机辅助药物设计概述
计算机辅助药物设计(Computer-Aided Drug Design,CADD)是近年来发展起来的研究与开发新药的一种崭新技术,它大大加快了新药设计的速度,节省了创制新药工作的人力和物力,使药物学家能够以理论为指导,有目的地开发新药。CADD是一个相当大的论题,涉及到结构化学、药物化学、分子药理学、生物化学、结构生物学、分子生物学、化学生物学、细胞生物学、生理学、病理学、生物物理学、组合化学、量子化学、分子力学、分子动力学、分子图形学、计算化学、化学信息学、生物信息学、X射线晶体学、核磁共振技术、计算机图形技术、数据库技术和人工智能技术等基础学科和应用学科与技术。融合这些学科知识与技术,CADD在药物作用和药理活性预测、药效基团研究、药物构效分析、全新药物设计、高通量虚拟筛选及合成数据库设计等方面展示了强大的威力,大大地提高了药物设计水平,并趋向于定向化和合理化,开辟了广阔的前景【2】。目前,CADD技术几乎覆盖了从靶标识别与确证、先导化合物发现与优化到临床前药物研究与开发的全过程。
图3. CADD 的部分应用场景
04
计算机辅助药物设计的发展过程
计算机辅助药物设计的发展阶段起始于20世纪60年代Hansch提出的定量构效分析方法(QSAR)。早期,药物化学家对疾病靶标结构的知识了解有限,因此发现先导化合物的过程通常是依赖偶然发现和随机筛选。药物设计的思想在这个阶段主要用于对先导化合物进行定向结构修饰,然后进行QSAR分析,以便发现活性更好的衍生物。在这个阶段,药物化学家的经验对结构优化非常重要,因此被称为经验药物设计阶段。
20世纪90年代初期,随着计算机技术的发展和分子图形学的出现,加上结构生物学的兴起,药物设计虽然还是广泛应用于对先导化合物的优化阶段,但是已经发展到基于生物大分子三维结构的药物设计方式。药物化学家采用“锁钥模型”,把药物的化学和生物学特性有机结合起来,合理设计药物,因此这个阶段被称为合理药物设计阶段【3】。
20世纪90年代中期,组合化学和高通量筛选的发展使得药物设计从先导化合物的优化阶段进入到先导化合物的发现阶段。与此同时,计算机虚拟组合化学库设计以及基于分子对接(Molecular Docking)和药效团(Pharmacophore)的数据库虚拟筛选(Virtual Screening)技术使得大量数据可以在计算机上进行预筛选,减少了实验合成和筛选的化合物数量,显著提高了药物研发的成功率。在这个阶段,“类药性”(Drug-Likeness)概念、“五倍率”(Rule-of-Five)经验规则、ADMET(药物的吸收、分布、代谢、排出和毒性)性质也逐渐被发展出来并被广泛应用到药物分子设计的过程当中【4】。
20世纪90年代中期开始至21世纪初,基因组学、蛋白质组学、生物信息学的发展为药物化学家提供了大量潜在的疾病靶标,药物设计进入到生物学驱动的后基因组时代。药物化学家需要充分研究靶标的生物学功能,并寻找与之匹配的小分子化合物,以便迅速有效地发现新型靶标和新型先导化合物。2010年以来,系统生物学的快速发展,启发了网络药理学、系统药理学等新概念的诞生,为复杂疾病的精准治疗带来了希望。
图4. 计算机辅助药物设计的流程【5】
05
总结
从药物研究模式和设计思想的发展以及计算机辅助药物设计(CADD)的发展历程可以看出,从事药物设计研究需要具备丰富的药物化学相关知识和熟练的药物设计软件使用经验。工欲善其事,必先利其器。殷赋科技在生物医药计算领域积累了丰富的经验,并且开发出了简单易用、智能友好的云计算平台,让科研工作者足不出实验室,便能得到计算专家的倾力协助,突破药物设计过程中的计算关卡。
参考文献
[1] Hubbard R E. Can drugs be designed. Curr Opin Biotech., 1997. 5:1139.
[2] Bajorath J. Computer-aided drug discovery [version 1]. F1000Research 2015, 4:630
[3] Gane P J, Dean P M. Recent advances in structure-based rational drug design. Curr. Opin. Struct. Biol., 2000, 10:401-404.
[4] Lipinski C A, Lombardo F, Dominy B W, et al. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv. Drug Del. Rev., 1997, 23: 3-25.
[5] https://doi.org/10.1016/j.ejmech.2021.113705
三、计算机辅助药物设计的智能化与自动化发展
(原创 LY-Drug NCS)
一、引言
传统药物研发周期长(10-15 年)、成本高(10-20 亿美元)、成功率低于 10%。计算机辅助药物设计(CADD)融合计算化学、生物学与计算机科学,随 AI 技术(深度学习、机器学习)发展升级为 AI 药物设计(AIDD),显著提升研发效率,加速靶点识别、候选药筛选等环节,降低风险与成本。本文聚焦 CADD 智能化自动化发展,涵盖历程、关键环节、理论框架、产业应用及趋势。
二、计算机辅助药物设计的发展历程
2.1 早期发展阶段(20 世纪 70 年代 - 90 年代)
核心为定量构效关系(QSAR):1964 年 Hansch 与藤田稔夫开创 QSAR,用热力学参数建结构 - 活性回归方程;1988 年 Cramer III 提出比较分子场方法(CoMFA),1989 年提出 “3D-QSAR”。成功案例:日本杏林公司基于 Hansch - 藤田模型研发抗菌药诺氟沙星。
2.2 基于结构的药物设计阶段(20 世纪 90 年代 - 21 世纪初)
依托 X 射线晶体学、核磁共振获生物大分子三维结构,推动基于结构的药物设计(SBDD)。理论方面,1994 年 Fisher “锁钥原理”、1959 年 Koshland “诱导契合” 学说奠定基础。成功案例:1996 年首款 SBDD 药物碳酸酐酶抑制剂上市;伊马替尼(首个靶向抗癌药)、多奈哌齐(阿尔茨海默病治疗药,3D-QSAR 辅助设计)。
2.3 人工智能融入药物设计阶段(21 世纪初至今)
2010 年后 Insilico 等公司推动 AIDD;2016-2019 年 ATOM、MLPDS 等联盟成立。关键突破:2020 年 AlphaFold2(蛋白结构预测)、DSP-1181(首个临床 AI 药物);2021 年 ISM001-005(AI 全流程设计 IPF 药物)、halicin(AI 发现广谱抗菌药);2023 年 “分子工厂”(中国药科大学 AI 设计流程);2024 年 ADMET-AI(快速 ADMET 预测平台)。
三、计算机辅助药物设计的关键环节与智能化进展
3.1 靶点发现与验证的智能化
•数据挖掘预测:SPiDER 模型(SOM 算法)识别靶点;MT-DTI 模型(DL)预测药物 - 靶点结合亲和力(如抗 SARS-CoV-2 药物)。
•深度学习结构预测:AlphaFold2(氨基酸序列→蛋白三维结构)、RGN 工具(键角预测)。
•相互作用预测:CNN、GNN 模型捕捉作用模式,MT-DTI 为典型案例。
3.2 分子对接的智能化与自动化
•方法演进:刚性→半柔性(主流)→柔性对接,工具含 AutoDock、GLIDE 等。
•深度学习对接:Q-N 对接(强化学习)、DSDP/Diffdock(2025 主流,直接预测结合构象),如 Xue 等用 AI 筛选曲古抑菌素 A。
•自动化流程:靶点预处理→结合位点预测→构象优化→对接计算→结果分析,AI 降低资源消耗。
3.3 分子生成的智能化方法
•核心模型:VAE(无监督生成)、GAN(对抗训练)、RNN/LSTM(序列处理)、Transformer(全局依赖)。
•工具平台:MolAIcal(3D 药物设计)、ReLeaSE(强化学习)、“分子工厂”(多模式设计)。
•案例:halicin(广谱抗菌)、RG-10(抗耐药 Menin 抑制剂,IC50 优化)。
3.4 虚拟筛选的智能化与自动化
•分类:基于受体(依赖靶点结构)、基于配体(依赖活性配体)、基于蛋白 - 配体相互作用。
•机器学习方法:SVM、随机森林等,速度达每日 10⁶分子(传统 10³),准确率超 80%。
•平台与案例:ADMET-AI(3.1 小时预测百万分子)、Schrödinger 平台(SGR-1505 筛选);恩西曲韦(抗 COVID)、福尔索司他(NASH 治疗)。
3.5 多靶点优化的智能化方法
•挑战:计算复杂、数据稀缺、靶点互作复杂、多目标平衡。
•方法:多任务学习、多目标优化(NSGA-II)、GNN、强化学习。
•案例:DSP-0038(抗精神分裂双靶点药)、赛诺菲双特异性糖尿病药。
四、计算机辅助药物设计的理论框架与方法
4.1 定量构效关系(QSAR)
•基础:结构决定活性,步骤为数据准备→特征提取→特征选择→模型构建→验证。
•分类:按维度(1D-6D,如 3D-QSAR 含 CoMFA/CoMSIA)、按建模技术(线性 / 非线性)。
•AI 方法:ANN、SVM、GNN 等,如 GONG 等用 AI 筛选糖尿病候选药。
4.2 分子对接
•理论:分子识别原理,目标为结合自由能最低。
•分类:按柔性(刚性 / 半柔性 / 柔性)、搜索算法(系统 / 启发式 / 局部)、评分函数(力场 / 经验 / 知识型)。
•深度学习对接:CNN(图像表示)、GNN(图结构)、混合方法,如 Q-N 对接。
4.3 分子动力学模拟(MDS)
•理论:牛顿运动定律,方程m_i\frac{d^2r_i}{dt^2} = -\nabla_{r_i}U。
•步骤:系统构建→能量最小化→平衡→生产运行→数据分析,应用于蛋白构象、结合机制研究。
•AI 加速:神经网络势函数(SchNOrb)、增强采样、模拟结果预测。
4.4 基于深度学习的药物设计
•模型:CNN(图像)、RNN/LSTM(序列)、GNN(分子图)、VAE/GAN(生成)、Transformer、强化学习。
•案例:AlphaFold2、halicin、“分子工厂”、ADMET-AI。
五、计算机辅助药物设计的产业应用与案例
5.1 应用现状
•范围:靶点发现、先导药筛选 / 优化、ADMET 预测、临床试验设计、药物再利用等。
•模式:自主研发(大型药企)、合作研发(赛诺菲 - Exscientia)、技术授权(Schrödinger)、风险投资(NVIDIA-Recursion)。
•效益:周期缩短、成本降低 30%+、成功率提升、新机制药物发现。
5.2 AI 制药企业
•模式:全程自研(Recursion)、合作研发(Exscientia)、技术输出(Schrödinger)。
•案例:Exscientia(DSP-1181/DSP-0038)、Insilico(ISM001-005)、BenevolentAI(巴瑞替尼再利用)。
•平台:Centaur(Exscientia)、Prime/Maestro(Schrödinger)、PhenoGraph(Recursion)。
5.3 药企与 AI 公司合作
•模式:联合研发、技术授权、股权投资、多项目合作。
•案例:赛诺菲 - Exscientia(糖尿病药)、百时美施贵宝 - VantAI(分子胶)、罗氏 - Freenome(癌症早筛)。
5.4 重大疾病应用
•癌症:RG-10(Menin 抑制剂)、多靶点抗癌药。
•神经退行性疾病:Aβ/Tau 蛋白靶向药、血脑屏障优化。
•心血管疾病:他汀类似物、ACE 抑制剂。
•传染病:恩西曲韦(抗 COVID)、halicin(抗菌)。
六、计算机辅助药物设计的未来发展趋势
6.1 发展方向
•深度学习:多模态学习、自监督学习、迁移学习。
•自动化平台:端到端自动化、人机协作、自动化实验、云平台。
•多尺度融合:量子力学 - 分子力学 - 粗粒化模拟、多学科交叉。
•个性化设计:个体基因组药物、疾病亚型药、数字孪生。
6.2 挑战与对策
•数据:质量(标准化流程)、稀缺(迁移学习)、孤岛(共享平台)。
•模型:可解释性(注意力机制)、泛化性(鲁棒架构)、效率(轻量模型)。
•实验:预测差距(多模型集成)、成本(优化实验设计)、多参数(Pareto 优化)。
•伦理监管:隐私(伦理审查)、标准(监管框架)、知识产权(法规完善)。
6.3 未来展望
全流程自动化、多组学整合、AI 与传统方法融合、量子计算应用(加速模拟)、应用拓展(难成药靶点、新型药物、个性化医疗)。
七、结论
CADD 已从传统方法升级为 AIDD,通过 AI 技术(AlphaFold2、“分子工厂” 等)实现全环节智能化,显著提升研发效率。产业中形成多元应用模式,虽面临数据、模型等挑战,但未来将通过技术融合实现全流程自动化,为创新药物研发提供高效解决方案,助力人类健康。
四、勃林格殷格翰的计算机辅助药物设计
(原创 我在西游你在红楼 AIDD Pro)
引言
计算机辅助药物设计(CADD)是勃林格殷格翰(BI)研究机构药物发现项目的重要组成部分。CADD 科学家与不同治疗领域的药物化学家密切合作,应用从化学信息学到分子建模等一系列技术。他们的工作包括基于结构和配体的药物设计、预测建模、虚拟筛选、苗头化合物选择、组合库设计和毒性预测。计算机辅助设计与开发部门还为项目团队提供技术和决策支持解决方案。计算生物学小组负责处理生物信息学任务,而 CADD 主要侧重于小分子药物发现,偶尔也为生物制剂研究提供支持。
除了为 BI 主要研究基地的特定项目提供支持外,计算机辅助设计与开发部还实施了一种全球方法,为所有基地制定战略、分享最佳实践、工作流程、协议和软件解决方案。这种全球视角体现在计算化学框架 (CCFW)、内部虚拟筛选平台和预测模型全球基础设施上。CADD 科学家积极推动项目进展,与药物化学家合作,并开发影响项目决策的技术。
CADD在药物设计中的作用
勃林格殷格翰公司(BI)的 CADD 科学家在药物发现项目中扮演着三个关键角色:项目贡献者、数据分析师和技术推动者。
作为项目贡献者,他们利用计算化学来识别新型化合物、指导寻找新药计划、分析筛选结果并帮助优化先导化合物。
数据分析师的工作包括将实验数据转化为化合物发现和优化的假设。CADD 科学家使用 Pipeline Pilot 和 KNIME 等工具处理和分析数据,并采用机器学习和聚类等技术。他们还汇编项目相关数据,并进行跨项目数据分析,以确定潜在的非靶点,并对苗头化合物集进行分流。
CADD 科学家的第三个作用,也是越来越重要的一个作用,是让药物化学家能够独立使用计算机辅助药物设计工具。BI 的药物化学家与计算化学家合作设计化合物,并独立使用一些 CADD 设计工具。药物化学家接受了使用某些 CADD 工具的培训,并对相关方法有了充分的了解。这激发了有关化合物设计的新型计算工具的讨论,并简化了 CADD 与药物化学之间的协调。药物化学家手中的 CADD 工具可以在合成可及性和化合物概况要求的限制条件下快速迭代设计思路,从而加快总体设计周期。
BI 鼓励使用先进的 CADD 技术(如分子动力学模拟),并积极监测该领域的发展趋势。与学术合作伙伴的合作对于推动技术和方法的发展至关重要,通常会将学术界开发的工具整合到内部工作流程中。
化合物设计与协作的通用平台
3.1 增强团队合作,提高效率
勃林格殷格翰公司(BI)的 CADD 科学家、结构生物学家和药物化学家共享一个通用平台,作为协作和化合物设计的强大工具。该平台以通用格式促进了假设和想法的共享,从而简化了决策流程。虽然 MOE 等分子建模工具非常复杂,但它们具有广泛的定制能力,可以开发新的模块。然而,要充分利用这些工具,往往需要计算化学家和 IT 专家所掌握的专业技能。3.2 全球协调部署 MOE
生物研究所成立了一个全球 MOE 工作组,负责协调三个研究基地的 MOE 工具和功能的部署。标准化的部署程序确保了 MOE 版本和 BI 特定定制功能在全球范围内的高效分发。特定站点的设置是独立配置的,菜单和库是根据启动 MOE 会话的站点加载的。外部工具(如属性和 ADME 描述符)可通过通信元层无缝集成到 MOE 中。
BI 为药物化学家引入了计算工具,包括基于 DFT 的扭转分析工具,可交互式评估化合物构象。该工具在高性能计算集群上使用QM计算,并以MOE、MOE数据库和Excel格式提供结果。此外,还有一项服务是根据 ab initio 计算估算化合物的诱变潜力。这些工具使药物化学家有能力执行复杂的任务,前提是能将它们标准化为常规工作流程。
BI 提供的对接工具利用 GOLD 和 CORINA 进行 2D-3D 转换。计算化学专家可以准备和优化 GOLD 配置文件和预对齐的蛋白质结构。药物化学家可以通过网络界面选择各种对接协议,提交输入文件进行自动对接。对接结果会以可用格式返回,同时还会提供性质预测,以帮助决策。3.3 三维结构数据自动化工作流程
BI 建立了一个自动工作流程,用于在项目主文件中编译三维结构数据。该工作流程包括计算晶体学堆积环境、质子化结构和排列蛋白质链等任务。为了便于使用,我们对结构进行了注释、分组和定制,使药物化学家能够在化合物设计中随时访问和利用相关的结构信息。
利用预测建模和 MMP 分析进行化合物设计
4.1 针对 ADMET 终点的预测建模
在勃林格殷格翰公司(BI),针对吸收、分布、代谢、排泄和毒性(ADMET)终点的预测建模在加速化合物设计-学习周期方面具有重要意义。勃林格殷格翰公司构建和共享虚拟模型的方法遵循以下原则:
频繁更新模型: 模型会自动重新训练和更新,以纳入最新数据。这可确保使用最新数据进行预测,从而随着时间的推移提高预测的准确性。
置信度估计:预测附有置信度估计,为管理预期提供了一种可解释的方法。在决策过程中,置信度低于一定阈值的预测通常会被忽略。
早期人体剂量预测:人体剂量预测是根据体外稳定性和药效数据进行的。最初的预测包括分布容积、血浆蛋白结合力和有效剂量,之后再根据实验数据加以完善。
与其他工具整合:预测的特性与其他建模输出(如对接结果)无缝集成,提高了其在化合物设计中的可用性。4.2 标准化模型部署
虽然许多模型都是在各个站点为本地目的建立的,但 BI 通过元层实现了模型部署和访问的标准化。这样,模型就能在本地和全球使用之间轻松切换,并能集成到各种前端工具中,包括 MOE、Marvin、Knime 和 Pipeline Pilot。基于 Python 的模型构建框架针对速度进行了优化,化学家可以在几秒钟内获得预测结果,并将预测模型集成到交互式合成规划中。4.3 关注相关终点
商业智能侧重于利用大量可用数据预测终点,采用随机森林和支持向量机等机器学习技术。最近的重点是改进对人体剂量预测至关重要的参数模型,如体外清除率、分布容积和血浆蛋白结合率。4.4 集成到决策工作流中
生物技术研究所正积极致力于将预测模型整合到项目团队的决策工作流程中,以加快化合物的开发进度。虚拟模型与实验检测并行,指导化合物进入下一阶段的筛选级联。作为简化决策的整体标准,对早期人体剂量预测进行了探索。4.5 用于SAR和化合物设计的MMP分析
通过采用匹配分子对(MMP)转换,BI 能够以更生动的方式挖掘内部数据。MMP 分析支持 SAR 分析和化合物设计,可显示特定项目的匹配分子系列,并提供分子转换统计分析及其对溶解度或代谢稳定性等参数的影响。这些分析使药物化学家能够将有利的虚拟转化应用到正在进行的设计活动中,而且 MMP 方法已扩展到肽。
整合计算工具:计算化学框架 (CCFW)
将功能强大的计算工具无缝集成到药物化学应用中需要计算化学(CADD)和信息技术两方面的专业知识,以确保工作流程的稳健性和科学性。为了缩小这两个领域之间的差距,勃林格殷格翰公司(BI)开发了计算化学框架(CCFW),作为一个中心枢纽。5.1 灵活连接前端和后端
CCFW 作为中间层,可将药物化学家使用的前端应用程序(如 Marvin、Spotfire、D360)与后端计算化学计算引擎连接起来。CCFW 利用标准化参数和文件交换格式,将 CADD 任务封装到网络服务中,而不是创建一个单一的集成系统。5.2 独立于客户端和模块化 CCFW 独立于客户端和模块化
CCFW 与客户端无关,可通过应用程序接口或插件由选定的前端触发。这意味着可从不同的客户端应用程序访问房产计算器和其他服务,而无需为同一任务提供多个后端服务。标准化的调用和结果可确保后端修改无需对前端进行更改。5.3 效率与协作
CCFW 的开发需要 CADD 科学家、IT 专家和药物化学家的通力合作。通常基于命令行或工作流的后端引擎被集成到 CCFW 中,以提供自动化和标准化服务,从而提高药物化学社区和 CADD 科学家的效率。
利用虚拟筛选和 BICLAIM扩大发现新药的范围
在勃林格殷格翰公司(BI),虚拟筛选(VS)在发现新药方面发挥着至关重要的作用。勃林格殷格翰公司采用快速、适应性强的基于配体和结构的虚拟筛选工作流程来进行量身定制的初始发现和迭代跟进活动。这些工作流程旨在适应各种早期药物发现目标和检测。
为了拓展内部和商业化合物数据库所涵盖的化学空间,BI 开发了 BI 可访问和创新分子综合库 (BICLAIM)。它包含从公司化合物数据库和商业资源中计算提取的库核和试剂,横跨广阔的组合化学领域。BICLAIM 包含近 90,000 个核心和数万种试剂,可提供超过 10^17 种化合物。
为挖掘 BICLAIM 空间,我们开发了多种搜索方法。其中包括二维特征树和用于三维匹配的 ROCS。这些方法已成功鉴定出新型化学实体,如 GPR119 激动剂和 CDK2 抑制剂。
此外,还可使用 PharmShapeCC 软件对 BICLAIM 空间进行直接三维搜索,从而进行药理和形状互补性搜索。BI 还利用 ROCS 在部分枚举的 BICLAIM 子空间中实现了三维搜索。库核和构件的选择是 CADD 科学家、组合化学专家和药物化学家共同努力的结果。
BICLAIM 是 BI 的全球资源,由所有研究机构共同维护和开发。其他内部开发成果,如从头设计程序 BiBuilder 和基于 Python的模型构建框架,可跨研究机构使用,促进了团队间的预测建模和工作流程交流。
结束语与展望
在化合物分析中使用新型预测模型的情况激增,影响了药物发现项目中有关化合物进展的决策。计算工具的普及改变了项目团队中 CADD 科学家与药物化学家之间的合作。越来越多与 CADD 相关的自动化任务变得可以为药物化学家所管理,同时又不影响建模结果的质量。这不仅简化了决策过程,还让 CADD 科学家有更多时间开发可应用于项目推进和创新设计理念的先进技术,或解决传统上不属于 CADD 范畴的问题。
生物技术研究所采用的一项独特技术是将大规模组合化学与虚拟筛选相结合,以便在药物发现项目的早期确定药物的苗头化合物和先导化合物。虽然与其他行业相比,计算设计在制药行业中的作用较小,但对速度、效率和解决前所未有的目标的需求正在推动 CADD 在药物设计和发现中发挥更大的影响力。CADD 的影响力取决于将结果转化为可操作的见解,并为药物化学家提供有关化合物开发下一步的可靠建议。
为了提高 CADD 的影响力,有必要在开发更准确、更强大的预测方法方面持续投资,并通过增加实验数据的获取来提供支持。将 ChEMBL 等公共数据源整合到内部数据中可进一步增强预测能力。此外,制药公司意识到共享竞争前数据的重要性,这为建立更准确、适用范围更广的预测模型提供了机会。云计算资源的可用性有望促进计算密集型方法的大规模开发和应用。
与学术团体的合作仍将是扩大 CADD 工具箱和探索新方法的关键。众包计划为解决出现的具体挑战提供了获得不同科学人才的途径。现代药物发现越来越多地涉及前所未有的低可药性靶点,如蛋白质-蛋白质相互作用或 RNA 结合。这些挑战需要超越传统小分子的创新化学设计方法。有了 CCFW 这样强大的计算基础设施、强大的外部科学网络和明确的 CADD 科学家角色,BI 完全有能力应对药物发现领域不断变化的挑战。
参考文献:Muegge, I., Bergner, A. & Kriegl, J.M. Computer-aided drug design at Boehringer Ingelheim. J Comput Aided Mol Des31, 275–285 (2017). https://doi.org/10.1007/s10822-016-9975-3
end
本公众号声明:
1、如您转载本公众号原创内容必须注明出处。
2、本公众号转载的内容是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请作者或发布单位与我们联系,我们将及时进行修改或删除处理。
3、本公众号文中部分图片来源于网络,版权归原作者所有,如果侵犯到您的权益,请联系我们删除。
4、本公众号发布的所有内容,并不意味着本公众号赞同其观点或证实其描述。其原创性以及文中陈述文字和内容未经本公众号证实,对本文全部或者部分内容的真实性、完整性、及时性我们不作任何保证或承诺,请浏览者仅作参考,并请自行核实。