——背景——蛋白质合成和降解是生命中至关重要的过程。在真核细胞中,胞内蛋白降解主要通过泛素-蛋白酶体系统(ubiquitin-proteasome system,UPS)。UPS包括泛素活化酶(E1)、泛素结合酶(E2)、泛素连接酶(E3)、泛素、26S蛋白酶体和靶蛋白。目前,靶向蛋白质降解(targeted protein degradation,TPD)已成为药物开发的热点。根据作用机制和化学结构,蛋白质降解剂可分为两类:双功能分子降解剂(bifunctional degrader)和分子胶水降解剂(molecular glue degrader)。PROTAC(proteolysis-targeting chimera)是双功能降解剂的重要代表,它由E3连接酶配体和目的蛋白(protein of interest,POI)配体组成,通过柔性或刚性linker连接。这种设计使靶标和E3连接酶邻近(proximity),促进POI的泛素化和随后蛋白酶体的降解。与传统的小分子抑制剂相比,PROTAC利用“事件驱动”降解过程而不是“占用驱动”结合机制。这种方法显著减少了对其目标作用模式的依赖。PROTAC需要POI配体而不是传统意义上的抑制剂,从而扩大了可药蛋白的范围。分子胶水是一类小分子,可以诱导两种蛋白质之间的紧密邻近,从而实现对蛋白质折叠、定位和降解的精确控制。分子胶水降解剂(MGD)诱导E3连接酶和底物蛋白质之间形成蛋白-蛋白相互作用,从而导致靶标蛋白质泛素化降解。与PROTAC不同,MGD只与E3连接酶或POI中的一个形成二元复合物,形成新的蛋白质-小分子界面,再与另一个蛋白结合。这种独特的机制允许MGD降解以前不可成药的靶标蛋白,而无需考虑结合口袋。由于没有Linker,MGD通常具有更小的分子量和更合适的药代动力学特性。迄今为止,PROTAC是理性设计的产物,而MGD通常被认为是偶然发现/高通量筛选得到的。MGD的理性设计具有挑战性,但目前已经取得了重大进展,比如通过特异性修饰CRBN配体,可以实现对单个靶点的选择性降解。针对GSPT1,IKZF1/3, IKZF2, CK1α、ZBTB16, WEE1和VAV-1的降解剂取得了显着进展,其中一些已经进入临床试验阶段。在下面的小节中,我们将重点介绍TPD研究进展和计算工具在该领域的应用,尤其是在“不可药”靶标中的应用。图1. 分子胶与PROTAC机制示意图。(A) PROTAC机制。PROTAC是双功能分子,由靶蛋白(POI)配体、linker和 E3泛素连接酶配体组成。PROTAC使靶蛋白和 E3 泛素连接酶紧密靠近,促进靶蛋白的泛素化,随后被蛋白酶体降解。(B) MGD 机制。免疫调节药物(IMiDs)是 MGD的代表。IMiDs重塑 CRBN(一种E3连接酶)表面,使其能够与新底物相互作用,促进新底物的泛素化,随后被蛋白酶体降解。——靶向蛋白降解的药物设计示例——RAS蛋白是重要的癌症靶标,但其表面光滑平坦,缺乏可药口袋,仅有的GTP结合口袋又与GTP的结合过于紧密,使得长久以来该靶点都被认为不可成药,直到Kevin Shokat课题组发现KRAS G12C可被共价调节。这一发现直接导致了Adagrasib和Sotorasib的上市。基于KRAS抑制剂开发的KRAS降解剂也随之出现。LC-2是首个诱导内源性KRAS G12C降解的PROTAC。它将KRAS G12C共价抑制剂MRTX849与VHL配体结合。与MRTX849相比,LC-2在某些细胞系中的抗增殖活性较弱,部分原因可能是共价结合剂与PROTAC事件驱动的特性相冲突。BI-2865是新一代pan-KRAS非共价抑制剂,对多种KRAS突变型均有抑制作用,基于该化合物开发的pan-KRAS降解剂ACBI3展现出强效抗肿瘤作用。磷酸酶是难成药靶标中的一大类,SHP2是其中重要的一员。其携带的PTP结构域带正电且在酪氨酸磷酸酶家族中高度保守。SHP2-D26是首个靶向SHP2的PROTAC,在多种细胞系中分别展现出纳摩尔DC50值。值得注意的是,在抑制癌细胞生长方面,SHP2-D26比对照的SHP2抑制剂更为有效。此外,基于CRBN配体的SHP2降解剂,比如SP4490和ZB-S-29也表现良好。信号转导与转录激活因子(STAT)家族是一组至关重要的转录因子,参与多种细胞过程,包括细胞生长、分化和凋亡。它们也是癌症、炎症和自身免疫性疾病颇具吸引力的治疗靶点。然而,截至目前尚无直接针对STAT家族成员的药物获批。王少萌团队在开发STAT抑制剂方面取得了重大进展。他们基于磷酸酪氨酸拟肽抑制剂和CRBN配体,创制了一种选择性强且高效的STAT3降解剂SD-36。在细胞模型中,SD-36能选择性地降解STAT3蛋白(对STAT3的选择性比其他STAT蛋白高出100倍以上)。他们还开发出了STAT5选择性降解剂AK-2292和STAT6选择性降解剂AK-1690。最近,新型STAT3降解剂SD-436的临床前研究数据公布,与SD-36相比,SD-436的linker位置有所变动。临床阶段的STAT3降解剂KT-333(NCT05225584)与SD-436使用相同的连接位点。与SD-36和SD-436不同,KT-333利用CRL2VHL复合物而非CRL4CRBN来降解STAT3。c-Myc是一个全长无序的转录因子蛋白,在多种生物学过程中发挥着关键作用。它在众多癌症中的过表达,使其成为一个极具吸引力的药物靶点。事实证明,用小分子抑制剂直接靶向c-Myc颇具挑战性。靶向蛋白降解的出现为c-Myc干预提供了新机会。A80.2HCl能特异性地与GSPT1和MYC结合,随后募集CRBN来促使MYC发生降解。它能在纳摩尔浓度下诱导MYC降解,恢复pRB1蛋白水平,使得对CDK激酶抑制剂(CDKi)耐药的细胞系中重新建立敏感性。WBC100是雷公藤甲素的一种衍生物,它能通过E3泛素连接酶CHIP来降解c-Myc。雷公藤甲素是一种从雷公藤根部提取的天然产物,具有免疫抑制、抗炎、抗增殖和抗肿瘤作用。此外,雷公藤甲素还可作为NF-κB激活的抑制剂。因此,WBC100可能通过多种机制发挥抗肿瘤活性。WBC100目前正在中国进行治疗急性髓系白血病的I期临床试验(CTR20243277)。雄激素受体(AR)是一种经过验证的抗肿瘤靶点,临床上正在使用各种针对AR配体结合域(LBD)的AR抑制剂。由AR LBD结合剂开发的AR PROTAC ARV-766目前正在临床试验中(NCT05067140)。缺乏LBD的组成型活性AR变体导致对下一代激素药物(NHAs)以及基于NHA的PROTACs(如恩杂鲁胺)产生耐药性。AR的N端结构域(NTD)是无序的,在天然产物EPI-001被发现之前,很难用小分子靶向。EPI-001能与AR NTD共价结合,它抑制AR的转录活性并展现出抗肿瘤作用。在这一发现之后,基于靶向无序区域配体的PROTACs被设计出来。BWA-522是一种基于EPI-002的PROTAC,具有刚性连接体和良好的口服生物利用度。它在实验模型中表现出微摩尔级的抗增殖活性,这对于基于IDP-配体的PROTACs来说是一个充满希望的开端。Bcl-2蛋白家族在肿瘤生长和转移中起着至关重要的作用,但它大而平坦的PPI界面使得该蛋白难以靶向。DT2216是首个选择性Bcl-xL降解剂,它基于VHL配体以及Bcl-2/Bcl-xL双重抑制剂ABT-263打造。在细胞中,DT2216对Bcl-xL的DC50在纳摩尔级别,同时选择性良好,对Bcl-2或其他Bcl蛋白无明显降解作用。在体内实验中,DT2216有效抑制了异种移植肿瘤的生长,且对血小板无明显毒性。753b是另一种强效的Bcl-xL/Bcl-2双重降解剂,其对癌细胞的选择性高于正常血小板,且毒性较低,使其成为未来癌症治疗的有前景候选药物。CRBN E3泛素连接酶调节剂(CELMoDs)的一大特点是它们能够降解多种新底物,特别是具有β-hairpin G-loop(G-loop)的C2H2锌指结构的转录因子。来那度胺通过CRL4CRBN复合物诱导多发性骨髓瘤细胞中关键淋巴转录因子IKZF1和IKZF3的降解发挥抗肿瘤作用。除了IKZF1/3,进一步的蛋白质组学分析表明,沙利度胺类似物介导CRL4CRBN依赖的更广泛的C2H2ZF蛋白的降解,包括ZNF692、ZFP91、ZNF276、ZNF653、ZNF827、SALL4和WIZ。结构分析显示,CELMoDs与沙利度胺结合域的结合对于诱导CRBN从开放构象到闭合构象的变构转变至关重要。新底物IKZFs仅与闭合构象稳定结合,突出了变构在CELMoDs有效性中的作用。CELMoDs的降解偏好各不相同,这表明通过化合物结构的细微变化可以实现对特定底物的选择性降解。下面是一些代表性的CELMoD类化合物。CC-122以及CC-92480,它们的降解靶点是IKZF1和IKZF3,目前它们正在处于临床研究阶段。IKZF1和IKZF2的G-loop仅相差一个氨基酸残基:IKZF1中是Q146,IKZF2中是H141。泊马度胺是一种有效的IKZF1降解剂,但它不能诱导IKZF2的降解。但邻近标记实验结果表明泊马度胺确实能促进CRBN和IKZF2的接近。以泊马度胺为起始,研究人员开发出了一种高效且高选择性的IKZF2降解剂NVP-DKY709,它不会影响IKZF1/3。它在体内能降低调节性T细胞(Treg)的抑制作用并降解IKZF2。NVP-DKY709目前正处在I期临床试验。来那度胺可以诱导WIZ的降解,一种优化后的WIZ转录因子降解剂dWIZ-1能有效地在成红细胞中诱导胎儿血红蛋白(HbF)降解。这种方法可能为镰状细胞病提供一种新的解决方案。此外,基于组合化学的CELMoD化合物库增加了CRBN配体的化学多样性,并拓展了CRBN可降解蛋白质组的范围。表1. 代表性难成药靶标及其降解剂——靶向蛋白降解的计算方法——计算手段也在降解剂设计方面扮演着重要角色。通过整合物理驱动的模拟方法与数据驱动的机器学习技术,计算工具能够显著提升化学空间的探索效率,辅助研究人员快速识别具有潜力的降解剂候选分子,并在实验验证前对关键的三元复合物(即靶蛋白-降解剂-E3泛素连接酶形成的复合物)的稳定性进行初步评估,加速新一代蛋白质降解剂的研发进程。在此过程中,高质量、结构化的数据库是计算辅助设计不可或缺的基石。对于PROTACs而言,目前已建立起多个专用数据库,例如历史悠久的PROTAC-DB,鼓励用户贡献数据的PROTACpedia,以及近期尤为值得关注的PROTAC-Databank。PROTAC-Databank的独特价值在于其不仅积累了大量的PROTACs分子信息,更重要的是,它强调了三元复合物的结构数据以及标准化的降解效率标签。这些特征对于训练先进的机器学习模型具有不可估量的价值,可以帮助模型理解结构与活性之间的复杂关系,进而指导理性设计。当然,时至今日,与通用蛋白质数据库相比,这些PROTACs专用数据库在的数据规模都尚且较小;相较之下,分子胶领域则面临着更为严峻的数据瓶颈。由于目前已报道的分子胶种类相对较少,且其作用机制呈现出高度的多样性与复杂性,专门针对分子胶的结构化数据库建设一直进展缓慢,这在一定程度上制约了针对性计算工具的开发与应用。PROTACs设计中的一个核心且极具挑战性的环节是连接子(linker)的设计。连接子并非简单的连接片段,它必须具备精确调控的柔韧性以适应动态的结合过程,能够探索多样的构象空间以促进最优三元复合物的形成,并拥有特定的理化性质以保证良好的成药性。同时,连接子还需要与弹头(warhead)和E3配体(E3 ligand)的三维构象实现精准匹配,这都是传统片段对接方法所难以实现的目标。为应对这一挑战,学术界已开发出一系列基于机器学习的创新计算模型。例如,PROTAC-RL模型引入了强化学习策略,通过迭代优化来改善连接子的药代动力学特性;AIMLinker模型在连接子生成过程中整合了关键的三维空间结构信息,以确保其与结合口袋的良好匹配;PROTAC-INVENT模型则更进一步,将蛋白质三元复合物的结合位点信息也纳入考量;而如DiffPROTACs等新兴模型,则借鉴了深度学习领域先进的生成模型(如Diffusion等)来设计连接子。这些工具从不同层面推动了连接子设计的智能化,也并不完美。如何在连接子自身的物理化学属性、三元复合物的稳定性以及整个PROTAC分子的整体药代动力学特性之间达成最佳平衡,仍然是一个亟待攻克的多目标优化难题。与PROTACs三元复合物形成机制相对明确不同,分子胶诱导的蛋白质-蛋白质相互作用(PPIs)的建模过程更为复杂。一般来说,人们认为分子胶设计的核心挑战在于作用机制尚不完全明晰,且其诱导的PPIs往往具有瞬时性、微弱性以及高度的背景依赖性。尽管如此,人们还在尝试一步步地接近分子胶理性设计的宏伟目标。传统的蛋白质对接(例如HADDOCK、RosettaDock等工具)已被用于初步预测分子胶如何介导蛋白质间的结合;分子动力学(MD)模拟则能够提供对复合物动态行为和稳定性的更精细洞察;自由能计算方法则有助于量化这种相互作用的强度。近年来,以AlphaFold3为代表的先进深度学习模型,在预测复杂生物分子相互作用方面展现出前所未有的能力。其独特的架构(例如集成了Pairformer模块和Diffusion模块)使其能够整合序列、结构和相互作用信息,有效地预测包括分子胶可能诱导的微妙且动态的结构重排在内的复合物结构。这为深入理解分子胶的作用机制提供了强有力的计算工具。然而,AlphaFold3等模型在分子胶领域的应用潜力,仍受到高质量、针对此类弱相互作用的特异性训练数据集缺乏的限制。在筛选与对接之外,分子降解剂的从头设计是本领域的终极目标,人们希望超越对已知分子片段的修饰,利用计算方法从零开始,基于理性和数据驱动的原则,直接生成具有理想药理活性的全新降解剂分子。在PROTACs的从头设计方面,已有若干颇具潜力的工具问世,例如主要用于高效预测降解效率但对设计具有重要指导意义的DeepPROTACs 2.0,能够从无到有生成分子结构的GraphINVENT,以及整合了对接、机器学习等多种计算流程进行设计和评估的PROTACable平台。对于分子胶,MOLDE平台的开发也代表了在这一方向上的积极尝试,它集成了一系列计算工具来预测和优化分子胶诱导的三元复合物。——总结与展望——无论是PROTACs还是分子胶的从头设计,目前都普遍面临着若干亟待解决的重大挑战。首先是数据层面的瓶颈:高质量数据永远是稀缺的,特别是缺乏大量完整的三元复合物实验结构数据和标准化的、可比较的降解活性指标,这严重制约了模型的训练精度和泛化能力。其次,降解剂的功能实现是一个复杂的多目标优化问题,需要在活性、选择性、溶解度、渗透性、代谢稳定性等多个相互关联甚至相互冲突的属性之间进行权衡。除此之外,计算预测结果与后续的实验合成及生物学验证之间往往存在显著差距,换言之,理论上设计的分子可能在实际合成中遇到困难,或者其生物学活性与预测不符。最后,当前大多数计算模型主要基于分子的静态结构进行分析,这在一定程度上忽略了对降解剂药效至关重要的分子动态构象变化。展望未来,为推动蛋白质降解剂的高效从头设计,本文认为以下几个方向的研究至关重要:1. 需要开发更为先进和鲁棒的多目标优化算法;2. 必须持续加强高质量、多样化、标准化数据集的建设与共享,为计算模型的开发提供坚实的数据基础;3. 要建立更紧密的计算预测与实验验证之间的反馈迭代机制,使计算模型能够从实验结果中不断学习和优化;4. 应积极引入更先进的三维空间感知建模技术和迁移学习等人工智能策略,以期探索更广阔、更新颖的化学空间。我们坚信,通过系统性地解决上述挑战,计算方法必将在蛋白质降解剂的发现与优化中发挥日益核心的作用,有望加速攻克那些传统药物难以靶向的“不可成药”靶点,最终为疾病治疗带来革命性的突破。文章信息:Qi Sun*, Hanping Wang, Juan Xie, Liying Wang, Junxi Mu, Junren Li, Yuhao Ren, and Luhua Lai*. Computer-Aided Drug Discovery for Undruggable Targets. Chemical Reviews 2025, doi: 10.1021/acs.chemrev.4c00969.作者:任宇浩,李隽仁审稿:来鲁华编辑:黄志贤GoDesignID:Molecular_Design_Lab( 扫描下方二维码可以订阅哦!)