摘要
许多药物或其前身,都是通过观察其对正常或疾病生理的影响被发现的。在过去一代中,这种方法在很大程度上被强大但还原主义的方法所取代,即调制特定分子靶点。现代表型药物发现(PDD)将原始概念与现代工具和策略相结合,过去十年重新兴起,系统地基于现实疾病模型中的治疗效果进行药物发现。在这里,我们讨论了近期的成功案例,并探讨了持续存在的挑战及应对方法。我们还探讨了该领域的创新如何推动下一代成功项目的发展。介绍
历史上,新药是通过观察其对疾病表型的治疗效果发现的,这些效果要么直接在人类中作为传统医学的一部分,要么在疾病模型中被发现。随着20世纪80年代分子生物学革命的到来以及2001年人类基因组测序的完成,研究重点转向了特定分子靶点。然而,自2011年以来,表型药物发现(PDD)经历了重大复兴,此前令人惊讶的是,1999年至2008年间,大多数首批药物是在无药物靶标假说的情况下实证发现的。1 现代版本的传统策略特点是专注于调控疾病表型或生物标志物,而非预先指定的靶点以提供治疗效益。2 十年过去了,PDD作为一个领域正在成熟,成为学术界和制药行业中被认可的发现模式,而非昙花一现的潮流。这种持续的关注源于过去十年的显著成功,包括伊巴卡托和卢米卡夫托治疗囊性纤维化,利斯迪普拉姆和布拉纳普拉姆治疗脊髓性肌萎缩症(SMA),SEP-363856治疗精神分裂症,KAF156治疗疟疾,以及治疗特应性皮炎的克里沙波罗。
这并不意味着PDD方法是解决制药行业生产力问题的灵丹妙药;表型筛选的利弊需要与分子方法在验证靶点上进行权衡。3 尽管PDD取得了成功,许多历史案例使用了高度复杂的疾病系统(体内模型甚至人类),或是偶然发现的结果(见图1),复杂模型直到现在才重新受到重视。药物再利用是这一状况的一个有力例子,一方面是基于偶然临床观察的众所周知的药物再利用案例(如西地那非、米诺地尔、沙利度胺、阿门他定),另一方面则因临床化合物的预先筛选缺乏获批的再利用药物。5 这引发了一个关键问题:如何通过表型筛选,最好地前瞻性地发现新药。
除了重新认识到生理学和药理学的复杂性外,PDD还挑战了我们在具有特殊靶点和作用机制(MoA)(包括多药理学)的药物可用作药,以及具有意想不到化合物特性的药物的假设。尽管在目标识别方面仍面临重要难关,这是安全风险降低和临床路径规划的有益步骤,功能基因组学、机器学习/人工智能和改进疾病模型的应用正带来令人振奋的机会。
鉴于基于靶点的药物发现(TDD)与基于靶点的药物发现(TDD)之间的重大差异,以及现可应用于表型项目的新技术,该领域正以快速发展的速度发展,亟需在业界和学术界建立并共享最佳实践。3,18–21尽管技术和文化障碍依然存在,这里我们讨论了PDD的重新利用如何开始改变我们对药物发现的概念化,并被证明是生命科学技术创新的重要试验场。这一观点突显了作者对PDD如何影响药物发现相关概念的集体思考,并以最大化PDD疗效所面临的挑战作结。
PDD近期塑造的药物发现概念
“可药物化”靶点空间的扩展
PDD的主要驱动力源于该方法衍生出的一流药物数量过多。1 与基于分子靶点与疾病状态之间既有因果关系的TDD不同,PDD依赖于对与疾病相关的生物系统进行化学探询,且不依赖分子靶点。这种以生物学为先的经验策略为工具分子,将治疗生物学与此前未知的信号通路、分子机制和药物靶点联系起来,正如以下示例所强调的。
丙型肝炎是一种由丙型肝炎病毒(HCV)引起的肝病,该病毒感染了3%的人口,估计每年全球有30万人死亡。22 在过去十年中,随着口服直接作用抗病毒药物(DAAs)的开发,HCV的治疗方式发生了革命性变化,这些药物能抑制HCV的复制,并在>90%的感染患者中清除病毒。HCV蛋白NS5A的调节因子如达克拉他韦是这些DAA组合的关键组成部分。NS5A对HCV复制至关重要但无已知酶活性,其小分子调节因子,最初通过HCV复制体表型筛选被发现。23
囊性纤维化(CF)是一种进行性且常致命的遗传疾病,由CF跨膜电导调节基因(CFTR)基因的多种突变引起,这些突变降低了CFTR功能或中断CFTR细胞内折叠和质膜插入。24个目标无关性化合物利用表达野生型或疾病相关CFTR变异的细胞系筛选出了改善CFTR通道门控特性的化合物类别(如ivacaftor等增强剂),以及具有意外作用机制的化合物:增强CFTR的折叠和质膜插入能力(如tezacaftor和elexacaftor等修正剂)。6,7值得注意的是,2019年批准了elexacaftor、tezacaftor和ivacaftor的组合,覆盖了90%的囊性纤维化患者群体。25
受观察到沙利度胺有效治疗麻风病、调节多种抗炎细胞因子、抑制血管生成并在多发性骨髓瘤中展现活性的观察启发26,优化后的类似物来纳度胺获得了FDA对多种血癌适应症的批准,并取得了极高成功(2020年销售额>120亿美元)。27–29值得注意的是,来那度胺前所未有的分子靶点和锲量直到获批数年后才被阐明。来那里度胺结合E3泛素连接酶Cereblon,并重新定向其底物选择性,促进目标蛋白的泛素化及随后降解,包括转录因子IKZF1和IKZF3。30 此外,这种新型MoA目前正被深入研究,用于开发更为靶向的蛋白质降解剂,被称为“双功能分子胶”。31
1型SMA是一种罕见的神经肌肉疾病,18个月大时死亡率为95%。SMA是由SMN1基因的功能丧失突变引起,该基因编码一种称为运动神经元存活蛋白(SMN)的蛋白质,参与神经肌肉连接的形成和维持。人类也有一个非常相关的SMN2基因,但影响其剪接的突变导致第7外显子被排除,产生了一个不稳定的短SMN变异。两个研究团队的表型筛选独立鉴定出调节SMN2前mRNA剪接并提升全长SMN蛋白水平的小分子。32,33这两种化合物都通过作用于SMN2第7外显子的两个位点,稳定U1 snRNP复合物32,34,35是前所未有的药物靶点和MoA。其中一种化合物risdiplam于2020年被FDA批准,作为首个口服疾病修饰治疗药物,用于治疗SMA。
表1展示了更多近期通过表型筛选获得批准或临床阶段化合物的例子,包括那些受影响的细胞过程定义明确,但结合该化合物的特定实体是一个多组分的“细胞机器”,即定义模糊的分子靶点。综合来看,这些例子展示了表型策略如何扩展了“可药物靶点空间”,涵盖了意想不到的细胞过程(前mRNA剪接、靶蛋白折叠、运输、翻译和降解)、传统靶类的新MoA(伪激酶结构域抑制、变构激酶激活、掩蔽共价弹头),并揭示了新的药物靶点类别(如溴结构域)。他们建议,当尚无可调节通路或疾病表型的吸引靶点,且项目目标是获得具有分化MoA的首批药物时,应考虑表型策略。
多药理学重新审视
除了化合物库和疾病模型系统定义的限制外,现有的化学和生物学领域没有其他限制,表型筛选提供了识别多重靶点分子的机会,这也被称为多药理学。51,52在这种情况下,化合物的预期效果取决于靶点(靶点上的靶点)的组合;然而,这些不一定是其完整的目标特征,可能包括非活动所需的目标(非目标)。
在追求越来越选择性的药物过程中,多药理学传统上与优化不良的化合物相关,这些化合物容易产生潜在副作用,因为难以追踪所有非靶点代表的生物功能。然而,在治疗相关浓度下,大多数甚至全部获批药物已知会与多个靶点相互作用,这些靶点常常是副作用的基础,但也能促进临床疗效。53–55事实上,同时低效力调节多个靶点以“协同效应”实现疗效,已被提出以减少副作用的策略。56 一个经典的TDD非预期多药效例子是伊马替尼,这是FDA批准的首个合理设计的激酶抑制剂,用于治疗慢性骨髓性白血病(CML)及其他癌症,目前正处于近期发病的1型糖尿病临床开发中。57 最初被认为是抑制CML的BCR-ABL融合蛋白的药物,58 伊马替尼还对c-KIT和PDGFR受体酪氨酸激酶等靶点表现出活性,这些靶点被认为有助于其在多种癌症中的活性。59,60
基于药物组合的多靶点方法,即设计上的事后多药理学,是抗病毒和肿瘤适应症中被广泛接受的策略,这些适应症在仅作用单一靶点时可能产生耐药性。61–64多药药物也常用于治疗中枢神经系统和心脏病,这些疾病单靶点方法在这些方面成效有限,经典的体内表型模型长期以来一直用于药物发现。40,65,66一般来说,多靶点药物可能更适合复杂、多基因且多重机制的疾病,这些疾病通常涉及免疫或神经系统成分的相互作用。
表型方法提供了多种药物和候选分子,在MoA鉴定后揭示了靶点多药理学。代表性例子包括20世纪50年代发现的三环类抗抑郁药伊咪帕明,具有显著的多药理学特征,调节一些关键的中枢神经单胺转运蛋白和受体;托吡酯,一种治疗癫痫和偏头痛的神经稳定剂,涉及多种神经受体、离子通道和酶,69Pemetrexed是一种获批用于间皮瘤和非小细胞肺癌的叶酸抗代谢剂,抑制参与叶酸代谢和核苷酸合成的多种酶组合;70,71 molibresib,一种在多项癌症1/2期临床试验中测试的第一代BET抑制剂;72,73 RG7834用于治疗HBV感染;74,75 SEP-363856,作为体内发现的精神分裂症临床候选药物表型筛查43及针对中枢神经系统病理、76种传染病、77种癌症和代谢障碍的新研究化合物(见表2)。不足为奇的是,多药理现象常发生在同一家族的蛋白质之间,共享共同的结构域或相似的底物或配体(例如激酶、氨能GPCR和BET结构域蛋白)。
药物组合、工程多靶点药物和多特异性抗体代表了简化的多药理学场景,通常结合了两个基层,并对每个靶点具有选择性。80–82将更复杂的多药理工程化为一个整体,同时平衡药物候选所需的所有其他特性,是一个复杂且艰巨的过程,尽管分子对接、计算技术和人工智能(AI)近年来取得了进步。76,82–84Table 2.
Representative examples of polypharmacology among marketed drugs, clinical candidates and investigational compounds. Generic name, code name or identifier from the original reference is indicated for each compound. For investigational compounds representative examples have been selected from the corresponding referenced publications.
表型筛选提供了识别具有新颖、无偏多药理特征的命中结果的可能性,这些特征仅受限于模型系统的目标景观以及化合物库中各支架中可能包含的活性数量。85,86一个重要的实际考虑是利用信号增益表型,帮助将注意力集中在生产性的多药理学上,而非通过与目标生物学无关的细胞压力或细胞毒性。21.76多药理学特征的初步快照可以通过传统的选择性面板获得。87,88这些特征可以作为逆向工程基于SAR的起点,旨在识别和优化其靶点上的/非靶点平衡,绘制表型检测与单个靶点活性之间的相关性。Tear等人提供了系统方法,利用表型HTS筛查结果识别布鲁氏锥虫抑制剂,系统地绘制离靶点并提高表型终点的选择性。89个表型终点整合了多药用药物靶点的贡献,同时可借助SAR及(如有)选择性化合物来探索减少非靶点足迹。90
在进行一些化合物优化以减少初始命中化合物的离靶特征及其潜在混杂效应后,靶点识别工作可能会更有效率。在更高级阶段,可能需要化学和功能基因组学工具的额外支持。即使无法明确识别靶点,目前以参考药物为基准的强大表型和分子剖析平台,仍可获得对候选分子MoA及潜在安全风险的洞察。91–94多药理学不太可能局限于蛋白质组。根据我们的经验,使用含有高度选择性、来自靶点药物发现项目的遗留化合物的化学文库进行表型筛选,可以获得表型活性似乎不依赖于其真实靶点的命中结果(如激酶抑制剂)。90 这可能是由于低效力活性的组合导致的微妙多药理作用,甚至涉及与非蛋白质靶点如RNA的相互作用,95在传统的纯蛋白选择性面板中未检测到,但肯定是表型筛选的潜在靶点。96
从药物发现的角度来看,表型筛选衍生的多药理学可以利用日益稳健的表型模型,结合先进的剖析、组学和计算技术,从偶然发展到基于SAR的逆向工程方法,从而在保持并最终优化表型活性的同时,最大限度地降低潜在安全风险,从而提高临床成功的可能性。
药物“相似性”再审:低分子量化合物中PDD的成功案例
现代表型筛选也可能有助于扩展新药所展现的分子性质范围。具体来说,随着TDD的出现,过去几十年药物的分子量显著增加。103 历史上,较小分子是通过表型方法发现的,通常采用动物模型(布洛芬104 MW 206,米诺地尔13 MW 209,美金刚12 MW 179)(见图1)。这些分子完全符合广泛接受的片段标准,如MW<300。当代例子包括利用癫痫模型发现的lacosamide(MW 250)和通过一组中枢神经系统模型(CNS)用于精神分裂症的SEP-363856(MW 183),以及通过多样化体内模型测试后,将MLR-1023(MW 202)重新利用用于2型糖尿病和NASH(48,105),以及用于多发性硬化症的双甲基富马酸酯(MW 144)。106
上述例子提出了一个关键问题。为什么那些在TDD项目中被视为弱效力、需要大量效力优化的片段级分子,在体内疾病模型中却活跃,并在优化后产生类似大小的药物?我们推测,可能有几个原因解释了这一意外的模式。首先,片段大小的分子由于体积小且能在结合位点内容纳的取向更多,在筛选特定靶点时,已知其有效命中率更高。如前所述,多药理学是PDD药物的常见特征,也可能在此方面有所贡献(例如SEP-363856与TAAR1和5-HT1A受体相互作用)。43.98最后,较小分子在肠道通透性方面具有已知优势,能通过细胞旁空间工作,而由于体积较小,代谢酶的选项较少。108 虽然许多这些片段级药物的剂量及相应暴露量相较于大分子标准可能较高,但它们仍可能表现出高配体效率,从而允许安全投放。109 换句话说,同样高浓度的化合物对于MW为200与500的分子来说,暴露风险并不相同。
因此,有机会有意识地利用表型筛选的能力,进入TDD项目覆盖不足的化学和药理领域。110 最近发现的SEP-363856、MLR-1023和酰氯酰胺表明,利用体内动物模型进行表型筛选仍然可以取得成功。这种成功在很大程度上取决于模型的临床相关性,这是一个有争议但仍值得深入探讨的话题,后续将详细讨论。展望未来,第二个选择是将筛选更少、更小分子的概念应用于复杂的多细胞类器官检测。片段库虽仅有数千个,却覆盖了庞大的药效团空间。107 检测片段或分子之间的化合物库,即使采用低通量、复杂的三维测定,也可能覆盖重要的药理学领域。110
相关概念是利用共价片段——包含反应基团的片段子集,能够与蛋白质建立化学键——以识别新靶点并揭示化学起点。它们用于基于细胞的表型检测,因其通过发现可逆化合物无法获得的结合位点,能够访问更广泛的生物学片段而获得认可。重要的是,共价片段同时受益于共价靶向(持续靶点结合)和基于片段筛选(广泛覆盖可配体囊且文库较小)的优势。例如,对原级人类T细胞共价片段的分析揭示了通过多种机制抑制T细胞激活的因子,包括蛋白质的直接功能扰动和/或降解。112 值得注意的是,调控靶标包括先前配体的蛋白和未配体的蛋白。
目标识别与项目进展——一场成熟的讨论
活性化合物系列的靶标识别被广泛认为有助于从安全和临床转化角度降低项目风险。多年来,关于是否绝对必要于进入临床前的化合物,一直是争议的焦点。3 这一讨论现在正在成熟。目标识别通常被视为导致简单的二元结果:目标要么被识别,要么未被识别(图3A)。在这里,我们希望提供一个不同的框架来讨论这一重要话题。首先,重要的是要记住,靶点鉴定只是达到某种目的的手段,目的是获取化合物系列在临床路径上的决策信息。因此,目标识别仅代表实现这一目标的一种选择。此外,识别分子靶点并不等同于理解化合物系列的MoA,甚至可能在程序决策上产生误导。例如,NS5A作为HCV药物达克拉他韦靶点的文献,并未合理化其显著的亚nM细胞效力,也未能解释如何用低于1到1000的化合物获得疗效。同样,当核糖体被确定为PCSK9分泌抑制剂的靶点时,理性的反应应是终止该项目,因为这带来了通过广泛蛋白质合成抑制带来重大安全风险的阴影。然而,进一步的研究包括蛋白质组学剖析显示,其分子MoA因核糖体、化合物与新生PCSK9多肽之间形成三聚复合物,意外地抑制了PCSK9 mRNA转录本的翻译。49,50另一类例子包括由于靶点降解或其蛋白结合伙伴的修饰(如与PDE3A的DNMDP)114,导致其类别中表现出独特表型效应的化合物。
作为目标识别的替代方案,我们建议通过实证获得大量关于MoA的可作知识(见图3B)。实际上,细胞和体内检测可以提供无偏见的化合物评估,并获得与疗效和安全性相关的读数,而机制性研究,如今常采用组学方法,可能揭示与MoA相关的信息,如化合物影响的特定生物途径。115 与其通过识别或未识别目标的二元开关,不如在项目过程中获得关于化合物系列的信息连续体,基于对安全性和转化的积累信心,最终推进到临床。
目标识别与作用机制分析策略
虽然找到直接结合小分子筛选目标有望实现“a/the”靶点,但在试图解开表型筛选时,这并不是完整的全貌。116–118亲和力(或光亲和力)富集结合化化蛋白质组学方法119–123,或最近的细胞热移分析(CETSA)124,以识别与小分子命中结合的蛋白质(或多样蛋白),是理解其作用机制的一种方法(例如P2X4作为自噬抑制剂吲冚啰碱的靶向)。125 但这可能还不够,正如前面提到的,PCSK9 甚至可能具有误导性。
RNAi和CRISPR-Cas9的发展开启了筛选全基因组文库的能力,使得功能增益和功能丧失研究能够高特异性地进行。126 遗传扰动结合化合物处理,进一步理解了MoA的机制,并可能促成分子靶点的鉴定(例如NAMPT作为抗白血病药物STF-118804的靶点,DHODH作为抗病毒GSK983的靶点)。127–130一项大型研究是癌症依赖图谱,旨在利用PRISM方法通过分子条形码细胞系的大规模平行化合物筛选,系统识别遗传依赖性和小分子敏感性。131,132
近年来,分子剖析方法提供了关于化学扰动引起的生物变化的全面信息,在表型命中后续中发挥了重要作用。21 此类大规模画像分析的例子可归类为基因表达、细胞形态或生物标志物活性的测量。连接图谱包含测试化合物和注释化合物的基因表达谱,可用于签名相似性定位。133 其延伸项目是综合网络基细胞特征库(LINCS),91,134 这是美国国立卫生研究院(NIH)共同基金项目,记录细胞系因化学、遗传和疾病扰动变化而发生的变化。细胞绘画使用形态学剖析:从细胞显微镜图像中提取定量数据,以识别样本间生物学相关的相似性和差异。135–138BioMap面板在处理(化学或生物)时对初级细胞系统进行剖析,显示出相较于载体控制而增加或减少的生物标志物活性。92,139,140这些技术带来的一个关键优势是,测试多种化合物(例如顶级化合物列表)的可行性日益增强,而不必像传统蛋白质组学策略那样只专注于有限数量的化合物。这些平台的价值很大程度上来自于将命中物的生物特征与使用参考注释化合物获得的签名数据库进行比较。它可能揭示匹配,或帮助构建关于其MoA的假设。例如,Tapinaroff通过BioMap面板与AHR激动剂匹配,其自身的AHR激动剂在后续研究中得到验证。141 实际上,分子剖析现已整合进筛选漏斗,用于确定哪些命中和系列将获得进一步投资和调查。21
这些大规模画像方法虽然通量更高且侧重于通路层面信息,但高度依赖参考数据库中表型相似的已知化合物。鉴于表型筛选的目的是发现新的作用机制,建立这些方法达到查找表期望的知识基础可能需要时间。然而,许多表型筛选现在是根据特定的机制信息(Moffat等人所说的机制导向PDD)来指导的。142 该策略为基于上述工具生成表型命中数据的假设提供了关键的生物学框架。
PDD衍生化合物的临床开发考虑
在缺乏靶点信息的情况下,将PDD衍生的临床前药物候选药物推进临床给开发团队带来了诸多挑战。简而言之,目标身份不仅为降低安全风险问题以及预测和监测疗效提供了宝贵信息。本节将介绍具体策略和示例,以应对这些障碍。
“可迁移链”——驱动原始表型检测、后续临床前疾病模型的分子层面关联,是人类疾病的固有组成部分——对于PDD项目在临床上的成功至关重要。例如,HBV抗病毒药物RG7834在体外降低含有耐受性病毒S抗原的非传染性膜颗粒的分泌,从而捕捉到人类疾病中一个关键(且预后)成分。74,75,143,144用于脊髓性肌萎缩症(SMA)的Branaplam和risdiplam治疗方案也很好地体现了这一理念。如上所述,SMA由SMN1基因的功能丧失突变引起,这两项努力都源自高通量表型筛选程序,旨在通过调节几乎相同的SMN2基因剪接,以包括外显子7(该外显子通常缺失,导致Δ7蛋白不稳定)来补偿功能性SMN。9,32,33,145这些项目筛查了具有明确临床意义的疾病替代生物标志物(即SMN2 mRNA中第7外显子的加入),后续临床研究也证明了这一点。例如,在一项一期健康男性志愿者单次递增剂量研究中,risdiplam治疗使SMN2向全长SMN2 mRNA转变,进一步转化为SUNFISH(NCT02908685)关键临床试验中SMA患者具有医学意义的益处。146 总结来说,在缺乏明确目标但基于强分子MoA理解的明确生物标志物的情况下,临床开发可能可行。
在安全方面,靶标信息及其生理表达模式和作用的相关知识,常被用来聚焦潜在的安全信号。这些问题可以在TDD项目早期进行调查,以降低风险或迅速终止。不过,监管指南并不要求安全性评估时必须提供靶点信息。相反,他们提供了一份必要的毒理学研究清单,以指导选择适合人体检测的化合物剂量。安全风险降低是2019年Keystone研讨会PDD研讨会的主题,讨论中涌现出多个主题和策略。
首先,安全考虑应在命中分诊和表型项目验证时就被纳入。有效的方法包括细胞毒性反筛筛选以及分子剖析,以去除通过频繁触发物和其他不良MoA作用的命中点。21 一旦命中列表被精简到几个感兴趣的命中点,使用活性-非活性化合物对已被证明有助于提升或降低对某一化合物系列及其对应靶/MoA的置信度。这些分子工具能够识别目标MoA的特定生物标志物和特征,同时还能评估与化合物作用机制无直接关联的不良反应(类似于基于靶点的药物发现中的“靶向”不良反应)。采用这一方法以增强对原始PCSK9分泌抑制命中R-IMPP的MoA的信心。49 和许多放映热门一样,这部热门作品较为薄弱且散漫,引发了对进一步投资的担忧。其对映体S-IMPP在PCSK9分泌测定中同样多发且不活跃,表明R-IMPP系列通过特定分子靶点作用,而非广泛的细胞应激或损伤(见图4A)。相反,这一策略也被用来为终止一系列正在开发的囊性纤维化CFTR矫正剂辩护。147 在本例中,鉴于慢性给药铅分子后体内出现严重毒性,结构密切但无活性的类似物也在体内进行了类似测试。该无活性化合物耐受性良好,暴露水平相近,表明毒性更可能是MoA相关而非化合物相关(见图4B)。
此外,研究人员还可以访问更复杂的表型特征分析,并将化合物特异性剖面映射到斑马鱼149的参考收藏或基于人类原一细胞的疾病系统(如Biomap),并通过使用临床批准药物生成的指纹进行验证。150,151虽然这些系统未能完全重现人体中可能观察到的安全问题范围,但仍提供了检测多器官风险的机会,同时允许测试更多化合物或系列。最后,体内毒理学研究,包括在两种不同动物物种中测试多种化合物剂量,是关键步骤,随后确定无观察到不良反应水平(NOAEL)指导了人体测试的化合物剂量选择。因此,确保所选两个物种表现出与MoA系列相关的疾病生物标志物或生物特征的调节,对于最大化这些研究进入临床前的价值非常重要。
源自PDD的药物候选物可以在缺乏分子靶点知识的情况下进入临床。例如,1)来那度胺(2005年多发性骨髓瘤获批),其MoA于2014年被阐明,30;2)拉科萨米德(2008年癫痫获批,信息中可能复杂MoA仍在研究中;11,152,153)RG7834,最近进入一期临床试验,且靶点识别尚未成功。74,75,154然而,在缺乏靶点信息的情况下,有必要识别能够有效转化为人类患者的替代疾病生物标志物。同样,特定策略有助于评估某系列及相关MoA的安全风险。另一个考虑因素是某一适应症的未满足医学需求和临床环境,缺乏经过充分验证的靶点可能会进一步推动化合物进入临床,且缺乏靶标信息。3期待
表型筛选的替代表型
有时,表型筛选可能带来难题。对于缺乏充分验证的治疗靶点且可能较少被理解或特征化的疾病,显然具有价值。然而,疾病知识对于设计具有相关体外或体内生物系统、刺激和读出的表型检测法,以及建立所需的翻译链至关重要。3,18就像它们被用来定义小分子的MoA一样,高维谱如基因表达和细胞形态学也可以用来定义替代疾病的表型,作为表型检测的读数。155 这里的透气剂不是化学物质,而是疾病本身,其筛查旨在将系统从病变状态恢复为健康状态。
基因表达剖析已被用来定义疾病状态,例如癌症基因组改变引起的疾病。例如,高通量mRNA谱被用于根据肺腺癌中发现的等位基因功能影响进行聚类,这为治疗此前未知重要变异的策略奠定了基础。156 如前所述,LINCS项目旨在通过记录基因表达在介扰剂或疾病状态下发生的变化,从而建立基于网络的生物学理解。134 该项目的目标之一是开发一个计算框架,基于恢复受扰通路和网络至正常健康状态来发现疗法。一项最新研究结合高通量药物筛选与现有转录组数据集的计算机分析,鉴定出一种能够在体内逆转肺动脉高压(PAH)的化合物。157 作者指出,通过使用血管细胞而非癌细胞生成LINCS基因表达特征,他们的研究有望进一步改进。然而,这些方法的前景仍处于起步阶段,正如Alvarez等人优雅的工作所证明的那样。158。在这里,作者结合了基因表达分析和多种计算算法,定义了胃肠胰神经内分泌肿瘤(GEP-NETs)的主控调控蛋白,随后对GEP-NET衍生细胞进行了转录组分析,这些细胞被扰动后,涉及107种化合物。从概念上讲,该方法表明能够反转肿瘤检查点主控调控因子协调活性的化合物能够有效破坏肿瘤细胞状态。然而,对两种预测会诱导患者特异性主控调控蛋白崩溃的药物的验证尚无定论。作者对可能的原因进行了深入讨论。
如前所述,细胞形态表型,包括细胞区室的形状、大小、强度和质地,已被证明会随着扰动而发生变化——无论是小分子还是疾病相关的等位基因。LINCS门户网站已整合了Cell Painting136和药物再利用中心159的此类数据,报告了1571种化合物的细胞绘画数据(其中92%被映射到人类蛋白靶点或被分配了作用机制标签)。这些数据可用于定义已知MoA药物逆转的表型。
还使用了其他方法,用于计算比较和可视化药物和疾病基因表达谱,以定义疾病表型的逆转。逆基因表达评分(RGES)是一种排名系统,将疾病基因表达与药物诱导的表达谱系统地联系起来。160 整合来自TCGA(https://tcga-data.nci.nih.gov/)、LINCS、91,134 ChEMBL161和CCLE162的数据,研究人员证明,在癌细胞中具有疗效的药物相比无效药物在逆转疾病基因表达方面的效力增强。160
类似于基因集富集分析(GSEA),Nassiri等人开发了细胞形态富集分析,以评估转录组变化与细胞形态变化之间的关联,强调转录与细胞形态之间的相互依赖性与疾病状态有关,本例中观察的是人类骨肉瘤细胞系中的细胞形态变化。163
本节提及的高维剖析数据集库已存在于公共领域。对于药物发现来说,如何最好利用这些数据定义可逆转的替代疾病表型作为治疗有效性指示,仍是该领域的下一大难题之一。一些制药公司已开始将这种方法作为筛查平台。自2013年起,Recursion Pharmaceuticals可能是首个通过细胞绘画检测替代病特征以筛查替代病特征复位的工业尝试。他们的主要研究重点是针对罕见单基因疾病的药物再利用。164
人工智能与PDD
人工智能的应用在药物发现和开发的多个领域(详见165页综述)中被广泛接受,包括药物设计、166蛋白质折叠、167化学、168硅胶毒性预测、169以及药物再利用。170 该方法论的指数级应用速度依赖于机器学习算法识别模式并从其与效力、选择性等参数的关联中学习。
在PubMed上使用“深度学习”、“人工智能”和“表型”或“药物发现”等关键词查询已发表文献,结果会得到两类截然不同的论文:1)应用于大量化合物或化学结构的分类器,2)用于表型检测衍生特征的分类器。绝大多数已发表的研究属于第一类(基于图或深度学习,有或不包含不同训练数据集的迁移学习),涉及大量化合物或化学结构及其相关药理学数据,这些数据在之前筛选中生成。因此,该分类器不应用于表型衍生特征,而是应用于化学结构,以提出潜在的新支架,进而成为实验验证的基底。一个典型例子是DeepMalaria研究,该研究基于GSK数据集的抗甲虫命中数据进行图化模型训练,预测恶性疟原虫的生长抑制(以及哺乳动物细胞毒性),从而有助于合理选择支架作为进一步研究的输入。171 为克服训练数据不足的难题,采用了来自无关数据集的迁移学习。这些分子随后通过表型检测得到验证。尽管AI分类仪在表型研究之前已应用于化学结构,但该方法仍可能促成PDD,这一点通过识别出强效候选抗疟药所证明。171
相反,除了AI的炒作之外,尽管这显然是该技术的一个诱人应用,但对表型衍生特征进行分类的努力仍然罕见,能够向普通观察者揭示隐藏在表面混乱中的模式。PDD的定义上依赖表型模式的变化来识别和优化对生物靶点或MoA知之甚少或几乎不了解的分子。172 细胞层面对药物诱导扰动的表征(例如《细胞绘画》)表明,亚细胞特征指标可用于聚类和分类复合和基因扰动。138,173,174机器学习在特征空间尚未明确定义的情况下尤为有用,因此对PDD有显著助益。例如,利用大量细胞绘画数据集(由30,616个化合物诱导的126,779个形态剖面),Hofmarcher等人证明,作于原始图像的卷积神经网络能够从图像中提取细胞的形态变化,优于基于分割单元和后续特征提取的传统图像处理流程。175 有趣的是,不同染料的应用可能并非必需,因为其他作者已证明,即使是明场图像也能训练能够区分特定表型的算法。177
机器学习与PDD的整合还有其他机会。例如,表型筛选和机器学习可以结合,从杂交化合物集合中提取靶向信息,如非选择性激酶抑制剂。在该领域,研究表明,即使使用多滥激酶抑制剂,也能解开活性分子的激酶依赖性,并识别出抑制后产生神经突增生增加或乳腺癌细胞死亡预期结果的激酶组合。76,178
两项研究强调了机器学习应用于PDD的变革潜力,包括细菌表型指纹识别以及高通量图像的再利用。94,176尽管其他人已将深度学习应用于抗生素发现,179 Zoffmann 等人94 结合高含量成像和基因组学方法,结合机器学习驱动的数据集分析,有效缩小、比较并预测了化合物 MoA。在该研究中,机器学习的应用因此可以在特征空间中定义化合物“原型”,使化学家能够在持续监测此类修改如何影响类似物的MoA的同时,推进化合物优化工作——这是与传统PDD的重大区别。Janssen的研究人员将这一概念提升到新高度,将通常用于读取单一生物过程的少数形态特征的高通量成像与机器学习相结合,证明给定的细胞检测图像能够支持在多种生物测定谱系中预测活性。具体来说,他们能够利用从无关成像筛查中提取的细胞形态信息,预测化合物对两个不同靶点的活性,命中率提高了>50倍。
生理和疾病相关检测系统的进一步发展
表型药物发现项目的成功与否取决于上述“可迁移链”的固有强度,该链将初级表型检测从初期连接到患者疗效,通常中间夹杂动物疾病模型。3 Scannell和Bosley对生物制药行业的分析表明,研发效率下降可能是由于最具预测性疾病模型的逐步枯竭所致,而新疾病相关模型的创建速度可能对研发生产力构成重大限制。180 值得注意的是,作者还得出结论,疾病模型预测效度或可翻译性的微小提升可以抵消检测通量上的巨大差异(即数量级)。综合来看,持续开发具有临床可迁移性且现实的疾病相关检测方法对未来PDD工作至关重要。
幸运的是,干细胞生物学、功能基因组学、生物工程/微制造以及仪器/数据分析等多个学科的进展汇聚,提供了丰富的实验托盘,用于开发潜在的疾病相关检测系统。技术进展包括但不限于:平台模式生物方法,181 高容量体内哺乳动物药理学,40,182 使用高精度Cas-9方法调控基因调控/结构,183,184 访问新型细胞系统,如原生细胞、患者来源细胞和诱导多能干细胞(iPSC)衍生细胞,18,185–187 单晶体或共培养的应用188–190 系统在二维或三维细胞格式中,191,192 微制造/生物工程进展的整合,提供微图案细胞培养表面193,三维矩阵/微流控系统187,以及芯片有机194–197 功能。
与疾病相关生物模型设计相关的实验变量数量和复杂性极为显著。18,185,186,198,199不幸的是,在模型中重现相关患者生物学的所有方面充其量只是一个理想化的目标。更现实的是,研究通常侧重于复制被认为对模型价值至关重要的特定疾病特征。即便如此,这些通常是复杂的系统,因此需要大量的开发、优化和验证工作。18,185,186与分子靶点验证一样,只有在发现数据与临床阶段数据保持一致后,200个疾病模型才应被视为转化型。这代表了一个高门槛,通常在项目生命周期后期才会达到。
尽管相关细胞类型和培养条件对于开发生理相关模型是必要的,但仅凭其使用不足以保证疾病相关性。199 关键的是,细胞系统的可迁移链应与人体临床状况的多个方面进行基准对比,如形态学、多组学表征和药理反应。最近开发的非酒精性脂肪肝病和非酒精性脂肪肝炎(NASH)体外模型说明了这一关键点。196,201该模型采用3D共培养原级人类肝细胞、Kupffer细胞和肝星状细胞,这些细胞表现出与疾病相关的组织形态、生物标志物表达/分泌、转录特征以及对方二胆酸的反应性,后者是一种先进的临床化合物,能改善NASH的组织学特征,但尚未获得FDA批准。196,201同样,利用3D类器官的肿瘤模型常常可从患者活检中推导出来。患者来源类器官(PDOs)保留了原始患者肿瘤的组织病理学、生物标志物蛋白表达和基因组特征(拷贝数变异和突变景观)等方面。202–205值得注意的是,胃肠癌和胰腺癌衍生的PDO在体外对标准护理的反应多样,但与特定患者的临床化疗反应高度吻合,203,204;直肠癌PDO对化疗的体外反应与个体患者肿瘤的临床反应相关。202,205
在大数据时代,整合来自大型人群的真实患者记录(如英国生物样本库、FinnGen)及其组学数据,也可用于帮助构建和验证模型系统。Mittal等人利用体外表型筛查监测α-突触核蛋白基因表达作为帕金森病(PD)模型,鉴定出药物再利用筛选中的βB2肾上腺素能受体调节因子。值得注意的是,体外模型随后通过分析400万条患者记录得到验证,这些记录显示β2AR激动剂的使用分别与帕金森病风险降低或增加相关。206 另一种是肿瘤剖析研究,旨在通过将患者的真实临床数据与高分辨率多组学剖面及肿瘤的体外药物反应整合,在临床相关周转时间内,提供患者特定的治疗建议。207
人类疾病的动物模型是临床前药物发现的重要组成部分。虽然如今它们主要用于验证特定分子靶点的调节,但利用哺乳动物模型一直是药物发现中主要的表型检测,直到20世纪末,并促成了癫痫、胃溃疡、高血压、炎症和疼痛等适应症治疗药物的发现。11,13,69,104,105随着21世纪的到来,这种药物发现方式在大型制药公司几乎被排除。105
随着对具有高转化潜力表型检测的必要性日益明确,也许是时候重新考虑彻底放弃体内模型作为一线表型筛选系统的做法了。虽然对于某些体外系统(包括原生细胞和三维结构)描述不佳的复杂或多器官适应症,可能需要整体生物模型来更完整地重现疾病状态,但开发有效的体内转化模型绝非易事。180
重要的是,体内疾病模型已认识到由于方法论、系统性数据综述以及关键疾病特异性差异等因素,人类疾病转化存在问题。208–210缺乏物种翻译是另一个重大障碍,尽管类黄酮DMXAA在临床前模型中疗效有前景,但临床试验中失败即为例证。在识别目标后,断层被追溯到小鼠STING在其人类同源基因上的选择性激活。总体而言,伦理、成本、可翻译性和通量考量共同为开发和使用合适体内模型设定了很高门槛。
提升转化价值的努力包括开发“小鼠医院”和联合临床试验概念,将体内前临床小鼠模型与早期临床研究紧密结合,进行药物的体内测试,以缓解转化问题。212,213同样,亨廷顿病(HD)遗传小鼠模型的表达对比与患者特征高度吻合,尤其是HD纹状体214中mRNA减少,从而提高了HD小鼠模型的预测效度。
疾病模型的进步也可能涵盖数据采集和分析的部分方面,而非模式生物本身的改进。SEP-363856是一种新型精神药物,其作用机制独立于传统药物如氯丙嗪所采用的D2和5-HT2A调节。该病通过SmartCube表型筛查识别——该系统自动化捕捉小鼠行为的不同领域的数字视频,随后通过算法将数据缩减至约2000个特征,并在监督学习中基于经过特定治疗适应症验证的化合物处理的小鼠,推导出药物类别特征或行为条码。40,41,215由此产生的药物类别/行为特征具有高维度/高含量,可能捕捉到传统手动独立小鼠模型中不明显的药物诱导行为特征。
虽然筛选通量是此类体内系统中的一大障碍,但人们错误地认为它是一个无法逾越的障碍。历史成功案例表明,命中率可作为较小、通常基于假设和药学团知情的体内表型筛查的一部分被识别。如前所述,在传统和近期筛选中观察到的极小分子成功率,可能被多个关键特征共同推断,从而提高成功概率。最后,对1000个类似物的体内剖析,促成了SEP-363856的发现和开发,表明仍可获得合理的通量。另外,利用Cas9小鼠的CRISPR sgRNA技术使遗传筛选能够识别调节某些疾病表型的通路和节点,尤其是在肿瘤学领域。基于低阶生物如斑马鱼的模型也提供了更高通量的机会,但代价是翻译上可能被进一步远离。
疾病模型赋能的多学科性质以及优化和关联这些资产发现和治疗终点的迭代过程,给生物制药研究界带来了重大障碍。值得注意的是,这些多元学科的许多专业知识集中在学术界,而识别和优先识别及优先识别疾病适应症以开发模型以解决未满足医疗需求的最终用户和经验主要集中在生物制药领域。开发新疾病模型系统的其他障碍还包括学术研究经费带来的不确定性和时间限制,以及营利性领域对长期或不确定时间前景的基础研究兴趣较低。因此,生理和疾病相关模型的开发可能受益于非营利的、竞争前的研究组织,类似于开发探针化合物以针对竞争性分子靶标的联盟。结束语
PDD通过识别药物、靶点和MoA,展示了其潜力,这些在许多情况下,通过基于靶点的方法根本无法发现。当缺乏关于疾病病理生理的分子信息时,这一策略为新疗法提供了一条路径,从而能够接触到由蛋白质组及其他任何生物分子和细胞过程所代表的未被开发的“暗生物物质”。化合物库的选择以及表型模型的临床可迁移性对于PDD的成功至关重要。
本文重点强调了仅限PDD可及的新MoA的发现、需要能够更好地重现复杂疾病的病理生理(例如整合免疫或神经系统成分)的表型模型、多药理学带来的机遇以及使用含有比传统分子更小分子的文库的优势。生物活性分析和MoA表征方法应用于疗效/安全性评估的应用增加,以及日益强大的计算技术已成为充分发挥PDD潜力的必要条件。
当前的挑战是如何合理地结合这些关键方面,以前瞻性地“工业化”表型药物发现。鉴于该领域的指数级增长,我们有信心机器学习(尤其是深度学习)的应用增加将有助于实现PDD的有效应用(见图5)。我们的愿景是,表型药物发现的工业化,加上十多年“现代”PDD实践积累的丰富经验,将促进更高效的药物发现过程,无缝整合靶点和表型方法。