摘 要
生物催化利用酶制剂制造有价值的产品。这项绿色技术应用广泛,从实验室规模到工业化生产,从业人员可以利用这项技术获得复杂的有机分子,而且通常可以减少合成步骤,减少浪费。过去十年间,用于定制酶特性的实验和计算工具的开发呈现爆炸式增长,使酶工程师有能力制造出能进行自然界不存在的反应的生物催化剂。通过使用(化学)酶合成路线或协调错综复杂的酶级联,科学家们可以合成精心制作的目标物,从DNA和复杂的药物到利用二氧化碳衍生的甲醇在体外制造的淀粉。此外,通过将生物催化与过渡金属催化、光催化和电催化相结合,还出现了新的化学方法。本综述重点介绍了最近的主要发展,指出了目前的局限性,并展望了这一快速发展技术的未来前景。
背 景
生物催化是一种由酶进行化学反应的合成化学方法。历史上,来自天然的酶一直被用于分解洗衣粉中的油脂和蛋白质、生产半合成抗生素以及为制药业制造简单的手性前体。在过去5年中,可用蛋白质序列的数量增加了惊人的20倍,加速了具有有用活性和特性的酶的发现。定向进化是我们定制酶特性的基石,它使研究人员能够定制用于合成复杂分子、改造生物疗法和分解塑料废物的酶。机器学习驱动的蛋白质结构预测,加上自动化和高通量筛选方面的进步,进一步提高了我们创造具有所需功能的酶的能力。在酶中添加非生物催化元件的能力意味着酶工程师不再需要完全依赖天然催化机制。科学家因此获得了重新设计、重新想象和重新利用酶的能力。举例说明的应用包括制造抗病毒药物依斯拉韦(Islatravir)和莫诺拉韦(Molnupiravir)的酶级联、能够产生和控制自由基的生物催化剂,以及利用光催化作用影响立体控制的C-C偶联、氢氨化或Diels-Alder反应的酶。
进 展
过去五年来,数据驱动工具的发展突飞猛进,加速了酶的发现、工程设计和应用,使其在化学、医药和食品技术领域得到广泛应用。通过利用酶控制化学反应环境的能力,科学家们成功开发了从合适的起始材料甚至二氧化碳构建复杂小分子的平台。除了用于(化学)酶级联反应外,精确定制的生物催化剂还能制造新的治疗方式,如反义寡核苷酸疗法和生物共轭物。DNA合成仍然依赖于亚磷酰胺化学,而独立于模板的脱氧核苷酸转移酶正在重塑这一过程,使之更快更便宜。机器学习已经在蛋白质结构预测和设计中占据主导地位,并正在酶工程中得到应用,包括改进对映选择性、活性和稳定性等功能。
展 望
未来十年,生物催化研究和应用将继续受益于数据挖掘、机器学习和DNA读写方面的进步。酶的组合设计以及通过实验产生新酶变体的便捷性,为训练数据密集型机器学习算法提供了条件。理想情况下,在定向进化活动中筛选出的变体的序列功能数据可用于预测下一步要评估的变体。机器学习在数据干净且可重复的情况下效果最佳,这就要求数据的标准化和报告以及实验技术的进一步发展,包括分子生物学方法、自动化和高通量筛选测定。
药物发现的工具箱正在从传统的小分子(分子量小于500g/mol)扩展到RNA治疗剂、蛋白质降解剂、环肽、抗体药物共轭物和基因治疗。因此,先导分子和临床候选药物的合成复杂性也在增加,手性分子和超出Linpinski五规则的分子所占比例越来越大。酶法合成在小分子药物发现和开发中的作用将超越其目前的影响。
新酶族的发现和新酶功能的合理设计将扩大现有生物催化剂的工具箱。开发和应用包含酶促反应的逆合成工具将是生物催化普及化的重要一步,并使非专业人员也能使用生物催化。在这些创新的推动下,天然的催化剂将被有效地用于应对当前的挑战,包括抗击疾病、提供负担得起的清洁能源以及减少工业和消费废物。
为了创新合成化学,学术界和工业界科学家越来越多地应用酶来制造简单和复杂的功能化(生物)分子(1)。由于受到酶可以精确控制反应结果的启发,化学家们正在利用生物催化转化来补充甚至替代更传统的化学途径(2)。然而,由于与合成相关的反应在自然界中很少有相对应的反应,生物催化的挑战在于为所需应用找到合适的酶催化剂。生物催化的早期应用依赖于食品或其他行业使用的野生型酶,用于生产洗衣粉、半合成抗生素和制药行业的简单手性前体(3-5)。虽然这种再利用偶尔还会有,但大多数新应用都需要发现具有独特反应活性的酶,或对现有酶进行工程改造,以催化所需的反应、接受所需的底物,并在所需的应用条件下保持稳定和活性。过去几年在计算和实验方面取得的进展加快并简化了生物催化剂的定制过程,使其能够进行一系列快速增长的化学转化。如今,开发高效生物催化剂的策略包括:筛选自然多样性以发现所需的酶活性;对生物催化剂进行工程设计以改变底物范围;重新设计机制以产生以前未知的反应活性;以及通过计算重新设计酶(图1)。现在,这些策略使该领域能够更大胆地选择尝试酶促反应。生物催化剂正在被重新设计、重新构想和重新使用,以便高效地获得所需的目标产物。
图一. 生物催化剂开发策略
(左上图)从环境样本或酶库中筛选天然多样性有助于发现所需的酶活性。(右上图)定向进化从在所需反应中具有少量性能的酶开始,并对酶进行调整,使其在所需反应条件下工作良好。通过定向进化的方式进行底物游走,可以扩大酶的能力。首先,酶在机制上能够催化所需的反应(但实际上并不催化),然后对酶进行改造,使其在目标底物上执行反应,生成所需的产物(即改变其底物范围)。(左下图)重新设计酶的机理,利用化学直觉创造新的化学功能——例如,通过辅助因子的再利用和添加新的修复基团。(右下图)计算设计使惰性蛋白质结构具备酶功能。
在此,我们将评估最近在实验和计算方面取得的进展,这些进展推动了生物催化及其应用的发展(图2)。突出的实验创新包括读写DNA的优化策略、自动化和高通量筛选的先进工具,以及在酶中加入新催化元件(包括非典型氨基酸)的能力。计算方面的进步体现在更容易获得合适的酶编码序列、基于机器学习的方法可准确预测蛋白质结构,以及数据驱动工具可指导酶工程创建信息丰富的功能变体库。这些成就已转化为各种应用,包括(化学)酶级联反应、新自然化学、酶法塑料降解以及生物制剂和治疗药物的合成(图2)。
图二. 实验和计算工具的进步拓宽了生物催化的应用范围开发生物催化剂
有几种方法可用于寻找或创造具有所需催化活性的酶(图1)(6)。首先,目标活性可能存在于自然界中,但需要被发现。目前,高质量、低成本的DNA测序已经揭示了全球物种的完整基因组(7, 8),以及来自元基因组样本的DNA片段。在过去5年中,可用蛋白质序列的数量增加了20多倍【2023年,>24亿(9, 10);2018年,~1.23亿(11)】。通过搜索这些序列,可以发现许多推定的酶,其中一些具有可预测的活性,还有许多功能未知。将这些序列数据与序列相似性网络(12)、系统发生分析(13)和蛋白质结构预测等计算工具相结合,可提高搜索的精确度。
一个具有代表性的例子是,通过经典筛选(14)、生物信息学搜索(15)和环境样本测序(16)发现了降解PET塑料的聚对苯二甲酸乙二醇酯(PET)水解酶(PET酶)。另外,过去证明有用的酶的遗留酶库也是确定合适的生物催化剂或工程项目先进起点的宝贵资源。市售酶筛选试剂盒和常用酶(如脂肪酶、酯酶、酮还原酶和转氨酶)的私人酶变体库可以大大缩短获得具有所需目标活性的生物催化剂的时间。最近,蛋白质结构预测的进步(见下文“计算工具”部分)进一步改善了在序列数据库中搜索合适酶的工作。例如,在对脱卤酶的搜索中,序列相似性搜索发现了2905种可能的目标酶(17)。随后的同源模型分析考虑了活性位点的大小、催化残基的存在以及进入活性位点的通道,将搜索范围缩小到45个基因,其中40个基因产生了具有催化活性的脱卤酶。
要获得所需的酶功能,最常见的策略是重新利用现有的酶,因为现有的酶符合新应用的许多要求,但并非所有要求。现有的酶往往能催化所需的反应,但不接受所需的底物或不产生所需的产物异构体。在这种情况下,需要通过蛋白质工程来改变酶对底物或产物的偏好。例如,通过重新设计天冬氨酸酶,可以使α,β-不饱和羧酸发生氢化反应,生成β-氨基酸(18)。目标底物在与天冬氨酸的α-羧酸盐相对应的位置上含有疏水取代基。该设计用疏水氨基酸取代了结合位点上四个主要为极性的氨基酸。在另一个例子中,由于需要进行选择性卤化反应,研究人员扩大了依赖铁(II)/a-酮戊二酸的卤化酶的底物范围,以包括非天然底物(19-21),例如大环内酯山梨醇A,一种强效杀真菌剂。通过使用算法辅助工程技术,soraphen的表观转化率(kcat)提高了100倍以上,使卤素酶成为药物化学结构-活性关系研究的合适催化剂。卤化酶还能接受其他阴离子,包括叠氮化物、硝酸盐和亚硝酸盐,从而生成更多的产品(22)。另一个例子是改变蛋白酶的选择性,以降解麸质肽,作为乳糜泻患者的潜在补充剂(23)。起始蛋白酶倾向于水解Pro-Arg/Lys序列,而谷蛋白含有许多Pro-Gln-Gln/Leu序列。在Gln和Gln/Leu残基之间需要水解。研究人员引入了八个取代位点,其中两个位于新的Gln位点,一个位于Gln/Leu位点,还有五个更远的取代位点,以稳定蛋白质。经过改造的蛋白酶目前正在进行临床试验。
十多年前,“底物行走”的概念还很少被应用(24, 25),即酶从转化天然底物进化到接受工业相关底物。利用转氨酶进化生产西格列汀(26)就是一个早期的例子。如今,使用苯甲醛的Pictet-Spengler酶(27)、对高分子量吲哚和咔唑有活性的黄素依赖性卤化酶(28)、使用胺和酮而非氨基和酮酸的蛋白脱氢酶(还原性胺酶)(29)以及使用非极性芳香底物的转酮酶(30)都是通过底物选择而产生的。
在更困难的情况下,虽然不存在具有所需反应活性的酶,但已知一种酶具有机制上相似的催化活性。将化学推理与蛋白质工程相结合,可以将天然催化活性扩展到所需的活性(6, 31)。扩大细胞色素P450单氧化酶的催化范围以催化碳烯和腈反应就是一个例子。细胞色素P450单氧化酶的氧化机制涉及铁卟啉氧化(Fe=O)中间体,据此推断,如果有适当的活性底物,可能会形成类似的铁碳烯[Fe=C(R1)(R2)]和铁腈(Fe=NR)物种(32, 33)。最初的实验显示反应效率不高,但通过定向进化和用弱供性的丝氨酸取代近端硫代血红素配体(产生所谓的P411支架)进行优化后,催化剂能够进行新自然化学反应,包括环丙烷化、环丙烯化、Si-C键形成、B-C键形成、C-H插入和烷基转移(图3)(34),以及叠氮化、硫酰亚胺化、C-H酰胺化和C-H胺化(图3)(35)。这些例子都是体外的酶催化反应,但这种新的自然碳转移化学也被用于扩展体内的生物合成。经过改造的链霉菌株能生物合成碳转移试剂氮杂环丁烷和受体苯乙烯,从而产生非天然环丙烷(36)。P450单加氧酶也可以通过其他策略被重新利用。例如,将Labrenzia agreggata中的P450单加氧酶改造成一种酮合成酶,通过利用高活性碳位种类作为关键中间体,能够将内部芳基烯直接氧化成酮(37)。再举一个例子,研究人员发现,通过利用金属氧化还原策略,可以开发出基于P450的自由基环化酶,催化立体选择性原子转移自由基反应,生成取代的γ-内酰胺(38)或芳烃(39)。
催化活性的变化也可能更为剧烈;例如,还原酶被扩展为一种通过自由基中间体形成C-C键的环化酶。依赖黄素的“烯”还原酶通常通过逐步加入H2来催化电子活化烯的还原――第一步通过来自黄素对苯二酚的氢化物转移(双电子转移)进行,第二步是来自一个保守的酪氨酸残基的质子转移(图3)。在其他酶中,黄素通过两次单电子转移还原底物,从而产生自由基中间体。将烯还原酶的活化烯底物换成作为自由基前体的a-溴酮,烯还原酶就会改变其机制,转移一个电子。溴的快速流失产生了相应的a-酮基。在适当选择的底物中,该自由基可能环化,形成一个C-C键,并从黄素半醌中抽取一个氢原子(40)。周围的活性位点引导产物中新立体中心的形成。因此,产生的反应是一种对映选择性还原环化反应。
在其他情况下,自由基前体的活性较低,需要光照射来启动单电子转移。在光生物催化反应中,蛋白质活性位点内的辅助因子或氨基酸受到光激发,促进电子或能量转移,将起始物质转化为所需产物。只有三种天然酶遵循这种合成逻辑:脂肪酸光脱羧酶(41)、DNA光解酶(42)和原叶绿素还原酶(43)。后两种酶与合成的关系不大,而脂肪酸脱羧酶已被研究用于催化脂肪酸的加氢脱羧反应,这是一种氧化还原中性反应,可生成烷烃,使其成为生物燃料生产(44)和化学砌块合成(45)的理想催化剂。
除了选择良好的有机卤化物的自由基环化反应(46)外,光生物催化方法同样可以实现炔的烷基化反应(47)、烷基卤化物和硝基烷烃的不对称交叉亲电偶联反应(48)(图3),以及通过生成酰胺自由基的加氢氨化反应(49)。非酶光氧化催化剂还能为酶生成底物,从而产生新的反应。添加基于氧杂蒽的光催化剂可使烯还原酶催化对映选择性脱乙酰氧基化反应(50)。在另一个例子中,利用单独的光催化和酶步骤合成了非典型氨基酸。在光催化过程中,三氟硼酸烷基前体生成一个烷基自由基。在同一溶液中,改良的色氨酸合成酶催化丝氨酸脱水,形成酶结合的吡哆醇-5′-磷酸氨基丙烯酸酯中间体。自由基的淬灭和中间体的释放会产生一种非典型氨基酸。调整活性位点的形状可微调所有所述反应的对映体选择性,最多可生成三个立体手性中心(51)。
图三. 重新设计酶机理的实例
(A)(顶部图)野生型细胞色素P450单加氧酶催化的加氧反应。铁氧化物和铁硝基苯的结构相似性启发了人们使用合成试剂与工程化的P450酶进行新的化学反应。(左下图)这些所谓的P411酶,含有一个丝氨酸残基作为近端配体(表示为X),进化出通过sp3C-H功能化来构建C-C键(34)和在苄基和烯丙基(未显示)位置氨基化(右下图)产生对映体富集的无保护的伯胺(35)。(B)(左上图)烯还原酶通过黄素单核苷酸(FMN)的氢化物转移(双电子转移)和一个保守的酪氨酸残基(未显示)的质子转移催化不对称双键还原。通过光催化,当使用自由基前体作为底物(如图所示,α-氯酮)时,烯还原酶的催化机理可以被重新利用。(右上图)在设计的Diels-Alder酶(155)催化下,4-羧基苄基-反式-1,3-丁二烯-1-氨基甲酸酯与N,N-二甲基丙烯酰胺发生热允许的[4+2]环加成反应。(左下图)照射启动了来自黄素对苯二酚辅助因子的单电子转移,并促进了甲酮基的形成,甲酮基可以在工程酶支架的范围内参与立体选择性sp3-sp3交叉亲电子偶联反应(48)。(右下图)通过基因代码扩增连接上非典型氨基酸4-苯甲酰基苯丙氨酸(绿色),扩大了Diels-Alder酶的反应范围。在设计酶的照射下,ncAA可将三重能转移到适当选择的底物上,从而实现热禁反应,如具有高立体选择性的分子内和双分子(未显示)[2+2]环加成反应(156)。
研究人员还通过计算将新的催化活性设计到蛋白质支架中,而不是修改或扩展现有的酶活性。这种从头开始的设计方法可以确定所需的转化过渡状态,然后建立一个结合位点使其稳定,从而将生物催化问题简化为分子识别问题。虽然从头的酶设计已经为质子转移、双分子-醛醇和Diels-Alder反应等模型转化创造了蛋白质催化剂(52)。设计催化剂的初始活性较低,但定向进化提高了它们的催化活性。例如,定向进化设计的逆醛醇酶使其催化活性从几乎检测不到提高到天然酶的水平。定向进化引入了31个取代基,使其活性提高了一百万倍(53)。最近,一种基于深度学习的方法生成了大量理想化的蛋白质结构及其编码序列。这些不同的支架被用来设计人工荧光素酶。通过定点饱和诱变引入的三个置换产生的光子通量比原设计高100倍(kcat/Km=106 M-1s-1)(54)(其中kcat/Km是催化效率,Km是迈克尔常数)。尽管从头设计具有可与天然酶相媲美活性的酶目前仍是一项重大挑战,但这些研究增进了我们对序列如何折叠成蛋白质以及基本酶活性如何产生的了解。随着我们对酶的序列―功能关系理解的加深、蛋白质设计方法的成熟和计算能力的提高,从头设计酶将继续发展。
实验工具
无论选择哪种策略来确定合适的生物催化剂,都需要进行实验室的研究来生产目标酶,并在必要时对其进行定制。无论是通过降低合成基因的成本、加快单个定向进化周期,还是在蛋白质中加入新的催化元件,蛋白质工程师可用的实验工具范围都在不断扩大。
生物催化剂的开发始于编码相关酶的DNA构建,这需要人工DNA合成。目前的DNA合成使用40年前开发的亚磷酰胺化学(55);不过,用酶进行DNA合成(56-58)可获得更高质量的DNA,而且速度更快、成本更低,因此本身就是一种生物催化解决方案。末端脱氧核苷酸转移酶(TdTs)(图4)以不依赖模板的方式将脱氧核苷酸三磷酸酯(dNTPs)聚合到DNA序列的3′端。使用3′-羟基被阻断的dNTP,可在单个核苷酸掺入后停止TdT的作用,从而控制原本失控的聚合。原生TdT与阻断的dNTP反应缓慢,因此针对这一应用设计了改进的 TdT(59,60)。以TdT为基础的方法推动了DNA寡核苷酸的合成,新长度可达1000个核苷酸,掺入效率大于99.6%,为快速、单一的全基因合成带来了希望。较温和的水反应条件也有利于提高DNA质量,大大改善了整个过程的可持续性,为基因编辑和诊断应用开辟了机会。TdTs还能组装短合成RNA片段。这些序列除了标准的RNA构建模块外,还含有修饰的核苷酸,具有作为反义寡核苷酸和小干扰RNA的巨大治疗潜力 (61-63)。
图四. 定向进化方法建模
单点突变的递归累积,如那些由易出错的PCR方法产生的突变,可使适应性提高2N(浅蓝色曲线)。在进化过程中加入重组技术,可将适合度累积提高到2.75N(26)到4N(122, 152)(虚线),平均约为3.2N(粉红色曲线)。无细胞表达技术提高了进化周期的速度(绿色曲线),而持续进化技术估计会更快地加速点突变的积累(长春花色曲线)。基于微流控技术的超高通量筛选每轮可提高100倍(76)。N表示进化周期数。在本综述中,假设每月可进行一次进化循环。
尽管酶法DNA合成技术不断进步,但大多数实验室仍依赖于传统的分子生物学策略,通过易出错的聚合酶链式反应(PCR)或以化学合成的基因为模板,通过定点诱变构建少量特定变体等方法,来创建大型随机化数据库。使用这些传统方法构建预定义酶变体库仍然昂贵且具有挑战性。“寡核苷酸库”——由几百到1000个不同的多核苷酸组成,长度约为300碱基对——是一种成本较低的替代解决方案(每个核苷酸0.00001到0.001美元,取决于长度、规模、平台或供应商)(64)。尽管寡核苷酸库有截短DNA分子和高错误率等缺点(65),但与通常用于数据库构建的变性或降低密码子覆盖率的引物相比,寡核苷酸库方案可能更具成本效益,而且可以进行更灵活的库设计(66)。
蛋白质工程的基石(1, 3, 67, 68),即诺贝尔奖得主的定向进化策略,在很大程度上依赖于这种随机基因库。30年前定向进化出现时,易出错的PCR是序列变异的驱动力,导致单突变逐轮积累,每轮进化中酶的性能大约提高两倍(69)(图4,浅蓝色曲线)。同时加入的重组技术通过在每轮进化中加入多个突变,将每轮进化的改进率提高到2.75到4倍(图4,虚线曲线),反映了过去二十年的技术水平。计算和分子生物学的努力改进了突变预测,加速了酶变体的产生,从而减轻了筛选负担,但并没有使筛选周期或每周期的改进率与这些历史标准相比发生巨大变化(70)。此外,蛋白质工程师还在不断提高尝试进化活动的复杂性。这些进展共同表明,生物催化领域的瓶颈问题日益突出:对蛋白质工程资源的需求越来越高,而进化实验的方式却缺乏改进。不过,技术创新即将到来。无细胞蛋白质表达技术提供了将许多DNA序列转录并转化为功能蛋白质的所有必要成分,避免了细胞转化、生长和诱导等耗时的步骤(71)。利用这种技术生产酶库,在进化实验中进行测试,有可能将完成一轮进化的时间加快约1.6倍(图4,绿色曲线)。在生物界,持续进化策略将所需酶活性的成功与生产微生物的生长速度联系在一起,同时为微生物提供了一种机制,即只在编码所需蛋白质的DNA中引入突变(72, 73)。这样,所需的蛋白质就会在连续培养过程中发生进化,从而避免了无细胞蛋白质表达所需的相同实验室操作,此外还避免了人为构建新的变体库,与容易出错的PCR相比,进化速度提高了八倍【与目前的技术水平相比提高了五倍(图4,长春花色曲线)】。例如,mRNA显示库(74)产生了新的蛋白质、具有催化活性的新型蛋白质以及与其靶标具有极高亲和力的结合蛋白。同样,微流控技术也证明了筛选大型库的能力,从而积极改变了定向进化实验的性质(图4,黑色曲线)(75)。将细胞封装到微微升大小的液滴中,再加上裂解试剂和分析读数,科学家们每秒就能分析数千个样本,与荧光激活细胞分拣(FACS)技术的分析速度相当。由于可以对数百万个样本进行分析,因此可以对每个序列具有多个突变的文库进行深入筛选,从而发现罕见事件,使每轮进化的改进幅度达到100倍或更高(76)。虽然由于缺乏商业化硬件、实施成本相对较高以及技术复杂性等原因,此类工具的使用迄今仅限于专家从业者,但这些策略显示出了管理日益复杂的靶标所需的更长进化时间的前景。
其他对蛋白质工程有用的新兴工具包括低温电子显微镜(cryo-EM)和微晶电子衍射(MicroED),前者已被有效地用于指导硝化酶的改进(77),后者支持对设计蛋白质中碳烯转移的机理研究(78)。这两种方法都能收集机理见解和结构数据,是对X射线晶体学的补充,而X射线晶体学仍然是生成高分辨率结构的重要工具,尤其是较小的酶。
作为对酶工程研究获得的生物催化剂的补充,一些应用要求研究人员为蛋白质配备新的自然功能。这可以通过使用琥珀色终止密码子抑制或杂合氨基酰tRNA合成酶(aaRSs)加入非规范氨基酸(ncAAs)来实现,从而将可用的催化单元范围扩大到20个蛋白源氨基酸编码之外(79)。
在血红素蛋白抗坏血酸过氧化物酶中引入Nd-甲基组氨酸(NMH)作为近端配体,可以在不影响催化效率的情况下大幅增加周转次数(80),这就是通过加入ncAAs来调整酶特性的一个典型例子。同样,引入NMH可调节细胞色素C过氧化物酶中化合物II的反应性(81,82),并增强肌红蛋白的杂合过氧化物酶(83)和环丙烷化(84,85)活性。最近,这种非经典的亲核试剂被引入了一种为Morita-Baylis-Hillman反应而设计的酶中。在进化过程中,NMH极大地改变了进化轨迹,产生的活性变体与之前设计的不包含新催化实体的酶相比高出一个数量级(86)。
装入酪氨酸类似物是对涉及自由基中间体的酶进行机理研究的重要工具,在这些酶中,酪氨酸残基可能起催化作用。在依赖铁(II)/α-酮戊二酸的二加氧酶——大肠杆菌核苷酸还原酶(87)或verrucologen合成酶(88)的活性位点的关键位置加入卤代酪氨酸类似物,就能使用电子磁共振等分析工具,从而对反应机理有重要的了解。
通过使用琥珀色终止密码子抑制来装入光敏剂,产生了一种能催化光诱导[2+2]环加成反应的酶。在非天然氨基酸4-苯甲酰基苯丙氨酸的激发下——这种氨基酸被安装在从头设计的Diels-Alder酶的活性位点上——三重能量转移启动了热禁性[2+2]-环加成反应。对酶进行微调的定向进化产生了一种对分子内和分子间反应都具有高对映选择性的催化剂(89)(图3)。
计算工具
基于机器学习的结构预测工具有望限制分析定向进化过程中通常产生的庞大数据库所需的过度筛选或选择。DeepMind开发的高级统计系统AlphaFold2可以根据氨基酸序列预测蛋白质结构,其准确性远远高于以往的方法。AlphaFold2使用深度神经网络来预测氨基酸序列中的残基间距离(90)。它的预测依赖于蛋白质数据库(PDB)(www.wwpdb.org)中的结构数据,该数据库包含20万种蛋白质和核酸的三维结构。神经网络假定数据库中经常出现的子结构比不存在或很少出现的子结构更稳定。目前,预测结构数据库(https://alphafold.com/)包含2亿多个条目,而且还在不断增加。Meta Platforms公司创建的RoseTTAFold(91)和ESMFold(92)也是类似的有用替代品。
结构预测有可能揭示目标酶活性位点残基的排列,从而指导酶的优化(93)。然而,酶的功能还需要底物结合和产物释放,而且往往依赖于辅助因子或金属离子。AlphaFill(94)和DiffDock(95)等工具可将缺失的有机分子和金属离子投射到蛋白质口袋中,从而提供更准确反映所需化学反应的模型。为了捕捉运动,AlphaFold2可以通过降低作为算法输入的多序列比对的深度来近似地反映构象的异质性(96),研究人员使用AlphaFold2创建色氨酸合成酶的交替构象模型时就证明了这一点(97)。
根据氨基酸序列预测原生蛋白质结构所训练的深度神经网络可以反过来设计新的蛋白质(98-101)。第一步是预测随机氨基酸序列的结构,从而得出结构的部分可信预测和其他部分的不确定预测。对不确定区域的氨基酸序列进行反复修改,最终得到一个整个结构都可预测的序列。测试这些预测结果往往能得到结构接近预测结果的稳定蛋白质。这些用于蛋白质设计的神经网络方法比Rosetta Match(102)、Rosetta Design(103)和Rosetta Ligand(104)等基于物理学的方法更快,因为它们并不试图优化侧链包装等相互作用。然而,神经网络方法缺乏Rosetta等方法的物理透明度。在蛋白质设计中加入经过蛋白质训练的扩散模型【类似于用于生成图像的Stable Diffusion(105)或用于生成文本的ChatGPT】,可以扩大生成设计的数量和种类,从而增加成功的机会(106)。此外,语言模型可以生成不同家族的功能性蛋白质序列(107)。
尽管蛋白质结构的设计在不断改进,但具有催化功能的蛋白质的设计仍然具有挑战性。设计通常会产生低效的酶,然后需要通过定向进化进行大量优化(见上文“实验工具”部分)。这可能是因为高效催化需要更精确的催化基团定位,而目前的算法无法实现。造成这一问题的另一个原因是人们对催化所需的结构特征(包括运动)了解不全面。利用X射线晶体学确定蛋白质结构的经典方法是使用过渡态类似物或自杀底物来揭示底物如何与酶的活性位点结合,了解结合口袋的位置,并收集有助于催化的蛋白质运动信息。例如,尽管已有几种脂肪酶的X射线结构显示催化位点被埋藏,但脂肪酶在油水界面具有较高催化活性的结构基础仍是一个谜。Brzozowski等人于1991年利用一种脂肪酶结构解决了这一难题,该结构显示覆盖催化位点的螺旋盖发生了剧烈运动(108)。最近的一个谜题是单胺氧化酶,其X射线结构也显示出一种封闭构象,无法解释突变对催化活性和底物范围的影响。在这种情况下,一种使用长时间尺度分子动力学的计算方法确定了部分和完全开放的构象,这些构象可以解释催化作用的变化(109)。目前的结构预测工具在大多数情况下不包括蛋白质动力学,同样也不包括有关二硫键和翻译后修饰(数据库中的蛋白质序列通常不包括这些修饰)(如糖基化和乙酰化)的信息,因此必须使用补充计算工具和实验。
将蛋白质结构与蛋白质功能(如反应性或选择性)联系起来是机器学习中一个不断进步的领域。基于蛋白质结构的神经网络(110)和使用对比学习方法基于序列的神经网络都提高了预测蛋白质功能的可靠性(111)。在许多情况下,机器学习在蛋白质催化特性方面的应用受到可用来训练神经网络的可靠实验数据的限制;最近,EnzymeML数据库的建立就是为了解决这个问题(112)。在测量了数万种蛋白质变体特性的特殊情况下,机器学习可以预测具有更好结合特性的变体(113,114)。计算建模预测数据的使用也有助于机器学习方法设计更具选择性的酶(115,116)。
酶设计的另一个挑战是预测远距离氨基酸置换的影响。实验表明,这些残基会影响催化作用,因此预测这些残基对设计高效的酶至关重要。这些残基距离太远,无法直接与底物相互作用。当蛋白质弯曲和移动时,它们可能通过类似于多米诺骨牌的作用来改变活性位点内催化残基和底物的定位和灵活性,这与异位作用类似。最短路径图(117)是捕捉相关远端残基影响的一种很有前途的计算方法。这种方法从分子动力学模拟入手,找出一起运动并与催化残基相连的残基。应用这种策略时,远处的取代取消了色氨酸合成酶B的异位激活,使其永久激活(118)。
应 用
将几种工程酶组合成级联,可创造出新的生化途径(119)。最近的例子(图5)包括合成药物——如环二核苷酸ulevostinag(120)、molnupiravir(121)、islatravir(122)和ikarugamycin(123)——和制造新型胰岛素的生物共轭物(124)以及人造甜味剂。能够通过CETCH循环(125)产生化合物的二氧化碳固定途径,甚至从二氧化碳衍生的甲醇中合成淀粉(126),都是复杂工程途径的进一步实例。
在香料工业中,(-)-Ambrox具有香草和木质的气味,是最广泛使用的可生物降解香料成分之一。(-)-Ambrox(市场名为Ambrofix)以前的合成方法是从鼠尾草中分离出来的二萜sclareol经过多个步骤合成的。新的一步法工艺是从生物合成的高法尼基醇中使用一种工程化的角鲨烯-蒎烯环化酶(图5)(127-129)。
酶级联的另一个例子是Bristol Myers Squibb(130)和Codexis(131)于2023年初报道的烯丙基酮3-oxocyclohexene-1-carboxylate到相应饱和醇的一锅双酶还原反应。烯还原酶(ERED)和酮还原酶(KRED)工艺显示出很高的对映选择性和化学选择性。辅助因子再生系统的兼容性和副反应的避免使产品产量最大化。另外,底物抑制和酶在工艺条件下的稳健性也得到了改善,从而提供了一种可扩展的酶级联,同时大大减少了合成步骤的数量,提高了总产率,并降低了工艺质量强度(PMI)——一种环境影响指标——从最初化学路线的2017值降至仅170。
图五. 基于生物催化的最新产品示例
上图显示的例子包括生物治疗药物【工程化的α-半乳糖苷酶A(157)、胰岛素类似物(124)和由TdTs合成的寡核苷酸(60)】;潜在的大宗产品【由CO2合成的淀粉(126)和由PET回收的塑料瓶(149)】;药物【molnupiravir(121)、ulevostinag(120)、islatravir(122)、ikarugamycin(123)和BMS-986278(130, 131)的中间体】;以及香料Ambrofix(127-129)。
由于有了逆合成工具——有机化学家几十年来一直使用的断开方法——来规划合成路线(132, 133),新型酶级联的开发工作得以简化。这些程序【如RetroBioCat(134)】可确定多步生物催化反应的可能路线,同时考虑到商业可用性、辅助因子要求和溶剂耐受性等方面(135-138)。机器学习也可协助实现这一目的(139)。同样,代谢途径规划可预测复杂天然产物和1,4-丁二醇等较简单分子的生成途径(140)。
针对更难用药的靶点开发药物导致分子中的手性中心、超出Linpinski五规则的骨架(141)和生物共轭物(142)【如放射治疗药物、反义寡核苷酸治疗药物和抗体药物共轭物(143)】越来越多。要解决这些合成(以及随后的制造)难题,需要找到酶工具来生产这些复杂的骨架。例如,据报道,通过使用改造的青霉素G酰化酶,可以选择性地酰化胰岛素的三个氨基——两个氨基末端或内部赖氨酸残基。这些酶变体能够以可编程的方式安装可裂解的苯乙酰胺保护基团,同时保留一个或多个未受保护的氨基基团,以便进行后续化学修饰。酶的高区域选择性提高了胰岛素共轭物的整体纯度和产量(124)(图5)。
尽管修饰寡核苷酸的化学合成方法已经成熟,但以可持续和经济可行的方式进行大规模生产仍具有挑战性(144)。随着寡核苷酸长度的增加,化学偶联效率的误差也会逐渐增加。一些公司和学术实验室已开发出酶组装化学修饰寡核苷酸的技术(62,145)。这种方法利用众所周知的RNA连接酶的催化活性,在两个寡核苷酸的3′-OH和5′-PO4端部之间形成依赖于三磷酸腺苷(ATP)的共价键,从而形成一条更大的连续链(146)。最近的一种方法介绍了使用这种RNA连接酶从短(≤9核苷酸)寡核苷酸片段开始合成化学修饰的RNA(147),转化率为40%至80%。
寡核苷酸的一种正交酶法(62)使用了添加催化量的自吸式(发夹状)模板。DNA聚合酶在三磷酸核苷(NTP)构建模块的存在下扩增互补序列。一种特定的内切酶会裂解新合成的链,然后释放模板进行下一个催化循环。这种合成方法在水中使用未受保护的构建模块,不需要大量乙腈(固相合成通常使用乙腈),因此解决了可持续发展的一大难题。能否以可接受的时间和成本获得足够大规模的无保护NTP,从而将这一概念完全应用于生产规模,还有待观察。不过,鉴于酶法合成非天然单核苷酸和二核苷酸(如ulevostinag,图5)的成功,可以认为生物催化生产是可行的。
酵素还可用于解决塑料污染问题。自20世纪50年代以来,已生产了近90亿吨塑料,废塑料已成为全球关注的主要环境问题。由于关键的化学键可以水解产生相应的单体,而单体可以用来制造新的原始聚合物,因此人们在利用生物催化方法降解和回收商品塑料(148)方面做出了巨大努力,特别是聚酯、聚酰胺和聚氨酯。据报道,最先进的回收工艺用于PET。合理的设计方法产生了叶枝堆肥角质酶(LCC)的四倍突变体,其效率足以建立目前在工业规模上实施的稳健工艺(149)(图5)。最近的一个例子是利用机器学习技术从Ideonella sakaiensis培育出PET酶(150)。目前的研究重点是聚酰胺和聚氨酯水解酶;最近在元基因组库中发现了首批候选酶(151)。
结 论
过去几年开发的先进工具加快了蛋白质工程的速度,使酶成为与传统有机合成催化剂同等的催化剂,导致生物催化在制药(152)和许多其他领域的应用激增。未来的酶工程还需要加快“发现-设计-测试”周期,以保持发展势头,并扩大对新酶类别的合成贡献。同样,需要将酶与其他(催化)合成化学方法相结合,如过渡金属催化、光催化和电催化(119,153,154),以应对人类面临的挑战,如应对气候变化、降解塑料废物、向可再生能源过渡以及开发新的医疗疗法。重新利用酶的机制来扩大生物催化反应的范围,是在酶催化剂中创造所需活性的一个新概念。其他令人兴奋的新型酶反应策略包括酶的全新设计(54)和计算机“幻觉”(98)。
十一年前,生物催化的第三次浪潮推动了酶技术从“围绕酶的局限性设计生物催化过程,到工程设计酶以适应过程的规格”(1)。现在,这项技术实现了又一次飞跃:酶工程师不再需要依赖酶本身的催化能力来定义可利用的化学反应,而是可以大胆设想新的自然反应,并将这些反应变为生物催化的现实。
参考文献
(1) U. T. Bornscheuer et al., Engineering the third wave of biocatalysis. Nature 485, 185–194 (2012). doi: 10.1038/nature11117; pmid: 22575958
(2) K. Chen, F. H. Arnold, Engineering new catalytic activities in enzymes. Nat. Catal. 3, 203–213 (2020). doi: 10.1038/s41929-019-0385-5
(3) E. L. Bell et al., Biocatalysis. Nat. Rev. Methods Primers 1, 46(2021). doi: 10.1038/s43586-021-00044-z
(4) K. Buchholz, V. Kasche, U. T. Bornscheuer, Biocatalysts and Enzyme Technology. (Wiley-VCH, ed. 2, 2012).
(5) A. S. Bommarius, B. R. Riebel, Biocatalysis. (Wiley-VCH, 2004).
(6) C. Klaus, S. C. Hammer, New catalytic reactions by enzyme engineering. Trends Chem. 4, 363–366 (2022). doi: 10.1016/ j.trechm.2022.03.002
(7) L. R. Thompson et al., A communal catalogue reveals Earth’s multiscale microbial diversity. Nature 551, 457–463 (2017).doi: 10.1038/nature24621; pmid: 29088705
(8) H. A. Lewin et al., Earth BioGenome Project: Sequencing life for the future of life. Proc. Natl. Acad. Sci. U.S.A. 115,4325–4333 (2018). doi: 10.1073/pnas.1720115115;pmid: 29686065
(9) The Uniprot Consortium, UniProt: The universal protein knowledgebase in 2021. Nucleic Acids Res. 49, D480–D489(2020).
(10) L. Richardson et al., MGnify: The microbiome sequence data analysis resource in 2023. Nucleic Acids Res. 51 (D1), D753–D759(2023). doi: 10.1093/nar/gkac1080; pmid: 36477304
(11) M. Steinegger, J. Söding, Clustering huge protein sequence sets in linear time. Nat. Commun. 9, 2542 (2018).doi: 10.1038/s41467-018-04964-5; pmid: 29959318
(12) J. A. Gerlt et al., Enzyme Function Initiative-Enzyme Similarity Tool (EFI-EST): A web tool for generating protein sequence similarity networks. Biochim. Biophys. Acta. - Prot.Proteom. 1854, 1019–1037 (2015). doi: 10.1016/j.bbapap.2015.04.015
(13) D. M. Emms, S. Kelly, SHOOT: Phylogenetic gene search and ortholog inference. Genome Biol. 23, 85 (2022). doi: 10.1186/s13059-022-02652-8; pmid: 35346327
(14) R.-J. Müller, H. Schrader, J. Profe, K. Dresler, W.-D. Deckwer, Enzymatic Degradation of Poly(ethylene terephthalate):Rapid Hydrolyse using a Hydrolase from T. fusca. Macromol.Rapid Commun. 26, 1400–1405 (2005). doi: 10.1002/marc.200500410
(15) E. Erickson et al., Sourcing thermotolerant poly(ethylene terephthalate) hydrolase scaffolds from natural diversity.Nat. Commun. 13, 7850 (2022). doi: 10.1038/s41467-022-35237-x; pmid: 36543766
(16) S. Sulaiman et al., Isolation of a novel cutinase homolog with polyethylene terephthalate-degrading activity from leafbranch compost by using a metagenomic approach. Appl.Environ. Microbiol. 78, 1556–1562 (2012). doi: 10.1128/AEM.06725-11; pmid: 22194294
(17) M. Vasina et al., Advanced database mining of efficient haloalkane dehalogenases by sequence and structure bioinformatics and microfluidics. Chem Catal. 2, 2704–2725 (2022). doi: 10.1016/j.checat.2022.09.011
(18) R. Li et al., Computational redesign of enzymes for regio- and enantioselective hydroamination. Nat. Chem. Biol. 14,664–670 (2018). doi: 10.1038/s41589-018-0053-0;pmid: 29785057
(19) T. Hayashi et al., Evolved Aliphatic Halogenases Enable Regiocomplementary C-H Functionalization of a Pharmaceutically Relevant Compound. Angew. Chem. Int. Ed.58, 18535–18539 (2019). doi: 10.1002/anie.201907245;pmid: 31589798
(20) J. Büchler et al., Algorithm-aided engineering of aliphatic halogenase WelO5* for the asymmetric late-stage functionalization of soraphens. Nat. Commun. 13, 371 (2022). doi: 10.1038/s41467-022-27999-1; pmid: 35042883
(21) S. Duewel et al., Directed Evolution of an Fe II -Dependent Halogenase for Asymmetric C(sp 3 )–H Chlorination.ACS Catal. 10, 1272–1277 (2020). doi: 10.1021/acscatal.9b04691
(22) A. Papadopoulou, F. Meyer, R. M. Buller, Engineering Fe(II)/ a-Ketoglutarate-Dependent Halogenases and Desaturases.Biochemistry 62,229–240(2023).doi: 10.1021/acs.biochem.2c00115; pmid: 35446547
(23) C. Wolf et al., Engineering of Kuma030: A Gliadin Peptidase That Rapidly Degrades Immunogenic Gliadin Peptides in Gastric Conditions. J. Am. Chem. Soc. 137,13106–13113 (2015). doi: 10.1021/jacs.5b08325;
pmid: 26374198
(24) J. M. Smith, Natural selection and the concept of a protein space. Nature 225, 563–564 (1970). doi: 10.1038/225563a0; pmid: 5411867
(25) M. Kaltenbach, N. Tokuriki, Dynamics and constraints of enzyme evolution. J. Exp. Zool. B Mol. Dev. Evol. 322,468–487 (2014). doi: 10.1002/jez.b.22562; pmid: 24522979
(26) C. K. Savile et al., Biocatalytic asymmetric synthesis of chiral amines from ketones applied to sitagliptin manufacture.Science 329, 305–309 (2010). doi: 10.1126/science.1188934;pmid: 20558668
(27) E. Eger et al., Asymmetric Biocatalytic Synthesis of 1-Aryltetrahydro-b-carbolines Enabled by “Substrate Walking”.Chemistry 26, 16281–16285 (2020). doi: 10.1002/chem.202004449; pmid: 33017078
(28) J. T. Payne, C. B. Poor, J. C. Lewis, Directed evolution of RebH for site-selective halogenation of large biologically active molecules. Angew. Chem. Int. Ed. 54, 4226–4230 (2015). doi: 10.1002/anie.201411901; pmid: 25678465
(29) O. Alvizo, M. A. Mayo, J. C. Moore, US Patent US10370648B2. (2014).
(30) P. E. Affaticati et al., Structural Analysis of an Evolved Transketolase Reveals Divergent Binding Modes.Sci. Rep. 6, 35716 (2016). doi: 10.1038/srep35716;pmid: 27767080
(31) H. Renata, Z. J. Wang, F. H. Arnold, Expanding the enzyme universe: Accessing non-natural reactions by mechanismguided directed evolution. Angew. Chem. Int. Ed. 54, 3351–3367 (2015). doi: 10.1002/anie.201409470;pmid: 25649694
(32) O. F. Brandenberg, R. Fasan, F. H. Arnold, Exploiting and engineering hemoproteins for abiological carbene and nitrene transfer reactions. Curr. Opin. Biotechnol. 47, 102–111 (2017). doi: 10.1016/j.copbio.2017.06.005; pmid: 28711855
(33) Y. Yang, F. H. Arnold, Navigating the Unnatural Reaction Space: Directed Evolution of Heme Proteins for Selective Carbene and Nitrene Transfer. Acc. Chem. Res. 54, 1209–1225 (2021). doi: 10.1021/acs.accounts.0c00591;pmid: 33491448
(34) R. K. Zhang et al., Enzymatic assembly of carbon-carbon bonds via iron-catalysed sp3 C-H functionalization. Nature 565, 67–72 (2019). doi: 10.1038/s41586-018-0808-5;pmid: 30568304
(35) Z.-J. Jia, S. Gao, F. H. Arnold, Enzymatic Primary Amination of Benzylic and Allylic C(sp3)-H Bonds. J. Am. Chem. Soc. 142,10279–10283 (2020). doi: 10.1021/jacs.0c03428;pmid: 32450692
(36) J. Huang et al., Complete integration of carbene-transfer chemistry into biosynthesis. Nature 617, 403–408(2023). doi: 10.1038/s41586-023-06027-2;pmid: 37138074
(37) S. Gergel et al., Engineered cytochrome P450 for direct arylalkene-to-ketone oxidation via highly reactive carbocation intermediates. Nat. Catal. 6, 606–617 (2023). doi: 10.1038/s41929-023-00979-4
(38) Q. Zhou, M. Chin, Y. Fu, P. Liu, Y. Yang, Stereodivergent atom-transfer radical cyclization by engineered cytochromes P450. Science 374, 1612–1616 (2021). doi: 10.1126/science.abk1603; pmid: 34941416
(39) W. Fu et al., Enzyme-controlled stereoselective radical cyclization to arenes enabled by metalloredox biocatalysis.Nat. Catal. 6, 628–636 (2023). doi: 10.1038/s41929-023-00986-5
(40) H. Fu et al., Ground-State Electron Transfer as an Initiation Mechanism for Biocatalytic C-C Bond Forming Reactions.J. Am. Chem. Soc. 143, 9622–9629 (2021). doi: 10.1021/jacs.1c04334; pmid: 34114803
(41) T. M. Hedison, D. J. Heyes, N. S. Scrutton, Making molecules with photodecarboxylases: A great start or a false dawn?Curr.Res.Chem.Biol.2,100017 (2022). doi: 10.1016/j.crchbi.2021.100017
(42) A. Sancar, Structure and function of DNA photolyase and cryptochrome blue-light photoreceptors. Chem. Rev. 103,2203–2237 (2003). doi: 10.1021/cr0204348;pmid: 12797829
(43) P. Vedalankar, B. C. Tripathy, Evolution of light-independent protochlorophyllide oxidoreductase. Protoplasma 256,293–312 (2019). doi: 10.1007/s00709-018-1317-y;pmid: 30291443
(44) M. A. Emmanuel et al., Photobiocatalytic Strategies for Organic Synthesis. Chem. Rev. 123, 5459–5520 (2023).doi: 10.1021/acs.chemrev.2c00767; pmid: 37115521
(45) W. Zhang et al., Photobiocatalytic synthesis of chiral secondary fatty alcohols from renewable unsaturated fatty acids. Nat. Commun. 11, 2258 (2020). doi: 10.1038/s41467-020-16099-7; pmid: 32382158
(46) K. F. Biegasiewicz et al., Photoexcitation of flavoenzymes enables a stereoselective radical cyclization. Science 364,1166–1169 (2019). doi: 10.1126/science.aaw1143;pmid: 31221855
(47) C. G. Page et al., Regioselective Radical Alkylation of Arenes Using Evolved Photoenzymes. J. Am. Chem. Soc. 145,11866–11874 (2023). doi: 10.1021/jacs.3c03607;pmid: 37199445
(48) H. Fu et al., An asymmetric sp3-sp3 cross-electrophile coupling using ‘ene’-reductases. Nature 610, 302–307(2022).doi: 10.1038/s41586-022-05167-1; pmid: 35952713
(49) Y. Ye et al., Using enzymes to tame nitrogen-centred radicals for enantioselective hydroamination. Nat. Chem. 15,206–212 (2023). doi: 10.1038/s41557-022-01083-z;pmid: 36376390
(50) K. F. Biegasiewicz, S. J. Cooper, M. A. Emmanuel, D. C. Miller,T. K. Hyster, Catalytic promiscuity enabled by photoredox catalysis in nicotinamide-dependent oxidoreductases.Nat. Chem. 10, 770–775 (2018). doi: 10.1038/s41557-018-0059-y; pmid: 29892028
(51) L. Cheng et al., Stereoselective amino acid synthesis by synergistic photoredox-pyridoxal radical biocatalysis.Science 381, 444–451 (2023). doi: 10.1126/science.adg2420;pmid: 37499030
(52) S. L. Lovelock et al., The road to fully programmable protein catalysis. Nature 606, 49–58 (2022). doi: 10.1038/s41586-022-04456-z; pmid: 35650353
(53) R. Obexer et al., Emergence of a catalytic tetrad during evolution of a highly active artificial aldolase. Nat. Chem.9, 50–56 (2017). doi: 10.1038/nchem.2596;pmid: 27995916
(54) A. H.-W. Yeh et al., De novo design of luciferases using deep learning. Nature 614, 774–780 (2023). doi: 10.1038/s41586-023-05696-3; pmid: 36813896
(55) S. L. Beaucage, M. H. Caruthers, Deoxynucleoside phosphoramidites—A new class of key intermediates for deoxypolynucleotide synthesis. Tetrahedron Lett. 22,1859–1862 (1981). doi: 10.1016/S0040-4039(01)90461-7
(56) A. Hoose, R. Vellacott, M. Storch, P. S. Freemont, M. G. Ryadnov, DNA synthesis technologies to close the gene writing gap. Nat. Rev. Chem. 7, 144–161 (2023). doi: 10.1038/s41570-022-00456-9; pmid: 36714378
(57) D. Verardo et al., Multiplex enzymatic synthesis of DNA with single-base resolution. Sci. Adv. 9, eadi0263 (2023). doi: 10.1126/sciadv.adi0263; pmid: 37418522
(58) S. Palluk et al., De novo DNA synthesis using polymerasenucleotide
conjugates. Nat. Biotechnol. 36, 645–650 (2018).doi: 10.1038/nbt.4173; pmid: 29912208
(59) I. Sarac, M. Hollenstein, Terminal Deoxynucleotidyl Transferase in the Synthesis and Modification of Nucleic Acids. ChemBioChem 20, 860–871 (2019). doi: 10.1002/cbic.201800658; pmid: 30451377
(60) C. Ching et al, Codexis Inc., World Intellectual Property Organization Patent Application WO 2023/069865, US Patent Application PCT/US2022/078071 (2023).
(61) M. Friedrich, A. Aigner, Therapeutic siRNA: State-of-the-Art and Future Perspectives. BioDrugs 36, 549–571 (2022).doi: 10.1007/s40259-022-00549-3; pmid: 35997897
(62) E. R. Moody, R. Obexer, F. Nickl, R. Spiess, S. L. Lovelock,An enzyme cascade enables production of therapeutic oligonucleotides in a single operation. Science 380,1150–1154 (2023). doi: 10.1126/science.add5892;pmid: 37319201
(63) D. J. Wiegand et al., A platform for controlled templateindependent
enzymatic synthesis of RNA oligonucleotides and therapeutics. bioRxiv 2023.06.2029.547106 [Preprint](2023). doi: 10.1101/2023.06.29.547106
(64) S. Kosuri, G. M. Church, Large-scale de novo DNA synthesis: Technologies and applications. Nat. Methods 11, 499–507 (2014). doi: 10.1038/nmeth.2918;pmid: 24781323
(65) B. P. Kuiper, R. C. Prins, S. Billerbeck, Oligo Pools as an Affordable Source of Synthetic DNA for Cost-Effective Library Construction in Protein- and Metabolic Pathway Engineering.ChemBioChem 23, e202100507 (2022). doi: 10.1002/cbic.202100507; pmid: 34817110
(66) D. Patsch, M. Eichenberger, M. Voss, U. T. Bornscheuer,R. M. Buller, LibGENiE - A bioinformatic pipeline for the design of information-enriched enzyme libraries. Comput. Struct.Biotechnol. J. 21, 4488–4496 (2023). doi: 10.1016/j.csbj.2023.09.013; pmid: 37736300
(67) S. Wu, R. Snajdrova, J. C. Moore, K. Baldenius,U. T. Bornscheuer, Biocatalysis: Enzymatic Synthesis for Industrial Applications.Angew.Chem.Int.Ed.60,88–119(2021).doi: 10.1002/anie.202006648; pmid: 32558088
(68) D. Yi et al., Recent trends in biocatalysis. Chem. Soc. Rev.50, 8003–8049 (2021). doi: 10.1039/D0CS01575J;pmid: 34142684
(69) J. C. Moore, F. H. Arnold, Directed evolution of a paranitrobenzyl esterase for aqueous-organic solvents.Nat. Biotechnol. 14, 458–467 (1996). doi: 10.1038/nbt0496-458; pmid: 9630920
(70) J. C. Moore et al., “Site and Mutation”-Specific Predictions Enable Minimal Directed Evolution Libraries. ACS Synth. Biol.7, 1730–1741 (2018). doi: 10.1021/acssynbio.7b00359;pmid: 29782150
(71) A. D. Silverman, A. S. Karim, M. C. Jewett, Cell-free gene expression: An expanded repertoire of applications. Nat. Rev.Genet. 21, 151–170 (2020). doi: 10.1038/s41576-019-0186-3;pmid: 31780816
(72) R. S. Molina et al., In vivo hypermutation and continuous evolution. Nat. Rev. Methods Primers 2, 36 (2022).doi: 10.1038/s43586-022-00119-5; pmid: 37073402
(73) X. Yi, J. Khey, R. J. Kazlauskas, M. Travisano, Plasmid hypermutation using a targeted artificial DNA replisome.Sci. Adv. 7, eabg8712 (2021). doi: 10.1126/sciadv.abg8712;pmid: 34272238
(74) B. Seelig, J. W. Szostak, Selection and evolution of enzymes from a partially randomized non-catalytic scaffold.Nature 448, 828–831 (2007). doi: 10.1038/nature06032;pmid: 17700701
(75) M. Gantz, S. Neun, E. J. Medcalf, L. D. van Vliet, F. Hollfelder, Ultrahigh-Throughput Enzyme Engineering and Discovery in In Vitro Compartments. Chem. Rev. 123, 5571–5611 (2023).doi: 10.1021/acs.chemrev.2c00910; pmid: 37126602
(76) A. Debon et al., Ultrahigh-throughput screening enables efficient single-round oxidase remodelling. Nat. Catal. 2,740–747 (2019). doi: 10.1038/s41929-019-0340-5
(77) A. E. Mulelu, A. M. Kirykowicz, J. D. Woodward, Cryo-EM and directed evolution reveal how Arabidopsis nitrilase specificity is influenced by its quaternary structure. Commun.Biol. 2, 260 (2019). doi: 10.1038/s42003-019-0505-4;pmid: 31341959
(78) E. Danelius, N. J. Porter, J. Unge, F. H. Arnold, T. Gonen,MicroED Structure of a Protoglobin Reactive Carbene Intermediate.J.Am.Chem.Soc. 145, 7159–7165 (2023).doi: 10.1021/jacs.2c12004; pmid: 36948184
(79) F. Agostini et al., Biocatalysis with Unnatural Amino Acids: Enzymology Meets Xenobiology. Angew. Chem. Int. Ed. 56,9680–9703 (2017). doi: 10.1002/anie.201610129;pmid: 28085996
(80) A. P. Green, T. Hayashi, P. R. Mittl, D. Hilvert, A Chemically Programmed Proximal Ligand Enhances the Catalytic Properties of a Heme Enzyme. J. Am. Chem. Soc. 138,11344–11352 (2016). doi: 10.1021/jacs.6b07029;pmid: 27500802
(81) M. Ortmayer et al., Rewiring the “Push-Pull” Catalytic Machinery of a Heme Enzyme Using an Expanded Genetic Code. ACS Catal. 10, 2735–2746 (2020). doi: 10.1021/acscatal.9b05129; pmid: 32550044
(82) M. Ortmayer et al., A Noncanonical Tryptophan Analogue Reveals an Active Site Hydrogen Bond Controlling Ferryl Reactivity in a Heme Peroxidase. JACS Au 1, 913–918 (2021).doi: 10.1021/jacsau.1c00145; pmid: 34337604
(83) M. Pott et al., A Noncanonical Proximal Heme Ligand Affords an Efficient Peroxidase in a Globin Fold. J. Am. Chem.Soc. 140, 1535–1543 (2018). doi: 10.1021/jacs.7b12621;pmid: 29309143
(84) D. M. Carminati, R. Fasan, Stereoselective Cyclopropanation of Electron-Deficient Olefins with a Cofactor Redesigned Carbene Transferase Featuring Radical Reactivity. ACS Catal.9, 9683–9697 (2019). doi: 10.1021/acscatal.9b02272;pmid: 32257582
(85) T. Hayashi et al., Capture and characterization of a reactive haem–carbenoid complex in an artificial metalloenzyme. Nat. Catal. 1, 578–584 (2018).doi: 10.1038/s41929-018-0105-6
(86) R. Crawshaw et al., Engineering an efficient and enantioselective enzyme for the Morita-Baylis-Hillman reaction. Nat. Chem. 14, 313–320 (2022). doi: 10.1038/s41557-021-00833-9; pmid: 34916595
(87) G. Kang, A. T. Taguchi, J. Stubbe, C. L. Drennan, Structure of a trapped radical transfer pathway within a ribonucleotide reductase holocomplex. Science 368, 424–427 (2020). doi: 10.1126/science.aba6794; pmid: 32217749
(88) C.-Y. Lin et al., Use of Noncanonical Tyrosine Analogues to Probe Control of Radical Intermediates during Endoperoxide Installation by Verruculogen Synthase (FtmOx1). ACS Catal. 12,6968–6979 (2022). doi: 10.1021/acscatal.2c01037;pmid: 37744570
(89) J. S. Trimble et al., A designed photoenzyme for enantioselective [2+2] cycloadditions. Nature 611, 709–714(2022). doi: 10.1038/s41586-022-05335-3; pmid: 36130727
(90) J. Jumper et al., Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589 (2021). doi: 10.1038/s41586-021-03819-2; pmid: 34265844
(91) M. Baek et al., Accurate prediction of protein structures and interactions using a three-track neural network. Science 373, 871–876 (2021). doi: 10.1126/science.abj8754;pmid: 34282049
(92) Z. Lin et al., Evolutionary-scale prediction of atomic-level protein structure with a language model. Science 379,1123–1130 (2023). doi: 10.1126/science.ade2574;pmid: 36927031
(93) G. Casadevall, C. Duran, S. Osuna, AlphaFold2 and Deep Learning for Elucidating Enzyme Conformational Flexibility and Its Application for Design. JACS Au 3, 1554–1562 (2023).doi: 10.1021/jacsau.3c00188; pmid: 37388680
(94) M. L. Hekkelman, I. de Vries, R. P. Joosten, A. Perrakis,AlphaFill: Enriching AlphaFold models with ligands and cofactors. Nat. Methods 20, 205–213 (2023). doi: 10.1038/s41592-022-01685-y; pmid: 36424442
(95) G. Corso, H. Stärk, B. Jing, R. Barzilay, T. Jaakkola, DiffDock: Diffusion Steps, Twists, and Turns for Molecular Docking. arXiv:2210.01776v2 [q-bio.BM] (2023).
(96) R. A. Stein, H. S. Mchaourab, SPEACH_AF: Sampling protein ensembles and conformational heterogeneity with Alphafold2. PLOS Comput. Biol. 18, e1010483 (2022).doi: 10.1371/journal.pcbi.1010483; pmid: 35994486
(97) G. Casadevall, C. Duran, M. Estévez-Gay, S. Osuna,Estimating conformational heterogeneity of tryptophan synthase with a template-based Alphafold2 approach.Protein Sci. 31, e4426 (2022). doi: 10.1002/pro.4426;pmid: 36173176
(98) I. Anishchenko et al., De novo protein design by deep network hallucination. Nature 600, 547–552 (2021). doi: 10.1038/s41586-021-04184-w; pmid: 34853475
(99) J. Dauparas et al., Robust deep learning-based protein sequence design using ProteinMPNN. Science 378, 49–56 (2022). doi: 10.1126/science.add2187; pmid: 36108050
(100) J. Wang et al., Scaffolding protein functional sites using deep learning. Science 377, 387–394 (2022). doi: 10.1126/science.abn2100; pmid: 35862514
(101) B. I. M. Wicky et al., Hallucinating symmetric protein assemblies. Science 378, 56–61 (2022). doi: 10.1126/ science.add1964; pmid: 36108048
(102) A. Zanghellini et al., New algorithms and an in silico benchmark for computational enzyme design. Protein Sci. 15, 2785–2794 (2006). doi: 10.1110/ps.062353106; pmid: 17132862
(103) B. Kuhlman et al., Design of a novel globular protein fold with atomic-level accuracy. Science 302, 1364–1368 (2003). doi: 10.1126/science.1089427; pmid: 14631033
(104) J. Meiler, D. Baker, ROSETTALIGAND: Protein-small molecule docking with full side-chain flexibility. Proteins 65, 538–548 (2006). doi: 10.1002/prot.21086; pmid: 16972285
(105) R. Rombach, A. Blattmann, D. Lorenz, P. Esser, B. Ommer, High-Resolution Image Synthesis with Latent Diffusion Models. arXiv:2112.10752v2 [cs.CV] (2021).
(106) J. L. Watson et al., Broadly applicable and accurate protein design by integrating structure prediction networks and diffusion generative models. bioRxiv2022.2012.2009.519842 [Preprint] (2022). https://doi.org/10.1101/2022.12.09.519842.
(107) A. Madani et al., Large language models generate functional protein sequences across diverse families. Nat. Biotechnol. 41, 1099–1106 (2023). doi: 10.1038/s41587-022-01618-2; pmid: 36702895
(108) A. M. Brzozowski et al., A model for interfacial activation in lipases from the structure of a fungal lipase-inhibitor complex. Nature 351, 491–494 (1991). doi: 10.1038/ 351491a0; pmid: 2046751
(109) C. Curado-Carballada, F. Feixas, J. Iglesias-Fernández, S. Osuna, Hidden Conformations in Aspergillus niger Monoamine Oxidase are Key for Catalytic Efficiency. Angew.Chem. Int. Ed. 58, 3097–3101 (2019). doi: 10.1002/anie.201812532; pmid: 30600584
(110) V. Gligorijević et al., Structure-based protein function prediction using graph convolutional networks. Nat. Commun. 12, 3168 (2021). doi: 10.1038/s41467-021-23303-9; pmid: 34039967
(111) T. Yu et al., Enzyme function prediction using contrastive learning. Science 379, 1358–1363 (2023). doi: 10.1126/science.adf2465; pmid: 36996195
(112) S. Lauterbach et al., EnzymeML: Seamless data flow and modeling of enzymatic data. Nat. Methods 20, 400–402 (2023). doi: 10.1038/s41592-022-01763-1; pmid: 36759590
(113) S. Gelman, S. A. Fahlberg, P. Heinzelman, P. A. Romero,A. Gitter, Neural networks to learn protein sequence-function relationships from deep mutational scanning data. Proc. Natl. Acad. Sci. U.S.A. 118, e2104878118 (2021). doi: 10.1073/pnas.2104878118; pmid: 34815338
(114) K. K. Yang, Z. Wu, F. H. Arnold, Machine-learning-guided directed evolution for protein engineering. Nat. Methods 16,687–694 (2019). doi: 10.1038/s41592-019-0496-6;pmid: 31308553
(115) Z. Wu, S. B. J. Kan, R. D. Lewis, B. J. Wittmann, F. H. Arnold, Machine learning-assisted directed protein evolution with combinatorial libraries. Proc. Natl. Acad. Sci. U.S.A. 116,8852–8858 (2019). doi: 10.1073/pnas.1901979116; pmid: 30979809
(116) E. J. Ma et al., Machine-Directed Evolution of an Imine Reductase for Activity and Stereoselectivity. ACS Catal. 11, 12433–12445 (2021). doi: 10.1021/acscatal.1c02786
(117) S. Osuna, The challenge of predicting distal active site mutations in computational enzyme design. WIREs Comput. Mol. Sci. 11, e1502 (2021). doi: 10.1002/wcms.1502
(118) M. A. Maria-Solano, T. Kinateder, J. Iglesias-Fernández, R. Sterner, S. Osuna, In Silico Identification and Experimental Validation of Distal Activity-Enhancing Mutations inTryptophan Synthase. ACS Catal. 11, 13733–13743 (2021). doi: 10.1021/acscatal.1c03950; pmid: 34777912
(119) F. Rudroff et al., Opportunities and challenges for combining chemo-and biocatalysis. Nat. Catal.1, 12–22 (2018). doi: 10.1038/s41929-017-0010-4
(120) J. A. McIntosh et al., A kinase-cGAS cascade to synthesize a therapeutic STING activator. Nature 603, 439–444 (2022).doi: 10.1038/s41586-022-04422-9; pmid: 35296845
(121) J. A. McIntosh et al., Engineered Ribosyl-1-Kinase Enables Concise Synthesis of Molnupiravir,an Antiviral for COVID-19.ACS Cent.Sci.7,1980–1985 (2021).doi: 10.1021/acscentsci.1c00608; pmid: 34963891
(122) M. A. Huffman et al., Design of an in vitro biocatalytic cascade for the manufacture of islatravir. Science 366,1255–1259 (2019). doi: 10.1126/science.aay8484;pmid: 31806816
(123) C. Greunke, A. Glöckle, J. Antosch, T. A. M. Gulder, Biocatalytic Total Synthesis of Ikarugamycin. Angew. Chem. Int. Ed. 56, 4351–4355 (2017). doi: 10.1002/anie.201611063;pmid: 28128495
(124) A. Fryszkowska et al., A chemoenzymatic strategy for site-selective functionalization of native peptides and proteins. Science 376, 1321–1327 (2022). doi: 10.1126/science.abn2009; pmid: 35709255
(125) T. Schwander, L. Schada von Borzyskowski, S. Burgener, N. S. Cortina, T. J. Erb, A synthetic pathway for the fixation of carbon dioxide in vitro. Science 354, 900–904 (2016).doi: 10.1126/science.aah5237; pmid: 27856910
(126) T. Cai et al., Cell-free chemoenzymatic starch synthesis from carbon dioxide. Science 373, 1523–1527 (2021). doi: 10.1126/ science.abh4049; pmid: 34554807
(127) E. Eichhorn, B. Schilling, D. Wahler, L. Fourage, E. Locher, Givaudan SA, World Intellectual Property Organization Patent WO 2016/170099 (2015).
(128) E. Eichhorn, C. Baumgartner, M. Biermann, Biotechnology– A Tool to Transform Givaudan’s Fragrance Ingredients Palette. Chimia 77, 384–389 (2023). doi: 10.2533/chimia.2023.384
(129) E. Eichhorn, C. Ullmann, Givaudan SA, World Intellectual Property Organization Patent Application WO 2021/110848 (2019).
(130) S. McKenna et al., Bristol Myers Squibb, World Intellectual Property Organization Patent Application WO 2023/178061 (2023).
(131) C. Ching D. Elgart et al., Codexis, World Intellectual Property Organization Patent Application WO 2023/150568 (2023).
(132) E. J. Corey, Robert Robinson Lecture. Retrosynthetic thinking—Essentials and examples.Chem.Soc.Rev.17,111–133(1988).doi: 10.1039/CS9881700111
(133) S. Warren, P. Wyatt, Organic Synthesis: The Disconnection Approach (Wiley-Blackwell, ed. 2, 2008).
(134) W. Finnigan, L. J. Hepworth, S. L. Flitsch, N. J. Turner,RetroBioCat as a computer-aided synthesis planning tool for biocatalytic reactions and cascades. Nat. Catal. 4, 98–104 (2021). doi: 10.1038/s41929-020-00556-z; pmid: 33604511
(135) R. O. M. A. de Souza, L. S. M. Miranda, U. T. Bornscheuer, A Retrosynthesis Approach for Biocatalysis in Organic Synthesis. Chemistry 23, 12040–12063 (2017). doi: 10.1002/chem.201702235; pmid: 28514518
(136) M. Hönig, P. Sondermann, N. J. Turner, E. M. Carreira, Enantioselective Chemo- and Biocatalysis: Partners in Retrosynthesis. Angew.Chem.Int.Ed.56, 8942–8973 (2017).doi: 10.1002/anie.201612462; pmid: 28407390
(137) N. J. Turner, L. Humphreys, Biocatalysis in Organic Synthesis: The
Retrosynthesis Approach (Royal Society of Chemistry, 2018).
(138) N. J. Turner, E. O’Reilly, Biocatalytic retrosynthesis. Nat.Chem. Biol. 9, 285–288 (2013). doi: 10.1038/nchembio.1235;pmid: 23594772
(139) T. Yu et al., Machine learning-enabled retrobiosynthesis of molecules. Nat. Catal. 6, 137–151 (2023). doi: 10.1038/s41929-022-00909-w
(140) H. Yim et al., Metabolic engineering of Escherichia coli for direct production of 1,4-butanediol. Nat. Chem. Biol. 7,445–452 (2011). doi: 10.1038/nchembio.580;pmid: 21602812
(141) C. A. Lipinski, F. Lombardo, B. W. Dominy, P. J. Feeney, Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv. Drug Deliv. Rev. 46, 3–26 (2001).doi: 10.1016/S0169-409X(00)00129-0; pmid: 11259830
(142) A. Debon, E. Siirola, R. Snajdrova, Enzymatic Bioconjugation: A Perspective from the Pharmaceutical Industry. JACS Au 3,1267–1283 (2023). doi: 10.1021/jacsau.2c00617;pmid: 37234110
(143) A. Ali et al., European Medicinal Chemistry Leaders in Industry (EMCL) -On the Status and Future of Medicinal Chemistry Research in Europe.ChemMedChem18,e202300127(2023).doi:10.1002/cmdc.202300127;pmid: 37276375
(144) B. I. Andrews et al., Sustainability Challenges and Opportunities in Oligonucleotide Manufacturing. J. Org.Chem. 86, 49–61 (2021). doi: 10.1021/acs.joc.0c02291;pmid: 33253568
(145) A. Crameri et al., Glaxo Smith Kline, World Intellectual Property Organization Patent WO 2018/011067 A2 (2018).
(146) J. Nandakumar, S. Shuman, C. D. Lima, RNA ligase structures reveal the basis for RNA specificity and conformational changes that drive ligation forward. Cell 127, 71–84 (2006). doi: 10.1016/j.cell.2006.08.038; pmid: 17018278
(147) G. Mann et al., Biocatalytic assembly of chemically modified oligonucleotides. Tetrahedron Lett. 93, 153696 (2022). doi: 10.1016/j.tetlet.2022.153696
(148) V. Tournier et al., Enzymes’ Power for Plastics Degradation. Chem. Rev. 123, 5612–5701 (2023). doi: 10.1021/acs. chemrev.2c00644; pmid: 36916764
(149) V. Tournier et al., An engineered PET depolymerase to break down and recycle plastic bottles. Nature 580,216–219 (2020). doi: 10.1038/s41586-020-2149-4;pmid: 32269349
(150) H. Lu et al., Machine learning-aided engineering of hydrolases for PET depolymerization. Nature 604, 662–667 (2022).doi: 10.1038/s41586-022-04599-z; pmid: 35478237
(151) Y. Branson et al., Urethanases for the Enzymatic Hydrolysis of Low Molecular Weight Carbamates and the Recycling of Polyurethanes. Angew. Chem. Int. Ed. 62, e202216220 (2023). doi: 10.1002/anie.202216220; pmid: 36591907
(152) D. L. Hughes, Biocatalysis in Drug Development—Highlights of the Recent Patent Literature. Org. Process Res. Dev. 22,1063–1080 (2018). doi: 10.1021/acs.oprd.8b00232
(153) S. González-Granda, J. Albarrán-Velo, I. Lavandera, V. Gotor-Fernández, Expanding the Synthetic Toolbox through Metal-Enzyme Cascade Reactions. Chem. Rev. 123, 5297–5346 (2023). doi: 10.1021/acs.chemrev.2c00454; pmid: 36626572
(154) H. Gröger, F. Gallou, B. H. Lipshutz, Where Chemocatalysis Meets Biocatalysis: In Water. Chem. Rev. 123, 5262–5296 (2023). doi: 10.1021/acs.chemrev.2c00416; pmid: 36473100
(155) J. B. Siegel et al., Computational design of an enzyme catalyst for a stereoselective bimolecular Diels-Alder reaction. Science 329, 309–313 (2010). doi: 10.1126/ science.1190239; pmid: 20647463
(156) A. Crossley et al., A non-canonical nucleophile unlocks a new mechanistic pathway in a designed enzyme. Research Square, [Preprint] (2023).doi:https://doi.org/10.21203/rs.3.rs-2922796/v1
(157) W. C. Hallows et al., Optimizing human a-galactosidase for treatment of Fabry disease. Sci. Rep. 13, 4748 (2023).doi: 10.1038/s41598-023-31777-4; pmid: 36959353
文章来源:百奥信康