一路走来,结构生物学

2022-10-07
放射疗法
这些年在生物中组学研究越来越深入,随着对基因组和转录组的研究,人们对生命的认识越来越丰富和清晰。蛋白组学也取得了很大进展,目前虽然对蛋白质的折叠问题都还没有研究透彻,但各种技术的更新迭代,例如X射线晶体学,电子显微镜以及数据分析的新方法正在以前所未有的速度持续给出蛋白质结构的新知识。研究人员仅仅用了一代人的时间就大致捋清了从DNA到转录RNA,再到蛋白质表达的脉络:其中DNA是核心的遗传物质,RNA以DNA为模板转录出来,作为蛋白质表达的模板,细胞根据RNA三个碱基对应一个特定氨基酸的方式来翻译出所需的蛋白质序列,而蛋白质才是最终生命过程中各种生化反应的执行者。同时,大量的研究告诉我们,蛋白质的功能由他的结构决定,而结构则取决于它根据RNA碱基序列翻译得到的氨基酸序列。如此看来,只要我们对基因组测序,就可以直接得到最终蛋白质的结构,并且由各种蛋白质的功能构建出一个生命模型。真是如此吗?半个世纪过去了,在这条美好的逻辑链条上,还是有些问题悬而未决。其中最棘手问题之一就是如何从蛋白质的氨基酸序列得到其三维结构。虽然前者很明显的决定了后者,但是到底是如“决定”的以及这其中的原理却一直没有被研究透彻。计算生物学家矢志不渝的在这个问题上向前推进,针对不同种类的蛋白质开发了一系列的效果不错的结构预测工具。而另外一边的,等不及的科学家们则在尝试在实验台上直接获得蛋白质的三维结构,在传统的X-射线晶体学技术变得越来越“傻瓜化”的同时,电镜技术的一系列发展使得之前难以研究的一些蛋白结构得以解析。 新晶体学与想要从第一性原理出发来预测蛋白质结构的做法不同,X-射线晶体学采用的是“抄后路”的策略——先纯化和结晶目的蛋白质,然后通过X-射线晶体衍射的方法来测量其结构。这需要两步,第一步其实是个“体力活”,通常需要重复上千次实验才摸索得出一套该蛋白质结晶的条件。听起来很吓人?不用怕,日益发展的机器人技术正慢慢将生物学家从这项“苦力”中解脱出来。“使用机器人技术进行蛋白结晶时要求的上样量很少,因此纯化一次的蛋白质就可以结晶更多次,测试更多的结晶条件。”约翰霍普金斯大学马里兰州巴尔的摩医学院的生理化学教授Cynthi Wolberger说。不仅如此,新的机器人系统可以自动的对结晶条件进行测试和筛选,比如TTP Labtech 公司的mosquito系统以及Formulatrix公司的Rock Imager系统,更是大大方便了研究人员的工作。仅仅这些并不能解决所有问题。为了得到蛋白质的结晶体,研究人有时不得不对其野生型序列进行突变和调整以便更好地结晶。摸索如何突变野生型序列需要反复尝试,而每一次都工作量巨大。不断发展的高效的克隆和蛋白质表达技术在这一方面作用巨大。除了改造蛋白质,晶体学家们在结晶方法上也动了不少脑筋。为了得到膜蛋白——很难结晶的蛋白结构,研究人员会将脂质分子,水以及蛋白质按比例混合,令其形成一种立方体的液晶结构,从而使得X-射线照射过去可以形成衍射。这种方法仅仅需要纳克量级的蛋白样品就可以操作。“这是一个巨大的进步。”来自爱尔兰都柏林圣三一学院(Trinity College in Dublin)的生化及免疫学教授MartinCaffrey如此评价。他将这项技术用与G蛋白偶联受体以及其他膜蛋白的结晶上,取得了一系列巨大的成功。X-射线晶体学测得蛋白质结构的流程图 X射线晶体学的第二步就是拿着结晶好的样品去同步加速器接受同步辐射的X-射线轰击并收集期待已久的数据。这一过程颇为繁琐,因为同步加速器往往由政府资助,不是每个地方都有,往返一次并不容易。得益于物流和自动化控制的进步,如今,这一过程大大简化。“我们现在很少需要过去同步加速器那边了,只要把我们的结晶样品寄过去就可以了,”Wolberger说道“然后借助很酷的软件和机器人技术就可以远程操作,不管你在哪儿。”不仅是操作方式得到了改进,同步加速器的数据采集和处理系统在这几年也得到了日新月异的发展。现在研究人员可以通过一个被称为“光栅扫描”(raster scanning)的操作流程预先检测一下待测蛋白晶体的一小部分以便找到形成衍射效应最佳的角度。同时,自动化高通量的数据采集也使得扫描更多的样品成为可能。Wolberger和她的同事就曾利用一轮扫描得到的上千个晶体样品的数据分析出了一个蛋白质的结构——这种策略在以前“纯人肉”的操作中显然是不可能的。狙击点射在改进了蛋白质本身、结晶方法、结晶仪器以及同步加速器控制系统之后,晶体学家们又2打起了X-射线源的主意。一种被称为”无电子激光器”(free-electron laser)的技术引起了结构生物学家的兴趣。这种X射线由氖原子的电子跃迁时的能量差产生,不像同步辐射是由电子在环形轨道中加速产生的,能量很高。“它可以产生脉冲时长为10到40飞秒量级的脉冲X-射线,可以做到持续时间短,但每次脉冲都释放大量X-射线光子。”Caffrey说。因此,对于一些结构非常小的蛋白质,比如半胱氨酸组织蛋白酶,加速器的同步辐射释放的X射线由于能量太弱,无法对其结构很好的解析,但这种脉冲光源可以使用一种新的Caffrey称之为为“狙击点射”(hit and run)的晶体解析策略短时快速的轰击晶体,收集大量光子带来的瞬时数据。这种方法可以将晶体解析的分辨率由之前的微米级提升到了纳米级。这项技术也在2012年被《科学》杂志评为年度十大科学突破。“上海光源”上获得的第一张溶菌酶蛋白质晶体衍射图。(图片来源:http://news.163.com/09/0410/14/56HVI1N40001124J.html#from=relevant#xwwzy_35_bottomnewskwd)技术的进步大大提升了结构生物学家们对蛋白质结构的探索能力,随着各种技术的不断发展,越来越多的相关领域的研究人员也开始尝试解析一些相对简单,可溶性好的蛋白质的结构,例如某些人类基因组蛋白产物(human genome’s proteinproducts)。这些“跨领域者”不论是从理论知识还是操作经验上都需要一套更为简化的“套餐”,最好像抽提质粒试剂盒那样的易于上手。很多供应商,例如HammptonResearch,MiTeGen以及Molecular Dimensions抓住这个机会,推出了自己的蛋白质结晶试剂盒。另外,也有些课程可以选择,“在课上我会解释如何进行结晶,真的非常简单,你来听听课,回去应该就可以自己操作了。”Caffrey这样说。当然,结晶之后还有很多工作要做才能最终拿到结构,如果你自己并不擅长,那么你也可以向“专业选手”寻求帮助,正如Caffrey所说的,“从事同步辐射蛋白质晶体学的研究人员都很乐于与其他实验室合作,分担其他项目中结构解析的工作,一起完成一篇文章。”冻人的数据 就在X-射线晶体学在结构生物学领域大展身手的时候,另一名技术界的选手也在摩拳擦掌,它就是在台下等待已久的冷冻电镜技术(cryo-electron microscopy,简称cryo-EM)。冷冻电镜技术很早就被发明出来了,但一直以来由于技术原因都仅限于对一些大的结构,例如病毒,进行解析。这项技术基本做法是将样品冷冻在一层无定性冰膜中然后在低温下用电镜成像观察从而得到结构。当我们使用显微镜观察样品时,就如同用一把尺子去进行测量,尺子的最小刻度就是显微镜成像元件探测的微粒的波长。因此,光学显微镜的分辨率极限就是几千埃(1埃是0.1纳米),因为可见光的波长范围就在几百纳米之间。而如果我们使用电子对物质进行测量,例如电子显微镜的电子能量通常在300keV(此时电子的波长为0.02埃),那么理论上来说分辨率的极限就可以到不到1埃。但是使用电子进行观测有个问题——电子的能量太大了,一般的生物类样品经受不住多久电子的轰击就会被打的七零八落——这当然是不行的。于是科学家们就通过负染的方法将脆弱的样品包裹在对电子轰击不敏感的重金属盐溶液中,从而通过电子经过两种物质时的反差来观察样品的表面结构。这就如同先给一个人做了一个倒模再通过模具来看他的长相一样,自然会有分辨率的损失,因此常温的电子显微镜通常只用来观察细胞或者病毒之类的结构比较大的样品。冷冻电镜则是在电镜的基础上用快速冷冻的方法来降低原子的运动,增加样品耐受电子轰击的能力。冷冻电镜的工作流程(图片来源:http://www.nature.com/nmeth/journal/v13/n1/full/nmeth.3700.html)但即便有了快速降温的处理方法,冷冻电镜在结构生物学领域依然没有迅速推广开,而是近几年才突然火爆起来。这跟一个技术的突破有关,而这个突破也是解决电子本身的高能量带来的问题的。“最主要的变革来自于电子探测器技术。”来自美国加州大学伯克利分校的生物化学和分子生物学教授Eva Nogales解释道。原来,不仅仅是样品无法耐受高能电子的猛烈轰击,之前就连电子显微镜本身也难以找到能够经受电子长时间轰击的感“光”器件,因此,之前的电子显微镜是先使用荧光层将电子信号转化为光信号,然后再进行分析。而这种方法带来了很多限制,例如单次的上样只能进行有限的50次曝光,而对多次上样扫描结果进行统一处理则会不可避免的带来偏误。这个问题令冷冻电镜一直难以在结构生物学领域大施拳脚,直到工程师们最近几年研究出“够胆”直接收集电子的传感器,用来代替之前使用荧光层,才解决了之前的桎梏。“信噪比出奇的好,这些图片的信号值非常的高,而且我跟你讲:这种方法的“成像”速度快的不要不要的!”Nogales说。冷冻电镜成像并通过组合还原得到蛋白质结构的原理图(图片来源:https://mail.qq.com/cgi-bin/frame_html?sid=5yavtjxAIzMUZWY-&r=007c05f6739671fb0940a7335c5e048f)这项技术带来翻天覆地的改变,从根本上解决了很多问题。比如,使用荧光层会有图像模糊的问题,有时候这是因为样品在电子束冲击下会发生些许的“漂移”——即便是样品已经过低温处理过被无定形冰“加固”过了。以前解决这个问题的方法无非就是多拍几张照片然后挑几张不那么“糊”的,现在有了新的传感器,策略完全不同了,“新系统太给力了,甚至可以在测量的同时进行实时的“直播录像”,然后再用计算机算法来自动的修正由于电子束轰击造成的‘图像漂移’。”来自加州大学旧金山分校的生物化学及生物物理学教授David Agarg说。 冷冻电镜的出现解决了在测量中样品“漂移“的问题(图片来源:http://www.cell.com/trends/biochemical-sciences/fulltext/S0968-0004(14)00187-X)“这个领域迎来了一个新的时代,兴奋地令人窒息。“——David Agard两埃,甚至更小 2008年后,一个由美国政府资助的项目研究出了一种新的可以捕捉单个电子信号的传感器,让冷冻电镜的分辨率一下提升到可以识别几百kDa(千道尔顿)的蛋白结构的程度,这在以前可是X-射线晶体学家横行江湖的独门绝技。如今电镜专家们对与X射线晶体学家同台竞技充满了期待,正如Nogales所说的,“很难说冷冻电镜技术最终在分辨率上是不是能赶超X射线晶体学,比如能看到两埃,甚至更小?我们现在最好的记录是看到了2.2埃左右的尺度,不过那次的样品准备的异常的好。”因此目前说冷冻电镜取代X射线晶体学为时尚早,即便是在专门做冷冻电镜的实验室,X射线晶体学也占有一席之地。“如果一个蛋白很容易结晶,X射线晶体学可以马上就拿到结构,那就没必要去折腾别的方法嘛,我们就是这么做的。”Agard解释说,“不过有很多蛋白没办法很容易结晶的,对于这些情况,冷冻电镜就是最好的替代选择了。”不过,冷冻电镜还有个难以回避的缺点——太贵,一套完整的冷冻电镜设备需要花费几百万美元,仅每年的维护费用就有数十万美元——而且你还没得选——全球的供应商就那么几家,FEIDirect Electron 以及Gatan。正如Agard所说的,“目前只有那些土豪实验室或者研究所能够搞得起这东西,这显然不利于冷冻电镜的广泛使用。”有些国家有国家层面的资金支持,情况就会好很多,中国也在其中。当然,事情也没有完全令人绝望,在硬件死贵的时候,冷冻电镜的软件绝大部分是开源的,而且在用户友好性和功能上都在不断地提升。不忘初心,方得始终 还记得我们刚开始讨论的问题吗?想要知道蛋白质结构是为了预测其功能,从而得到直接的生命模型。在这个最终目的的驱动下,虽然X-射线晶体学和冷冻电镜不断发展,在一个个蛋白质的结构解析上获得突破,却仍旧无法满足科学家们对蛋白结构模型的迫切需求。“显然,目前没什么比得上实验中直接测得的蛋白质结构的精确度,但问题是我们已经测量了大量的基因序列,用X-射线或者电子束把它们对应的所有蛋白都打一遍是不可能的。”来自英国伦敦帝国理工学院系统生物与生物信息中心的负责人Michael Sternberg说道。他和他的同事Lawrence Kelley一直致力于攻克蛋白质结构预测这个分子生物学家们梦寐以求的要解决的难题。他们现在采用一个很多人都在使用的算法策略——通过与已知结构的蛋白序列进行相似性比较来预测目的蛋白的结构。这种算法的核心思想就是具有相似的氨基酸序列的蛋白的三维结构也相似。据此,研究人员各自开发了很多线上的工具供国际上其他的研究人员使用,Sternberg和Kelly的团队最近也更新了他们的软件——Phyre2。基于这种算法开发的程序处理起蛋白数据库里信息汇总完善的蛋白家族也算是得心应手。“对有些蛋白质,算法已经能够给出很不错的结果了,近几年蛋白质的数据越来越丰富了,其实可以试试把一些之前一些经典技巧放进算法里,看看能不能得到更好的序列——结构预测。”来自芝加哥大学计算中心的项目负责人许锦波说,他们一个线上软件RaptorX(http://raptorx.uchicago.edu/)可以预测蛋白质二级和三级结构。不同物种间存在着大量的功能、结构以及序列都相似的蛋白质,这些序列被称为同源序列。不同物种的蛋白质氨基酸序列之间肯定是存在差别的,但通过精巧的计算机算法,可以将它们彼此对应的序列区域找到,就好比人和人虽然长得各不相同,但我们始终能在不同的脸上找到各自的鼻子、眼睛等器官并将它们在不同的脸中对应好。研究人员们发现,在这些对应好的序列中,有些位点的氨基酸,虽然它们在同一条序列上的位置相距甚远,但是两条同源序列上一个位点的氨基酸不同时,另外一个(或几个)在这两条序列上也会彼此不同,就像如果发现有人的一只眼睛是蓝色的,那么另一只也会是蓝色的。研究人员认为这是因为在空间结构上这些存在协同变化的点实际上是彼此“邻接”(contact)的,由于同源序列的蛋白质实际上是功能和结构相似的,那么为了保持结构框架的相似性,这个结构框架上有些“焊接点”(即前文的“邻接”)就必须有一定的稳定性,这就是蛋白质序列上的邻接模式(contact pattern)。基于这种假设,如果能在序列中找到邻接模式,就能得到蛋白质的三维结构了,这种方法被称为“蛋白邻接位点预测法”(contact prediction)。许锦波和他的同事王晟算是在这个方向上进行了较为成功的尝试的,他们也将这个功能加入了RaptorX。“这种方法很适合膜蛋白的结构预测,因为通常这些蛋白都不怎么容易结晶,”Sternberg继续说道,“不过这个方法还是需要大量的测序数据作为支撑的。”通过在同源序列中找到“邻接点”来预测蛋白质结构的原理图(图片来源:http://www.nature.com/nbt/journal/v30/n11/full/nbt.2419.html)除了在算法上推陈出新,计算生物学家们也在用户体验上用足了心思。“我们很喜欢谷歌那种极简设计的界面,简单明了的把用户需要的最核心功能呈现出来,花里胡哨的操作界面会让人头晕。”Sternberg说道。这个想法似乎很正确,因为几万个使用Phyrel的用户中,只有几百人没有搞明白怎么操作而发邮件给他或者Kelly来寻求帮助。更多的选择 不光Sternberg注意到了用户友好性的重要,许锦波组也对这一原则身体力行,“越来越多其他领域的专家开始登陆我们的服务器来做结构预测。”但是不做蛋白质结构预测的人可能并不能深刻理解不同算法的区别和局限性,因此很多网站会对程序给出的结果进行注释,从而帮助用户更好的理解算出来的结构。例如,RaptorX会对每种蛋白质模型进行一个评估,并给出一个建议分数来告诉用户预测结果的好坏。Phyre2则除了会对蛋白结构的预测结果整体打分,还会分区域打分,做的更为细致,而且在数据库更新之后,Phyre2还会贴心的发邮件通知用户可以重新进行计算以修正结果。现在的问题又来了,往上那么多在线的免费预测工具可以使用,到底哪个更好用呢?于是就有了CAMEO,该网站(https://www.cameo3d.org/sp/3-months/)可以帮助研究人员把需要预测的蛋白序列一次发给所有在其系统注册的结构预测服务器,并根据各自的计算速度,准确性等一系列指标对预测结果进行排序。当然,很难说在结构预测中,哪一款程序更好一些,因为不同的算法本来就是针对不同的特定问题的。比如RaptorX更强调的是从序列比对的结果得到更好的结构,而其他同类算法更多的是强调多序列时,序列比对的速度——这对这类算法是一个非常重要的考量因素。 “这个领域迎来了一个新的时代,兴奋地令人窒息。“正如David Agard所说的,如今,不论采用什么方法,X-射线晶体学,冷冻电镜,亦或是生物信息结构预测,这些方法都已经取得了巨大的进步,并且仍然在日新月异的进行技术更新和迭代。我们所能期待的,一定是更好的结果以及更多的好消息。参考资料:Structural biology shapes up (http://www.sciencemag.org/custom-publishing/technology-features/structural-biology-shapes)Cryo-electron microscopy--a primer for the non-microscopist.FEBS J. 2013 Jan;280(1):28-45. doi: 10.1111/febs.12078. Epub  2012 Dec 17.(https://www.ncbi.nlm.nih.gov/pubmed/23181775)Accurate De Novo Prediction of Protein Contact Map by Ultra-Deep Learning Model.Published: January 5, 2017https://doi.org/10.1371/journal.pcbi.1005324(http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1005324)扫码加入BiG生物创新社读者交流群,分享、交流纯粹的行业知识,非诚勿扰!BiGScientific Driven, Making Impact!创新生态丨医药论坛丨行业分析媒体公关丨BiG Webinar联系我们商务:Max   18662346610媒体:Kathy 17621909690
更多内容,请访问原始网站
文中所述内容并不反映新药情报库及其所属公司任何意见及观点,如有版权侵扰或错误之处,请及时联系我们,我们会在24小时内配合处理。
适应症
-
靶点
药物
-
立即开始免费试用!
智慧芽新药情报库是智慧芽专为生命科学人士构建的基于AI的创新药情报平台,助您全方位提升您的研发与决策效率。
立即开始数据试用!
智慧芽新药库数据也通过智慧芽数据服务平台,以API或者数据包形式对外开放,助您更加充分利用智慧芽新药情报信息。