新型冠状病毒刺突蛋白基因型分型与抗原性聚类的关系分析

2023-12-15
疫苗
中文摘要目的   对新型冠状病毒刺突蛋白(spike,S)进行抗原性聚类与基因型聚簇的关联分析,为疫苗设计的方向提供参考。方法   基于476条新型冠状病毒基因,分析S序列的氨基酸进化情况并构建系统发育树。在抗原抗体结合界面提取抗原表位并对序列进行三维空间结构模拟,将提取表位与模拟结构两两配对计算抗原性距离,构建抗原相似性聚类树。通过比较毒株对应的序列系统发育树和抗原相似性聚类树,评估新型冠状病毒进化与抗原性的关系。结果   新型冠状病毒的系统发育树上不同谱系的毒株分别聚在相应的分支上,其中Alpha分支与Gamma分支相距最远,序列相似度最低;同时Omicron株的BA.1到BA.5分支聚在一起,呈现出高度的序列相似性,且与野生型毒株的距离较远。抗原性的聚类表明,Omicron株的5个谱系的抗原性聚集情况与序列聚类情况不一致,并未呈现出较为明显的抗原性聚类。结论   新型冠状病毒S的抗原性聚类与序列聚类情况可能并不一致,而是更倾向于抗原表位的差异。疫苗设计中,考虑抗原性位点差异特征的设计思路将会比基于家族谱系的设计思路更为有效。正文2019年12月出现的COVID-19是由新型冠状病毒导致的急性呼吸道传染病,并引发全球大流行。截至2023年2月,全球累计确诊病例超过7.5亿,累计死亡病例超过680万,严重危害人类健康。新型冠状病毒的刺突蛋白(spike,S)是冠状病毒的主要抗原蛋白,在功能上不仅负责识别宿主细胞表面受体,同时还会介导细胞膜与病毒包膜融合,从而导致病毒感染宿主细胞,是宿主中和抗体的重要作用位点以及疫苗设计的关键靶点。S的快速突变会导致抗原性逃逸,尚不清楚这种抗原性逃逸是否存在显著的谱系关系,而这种关系对于新型冠状病毒表位识别以及疫苗的设计筛选起到至关重要的作用。系统发育树是描绘不同物种或相同物种不同种群的个体之间的亲缘关系及其进化历程的树状图,进化树的末端为叶节点,每一个叶节点代表一条病毒的蛋白氨基酸序列,用于探究不同谱系之间的亲缘关系。本研究旨在通过比较新型冠状病毒S序列系统发育树与抗原相似性聚类树之间的对应关系,来评估病毒进化的谱系与抗原性改变的关系,从而为新型冠状病毒疫情防控与疫苗设计提供一定的参考。1材料与方法1.1数据从美国国家生物信息中心(National Center for Biotechnology Information,NCBI)收集到新型冠状病毒野生株(wild type,WT)及Alpha、Beta、Delta、Epsilon、Eta、Gamma、Iota、Lambda、Mu、Theta、Zeta、Omicron株等分支毒株序列共476条。1.2实验网站及软件NCBI数据库(https://www.ncbi.nlm.nih.gov/);序列进化树展示软件〔(Interaction Tree Of Life,iTOL), https://itol.embl.de/〕;空间表位比对工具平台(CE-BLAST, https://www.biosino.org/ce_ blast/);蛋白质三维结构同源建模软件(Swissmodel,https://swissmodel.expasy.org/);三维结构蛋白质数据库〔(Protein Data Bank,PDB),https://www1.rcsb.org/〕;蛋白结构可视化软件Pymol;分子进化遗传分析工具〔(Molecular Evolutionary Genetics Analysis,MEGA),version 11〕。1.3数据收集及预处理从NCBI数据库下载新型冠状病毒序列数据476条,按照以下步骤过滤:(1)抗原名称为SARS-CoV-2 Spike protein;(2)抗体序列同时包含轻重链;(3)按抗体序列相似性为100%去冗余(即将序列相似性按照100%的阈值进行聚类后,每一类仅保留最长的一条)。挑选WT和Omicron株的S序列共113条。新型冠状病毒S抗原抗体复合物收集自PDB,共包含809对复合物数据,其中人源750对。对750对人源新型冠状病毒S抗原抗体复合物进一步筛选,以0.4 nm为阈值,提取抗原抗体相互作用界面中的表位和对位,并去除表位小于5个氨基酸的复合物。1.4系统发育树构建通过邻接法,针对每个毒株的S氨基酸序列构建系统发育树(Bootstrap=500,Model/Method 选择p-distance)。用MEGA软件计算构建系统发育树时涉及的多序列比对及分子进化分析。1.5抗原表位提取抗原表位从PDB中提取,分别包括新型冠状病毒Omicron株 BA.4/5 受体结合域(receptor-binding domain,RBD)(PDB id:7ZXU)24个表位氨基酸、新型冠状病毒Omicron株BA.1 RBD(PDB id:7TM0)9个表位氨基酸、新型冠状病毒Omicron株 BA.1 RBD(PDB id:7TLY)12个表位氨基酸。1.6三维空间结构模拟使用Swissmodel对113条Omicron株及WT序列进行三维空间结构模拟。将序列输入Swissmodel的template框中,选择全局性模型质量估测值以及序列相似性较高的结构作为后续研究使用结构。1.7抗原表位相似性比对将1.5得到的表位映射到1.6对应结构上,对于任意两两结构,使用CE-BLAST计算两两表位的抗原相似性距离,得到表位相似性矩阵,将表位相似性矩阵映射到聚类树中,观察聚类树中病毒株的聚类情况。这里CE-BLAST的设定选用默认参数,因为该模型的特点是完全基于结构特征进行描述,而不需要考虑历史数据训练,即对不同表位来源不敏感,而是客观描述不同表位结构和性质上的差异,由于CE-BLAST给出的得分是0~1之间的标准化结果,更接近1的得分预示着更高的相似性,因此最终得分进行聚类可以进行抗原相似性的比较。2结果2.1基于序列构建的系统进化树呈同类聚集分布为了研究新型冠状病毒S的进化情况,本研究将475条来自新型冠状病毒不同谱系的变异株映射到进化树中(图1),不同颜色的分支代表不同分支的毒株。基于S序列的系统发育树显示,同一谱系的毒株聚集在一起,为序列相似性毒株。其中,Alpha分支与其他毒株较远,其次为Delta。而其他毒株可以分为2个大分支,其中Eta、Lota、Epsilon和Lambda为同一支上的几个分支;而Omicron株与Mu、Beta、Theta、Zeta和Gamma组成另一分支。     在Omicron株的5个分支中,BA.2的分支最为完整,与其他并不相交。处于同一大分支的还包括BA.4和BA.5,这表明BA.4和BA.5在系统发育上与BA.2相近。Omicron株的另一支则是BA.1和BA.3聚集在一起。2.2新型冠状病毒Omicron株主要抗原蛋白表位映射分析本研究从模拟的112株来自新型冠状病毒Omicron株不同谱系的结构中挑选出BA.1—BA.5谱系中的随机代表,同时选取了WT结构,共计6个结构。进而,本研究选取了3个重要的Omicron株表位区域,包括抗Omicron株抗体S309(PDB id:7TLY)及S2L20(PDB id:7TM0)在谱系BA.1上的RBD表位,以及抗Omicron株抗体Beta-27(PDB id:7ZXU)在BA.4/5的RBD表位。将这些表位对应的氨基酸位点映射到上述6个S的三维结构上(图2)。结果表明,S309的表位主要分布在RBD的330—440区域(标注为绿色),S2L20的表位分布于410—510区域(标注为蓝色),Beta-27的表位主要分布在N端区域,位于S20—270区域(标注为红色)。3个抗体的表位均在RBD区域的头部,具体的表位位点如表1所示。       为了进一步探究这些表位位点是否发生显著突变,我们将112条新型冠状病毒Omicron株及WT的S区域对应的表位位点筛选出来,通过多序列比对的方式进行了展示(图3)。结果表明,S309抗体对应的表位在Omicron株内仅在R346K位点发生了突变。其优势位点精氨酸在少数Omicron株上突变成了赖氨酸。需要注意的是这两个氨基酸均为碱性氨基酸,可能对于表位结合的影响相对较小。但是另一方面,在G339D位点与WT相比发生了显著的性质改变。其中WT339位点氨基酸为甘氨酸,而在Omicron株内则突变成了酸性氨基酸天冬氨酸,这个位点的突变可能会影响抗体的结合,产生潜在的免疫逃逸。S2L20对应的表位保守性最好,在WT和Omicron株中都保持了 YVPNTTRY的序列特征,未发生任何突变。另一方面,Beta-27的表位位点出现了非常显著的突变。在Omicron株谱系内部有 K417N、Q493R、N501G、Y505H等重要突变,其中包含了酸碱性氨基酸与中性氨基酸之间的转换,例如赖氨酸和精氨酸均为碱性氨基酸,而天冬酰胺和谷氨酰胺则为中性亲水氨基酸。另一方面,还发生了从侧链带苯环的疏水性芳香族氨基酸酪氨酸突变成碱性的亲水性氨基酸组氨酸的显著性质改变。相较于WT和Omicron株,S477N位点也发生了突变,这表明Beta-27抗体的表位突变最为活跃,由于其氨基酸突变涉及氨基酸物理化学性质以及局部微环境的性质改变,导致S的抗原性发生改变,进而容易导致病毒与受体结合的能力发生改变,从而导致病毒的抗原性发生逃逸。2.3抗原性聚类分析为了研究新型冠状病毒S系统发育树和抗原性聚类之间的关系,本研究对这113个S在上述3个Omicron株表位上进行了抗原性聚类,结果如图4所示。按照序列相似性进行聚类的结果表明,Omicron株大部分都是按照不同谱系进行区分的。整个聚类树可以分为4个大的分支,其中BA.1和BA.2的大部分毒株均聚集在一起,仅有少数毒株被分散在其他谱系中。而其他3个谱系的分类较为零散,混合分布在聚类树的一支上。第4支相对比较小,仅包含1株BA.1和1株BA.2毒株,这可能是由结构模拟带来的误差所导致,使其不能准确被分到聚类树上的对应支中。不同的是,Omicron株不同毒株的抗原性聚类则显示出明显的离散性分布特征。在每个表位上,WT都与BA.2毒株SARS-CoV-2/human/USA/TX-CDC-ASC210757431/2022抗原性距离最近。这表明即使从WT到Omicron BA.2毒株已经间隔了2年以上,抗原性位点不发生突变的情况下,依旧有可能被同一个抗体保护。同时,不同谱系在3个表位上的抗原性分布都较为分散,并未按照序列相似性进行聚类。3讨论本研究基于大规模的新型冠状病毒S抗原序列和结构数据,对病毒进化与抗原性改变的关系进行了探讨。序列相似性及抗原性相似性分析结构表明,目前新型冠状病毒的谱系是按照序列相似性进行聚类的,进化树第1层分出的分支即代表序列的聚类关系,距离较近的毒株代表两株的亲缘关系更近。从构建得到的进化树上可以看出,不同新型冠状病毒的S序列聚类呈现出十分明显的谱系关系。但是抗原性的分型与基于全序列的基因型分型并不一致,呈现分散分布的特点,这说明病毒的序列进化关系与抗原性的改变关系并不一致。另一方面,由2.3抗原相似性聚类树结果显示,基于WT的疫苗在对于抗原表位未发生突变的Omicron株也能保持较好的保护效果。且新型冠状病毒S(PDB id:7ZXU)和WT的蛋白序列比对结果显示,S全长的突变位点占比12.4%(25/202),其中RBD的突变占比为16.7%(4/24),突变程度比全长高。这说明RBD收到的选择压力大,突变更快,且会影响中和抗体效价。由此可见,S全长的系统发育学特征不能代表S的抗原性变化特征。新型冠状病毒突变迅速,不能只根据病毒序列判断S抗原表位的抗原相似性关系。而在疫苗设计的时候,值得注意的是,毒株抗原性的关系与序列进化的相似性并无完全对应的关系,疫苗免疫原设计还需考虑到表位位点突变导致的抗原性逃逸,而非仅基于谱系或亚型之间的序列相似性进行设计。表位的改变会导致免疫逃逸,而免疫逃逸会导致之前活化的中和抗体不一定继续能产生作用。目前多数新型冠状病毒疫苗以及中和抗体疗法的靶点均为新型冠状病毒的RBD区域,因此表位发生突变就会导致疫苗的失效。此外,其他非RBD的表位,如N端结合域也能作为抗原表位活化有一定效果的中和抗体,这表示许多抗体不结合RBD,也可以起到中和作用,为新一代重组疫苗的设计提供重要支持信息。总之,系统性的统计学分析表明新型冠状病毒S序列进化和抗原相似性关系没有既定规律,即序列相似性越高,对应毒株的抗原表位与受体结合的能力不一定越强。同时,结果提示在疫苗免疫原筛选设计的时候,考虑对于目前流行毒株的保护情况,需要从抗原性相似性,或抗原表位氨基酸的突变情况入手,而非仅针对序列相似性进行设计。本研究的结果对新型冠状病毒进行了准确的抗原分析,对于疫情期间的疫苗选择和流行病预防有重要意义。作者田欣心1   张璐2   汪萱怡3   裘天颐4   邱景璇11上海理工大学健康科学与工程学院,上海 200093;2同济大学生命科学与技术学院,上海 200092;3复旦大学生物医学研究院,上海 200032; 4复旦大学附属中山医院实验研究中心,上海 200032通信作者:邱景璇,Email:jxqiu@usst. edu. cn引用本文:田欣心, 张璐, 汪萱怡, 等. 新型冠状病毒刺突蛋白基因型分型与抗原性聚类的关系分析 [J]. 国际生物制品学杂志, 2023, 46(5): 241-246.  DOI: 10.3760/cma.j.cn311962-20221211-00084识别微信二维码,添加生物制品圈小编,符合条件者即可加入生物制品微信群!请注明:姓名+研究方向!版权声明本公众号所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(cbplib@163.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。
更多内容,请访问原始网站
文中所述内容并不反映新药情报库及其所属公司任何意见及观点,如有版权侵扰或错误之处,请及时联系我们,我们会在24小时内配合处理。
机构
-
靶点
-
立即开始免费试用!
智慧芽新药情报库是智慧芽专为生命科学人士构建的基于AI的创新药情报平台,助您全方位提升您的研发与决策效率。
立即开始数据试用!
智慧芽新药库数据也通过智慧芽数据服务平台,以API或者数据包形式对外开放,助您更加充分利用智慧芽新药情报信息。