Protein A蛋白简介Protein A作为抗体亲和捕获配基,得到广泛关注和竞相开发,它是金黄色葡萄球菌 (Staphylococcus aureu) 细胞壁的组分,和胞壁的肽聚糖共价结合,简称为SpA[1, 2]。分子量42 KD,为单条多肽链分子,天然序列中不含半胱氨酸,因此人为在末端加入Cys后,可用于定向偶联[3]。SpA有5个高度同源的IgG结合结构域,从N端始记为E-D-A-B-C,分别含有51, 61, 58, 58和58个氨基酸残基[4],每个结构域均由3个α螺旋和之间的2个loop环组成,helix II和III反向平行,helix I和前者之间存在夹角,domain B为30度,domain D和E均为15度[5]。A、B、C结构域同源性高达90%,domain D因多了三个氨基酸的插入以及其它位点突变造成同源性约80%, domain E的同源性约为70%差异更大[6]。图1:SpA的5个IgG结合结构域序列比对[7]SpA的C末端还有一个X结构域,由8个氨基酸、重复12次组成[6],用于将SpA锚定到细胞壁上。因此,SpA完整序列为EDABCX(部分文献还会备注一个跨膜区M)。图2:A) Protein A基因组成。B) IgG的Fc区域的3个β-turn(灰色)和SpA B domain的前2个α-helix(红色)互作[8]SpA对多种类型的IgG具有高亲和力,对IgG1、IgG2、IgG4的亲和力为10^8 (M-1) [9],但是对IgG3(约占总IgG的8%)的亲和力则非常弱。目前,大部分的抗体药物是基于IgG1或IgG4开发。表1:Protein A和Protein G与人不同类型抗体的亲和力[10]虽然Protein G也能和大部分抗体亲和(表1),但其和Fab-CH1以及Fc均有互作,结合强度高,洗脱pH低,更容易造成不稳定的抗体发生聚集,而Protein A则“主要”和Fc区域互作,洗脱pH更高,因此,大部分商业化使用的亲和层析是基于Protein A开发的[11]。SpA IgG结合结构域命名为何是EDABC而不是ABCDE?简言之,和基因的发现顺序有关,顺次命名,过程曲折励志。最初,1975年,H Hjelm和J Sjödahl等[12],使用溶葡球菌酶 (Lysostaphin) 消化细胞壁,从S. aureus strain(菌株Cowan I)胞壁中释放Protein A,并通过IgG Sepharose 4B亲和层析柱(Cytiva,当时的GE Healthcare)分离。为了获得具有亲和力的最小片段,纯化后的蛋白继续使用胰酶进行部分消化以及IgG再次捕获,然后用离子交换 (Phosphocellulose,Whatman) 进行纯化及序列分析。获得至少3个高度同源的Fc结合区,每个大约由60个氨基酸残基组成,说明Protein A存在结合IgG的重复单元结构。一年后,1976年,前述文章的2作J Sjödahl,独立发表文章,继续求证[13]。将纯化后的Protein A蛋白,使用胰酶进行降解,根据降解片段在离子交换层析上的出峰顺序(8个组分),结合氨基酸组成序列分析和功能检测结果,将和Fc区域有亲和力的片段分为A、B和C三个区域,其各自具备抗体结合能力并高度同源 (80%) 。但是否还有活性区域被胰酶降解而丢失,或从未被分离到,以及是否有更大的片段以便对三个区域进行位置排序,仍待研究。如果使用胰酶直接降解金黄色葡萄球菌(非纯化后的Protein A蛋白),A和B区对应的片段仍在,而C区则没有被检测到,提示C区接近细胞壁,存在酶解的空间位阻[13, 14]。1977年,J Sjödahl继续独立研究并发表结果,用实验证实第4个互作区域的存在[14],使用胰酶直接降解金黄色葡萄球菌(菌株Cowan I): 1 通过调整酶解条件而产生更大的Protein A片段,经过前述同样的亲和及离子交换层析,分离出6个组分(数量更少、片段更长),并使用DEAE离子交换进一步分离,根据氨基酸组成以及末端序列分析,并和之前的A、B、C区域进行对照,D结构域被发现。 2 通过对比更长的片段序列(如AB和DAB)以及N端测序证明其排序为D-A-B-C,并且连续。 3 对胰酶消化后,剩余的胞壁组分继续使用溶葡球菌酶处理,经过亲和以及一步离子交换进行分离,得到的片段进行氨基酸组成以及N末端序列分析,找到了Protein A碳末端缺失的X区域(酶消化后和C区连在一起,即CX区)。注意:如果先用溶葡球菌酶处理菌体,再用胰酶消化,那么C和X之间的连接会断开,因此早期研究中丢掉了X这部分。至此,D、A、B和CX 4个IgG结合结构域被发现。但是,就像之前分离的C区还存在一个嵌入细胞壁内的X区域一样,作者也推测在D区的N端很可能也存在类似区域未被发现。图3:J Sjödahl文章(1977年)中推测的Protein A(或部分)结构图[14]Domain E的晚发现:得益于基因测序技术的进步,开始从基因角度来解析Protein A序列。1983年S Löfdahl等[2]分离金黄色葡萄球菌(菌株8325-4,遗传信息比Cowan I更清晰)的染色体DNA并进行酶切,跑胶鉴定8-10 Kb的片段并克隆到pBR322载体(宿主E.coli)上,表达后,使用ELISA筛选和抗体具有亲和作用的克隆及更小的亚克隆。使用化学测序法对启动子区以及5'末端结构基因进行测序,翻译成氨基酸序列后,和前述J Sjödahl研究[14]中的序列进行比对,在N端发现了信号肽 (S,Signal) 区域以及紧挨着的、顺次命名为E的区域,E区和之前报道的D-A-B-C高度同源,由50个氨基酸组成,其中42个和D区一致。1984年[6],同一个团队继续通过合作对菌株8325-4 的Protein A进行全基因测序,进一步验证了E区的存在。1986年,Tomas MOKS等[15]发表文章,对E区进行克隆表达,证明domain E和抗体单价结合,从亲和力上,D、A、B、C和抗体结合的亲和力差异不大,但是domain E的亲和力弱一些。至此,SpA的E-D-A-B-CX序列结构才算完成。从进化角度,SpA的5个IgG结合结构域氨基酸序列高度同源,并且存在同源梯度 (homology gradient) ,即相邻的两个区域,同源性更高(如图1)。说明原始祖先基因,在进化过程中被复制多次,并存在点突变,体现出stepwise multiple DNA duplications特征[16]。另外,在同源区域存在大量同义突变,说明存在进化压力以维持氨基酸序列高度保守,其中B区的密码子突变最少,也被认为是最接近祖先序列的[15]。SpA其实可以和Fab和Fc区域同时互作SpA通过和IgG的两个不同的位置即Fab以及Fc区域结合,以尽可能逃避或切断宿主的免疫系统[17]。目前认为,A、B、C三个高度同源的结构域,主要通过和IgG的Fc区域进行结合;由于D和E区在helix III区域存在序列差异,二者主要通过Fab和Fc与IgG互作[18]。 Helix I&II主要负责和IgG-Fc互作图4:SpA的domain B和抗体CH2-CH3之间区域互作示意图[19]SpA和抗体Fc之间的互作主要是疏水作用驱动的,另外有部分氢键以及盐桥[20, 21, 22, 23]:互作位置:IgG的CH2-CH3连接处(elbow region,3个β折叠)和SpA domain B的前两个α螺旋helix I和II发生互作。互作位点#1:由SPA-helix I的二肽疏水核心(苯丙氨酸和酪氨酸),和IgG的CH2-CH3之间的3个β折叠区组成,并通过4个氢键进行稳定。互作位点#2:SPA的helix II和Fc的CH3区域的氨基酸残基组成。互作主要通过23个氨基酸残基进行,如下表。序号基于SpA domain B在PDB数据库的序列(https://www.rcsb.org/structure/1BDC) [8]。表2:参与Protein A和IgG-Fc之间互作的氨基酸残基[8]Helix II&III主要负责和Fab区互作天然的SpA中,每个IgG结合结构域都可以和Fab区发生互作[9],但强弱有差异:SpA的domain D[5]和domain E[24]与Fab区互作更为明显。A、B、C domain和Fab区的互作则较弱[25]。互作结构解析,最经典当属M Graille等于2000年发表的文章[5],IgM主要通过Fab区和Protein A互作(Fc互作则缺失)因此适合用于此类研究[26]。文章通过domain D和VH3–30y1.9III编码2A2 IgM被酶切后产生的Fab区互作,解析晶体结构,要点如下:SpA domain D通过Helix II和III,与Fab-VH3的4条β链(B、C’’、D和E)发生互作(图5)。图5:SpA domain D(红色)和人IgM- Fab 2A2互作示意图。Fab-VH3重链的框架区(青色cyan)参与互作,VL区不参与互作(深蓝色)。互作区远离和抗原互作的CDR loops区(酒红色),尤其是和最常用于抗原特异性识别的CD3较远(相距10 Å以上)[5]SpA domain D中参与互作的11个氨基酸,分布在:helix II(6个)、helix II和III之间的loop环(2个),以及helix III(3个),如图6。图6:SpA domain D(棕色)和Fab 2A2-VH3(蓝色)互作氨基酸展示图。注意G29,文献报道中domain Z为了提高耐碱性,将G29突变为丙氨酸而失去了和Fab区的结合(更利于用更高的pH洗脱)[5]Fab中参与互作的区域主要在VH3框架区(framework region, FR) ,距离IgG轻链以及重链恒定区远,并区别于和抗原互作的CDR区。主要有13个氨基酸(如图6和表3),其中6个在β strands的框架区,7个位于框架区的链间loops(和抗原结合口袋最远)。SpA不和IgG的抗原结合区竞争,被认为是SpA能够和最大的VH基因家族-VH3互作的基础之一。互作结构中,主要由极性氨基酸侧链组成,包括domain D的3个带负电的侧链残基以及IgM-Fab区2个带正电的残基,提示2个分子之间的互作主要通过静电吸附发生,且5个极性互作中,3个发生在氨基酸侧链基团。其次为氢键互作,包括Tyr-H59和Asp-37、Asn-H82a和Ser-33、Gly-H15 carbonyl 和Gln-26,以及Lys-H57和Asp-36 carbonyl之间,其中后两个发生在主链原子和侧链原子之间。另外,Arg-H19和Asp-36之间形成盐桥。综上,domain D和Fab之间的互作,是以氨基酸序列特异性为主导的。SpA和Fab以及Fc的互作是否互相干扰呢?实则不然。SpA和Fc的结合主要发生在helix I和II,其中以helix I为主,疏水互作为主导;helix II以另外一面 (opposite face) 以及helix III又和Fab区发生互作,主要为极性作用,包括静电、氢键和盐桥。两个结合结构域之间各自独立、互不影响:除了domain D的Gln-32被认为较弱的、同时参与了SpA同Fab和Fc的互作,其它氨基酸均无重叠[IgM]。SpA domain B和Fc互作面积 (1,320 Å2) ,与SpA domain D与IgM-Fab互作面积 (1,220 Å2) 相似。为了进一步了解SpA和Fab-Fc之间的空间关系,结合此文以及之前domain B和Fc互作的结构解析结果[21],通过模型模拟,如图7,抗体的Fab和Fc区形成了一个三明治结构,各自朝向Helix II的两侧,将SpA domain D夹在其中,互不干扰。 图7:SpA domain D(红色)和VH3 Fab(青色)以及Fc区(灰色)形成复合物示意图[5]其它SpA结构域,是否也能够和Fab区发生互作?通过将domain D的结构,和已发表文献中的其它IgG结合结构域进行比对,发现domain E的相似度最高(很多文献中提到D和E主要负责和Fab区互作)。如图8所示,domain D中参与Fab区互作的氨基酸残基(青色背景),在所有的SpA IgG结合结构域中高度保守(在domain E、A和B中完全一致),说明每一个结构域都能以类似方式和Fab区互作(但强度有差异)。图8:SpA的5个抗体结合区的序列示意图。domain D中参与Fab 2A2互作的氨基酸残基用青色背景表示,参与Fc互作的氨基酸残基[22]用灰色背景表示。粉色为domain D的Gln-32,同时较弱的参与Fab和Fc互作再说VH3SpA被报道可以和B细胞表面的VH3家族抗体的Fab区结合,并介导细胞凋亡,用于逃逸免疫监视[27, 28],大约有一半的人IgM以及32–54%的人外周血B淋巴细胞 (BCR) 能够和SpA发生结合[29],互作被严格限定在VH3基因家族(占VH基因型的50%以上)或者其它哺乳动物中的VH3同源基因家族。为何呢?表3:VH基因家族和domain D互作的13个氨基酸序列展示[5]根据前述M Graille等[5]的研究,从序列上看,和SpA互作的13个氨基酸中(图6和表3),考虑到VH3基因的种系序列多样性,只有第57位有多个突变的可能性,而其在互作结构中并不是核心氨基酸残基。另外12个直接参与domain D互作的功能氨基酸则高度保守,其中,只有2个氨基酸存在种系可变性,即19位的Lys (K) 和82位的Gly (G) ,但是这两个突变氨基酸在成年VH3 Ig表达谱中发生的可能性只有不到2%(因此,也并不是所有的VH3基因家族都能和SpA的Fab区结合)。而其它无法结合SpA的VH家族,在13个互作氨基酸残基中,至少含有2个或更多的氨基酸残基差异。作者又从结构角度,给出了7个氨基酸组成的核心关键残基 (Arg/Lys-H19, Gly-H65, Arg-H66, Thr-H68, Ser-H70, Gln-H81, Asn-H82a) ,奠定了VH3特异性结合的基础。 关于商业化配基改造针对Protein A或其单个抗体结合结构域,主要发生的改造类型:① 高耐碱性:利于低成本、方便的进行NaOH在位清洁CIP。Cytiva的多款明星抗体亲和产品,为基于domain B开发,如MabSelect SuRe和PrismA,除了和祖先序列最为相似以外,domain B还被证明对于溶剂和温度变性更加稳定[30],并且对不同种属抗体的结合范围最广。Domain Z最初是为提高耐碱性而生(注意Z有很多不同突变的变体),将domain B中在高pH条件下会发生降解(如脱氨化)的氨基酸残基进行突变,如天冬酰胺Asn等,并进一步优化为MabSelect SuRe以及MabSelect SuRe LX填料,耐受0.1-0.5M NaOH,Sure LX载量为60 mg 人lgG/mL填料。MabSelect PrismA则进一步优化了耐碱和载量,可以耐受1M NaOH CIP,载量提升至80 mg 人lgG/mL填料。图9:对Protein A进行定点突变,产生耐碱稳定的四聚体变体[3]② 提高洗脱的pH条件:Protein A序列中的组氨酸残基His 137,有一个在IgG-Fc中高度保守的、位于互补位置的组氨酸残基His 435,在中性pH条件下两个氨基酸不带电,Protein A和IgG的互作正常发生;在低pH条件下,两个组氨酸残基被质子化而同样带上正电荷,因此互斥造成结合减弱,促进样品洗脱[31]。如果样品不稳定,需要更高的洗脱pH,也可以通过减弱或去除Protein A和Fab之间的互作达成。例如,去掉和Fab区主要发生互作的domain D和E,转而使用单独的domain B(或Z)、domain C等进行配基开发,可以将洗脱的pH提高。报道中,domain Z的29位甘氨酸突变(如G29A),使其失去了对Fab区的亲和力,从而提高洗脱pH[7, 18, 32]。另外,并不是所有的Fab区都不能和domain Z(或MabSelect SuRe)互作,在极罕见的情况下也会发生结合,但比全长Protein A更弱[26]。图10:MabSelect SuRe对于多个人抗体和Fc融合蛋白的洗脱pH分布,相较于MabSelect填料(重组Protein A配基),MabSelect SuRe洗脱pH更高也更窄[33]③ 更高载量: 1 对改造后的单一结构域,重复多次,使用同源多聚体或异源多聚体[25]。 2 优化linker设计:避免被蛋白酶降解(减少由此造成的配基脱落),同时提高配基和IgG的结合和利用率[18]。 3 基架相关:如基架材质、配基密度、粒径大小、孔径大小、化学偶联方式等。④ 针对特定区域的结合,Cytiva专门开发了多种填料例如针对VH3基因家族,专门开发了耐碱的MabSelect VH3填料[34],也可以测试MabSelect PrismA。针对轻链的结合,Cytiva还开发了耐碱的MabSelect VL(结合Kappa轻链可变区)[35]以及LambdaFabSelect(结合Lambda轻链恒定区)以及KappaSelect填料(结合Kappa轻链恒定区)[36]。参考文献[1] J Sjöquist, J Movitz, I B Johansson, H Hjelm. Localization of protein A in the bacteria.Eur J Biochem. 1972 Oct 17;30(1):190-4.[2] S Löfdahl, B Guss, M Uhlén, L Philipson, M Lindberg. Gene for staphylococcal protein A.Proc Natl Acad Sci U S A. 1983 Feb;80(3):697-701.[3] MabSelect SuRe–studies on ligand toxicity, leakage, removal of leached ligand, and sanitization. Application notes, CY17448-30Oct20-AN.[4] Colbert, D., A., and Anilinois, A., 1992. Repligen Corporation. Cloned genes encoding recombinant Protein A. US5151350A.[5] M Graille, E A Stura, A L Corper, B J Sutton, M J Taussig, J B Charbonnier, G J Silverman. Crystal structure of a Staphylococcus aureus protein A domain complexed with the Fab fragment of a human IgM antibody: structural basis for recognition of B-cell receptors and superantigen activity. Proc Natl Acad Sci U S A. 2000 May 9;97(10):5399-404.[6] M Uhlén, B Guss, B Nilsson, S Gatenbeck, L Philipson, M Lindberg. Complete sequence of the staphylococcal gene encoding protein A. A gene evolved through multiple duplications. J Biol Chem. 1984 Feb 10;259(3):1695-702.[7] Sara Kanje, Julia Scheffel, Johan Nilvebrant, Sophia Hober. Chapter 2 - Engineering of Protein A for improved purification of antibodies and Fc-fused proteins. Approaches to the Purification, Analysis and Characterization of Antibody-Based Therapeutics. 2020, Pages 35-54.[8] Mahshid Zarrineh, Ilnaz Soleimani Mashhadi, Mohsen Farhadpour, Alireza Ghassempour. Mechanism of antibodies purification by protein A. Anal Biochem. 2020 Nov 15:609:113909.[9] B Jansson 1, M Uhlén, P A Nygren. All individual domains of staphylococcal protein A show Fab binding. FEMS Immunol. Med. Microbiol. 20, 69–78.[10] Vol. 1: Antibodies Affinity Chromatography. Handbook. CY13981-25Jan21-HB.[11] I. Johansson, IGG Separation Medium, Google Patents, 2002.[12] H Hjelm, J Sjödahl, J Sjöquist. Immunologically active and structurally similar fragments of protein A from Staphylococcus aureus. Eur J Biochem. 1975 Sep 15;57(2):395-403.[13] J Sjödahl. Repetitive sequences in protein A from Staphyloccus aureus: three highly homologous Fc-binding regions. FEBS Lett. 1976 Aug 1;67(1):62-7.[14] J Sjodahl. Repetitive sequences in protein A from Staphylococcus aureus. Arrangement of five regions within the protein, four being highly homologous and Fc-binding. Eur J Biochem. 1977 Mar 1;73(2):343-51.[15] T Moks, L Abrahmsén, B Nilsson, U Hellman, J Sjöquist, M Uhlén. Staphylococcal protein A consists of five IgG-binding domains. Eur J Biochem. 1986 May 2;156(3):637-43.[16] J Sjödahl. Structural studies on the four repetitive Fc-binding regions in protein A from Staphylococcus aureus. Eur J Biochem. 1977 Sep;78(2):471-90.[17]Scott D Kobayashi 1, Frank R DeLeo.Staphylococcus aureus protein A promotes immune suppression. mBio. 2013 Oct 1;4(5):e00764-13.[18] Vinod Amritkar, Satish Adat, Vijay Tejwani, Anurag Rathore, Rahul Bhambure. Engineering Staphylococcal Protein A for high-throughput affinity purification of monoclonal antibodies. Biotechnol Adv. 2020 Nov 15:44:107632.[19] A C Braisted 1, J A Wells. Minimizing a binding domain from protein A. Proc Natl Acad Sci U S A. 1996 Jun 11;93(12):5688-92.[20] R Li 1, V Dowd, D J Stewart, S J Burton, C R Lowe. Design, synthesis, and application of a protein A mimetic. Nat Biotechnol. 1998 Feb;16(2):190-5.[21] J Deisenhofer, T A Jones, R Huber, J Sjödahl, J Sjöquist. Crystallization, crystal structure analysis and atomic model of the complex formed by a human Fc fragment and fragment B of protein A from Staphylococcus aureus. Hoppe Seylers Z Physiol Chem. 1978 Aug;359(8):975-85.[22] J Deisenhofer. Crystallographic refinement and atomic models of a human Fc fragment and its complex with fragment B of protein A from Staphylococcus aureus at 2.9- and 2.8-A resolution. Biochemistry. 1981 Apr 28;20(9):2361-70.[23] H Gouda 1, M Shiraishi, H Takahashi, K Kato, H Torigoe, Y Arata, I Shimada. NMR study of the interaction between the B domain of staphylococcal protein A and the Fc portion of immunoglobulin G. Biochemistry. 1998 Jan 6;37(1):129-36.[24] M A Starovasnik 1, M P O'Connell, W J Fairbrother, R F Kelley. Antibody variable region binding by Staphylococcal protein A: thermodynamic analysis and location of the Fv binding site on E-domain. Protein Sci. 1999 Jul;8(7):1423-31.[25] U K Ljungberg 1, B Jansson, U Niss, R Nilsson, B E Sandberg, B Nilsson. The interaction between different domains of staphylococcal protein A and human polyclonal IgG, IgA, IgM and F(ab')2: separation of affinity from specificity. Mol Immunol. 1993 Oct;30(14):1279-85.[26]Julia Bach 1, Nathaniel Lewis 1, Kathy Maggiora 1, Alison J Gillespie 1, Lisa Connell-Crowley. Differential binding of heavy chain variable domain 3 antigen binding fragments to protein A chromatography resins. J Chromatogr A. 2015 Aug 28:1409:60-9.[27] J L Hillson 1, N S Karr, I R Oppliger, M Mannik, E H Sasso. The structural basis of germline-encoded VH3 immunoglobulin binding to staphylococcal protein A. J Exp Med. 1993 Jul 1;178(1):331-6.[28] Carl S Goodyear 1, Gregg J Silverman. Death by a B cell superantigen: In vivo VH-targeted apoptotic supraclonal B cell deletion by a Staphylococcal Toxin. J Exp Med. 2003 May 5;197(9):1125-39.[29] M Hakoda 1, N Kamatani, S Hayashimoto-Kurumada, G J Silverman, H Yamanaka, C Terai, S Kashiwazaki. Differential binding avidities of human IgM for staphylococcal protein A derive from specific germ-line VH3 gene usage. J Immunol. 1996 Oct 1;157(7):2976-81.[30] Simin Khodaei 1 2, Samira Ghaedmohammadi 2 3, Mehdi Mohammadi 4, Garshasb Rigi 5, Parisa Ghahremanifard 2, Reza Zadmard 1, Gholamreza Ahmadian 2. Covalent Immobilization of Protein A on Chitosan and Aldehyde Double-Branched Chitosan as Biocompatible Carriers for Immunoglobulin G (Igg) Purification.J Chromatogr Sci. 2018 Nov 1;56(10):933-940.[31] M I Nik Jaafar, J A Lowe, N R Ling, R Jefferis. Immunogenic and antigenic epitopes of immunoglobulins--VII. The topographical distribution of Fc gamma epitopes and the relationship of an iso-allotypic specificity to the presence of histidine 435. Mol Immunol. 1984 Feb;21(2):137-43.[32] B Nilsson 1, T Moks, B Jansson, L Abrahmsén, A Elmblad, E Holmgren, C Henrichson, T A Jones, M Uhlén. A synthetic IgG-binding domain based on staphylococcal protein A. Protein Eng. 1987 Feb-Mar;1(2):107-13.[33] MabSelect SuRe LX. Data File, CY12583-09Apr20-DF.[34] MabSelect™ VH3 resin. Data File, CY36703-29Nov23-DF.[35] MabSelect™ VL resin. Data File, CY26149-26Sep22-DF.[36] KappaSelect LambdaFabSelect. Data File, CY13476-30Jul20-DF.识别微信二维码,添加生物制品圈小编,符合条件者即可加入生物制品微信群!请注明:姓名+研究方向!版权声明本公众号所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(cbplib@163.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。