引言
我们体内的血液,就像是一条川流不息的运河,携带着成千上万种游走于全身的蛋白质。这些蛋白质不仅是生命活动的直接执行者,更是我们窥探疾病发生发展的绝佳窗口。然而,在这条运河的源头,我们的基因组究竟是如何在宏观层面调控这些蛋白质的丰度?远距离的非编码区基因变异,又是如何隔山打牛般地引发特定疾病的?
5月6日,《Cell》的研究报道“Multi-cohort proteogenomic analyses reveal genetic effects across the proteome and diseasome”,研究人员以前所未有的规模,绘制了一幅跨越基因组与疾病组的蛋白质调控全景图。这项研究不仅打破了我们对蛋白质遗传调控的固有认知,更为老药新用和寻找新型疾病标志物提供了极具价值的数据支撑。
破译血液蛋白质组的宏大遗传图谱
在过去的数十年里,全基因组关联分析详细描绘了基因变异与复杂疾病之间的统计学联系,但这些变异往往位于非编码区,犹如暗物质般难以解析其背后的真实分子机制。为了建立基因组与疾病之间的实质性桥梁,研究人员汇集了多达38个独立队列的数据,总计涵盖了78664名参与者。通过对1161种循环蛋白质进行深入的全基因组关联分析,他们成功鉴定出超过24000个独立的蛋白质定量性状基因座(protein quantitative trait loci, pQTLs)。
在遗传学中,我们将靠近目标蛋白质编码基因的调控变异称为顺式(cis)作用,而将远离目标基因、位于不同染色体上的调控变异称为反式(trans)作用。在这项宏大的分析中,研究人员共确认了5040个顺式变异(cis-pQTLs)和19698个反式变异(trans-pQTLs)。数据显示,对于所检测的1161种靶蛋白,高达87.1%的蛋白质至少拥有一个顺式变异,而94.1%的蛋白质至少受一个反式变异的调控。
这些庞大的数据向我们展示了蛋白质丰度调控的极端多样性。以Fc受体样蛋白3(Fc receptor-like protein 3, FCRL3)为例,这是一个典型的单基因驱动模型,其循环水平的变异有45.3%都可以被鉴定出的顺式基因座解释,而多基因背景的贡献仅为3.8%。然而,并非所有蛋白质都如此简单。对于细胞间粘附分子2(intercellular adhesion molecule 2, ICAM2),顺式变异仅仅解释了0.3%的浓度变化,而反式变异的解释度却高达52.7%;与之类似的还有α-L-岩藻糖苷酶1(alpha-L-fucosidase 1, FUCA1),其顺式变异解释度为6.3%,反式变异则主导了68.4%的变化。这种强烈的对比揭示了一个不容忽视的事实:血液中蛋白质的水平,在很大程度上是由其编码基因之外的庞大系统网络所决定的。
远距离的调控艺术:追踪基因组的“幕后推手”
绝大多数被发现的蛋白质遗传调控并不发生在目标基因的附近,而是散布在基因组的各个角落。要将这些远距离的反式变异准确映射到其实际作用的效应基因(effector genes)上,一直是基因组学领域的一大挑战。研究人员巧妙地引入了机器学习算法,结合现有的生物学先验知识,成功为超过半数(共11261个)的反式变异分配了具有中高置信度的候选效应基因,其中1534个分配结果具有极高的置信度。
顺藤摸瓜之下,一幅精密的系统性调控网络浮出水面。数据显示,有143种靶蛋白的反式效应基因在“天冬酰胺N-连接糖基化”(asparagine N-linked glycosylation)通路中出现了显著的富集。N-连接糖基化是分泌型蛋白质最常见的翻译后修饰,它直接决定了蛋白质的正确折叠、分泌效率以及在血液中的半衰期。这些具有广泛多效性的反式效应基因主要参与聚糖的延伸、分支和加帽过程,主要负责调节循环蛋白质的稳定性,而非仅仅是早期的内质网折叠。这表明,基因组通过系统性地调节这些“加工流水线”的效率,从根本上重塑了整个血液蛋白质组的面貌。
更有趣的是,研究还发现了器官之间通过蛋白质进行的跨组织对话。数据表明,95种和97种靶蛋白的反式效应基因分别在12种特定组织和29种特定细胞类型中表现出显著的特异性表达富集。其中,肝脏(特别是肝细胞)的效应基因与大量循环蛋白质的水平密切相关,凸显了肝脏在维持全身蛋白质稳态中的核心地位。此外,在自然杀伤细胞(NK cells)中高表达的基因,被发现是介导白细胞介素15(interleukin-15, IL-15)循环水平的重要反式效应基因;而大脑特异性的细胞外基质蛋白腱蛋白R(tenascin R),其反式效应基因竟然在内皮细胞中呈现出超过20倍的极高富集度。这些跨越组织边界的调控网络,让我们对机体内部的系统级通讯有了全新的理解。
殊途同归还是分道扬镳?遗传变异与疾病因果的碰撞
在寻找疾病的潜在治疗靶点时,利用遗传变异作为工具变量进行孟德尔随机化(Mendelian randomization, MR)推断因果关系,已成为近年来的热门手段。顺式变异由于直接影响蛋白质的表达,通常具有极高的生物学说服力。在这项研究中,研究人员结合孟德尔随机化和共定位(colocalization)分析,在最初的300对基于顺式变异的蛋白质-疾病关联中,筛选出了73个具有双重高置信度支持的靶点。
然而,当我们引入远距离的反式变异进行相互印证时,结果却呈现出明显的两极分化。在某些情况下,顺式和反式变异“殊途同归”。例如,编码磺基转移酶的SULT2A1基因,其附近的顺式变异已知会增加妊娠期肝内胆汁淤积症(intrahepatic cholestasis of pregnancy, ICP)的风险,这主要是由于酶活性的改变促进了胆结石的形成。而该研究发现,位于PANX1基因附近的潜在反式变异(如rs16919533)同样展现出一致的致病方向。这种顺反协同的现象,为确立该蛋白质在疾病发生中的核心地位提供了双重保障。
但在更多时候,顺式与反式推断却“分道扬镳”。以负向调节骨形成的硬化蛋白(sclerostin, SOST)为例。利用顺式变异进行的因果推断强烈显示,SOST水平与前臂骨折风险显著相关(效应值beta = 1.34,p < 5.6 × 10-19)。但是,当研究人员利用累积解释度更高的16个特定反式变异进行评估时,这种骨折风险的关联却神奇地消失了(效应值beta = 0.02,p = 0.84)。这警示我们,反式变异可能通过极其复杂的上游网络调节目标蛋白质,其携带的多效性(pleiotropy)很可能会掩盖或扭曲真实的因果关联效应。不加甄别地将反式变异应用于靶点发现,极易导致因果推断的误判。
为了进一步验证遗传推断的可靠性,研究人员将这些高置信度的遗传数据与高达52164名参与者的真实世界前瞻性生存分析数据进行了系统性三角互证。在193对获得遗传学高度支持的蛋白质-疾病关联中,仅有不到四分之一(52对)在观察性生物标志物队列中显示出方向一致且具有统计学意义的支持。
在这少数能够经受住双重考验的靶点中,弗林蛋白酶(Furin)的表现尤为抢眼。无论是孟德尔随机化推断,还是真实世界的前瞻性生存风险及患病率分析,Furin水平的升高都一致地指向了更高的原发性高血压、心肌梗死和心房颤动风险。长期以来,学术界普遍认为Furin主要在细胞内(如反式高尔基体网络)发挥切割作用,其与心血管疾病的联系可能源于对脑钠肽(brain natriuretic peptide, BNP)的细胞内加工。然而,这项研究的数据显示,主导Furin水平的顺式变异(rs8027450-T)与血液中BNP(p = 0.2)或NT-proBNP(p = 0.3)的浓度毫无关联。这一突破性发现直接挑战了传统假说,提示细胞外环境中的Furin同样在心血管病理过程中扮演着极其关键的角色,为其作为新型心血管药物靶点奠定了坚实的理论依据。
变废为宝:老药新用的惊喜与未来
这项研究最令人兴奋的成果之一,在于揭示了多效性反式变异(pleiotropic trans-pQTLs)在解码疾病全貌及指导药物重定向(老药新用)中的巨大潜力。研究发现,在具有至少5种显著相关蛋白质的307种疾病中,超过90%(280种)的疾病生物标志物特征富集于170个具有多效性的变异基因座上。这意味着,血液中某些看似不相关的蛋白质水平波动,实际上正是深层组织病变在体液中的投影。
一个堪称经典的案例是酪氨酸激酶2(tyrosine kinase 2, TYK2)基因上的一个错义变异(rs34536443, p.P1104A)。这个单一的遗传改变,竟然作为反式变异同时调控了血液中6种重要免疫蛋白质的丰度,包括BST2、CXCL9、CXCL10、CXCL11、IL-12RB1以及PDCD1。共定位分析证实,这6种蛋白质水平的升高与类风湿性关节炎(rheumatoid arthritis)、银屑病(psoriasis)以及甲状腺功能减退症的发生风险共享着同一个高度可信的遗传信号(后验概率PP = 98.9%)。
银屑病正是TYK2抑制剂(如deucravacitinib)目前获批的适应症,而这项强有力的遗传学证据不仅为其疗效提供了底层逻辑支撑,更为该药物拓展至类风湿性关节炎和自身免疫性甲状腺疾病的治疗指明了方向。更重要的是,这组由6种蛋白质组成的特定血液标签,完全有潜力成为监测高危人群早期免疫失调的生物标志物。在未来的临床实践中,持续升高的标志物水平不仅能帮助医生精准筛选出最可能从TYK2抑制剂中获益的患者,还能作为实时评估靶向治疗效果的“金标准”。
在数据的海洋中打捞医学真相,道阻且长。通过对7万多名参与者的基因组和蛋白质组进行极其深度的交互分析,这项研究不仅以前所未有的分辨率重构了调控血液蛋白质丰度的遗传学网络,更向我们深刻展示了:那些原本被视为噪音或间接效应的反式调控变异,实际上正是解读全身性疾病发病机制的密码本。随着未来多队列、大样本、深覆盖研究的不断推进,我们有理由相信,隐藏在人类血液中的那片广袤“暗物质”,终将被完全照亮。
参考文献
Koprulu M, Smith-Byrne K, Ferolito BR, Macdonald-Dunlop E, Luan J, Hedman ÅK, Ogamba CF, Kuliesius J, Repetto L, Ramisch A, Abbasi F, Ärnlöv J, Assimes TL; BeLOVE Study Group; Björck HM, Björkander S, Böttcher M, Butterworth AS, Chen Z, Cho K, Clarke RJ, Cox SR, Czene K, Danesh J, Dedoussis G, Elmståhl S, Eriksson N, Eriksson P, Esko T; Estonian Biobank Research Team; Ferreiro-Iglesias A, Franks PW, Fu J, Gaziano JM, Ghanbari M, Gieger C, Gilly A, Grallert H, Gunter MJ, Gustafsson S, Göteson A, Hall PFL, Hansson O, Harris SE, Hayward C, Herder C, Hernandez-Pacheco N, Hijazi Z, Hillary RF, Hopewell JC, Hu S, Hwang SJ, Jern C, Johansson Å, Jonsson L, Kalnapenkis A, Kerrison ND, Kho PF, Klaric L, Kohleick L, Kraft J, Landén M, Levy D, Li L, Lind L, Long J, Mattsson-Carlgren N, Melén E, Merid SK, Mertins P, Michaëlsson K, Møller PL, Murgia F, Nyegaard M, Park YC, Pearson E, Peters J, Petrie JR, Png G, Polašek O, Prins BP, Ripke S, Roden M, Rohde PD, Said S; SCALLOP Consortium; Shen X, Schwenk JM, Siegbahn A, Smith JG, Stanne TM, Suhre K, Sundström J, Thorand B, Valdes-Marquez E, Vallerga CL, van Meurs JBJ, Viñuela A, Võsa U, Wallentin L, Walters RG, Wareham NJ, Weber JE, Weersma RK, Wilson JF, Winther S, Yasmeen S, Zanetti D, Zeggini E, Zhao JH, Zhernakova A, Zhernakova DV, Ziehm M, Kessler BM, Pereira AC, Mälarstig A, Pietzner M, Langenberg C. Multi-cohort proteogenomic analyses reveal genetic effects across the proteome and diseasome. Cell. 2026 May 6:S0092-8674(26)00385-5. doi: 10.1016/j.cell.2026.03.049. Epub ahead of print. PMID: 42097137.
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
往期热文:
Nature Medicine | 帕金森病的肠道倒计时:隐藏在微生态中的患病轨迹
Nature | 打破多倍体对称性!单体型基因组揭示“染色体融合”触发二倍体化
Cell | 从“帮凶”到“刺客”:研究揭示亲环素家族蛋白PPID阻断HIV核输入的全新机制
Nature Medicine | 从表观遗传到宏观流行病学:最新研究实锤农药暴露与肠癌年轻化的深层关联
Nature Methods | 被颠覆的序列之谜:让AI重新理解RNA语言的生命密码
Nature Genetics | 从遗传发掘到临床预警,高度近视高危人群筛选迎来新标尺
Nature | 肿瘤“超适应症”处方不能成为脱缰野马:最新研究为临床探索套上了哪些“缰绳”?
Science | 终结“双起源”与“分子锚点”之争:研究揭示大脑皮层扩张的统一梯度模型
Nature | 突破递送与内体逃逸壁垒!MitoCatch系统实现定制化线粒体靶向移植
Nature | 重磅综述重构肿瘤促发底层逻辑:变异只是起点,选择决定结局