蛋白质分子3d渲染图,图自unsplash
学术探索
这是科睿研究院第606篇原创内容。
字数3229字,阅读全文大约需要7分钟。
2009 年,分子细胞生物学家 Jonathan Weissman 的实验室正在开发一种全新技术,试图直接捕捉细胞内蛋白质工厂的实时产出。当时,科学家们普遍认为人类基因组中编码蛋白质的基因已基本被锁定,总数约两万左右,这些基因通过转录翻译形成维持生命活动的各类蛋白质。
Weissman 与博士后 Nicholas Ingolia 共同设计的方法,核心是收集细胞内所有核糖体,对与之结合的信使 RNA 进行测序,这种被命名为核糖体分析的技术,本应精准统计已知蛋白质的生产情况。
然而实验结果却超出了所有人的预期,核糖体不仅在制造已知基因编码的蛋白质,还在忙碌地生产着成千上万种从未被记载的神秘分子,它们来自基因组中被认定为不编码蛋白质的区域。这一意外发现让科研界意识到,人类基因组的编码潜能远未被完全挖掘,一个隐藏的暗蛋白质世界正等待被揭开。
图自nature
01
基因计数的困境与暗蛋白质的
初步识别
人类基因组计划完成后的很长一段时间里,科学家们对蛋白质编码基因的识别主要依赖开放阅读框的筛选。开放阅读框是基因组中包含特定密码子序列的片段,被认为承载着合成蛋白质的指令,而研究者们还会结合序列保守性、长度合理性等标准进一步验证,不符合这些条件的片段往往被归为非编码区域而忽略。维护基因列表的 GENCODE 项目目前收录了近两万个蛋白质编码基因,其中约九成已通过实验证实,但这一清单并非终极答案。密歇根大学医学院的 John Prensner 指出,人类基因组计划的完成只是探索的起点,而非终点,早期技术限制使得大量潜在编码序列被遗漏。
核糖体分析技术的出现彻底改变了这一局面,它让科学家们得以直接观察核糖体的翻译活动,而非依赖间接的基因序列预测。2022 年,Prensner、Sebastiaan van Heesch 等人领导的研究团队在自然生物技术上发表成果,列出了 7000 多个非经典开放阅读框,这些序列因不符合传统筛选标准而长期被数据库排除。
van Heesch 强调这只是保守估计,其他研究已发现数万个潜在暗蛋白质编码序列。这些非经典开放阅读框的分布具有鲜明特征,大多邻近或重叠于经典蛋白质编码基因,约三分之一存在于长链非编码 RNA 中,而长链非编码 RNA 此前被认为仅承担调控功能,不参与蛋白质合成。
绘图:Fabio Buonocore
但识别开放阅读框的翻译活动只是第一步,证明这些翻译产物是稳定且具有功能的蛋白质,面临着巨大挑战。暗蛋白质的显著特征是分子量极小,通常由几十个甚至更少氨基酸组成,远低于人类蛋白质几百个氨基酸的平均长度。这种微小的尺寸让它们在质谱分析中难以被检测,细胞样本中长蛋白质片段的占比过高,进一步掩盖了低丰度微蛋白的信号。
此外,利用 AlphaFold 人工智能工具预测暗蛋白质结构时,多数分子与已知折叠良好的功能蛋白差异巨大,仅有少数案例显示出与经典蛋白质的相似性。GENCODE 项目负责人 Jonathan Mudge 表示,目前已有约 50 个通过核糖体分析确认的序列被纳入正式基因列表,但团队必须保持谨慎,因为实验室研究和临床诊断都依赖这些数据库,过早纳入可疑基因可能干扰有害变异的识别工作。
图自nature
02
CRISPR 技术解锁暗蛋白质的
功能密码
就在暗蛋白质的存在逐渐被证实之时,CRISPR-Cas9 基因编辑技术的成熟为功能研究提供了强大工具。Weissman 回忆,这项技术的出现让科研人员能够精准切除非经典开放阅读框,直接观察细胞功能是否受到影响,从而验证暗蛋白质的重要性。2020 年,他的团队在科学杂志上发表突破性研究,通过 CRISPR 干扰了人类诱导多能细胞和癌细胞系中数千个非经典开放阅读框的翻译,结果发现数百个案例中细胞出现明显生长缺陷,这直接证明许多微蛋白对细胞存活至关重要。
进一步实验揭示了暗蛋白质的多种作用机制,部分非经典开放阅读框编码的蛋白质会与同一信使 RNA 链上经典基因编码的蛋白质相互作用,这种排列方式类似细菌中共同调控的操纵子结构。Weissman 团队鉴定出的功能性暗蛋白质承担着多样化角色,有的参与细胞周期调控,有的则与线粒体生理功能相关。
癌症领域的研究更凸显了暗蛋白质的重要性,Prensner 作为儿科神经肿瘤学家,发现人类基因组中的非经典开放阅读框在某些癌症中存在异常调控,可能影响患者的治疗效果。他领导的研究小组通过 CRISPR 抑制 500 多个非经典开放阅读框后,约 10% 的案例导致人类癌细胞生长受阻,其中一种在乳腺癌细胞中高表达的暗蛋白质被证实会促进癌细胞增殖。
在儿童脑癌髓母细胞瘤的研究中,Prensner 和 van Heesch 团队发现多种暗蛋白质与肿瘤发生相关,其中一种独立于邻近经典蛋白的暗蛋白质,在携带过度活跃 MYC 癌基因的侵袭性髓母细胞瘤中发挥关键作用。van Heesch 强调,这些发现只是冰山一角,每个暗蛋白质的深入研究都需要三到四年时间,而目前已知的潜在分子数以千计,更多未知生物学机制等待探索。暗蛋白质在癌症中的特异性表达,使其成为极具潜力的治疗靶点,为开发精准抗癌疗法提供了新方向。
图自nature
03
筛选功能性分子与
暗蛋白质组的应用潜力
尽管已有部分功能明确的案例,但从海量潜在暗蛋白质中筛选出真正具有生物学功能的分子,仍是科研界面临的重大挑战。Prensner 提出一种可能性,许多观察到的暗蛋白质可能并不稳定,也不具备实际功能,更像是细胞代谢过程中产生的垃圾,被快速降解回收。纽约哥伦比亚大学的吴雪兵团队则从免疫监视系统入手,发现人体白细胞抗原复合体能够呈递细胞内几乎所有蛋白质片段,包括暗蛋白质,这一过程有助于训练免疫细胞识别异常细胞,但也使得许多无功能的翻译产物被检测到。
2023 年,吴雪兵团队在自然杂志发表研究,指出许多暗蛋白质带有特定化学特征,会被直接引导至降解途径,避免在细胞内积累。但研究同时发现,存在一种特殊机制能将部分暗蛋白质转运至细胞膜,使其免受降解并可能演化出新功能。在 2024 年的综述中,该团队筛选出约 1000 种可能具有功能的暗蛋白质,认为细胞需要在清除有害异常蛋白与保留潜在创新分子之间维持平衡。van Heesch 则从能量消耗角度提出质疑,核糖体是高耗能细胞器,持续生产大量无功能蛋白质不符合细胞的能量优化原则,因此许多暗蛋白质可能具有尚未被发现的功能,尤其是在免疫调节方面。
暗蛋白质组的潜在价值已吸引制药行业的关注。英国的 Enara Bio、法国的 Mnemo Therapeutics 等生物技术公司,正开发针对癌细胞特有暗抗原的免疫细胞疗法,利用暗蛋白质的肿瘤特异性表达,引导免疫系统精准攻击癌细胞。中国即将启动的一项临床试验,将测试针对乳腺癌暗蛋白质的疫苗效果,其前期小鼠实验已取得可靠数据。马萨诸塞州的 ProFound Therapeutics 公司与辉瑞合作,探索以暗蛋白质为靶点的肥胖症治疗方法,为代谢疾病治疗开辟新路径。
在基础研究领域,暗蛋白质被认为可能是基因演化的创新沙盒。van Heesch 团队 2024 年在自然心血管研究发表的成果显示,一组暗蛋白质出现在灵长类动物世系中,部分对心脏功能具有重要作用,但这些分子在心脏病患者体内往往表达异常。Prensner 补充,正常发育过程中发挥作用的暗蛋白质若发生调控异常,可能引发癌症,这一现象在儿童癌症中尤为突出。这些发现表明,暗蛋白质组不仅是功能分子的储备库,其演化过程也与疾病发生密切相关。
图自unsplash
人类基因组中的暗蛋白质世界,是过去十五年来生命科学领域最令人振奋的发现之一。从核糖体分析技术带来的意外突破,到 CRISPR 工具解锁的功能密码,再到如今逐渐显现的临床应用潜力,这些微小的分子正在改写我们对基因组编码能力的认知。尽管仍有大量暗蛋白质的功能亟待证实,筛选功能性分子的技术挑战依然存在,但科研人员已逐渐达成共识:基因组的编码潜力远超出传统认知,不应被既有分类标准束缚。
暗蛋白质组的研究不仅为理解生命演化提供了新视角,更为疾病治疗开辟了全新赛道。从癌症疫苗到代谢疾病疗法,这些曾经被忽视的分子正成为生物医药创新的重要靶点。
随着检测技术的升级和研究方法的完善,未来将有更多暗蛋白质的神秘面纱被揭开,它们或许会带来更多生物学惊喜,甚至改变疾病诊断与治疗的范式。对于这个充满未知的领域,保持开放的探索态度,摒弃固有的分类偏见,将是推动科学进步的关键,而人类基因组中更多隐藏的生命密码,也正等待着研究者们继续发掘。
Reference List
1. Ingolia, N. et al. Science 324, 218–223 (2009).
2. Mudge, J. M. et al. Nature Biotechnol. 40, 994–999 (2022).
3. Deutsch, E. W. et al. Preprint at bioRxiv https://doi.org/10.1101/2024.09.09.612016 (2024).
4. Chen, J. et al. Science 367, 1140–1146 (2020).
5. Prensner, J. R. et al. Nature Biotechnol. 39, 697–704 (2021).
6. Hofman, D. A. et al. Mol. Cell 84, 261–276 (2024).
7. Kesner, J. S. et al. Nature 617, 395–402 (2023).
8. Azam, S., Yang, F. & Wu, X. Trends Genet. https://doi.org/10.1016/j.tig.2024.12.001 (2025).
9. Huang, D. et al. Nature 625, 593–602 (2024).
10. Ruiz-Orera, J. et al. Nature Cardiovasc. Res. 3, 1217–1235 (2024).
【本文中包含的图片均来源于网络,仅用于信息传播和新闻报道目的。我们尊重并保护所有版权拥有者的权利。若有任何版权问题,或版权拥有者不希望图片被使用,请与我们联系,我们将在收到通知后立即处理并删除相关图片。】
往期推荐
真相倒计时:爱泼斯坦档案公开背后的权力游戏与社会拷问
星河探路者:中国将如何在宇宙中寻找第二颗地球
高市早苗的激进施政正在将日本拖入内外困局的危险棋局
H200芯片对华出口松动?全球 AI 算力格局能否迎来重构?
欢迎转发&点赞哦~