点击蓝字 关注我们
投
医
问
药
Summary
医院生物样本库中将遗传数据与电子健康记录(EHR)相结合有望极大推进精准医疗的演进,但目前有限的遗传祖先多样性限制了全新遗传学发现的能力及其在更广泛人群中的普适性,在不同复杂遗传背景人群中的特异性疾病患病率和潜在遗传风险目前仍不清楚,如何利用具有高度祖先多样性的区域生物样本库产生可靠的跨人群疾病关联和药物基因组学见解仍有待揭示。这项研究突出了填补上述研究空白对于实现公平精准医疗的深远意义。
2026年3月27日,加州大学洛杉矶分校(UCLA)的Roni Haas、Paul T. Spellman、Paul C. Boutros与Daniel H. Geschwind等人在Cell期刊发表题为"Advancing precision health discovery in a genetically diverse health system"(在一个具有遗传多样性的卫生系统中推进精准健康发现)的研究论文。研究团队发现,通过整合UCLA ATLAS生物样本库中代表5大洲及36个精细祖先群体的92,164名参与者的遗传与临床数据,成功揭示了众多以前未曾报道的特定基因-表型关联(例如欧洲人和美洲混血人群中FN3K基因与肠道双糖酶缺乏症的联系)。此外,多基因风险评分(PGS)能可靠预测常见疾病,但其效用在非欧洲人群中显著衰减。研究团队还发现2型糖尿病多基因风险以及特定罕见变异(如PTPRU基因)会显著调节不同人群在使用司美格鲁肽(Semaglutide)时的减重疗效。
欢迎关注公众号/设置星标并下载原文
PIIS0092867426002746.pdf
01
|INTRODUCTION
将电子健康记录(EHR)与遗传数据整合正在深刻改变生物医学研究,为预防和管理常见医疗状况提供了前所未有的机会。与标准队列驱动的研究相比,结合遗传和环境数据进行纵向采样具有明显优势。这推动了全国性生物样本库以及多个大型学术生物样本库的创建。对这些生物样本库的深度整合促成了众多创新的合作项目。
尽管这些努力极大地推进了遗传和生物医学领域的发现,但它们主要集中于欧洲(EUR)祖先参与者,这限制了研究结果的普适性。随着多基因评分(PGS)被验证可用于临床,在不同人群中评估其准确性的重要性日益增加;最近的分析表明,与参考人群的祖先距离和PGS效用之间存在连续的相关性。同样,罕见遗传变异也具有显著的特定祖先效应和分布特征;例如,在非裔美国人中,APOE4等位基因对阿尔茨海默病风险的影响较小,而罕见的保护性PCSK9变异更为普遍。此外,临床相关罕见变异的解释受到遗传数据库中过度偏向欧洲人群变异的严重阻碍。纳入非欧洲人群揭示了临床相关罕见变异频率的巨大差异,并有效增加了发现这些风险的统计效力。因此,在具有详细医疗记录的生物样本库中提升祖先多样性,将极大加强推进精准健康的各项努力。
在此背景下,研究团队分析了来自UCLA ATLAS社区健康倡议的数据,将92,164名进行了芯片基因分型和61,797名进行了全外显子组测序(WES)的参与者的EHR与基因组信息联系起来。ATLAS真实反映了单一卫生系统内洛杉矶地区的祖先多样性,这有效减少了不同临床实践带来的混杂因素,并实现了稳健的跨人群比较。研究团队在广泛尺度(大陆级别)和精细尺度(次大陆级别)祖先群体中使用常见和罕见变异进行了全表型组关联分析,并量化了这些群体中的疾病诊断分布和遗传风险。利用纵向EHR数据,研究团队以司美格鲁肽(Semaglutide)作为案例研究,以确定改变药物疗效的遗传因素。该研究确定了多个以前未报道的特定祖先风险关联,进一步证明了祖先多样性数据对于更公平、更个性化的医学研究的实用价值。
02
|RESULTS
研究人员通过对92,164名阵列基因分型参与者的电子健康记录(自2013年起)进行流行病学分析,得到了涵盖5个广泛尺度祖先群体的人口学数据,发现不同遗传祖先之间的平均就诊次数和并发症指数存在显著差异(例如美洲混血人群年均就诊达16.2次,高于欧洲人群的12.2次),证明了广泛尺度遗传背景对群体疾病负担与医疗系统使用情况的重要影响。
图1. UCLA ATLAS生物样本库概览
在此基础上,研究人员通过多同源核对(IBD)分析和逻辑回归实验,得到了36个精细尺度祖先群组对1,253个临床表型的患病率数据,发现并证明了高度特异性的罕见疾病人群聚集现象(如菲律宾裔群体患胆囊胆固醇沉着症的风险极高,OR=4.3;而阿什肯纳兹犹太裔前列腺增生风险显著升高,OR=1.7)。
图2. IBD映射与精细尺度祖先的疾病风险
为了评估跨族裔预测能力,研究人员通过多基因评分(PGS)风险分层实验,得到了各人群中不同疾病高风险患者的占比数据,发现处于PGS最高十分位数的人群涵盖了18.6%的常见疾病患者(其中1型糖尿病患者高达41%),证明了现存的PGS模型在欧洲人群中预测效力极佳,但在非欧洲血统中预测准确度被极大削弱。
图3. 多基因风险与疾病诊断
随着风险差异的明确,研究人员通过全表型组关联实验对84,110名参与者的常见变异进行了深度扫描,得到了19,431个具有全基因组显著性的关联数据,发现了FN3K基因突变(rs7208565-T,次等位基因频率超33%)与肠道双糖酶缺乏症间的全新关联,证明了不同精细人群携带特定的药物遗传变异,直接影响药物代谢(如非裔及美洲混血人群中DPYD变异富集影响化疗毒性)。
图4. 选定的全表型组关联研究(PheWAS)结果与药物遗传变异富集
深入到蛋白质编码层面,研究人员通过全外显子组关联研究(ExWAS)分析了17,537个基因的负荷测试,得到了1,099个显著的基因-性状数据,发现并证明了罕见功能丧失变异(dLOF)在非欧洲人群中存在隐秘的致病机理(如非裔人群中ANKZF1变异使得周围血管疾病风险激增,OR=58.8),揭示了采用计算预测模型纠正当前ClinGen等数据库欧洲人群偏倚的必要性。
图5. 罕见变异的发现
结合前述变异与临床记录,研究人员通过线性混合效应模型评估了7,340名司美格鲁肽使用者的纵向数据,得到了不同遗传背景下长达60周的体重变化轨迹,发现美洲混血和东亚裔人群的减重速度及幅度显著低于欧洲人群(减重差异β值分别达到45.2和76.4),并证明了PTPRU基因中特定变异以及2型糖尿病的高PGS与减重疗效呈显著负相关。
图6. 司美格鲁肽(Semaglutide)的疗效分析
03
|DISCUSSION
该研究全面展示了具备遗传多样性的单一卫生系统大型生物样本库在推动公平精准医疗领域的巨大潜力与价值。机制上,研究不仅在精细祖先尺度上揭示了多个全新的基因-疾病关联(如菲律宾裔特定的心血管代谢风险),更创新性地证实了复杂的多基因风险及PTPRU等罕见功能变异可以直接调控司美格鲁肽的临床减重效果。该工作的重要意义在于,它用详实的数据暴露并尝试纠正了当前全球临床变异数据库对欧洲人群的严重偏倚,同时通过将纵向动态处方数据与基因组学深度融合,开辟了药物基因组学评估的新范式。尽管基于EHR的表型获取存在不完整性以及计算机预测工具潜在残存一定偏差,仍需未来在更多独立队列中开展交叉验证,但本研究整体为更精准的跨族裔风险分层、药物靶点发掘以及个性化干预措施制定贡献了不可或缺的基础架构与临床应用视野。
References
[1] Haas, R., Margolis, M. P., Wei, A., Yamaguchi, T. N., Feng, J., Tran, T., ... & Geschwind, D. H. Advancing precision health discovery in a genetically diverse health system. Cell, 2026. DOI: 10.1016/j.cell.2026.03.007
[2] Manral, A.K., Funke, B.H., Rehm, H.L., Olesen, M.S., Maron, B.A., Szolovits, P., Margulies, D.M., Loscalzo, J., and Kohane, I.S. Genetic Misdiagnoses and the Potential for Health Disparities. N. Engl. J. Med., 2016.
[3] The All US Research Program Genomics Investigators. Genomic data in the All of Us Research Program. Nature, 2024.
[4] Ding, Y., Hou, K., Xu, Z., Pimplaskar, A., Petter, E., Boulier, K., Privé, F., Vilhjálmsson, B.J., Olde Loohuis, L.M., and Pasaniuc, B. Polygenic scoring accuracy varies across the genetic ancestry continuum. Nature, 2023.
[5] Kurki, M.I., Karjalainen, J., Palta, P., Sipilä, T.P., Kristiansson, K., Donner, K.M., Reeve, M.P., Laivuori, H., Aavikko, M., Kaunisto, M.A., et al. FinnGen provides genetic insights from a well-phenotyped isolated population. Nature, 2023.
[6] Halldorsson, B.V., Eggertsson, H.P., Moore, K.H.S., Hauswedell, H., Eiriksson, O., Ulfarsson, M.O., Palsson, G., Hardarson, M.T., Oddsson, A., Jensson, B.O., et al. The sequences of 150,119 genomes in the UK Biobank. Nature, 2022.
[7] Graham, S.E., Clarke, S.L., Wu, K.-H.H., Kanoni, S., Zajac, G.J.M., Ramdas, S., Surakka, I., Ntalla, I., Vedantam, S., Winkler, T.W., et al. The power of genetic diversity in genome-wide association studies of lipids. Nature, 2021.
[8] Wojcik, G.L., Graff, M., Nishimura, K.K., Tao, R., Haessler, J., Gignoux, C.R., Highland, H.M., Patel, Y.M., Sorokin, E.P., Avery, C.L., et al. Genetic analyses of diverse populations improves discovery for complex traits. Nature, 2019.
[9] Bycroft, C., Freeman, C., Petkova, D., Band, G., Elliott, L.T., Sharp, K., Motyer, A., Vukcevic, D., Delaneau, O., O'Connell, J., et al. The UK Biobank resource with deep phenotyping and genomic data. Nature, 2018.
[10] Sirugo, G., Williams, S.M., and Tishkoff, S.A. The Missing Diversity in Human Genetic Studies. Cell, 2019.
[11] Abul-Husn, N.S., and Kenny, E.E. Personalized Medicine and the Power of Electronic Health Records. Cell, 2019.
往期回顾
【联合举办-清华大学生命科学学院行业大咖论坛】
► 清华大学生命科学学院 “行业大咖讲坛”第一期 晶泰科技 赖力鹏
► 清华大学生命科学学院 “行业大咖开讲”第二期 迈威生物 范梦奇
【投医问药分享会】
► 投医问药分享会第一期-脑转移肿瘤:基础科研、临床诊疗和成果转化(复旦大学 迟喻丹;北医三院 杨辰龙)
► 投医问药分享会第二期-细胞治疗(北京大学 席建忠;北京科技研究院/海豚博士 徐庞连;极客基因 来威锋;清辉联诺 马伟伟 )
► 投医问药分享会第三期-AI+医药(晶泰科技 赖力鹏;科迈生物 黄小鲁;剂泰科技 赖才达;数坤科技 廖方舟;)
【一文读懂系列】
► Suzetrigine(镇痛/Nav1.8/VX-548)
► Efruxifermin(MASH/FGF21/Thrb)
► Penmenvy(/脑膜炎疫苗/MenABCWY)
► 全球首个iPS细胞疗法/日本干细胞监管政策
【全球靶点在研管线一览】
► CD3×BCMA×CD19► 双靶小核酸 ► GLP-1R×GIPR×GCGR
► TL1A单抗、双抗/多抗► miR-124 ► Kv7► ACVR2A/B
► amylin/AMYR► FGF21► Thr-β►VAP-1/SSAO►NTSR1
► factor XI siRNA► GLP-1小分子激动剂►TRPC6
► TfR & CD98hc 单靶/双靶透脑递送管线►GPNMB-RYK
【新靶点】
► 癌症新靶点:eSrc;GSH/GGT;GPX1;OSBPL8;Gstm2/3;mSWI/SNF;ACOD1;ADRB2-CXCL16;GPX4;U2AF1;CD161;NNMT;RAS-PI3Kα;
► 代谢新靶点:CLCC1;RANK;SLC25A45;Or5v1/Olfr110;
► 皮肤新靶点:OXGR1;SLIT2-ROBO2-EID1-EP300;
► 自免新靶点:TRPV3–IL-6/CCL20–GC;HLA-DR15;MLKL;
► 心脏/血液新靶点:αIIbβ3;p38;
► CGT新靶点:OR7A10;KLHL6;
► 抗衰老新靶点:cGAS-STING;Nr3c2;HIS-71、DOT-1.3;
► 纤维化新靶点:ROCK2;GLIS3;
► 再生医学新靶点:FGF9;
► 神经精神类新靶点:TREM2;SCAN;CRL5^SOCS4;SLC45A1;SLC45A4;
► 避孕新靶点:STK3;
投医问药
投医问药起源于清华大学、北京大学和中国科学院,包含投医问药分享会和投医问药俱乐部,以及与清华大学生命科学学院合办的行业大咖论坛等板块,为生物医药领域专业人士专门打造,通过小型圆桌论坛和分享会的形式,提供一个深度交流和合作的平台。俱乐部成员包括PI、博士后、博士生以及生物医药产业和金融界的专业人士。在这里,大家可以分享自己的研究成果,讨论科研转化的可能性,寻找合作伙伴和资本介入的机会。投医问药注重建立信任关系,保持公益性,为生物医药相关人士促成各类资源的精准匹配,促进科研成果、创业想法的转化和社会价值的实现。
欢迎关注投医问药,并添加小编微信号:seekmedicine,添加微信时请备注:单位/职业/姓名,如果是PI/教授、创始人、合伙人等,还请注明。
声明:本内容仅用作生物医药行业信息传播,不构成任何用药和投资建议。如需转载,请务必注明文章作者和来源。对本文有异议或投诉,请联系seekmedicine@163.com。
点赞
收藏
分享