Nat Commun:郁金泰/程炜团队基于超25万人样本构建血浆代谢组遗传图谱,揭示代谢与疾病因果关联
时间:2025-09-25 15:50:07 热度:37.1℃ 作者:网络
循环代谢物是细胞过程与组织功能的关键指标,其异常与多种疾病密切相关。大量研究显示,多数血浆代谢物具有较高遗传性,表明遗传因素在其调控中扮演关键角色,但目前人们对相关遗传变异识别仍不全面。通过系统整合大规模人群的代谢组学与基因组学数据,不仅有望揭示尚未被发现的遗传决定因素,还有助于阐明其在疾病发生中的机制,并为治疗干预提供潜在的分子靶点。
既往代谢组遗传研究多受限于样本量或代谢物多样性,对代谢物比率的关注不足。基于核磁共振(NMR)的比值更具临床价值,但相关研究多聚焦于质谱(MS)技术且样本量较小,常常忽视了罕见编码变异的研究价值。目前亟需开展纳入常见与罕见变异的大规模研究,以系统分析NMR代谢物及其比率,从而全面揭示代谢组的遗传架构,推动精准医学的发展。
近日,复旦大学郁金泰、程炜团队基于254,825名UKB参与者的数据,对NMR血浆代谢组学进行了全面的遗传结构解析,共分析了249项代谢指标和64个生物学相关比率。通过全基因组关联研究(GWAS),在427个基因座中发现了24,438个独立的变异-代谢物关联;经精细定位发现了3,610个潜在因果关联,其中785个为新发现。同时,利用全外显子组测序(WES)数据开展聚合检验,揭示了2,948个基因-代谢物关联,凸显了罕见编码变异在代谢调控中的重要性。此外,整合研究成果与疾病遗传学数据后,还揭示了代谢物与疾病间的潜在因果关联。总之,该研究系统阐述了血浆代谢组的复杂遗传结构,为未来疾病机制探索和治疗策略开发提供了宝贵资源。
文章发表在Nature Communications
研究流程和结果摘要
研究团队共纳入254,825名UKB参与者,并对其中189,846名英国白人参与者进行初步GWAS,分析了7,924,871个常见遗传变异;基于高通量NMR代谢生物标志物检测平台,对249种代谢物进行定量检测,其中脂蛋白和脂质类占比最高,其余涵盖氨基酸、载脂蛋白等9类。结果显示,共识别出21,132个独立变异-代谢物关联,涉及3,059个独特lead变异,主要集中于脂蛋白和脂质类。
图1. 与249个代谢指标相关的已知基因座及其多效性效应概述
此外,研究团队还分析了人类代谢组数据库(HMDB)中具有共同蛋白质关联的64对代谢物比率,共确定了3,306个独立的遗传关联;每个代谢物比率的关联数量从6(异亮氨酸与缬氨酸比率)到 122(总胆固醇与总甘油三酯比率)个不等。值得注意的是,21.26%的关联仅通过比率分析发现,这突显了比率分析在揭示新型遗传关联方面的独特价值。
连锁不平衡(LD)评分回归分析显示,所有313个代谢性状的截距值为0.99-1.09,表明其具有多基因调控特性。性别分层分析显示,13,770个关联在男女中均显著,同时存在多个性别特异性关联变异,如rs768832539仅与女性甘氨酸水平相关,这为理解代谢调控的性别差异机制提供了重要证据。
综上,通过对249种核心代谢物及64对代谢物比率开展GWAS,研究团队共发现24,438个独立基因变异-代谢物性状关联,涉及427个基因座。
图2. 64种代谢物比值的生成及其GWAS结果的可视化
接下来,研究团队对上述427个独立基因座进行单基因座多效性评估。结果显示,323个基因座(75.64%)与多个性状相关,其中37个基因座仅与同一类别内的性状相关(类别内多效性),286个基因座与不同类别中的性状相关(跨类别多效性)。TRIB1(8q24.13)基因座表现出最广泛的跨类别多效性,与9个类别的255个性状相关联。
进一步分析揭示了代谢物多基因性的概念:每个性状至少关联5个基因座,其中171个性状与超50个基因座相关,如大高密度脂蛋白(HDL)中的胆固醇酯关联85个基因座。
遗传性分析表明,313种代谢性状中位遗传力为12.32%,不同类别间差异显著,脂蛋白与脂质、脂肪酸等类别遗传力较高。特别地,代谢物的关联基因座数量与其遗传力呈正相关。此外,研究团队还分析了313个代谢性状间的成对表型与遗传相关性,发现表型相关矩阵与遗传相关矩阵具有高度一致性。
图3. 代谢物的遗传结构和衍生比例
研究团队通过FINEMAP软件对14,661个独立信号区域进行精细定位,共识别出3,610个独特的潜在因果变异-代谢物关联,其效应等位基因频率与绝对效应大小之间呈负相关;其中2,871个与聚类分析发现的关联重叠。功能注释分析表明,部分非编码变异位于增强子或启动子区域,提示其可能通过调控基因表达影响代谢表型。
研究团队还采用两种方法系统评估了该研究结果与既往19项代表性代谢组学GWAS研究的一致性。在3,610个潜在因果关联中,785个为新发现,2,785个与既往报道一致,40个与已知变异存在连锁不平衡。这既验证了已有研究的可靠性,又显著拓展了对代谢物遗传结构认识。
图4. 313个代谢性状的精细映射关联
为鉴定与代谢性状相关的罕见编码变异,研究团队利用197,774名UKB 参与者的WES数据进行分析。经10种聚合测试,共鉴定出2,948个显著的基因-代谢物关联,涉及308个代谢性状、126个基因。其中,约93.87%关联信号不受附近常见变异影响,表明罕见变异对代谢性状具有独立作用。与既往研究对比,研究团队验证了91.94%的已知关联,并发现了46.24%新关联。
为探究血浆代谢组与疾病的相关性,研究团队分析了313种代谢性状与2,179种临床性状的遗传相关性,发现75,927对具有遗传重叠的代谢物-疾病关联;共定位分析进一步揭示了72,538对共享遗传决定因素的代谢物-疾病关联。接下来,通过双样本孟德尔随机化(MR)分析,最终鉴定出36个潜在因果关联,其中葡萄糖关联疾病最多(9种),乙酸盐次之(4种)。
值得注意的是,研究团队还识别出多个新关联,如乙酸盐水平与心房颤动/扑动风险呈负相关、异亮氨酸/亮氨酸比值与身高呈正相关,以及大粒径HDL中胆固醇/总脂质比例与缺血性心脏病风险呈负相关。
图5. 代谢物-疾病关联
综上所述,该研究依托超25万人的大规模样本,全面揭示了血浆代谢组的遗传架构,不仅验证了大量已知关联,还发现785个新型因果变异,并系统评估了罕见编码变异的作用。通过整合多组学数据和疾病遗传信息,该研究为代谢物在疾病机制中的潜在作用提供新见解,对推动代谢组学向临床转化具有重要意义。
参考文献:
Qiang, YX., Wang, YX., He, XY. et al. Genetic architecture of plasma metabolome in 254,825 individuals. Nat Commun 16, 8272 (2025). https://doi.org/10.1038/s41467-025-62126-w