Nat Genet | MASLD风险变异图谱

核心突破
文章摘要
研究背景:为什么 MASLD 风险变异难解释?
MASLD 是代谢相关脂肪性肝病,遗传学研究已经发现大量相关位点。但多数 GWAS 信号位于非编码区域,不直接改变蛋白序列,因此很难判断它们究竟通过 enhancer、promoter、转录因子结合还是染色质互作影响疾病。
更麻烦的是,肝脏不是单一细胞群。肝细胞、星状细胞、Kupffer 细胞、胆管细胞、内皮细胞和免疫细胞在 MASLD 进展中承担不同角色。同一个变异在 HepG2 里可能有活性,在星状细胞里可能完全是另一套调控逻辑。
所以,这篇文章的价值不只是找到几个 marker,而是把 GWAS、单细胞染色质、MPRA、高通量扰动和功能表型串起来,形成从风险位点到疾病机制的解释框架。
技术路线:从 GWAS 位点到功能变异
- 用人类肝脏 snATAC-seq 描绘正常与 MASLD 样本的细胞类型开放染色质图谱,并用 SCAVENGE/TRS 把 GWAS 风险信号投射到单细胞状态。
- 设计 5,369 个 MASLD 显著 SNP 及 LD SNP 的 MPRA 文库,在 HepG2 和 LX-2 细胞中测试参考/替代等位基因的调控活性差异。
- 用细胞类型特异性、PAOA/TGFβ 刺激条件和 TF motif disruption 分析,判断 DAV 的上下文依赖性。
- 整合 eQTL、Hi-C、co-accessibility、近端基因和 CROP-seq/CRISPRi,把 DAV 分配到候选靶基因和疾病相关通路。
- 围绕 ANGPTL3、APOA5、LPL、SLC22A3/LPA 等代表性轴进行功能验证,并用 DAV 构建 PRS 评估 MASLD 风险预测价值。
Figure 逐图解读
Figure 1:人类 MASLD 肝脏 snATAC 图谱与风险信号富集

Figure 2:MPRA 将 MASLD 风险位点筛成 DAV 候选集

Figure 3:DAV 的细胞类型特异性

Figure 4:刺激依赖的 DAV 活性

Figure 5:从 DAV 到靶基因和通路网络

Figure 6:APOA5、ANGPTL3 与 LPL 轴的脂质代谢功能验证

Figure 7:rs474513-SLC22A3/LPA 与 MASLD 风险预测

生信视角:这篇文章可以怎么学?
第一,非编码 GWAS 解释不能只做 nearest gene annotation。本文把近端基因、eQTL、Hi-C/co-accessibility、单细胞 CRISPRi 和功能读出放在一起,给 target gene assignment 做了多证据整合。
第二,单细胞组学不是只画 UMAP。snATAC 让风险变异进入细胞状态空间,MPRA 让候选变异进入实验筛选空间,CROP-seq 让靶基因进入扰动验证空间。
第三,细胞类型和刺激条件要作为模型变量。HepG2、LX-2、PAOA、TGFβ 的差异说明,疾病变异功能常常是 context-dependent,而不是在任意细胞里都能被复现。
研究意义与局限
代码和数据
- 论文 DOI:10.1038/s41588-026-02617-8
- 本研究产生数据:GSE281367、GSE281364、GSE281160
- 公开数据来源:GSE189600、GSE244832、GSE86189;ENCODE Hi-C/ChIA-PET;ROADMAP E066/E118;GWAS Catalog;GTEx v8
- 代码说明:论文说明分析使用公开软件包和 Methods 中列出的流程,未提供单独自定义代码仓库
一句话收束
这篇文章真正值得学的,不只是某几个 MASLD 位点,而是它把“遗传关联、细胞状态、调控元件、靶基因、扰动验证、风险预测”连成了一条可以复用的复杂疾病非编码变异解释路线。
服务器与学习交流
开放 4 个共享服务器节点,适合上手跑生信流程。单细胞、转录组、空间组学等环境会逐步整理。账号和存储相互独立,分析完请及时清空导出。
服务器地址:https://vip.r-py.com/

| 群聊二维码:生信学习001 | 客服微信:water-star0818 |
|---|---|
![]() | ![]() |

