Skip to content

Nat Commun | AFP阴性肝癌的转录因子哑铃图复现

生信文章解读 002

AFP 不高,不代表肝癌样本里没有线索。真正麻烦的是:线索换了一条路,你的图能不能把它讲出来。

这次我们复现的是一张 TF activity 相关性哑铃图。它不靠堆一屏热图取胜,而是把同一批转录因子放到两个分子信号上比较:一边是 AFP expression,另一边是 CYP gene signature。

TF 活性相关性哑铃图

读这张图时,别急着问哪个点最显著。先看方向:同一个 TF,在 AFP expression 这边往左,在 CYP signature 这边往右,这种“分叉”才是它最值得讲的地方。

这篇文章在研究什么?

论文来自 Nature Communications:

Androgen receptor promotes arachidonic acid metabolism and angiogenic microenvironment in AFP-negative hepatocellular carcinoma

文章关注的是 AFP-negative HCC。简单说,就是有些肝癌患者的 AFP 指标并不高,但肿瘤并不会因此变得“安静”。作者把注意力放到 androgen receptor、花生四烯酸代谢、血管生成微环境,以及一组和 CYP signature 相关的转录调控状态上。

这类文章最适合做复现教学。原因也很直接:图不复杂,但背后的数据整理、方向解释、图形表达和项目封装都很典型。学生跑完一次,后面遇到类似的 TF activity、pathway score、signature correlation 图,都知道怎么拆。

这张哑铃图为什么好用?

很多生信图的问题是信息太满。点、颜色、聚类、注释条全堆在一起,读者看半天也不知道作者到底想让他记住什么。

哑铃图反过来。它一行只讲一个对象。

  • 横轴是 correlation coefficient。
  • 蓝色点表示 TF activity 与 AFP expression 的相关性。
  • 玫红色点表示 TF activity 与 CYP gene signature 的相关性。
  • 中间灰线连接同一个 TF 的两个结果。
  • 实心点和空心点区分统计显著性。

这样一来,读者不用先背一堆方法名,也能看懂一个核心问题:这个转录因子到底更靠近 AFP 轴,还是更靠近 CYP/代谢轴?

这类图适合拿来做什么?

如果你手里有两组表型、两个 signature、两个临床分组,或者两个 pathway score,哑铃图都可以用。

比如:

  • TF activity vs 治疗敏感、耐药 signature;
  • pathway score vs 增殖、免疫浸润;
  • 细胞亚群比例 vs 炎症评分、纤维化评分;
  • gene module score vs 预后风险、药物反应;
  • 单细胞 cluster marker vs 两类临床分型。

它最适合回答的不是“谁最大”,而是“谁在两个方向之间拉开了差距”。

云平台这次复现了哪些内容?

我们不是把代码截个图放上来,也不是只给一段能跑的 R 脚本。完整复现包按项目方式整理,方便学生跟着学,也方便后面换成自己的数据。

text
my-rawdata/      原始材料与待整理数据
my-data/         清洗后的正式分析数据
demo-rawdata/    教学输入数据
demo-data/       教学整理结果
scripts/         可运行脚本
results/         结果图、PDF、视频
readme/          运行说明
conda-env/       可复用 conda 环境

这个结构看起来朴素,但真正做复现时很管用。因为学生最容易卡住的地方,往往不是 geom_point(),而是文件从哪里来、数据怎么变形、脚本怎么接输入、结果怎么检查。

数据会全部公开吗?

不会在文章里直接把完整表放出来。

这篇文章的重点是展示复现思路和成图效果。完整数据、整理脚本、conda 环境和项目包,会给真正需要复现的同学。

文章里只放一个字段预览,方便你判断这类图的数据长什么样:

text
TF      AFP_corr  AFP_sig          CYP_corr  CYP_sig
AR      -0.62     p < 0.05         0.74      p < 0.05
TEF     -0.50     p < 0.05         0.61      p < 0.05
...

如果你想拿完整复现包,或者想把自己的 TF 活性结果整理成同款图,加客服微信:

客服微信:15259811736

备注:TF哑铃图复现 / 生信文章解读002

视频里讲了什么?

这段视频把“文章图形到复现包”的过程压缩到一个紧凑版本里:看图、整理目录、准备环境、运行脚本、检查结果图。适合先快速过一遍流程,再决定要不要自己跟着跑。

视频直链:

点击查看 TF 哑铃图复现教学视频

复现时真正要学的三件事

第一,宽表转长表。

很多同学卡在这一步。原始结果通常是一行一个 TF,AFP 和 CYP 的相关系数分成不同列;但 ggplot 更喜欢一行一个点。表一旦转对,颜色、图例、标签都顺了。

第二,显著性不要抢戏。

显著性当然要标,但它不是这张图的主角。这张图真正要看的,是同一个 TF 在两类分子信号之间的方向差异。

第三,图形要服务解读。

交替行背景、0 参考线、标签位置、点的填充方式,这些都不是装饰。它们的作用是让读者少花力气读图,多花力气理解生物学。

为什么推荐在云平台上跑?

因为复现最烦人的部分,不是“这段代码是什么意思”,而是环境和路径。

R 包版本不一致,图会变;路径写死,脚本会断;数据放错目录,后面全乱。云平台把环境、脚本、数据和结果放在一个空间里,学生少折腾依赖,多关注分析本身。

这次复现已经整理好:

  • conda 环境;
  • demo 输入和整理后数据;
  • R 作图脚本;
  • PNG/PDF 结果图;
  • 运行说明;
  • 教学视频。

你可以直接照着跑,也可以把自己的相关性结果替换进去,让它变成你的论文图、汇报图或课程图。

适合哪些同学?

如果你只是想看一眼图,公开视频就够了。

如果你想真正复现,尤其是下面几类情况,建议直接拿完整包:

  • 想学习文章图形怎么拆成数据结构;
  • 想把 TF activity、pathway score、signature score 画成同款图;
  • 想要一个能复跑的 conda 项目模板;
  • 想把图做得更像汇报和论文里能用的版本;
  • 想让学生跟着云平台流程练一次完整复现。

完整复现资料和上机方式,加客服微信:

客服微信:15259811736

备注“生信文章解读002”,说明你想要 TF 哑铃图复现包。

最后说一句

这张图值得学,不是因为它有多难,而是因为它很会替数据说话。

AFP 阴性肝癌这类场景里,单看一个 marker 往往不够。把同一批 TF 放到两个分子信号上比较,方向一拉开,故事就出来了。

服务器地址:https://vip.r-py.com/