趋势图教程(做了分析拿到数据)
趋势图教程(做了分析拿到数据)话不多说,先看图给自己立个flag:豁出去小云的这头秀发,也要给同为生信小白的朋友讲清楚风险模型预后评估图、GO-KEGG富集分析图、GSEA富集分析图···这些图又代表了什么结果?别急,别急!【小云解读生信图】上线,专门解决这些问题咱们一个一个来,由易入难,今天就先讲讲火山图怎么看,代表的是什么结果
尔云间 一个专门做科研的团队原创 eryun 云生信学生物信息学
原创不易/ 请关注和转发支持我们
做了生信分析,拿到一堆数据,看不懂图怎么办?
火山图、PCA图、热图、箱式图、瀑布图···这么多类型的图都咋看?
风险模型预后评估图、GO-KEGG富集分析图、GSEA富集分析图···这些图又代表了什么结果?
别急,别急!【小云解读生信图】上线,专门解决这些问题
咱们一个一个来,由易入难,今天就先讲讲火山图怎么看,代表的是什么结果
给自己立个flag:豁出去小云的这头秀发,也要给同为生信小白的朋友讲清楚
话不多说,先看图
1. 火山图的用途是什么?
主要是展示差异表达的基因,通常应用于转录组研究,也能应用于基因组,蛋白质组,代谢组等统计数据。
2. 火山图怎么看?
1)坐标轴:横轴是log2(Fold change),显示差异倍数(FC),点越偏离中心,表示差异倍数越大;纵轴是-log 10 (adj. p-value),显示显著性,点越靠图的顶部,表示差异越显著;
2)点:图中每个点代表一个检测到的基因(或蛋白、代谢物等),图中这些点分别具有不同颜色,颜色的意义可以参考图片右侧的图例:
UP:差异显著且上调的基因
DOWN:差异显著且下调的基因
NOT:差异不显著的基因
3)差异基因筛选阈值设置:根据差异倍数(fold change)和显著性(P-value)设定差异基因的筛选阈值
p-value:表示某个基因在分组之间的表达是否差异显著,一般认为p-value<0.05为显著。adjusted p-value:即经过统计学方法校正后的p-value,由于统计学上常用的校正方法包括“BH”、“FDR”等,所以在一些文章中,我们也会看到筛选差异基因的阈值是FDR<0.05。p值越小差异越显著,但直接用adjusted p-value画图的话点会集中在底部不美观,而-log 10 (adjusted p-value)转换后正好是反了过来,数值越大越显著,而且以10为底很容易换算回去,做出的图比较美观。
Fold Change:表示两个分组之间的差异倍数,其绝对值越大说明某基因在两组之间的表达差异也越大。该值为正时,表示差异上调;该值为负时,表示差异下调。画图时,一般转换为log2FoldChange,使展示更直观。
示例:我们按示例图中将“adjusted p-value<0.05”且“log2FoldChange的绝对值大于1”设置为差异基因筛选阈值,那么:
-log 10 (adj. p-value) > 1.30且log2FoldChange > 1的基因为红色点,即UP;
-log10 (adj. p-value) >1.30且log2FoldChange < -1的基因为蓝色点,即DOWN;
-log 10 (adj. p-value) <1.30的基因为黑色点,即NOT。
再来几张不一样的
(ps:不一样的只是形式,代表的结果还是不变滴,万变不离其宗)
火山图的解读有没有让生信小白们豁然开朗呀?还有问题的话欢迎私信哦!