散点图怎么分析结果(小云解读生信图)
散点图怎么分析结果(小云解读生信图)(doi: 10.3389/fimmu.2022.872170)话不多说,先看图前面讲了火山图,阅读量反馈还不错,说明还是有很多朋友关注这个问题的下面可以继续给大家更新解读生信图这个系列喽!这次讲讲相关性分析散点图
尔云间 一个专门做科研的团队云生信学生物信息学 关注我们
做了生信分析,拿到一堆数据,看不懂图怎么办?
火山图、热图、散点图、箱式图、瀑布图···这么多类型的图都咋看?
风险模型预后评估图、GO-KEGG富集分析图、GSEA富集分析图···这些图又代表了什么结果?
前面讲了火山图,阅读量反馈还不错,说明还是有很多朋友关注这个问题的
下面可以继续给大家更新解读生信图这个系列喽!
这次讲讲相关性分析散点图
话不多说,先看图
(doi: 10.3389/fimmu.2022.872170)
1.散点图的用途是什么?
散点图是用两组数据构成多个坐标点,观察坐标点的分布,判断两者之间是否存在某种关联或总结坐标点的分布模式。从散点图上可以解读两个变量的相互关系,所以一般用于做相关性分析。
2. 什么是相关性分析呢?
对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度。通常用来分析两组或多组数据的变化趋势是否一致。
比如熬夜频率与脱发是否相关? 再比如,最近高温天气搞得人相当难受,那天气温度是否与碳排放量多少相关?临床上也需要分析两种疾病的相关性,比如新冠肺炎与心血管疾病的发生是否相关?相关性强弱如何?····这些问题都可以用相关性分析来解决,那么也可以用散点图的形式展现出来。
3. 相关性分析包括哪些内容?
- 变量间是否存在相关关系?
- 存在什么相关关系?线性 or 非线性?正相关 or 负相关?
- 相关性大小?强弱?
(图片来源于网络)
4. 相关性散点图怎么看?
1)坐标轴:x,y轴分别代表2个变量;
2)相关性判断:通过计算相关性系数判断相关性(主要是r值)
相关系数r是反映两个变量之间线性相关程度的指标(R2称为判定系数,用于评估回归模型系数拟合优度)
- r的取值范围是[-1 1]。
- 相关关系的方向:正相关,则r>0;负相关,则r<0
- 相关关系的强弱:
3)相关性系数的计算(前两种最常用)
Pearson系数:也叫线性相关系数,用于进行线性相关分析,是最常用的相关系数,当数据满足正态分布时会使用该系数。
Spearman系数:当数据不满足正态分布时,使用该系数。
Kendall系数:通常用于评分数据一致性水平研究(非关系研究)
4)显著性判断(p值)
P值是用来进行显著性检验的,用来检验变量之间是否有差异以及差异是否显著,P值<0.05,代表数据之间存在显著性的差异。
示例:从图中我们可以得到的信息如下
上图x,y轴就分别为LAG3和TRPV3的表达量;
相关性系数是通过Spearman系数来计算的;
r=0.287,P<0.001:说明LAG3和TRPV3的表达呈显著弱正相关关系;
再来几张不一样的
(ps:不一样的只是形式,解图的方法还是不变滴,万变不离其宗)
(这张显示的是强正相关关系,计算2种相关系数,还标出了回归曲线方程和R2数值,信息比较全面,doi: 10.1016/j.intimp.2020.106828)
(这张显示的就是负相关关系,doi: 10.3389/fimmu.2022.872170)
(这张显示的是非线性相关关系,doi: 10.1016/j.intimp.2020.106828)
(这种散点图就是来观察样本分布的,与上面展示相关性的散点图有很大差别,doi: 10.3389/fcell.2022.793425)
相关性分析散点图的解读有没有让生信小白们豁然开朗呀?还有问题的话欢迎给小云留言或私信哦!