meta分析发sci流程:最新2区临床预测模型SCI
meta分析发sci流程:最新2区临床预测模型SCI仙桃学术 www.xiantao.loveGEPIA数据库 gepia.cancer-pku.cnTIMER数据库 cistrome.shinyapps.io/timer复现工具全文共有6个图和2个表,让我们一起来看一看这篇文章中每个图表都做了哪些内容吧。复现内容图1A:SYT16在胶质瘤的肿瘤组织和正常组织中的表达水平图1B:GEPIA数据库中,SYT16表达对于胶质瘤生存的影响图2:TCGA数据中,SYT16在肿瘤不同分化级别间存在表达差异表1:SYT16及临床病理参数的单因素和多因素Cox分析图3:SYT1及与年龄、性别、肿瘤分化的多因素Cox分析图4:在22种免疫细胞中,SYT16高低表达间免疫细胞浸润差异图5A:TIMER数据库中,SYT16表达与免疫细胞浸润的相关性分析图5B:免疫细胞浸润和SYT16表达脑低级别胶质瘤的预后相关性表2、图6:GSEA富集分析结果
从小白的角度,一刻钟复现生信套路。
更多生信干货教程
私信我回复“数据库”即可免费领取哦
各位小伙伴大家好,今天给大家带来的是一篇2020年发表在International immunopharmacology(影响因子:3.943)的单基因生信文章套路。
全文共有6个图和2个表,让我们一起来看一看这篇文章中每个图表都做了哪些内容吧。
复现内容
图1A:SYT16在胶质瘤的肿瘤组织和正常组织中的表达水平
图1B:GEPIA数据库中,SYT16表达对于胶质瘤生存的影响
图2:TCGA数据中,SYT16在肿瘤不同分化级别间存在表达差异
表1:SYT16及临床病理参数的单因素和多因素Cox分析
图3:SYT1及与年龄、性别、肿瘤分化的多因素Cox分析
图4:在22种免疫细胞中,SYT16高低表达间免疫细胞浸润差异
图5A:TIMER数据库中,SYT16表达与免疫细胞浸润的相关性分析
图5B:免疫细胞浸润和SYT16表达脑低级别胶质瘤的预后相关性
表2、图6:GSEA富集分析结果
复现工具
仙桃学术 www.xiantao.love
GEPIA数据库 gepia.cancer-pku.cnTIMER数据库 cistrome.shinyapps.io/timer
复现步骤
- 图1A:SYT16在胶质瘤的肿瘤组织和正常组织中的表达水平
- 图1B:GEPIA数据库中,SYT16表达对于胶质瘤生存的影响
这两张图作者都是用GEPIA数据库完成的,让我们来看一下具体的操作方法。
GEPIA数据库复现
登入GEPIA数据库:http://gepia.cancer-pku.cn/index.html
点击“Boxplots”进入单基因表达差异分析。
在“Gene”处输入我们的分子“SYT16”——选择肿瘤名称“LGG”,点击“ADD”——点击“Plot”等待出图。
可以看到和Fig1A一样的结果啦,点击右上角的下载按钮即可保存图片。
接下来我们来看一下生存分析。
选择“Survival”模块——在“Gene”处输入我们的分子“SYT16”——选择肿瘤名称“LGG”,点击“ADD”——点击“Plot”等待出图。
结果出来啦~
但是,仔细看一下,这张图是不是和我们的Fig1B有一点点的不一样?
是的,在我们所复现的这篇文章里,没有加入生存曲线的置信区间,那我们要如何调整呢?
只需要回到刚刚的界面,在下图中所示位置选“No”,就可以啦。
仙桃学术生信工具复现
想要做单基因基因在肿瘤中的表达差异和生存曲线,其实还有另一种方法,就是我们的仙桃学术生信工具!
进入仙桃生信工具(https://www.xiantao.love/products),选择高级版(由于高级版功能最为全面,这里统一使用高级版作为示范)
选择“表达差异(挑)”——“表达差异”——“非配对样本”,在疾病种类处选择“脑低级别胶质瘤”,在分子处输入我们本篇文章的分子“SYT16”,点击确认,就可以等待出图啦。
注:因为有些癌种中正常样本数比较少,比如我们本文分析中所应用的脑低级别胶质瘤,我们选择用GTEx数据库的正常样本补足。因此我们在这里选择XENA-TCGA-GTEx泛癌数据进行分析。
在这个结果中,我们可以看到这个结果和GEPIA分析的结果并不一致。当然造成这种情况的原因有很多,设置的参数、选择的样本数、数据格式等等,都会影响复现的结果,在这里我们只需要学会如何做这张图就好啦。
点击“保存结果”将结果保存,虽然这张图没啥意义,但是在后面我会以这张图为示范讲解一下如何利用我们的仙桃工具完成拼图。
下面我们来看一下生存分析:
选择【“临床意义(靠)”——“预后分析”——“KM曲线”模块】,在疾病中选择【“脑低级别胶质瘤”——选择数据格式“TPM”——输入分子“SYT16”】,最后点击确认。
注:此处我们选择TPM格式的数据进行复现是因为文章中的生存曲线右上角有标明是用TPM格式数据进行分析,为了保证复现的还原度,此处我们也选择TPM格式的数据。
点击“保存结果”即可将结果保存,可用于后续拼图。
下面来看一下我们的拼图功能。
在页面上方点击进入“拼图工具”模块,可以看到左侧有我们刚刚保存的图片。
将图片直接拖入画板中,调整图片位置,进行对齐。当开启吸附对齐时,两张图片靠近时会直接自动吸附对齐,省去了我们一点点对齐的麻烦。
拼好之后,点击界面下方的“PDF下载”,就可以看到拼好的图片了,还贴心地加好了字母标注~
那如果是我们自己的图片可以用仙桃工具的拼图功能吗?
也是可以的哟~
在【“基础绘图”——“上传图片”模块】中,点击箭头所指的位置即可选择图片上传,上传后同样点击“保存结果”选项,这张图片就会出现在我们的拼图工具左侧栏啦,大家可以自己试一试呀~
- 图2:TCGA数据中,SYT16在肿瘤不同分化级别间存在表达差异。
这个图是作者应用R进行数据分析处理后得到的结果,不过不会R语言也没有关系,我们的生信工具一样可以完成这张图的复现。
选择【“临床意义”——“临床相关性”模块】,选择疾病“脑低级别胶质瘤”,选择数据格式“FPKM”,输入分子“SYT16”,在临床参数位置选择“grade”——分组选择“G2”VS“G3”,点击确认。
就得到我们的Fig2啦。
- 表1:SYT16及临床病理参数的单因素和多因素Cox分析
单因素/多因素Cox分析是生信文章中常用的评价单基因或预后模型及病理学参数与肿瘤预后(如OS)之间关系的方法,在R语言中可以通过survival包实现这一分析。不过,我们的仙桃工具也可以通过点点点实现。
选择【“临床意义”——“预后分析”——“单因素/多因素Cox”模块】,选择疾病“脑低级别胶质瘤”,选择数据格式“FPKM”,分别选择参数“Grade”、“Gender”、“Age”以及分子“SYT16”(如果想增加参数或删减参数的话可以点击右侧的 /-按钮)——分别设置分组,点击确认。
结果提供了Excel、CSV和Word三线表几种保存方法,点击即可下载。
在这里,我们下载CSV格式用于后续完成森林图绘制。
详细的方法学和统计学描述仙桃工具也有提供哟,结果界面下拉就能找到,供大家学习。
- 图3:SYT1及与年龄、性别、肿瘤分化的多因素Cox分析
相对于表格来说,图片总是更容易抓住我们的眼球,所以作者在提供表格之外,还将多因素Cox回归分析的结果绘制成森林图。
那让我们看一下用仙桃工具绘制森林图的详细步骤吧。
选择“基础绘图”——“森林图”模块,在很多模块中都提供了上传数据之后即可进行分析的功能,如果不清楚需要上传什么格式的数据,我们可以先点击
“下载示例数据”看一下。
下载后我们可以看到示例数据是这样的:
以单因素Cox回归的结果为例,整理之后的结果如图所示:
在“森林图”模块中,点击上传位置,即可上传整理好的文件(xlsx、csv、txt格式均可),上传成功后可以看到文件名显示在下方。调整图片的宽度(当然,这一步可以等出图之后再根据图片显示的结果进行调整),最后点击确认。
点击查看大图即可看到完整结果:
这样一张好看的森林图就完成啦。
- 图4:在22种免疫细胞中,SYT16高低表达间免疫细胞浸润差异
作者用CIBERSORT分析了当SYT16高表达及低表达分组时,22种免疫细胞在两组间的差异。我们来看一下如何用仙桃工具进行这一步分析。
进入【“交互网络(联)”——“免疫浸润”——“分组比较图”模块】,选择疾病“脑低级别胶质瘤”,选择数据格式“FPKM”,在参数中选择图片类型“小提琴图”——输入分子“SYT16”,在算法参数的细胞中勾选所有细胞,点击确认。
结果的图片都堆叠在一起了,X轴也看不清,那我们如何调整呢?
在参数设置的“风格”位置,设置“X轴文本翻转角度”为“30”;在“图片”设置里,调整图片长度。
这次的结果就好看多了是不是?
点击查看大图可以看到完整图片:
需要特殊说明的是,我们工具中目前免疫浸润分析的算法是ssGSEA的算法,而文章中使用的是CIBERSORT,所以得到的结果会有所不同,但是所表达的含义是一样的。所谓白猫黑猫,能抓到耗子就是好猫,何必纠结于是白色的还是黑色的猫呢?
关于免疫浸润的更多算法,大家呼声高的话,也是可以让工程师小哥哥们安排上滴~
- 图5A:TIMER数据库中,SYT16表达与免疫细胞浸润的相关性分析
- 图5B:免疫细胞浸润和SYT16表达脑低级别胶质瘤的预后相关性。
TIMER数据库是生信免疫浸润分析中最常用的数据库之一了,如果你有一直关注我们的复现系列的话,应该已经对这个数据库非常熟悉了。如果没有的话,也不要紧,我们来一起看一下这张图片如何用TIMER数据库进行复现。
TIMER数据库复现
登入TIMER数据库:https://cistrome.shinyapps.io/timer/
免疫细胞相关性分析:
登入数据库后,选择“Gene”模块,在Gene Symbol处输入分子“SYT16”,在Cancer Type处选择肿瘤类型“LGG”脑低级别胶质瘤,点击提交后,即可得到图5A的结果。
下载PDF格式文件可用于后续拼图。
我们复现得到的图片和原文也有细微的差别,可能是由于Timer数据库也是在动态更新的,还是之前的那句话,我们掌握方法更重要。
生存分析:
选择“Survival”模块——在Cancer Type处选择肿瘤类型“LGG” 脑低级别胶质瘤——在Gene Symbol处输入分子“SYT16”,点击提交后,即可得到图5B的结果。
仙桃学术生信工具复现
我们仙桃学术的生信工具也提供了单基因与免疫细胞浸润相关的分析。
选择【“交互网络(联)”——“免疫浸润”——“棒棒糖图”】。在疾病处选择“脑低级别胶质瘤”——选择数据格式FPKM——输入分子“SYT16”——点击确认,等待出图。
在结果界面下拉可以看到关于数据来源和算法的详细说明,我们就不多赘述啦。
而对于相关性显著的免疫细胞,工具也提供了用散点图进一步展示的方式。
以相关性较强的巨噬细胞为例,我们来一起看一下。
选择“散点图”模块——在疾病处选择“脑低级别胶质瘤”——选择数据格式FPKM——输入分子“SYT16”——在算法参数处选择细胞“Macrophages”——点击确认,就得到可以直接用于发表级别的散点图啦。
不要忘记点击“保存结果”呀。
- 表2、图6:GSEA富集分析结果
表2和图6这一图一表展示的内容基本是一致的,即作者分别用图和表两种方式展现了GSEA富集的结果。
我们分成三步进行复现:
第一步:SYT16的差异基因分析
进入“表达差异(挑)”——“差异分析”——“单基因差异分析”模块,在疾病处选择“脑低级别胶质瘤”——选择数据格式FPKM——输入分子“SYT16”,点击确认。
点击确认之后,后台会进行分析,可以在“历史记录”里查看分析进程,一般几分钟即可完成,完成后可以下载差异分子列表。
第二步:GSEA富集分析
将我们在上一步中得到的差异分子列表,整理为“gene_name”一列,“logFC”一列的结果:
在【“功能聚类(圈)”——“GSEA富集”——“GSEA分析”模块】,上传我们整理之后的文件,选择数据集及物种:数据集我们一般选择默认即可,如果有特殊需要也可以选择其它数据集,然后点击确认。
在“历史记录”中状态重“执行中”变为“完成”时即可下载GSEA结果。
保存结果可用于后续进行可视化,也可以选择其它格式直接以表格形式输出。
第三步:GSEA富集分析可视化
进入“GSEA可视化”模块,可以看到我们刚刚保存的分析结果。在右侧参数的基因集ID里会自动展现富集得到的前两条通路,也可以选择自己感兴趣的通路。
我们在基因集ID中,输入我们刚刚富集结果的前五条通路:
REACTOME_GPCR_LIGAND_BINDING
REACTOME_NEURONAL_SYSTEM
REACTOME_G_ALPHA_I_SIGNALLING_EVENTS
REACTOME_CLASS_A_1_RHODOPSIN_LIKE_RECEPTORS_
KEGG_NEUROACTIVE_LIGAND_RECEPTOR_INTERACTION
点击确认后,即可得到结果:
相比于这样在一张图中展示多条通路,其实我们更建议大家将每条通路分别展示:
例如,我们在基因集ID中,只输入REACTOME_GPCR_LIGAND_BINDING这一条通路,点击确认后结果如下:
可以看到只输入一条通路时,还可以展示NES和FDR值,这样也更加清楚明了。如果有很多想展示的富集结果,就保存结果再进行拼图即可。
这篇单基因套路的复现就到这里就完成了,原文中大部分内容都是用R语言完成的,不过我们优秀的仙桃工具也可以无代码完成,省去学代码的时间,我们好好学习一下生信文章套路。
最后,预祝一起学习的大家的下一篇SCI都在路上啦~