ppi网络图构建(PPI图绘制全网最全最细教程)
ppi网络图构建(PPI图绘制全网最全最细教程)Proteins whose genes are observed to be correlated in expression across a large number of experiments. 在大量实验中观察到其基因表达相关的蛋白质。Gene families whose occurrence patterns across genomes show similarities. 跨基因组的共现模式表现出相似性的基因家族。Automated unsupervised textmining - searching for proteins that are frequently mentioned together. 自动的、无监督的文本挖掘--搜索经常在一起有关的蛋白质。Groups of genes that are frequently observed in each
背景介绍String数据库是一个可以用来检索已知蛋白和预测蛋白之间相互作用的数据库。除了可以对这些蛋白生成精美的蛋白质-蛋白质-互相作用(PPI)图,还提供了输入蛋白的的分析,包括常见的功能富集分析(GO、KEGG),参考出版物等。
String数据库主要包含以下功能:- Network
Summary view: shows current interactions. Nodes can be moved; popups provide information on nodes & edges. 摘要视图:显示当前的交互。节点可以被移除;弹出窗口提供关于节点和边缘的信息。
- Experiments
Co-purification co-crystallization Yeast2Hybrid Genetic Interactions etc ... as imported from primary sources. 共纯化、共结晶、酵母2杂交、遗传互作等...作为主要来源。
- Databases
Known metabolic pathways protein complexes signal transduction pathways etc ... from curated databases. 已知的代谢途径、蛋白质复合物、信号转导通路等... 来自精选的数据库。
- Textmining
Automated unsupervised textmining - searching for proteins that are frequently mentioned together. 自动的、无监督的文本挖掘--搜索经常在一起有关的蛋白质。
- Neighborhood
Groups of genes that are frequently observed in each other's genomic neighborhood. 在彼此的基因组邻域中经常观察到的基因组。
- Fusion
Genes that are sometimes fused into single open reading frames. 有时融合成单个开放阅读框的基因。
- Cooccurence
Gene families whose occurrence patterns across genomes show similarities. 跨基因组的共现模式表现出相似性的基因家族。
- Coexpression
Proteins whose genes are observed to be correlated in expression across a large number of experiments. 在大量实验中观察到其基因表达相关的蛋白质。
网址介绍[网址名称]:STRING
[网址链接]:https://www.string-db.org/
网站的数据也是可以下载的,点击Download,网站所有的后台数据,包括蛋白互作数据,蛋白附件数据,完整的数据库存储。
当然,你也可以下载某一物种的,如人类,输入物种名称,点击UPDATE,即可出现相应的数据,点击即可下载。
这里以多个差异基因的分析进行示例
1.将相应的基因直接复制在框中,选择物种名称,点击SEARCH(想试试的,可以直接点击#1 #2 #3 的例子)
2.点击继续
3.网络图出现,当前默认展示的是Network
4.点击Legend,即可发现PPI网络中的信息
- Node Color:即查询蛋白和相关蛋白,然后对蛋白根据Score进行颜色映射,因此图中就出现了花花绿绿的蛋白
- Node Content:即空的未知3D结构的蛋白和已知蛋白
- Known Interactions:即来自数据库或者实验中的数据
- Predicted Interactions:即基因邻接,基因融合,基因共现
- Others:即文本挖掘,共表达,蛋白同源性
- Your Input:这里面就是你输入进去的基因
5.点击Settings,这里我们只对常用的进行解释
- meaning of network edges:即可以将图中的连线更改为证据型还是按照数据支持的强度型
- minimum required interaction score:可以通过调整数据,对网络进行筛选,数值越大,节点越少
- network display mode:即将网络作为不能更改的位图展示,还是作为可以更改挪动的矢量图展示
- network display options:一般我们会选择将离散的点进行去除,所以选择第二个
6.然后我们的蛋白网络就变成这样了,你也可以自己点击挪动即可
7.点击Analysis,可以发现对PPI图的一个总结和分析
- Network Stats:图中节点的所有信息
- GO分析:生物过程,分子功能,细胞组分
- 参考出版物:数据库中类似研究的文献
- KEGG通路
- 反应途径
- 维基通路
- 亚细胞定位
- 注释关键字(UniProt)
8.这些分析结果,在本页下方提供了下载,方便其他应用
9.关于PPI网络图的下载,可以点击as a vector graphic,然后图形就作为一个svg格式进行下载了,通过AI打开,进行编辑,或者直接另存为TIF格式图片应用于文章中。
10.网络中数据的下载,可以点击as short tabular text output,下载下来直接使用记事本打开,也可以用这些数据,通过一些其他软件如Cytoscape进行一个重新作图。
11.Clusters,一般是默认为不聚类的。
12.如果需要对图中的节点进行聚类分析,可以点击kmeans clustering进行聚类
13.结果就如图所示,每一种颜色代表一个聚类
14.下方或出现聚类的标志和个数,以及对应的蛋白名称
15.下方提供了聚类网络的数据库下载
16.点击一个聚类进去,可以发现该聚类的所有信息,包括PPI图
17.以及对应的网络节点分析信息
18.点击More或者Less可以显示更多或者更少的蛋白节点信息
19.我们返回一开始,点击Experiments,可以发现蛋白相关的实验
20.这里提供了跟你需要的物种相关的信息,以及相关的其他物种信息
21.点击Databases,可以发现相关的通路信息
22.点击进去,我们还可以发现我们输入的蛋白,以及该通路上的其他蛋白
23.点击文本挖掘,可以发现跟这些蛋白相关的一些文献信息
24.点击进去之后,我们也可以发现文献的信息,以及相应的蛋白出现的位置
到这里就结束了,其他内容,留给大家自己探索!