如何在geo数据库找到合适数据:一图介绍GEO数据库
如何在geo数据库找到合适数据:一图介绍GEO数据库扬帆起航正当时踌躇满志无限期作者已经整理好的数据下载,可通过GEOquery包直接得到表达矩阵,GSE号下载数据为seires Matrix File文件,含有整理好的表达矩阵、样品信息等,GDS号数据下载数据为soft文件,数据下载之后有时需要标准化,如log2变换。探针注释文件含有genelD和探针直接的对应关系,最好不要通过R包下载探针注释文件,下载结果有时候不完全,所以还是去GEO官网下载注释文件,原始芯片数据一样可以通过GEOquery包getGEOSuppFiles()函数下载,筛选CEL结尾的文件 AffyBatch类,用于存储探针水平数据。需要标准化.科研路其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。
GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。关键是这个数据是免费的!
NCBI Gene Expression Omnibus(GEO)作为各种高通量实验数据的公共存储库。这些数据包括基于单通道和双通道微阵列的实验,检测mRNA,基因组DNA和蛋白质丰度,以及非阵列技术,如基因表达系列分析(SAGE),质谱蛋白质组学数据和高通量测序数据。
在GEO最基本的组织层面,有四种基本实体类型。前三个(样本,平台和系列)由用户提供; 第四,数据集由GEO工作人员根据用户提交的数据进行编译和策划。
检索界面,网址:http://www.ncbi.nlm.nih.gov/geo
总结
作者已经整理好的数据下载,可通过GEOquery包直接得到表达矩阵,GSE号下载数据为seires Matrix File文件,含有整理好的表达矩阵、样品信息等,GDS号数据下载数据为soft文件,数据下载之后有时需要标准化,如log2变换。
探针注释文件含有genelD和探针直接的对应关系,最好不要通过R包下载探针注释文件,下载结果有时候不完全,所以还是去GEO官网下载注释文件,原始芯片数据一样可以通过GEOquery包getGEOSuppFiles()函数下载,筛选CEL结尾的文件 AffyBatch类,用于存储探针水平数据。需要标准化.
科研路其修远兮,吾将上下而求索,有烦恼苦闷或者有趣好玩的事情记得告诉小助理,希望陪伴您一起成长。
踌躇满志无限期
扬帆起航正当时
科研小助理为您在线解答