从哪里找基因序列(如何查找基因序列信息)
从哪里找基因序列(如何查找基因序列信息)3.点击后进入以下页面,通过UCSC数据库可以查询该基因的基因组信息,蛋白质数据库UniprotKB相关信息,该基因在不同组织表达的RNA-seq数据,基因芯片数据,蛋白质功能域以及结构,GO富集分析等等内容2.点击GO之后出现以下界面,点击黑色标注的BCL22. 点击NM_000633.2,可以查询基因编码区CDS、以及外显子exon等。应用小故事(1):比如,近年来异常火爆的cas9技术,是在DNA的水平进行编辑。在验证cas9对基因效率时,一般将突变型与野生型的基因序列交给测序公司,通过分析测序结果判断基因是否发生突变。而为了实现DNA的水平的突变,在进行设计时就会在mRNA序列中的mRNA序列的外显子上进行设计引物,为什么是外显子呢?因为内含子在翻译过程中被剪切,即便发生序列发生改变,功能也不会改变。1.打开UCSC主页,选择物种,输入基因名称
查找基因信息,好多网站都可以做到。一般常用的经典基因数据库有NCBI、 UCSC。下面我们就以BCL2为例看一下如何在这两个数据库查找基因信息,比如最常查询DNA序列、mRNA序列以及启动子序列、UTR序列甚至蛋白质序列。
一.DNA序列1.打开NCBI中Gene选项,输入BCL2后,点击search
2. 首先寻找基因DNA序列,如图所示,可以看到基因在染色体定位
1.在mRNA and protein一栏中,可以看到BCl2基因有两个转录本NM_000633.2和NM_000633.2
2. 点击NM_000633.2,可以查询基因编码区CDS、以及外显子exon等。
应用小故事(1):比如,近年来异常火爆的cas9技术,是在DNA的水平进行编辑。在验证cas9对基因效率时,一般将突变型与野生型的基因序列交给测序公司,通过分析测序结果判断基因是否发生突变。而为了实现DNA的水平的突变,在进行设计时就会在mRNA序列中的mRNA序列的外显子上进行设计引物,为什么是外显子呢?因为内含子在翻译过程中被剪切,即便发生序列发生改变,功能也不会改变。
三.启动子序列、UTR序列、蛋白序列1.打开UCSC主页,选择物种,输入基因名称
2.点击GO之后出现以下界面,点击黑色标注的BCL2
3.点击后进入以下页面,通过UCSC数据库可以查询该基因的基因组信息,蛋白质数据库UniprotKB相关信息,该基因在不同组织表达的RNA-seq数据,基因芯片数据,蛋白质功能域以及结构,GO富集分析等等内容
(1)根据查询目的 比如查询基因启动子、UTR、CDS区,点击Genomic sequence
(2)根据需求选择需要查询的内容,同时可以设置UTR、CDS区等,搜索结果会以大小写形式区分。转录起始位点前面是基因的调控区,启动子区没有明显的位置定义,大家也只是猜测它的大体位置,比如你要研究 promoter 区,建议选择转录起始位点前的2000个碱基进行研究。当然如果觉得长度太长,也可以只研究-1000 到0 这一千个碱基,一般情况下,启动子区的变异都在这个区域内
应用小故事(2):在mircroRNA的研究中,最关键的一步是验证mircroRNA与靶基因是否具有调控关系。可以通过将目的基因3’UTR区域构建至载体中报告基因luciferase的后面, 通过比较过表达或者干扰miRNA后,监测萤光素酶的活性变化而验证报告基因表达的改变。
(3)如果想要查寻蛋白序列,点击protein即可得到
当然,如果不满足于获得蛋白质序列,还可以看看蛋白质功能域与3D结构。
最后,不管是Pubmed还是UCSC数据库 数据库功能都非常强悍,而且数据库会链接到不同的数据库(Uniport GO MGI等等),让搜索变得更简单。所以需要我们不断地学习与探索......
【医学方】来自于“医学人”,始终致力于服务“医学人”,将最前沿、最有价值的临床、科研原创文章推送给各位临床医师、科研人员,关注【医学方】头条号,更多临床和科研相关的实用培训课程等着你哦~
【医学方】已推出【医学统计学精品公益课程】、【医学方R语言快速入门与数据清洗】、【R语言可视化及作图】、【GEO|TCGA|Oncomine数据挖掘教程】等视频教程。可登陆网易云课堂,搜索“医学方”查询