基因功能研究套路(基因功能研究的那些套路你知道多少)
基因功能研究套路(基因功能研究的那些套路你知道多少)1、应用生物信息学分析软件或数据库进行结构和功能的预测5、基因编码产物相互作用蛋白的研究2、基因的体内表达规律分析;3、亚细胞定位分析;4、转基因研究;
时隔一期,伯小远带着基因功能研究的干货又和大家见面啦!咱们话不多说,直入主题吧!
在上一期的文章中,伯小远对基因的结构进行了分析,在对基因的结构有所了解之后,咱们再来讨论基因的功能如何研究会更容易理解哦!
基因功能的研究策略主要包括:
1、应用生物信息学分析软件或数据库进行结构和功能的预测;
2、基因的体内表达规律分析;
3、亚细胞定位分析;
4、转基因研究;
5、基因编码产物相互作用蛋白的研究
1、应用生物信息学分析软件或数据库进行结构和功能的预测
在对基因功能进行实验学验证之前,研究者可先对基因功能进行合理预测,再根据预测的结果,进而制定出适合的实验室研究方案,从而避免研究的盲目性,节约研究成本。那该怎么预测呢?
生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
目前,生物信息学分析已成为新基因功能研究首选和必用方法,其具有方便快捷和经济等优点。研究者往往可以从中得到与新基因功能有关的重要信息,初步推测基因的可能功能,进而制定出进一步的实验室研究方案。
研究者在最开始时往往会获得基因序列信息,可首先进行序列同源性分析,包括核苷酸序列同源性分析和氨基酸序列同源性分析,这是目前生物信息学技术中应用最为广泛的基本技术之一。序列同源性分析主要采用序列分析比较工具,如BLASTn和BLASTx,将一段结构和功能未知的新DNA片段与GenBank数据库中结构或功能已知的序列进行比对,根据这些已知基因的功能信息来初步推测新基因的功能,从而建立基因序列结构和功能的关系。
图1 生物信息学应用于蛋白质相互作用
2、基因的体内表达规律分析
基因表达的时空性是指基因的表达在个体发育的不同阶段以及在个体的不同组织和细胞类型中均不相同,是有机体发育、分化、衰老等生命现象的分子基础。
基因表达的时空性特征为基因功能的研究提供了重要的信息:如果基因在某一特定的正常组织细胞中的表达水平较高,则往往表示其在维持正常生理状态中发挥着重要的作用;而如果基因在相应的突变体中表达异常,则提示其可能与该突变过程的发生、发展有关。因此,在研究一个基因的功能前,首先要在mRNA和蛋白质两个水平上对基因的时空表达谱进行分析,即看其在各种不同的正常或突变体中是否表达以及表达水平的高低等,从而摸清基因在体内的表达规律。
图2 利用强启动子过表达单个TFs LEAFY COTYLEDON2 [LEC2] 和 AtMYB23分别促使胚和毛状体异位形成
mRNA水平的表达谱分析
在mRNA水平上进行的基因表达谱分析实际上就是进行转录组研究。细胞的转录表达水平能精确而特异地反映其类型、发育阶段以及反应状态。
经典的mRNA水平的表达谱分析方法有Northern Blotting、原位杂交及RT-PCR等。Northern Blotting是一种在mRNA水平上对基因表达进行分析的经典技术,它可以特异性的定量检测基因的表达水平,还能检测出基因转录本的大小与类型。但是,Northern Blotting的检测效率和灵敏度不高,无法检测出较低的基因表达量,而且操作过程也较为繁琐,还带有放射性物质。这将造成环境污染,危害人类健康。
原位杂交技术不仅可以检测mRNA在特定生物体或组织、细胞中的具体表达位置,并能对待测核酸分子进行定性、定量及定位分析,因此被各实验室广泛采用。
RT-PCR主要包括半定量RT-PCR、实时定量RT-PCR和竞争性定量RT-PCR。半定量RT-PCR操作简便,经济快捷,但精确度不高,无法进行绝对定量,因此多用于基因表达水平的快速初步分析;实时定量RT-PCR特异性更强,有效地解决了PCR污染的问题,且自动化程度高,因此被广泛应用,不足之处是其成本相对较高;竞争性RT-PCR则是将特异性目的序列与已知浓度的内标RNA同时进行扩增,通过比较目的模板所产生的信号和内标产生的信号,从而确定目的模板的相对水平。
图3 在高磷和低磷条件下,GmSPX基因在不同部位的表达水平
蛋白质水平的表达谱分析
很多研究指出,细胞内特定基因的mRNA水平变化和蛋白质水平变化的一致性很差,即便知道了全部基因的表达情况,也不能反映基因功能的体现者和行使者——蛋白质的实际合成情况,因此难以阐明基因的实际功能。因此基因组计划开始转向了蛋白质终产物的表达情况研究。这种在蛋白质水平上的表达分析最常用的技术是Western Blotting和免疫组化。
Western Blotting与前述的Nortern Blotting类似,不仅可以进行定量分析,而且还可以检测蛋白质的分子量大小及聚体形式。免疫组化技术则能够准确地检测蛋白质在特定生物体或组织、细胞中的具体表达位置,是研究蛋白质定位、定量的重要方法,并且特异性强,灵敏度高。
图4 VRN2-FLAG、FIE-HA、VIN3-HA蛋白表达随时间变化
3、亚细胞定位分析
一般情况下我们在对基因的功能进行预测之后,对于该基因的亚细胞定位也会做一个预测,由于亚细胞定位能较快拿到实验结果,所以会首先做一个亚细胞定位分析,根据实验结果,一方面可以验证预测是否正确,另一方面可以帮助我们分析其可能的功能。了解蛋白的亚细胞定位对于研究基因的功能、蛋白互作及其作用机理是必要的。
目前比较常用的就是将目标基因与荧光蛋白的N端或者C端融合,通过瞬时转化技术使该融合蛋白在受体材料细胞内表达,通过观察荧光蛋白在细胞内显示的位置确定目标蛋白的位置,从而确定目标蛋白的亚细胞定位情况。
图4 GmVTL1a在烟草原生质体中的亚细胞定位。
4、转基因研究
生物信息学分析在对基因功能进行合理的预测后,又做了亚细胞定位分析,但是这些仅仅只能对基因的功能有一个大致推断,在一定程度上需通过试验方法进行验证,并进一步外延生物信息学研究的结果。验证方法一般都会用到转基因技术,基因功能研究至少可以包括以下几种类型转基因与基因敲除材料的构建:
(1)增强基因表达:过表达
过表达通常是融合目的基因的全长序列与表达水平较高的启动子(如:CaMV35S、pUBQ10等),通过遗传转化,获得该基因表达上调,表达产物大量积累的个体。
有时,想要研究的基因可能属于某个基因家族,在基因组中有多个结构同源,功能类似的拷贝,冗余性比较高,敲除其中一两个基因后,其它家族成员可以代替其功能,所以敲除个体没有任何表型或缺陷,很难研究基因的功能。这时候,我们可以尝试对该基因进行过表达,增加此基因表达产物的丰度,以期增强其在生理生化过程中的作用,并通过比较过表达材料与野生型植株在表型上的一系列差异来研究该基因的功能。
同时,过表达材料也可以和基因敲除,敲低的突变体材料之间相互比较,互相印证。
(2)恢复基因表达:功能互补
由于EMS诱变,辐射诱变或T-DNA插入构建突变体时,往往突变位点不唯一,有大量的背景突变。对于正向遗传学筛选到的突变体,我们进行基因定位与克隆,发现是某个基因突变导致的表型改变。怎么验证该基因就是造成表型改变的基因,而不是错误定位到了不影响表型的背景突变表型基因呢?
很简单,通过基因回补。如果克隆到的基因发生了隐性突变,那么表型可能就是突变导致该基因功能丧失或减弱造成的,将该基因的编码区连同表达调控区域(包括启动子、UTR等)通过转基因回补到突变体,表型就能随着该基因正常版本的出现而恢复到野生型水平。如果回补株系出现了预期的表型恢复,那么就说明定位到的基因确实是造成表型改变的基因。
图5 在突变体中恢复PTOX基因使得表型恢复
这里还有一些问题,比如,显性突变或者功能获得性突变(Gain of function)的突变体,以及显性负性突变体(Dominant negative)往往不能通过转入正常版本使之表型恢复到野生型水平。这个时候可以试着把突变体版本转入野生型,看转入突变基因的野生型植株会不会出现类似于突变体的表型,进而验证表型改变是不是该基因突变造成的。
(3)敲除基因:CRISPR
研究植物基因功能的重要前提之一是获得突变体。比如,当A基因突变失去功能了,植株变矮,那么A基因就可能作用于植物长高;当B基因突变失去功能,植株的抗病能力下降,那么B基因就可能作用于植物抗病。
通过T-DNA插入突变、转座子插入突变、基于基因编辑技术的敲除等,是获得基因敲除突变体的主要手段,抑制目的基因的表达则是获得基因敲低突变体的有效途径。
目前,拟南芥、玉米、矮牵牛中已有大量可用的突变群体,水稻的插入突变群体也正在逐渐扩充完善。以T-DNA、转座子及质粒介导的插入突变等构建突变体库,是利用插入突变进行功能基因组学研究的主要方法。T-DNA插入突变对于正向遗传学和反向遗传学的研究极其方便。农杆菌介导的T-DNA插入突变适用于多种植物,不仅插入位点的随机性比较强,且能直接在植物基因组DNA中产生稳定的插入突变。此方法的缺点是只适合易被T-DNA转化的植物,T-DNA边界的质粒序列可随着T-DNA整合到基因组并出现由于整合引起的染色体重排,有可能造成突变体表型与T-DNA插入无关。
目前,基于CRISPR/Cas的基因编辑工具因其简单高效的特征,被广泛应用于各种突变体创制。编辑启动子区域,不仅能改变基因表达量,还有可能改变基因表达模式,而编辑基因的编码区,则可以实现碱基替换、插入、缺失等突变……
有时候,由于个别基因发挥极其重要的功能,或者它们在植物基因组中冗余性低,没有功能类似的基因代替它们,其功能丧失的纯合突变往往会致死。对于这种基因,有的杂合子也会表现出异于野生型的表型,我们可以用杂合子研究其基因功能,有时候杂合子并不表现出任何不同,但是纯合又致死,我们可以通过RNA干扰和反义技术降低其表达量,获得基因敲低突变体。
图6 敲除GmVTL1基因导致根瘤发育缺陷
(4)反义技术
反义技术是指通过碱基互补配对原理,利用人工或生物合成的特异互补性DNA或RNA片段(或其修饰产物),干扰基因的解旋、复制、转录、mRNA剪接加工与输出、翻译等各个环节,抑制或封闭靶基因的表达,从而调节细胞的生长分化等。反义技术主要包括反义寡核苷酸技术(Antisense oligonucleotides ASON)、核酶技术(Ribozyme)和小干扰RNA。
(5)RNAi
所有生物体体内都有一套限制异常或外源性基因表达的保护机制。例如,在将基因转入植物后,转入基因会出现自身沉默,并同时通过转录后基因沉默机制,引起同源内源基因的沉默。转录后基因沉默并非偶然事件,而是生物体在长期的进化过程中,为了防止外源物的引入对宿主细胞内平衡机制的致命破坏,而形成的一种防御系统。
研究者们也发现,当在多种生物体内转入双链RNA(Double stranded RNA dsRNA)分子后,会引起强烈的特异性同源基因沉默,且其诱导沉默的效果比正义或反义RNA更为明显,最终产生功能缺失表型。这一现象引起了研究者的广泛关注,人们将这种外源性或内源性双链RNA导入细胞后所引起的转录后基因沉默机制称为RNA干扰(RNA interference RNAi)。
其中小干扰RNA(Small interfering RNA siRNA)是一类重要的、可引起RNAi的外源性双链RNA分子,它们能够与核酸酶和螺旋酶等结合在一起形成RNA诱导沉默复合物(RISC),并精确引导RISC中的核酸酶降解特异性的mRNA,从而关闭基因的表达,使细胞抵抗外来基因侵入及病毒感染。RNAi现象首先在线虫体内得以发现,随后在多种生物,如果蝇、拟南芥、小鼠及哺乳动物等的成体细胞中均有发现,这表明RNAi是生物界普遍存在的RNA水平上调节基因表达的方式。
RNAi技术是通过人为地引入与靶基因具有同源序列的dsRNA,诱导靶基因的mRNA降解,从而达到阻止基因表达、产生“功能失活”的目的。在RNAi试验中,首先需要构建双链RNA表达载体,然后将这种载体导入到受体细胞后,表达产生的双链RNA在Dicer酶作用下形成siRNA,从而引起具有相同序列的mRNA发生降解,导致细胞或个体不能合成相应的蛋白质,所以个体会表现出功能缺失表型。
miRNA是一类长约18~25个核苷酸的、内源性非编码性的单链小分子RNA,可与靶基因mRNA的3’UTR完全或不完全互补结合,从而降解靶基因mRNA或抑制mRNA的翻译,最终在转录水平和转录后水平上调控靶基因的表达。miRNA在不同物种间具有高度的保守性,表达具有细胞或组织特异性,而且具有很强的基因沉默功能,能够介导RNAi现象。miRNA与siRNA之间存在着很多相似之处,两者长度都约在22个核苷酸左右,都是由双链RNA或RNA前体加工形成的,都依赖于Dicer酶,并且都是RISC的组成部分。两者的不同之处在于:
①来源不同:miRNA是生物体的固有因素,是内源性的,而siRNA是人工体外合成后通过转染进入体内的,是RNAi的中间产物;
②结构不同:miRNA为单链RNA,而siRNA是双链RNA;
③Dicer酶对两者的加工过程不同,miRNA是由不对称加工形成的,仅是剪切前体miRNA的一个侧臂,其它部分降解,而siRNA对称地来源于双链RNA前体的两个侧臂;
④作用部位不同:miRNA主要作用于靶基因mRNA的3’UTR区域,而siRNA可作用于靶基因mRNA的任何部位;
⑤作用方式不同,miRNA既可抑制靶基因mRNA的翻译,也可以导致靶基因mRNA降解,即在转录后水平和翻译水平起作用,而siRNA只能导致靶基因mRNA的降解,为转录后水平调控;
⑥miRNA主要参与内源基因的调节和细胞发育过程,而siRNA的原始作用是抑制转座子活性和病毒感染。
尽管miRNA为内源性RNA分子,但是研究者们目前开发出了多种miRNA的模拟物,促进了miRNA在基因功能研究中的应用。
图7 miRNA的生物发生
(7)启动子分析
对于基因表达模式的分析,一般采用报告基因分析法。基因的时空表达依赖于反式作用因子识别启动子上的瞬时元件,招募转录调控蛋白,决定目的基因的转录、翻译。因此,我们可以用目的基因的启动子驱动报告基因表达,将这一构建转入植物,实现目的基因时空表达模式的可视化。常用的报告基因可以编码一个易于离体检查的酶,或者能活体条件下进行组织化学定位。常见的报告基因有LUC(萤火虫荧光素酶基因),GUS(β-葡糖醛酸糖基转移酶),lacZ(β-半乳糖苷酶基因),GFP(绿色荧光蛋白)等。
图8 MIR167a和MIR167b启动子活性分析(O-Y)
今天的干货就分享到这里啦,下面做一个简单的总结,这一期伯小远主要介绍了研究一个基因的功能,一般会先进行生物信息学分析,然后对基因的功能进行预测,做亚细胞定位分析,最后利用转基因技术实验对基因功能进行验证研究,下期咱们会分享基因编码产物相互作用蛋白的研究,想知后续如何,请关注伯远生物公众号,伯小远和您不见不散!希望有了伯小远的陪伴,您的科研之路越走越顺!
参考文献:
[1] A VIT‐like transporter facilitates iron transport into nodule symbiosomes for nitrogen fixation in soybean[J]. New Phytologist 2020 226(5).
[2] Bao-Xiang Qin Ding et al. Rice OsGL1-1 Is Involved in Leaf Cuticular Wax and Cuticle Membrane[J]. Molecular Plant 2011.
[3] Bohnsack M. T. Czaplinski K. GÖRLICH D. Exportin 5 is a RanGTP-dependent dsRNA-binding protein that mediates nuclear export of pre-miRNAs[J]. Rna 2004 10(2): 185-191.
[4] Bracht J. Hunter S. Eachus R. et al. Trans-splicing and polyadenylation of let-7 microRNA primary transcripts[J]. Rna 2004 10(10): 1586-1594.
[5] C C Wood et al. The Arabidopsis thaliana vernalization response requires a polycomb-like protein complex that also includes VERNALIZATION INSENSITIVE 3[J]. Proceedings of the National Academy of Sciences 2006.
[7] Denli A. M. Tops B. B. Plasterk R. H. et al. Processing of primary microRNAs by the Microprocessor complex[J]. Nature 2004 432(7014): 231-235.
[8] Han J. Lee Y. Yeom K.-H. et al. Molecular basis for the recognition of primary microRNAs by the Drosha-DGCR8 complex[J]. cell 2006 125(5): 887-901.
[9] Sharma M Kretschmer C Lampe C et al. Targeting specificity of nuclear-encoded organelle proteins with a self-assembling split-fluorescent protein toolkit[J]. Journal of Cell ence 2019 132(11).
[10]Zhang J Z . Overexpression analysis of plant transcription factors[J]. Current Opinion in Plant Biology 2003 6(5):430-440.
[11] Zhufang Y Jiang T Hong L . Comparative characterization of GmSPX members reveals that GmSPX3 is involved in phosphate homeostasis in soybean[J]. Annals of Botany(3):477.