rna聚合酶识别和结合的是什么(转录聚合酶复制RNA的分子机制)
rna聚合酶识别和结合的是什么(转录聚合酶复制RNA的分子机制)虽然序列不同 RNA species结构有共同的特点:(i)“2-way重复”结构,整个RNA反向重复,暗示可能形成长发夹结构(ii)“4-way重复”结构,在每一个“2-way重复”结构臂中含有短的“2-way重复”结构。这两种重复结构暗示RNA可以被T7 RNAP复制。无模板T7 RNAP反应产生的RNA species接下来,作者分析了24个无模板T7 RNAP反应所生成的RNA序列。利用RNA-Seq对主要反应产物进行测序。对反应产物进行序列分类,观察到每个反应产生一个或多个RNA序列簇(以下称为RNA species)。每一个这样的RNA species是由序列紧密相关RNA组成的异质群体。对于每个RNA species,作者选择了典型的并且高丰度的序列作为“参考”序列。24个测序结果中,每一个反应各有1~ 3种RNA占主导地位(相对丰度大于5%的RNA)。尽管有些反应产生的“
在所有生命体中,转录聚合酶(依赖DNA的RNA聚合酶)介导遗传信息从DNA到RNA传递。除了从DNA模板中扩增出RNA外,转录聚合酶也可以复制某些RNA模板。RNA复制是一个模板再生过程,包括RNA模板的全长复制,生成RNA拷贝,然后作为新的RNA复制模板,这种RNA复制过程不涉及DNA。传统研究中,T7噬菌体转录聚合酶(T7 RNAP)是依赖DNA模板的RNA聚合酶研究模型,同时T7 RNAP也是研究转录聚合酶复制RNA模板的范例。类似于T7 RNAP的一种叶绿体转录聚合酶可能参与复制鳄梨sunblotch类病毒。迄今为止,已经有5种不同的RNA序列可被T7 RNAP复制,它们都能形成长发卡二级结构。但T7 RNAP复制RNA的起源尚不清楚。一些学者推测,RNA模板可能是T7 RNAP准备过程中预先存在的RNA污染物;而另外一些人提出,复制RNA是T7 RNAP分子进化的结果。
近日斯坦福大学医学院的Andrew Z. Fire课题组通过将二代测序、微流控技术和生物信息学与经典生物化学相结合的方法,系统回答了转录聚合酶复制RNA的三个主要问题:(i)依赖DNA的RNA聚合酶如何复制RNA?(ii)可被转录聚合酶复制的RNA家族的多态性?(iii)转录聚合酶复制RNA的起源是什么?
壹 无模板反应中产生多种RNA
作者首先使用相同的试剂建立了一系列T7 RNAP平行反应。每个反应都含有高浓度(2μM)的T7 RNAP,反应中未加入核酸模板。37℃孵育约24小时后,每个反应均生成大量的RNA。每个反应产生的RNA产物在凝胶电泳中迁移情况不同,表明在每个反应中都存在不同的RNA分子。
接下来,作者分析了24个无模板T7 RNAP反应所生成的RNA序列。利用RNA-Seq对主要反应产物进行测序。对反应产物进行序列分类,观察到每个反应产生一个或多个RNA序列簇(以下称为RNA species)。每一个这样的RNA species是由序列紧密相关RNA组成的异质群体。对于每个RNA species,作者选择了典型的并且高丰度的序列作为“参考”序列。
24个测序结果中,每一个反应各有1~ 3种RNA占主导地位(相对丰度大于5%的RNA)。尽管有些反应产生的“参考”序列可能相关,RNA species中“参考”序列各不相同。此外,其中3个“参考”序列与Y RNA有关,这3个序列之前被认为是由T7 RNAP复制的RNA。
大多数RNA“参考”序列的长度在60到80个核苷酸之间。由于RNA-seq是链特异性的,作者进一步分析了每个RNA species中RNA序列的方向。大多数RNA species含有两个特征:(i)reads与RNA species参考序列方向相同,(ii)reads与RNA species参考序列方向互补。因此RNA复制可能会产生两种方向的序列。
无模板T7 RNAP反应产生的RNA species
虽然序列不同 RNA species结构有共同的特点:(i)“2-way重复”结构,整个RNA反向重复,暗示可能形成长发夹结构(ii)“4-way重复”结构,在每一个“2-way重复”结构臂中含有短的“2-way重复”结构。这两种重复结构暗示RNA可以被T7 RNAP复制。
为了确定无模板反应中RNA species是否可以被T7 RNAP持续复制,作者评估几种不同RNA species在稀释后的新T7 RNAP反应中的生成情况。结果表明,用作模板的RNA species与生成的产物之间存在明显的序列对应关系,这表明RNA在复制。而使用低浓度的T7 RNAP,在没有模板的情况下,没有产生任何产物。因此T7 RNAP反应浓度实验可以得到两个结论:(i)低浓度T7 RNAP可以从指定RNA模板中复制RNA;(ii)高浓度T7 RNAP可以从无模板反应中生成可供复制的RNA。
贰 3’端序列是RNA复制所必须的
尽管在低浓度T7 RNAP反应中再生了RNA species,表明发生了依赖模板的RNA复制过程,但作者分析的RNA species仍然有可能不是模板本身,而是更复杂反应的副产物。为了从特定RNA模板中建立复制反应,作者用T7 RNAP对一系列化学合成的RNA进行复制。并将复制的RNA互补链称为G链和C链。G链序列在5'端和3'端有两个G核苷酸;C链序列在5'端和3'端有两个C核苷酸。作者合成的Y2 RNA G链和C链不能有效指导RNA的合成,混合这两条链,也没有增加RNA的合成。
考虑到活性模板的特征,作者最初将注意力集中在序列3'末端。发现无模板高浓度T7 RNAP反应中分离出的RNA species经常出现额外添加3’核苷酸(T7 RNAP活性的一个已知特征)。为了模拟额外添加的3'核苷酸,作者在Y2 RNA G链和C链的3'端添加了一个额外的核苷酸;结果,T7 RNAP反应产物的数量显著增加。这些结果表明,G链和C链序列中需要添加3'核苷酸到才能有效地合成RNA。
为了进一步鉴定T7 RNAP以化学合成RNA模板所产生的反应产物,作者使用RNA-seq对产物进行了比较。产物序列与模板序列一致,表明模板RNA在复制。模板池含有特定方向和特定3’核苷酸的单链序列,而产物中包含两条链方向的序列,并且具有多样性的3’核苷酸末端。产物池中的序列3'端多样性,为T7 RNAP在RNA合成过程中添加3'端核苷酸提供了证据。此外,对模板和产物进行序列比较,可以直接看出RNA两条链的复制循环。例如,从一个特定化学合成的RNA模板G链方向,作者观察到C链互补链的合成,和紧随其后的是这些产物作为模板产生G链,并在合成的G链3’端添加额外的核苷酸。使用化学合成的C链RNA模板进行反应时,也得到了类似的结果。因此,带有特定3’核苷酸的G链和C链序列可作为RNA复制的模板。
作者的研究结果,特别是添加3’核苷酸,为T7 RNAP的RNA复制提供了一种“近末端从头起始”模型。在这个模型中,T7 RNAP从头合成RNA发生在3'端上游而不是在3'端。在从5'→3 '复制RNA模板后,T7 RNAP在RNA产物上添加一个3'核苷酸。实际上,3'核苷酸添加为RNA产物提供了合适的3'端,随后作为有效的复制模板,同时保持了复制RNA species的链长。
3’额外碱基是RNA复制所必须的
叁 RNA复制产物是一个集合
为了研究无模板T7 RNAP反应中,RNA-seq检测到的RNA species序列异质性,作者检测了复制RNA产物与“参考”G/C链相关的序列变异。作者发现两个RNA链上序列变异是互补的,并且互补的变异发生频率相似。例如,G链上44位的G→A变异的频率是1.1%,而互补链上C→U的变异频率是1.3%。由于RNA-seq是链特异的,在这两条链上的互补变异表明:具有序列变异的RNA模板可以被复制。因此,T7 RNAP复制产生的RNA species是多个变异产物复制产生的集合,而不是一对简单的互补链复制产生的。众所周知,类病毒和RNA病毒以类似的方式形成由多个复制序列组成的异质群体。
肆 RNA结构是复制所必须的
为了评估复制RNA序列中结构特征的重要性,作者对“2-way”和“4-way”重复构象进行了高通量诱变。作者设计了一系列分子库,每个库都是通过对XRNA(一种由T7 RNAP复制的RNA)或Y2 RNA中5-6个不同位置进行碱基随机化。为了测试“4-way”重复,作者在4-way重复中4个潜在的碱基对位置进行碱基随机化。为了测试2-way重复,作者在2-way重复的两个潜在碱基对位置进行了随机化,这些位置与4-way重复的部分不重叠。作者对这些库进行T7 RNAP复制反应,并在RNA复制前后进行测序,检测复制群体中随机碱基的位置是否存在互补碱基。
在测试“2-way”重复位点中,RNA复制产物中占主要的是沃森—克里克碱基配对,最丰富的RNA序列是四种碱基组合:(A U A U),(U A U A),(G C G C)或(C G C G)中的一种。值得注意的是,并不是所有的沃森-克里克碱基组合都能以相似的效率复制。作者至少检测两个主要的沃森—克里克碱基组合。在“4-way”重复4个潜在位点中随机化两个位点,在这个库模板复制后,最主要的RNA序列只有特定的4-way Watson-Crick碱基组合。从这些实验中可以看出,“2-way”重复和“4-way”重复都是T7 RNAP有效复制X和Y2 RNA所必需的。基于“2-way”重复作用,作者认为T7 RNAP需要一个长发夹RNA结构来进行复制。长发夹结构可能在热力学上允许互补链的分离,从而促进活跃的单链模板产生,进而继续复制。“4-way”重复表明,改变二级结构的能力是RNA模板被T7 RNAP有效复制所必需的。
2-way 和4-way重复是RNA复制必须的
伍 不规则滚环RNA合成机制
RNA串联体是由多个全长模板序列重复组成的RNA链,被认为是类病毒和丁型肝炎病毒复制过程的中间产物。在T7 RNAP复制RNA的过程中,也会形成一系列RNA连接物(二聚体、三聚体、四聚体等)。为了鉴定RNA串联体形成的机制,作者分析了从T7 RNAP反应中获得的RNA二聚体序列,这些RNA二聚体是从不同化学合成RNA单体模板复制而来的。作者将“RNA单体”定义为由一个完整长度的模板RNA序列组成,而“RNA二聚体”定义为由两个重复组成。考虑到RNA单体形成RNA二聚体的两种机制:单模板化和双模板化。在单模板机制中,相同的单体模板分子指导合成两次形成二聚体。在双模板机制中,两个不同的单体模板分子,可能仍然有相同的序列,指导二聚体中各一半的合成。
作者从两个起始单体模板池X1和Y21开始进行研究,并分别在X RNA和Y2 RNA的6个位置随机化碱基,对生成的二聚体进行RNA-Seq分析。作者预测,单模板合成将导致RNA二聚体的两半在随机碱基的位置上包含相同的六碱基组合。相反,双模板合成预计二聚体两部分六碱基组合的一致性相对罕见。对于绝大多数二聚体序列,作者发现二聚体的两部分六碱基组合之间具有很强的序列一致性。在两个含有X1的实验重复中,87%和88%的二聚体两部分都具有相同的序列。同样,在Y21池中进行两次重复实验,二聚体两部分有88%的二聚体序列相同。这些结果表明,单模板合成是RNA二聚体形成的主要机制。
T7 RNAP如何有效地使用同一个模板分子来指导多轮RNA合成?作者认为,在RNA合成过程中,当到达复制RNA模板的5'端后,T7 RNAP可以从模板的5'端跳到3'端,而不需要解离RNAP-模板-产物复合物。在跳转之后继续进行RNA合成,将模板产生的新拷贝附加到现有的RNA产物中。作者将这种机制称为不规则的滚环合成。
作者进一步检查了RNA二聚体两部分之间的连接序列,以评估T7 RNAP的跳变是否与任何序列特征有关。在二聚体连接处发现了多样性的序列。连接序列在性质上类似于RNA单体的3'端序列(包括额外添加的核苷酸),然后是RNA单体的5'端序列。此外,特定二聚体分子连接处的序列不一定与该二聚体的3'端序列相同。
不规则滚环复制形成RNA多聚体
陆 T7 RNAP-RNA复制子的起源是DNA seeds进化的结果
在无模板反应中观察到许多不同复制RNA分子,哪么RNA复制分子的起源是什么?不同的复制RNA是在每个反应中产生的,还是预先存在的RNA复制的?如果新复制的RNA确实在每个反应中产生,它们是由单核苷酸组装而成,还是需要部分模板?
作者设想,获得许多不同RNA复制子序列,可能有助于深入了解复制RNA的起源。因此,作者开发了一种微流控方法来实现高通量无模板反应。作者将通常10μl反应体积,分割成~17万滴独立反应(每滴~60 picoliters),这样可以消除优势RNA形成的偏好性影响,获得更多种类的复制子。作者分析了约10^5无模板、高浓度T7 RNAP液滴生成的RNA,发现许多RNA species有不同的序列 但与先前观察结构类似。
在液滴反应获得的大量RNA species中,有一部分包含与已知生物完全匹配的序列。与人类或接近人类的物种相匹配。在一组无模板反应液滴中 作者添加了牛血清白蛋白(BSA)促进液滴反应,分离的RNA序列类似于此前报到的复制RNA序列T7rp1。有趣的是,T7rp1和分离的其它RNA序列,强烈匹配到牛和牦牛的基因组。这些结果表明,复制RNA可以从高浓度T7 RNAP反应中残留的核酸进化而来。
作者假设T7 RNAP复制的RNAs可以通过DNA seeds的部分指令产生。首先认为DNAseeds作为一种可能性,而不是RNAseeds,是因为在复制RNA中检测到的序列同源性匹配到生物体的整个基因组中,而不是特定的、高度转录的区域。为了验证复制RNA可能来自DNA seeds的假设,作者讨论了T7 RNAP是否可以催化特定复杂DNA seeds库形成新复制RNA;这些seeds池混合了模式物种基因组[3个线虫物种(秀丽隐杆线虫、remanei线虫和brenneri线虫)、酵母(酿酒酵母菌株S288C)、噬菌体lambda和一个实验室质粒];选择这些特定的DNA是因为它们代表了一系列大小的基因组和序列复杂性。另一个需要考虑的是,所选择的DNA来源与之前分离的任何复制RNA都不匹配。除了从纯化噬菌体中分离出的lambda DNA外,DNA seeds均是细胞来源。并在使用前,用RNaseA和RNaseI对DNA seeds进行预处理。混合所有来源的seeds后,作者将seeds池分成三个相同的部分。一部分不需要进一步处理,第二部分用DNase处理,第三部分用碱液加热(0.2M氢氧化钠,70°C,加热1小时)进一步水解任何可能残留的RNA(热碱液处理也提供了对变性DNA的seeds活性评估)。
作者在四种实验条件下同时进行了液滴和试管高浓度T7 RNAP反应:(i)没有seeds;(ii)加入已准备好的DNA池;(iii)加入DNase处理的DNA池;(iv)加入热碱处理的DNA池。对于每种实验条件,都对液滴反应和试管反应产物进行RNA-Seq分析。8个聚合液滴反应中,每个反应相同的复制RNA为53±22(平均值±标准差),6个重复试管反应中,相同的复制RNA为7±5。然后,使用BLAST将所有四种条件中获得的复制RNA与所设计的DNA池序列比对。并且将复制的RNA与RefSeq基因组数据库中所有可用的完整基因组进行比对(不包括作者设计的DNA池基因组)。在所检测的四种实验条件中,只有“添加了DNA池”和“添加了经过热碱处理的DNA池”条件下产生了DNA池复制的RNA。在两个阴性对照中——“没有seed”和“已用DNase处理的DNA池”,与DNA池序列没有显著匹配。因此T7 RNAP所复制的RNA可能来源于DNA seeds。
为了研究DNA seeds产生RNA的分子机制,作者将复制RNA序列匹配seeds的位置与该序列4-way重复单元的位置进行了比较。发现seeds匹配位置从复制RNA的两端开始,并扩展到第二个4-way重复单元。因此RNA复制分子形成的机理可以概括为:(i)seed DNA转录成RNA (ii)RNA以自我为模板,进行3′延伸,形成第二个4-way重复单元(3) RNA再次以自我为模板,3′延伸,获得完整的2-way和4-way重复构象。一旦RNA形成2-way和4-way重复构象 它可以通过达尔文选择效应,适合T7 RBAP复制,迅速成为主要分子。
DNA seeds是RNA复制的起源
总结:转录聚合酶不仅以DNA为模板,起始RNA转录;还以特定结构的RNA为模板进行RNA复制。作者发现转录聚合酶在高浓度无模板情况下,可以产生大量RNA species;在低浓度情况下可以复制3’端有额外碱基和有2-way/4-way重复的RNA;并且单体RNA分子可以通过不规则滚环复制形成RNA多聚体。最后作者发现无模板系统中生成的RNA,是由于酶或者试剂残留的DNA seeds作为模板复制的,不是单核苷酸从无到有组装而成的。本文系统解决了无模板转录聚合酶系统中RNA复制的模板问题,以及RNA复制的分子机制。
原文链接:https://science.sciencemag.org/content/early/2020/03/25/science.aay0688?rss=1