金鱼是基因突变还是基因重组(金鱼基因组图谱及全基因组复制后基因的演化)
金鱼是基因突变还是基因重组(金鱼基因组图谱及全基因组复制后基因的演化)图1. 测序信息及金鱼(GF)、草鱼(GC)、鲤(CC)和斑马鱼(ZF)基因组的进化分析利用得到的基因组遗传变异信息,基于同源基因对(orthologous/ohnologous gene pairs)进行了非同义替换(synonymous substitution dS)分析,结果显示WGD发生于金鱼和鲤分化之前(图1D)。以20.5 Mya(百万年前)作为草鱼和鲤的分化时间,结合绘制的物种分化树推算出第四轮全基因组复制事件发生于约14.4 Mya,而金鱼和鲤的物种形成时间在大约11.0 Mya(图1E)。基因组组装、注释及演化时间推演该版本基因组采用71X PacBio单分子实时(Single Molecule Real-Time SMRT)测序技术对一尾雌核发育的和金金鱼(Wakin goldfish)进行全基因组测序,并结合已发表的金鱼遗传连锁图谱将基因组组装至50条染色体,
深知养殖从业不易,共谋水产行业繁荣。不误导不夸大不炒作不标题党。用养殖人的语境,让你在短时间内享用一份精品!
金鱼(Carassius auratus)属鲤形目(Cypriniformes),鲤科(Cyprinidae),鲫属(Carassius),原产于中国,是野生鲫经人工选择发生快速演化而来的彩色变种,成为研究鱼类形态进化的优良模型。同鲤一样,金鱼经历了除硬骨鱼类特有的第三轮全基因组复制(Teleost-specific WGD)之外的第四轮全基因组复制事件,因此也是研究硬骨鱼类基因组倍性演化的良好材料。
鲫(左)及其变种金鱼(右),图片来自FIMSEA & Aquatic Log
01
基因组组装、注释及演化时间推演
该版本基因组采用71X PacBio单分子实时(Single Molecule Real-Time SMRT)测序技术对一尾雌核发育的和金金鱼(Wakin goldfish)进行全基因组测序,并结合已发表的金鱼遗传连锁图谱将基因组组装至50条染色体,总长度为1246 Mbp。
为了辅助基因组注释,研究者对金鱼的脑、鳃、眼睛等7个组织进行转录组测序,共获得70324个蛋白编码基因,其中24026个是与斑马鱼、草鱼或鲤共有的(图1C)。此外,研究者还通过70X Illumina短读长测序检测了金鱼基因组的核苷酸变异信息,在此不再赘述。
利用得到的基因组遗传变异信息,基于同源基因对(orthologous/ohnologous gene pairs)进行了非同义替换(synonymous substitution dS)分析,结果显示WGD发生于金鱼和鲤分化之前(图1D)。以20.5 Mya(百万年前)作为草鱼和鲤的分化时间,结合绘制的物种分化树推算出第四轮全基因组复制事件发生于约14.4 Mya,而金鱼和鲤的物种形成时间在大约11.0 Mya(图1E)。
图1. 测序信息及金鱼(GF)、草鱼(GC)、鲤(CC)和斑马鱼(ZF)基因组的进化分析
(A:用于三代测序的雌核发育和金金鱼,B:金鱼、斑马鱼基因组重复元件,C:基因分布,D:同义替换率,E:物种进化关系)
02
WGD后广泛保留的共线性
理论上,分化时间越短的生物,其基因组相似度越高。然而共线性分析显示,尽管金鱼-鲤发生分化的时间(14.4Mya)比金鱼-斑马鱼(60 Mya)要短,但金鱼-鲤的染色体共线性程度却更低(图 2A),作者认为这可能是因金鱼和鲤之间的物种分化所致。
除此之外,在多倍体植物中的研究显示,全基因组复制会造成基因组不稳定性升高、染色体重排频发,并由此加速物种进化⁵。然而金鱼-斑马鱼的基因组共线性结果却显示,金鱼基因组倍增后并未发生大规模的重排现象(图2B)。
图2. 金鱼-鲤、金鱼-斑马鱼的染色体共线性分析
(A:金鱼和鲤共线性,B:金鱼和斑马鱼共线性,C:金鱼染色体重排)
03
WGD后的基因演化
为了探究WGD事件后金鱼基因组的演化情况,研究者们将金鱼基因组与其近缘物种斑马鱼(二倍体)、草鱼(二倍体)和鲤(四倍体)进行比较,分析了金鱼在WGD后的基因丢失和保守非编码元件丢失等,并通过基因表达分析,探究金鱼基因功能的演化情况。
基因丢失情况
基因丢失(gene loss)往往紧跟WGD的步伐,如大西洋鲑在最近一轮全基因组复制后发生了快速的基因丢失,产生去四倍化现象⁴ 。
基于斑马鱼:草鱼:金鱼:鲤=1:1:2:2的基因组倍性关系,同一斑马鱼基因(ortholog)理论上在金鱼中应该对应两个基因,这两个基因互为旁系同源基因(paralogs),称同源基因对(ohnolog pair,注1)。
该研究据此鉴定到了19040个直系-旁系同源基因簇(ortholog-paralog gene clusters),其中的12.4%(2341个)在金鱼中丢失了一个拷贝(图3A)。
在此基础上对WGD后每百万年的基因丢失率进行计算,结果显示,金鱼和鲤的基因丢失率在最近一次WGD(14.4 My)后均有所升高(图3B)。
图3. 斑马鱼、草鱼、鲤和金鱼之间的进化关系&基因丢失速率
(A中粉色代表保留的基因数,浅蓝色代表保留的CNE数)
功能分析发现,金鱼中与氧化还原酶活性、核酸酶活性和甲基转移酶活性相关的基因更倾向丢失,而与蛋白结合和转录因子相关的基因则更倾向于保留,这可能由于发育相关的关键转录因子的剂量平衡一旦被打破,就可能会导致幼年个体发育紊乱或停滞,进而影响其适合度。
保守非编码元件丢失情况
保守非编码元件(conserved non-coding elements,CNE)通常分布于基因的上下游区域,作为基因调控网络的核心元件调控基因表达,其丢失往往会影响基因的功能。
与斑马鱼相比,草鱼基因组在40Ma内丢失的CNEs数目多达3611个,而金鱼和鲤仅有329个,表明这些CNEs丢失可能发生在金鱼-草鱼分化之后和第四轮全基因组复制事件之前。
此外,对CNE的丢失率分析发现,金鱼和鲤基因组中均有4316个CNEs存在单拷贝丢失,这很可能发生在二者WGD事件之后和物种形成之前的3Ma期间(图3B);而在物种形成后至今,金鱼基因组有16102个CNEs成为单拷贝或完全丢失,鲤中则为28937个,均呈加速丢失的趋势。
基因表达分化情况
WGD后通常会伴随去多倍化,冗余的基因倾向于发生空间或功能上的分化,从而使新的基因组能最大限度地发挥作用并适应环境。
对金鱼各组织的转录表达分析显示,鉴定出的同源基因区域中,6.2%(649个)的同源基因对都存在其中一个基因在所有组织中均沉默的现象(可能发生了非功能化),并且这些沉默的基因有较高的外显子丢失率;其余同源基因对中,29.7%出现表达分化,68.7%在至少3个组织中共表达,可见WGD后金鱼基因组中同源基因对呈现较大的表达分化。
那么,造成这些同源基因出现表达分化的原因是什么呢?金鱼的WGD事件相对较晚,这就使得从序列分化、外显子丢失和CNE丢失角度出发去解释同源基因对的表达模式成为可能。
研究者们将这些同源基因对分别按序列相似度(图4B)、外显子丢失数(图4C)和CNE丢失数(图4D)划分等级后再对比表达差异情况,结果显示,基因表达的分化程度随序列相似性升高而降低、随外显子丢失数增加而升高,但与CNE丢失数的多少没有明显关系。
图4. 金鱼同源基因的表达受序列变化、外显子缺失和CNE丢失的影响
功能分析发现,与免疫功能相关的基因序列相似性较低,而与代谢调节、发育和基因表达调控等基础生物学功能相关的基因序列相似性则相对较高,暗示金鱼演化过程中对免疫等不同功能的不同需求。
此外,研究还发现,CNE丢失但外显子不丢失的情况下,同源基因对在不同组织间的表达差异较小,表明CNE的丢失会缩小同源基因对的空间表达差异,而不是造成一对同源基因产生表达分化。
最后,对9750个同源基因对的表达情况进行聚类(图4E)发现,表达量最高的基因簇(cluster 10 11 12 and 15)中的绝大部分基因均未出现外显子或CNE丢失的情况,这些基因主要编码一些信号分子和转录因子。
图4E. 9750对同源基因的表达聚类
WGD后基因的演化机制
通常情况下,WGD后同源基因对的演化方式有4种:① 一对同源基因均保留其祖先物种的表达模式,称保守共表达(conserved coexpression);②一对同源基因均保留祖先物种的部分表达模式,即亚功能化(subfunctionalization sub-F);③其中一个同源基因不再表达,发生非功能化(nonfunctionalization non-F);④其中一个同源基因产生新的功能,即新功能化(neofunctionalization neo-F)。
为了确定金鱼同源基因的演化机制是哪种,研究者们以斑马鱼为祖先物种,对金鱼-斑马鱼同源基因的表达进行相关性分析,结果发现,金鱼同源基因对间表达量的相关性(图5A中GF1 vs GF2)高于金鱼同源基因对表达量之和与斑马鱼直系同源基因的相关性(GF1 GF2 vs ZF),也高于金鱼一对同源基因对中任一个与斑马鱼直系同源基因间的相关性(GF1/GF2 vs ZF)。这表明,金鱼的基因组在WGD后发生了强的纯化选择来维持同源基因表达的剂量平衡(注2)。
图5A. 斑马鱼-金鱼基因组种同源基因表达的聚类热图
对比金鱼-斑马鱼的基因表达情况,研究者们发现共表达和非功能化是金鱼基因在WGD后的主要演化机制,并且同源基因主要通过新功能化来避免非功能化,而不是通过亚功能化(表1,此部分受分析方法影响较大,建议小伙伴们查看Methods,推荐给大家两篇NG Correspondence 参考文献6-7)。
表1. 文中鉴定到的发生不同类型演化的同源基因对情况
(注:这里的部分非功能化是指同源基因对中的一个基因在至少一个组织中发生非功能化,但在其他组织中共表达,其他亦同)
金鱼WGD后同源基因对的不同演化类型与其基因结构变化之间有什么关系呢?研究者们发现,与其他三种类型相比,金鱼基因组中发生共表达的基因具有较高的金鱼-斑马鱼同源基因序列相似性(图5C左);而在非功能化的同源基因对中,表达了的ohnolog相比未表达的具有更高的外显子保留率及金鱼-斑马鱼序列相似性,表明外显子丢失可能是造成非功能化的主要因素;外显子丢失率分析发现,不同类型演化机制的同源基因对丢失率表现出:非功能化>亚功能化/新功能化>共表达的趋势(图5C右),表明外显子数量变异在亚功能化和新功能化中也发挥一定作用。
图5C. 不同类型演化机制的同源基因数量与斑马鱼-金鱼序列一致性(左)及外显子获得/丢失率(右)间的关系
CNE获得/丢失比例分析则显示,新功能化/非功能化组中的同源基因比共表达组有更高的CNE获得/丢失比例(图6a),并且落在共表达和亚功能化组中的基因在斑马鱼中的表达量高于非功能化和新功能化组的(图6b);此外,落在亚功能化组中的斑马鱼基因所能表达的组织数目比非功能化和新功能化组中的要多(图6c),这些表明金鱼基因组中具有高表达和广泛表达的基因在WGD后更可能发生了亚功能化。
图6. 不同类型演化机制的同源基因数量与CNE获得/丢失之间的关系
(不同类型同源基因对与CNE获得/丢失(a)、基因表达强度(b)以及表达组织数(c)间的关系)
04
结论
该研究利用71X PacBio单分子测序对和金金鱼进行了全基因组测序,获得了高质量的金鱼基因组组装和注释数据,推演金鱼和鲤共同经历的第四轮全基因组复制事件约发生于14 Mya,通过后续的一系列分析,得出以下主要结论:
(1)金鱼两个亚基因组间保持着较高的共线性,并与斑马鱼维持较高的共线性;
(2)第四轮全基因组复制事件后发生了快速的基因丢失,同时30%的保留基因在各组织间产生了表达分化;
(3)序列相似度、外显子数量变异影响基因的功能分化,CNE数量变异影响不同组织间基因表达差异;
(4)WGD后ohnologs更倾向于经历非功能化和新功能化,而不是亚功能化;
(5)外显子数量变异是驱动脊椎动物多样性产生的关键因素。
注1:同源基因的分类及说法
(1)同一物种的成对基因或染色体经历物种形成及异源多倍化后在同一基因组中出现称为Homoeologs(也有写为homeolog,但homoeolog更常见);Ohnologs为由于全基因组复制事件产生的基因。
(2)同源序列可分为两种:直系同源(orthology)和旁系同源(paralogy)。直系同源(orthologs)由物种形成(speciation)产生:若一个基因原本存在于某个物种,而该物种分化为两个物种,那么新物种中的基因即是直系同源;旁系同源(paralogs)由基因复制产生:若生物体中发生了基因复制,那么两个副本序列就是旁系同源。旁系同源常见于同一物种,但也不是绝对如此,如鼠的α球蛋白和β球蛋白基因是paralog,鼠的α球蛋白和鸡的β球蛋白基因的关系也是paralog。
同源基因分类,图片来自参考文献8
注2:选择压力
选择压力也被称为进化压力,即自然界施与生物体选择压力从而使适应环境者得以存活和繁衍。通常将选择压力分为三种,用碱基的非同义替换与同义替换比值ω(即Ka/Ks或dN/dS)进行区分:① 正选择(Positive/Directional selection),保留有益变异,导致遗传多样性水平升高,ω>1的变异则为受到了正选择;②中性选择(Neutral selection),也称平衡选择(balancing selection),轻微有害却不致命的变异通常受到中性选择,ω=1;③ 负选择(Negative selection),也称为纯化选择(Purifying selection),剔除有害变异,导致遗传多样性水平降低,其ω<1。
(作者:陈琳等。来源:AGCT与鱼)
水产实践人士,共谋渔业繁荣!敬请关注我的头条号@渔人刘文俊,更多精彩内容请登录西南渔业网和养鱼第一线公众号,本文原创如需转载请注明出处,如有不同见解或者内容补充请私信或留言或评论分享!#鱼##品种##水产品##养鱼##喂鱼##