第三代测序技术发展(测序技术从前世到来生)
第三代测序技术发展(测序技术从前世到来生)沃森大学毕业后一直从事着动物学的研究,克里克则是一位对数学和物理十分感兴趣的科学家,这两个研究方向均不是这个领域的年轻人结合在一起,碰撞产生了一个影响巨大的火花。他们继而成为诺奖得主,科学界名垂青史的传说,不得不说也是科学界的一碗好鸡汤。其工作的过程点滴也成了后世研究者的工作典范。对,一碗可反复熬煮,经久不衰的好鸡汤。1953年4月25日是在遗传学历史上浓墨重彩的一天。这天,Nature杂志刊登了沃森(James Dewey Watson)和克里克(Francis Harry Compton Crick)关于DNA双螺旋结构的发现。第二章:DNA结构的发现开启新时代毋庸置疑,DNA双螺旋结构的发现是一个伟大的里程碑,标志着一个新时代的来临,分子遗传学时代拉开序幕。但和罗马城一样,DNA作为遗传物质的地位并不是一蹴而就的。1930年到1952年间关于噬菌体的一系列研究,奠定了DNA在遗传中的
生而为人,我们既渺小而又伟大,从刀耕火种到现代文明,仅用了整个地球发展史的千分之一的时光。我们对于自身和自身所处的世界的不断探索也许正是这一切伟大进步的源动力。凭借远高于低等动物的自我认知,人类不断对自身进行着解构和剖析。这个过程从宏观到微观,从横向到纵向,从精神认知到结构解析,再到组成我们的最基本的部分 —— 基因。
我们的认知从宏观出发,了解人体,了解器官,到了解细胞,但位于这些宏观体现背后的调控和决定者——基因,我们依旧知之甚少。当我们试图解读这神秘难懂的遗传密码时,一些手段和方法便应运而生。测序技术便是我们手中强有力的解码工具。
随着近年来测序技术应用越来越广泛,资讯通量激增,人们对于测序技术的了解也越来越深入。基因组和测序技术不再是一个缥缈的概念,不少人已通过测序技术了解了自己生命的设计蓝图。测序技术更深入更广泛的应用成为大多数人认定的必然趋势,即将迎来一片大好的春光。
这个时代的科学家们也共同给我们贡献了两个高考常驻考点,基因分离定律和基因的自由组合定律,告诉了我们遗传性状是怎么从我们的父母体内,借助染色体,通过分离和自由组合,遗传到我们子代中的。正是这些发现给我们带来了基因研究的第一缕阳光。
第二章:DNA结构的发现开启新时代
毋庸置疑,DNA双螺旋结构的发现是一个伟大的里程碑,标志着一个新时代的来临,分子遗传学时代拉开序幕。
但和罗马城一样,DNA作为遗传物质的地位并不是一蹴而就的。1930年到1952年间关于噬菌体的一系列研究,奠定了DNA在遗传中的重要性,从此DNA作为遗传信息的载体为人熟知。
1953年4月25日是在遗传学历史上浓墨重彩的一天。这天,Nature杂志刊登了沃森(James Dewey Watson)和克里克(Francis Harry Compton Crick)关于DNA双螺旋结构的发现。
沃森大学毕业后一直从事着动物学的研究,克里克则是一位对数学和物理十分感兴趣的科学家,这两个研究方向均不是这个领域的年轻人结合在一起,碰撞产生了一个影响巨大的火花。他们继而成为诺奖得主,科学界名垂青史的传说,不得不说也是科学界的一碗好鸡汤。其工作的过程点滴也成了后世研究者的工作典范。对,一碗可反复熬煮,经久不衰的好鸡汤。
在两个男人的传奇背后,还有一位不容忽视的,同样伟大的女科学家,DNA结构发现的重要贡献者——罗莎琳德·富兰克林(Rosalind Elsie Franklin)。正是她分辨出了DNA的两种构型,并成功地拍摄了它的X射线衍射照片,这张照片也成为了沃森和克里克发现的基础。在评诺奖时,她本可以和以上两位男士比肩,但是由于她遗憾地因为卵巢癌去世而错过了这一奖项。为了纪念她,英国设立“富兰克林奖章” ,来奖励像罗莎琳德·富兰克林这样在科研领域做出重大创新的科学家。
借由这个重大的发现,人类对遗传和基因的研究都进入了一个崭新的时代,DNA的自我复制,DNA到RNA的翻译机制被一步步逐渐揭示,一个美好的清晨已经来临。
第三章:一代测序技术的登场
DNA的功能很大程度上是由序列排布决定的(DNA和组蛋白修饰,核小体排布等表观遗传上的因素也参与影响)。1958年提出的中心法则是遗传学的重要法则,法则阐述了从DNA序列出发,反向互补转录成RNA,RNA中的mRNA(信使RNA)在核糖体中,以三个碱基一组的方式,三个碱基决定一个氨基酸,一个个的氨基酸按RNA序列密码的顺序连成蛋白质的过程。而蛋白质是目前研究最清楚的影响性状表达、调控身体机能的重要角色。
由此看出,DNA序列可以作为一切的出发点,对揭秘遗传物质,了解生物密码至关重要。那么DNA序列的测定成为当时的研究发展迫切需要解决的难题。
1977年,英国化学家桑格(Frederick Sanger)发明了双脱氧链终止法,这个技术以及吉尔伯特(W.Gilbert)发明的化学降解法被称为一代测序技术。Sanger曾经在1958年及1980年两度获得诺贝尔化学奖,是第四位两度获得诺贝尔奖,以及唯一获得两次化学奖的人。其第一次获奖是凭借定序胰岛素的氨基酸序列,证明蛋白质具有明确构造,而第二次获奖就是因为其双脱氧链终止法——Sanger法的发明。利用这个技术他成功测定了Φ-X174噬菌体(Phage Φ-X174)的基因组序列。Sanger也是一个传奇的大科学家,现在基因组研究中举足轻重的桑格研究院(Sanger Institute)便是这位大牛一手建立的。
扩展阅读
Sanger测序技术简介
在DNA的自我复制过程中,双链DNA在酶的作用下解螺旋,局部变成两条单链。以单链为模板,游离的碱基为材料,遵循碱基互补配对原则(组成DNA序列的四种碱基AGCT,A和T配对,C和G配对),在酶的作用下合成一条和模板互补的新的DNA链。Sanger测序法利用了DNA合成的这个过程,通过高温使双链变成两条单链待测模板,引物标定测序的起始点,再加入酶和游离碱基合成互补DNA序列,而测序的秘密就在于加入的特殊碱基中。
正常的DNA碱基是四种脱氧核糖核苷酸(dNTP),如果将这个碱基稍加改造,将一个-OH的氧去除,变成-CH2,就变成了一个双脱氧的核糖核苷酸(ddNTP)。在DNA合成的过程中加上这个ddNTP,由于ddNTP无法和下一个碱基链接,DNA链将无法继续延伸。故在Sanger在体系中的dNTP里掺入了一定比例的ddNTP,使得DNA复制时可以在任意位置随机终止,从而产生长短不一的合成产物。将这些长短不同的片段通过电泳加以区分鉴定,从而解密出序列信息。
第一代测序技术的特点是测序读长可达1000bp,准确性高达99.999%,但测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。但由于高精度,现今一代测序仍然是基因检测的金标准,也是对新一代测序结果进行评估验证的主要手段。而在当时,正是一代测序技术使得基因组的研究在当时成为了可能,浩浩荡荡的人类基因组计划即将轰轰烈烈的展开。
第四章:人类基因组计划开启新航程
了解自身,探索自我,这是观察人类发展的永恒主题。为了揭开组成人体2.5万个基因和30亿个碱基对的秘密,一个伟大的工程开启了。这个和阿波罗登月,曼哈顿计划齐名的当时人类的三大工程,就是人类基因组计划(Human Genome Project HGP)。这个计划要对人的30亿对碱基进行测序,从而构架人类基因组框架,并识别基因组上的基因,将基因定位到基因组上对应的位置,绘制出人类的基因图谱。
这个计划在1985年由美国科学家率先提出,1990年启动,美英法德日中6个国家共同参与,预算高达30亿美元。中国负责了其中1%的任务,是当时参与计划的唯一发展中国家,也在这个历史的重要时刻留下了我们国家的身影。
这个计划进行的过程中发生了不少有趣的故事,不得不提的是一个叫克莱格·文特尔(John Craig Venter)的大牛,一个以一人之力挑战六国的传奇的科学狂人。在人类基因组计划进行的同时,这位科学家成立了塞莱拉基因公司( Celera Genomics)与HGP公然叫板竞争。鸟枪法测序(shotgun sequencing)也叫散弹测序法,是一个基于一代测序技术的基因组测序策略,这个策略以不够精确的理由被HGP拒绝,但是Venter认为这是个好技术而对HGP的进度缓慢十分失望。一怒之下,这个大牛想着”自己干“,于是以个人公司和名义和这个六国计划开始了同台竞技。
戏剧化的是,Venter很快赶上了HGP的进度,HGP也在其压力下不断加快速度,最后两者几乎同步发布结果,2001年2月分别在Nature和Science杂志上刊登。单从时间和花费上评估,某种意义上文特尔可以说是完胜了,这也算是个人英雄主义的极致体现了。虽然其想把人类基因图谱申请专利或者用于商业的想法,行为语言的高调和炫耀卖弄惹人微词,但是文特尔向人证明了天才可能根本不屑于讨人喜欢。和乔布斯类似,他因为公司盈利问题被董事会投票开除,可是他转向合成生物学,领导的团队合成制造理论上的“最小基因组”的生物(300 个基因)。现在,这个科学狂人还在不断的创造奇迹。
HGP的成果极大的促进了基因组学的研究,当时完成了99%的基因组的测序组装,现在我们依然使用的所谓参考基因组就是在当时成果基础上不断完善的成果。
第五章:二代测序技术带来的革新
二代测序也被叫做下一代测序(next-generation sequencing,NGS),相比于一代测序,在技术上是一个类比工业革命的大革新。NGS的出现加快了测序的速度,并使得成本成千上万的缩减,全基因组测序在2001年时需要耗费一亿美元,而在第二代测序技术的帮助下,2011年已经下降到1万美元,测序时间也从3年缩短到了1周,正是这种改变使得大测序时代的到来真正成为可能。
不同于一代测序,NGS采用的是边合成边测序的策略,主要的技术路线以Roche公司的454技术、illumina公司的Solexa,Hiseq技术和ABI公司的Solid技术为代表。为了增强测序准确性,需要对同一模板通过PCR扩增多个拷贝来矫正偏差值。因此整个测序分为PCR扩增(一种可以快速复制大量产生相同DNA片段的技术)和测序两个步骤。但是PCR过程会一定程度增加系统的错误率,并且带来的错误具有偏向性,这也是二代技术存在的问题之一。
扩展阅读
二代测序技术简介
Roche 454
454是焦磷酸测序,采用了乳液PCR技术。准确率高,读长长是其相对其他两种产品的优势,是从头拼接和宏基因组学的理想的选择。不足之处是样品制备较难,难于处理重复和同种碱基多聚区域,成本相对较高。最后在illumina的压力下,454测序部门在2007年被收购,到2013年底被迫关闭。
illumina Solexa
illumina的Solexa技术是单分子阵列测序,采用桥式PCR扩增,也是当今最有人气的技术,市场份额最高的绝对霸主。其专利核心技术为“DNA簇”和“可逆终止子(reversible terminator)”。Solexa技术的特别在于速度快(几乎是其他测序技术的100倍)和价格便宜,而其公司提供数据分析配套服务的策略,也帮助illumina迅速占领市场,当今已占据超过70%的市场份额。
illumina 测序原理
PCR扩增阶段,将加好接头的待测DNA借助接头固定到一个叫flowcell的芯片上,由于两端同时固定扩增时待测序列成桥状也被成为桥式扩增,PCR反应后模板周围产生扩增产物聚集的一个个单克隆的DNA簇。在30轮扩增后,每个DNA分子可得到1000倍的扩增。
测序时, 同时加入用四种不同颜色荧光标记的游离碱基参与合成反正,这些碱基经过改造,是一个“可逆的终止子”,正常情况下配对后不能连接上下一个碱基,保证了每次加入都只能配对一个碱基分子。但是在化学切割后,这些碱基可正常延伸。于是通过加入不可延伸游离碱基,配对一个,读荧光,化学切割恢复延伸性,再加入新的不可延伸游离碱基,反复循环,即可一个个的同时识别flowcell上固定的所有待测DNA的序列。
ABI Solid
ABI在一代时期曾处于行业的霸主地位,收购Solid后进入二代市场。Solid技术和之前两个合成测序略有不同,是一种连接测序技术。不是单个碱基识别荧光,而是连续的双碱基共同编码。超高的通量是其一大特色,SOLiD 3系统单次运行可产生50GB的数据,相当于17倍人类基因组覆盖度。准确性、系统可靠性和可扩展性都很好,可是读长太短(25-35bp),运行时间过长。在当今illumina当道的时代,更是由于数据形式和其他技术差距较大,后期处理软件很难通用,处于比较被冷落的地位。
如今NGS成为当今测序市场的主流,illumina从一个名不见经传的小公司也变成了绝对的当红炸子鸡。在技术的不断革新下,全基因组测序的价格也从1千万美金降到了今天的1千美金。公司主打产品MiSeq测序仪、HiSeq X Ten测序仪、Miseq FGx测序仪、NextSeq 500/550桌上型测序仪、MiniSeq台式测序仪等,涵盖了不同的应用场景的不同需求。
就在今年,illumina推出新产品Novoseq,同时制定了3-10年内将测序价格降到100美元的目标。可以说,正是测序价格超越摩尔定律的下降速度,才使一个普通人可望不可及的技术变成了当今人人关注,人人可能受益的,越来越平民化的产业。人人拥有其基因组的时代变成了可以预见的未来,测序相关领域的蓬勃发展,生物信息技术的重要性的提高,投资市场对相关行业的资本倾斜都是测序技术价格降低带来的福利。NGS相比于一代完成了一个跃龙门式的飞跃,给生物医疗领域的发展带来了巨大的变化,许给了人们一个不一样的未来。
第六章:技术革新以及生物大数据时代的来临
第二代测序技术测序平台和测序成本,测序费用,花费时间,建库等实验技术难度,错误率以及读长(150-400bp),分析工作的体量,对于满足更高的科研需求和在医疗诊断中的普及都是不小的阻碍。其PCR过程带来的误差和偏好或成为其在医疗诊断大规模运用的阻碍。针对NGS在应用上的种种不足,二代技术本身的改良以及第三代以上世代的新测序技术发展是历史的必然。
三代技术主要解决二代测长较短的问题,那么新一代技术能否将NGS的天下重新洗牌,从而抢占新的市场都是领域相关人士和资本家们关注的重点。在这个机遇与挑战并存的时代,几家公司的产品正吸引着人们的眼球。PacBio 的SMRT 技术,LifeTechnologies 的 IonTorrent 半导体测序技术和 Oxford NanoporeTechnologies 纳米孔单分子测序技术就是其中代表。
扩展阅读
三代测序技术简介
PacBio SMR
PacBio的SMRT仍然运用边合成边测序的策略,但是其超强活性的DNA聚合酶是实现超长读长(~1000bp)的关键。反应在纳米管中进行,方便达到超高通量的目的。利用的是ZMW(零模波导孔)原理在超小的纳米孔中区别荧光信号的背景。其测序速度很快,每秒约10个dNTP。目前的问题在于测序的错误率太高(81-83%),这也是大多数三代技术需要解决的共同问题。不过错误随机,几乎没有偏向性,为其通过矫正来减少错误率提供了可能。目前这个技术已经投入市场。
Oxford Nanopre MinlON
而Nanopore的MinlON测序仪应用纳米孔单分子技术,这是一种基于电信号的测序技术,比起其他的光信号测序技术来说是一个革新。技术核心是一种特殊的内有分子接头的纳米孔,由蛋白质小孔嵌在人造膜上形成。膜两侧加上电压,使电流通过小孔。当不同的DNA碱基通过纳米孔时,其对电流的阻碍作用短暂地影响流过纳米孔的电流强度,不同碱基影响的程度不同,这种差异被灵敏的电子设备捕捉从而鉴定所通过的碱基种类。这种技术的优点很多,读长长(大约在几十kb,甚至100 kb),错误随机,而不是聚集在读取的两端,通量较高,该公司也在努力简化样品制备流程。理论上运用这个技术RNA也可以直接测序,还能检测到甲基化的胞嘧啶。不过不能实现理想的错误率控制,或成为其投入市场的阻碍。该公司在2016年12月刚完成其第一轮的一亿英镑的融资。
LifeTechnologies IonTorrent
IonTorrent 使用半导体芯片,在芯片的微孔中固定DNA链。依次加入AGCT的碱基,DNA合成时如果碱基可以结合到模板链则会释放一个氢离子。这个氢离子导致局部HP值发生变化。离子传感器检测到PH 变化后,便将化学信号转变为序列信息。而如果DNA 链有两个连续的相同碱基,则记录到的信号翻倍,从而将其识别。如果不匹配,则记录不到变化。这种技术由于不涉及荧光激发和拍照,则运行时间被大大缩减(仅数小时),无需激光光源,光学系统和照相系统,也不需要荧光标记,规避了这些环节带来的误差。但是其读长不算太长(200bp),并且当遭遇多个连续的相同碱基时,强烈的PH变化会带来误差。
虽然目前新一代技术离真正的大规模投放到市场还有一段距离,但从不少公司更新的信息来看,这个距离正在逐步缩短。
测序的应用在当今很多产业中已经相当普遍,测序服务公司在中国差不多有1000家。而测序技术在医疗检测中的应用也越来越深入。从精准医疗,个性化用药,遗传咨询的大方向,到肠道阴道菌群基因组分析,NIPT,ctDNA等具体的应用场景。从科研领域到日常生活,测序技术逐渐融入我们的生活。各种来源的测序和配套表型临床数据的爆发,也预示着生物大数据时代的到来,结合AI相关技术,我们能做的事情越来越超越人们的想象。对于生物,医疗,计算机领域的工作者来说,一片新大陆就在前方等着大家去开垦,期许已久的生物学的时代真的要来临了。
扩展阅读
什么是NIPT?
无创产前 (Noninvasive Prenatal Testing,NIPT),是目前市场上对测序技术成熟运用的典范。它实现了仅需一管血,即可在孕妇怀孕10周时对胎儿染色体疾病(如唐氏综合征,即21-三体综合征,以及13-三体综合征,18三体综合征等其他三体病症)的风险进行筛查。其运用孕妇外周血中存在着的胎儿游离的DNA片段,通过高通测序的方法进行检查。NIPT的应用解决了其他类型的产前筛查和诊断检测需多次就医、多次抽血,假阳性高的问题。而如绒毛膜取样(CVS)或羊膜穿刺这样虽可以给出大多数染色体疾病的明确结果,但存在让孕妇流产的风险,NIPT则完全避免了这样的风险。如今,NIPT在市场上已经确立了重要地位,在美国,NIPT市场主要为4家公司所覆盖,分别为Sequenom Verinata Health (2013年被Illumina收购) Ariosa Diagnostics 和Natera,而在中国华大基因(BGI)和贝瑞和康是市场的主要占据者。
此时回头看看我们所经历的历史进程,你或许会惊异我们竟然走了这么这么远,而未来好像离我们这么这么近。
来源:AGCTU社区
更多文章请关注基因谷旗下:
基因谷公众号(jiyinguzixun)基因检测领域最新技术进展、最新临床应用、最新行业资讯。
基因谷官网(www.genegood.com):基因检测行业门户网站。