新一代测序技术

如题所述

第1个回答  2022-07-02

第一代测序技术以“Sanger法”为代表,实现了测序技术从无到有的飞跃,人们借助其完成了“人类基因组草图”,以及动植物、微生物等模式生物的基因组测序。一代测序经发展实现了自动化,但总体而言通量低、流程长、成本高,难以商业化。新测序技术以不可抵挡的势头发展起来。

新一代测序技术(next-generation sequencing, NGS)的起点是2005年以来Roche 454、Illumina GA/HiSeq、Life SOLiD/Ion Torrent、PacBio RS技术的发明,新技术使测序通量快速增加,测序成本极大降低。本文主要介绍Illumina测序技术、Pacific BioSciences SMRT RS测序技术、Oxford纳米孔测序技术及华大平台的DNBSEQ TM 测序技术。

该技术是目前应用最广泛的新一代基因组测序平台,它使用边合成边测序技术实现大规模平行测序。它最早是由Solexa公司开发,所以也称为Solexa测序技术。Illumina测序平台有多种仪器选择,如超大通量、适合测序中心和测序公司的 HiSeq 系列测序仪,也有适合中小型实验室测序和医院医疗诊断测序使用的 MiSeq NextSeq500 测序仪,也有专门用于医疗诊断测序用的 MiniSeq 等。测序模式分为 高通量模式 快速模式 。其中,高通量模式可兼容更多的样本量及应用种类;而快速模式测序速度更快、单次运行成本更低。

Solexa测序技术的原理网友“星空Idealist”在“知乎”、“Z_Y_H”在“”等平台做过详细介绍:

( 第二代测序原理的详细解析! - 星空Idealist的文章 - 知乎);

( illumina 双端测序 - Z_Y_H的文章 - )。

下面只做简单概括。该方法的第一步是 建立测序文库 (sequencing library preparation)(图1)。基因组打碎成小片段,双端补齐,3’加A尾,添加Illumina专用接头(一端有oligo T),该接头含有一个酶切位点,且为环状非互补链,故形成一个“球形”接头。当用限制酶进行切割后,形成“Y形”末端,从而能按部就班逐链复制。在双链末端加入与后续扩增引物互补的片段(通过两次复制实现,所加两端引物序列不同,设为P5、P7),以及在引物内侧加入标记(barcode)(所加两端标记不同),如有需要可用 Taq 酶补齐至平末端。做好以上工作,需行纯化,仅将正确添加接头的序列用于后续反应,去除引物、酶等杂质。以上操作可一次性对整个文库进行。

提纯后进行文库的 扩增成簇过程 (cluster generation),该过程的目的是为使测序信号放大。经变性的测序文库在有八个泳道(lane)的芯片(flow cell)上,与固化在泳道玻片壁上的寡核苷酸特异性互补结合(P5’、P7’),经一轮复制(5’->3’),模板被切断并洗掉,固定在芯片的寡核苷酸合成为互补链。然后开始桥式扩增(bridge amplification)把带有待测DNA片段的文库扩增到1000个拷贝左右,每个拷贝都有相同的DNA序列,这样就形成了簇(cluster)。最后一次扩增产物变性为单链,这些单链可用来双端测序(paired-end sequencing),但通常的做法是利用甲酰胺基嘧啶糖苷酶(Fpg)的8-氧鸟嘌呤糖苷(8-oxo-G)选择性切断作用,选择性将正向或反向序列从接头处切去,避免因链间距过近对序列添加的影响。若先切去反向序列,则测完后,再重复前述反应至选择性切割时,切去正向序列,进行反向测序即可。

第三步是 测序过程 。Illumina平台使用SBS技术和3’端可逆屏蔽终结子技术(3’-blocked reversible terminator)进行测序。3’端可逆屏蔽终结子技术利用有荧光标记的特殊核苷酸,这种核苷酸的3’羟基被化学基团屏蔽,导致每次DNA链合成都只能加入一个核苷酸,但当荧光图像记录完后,该化学屏蔽基团便通过酶切方法切掉,3’端恢复连接能力,如此周而复始。可以想象,由于起初变性文库中包含模板-互补链(二者的标记没有区别),在一次过程中同时被测序,因此在收集单向测序(single read sequencing)结果时需进行互补链识别,以免序列拼接发生混乱。正反双端测序,极大提高了测序效率。

由于Illumina测序技术使用扩增成簇的信号放大原理,使其读长无法达到一代测序水平,因为当扩增至数百碱基后,受核苷酸浓度、酶活等影响,簇内碱基添加将不再同步,不同步则信号混乱,导致读序不准。

该技术是Pacific BioSciences推出的 单分子实时(single molecular real time)DNA测序技术 ,基于边合成边测序原理。该技术主要特点是读长长,平均序列在10kb以上,最长读长可达40kb。它以SMRT Cell为测序载体,SMRT Cell是一张厚度为100nm的金属片,一面带有15万个(2014年)直径为几十纳米的小孔,称为 零模波导 (zero-mode waveguide, ZMW),也称纳米孔。测序时,系统将测序文库、DNA聚合酶和带有不同荧光标记的dDNA放置到纳米孔底部进行DNA合成反应。通常一个纳米孔固定一个DNA聚合酶Fenix和一条DNA模板。

该方法的特别之处在于 测序文库不需要扩增 ,因为零模波导能极大消除噪音荧光背景,而使单分子反应释放的荧光也能被准确记录。此外,SMRT技术用于检测标记的荧光基团与脱氧核苷酸的结合位置不是在碱基上,而是在5’磷酸基团的第3个磷酸基上,这样在dNTP于测序模板互补结合到测序引物上发生缩合反应后,荧光基团就随焦磷酸一起被切掉了,省去酶切步骤。

2014年Oxford Nanopore公司推出了几款基于纳米孔测序技术的测序仪MinION、PromenthION、GridION。其基本原理为:在充满了电解液的纳米级小孔两端加上一定的电压,可以很容易地测量通过此纳米孔的电流强度。纳米孔的直径只能容纳一个核苷酸通过,当核苷酸通过时,纳米孔被核苷酸阻断,通过的电流强度随之变弱。由于四种核苷酸碱基的空间构象不同,它们在通过纳米孔时,被减弱的电流强度变化程度也就有所不同。因此,只需检测DNA通过纳米孔时检测电流强度的变化,即可实现实时测序。

该法亦无需文库扩增,读长长,实时,单分子,可以极大降低测序成本。

该技术起源于Complete Genomics,改进于华大。下面根据华大官网文章简要说明该方法的原理。

按照图2的流程,华大基因使用DNA纳米球技术来扩增DNA序列,在该技术中,DNA被分割成约100碱基对的片段。该片段的每一侧与第一种接头,即接头1连接。连接后的DNA片段被扩增,通过将两端的接头结合而形成环状连接的序列片段。该环状DNA片段被切割以加入第二种衔接子,即接头2,并重复扩增和环化过程。一旦将四种接头,即接头1,2,3和4(四种接头的序列不同,有些是与引物互补的寡核苷酸,有些是标记物等)加入到DNA片段中,则通过滚环扩增最后的环状DNA以产生 DNA纳米球 (DNA nanoball, DNB)。滚球扩增时不切断各拷贝,而利用某种方法使扩增后变性但又不影响延伸,得到一团多拷贝的纳米球。将纳米球固定在芯片上的网状小孔内。

测序使用联合探针锚定聚合技术(combinatorial probe-anchor ligation sequencing, cPAS)和多重置换扩增的双末端测序法(MDA-PE)增加测序读长,可测得100bp/150bp的双端序列。目前为止,并没有对联合探针锚定聚合技术的详细披露。 MDA-P的具体原理是:经复制延伸完成第一链(Forward Strand)的测序后,在具备链置换功能的高保真聚合酶的作用下,除去第一链模板同时合成第二链(Reverse Strand),并通过DNA分子锚,进行第二链的测序。

与其他二代测序相比,DNBSEQ TM 测序技术基于DNB,DNB以最初模板扩增,不同于PCR的指数增长,最重要的是 其不会使扩增过程中产生的错误累积

[1] 陈浩峰. 新一代基因组测序技术[M]. 第一版. 北京: 科学出版社, 2016.
[2] 第二代测序原理的详细解析! - 星空Idealist的文章 - 知乎.
[3] illumina 双端测序 - Z_Y_H的文章 - .
[4] 华大科技-产品服务-全外显子测序-产品介绍 .
[5] 解密人类基因组:下一代测序 -(一) - Jing Zhou的文章 - LEXOLOGY.