WO2014075296A1

WO2014075296A1 - 核酸测序方法、系统及质控方法、系统

Info

Publication number: WO2014075296A1
Application number: PCT/CN2012/084757
Authority: WO
Inventors: 刘琳; 何毅敏; 尹烨; 席凤; 罗宇芬
Original assignee: 深圳华大基因科技服务有限公司
Priority date: 2012-11-16
Filing date: 2012-11-16
Publication date: 2014-05-22
Also published as: CN104822842A

Abstract

本发明公开了一种高通量核酸测序的质控方法、质控系统以及相应的核酸测序方法和系统。包括使用预测芯片对样品文库进行预测序，根据预测序结果判断样品文库是否合格，不合格样品不进行正式测序，所述预测芯片的容量小于正式芯片的容量。

Description

核酸测序方法、系统及质控方法、系统技术领域

本发明涉及核酸测序技术领域，特别是涉及一种核酸测序文库的质控方法和质控系统，以及一种核酸测序方法和核酸测序系统。背景技术

高通量测序技术 ( High-throughput sequencing ), 又称 "下一代，，测序技术 (Next-generation sequencing technology )。以能一次并行对几十万到几百万条 DNA分子进行序列测定和一般读长较短等为标志。高通量测序技术堪称测序技术发展历程的一个里程碑。该技术可以对数百万个 DNA 分子进行同时测序。这使得对一个物种的转录组和基因组进行细致全貌的分析成为可能。因此也称其为深度测序（deepsequencing) 或下一代测序技术（next generation sequencing, NGS)。根据发展历史、影响力、测序原理和技术不同等主要有以下几种：大规模平行签名测序 ( Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆 ( Polony Sequencing ). 454 焦石舞酸测序 ( 454 pyrosequencing ). 11 lumina (Solexa) sequencing ABI SOLiD sequencing. 离子半导体测序 ( Ion semiconductor sequenc ing ). DNA纳米球测序 ( DNA nanoba 11 sequenc ing ) 等。

PGM测序平台是 Life Technologies公司推出的一种测序仪，测序时间短是其最大的特点， Ion Proton 是基于相同技术的高通量升级版测序仪。

最早的 PGM测序文库建库方法数据量产出较低， 314芯片产量仅为 10M, 随着技术的不断更新，测序仪通量和单张芯片的成本也有所增大，相应的测序风险也在提高，在这样的情况下，如何对测序文库提前进行有效的质控，就成为一个突出的问题。

以 Life Technologies公司的 PGM测序平台的一种样品文库制备方法（参考 Ion Xpress^TMTemplate 200 Kit说明书）为例，建库过程如下：首先将基因组 DNA按照 PGM样品制备方法打断成主带小于 500bp的一系列 DNA片段；然后将因打断形成的粘性末端修复成平末端；再将 DNA 片段能与 y 端带有 "τ"碱基的并含有用于标记样品来源的标签序列的接头连接；连接产物用电泳法选择回收目的片段的分子量大小；然后使用乳液 PCR ( emu l s ion PCR , emPCR )技术扩增两端带有接头的 DNA片段并对最后的 PCR产物进行纯化。

基于桥式扩增构建的测序文库可以用 Ag i lent 2100 , qPCR等进行文库的质量控制，如适用于 I l lumina So l exa测序平台的测序文库。但是涉及 emPCR构建得的文库的质量控制，现在没有专门的仪器或方法，而且随着技术的不断提升， Ion PGM测序仪通量也得到成倍提升，而 Ion

Pro ton测序仪相比较于 PGM的 314芯片通量提高 100倍以上，他们的高通量的特点对其测序文库的质控也提出了更高的要求。

发明内容

本发明的目的是针对现有技术的不足，提供一种能够在采用高通量测序系统进行核酸测序时，有效检测出不合格文库的核酸测序文库质控方法、质控系统，以及核酸测序方法和系统。

为实现上述目的，本发明采用了以下技术方案：

本发明公开了一种核酸测序的质控方法，所述核酸测序采用高通量测序系统进行，所述质控方法包括，在使用正式芯片对样品文库进行正式测序之前，使用预测芯片对样品文库进行预测序，根据预测序结果判断样品文库是否合格，不合格样品不进行正式测序，所述预测芯片的容量小于正式芯片的容量。

本发明还公开了一种核酸测序方法，包括对测序文库进行测序的步骤，以及在此之前采用上述质控方法对测序文库进行质控的步骤。

本发明进一步公开了一种测序文库的质控系统，包括预测序模块，所述预测序模块中设置有预测序芯片，该预测序模块用于在采用正式芯片对文库进行正式测序之前利用预测序芯片对文库进行预测序，预测序结果可用于判断文库是否合格，所述预测序芯片的容量小于正式测序芯片的容量。

本发明同时公开了一种核酸测序系统，包括正式测序模块，用于采用正式芯片对测序文库进行正式测序，还包括上述的测序文库的质控系统，用于在正式测序之前对测序文库进行质控，如果质控结果合格则进行正式测序，且在质控系统中采用预测芯片进行预测序的数据，与正式测序模块中正式测序得到的数据一起汇总共同作为有效测序数据；如果质控结果不合格，则不进行正式测序。

本发明通过在采用高通量测序系统进行核酸测序时，使用比正式芯片容量更小的预测芯片进行预测序，能够根据预测序的结果判断出样品文库是否合格，从而选出不合格文库，避免了不合格文库直接测序造成的材料试剂、时间及人工成本的浪费。附图说明

图 1：文库 DNA与 I SP连接反应示意图。 Em-PCR模板制备中文库 DNA 与 ISP连接，发生反应的示意图。其中灰色球状为 ISP, 黑色曲线表示文库 DNA, 两端的长方形表示两端的接头（ adapter )。

图 2: 314芯片与 316芯片读长的比较。 A: 314芯片； B: 316芯片。其中横坐标表示读长数，纵坐标表示该读长的碱基序列数。

图 3: 314芯片与 316芯片碱基序列质量的比较。 A: 314芯片； B: 316 芯片， C: 316 芯片（未经质控的不合格文库）。其中横坐标表示质量情况，纵坐标表示碱基序列数量。

图 4: 314 芯片与 316 芯片碱基分布的比较。 A: 314 芯片； B: 316 芯片， C: 316芯片（未经质控的不合格文库）。其中横坐标表示读长数，纵坐标表示不同的碱基所占比例。该图显示了每次测序中测到的各种碱基比例 ( base percentage composition along reads )

图 5: 314芯片与 316芯片碱基质量随循环数变化趋势的比较。 A: 314 芯片； B: 316芯片， C: 316芯片（未经质控的不合格文库）。其中横坐标表示读长数，纵坐标表示在此循环中碱基的平均质量值。具体实施方式

本发明是关于采用高通量测序系统进行核酸测序的质控方法、系统以及包括该质控方法的核酸测序方法和系统。

本发明的质控方法主要包括在使用正式芯片对样品文库进行正式测序之前，使用预测芯片对样品文库进行预测序，根据预测序结果判断样品文库是否合格，不合格样品不进行正式测序，所述预测芯片的容量小于正式芯片的容量。

本发明的核酸测序方法，包括对测序文库进行测序的步骤，还包括在对测序文库进行测序的步骤之前，采用本发明的质控方法对测序文库进行质控的步骤。在本发明的测序方法中，如果质控结果合格，那么采用预测芯片进行预测序的数据，与后续正式测序得到的数据一起汇总共同作为有效测序数据。本发明的核酸测序方法，还可以包括制备测序文库的步骤，所述制备测序文库的步骤包括，将 DNA样品打断成片段后对末端进行修复反应，并与接头进行连接，再对目的片段进行乳液 PCR 扩增，之后回收目的片段，得到测序文库。

本发明的测序文库的质控系统，包括预测序模块，其中设置有预测用预测序芯片对文库进行预测序，预测序结果可用于判断文库是否合格，预测序芯片的容量小于正式测序芯片的容量。

本发明的核酸测序系统，包括正式测序模块以及上述的测序文库的测序文库的质控系统用于在正式测序之前对测序文库进行质控，如果质控结果合格则进行正式测序，且在质控系统中采用预测芯片进行预测序的数据，与正式测序模块中正式测序得到的数据一起汇总共同作为有效测序数据；如果质控结果不合格，则不进行正式测序。

为了能够从预测序得到的数据中有效分析出样品文库是否合格，预片的容量为正式芯片容量的 1 % ~ 10%。

本发明的方法或系统所适用的高通量测序系统，优选是使用乳液 PCR ( emul s i on PCR , emPCR ) 的高通量测序系统。更优选的是目前常用的 Ion Tor rent测序平台、 ABI SOL iD测序平台和 Roche 454测序平台。其中, Ion Torrent 测序平台中的 I on PGM ( Ion Per sona l Genome Machine ) 和 Ion Pro ton尤其适用于本发明的质控方法。

在本发明的方法或系统中，利用预测芯片对样品文库进行预测序时，可以一次仅检测一个样品文库，也可以对多个不同来源的样品文库通过增加 index标签序列，混合在一起，然后同时在一个预测芯片上进行一次检测。混合检测得到的结果也能有效反应出各个样品文库的质量，并据此判断其合格与否，并不因多个样品文库混合同时检测而具有相比较单一文库单独检测更低的准确性。

本发明的方法或系统最适合应用于采用 Ion PGM和 Ion Proton 系统进行测序的过程。由此，与 Ion PGM和 Ion Proton相配套的芯片中，具有最低容量的芯片 PGM 314芯片便可作为本发明方法或系统的首选预测芯片。 Ion PGM的配套芯片包括 314芯片、 316芯片、 318芯片，其容量及市场价格可参考如下表 1:

表 1

在本发明一个具体的实施方式中，基于目前 Life technologies公司的 PGM及 Ion Proton测序平台提供的文库制备方法，将一个基因组 DNA样品构建的文库，如大肠杆菌基因组，先在 314芯片（容量 10M)上进行预测序，得到预测序结果数据，分析预测序的结果数据来进行质控，如果数据符合要求，则说明文库合格，再将此文库在 316芯片（容量 100M ) 上进行正式测序，从而得到良好的数据效果。在此基础上，对于多个不同来源的文库，可通过在文库中加入 index序列对多个文库同时进行质控，再分别上机或混合上机（根据测序仪测序通量及所需要的数据量来选择），得到预期的数据结果。对于 Ion Proton 测序平台，它是 Life Technologies公司在继 Ion PGM之后最新推出的新一代测序仪。它的上市时间是 2012年 9月。 Ion Proton测序平台没有专门的质控方法，其芯片类型有 PI和 ΡΠ, 容量都大于 1G, 价格也远高于 Ion 314、 316或 318 芯片，各芯片都是一次性使用。由于容量相对低但价格绝对低廉的 Ion 314、 316或 318芯片可兼容于 Ion Proton平台，由此，利用本发明所述的质控方法，在利用 PI或 ΡΠ进行正式测序以前，采用容量更小的 Ion 314、 316或 318芯片优选 314芯片进行预测序，可在预测序过程中付出相对小的代价选出绝大部分不合格文库，免除大部分不合格文库直接上机而造成的损失。

本发明可同样灵活地运用于文库构建时涉及 emPCR过程的文库的质控上, 如应用于 Life technologies (applied biosys terns) SOLiD 和 Roche 454测序平台。这两种高通量测序平台各自都只有 1种类型的芯片，也没有专门的质控方法，测序时需要人工或机器实时监控。利用本发明质控方法，如设计或购买与 S01iD、 454或 PGM平台兼容的且容量仅为所需数据量至少 1%的芯片来进行文库质控，可检测出大部分不合格文库，免除不合格文库直接测序造成的材料试剂、时间及人工成本的浪费，有很强的实用性。在 SOliD及 Roche 454测序平台上， Ion 314芯片也适合作为预测芯片用于质控的预测序过程，这时预测序过程可以在 Ion Torrent 测序平台上进行。如果放宽费用的考虑， life technologies 316、 318芯片可以代替 314芯片用于此处的预测序。

本发明的方法或系统中，所检测的文库，其制备方法可以基于目前各测序平台所提供的标准文库制备方法来进行，比如基于目前 Life technologies公司的 PGM测序平台提供的文库制备方法。首先将总 DNA 样品利用机械法或酶切法打断成一定长度的片段，然后对末端进行修复反应，并与接头进行连接。目的片段与接头连接后，再通过特定的 PCR 引物对目的片段进行 Em-PCR扩增，最后通过琼脂糖电泳并切胶回收目的片段文库。

在本发明的一个具体实施方式中，将构建好的文库（参见实施例 1, 使用大肠杆菌基因组 DNA为材料构建的人类 pair-end DNA标签文库），按设计目的进行比例混合后，使用 PGM 314芯片对文库进行预测序，以预测文库的质量和定量浓度，并与使用相同读长的 316芯片比较质量值的变化（即看这个文库在测序总读长分别为 100和 200个碱基的情况下，比较前 100循环的文库质量值变化）。质量值（Q-Value) 可以反映测序质量，介于 0-40之间，在此范围内，越高表示质量越好。 Q20是指质量值大于 20的碱基在所有碱基中所占的比例，可以反映测序出来的序列质量好坏，数值越接近 1, 说明测序质量越好。使用 314 芯片的文库 Q20 平均值在 80.7%, 使用 316芯片质量值一直都维持在 60.9% (如图 3 ), 两者的差异在 20%,这是由于 314芯片读长较短（ 314和 316芯片的测序总读长分别为 100和 200个碱基），质量会较 316芯片更好；也从另一方面反映出，如果以 314芯片作为 316芯片的质控用芯片，则 314芯片的 Q20需降低一定数值。本方法中使用的 314芯片测序读长为 100个碱基， 316芯片测序读长为 200个碱基，测序读长增加会造成测序质量的下降，表现为 Q20值的降低，这个降低的趋势在不同读长不同产量的芯片上是一样的，由此可以利用产量较低成本也较低的 314芯片测序质量变化，看出相同文库在 316芯片上质量变化情况。读簇碱基分布及其循环变化趋势也体现出相似的质量情况。

在本发明的上述具体实施方式中，对于采用例如 314芯片作为预测芯片进行质控时，文库质量是否合格，本领域技术人员可根据 314芯片的预测序结果通过经验值判断，通常而言，对于 Illumina hiseq2000 测序平台 100PE ( pair-end)文库构建的经验， Q20大于 80%可判断为文库合格。这样在本发明中，采用 314芯片作为预测芯片时，在采用经验值判断的基础上，也可以直接确定便于操作的判断标准，就是将质控结果 Q20> 80%的文库确定为合格文库，可用于后一步正式测序，反之则不合格，可避免后步大容量芯片的浪费。并且，对于质控合格的文库，采用预测芯片进行预测序的数据，也是有效数据，可汇总入后续正式测序得到的数据中，用于后续分析。

图 3、图 4、图 5分别给出了 314芯片与 316芯片碱基序列质量的比较图、碱基分布的比较图、碱基质量随循环数变化趋势的比较图，其中 A: 314芯片； B: 316芯片（经质检合格的文库）， C: 316芯片（未经质控的不合格文库）。由这三幅图可清楚地看到，质检合格及不合格的文库，其无论是碱基序列质量、碱基分布还是碱基质量随循环数变化趋势，均具有相当的区别。图 A为 lOObp读长的 314芯片测序结果，图 B为 200b_P 读长的 316芯片正常文库测序结果，图 C为 200bp读长的 316芯片正常文库测序结果。从图 3结果来看，随着读长增加，横坐标质量值也表现出不同趋势，合格文库在前两个图中高质量值数据都高于不合格文库数据，不合格文库总体 Q20值也低于合格文库。在图 4中，合格与不合格文库的差异更为明显，合格文库的碱基为均勾分布的，且这个趋势和读长是同步的，而不合格文库的碱基分布呈现明显波动。图 5反映了纵坐标质量值随横坐标读长的变化趋势热度图，颜色越浅表示碱基在该处的分布比例较高，在合格文库中，高质量的碱基比例明显高于不合格文库，并且 314芯片和 316芯片具有一致的变化趋势。

l i fe techno l og ies 的 Ion prot on , 由于 Ion pro ton测序平台的技术基础和 PGM完全一致，所以可以同样用成本低廉的 314芯片和 PGM 测序平台作为 I on prot on 的质控手段，此方法可同时应用于其他使用 em-PCR技术的测序平台，如 ABI的 SOL iD测序平台和 Roche的 454测序平台。下面通过具体实施方式结合附图对本发明作进一步详细说明。

在本申请的实施例中所用试剂和仪器的列表：

主要实验仪器列表

表 2

仪器名称型号厂家

热循环仪（PCR仪） Veriti Thermal ABI

Cycler

NanoDrop 1000 ( DNA浓度 Spectrophotometer Thermo Fisher 检测仪器） Scientific

电泳槽 DYCP-31DN 北京六一仪器厂电泳仪 DYY-6C 北京六一仪器厂凝胶成像系统 Tanon 上海天能科技有限公司

DarkReader TransLife D195M Clare Chemical technologiestor (切胶仪器) Reasearch

Covaris打碎仪 S-2 Covaris

Thermo mixer (力口热混匀仪 Thermomixer Eppendorf

哭 ) comfort

^[氐温离心机 5417R Eppendorf

台式离心才几 5418 Eppendorf

台式离心才几 SVC-75004334 Heraeus

微波炉 MM721AAU. 美的

热循环仪（PCR仪） BS 124S Sartorius 试剂

表 3

试剂名称

10 mM dNTP Mix ( 10 mM dNTP 混合液） part # 1000564

DNA Polymerase I ( DNA聚合酶 I ) part # 1000577

5xT4 DNA Ligase Buffer ( 5xT4 DNA连接酶緩 part # 1000581 冲液 )

T4 DNA Ligase ( T4 DNA连接酶） part # 1000580

10x Restriction Buffer ( 10x限制性酶切緩冲液 ) part # 1000583

5 x Phusion HF Buffer (5x Phusion高保真酶緩冲 part # 1000585 液）

2xPhusion Polymerase (Phusion高保真酶) part # 1000584

25 mM dNTP Mix(25 mM dNTP混合液） part # 1001663

25 bp Ladder part # 1001662

1 Ox Gel Elution Buffer(10x溶胶緩冲液） part # 1000571

Resuspension Buffer (溶解緩冲液 ) part # 1001388

Sera- mag Magnetic Oligo(dT) Beads(01igo(dT) part # 1002545 磁珠）

Ultra Pure Water (超纯水） part # 1000467

10x Polynucleotide Kinase Buffer B904(Enzymatics) lOx blue buffer B011 (Enzymatics) dATP P0756L(NEB)

2x Rapid ligation buffer B 101 (Enzymatics)

Index PE Adapter Oligo Mix

注：若实验中所列试剂未在上表中，则为 Life technologies PE DNA 样品制备试剂盒（ Ion OneTouch™ System Template Kit, 4468660 , 购自 Life technologies ) 内试剂。实施例 1 PGM测序非标签文库的构建具体实例

以下是按照 life technology公布的实验流程操作的常规步骤。

1. PGM测序片段文库构建

1) 全基因组打断

将 Ecoli g DNA打断成为目标长度片段。使用 Covaris® S2 System 进成分浓度取样体积

Ecoli 100ng/ul ΙΟμΙ

H₂0 90μ1

总量 ΙΟΟμΙ

打断产物纯化 QIAquick PCR Purification Kit 回收纯化，溶于 40ul EB。

2) 末端修复反应

Ecoli故 DNA末端 4爹复反应 ,体系口下 ( Use buffer and enzyme mix supplied in the Ion Xpress™ Plus Fragment Library Kit ):

反应体系 200μ1, 其组成是：

表 6

试剂体积 /反应

片段化 DNA 39

Nuclease-free Water 119 L

5X End Repair Buffer 40 End Repair Enzyme 2 μΐ^

里 200

反应条件为：室温孵育 20min

.纯化，溶于 25μ1的

EB ( QIAGEN Elution Buffer ) 中

3) 连接接头（adapter )反应

文库 DNA的连接接头 ( adapter )反应 , 体系口下 ( Use reagents supplied in the Ion Fragment Library Kit ):

反应体系 lOOul, 其组成是：

表 7

反应条件为： 25 °C 15min , 72 °C 5min, 4°C∞

反应产物经 1.8倍体积 Ampure Beads(Beckman Coulter Genomics) 纯化回收纯化，溶于 20μ1的 EB中。

4) 目的片段选择

上一步骤中纯化后的 DNA在 2.0%的回收胶中电泳。条件为 100V , 2h。选择目的片段 180-200bp或是 280-300bp进行切胶回收。回溶 40μ1ΕΒ中。

2. Em-PCR模板制备 2. 1 200bp文库参照 Ion Xpress™ Template 200 Kit说明书操作规范以下试剂源自 Ion Xpress™ Template 200 Kit

1) 确定合适的文库浓度

以 Agilent 2100检测结果为准，将上一步制备好的文库进行稀释，最终浓度达到每 18μ1中含有 280* 10⁶个分子，即满足 280* 10⁶molecules per reaction (280* 10⁶ ISP/reaction)

2) 生成油包水 ISP模板：

参照 Ion Xpress™ Template 200 Kit说明书操作规范，分别制备 IKA DT-20 油相（ 9ml ) 和 ISP,以及 PCR水相 MIX , PCR水相 MIX组成成分是：

表 8

最后将稀释合格的文库（ 18μ1/反应）与 PCR水相 MIX混匀，进行 PCR反应。反应程序如下：

表 9

阶段步骤温度时间

保持变性 94 °C 6分钟

循环变性 94 °C 30秒

(40cycles) 退火 58 °C 30秒

延伸 72 °C 90秒

循环变性 94 °C 30秒

(l Ocycles) 延伸 68 °C 6min 保持 - 10。C 00

3) 制备 ISPs单链模板

文库中 DNA与 ISP连接并复制（附图 1 ), 反应产物为 ISPs油包水的状态。产物富集后，加入带有生物素的 My one Beads与 ISPs 扩增产物特异性结合然后加入裂解液 Melt-off solution将 ISPs上的 DNA 模板由双链变为单链。，从而获得单链 ISPs。

Melt-off solution成分: ¾口下：

表 10

经 Qubit 2.0 ( Invitrogen公司）检测合格满足上机测序要求。

2.2 100bp 文库参考 IonOne Touch System操作（以下试剂源自 the Ion One Touch™ Template Kit )

1) 确定合适的文库浓度

以 2100检测结果为准，将上一步制备好的文库进行稀释，最终浓度达到每 5μ1 中含有 280*10⁶个分子，即满足 160*10⁶molecules per reaction (160*10⁶ ISP/reaction)

2) 生成油包水 ISP模板

参考 Ion One Touch™ Template Kit操作说明，将油相和回收 ISP需要用的液体各 50ml安装在 One Touch自动化操作系统后，安置配套的 PCR 反应板，并配置 PCR水相 mix 。 PCR水相 mix成分如下：

表 11

顺序试剂体积 ( ΐ )

1 Nuclease-free water 595

2 Ion One Touch™Reagent Mix 200 3 Ion One Touch™Enzyme Mix 100

4 Diluted library 5

5 Ion Sphere™ Particles 100

里 900

^！寻配置好的 mix 放置 One Touch system 上，点击开始运行，自动 4匕操作系统即开始进行 PCR, 文库 DNA与 ISP连接并复制。在 PCR 程序结束后，自行进行 ISP的富集工作

3) 制备 ISPs单链模板

这一步骤参照 Ion One Touch™ Template Kit操作说明，将试剂放于指定位置，由 One Touch 自动化系统中的机器 ES完成。

Melt-off solution成分: ¾口下：

表 12

单链 ISP经 Qubit 2.0 ( Invitrogen公司）检测合格满足上机测序要求后进行下一步骤。实施例 2 所构建文库的测序

使用实施例 1所得的文库，分别使用不同的测序芯片（314/316),安排在 PGM进行测序（严格按照仪器推荐的流程操作）。

测序操作流程详见 PGM操作说明书。 100bp 文库采用 100bp测序试剂， 200bp 文库采用 200bp 测序试剂。安装对应的测序芯片（如 314 芯片， 316芯片， 318芯片等）

数据中 lOObp文库和 200bp文库分别采用 314芯片和 316芯片。在芯片上加入酶和制备好的单链 ISPs进行测序。其中， 314芯片作为预测芯片，经 314芯片预测后结果为文库合格（Q20平均值在 80.7% ), 之后再采用 316芯片进行正式测序。在以上具体实施方式中，利用本发明的质控方法，使用 314和 316 两种芯片进行测序。使用 314芯片时，平均读长为 lOObp, Q20平均值在 80.7%, 使用 316芯片测序时，平均读长为 200bp, 质量值一直都维持在 60.9% (如图 3 ), 两者的差异在 20%, 这是由于 314芯片读长较短，质量会较 316芯片更好；也从另一方面反映出，如果以 314芯片作为 316 芯片的质控用芯片，则 314芯片的 Q20需降低一定数值（如 20% ), 可有效反映文库的质量情况。如果使用标签序列对不同文库进行标记，则可以在低成本的 314芯片上同时检测多个不同文库的质量。

以下表格写明了各芯片在不同读长的情况下测序的预期运行时间以及预期输出的数据量。由表格看出，低容量芯片运行所需时间较短且其容量满足多个文库混合质控所需数据量，可节省对不合格文库直接测序花费的时间。如 10个文库混合采用 314芯片进行质控则只需要花费 1.5h, 里边有一文库不合格，不合格文库直接 318测序花费 2.4h, 节省 0.9h; 若没有一文库不合格，这质控数据可直接作为测序数据使用，也没有多花费时间。

表 13

参考文献 1. Ion Xpress™ Template 200 Kit说明书 . Life technologies.

2. Ion OneTouch™ Template Kit操作说明 . Life technologies. 尽管本发明的具体实施方式已经得到详细的描述，本领域技术人员将会理解。根据已经公开的所有教导，可以对那些细节进行各种修改和替换，这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。

Claims

权利要求

1、一种测序文库的质控方法，所述质控方法包括，在使用正式芯片对文库进行正式测序之前，使用预测芯片对文库进行预测序，根据预测序结果判断文库是否合格，不合格文库不进行正式测序，所述预测芯片的容量小于正式芯片的容量。

2、根据权利要求 1所述的测序文库的质控方法，其特征在于：所述预测芯片的容量至少为正式芯片容量的 1%。

3、根据权利要求 2所述的测序文库的质控方法，其特征在于：所述预测芯片的容量为正式芯片容量的 1% ~ 10%。

4、根据权利要求 1 ~ 3任意一项所述的测序文库的质控方法，其特征在于：所述测序文库的构建包括乳液 PCR过程。

5、根据权利要求 4所述的测序文库的质控方法，其特征在于：所述预测序为利用预测芯片对一个文库或者混合文库进行检测。

6、根据权利要求 5所述的测序文库的质控方法，其特征在于：所述混合文库带有标签序列标记。

7、根据权利要求 5所述的测序文库的质控方法，其特征在于：所述测序在高通量测序系统上进行，所述高通量测序系统选自 Ion Torrent 测序平台、 ABI SOL iD测序平台、 Roche 454测序平台中的至少一种；所述 Ion Tor rent测序平台包括 I on PGM和 I on Prot on。

8、根据权利要求 7所述的测序文库的质控方法，其特征在于：所述预测芯片为 PGM 314芯片、 316芯片和 318芯片中的至少一种，所述预测序在所述 I on Torrent测序平台上进行。

9、根据权利要求 8所述的测序文库的质控方法，其特征在于：所述预测序结果若 Q20大于 80% , 则判断文库为合格文库，所述 Q20是指质量值大于 20的碱基在所有碱基中所占的比例。

10、一种核酸测序方法，包括对测序文库进行测序的步骤，其特征在于：在对测序文库进行测序的步骤之前，还包括对测序文库进行质控的步骤，所述对测序文库进行质控是采用权利要求 1 ~ 9中任意一项所述的质控方法进行。

11、根据权利要求 10所述的核酸测序方法，其特征在于：在所述测序方法中，如果质控结果合格，那么采用预测芯片进行预测序的数据，与后续正式测序得到的数据一起汇总共同作为有效测序数据。

12、根据权利要求 11所述的核酸测序方法，其特征在于：还包括制备测序文库的步骤，所述制备测序文库的步骤包括，将 DNA样品打断成片段后对末端进行修复反应，并与接头进行连接，再对目的片段进行乳液 PCR扩增，之后回收目的片段，得到测序文库。

13、一种测序文库的质控系统，其特征在于：包括预测序模块，所述预测序模块中设置有预测序芯片，该预测序模块用于在采用正式芯片对文库进行正式测序之前利用预测序芯片对文库进行预测序，预测序结果可用于判断文库是否合格，所述预测序芯片的容量小于正式测序芯片的容量。

14、根据权利要求 13所述的系统，其特征在于：所述预测芯片的容量至少为正式芯片容量的 1 %。

15、根据权利要求 14所述的系统，其特征在于：所述预测芯片的容量为正式芯片容量的 1% ~ 10%。

16、根据权利要求 13 ~ 15中任意一项所述的系统，其特征在于：所述测序文库的构建包括乳液 PCR过程。

17、根据权利要求 16所述的系统，其特征在于：所述预测序为利用预测芯片对一个文库或者混合文库进行检测。

18、根据权利要求 17所述的系统，其特征在于：所述混合文库带有标签序列标记。

19、根据权利要求 17所述的系统，其特征在于：所述测序在高通量测序系统上进行，所述高通量测序系统选自 I on Torrent测序平台、 ABI SOL iD测序平台、 Roche 454测序平台中的至少一种；所述 Ion Torrent 测序平台包括 Ion PGM和 I on Pro ton。

20、根据权利要求 19 所述的系统，其特征在于：所述预测芯片为 PGM 314 芯片、 316 芯片和 318 芯片中的至少一种，所述预测序在所述 Ion Tor rent测序平台上进行。

21、根据权利要求 20所述的系统，其特征在于：所述预测序结果若 Q20大于 80% , 则判断文库为合格文库，所述 Q20是指质量值大于 20的碱基在所有碱基中所占的比例。

22、一种核酸测序系统，包括正式测序模块，用于采用正式芯片对测序文库进行正式测序，其特征在于：还包括权利要求 13 ~ 21中任意一项所述的测序文库的质控系统，用于在正式测序之前对测序文库进行质控，如果质控结果合格则进行正式测序，且在质控系统中采用预测芯片进行预测序的数据，与正式测序模块中正式测序得到的数据一起汇总共同作为有效测序数据；如果质控结果不合格，则不进行正式测序。