CN117887812A

CN117887812A - 高通量测序质控用文库及其制备方法和应用

Info

Publication number: CN117887812A
Application number: CN202410289937.9A
Authority: CN
Inventors: 陈辉; 王旭彤; 莫敏俐; 陈钊; 刘玉忠; 张艳; 万冲; 侯光远; 张峰; 许军普
Original assignee: Jiaxing Accb Diagnostics Ltd; Jiaxing Yakangbo Biotechnology Co ltd; Beijing ACCB Biotech Ltd; Yangtze Delta Region Institute of Tsinghua University Zhejiang
Current assignee: Jiaxing Accb Diagnostics Ltd; Jiaxing Yakangbo Biotechnology Co ltd; Beijing ACCB Biotech Ltd; Yangtze Delta Region Institute of Tsinghua University Zhejiang
Priority date: 2024-03-14
Filing date: 2024-03-14
Publication date: 2024-04-16
Anticipated expiration: 2044-03-14

Abstract

本发明涉及基因测序技术领域，尤其涉及一种高通量测序质控用文库及其制备方法和应用。本发明提供的高通量测序质控用文库在每个碱基位置的碱基占比均是均衡的。将本发明提供的高通量测序质控用文库与待测样本文库混合后共同上机测序，可消除因待检样本文库碱基序列的不平衡性所导致的测序质量降低，提高对不平衡文库测序的准确性。

Description

高通量测序质控用文库及其制备方法和应用

技术领域

本发明涉及基因测序技术领域，尤其涉及一种高通量测序质控用文库及其制备方法和应用。

背景技术

高通量测序技术又称下一代测序技术（Next-generation sequencing，NGS），一次能对几十万到几百万条核酸分子进行序列测定，是目前发展最为迅速的技术之一，其已深入生命科学的各个领域，在肿瘤检测、新药研发等方面前景广阔。高通量测序技术通量大、灵敏度高等优点已使其成为目前临床分子检测中最重要的应用平台之一。

高通量测序仪在测序时会采用前几十个测序Cycle信号来确定簇的位置和密度等信息，这些信息影响了测序信号采集、测序碱基质量。碱基不平衡文库（即每个测序Cycle中A、G、C、T四种碱基的含量远远偏离25%）在测序时会导致测序仪荧光信号采集失真，大大降低碱基识别的准确性，进而影响测序结果的准确性。尤其在甲基化DNA测序中，常通过亚硫酸氢盐使DNA中未甲基化的C转化为U，进而在PCR过程中转化为T，这种转化使待测序的DNA中C碱基占比大大降低，很容易导致测序中碱基的不平衡。

为解决这一问题，目前主要采用混合质控文库与待检样本文库共同上机测序的方式。但是现有质控文库主要通过非人源DNA（如PhiX噬菌体DNA）来制备，通过片段筛选方式获得一定长度范围的文库，最终混入待检样本文库中一同测序。这种方法的主要问题是：制备过程中涉及片段筛选、获得的质控文库非固定序列容易导致批间存在差异。

有鉴于此，特提出本发明。

发明内容

为解决上述技术问题，本发明提供了一种高通量测序质控用文库及其制备方法和应用，可有效降低因待测文库碱基不平衡导致的碱基测序质量下降问题。

具体的，本发明的技术方案如下：

第一方面，本发明提供了一种高通量测序质控用文库，由包括序列插入片段的模板DNA经PCR扩增得到；所述序列插入片段包括序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d；所述序列插入片段a的核苷酸序列如SEQ ID NO.1所示；所述序列插入片段b的核苷酸序列如SEQ ID NO.2所示；所述序列插入片段c的核苷酸序列如SEQ IDNO.3所示；所述序列插入片段d的核苷酸序列如SEQ ID NO.4所示。

序列插入片段a：

CGAGGATTCAACAAGGTGATCGAAGTCGACAGATCCAGAGAGACGGGCTTCAAAGCTGCGTGACGACGCTTGCGAGTCCGTATCAATATCCTCACAATAAGCACACGTGACCGTTGGTTGAACAGCACAGGACGAGCTGACCAGAAGCACTATTATATCGCTTAACGGCTCTTGAGCCAGTGTGCGTTACCTTGCAGCAATCGAGGCCGTCCGTTAATTCCTCTTGCATTCATATCGCGTATTGTTGTCTCTGTACGCGCTTACTTGGATCAGGATGACATAGCTTCTTACAGGAGCGTC

序列插入片段b：

ACTTAGACTGCAGCTAGTCGATGGTCGACTGATCGTGACTCCTGATATCATGCCTAACGCGATGTGTAGCATGCTAGTACGTGACTGCATGCATGCTAGCTAGTCACGTCAGTCATCAGTGCATCGTACTCGATGCTGTCGTCAGTAGCTACAGGACAGATCGCTGACGATGCATAGTCACTGATCGATGGCATGCATGCATAGCATGTCAGTCGTGACTGAGACTACGATGCTAGCATGCAGTCGACAGTCAGCTAGTAGACTGACTGCACTATCTCACCTAGCGTAGCTCACGTACAA

序列插入片段c：

GACATCGAGTGTTGCTACTAGCCTAGTCTATCGAAGCTGCTACTCACAGGACTTCGGATACTCACTGTAGCATACCAGTACGCTGGCTGATAGCTGCGTGATCGTGTCAGTACGCATGCACTGCATGTGCATGCTAGACTAGGCTCTAGAGTCACGTGATGACTGACTAGACGTCTAAGTACACGTACGTTAGCATCGCTGACTATAACAGTAGACTCGATGAGACTGACGCAGCTATCAGCACGACGTCAGTCGATACGACGACGTATGTTCTCACTGTAGCTACAGCTGGTATCGTCG

序列插入片段d：

TTGCCTCGACTGCTACCAGCTATCCAATGGCTCGTATCTAGTGATCTGACGTGGATCTATACGTACACTAGCATGTCAGTACAGTCAGCGAGTGATGCCTCGTAGTAACTGTAAGCACACTGTGTACGTATCTACTACAGTATTCGCTTGCGGCTCGCTCAGAGCTTATCGAACGCTGTCGACTAACGCAAGCATGTATGCGTCTCGTAGTACACGCGAGACTCGAGTCGATGCGATGACTGCAACTAGAGACATGCTATCGTGACACCAGGACGGAGTGGCTAGAGCAGATCTCATAGT

上述4种序列插入片段的长度均为300bp，其各自的4种碱基AGCT含量均相同（四种碱基各占25%），且这4种特定序列插入片段对应的相同位置上DNA碱基（A/G/C/T）均不相同。4种特定序列插入片段均无法比对到人、常见动植物和微生物，可有效防止数据污染。

优选地，所述高通量测序质控用文库包括4组目标特定序列；所述目标特定序列包含双端接头、双端Index和核心区序列。所述核心区序列由所述序列插入片段扩增得到；4组目标特定序列的核心区序列长度相同，且在序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d上对应的位置相同；所述核心区序列的长度为100-300bp。

本发明以上述4种序列插入片段a/b/c/d或包含上述4种序列插入片段a/b/c/d的质粒或长链DNA分子为模板，经PCR扩增，可获得含有4种目标特定序列的文库。目标特定序列文库由4种不同序列的文库组成，文库两端包含双端接头、双端index及特定序列（特定序列来自上述序列插入片段a/b/c/d）。4种目标特定序列文库的核心区的长度均相同（100~300bp，优选150~250bp，优选250bp）。4种目标特定序列文库的序列均是单一且固定的。4种目标特定序列各自的4种碱基AGCT含量均相同（四种碱基各占25%），且这4种目标特定序列对应的相同位置上DNA碱基（A/G/C/T）均不相同，因此可使用在同一个测序Cycle中，这4种文库测出的序列各不相同。4种目标特定序列文库需与待检样本文库的长度接近，避免差异过大，以使目标特定序列文库与待检样本文库在测序仪上进行无差异反应（例如通过桥式扩增生成簇的过程）。另外，本发明提供的高通量测序质控用文库含有双端标签（index）序列，测序数据下机后可直接进行数据拆分，用于质控数据的详细评估（包括但不限于质控数据量在总数量中的占比、测序质控用文库测序结果与已知测序结果的对比等）。

举例说明本发明涉及的4种目标特定序列文库组成结构，包含但不限于下述结构序列：

illumina测序平台测序质控用文库结构序列：

5'-AATGATACGGCGACCACCGAGATCTACAC

-Index2（CGCATGTC）

-ACACTCTTTCCCTACACGACGCTCTTCCGATCTT

-序列插入片段a/b/c/d

-AAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC

-Index1（TCATTCGA）

-ATCTCGTATGCCGTCTTCTGCTTG-3'。

华大测序平台测序质控用文库结构序列：

5'-CTCTCAGTACGTCAGCAGTT

-Index2（CGCATGTC）

-CAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTTT

-序列插入片段a/b/c/d

-AAAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA

-Index1（TCATTCGA）

-CTGATAAGGTCGCCATGC-3'。

本发明优选等摩尔浓度混合4种目标特定序列文库（根据文库的质量浓度和分子量计算摩尔浓度并按照等摩尔浓度混合），同时采用数字PCR进行质检。质检合格后，加入一定浓度的poly(dN)（N=A/C/T/G碱基），制成测序质控用文库。Poly(dN)优选Poly(dA)，Poly(dA)的浓度为0.1~100ng/μL，优选1~10ng/μL，优选1ng/μL；dA碱基数为5~100，优选10~50，优选18~30。

将测序质控用文库与待检样本文库按一定比例混合后通过高通量测序仪测序。测序质控用文库在总文库（测序质控用文库与待检样本文库之和）中的占比为1~50%，优选5~20%，优选5~10%，优选5%。

第二方面，本发明提供了所述高通量测序质控用文库的制备方法，由包括序列插入片段的模板DNA经PCR扩增得到；所述序列插入片段包括序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d；所述序列插入片段a的核苷酸序列如SEQ ID NO.1所示；所述序列插入片段b的核苷酸序列如SEQ ID NO.2所示；所述序列插入片段c的核苷酸序列如SEQ ID NO.3所示；所述序列插入片段d的核苷酸序列如SEQ ID NO.4所示。

本发明提供的方法可快速、稳定制备出含有目标特定序列且固定长度的可拆分测序质控用文库。

优选地，用于PCR扩增的引物对的上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ ID NO.6所示。此时，4种文库所含目标特定序列长度为300bp，仅需一轮PCR和一轮纯化即可完成制备。

作为另一种可选的实施方式，用于PCR扩增的引物对包括如下（1）、（2）、（3）、（4）和（5）所示引物对：

（1）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ IDNO.7所示；

（2）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ IDNO.8所示；

（3）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ IDNO.9所示；

（4）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ IDNO.10所示；

（5）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ IDNO.11所示。

当用于PCR扩增的引物对选自（1）、（2）、（3）、（4）和（5）时，获得的4种文库所含目标特定序列长度为160bp，共需两轮PCR和纯化完成制备。其中，（1）、（2）、（3）和（4）所示引物对用于第一轮PCR扩增，（5）所示引物对用于第二轮PCR扩增。

基于相同的原理，其他未列出的能特异性针对本发明所述序列插入片段a/b/c/d，在相同碱基位置进行PCR扩增，且能获得相同技术效果（即4种目标特定序列各自的4种碱基AGCT含量均相同，且这4种目标特定序列对应的相同位置上DNA碱基均不相同）的引物组合也在本发明的保护范围之内。

第三方面，本发明提供了所述高通量测序质控用文库或者所述制备方法制备得到的高通量测序质控用文库在高通量测序中的应用。

优选地，本发明所述应用将所述高通量测序质控用文库与待检样本文库混合，然后通过高通量测序仪测序；其中，所述高通量测序质控用文库中的目标特定序列与待测样本序列长度相同或相差±100bp以内。

第四方面，本发明还提供了一种高通量测序文库，包括所述高通量测序质控用文库，还包括待测样本文库；所述高通量测序质控用文库在所述高通量测序文库中的占比为1-50%，优选为5-20%，更优选5-10%，更优选为5%。

本发明优选根据数字PCR得到的拷贝浓度进行分析，若所述高通量测序质控用文库中的4种目标特定序列文库两两之间的拷贝浓度的相对偏差不超过±10%即可判定为合格。如果不合格，则根据数字PCR结果进一步调整文库浓度，直至合格。

有益效果：

本发明提供了一种高通量测序质控用文库及其制备方法和应用。本发明提供的高通量测序质控用文库在每个碱基位置的碱基占比均是均衡的。将本发明提供的高通量测序质控用文库与待测样本文库混合后共同上机测序，可消除因待检样本文库碱基序列的不平衡性所导致的测序质量降低，提高对不平衡文库测序的准确性。

具体实施方式

本发明提供了一种高通量测序质控用文库及其制备方法和应用。所述高通量测序质控用文库由包括序列插入片段的模板DNA经PCR扩增得到。

在本发明提供的一种具体实施方式中，所述高通量测序质控用文库的制备及应用方法包括以下步骤：

（1）合成一组4种含有特定序列插入片段a/b/c/d的质粒：质粒上的插入片段包括测序文库的双端接头、双端index及特定序列插入片段。其中4种特定序列插入片段的长度均为300bp，4种特定序列插入片段所含的4种碱基（A/G/C/T）的比例均相同（四种碱基各占25%），且这4种特定序列插入片段对应的相同碱基位置上的碱基（A/G/C/T）均不相同。4种特定序列插入片段均无法比对到人、常见动植物和微生物，可有效防止数据污染。

（2）通过上述质粒获得一组4种含有目标特定序列的文库：这组文库包括双端接头、双端index及核心区序列（核心区序列来自上述质粒含有的特定序列插入片段）。4种文库的核心区长度均相同（100~300bp，优选150~250bp，优选250bp），且与待检样本文库的长度接近。

（3）等摩尔浓度混合上述4种文库：根据质量浓度和分子量计算摩尔浓度并按照等摩尔浓度混合，同时采用数字PCR进行质检。质检合格后，加入一定浓度的poly(dN)（N=A/C/T/G碱基），制成测序质控用文库。Poly(dN)优选Poly(dA)，Poly(dA)的浓度为0.1~100ng/μL，优选1~10ng/μL，优选1ng/μL；dA碱基数为5~100，优选10~50，优选18~30。

（4）将测序质控用文库与待检样本文库按一定比例混合后通过高通量测序仪测序。测序质控用文库在总文库（测序质控用文库与待检样本文库之和）中的占比为1~50%，优选5~20%，优选5~10%，优选5%。

本发明提供的高通量测序质控用文库通过利用AGCT四种平衡碱基以平衡整体待测样本文库的碱基平衡性，可有效解决由于待测文库碱基不平衡可能导致的测序准确性降低问题，提高测序质量。相较于现有技术，本发明仅采用4种含有目标特定序列且固定长度的测序质控用文库。最重要的是这4种目标特定序列中各自的4种碱基AGCT含量均相同（四种碱基各占25%），且这4种目标特定序列对应的相同碱基位置上DNA碱基（A/G/C/T）均不相同，因此可使在同一个测序Cycle中，这组质控文库测出的AGCT碱基含量均相同（四种碱基各占25%），从而避免由于待测样本文库碱基不平衡而导致的测序质量下降，大大改善整体测序的质量。本发明在碱基不平衡的文库样本测序时，可以加入较大比例测序质控用文库，以此来抵消待测文库样本的碱基不平衡性。在正常待测文库中也可以少量的加入测序质控用文库，以此来监控测序质量。同时，本发明提供的高通量测序质控用文库还具有稳定性高，便于使用和保存，制备方法简单快捷、稳定可靠，且无需文库片段筛选、批间差异小等优点。

由于不同测序平台对应的测序文库的接头和index可能不同，因此以下以illumina测序平台为例说明实施方式。

该制备方法主要步骤如下：

S1、采用基因合成法，合成4个含有特定序列的插入片段（即序列插入片段a/b/c/d）的大肠杆菌克隆质粒（或长链DNA分子）。

以质粒为例说明实施方式：质粒载体为克隆性质粒，包括但不限于pUC57质粒。质粒上的插入片段包括测序文库的双端接头、双端index及特定序列插入片段a/b/c/d。质粒插入片段为：5'-AATGATACGGCGACCACCGAGATCTACAC-Index2（CGCATGTC）-ACACTCTTTCCCTACACGACGCTCTTCCGATCTT-序列插入片段a/b/c/d-AAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-Index1（TCATTCGA）-ATCTCGTATGCCGTCTTCTGCTTG-3'。4种特定序列插入片段a/b/c/d均无法比对到人、常见动植物和微生物，可有效防止数据污染。通过Sanger测序法确认质粒插入片段序列合成正确。获得的4种特定序列文库质粒对应编号为1/2/3/4。

S2、采用分子生物学常规方法进行质粒提取纯化（例如使用商品化试剂盒）、测定质粒的质量浓度（例如使用分光光度计、荧光计等）。

S3、通过PCR获得目标特定序列文库：

I、当4种文库所含目标特定序列长度为300bp时，仅需一轮PCR和一轮纯化即可完成制备。

（1）PCR

将制备目标特定序列文库的上述4种质粒以及下表中试剂取出，室温解冻，完全融化后轻柔振荡混匀，短暂离心后置于冰盒上备用。

在0.2mL的离心管中，按照下表分别配制4管PCR反应体系。其中质粒模板用量为：1pg~50ng，优选1pg~1ng，优选10pg。使用高保真DNA聚合酶，以确保DNA序列在扩增过程中的保真性。

表 1 PCR反应体系

4种质粒模板均可使用相同的PCR引物：

PCR正向引物（P5）：AATGATACGGCGACCACCGAG

PCR反向引物（P7）：CAAGCAGAAGACGGCATACGAGA

表 2 PCR反应条件

注：模板用量越少，循环数应对应增加。

（2）根据产品说明书，使用磁珠（VAHTS DNA Clean Beads）纯化PCR产物。

II、当4种文库所含目标特定序列长度为100~300bp时，需两轮PCR和纯化完成制备。下文以160bp的目标特定序列为例进行说明。

（1）第1轮PCR

反应体系同表1，4种质粒模板均可使用相同的正向引物和各自对应的反向引物：

PCR正向引物（P5）：AATGATACGGCGACCACCGAG

PCR反向引物（对应质粒1）：GTTAAGCGATATAATAGTGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTT

PCR反向引物（对应质粒2）：CAGCGATCTGTCCTGTAGCTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTT

PCR反向引物（对应质粒3）：TCAGTCATCACGTGACTCTAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTT

PCR反向引物（对应质粒4）：AGCTCTGAGCGAGCCGCAAGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTT

反向引物中的下划线序列对应于质粒上的特定序列，且均位于4个质粒对应的相同位置，以确保PCR扩增出的产物长度一致，且在4个PCR产物中的特定序列的每个碱基位置都各不相同。

PCR程序同表2。

（2）根据产品说明书，使用磁珠（VAHTS DNA Clean Beads）纯化第1轮PCR产物。

（3）第2轮PCR

反应体系同表1，PCR模板为4种纯化后的第1轮PCR产物1μL。

4种质粒模板均可使用相同的正向引物和反向引物：

PCR正向引物（P5）：AATGATACGGCGACCACCGAG

PCR反向引物：CAAGCAGAAGACGGCATACGAGAT-Index1（TCGAATGA）-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTT

PCR程序同表2。循环数可减少至5~10轮。

（4）根据产品说明书，使用磁珠（VAHTS DNA Clean Beads）纯化第2轮PCR产物。

S4、制备测序质控用文库：

（1）通过分光光度计或荧光计对4种目标特定序列文库的质量浓度进行测定，并根据下述公式计算出对应的摩尔浓度：

摩尔浓度（nM）=质量浓度（ng/μL）÷分子量（g/mol）10^-6

根据上述公式计算出的4种目标特定序列文库的摩尔浓度，统一稀释到相同的摩尔浓度，摩尔浓度为：5~200nM，优选5~100nM，优选10nM。

（2）通过数字PCR对稀释后的文库进行质检。以Thermo QuantStudio 3D数字PCR平台为例：

表 3 数字PCR反应体系

数字PCR反应体系中PCR正向引物（P5）：AATGATACGGCGACCACCGAG；PCR反向引物（P7）：CAAGCAGAAGACGGCATACGAGA。

表 4 数字PCR反应条件

根据数字PCR得到的拷贝浓度进行分析，若4种目标特定序列文库两两之间的拷贝浓度的相对偏差不超过±10%即判定为合格。如果不合格，则根据数字PCR结果进一步调整文库浓度，直至合格。

（3）向已满足上述等摩尔浓度混合标准的4种目标特定序列文库中，加入一定浓度的poly(dN)，制成测序质控用文库。Poly(dN)优选Poly(dA)，Poly(dA)的浓度为0.1~100ng/μL，优选1~10ng/μL，优选1ng/μL；dA碱基数为8~100，优选10~50，优选18~30。

S5、将测序质控用文库与待检样本文库按一定比例混合后通过高通量测序仪测序。测序质控用文库在总文库（测序质控用文库与待检样本文库之和）中的占比为1~50%，优选5~20%，优选5~10%，优选5%。

S6、下机后数据可通过文库标签将测序质控用文库数据拆分出来，单独进行分析，不影响待检样本文库的结果分析。同时，也可通过序列比对，将测序质控用文库的已知序列从测序结果中剔除，避免影响待检样本测序结果分析。

为了便于理解本发明，下面将对本发明实施例中的技术方案进行清晰完整的描述，但是不能把它们理解为对本发明保护范围的限定。实施例中未注明具体条件的，按照常规条件或制造商建议的条件进行。所用试剂和仪器未注明生产厂家的，均为可以通过市售购买获得的常规产品。

实施例1

本实施例按照具体实施方式所述进行illumina测序平台质控用文库制备，选择3天制备，每天制备3个批次，每个批次制备1管质控用文库。摩尔浓度稀释至10nM。

将制备好的测序质控用文库使用qPCR方法（KAPA Library Quantification Kit）进行定量。结果显示：所有制备出的质控文库的实测浓度与理论浓度的相对偏差均不超过10%，9批次质控文库的浓度的相对标准偏差（CV）仅为2.41%，表明按本发明方法制备出的测序质控用文库制备的批间稳定性好，具体结果见下表。

表 5 测序质控用文库多批次制备定量浓度

将上述制备好的9个批次测序质控用文库分别与9组待测文库样本，均按5%的比例混合后在illumina Nextseq CN500测序仪上完成测序，针对第1组待测文库样本设置对照组：即不加入测序质控用文库、仅对该组待测文库样本进行测序。结果显示：对照组测序数据中，簇密度（Cluster Density）出现异常，仅为146 K/mm²（正常范围在170~230 K/mm²），碱基质量值≥Q30占比也较低；对应的该组待测文库样本以及其他组待测样本文库在加入测序质控用文库的所在上机批次均符合要求。同时数据下机后使用其特有Index标签进行拆分后，测序质控用文库实际产出占比与测序质控用文库掺入比例相差极少（相对偏差在5%以内），得到的整体下机数据的簇密度（Cluster Density），簇通过率（Cluster PassingFilter），碱基质量值≥Q30占比均符合要求。结果表明：按本发明方法制备出的测序质控用文库制备的批间差异很小，且用其与待检样本文库混合上机测序得到的数据质量高。具体结果见下表。

表 6 测序质控用文库使用效果

实施例2

本实施例按照具体实施方式所述进行制备测序质控用文库，摩尔浓度为10nM，其中加入Poly(dA)的浓度为1ng/μL。设立对照组，对照组中质控文库摩尔浓度为10nM，但不加入poly(dA)。两组测序质控用文库同时做实时稳定性测试（保存于-30~-10℃，在第0/4/8/12/16/20/24个月检测文库浓度）、加速破坏稳定性测试（在反复冻融10次、室温（20~30℃）放置2天后检测文库浓度）。共制备3个批次测序质控用文库及对应的对照组进行测试。使用qPCR方法（KAPA Library Quantification Kit）进行定量，定量结果显示，按照具体实施方式所述制备出的测序质控用文库，无论是实时稳定性，还是加速破坏稳定性，各次检测结果间无明显差异；对照组（不加入poly(dA)）在对应各次测试中的稳定性均表现较差。结果表明：按本发明方法制备出的测序质控用文库制备的实时稳定性、加速破坏稳定性（反复冻融、室温放置）均良好。具体结果见下表。

表 7 测序质控用文库实时稳定性测试

表 8 测序质控用文库加速破坏稳定性测试

以上所述实施例仅表达了本发明的几种实施方式，便于具体和详细地理解本发明的技术方案，但并不能因此而理解为对本发明保护范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.高通量测序质控用文库，其特征在于，由包括序列插入片段的模板DNA经PCR扩增得到；所述序列插入片段包括序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d；所述序列插入片段a的核苷酸序列如SEQ ID NO.1所示；所述序列插入片段b的核苷酸序列如SEQ ID NO.2所示；所述序列插入片段c的核苷酸序列如SEQ ID NO.3所示；所述序列插入片段d的核苷酸序列如SEQ ID NO.4所示。

2.根据权利要求1所述高通量测序质控用文库，其特征在于，所述高通量测序质控用文库包括4组目标特定序列；所述目标特定序列包含双端接头、双端Index和核心区序列；所述核心区序列由所述序列插入片段扩增得到；4组目标特定序列的核心区序列长度相同，且在序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d上对应的位置相同；所述核心区序列的长度为100-300bp。

3.根据权利要求2所述高通量测序质控用文库，其特征在于，还包括poly（dN），N=A/C/T/G碱基。

4.根据权利要求3所述高通量测序质控用文库，其特征在于，所述poly（dN）选用poly（dA），所述poly（dA）的浓度为0.1-100mg/μL，dA碱基数为5-100。

5.权利要求1-4任意一项所述高通量测序质控用文库的制备方法，其特征在于，由包括序列插入片段的模板DNA经PCR扩增得到；所述序列插入片段包括序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d；所述序列插入片段a的核苷酸序列如SEQ ID NO.1所示；所述序列插入片段b的核苷酸序列如SEQ ID NO.2所示；所述序列插入片段c的核苷酸序列如SEQ ID NO.3所示；所述序列插入片段d的核苷酸序列如SEQ ID NO.4所示。

6.根据权利要求5所述制备方法，其特征在于，用于PCR扩增的引物对的上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ ID NO.6所示。

7.根据权利要求5所述制备方法，其特征在于，用于PCR扩增的引物对包括如下（1）、（2）、（3）、（4）和（5）所示引物对：

（1）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ ID NO.7所示；

（2）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ ID NO.8所示；

（3）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ ID NO.9所示；

（4）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ ID NO.10所示；

（5）上游引物核苷酸序列如SEQ ID NO.5所示，下游引物核苷酸序列如SEQ ID NO.11所示。

8.权利要求1-4任意一项所述高通量测序质控用文库或者权利要求5-7任意一项所述制备方法制备得到的高通量测序质控用文库在高通量测序中的应用。

9.根据权利要求8所述应用，其特征在于，将所述高通量测序质控用文库与待检样本文库混合，然后通过高通量测序仪测序；其中，所述高通量测序质控用文库中的目标特定序列与待测样本序列长度相同或相差±100bp以内。

10.高通量测序文库，其特征在于，包括权利要求1-4任意一项所述高通量测序质控用文库，还包括待测样本文库；所述高通量测序质控用文库在所述高通量测序文库中的占比为1-50%；所述高通量测序质控用文库中的4种目标特定序列两两之间的拷贝浓度相对偏差≤±10%。