CN117625767A

CN117625767A - 一种文库扩增单克隆纯度表征方法

Info

Publication number: CN117625767A
Application number: CN202311609943.XA
Authority: CN
Inventors: 沈晨; 乔朔; 陈子天; 康力; 李昂
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2023-11-29
Filing date: 2023-11-29
Publication date: 2024-03-01

Abstract

本公开实施例公开了一种文库扩增单克隆纯度表征方法。该方法包括：设计多种标签序列均不同的文库；设计多种测序引物，测序引物与文库一一匹配对应，测序引物的3’端序列与文库的标签序列对应，各测序引物与文库杂交后的延伸序列均相同；将文库进行混合，在芯片表面的反应点中生成扩增产物，不同文库的用量之比的最大值小于5；对扩增产物进行处理，生成单链核酸；一种测序引物与单链核酸进行杂交，提供测序反应条件完成N个循环的延伸反应，每个循环延伸的碱基个数为M，收集测序信号；重复直至完成所有测序引物的杂交及测序信号的收集；根据测序信号的强度数据，确定文库扩增后的单克隆纯度。通过以上方法能够对文库扩增后的单克隆纯度进行表征。

Description

一种文库扩增单克隆纯度表征方法

技术领域

本公开涉及基因测序技术领域，尤其涉及一种文库扩增单克隆纯度表征方法。

背景技术

现阶段高通量测序技术发展迅速，已成为目前生命研究的常用的分析方法，它具有通量高、检测速度快、灵活多用、成本低的特点，这种技术需要DNA文库中的单个分子在带有微反应室(如微坑)的芯片中进行扩增放大信号，从而实现同时检测几十万到几百万的DNA分子的目的。

在扩增前，需要将DNA文库均匀的杂交到带有微坑的芯片表面，而DNA文库中的DNA分子进入到微坑的数量符合泊松分布，即一定浓度的DNA文库随机杂交到芯片的微坑中，使泊松分布的λ为1时(即达到最高单克隆率)，36％的微坑中有1个DNA分子，36％的微坑中没有DNA分子，28％的微坑中有2个及2个以上的DNA分子。

在后续的扩增过程中，微坑中的多个分子会同时扩增，产生包含多种DNA文库模板的多克隆，会严重影响测序准确度。单克隆纯度低于某一阈值时，将直接影响后续测序信号的分辨，甚至无法达到测序的目的，对测序通量影响很大，因此，亟需要开发一种方法来表征文库扩增后的单克隆纯度。

发明内容

有鉴于此，本公开实施例提供了一种文库扩增单克隆纯度表征方法，能够对文库扩增后的单克隆纯度进行表征。

本公开实施例提供了一种文库扩增单克隆纯度表征方法，采用如下技术方案：

所述文库扩增单克隆纯度表征方法包括：

步骤S1、设计多种文库，每种文库的标签序列均不同；

步骤S2、设计多种测序引物，所述测序引物与所述文库一一匹配对应，所述测序引物的3’端序列与所述文库的标签序列对应，且各测序引物与对应文库杂交后的延伸序列均相同；

步骤S3、将所述多种文库进行混合，在芯片表面的反应点中进行扩增反应生成扩增产物，不同文库的用量之比的最大值小于5；

步骤S4、对所述扩增产物进行处理，生成用于进行测序反应的单链核酸；

步骤S5、提供所述多种测序引物中的一种测序引物，与所述单链核酸进行杂交，提供测序反应条件完成N个循环的延伸反应，每个循环延伸的碱基个数为M，收集测序信号，N≥1，M≥1；重复此步骤直至完成所有测序引物的杂交及测序信号的收集；

步骤S6、对所述测序信号进行强度提取，得到所述测序信号的强度数据，根据所述强度数据，确定文库扩增后的单克隆纯度。

可选地，步骤S1中，所述文库的数量至少为4种，步骤S2中，所述测序引物的数量至少为4种。

可选地，步骤S3中，将所述多种文库按相同比例进行混合。

可选地，步骤S5中的测序反应为3'端开放的测序反应。

可选地，步骤S5中，每个循环延伸的碱基个数为M，M≥3。

可选地，步骤S5中，在杂交一种测序引物的过程中，完成的N个循环的延伸反应中，每个循环延伸的碱基个数均相同，N≥2。

可选地，步骤S6中，所述根据所述强度数据，确定文库扩增后的单克隆纯度，包括：

对所述强度数据进行过滤，根据过滤后的强度数据，确定文库扩增后的单克隆纯度。

可选地，所述对所述强度数据进行过滤，包括：

根据杂交一种测序引物的过程中，N个循环的强度数据，对所述强度数据进行过滤，N≥2。

可选地，所述根据杂交一种测序引物的过程中，N个循环的强度数据，对所述强度数据进行过滤，包括：

计算每个反应点内所有测序引物对应的强度数据，确定每个反应点内强度数据最大的第一测序引物，保留所述第一测序引物的N个循环的强度值相差小于10％的反应点的强度数据。

对所述强度数据进行过滤后，计算每种测序引物杂交测序过程的N个循环的强度之和，N≥2；

选择强度之和最大的测序引物对应的文库为主种；

根据主种对应的测序引物的杂交测序过程的N个循环的强度之和，以及所有测序引物的杂交测序过程的N个循环的强度之和，计算得到文库扩增后的单克隆纯度。

本公开实施例提供了一种文库扩增单克隆纯度表征方法，该文库扩增单克隆纯度表征方法包括：步骤S1、设计多种文库，每种文库的标签序列均不同；步骤S2、设计多种测序引物，测序引物与文库一一匹配对应，测序引物的3’端序列与文库的标签序列对应，且各测序引物与对应文库杂交后的延伸序列均相同；步骤S3、将多种文库进行混合，在芯片表面的反应点中进行扩增反应生成扩增产物，不同文库的用量之比的最大值小于5；步骤S4、对扩增产物进行处理，生成用于进行测序反应的单链核酸；步骤S5、提供多种测序引物中的一种测序引物，与单链核酸进行杂交，提供测序反应条件完成N个循环的延伸反应，每个循环延伸的碱基个数为M，收集测序信号，N≥1，M≥1；重复此步骤直至完成所有测序引物的杂交及测序信号的收集；步骤S6、对测序信号进行强度提取，得到测序信号的强度数据，根据强度数据，确定文库扩增后的单克隆纯度。通过以上方法能够对文库扩增后的单克隆纯度进行表征，不仅适用范围广，而且检测单克隆纯度的灵敏度较高，同时有助于对芯片有效测序通量做出较为准确的预测。

上述说明仅是本公开技术方案的概述，为了能更清楚了解本公开的技术手段，而可依照说明书的内容予以实施，并且为让本公开的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图，详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本公开实施例提供的一种文库扩增单克隆纯度表征方法的流程图；

图2为本公开实施例提供的文库和测序引物的匹配示意图；

图3为本公开实施例提供的测序引物杂交过程中不同循环的测序信号图；

图4为本公开实施例提供的完整芯片中单克隆纯度大于96％的单克隆率的空间分布图。

具体实施方式

下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施方式仅用于解释相关内容，而非对本公开的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本公开相关的部分。

需要说明的是，在不冲突的情况下，本公开中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本公开的技术方案。

除非另有说明，否则示出的示例性实施方式/实施例将被理解为提供可以在实践中实施本公开的技术构思的一些方式的各种细节的示例性特征。因此，除非另有说明，否则在不脱离本公开的技术构思的情况下，各种实施方式/实施例的特征可以另外地组合、分离、互换和/或重新布置。

这里使用的术语是为了描述具体实施例的目的，而不意图是限制性的。如这里所使用的，除非上下文另外清楚地指出，否则单数形式“一个(种、者)”和“所述(该)”也意图包括复数形式。此外，当在本说明书中使用术语“包含”和/或“包括”以及它们的变型时，说明存在所陈述的特征、整体、步骤、操作、部件、组件和/或它们的组，但不排除存在或附加一个或更多个其它特征、整体、步骤、操作、部件、组件和/或它们的组。还要注意的是，如这里使用的，术语“基本上”、“大约”和其它类似的术语被用作近似术语而不用作程度术语，如此，它们被用来解释本领域普通技术人员将认识到的测量值、计算值和/或提供的值的固有偏差。

本公开实施例提供了一种文库扩增单克隆纯度表征方法，具体地，如图1所示，该文库扩增单克隆纯度表征方法包括：

步骤S1、设计多种文库，每种文库的标签序列均不同。

其中，步骤S1中设计的文库的数量越多，通过该文库扩增单克隆纯度表征方法表征得到的单克隆纯度的准确性越高，示例性地，如果设计的文库有2种，不纯序列会被低估50％，如果设计的文库有3种，不纯的序列会被低估33％，如果设计的文库有4种，那么不纯的序列会被低估25％。可选地，步骤S1中设计至少4种文库。具体地，可以根据trueseq标准文库、tn5标准文库，ion标准文库，CYG标准文库等的文库接头进行设计，需要说明的是通过一种标准设计得到多种文库，而非通过多种标准设计得到多种文库。需要补充的是，在实际扩增过程中，使用的是哪种标准文库结构的文库，则需要表征该扩增后的单克隆纯度时，就需要根据同样的标准文库来进行文库的设计，特殊情况下，Trueseq标准文库和tn5标准文库可以混用，这两个标准文库的接头序列是基本相同的不影响本文库扩增单克隆纯度表征方法的实现。

由于每种文库的标签序列均不同，所以能够实现不同文库与不同测序引物的特异性杂交，并产生测序信号。每种文库的插入片段序列可以相同，也可以不同，此处不进行限定。

步骤S2、设计多种测序引物，测序引物与文库一一匹配对应，测序引物的3’端序列与文库的标签序列对应，且各测序引物与对应文库杂交后的延伸序列均相同。

可选地，步骤S2中，测序引物的数量至少为4种。虽然步骤S1中设计的文库的数量越多，表征得到的单克隆纯度的准确性越高，但步骤S2中设计合适的测序引物的难度也就越高。优选地，文库和测序引物的数量为4种或5种，以兼具单克隆纯度表征的准确性，以及，测序引物设计的简便性。

示例性地，如图2所示，测序引物与文库一一匹配对应的方式为：测序引物序列的3’端为与各文库的标签序列对应的i7序列。图2中，下方序列为文库序列，文库序列中的i5rc与i7rc分别表示标签序列，(N)为插入片段序列。上方序列为测序引物序列，其包含i7序列，i7序列与文库的i7rc序列对应，加粗下划线序列为待测序列。由图2可以看出，测序引物序列的3’端序列要更短，在测序过程中3’端要继续向前延伸，释放测序信号。测序引物序列可以分为两部分，一部分是公共序列(即5’端)，一部分是特异性序列(即3’端与各文库的标签序列对应的i7序列)，公共序列可以和所有文库互补配对(比如测序引物结合位点)，而特异性序列只能和某一种特定的文库结合互补配对，此测序引物结合到特定文库后释放的测序信号即与该种特定文库的数量相对应，进而后续可以用测序信号强度来表征文库的数量，从而可以用于计算单克隆纯度。且本公开实施例的文库扩增单克隆纯度表征方法中设计的测序引物在与对应文库杂交后的延伸序列均相同，释放的测序信号也相同，使得测序信号强度与文库数量之间具有线性相关。

图2中，文库序列具体为：3’-TTACTATGCCGCTGGTGGCTCTAGATGTG[i5rc]TGTGAGAAAGG GATGTGCTGCGAGAAGGCTAGA(N)TCTAGCCTTCTCGTGTGCAGACTTGAGGTCAGTG[i7rc]TAGAGCAT ACGGCAGAAGACGAAC-5’。测序引物序列具体为：AAGAGCACACGTCTGAACTCCAGTCAC[i7]ATCTCGTATGCCGTCT TCTGCTTG。

可选地，本公开实施例中的文库扩增单克隆纯度表征方法还包括：在设计多种文库和设计多种测序引物之后，对文库与测序引物之间的杂交的特异性进行验证，以进一步确保每种测序引物只能杂交到对应的文库，不会杂交到其他文库。示例性地，在只有一种文库的情况下进行测试，所有测序引物中只有一种测序引物能够延伸产生测序信号，其他测序引物均不能产生测序信号，用相同的方式完成对所有文库和测序引物之间的杂交的特异性的验证。

步骤S3、将多种文库进行混合，在芯片表面的反应点中进行扩增反应生成扩增产物，不同文库的用量之比的最大值小于5。

其中，不同文库的用量之比的最大值小于5指的是，计算任意两个文库的用量之比，所有的用量之比中的最大值应小于5，也就是所有用量之比均应小于5。不同文库的用量之比过大，会对单克隆纯度表征的准确性产生一定的影响。优选地，将多种文库按相同比例进行混合，以进一步提高单克隆纯度表征的准确性。

示例性地，步骤S5中的测序反应为3’端开放的测序反应。3’端开放的测序反应，即测序底物核苷酸可以连续延伸，每个测序反应循环延伸的核苷酸数可以是多个。可选地，步骤S5中，每个循环延伸的碱基个数为M，M≥3，每个循环延伸的核苷酸可能是多个，即释放的测序标记(例如的，荧光基团)可以是多个，由于测序反应释放的荧光信号强度与释放的荧光基团数目成正相关，因此可以放大反应信号，使得最低能够检测到约1％的杂信号，使得该方法具有较高的灵敏度。

例如的，常见的3’端开放的测序反应包括简并测序(包括：2+2测序，1+3测序，3x4测序)，或者1x4测序，等等。具体的，2+2测序指的是，在测序中，包括两种不同的测序试剂：第一测序试剂和第二测序试剂；两种测序试剂循环加入；其中第一测序试剂包含具有可检测标记的两种不同的核苷酸单体；第二测序试剂包含具有可检测标记的两种不同的核苷酸单体，且所述核苷酸单体不同于第一测序试剂中存在的核苷酸单体，并且其中第二测序试剂是在提供了第一测序试剂随后提供的，将核苷酸单体掺入待测核酸之后检测可检测标记生成的信号，例如的，荧光信号；在2+2测序中，可利用荧光标记核苷酸的组合来获得与目标DNA序列相关的荧光信号值。可能的组合实例如下所示：M/K模式：凡奇数轮呈递dA6P和dC6P，凡偶数轮呈递dG6P和dT6P；或者二者反过来；R/Y模式：凡奇数轮呈递dA6P和dG6P，凡偶数轮呈递dC6P和dT6P；或者二者反过来；以及W/S模式：凡奇数轮呈递dA6P和dT6P，凡偶数轮呈递dC6P和dG6P；或者二者反过来。1+3测序与2+2测序类似，指的是，在测序中，包括两种不同的测序试剂：第一测序试剂和第二测序试剂；两种测序试剂循环加入；其中第一测序试剂包含具有可检测标记的三种不同的核苷酸单体；第二测序试剂包含具有可检测标记的一种核苷酸单体，且所述核苷酸单体不同于第一测序试剂中存在的核苷酸单体，并且其中第二测序试剂是在提供了第一测序试剂随后提供的，将核苷酸单体掺入待测核酸之后检测可检测标记生成的信号，例如的，荧光信号；3x4测序指的是，在测序中，包括四种不同的测序试剂：第一测序试剂、第二测序试剂、第三测序试剂和第四测序试剂；四种测序试剂循环加入；其中每种测序试剂均包含具有可检测标记的三种不同的核苷酸单体；并且其中第二测序试剂是在提供了第一测序试剂随后提供的，将核苷酸单体掺入待测核酸之后检测可检测标记生成的信号；第三测序试剂是在提供了第二测序试剂随后提供的，将核苷酸单体掺入待测核酸之后检测可检测标记生成的信号；第四测序试剂是在提供了第三测序试剂随后提供的，将核苷酸单体掺入待测核酸之后检测可检测标记生成的信号；例如的，上述四种测序试剂分别为B、D、H、V。1x4测序，即SNA测序，在测序中，包括四种不同的测序试剂：第一测序试剂、第二测序试剂、第三测序试剂和第四测序试剂；四种测序试剂循环加入；其中每种测序试剂均只包含具有可检测标记的一种核苷酸单体，将核苷酸单体掺入待测核酸之后检测可检测标记生成的信号。

可选的，前述3’端开放的测序反应可以是荧光发生测序，荧光发生测序可使用末端磷酸荧光标记核苷酸作为底物，测序时当底物在DNA聚合酶作用下与模板DNA配对后，聚合酶会切断磷酸基团之间的磷酸二酯键，释放接有磷酸根的荧光基团，磷酸根进一步被反应液中的碱性磷酸酶切下，得到自由的荧光基团，再通过密封将荧光基团限制在微反应室内，随后在特定波长的激发光作用下释放荧光。芯片可以包括底板以及包含多个微坑(可阵列排布)的盖板，底板和盖板具有微坑的一面通过粘接层粘接，每一个微坑即对应一个微反应室，微反应室是进行化学反应的基本单元。

以上扩增反应可以通过RCA、bridge PCR、RPA等任意一种扩增方式实现，此处不进行限定。

步骤S4、对扩增产物进行处理，生成用于进行测序反应的单链核酸。

扩增反应结束后，需要对扩增产物进行进一步处理才能进行后续测序。示例性地，在扩增反应结束后，对扩增产物进行剪切、解旋和封端。首先，固载在芯片表面的微球(待测DNA的载体)表面预先种植有一种或两种扩增引物，用于对待测DNA进行扩增放大，在微球表面的至少一种引物里，含有一个剪切位点，在加入剪切液后互补链可以被特异性的剪切掉，然后加入解旋液反应将被剪切的序列解旋掉，暴露出可以结合测序引物的单链，最后向芯片内加入封端液，使得所有固相DNA的3’端都被封住，无法在DNA聚合酶的作用下延伸产生杂信号。

步骤S5、提供多种测序引物中的一种测序引物，与单链核酸进行杂交，提供测序反应条件完成N个循环的延伸反应，每个循环延伸的碱基个数为M，收集测序信号，N≥1，M≥1；重复此步骤直至完成所有测序引物的杂交及测序信号的收集。

可选地，针对每种测序引物，与单链核酸进行杂交，完成至少2个循环的延伸反应，反应至少2个测序循环的目的在于过滤掉可能存在的测序异常的反应点，从而保证该文库扩增单克隆纯度表征方法的高准确度。

进一步地，步骤S5中，在杂交一种测序引物的过程中，完成的N个循环的延伸反应中，每个循环延伸的碱基个数均相同，N≥2，以便于后续对测序信号进行过滤处理，以进一步提高单克隆纯度表征的准确性。

示例性地，步骤S5中，在杂交一种测序引物的过程中，反应2个循环，第一个循环中使用带有A、T和C三种核苷酸底物的反应液，第二个循环中使用有A、T和G三种核苷酸底物的反应液，每个循环各延伸5个碱基，从而可以得到5个单倍信号，起到明显的信号放大作用。

步骤S6、对测序信号进行强度提取，得到测序信号的强度数据，根据强度数据，确定文库扩增后的单克隆纯度。

示例性地，通过图像处理技术对测序信号进行强度提取，得到测序信号的强度数据。

可选地，在步骤S5杂交一种测序引物的过程中，完成的N个循环的延伸反应中，每个循环延伸的碱基个数均相同，N≥2时，步骤S6中，根据强度数据，确定文库扩增后的单克隆纯度，包括：对强度数据进行过滤，根据过滤后的强度数据，确定文库扩增后的单克隆纯度。可选地，对强度数据进行过滤，包括：根据杂交一种测序引物的过程中，N个循环的强度数据，对强度数据进行过滤，N≥2。具体地，计算每个反应点内所有测序引物对应的强度数据，确定每个反应点内强度数据最大的第一测序引物，保留第一测序引物的N个循环的强度值相差小于10％的反应点的强度数据，该强度数据用于计算对应文库的单克隆纯度，该文库可以称为“主种文库”。通过以上对强度数据的过滤，能够提高计算文库扩增后的单克隆纯度所采用的强度数据的可靠性，进一步提高表征单克隆纯度的准确性。

可选地，步骤S6中，根据强度数据，确定文库扩增后的单克隆纯度，包括：对强度数据进行过滤后，计算每种测序引物杂交测序过程的N个循环的强度之和，N≥2；根据前述操作，选择强度之和最大的测序引物对应的文库为主种，即各文库在微坑中的信号比例最高的文库为主种；根据主种对应的测序引物的杂交测序过程的N个循环的强度之和，以及所有测序引物的杂交测序过程的N个循环的强度之和，计算得到文库扩增后的单克隆纯度。

可选地，在确定主种之后，过滤出主种对应的测序引物的杂交过程中N个循环的测序强度都大于2000的反应点的强度数据，通过过滤后的数据来进行可视化分析。

在以上文库扩增单克隆纯度表征方法中，通过设计多种文库，每种文库的标签序列均不同，设计多种测序引物，测序引物与文库一一匹配对应，测序引物的3’端序列与文库的标签序列对应，且各测序引物与对应文库杂交后的延伸序列均相同，然后，将多种文库进行混合，在芯片表面的反应点中进行扩增反应生成扩增产物，不同文库的用量之比的最大值小于5，然后，对扩增产物进行处理，生成用于进行测序反应的单链核酸，然后，提供多种测序引物中的一种测序引物，与单链核酸进行杂交，提供测序反应条件完成N个循环的延伸反应，每个循环延伸的碱基个数为M，收集测序信号，N≥1，M≥1；重复此步骤直至完成所有测序引物的杂交及测序信号的收集，然后，对测序信号进行强度提取，得到测序信号的强度数据，根据强度数据，确定文库扩增后的单克隆纯度。由于在相同的扩增体系下，文库通过扩增达到的单克隆纯度是基本一样的，所以只要保证在以上文库扩增单克隆纯度表征方法中，扩增体系等条件是一样的，则表征得到的单克隆纯度就能够代表真实条件下各种文库扩增能达到的单克隆纯度。

传统芯片内扩增的SBS二代测序的平台对单克隆纯度要求为60％～70％左右即可，如Illumina等，纯度不达标的多克隆不会输出序列，会影响最终的通量产出。由于简并测序、1x4测序等3’端开放的测序反应一次测序反应可能测得1到N个碱基，对于信号强度的分辨度要求高，这就对扩增的单克隆纯度提出了更高的要求。因此，以上文库扩增单克隆纯度表征方法对于3’端开放的测序反应具有更优的技术效果。

实施例1

表征单克隆纯度的过程包括：

(1)设计表一所示的5种文库。

表一

(2)设计表二所示的5种测序引物。

表二

测序引物	序列
		PX1-ecoli	AAGAGCACACGTCTGAACTCCAGTCACATTACTCG
PX1-sau	AAGAGCACACGTCTGAACTCCAGTCACCGCTCATT
		PX1-brca	AAGAGCACACGTCTGAACTCCAGTCACAGCGATAG
PX1-snv	AAGAGCACACGTCTGAACTCCAGTCACATTCAGAA
		PX1-lambda	AAGAGCACACGTCTGAACTCCAGTCACGAATTCGT

表二中，五种测序引物相同的“AAGAGCACACGTCTGAACTCCAGTCAC”为公共序列，下划线的序列为其包含的i7序列，即特异性序列。

(3)将多种文库按照等比例进行混合，在芯片表面的微反应室中进行扩增反应生成扩增产物，在扩增结束后对扩增产物进行剪切、解旋和封端，生成用于进行测序反应的单链核酸。

其中，扩增采用油封扩增RPA，剪切为User酶处理2min，解旋为甲酰胺处理1min，封端为TdT酶处理10min。

(4)依次提供各测序引物，与单链核酸进行杂交，提供测序反应条件完成2个循环的延伸反应，每个循环延伸的碱基个数为5，收集测序信号，重复此步骤直至完成所有测序引物的杂交以及测序信号的收集。

具体为，

杂交引物PX1-ecoli，进带有A、T、C底物的反应液，延伸5碱基,进带有A、T、G底物的反应液，延伸5碱基。解旋。

杂交引物PX1-sau，进带有A、T、C底物的反应液，延伸5碱基,进带有A、T、G底物的反应液，延伸5碱基。解旋。

杂交引物PX1-brca，进带有A、T、C底物的反应液，延伸5碱基,进带有A、T、G底物的反应液，延伸5碱基。解旋。

杂交引物PX1-snv，进带有A、T、C底物的反应液，延伸5碱基,进带有A、T、G底物的反应液，延伸5碱基。解旋。

杂交引物PX1-lambda，进带有A、T、C底物的反应液，延伸5碱基,进带有A、T、G底物的反应液，延伸5碱基。

以上测序信号为荧光发生测序反应产生的信号。以上反应液的组成为：荧光发生底物、碱性磷酸酶、聚合酶和测序缓冲液。荧光发生测序反应的具体过程包括：聚合酶将荧光发生底物聚合进入芯片表面的微反应室中固定的核酸模板的引物3’端，释放出磷酸化的荧光发生荧光团，进一步被碱性磷酸酶水解去除磷酸，释放荧光状态改变的荧光发生荧光团。利用荧光发生底物聚合酶反应，检测荧光发生荧光团的荧光改变，便可以得到聚合酶发生反应的信息。

(5)对测序信号进行强度提取，得到测序信号的强度数据，根据强度数据，确定文库扩增后的单克隆纯度。

如图3所示，图3中，横坐标为测序循环(cycle)编号，纵坐标为信号强度，Cycle1为本底信号(即荧光染料释放的信号，可以辅助微反应室的准确定位)，Cycle2-3为杂交PX1-ecoli的测序信号，Cycle4-5为杂交PX1-sau的测序信号，Cycle6-7为杂交PX1-brca的测序信号，Cycle8-9为杂交PX1-snv的测序信号，Cycle10-11为杂交PX1-lambda的测序信号。通过图3可以看出，整个过程是正常进行的，即每个cycle都有合适的测序信号。

单克隆纯度＝max((S2+S3),(S4+S5),(S6+S7),(S8+S9),(S10+S11))/sum(S2,S3,S4,S5,S6,S7,S8,S9,S10,S11)。该式中，S2表示的是第2个循环的测序信号，依此类推；该式表示的是选择出强度之和最大的测序引物，再计算出该强度之和与所有测序引物对应的强度之和的比值，该比值对应的即是该测序引物对应的文库的单克隆纯度。

进一步，如表三所示，表三示出了不同文库的单克隆纯度的均值、中位数、变异系数(CV)等信息，由表三可以看出本文库扩增单克隆纯度表征方法对单克隆纯度的表征可以精确到1％，具有较高的分辨率。

表三

其中，纯度>96％的单克隆率的空间分布如图4所示，图4中，每一个小格子代表芯片中一个tile的单克隆纯度。每一次测序荧光扫描的最小单位即为tile，或称为小区。可见该文库扩增单克隆纯度表征方法能够表征整个芯片空间所有tile的扩增纯度，在实际应用中能够比较准确估计芯片的有效数据通量。

在本说明书的描述中，参考术语“一个实施例/方式”、“一些实施例/方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例/方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例/方式或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例/方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例/方式或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例/方式或示例以及不同实施例/方式或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

本领域的技术人员应当理解，上述实施方式仅仅是为了清楚地说明本公开，而并非是对本公开的范围进行限定。对于所属领域的技术人员而言，在上述公开的基础上还可以做出其它变化或变型，并且这些变化或变型仍处于本公开的范围内。

Claims

1.一种文库扩增单克隆纯度表征方法，其特征在于，包括：

步骤S1、设计多种文库，每种文库的标签序列均不同；

2.根据权利要求1所述的文库扩增单克隆纯度表征方法，其特征在于，步骤S1中，所述文库的数量至少为4种，步骤S2中，所述测序引物的数量至少为4种。

3.根据权利要求1所述的文库扩增单克隆纯度表征方法，其特征在于，步骤S3中，将所述多种文库按相同比例进行混合。

4.根据权利要求1所述的文库扩增单克隆纯度表征方法，其特征在于，步骤S5中的测序反应为3'端开放的测序反应。

5.根据权利要求4所述的文库扩增单克隆纯度表征方法，其特征在于，步骤S5中，每个循环延伸的碱基个数为M，M≥3。

6.根据权利要求1所述的文库扩增单克隆纯度表征方法，其特征在于，步骤S5中，在杂交一种测序引物的过程中，完成的N个循环的延伸反应中，每个循环延伸的碱基个数均相同，N≥2。

7.根据权利要求6所述的文库扩增单克隆纯度表征方法，其特征在于，步骤S6中，所述根据所述强度数据，确定文库扩增后的单克隆纯度，包括：

8.根据权利要求7所述的文库扩增单克隆纯度表征方法，其特征在于，所述对所述强度数据进行过滤，包括：

9.根据权利要求8所述的文库扩增单克隆纯度表征方法，其特征在于，所述根据杂交一种测序引物的过程中，N个循环的强度数据，对所述强度数据进行过滤，包括：

10.根据权利要求1～9任一项所述的文库扩增单克隆纯度表征方法，其特征在于，步骤S6中，所述根据所述强度数据，确定文库扩增后的单克隆纯度，包括：

选择强度之和最大的测序引物对应的文库为主种；