CN113302301A

CN113302301A - 检测分析物的方法及其组合物

Info

Publication number: CN113302301A
Application number: CN202080008831.7A
Authority: CN
Inventors: 汪烨迅; 彭泉
Original assignee: Qiagen Sciences LLC
Current assignee: Qiagen Sciences LLC
Priority date: 2019-01-09
Filing date: 2020-01-09
Publication date: 2021-08-24
Also published as: WO2020146603A1; US20220127600A1; EP3908657A1; EP3908657A4

Abstract

本发明涉及通过产生可用于测序的基于分析物的DNA文库来检测样品中的分析物的方法。该方法包括使用邻近探针对，每个探针包含分析物结合域和寡核苷酸域。该方法进一步提供了集成的DNA和RNA文库制备物及其制备和使用方法。本发明还提供了可用于该方法中的组合物。

Description

检测分析物的方法及其组合物

发明背景

下一代测序(NGS)技术已用于核酸分析，例如在DNA变体检测以及RNA转录组谱分析中。与DNA/RNA同等重要的是转化研究中的蛋白质生物标志物。然而，大多数蛋白质分析是在完全不同的平台上进行的。例如，蛋白质分析可以通过传统的ELISA分析或质谱分析来完成。能够在同一平台上分析核酸和蛋白质生物标志物将显著减少分析时间并提供更多见解。

人们已经通过使用寡核苷酸缀合的抗体(Ab)成功地将蛋白质检测转变为核酸检测。免疫-PCR是一种几十年前描述的此类技术(Sano，T.等，Science 258：120-2(1992))。在这种情况中，抗原特异性Ab与寡核苷酸序列缀合，并用于典型的ELISA过程中。尽管存在许多ELISA变型，但该过程通常至少包括抗原抗体结合、抗体洗涤和检测步骤。在免疫PCR的情况中，最终检测是通过使用实时PCR测定来完成的，以量化缀合到与特异性抗原结合的抗体的特定寡核苷酸。与具有传统比色读数的ELISA相比，免疫PCR理论上更灵敏，因为实时PCR甚至可以检测到与抗原特异性结合的微量寡核苷酸。免疫PCR还具有更高的多重潜力，因为不同的寡核苷酸序列可用于检测不同的抗原-抗体对。然而在实践中，由于抗体的非特异性结合，实际的免疫PCR敏感性通常受限于抗体特异性。此外，由于指数扩增固有的易变性，实时PCR对于检测丰度的微小变化不是很准确，例如，实时PCR测量50％变化或小于1Ct差异时存在很大的可变性。

为了解决免疫PCR中的局限性，人们开发了蛋白质邻近连接(PLA)和邻近延伸(PEA)分析(Gullberg,M.等，Proc.Natl.Acad.Sci.USA.101:8420-4(2004)；Lundberg,M.等，Nucleic Acids Res.39:e102(2011))。在这两种技术中，将针对同一抗原的一对抗体与不同的寡核苷酸缀合。当这对抗体与特异性抗原结合时，缀合的寡核苷酸会非常靠近，比它们在溶液中的随机位置要近得多。由于这种接近，这两种寡核苷酸现在更有可能参与分子间连接或延伸反应。所得到的连接或延伸产物可以使用例如PCR分析来检测。由于接近度受两种抗体的特异性控制，因此接近度测定特异性更高，并且常常不需要大量洗涤步骤来去除未结合的抗体。然而，现有的PLA和PEA检测仍然受到相同的下游qPCR检测限制的影响，在检测微小差异方面不是很可靠。

使用NGS作为PLA分析的下游读出是已知的(Darmanis S.等，PLoS One.6:e25583(2011)。这种方法可以潜在地提高分析通量，从而可以在单个平台上分析许多样品中的大量蛋白质靶标。但是，由于NGS样品制备工作流程中广泛的扩增偏差，读数计数仍然是不准确的。

仍然需要改进的、适于测序分析的蛋白质分析方法。

发明简述

本文公开了用于检测样品中分析物的方法，包括：将第一和第二邻近探针结合到样品中的分析物，其中第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域，并且其中第二邻近探针包含第二分析物结合域，以及包含通用扩增区域、PST和IMR的第二寡核苷酸域；并检测分析物。在一些实施方案中，第二邻近探针的寡核苷酸域还包含UMI。

第一和第二分析物结合域可以是但不限于抗体、适体、配体、受体或其组合。第一和第二分析物结合域可以与寡核苷酸域缀合，例如通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合。在一些实施方案中，第一和第二分析物结合域分别是第一和第二抗体。第一抗体和第二抗体中的每一个可以是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体，或其组合。

该方法可以进一步包括进行邻近连接(PLA)或延伸(PEA)测定。PLA或PEA测定可以产生单链或双链的第三寡核苷酸。

该方法可以进一步包括将适体序列连接第三寡核苷酸。适体序列可以通过扩增或连接与第三寡核苷酸连接。

该方法可以进一步包括进行第三寡核苷酸的扩增，以产生基于蛋白质的DNA文库。

该方法可以进一步包括从同一样品制备DNA或cDNA文库，包括：将DNA标签连接样品中的DNA分子的末端，其中DNA标签包含UMI和DNA标识符；以及在RNA标签的存在下进行样品中RNA分子的逆转录，其中RNA标签包含RNA标识符、UMI和多聚(T)。逆转录可以在第二RNA标签的存在下进行，其中第二RNA标签包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。

该方法可以进一步包括扩增标记的DNA和标记的cDNA以用一组基因特异性引物富集。该方法可以进一步包括将扩增的样品分离成第一、第二或第三样品。蛋白质、DNA和RNA分子可以从生物样品获得，例如，同一生物样品。在一些实施方案中，DNA和RNA分子是来自生物样品的片段化DNA和RNA。在一些实施方案中，DNA分子包含用于连接的抛光(polished)的末端。在其他实施方案中，RNA分子是聚腺苷酸化的。

在一些实施方案中，该方法不需要核糖体耗竭。

该方法可以进一步包括用DNA标签特异性的引物扩增第一样品。该扩增可以产生对应于样品中的DNA的DNA文库。

该方法可以进一步包括用RNA标签特异性的引物扩增第二样品。该扩增可以产生对应于样品中的RNA的cDNA文库。

该方法可以进一步包括将基于蛋白质的DNA、DNA或cDNA文库测序。DNA分子可以是基因组DNA。DNA文库可以用于变体检测、拷贝数分析、融合基因检测或结构变体检测。cDNA文库可以用于RNA变体检测、基因表达分析或融合基因检测。DNA和cDNA文库可以用于配对的DNA和RNA谱分析。

在一些实施方案中，将第三寡核苷酸从基因组DNA和总RNA中分离出来。

该方法可以进一步包括：(a)从同一生物样品获得纯化的DNA和RNA；(b)将DNA标签序列结合到样品中的DNA；(c)将RNA标签序列结合到样品中的RNA；和(d)分别检测DNA、RNA和蛋白质靶标。

本文还公开了由本文公开的任何方法制成的基于蛋白质的DNA文库。还公开了是由本文公开的任何方法制成的DNA文库。还公开了是由本文公开的任何方法制成的cDNA文库。

本文公开了组合物，其包含第一邻近探针和第二邻近探针，第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域，并且第二邻近探针包含第二分析物结合域，以及包含通用扩增区域、PST和IMR的第二寡核苷酸域。第二寡核苷酸域可以进一步包含独特分子标识符(UMI)。第一和第二分析物结合域可以是抗体、适体、配体、受体或其组合。第一和第二分析物结合域可以通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合与寡核苷酸域缀合。第一和第二分析物结合域可以分别是第一和第二抗体。第一抗体和第二抗体中的每一个可以是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体或其组合。

组合物可以进一步包括包含独特分子标识符(UMI)和DNA标识符的DNA标签和/或包含RNA标识符、UMI和多聚(T)的RNA标签。组合物可以进一步包括包含RNA标识符、UMI和模板转换寡核苷酸(TSO)的RNA标签。DNA标签可以以5’到3’方向包含UMI和DNA标识符。RNA标签可以以5’到3’方向包含RNA标识符、UMI和多聚(T)。RNA标签可以以5’到3’方向包含RNA标识符、UMI和TSO。

附图简述

图1.示例性邻近探针对。

图2.显示了使用一个带有UMI的探针的PFA的工作流程。用箭头显示了游离3’末端。

图3.从邻近反应产生的第三寡核苷酸。

图4.邻近分析的流程图。

图5.示例性DNA和RNA标签分子。

图6.用于产生DNA和cDNA文库的示例性过程。

发明详述

本文公开了改进的PLA和PEA分析设计，以整合独特分子索引(UMI)和蛋白质或分析物特异性标签序列。NGS可用于计数UMI，作为计算蛋白质丰度的一种方式。使用UMI的蛋白质或分析物PLA或PEA可以使用来自同一样品输入的基因组DNA/转录组RNA文库制备品进行，即，通过计算各自的UMI可以在同一NGS平台上定量分析DNA/RNA/蛋白质生物标志物。2018年3月26日提交的美国申请No.62/648,174中报告了无需物理分离基因组DNA和总RNA的同时进行DNA和RNA富集和文库制备的组合工作流程，其全部内容通过引用并入本文中。新的支持UMI的PLA和PEA分析设计可以整合到其中以允许同时分析所有都来自同一样品的蛋白质/DNA/RNA。

本文公开了用于检测样品中的分析物的方法，包括：将第一和第二邻近探针结合到样品中的分析物，其中第一邻近探针包含第一分析物结合域和包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域，并且其中第二邻近探针包含第二分析物结合域和包含通用扩增区域、PST和IMR的第二寡核苷酸域；并检测分析物。该方法可以进一步包括进行邻近连接(PLA)或延伸(PEA)测定。进行PLA和PEA的方法是本领域公知的。

PLA或PEA测定产生单链或双链的第三寡核苷酸。该方法可以进一步包括进行第三寡核苷酸的扩增以产生基于蛋白质的DNA文库。

本文还公开了组合物，其包含第一邻近探针和第二邻近探针，第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域，并且第二邻近探针包含第二分析物结合域和包含通用扩增区域、PST和IMR的第二寡核苷酸域。

在一些实施方案中，第二邻近探针的第二寡核苷酸域进一步包含UMI。

在第一和第二邻近探针中，第一和第二分析物结合域分别可以是抗体、适体、配体、受体，或其组合。

在一些实施方案中，第一和第二分析物结合域通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合分别与第一和第二寡核苷酸域缀合。

在一些实施方案中，第一和第二分析物结合域可以分别是第一和第二抗体。例如，第一抗体和第二抗体中的每一个是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体或其组合。

本文公开的方法可以进一步包括从同一样品(如同一生物样品)制备DNA和cDNA文库，包括：将DNA标签连接样品中的DNA分子的末端，其中DNA标签包含UMI和DNA标识符；以及在RNA标签的存在下进行样品中RNA分子的逆转录，其中RNA标签包含RNA标识符、UMI和多聚(T)。逆转录可以在第二RNA标签的存在下进行，其中第二RNA标签包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。该方法可以进一步包括扩增标记的DNA和标记的cDNA以用一组基因特异性引物富集。

该方法可以进一步包括将扩增的样品分离成第一、第二或第三样品。

蛋白质和DNA和RNA分子可以从生物样品获得。DNA和RNA分子可以是来自生物样品的片段化DNA和RNA。

DNA分子可以含有用于连接的抛光(polished)末端。RNA分子可以是聚腺苷酸化的。在一些实施方案中，该方法不需要核糖体耗竭。

该方法可以进一步包括用DNA标签特异性的引物扩增第一样品。

该扩增可以产生对应于样品中的DNA的DNA文库。

该方法可以进一步包括用RNA标签特异性的引物扩增第二样品。该扩增可以产生对应于样品中的RNA的RNA文库。

该方法可以进一步包括将基于蛋白质的DNA、DNA或cDNA文库测序。

DNA分子可以是基因组DNA。DNA文库可以用于变体检测、拷贝数分析、融合基因检测或结构变体检测。

cDNA文库可以用于RNA变体检测、基因表达分析或融合基因检测。该文库可以用于配对的DNA和RNA谱分析。

在一些实施方案中，可以将第三寡核苷酸从基因组DNA和总RNA中分离出来。

该方法可以进一步包括从同一样品获得纯化的DNA和RNA；将DNA标签序列连接样品中的DNA；将RNA标签序列连接样品中的RNA；和分别检测DNA、RNA和蛋白质靶标。

本文公开的方法可以进一步包括：(a)从同一生物样品获得纯化的DNA和RNA；(b)将DNA和RNA片段化；(c)将双链DNA片段的末端抛光用于连接；(d)通过聚腺苷酸化将RNA片段抛光；(e)将DNA标签连接抛光的DNA片段的3’末端，其中DNA标签以5’到3’方向包含独特分子标识符(UMI)和DNA标识符；(f)在第一RNA标签和第二RNA标签的存在下进行抛光的RNA片段的逆转录，其中第一RNA标签以5’到3’方向包含RNA标识符、UMI和多聚(T)，并且其中第二RNA标签以5’到3’方向包含RNA标识符、UMI和模板转换寡核苷酸(TSO)；(g)扩增标记的DNA和标记的cDNA，用于用一组基因特异性引物富集；(h)将扩增的样品分成第一和第二样品；(i)用DNA标签特异性的引物扩增第一样品；和(j)用RNA标签特异性的引物扩增第二样品。

本文还公开了通过本文公开的方法形成的基于蛋白质的DNA文库、DNA文库和/或cDNA文库。

例如，本文公开的方法可以使用含有两个针对特异性蛋白质靶标的抗体的抗体对。抗体对(抗体A和抗体B)可以是分成两个的一个多克隆Ab、两个不同的多克隆Ab、两个不同的单克隆Ab，或其组合。两个不同的寡核苷酸分别与两个抗体缀合，形成第一和第二邻近探针。每个寡核苷酸(寡核苷酸A或寡核苷酸B)可以包含通用扩增区，例如，用于PCR扩增，可变探针特异性标签区(PST)，用于区分靶蛋白，UMI区，用于分子计数，以及分子间反应区(IMR)，用于促进寡核苷酸对相互作用，通过连接(PLA)或延伸(PEA)。寡核苷酸对的示例性说明显示于图1中。

UMI可以在寡核苷酸对中的两者中都存在。例如，UMI也可以包括在以上实例中的寡核苷酸B中。在这样的情况中，两个寡核苷酸中的UMI组合用于计数目的。

寡核苷酸与抗体的缀合可以通过化学键直接连接，或通过与连接抗体的中间寡核苷酸杂交，或通过分别连接抗体和寡核苷酸的其他相互作用成分(例如，链霉亲和素和生物素)。

随后将缀合的探针对(与寡核苷酸A缀合的抗体A，与寡核苷酸B缀合的抗体B)用于检测样品中特定靶蛋白的丰度。将不同的探针对混合在一起，使得可以在单一反应中检测多个蛋白质靶标。根据寡核苷酸设计，探针对可以用于PLA或PEA测定中。具体地，邻近探针对的抗体A和抗体B结合单一蛋白质靶标，其使寡核苷酸A和寡核苷酸B接近。随后寡核苷酸A和B彼此相互作用，通过连接酶的连接(PLA)或通过DNA聚合酶的延伸(PEA)，形成新的寡核苷酸。使用以上寡核苷酸的邻近探针对的PEA工作流程的示例显示于图2中。该工作流程显示了使用带有UMI的探针的PEA。用箭头显示了游离3’末端。

所得到的新寡核苷酸，在本文中称为“第三寡核苷酸”或“邻近寡核苷酸”，由两端的通用区、UMI区、两部分的探针特异性标签区(PST-A和PST-B)和分子间反应区(IMR)组成。其可以是单链(PLA或PEA)或双链(PEA)。来自以上PEA测定的示例性双链寡核苷酸显示于图3中。

可以通过添加的适体(通过PCR或连接)来进一步修饰第三寡核苷酸，使得可以在NGS平台上分析它们。从测序读数，通用-A和通用-B的序列用作签名标签，表明该读数是针对蛋白质样品的。如果要在同一平台上分析所有来自DNA和RNA样品的其他类型的读数，这将特别有帮助。PST-A+IMR+PST-B的序列独特地标识每个蛋白质靶标。UMI计数度量了样品中相应蛋白质靶标的丰度。

例如，典型的Illumina Miseq测序读数可以如下：

斜体区域是通用序列。下划线区域(PST-A+IMR+PST-B)独特地标识每个蛋白质靶标。粗体区域是UMI，用于计算样品中相应蛋白质靶标的丰度。与仅使用读数计数相比，使用UMI计数可以有效抵消PCR扩增偏差，提高数据分析的准确性。样品中每个蛋白质靶标的UMI计数首先针对对照的UMI计数进行归一化(normalized)。然后可以比较不同样本的归一化UMI计数。归一化计数越高，样品中相应靶的丰度越高。

本文公开的方法可以并入常规的DNAseq和RNAseq工作流程中，允许同时分析蛋白质/DNA/RNA，仅同时分析DNA和RNA，或从同一样品中各自分开分析。图4中提供了示例工作流程。从基因组DNA和总RNA分离邻近反应的DNA产物可以简化下游NGS文库的制备。由于其长度比gDNA短，因此可以通过简单的大小选择方法将邻近反应的DNA产物与基因组DNA分离。邻近寡核苷酸还可以含有亲和标记(例如生物素)以有助于其与基因组DNA和总RNA的分离。参见图4。

本文公开了用于分析的基于整合分析物的DNA、DNA和cDNA文库制备物，例如通过下一代测序(NGS)分析，而无需物理分离样品中的DNA和RNA。这些方法将UMI(独特分子索引)技术和任选的靶向富集技术无缝地集成到工作流程中，这提高了测序能力的利用和结果的准确性。此外，这些方法分别从分析物、DNA和RNA输出三个独立的基于分析物的DNA、DNA和cDNA文库，这允许在下游测序平台上灵活操作。与独立的DNA文库和cDNA文库方法相比，这些方法减少了样品消耗，简化了实验过程，并且可以帮助研究人员获得基因型和表型相关性以及疾病分子机制的生物学见解。

本文描述了在无需物理分离基因组DNA(gDNA)和mRNA的情况下制备靶向的DNA和cDNA文库的方法。该过程涉及三个模块：(1)分别为每个单独的DNA和RNA片段分配不同的DNA和RNA标签分子，而无需在系统中将它们分开；任选，(2)扩增和富集标记的DNA和RNA片段的子集(靶富集)；(3)差异PCR扩增(富集)产物中标记的DNA和标记的cDNA，输出分别对应于原始DNA和RNA的两个文库。

在第一模块中使用的DNA和RNA标签分子是寡核苷酸，其包含至少1)用于区分DNA文库或RNA文库的识别序列，和2)用于识别每个单独核酸分子的UMI序列。

DNA和RNA标签对于模块3中DNA和cDNA文库的最终分离是必不可少的，在模块3中它们可以作为DNA和RNA的特异性扩增引物位点。UMI序列有助于提高DNA和RNA NGS分析的准确性。示例性标签分子示于图5中。

可以使用两种类型的RNA标签分子，以从两个方向对单链RNA进行测序，并且因此，可以使用两种不同机制来连接RNA特异性序列。只需一种类型的DNA标签分子，因为DNA标签分子可以连接双链DNA的两端。

靶向富集反应(模块2)能够集中观察相关目标区并提供NGS测序能力的经济利用。它还减少了对与全基因组或转录组工作流程相关的样本进行额外处理(如核糖体RNA耗竭)的必要性。DNA和RNA的富集都是在同一反应中完成的。根据应用，如果靶DNA和RNA区相同，富集引物池可以相同。如果对于DNA和RNA的目标区域不同，用户可以简单地混合相应的富集引物池，并将它们放入同一反应中。

模块3能够分离DNA和cDNA文库的输出。DNA和cDNA的测序深度要求通常大不相同，并且它们因应用而异。本文公开的方法的输出为用户提供了灵活性，以便可以根据特定需要单独分配测序容量。此外，由于样品已经在模块2中部分扩增，分离对样品损失的影响可以忽略不计。

图6示出了利用本文公开的方法的一种示例性的优化方式。它从生物样品纯化(不一定分离)的gDNA和RNA开始(步骤1)。总核酸通过酶消化(对于DNA)和通过热水解(对于RNA)进行片段化。双链DNA片段经过末端抛光，以便它们准备好用于连接(步骤2)。片段化的RNA通过聚腺苷酸化进行末端抛光(步骤3)。在接下来的几个步骤中，将DNA片段连接DNA标签分子(步骤4)，然后通过模板转换逆转录将RNA片段与RNA标签分子(在两端)连接(步骤5)。DNA和RNA标签就位后，样品通过一组基因特异性引物进行靶向富集反应，其中目标区域被扩增和富集(步骤6)。最后，样品被分成两个样品，并分别通过DNA标签和RNA标签特异性引物进一步扩增，并使用与例如Illumina NGS平台兼容的适当NGS适体序列(步骤7)。最终产品是分别由原始DNA和RNA材料产生的两个分开的DNA和cDNA文库，且准备好用于测序。

除了从样品制备基于分析物的DNA文库外，本文还公开了用于从同一样品制备DNA和cDNA文库的方法，包括：将DNA标签连接样品中的DNA分子的末端，其中DNA标签包括独特分子标识符(UMI)和DNA标识符；在RNA标签存在下对样品中的RNA分子进行逆转录，其中所述RNA标签包含RNA标识符、UMI和多聚(T)。这些方法不需要从样品物理分离DNA和RNA。

在一些实施方案中，在第二RNA标签的存在下进行逆转录，其中第二RNA标签包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。

在一些实施方案中，所述方法可以包括核糖体耗竭。或者，在一些实施方案中，所述方法不需要核糖体耗竭。核糖体耗竭的方法是本领域已知的，例如，使用RiboZero金(Illumina:MRZG126)。

术语“样品”可以包括获自受试者(例如，哺乳动物受试者、动物受试者、人受试者或非人动物受试者)的肽、多肽、蛋白质、RNA、DNA、单细胞、多细胞、细胞片段或体液试样。可以通过本领域技术人员使用任何已知的方式来选择样品，所述已知方式包括但不限于离心、静脉穿刺、抽血、排泄、擦拭、活检、针吸、灌洗样品、刮擦、手术切除、激光捕获显微切割、梯度分离或干预或本领域已知的其他方式。如本文使用的术语“哺乳动物(mammal)”或“哺乳动物(mammalian)”包括人和非人，并且包括但不限于人、非人灵长类、犬科动物、猫科动物、鼠科动物、牛科动物、马科动物和猪科动物。

如本文使用的，术语“生物样品”旨在包括，但不限于，从受试者分离的组织、细胞、生物流体及其分离物，以及受试者内存在的组织、细胞和流体。

如本文使用的，“单细胞”是指一个细胞。本文所述方法中有用的单细胞可以获自目标组织，或来自活检、血样或细胞培养物。另外，可以获得来自特定器官、组织、肿瘤、赘生物等的细胞并用于本文所述的方法中。通常，可以将来自任何群的细胞用于所述方法中，如原核或真核生物体的群，包括细菌或酵母。

可以使用本领域已知的标准方法，例如，使用胰蛋白酶或木瓜蛋白酶以酶促方式消化组织样品中连接细胞的蛋白质或释放培养物中的贴壁细胞，或机械分离样品中的细胞，来获得单细胞悬液。也可以通过本领域技术人员使用一种或多种已知的与目标样品相关的标志物来选择样品。

用于操作单细胞的方法是本领域已知的并且包括荧光激活细胞分选(FACS)、显微操作和使用半自动化细胞采集器(例如，来自Stoelting Co.的Quixell^TM细胞转移系统)。例如，可以基于显微观察可检测的特征，如位置、形态或报告基因表达，来单独选择单独的细胞。

一旦已经鉴定出所需的样品，使用本领域技术人员已知的方法，制备样品并将细胞裂解以释放细胞内容物，包括DNA和RNA，如gDNA和mRNA。例如，可以通过加热细胞，或通过使用去污剂或其他化学方法，或通过这些的组合，来实现裂解。可以使用本领域已知的任何合适的裂解方法。

使用本领域技术人员已知的方法从细胞分离蛋白质或核酸，如DNA或RNA。

如本文使用的，“分析物”是样品中待鉴定和/或定量的任何分子，如但不限于肽、多肽、蛋白质、抗体、抗原、配体、受体、细菌或病毒成分、小分子、多核苷酸、寡核苷酸等。分析物可以包括诸如，例如，被施用以抑制或治疗或预防失调和/或疾病的药物或化合物这类药剂。

在第一和第二邻近探针中，第一和第二分析物结合域分别可以是能够与目标分析物相互作用的抗体、适体、配体、受体或其组合。

术语“多肽”、“肽”和“蛋白质”在本文可互换使用，是指任何长度的氨基酸的聚合形式。NH₂是指存在于多肽的氨基末端的游离氨基基团。COOH是指存在于多肽的羧基末端的游离羧基基团。

术语“基于蛋白质的DNA”和“基于分析物的DNA”是指分别由于蛋白质或分析物与分析物结合域相互作用而分别与目标蛋白质或分析物相关的DNA，其转而与第一和第二寡核苷酸域相关。

术语“多核苷酸”或“寡核苷酸”是指核酸，如DNA分子和RNA分子及其类似物(例如，使用核苷酸类似物或使用核酸化学产生的DNA或RNA)。如预期的，可以合成制得多核苷酸，例如，使用本领域认可的核酸化学或酶促反应，例如，使用聚合酶，并且如果需要，多核苷酸可以修饰。典型的修饰包括甲基化、生物素化和其他本领域已知的修饰。此外，多核苷酸可以是单链或双链的，且在需要的情况中，连接到可检测部分。在一些方面中，多核苷酸可以包括杂合分子，例如，包含DNA和RNA。

“G”、“C”、“A”、“T”和“U”各自通常代表分别包含鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶和尿嘧啶作为碱基的核苷酸。然而，应当理解，术语“核糖核苷酸”或“核苷酸”也可以指修饰的核苷酸或代替替换部分。技术人员非常清楚鸟嘌呤、胞嘧啶、腺嘌呤和尿嘧啶可以被其他部分替换，而不会显著改变包含带有这种替换部分的核苷酸的寡核苷酸的碱基配对特性。例如，不限于，包含肌苷作为其碱基的核苷酸可以与含有腺嘌呤、胞嘧啶或尿嘧啶的核苷酸碱基配对。因此，含有尿嘧啶、鸟嘌呤或腺嘌呤的核苷酸可以在核苷酸序列中被含有例如肌苷的核苷酸替换。在另一个实例中，寡核苷酸中任何地方的腺嘌呤和胞嘧啶可以分别替换为鸟嘌呤和尿嘧啶，以与靶mRNA形成G-U Wobble碱基配对。含有此类替换部分的序列适用于本文所述的组合物和方法。

术语“DNA”是指单链或双链的染色体DNA、质粒DNA、噬菌体DNA或病毒DNA。DNA可以获自原核生物或真核生物。

术语“基因组DNA”或“gDNA”是指染色体DNA。

术语“信使RNA”或“mRNA”是指没有内含子的且可以翻译成多肽的RNA。

术语“cDNA”是指与mRNA互补或相同的DNA，单链或双链形式的。

独特分子索引或标识符(UMI；也称为随机分子标签(RMT))是用于在文库扩增之前标记每个分析物、蛋白质、DNA或RNA分子(片段)的碱基的短序列或“条形码”，从而辅助识别每种单独的核酸分子或PCR倍增物。参见Kivioja,T.等人，Nat.Methods 9:72-74(2012)和增刊。如果两个读段对齐到相同的位置并具有相同的UMI，则它们很可能是源自扩增前相同片段的PCR倍增物。UMI还可用于检测和量化独特的mRNA转录物。在一些实施方案中，含有相同DNA标识符序列的DNA标签含有不同的UMI序列。在一些实施方案中，含有相同RNA标识符序列的RNA标签含有不同的UMI序列。

UMI区用于分子计数。UMI的概念是在任何扩增之前，每个原始靶分子被独特的条形码序列“标记”。这个DNA序列必须足够长，以提供足够的排列来为每个创建者分子分配独特的条形码。在一些实施方案中，UMI序列含有随机化的核苷酸并且被并入邻近探针的寡核苷酸域或DNA或RNA标签中。例如，12个碱基的随机序列为样品中的每个靶分子提供4¹²或16,777,216个UMI。

适体可以连接第三寡核苷酸，例如，通过扩增或连接，以促进通过测序(如NGS)分析第三寡核苷酸。

“可变探针特异性标签区”(PST)是用于区分靶分析物或蛋白质的特异性序列。由于蛋白质或分析物分别与分析物结合域的相互作用，其转而与第一和第二寡核苷酸域相关，因此探针上的PST序列与相应的靶分析物或蛋白质相关，使得不同的PST表示不同的分析物或蛋白质。

“分子间反应区”(IMR)促可以进寡核苷酸对相互反应，通过连接(PLA)或延伸(PEA)。IMR是第一邻近探针中与第二邻近探针中的IMR区相互作用的区域，如通过杂交。因此，第一邻近探针的IMR可以是100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、85％或80％互补或可由此衍生至第二邻近探针的IMR的任何范围。IMR可以是例如但不限于1-100个核苷酸、1-90个核苷酸、1-80个核苷酸、1-60个核苷酸、1-50个核苷酸、1-40个核苷酸、1-30个核苷酸、1-20个核苷酸、1-10个核苷酸，或可从其衍生的任何长度或范围。

术语“通用PCR手柄(handle)”、“通用PCR序列”、“PCR手柄”、“PCR手柄序列”、“通用PCR手柄”和“通用扩增序列”是指可用于对从生物单元提取或衍生的核酸序列进行扩增(例如PCR扩增)并进一步测序的共同核酸序列。在一些实施方案中，PCR手柄与模板序列缺乏同源性。在其他实施方案中，PCR手柄序列对于整个样品制备工作流程是共同的。可以将RNA逆转录为cDNA，并且可以使用模板转换寡核苷酸(TSO)在合成的cDNA的下游引入PCR手柄(Zhu，Y.Y.等，Biotechniques30：892-7(2001)，即，将PCR手柄附加到全长cDNA的5′端。PCR手柄用于后续扩增。在一些实施方案中，在5′和3′端均具有PCR手柄，即2个PCR手柄，可以增加扩增效率。

如本文使用的，“聚合酶”及其衍生物，通常是指可以催化核苷酸(包括其类似物)聚合成核酸链的任何酶。通常但不必定，这样的核苷酸聚合可以以模板依赖性方式进行。这样的聚合酶可以包括不限于天然产生的聚合酶及其任何亚基和截短体、突变聚合酶、变体聚合酶、重组、融合或其他工程化的聚合物、化学修饰的聚合酶、合成的分子或装配体，及其保留催化此类聚合的能力的任何类似物、衍生物或片段。任选地，聚合酶可以是包含一个或多个突变的突变聚合酶，所述突变涉及用其他氨基酸替换一个或多个氨基酸、聚合酶的一个或多个氨基酸的插入或缺失，或两个或多个聚合物的一部分的连接。通常，聚合酶包含一个或多个活性位点，在该位点可以进行核苷酸聚合的核苷酸结合和/或催化。一些示例性聚合酶包括不限于DNA聚合酶和RNA聚合酶。如本文使用的，术语“聚合酶”及其变体，还指包含至少两个彼此连接的蛋白质的融合蛋白，其中第一部分包含可以催化核苷酸聚合成核酸链的肽并连接包含第二多肽的第二部分。在一些实施方案中，第二多肽可以包括报告酶或处理能力增强域。任选，聚合酶可以具有5’外切酶活性或末端转移酶活性。在一些实施方案中，聚合物可以任选被重新激活，例如通过使用热、化学品或重新添加新含量的聚合酶至反应混合物中。在一些实施方案中，聚合酶可以包括热启动聚合酶或基于适体的聚合物，其任选可以被重新激活。

如本文使用的，术语“延伸”及其变体，用于提及给定引物时，包括给定聚合酶的任何体内或体外酶活性特征，其涉及一个或多个核苷酸聚合到现有核酸分子的末端。通常但不必然地，这样的引物延伸以依赖模板的方式发生；在依赖模板的延伸过程中，碱基的顺序和选择由已建立的碱基配对规则驱动，其可以包括Watson-Crick类型的碱基配对规则，或可替代地(且尤其是在涉及核苷酸类似物的延伸反应的情况中)由一些其他类型的碱基配对范式驱动。在一个非限制性的实例中，延伸通过聚合酶经由核酸分子3′OH末端上的核苷酸的聚合而进行。

如本文使用的，术语“连接(ligating)”、“连接(ligation)”及其衍生通常是指将两个或更多个分子共价连接在一起的行为或过程，例如将两个或更多个核酸分子彼此共价连接。在一些实施方案中，连接包括连接核酸的相邻核苷酸之间的切口。在一些实施方案中，连接包括在第一个核酸分子的末端和第二个核酸分子的末端之间形成共价键。在一些实施方案中，例如其中待连接的核酸分子包括常规核苷酸残基的实施方案，连接可以包括在一个核酸的5′磷酸基团和第二个核酸的3′羟基之间形成共价键，从而形成连接的核酸分子。在一些实施方案中，可以采用任何用于在相邻核苷酸之间连接切口或将5’磷酸与3’羟基键合的方式。在示例性的实施方案中，可以使用诸如连接酶的酶。通常出于本公开的目的，可以将扩增的靶序列连接适体以产生适体连接的扩增靶序列。

如本文使用的，“连接酶”及其衍生，通常是指能够催化两个底物分子连接的任何试剂。在一些实施方案中，连接酶包括能够催化核酸的相邻核苷酸之间切口连接的酶。在一些实施方案中，连接酶包括能够催化一个核酸分子的5′磷酸酯与另一个核酸分子的3′羟基之间形成共价键从而形成连接的核酸分子的酶。合适的连接酶可以包括但不限于T4 DNA连接酶、T4 RNA连接酶和大肠杆菌DNA连接酶。

如本文使用的，“连接条件”及其衍生，通常是指适合将两个分子彼此连接的条件。在一些实施方案中，连接条件适用于密封核酸之间的切口或缺口。如本文定义的，“切口”或“缺口”是指在核酸序列的内部核苷酸内缺少单核苷酸戊糖环的5′磷酸酯与相邻单核苷酸戊糖环的3′羟基直接键合的核酸分子。如本文使用的，术语切口或缺口与该术语在本领域中的使用一致。通常，切口或缺口可以在酶(如连接酶)的存在下在合适的温度和pH下连接。在一些实施方案中，T4 DNA连接酶可以在约70-72℃的温度下连接核酸之间的切口。

如本文使用的，“平端连接”及其衍生，通常是指两个平端双链核酸分子彼此连接。“平端”是指双链核酸分子的末端，其中核酸分子一条链末端的基本上所有核苷酸与同一核酸分子另一条链中的相对核苷酸碱基配对。如果核酸分子的末端包括长度大于两个核苷酸的单链部分(本文称为“突出端”)，则该核酸分子不是平端的。在一些实施方案中，核酸分子的末端不包括任何单链部分，使得末端的一条链中的每个核苷酸与同一核酸分子的另一条链中的相对核苷酸配对。在一些实施方案中，彼此连接的两个平端核酸分子的末端不包括任何重叠、共享或互补序列。通常，平端连接不包括使用额外的寡核苷酸适体来辅助双链扩增的靶序列与双链适体的连接，如在Mitra和Varley，US2010/0129874中描述的贴片寡核苷酸。在一些实施方案中，平端连接包括切口平移反应以密封在连接过程中产生的切口。

术语“扩增子”是指核酸扩增反应(例如，RT-PCR)的扩增产物。

术语“逆转录PCR”和“RT-PCR”是指其中起始材料是mRNA的PCR类型。使用逆转录酶将起始mRNA酶促转化为互补DNA或“cDNA”。然后将cDNA用作PCR反应的模板。

术语“PCR产物”、“PCR片段”和“扩增产物”是指在变性、退火和延伸的两个或更多个循环的PCR步骤完成后得到的化合物混合物。这些术语包括一个或多个靶序列的一个或多个区段已经扩增的情况。

术语“扩增试剂”是指除引物、核酸模板和扩增酶外，扩增所需的那些试剂(三磷酸脱氧核糖核苷酸、缓冲液等)。通常，扩增试剂与其他反应成分一起放置并包含在反应容器(试管、微孔等)中。扩增方法包括本领域技术人员已知的PCR方法，也包括滚环扩增(Blanco等，J.Biol.Chem.,264，8935-8940，1989)、超支化滚环扩增(Lizard等，1989，Nat.Genetics，19，225-232，1998)和环介导的等温扩增(Notomi等，Nuc.Acids Res.，28，e63，2000)，它们各自通过引用整体并入本文中。

术语“杂交”是指与互补核酸的序列特异性非共价结合相互作用。可以对全部或部分核酸序列进行杂交。本领域技术人员将认识到核酸双链体或杂交体的稳定性可以由Tm确定。有关杂交条件的其他指导可参见：Current Protocols in Molecular Biology，JohnWiley&Sons，NY，1989，6.3.1-6.3.6和：Sambrook等人，Molecular Cloning，a LaboratoryManual，Cold Spring Harbor Laboratory Press，1989，Vol.3。

如本文使用的，将序列“整合入(incorporating)”多核苷酸中是指通过磷酸二酯键将一系列核苷酸与多核苷酸的其余部分共价连接，例如在多核苷酸的3′或5′末端，其中核苷酸按照序列规定的顺序连接。如果多核苷酸含有序列或其互补序列，则序列已被“整合入”多核苷酸中，或者等同于多核苷酸“整合”了该序列。可通过酶促(例如，通过连接或聚合)或使用化学合成(例如，通过亚磷酰胺化学)将序列并入多核苷酸中。

如本文使用的，术语“扩增(amplify)”和“扩增(amplification)”是指完整地或部分地酶促拷贝多核苷酸的序列，使得产生更多也含有该序列或其互补序列的多核苷酸。被拷贝的序列被称为模板序列。扩增的实例包括通过RNA聚合酶的DNA模板的RNA合成、通过逆转录酶的RNA模板的第一链cDNA合成和使用热稳定的DNA聚合酶的DNA模板的PCR扩增。扩增包括引物延伸反应。扩增包括如PCR、连接扩增(或连接酶链反应，LCR)和扩增方法这样的方法。这些方法在本领域中是已知的并且被广泛实践。参见，例如，美国专利No.4,683,195和4,683,202以及Innis等，“PCR protocols:a guide to method and applications”Academic Press,Incorporated(1990)(用于PCR)；和Wu等(1989)Genomics 4:560-569(用于LCR)。一般而言，PCR程序描述了一种基因扩增方法，该方法包括(i)引物与DNA样品(或文库)中的特定基因的序列特异性杂交，(ii)随后的扩增，涉及使用DNA聚合酶的多轮退火、延伸和变性，以及(iii)筛选PCR产物中正确大小的条带。所用的引物是足够长的寡核苷酸和合适的序列以提供聚合起始，即每个引物被特异性设计为与待扩增的基因组位置的每条链互补。

用于进行扩增反应的试剂和硬件是可商购的。用于从特定基因区扩增序列的引物优选与靶区域或其侧翼区域中的序列互补并特异性杂交，并且可以使用本文提供的多核苷酸序列制备。扩增产生的核酸序列可直接测序。

两个单链多核苷酸之间以反平行构型发生杂交时，该反应称为“退火”，而那些多核苷酸被描述为“互补”。如本文使用的，除非另有说明，术语“互补”在用于描述与第二核苷酸序列相关的第一核苷酸序列时，是指包含第一核苷酸序列的多核苷酸在某些条件下与包含第二核苷酸序列的多核苷酸杂交并形成双链体结构的能力，如技术人员将理解的。例如，此类条件可以是严格条件，其中严格条件可以包括：400mM NaCl、40mM PIPES pH 6.4、1mMEDTA、50℃或70℃12-16小时，然后洗涤。可以应用其他条件，例如在生物体内可能遇到的生理相关条件。技术人员将能够根据杂交的核苷酸的最终应用确定最适合测试两个序列互补性的条件设置。

互补序列包括包含第一核苷酸序列的多核苷酸区域与包含第二核苷酸序列的多核苷酸区域在一个或全部两个核苷酸序列的长度或部分长度上的碱基配对。此类序列在本文中可被称为彼此“互补”。然而，当第一序列在本文中被称为与第二序列“基本互补”时，这两个序列可以是互补的，或者它们可以在碱基配对区域内包括一个或多个，但通常不超过约5、4、3或2个错配碱基对。对于具有错配碱基对的两个序列，只要这两个核苷酸序列通过碱基配对相互结合，该序列将被视为“基本互补”。

本文使用常规符号来描述核苷酸序列：单链核苷酸序列的左手端是5′端；双链核苷酸序列的左手方向称为5′方向。将核苷酸从5′到3′添加到新生RNA转录物的方向称为转录方向。与mRNA具有相同序列的DNA链称为“编码链”；在与从该DNA转录的mRNA具有相同序列的DNA链上并位于RNA转录物5′端的序列称为“上游序列”；在与RNA具有相同序列的DNA链上并位于编码RNA转录物3′端的序列称为“下游序列”。

在一些实施方案中，双链DNA片段可以是末端抛光的，使得它们适于连接。例如，可以将DNA片段的末端抛光以具有平端。如本领域已知的，这可以用可以填充或去除突出链的酶来实现。另一种方法是在称为“适体”的短合成寡核苷酸存在下进行连接，其制备方式最终将一个末端连接到片段上，并使片段适于与目标多核苷酸连接，如DNA或RNA标签。因此，DNA片段可以连接DNA标签。

在一些实施方案中，RNA片段是通过聚腺苷酸化末端抛光的。RNA片段可以连接RNA标签，例如，在全部两个末端上，通过模板转换逆转录。

“DNA标签”或“DNA标签分子”是包含DNA标识符和UMI的多核苷酸。DNA标签可以是脱氧核糖多核苷酸。“DNA标识符”是分配用于区分gDNA分子和RNA分子的多核苷酸序列。DNA标签可以连接双链DNA片段的5′或3′末端。

“RNA标签”或“RNA标签分子”是包含RNA标识符和UMI的多核苷酸。RNA标签可以是脱氧核糖多核苷酸。“RNA标识符”是分配用于区分cDNA分子和gDNA分子的多核苷酸序列。RNA标签可以进一步包含多聚(T)。或者，RNA标签可以进一步包含模板转换寡核苷酸(TSO)。RNA标签可以用于通过逆转录将5′标签添加到RNA衍生的cDNA片段上。在一些实施方案中，RNA标签可用于通过逆转录中的模板转换将3标签添加到RNA衍生的cDNA上。

两种类型的RNA标签是有帮助的，因为为了从两个方向对单链RNA进行测序，可以使用两种不同的机制来连接RNA特定序列。只需要一种类型的DNA标签，因为DNA标签可以连接双链DNA的两端。

组合物可以包含至少2种上述标签，例如，DNA标签和RNA标签。组合物还可以包含3种上述标签，例如，DNA标签和2种类型的RNA标签。

在一些实施方案中，RNA标签是单链DNA分子并且作为用于逆转录的引物。RNA标签可以使用DNA聚合酶(DNAP)来产生。在此，RNA标签的结合位点是RNA结合位点(例如，mRNA结合位点)并含有与一个或多个RNA中的序列区互补的序列区。在一些实施方案中，结合位点与样品中所有RNA共同的序列区互补，将条形码适体添加到其上。例如，结合位点可以是多聚(T)束，其与真核mRNA的多(A)尾互补。可替代地或另外地，结合位点可以包括随机序列束。将RNA标签添加到与样品相关的RNA后，可以发生逆转录并且可以合成cDNA的第一条链，从而将RNA标识符序列整合入到cDNA的第一条链中。应当认识到逆转录需要合适的条件，例如存在合适的缓冲液和逆转录酶，以及对于将条形码适体与RNA退火和酶活性合适的温度。还将认识到引物的3′端与模板互补并可直接与模板退火时，涉及DNA引物和RNA模板的逆转录是最有效的。因此，可以设计RNA标签，使结合位点出现在适体分子的3′末端。

如上所述，本发明的方法可以使用逆转录酶，在达到模板RNA的5’末端时，将一个或多个非模板的核苷酸(如C)添加到新生cDNA链的末端。这些核苷酸在RNA/DNA双链体的一个末端形成3’DNA突出。如果第二RNA分子含有序列区，例如，在其3’末端与非模板核苷酸互补的多G束，并结合非模板核苷酸，逆转录酶可以转换模板并继续延伸cDNA，现在使用第二RNA分子作为模板。这样的第二RNA分子在本文以及在本领域中被称为模板转化寡核苷酸(TSO)。

在本发明方法的实施方案中，包含RNA标识符、UMI和TSO的第二RNA标签可以作为模板转换寡核苷酸，用于逆转录。因此，在模板转换后，将RNA标识符序列并入cDNA的第一链中，并且存在于从第一链的cDNA扩增(例如，通过PCR)得到的DNA分子中。在这些实施方案中，可以使用具有模板转换活性的任何逆转录酶。第一RNA标签的结合位点是cDNA结合位点并优选出现在适体分子的3’末端。结合位点可以包括G-束(包含一个或多个G核苷酸)，或任何其他至少部分与通过逆转录酶产生的3’突出互补的序列。将认识到突出序列并且因此用于条形码适体的结合位点的合适序列，可以取决于该方法中使用的逆转录酶的选择。

用于逆转录和模板转换的方法是本领域公知的。常常称为“SMART”(在RNA转录物5’末端的转换机制)的程序可以产生全长cDNA文库，甚至从单细胞衍生的RNA样品产生。这个策略依赖于莫洛尼鼠白血病病毒(MMLV)逆转录酶的内在特性以及独特的模板转换寡核苷酸(TS寡核苷酸，或TSO)的使用。莫洛尼鼠白血病病毒逆转录酶(M-MLV RT)是RNA依赖性DNA聚合酶，其可用于长信使RNA模板(>5kb)的cDNA合成。该酶是M-MLV pol基因的产物，且由分子量为71kDa的单个亚基组成。在第一链合成过程中，到达RNA模板的5′末端时，MMLV逆转录酶的末端转移酶活性在新合成的cDNA链的3′末端添加将一些额外的核苷酸(主要是脱氧胞苷)。这些碱基充当TS寡核苷酸核苷酸锚定位点。在TS寡核苷酸和突出的脱氧胞苷段之间进行碱基配对后，逆转录酶“转换”模板链，从细胞RNA到TS寡核苷酸，并继续复制到TS寡核苷酸的5′末端。通过这样做，得到的cDNA包含转录物的完整5′末端，并且可以将选择的通用序列添加到逆转录产物中。除了通过寡核苷酸dT引物标记cDNA3′末端外，这种方法还可以以完全独立于序列的方式有效扩增整个全长转录库。

TS寡核苷酸可以是在其3’末端携带3个核糖鸟苷(rGrGrG)的DNA寡核苷酸序列。这些连续的rG碱基与cDNA分子的3′dC延伸之间的互补性允许随后的模板转换。也可以用锁核酸碱基(LNA)替换最3′端的rG，以增强LNA单体的热稳定性，这将有利于碱基配对。

TSO可以包括3’部分，其包含多个鸟苷或与胞嘧啶配对的鸟苷类似物。本文所述的方法中有用的鸟苷或鸟苷类似物的非限制性实例包括，但不限于，脱氧核糖鸟苷、核糖鸟苷、锁核酸-鸟苷和肽核酸-鸟苷。鸟苷可以是核糖核苷或锁核酸单体。

TSO可以包括3’部分，其包括至少2个、至少3个、至少4个、至少5个或2、3、4或5，或2-5个鸟苷，或与胞嘧啶配对的鸟苷类似物。多个鸟苷(或与胞嘧啶碱基配对的鸟苷类似物)的存在允许TSO与cDNA的第一链的3’末端暴露的胞嘧啶瞬时退火。这会导致逆转录酶转换模板并继续合成与TSO互补的链。在本发明的一个方面中，TSO的3′末端可以被封闭，例如通过3′磷酸基团，以防止TSO在cDNA合成过程中作为引物起作用。

在集合标记的cDNA样品前，可以停止cDNA的合成，例如，通过除去或灭活逆转录酶。这防止通过逆转录的cDNA合成在集合的样品中继续。

如本文使用的，“扩增的靶序列”及其衍生，通常是指使用靶特异性引物和本文提供的方法通过靶序列的扩增/扩增靶序列产生的核酸序列。扩增的靶细胞关于靶序列可以是相同义的(第二轮和随后偶数轮扩增中产生的正链)或是反义的(即，在第一轮和随后奇数轮扩增中产生的负链)。出于本公开的目的，扩增的靶序列通常与反应中另一个扩增的靶序列的任何部分的互补性低于50％。

Mullis(美国专利No.4,683,195、4,683,202和4,965,188)的术语“聚合酶链式反应”(“PCR”)是指增加核酸序列混合物中靶序列区段的浓度而没有克隆或纯化的方法。这种用于扩增靶序列的方法由以下步骤组成：将大量过剩的两个寡核苷酸引物引入含有所需靶序列的核酸序列混合物中，接着在聚合酶(例如，DNA聚合酶)的存在下热循环精确的序列。这两个引物与双链靶序列各自的链互补。为了实现扩增，将混合物变性并随后将引物退火至靶分子内的其互补序列。退火后，聚合酶将引物延伸，使得形成新的互补链对。将变性、引物退火和聚合酶延伸的步骤重复多次(即，变性、退火和延伸构成一个“循环”，可以存在很多“循环”)，以获得高浓度的所需靶序列的扩增区段。通过引物相对于彼此的相对位置来确定所需靶序列的扩增区段的长度，并且因此，这个长度是可控参数。凭借该过程的重复特征，将该方法称为“聚合酶链式反应”(下文称为“PCR”)。因为所需的靶序列的扩增区段变成混合物中的主要序列(就浓度而言)，因此将它们称为“PCR扩增的”。

本文公开的方法可以进一步包括扩增标记的DNA和标记的cDNA，用于用一组基因特异性引物富集。可以用例如SPE引物集合、DNA加强引物和RNA加强引物来实现靶富集。基于扩增子的下一代测序(NGS)试验给予了靶向富集许多优势。例如，QIAseq NGS组使用独特分子索引(UMI)来校正PCR扩增偏差并使用单引物延伸(SPE)技术，其提供设计灵活性和高度特异性靶富集。UMI的概念是在任何扩增之前，每个原始靶分子都被一个独特的条形码序列“标记”。这个DNA序列必须足够长，以提供足够的排列来为每个创建者分子分配独特的条形码。在目前的形式中，12个碱基的随机序列为样品中的每个靶分子提供4¹²或16,777,216个UMI。

如本文使用的，术语“引物”包括天然或合成的寡核苷酸，与多核苷酸模板形成双链体时，其能够作为核酸合成的起始点并从其3′端沿模板延伸，从而形成延伸的双链体。在延伸过程中添加的核苷酸序列由模板多核苷酸的序列决定。通常引物通过DNA聚合酶延伸。引物通常具有3至36个核苷酸、5至24个核苷酸以及14至36个核苷酸范围内的长度。本发明范围内的引物包括正交引物、扩增引物、构建引物等。引物对可以位于目标序列或一组目标序列的侧翼。引物和探针在序列上可以是简并的。本发明范围内的引物与靶序列相邻结合。“引物”可以被认为是一种短的多核苷酸，通常带有游离的3′-OH基团，该基团通过与靶标杂交而与可能存在于目标样品中的靶或模板结合，然后促进与该靶互补的多核苷酸的聚合。本发明的引物由17至30个核苷酸的核苷酸组成。在一些实施方案中，引物是至少17个核苷酸，或可替代地，至少18个核苷酸，或可替代地，至少19个核苷酸，或可替代地，至少20个核苷酸，或可替代地，至少21个核苷酸，或可替代地，至少22个核苷酸，或可替代地，至少23个核苷酸，或可替代地，至少24个核苷酸，或可替代地，至少25个核苷酸，或可替代地，至少26个核苷酸，或可替代地，至少27个核苷酸，或可替代地，至少28个核苷酸，或可替代地，至少29个核苷酸，或可替代地，至少30个核苷酸，或可替代地至少50个核苷酸，或可替代地至少75个核苷酸或可替代地至少100个核苷酸。

如本文使用的，“靶特异性引物”及其衍生，通常是指单链或双链多核苷酸，通常是寡核苷酸，其包括至少一个与包括靶序列的核酸分子的至少一部分至少50％互补，通常至少70％互补或至少85％互补，更常见至少90％互补，更常见至少95％互补，更常见至少98％或至少99％互补，或100％相同的序列。在这样的情况中，将靶特异性引物和靶序列描述为彼此“对应”。在一些实施方案中，靶特异性引物能够预期对应的靶序列的至少一部分(或与靶序列的补体)杂交；这样的杂交可以任选在标准杂交条件下或严格杂交条件下进行。在一些实施方案中，靶特异性引物不能够与靶序列或与其互补序列杂交，但能够与包括靶序列的核酸链的一部分或与其互补序列杂交。在一些实施方案中，靶特异性引物包括至少一个与靶序列自身的至少一部分至少75％互补，通常至少85％互补，更常见至少90％互补，更常见至少95％互补，更常见至少98％互补，或更常见至少99％互补的序列；在其他实施方案中，靶特异性引物包括与靶序列以外的其他核酸分子的至少一部分至少75％互补，通常至少85％互补，更常见至少90％互补，更常见至少95％互补，更常见至少98％互补，或更常见至少99％互补的序列。在一些实施方案中，靶特异性引物与样品中存在的其他靶序列基本上不互补；任选，靶特异性引物与样品中存在的其他核酸分子基本上不互补。在一些实施方案中，样品中存在的不包括或对应于靶序列(或靶序列的补体)的核酸分子被称为“非特异性”序列或“非特异性核酸”。在一些实施方案中，对靶特异性引物进行设计，以包括与其对应的靶序列的至少一部分基本上互补的核苷酸序列。在一些实施方案中，靶特异性引物在其整个长度上与包括其对应的靶序列的核酸分子的至少一部分为至少95％互补，或至少99％互补，或100％相同。在一些实施方案中，靶特异性引物在其整个长度上与其对应的靶序列的至少一部分可以为至少90％，至少95％互补，至少98％互补或至少99％互补，或100％相同。在一些实施方案中，正向靶特异性引物和反向靶特异性引物限定了可以用于通过模板依赖性引物延伸扩增靶序列的靶特异性引物对。通常，靶特异性引物对的每个引物包含至少一条与包括对应的靶序列的核酸分子的至少一部分基本上互补的序列，但该序列与样品中的至少一个其他靶序列低于50％互补。在一些实施方案中，可以在单个扩增反应中使用多个靶特异性引物对来进行扩增，其中每个引物对包括正向靶特异性引物和反向靶特异性引物，每个包括至少一个与样品中对应的靶序列基本上互补或基本上相同的序列，并且每个引物对具有不同的对应靶序列。在一些实施方案中，靶特异性引物可以在其3’末端或其5’末端与扩增反应中存在的任何其他靶特异性引物基本上不互补。在一些实施方案中，靶特异性引物可以包括与扩增反应中的其他靶特异性引物的最小交叉杂交。在一些实施方案中，靶特异性引物包括与扩增反应混合物中的非特异性序列的最小交叉杂交。在一些实施方案中，靶特异性引物可以包括最小自我互补。在一些实施方案中，靶特异性引物可以包括一个或多个位于3’末端的可分裂基团。在一些实施方案中，靶特异性引物可以包括一个或多个位于靶特异性引物的中心核苷酸附近或大致位置的可分裂基团。在一些实施方案中，多个靶特异性引物中的一个仅在靶特异性引物的5’末端包括不可分裂的核苷酸。在一些实施方案中，靶特异性引物与任选在同一扩增反应中的一个或多个不同的靶特异性引物相比，在引物的3’末端或5’末端包括最小核苷酸序列重叠。在一些实施方案中，单个反应混合物中的1、2、3、4、5、6、7、8、9、10或更多个靶特异性引物包括以上实施方案中的一个或多个。在一些实施方案中，单个反应混合物中基本上全部的多个靶特异性引物包括以上实施方案中的一个或多个。

引物设计是基于单引物延伸，其中每个基因组靶通过一个靶特异性引物和一个通用引物来富集——即除去常规两个靶特异性引物设计限制并降低所需引物量的策略。将对于组所需的所有引物集合到单个引物池中，以减少组操作以及对于富集和文库构建所需的池的数量。

加强组是多达100个引物的池，所述引物可以用于加强任何组中的特定引物(编目的、延伸的或定制的)的性能，或用于延伸现有的定制组的内容物。所述引物作为可以掺加(spiked)到现有组中的单个池来递送。

去除未使用的适体后，可以使用适体引物和单个引物池进行有限数量的PCR循环，每个引物都携带基因特异性序列和5′通用序列。在此过程中，每个引物都会从不同的DNA模板中重复采样相同的靶基因座。之后，可以使用通用引物进行额外的PCR循环，以连接完整的适体序列并将文库扩增到所需数量。

与现有的靶向富集方法相比，SPE方法依赖于单末端适体连接，这固有地比需要适体来连接dsDNA片段的两个末端具有高得多的效率。将有更多的DNA分子可用于下游PCR富集步骤。由于不存在来自第二个引物的效率约束，使用一个引物的PCR富集效率也高于常规的双引物方法。在初始PCR循环过程中，引物具有重复的机会将最大量的初始DNA分子转换成扩增子。

所有三个特征都有助于提高捕获样品中稀有突变的效率。此外，扩增子中整合的UMI是估算捕获的DNA分子数量以及很大程度上降低下游分析中的测序错误的关键。单引物延伸还允许发现未知的结构变体，如基因融合体。

将DNA(例如，gDNA)和cDNA的靶向富集样品分成2个分开的样品。第一样品可以使用DNA标签特异性的引物通过聚合酶链式反应(PCR)来扩增，以产生对应于样品中的DNA的DNA文库。第二样品可以使用RNA标签特异性的引物通过PCR来扩增，以产生对应于样品中的RNA的cDNA文库。

实时聚合酶链式反应(实时PCR)，也称为定量聚合酶链式反应(qPCR)，是一种基于聚合酶链式反应(PCR)的分子生物学实验室技术。它在PCR过程中监测靶向的DNA分子的扩增，即实时监测，而不是像传统PCR那样在其结束时监测。实时PCR可以定量使用(定量实时PCR)，也可以半定量使用，即高于/低于一定数量的DNA分子(半定量实时PCR)。其他类型的PCR包括但不限于巢式PCR(用于分析来自同一物种的不同生物体但单个核苷酸可能不同的DNA序列(SNIPS)，并确保分析的每个生物体中的目标序列的扩增)和反向PCR(通常用于克隆插入或转座元件侧翼的区域)。

在实时PCR中检测PCR产物的两种常用方法是：(1)插入任何双链DNA的非特异性荧光染料，以及(2)由用荧光报告子标记的寡核苷酸组成的序列特异性DNA探针，所述荧光报告子使得只有在探针与其互补序列杂交后才允许检测。

用于进行PCR的方法和试剂盒是本领域公知的。PCR是其中复制拷贝由靶多核苷酸构成的反应，所述反应使用由上游和下游引物组成的一对引物或一组引物和聚合催化剂，如DNA聚合酶，且通常是热稳定的聚合酶。用于PCR的方法是本领域公知的，并且例如在MacPherson等(1991)PCR 1:A Practical Approach(IRL Press at Oxford UniversityPress)中有教导。

本发明的实施方案提供了2个分开的用于下游灵活操作的文库：通过本文所述的任一种方法产生的基于初始DNA的DNA文库和基于初始RNA的cDNA文库。可以将DNA文库或cDNA文库测序，以提供单细胞或多个单细胞中的基因表达的分析。

可以使用本领域技术人员已知的方法，例如，通过下一代测序(NGS)，对扩增的DNA或cDNA文库进行测序和分析。在某些示例性实施方案中，使用本领域已知的任一种测序方法来测定RNA表达特征。可以使用本领域已知的各种测序方法来进行目标核酸序列的序列测定，所述包括但不限于，合成测序(SBS)、杂交测序(SBH)、连接测序(SBL)(Shendure等(2005)Science 309:1728)、定量增量荧光核苷酸添加测序(QIFNAS)、逐步连接和裂解、荧光共振能量转移(FRET)、分子信标、TaqMan报告探针消化、焦磷酸测序、荧光原位测序(FISSEQ)、FISSEQ珠(美国专利No.7,425,431)、摆频(wobble)测序(PCT/US05/27695)、多重测序(美国系列No.12/027,039，2008年2月6日提交；Porreca等(2007)Nat.Methods 4:931)，聚合菌落(POLONY)测序(美国专利No.6,432,360、6,485,944和6,511,803，以及PCT/US05/06425)；纳米网格滚环测序(ROLONY)(US2009/0018024)、等位基因特异性寡核苷酸连接测定(例如，寡核苷酸连接分析(OLA)、使用连接线性探针和滚环扩增(RCA)读数的单模板分子OLA、连接挂锁探针，和/或使用连接环状挂锁探针和滚环扩增(RCA)读数的单模板分子OLA)等。也可以使用高通量测序方法，例如使用诸如Roche 454、Illumina Solexa、AB-SOLiD、Hel icos、CompleteGenomics、Polonator平台等的平台。多种基于光的测序技术是本领域已知的(Landegren等(1998)Genome Res.8:769-76；Kwok(2000)Pharmacogenomics1:95-100；和Shi(2001)Clin.Chem.47:164-172)。

本发明的实施方案还提供了用于分析多个单细胞中的基因表达的方法，该方法包括使用本文所述的方法制备cDNA文库和对该cDNA文库测序的步骤。“基因”是指含有至少一个开放阅读框(ORF)的多核苷酸，该开放阅读框在转录和翻译后能够编码特定多肽或蛋白质。本文所述的任何多核苷酸序列均可用于识别与其相关的基因的较大片段或全长编码序列。分离较大片段序列的方法是本领域技术人员已知的。

如本文所用，“表达”是指多核苷酸转录成mRNA的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。如果多核苷酸源自基因组DNA，则表达可以包括mRNA在真核细胞中的剪接。

可以通过任何合适的筛选方法对cDNA文库进行测序。特别是，可以使用高通量筛选方法对cDNA文库进行测序，如Applied Biosystems的SOLiD测序技术或Illumina的基因组分析仪。在本发明的一个方面中，可以对cDNA文库进行鸟枪测序。读段数可以是至少10,000、至少100万、至少1000万、至少1亿或至少10亿。在另一个方面中，读数的数量可以是10,000到100,000，或可替代地100,000到100万，或可替代地10万到100万，或可替代地100万到1000万，或可替代地1000万到1亿，或可替代地1亿到10亿。“读段”是通过测序反应获得的一段连续核酸序列。

通过本文公开的方法产生的DNA或gDNA文库可以用于，但不限于，DNA变体检测、拷贝数分析、融合基因检测和结构变体检测。通过本文公开的方法产生的cDNA文库可以用于，但不限于，RNA变体检测、基因表达分析和融合基因检测。基于蛋白质的DNA、DNA和cDNA文库也可以用于配对的蛋白质、DNA和RNA谱分析。

本文所述的表达谱可用于预测医学领域中，其中将诊断测定、预后测定、药物基因组学和监测临床试验用于预后(预测)目的，从而预防性治疗个体。因此，一些实施方案涉及用于确定核酸序列(例如，蛋白质或RNA)的表达谱的诊断测定，以确定个体是否处于发展病症和/或疾病的风险中。此类测定可用于预后或预测目的，从而在病症和/或疾病发作之前预防性治疗个体。因此，在某些示例性实施方案中，提供了使用本文所述的一种或多种表达谱方法来诊断和/或预后一种或多种疾病和/或病症的方法。

一些实施方案涉及在临床试验中监测试剂(例如，被施用以抑制或治疗或预防失调和/或疾病的药物或其他化合物)对核酸序列(例如，蛋白质或RNA)的表达谱的影响。因此，在某些示例性实施方案中，提供了使用本文所述的一种或多种表达谱分析方法在用一种或多种药剂治疗之前、期间和/或之后监测一种或多种疾病和/或失调的方法。

监测药剂(例如，药物化合物)对本发明的标志物的表达水平的影响不仅可以应用于基础药物筛选中，也可以应用于临床试验中。例如，可以在接受针对与表达谱相关的疾病和/或病症治疗的受试者的临床试验中监测药剂影响表达谱的有效性。在某些示例性实施方案中，用于监测用药剂(例如，激动剂、拮抗剂、肽模拟物、蛋白质、肽、核酸、小分子或其他药物候选物)治疗受试者的有效性的方法包括：(i)药剂给药前从受试者获得给药前样品；(ii)检测给药前样品中的一种或多种表达谱；(iii)从受试者获得一个或多个给药后样品；(iv)检测给药后样品中的一种或多种表达谱；(v)将给药前样品中的一种或多种表达谱与给药后样品中的一种或多种表达谱进行比较；(vi)相应地改变对受试者的药剂给药。

本文所述的表达谱分析方法允许对基因表达进行定量。因此，不仅可以确定组织特异性，而且可以确定组织中多种基因的表达水平。因此，可以根据基因组织表达本身以及该组织中的表达水平对基因进行分组。例如，这有助于确定两种或更多种组织之间的基因表达关系。因此，可以扰乱一种组织并且可以确定对第二种组织中的基因表达的影响。在这种情况下，可以确定一种细胞类型响应生物刺激对另一种细胞类型的影响。例如，这种确定有助于了解细胞-细胞相互作用在基因表达水平上的影响。如果治疗性给药药剂以治疗一种细胞类型但对另一种细胞类型具有不良作用，则本发明提供测定法以确定不良作用的分子基础并因此提供共同给药对抗剂或以其他方式治疗不良作用的机会。类似地，即使在单个细胞类型中，也可以在分子水平上确定不良的生物效应。因此，可以确定和抵消药剂对靶基因以外的表达的影响。

在其他实施方案中，可以监测表达谱中的一个或多个核酸序列(例如，基因、mRNA等)表达的时间过程。这可以发生在各种生物学背景中，如本文所公开的，例如疾病和/或病症的发展、疾病和/或病症的进展以及过程，此类与疾病和/或病症相关的细胞改变。

本文所述的表达谱分析方法也可用于确定同一细胞中或不同细胞中一个或多个核酸序列(例如基因、mRNA等)的表达对其他核酸序列(例如，基因、mRNA等)表达的影响。例如，如果无法调控最终的或下游的靶，则这对于用于治疗干预的替代分子靶标提供了选择。

本文所述的表达谱分析方法也可用于确定正常和异常细胞中一种或多种核酸序列(例如，基因、mRNA等)的差异表达模式。这提供了可作为诊断或治疗干预的分子靶的一组核酸序列(例如，基因、mRNA等)。

本文所述的方法可用于检测或测量分析物，诸如但不限于转化研究中的蛋白质生物标志物。此外，能够在同一平台上分析核酸和蛋白质或分析物将大大减少分析时间并提供更多见解。

实施例

实施例1

下面是一个说明性的实例，显示了本文描述的方法可以如何用于蛋白质分析。总共设计了96对探针来检测96种不同的蛋白质靶标。其中四个是用于数据归一化目的的对照。对照1和对照2用于不在测试样品中的外源蛋白质靶标。所有寡核苷酸的5′末端都与它们各自的抗体缀合。对照3是延伸对照，其中寡核苷酸A和寡核苷酸B都与同一抗体缀合，因此延伸与抗原结合无关。对照4是用于监测PCR扩增变化的检测对照，其中将完整的全长寡核苷酸直接掺入反应中。

实施例2

样品：

1.人血清样品

2.人血清样品+掺入5ng/ml的蛋白质靶标#1和#2

3.PBS(阴性对照)

抗体结合：

在4℃孵育过夜(16hr)。

延伸：

在带有加热盖的热循环仪中孵育50℃20min→95℃5min→17个循环(95℃30sec→54℃1min→60℃1min)→4℃保持。

文库扩增：

在带有加热盖的热循环仪中孵育95℃13分钟→98℃2分钟→20个循环(98℃15秒→60℃2分钟)→72℃5分钟→4℃保持。

纯化：向来自前一步骤的25uL样品中的每一个中添加75uL冰冷的水以使得总共100uL。进行1轮1.2x Ampure XP珠纯化(在20uL水中洗脱)。

使用Agilent生物分析仪高灵敏度DNA芯片进行文库定量：将纯化的文库稀释至2ng/uL。在生物分析仪上上样1uL此稀释样品。基于生物分析仪的电泳图获得文库的摩尔浓度。文库已准备好进行测序。

实施例3

起始材料：纯化的基因组DNA和总RNA。例如，从THP-1细胞系纯化50ng gDNA和50ng总RNA。理想情况下，gDNA和RNA的相对量应当代表样品中的含量。

DNA/RNA片段化：

RNA多聚腺苷酸化

DNA连接：

纯化：将50uL冰冷的水加入50uL来自前一步的样品中，使得总共100uL。进行2轮1.2×Ampure XP珠纯化，遵循制造商手册但有以下例外：第一轮在52uL水中洗脱；且第二轮在13uL水中洗脱。

逆转录：

纯化：将75uL冰冷的水加入25uL来自前一步骤的样品中，使得总共100uL。按照制造商的手册进行1轮1.2×Ampure XP珠纯化，并在16.8uL水中洗脱。

靶富集：

纯化：将60uL冰冷的水加入40uL来自前一步骤的样品中，使得总共100uL。按照制造商的手册使用Ampure XP珠进行双倍尺寸选择0.5x/0.5x，并在22uL水中洗脱。

qPCR(实时)来确定最终扩增循环：

通用PCR：

纯化：将75uL冰冷的水加入每个25uL来自前一步骤的样品中，使得总共100uL。按照制造商的手册进行1轮1.2×Ampure XP珠纯化，并在20uL水中洗脱。

使用Agilent生物分析仪高灵敏度DNA芯片的文库定量：将纯化的文库稀释至2ng/uL。在生物分析仪上加载1uL此稀释样品。基于生物分析仪的电泳图获得文库的摩尔浓度。文库已准备好进行测序。

按照工作流程，使用50ng gDNA和50ng总RNA输入，我们获得了675ng DNA文库和455ng RNA文库。为了比较的目的，还将相同量的50ng总RNA用于来自QIAGEN的QIAseqTargeted RNAscan Panels系统。为了比较的目的，还将相同量的50ng gDNA用于来自QIAGEN的QIAseq Targeted DNA Panels系统。然后将样品放在Illumina的MiSeq机器上进行测序。

结果：如表1所示，与独立的RNA文库制备工作流程(来自QIAGEN的QIASeqTargeted RNAscan Panels系统)相比，我们的方法对第一链cDNA实现了约24％的富集效率，以及第二链cDNA的约40％的富集效率。由于RNAscan工作流程的链偏向于第一链，因此我们的方法具有较少的偏向性并改善了链平衡。富集效率对RNA分析的影响值得进一步的探索。

表1.

RNA样品的每个SPE引物的UMI：基于它们检测到的RNA链将引物分成两组。如表2所示，与独立的DNA文库制备工作流程(来自QIAGEN的QIASeq Targeted DNA Panels系统)相比，我们的方法实现了略高的富集效率。这两种方法具有相当的测序特异性和一致性。

表2.

两种方法中DNA样品的测序规格：通过T50测量了序列覆盖均匀性，T50是目标区域底部50％捕获的总序列通量的百分比。在完美均匀的场景中，T50值等于50。

还评估了DNA和RNA之间的串扰，因为它们保持在同一反应中。使用来自THP-1细胞系的相同50ng的DNA和RNA，从RNA到DNA的有效泄漏信号仅为真实DNA信号的0.75％，这是通过检测RNA和DNA的引物的总UMI测量的。在这种情况下，只有极高表达的基因可能会对相应的DNA拷贝数分析产生影响。然而，如果DNA拷贝数分析仅限于内含子区，这种影响应该会消失。通过相同的测量，从DNA到RNA的有效泄漏信号平均约为3％。由于大多数情况下每个细胞中只有几个基因组DNA的拷贝，这种泄漏只会影响那些极低表达的基因(每个细胞少于0.1个拷贝)，这可能低于背景噪音水平。总之，我们的方法证明了DNA和RNA样本之间的最小串扰，这在实际情况中可能没有任何显著影响。

通过我们的方法制备的DNA文库可用于DNA变体检测和拷贝数分析。我们的方法制备的RNA文库适用于基因表达分析、融合基因检测和RNA变体检测。可以基于我们提出的方法开发多模式NGS组，用于生物标志物筛选或靶向eQTL分析。

用于连接的适体：

逆转录寡核苷酸：

靶富集寡核苷酸：

uPCR引物：

SPE引物池(以下寡核苷酸的等摩尔混合物)：

SEQ ID NO:11:

AATGTACAGTATTGCGTTTTGAGCCCCAAGTCCTATGAGAACCTCTG

SEQ ID NO:12:

AATGTACAGTATTGCGTTTTGTGGCACCAGCGATCAGGTCCTTTAT

SEQ ID NO:13:

AATGTACAGTATTGCGTTTTGCTGAGTGGAGTCACAGCGGAGATAGT

SEQ ID NO:14:

AATGTACAGTATTGCGTTTTGTGTTCCACCAGTAACAACAGTTGAATGTCC

SEQ ID NO:15:

AATGTACAGTATTGCGTTTTGGTGTGAGGAACATACTAGTGCTTTGCAAGT

SEQ ID NO:16:

AATGTACAGTATTGCGTTTTGTTCAAAGTTGGGTCTGCTTCAGTCCAAAG

SEQ ID NO:17:

AATGTACAGTATTGCGTTTTGCCCCCAGCTTCTTCTCTCTGCACTAAG

SEQ ID NO:18:

AATGTACAGTATTGCGTTTTGGCCTTCCCAACATGCATTCTAACTTCTTCC

SEQ ID NO:19:

AATGTACAGTATTGCGTTTTGCCAGCTACTCTCAAAATCAGCATCCTTTGG

SEQ ID NO:20:

AATGTACAGTATTGCGTTTTGCCAGTCCTTCTGTGAGTCTATCCTCAGTTC

SEQ ID NO:21:

AATGTACAGTATTGCGTTTTGAGAGCGAACCAAGAATGCCTGTTTACAG

SEQ ID NO:22:

AATGTACAGTATTGCGTTTTGGAGAGGCACGAGAACACACATCTATTCTG

SEQ ID NO:23:

AATGTACAGTATTGCGTTTTGTTCTCTTCAGAAGTTCCTTCGTCATCCTT

SEQ ID NO:24:

AATGTACAGTATTGCGTTTTGTGATGACATGCCCCATCACTAAAACAC

SEQ ID NO:25:

AATGTACAGTATTGCGTTTTGTGATAGAGACATGATGTAACCGTGGGAATTTCTTC

SEQ ID NO:26:

AATGTACAGTATTGCGTTTTGCGTTCTAAGAGAGTGACAGAAAGGTAAAGAGGAG

SEQ ID NO:27:

AATGTACAGTATTGCGTTTTGATCACAAAGTATCTTTTTCTGTGGCTTAGAAATCTT

SEQ ID NO:28:

AATGTACAGTATTGCGTTTTGTCAAATGTTAGCTCATTTTTGTTAATGGTGGCTTTT

SEQ ID NO:29:

AATGTACAGTATTGCGTTTTGTGTCACATTATAAAGATTCAGGCAATGTTTGTTAGT

SEQ ID NO:30:

AATGTACAGTATTGCGTTTTGAGTTTGTATGCAACATTTCTAAAGTTACCTACTTGT

SEQ ID NO:31:

AATGTACAGTATTGCGTTTTGAAAATCTGTTTTCCAATAAATTCTCAGATCCAGGAA

SEQ ID NO:32:

AATGTACAGTATTGCGTTTTGCGACCCAGTTACCATAGCAATTTAGTGAAATAACTA

SEQ ID NO:33:

AATGTACAGTATTGCGTTTTGAGAGGCGCTATGTGTATTATTATAGCTACCTGTTAA

SEQ ID NO:34:

AATGTACAGTATTGCGTTTTGCGTTTTTGACAGTTTGACAGTTAAAGGCATTTCC

SEQ ID NO:35:

AATGTACAGTATTGCGTTTTGCTGTCCTTATTTTGGATATTTCTCCCAATGAAAGTA

SEQ ID NO:36:

AATGTACAGTATTGCGTTTTGGACTTTTTGCAAATGTTTAACATAGGTGACAGATTT

SEQ ID NO:37:

AATGTACAGTATTGCGTTTTGAAGTAGAAAATGGAAGTCTATGTGATCAAGAAATCG

SEQ ID NO:38:

AATGTACAGTATTGCGTTTTGGGCCTCTTAAAGATCATGTTTGTTACAGTGCTTA

SEQ ID NO:39:

AATGTACAGTATTGCGTTTTGACAAGATTGGTCAGGAAAAGAGAATTGTTCCTATAA

SEQ ID NO:40:

AATGTACAGTATTGCGTTTTGAGACCCTGTCTCAAAAGTAAAAAGTAAGTTAACATG

SEQ ID NO:41:

AATGTACAGTATTGCGTTTTGTCAGTGTCTTCCAAATCCTTATGTATAGCAGCAAT

SEQ ID NO:42:

AATGTACAGTATTGCGTTTTGAGGGTCGAGGAAGCCAGTTTACATCAA

SEQ ID NO:43:

AATGTACAGTATTGCGTTTTGAACAAAAAGATATTTTCAATATTTCTGCGCAGGTTT

SEQ ID NO:44:

AATGTACAGTATTGCGTTTTGGTCTCGACTTGAATTGCAAAAAGATGTTAGAAAAGC

SEQ ID NO:45:

AATGTACAGTATTGCGTTTTGAAAATGTTGGCAGTCATAACATTTGAAACTAATGGA

SEQ ID NO:46:

AATGTACAGTATTGCGTTTTGAGCCTCAAACAGGTTGGTTTTAAATTTGAAGTCT

SEQ ID NO:47:

AATGTACAGTATTGCGTTTTGCCTCTGTGTGTATGTTTTAACTACAAAGCGAAACA

SEQ ID NO:48:

AATGTACAGTATTGCGTTTTGGATTCACCTGGTAATGAGGAAAACAGCTTTAAAATC

SEQ ID NO:49:

AATGTACAGTATTGCGTTTTGAGATCTGCTGAAAAGAAATTTGTTAAAGCACAATT

SEQ ID NO:50:

AATGTACAGTATTGCGTTTTGCGGCATCCCCTACATCGAGACCTC

SEQ ID NO:51:

AATGTACAGTATTGCGTTTTGCAGGGAGCAGATCAAACGGGTGAAG

SEQ ID NO:52:

AATGTACAGTATTGCGTTTTGCAAGTCTTTTGAGGACATCCACCAGTACAG

SEQ ID NO:53

AATGTACAGTATTGCGTTTTGACGTGCCTGTTGGACATCCTGGATA

SEQ ID NO:54:

AATGTACAGTATTGCGTTTTGCCTGTACTGGTGGATGTCCTCAAAAGACT

SEQ ID NO:55:

AATGTACAGTATTGCGTTTTGCCCTGAGGAGCGATGACGGAATATAAGC

SEQ ID NO:56:

AATGTACAGTATTGCGTTTTGGTCGTATTCGTCCACAAAATGGTTCTGGATC

SEQ ID NO:57:

AATGTACAGTATTGCGTTTTGTGACTGGCAATTGTGTCAACAGGTGAAAA

SEQ ID NO:58:

AATGTACAGTATTGCGTTTTGCGCCAGCTGGAGTTTGGTCATGTTT

SEQ ID NO:59:

AATGTACAGTATTGCGTTTTGAATCCCTCTCATCACAATTTCATTCCACAATAGTTT

SEQ ID NO:60:

AATGTACAGTATTGCGTTTTGTCAACAACAAAGAGAATCATGAAATCAACCCTAGC

SEQ ID NO:61:

AATGTACAGTATTGCGTTTTGGATATGGAGCCAGCGTGTTCCGATT

SEQ ID NO:62:

AATGTACAGTATTGCGTTTTGGGCGCGGAAAGTCCTCACTCTC

SEQ ID NO:63:

AATGTACAGTATTGCGTTTTGTATGGTGAGGTTCGGCGTGTTTAAACG

SEQ ID NO:64:

AATGTACAGTATTGCGTTTTGTGGTGACAAAGTTAGAAGGGTCCATGG

SEQ ID NO:65:

AATGTACAGTATTGCGTTTTGCTTCTTTACCACCCCAGATACGACGACTA

SEQ ID NO:66:

AATGTACAGTATTGCGTTTTGCGCTCGTGGTGGTAGTCGTCGTAT

SEQ ID NO:67:

AATGTACAGTATTGCGTTTTGCCAGGAGGCCCTTTCTGTTTACAACC

SEQ ID NO:68:

AATGTACAGTATTGCGTTTTGCCCACAAGCCCAAAATATTCTACTCACTTTGC

SEQ ID NO:69:

AATGTACAGTATTGCGTTTTGATCGCCTGCATCAAGGAAAAGGTAATGG

SEQ ID NO:70:

AATGTACAGTATTGCGTTTTGCGCGTAAGGATAGCAACTGAGGTTATCAC

SEQ ID NO:71:

AATGTACAGTATTGCGTTTTGCGACCTGACGTAACCCCTTGCTTATC

SEQ ID NO:72:

AATGTACAGTATTGCGTTTTGGGAAATGCTCTCACGTAGTCTCTCATGTCT

SEQ ID NO:73:

AATGTACAGTATTGCGTTTTGGTCATAACCCGAAGAACAATGTTGCCACTA

SEQ ID NO:74:

AATGTACAGTATTGCGTTTTGGTCAGCTCAGGATAAAGCACGGATGGATA

SEQ ID NO:75:

AATGTACAGTATTGCGTTTTGCTCAGGATAAAAGCTTCCTTCTTAACAAGTTTTTCC

SEQ ID NO:76:

AATGTACAGTATTGCGTTTTGAGAGATTGTTCCCTTGCATTGACCTCTTTTTC

SEQ ID NO:77:

AATGTACAGTATTGCGTTTTGCCCCTCACCTTTGGAATTTACAGTCTGAA

SEQ ID NO:78:

AATGTACAGTATTGCGTTTTGTAGGTTCTTCAGGTCTCTACACTCTCCTTTAAACT

SEQ ID NO:79:

AATGTACAGTATTGCGTTTTGGAGAAGGAGTGCAATGCCAAGATTATGATCC

SEQ ID NO:80:

AATGTACAGTATTGCGTTTTGGACGTTCTCCATTGTATTGGCAGTAACCA

SEQ ID NO:81:

AATGTACAGTATTGCGTTTTGCACATCTCACAGGCTCTAAAGGAATTCTATATCCTA

SEQ ID NO:82:

AATGTACAGTATTGCGTTTTGGAGGCAAGAGGTGAGTAGTACCAATACTGTC

SEQ ID NO:83:

AATGTACAGTATTGCGTTTTGGAGCCCCTCCGCTTACTTGTAATCTG

SEQ ID NO:84:

AATGTACAGTATTGCGTTTTGCCAGTAAAACGTATTGAGAAAAAGGTAAAAGCGTTA

SEQ ID NO:85:

AATGTACAGTATTGCGTTTTGGCTCAGAATAAATCGTAACAATCTCAAAGTGCATTT

SEQ ID NO:86:

AATGTACAGTATTGCGTTTTGTGAGGTGTCCACAGGGCTCAATCTTTAC

SEQ ID NO:87:

AATGTACAGTATTGCGTTTTGCCCCTTGTATCAGTAAAGGCTATATAATACCGAATT

SEQ ID NO:88:

AATGTACAGTATTGCGTTTTGTCATGAAGAGAGTATCATCAGCTCGTTCATCATC

SEQ ID NO:89:

AATGTACAGTATTGCGTTTTGTGTCCTTTCTGCCGATGTGAAATTAAAGGTAC

SEQ ID NO:90:

AATGTACAGTATTGCGTTTTGTCGCCCCAAATAATTTCCTGCGAACA

SEQ ID NO:91:

AATGTACAGTATTGCGTTTTGCTCATACCTCCATTCCAAGCTTTCATTGTCTC

SEQ ID NO:92:

AATGTACAGTATTGCGTTTTGCCTGCCCTTATTTTTAACAGCAGGAACGAAT

SEQ ID NO:93:

AATGTACAGTATTGCGTTTTGTCGATAGCGAAAGTCCTCTTTGGTCAG

SEQ ID NO:94:

AATGTACAGTATTGCGTTTTGGTTAAAGACCAACCACTAACTAAGAGACTTTCCAAG

SEQ ID NO:95:

AATGTACAGTATTGCGTTTTGAAACCTCTTCCAGTACCTTCTTCATGGTTCT

SEQ ID NO:96:

AATGTACAGTATTGCGTTTTGTTTCCAGGTGATGTGCTCTATGAACTCCTT

SEQ ID NO:97:

AATGTACAGTATTGCGTTTTGGGAGCGGTGCAACAGTTCAATGGT

SEQ ID NO:98:

AATGTACAGTATTGCGTTTTGCATCCGTGGATAATGTGCACCATAACC

SEQ ID NO:99:

AATGTACAGTATTGCGTTTTGTCGGAGAGCCTGGACTGTTTGAAATC

SEQ ID NO:100:

AATGTACAGTATTGCGTTTTGAAGCCAGGTCTTCCCGATGAGAGAG

SEQ ID NO:101:

AATGTACAGTATTGCGTTTTGGGCACTCCGTGGATTTCAAACAGTC

SEQ ID NO:102:

AATGTACAGTATTGCGTTTTGCAGATATCTGCTGCCCTTTTACCTTATGGTTT

SEQ ID NO:103:

AATGTACAGTATTGCGTTTTGTGTAGACTGCTTTGGGATTACGTCTATCAGTTG

SEQ ID NO:104:

AATGTACAGTATTGCGTTTTGGGAAAGGAGAAAAAGGAAGTGCTACCTGAAC

SEQ ID NO:105:

AATGTACAGTATTGCGTTTTGTTTTTCTCCCTTCCTCCTTTGAACAAACAG

SEQ ID NO:106:

AATGTACAGTATTGCGTTTTGACAGCTTTAGGAAAATGGAATCTCTTACCTCCTC

SEQ ID NO:107:

AATGTACAGTATTGCGTTTTGGGGTGTTATGGTCGCGTTGGATTTCTG

SEQ ID NO:108:

AATGTACAGTATTGCGTTTTGGCTACGGCGTGCAACTCACAGAAC

SEQ ID NO:109:

AATGTACAGTATTGCGTTTTGACCGACCTCTTCCAGCGCTACTT

SEQ ID NO:110:

AATGTACAGTATTGCGTTTTGCGGGCAGGGCTTACTTACCTTGG

SEQ ID NO:111:

AATGTACAGTATTGCGTTTTGTAGCTACTGCCTGCCTTCGAAGAACGAT

SEQ ID NO:112:

AATGTACAGTATTGCGTTTTGTGTGGGTGGAAAAAGATGTGGTTAAGAAACAAC

SEQ ID NO:113:

AATGTACAGTATTGCGTTTTGCCCCCATATAGCTTAATCTGATGGGCATC

SEQ ID NO:114:

AATGTACAGTATTGCGTTTTGGAAAGAGCATCAGGAACAAGCCTTGAGTAC

SEQ ID NO:115:

AATGTACAGTATTGCGTTTTGTTGAGATGCCTGACAACCTTTACACCTTTG

SEQ ID NO:116:

AATGTACAGTATTGCGTTTTGCTCTAGGGCTGAGGGAATATGCATCTCT

SEQ ID NO:117:

AATGTACAGTATTGCGTTTTGCGTACCCAGAAGACAATGGCCTAGCTAT

SEQ ID NO:118:

AATGTACAGTATTGCGTTTTGGGGCAGCACAGATTCCCTTAACCA

SEQ ID NO:119:

AATGTACAGTATTGCGTTTTGCCATACCTTGGCTATCCCCTGAAAGTTG

SEQ ID NO:120:

AATGTACAGTATTGCGTTTTGGCCCTGATGCTCATGGAGTGTTCCT

SEQ ID NO:121:

AATGTACAGTATTGCGTTTTGCCTGGTGGTTGGGAGACGACTAC

SEQ ID NO:122:

AATGTACAGTATTGCGTTTTGTGCTGACAGGACACAGAACAAGATACCT

SEQ ID NO:123:

AATGTACAGTATTGCGTTTTGGGTACAGGTATCTTGTTCTGTGTCCTGTCAG

SEQ ID NO:124:

AATGTACAGTATTGCGTTTTGGAGTCCCGGGCTCGATTCACAG

SEQ ID NO:125:

AATGTACAGTATTGCGTTTTGCTGGTCAGAGAGGTGTGTACTGATTGTCT

SEQ ID NO:126:

AATGTACAGTATTGCGTTTTGAGGAAAGATCAATTACATTCACAAGTTCACACTTCT

SEQ ID NO:127:

AATGTACAGTATTGCGTTTTGCTGCACAGTTCAGAGGATATTTAAGCTCAATGAC

SEQ ID NO:128:

AATGTACAGTATTGCGTTTTGCACAGACCGTCATGCATTTCTGACACTC

SEQ ID NO:129:

AATGTACAGTATTGCGTTTTGAGGCTGGTACCTGCTCTTCTTCAATC

SEQ ID NO:130:

AATGTACAGTATTGCGTTTTGCGAAATCAAACAGTTGTCTATCAGAGCCTGTC

SEQ ID NO:131:

AATGTACAGTATTGCGTTTTGACAAAAGAAAAGAAGTCATGTCTGTATGTGGAAA

SEQ ID NO:132:

AATGTACAGTATTGCGTTTTGTCCAGGATAATACACATCACAGTAAATAACACTCTG

SEQ ID NO:133:

AATGTACAGTATTGCGTTTTGCATCCTCTTTGTCATCAAGCTACAGTCTTTTTGA

SEQ ID NO:134:

AATGTACAGTATTGCGTTTTGCTCCCATTTTTGTGCATCTTTGTTGCTGTC

SEQ ID NO:135:

AATGTACAGTATTGCGTTTTGCAGAACTGCCTATTCCTAACTGACTCATCATTTC

SEQ ID NO:136:

AATGTACAGTATTGCGTTTTGGAATTCTGTTTCATCGCTGAGTGACACTCTTTT

SEQ ID NO:137:

AATGTACAGTATTGCGTTTTGTTTTTACCTTTGCTTTTACCTTTTTGTACTTGTGAC

SEQ ID NO:138:

AATGTACAGTATTGCGTTTTGAGAAGGAGTCTGGAATAGAAAGGCTAACAGAA

SEQ ID NO:139:

AATGTACAGTATTGCGTTTTGCACAAGATGTGCCAAGGGAATTGTATGC

SEQ ID NO:140:

AATGTACAGTATTGCGTTTTGAAGAGTCAATAGGTCAGAGAGTTTTATGTTCTTCCA

SEQ ID NO:141:

AATGTACAGTATTGCGTTTTGACTGATCTTCTCAAAGTCGTCATCCTTCAGT

SEQ ID NO:142:

AATGTACAGTATTGCGTTTTGACCCTGAGAAATAATCCAATTACCTGTTAATCAAGG

SEQ ID NO:143:

AATGTACAGTATTGCGTTTTGAAAAGGTATTGAGTAAAATCAGTCTTCCTTCTACCC

SEQ ID NO:144:

AATGTACAGTATTGCGTTTTGCCTTCCTCCCTCTTTCTTTCATAAAACCTCTCTT

SEQ ID NO:145:

AATGTACAGTATTGCGTTTTGGCCAGAGCCACCCAACTCTTAAGG

SEQ ID NO:146:

AATGTACAGTATTGCGTTTTGTGGAAGAGGAATTTAATAACGAACGTTTTAAGAGGA

SEQ ID NO:147:

AATGTACAGTATTGCGTTTTGGCATCTACTGCCGAGGATGTTCCAAG

SEQ ID NO:148:

AATGTACAGTATTGCGTTTTGCACAGTGAGCTCAAGTGCGACATCA

SEQ ID NO:149:

AATGTACAGTATTGCGTTTTGCCGACTGGCCATCTCCTCGTAG

SEQ ID NO:150:

AATGTACAGTATTGCGTTTTGGTACCAGCGCGACTACGAGGAGAT

SEQ ID NO:151:

AATGTACAGTATTGCGTTTTGTCTTTTCTGTCAAATGGAGATGATCTCTTCTGACTC

SEQ ID NO:152:

AATGTACAGTATTGCGTTTTGGGGAGCCCATCATCTGCAAAAACATCC

SEQ ID NO:153:

AATGTACAGTATTGCGTTTTGAAGCTGAAGAAGATGTGGAAAAGTCCCAATG

SEQ ID NO:154:

AATGTACAGTATTGCGTTTTGGCGTGGGATGTTTTTGCAGATGATGG

SEQ ID NO:155:

AATGTACAGTATTGCGTTTTGCGACGCTGAGGACGCTATGGATG

SEQ ID NO:156:

AATGTACAGTATTGCGTTTTGGCTGAGGCGCGTCTTCGAGAAG

SEQ ID NO:157:

AATGTACAGTATTGCGTTTTGGCGCTTGTCGTGAAAGCGAACGA

SEQ ID NO:158:

AATGTACAGTATTGCGTTTTGGCTGCCCGCCCAGTTGTTACT

SEQ ID NO:159:

AATGTACAGTATTGCGTTTTGAGACTCTGGACTGATGAAGCAATTCTGAGT

SEQ ID NO:160:

AATGTACAGTATTGCGTTTTGTCACCGGTGACACCTTAAAACCAAAGC

SEQ ID NO:161:

AATGTACAGTATTGCGTTTTGGGCTCCTTTGTACCTCCTCCATCTTGATC

SEQ ID NO:162:

AATGTACAGTATTGCGTTTTGGTCAGTTGTCTAACAATAACAAAGATCTGCTCTTGG

SEQ ID NO:163:

AATGTACAGTATTGCGTTTTGGGTGGGCAGCAAGAAAAAGTCCAGTAAA

SEQ ID NO:164:

AATGTACAGTATTGCGTTTTGGCCAAGGCTTTCTCTGGCATGATCTTTT

SEQ ID NO:165:

AATGTACAGTATTGCGTTTTGGGATAACTTTCTCAGCATTTCCACCAGTTTCAAG

SEQ ID NO:166:

AATGTACAGTATTGCGTTTTGTGTCCCTAAGTTGAGTAAAATGATAGAGAATGAGTC

SEQ ID NO:167:

AATGTACAGTATTGCGTTTTGGCTGCCAGAAATCCAGCATCCAAAATTTG

SEQ ID NO:168:

AATGTACAGTATTGCGTTTTGGTCGCTTTCTTTTCTTAGTGCCAGGAAACT

SEQ ID NO:169:

AATGTACAGTATTGCGTTTTGACAGTCGAGACGATTCATGAGGGAACTTC

SEQ ID NO:170:

AATGTACAGTATTGCGTTTTGGGAAAGCTCGGCGTGTTGGATAAGAAG

SEQ ID NO:171:

AATGTACAGTATTGCGTTTTGACGCCACAAGTGACTGAAAGTTGGAAG

SEQ ID NO:172:

AATGTACAGTATTGCGTTTTGTGATGGGCTGGAGATTTGGCATAGTTTTC

SEQ ID NO:173:

AATGTACAGTATTGCGTTTTGCTATGCACCCACTTTCAACACAGTTAGGT

SEQ ID NO:174:

AATGTACAGTATTGCGTTTTGGCTTGGTCAGAAGTGCTGTTGTTGTC

SEQ ID NO:175:

AATGTACAGTATTGCGTTTTGCGTGGGCCAGAAAGTTGTCCACAATG

SEQ ID NO:176:

AATGTACAGTATTGCGTTTTGGGGATATGGATTCTCGTGGTAGAAGGTGTAA

SEQ ID NO:177:

AATGTACAGTATTGCGTTTTGCTAATCACCAAGTTCCAAGTGTTCAGAATCTCC

SEQ ID NO:178:

AATGTACAGTATTGCGTTTTGACCGTAATAACCAAGGTTCATCATAGGCATTGAT

SEQ ID NO:179:

AATGTACAGTATTGCGTTTTGTCCCAGTGGAAGTTACTATGCACCCTAT

SEQ ID NO:180:

AATGTACAGTATTGCGTTTTGTGCTTATGCTTGTGTTTGTGTTTCCTCTTATGG

SEQ ID NO:181:

AATGTACAGTATTGCGTTTTGGCTTCTGTTTCTCCTTATGCTTGTTCTTCTCAC

SEQ ID NO:182:

AATGTACAGTATTGCGTTTTGCCTGAGTGGTCTTTTTGCAGGCAAAG

SEQ ID NO:183:

AATGTACAGTATTGCGTTTTGCCGGCCACAAAGCTTCTAAGAACAAC

SEQ ID NO:184:

AATGTACAGTATTGCGTTTTGGCGGTTCATCTTGAAGGCTTGGATGT

SEQ ID NO:185:

AATGTACAGTATTGCGTTTTGTTCAGTGAAATGAACCCTTCGAATGACAAG

SEQ ID NO:186:

AATGTACAGTATTGCGTTTTGCTCCTCCTCCTCTTTGCGTTTCTTGTC

SEQ ID NO:187:

AATGTACAGTATTGCGTTTTGGCAGCAGAGAAACAAATGAAGGACAAACAG

SEQ ID NO:188:

AATGTACAGTATTGCGTTTTGTAAGGAGGAGGAAGAAGACAAGAAACGCAAA

SEQ ID NO:189:

AATGTACAGTATTGCGTTTTGTAAGGCAGGTCTGTGAGCACAAAATTTGG

SEQ ID NO:190:

AATGTACAGTATTGCGTTTTGTGGAGCTGACCAGTGACAATGACC

SEQ ID NO:191:

AATGTACAGTATTGCGTTTTGGGCCAAGAAGTCGGTGGACAAGAAC

SEQ ID NO:192:

AATGTACAGTATTGCGTTTTGGCGCAGGCGGTCATTGTCACTG

SEQ ID NO:193:

AATGTACAGTATTGCGTTTTGTTGCTGTTCTTGTCCACCGACTTCTTG

SEQ ID NO:194:

AATGTACAGTATTGCGTTTTGGCAGTGCGCGATCTGGAACTG

SEQ ID NO:195:

AATGTACAGTATTGCGTTTTGCGGCGGCGACTTTGACTACCC

SEQ ID NO:196:

AATGTACAGTATTGCGTTTTGGAGCACGAGACGTCCATCGACATC

SEQ ID NO:197:

AATGTACAGTATTGCGTTTTGCGGCCAGGAACTCGTCGTTGAA

SEQ ID NO:198:

AATGTACAGTATTGCGTTTTGGCCATGCCGGGAGAACTCTAACTC

SEQ ID NO:199:

AATGTACAGTATTGCGTTTTGTGTAACCCTCCTAAGTGTTCATACGTTGTCTTG

SEQ ID NO:200:

AATGTACAGTATTGCGTTTTGGTCTTGGTCTCTGTTATATCTTGAGTCTAGAACAGT

SEQ ID NO:201:

AATGTACAGTATTGCGTTTTGCAGGAGAACATGGAGGCGAGAAGAAAAT

SEQ ID NO:202:

AATGTACAGTATTGCGTTTTGGGGAAAGATTGGATGCCGGGAATCAAC

SEQ ID NO:203:

AATGTACAGTATTGCGTTTTGCGGAGGCTTGATTAGGTAGGAGGTG

SEQ ID NO:204:

AATGTACAGTATTGCGTTTTGGCGGCAGCTCAACGAGAATAAACA

SEQ ID NO:205:

AATGTACAGTATTGCGTTTTGGCCCGCATCCTTACTCCGCTTATC

SEQ ID NO:206:

AATGTACAGTATTGCGTTTTGGCTGGTTTCAAGGTAAGTGGACTCTTCC

SEQ ID NO:207:

AATGTACAGTATTGCGTTTTGGGGAATGACTGACGGAGAATCCCAAC

SEQ ID NO:208:

AATGTACAGTATTGCGTTTTGCTAAGACCGAGAGCCTGTAGGAGCTTT

SEQ ID NO:209:

AATGTACAGTATTGCGTTTTGGCCGGGCTTGTCTGGTCATCT

SEQ ID NO:210:

AATGTACAGTATTGCGTTTTGCAGCTCACCTCCAAAAAGGCAAAATTCTTG

SEQ ID NO:211:

AATGTACAGTATTGCGTTTTGGCAGGAGGCCATGATGGATTTCTTCAA

SEQ ID NO:212:

AATGTACAGTATTGCGTTTTGCATGAGTGAAAGGAAAGAGGAAATCCCAATCC

SEQ ID NO:213:

AATGTACAGTATTGCGTTTTGCCTATCTTCCACAGTACTTACACAACTTCCTAAGC

SEQ ID NO:214:

AATGTACAGTATTGCGTTTTGCTCGCCGTAGACTGTCCAGGTTTT

SEQ ID NO:215:

AATGTACAGTATTGCGTTTTGCTCACCTGATCCGTGACGTTGATGTC

SEQ ID NO:216:

AATGTACAGTATTGCGTTTTGGCCCTGATGGACTCTCGGCTACT

SEQ ID NO:217:

AATGTACAGTATTGCGTTTTGGAGAAAGATCAGGAACACTTGTCCCCTACTAG

SEQ ID NO:218:

AATGTACAGTATTGCGTTTTGGTCCTCCACGATCTCCTCATACTCCTC

SEQ ID NO:219:

AATGTACAGTATTGCGTTTTGTCGATGGACTTGACAAGCCCGTACTT

SEQ ID NO:220:

AATGTACAGTATTGCGTTTTGCTGGACGACGAGGAGTATGAGGAGATC

SEQ ID NO:221:

AATGTACAGTATTGCGTTTTGTACCAGAAGTCCCGGCGGTGATAAG

SEQ ID NO:222:

AATGTACAGTATTGCGTTTTGGTTCACCTCTGTGTTTGACTGCCAGAAA

SEQ ID NO:223:

AATGTACAGTATTGCGTTTTGCAATGAGTATTCTCTTCATTTCAGGTCAGTTGATTT

SEQ ID NO:224:

AATGTACAGTATTGCGTTTTGGGCTGCTTTCTTGAAGGCTATTGGGTAT

SEQ ID NO:225:

AATGTACAGTATTGCGTTTTGAGGAGACTGGAATTCTCGAATAAGGATTAACA

SEQ ID NO:226:

AATGTACAGTATTGCGTTTTGGCATAGTTAAAACCTGTGTTTGGTTTTGTAGGTCTT

SEQ ID NO:227:

AATGTACAGTATTGCGTTTTGCTCTGTGTTGGCGGATACCCTTCCATA

SEQ ID NO:228:

AATGTACAGTATTGCGTTTTGGGCATTCCTTCTTTATTGCCCTTCTTAAAAGC

SEQ ID NO:229:

AATGTACAGTATTGCGTTTTGGCTGCTGGTCTGGCTACTATGATCTCTAC

SEQ ID NO:230:

AATGTACAGTATTGCGTTTTGGCACACAGCTTTTAAGAAGGGCAATAAAGAAG

SEQ ID NO:231:

AATGTACAGTATTGCGTTTTGTGTATGTTTAATTCTGTACATGAGCATTTCATCAGT

SEQ ID NO:232:

AATGTACAGTATTGCGTTTTGATTTCATACCTTGCTTAATGGGTGTAGATACCAAAA

SEQ ID NO:233:

AATGTACAGTATTGCGTTTTGTTGGCGTCAAATGTGCCACTATCACTC

SEQ ID NO:234:

AATGTACAGTATTGCGTTTTGTTCTCTTTCAAGCTATGATTTAGGCATAGAGAATCG

SEQ ID NO:235:

AATGTACAGTATTGCGTTTTGCTGCAGTTGTAGGTTATAACTATCCATTTGTCTGAA

SEQ ID NO:236:

AATGTACAGTATTGCGTTTTGCCCTAGGTCAGATCACCCAGTCAGTTAAAAC

SEQ ID NO:237:

AATGTACAGTATTGCGTTTTGTGGTTAAAGGTCAGCCCACTTACCAGATATG

SEQ ID NO:238:

AATGTACAGTATTGCGTTTTGGGGTATGCTCCCCATTTAGAGGATAAGG

SEQ ID NO:239:

AATGTACAGTATTGCGTTTTGACGTCAGATCTACAGCGAACACAACTACT

SEQ ID NO:240:

AATGTACAGTATTGCGTTTTGAGTGGTGCCAGACTCACATTCAGTTCTAA

SEQ ID NO:241:

AATGTACAGTATTGCGTTTTGCTTGGCCAGTTCCTTTCTCTAATGTATCATCTC

SEQ ID NO:242:

AATGTACAGTATTGCGTTTTGAAGTTTTCTTGTCTAGTATCACTTTCCCTCATAGG

SEQ ID NO:243:

AATGTACAGTATTGCGTTTTGGGGCTCAACAGATGGTATGTGTTCTCTG

SEQ ID NO:244:

AATGTACAGTATTGCGTTTTGGCTCTCGTTTCTAACAGTTCTTTGCATTGGATA

SEQ ID NO:245:

AATGTACAGTATTGCGTTTTGGAGGTGACCTTCAAAGTCAGAGGCTGTAT

SEQ ID NO:246:

AATGTACAGTATTGCGTTTTGGAGCAACCATCCCATCTGTCCTTGTAAC

SEQ ID NO:247:

AATGTACAGTATTGCGTTTTGGGACAAGGATGAGAAACCCAATTGGAACC

SEQ ID NO:248:

AATGTACAGTATTGCGTTTTGCGGTCCGCCAAAAGATCCCAGATTC

SEQ ID NO:249:

AATGTACAGTATTGCGTTTTGGGAGGCCACTAACCCACTTGTGATG

SEQ ID NO:250:

AATGTACAGTATTGCGTTTTGTCCAGTTTCCTAGAGGATGTAATGGGATTTGTC

SEQ ID NO:251:

AATGTACAGTATTGCGTTTTGTCACATTTGGAGATGAGAAACGAGGTGTTCT

SEQ ID NO:252:

AATGTACAGTATTGCGTTTTGCCCTTGGCCTGTAACATTGCTCTGATC

SEQ ID NO:253:

AATGTACAGTATTGCGTTTTGCACCTCGTTTCTCATCTCCAAATGTGATCTC

SEQ ID NO:254:

AATGTACAGTATTGCGTTTTGCCAGTAGCTTTCCTGTTCTCGGCATT

SEQ ID NO:255:

AATGTACAGTATTGCGTTTTGGCAGCGTCAAGAATGAGAAGACTTTTGTG

SEQ ID NO:256:

AATGTACAGTATTGCGTTTTGTTGCCCTTCTGGAAATTACCCCGAGA

SEQ ID NO:257:

AATGTACAGTATTGCGTTTTGAGTTCCACCAGCTTTAATTATTCCTCTAGCTCTC

SEQ ID NO:258:

AATGTACAGTATTGCGTTTTGGTTTCCCATGGCCATAATTTATTATCTCACCACAA

SEQ ID NO:259:

AATGTACAGTATTGCGTTTTGGTCACGATGACTGTATTGGACCCTCAA

SEQ ID NO:260:

AATGTACAGTATTGCGTTTTGTCCAGACCTTTGCTTTAGATTGGCAATTATTACTG

SEQ ID NO:261:

AATGTACAGTATTGCGTTTTGCCCTAACAACACAGAAGCAAAGCGTTCTTT

SEQ ID NO:262:

AATGTACAGTATTGCGTTTTGCGCCCTCCTACCACCTGTACTACG

SEQ ID NO:263:

AATGTACAGTATTGCGTTTTGACTATCCAGGCGCCTTCACCTACTC

SEQ ID NO:264:

AATGTACAGTATTGCGTTTTGCTCCTAGGCGGTATCATCCTGGGTAG

SEQ ID NO:265:

AATGTACAGTATTGCGTTTTGTCTGATTCTCTTCAGATACAAGGCAGATCC

SEQ ID NO:266:

AATGTACAGTATTGCGTTTTGGCAGATACTTGGACTTGAGTAGGCTTATTAAACC

SEQ ID NO:267:

AATGTACAGTATTGCGTTTTGGCGGCTCTATAAAGAATTGTCCTTATTTTCGAACTT

SEQ ID NO:268:

AATGTACAGTATTGCGTTTTGGTTCGAGGCCTTTCTCTGAGCATCAAG

SEQ ID NO:269:

AATGTACAGTATTGCGTTTTGACATCGGCAGAAACTAGATGATCAGACCAA

SEQ ID NO:270:

AATGTACAGTATTGCGTTTTGTTTAGGAAATCCACAATACTTTTTCTGATCTCTTCC

SEQ ID NO:271:

AATGTACAGTATTGCGTTTTGGCCACCAACCTCATTCTGTTTTGTTCTCTATC

SEQ ID NO:272:

AATGTACAGTATTGCGTTTTGCTGCATTTGTCCTTTGACTGGTGTTTAGGT

SEQ ID NO:273:

AATGTACAGTATTGCGTTTTGCTTCGACCGACAAACCTGAGGTCATTAAATC

SEQ ID NO:274:

AATGTACAGTATTGCGTTTTGCCCCACATCCCAAGCTAGGAAGACC

SEQ ID NO:275:

AATGTACAGTATTGCGTTTTGCGGGCCAGTACCTTGAAAGCGATG

SEQ ID NO:276:

AATGTACAGTATTGCGTTTTGCTAACTCAATCGGCTTGTTGTGATGCGTAT

SEQ ID NO:277:

AATGTACAGTATTGCGTTTTGCCCTCCTGGACTGTTAGTAACTTAGTCTCC

SEQ ID NO:278:

AATGTACAGTATTGCGTTTTGCCCTCCGAGCTCCGCGAAAAT

SEQ ID NO:279:

AATGTACAGTATTGCGTTTTGGTGCTAAAAAGTGTAAGAAGAAATGAGCTAGCAAAA

SEQ ID NO:280:

AATGTACAGTATTGCGTTTTGCATATGCCTCAGTTTGAATTCCTCTCACAAACAA

SEQ ID NO:281:

AATGTACAGTATTGCGTTTTGGGGAGAAGAAAGAGAGATGTAGGGCTAGAG

SEQ ID NO:282:

AATGTACAGTATTGCGTTTTGGCAAGCACTTCTGTTTTTGTCTTTTCAGTTTCG

SEQ ID NO:283:

AATGTACAGTATTGCGTTTTGTCTCTGATATACTTGGATTGGTAATTGAGAAAGTCT

SEQ ID NO:284:

AATGTACAGTATTGCGTTTTGGTTTGATATCTTCCCAGCAAAATAATCAGCTCTCAT

SEQ ID NO:285:

AATGTACAGTATTGCGTTTTGTAGCCAACCTCTTTTCGATGAGCTCACTAG

SEQ ID NO:286:

AATGTACAGTATTGCGTTTTGTGGAACAGACAAACTATCGACTGAAGTTGT

SEQ ID NO:287:

AATGTACAGTATTGCGTTTTGGAGGCTGAGTGCAAATTTGGTCTGGAA

SEQ ID NO:288:

AATGTACAGTATTGCGTTTTGGATGGTGGTGGTTGTCTCTGATGATTACC

SEQ ID NO:289:

AATGTACAGTATTGCGTTTTGGCAAGGCGAGTCCAGAACCAAGATT

SEQ ID NO:290:

AATGTACAGTATTGCGTTTTGTCAGAAGCGACTGATCCCCATCAAGT

SEQ ID NO:291:

AATGTACAGTATTGCGTTTTGCATATGGTCACATCACCTTAACTAAACCCATGTTT

SEQ ID NO:292:

AATGTACAGTATTGCGTTTTGTTTCTCGGTACTGTTTATTTTGAACAAAACCAATCC

SEQ ID NO:293:

AATGTACAGTATTGCGTTTTGCCTCCTCCCCAAATTCCAGGAACAATATGA

SEQ ID NO:294:

AATGTACAGTATTGCGTTTTGTGTGCGTCATTTTATTTGGGAAAATTTGATACTAAC

SEQ ID NO:295:

AATGTACAGTATTGCGTTTTGCATGCAGGAGAAGTCATCCCCCTTC

SEQ ID NO:296:

AATGTACAGTATTGCGTTTTGTCTGAAAACTGGTGGTTGCCTCTAGGTTAA

SEQ ID NO:297:

AATGTACAGTATTGCGTTTTGGCCCCTTTCTTGCTCTTCTTGGACTTG

SEQ ID NO:298:

AATGTACAGTATTGCGTTTTGCCAAGCCAAGCCAAGCTGGATATTGTG

SEQ ID NO:299:

AATGTACAGTATTGCGTTTTGCACTCACATTGTGCAGCTTGTAGTAGAG

SEQ ID NO:300:

AATGTACAGTATTGCGTTTTGGCAAAGCGTCTGCATTTGAAGGAGTTT

SEQ ID NO:301:

AATGTACAGTATTGCGTTTTGCCCTCCCGAGAACTTGCCGGTTAA

SEQ ID NO:302:

AATGTACAGTATTGCGTTTTGGCTCCCCACCACAAAAACGCAAATG

SEQ ID NO:303:

AATGTACAGTATTGCGTTTTGGTGTCACTGACGGAGAGCATGAAGATG

SEQ ID NO:304:

AATGTACAGTATTGCGTTTTGCCACCCAAAGAAGTGTCTCCTGACC

SEQ ID NO:305:

AATGTACAGTATTGCGTTTTGTCCGTCAGTGACACCTGGTACTTGAC

SEQ ID NO:306:

AATGTACAGTATTGCGTTTTGCCCTAGCTCTGCCTACCCTGATCTTTC

SEQ ID NO:307:

AATGTACAGTATTGCGTTTTGACGAGGTGGACGTCTTCTTCAATCAC

SEQ ID NO:308:

AATGTACAGTATTGCGTTTTGGCCCTGCGAGTCGAGGTGATTG

SEQ ID NO:309:

AATGTACAGTATTGCGTTTTGCCATGACTCTCAGGAATTGGCCCTATACTTAG

SEQ ID NO:310:

AATGTACAGTATTGCGTTTTGCTTGGGACCTTCATTTCTATATAACCCCTATCTGG

SEQ ID NO:311:

AATGTACAGTATTGCGTTTTGTGCCAGGAAACTTTTCATTGTGCCTCTC

SEQ ID NO:312:

AATGTACAGTATTGCGTTTTGGTTACCCCATGGAACTTACCAAGCACTAG

SEQ ID NO:313:

AATGTACAGTATTGCGTTTTGGTATGAAATTCGCTGGAGGGTCATTGAATCAAT

SEQ ID NO:314:

AATGTACAGTATTGCGTTTTGCAGGAAGGAGCACTTACGTTTTAGCATCTTC

SEQ ID NO:315:

AATGTACAGTATTGCGTTTTGGATTTTGAGAAATTCCCTTAATATCCCCATGCTCAA

SEQ ID NO:316:

AATGTACAGTATTGCGTTTTGCACAACCACATGTGTCCAGTGAAAATCC

SEQ ID NO:317:

AATGTACAGTATTGCGTTTTGTGCTTTCATCAGCAGGGTTCAATCCAAA

SEQ ID NO:318:

AATGTACAGTATTGCGTTTTGCATTTACATCATCACAGAGTATTGCTTCTATGGAGA

SEQ ID NO:319:

AATGTACAGTATTGCGTTTTGGTGATCTCTGGATGTCGGAATATTTAGAAACCTCT

SEQ ID NO:320:

AATGTACAGTATTGCGTTTTGATCTTTTGAAAACAATGGTGACTACATGGACATGAA

SEQ ID NO:321:

AATGTACAGTATTGCGTTTTGGGTCTAAAAAGGTCTGTGTTCCTTGAACTTACA

SEQ ID NO:322:

AATGTACAGTATTGCGTTTTGCCAGCACCAATACATTTAATTTCTTTTCTGCAGAC

SEQ ID NO:323:

AATGTACAGTATTGCGTTTTGGCTACAGATGGCTTGATCCTGAGTCATTTC

SEQ ID NO:324:

AATGTACAGTATTGCGTTTTGGTCAGGCCCATACCAAGGGAAAAGATC

SEQ ID NO:325:

AATGTACAGTATTGCGTTTTGACACTGAGTGATGTCTGGTCTTATGGCATT

SEQ ID NO:326:

AATGTACAGTATTGCGTTTTGCACTGAGCGTTTGTTAGTCCTGGTGTTTT

SEQ ID NO:327:

AATGTACAGTATTGCGTTTTGCAGATTCTCCACAATCTCACTCAGGTGGTAAA

SEQ ID NO:328:

AATGTACAGTATTGCGTTTTGCCCCACAGCTACGAGATCATGGTGAAAT

SEQ ID NO:329:

AATGTACAGTATTGCGTTTTGTCTCTATTCATTTTTGAGGTTTGGTTGTTAACACTT

SEQ ID NO:330:

AATGTACAGTATTGCGTTTTGGGGAGTGCACCATTATCGGGAAAATGG

SEQ ID NO:331:

AATGTACAGTATTGCGTTTTGGCTTATTCTCATTCGTTTCATCCAGGATCTCAAAA

SEQ ID NO:332:

AATGTACAGTATTGCGTTTTGGGGCGACGAGATTAGGCTGTTATGC

SEQ ID NO:333:

AATGTACAGTATTGCGTTTTGCCCCTCTGCATTATAAGCAGTGCCAAAA

SEQ ID NO:334:

AATGTACAGTATTGCGTTTTGGCCCACATCGTTGTAAGCCTTACATTCAA

SEQ ID NO:335:

AATGTACAGTATTGCGTTTTGCCGTTTGGAAAGCTAGTGGTTCAGAGTTC

SEQ ID NO:336:

AATGTACAGTATTGCGTTTTGGAGATCCCATCCTGCCAAAGTTTGTGATT

SEQ ID NO:337:

AATGTACAGTATTGCGTTTTGGGAAAGCCCCTGTTTCATACTGACCAAAA

SEQ ID NO:338:

AATGTACAGTATTGCGTTTTGCTTTCTCCCCACAGAAACCCATGTATGAAG

SEQ ID NO:339:

AATGTACAGTATTGCGTTTTGGTTTGCCAGTTGTGCTTTTTGCTAAAATGC

SEQ ID NO:340:

AATGTACAGTATTGCGTTTTGCCCTCCCACCCTCAGGACTATACCAAT

SEQ ID NO:341:

AATGTACAGTATTGCGTTTTGTGCTCGGCAGATTGGTATAGTCCTG

SEQ ID NO:342:

AATGTACAGTATTGCGTTTTGGGCATCCTCTGTCCTATCTCCCAGATACA

SEQ ID NO:343:

AATGTACAGTATTGCGTTTTGAGGTTTTATACTAAACTTACTTTGACTGGGTTTGG

SEQ ID NO:344:

AATGTACAGTATTGCGTTTTGCCCCCAGAGGTAAGCGTCATATGG

SEQ ID NO:345:

AATGTACAGTATTGCGTTTTGGCACAGGGAAGTAGGTACTGGGAGATTG

SEQ ID NO:346:

AATGTACAGTATTGCGTTTTGAGGCCTGCAAGGTTTTAACTGGACCTA

SEQ ID NO:347:

AATGTACAGTATTGCGTTTTGCGGGAGCTGATAAGTGGTACCTGTATGT

SEQ ID NO:348:

AATGTACAGTATTGCGTTTTGGAAAAGGGTCCCAGGTAGGTCCAGTTAA

SEQ ID NO:349:

AATGTACAGTATTGCGTTTTGCTCTCGGTGTATTTCTCTACTTACCTGTAATAATGC

SEQ ID NO:350:

AATGTACAGTATTGCGTTTTGTTTATTGATGTCTATGAAGTGTTGTGGTTCCTTAAC

SEQ ID NO:351:

AATGTACAGTATTGCGTTTTGCAGAAAACAAGCTGCCGCAAAGTTCTAC

SEQ ID NO:352:

AATGTACAGTATTGCGTTTTGCAGGTGTTGCGATGATGTCACTGTACG

SEQ ID NO:353:

AATGTACAGTATTGCGTTTTGTCATTTTTCATTGGACTTGTTTTGTCAGCTTTTTGG

SEQ ID NO:354:

AATGTACAGTATTGCGTTTTGGTTAGCCCCAATATGAAAAATAAAGCTGGTTGGA

SEQ ID NO:355:

AATGTACAGTATTGCGTTTTGCTGGTTGGAGGTTTTTGCTAAATCTGGAATGA

SEQ ID NO:356:

AATGTACAGTATTGCGTTTTGTTCTTTTTGACTAGAAAACTTCAGCCACTGTGTATT

SEQ ID NO:357:

AATGTACAGTATTGCGTTTTGCATATGACCAATTGCAGATGAGCCCATTATTGAA

SEQ ID NO:358:

AATGTACAGTATTGCGTTTTGAGGCATAGCTGACTCATCTATGTTTGTTCT

SEQ ID NO:359:

AATGTACAGTATTGCGTTTTGTTCCTCATTTCTTTCACTCTGACAGTATAAAGGTAA

SEQ ID NO:360:

AATGTACAGTATTGCGTTTTGGAACTATTCCAACAGAACAAACCGATAACATCA

SEQ ID NO:361:

AATGTACAGTATTGCGTTTTGTGGATAGCAAGACAATTAGAGCCCAACTTAGT

SEQ ID NO:362:

AATGTACAGTATTGCGTTTTGCTACTCCTCCTGTCTCTTTCCACATCATCAATT

SEQ ID NO:363:

AATGTACAGTATTGCGTTTTGAGGACCTTATGTTGTATGCTGTATAAATCTAAAGGT

SEQ ID NO:364:

AATGTACAGTATTGCGTTTTGGTTTGTCATCTTCTATGGTAAGTATCTTTCTGGATG

SEQ ID NO:365:

AATGTACAGTATTGCGTTTTGTGGAGGAGAAACAGATAAAAGTTGAGTATACGTTTA

SEQ ID NO:366:

AATGTACAGTATTGCGTTTTGGAGGATGACGACATGTTAGTAAGCACTACTACT

SEQ ID NO:367:

AATGTACAGTATTGCGTTTTGATTCCACCATCATTTCCTTCTCCAAAATTATCATCC

SEQ ID NO:368:

AATGTACAGTATTGCGTTTTGCTCAAAAGCACTGCCTTCTCTCATTATCTCAC

SEQ ID NO:369:

AATGTACAGTATTGCGTTTTGAATGTATTTGACCTTCTTTTAAAGTGACATCGATGT

SEQ ID NO:370:

AATGTACAGTATTGCGTTTTGTGATGTTCCCAACTTCTTCTCTCATGGTTATCTC

SEQ ID NO:371:

AATGTACAGTATTGCGTTTTGCCCTCTGATCCCTAGATAATTTATGGGTAGCTAGA

SEQ ID NO:372:

AATGTACAGTATTGCGTTTTGCACGAAATGCAGGTTTTGGAATATGATTAATGTT

SEQ ID NO:373:

AATGTACAGTATTGCGTTTTGGAACAATGTTCTACGCACATTTTGTTCTCAGTAAA

SEQ ID NO:374:

AATGTACAGTATTGCGTTTTGTCCACGCTGCTCTCTAAATTACACTCGAA

SEQ ID NO:375:

AATGTACAGTATTGCGTTTTGACGTAGAACACATTTCATTTTACTCCTCTTTGG

SEQ ID NO:376:

AATGTACAGTATTGCGTTTTGGTCACATGAATGTAAATCAAGAAAACAGATGTTGTT

SEQ ID NO:377:

AATGTACAGTATTGCGTTTTGTTCTGAACTATTTATGGACAACAGTCAAACAACAAT

SEQ ID NO:378:

AATGTACAGTATTGCGTTTTGTGAAGCCATTGCGAGAACTTTATCCATAAGTATTTC

SEQ ID NO:379:

AATGTACAGTATTGCGTTTTGGCCAGAGCACATGAATAAATGAGCATCCAT

SEQ ID NO:380:

AATGTACAGTATTGCGTTTTGGGAAGCTCTCAGGGTACAAATTCTCAGATCAT

SEQ ID NO:381:

AATGTACAGTATTGCGTTTTGCTCAGGGTACAAATTCTCAGATCATCAGTCCTC

SEQ ID NO:382:

AATGTACAGTATTGCGTTTTGCTCTACACAAGCTTCCTTTCCGTCATGC

SEQ ID NO:383:

AATGTACAGTATTGCGTTTTGCCCTTCAGATCTTCTCAGCATTCGAGAGATC

SEQ ID NO:384:

AATGTACAGTATTGCGTTTTGAATCGAAGCGCTACCTGATTCCAATTCC

SEQ ID NO:385:

AATGTACAGTATTGCGTTTTGCCGACCGTAACTATTCGGTGCGTTG

SEQ ID NO:386:

AATGTACAGTATTGCGTTTTGACATTCTATCCAAGCTGTGTTCTATCTTGAGAAACT

SEQ ID NO:387:

AATGTACAGTATTGCGTTTTGCGAGTGAGGGTTTTCGTGGTTCACATC

SEQ ID NO:388:

AATGTACAGTATTGCGTTTTGCGTGGGTCCCAGTCTGCAGTTAAG

SEQ ID NO:389:

AATGTACAGTATTGCGTTTTGGCTCAGAGCCGTTCCGAGATCTT

SEQ ID NO:390:

AATGTACAGTATTGCGTTTTGGCGTTCCATCTCCCACTTGTCGTAGTT

SEQ ID NO:391:

AATGTACAGTATTGCGTTTTGCTGGCCGAGTTGGTTCATCATCATTCAA

SEQ ID NO:392:

AATGTACAGTATTGCGTTTTGTATGGTGTGTCCCCCAACTACGACAAG

SEQ ID NO:393:

AATGTACAGTATTGCGTTTTGTGAAAAGCACTTCCTGAAATAATTTCACCTTCGTTT

SEQ ID NO:394:

AATGTACAGTATTGCGTTTTGAGGTACTCCATGGCTGACGAGATCTG

SEQ ID NO:395:

AATGTACAGTATTGCGTTTTGTTGCCTTTGTTCCAAGGTCCAATGTGT

SEQ ID NO:396:

AATGTACAGTATTGCGTTTTGCGTCCCCGCATTCCAACGTCTC

SEQ ID NO:397:

AATGTACAGTATTGCGTTTTGGGCGCGCCGTTTACTTGAAGG

SEQ ID NO:398:

AATGTACAGTATTGCGTTTTGGCCTGGCGGTGCACACTATTCTG

SEQ ID NO:399:

AATGTACAGTATTGCGTTTTGAGGTGCAGCCACAAAACTTACAGATGC

SEQ ID NO:400:

AATGTACAGTATTGCGTTTTGGTGCCGAACCAATACAACCCTCTG

SEQ ID NO:401:

AATGTACAGTATTGCGTTTTGGGGCGGGTCCACCAGTTTGAAT

SEQ ID NO:402:

AATGTACAGTATTGCGTTTTGCCGCAGAGGGTTGTATTGGTTCG

SEQ ID NO:403:

AATGTACAGTATTGCGTTTTGAGCCACTCGCATTGACCATTCAAACT

SEQ ID NO:404:

AATGTACAGTATTGCGTTTTGCCACGTCTGACAGGTAGCCATGG

SEQ ID NO:405:

AATGTACAGTATTGCGTTTTGGTGAGGCTGCTGGACGAGTACAAC

SEQ ID NO:406:

AATGTACAGTATTGCGTTTTGCGCACCAGGTTGTACTCGTCCA

SEQ ID NO:407:

AATGTACAGTATTGCGTTTTGCCGCCTTTGTGCTTCTGTTCTTCGT

SEQ ID NO:408:

AATGTACAGTATTGCGTTTTGCTGATTAATCGCGTAGAAAATGACCTTATTTTGGAG

SEQ ID NO:409:

AATGTACAGTATTGCGTTTTGGCTCCATCGTCTACCTGGAGATTGACAA

SEQ ID NO:410:

AATGTACAGTATTGCGTTTTGTCTGCACGGCCTCGATCTTGTAGG

SEQ ID NO:411:

AATGTACAGTATTGCGTTTTGGCCAGCAGATGATCTTCCCCTACTACG

SEQ ID NO:412:

AATGTACAGTATTGCGTTTTGCGTCACGCTTGAAGACCACGTTG

SEQ ID NO:413:

AATGTACAGTATTGCGTTTTGGCCAGCATGCAGTTCTAAGGCTCT

SEQ ID NO:414:

AATGTACAGTATTGCGTTTTGGTGCCCGTCTCGACTCTTAGGC

SEQ ID NO:415:

AATGTACAGTATTGCGTTTTGTGTAGCCGCTGATCGTCGTGTATATGTC

SEQ ID NO:416:

AATGTACAGTATTGCGTTTTGGACTGGTACTGGTTAGTAAAGGTTGATAATATTCCA

SEQ ID NO:417:

AATGTACAGTATTGCGTTTTGGGTGAAGTAATCAGTTTGTTCACTAGTTACGTGATT

SEQ ID NO:418:

AATGTACAGTATTGCGTTTTGCTGACATGCCTACTGATTATTCTTCAAACTCATCAC

SEQ ID NO:419:

AATGTACAGTATTGCGTTTTGTGTGTGTTTTAATTGTTCCACTTGAGATTCTTAACC

SEQ ID NO:420:

AATGTACAGTATTGCGTTTTGCGTCAGCATTTTGAATCACTTCATTCTGACATGATA

SEQ ID NO:421:

AATGTACAGTATTGCGTTTTGAGTAATTTTCAACTATTGGCCTAGTGAATTTAAGCT

SEQ ID NO:422:

AATGTACAGTATTGCGTTTTGAGAAAGAGGGAAGTCACATTTATAGAGTGCTAGC

SEQ ID NO:423:

AATGTACAGTATTGCGTTTTGCATCAACAGAAACAGAACAACAAACTGTGACAAATC

SEQ ID NO:424:

AATGTACAGTATTGCGTTTTGCCAAAGAATATCCCTTTATATAGCAGTGGAACAATT

SEQ ID NO:425:

AATGTACAGTATTGCGTTTTGCAGAATATGCAGTGATAAGTGCTGTTTCATCACT

SEQ ID NO:426:

AATGTACAGTATTGCGTTTTGTTCCCCCTGTGACGACTACTTTTCCTC

SEQ ID NO:427:

AATGTACAGTATTGCGTTTTGCGGTCCCTATTTCTTCCTCTGCTTCGT

SEQ ID NO:428:

AATGTACAGTATTGCGTTTTGCTGAACAGTTCTGTCTCTATTACCCGACCTC

SEQ ID NO:429:

AATGTACAGTATTGCGTTTTGCGTTCATAGCCTTCTATCCGAGTATGTAGCA

SEQ ID NO:430:

AATGTACAGTATTGCGTTTTGCCCCTTCTGTCCTCGCAGGTTAATCC

SEQ ID NO:431:

AATGTACAGTATTGCGTTTTGGCTTCCAGCCATTTCTGAGATATCCTCACAGT

SEQ ID NO:432:

AATGTACAGTATTGCGTTTTGACCAGGAGGAACAAAGACACATGAAGATCAT

SEQ ID NO:433:

AATGTACAGTATTGCGTTTTGGCGCCCCCGAGTTTCTTACGAATC

SEQ ID NO:434:

AATGTACAGTATTGCGTTTTGTTTATACACAGTTTGGAGTTTGAGAATCAGAAGACT

SEQ ID NO:435:

AATGTACAGTATTGCGTTTTGGGTTATCTCTGGCTGATGAGATTATGAGTGATTCTC

SEQ ID NO:436:

AATGTACAGTATTGCGTTTTGGCCAAGCTAGTGATTGATGTGATTCGCTAT

SEQ ID NO:437:

AATGTACAGTATTGCGTTTTGCCCCTCCTCTAGTACTCCCTGTTTGT

SEQ ID NO:438:

AATGTACAGTATTGCGTTTTGCTCCTTCCTGTCCCAATCAACTAGTCTAGC

SEQ ID NO:439:

AATGTACAGTATTGCGTTTTGGCCTCGTCCCTCTTCCCTTAGGTAA

SEQ ID NO:440:

AATGTACAGTATTGCGTTTTGTCTCTCTTCCCATTAGTCTGAGTACTGAGTGATT

SEQ ID NO:441:

AATGTACAGTATTGCGTTTTGAGCATTTCTTGAGACTTAAAGTGGCATTCTAAAGG

SEQ ID NO:442:

AATGTACAGTATTGCGTTTTGATTTTTATTCTCAAGAGGCAGAAATACCAACTTACC

SEQ ID NO:443:

AATGTACAGTATTGCGTTTTGAATTTATAGCTCTTTTCATCTGCTTTGGTATCATCA

SEQ ID NO:444:

AATGTACAGTATTGCGTTTTGGCCTCTAATCTGATATACAGCCTTAGAAAGTCACA

SEQ ID NO:445:

AATGTACAGTATTGCGTTTTGTGTGCCATTGTCCTGGAGCAACAATT

SEQ ID NO:446:

AATGTACAGTATTGCGTTTTGAGTGTACTGCTCGTTTTCTTAATTTGAAAAGTGAGT

SEQ ID NO:447:

AATGTACAGTATTGCGTTTTGACCCATGAACTAATACTTATTTTGAGATTGGTCCAT

SEQ ID NO:448:

AATGTACAGTATTGCGTTTTGCATGGTGCAACAAAAGTAAGAATCCAACAGTTTT

SEQ ID NO:449:

AATGTACAGTATTGCGTTTTGTTGAAATGTTAAGTAAGCTTGAAATACCGATAGCAT

SEQ ID NO:450:

AATGTACAGTATTGCGTTTTGGGGAGGAAGAAAATGAAGCACGAGGAAAAC

SEQ ID NO:451:

AATGTACAGTATTGCGTTTTGATTTGGGATGTACTCTAAATTTAAAGCAGCAAATCA

SEQ ID NO:452:

AATGTACAGTATTGCGTTTTGTCAAGAGCAGAATTTGGAGACTTTGATATTAAAACT

SEQ ID NO:453:

AATGTACAGTATTGCGTTTTGCGGTTACTAACATGTTTAGGGAAATAGACAACTGTT

SEQ ID NO:454:

AATGTACAGTATTGCGTTTTGCCTGACAACAGATCCCATATAATTAACTTTCATACC

SEQ ID NO:455:

AATGTACAGTATTGCGTTTTGAGATGAAGAAGATGAGGAACGAGAGAGTAAAAGC

之前特定实施方案的描述将如此充分地揭示本发明的一般性质，使得其他人可以通过应用本领域技术内的知识，容易地修改和/或改编，以用于各种应用，而不脱离本发明的一般概念。因此，基于本文呈现的教导和指导，此类修改和改编旨在在所公开实施方案的等价体的含义和范围内。应当理解，本文中的措辞或术语是为了描述而非限制的目的，使得本说明书的术语或措辞将由本领域技术人员根据教导和指导来解释。

本发明的广度和范围不应受上述任何示例性实施方案的限制，而应当仅根据所附权利要求及其等价体来定义。

本文描述的所有各个方面、实施方案和选项可以以任何和所有变化组合。

本说明书中提及的所有出版物、专利和专利申请均通过参考并入本文中，其程度就如同每个单独的出版物、专利或专利申请被具体地和单独地指示为通过引用并入本文中一样。将2019年1月9日提交的美国申请No.62/790,338的全部内容通过引用并入本文中。

Claims

1.一种用于检测样品中的分析物的方法，包括：

将第一和第二邻近探针结合到样品中的分析物，其中第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域，并且其中第二邻近探针包含第二分析物结合域和包含通用扩增区域、PST和IMR的第二寡核苷酸域；和

检测分析物。

2.权利要求1的方法，第二邻近探针的寡核苷酸域还包含UMI。

3.权利要求1或2的方法，其中第一和第二分析物结合域是抗体、适体、配体、受体，或其组合。

4.权利要求1-3任一项的方法，其中第一和第二分析物结合域通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合与寡核苷酸域缀合。

5.权利要求1-4任一项的方法，其中第一和第二分析物结合域分别是第一和第二抗体。

6.权利要求5的方法，其中第一和第二抗体中的每一个是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体，或其组合。

7.权利要求1-6任一项的方法，进一步包括进行邻近连接(PLA)或延伸(PEA)测定。

8.权利要求7的方法，其中PLA或PEA测定产生第三寡核苷酸，其是单链或双链的。

9.权利要求8的方法，进一步包括将适体序列连接第三寡核苷酸。

10.权利要求9的方法，其中通过扩增或连接将适体序列连接第三寡核苷酸。

11.权利要求8-10任一项的方法，进一步包括进行第三寡核苷酸的扩增，以产生基于蛋白质的DNA文库。

12.权利要求1-11任一项的方法，进一步包括从样品制备DNA和cDNA文库，包括：

将DNA标签连接样品中的DNA分子的末端，其中DNA标签包含UMI和DNA标识符；和

在RNA标签的存在下进行样品中RNA分子的逆转录，其中RNA标签包含RNA标识符、UMI和多聚(T)。

13.权利要求12的方法，其中逆转录在第二RNA标签的存在下进行，其中第二RNA标签包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。

14.权利要求12或13的方法，进一步包括扩增标记的DNA和标记的cDNA以用一组基因特异性引物富集。

15.权利要求14的方法，进一步包括将扩增的样品分成第一、第二或第三样品。

16.权利要求12-15任一项的方法，其中蛋白质、DNA和RNA分子从生物样品获得。

17.权利要求12-16任一项的方法，其中DNA和RNA分子是来自生物样品的片段化DNA和RNA。

18.权利要求12-17任一项的方法，其中DNA分子含有抛光的末端，用于连接。

19.权利要求12-19任一项的方法，其中RNA分子是多聚腺苷酸化的。

20.权利要求12-20任一项的方法，其中该方法不需要核糖体耗竭。

21.权利要求10-18任一项的方法，进一步包括用DNA标签特异性的引物扩增第一样品。

22.权利要求19的方法，其中扩增产生对应于样品中的DNA的DNA文库。

23.权利要求12-20任一项的方法，进一步包括用RNA标签特异性的引物扩增第二样品。

24.权利要求23的方法，其中扩增产生对应于样品中的RNA的cDNA文库。

25.权利要求1-24任一项的方法，进一步包括将基于蛋白质的DNA、DNA或cDNA文库测序。

26.权利要求12-25任一项的方法，其中DNA分子是基因组DNA。

27.权利要求12-26任一项的方法，其中DNA文库可以用于DNA变体检测、拷贝数分析、融合基因检测或结构变体检测。

28.权利要求12-27任一项的方法，其中cDNA文库可以用于RNA变体检测、基因表达分析或融合基因检测。

29.权利要求12-28任一项的方法，其中文库可以用于配对的DNA和RNA谱分析。

30.权利要求8-29任一项的方法，其中从基因组DNA和总RNA分离第三寡核苷酸。

31.权利要求1-11任一项的方法，进一步包括：

(a)从同一生物样品获得纯化的DNA和RNA；

(b)将DNA标签序列连接样品中的DNA；

(c)将RNA标签序列连接样品中的RNA；和

(d)分别检测DNA、RNA和蛋白质靶标。

32.通过权利要求1-31任一项的方法制得的基于蛋白质的DNA文库。

33.通过权利要求12-31任一项的方法制得的DNA文库。

34.通过权利要求12-31任一项的方法制得的cDNA文库。

35.一种组合物，其包含第一邻近探针和第二邻近探针，第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域，并且第二邻近探针包含第二分析物结合域和包含通用扩增区域、PST和IMR的第二寡核苷酸域。

36.权利要求35的组合物，其中第二寡核苷酸域进一步包含独特分子标识符(UMI)。

37.权利要求35或36的组合物，其中第一和第二分析物结合域是抗体、适体、配体、受体，或其组合。

38.权利要求35-37任一项的组合物，其中第一和第二分析物结合域通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合与寡核苷酸域缀合。

39.权利要求35-38任一项的方法，其中第一和第二分析物结合域分别是第一和第二抗体。

40.权利要求39的方法，其中第一和第二抗体中的每一个是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体，或其组合。

41.权利要求35-40任一项的组合物，进一步包括包含独特分子标识符(UMI)和DNA标识符的DNA标签，和/或包含RNA标识符、UMI和多聚(T)的RNA标签。

42.权利要求41的组合物，进一步包含RNA标签，其包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。

43.权利要求41或42的组合物，其中DNA标签以5’到3’方向包含UMI和DNA标识符。

44.权利要求41-43任一项的组合物，其中RNA标签以5’到3’方向包含RNA标识符、UMI和多聚(T)。

45.权利要求41-44任一项的组合物，其中RNA标签可以以5’到3’方向包含RNA标识符、UMI和TSO。