CN113302301A - 检测分析物的方法及其组合物 - Google Patents

检测分析物的方法及其组合物 Download PDF

Info

Publication number
CN113302301A
CN113302301A CN202080008831.7A CN202080008831A CN113302301A CN 113302301 A CN113302301 A CN 113302301A CN 202080008831 A CN202080008831 A CN 202080008831A CN 113302301 A CN113302301 A CN 113302301A
Authority
CN
China
Prior art keywords
dna
seq
rna
sample
oligonucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080008831.7A
Other languages
English (en)
Inventor
汪烨迅
彭泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qiagen Sciences LLC
Original Assignee
Qiagen Sciences LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiagen Sciences LLC filed Critical Qiagen Sciences LLC
Publication of CN113302301A publication Critical patent/CN113302301A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Abstract

本发明涉及通过产生可用于测序的基于分析物的DNA文库来检测样品中的分析物的方法。该方法包括使用邻近探针对,每个探针包含分析物结合域和寡核苷酸域。该方法进一步提供了集成的DNA和RNA文库制备物及其制备和使用方法。本发明还提供了可用于该方法中的组合物。

Description

检测分析物的方法及其组合物
发明背景
下一代测序(NGS)技术已用于核酸分析,例如在DNA变体检测以及RNA转录组谱分析中。与DNA/RNA同等重要的是转化研究中的蛋白质生物标志物。然而,大多数蛋白质分析是在完全不同的平台上进行的。例如,蛋白质分析可以通过传统的ELISA分析或质谱分析来完成。能够在同一平台上分析核酸和蛋白质生物标志物将显著减少分析时间并提供更多见解。
人们已经通过使用寡核苷酸缀合的抗体(Ab)成功地将蛋白质检测转变为核酸检测。免疫-PCR是一种几十年前描述的此类技术(Sano,T.等,Science 258:120-2(1992))。在这种情况中,抗原特异性Ab与寡核苷酸序列缀合,并用于典型的ELISA过程中。尽管存在许多ELISA变型,但该过程通常至少包括抗原抗体结合、抗体洗涤和检测步骤。在免疫PCR的情况中,最终检测是通过使用实时PCR测定来完成的,以量化缀合到与特异性抗原结合的抗体的特定寡核苷酸。与具有传统比色读数的ELISA相比,免疫PCR理论上更灵敏,因为实时PCR甚至可以检测到与抗原特异性结合的微量寡核苷酸。免疫PCR还具有更高的多重潜力,因为不同的寡核苷酸序列可用于检测不同的抗原-抗体对。然而在实践中,由于抗体的非特异性结合,实际的免疫PCR敏感性通常受限于抗体特异性。此外,由于指数扩增固有的易变性,实时PCR对于检测丰度的微小变化不是很准确,例如,实时PCR测量50%变化或小于1Ct差异时存在很大的可变性。
为了解决免疫PCR中的局限性,人们开发了蛋白质邻近连接(PLA)和邻近延伸(PEA)分析(Gullberg,M.等,Proc.Natl.Acad.Sci.USA.101:8420-4(2004);Lundberg,M.等,Nucleic Acids Res.39:e102(2011))。在这两种技术中,将针对同一抗原的一对抗体与不同的寡核苷酸缀合。当这对抗体与特异性抗原结合时,缀合的寡核苷酸会非常靠近,比它们在溶液中的随机位置要近得多。由于这种接近,这两种寡核苷酸现在更有可能参与分子间连接或延伸反应。所得到的连接或延伸产物可以使用例如PCR分析来检测。由于接近度受两种抗体的特异性控制,因此接近度测定特异性更高,并且常常不需要大量洗涤步骤来去除未结合的抗体。然而,现有的PLA和PEA检测仍然受到相同的下游qPCR检测限制的影响,在检测微小差异方面不是很可靠。
使用NGS作为PLA分析的下游读出是已知的(Darmanis S.等,PLoS One.6:e25583(2011)。这种方法可以潜在地提高分析通量,从而可以在单个平台上分析许多样品中的大量蛋白质靶标。但是,由于NGS样品制备工作流程中广泛的扩增偏差,读数计数仍然是不准确的。
仍然需要改进的、适于测序分析的蛋白质分析方法。
发明简述
本文公开了用于检测样品中分析物的方法,包括:将第一和第二邻近探针结合到样品中的分析物,其中第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域,并且其中第二邻近探针包含第二分析物结合域,以及包含通用扩增区域、PST和IMR的第二寡核苷酸域;并检测分析物。在一些实施方案中,第二邻近探针的寡核苷酸域还包含UMI。
第一和第二分析物结合域可以是但不限于抗体、适体、配体、受体或其组合。第一和第二分析物结合域可以与寡核苷酸域缀合,例如通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合。在一些实施方案中,第一和第二分析物结合域分别是第一和第二抗体。第一抗体和第二抗体中的每一个可以是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体,或其组合。
该方法可以进一步包括进行邻近连接(PLA)或延伸(PEA)测定。PLA或PEA测定可以产生单链或双链的第三寡核苷酸。
该方法可以进一步包括将适体序列连接第三寡核苷酸。适体序列可以通过扩增或连接与第三寡核苷酸连接。
该方法可以进一步包括进行第三寡核苷酸的扩增,以产生基于蛋白质的DNA文库。
该方法可以进一步包括从同一样品制备DNA或cDNA文库,包括:将DNA标签连接样品中的DNA分子的末端,其中DNA标签包含UMI和DNA标识符;以及在RNA标签的存在下进行样品中RNA分子的逆转录,其中RNA标签包含RNA标识符、UMI和多聚(T)。逆转录可以在第二RNA标签的存在下进行,其中第二RNA标签包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。
该方法可以进一步包括扩增标记的DNA和标记的cDNA以用一组基因特异性引物富集。该方法可以进一步包括将扩增的样品分离成第一、第二或第三样品。蛋白质、DNA和RNA分子可以从生物样品获得,例如,同一生物样品。在一些实施方案中,DNA和RNA分子是来自生物样品的片段化DNA和RNA。在一些实施方案中,DNA分子包含用于连接的抛光(polished)的末端。在其他实施方案中,RNA分子是聚腺苷酸化的。
在一些实施方案中,该方法不需要核糖体耗竭。
该方法可以进一步包括用DNA标签特异性的引物扩增第一样品。该扩增可以产生对应于样品中的DNA的DNA文库。
该方法可以进一步包括用RNA标签特异性的引物扩增第二样品。该扩增可以产生对应于样品中的RNA的cDNA文库。
该方法可以进一步包括将基于蛋白质的DNA、DNA或cDNA文库测序。DNA分子可以是基因组DNA。DNA文库可以用于变体检测、拷贝数分析、融合基因检测或结构变体检测。cDNA文库可以用于RNA变体检测、基因表达分析或融合基因检测。DNA和cDNA文库可以用于配对的DNA和RNA谱分析。
在一些实施方案中,将第三寡核苷酸从基因组DNA和总RNA中分离出来。
该方法可以进一步包括:(a)从同一生物样品获得纯化的DNA和RNA;(b)将DNA标签序列结合到样品中的DNA;(c)将RNA标签序列结合到样品中的RNA;和(d)分别检测DNA、RNA和蛋白质靶标。
本文还公开了由本文公开的任何方法制成的基于蛋白质的DNA文库。还公开了是由本文公开的任何方法制成的DNA文库。还公开了是由本文公开的任何方法制成的cDNA文库。
本文公开了组合物,其包含第一邻近探针和第二邻近探针,第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域,并且第二邻近探针包含第二分析物结合域,以及包含通用扩增区域、PST和IMR的第二寡核苷酸域。第二寡核苷酸域可以进一步包含独特分子标识符(UMI)。第一和第二分析物结合域可以是抗体、适体、配体、受体或其组合。第一和第二分析物结合域可以通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合与寡核苷酸域缀合。第一和第二分析物结合域可以分别是第一和第二抗体。第一抗体和第二抗体中的每一个可以是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体或其组合。
组合物可以进一步包括包含独特分子标识符(UMI)和DNA标识符的DNA标签和/或包含RNA标识符、UMI和多聚(T)的RNA标签。组合物可以进一步包括包含RNA标识符、UMI和模板转换寡核苷酸(TSO)的RNA标签。DNA标签可以以5’到3’方向包含UMI和DNA标识符。RNA标签可以以5’到3’方向包含RNA标识符、UMI和多聚(T)。RNA标签可以以5’到3’方向包含RNA标识符、UMI和TSO。
附图简述
图1.示例性邻近探针对。
图2.显示了使用一个带有UMI的探针的PFA的工作流程。用箭头显示了游离3’末端。
图3.从邻近反应产生的第三寡核苷酸。
图4.邻近分析的流程图。
图5.示例性DNA和RNA标签分子。
图6.用于产生DNA和cDNA文库的示例性过程。
发明详述
本文公开了改进的PLA和PEA分析设计,以整合独特分子索引(UMI)和蛋白质或分析物特异性标签序列。NGS可用于计数UMI,作为计算蛋白质丰度的一种方式。使用UMI的蛋白质或分析物PLA或PEA可以使用来自同一样品输入的基因组DNA/转录组RNA文库制备品进行,即,通过计算各自的UMI可以在同一NGS平台上定量分析DNA/RNA/蛋白质生物标志物。2018年3月26日提交的美国申请No.62/648,174中报告了无需物理分离基因组DNA和总RNA的同时进行DNA和RNA富集和文库制备的组合工作流程,其全部内容通过引用并入本文中。新的支持UMI的PLA和PEA分析设计可以整合到其中以允许同时分析所有都来自同一样品的蛋白质/DNA/RNA。
本文公开了用于检测样品中的分析物的方法,包括:将第一和第二邻近探针结合到样品中的分析物,其中第一邻近探针包含第一分析物结合域和包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域,并且其中第二邻近探针包含第二分析物结合域和包含通用扩增区域、PST和IMR的第二寡核苷酸域;并检测分析物。该方法可以进一步包括进行邻近连接(PLA)或延伸(PEA)测定。进行PLA和PEA的方法是本领域公知的。
PLA或PEA测定产生单链或双链的第三寡核苷酸。该方法可以进一步包括进行第三寡核苷酸的扩增以产生基于蛋白质的DNA文库。
本文还公开了组合物,其包含第一邻近探针和第二邻近探针,第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域,并且第二邻近探针包含第二分析物结合域和包含通用扩增区域、PST和IMR的第二寡核苷酸域。
在一些实施方案中,第二邻近探针的第二寡核苷酸域进一步包含UMI。
在第一和第二邻近探针中,第一和第二分析物结合域分别可以是抗体、适体、配体、受体,或其组合。
在一些实施方案中,第一和第二分析物结合域通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合分别与第一和第二寡核苷酸域缀合。
在一些实施方案中,第一和第二分析物结合域可以分别是第一和第二抗体。例如,第一抗体和第二抗体中的每一个是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体或其组合。
本文公开的方法可以进一步包括从同一样品(如同一生物样品)制备DNA和cDNA文库,包括:将DNA标签连接样品中的DNA分子的末端,其中DNA标签包含UMI和DNA标识符;以及在RNA标签的存在下进行样品中RNA分子的逆转录,其中RNA标签包含RNA标识符、UMI和多聚(T)。逆转录可以在第二RNA标签的存在下进行,其中第二RNA标签包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。该方法可以进一步包括扩增标记的DNA和标记的cDNA以用一组基因特异性引物富集。
该方法可以进一步包括将扩增的样品分离成第一、第二或第三样品。
蛋白质和DNA和RNA分子可以从生物样品获得。DNA和RNA分子可以是来自生物样品的片段化DNA和RNA。
DNA分子可以含有用于连接的抛光(polished)末端。RNA分子可以是聚腺苷酸化的。在一些实施方案中,该方法不需要核糖体耗竭。
该方法可以进一步包括用DNA标签特异性的引物扩增第一样品。
该扩增可以产生对应于样品中的DNA的DNA文库。
该方法可以进一步包括用RNA标签特异性的引物扩增第二样品。该扩增可以产生对应于样品中的RNA的RNA文库。
该方法可以进一步包括将基于蛋白质的DNA、DNA或cDNA文库测序。
DNA分子可以是基因组DNA。DNA文库可以用于变体检测、拷贝数分析、融合基因检测或结构变体检测。
cDNA文库可以用于RNA变体检测、基因表达分析或融合基因检测。该文库可以用于配对的DNA和RNA谱分析。
在一些实施方案中,可以将第三寡核苷酸从基因组DNA和总RNA中分离出来。
该方法可以进一步包括从同一样品获得纯化的DNA和RNA;将DNA标签序列连接样品中的DNA;将RNA标签序列连接样品中的RNA;和分别检测DNA、RNA和蛋白质靶标。
本文公开的方法可以进一步包括:(a)从同一生物样品获得纯化的DNA和RNA;(b)将DNA和RNA片段化;(c)将双链DNA片段的末端抛光用于连接;(d)通过聚腺苷酸化将RNA片段抛光;(e)将DNA标签连接抛光的DNA片段的3’末端,其中DNA标签以5’到3’方向包含独特分子标识符(UMI)和DNA标识符;(f)在第一RNA标签和第二RNA标签的存在下进行抛光的RNA片段的逆转录,其中第一RNA标签以5’到3’方向包含RNA标识符、UMI和多聚(T),并且其中第二RNA标签以5’到3’方向包含RNA标识符、UMI和模板转换寡核苷酸(TSO);(g)扩增标记的DNA和标记的cDNA,用于用一组基因特异性引物富集;(h)将扩增的样品分成第一和第二样品;(i)用DNA标签特异性的引物扩增第一样品;和(j)用RNA标签特异性的引物扩增第二样品。
本文还公开了通过本文公开的方法形成的基于蛋白质的DNA文库、DNA文库和/或cDNA文库。
例如,本文公开的方法可以使用含有两个针对特异性蛋白质靶标的抗体的抗体对。抗体对(抗体A和抗体B)可以是分成两个的一个多克隆Ab、两个不同的多克隆Ab、两个不同的单克隆Ab,或其组合。两个不同的寡核苷酸分别与两个抗体缀合,形成第一和第二邻近探针。每个寡核苷酸(寡核苷酸A或寡核苷酸B)可以包含通用扩增区,例如,用于PCR扩增,可变探针特异性标签区(PST),用于区分靶蛋白,UMI区,用于分子计数,以及分子间反应区(IMR),用于促进寡核苷酸对相互作用,通过连接(PLA)或延伸(PEA)。寡核苷酸对的示例性说明显示于图1中。
UMI可以在寡核苷酸对中的两者中都存在。例如,UMI也可以包括在以上实例中的寡核苷酸B中。在这样的情况中,两个寡核苷酸中的UMI组合用于计数目的。
寡核苷酸与抗体的缀合可以通过化学键直接连接,或通过与连接抗体的中间寡核苷酸杂交,或通过分别连接抗体和寡核苷酸的其他相互作用成分(例如,链霉亲和素和生物素)。
随后将缀合的探针对(与寡核苷酸A缀合的抗体A,与寡核苷酸B缀合的抗体B)用于检测样品中特定靶蛋白的丰度。将不同的探针对混合在一起,使得可以在单一反应中检测多个蛋白质靶标。根据寡核苷酸设计,探针对可以用于PLA或PEA测定中。具体地,邻近探针对的抗体A和抗体B结合单一蛋白质靶标,其使寡核苷酸A和寡核苷酸B接近。随后寡核苷酸A和B彼此相互作用,通过连接酶的连接(PLA)或通过DNA聚合酶的延伸(PEA),形成新的寡核苷酸。使用以上寡核苷酸的邻近探针对的PEA工作流程的示例显示于图2中。该工作流程显示了使用带有UMI的探针的PEA。用箭头显示了游离3’末端。
所得到的新寡核苷酸,在本文中称为“第三寡核苷酸”或“邻近寡核苷酸”,由两端的通用区、UMI区、两部分的探针特异性标签区(PST-A和PST-B)和分子间反应区(IMR)组成。其可以是单链(PLA或PEA)或双链(PEA)。来自以上PEA测定的示例性双链寡核苷酸显示于图3中。
可以通过添加的适体(通过PCR或连接)来进一步修饰第三寡核苷酸,使得可以在NGS平台上分析它们。从测序读数,通用-A和通用-B的序列用作签名标签,表明该读数是针对蛋白质样品的。如果要在同一平台上分析所有来自DNA和RNA样品的其他类型的读数,这将特别有帮助。PST-A+IMR+PST-B的序列独特地标识每个蛋白质靶标。UMI计数度量了样品中相应蛋白质靶标的丰度。
例如,典型的Illumina Miseq测序读数可以如下:
Figure BDA0003156074220000091
斜体区域是通用序列。下划线区域(PST-A+IMR+PST-B)独特地标识每个蛋白质靶标。粗体区域是UMI,用于计算样品中相应蛋白质靶标的丰度。与仅使用读数计数相比,使用UMI计数可以有效抵消PCR扩增偏差,提高数据分析的准确性。样品中每个蛋白质靶标的UMI计数首先针对对照的UMI计数进行归一化(normalized)。然后可以比较不同样本的归一化UMI计数。归一化计数越高,样品中相应靶的丰度越高。
本文公开的方法可以并入常规的DNAseq和RNAseq工作流程中,允许同时分析蛋白质/DNA/RNA,仅同时分析DNA和RNA,或从同一样品中各自分开分析。图4中提供了示例工作流程。从基因组DNA和总RNA分离邻近反应的DNA产物可以简化下游NGS文库的制备。由于其长度比gDNA短,因此可以通过简单的大小选择方法将邻近反应的DNA产物与基因组DNA分离。邻近寡核苷酸还可以含有亲和标记(例如生物素)以有助于其与基因组DNA和总RNA的分离。参见图4。
本文公开了用于分析的基于整合分析物的DNA、DNA和cDNA文库制备物,例如通过下一代测序(NGS)分析,而无需物理分离样品中的DNA和RNA。这些方法将UMI(独特分子索引)技术和任选的靶向富集技术无缝地集成到工作流程中,这提高了测序能力的利用和结果的准确性。此外,这些方法分别从分析物、DNA和RNA输出三个独立的基于分析物的DNA、DNA和cDNA文库,这允许在下游测序平台上灵活操作。与独立的DNA文库和cDNA文库方法相比,这些方法减少了样品消耗,简化了实验过程,并且可以帮助研究人员获得基因型和表型相关性以及疾病分子机制的生物学见解。
本文描述了在无需物理分离基因组DNA(gDNA)和mRNA的情况下制备靶向的DNA和cDNA文库的方法。该过程涉及三个模块:(1)分别为每个单独的DNA和RNA片段分配不同的DNA和RNA标签分子,而无需在系统中将它们分开;任选,(2)扩增和富集标记的DNA和RNA片段的子集(靶富集);(3)差异PCR扩增(富集)产物中标记的DNA和标记的cDNA,输出分别对应于原始DNA和RNA的两个文库。
在第一模块中使用的DNA和RNA标签分子是寡核苷酸,其包含至少1)用于区分DNA文库或RNA文库的识别序列,和2)用于识别每个单独核酸分子的UMI序列。
DNA和RNA标签对于模块3中DNA和cDNA文库的最终分离是必不可少的,在模块3中它们可以作为DNA和RNA的特异性扩增引物位点。UMI序列有助于提高DNA和RNA NGS分析的准确性。示例性标签分子示于图5中。
可以使用两种类型的RNA标签分子,以从两个方向对单链RNA进行测序,并且因此,可以使用两种不同机制来连接RNA特异性序列。只需一种类型的DNA标签分子,因为DNA标签分子可以连接双链DNA的两端。
靶向富集反应(模块2)能够集中观察相关目标区并提供NGS测序能力的经济利用。它还减少了对与全基因组或转录组工作流程相关的样本进行额外处理(如核糖体RNA耗竭)的必要性。DNA和RNA的富集都是在同一反应中完成的。根据应用,如果靶DNA和RNA区相同,富集引物池可以相同。如果对于DNA和RNA的目标区域不同,用户可以简单地混合相应的富集引物池,并将它们放入同一反应中。
模块3能够分离DNA和cDNA文库的输出。DNA和cDNA的测序深度要求通常大不相同,并且它们因应用而异。本文公开的方法的输出为用户提供了灵活性,以便可以根据特定需要单独分配测序容量。此外,由于样品已经在模块2中部分扩增,分离对样品损失的影响可以忽略不计。
图6示出了利用本文公开的方法的一种示例性的优化方式。它从生物样品纯化(不一定分离)的gDNA和RNA开始(步骤1)。总核酸通过酶消化(对于DNA)和通过热水解(对于RNA)进行片段化。双链DNA片段经过末端抛光,以便它们准备好用于连接(步骤2)。片段化的RNA通过聚腺苷酸化进行末端抛光(步骤3)。在接下来的几个步骤中,将DNA片段连接DNA标签分子(步骤4),然后通过模板转换逆转录将RNA片段与RNA标签分子(在两端)连接(步骤5)。DNA和RNA标签就位后,样品通过一组基因特异性引物进行靶向富集反应,其中目标区域被扩增和富集(步骤6)。最后,样品被分成两个样品,并分别通过DNA标签和RNA标签特异性引物进一步扩增,并使用与例如Illumina NGS平台兼容的适当NGS适体序列(步骤7)。最终产品是分别由原始DNA和RNA材料产生的两个分开的DNA和cDNA文库,且准备好用于测序。
除了从样品制备基于分析物的DNA文库外,本文还公开了用于从同一样品制备DNA和cDNA文库的方法,包括:将DNA标签连接样品中的DNA分子的末端,其中DNA标签包括独特分子标识符(UMI)和DNA标识符;在RNA标签存在下对样品中的RNA分子进行逆转录,其中所述RNA标签包含RNA标识符、UMI和多聚(T)。这些方法不需要从样品物理分离DNA和RNA。
在一些实施方案中,在第二RNA标签的存在下进行逆转录,其中第二RNA标签包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。
在一些实施方案中,所述方法可以包括核糖体耗竭。或者,在一些实施方案中,所述方法不需要核糖体耗竭。核糖体耗竭的方法是本领域已知的,例如,使用RiboZero金(Illumina:MRZG126)。
术语“样品”可以包括获自受试者(例如,哺乳动物受试者、动物受试者、人受试者或非人动物受试者)的肽、多肽、蛋白质、RNA、DNA、单细胞、多细胞、细胞片段或体液试样。可以通过本领域技术人员使用任何已知的方式来选择样品,所述已知方式包括但不限于离心、静脉穿刺、抽血、排泄、擦拭、活检、针吸、灌洗样品、刮擦、手术切除、激光捕获显微切割、梯度分离或干预或本领域已知的其他方式。如本文使用的术语“哺乳动物(mammal)”或“哺乳动物(mammalian)”包括人和非人,并且包括但不限于人、非人灵长类、犬科动物、猫科动物、鼠科动物、牛科动物、马科动物和猪科动物。
如本文使用的,术语“生物样品”旨在包括,但不限于,从受试者分离的组织、细胞、生物流体及其分离物,以及受试者内存在的组织、细胞和流体。
如本文使用的,“单细胞”是指一个细胞。本文所述方法中有用的单细胞可以获自目标组织,或来自活检、血样或细胞培养物。另外,可以获得来自特定器官、组织、肿瘤、赘生物等的细胞并用于本文所述的方法中。通常,可以将来自任何群的细胞用于所述方法中,如原核或真核生物体的群,包括细菌或酵母。
可以使用本领域已知的标准方法,例如,使用胰蛋白酶或木瓜蛋白酶以酶促方式消化组织样品中连接细胞的蛋白质或释放培养物中的贴壁细胞,或机械分离样品中的细胞,来获得单细胞悬液。也可以通过本领域技术人员使用一种或多种已知的与目标样品相关的标志物来选择样品。
用于操作单细胞的方法是本领域已知的并且包括荧光激活细胞分选(FACS)、显微操作和使用半自动化细胞采集器(例如,来自Stoelting Co.的QuixellTM细胞转移系统)。例如,可以基于显微观察可检测的特征,如位置、形态或报告基因表达,来单独选择单独的细胞。
一旦已经鉴定出所需的样品,使用本领域技术人员已知的方法,制备样品并将细胞裂解以释放细胞内容物,包括DNA和RNA,如gDNA和mRNA。例如,可以通过加热细胞,或通过使用去污剂或其他化学方法,或通过这些的组合,来实现裂解。可以使用本领域已知的任何合适的裂解方法。
使用本领域技术人员已知的方法从细胞分离蛋白质或核酸,如DNA或RNA。
如本文使用的,“分析物”是样品中待鉴定和/或定量的任何分子,如但不限于肽、多肽、蛋白质、抗体、抗原、配体、受体、细菌或病毒成分、小分子、多核苷酸、寡核苷酸等。分析物可以包括诸如,例如,被施用以抑制或治疗或预防失调和/或疾病的药物或化合物这类药剂。
在第一和第二邻近探针中,第一和第二分析物结合域分别可以是能够与目标分析物相互作用的抗体、适体、配体、受体或其组合。
术语“多肽”、“肽”和“蛋白质”在本文可互换使用,是指任何长度的氨基酸的聚合形式。NH2是指存在于多肽的氨基末端的游离氨基基团。COOH是指存在于多肽的羧基末端的游离羧基基团。
术语“基于蛋白质的DNA”和“基于分析物的DNA”是指分别由于蛋白质或分析物与分析物结合域相互作用而分别与目标蛋白质或分析物相关的DNA,其转而与第一和第二寡核苷酸域相关。
术语“多核苷酸”或“寡核苷酸”是指核酸,如DNA分子和RNA分子及其类似物(例如,使用核苷酸类似物或使用核酸化学产生的DNA或RNA)。如预期的,可以合成制得多核苷酸,例如,使用本领域认可的核酸化学或酶促反应,例如,使用聚合酶,并且如果需要,多核苷酸可以修饰。典型的修饰包括甲基化、生物素化和其他本领域已知的修饰。此外,多核苷酸可以是单链或双链的,且在需要的情况中,连接到可检测部分。在一些方面中,多核苷酸可以包括杂合分子,例如,包含DNA和RNA。
“G”、“C”、“A”、“T”和“U”各自通常代表分别包含鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶和尿嘧啶作为碱基的核苷酸。然而,应当理解,术语“核糖核苷酸”或“核苷酸”也可以指修饰的核苷酸或代替替换部分。技术人员非常清楚鸟嘌呤、胞嘧啶、腺嘌呤和尿嘧啶可以被其他部分替换,而不会显著改变包含带有这种替换部分的核苷酸的寡核苷酸的碱基配对特性。例如,不限于,包含肌苷作为其碱基的核苷酸可以与含有腺嘌呤、胞嘧啶或尿嘧啶的核苷酸碱基配对。因此,含有尿嘧啶、鸟嘌呤或腺嘌呤的核苷酸可以在核苷酸序列中被含有例如肌苷的核苷酸替换。在另一个实例中,寡核苷酸中任何地方的腺嘌呤和胞嘧啶可以分别替换为鸟嘌呤和尿嘧啶,以与靶mRNA形成G-U Wobble碱基配对。含有此类替换部分的序列适用于本文所述的组合物和方法。
术语“DNA”是指单链或双链的染色体DNA、质粒DNA、噬菌体DNA或病毒DNA。DNA可以获自原核生物或真核生物。
术语“基因组DNA”或“gDNA”是指染色体DNA。
术语“信使RNA”或“mRNA”是指没有内含子的且可以翻译成多肽的RNA。
术语“cDNA”是指与mRNA互补或相同的DNA,单链或双链形式的。
独特分子索引或标识符(UMI;也称为随机分子标签(RMT))是用于在文库扩增之前标记每个分析物、蛋白质、DNA或RNA分子(片段)的碱基的短序列或“条形码”,从而辅助识别每种单独的核酸分子或PCR倍增物。参见Kivioja,T.等人,Nat.Methods 9:72-74(2012)和增刊。如果两个读段对齐到相同的位置并具有相同的UMI,则它们很可能是源自扩增前相同片段的PCR倍增物。UMI还可用于检测和量化独特的mRNA转录物。在一些实施方案中,含有相同DNA标识符序列的DNA标签含有不同的UMI序列。在一些实施方案中,含有相同RNA标识符序列的RNA标签含有不同的UMI序列。
UMI区用于分子计数。UMI的概念是在任何扩增之前,每个原始靶分子被独特的条形码序列“标记”。这个DNA序列必须足够长,以提供足够的排列来为每个创建者分子分配独特的条形码。在一些实施方案中,UMI序列含有随机化的核苷酸并且被并入邻近探针的寡核苷酸域或DNA或RNA标签中。例如,12个碱基的随机序列为样品中的每个靶分子提供412或16,777,216个UMI。
适体可以连接第三寡核苷酸,例如,通过扩增或连接,以促进通过测序(如NGS)分析第三寡核苷酸。
“可变探针特异性标签区”(PST)是用于区分靶分析物或蛋白质的特异性序列。由于蛋白质或分析物分别与分析物结合域的相互作用,其转而与第一和第二寡核苷酸域相关,因此探针上的PST序列与相应的靶分析物或蛋白质相关,使得不同的PST表示不同的分析物或蛋白质。
“分子间反应区”(IMR)促可以进寡核苷酸对相互反应,通过连接(PLA)或延伸(PEA)。IMR是第一邻近探针中与第二邻近探针中的IMR区相互作用的区域,如通过杂交。因此,第一邻近探针的IMR可以是100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%或80%互补或可由此衍生至第二邻近探针的IMR的任何范围。IMR可以是例如但不限于1-100个核苷酸、1-90个核苷酸、1-80个核苷酸、1-60个核苷酸、1-50个核苷酸、1-40个核苷酸、1-30个核苷酸、1-20个核苷酸、1-10个核苷酸,或可从其衍生的任何长度或范围。
术语“通用PCR手柄(handle)”、“通用PCR序列”、“PCR手柄”、“PCR手柄序列”、“通用PCR手柄”和“通用扩增序列”是指可用于对从生物单元提取或衍生的核酸序列进行扩增(例如PCR扩增)并进一步测序的共同核酸序列。在一些实施方案中,PCR手柄与模板序列缺乏同源性。在其他实施方案中,PCR手柄序列对于整个样品制备工作流程是共同的。可以将RNA逆转录为cDNA,并且可以使用模板转换寡核苷酸(TSO)在合成的cDNA的下游引入PCR手柄(Zhu,Y.Y.等,Biotechniques30:892-7(2001),即,将PCR手柄附加到全长cDNA的5′端。PCR手柄用于后续扩增。在一些实施方案中,在5′和3′端均具有PCR手柄,即2个PCR手柄,可以增加扩增效率。
如本文使用的,“聚合酶”及其衍生物,通常是指可以催化核苷酸(包括其类似物)聚合成核酸链的任何酶。通常但不必定,这样的核苷酸聚合可以以模板依赖性方式进行。这样的聚合酶可以包括不限于天然产生的聚合酶及其任何亚基和截短体、突变聚合酶、变体聚合酶、重组、融合或其他工程化的聚合物、化学修饰的聚合酶、合成的分子或装配体,及其保留催化此类聚合的能力的任何类似物、衍生物或片段。任选地,聚合酶可以是包含一个或多个突变的突变聚合酶,所述突变涉及用其他氨基酸替换一个或多个氨基酸、聚合酶的一个或多个氨基酸的插入或缺失,或两个或多个聚合物的一部分的连接。通常,聚合酶包含一个或多个活性位点,在该位点可以进行核苷酸聚合的核苷酸结合和/或催化。一些示例性聚合酶包括不限于DNA聚合酶和RNA聚合酶。如本文使用的,术语“聚合酶”及其变体,还指包含至少两个彼此连接的蛋白质的融合蛋白,其中第一部分包含可以催化核苷酸聚合成核酸链的肽并连接包含第二多肽的第二部分。在一些实施方案中,第二多肽可以包括报告酶或处理能力增强域。任选,聚合酶可以具有5’外切酶活性或末端转移酶活性。在一些实施方案中,聚合物可以任选被重新激活,例如通过使用热、化学品或重新添加新含量的聚合酶至反应混合物中。在一些实施方案中,聚合酶可以包括热启动聚合酶或基于适体的聚合物,其任选可以被重新激活。
如本文使用的,术语“延伸”及其变体,用于提及给定引物时,包括给定聚合酶的任何体内或体外酶活性特征,其涉及一个或多个核苷酸聚合到现有核酸分子的末端。通常但不必然地,这样的引物延伸以依赖模板的方式发生;在依赖模板的延伸过程中,碱基的顺序和选择由已建立的碱基配对规则驱动,其可以包括Watson-Crick类型的碱基配对规则,或可替代地(且尤其是在涉及核苷酸类似物的延伸反应的情况中)由一些其他类型的碱基配对范式驱动。在一个非限制性的实例中,延伸通过聚合酶经由核酸分子3′OH末端上的核苷酸的聚合而进行。
如本文使用的,术语“连接(ligating)”、“连接(ligation)”及其衍生通常是指将两个或更多个分子共价连接在一起的行为或过程,例如将两个或更多个核酸分子彼此共价连接。在一些实施方案中,连接包括连接核酸的相邻核苷酸之间的切口。在一些实施方案中,连接包括在第一个核酸分子的末端和第二个核酸分子的末端之间形成共价键。在一些实施方案中,例如其中待连接的核酸分子包括常规核苷酸残基的实施方案,连接可以包括在一个核酸的5′磷酸基团和第二个核酸的3′羟基之间形成共价键,从而形成连接的核酸分子。在一些实施方案中,可以采用任何用于在相邻核苷酸之间连接切口或将5’磷酸与3’羟基键合的方式。在示例性的实施方案中,可以使用诸如连接酶的酶。通常出于本公开的目的,可以将扩增的靶序列连接适体以产生适体连接的扩增靶序列。
如本文使用的,“连接酶”及其衍生,通常是指能够催化两个底物分子连接的任何试剂。在一些实施方案中,连接酶包括能够催化核酸的相邻核苷酸之间切口连接的酶。在一些实施方案中,连接酶包括能够催化一个核酸分子的5′磷酸酯与另一个核酸分子的3′羟基之间形成共价键从而形成连接的核酸分子的酶。合适的连接酶可以包括但不限于T4 DNA连接酶、T4 RNA连接酶和大肠杆菌DNA连接酶。
如本文使用的,“连接条件”及其衍生,通常是指适合将两个分子彼此连接的条件。在一些实施方案中,连接条件适用于密封核酸之间的切口或缺口。如本文定义的,“切口”或“缺口”是指在核酸序列的内部核苷酸内缺少单核苷酸戊糖环的5′磷酸酯与相邻单核苷酸戊糖环的3′羟基直接键合的核酸分子。如本文使用的,术语切口或缺口与该术语在本领域中的使用一致。通常,切口或缺口可以在酶(如连接酶)的存在下在合适的温度和pH下连接。在一些实施方案中,T4 DNA连接酶可以在约70-72℃的温度下连接核酸之间的切口。
如本文使用的,“平端连接”及其衍生,通常是指两个平端双链核酸分子彼此连接。“平端”是指双链核酸分子的末端,其中核酸分子一条链末端的基本上所有核苷酸与同一核酸分子另一条链中的相对核苷酸碱基配对。如果核酸分子的末端包括长度大于两个核苷酸的单链部分(本文称为“突出端”),则该核酸分子不是平端的。在一些实施方案中,核酸分子的末端不包括任何单链部分,使得末端的一条链中的每个核苷酸与同一核酸分子的另一条链中的相对核苷酸配对。在一些实施方案中,彼此连接的两个平端核酸分子的末端不包括任何重叠、共享或互补序列。通常,平端连接不包括使用额外的寡核苷酸适体来辅助双链扩增的靶序列与双链适体的连接,如在Mitra和Varley,US2010/0129874中描述的贴片寡核苷酸。在一些实施方案中,平端连接包括切口平移反应以密封在连接过程中产生的切口。
术语“扩增子”是指核酸扩增反应(例如,RT-PCR)的扩增产物。
术语“逆转录PCR”和“RT-PCR”是指其中起始材料是mRNA的PCR类型。使用逆转录酶将起始mRNA酶促转化为互补DNA或“cDNA”。然后将cDNA用作PCR反应的模板。
术语“PCR产物”、“PCR片段”和“扩增产物”是指在变性、退火和延伸的两个或更多个循环的PCR步骤完成后得到的化合物混合物。这些术语包括一个或多个靶序列的一个或多个区段已经扩增的情况。
术语“扩增试剂”是指除引物、核酸模板和扩增酶外,扩增所需的那些试剂(三磷酸脱氧核糖核苷酸、缓冲液等)。通常,扩增试剂与其他反应成分一起放置并包含在反应容器(试管、微孔等)中。扩增方法包括本领域技术人员已知的PCR方法,也包括滚环扩增(Blanco等,J.Biol.Chem.,264,8935-8940,1989)、超支化滚环扩增(Lizard等,1989,Nat.Genetics,19,225-232,1998)和环介导的等温扩增(Notomi等,Nuc.Acids Res.,28,e63,2000),它们各自通过引用整体并入本文中。
术语“杂交”是指与互补核酸的序列特异性非共价结合相互作用。可以对全部或部分核酸序列进行杂交。本领域技术人员将认识到核酸双链体或杂交体的稳定性可以由Tm确定。有关杂交条件的其他指导可参见:Current Protocols in Molecular Biology,JohnWiley&Sons,NY,1989,6.3.1-6.3.6和:Sambrook等人,Molecular Cloning,a LaboratoryManual,Cold Spring Harbor Laboratory Press,1989,Vol.3。
如本文使用的,将序列“整合入(incorporating)”多核苷酸中是指通过磷酸二酯键将一系列核苷酸与多核苷酸的其余部分共价连接,例如在多核苷酸的3′或5′末端,其中核苷酸按照序列规定的顺序连接。如果多核苷酸含有序列或其互补序列,则序列已被“整合入”多核苷酸中,或者等同于多核苷酸“整合”了该序列。可通过酶促(例如,通过连接或聚合)或使用化学合成(例如,通过亚磷酰胺化学)将序列并入多核苷酸中。
如本文使用的,术语“扩增(amplify)”和“扩增(amplification)”是指完整地或部分地酶促拷贝多核苷酸的序列,使得产生更多也含有该序列或其互补序列的多核苷酸。被拷贝的序列被称为模板序列。扩增的实例包括通过RNA聚合酶的DNA模板的RNA合成、通过逆转录酶的RNA模板的第一链cDNA合成和使用热稳定的DNA聚合酶的DNA模板的PCR扩增。扩增包括引物延伸反应。扩增包括如PCR、连接扩增(或连接酶链反应,LCR)和扩增方法这样的方法。这些方法在本领域中是已知的并且被广泛实践。参见,例如,美国专利No.4,683,195和4,683,202以及Innis等,“PCR protocols:a guide to method and applications”Academic Press,Incorporated(1990)(用于PCR);和Wu等(1989)Genomics 4:560-569(用于LCR)。一般而言,PCR程序描述了一种基因扩增方法,该方法包括(i)引物与DNA样品(或文库)中的特定基因的序列特异性杂交,(ii)随后的扩增,涉及使用DNA聚合酶的多轮退火、延伸和变性,以及(iii)筛选PCR产物中正确大小的条带。所用的引物是足够长的寡核苷酸和合适的序列以提供聚合起始,即每个引物被特异性设计为与待扩增的基因组位置的每条链互补。
用于进行扩增反应的试剂和硬件是可商购的。用于从特定基因区扩增序列的引物优选与靶区域或其侧翼区域中的序列互补并特异性杂交,并且可以使用本文提供的多核苷酸序列制备。扩增产生的核酸序列可直接测序。
两个单链多核苷酸之间以反平行构型发生杂交时,该反应称为“退火”,而那些多核苷酸被描述为“互补”。如本文使用的,除非另有说明,术语“互补”在用于描述与第二核苷酸序列相关的第一核苷酸序列时,是指包含第一核苷酸序列的多核苷酸在某些条件下与包含第二核苷酸序列的多核苷酸杂交并形成双链体结构的能力,如技术人员将理解的。例如,此类条件可以是严格条件,其中严格条件可以包括:400mM NaCl、40mM PIPES pH 6.4、1mMEDTA、50℃或70℃12-16小时,然后洗涤。可以应用其他条件,例如在生物体内可能遇到的生理相关条件。技术人员将能够根据杂交的核苷酸的最终应用确定最适合测试两个序列互补性的条件设置。
互补序列包括包含第一核苷酸序列的多核苷酸区域与包含第二核苷酸序列的多核苷酸区域在一个或全部两个核苷酸序列的长度或部分长度上的碱基配对。此类序列在本文中可被称为彼此“互补”。然而,当第一序列在本文中被称为与第二序列“基本互补”时,这两个序列可以是互补的,或者它们可以在碱基配对区域内包括一个或多个,但通常不超过约5、4、3或2个错配碱基对。对于具有错配碱基对的两个序列,只要这两个核苷酸序列通过碱基配对相互结合,该序列将被视为“基本互补”。
本文使用常规符号来描述核苷酸序列:单链核苷酸序列的左手端是5′端;双链核苷酸序列的左手方向称为5′方向。将核苷酸从5′到3′添加到新生RNA转录物的方向称为转录方向。与mRNA具有相同序列的DNA链称为“编码链”;在与从该DNA转录的mRNA具有相同序列的DNA链上并位于RNA转录物5′端的序列称为“上游序列”;在与RNA具有相同序列的DNA链上并位于编码RNA转录物3′端的序列称为“下游序列”。
在一些实施方案中,双链DNA片段可以是末端抛光的,使得它们适于连接。例如,可以将DNA片段的末端抛光以具有平端。如本领域已知的,这可以用可以填充或去除突出链的酶来实现。另一种方法是在称为“适体”的短合成寡核苷酸存在下进行连接,其制备方式最终将一个末端连接到片段上,并使片段适于与目标多核苷酸连接,如DNA或RNA标签。因此,DNA片段可以连接DNA标签。
在一些实施方案中,RNA片段是通过聚腺苷酸化末端抛光的。RNA片段可以连接RNA标签,例如,在全部两个末端上,通过模板转换逆转录。
“DNA标签”或“DNA标签分子”是包含DNA标识符和UMI的多核苷酸。DNA标签可以是脱氧核糖多核苷酸。“DNA标识符”是分配用于区分gDNA分子和RNA分子的多核苷酸序列。DNA标签可以连接双链DNA片段的5′或3′末端。
“RNA标签”或“RNA标签分子”是包含RNA标识符和UMI的多核苷酸。RNA标签可以是脱氧核糖多核苷酸。“RNA标识符”是分配用于区分cDNA分子和gDNA分子的多核苷酸序列。RNA标签可以进一步包含多聚(T)。或者,RNA标签可以进一步包含模板转换寡核苷酸(TSO)。RNA标签可以用于通过逆转录将5′标签添加到RNA衍生的cDNA片段上。在一些实施方案中,RNA标签可用于通过逆转录中的模板转换将3标签添加到RNA衍生的cDNA上。
两种类型的RNA标签是有帮助的,因为为了从两个方向对单链RNA进行测序,可以使用两种不同的机制来连接RNA特定序列。只需要一种类型的DNA标签,因为DNA标签可以连接双链DNA的两端。
组合物可以包含至少2种上述标签,例如,DNA标签和RNA标签。组合物还可以包含3种上述标签,例如,DNA标签和2种类型的RNA标签。
在一些实施方案中,RNA标签是单链DNA分子并且作为用于逆转录的引物。RNA标签可以使用DNA聚合酶(DNAP)来产生。在此,RNA标签的结合位点是RNA结合位点(例如,mRNA结合位点)并含有与一个或多个RNA中的序列区互补的序列区。在一些实施方案中,结合位点与样品中所有RNA共同的序列区互补,将条形码适体添加到其上。例如,结合位点可以是多聚(T)束,其与真核mRNA的多(A)尾互补。可替代地或另外地,结合位点可以包括随机序列束。将RNA标签添加到与样品相关的RNA后,可以发生逆转录并且可以合成cDNA的第一条链,从而将RNA标识符序列整合入到cDNA的第一条链中。应当认识到逆转录需要合适的条件,例如存在合适的缓冲液和逆转录酶,以及对于将条形码适体与RNA退火和酶活性合适的温度。还将认识到引物的3′端与模板互补并可直接与模板退火时,涉及DNA引物和RNA模板的逆转录是最有效的。因此,可以设计RNA标签,使结合位点出现在适体分子的3′末端。
如上所述,本发明的方法可以使用逆转录酶,在达到模板RNA的5’末端时,将一个或多个非模板的核苷酸(如C)添加到新生cDNA链的末端。这些核苷酸在RNA/DNA双链体的一个末端形成3’DNA突出。如果第二RNA分子含有序列区,例如,在其3’末端与非模板核苷酸互补的多G束,并结合非模板核苷酸,逆转录酶可以转换模板并继续延伸cDNA,现在使用第二RNA分子作为模板。这样的第二RNA分子在本文以及在本领域中被称为模板转化寡核苷酸(TSO)。
在本发明方法的实施方案中,包含RNA标识符、UMI和TSO的第二RNA标签可以作为模板转换寡核苷酸,用于逆转录。因此,在模板转换后,将RNA标识符序列并入cDNA的第一链中,并且存在于从第一链的cDNA扩增(例如,通过PCR)得到的DNA分子中。在这些实施方案中,可以使用具有模板转换活性的任何逆转录酶。第一RNA标签的结合位点是cDNA结合位点并优选出现在适体分子的3’末端。结合位点可以包括G-束(包含一个或多个G核苷酸),或任何其他至少部分与通过逆转录酶产生的3’突出互补的序列。将认识到突出序列并且因此用于条形码适体的结合位点的合适序列,可以取决于该方法中使用的逆转录酶的选择。
用于逆转录和模板转换的方法是本领域公知的。常常称为“SMART”(在RNA转录物5’末端的转换机制)的程序可以产生全长cDNA文库,甚至从单细胞衍生的RNA样品产生。这个策略依赖于莫洛尼鼠白血病病毒(MMLV)逆转录酶的内在特性以及独特的模板转换寡核苷酸(TS寡核苷酸,或TSO)的使用。莫洛尼鼠白血病病毒逆转录酶(M-MLV RT)是RNA依赖性DNA聚合酶,其可用于长信使RNA模板(>5kb)的cDNA合成。该酶是M-MLV pol基因的产物,且由分子量为71kDa的单个亚基组成。在第一链合成过程中,到达RNA模板的5′末端时,MMLV逆转录酶的末端转移酶活性在新合成的cDNA链的3′末端添加将一些额外的核苷酸(主要是脱氧胞苷)。这些碱基充当TS寡核苷酸核苷酸锚定位点。在TS寡核苷酸和突出的脱氧胞苷段之间进行碱基配对后,逆转录酶“转换”模板链,从细胞RNA到TS寡核苷酸,并继续复制到TS寡核苷酸的5′末端。通过这样做,得到的cDNA包含转录物的完整5′末端,并且可以将选择的通用序列添加到逆转录产物中。除了通过寡核苷酸dT引物标记cDNA3′末端外,这种方法还可以以完全独立于序列的方式有效扩增整个全长转录库。
TS寡核苷酸可以是在其3’末端携带3个核糖鸟苷(rGrGrG)的DNA寡核苷酸序列。这些连续的rG碱基与cDNA分子的3′dC延伸之间的互补性允许随后的模板转换。也可以用锁核酸碱基(LNA)替换最3′端的rG,以增强LNA单体的热稳定性,这将有利于碱基配对。
TSO可以包括3’部分,其包含多个鸟苷或与胞嘧啶配对的鸟苷类似物。本文所述的方法中有用的鸟苷或鸟苷类似物的非限制性实例包括,但不限于,脱氧核糖鸟苷、核糖鸟苷、锁核酸-鸟苷和肽核酸-鸟苷。鸟苷可以是核糖核苷或锁核酸单体。
TSO可以包括3’部分,其包括至少2个、至少3个、至少4个、至少5个或2、3、4或5,或2-5个鸟苷,或与胞嘧啶配对的鸟苷类似物。多个鸟苷(或与胞嘧啶碱基配对的鸟苷类似物)的存在允许TSO与cDNA的第一链的3’末端暴露的胞嘧啶瞬时退火。这会导致逆转录酶转换模板并继续合成与TSO互补的链。在本发明的一个方面中,TSO的3′末端可以被封闭,例如通过3′磷酸基团,以防止TSO在cDNA合成过程中作为引物起作用。
在集合标记的cDNA样品前,可以停止cDNA的合成,例如,通过除去或灭活逆转录酶。这防止通过逆转录的cDNA合成在集合的样品中继续。
如本文使用的,“扩增的靶序列”及其衍生,通常是指使用靶特异性引物和本文提供的方法通过靶序列的扩增/扩增靶序列产生的核酸序列。扩增的靶细胞关于靶序列可以是相同义的(第二轮和随后偶数轮扩增中产生的正链)或是反义的(即,在第一轮和随后奇数轮扩增中产生的负链)。出于本公开的目的,扩增的靶序列通常与反应中另一个扩增的靶序列的任何部分的互补性低于50%。
Mullis(美国专利No.4,683,195、4,683,202和4,965,188)的术语“聚合酶链式反应”(“PCR”)是指增加核酸序列混合物中靶序列区段的浓度而没有克隆或纯化的方法。这种用于扩增靶序列的方法由以下步骤组成:将大量过剩的两个寡核苷酸引物引入含有所需靶序列的核酸序列混合物中,接着在聚合酶(例如,DNA聚合酶)的存在下热循环精确的序列。这两个引物与双链靶序列各自的链互补。为了实现扩增,将混合物变性并随后将引物退火至靶分子内的其互补序列。退火后,聚合酶将引物延伸,使得形成新的互补链对。将变性、引物退火和聚合酶延伸的步骤重复多次(即,变性、退火和延伸构成一个“循环”,可以存在很多“循环”),以获得高浓度的所需靶序列的扩增区段。通过引物相对于彼此的相对位置来确定所需靶序列的扩增区段的长度,并且因此,这个长度是可控参数。凭借该过程的重复特征,将该方法称为“聚合酶链式反应”(下文称为“PCR”)。因为所需的靶序列的扩增区段变成混合物中的主要序列(就浓度而言),因此将它们称为“PCR扩增的”。
本文公开的方法可以进一步包括扩增标记的DNA和标记的cDNA,用于用一组基因特异性引物富集。可以用例如SPE引物集合、DNA加强引物和RNA加强引物来实现靶富集。基于扩增子的下一代测序(NGS)试验给予了靶向富集许多优势。例如,QIAseq NGS组使用独特分子索引(UMI)来校正PCR扩增偏差并使用单引物延伸(SPE)技术,其提供设计灵活性和高度特异性靶富集。UMI的概念是在任何扩增之前,每个原始靶分子都被一个独特的条形码序列“标记”。这个DNA序列必须足够长,以提供足够的排列来为每个创建者分子分配独特的条形码。在目前的形式中,12个碱基的随机序列为样品中的每个靶分子提供412或16,777,216个UMI。
如本文使用的,术语“引物”包括天然或合成的寡核苷酸,与多核苷酸模板形成双链体时,其能够作为核酸合成的起始点并从其3′端沿模板延伸,从而形成延伸的双链体。在延伸过程中添加的核苷酸序列由模板多核苷酸的序列决定。通常引物通过DNA聚合酶延伸。引物通常具有3至36个核苷酸、5至24个核苷酸以及14至36个核苷酸范围内的长度。本发明范围内的引物包括正交引物、扩增引物、构建引物等。引物对可以位于目标序列或一组目标序列的侧翼。引物和探针在序列上可以是简并的。本发明范围内的引物与靶序列相邻结合。“引物”可以被认为是一种短的多核苷酸,通常带有游离的3′-OH基团,该基团通过与靶标杂交而与可能存在于目标样品中的靶或模板结合,然后促进与该靶互补的多核苷酸的聚合。本发明的引物由17至30个核苷酸的核苷酸组成。在一些实施方案中,引物是至少17个核苷酸,或可替代地,至少18个核苷酸,或可替代地,至少19个核苷酸,或可替代地,至少20个核苷酸,或可替代地,至少21个核苷酸,或可替代地,至少22个核苷酸,或可替代地,至少23个核苷酸,或可替代地,至少24个核苷酸,或可替代地,至少25个核苷酸,或可替代地,至少26个核苷酸,或可替代地,至少27个核苷酸,或可替代地,至少28个核苷酸,或可替代地,至少29个核苷酸,或可替代地,至少30个核苷酸,或可替代地至少50个核苷酸,或可替代地至少75个核苷酸或可替代地至少100个核苷酸。
如本文使用的,“靶特异性引物”及其衍生,通常是指单链或双链多核苷酸,通常是寡核苷酸,其包括至少一个与包括靶序列的核酸分子的至少一部分至少50%互补,通常至少70%互补或至少85%互补,更常见至少90%互补,更常见至少95%互补,更常见至少98%或至少99%互补,或100%相同的序列。在这样的情况中,将靶特异性引物和靶序列描述为彼此“对应”。在一些实施方案中,靶特异性引物能够预期对应的靶序列的至少一部分(或与靶序列的补体)杂交;这样的杂交可以任选在标准杂交条件下或严格杂交条件下进行。在一些实施方案中,靶特异性引物不能够与靶序列或与其互补序列杂交,但能够与包括靶序列的核酸链的一部分或与其互补序列杂交。在一些实施方案中,靶特异性引物包括至少一个与靶序列自身的至少一部分至少75%互补,通常至少85%互补,更常见至少90%互补,更常见至少95%互补,更常见至少98%互补,或更常见至少99%互补的序列;在其他实施方案中,靶特异性引物包括与靶序列以外的其他核酸分子的至少一部分至少75%互补,通常至少85%互补,更常见至少90%互补,更常见至少95%互补,更常见至少98%互补,或更常见至少99%互补的序列。在一些实施方案中,靶特异性引物与样品中存在的其他靶序列基本上不互补;任选,靶特异性引物与样品中存在的其他核酸分子基本上不互补。在一些实施方案中,样品中存在的不包括或对应于靶序列(或靶序列的补体)的核酸分子被称为“非特异性”序列或“非特异性核酸”。在一些实施方案中,对靶特异性引物进行设计,以包括与其对应的靶序列的至少一部分基本上互补的核苷酸序列。在一些实施方案中,靶特异性引物在其整个长度上与包括其对应的靶序列的核酸分子的至少一部分为至少95%互补,或至少99%互补,或100%相同。在一些实施方案中,靶特异性引物在其整个长度上与其对应的靶序列的至少一部分可以为至少90%,至少95%互补,至少98%互补或至少99%互补,或100%相同。在一些实施方案中,正向靶特异性引物和反向靶特异性引物限定了可以用于通过模板依赖性引物延伸扩增靶序列的靶特异性引物对。通常,靶特异性引物对的每个引物包含至少一条与包括对应的靶序列的核酸分子的至少一部分基本上互补的序列,但该序列与样品中的至少一个其他靶序列低于50%互补。在一些实施方案中,可以在单个扩增反应中使用多个靶特异性引物对来进行扩增,其中每个引物对包括正向靶特异性引物和反向靶特异性引物,每个包括至少一个与样品中对应的靶序列基本上互补或基本上相同的序列,并且每个引物对具有不同的对应靶序列。在一些实施方案中,靶特异性引物可以在其3’末端或其5’末端与扩增反应中存在的任何其他靶特异性引物基本上不互补。在一些实施方案中,靶特异性引物可以包括与扩增反应中的其他靶特异性引物的最小交叉杂交。在一些实施方案中,靶特异性引物包括与扩增反应混合物中的非特异性序列的最小交叉杂交。在一些实施方案中,靶特异性引物可以包括最小自我互补。在一些实施方案中,靶特异性引物可以包括一个或多个位于3’末端的可分裂基团。在一些实施方案中,靶特异性引物可以包括一个或多个位于靶特异性引物的中心核苷酸附近或大致位置的可分裂基团。在一些实施方案中,多个靶特异性引物中的一个仅在靶特异性引物的5’末端包括不可分裂的核苷酸。在一些实施方案中,靶特异性引物与任选在同一扩增反应中的一个或多个不同的靶特异性引物相比,在引物的3’末端或5’末端包括最小核苷酸序列重叠。在一些实施方案中,单个反应混合物中的1、2、3、4、5、6、7、8、9、10或更多个靶特异性引物包括以上实施方案中的一个或多个。在一些实施方案中,单个反应混合物中基本上全部的多个靶特异性引物包括以上实施方案中的一个或多个。
引物设计是基于单引物延伸,其中每个基因组靶通过一个靶特异性引物和一个通用引物来富集——即除去常规两个靶特异性引物设计限制并降低所需引物量的策略。将对于组所需的所有引物集合到单个引物池中,以减少组操作以及对于富集和文库构建所需的池的数量。
加强组是多达100个引物的池,所述引物可以用于加强任何组中的特定引物(编目的、延伸的或定制的)的性能,或用于延伸现有的定制组的内容物。所述引物作为可以掺加(spiked)到现有组中的单个池来递送。
去除未使用的适体后,可以使用适体引物和单个引物池进行有限数量的PCR循环,每个引物都携带基因特异性序列和5′通用序列。在此过程中,每个引物都会从不同的DNA模板中重复采样相同的靶基因座。之后,可以使用通用引物进行额外的PCR循环,以连接完整的适体序列并将文库扩增到所需数量。
与现有的靶向富集方法相比,SPE方法依赖于单末端适体连接,这固有地比需要适体来连接dsDNA片段的两个末端具有高得多的效率。将有更多的DNA分子可用于下游PCR富集步骤。由于不存在来自第二个引物的效率约束,使用一个引物的PCR富集效率也高于常规的双引物方法。在初始PCR循环过程中,引物具有重复的机会将最大量的初始DNA分子转换成扩增子。
所有三个特征都有助于提高捕获样品中稀有突变的效率。此外,扩增子中整合的UMI是估算捕获的DNA分子数量以及很大程度上降低下游分析中的测序错误的关键。单引物延伸还允许发现未知的结构变体,如基因融合体。
将DNA(例如,gDNA)和cDNA的靶向富集样品分成2个分开的样品。第一样品可以使用DNA标签特异性的引物通过聚合酶链式反应(PCR)来扩增,以产生对应于样品中的DNA的DNA文库。第二样品可以使用RNA标签特异性的引物通过PCR来扩增,以产生对应于样品中的RNA的cDNA文库。
实时聚合酶链式反应(实时PCR),也称为定量聚合酶链式反应(qPCR),是一种基于聚合酶链式反应(PCR)的分子生物学实验室技术。它在PCR过程中监测靶向的DNA分子的扩增,即实时监测,而不是像传统PCR那样在其结束时监测。实时PCR可以定量使用(定量实时PCR),也可以半定量使用,即高于/低于一定数量的DNA分子(半定量实时PCR)。其他类型的PCR包括但不限于巢式PCR(用于分析来自同一物种的不同生物体但单个核苷酸可能不同的DNA序列(SNIPS),并确保分析的每个生物体中的目标序列的扩增)和反向PCR(通常用于克隆插入或转座元件侧翼的区域)。
在实时PCR中检测PCR产物的两种常用方法是:(1)插入任何双链DNA的非特异性荧光染料,以及(2)由用荧光报告子标记的寡核苷酸组成的序列特异性DNA探针,所述荧光报告子使得只有在探针与其互补序列杂交后才允许检测。
用于进行PCR的方法和试剂盒是本领域公知的。PCR是其中复制拷贝由靶多核苷酸构成的反应,所述反应使用由上游和下游引物组成的一对引物或一组引物和聚合催化剂,如DNA聚合酶,且通常是热稳定的聚合酶。用于PCR的方法是本领域公知的,并且例如在MacPherson等(1991)PCR 1:A Practical Approach(IRL Press at Oxford UniversityPress)中有教导。
本发明的实施方案提供了2个分开的用于下游灵活操作的文库:通过本文所述的任一种方法产生的基于初始DNA的DNA文库和基于初始RNA的cDNA文库。可以将DNA文库或cDNA文库测序,以提供单细胞或多个单细胞中的基因表达的分析。
可以使用本领域技术人员已知的方法,例如,通过下一代测序(NGS),对扩增的DNA或cDNA文库进行测序和分析。在某些示例性实施方案中,使用本领域已知的任一种测序方法来测定RNA表达特征。可以使用本领域已知的各种测序方法来进行目标核酸序列的序列测定,所述包括但不限于,合成测序(SBS)、杂交测序(SBH)、连接测序(SBL)(Shendure等(2005)Science 309:1728)、定量增量荧光核苷酸添加测序(QIFNAS)、逐步连接和裂解、荧光共振能量转移(FRET)、分子信标、TaqMan报告探针消化、焦磷酸测序、荧光原位测序(FISSEQ)、FISSEQ珠(美国专利No.7,425,431)、摆频(wobble)测序(PCT/US05/27695)、多重测序(美国系列No.12/027,039,2008年2月6日提交;Porreca等(2007)Nat.Methods 4:931),聚合菌落(POLONY)测序(美国专利No.6,432,360、6,485,944和6,511,803,以及PCT/US05/06425);纳米网格滚环测序(ROLONY)(US2009/0018024)、等位基因特异性寡核苷酸连接测定(例如,寡核苷酸连接分析(OLA)、使用连接线性探针和滚环扩增(RCA)读数的单模板分子OLA、连接挂锁探针,和/或使用连接环状挂锁探针和滚环扩增(RCA)读数的单模板分子OLA)等。也可以使用高通量测序方法,例如使用诸如Roche 454、Illumina Solexa、AB-SOLiD、Hel icos、CompleteGenomics、Polonator平台等的平台。多种基于光的测序技术是本领域已知的(Landegren等(1998)Genome Res.8:769-76;Kwok(2000)Pharmacogenomics1:95-100;和Shi(2001)Clin.Chem.47:164-172)。
本发明的实施方案还提供了用于分析多个单细胞中的基因表达的方法,该方法包括使用本文所述的方法制备cDNA文库和对该cDNA文库测序的步骤。“基因”是指含有至少一个开放阅读框(ORF)的多核苷酸,该开放阅读框在转录和翻译后能够编码特定多肽或蛋白质。本文所述的任何多核苷酸序列均可用于识别与其相关的基因的较大片段或全长编码序列。分离较大片段序列的方法是本领域技术人员已知的。
如本文所用,“表达”是指多核苷酸转录成mRNA的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。如果多核苷酸源自基因组DNA,则表达可以包括mRNA在真核细胞中的剪接。
可以通过任何合适的筛选方法对cDNA文库进行测序。特别是,可以使用高通量筛选方法对cDNA文库进行测序,如Applied Biosystems的SOLiD测序技术或Illumina的基因组分析仪。在本发明的一个方面中,可以对cDNA文库进行鸟枪测序。读段数可以是至少10,000、至少100万、至少1000万、至少1亿或至少10亿。在另一个方面中,读数的数量可以是10,000到100,000,或可替代地100,000到100万,或可替代地10万到100万,或可替代地100万到1000万,或可替代地1000万到1亿,或可替代地1亿到10亿。“读段”是通过测序反应获得的一段连续核酸序列。
通过本文公开的方法产生的DNA或gDNA文库可以用于,但不限于,DNA变体检测、拷贝数分析、融合基因检测和结构变体检测。通过本文公开的方法产生的cDNA文库可以用于,但不限于,RNA变体检测、基因表达分析和融合基因检测。基于蛋白质的DNA、DNA和cDNA文库也可以用于配对的蛋白质、DNA和RNA谱分析。
本文所述的表达谱可用于预测医学领域中,其中将诊断测定、预后测定、药物基因组学和监测临床试验用于预后(预测)目的,从而预防性治疗个体。因此,一些实施方案涉及用于确定核酸序列(例如,蛋白质或RNA)的表达谱的诊断测定,以确定个体是否处于发展病症和/或疾病的风险中。此类测定可用于预后或预测目的,从而在病症和/或疾病发作之前预防性治疗个体。因此,在某些示例性实施方案中,提供了使用本文所述的一种或多种表达谱方法来诊断和/或预后一种或多种疾病和/或病症的方法。
一些实施方案涉及在临床试验中监测试剂(例如,被施用以抑制或治疗或预防失调和/或疾病的药物或其他化合物)对核酸序列(例如,蛋白质或RNA)的表达谱的影响。因此,在某些示例性实施方案中,提供了使用本文所述的一种或多种表达谱分析方法在用一种或多种药剂治疗之前、期间和/或之后监测一种或多种疾病和/或失调的方法。
监测药剂(例如,药物化合物)对本发明的标志物的表达水平的影响不仅可以应用于基础药物筛选中,也可以应用于临床试验中。例如,可以在接受针对与表达谱相关的疾病和/或病症治疗的受试者的临床试验中监测药剂影响表达谱的有效性。在某些示例性实施方案中,用于监测用药剂(例如,激动剂、拮抗剂、肽模拟物、蛋白质、肽、核酸、小分子或其他药物候选物)治疗受试者的有效性的方法包括:(i)药剂给药前从受试者获得给药前样品;(ii)检测给药前样品中的一种或多种表达谱;(iii)从受试者获得一个或多个给药后样品;(iv)检测给药后样品中的一种或多种表达谱;(v)将给药前样品中的一种或多种表达谱与给药后样品中的一种或多种表达谱进行比较;(vi)相应地改变对受试者的药剂给药。
本文所述的表达谱分析方法允许对基因表达进行定量。因此,不仅可以确定组织特异性,而且可以确定组织中多种基因的表达水平。因此,可以根据基因组织表达本身以及该组织中的表达水平对基因进行分组。例如,这有助于确定两种或更多种组织之间的基因表达关系。因此,可以扰乱一种组织并且可以确定对第二种组织中的基因表达的影响。在这种情况下,可以确定一种细胞类型响应生物刺激对另一种细胞类型的影响。例如,这种确定有助于了解细胞-细胞相互作用在基因表达水平上的影响。如果治疗性给药药剂以治疗一种细胞类型但对另一种细胞类型具有不良作用,则本发明提供测定法以确定不良作用的分子基础并因此提供共同给药对抗剂或以其他方式治疗不良作用的机会。类似地,即使在单个细胞类型中,也可以在分子水平上确定不良的生物效应。因此,可以确定和抵消药剂对靶基因以外的表达的影响。
在其他实施方案中,可以监测表达谱中的一个或多个核酸序列(例如,基因、mRNA等)表达的时间过程。这可以发生在各种生物学背景中,如本文所公开的,例如疾病和/或病症的发展、疾病和/或病症的进展以及过程,此类与疾病和/或病症相关的细胞改变。
本文所述的表达谱分析方法也可用于确定同一细胞中或不同细胞中一个或多个核酸序列(例如基因、mRNA等)的表达对其他核酸序列(例如,基因、mRNA等)表达的影响。例如,如果无法调控最终的或下游的靶,则这对于用于治疗干预的替代分子靶标提供了选择。
本文所述的表达谱分析方法也可用于确定正常和异常细胞中一种或多种核酸序列(例如,基因、mRNA等)的差异表达模式。这提供了可作为诊断或治疗干预的分子靶的一组核酸序列(例如,基因、mRNA等)。
本文所述的方法可用于检测或测量分析物,诸如但不限于转化研究中的蛋白质生物标志物。此外,能够在同一平台上分析核酸和蛋白质或分析物将大大减少分析时间并提供更多见解。
实施例
实施例1
下面是一个说明性的实例,显示了本文描述的方法可以如何用于蛋白质分析。总共设计了96对探针来检测96种不同的蛋白质靶标。其中四个是用于数据归一化目的的对照。对照1和对照2用于不在测试样品中的外源蛋白质靶标。所有寡核苷酸的5′末端都与它们各自的抗体缀合。对照3是延伸对照,其中寡核苷酸A和寡核苷酸B都与同一抗体缀合,因此延伸与抗原结合无关。对照4是用于监测PCR扩增变化的检测对照,其中将完整的全长寡核苷酸直接掺入反应中。
实施例2
样品:
1.人血清样品
2.人血清样品+掺入5ng/ml的蛋白质靶标#1和#2
3.PBS(阴性对照)
抗体结合:
Figure BDA0003156074220000351
在4℃孵育过夜(16hr)。
延伸:
Figure BDA0003156074220000361
在带有加热盖的热循环仪中孵育50℃20min→95℃5min→17个循环(95℃30sec→54℃1min→60℃1min)→4℃保持。
文库扩增:
Figure BDA0003156074220000362
在带有加热盖的热循环仪中孵育95℃13分钟→98℃2分钟→20个循环(98℃15秒→60℃2分钟)→72℃5分钟→4℃保持。
纯化:向来自前一步骤的25uL样品中的每一个中添加75uL冰冷的水以使得总共100uL。进行1轮1.2x Ampure XP珠纯化(在20uL水中洗脱)。
使用Agilent生物分析仪高灵敏度DNA芯片进行文库定量:将纯化的文库稀释至2ng/uL。在生物分析仪上上样1uL此稀释样品。基于生物分析仪的电泳图获得文库的摩尔浓度。文库已准备好进行测序。
实施例3
起始材料:纯化的基因组DNA和总RNA。例如,从THP-1细胞系纯化50ng gDNA和50ng总RNA。理想情况下,gDNA和RNA的相对量应当代表样品中的含量。
DNA/RNA片段化:
Figure BDA0003156074220000371
RNA多聚腺苷酸化
Figure BDA0003156074220000372
Figure BDA0003156074220000381
DNA连接:
Figure BDA0003156074220000382
纯化:将50uL冰冷的水加入50uL来自前一步的样品中,使得总共100uL。进行2轮1.2×Ampure XP珠纯化,遵循制造商手册但有以下例外:第一轮在52uL水中洗脱;且第二轮在13uL水中洗脱。
逆转录:
Figure BDA0003156074220000383
Figure BDA0003156074220000391
纯化:将75uL冰冷的水加入25uL来自前一步骤的样品中,使得总共100uL。按照制造商的手册进行1轮1.2×Ampure XP珠纯化,并在16.8uL水中洗脱。
靶富集:
Figure BDA0003156074220000392
纯化:将60uL冰冷的水加入40uL来自前一步骤的样品中,使得总共100uL。按照制造商的手册使用Ampure XP珠进行双倍尺寸选择0.5x/0.5x,并在22uL水中洗脱。
qPCR(实时)来确定最终扩增循环:
Figure BDA0003156074220000401
通用PCR:
Figure BDA0003156074220000402
Figure BDA0003156074220000411
纯化:将75uL冰冷的水加入每个25uL来自前一步骤的样品中,使得总共100uL。按照制造商的手册进行1轮1.2×Ampure XP珠纯化,并在20uL水中洗脱。
使用Agilent生物分析仪高灵敏度DNA芯片的文库定量:将纯化的文库稀释至2ng/uL。在生物分析仪上加载1uL此稀释样品。基于生物分析仪的电泳图获得文库的摩尔浓度。文库已准备好进行测序。
按照工作流程,使用50ng gDNA和50ng总RNA输入,我们获得了675ng DNA文库和455ng RNA文库。为了比较的目的,还将相同量的50ng总RNA用于来自QIAGEN的QIAseqTargeted RNAscan Panels系统。为了比较的目的,还将相同量的50ng gDNA用于来自QIAGEN的QIAseq Targeted DNA Panels系统。然后将样品放在Illumina的MiSeq机器上进行测序。
结果:如表1所示,与独立的RNA文库制备工作流程(来自QIAGEN的QIASeqTargeted RNAscan Panels系统)相比,我们的方法对第一链cDNA实现了约24%的富集效率,以及第二链cDNA的约40%的富集效率。由于RNAscan工作流程的链偏向于第一链,因此我们的方法具有较少的偏向性并改善了链平衡。富集效率对RNA分析的影响值得进一步的探索。
表1.
Figure BDA0003156074220000421
RNA样品的每个SPE引物的UMI:基于它们检测到的RNA链将引物分成两组。如表2所示,与独立的DNA文库制备工作流程(来自QIAGEN的QIASeq Targeted DNA Panels系统)相比,我们的方法实现了略高的富集效率。这两种方法具有相当的测序特异性和一致性。
表2.
Figure BDA0003156074220000422
两种方法中DNA样品的测序规格:通过T50测量了序列覆盖均匀性,T50是目标区域底部50%捕获的总序列通量的百分比。在完美均匀的场景中,T50值等于50。
还评估了DNA和RNA之间的串扰,因为它们保持在同一反应中。使用来自THP-1细胞系的相同50ng的DNA和RNA,从RNA到DNA的有效泄漏信号仅为真实DNA信号的0.75%,这是通过检测RNA和DNA的引物的总UMI测量的。在这种情况下,只有极高表达的基因可能会对相应的DNA拷贝数分析产生影响。然而,如果DNA拷贝数分析仅限于内含子区,这种影响应该会消失。通过相同的测量,从DNA到RNA的有效泄漏信号平均约为3%。由于大多数情况下每个细胞中只有几个基因组DNA的拷贝,这种泄漏只会影响那些极低表达的基因(每个细胞少于0.1个拷贝),这可能低于背景噪音水平。总之,我们的方法证明了DNA和RNA样本之间的最小串扰,这在实际情况中可能没有任何显著影响。
通过我们的方法制备的DNA文库可用于DNA变体检测和拷贝数分析。我们的方法制备的RNA文库适用于基因表达分析、融合基因检测和RNA变体检测。可以基于我们提出的方法开发多模式NGS组,用于生物标志物筛选或靶向eQTL分析。
用于连接的适体:
Figure BDA0003156074220000431
逆转录寡核苷酸:
Figure BDA0003156074220000432
Figure BDA0003156074220000441
靶富集寡核苷酸:
Figure BDA0003156074220000442
uPCR引物:
Figure BDA0003156074220000443
SPE引物池(以下寡核苷酸的等摩尔混合物):
SEQ ID NO:11:
AATGTACAGTATTGCGTTTTGAGCCCCAAGTCCTATGAGAACCTCTG
SEQ ID NO:12:
AATGTACAGTATTGCGTTTTGTGGCACCAGCGATCAGGTCCTTTAT
SEQ ID NO:13:
AATGTACAGTATTGCGTTTTGCTGAGTGGAGTCACAGCGGAGATAGT
SEQ ID NO:14:
AATGTACAGTATTGCGTTTTGTGTTCCACCAGTAACAACAGTTGAATGTCC
SEQ ID NO:15:
AATGTACAGTATTGCGTTTTGGTGTGAGGAACATACTAGTGCTTTGCAAGT
SEQ ID NO:16:
AATGTACAGTATTGCGTTTTGTTCAAAGTTGGGTCTGCTTCAGTCCAAAG
SEQ ID NO:17:
AATGTACAGTATTGCGTTTTGCCCCCAGCTTCTTCTCTCTGCACTAAG
SEQ ID NO:18:
AATGTACAGTATTGCGTTTTGGCCTTCCCAACATGCATTCTAACTTCTTCC
SEQ ID NO:19:
AATGTACAGTATTGCGTTTTGCCAGCTACTCTCAAAATCAGCATCCTTTGG
SEQ ID NO:20:
AATGTACAGTATTGCGTTTTGCCAGTCCTTCTGTGAGTCTATCCTCAGTTC
SEQ ID NO:21:
AATGTACAGTATTGCGTTTTGAGAGCGAACCAAGAATGCCTGTTTACAG
SEQ ID NO:22:
AATGTACAGTATTGCGTTTTGGAGAGGCACGAGAACACACATCTATTCTG
SEQ ID NO:23:
AATGTACAGTATTGCGTTTTGTTCTCTTCAGAAGTTCCTTCGTCATCCTT
SEQ ID NO:24:
AATGTACAGTATTGCGTTTTGTGATGACATGCCCCATCACTAAAACAC
SEQ ID NO:25:
AATGTACAGTATTGCGTTTTGTGATAGAGACATGATGTAACCGTGGGAATTTCTTC
SEQ ID NO:26:
AATGTACAGTATTGCGTTTTGCGTTCTAAGAGAGTGACAGAAAGGTAAAGAGGAG
SEQ ID NO:27:
AATGTACAGTATTGCGTTTTGATCACAAAGTATCTTTTTCTGTGGCTTAGAAATCTT
SEQ ID NO:28:
AATGTACAGTATTGCGTTTTGTCAAATGTTAGCTCATTTTTGTTAATGGTGGCTTTT
SEQ ID NO:29:
AATGTACAGTATTGCGTTTTGTGTCACATTATAAAGATTCAGGCAATGTTTGTTAGT
SEQ ID NO:30:
AATGTACAGTATTGCGTTTTGAGTTTGTATGCAACATTTCTAAAGTTACCTACTTGT
SEQ ID NO:31:
AATGTACAGTATTGCGTTTTGAAAATCTGTTTTCCAATAAATTCTCAGATCCAGGAA
SEQ ID NO:32:
AATGTACAGTATTGCGTTTTGCGACCCAGTTACCATAGCAATTTAGTGAAATAACTA
SEQ ID NO:33:
AATGTACAGTATTGCGTTTTGAGAGGCGCTATGTGTATTATTATAGCTACCTGTTAA
SEQ ID NO:34:
AATGTACAGTATTGCGTTTTGCGTTTTTGACAGTTTGACAGTTAAAGGCATTTCC
SEQ ID NO:35:
AATGTACAGTATTGCGTTTTGCTGTCCTTATTTTGGATATTTCTCCCAATGAAAGTA
SEQ ID NO:36:
AATGTACAGTATTGCGTTTTGGACTTTTTGCAAATGTTTAACATAGGTGACAGATTT
SEQ ID NO:37:
AATGTACAGTATTGCGTTTTGAAGTAGAAAATGGAAGTCTATGTGATCAAGAAATCG
SEQ ID NO:38:
AATGTACAGTATTGCGTTTTGGGCCTCTTAAAGATCATGTTTGTTACAGTGCTTA
SEQ ID NO:39:
AATGTACAGTATTGCGTTTTGACAAGATTGGTCAGGAAAAGAGAATTGTTCCTATAA
SEQ ID NO:40:
AATGTACAGTATTGCGTTTTGAGACCCTGTCTCAAAAGTAAAAAGTAAGTTAACATG
SEQ ID NO:41:
AATGTACAGTATTGCGTTTTGTCAGTGTCTTCCAAATCCTTATGTATAGCAGCAAT
SEQ ID NO:42:
AATGTACAGTATTGCGTTTTGAGGGTCGAGGAAGCCAGTTTACATCAA
SEQ ID NO:43:
AATGTACAGTATTGCGTTTTGAACAAAAAGATATTTTCAATATTTCTGCGCAGGTTT
SEQ ID NO:44:
AATGTACAGTATTGCGTTTTGGTCTCGACTTGAATTGCAAAAAGATGTTAGAAAAGC
SEQ ID NO:45:
AATGTACAGTATTGCGTTTTGAAAATGTTGGCAGTCATAACATTTGAAACTAATGGA
SEQ ID NO:46:
AATGTACAGTATTGCGTTTTGAGCCTCAAACAGGTTGGTTTTAAATTTGAAGTCT
SEQ ID NO:47:
AATGTACAGTATTGCGTTTTGCCTCTGTGTGTATGTTTTAACTACAAAGCGAAACA
SEQ ID NO:48:
AATGTACAGTATTGCGTTTTGGATTCACCTGGTAATGAGGAAAACAGCTTTAAAATC
SEQ ID NO:49:
AATGTACAGTATTGCGTTTTGAGATCTGCTGAAAAGAAATTTGTTAAAGCACAATT
SEQ ID NO:50:
AATGTACAGTATTGCGTTTTGCGGCATCCCCTACATCGAGACCTC
SEQ ID NO:51:
AATGTACAGTATTGCGTTTTGCAGGGAGCAGATCAAACGGGTGAAG
SEQ ID NO:52:
AATGTACAGTATTGCGTTTTGCAAGTCTTTTGAGGACATCCACCAGTACAG
SEQ ID NO:53
AATGTACAGTATTGCGTTTTGACGTGCCTGTTGGACATCCTGGATA
SEQ ID NO:54:
AATGTACAGTATTGCGTTTTGCCTGTACTGGTGGATGTCCTCAAAAGACT
SEQ ID NO:55:
AATGTACAGTATTGCGTTTTGCCCTGAGGAGCGATGACGGAATATAAGC
SEQ ID NO:56:
AATGTACAGTATTGCGTTTTGGTCGTATTCGTCCACAAAATGGTTCTGGATC
SEQ ID NO:57:
AATGTACAGTATTGCGTTTTGTGACTGGCAATTGTGTCAACAGGTGAAAA
SEQ ID NO:58:
AATGTACAGTATTGCGTTTTGCGCCAGCTGGAGTTTGGTCATGTTT
SEQ ID NO:59:
AATGTACAGTATTGCGTTTTGAATCCCTCTCATCACAATTTCATTCCACAATAGTTT
SEQ ID NO:60:
AATGTACAGTATTGCGTTTTGTCAACAACAAAGAGAATCATGAAATCAACCCTAGC
SEQ ID NO:61:
AATGTACAGTATTGCGTTTTGGATATGGAGCCAGCGTGTTCCGATT
SEQ ID NO:62:
AATGTACAGTATTGCGTTTTGGGCGCGGAAAGTCCTCACTCTC
SEQ ID NO:63:
AATGTACAGTATTGCGTTTTGTATGGTGAGGTTCGGCGTGTTTAAACG
SEQ ID NO:64:
AATGTACAGTATTGCGTTTTGTGGTGACAAAGTTAGAAGGGTCCATGG
SEQ ID NO:65:
AATGTACAGTATTGCGTTTTGCTTCTTTACCACCCCAGATACGACGACTA
SEQ ID NO:66:
AATGTACAGTATTGCGTTTTGCGCTCGTGGTGGTAGTCGTCGTAT
SEQ ID NO:67:
AATGTACAGTATTGCGTTTTGCCAGGAGGCCCTTTCTGTTTACAACC
SEQ ID NO:68:
AATGTACAGTATTGCGTTTTGCCCACAAGCCCAAAATATTCTACTCACTTTGC
SEQ ID NO:69:
AATGTACAGTATTGCGTTTTGATCGCCTGCATCAAGGAAAAGGTAATGG
SEQ ID NO:70:
AATGTACAGTATTGCGTTTTGCGCGTAAGGATAGCAACTGAGGTTATCAC
SEQ ID NO:71:
AATGTACAGTATTGCGTTTTGCGACCTGACGTAACCCCTTGCTTATC
SEQ ID NO:72:
AATGTACAGTATTGCGTTTTGGGAAATGCTCTCACGTAGTCTCTCATGTCT
SEQ ID NO:73:
AATGTACAGTATTGCGTTTTGGTCATAACCCGAAGAACAATGTTGCCACTA
SEQ ID NO:74:
AATGTACAGTATTGCGTTTTGGTCAGCTCAGGATAAAGCACGGATGGATA
SEQ ID NO:75:
AATGTACAGTATTGCGTTTTGCTCAGGATAAAAGCTTCCTTCTTAACAAGTTTTTCC
SEQ ID NO:76:
AATGTACAGTATTGCGTTTTGAGAGATTGTTCCCTTGCATTGACCTCTTTTTC
SEQ ID NO:77:
AATGTACAGTATTGCGTTTTGCCCCTCACCTTTGGAATTTACAGTCTGAA
SEQ ID NO:78:
AATGTACAGTATTGCGTTTTGTAGGTTCTTCAGGTCTCTACACTCTCCTTTAAACT
SEQ ID NO:79:
AATGTACAGTATTGCGTTTTGGAGAAGGAGTGCAATGCCAAGATTATGATCC
SEQ ID NO:80:
AATGTACAGTATTGCGTTTTGGACGTTCTCCATTGTATTGGCAGTAACCA
SEQ ID NO:81:
AATGTACAGTATTGCGTTTTGCACATCTCACAGGCTCTAAAGGAATTCTATATCCTA
SEQ ID NO:82:
AATGTACAGTATTGCGTTTTGGAGGCAAGAGGTGAGTAGTACCAATACTGTC
SEQ ID NO:83:
AATGTACAGTATTGCGTTTTGGAGCCCCTCCGCTTACTTGTAATCTG
SEQ ID NO:84:
AATGTACAGTATTGCGTTTTGCCAGTAAAACGTATTGAGAAAAAGGTAAAAGCGTTA
SEQ ID NO:85:
AATGTACAGTATTGCGTTTTGGCTCAGAATAAATCGTAACAATCTCAAAGTGCATTT
SEQ ID NO:86:
AATGTACAGTATTGCGTTTTGTGAGGTGTCCACAGGGCTCAATCTTTAC
SEQ ID NO:87:
AATGTACAGTATTGCGTTTTGCCCCTTGTATCAGTAAAGGCTATATAATACCGAATT
SEQ ID NO:88:
AATGTACAGTATTGCGTTTTGTCATGAAGAGAGTATCATCAGCTCGTTCATCATC
SEQ ID NO:89:
AATGTACAGTATTGCGTTTTGTGTCCTTTCTGCCGATGTGAAATTAAAGGTAC
SEQ ID NO:90:
AATGTACAGTATTGCGTTTTGTCGCCCCAAATAATTTCCTGCGAACA
SEQ ID NO:91:
AATGTACAGTATTGCGTTTTGCTCATACCTCCATTCCAAGCTTTCATTGTCTC
SEQ ID NO:92:
AATGTACAGTATTGCGTTTTGCCTGCCCTTATTTTTAACAGCAGGAACGAAT
SEQ ID NO:93:
AATGTACAGTATTGCGTTTTGTCGATAGCGAAAGTCCTCTTTGGTCAG
SEQ ID NO:94:
AATGTACAGTATTGCGTTTTGGTTAAAGACCAACCACTAACTAAGAGACTTTCCAAG
SEQ ID NO:95:
AATGTACAGTATTGCGTTTTGAAACCTCTTCCAGTACCTTCTTCATGGTTCT
SEQ ID NO:96:
AATGTACAGTATTGCGTTTTGTTTCCAGGTGATGTGCTCTATGAACTCCTT
SEQ ID NO:97:
AATGTACAGTATTGCGTTTTGGGAGCGGTGCAACAGTTCAATGGT
SEQ ID NO:98:
AATGTACAGTATTGCGTTTTGCATCCGTGGATAATGTGCACCATAACC
SEQ ID NO:99:
AATGTACAGTATTGCGTTTTGTCGGAGAGCCTGGACTGTTTGAAATC
SEQ ID NO:100:
AATGTACAGTATTGCGTTTTGAAGCCAGGTCTTCCCGATGAGAGAG
SEQ ID NO:101:
AATGTACAGTATTGCGTTTTGGGCACTCCGTGGATTTCAAACAGTC
SEQ ID NO:102:
AATGTACAGTATTGCGTTTTGCAGATATCTGCTGCCCTTTTACCTTATGGTTT
SEQ ID NO:103:
AATGTACAGTATTGCGTTTTGTGTAGACTGCTTTGGGATTACGTCTATCAGTTG
SEQ ID NO:104:
AATGTACAGTATTGCGTTTTGGGAAAGGAGAAAAAGGAAGTGCTACCTGAAC
SEQ ID NO:105:
AATGTACAGTATTGCGTTTTGTTTTTCTCCCTTCCTCCTTTGAACAAACAG
SEQ ID NO:106:
AATGTACAGTATTGCGTTTTGACAGCTTTAGGAAAATGGAATCTCTTACCTCCTC
SEQ ID NO:107:
AATGTACAGTATTGCGTTTTGGGGTGTTATGGTCGCGTTGGATTTCTG
SEQ ID NO:108:
AATGTACAGTATTGCGTTTTGGCTACGGCGTGCAACTCACAGAAC
SEQ ID NO:109:
AATGTACAGTATTGCGTTTTGACCGACCTCTTCCAGCGCTACTT
SEQ ID NO:110:
AATGTACAGTATTGCGTTTTGCGGGCAGGGCTTACTTACCTTGG
SEQ ID NO:111:
AATGTACAGTATTGCGTTTTGTAGCTACTGCCTGCCTTCGAAGAACGAT
SEQ ID NO:112:
AATGTACAGTATTGCGTTTTGTGTGGGTGGAAAAAGATGTGGTTAAGAAACAAC
SEQ ID NO:113:
AATGTACAGTATTGCGTTTTGCCCCCATATAGCTTAATCTGATGGGCATC
SEQ ID NO:114:
AATGTACAGTATTGCGTTTTGGAAAGAGCATCAGGAACAAGCCTTGAGTAC
SEQ ID NO:115:
AATGTACAGTATTGCGTTTTGTTGAGATGCCTGACAACCTTTACACCTTTG
SEQ ID NO:116:
AATGTACAGTATTGCGTTTTGCTCTAGGGCTGAGGGAATATGCATCTCT
SEQ ID NO:117:
AATGTACAGTATTGCGTTTTGCGTACCCAGAAGACAATGGCCTAGCTAT
SEQ ID NO:118:
AATGTACAGTATTGCGTTTTGGGGCAGCACAGATTCCCTTAACCA
SEQ ID NO:119:
AATGTACAGTATTGCGTTTTGCCATACCTTGGCTATCCCCTGAAAGTTG
SEQ ID NO:120:
AATGTACAGTATTGCGTTTTGGCCCTGATGCTCATGGAGTGTTCCT
SEQ ID NO:121:
AATGTACAGTATTGCGTTTTGCCTGGTGGTTGGGAGACGACTAC
SEQ ID NO:122:
AATGTACAGTATTGCGTTTTGTGCTGACAGGACACAGAACAAGATACCT
SEQ ID NO:123:
AATGTACAGTATTGCGTTTTGGGTACAGGTATCTTGTTCTGTGTCCTGTCAG
SEQ ID NO:124:
AATGTACAGTATTGCGTTTTGGAGTCCCGGGCTCGATTCACAG
SEQ ID NO:125:
AATGTACAGTATTGCGTTTTGCTGGTCAGAGAGGTGTGTACTGATTGTCT
SEQ ID NO:126:
AATGTACAGTATTGCGTTTTGAGGAAAGATCAATTACATTCACAAGTTCACACTTCT
SEQ ID NO:127:
AATGTACAGTATTGCGTTTTGCTGCACAGTTCAGAGGATATTTAAGCTCAATGAC
SEQ ID NO:128:
AATGTACAGTATTGCGTTTTGCACAGACCGTCATGCATTTCTGACACTC
SEQ ID NO:129:
AATGTACAGTATTGCGTTTTGAGGCTGGTACCTGCTCTTCTTCAATC
SEQ ID NO:130:
AATGTACAGTATTGCGTTTTGCGAAATCAAACAGTTGTCTATCAGAGCCTGTC
SEQ ID NO:131:
AATGTACAGTATTGCGTTTTGACAAAAGAAAAGAAGTCATGTCTGTATGTGGAAA
SEQ ID NO:132:
AATGTACAGTATTGCGTTTTGTCCAGGATAATACACATCACAGTAAATAACACTCTG
SEQ ID NO:133:
AATGTACAGTATTGCGTTTTGCATCCTCTTTGTCATCAAGCTACAGTCTTTTTGA
SEQ ID NO:134:
AATGTACAGTATTGCGTTTTGCTCCCATTTTTGTGCATCTTTGTTGCTGTC
SEQ ID NO:135:
AATGTACAGTATTGCGTTTTGCAGAACTGCCTATTCCTAACTGACTCATCATTTC
SEQ ID NO:136:
AATGTACAGTATTGCGTTTTGGAATTCTGTTTCATCGCTGAGTGACACTCTTTT
SEQ ID NO:137:
AATGTACAGTATTGCGTTTTGTTTTTACCTTTGCTTTTACCTTTTTGTACTTGTGAC
SEQ ID NO:138:
AATGTACAGTATTGCGTTTTGAGAAGGAGTCTGGAATAGAAAGGCTAACAGAA
SEQ ID NO:139:
AATGTACAGTATTGCGTTTTGCACAAGATGTGCCAAGGGAATTGTATGC
SEQ ID NO:140:
AATGTACAGTATTGCGTTTTGAAGAGTCAATAGGTCAGAGAGTTTTATGTTCTTCCA
SEQ ID NO:141:
AATGTACAGTATTGCGTTTTGACTGATCTTCTCAAAGTCGTCATCCTTCAGT
SEQ ID NO:142:
AATGTACAGTATTGCGTTTTGACCCTGAGAAATAATCCAATTACCTGTTAATCAAGG
SEQ ID NO:143:
AATGTACAGTATTGCGTTTTGAAAAGGTATTGAGTAAAATCAGTCTTCCTTCTACCC
SEQ ID NO:144:
AATGTACAGTATTGCGTTTTGCCTTCCTCCCTCTTTCTTTCATAAAACCTCTCTT
SEQ ID NO:145:
AATGTACAGTATTGCGTTTTGGCCAGAGCCACCCAACTCTTAAGG
SEQ ID NO:146:
AATGTACAGTATTGCGTTTTGTGGAAGAGGAATTTAATAACGAACGTTTTAAGAGGA
SEQ ID NO:147:
AATGTACAGTATTGCGTTTTGGCATCTACTGCCGAGGATGTTCCAAG
SEQ ID NO:148:
AATGTACAGTATTGCGTTTTGCACAGTGAGCTCAAGTGCGACATCA
SEQ ID NO:149:
AATGTACAGTATTGCGTTTTGCCGACTGGCCATCTCCTCGTAG
SEQ ID NO:150:
AATGTACAGTATTGCGTTTTGGTACCAGCGCGACTACGAGGAGAT
SEQ ID NO:151:
AATGTACAGTATTGCGTTTTGTCTTTTCTGTCAAATGGAGATGATCTCTTCTGACTC
SEQ ID NO:152:
AATGTACAGTATTGCGTTTTGGGGAGCCCATCATCTGCAAAAACATCC
SEQ ID NO:153:
AATGTACAGTATTGCGTTTTGAAGCTGAAGAAGATGTGGAAAAGTCCCAATG
SEQ ID NO:154:
AATGTACAGTATTGCGTTTTGGCGTGGGATGTTTTTGCAGATGATGG
SEQ ID NO:155:
AATGTACAGTATTGCGTTTTGCGACGCTGAGGACGCTATGGATG
SEQ ID NO:156:
AATGTACAGTATTGCGTTTTGGCTGAGGCGCGTCTTCGAGAAG
SEQ ID NO:157:
AATGTACAGTATTGCGTTTTGGCGCTTGTCGTGAAAGCGAACGA
SEQ ID NO:158:
AATGTACAGTATTGCGTTTTGGCTGCCCGCCCAGTTGTTACT
SEQ ID NO:159:
AATGTACAGTATTGCGTTTTGAGACTCTGGACTGATGAAGCAATTCTGAGT
SEQ ID NO:160:
AATGTACAGTATTGCGTTTTGTCACCGGTGACACCTTAAAACCAAAGC
SEQ ID NO:161:
AATGTACAGTATTGCGTTTTGGGCTCCTTTGTACCTCCTCCATCTTGATC
SEQ ID NO:162:
AATGTACAGTATTGCGTTTTGGTCAGTTGTCTAACAATAACAAAGATCTGCTCTTGG
SEQ ID NO:163:
AATGTACAGTATTGCGTTTTGGGTGGGCAGCAAGAAAAAGTCCAGTAAA
SEQ ID NO:164:
AATGTACAGTATTGCGTTTTGGCCAAGGCTTTCTCTGGCATGATCTTTT
SEQ ID NO:165:
AATGTACAGTATTGCGTTTTGGGATAACTTTCTCAGCATTTCCACCAGTTTCAAG
SEQ ID NO:166:
AATGTACAGTATTGCGTTTTGTGTCCCTAAGTTGAGTAAAATGATAGAGAATGAGTC
SEQ ID NO:167:
AATGTACAGTATTGCGTTTTGGCTGCCAGAAATCCAGCATCCAAAATTTG
SEQ ID NO:168:
AATGTACAGTATTGCGTTTTGGTCGCTTTCTTTTCTTAGTGCCAGGAAACT
SEQ ID NO:169:
AATGTACAGTATTGCGTTTTGACAGTCGAGACGATTCATGAGGGAACTTC
SEQ ID NO:170:
AATGTACAGTATTGCGTTTTGGGAAAGCTCGGCGTGTTGGATAAGAAG
SEQ ID NO:171:
AATGTACAGTATTGCGTTTTGACGCCACAAGTGACTGAAAGTTGGAAG
SEQ ID NO:172:
AATGTACAGTATTGCGTTTTGTGATGGGCTGGAGATTTGGCATAGTTTTC
SEQ ID NO:173:
AATGTACAGTATTGCGTTTTGCTATGCACCCACTTTCAACACAGTTAGGT
SEQ ID NO:174:
AATGTACAGTATTGCGTTTTGGCTTGGTCAGAAGTGCTGTTGTTGTC
SEQ ID NO:175:
AATGTACAGTATTGCGTTTTGCGTGGGCCAGAAAGTTGTCCACAATG
SEQ ID NO:176:
AATGTACAGTATTGCGTTTTGGGGATATGGATTCTCGTGGTAGAAGGTGTAA
SEQ ID NO:177:
AATGTACAGTATTGCGTTTTGCTAATCACCAAGTTCCAAGTGTTCAGAATCTCC
SEQ ID NO:178:
AATGTACAGTATTGCGTTTTGACCGTAATAACCAAGGTTCATCATAGGCATTGAT
SEQ ID NO:179:
AATGTACAGTATTGCGTTTTGTCCCAGTGGAAGTTACTATGCACCCTAT
SEQ ID NO:180:
AATGTACAGTATTGCGTTTTGTGCTTATGCTTGTGTTTGTGTTTCCTCTTATGG
SEQ ID NO:181:
AATGTACAGTATTGCGTTTTGGCTTCTGTTTCTCCTTATGCTTGTTCTTCTCAC
SEQ ID NO:182:
AATGTACAGTATTGCGTTTTGCCTGAGTGGTCTTTTTGCAGGCAAAG
SEQ ID NO:183:
AATGTACAGTATTGCGTTTTGCCGGCCACAAAGCTTCTAAGAACAAC
SEQ ID NO:184:
AATGTACAGTATTGCGTTTTGGCGGTTCATCTTGAAGGCTTGGATGT
SEQ ID NO:185:
AATGTACAGTATTGCGTTTTGTTCAGTGAAATGAACCCTTCGAATGACAAG
SEQ ID NO:186:
AATGTACAGTATTGCGTTTTGCTCCTCCTCCTCTTTGCGTTTCTTGTC
SEQ ID NO:187:
AATGTACAGTATTGCGTTTTGGCAGCAGAGAAACAAATGAAGGACAAACAG
SEQ ID NO:188:
AATGTACAGTATTGCGTTTTGTAAGGAGGAGGAAGAAGACAAGAAACGCAAA
SEQ ID NO:189:
AATGTACAGTATTGCGTTTTGTAAGGCAGGTCTGTGAGCACAAAATTTGG
SEQ ID NO:190:
AATGTACAGTATTGCGTTTTGTGGAGCTGACCAGTGACAATGACC
SEQ ID NO:191:
AATGTACAGTATTGCGTTTTGGGCCAAGAAGTCGGTGGACAAGAAC
SEQ ID NO:192:
AATGTACAGTATTGCGTTTTGGCGCAGGCGGTCATTGTCACTG
SEQ ID NO:193:
AATGTACAGTATTGCGTTTTGTTGCTGTTCTTGTCCACCGACTTCTTG
SEQ ID NO:194:
AATGTACAGTATTGCGTTTTGGCAGTGCGCGATCTGGAACTG
SEQ ID NO:195:
AATGTACAGTATTGCGTTTTGCGGCGGCGACTTTGACTACCC
SEQ ID NO:196:
AATGTACAGTATTGCGTTTTGGAGCACGAGACGTCCATCGACATC
SEQ ID NO:197:
AATGTACAGTATTGCGTTTTGCGGCCAGGAACTCGTCGTTGAA
SEQ ID NO:198:
AATGTACAGTATTGCGTTTTGGCCATGCCGGGAGAACTCTAACTC
SEQ ID NO:199:
AATGTACAGTATTGCGTTTTGTGTAACCCTCCTAAGTGTTCATACGTTGTCTTG
SEQ ID NO:200:
AATGTACAGTATTGCGTTTTGGTCTTGGTCTCTGTTATATCTTGAGTCTAGAACAGT
SEQ ID NO:201:
AATGTACAGTATTGCGTTTTGCAGGAGAACATGGAGGCGAGAAGAAAAT
SEQ ID NO:202:
AATGTACAGTATTGCGTTTTGGGGAAAGATTGGATGCCGGGAATCAAC
SEQ ID NO:203:
AATGTACAGTATTGCGTTTTGCGGAGGCTTGATTAGGTAGGAGGTG
SEQ ID NO:204:
AATGTACAGTATTGCGTTTTGGCGGCAGCTCAACGAGAATAAACA
SEQ ID NO:205:
AATGTACAGTATTGCGTTTTGGCCCGCATCCTTACTCCGCTTATC
SEQ ID NO:206:
AATGTACAGTATTGCGTTTTGGCTGGTTTCAAGGTAAGTGGACTCTTCC
SEQ ID NO:207:
AATGTACAGTATTGCGTTTTGGGGAATGACTGACGGAGAATCCCAAC
SEQ ID NO:208:
AATGTACAGTATTGCGTTTTGCTAAGACCGAGAGCCTGTAGGAGCTTT
SEQ ID NO:209:
AATGTACAGTATTGCGTTTTGGCCGGGCTTGTCTGGTCATCT
SEQ ID NO:210:
AATGTACAGTATTGCGTTTTGCAGCTCACCTCCAAAAAGGCAAAATTCTTG
SEQ ID NO:211:
AATGTACAGTATTGCGTTTTGGCAGGAGGCCATGATGGATTTCTTCAA
SEQ ID NO:212:
AATGTACAGTATTGCGTTTTGCATGAGTGAAAGGAAAGAGGAAATCCCAATCC
SEQ ID NO:213:
AATGTACAGTATTGCGTTTTGCCTATCTTCCACAGTACTTACACAACTTCCTAAGC
SEQ ID NO:214:
AATGTACAGTATTGCGTTTTGCTCGCCGTAGACTGTCCAGGTTTT
SEQ ID NO:215:
AATGTACAGTATTGCGTTTTGCTCACCTGATCCGTGACGTTGATGTC
SEQ ID NO:216:
AATGTACAGTATTGCGTTTTGGCCCTGATGGACTCTCGGCTACT
SEQ ID NO:217:
AATGTACAGTATTGCGTTTTGGAGAAAGATCAGGAACACTTGTCCCCTACTAG
SEQ ID NO:218:
AATGTACAGTATTGCGTTTTGGTCCTCCACGATCTCCTCATACTCCTC
SEQ ID NO:219:
AATGTACAGTATTGCGTTTTGTCGATGGACTTGACAAGCCCGTACTT
SEQ ID NO:220:
AATGTACAGTATTGCGTTTTGCTGGACGACGAGGAGTATGAGGAGATC
SEQ ID NO:221:
AATGTACAGTATTGCGTTTTGTACCAGAAGTCCCGGCGGTGATAAG
SEQ ID NO:222:
AATGTACAGTATTGCGTTTTGGTTCACCTCTGTGTTTGACTGCCAGAAA
SEQ ID NO:223:
AATGTACAGTATTGCGTTTTGCAATGAGTATTCTCTTCATTTCAGGTCAGTTGATTT
SEQ ID NO:224:
AATGTACAGTATTGCGTTTTGGGCTGCTTTCTTGAAGGCTATTGGGTAT
SEQ ID NO:225:
AATGTACAGTATTGCGTTTTGAGGAGACTGGAATTCTCGAATAAGGATTAACA
SEQ ID NO:226:
AATGTACAGTATTGCGTTTTGGCATAGTTAAAACCTGTGTTTGGTTTTGTAGGTCTT
SEQ ID NO:227:
AATGTACAGTATTGCGTTTTGCTCTGTGTTGGCGGATACCCTTCCATA
SEQ ID NO:228:
AATGTACAGTATTGCGTTTTGGGCATTCCTTCTTTATTGCCCTTCTTAAAAGC
SEQ ID NO:229:
AATGTACAGTATTGCGTTTTGGCTGCTGGTCTGGCTACTATGATCTCTAC
SEQ ID NO:230:
AATGTACAGTATTGCGTTTTGGCACACAGCTTTTAAGAAGGGCAATAAAGAAG
SEQ ID NO:231:
AATGTACAGTATTGCGTTTTGTGTATGTTTAATTCTGTACATGAGCATTTCATCAGT
SEQ ID NO:232:
AATGTACAGTATTGCGTTTTGATTTCATACCTTGCTTAATGGGTGTAGATACCAAAA
SEQ ID NO:233:
AATGTACAGTATTGCGTTTTGTTGGCGTCAAATGTGCCACTATCACTC
SEQ ID NO:234:
AATGTACAGTATTGCGTTTTGTTCTCTTTCAAGCTATGATTTAGGCATAGAGAATCG
SEQ ID NO:235:
AATGTACAGTATTGCGTTTTGCTGCAGTTGTAGGTTATAACTATCCATTTGTCTGAA
SEQ ID NO:236:
AATGTACAGTATTGCGTTTTGCCCTAGGTCAGATCACCCAGTCAGTTAAAAC
SEQ ID NO:237:
AATGTACAGTATTGCGTTTTGTGGTTAAAGGTCAGCCCACTTACCAGATATG
SEQ ID NO:238:
AATGTACAGTATTGCGTTTTGGGGTATGCTCCCCATTTAGAGGATAAGG
SEQ ID NO:239:
AATGTACAGTATTGCGTTTTGACGTCAGATCTACAGCGAACACAACTACT
SEQ ID NO:240:
AATGTACAGTATTGCGTTTTGAGTGGTGCCAGACTCACATTCAGTTCTAA
SEQ ID NO:241:
AATGTACAGTATTGCGTTTTGCTTGGCCAGTTCCTTTCTCTAATGTATCATCTC
SEQ ID NO:242:
AATGTACAGTATTGCGTTTTGAAGTTTTCTTGTCTAGTATCACTTTCCCTCATAGG
SEQ ID NO:243:
AATGTACAGTATTGCGTTTTGGGGCTCAACAGATGGTATGTGTTCTCTG
SEQ ID NO:244:
AATGTACAGTATTGCGTTTTGGCTCTCGTTTCTAACAGTTCTTTGCATTGGATA
SEQ ID NO:245:
AATGTACAGTATTGCGTTTTGGAGGTGACCTTCAAAGTCAGAGGCTGTAT
SEQ ID NO:246:
AATGTACAGTATTGCGTTTTGGAGCAACCATCCCATCTGTCCTTGTAAC
SEQ ID NO:247:
AATGTACAGTATTGCGTTTTGGGACAAGGATGAGAAACCCAATTGGAACC
SEQ ID NO:248:
AATGTACAGTATTGCGTTTTGCGGTCCGCCAAAAGATCCCAGATTC
SEQ ID NO:249:
AATGTACAGTATTGCGTTTTGGGAGGCCACTAACCCACTTGTGATG
SEQ ID NO:250:
AATGTACAGTATTGCGTTTTGTCCAGTTTCCTAGAGGATGTAATGGGATTTGTC
SEQ ID NO:251:
AATGTACAGTATTGCGTTTTGTCACATTTGGAGATGAGAAACGAGGTGTTCT
SEQ ID NO:252:
AATGTACAGTATTGCGTTTTGCCCTTGGCCTGTAACATTGCTCTGATC
SEQ ID NO:253:
AATGTACAGTATTGCGTTTTGCACCTCGTTTCTCATCTCCAAATGTGATCTC
SEQ ID NO:254:
AATGTACAGTATTGCGTTTTGCCAGTAGCTTTCCTGTTCTCGGCATT
SEQ ID NO:255:
AATGTACAGTATTGCGTTTTGGCAGCGTCAAGAATGAGAAGACTTTTGTG
SEQ ID NO:256:
AATGTACAGTATTGCGTTTTGTTGCCCTTCTGGAAATTACCCCGAGA
SEQ ID NO:257:
AATGTACAGTATTGCGTTTTGAGTTCCACCAGCTTTAATTATTCCTCTAGCTCTC
SEQ ID NO:258:
AATGTACAGTATTGCGTTTTGGTTTCCCATGGCCATAATTTATTATCTCACCACAA
SEQ ID NO:259:
AATGTACAGTATTGCGTTTTGGTCACGATGACTGTATTGGACCCTCAA
SEQ ID NO:260:
AATGTACAGTATTGCGTTTTGTCCAGACCTTTGCTTTAGATTGGCAATTATTACTG
SEQ ID NO:261:
AATGTACAGTATTGCGTTTTGCCCTAACAACACAGAAGCAAAGCGTTCTTT
SEQ ID NO:262:
AATGTACAGTATTGCGTTTTGCGCCCTCCTACCACCTGTACTACG
SEQ ID NO:263:
AATGTACAGTATTGCGTTTTGACTATCCAGGCGCCTTCACCTACTC
SEQ ID NO:264:
AATGTACAGTATTGCGTTTTGCTCCTAGGCGGTATCATCCTGGGTAG
SEQ ID NO:265:
AATGTACAGTATTGCGTTTTGTCTGATTCTCTTCAGATACAAGGCAGATCC
SEQ ID NO:266:
AATGTACAGTATTGCGTTTTGGCAGATACTTGGACTTGAGTAGGCTTATTAAACC
SEQ ID NO:267:
AATGTACAGTATTGCGTTTTGGCGGCTCTATAAAGAATTGTCCTTATTTTCGAACTT
SEQ ID NO:268:
AATGTACAGTATTGCGTTTTGGTTCGAGGCCTTTCTCTGAGCATCAAG
SEQ ID NO:269:
AATGTACAGTATTGCGTTTTGACATCGGCAGAAACTAGATGATCAGACCAA
SEQ ID NO:270:
AATGTACAGTATTGCGTTTTGTTTAGGAAATCCACAATACTTTTTCTGATCTCTTCC
SEQ ID NO:271:
AATGTACAGTATTGCGTTTTGGCCACCAACCTCATTCTGTTTTGTTCTCTATC
SEQ ID NO:272:
AATGTACAGTATTGCGTTTTGCTGCATTTGTCCTTTGACTGGTGTTTAGGT
SEQ ID NO:273:
AATGTACAGTATTGCGTTTTGCTTCGACCGACAAACCTGAGGTCATTAAATC
SEQ ID NO:274:
AATGTACAGTATTGCGTTTTGCCCCACATCCCAAGCTAGGAAGACC
SEQ ID NO:275:
AATGTACAGTATTGCGTTTTGCGGGCCAGTACCTTGAAAGCGATG
SEQ ID NO:276:
AATGTACAGTATTGCGTTTTGCTAACTCAATCGGCTTGTTGTGATGCGTAT
SEQ ID NO:277:
AATGTACAGTATTGCGTTTTGCCCTCCTGGACTGTTAGTAACTTAGTCTCC
SEQ ID NO:278:
AATGTACAGTATTGCGTTTTGCCCTCCGAGCTCCGCGAAAAT
SEQ ID NO:279:
AATGTACAGTATTGCGTTTTGGTGCTAAAAAGTGTAAGAAGAAATGAGCTAGCAAAA
SEQ ID NO:280:
AATGTACAGTATTGCGTTTTGCATATGCCTCAGTTTGAATTCCTCTCACAAACAA
SEQ ID NO:281:
AATGTACAGTATTGCGTTTTGGGGAGAAGAAAGAGAGATGTAGGGCTAGAG
SEQ ID NO:282:
AATGTACAGTATTGCGTTTTGGCAAGCACTTCTGTTTTTGTCTTTTCAGTTTCG
SEQ ID NO:283:
AATGTACAGTATTGCGTTTTGTCTCTGATATACTTGGATTGGTAATTGAGAAAGTCT
SEQ ID NO:284:
AATGTACAGTATTGCGTTTTGGTTTGATATCTTCCCAGCAAAATAATCAGCTCTCAT
SEQ ID NO:285:
AATGTACAGTATTGCGTTTTGTAGCCAACCTCTTTTCGATGAGCTCACTAG
SEQ ID NO:286:
AATGTACAGTATTGCGTTTTGTGGAACAGACAAACTATCGACTGAAGTTGT
SEQ ID NO:287:
AATGTACAGTATTGCGTTTTGGAGGCTGAGTGCAAATTTGGTCTGGAA
SEQ ID NO:288:
AATGTACAGTATTGCGTTTTGGATGGTGGTGGTTGTCTCTGATGATTACC
SEQ ID NO:289:
AATGTACAGTATTGCGTTTTGGCAAGGCGAGTCCAGAACCAAGATT
SEQ ID NO:290:
AATGTACAGTATTGCGTTTTGTCAGAAGCGACTGATCCCCATCAAGT
SEQ ID NO:291:
AATGTACAGTATTGCGTTTTGCATATGGTCACATCACCTTAACTAAACCCATGTTT
SEQ ID NO:292:
AATGTACAGTATTGCGTTTTGTTTCTCGGTACTGTTTATTTTGAACAAAACCAATCC
SEQ ID NO:293:
AATGTACAGTATTGCGTTTTGCCTCCTCCCCAAATTCCAGGAACAATATGA
SEQ ID NO:294:
AATGTACAGTATTGCGTTTTGTGTGCGTCATTTTATTTGGGAAAATTTGATACTAAC
SEQ ID NO:295:
AATGTACAGTATTGCGTTTTGCATGCAGGAGAAGTCATCCCCCTTC
SEQ ID NO:296:
AATGTACAGTATTGCGTTTTGTCTGAAAACTGGTGGTTGCCTCTAGGTTAA
SEQ ID NO:297:
AATGTACAGTATTGCGTTTTGGCCCCTTTCTTGCTCTTCTTGGACTTG
SEQ ID NO:298:
AATGTACAGTATTGCGTTTTGCCAAGCCAAGCCAAGCTGGATATTGTG
SEQ ID NO:299:
AATGTACAGTATTGCGTTTTGCACTCACATTGTGCAGCTTGTAGTAGAG
SEQ ID NO:300:
AATGTACAGTATTGCGTTTTGGCAAAGCGTCTGCATTTGAAGGAGTTT
SEQ ID NO:301:
AATGTACAGTATTGCGTTTTGCCCTCCCGAGAACTTGCCGGTTAA
SEQ ID NO:302:
AATGTACAGTATTGCGTTTTGGCTCCCCACCACAAAAACGCAAATG
SEQ ID NO:303:
AATGTACAGTATTGCGTTTTGGTGTCACTGACGGAGAGCATGAAGATG
SEQ ID NO:304:
AATGTACAGTATTGCGTTTTGCCACCCAAAGAAGTGTCTCCTGACC
SEQ ID NO:305:
AATGTACAGTATTGCGTTTTGTCCGTCAGTGACACCTGGTACTTGAC
SEQ ID NO:306:
AATGTACAGTATTGCGTTTTGCCCTAGCTCTGCCTACCCTGATCTTTC
SEQ ID NO:307:
AATGTACAGTATTGCGTTTTGACGAGGTGGACGTCTTCTTCAATCAC
SEQ ID NO:308:
AATGTACAGTATTGCGTTTTGGCCCTGCGAGTCGAGGTGATTG
SEQ ID NO:309:
AATGTACAGTATTGCGTTTTGCCATGACTCTCAGGAATTGGCCCTATACTTAG
SEQ ID NO:310:
AATGTACAGTATTGCGTTTTGCTTGGGACCTTCATTTCTATATAACCCCTATCTGG
SEQ ID NO:311:
AATGTACAGTATTGCGTTTTGTGCCAGGAAACTTTTCATTGTGCCTCTC
SEQ ID NO:312:
AATGTACAGTATTGCGTTTTGGTTACCCCATGGAACTTACCAAGCACTAG
SEQ ID NO:313:
AATGTACAGTATTGCGTTTTGGTATGAAATTCGCTGGAGGGTCATTGAATCAAT
SEQ ID NO:314:
AATGTACAGTATTGCGTTTTGCAGGAAGGAGCACTTACGTTTTAGCATCTTC
SEQ ID NO:315:
AATGTACAGTATTGCGTTTTGGATTTTGAGAAATTCCCTTAATATCCCCATGCTCAA
SEQ ID NO:316:
AATGTACAGTATTGCGTTTTGCACAACCACATGTGTCCAGTGAAAATCC
SEQ ID NO:317:
AATGTACAGTATTGCGTTTTGTGCTTTCATCAGCAGGGTTCAATCCAAA
SEQ ID NO:318:
AATGTACAGTATTGCGTTTTGCATTTACATCATCACAGAGTATTGCTTCTATGGAGA
SEQ ID NO:319:
AATGTACAGTATTGCGTTTTGGTGATCTCTGGATGTCGGAATATTTAGAAACCTCT
SEQ ID NO:320:
AATGTACAGTATTGCGTTTTGATCTTTTGAAAACAATGGTGACTACATGGACATGAA
SEQ ID NO:321:
AATGTACAGTATTGCGTTTTGGGTCTAAAAAGGTCTGTGTTCCTTGAACTTACA
SEQ ID NO:322:
AATGTACAGTATTGCGTTTTGCCAGCACCAATACATTTAATTTCTTTTCTGCAGAC
SEQ ID NO:323:
AATGTACAGTATTGCGTTTTGGCTACAGATGGCTTGATCCTGAGTCATTTC
SEQ ID NO:324:
AATGTACAGTATTGCGTTTTGGTCAGGCCCATACCAAGGGAAAAGATC
SEQ ID NO:325:
AATGTACAGTATTGCGTTTTGACACTGAGTGATGTCTGGTCTTATGGCATT
SEQ ID NO:326:
AATGTACAGTATTGCGTTTTGCACTGAGCGTTTGTTAGTCCTGGTGTTTT
SEQ ID NO:327:
AATGTACAGTATTGCGTTTTGCAGATTCTCCACAATCTCACTCAGGTGGTAAA
SEQ ID NO:328:
AATGTACAGTATTGCGTTTTGCCCCACAGCTACGAGATCATGGTGAAAT
SEQ ID NO:329:
AATGTACAGTATTGCGTTTTGTCTCTATTCATTTTTGAGGTTTGGTTGTTAACACTT
SEQ ID NO:330:
AATGTACAGTATTGCGTTTTGGGGAGTGCACCATTATCGGGAAAATGG
SEQ ID NO:331:
AATGTACAGTATTGCGTTTTGGCTTATTCTCATTCGTTTCATCCAGGATCTCAAAA
SEQ ID NO:332:
AATGTACAGTATTGCGTTTTGGGGCGACGAGATTAGGCTGTTATGC
SEQ ID NO:333:
AATGTACAGTATTGCGTTTTGCCCCTCTGCATTATAAGCAGTGCCAAAA
SEQ ID NO:334:
AATGTACAGTATTGCGTTTTGGCCCACATCGTTGTAAGCCTTACATTCAA
SEQ ID NO:335:
AATGTACAGTATTGCGTTTTGCCGTTTGGAAAGCTAGTGGTTCAGAGTTC
SEQ ID NO:336:
AATGTACAGTATTGCGTTTTGGAGATCCCATCCTGCCAAAGTTTGTGATT
SEQ ID NO:337:
AATGTACAGTATTGCGTTTTGGGAAAGCCCCTGTTTCATACTGACCAAAA
SEQ ID NO:338:
AATGTACAGTATTGCGTTTTGCTTTCTCCCCACAGAAACCCATGTATGAAG
SEQ ID NO:339:
AATGTACAGTATTGCGTTTTGGTTTGCCAGTTGTGCTTTTTGCTAAAATGC
SEQ ID NO:340:
AATGTACAGTATTGCGTTTTGCCCTCCCACCCTCAGGACTATACCAAT
SEQ ID NO:341:
AATGTACAGTATTGCGTTTTGTGCTCGGCAGATTGGTATAGTCCTG
SEQ ID NO:342:
AATGTACAGTATTGCGTTTTGGGCATCCTCTGTCCTATCTCCCAGATACA
SEQ ID NO:343:
AATGTACAGTATTGCGTTTTGAGGTTTTATACTAAACTTACTTTGACTGGGTTTGG
SEQ ID NO:344:
AATGTACAGTATTGCGTTTTGCCCCCAGAGGTAAGCGTCATATGG
SEQ ID NO:345:
AATGTACAGTATTGCGTTTTGGCACAGGGAAGTAGGTACTGGGAGATTG
SEQ ID NO:346:
AATGTACAGTATTGCGTTTTGAGGCCTGCAAGGTTTTAACTGGACCTA
SEQ ID NO:347:
AATGTACAGTATTGCGTTTTGCGGGAGCTGATAAGTGGTACCTGTATGT
SEQ ID NO:348:
AATGTACAGTATTGCGTTTTGGAAAAGGGTCCCAGGTAGGTCCAGTTAA
SEQ ID NO:349:
AATGTACAGTATTGCGTTTTGCTCTCGGTGTATTTCTCTACTTACCTGTAATAATGC
SEQ ID NO:350:
AATGTACAGTATTGCGTTTTGTTTATTGATGTCTATGAAGTGTTGTGGTTCCTTAAC
SEQ ID NO:351:
AATGTACAGTATTGCGTTTTGCAGAAAACAAGCTGCCGCAAAGTTCTAC
SEQ ID NO:352:
AATGTACAGTATTGCGTTTTGCAGGTGTTGCGATGATGTCACTGTACG
SEQ ID NO:353:
AATGTACAGTATTGCGTTTTGTCATTTTTCATTGGACTTGTTTTGTCAGCTTTTTGG
SEQ ID NO:354:
AATGTACAGTATTGCGTTTTGGTTAGCCCCAATATGAAAAATAAAGCTGGTTGGA
SEQ ID NO:355:
AATGTACAGTATTGCGTTTTGCTGGTTGGAGGTTTTTGCTAAATCTGGAATGA
SEQ ID NO:356:
AATGTACAGTATTGCGTTTTGTTCTTTTTGACTAGAAAACTTCAGCCACTGTGTATT
SEQ ID NO:357:
AATGTACAGTATTGCGTTTTGCATATGACCAATTGCAGATGAGCCCATTATTGAA
SEQ ID NO:358:
AATGTACAGTATTGCGTTTTGAGGCATAGCTGACTCATCTATGTTTGTTCT
SEQ ID NO:359:
AATGTACAGTATTGCGTTTTGTTCCTCATTTCTTTCACTCTGACAGTATAAAGGTAA
SEQ ID NO:360:
AATGTACAGTATTGCGTTTTGGAACTATTCCAACAGAACAAACCGATAACATCA
SEQ ID NO:361:
AATGTACAGTATTGCGTTTTGTGGATAGCAAGACAATTAGAGCCCAACTTAGT
SEQ ID NO:362:
AATGTACAGTATTGCGTTTTGCTACTCCTCCTGTCTCTTTCCACATCATCAATT
SEQ ID NO:363:
AATGTACAGTATTGCGTTTTGAGGACCTTATGTTGTATGCTGTATAAATCTAAAGGT
SEQ ID NO:364:
AATGTACAGTATTGCGTTTTGGTTTGTCATCTTCTATGGTAAGTATCTTTCTGGATG
SEQ ID NO:365:
AATGTACAGTATTGCGTTTTGTGGAGGAGAAACAGATAAAAGTTGAGTATACGTTTA
SEQ ID NO:366:
AATGTACAGTATTGCGTTTTGGAGGATGACGACATGTTAGTAAGCACTACTACT
SEQ ID NO:367:
AATGTACAGTATTGCGTTTTGATTCCACCATCATTTCCTTCTCCAAAATTATCATCC
SEQ ID NO:368:
AATGTACAGTATTGCGTTTTGCTCAAAAGCACTGCCTTCTCTCATTATCTCAC
SEQ ID NO:369:
AATGTACAGTATTGCGTTTTGAATGTATTTGACCTTCTTTTAAAGTGACATCGATGT
SEQ ID NO:370:
AATGTACAGTATTGCGTTTTGTGATGTTCCCAACTTCTTCTCTCATGGTTATCTC
SEQ ID NO:371:
AATGTACAGTATTGCGTTTTGCCCTCTGATCCCTAGATAATTTATGGGTAGCTAGA
SEQ ID NO:372:
AATGTACAGTATTGCGTTTTGCACGAAATGCAGGTTTTGGAATATGATTAATGTT
SEQ ID NO:373:
AATGTACAGTATTGCGTTTTGGAACAATGTTCTACGCACATTTTGTTCTCAGTAAA
SEQ ID NO:374:
AATGTACAGTATTGCGTTTTGTCCACGCTGCTCTCTAAATTACACTCGAA
SEQ ID NO:375:
AATGTACAGTATTGCGTTTTGACGTAGAACACATTTCATTTTACTCCTCTTTGG
SEQ ID NO:376:
AATGTACAGTATTGCGTTTTGGTCACATGAATGTAAATCAAGAAAACAGATGTTGTT
SEQ ID NO:377:
AATGTACAGTATTGCGTTTTGTTCTGAACTATTTATGGACAACAGTCAAACAACAAT
SEQ ID NO:378:
AATGTACAGTATTGCGTTTTGTGAAGCCATTGCGAGAACTTTATCCATAAGTATTTC
SEQ ID NO:379:
AATGTACAGTATTGCGTTTTGGCCAGAGCACATGAATAAATGAGCATCCAT
SEQ ID NO:380:
AATGTACAGTATTGCGTTTTGGGAAGCTCTCAGGGTACAAATTCTCAGATCAT
SEQ ID NO:381:
AATGTACAGTATTGCGTTTTGCTCAGGGTACAAATTCTCAGATCATCAGTCCTC
SEQ ID NO:382:
AATGTACAGTATTGCGTTTTGCTCTACACAAGCTTCCTTTCCGTCATGC
SEQ ID NO:383:
AATGTACAGTATTGCGTTTTGCCCTTCAGATCTTCTCAGCATTCGAGAGATC
SEQ ID NO:384:
AATGTACAGTATTGCGTTTTGAATCGAAGCGCTACCTGATTCCAATTCC
SEQ ID NO:385:
AATGTACAGTATTGCGTTTTGCCGACCGTAACTATTCGGTGCGTTG
SEQ ID NO:386:
AATGTACAGTATTGCGTTTTGACATTCTATCCAAGCTGTGTTCTATCTTGAGAAACT
SEQ ID NO:387:
AATGTACAGTATTGCGTTTTGCGAGTGAGGGTTTTCGTGGTTCACATC
SEQ ID NO:388:
AATGTACAGTATTGCGTTTTGCGTGGGTCCCAGTCTGCAGTTAAG
SEQ ID NO:389:
AATGTACAGTATTGCGTTTTGGCTCAGAGCCGTTCCGAGATCTT
SEQ ID NO:390:
AATGTACAGTATTGCGTTTTGGCGTTCCATCTCCCACTTGTCGTAGTT
SEQ ID NO:391:
AATGTACAGTATTGCGTTTTGCTGGCCGAGTTGGTTCATCATCATTCAA
SEQ ID NO:392:
AATGTACAGTATTGCGTTTTGTATGGTGTGTCCCCCAACTACGACAAG
SEQ ID NO:393:
AATGTACAGTATTGCGTTTTGTGAAAAGCACTTCCTGAAATAATTTCACCTTCGTTT
SEQ ID NO:394:
AATGTACAGTATTGCGTTTTGAGGTACTCCATGGCTGACGAGATCTG
SEQ ID NO:395:
AATGTACAGTATTGCGTTTTGTTGCCTTTGTTCCAAGGTCCAATGTGT
SEQ ID NO:396:
AATGTACAGTATTGCGTTTTGCGTCCCCGCATTCCAACGTCTC
SEQ ID NO:397:
AATGTACAGTATTGCGTTTTGGGCGCGCCGTTTACTTGAAGG
SEQ ID NO:398:
AATGTACAGTATTGCGTTTTGGCCTGGCGGTGCACACTATTCTG
SEQ ID NO:399:
AATGTACAGTATTGCGTTTTGAGGTGCAGCCACAAAACTTACAGATGC
SEQ ID NO:400:
AATGTACAGTATTGCGTTTTGGTGCCGAACCAATACAACCCTCTG
SEQ ID NO:401:
AATGTACAGTATTGCGTTTTGGGGCGGGTCCACCAGTTTGAAT
SEQ ID NO:402:
AATGTACAGTATTGCGTTTTGCCGCAGAGGGTTGTATTGGTTCG
SEQ ID NO:403:
AATGTACAGTATTGCGTTTTGAGCCACTCGCATTGACCATTCAAACT
SEQ ID NO:404:
AATGTACAGTATTGCGTTTTGCCACGTCTGACAGGTAGCCATGG
SEQ ID NO:405:
AATGTACAGTATTGCGTTTTGGTGAGGCTGCTGGACGAGTACAAC
SEQ ID NO:406:
AATGTACAGTATTGCGTTTTGCGCACCAGGTTGTACTCGTCCA
SEQ ID NO:407:
AATGTACAGTATTGCGTTTTGCCGCCTTTGTGCTTCTGTTCTTCGT
SEQ ID NO:408:
AATGTACAGTATTGCGTTTTGCTGATTAATCGCGTAGAAAATGACCTTATTTTGGAG
SEQ ID NO:409:
AATGTACAGTATTGCGTTTTGGCTCCATCGTCTACCTGGAGATTGACAA
SEQ ID NO:410:
AATGTACAGTATTGCGTTTTGTCTGCACGGCCTCGATCTTGTAGG
SEQ ID NO:411:
AATGTACAGTATTGCGTTTTGGCCAGCAGATGATCTTCCCCTACTACG
SEQ ID NO:412:
AATGTACAGTATTGCGTTTTGCGTCACGCTTGAAGACCACGTTG
SEQ ID NO:413:
AATGTACAGTATTGCGTTTTGGCCAGCATGCAGTTCTAAGGCTCT
SEQ ID NO:414:
AATGTACAGTATTGCGTTTTGGTGCCCGTCTCGACTCTTAGGC
SEQ ID NO:415:
AATGTACAGTATTGCGTTTTGTGTAGCCGCTGATCGTCGTGTATATGTC
SEQ ID NO:416:
AATGTACAGTATTGCGTTTTGGACTGGTACTGGTTAGTAAAGGTTGATAATATTCCA
SEQ ID NO:417:
AATGTACAGTATTGCGTTTTGGGTGAAGTAATCAGTTTGTTCACTAGTTACGTGATT
SEQ ID NO:418:
AATGTACAGTATTGCGTTTTGCTGACATGCCTACTGATTATTCTTCAAACTCATCAC
SEQ ID NO:419:
AATGTACAGTATTGCGTTTTGTGTGTGTTTTAATTGTTCCACTTGAGATTCTTAACC
SEQ ID NO:420:
AATGTACAGTATTGCGTTTTGCGTCAGCATTTTGAATCACTTCATTCTGACATGATA
SEQ ID NO:421:
AATGTACAGTATTGCGTTTTGAGTAATTTTCAACTATTGGCCTAGTGAATTTAAGCT
SEQ ID NO:422:
AATGTACAGTATTGCGTTTTGAGAAAGAGGGAAGTCACATTTATAGAGTGCTAGC
SEQ ID NO:423:
AATGTACAGTATTGCGTTTTGCATCAACAGAAACAGAACAACAAACTGTGACAAATC
SEQ ID NO:424:
AATGTACAGTATTGCGTTTTGCCAAAGAATATCCCTTTATATAGCAGTGGAACAATT
SEQ ID NO:425:
AATGTACAGTATTGCGTTTTGCAGAATATGCAGTGATAAGTGCTGTTTCATCACT
SEQ ID NO:426:
AATGTACAGTATTGCGTTTTGTTCCCCCTGTGACGACTACTTTTCCTC
SEQ ID NO:427:
AATGTACAGTATTGCGTTTTGCGGTCCCTATTTCTTCCTCTGCTTCGT
SEQ ID NO:428:
AATGTACAGTATTGCGTTTTGCTGAACAGTTCTGTCTCTATTACCCGACCTC
SEQ ID NO:429:
AATGTACAGTATTGCGTTTTGCGTTCATAGCCTTCTATCCGAGTATGTAGCA
SEQ ID NO:430:
AATGTACAGTATTGCGTTTTGCCCCTTCTGTCCTCGCAGGTTAATCC
SEQ ID NO:431:
AATGTACAGTATTGCGTTTTGGCTTCCAGCCATTTCTGAGATATCCTCACAGT
SEQ ID NO:432:
AATGTACAGTATTGCGTTTTGACCAGGAGGAACAAAGACACATGAAGATCAT
SEQ ID NO:433:
AATGTACAGTATTGCGTTTTGGCGCCCCCGAGTTTCTTACGAATC
SEQ ID NO:434:
AATGTACAGTATTGCGTTTTGTTTATACACAGTTTGGAGTTTGAGAATCAGAAGACT
SEQ ID NO:435:
AATGTACAGTATTGCGTTTTGGGTTATCTCTGGCTGATGAGATTATGAGTGATTCTC
SEQ ID NO:436:
AATGTACAGTATTGCGTTTTGGCCAAGCTAGTGATTGATGTGATTCGCTAT
SEQ ID NO:437:
AATGTACAGTATTGCGTTTTGCCCCTCCTCTAGTACTCCCTGTTTGT
SEQ ID NO:438:
AATGTACAGTATTGCGTTTTGCTCCTTCCTGTCCCAATCAACTAGTCTAGC
SEQ ID NO:439:
AATGTACAGTATTGCGTTTTGGCCTCGTCCCTCTTCCCTTAGGTAA
SEQ ID NO:440:
AATGTACAGTATTGCGTTTTGTCTCTCTTCCCATTAGTCTGAGTACTGAGTGATT
SEQ ID NO:441:
AATGTACAGTATTGCGTTTTGAGCATTTCTTGAGACTTAAAGTGGCATTCTAAAGG
SEQ ID NO:442:
AATGTACAGTATTGCGTTTTGATTTTTATTCTCAAGAGGCAGAAATACCAACTTACC
SEQ ID NO:443:
AATGTACAGTATTGCGTTTTGAATTTATAGCTCTTTTCATCTGCTTTGGTATCATCA
SEQ ID NO:444:
AATGTACAGTATTGCGTTTTGGCCTCTAATCTGATATACAGCCTTAGAAAGTCACA
SEQ ID NO:445:
AATGTACAGTATTGCGTTTTGTGTGCCATTGTCCTGGAGCAACAATT
SEQ ID NO:446:
AATGTACAGTATTGCGTTTTGAGTGTACTGCTCGTTTTCTTAATTTGAAAAGTGAGT
SEQ ID NO:447:
AATGTACAGTATTGCGTTTTGACCCATGAACTAATACTTATTTTGAGATTGGTCCAT
SEQ ID NO:448:
AATGTACAGTATTGCGTTTTGCATGGTGCAACAAAAGTAAGAATCCAACAGTTTT
SEQ ID NO:449:
AATGTACAGTATTGCGTTTTGTTGAAATGTTAAGTAAGCTTGAAATACCGATAGCAT
SEQ ID NO:450:
AATGTACAGTATTGCGTTTTGGGGAGGAAGAAAATGAAGCACGAGGAAAAC
SEQ ID NO:451:
AATGTACAGTATTGCGTTTTGATTTGGGATGTACTCTAAATTTAAAGCAGCAAATCA
SEQ ID NO:452:
AATGTACAGTATTGCGTTTTGTCAAGAGCAGAATTTGGAGACTTTGATATTAAAACT
SEQ ID NO:453:
AATGTACAGTATTGCGTTTTGCGGTTACTAACATGTTTAGGGAAATAGACAACTGTT
SEQ ID NO:454:
AATGTACAGTATTGCGTTTTGCCTGACAACAGATCCCATATAATTAACTTTCATACC
SEQ ID NO:455:
AATGTACAGTATTGCGTTTTGAGATGAAGAAGATGAGGAACGAGAGAGTAAAAGC
之前特定实施方案的描述将如此充分地揭示本发明的一般性质,使得其他人可以通过应用本领域技术内的知识,容易地修改和/或改编,以用于各种应用,而不脱离本发明的一般概念。因此,基于本文呈现的教导和指导,此类修改和改编旨在在所公开实施方案的等价体的含义和范围内。应当理解,本文中的措辞或术语是为了描述而非限制的目的,使得本说明书的术语或措辞将由本领域技术人员根据教导和指导来解释。
本发明的广度和范围不应受上述任何示例性实施方案的限制,而应当仅根据所附权利要求及其等价体来定义。
本文描述的所有各个方面、实施方案和选项可以以任何和所有变化组合。
本说明书中提及的所有出版物、专利和专利申请均通过参考并入本文中,其程度就如同每个单独的出版物、专利或专利申请被具体地和单独地指示为通过引用并入本文中一样。将2019年1月9日提交的美国申请No.62/790,338的全部内容通过引用并入本文中。
Figure IDA0003156074280000011
Figure IDA0003156074280000021
Figure IDA0003156074280000031
Figure IDA0003156074280000041
Figure IDA0003156074280000051
Figure IDA0003156074280000061
Figure IDA0003156074280000071
Figure IDA0003156074280000081
Figure IDA0003156074280000091
Figure IDA0003156074280000101
Figure IDA0003156074280000111
Figure IDA0003156074280000121
Figure IDA0003156074280000131
Figure IDA0003156074280000141
Figure IDA0003156074280000151
Figure IDA0003156074280000161
Figure IDA0003156074280000171
Figure IDA0003156074280000181
Figure IDA0003156074280000191
Figure IDA0003156074280000201
Figure IDA0003156074280000211
Figure IDA0003156074280000221
Figure IDA0003156074280000231
Figure IDA0003156074280000241
Figure IDA0003156074280000251
Figure IDA0003156074280000261
Figure IDA0003156074280000271
Figure IDA0003156074280000281
Figure IDA0003156074280000291
Figure IDA0003156074280000301
Figure IDA0003156074280000311
Figure IDA0003156074280000321
Figure IDA0003156074280000331
Figure IDA0003156074280000341
Figure IDA0003156074280000351
Figure IDA0003156074280000361
Figure IDA0003156074280000371
Figure IDA0003156074280000381
Figure IDA0003156074280000391
Figure IDA0003156074280000401
Figure IDA0003156074280000411
Figure IDA0003156074280000421
Figure IDA0003156074280000431
Figure IDA0003156074280000441
Figure IDA0003156074280000451
Figure IDA0003156074280000461
Figure IDA0003156074280000471
Figure IDA0003156074280000481
Figure IDA0003156074280000491
Figure IDA0003156074280000501
Figure IDA0003156074280000511
Figure IDA0003156074280000521
Figure IDA0003156074280000531
Figure IDA0003156074280000541
Figure IDA0003156074280000551
Figure IDA0003156074280000561
Figure IDA0003156074280000571
Figure IDA0003156074280000581
Figure IDA0003156074280000591
Figure IDA0003156074280000601
Figure IDA0003156074280000611
Figure IDA0003156074280000621
Figure IDA0003156074280000631
Figure IDA0003156074280000641
Figure IDA0003156074280000651
Figure IDA0003156074280000661
Figure IDA0003156074280000671
Figure IDA0003156074280000681
Figure IDA0003156074280000691
Figure IDA0003156074280000701
Figure IDA0003156074280000711
Figure IDA0003156074280000721
Figure IDA0003156074280000731
Figure IDA0003156074280000741
Figure IDA0003156074280000751
Figure IDA0003156074280000761
Figure IDA0003156074280000771
Figure IDA0003156074280000781
Figure IDA0003156074280000791
Figure IDA0003156074280000801
Figure IDA0003156074280000811
Figure IDA0003156074280000821
Figure IDA0003156074280000831
Figure IDA0003156074280000841
Figure IDA0003156074280000851
Figure IDA0003156074280000861
Figure IDA0003156074280000871
Figure IDA0003156074280000881
Figure IDA0003156074280000891
Figure IDA0003156074280000901
Figure IDA0003156074280000911
Figure IDA0003156074280000921
Figure IDA0003156074280000931
Figure IDA0003156074280000941
Figure IDA0003156074280000951
Figure IDA0003156074280000961
Figure IDA0003156074280000971
Figure IDA0003156074280000981
Figure IDA0003156074280000991
Figure IDA0003156074280001001
Figure IDA0003156074280001011
Figure IDA0003156074280001021
Figure IDA0003156074280001031
Figure IDA0003156074280001041
Figure IDA0003156074280001051
Figure IDA0003156074280001061
Figure IDA0003156074280001071
Figure IDA0003156074280001081
Figure IDA0003156074280001091
Figure IDA0003156074280001101
Figure IDA0003156074280001111
Figure IDA0003156074280001121
Figure IDA0003156074280001131
Figure IDA0003156074280001141
Figure IDA0003156074280001151
Figure IDA0003156074280001161
Figure IDA0003156074280001171
Figure IDA0003156074280001181
Figure IDA0003156074280001191
Figure IDA0003156074280001201
Figure IDA0003156074280001211
Figure IDA0003156074280001221
Figure IDA0003156074280001231
Figure IDA0003156074280001241
Figure IDA0003156074280001251
Figure IDA0003156074280001261
Figure IDA0003156074280001271

Claims (45)

1.一种用于检测样品中的分析物的方法,包括:
将第一和第二邻近探针结合到样品中的分析物,其中第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域,并且其中第二邻近探针包含第二分析物结合域和包含通用扩增区域、PST和IMR的第二寡核苷酸域;和
检测分析物。
2.权利要求1的方法,第二邻近探针的寡核苷酸域还包含UMI。
3.权利要求1或2的方法,其中第一和第二分析物结合域是抗体、适体、配体、受体,或其组合。
4.权利要求1-3任一项的方法,其中第一和第二分析物结合域通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合与寡核苷酸域缀合。
5.权利要求1-4任一项的方法,其中第一和第二分析物结合域分别是第一和第二抗体。
6.权利要求5的方法,其中第一和第二抗体中的每一个是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体,或其组合。
7.权利要求1-6任一项的方法,进一步包括进行邻近连接(PLA)或延伸(PEA)测定。
8.权利要求7的方法,其中PLA或PEA测定产生第三寡核苷酸,其是单链或双链的。
9.权利要求8的方法,进一步包括将适体序列连接第三寡核苷酸。
10.权利要求9的方法,其中通过扩增或连接将适体序列连接第三寡核苷酸。
11.权利要求8-10任一项的方法,进一步包括进行第三寡核苷酸的扩增,以产生基于蛋白质的DNA文库。
12.权利要求1-11任一项的方法,进一步包括从样品制备DNA和cDNA文库,包括:
将DNA标签连接样品中的DNA分子的末端,其中DNA标签包含UMI和DNA标识符;和
在RNA标签的存在下进行样品中RNA分子的逆转录,其中RNA标签包含RNA标识符、UMI和多聚(T)。
13.权利要求12的方法,其中逆转录在第二RNA标签的存在下进行,其中第二RNA标签包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。
14.权利要求12或13的方法,进一步包括扩增标记的DNA和标记的cDNA以用一组基因特异性引物富集。
15.权利要求14的方法,进一步包括将扩增的样品分成第一、第二或第三样品。
16.权利要求12-15任一项的方法,其中蛋白质、DNA和RNA分子从生物样品获得。
17.权利要求12-16任一项的方法,其中DNA和RNA分子是来自生物样品的片段化DNA和RNA。
18.权利要求12-17任一项的方法,其中DNA分子含有抛光的末端,用于连接。
19.权利要求12-19任一项的方法,其中RNA分子是多聚腺苷酸化的。
20.权利要求12-20任一项的方法,其中该方法不需要核糖体耗竭。
21.权利要求10-18任一项的方法,进一步包括用DNA标签特异性的引物扩增第一样品。
22.权利要求19的方法,其中扩增产生对应于样品中的DNA的DNA文库。
23.权利要求12-20任一项的方法,进一步包括用RNA标签特异性的引物扩增第二样品。
24.权利要求23的方法,其中扩增产生对应于样品中的RNA的cDNA文库。
25.权利要求1-24任一项的方法,进一步包括将基于蛋白质的DNA、DNA或cDNA文库测序。
26.权利要求12-25任一项的方法,其中DNA分子是基因组DNA。
27.权利要求12-26任一项的方法,其中DNA文库可以用于DNA变体检测、拷贝数分析、融合基因检测或结构变体检测。
28.权利要求12-27任一项的方法,其中cDNA文库可以用于RNA变体检测、基因表达分析或融合基因检测。
29.权利要求12-28任一项的方法,其中文库可以用于配对的DNA和RNA谱分析。
30.权利要求8-29任一项的方法,其中从基因组DNA和总RNA分离第三寡核苷酸。
31.权利要求1-11任一项的方法,进一步包括:
(a)从同一生物样品获得纯化的DNA和RNA;
(b)将DNA标签序列连接样品中的DNA;
(c)将RNA标签序列连接样品中的RNA;和
(d)分别检测DNA、RNA和蛋白质靶标。
32.通过权利要求1-31任一项的方法制得的基于蛋白质的DNA文库。
33.通过权利要求12-31任一项的方法制得的DNA文库。
34.通过权利要求12-31任一项的方法制得的cDNA文库。
35.一种组合物,其包含第一邻近探针和第二邻近探针,第一邻近探针包含第一分析物结合域以及包含通用扩增区、可变探针特异性标签区(PST)、独特分子标识符(UMI)和分子间反应区(IMR)的第一寡核苷酸域,并且第二邻近探针包含第二分析物结合域和包含通用扩增区域、PST和IMR的第二寡核苷酸域。
36.权利要求35的组合物,其中第二寡核苷酸域进一步包含独特分子标识符(UMI)。
37.权利要求35或36的组合物,其中第一和第二分析物结合域是抗体、适体、配体、受体,或其组合。
38.权利要求35-37任一项的组合物,其中第一和第二分析物结合域通过化学键、与连接分析物结合域的中间寡核苷酸杂交、链霉亲和素、生物素或其组合与寡核苷酸域缀合。
39.权利要求35-38任一项的方法,其中第一和第二分析物结合域分别是第一和第二抗体。
40.权利要求39的方法,其中第一和第二抗体中的每一个是分成两个抗体的一个多克隆抗体、两个不同的多克隆抗体、两个不同的单克隆抗体,或其组合。
41.权利要求35-40任一项的组合物,进一步包括包含独特分子标识符(UMI)和DNA标识符的DNA标签,和/或包含RNA标识符、UMI和多聚(T)的RNA标签。
42.权利要求41的组合物,进一步包含RNA标签,其包含RNA标识符、UMI和模板转换寡核苷酸(TSO)。
43.权利要求41或42的组合物,其中DNA标签以5’到3’方向包含UMI和DNA标识符。
44.权利要求41-43任一项的组合物,其中RNA标签以5’到3’方向包含RNA标识符、UMI和多聚(T)。
45.权利要求41-44任一项的组合物,其中RNA标签可以以5’到3’方向包含RNA标识符、UMI和TSO。
CN202080008831.7A 2019-01-09 2020-01-09 检测分析物的方法及其组合物 Pending CN113302301A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962790338P 2019-01-09 2019-01-09
US62/790,338 2019-01-09
PCT/US2020/012892 WO2020146603A1 (en) 2019-01-09 2020-01-09 Methods of detecting analytes and compositions thereof

Publications (1)

Publication Number Publication Date
CN113302301A true CN113302301A (zh) 2021-08-24

Family

ID=71521748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080008831.7A Pending CN113302301A (zh) 2019-01-09 2020-01-09 检测分析物的方法及其组合物

Country Status (4)

Country Link
US (1) US20220127600A1 (zh)
EP (1) EP3908657A4 (zh)
CN (1) CN113302301A (zh)
WO (1) WO2020146603A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3182960A1 (en) * 2020-11-06 2022-05-12 Illumina, Inc. Detecting materials in a mixture using oligonucleotides

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10669569B2 (en) * 2010-10-15 2020-06-02 Navinci Diagnostics Ab Dynamic range methods
WO2017075265A1 (en) * 2015-10-28 2017-05-04 The Broad Institute, Inc. Multiplex analysis of single cell constituents
WO2018183796A1 (en) * 2017-03-31 2018-10-04 Predicine, Inc. Systems and methods for predicting and monitoring cancer therapy
EP4257701A3 (en) * 2016-06-30 2023-12-20 Grail, LLC Differential tagging of rna for preparation of a cell-free dna/rna sequencing library
WO2018031897A1 (en) * 2016-08-12 2018-02-15 Cdi Laboratories, Inc. Compositions and methods for analyzing nucleic acids associated with an analyte
US20180208975A1 (en) * 2017-01-20 2018-07-26 Merck Sharp & Dohme Corp. Assay for simultaneous genomic and proteomic analysis
WO2019191122A1 (en) * 2018-03-26 2019-10-03 Qiagen Sciences, Llc Integrative dna and rna library preparations and uses thereof

Also Published As

Publication number Publication date
WO2020146603A1 (en) 2020-07-16
US20220127600A1 (en) 2022-04-28
EP3908657A1 (en) 2021-11-17
EP3908657A4 (en) 2022-09-14

Similar Documents

Publication Publication Date Title
US11421269B2 (en) Target enrichment by single probe primer extension
JP2020500504A (ja) 増幅二本鎖デオキシリボ核酸の作製方法ならびに該方法で使用する組成物及びキット
US20210024920A1 (en) Integrative DNA and RNA Library Preparations and Uses Thereof
US11898204B2 (en) Generation of single-stranded circular DNA templates for single molecule sequencing
JP2015516814A (ja) 標的化されたdnaの濃縮および配列決定
WO2019086531A1 (en) Linear consensus sequencing
CN111801427A (zh) 用于单分子的单链环状dna模板的产生
US20220017954A1 (en) Methods for Preparing CDNA Samples for RNA Sequencing, and CDNA Samples and Uses Thereof
US20220127600A1 (en) Methods of Detecting Analytes and Compositions Thereof
US20210268508A1 (en) Parallelized sample processing and library prep
KR20220130591A (ko) 희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법
KR20220130592A (ko) 핵산의 정확한 병렬 정량분석을 위한 고감도 방법
WO2021216574A1 (en) Nucleic acid preparations from multiple samples and uses thereof
KR20240032630A (ko) 핵산의 정확한 병렬 검출 및 정량화 방법
AU2021468499A1 (en) Methods for producing dna libraries and uses thereof
WO2021180791A1 (en) Novel nucleic acid template structure for sequencing
WO2023025784A1 (en) Optimised set of oligonucleotides for bulk rna barcoding and sequencing
WO2024059622A2 (en) Methods for simultaneous amplification of dna and rna
JP2024035110A (ja) 変異核酸の正確な並行定量するための高感度方法
TW202411430A (zh) 準確地平行檢測和定量核酸的方法
WO2023237180A1 (en) Optimised set of oligonucleotides for bulk rna barcoding and sequencing
TW202411431A (zh) 準確地平行定量變體核酸的高靈敏度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination