CN107922971A - 用于富集核酸群体的组合物和方法 - Google Patents

用于富集核酸群体的组合物和方法 Download PDF

Info

Publication number
CN107922971A
CN107922971A CN201680042387.4A CN201680042387A CN107922971A CN 107922971 A CN107922971 A CN 107922971A CN 201680042387 A CN201680042387 A CN 201680042387A CN 107922971 A CN107922971 A CN 107922971A
Authority
CN
China
Prior art keywords
nucleic acid
oligonucleotides
host
nucleotide
nonhost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680042387.4A
Other languages
English (en)
Inventor
蒂莫西·A·布劳坎普
佛瑞德·克里斯蒂安斯
伊戈尔·D·维尔凡
斯科特·史密斯
迈克尔·凯尔泰斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kayrux Co
Original Assignee
Kayrux Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kayrux Co filed Critical Kayrux Co
Publication of CN107922971A publication Critical patent/CN107922971A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/159Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本公开内容提供了可用于在复杂的核酸混合物中富集核酸的特定群体(“感兴趣群体”)的方法和组合物。所述感兴趣群体可构成复杂的核酸混合物的一小部分。本文提供的方法和组合物可用于检测、预测、诊断或监测疾病或病症,特别是由外来微生物或病原体引起的疾病或病症。

Description

用于富集核酸群体的组合物和方法
交叉引用
本申请要求于2015年5月18日提交的美国临时申请号62/163,273以及于2016年5月10日提交的美国临时申请号62/334,348的权益,这些申请通过引用并入本文。
背景
感染性疾病和病症对主要照顾者和患者来说都是一个挑战,而且通常检测率很低,尤其是与其他疾病相比。感染性疾病检测不当可能是由于多种因素,包括缺乏可以迅速产生准确答案的有意义的测试。鉴于一些诊断测试的速度较慢,许多医师在收到测试结果之前选择根据可疑病因对患者进行治疗,而不是在等待期间冒着症状恶化的风险。感染性疾病的测试通常也是病原体特异性的;因此,医师在要求测试前必须对患者症状的病原体有一定的了解。一些感染性疾病的另一混杂因素在于感染原可能在感染过程中发生突变,使得最初的诊断可能不能在稍后的时间点准确地反映患者状况的性质。继发性感染和共感染也可能混淆诊断和治疗,因为它们可能掩盖其他感染源或完全逃避检测。
对致病性感染的误诊和诊断不足可能对患者以及整个社区都会产生可怕的后果。例如,过度使用或滥用抗生素可促使抗生素抗性细菌增多,这不仅对患者有危险,而且对与患者接触的其他人也是危险的。因此,本领域需要可靠的、全面的且可负担的测试来鉴别样品中的病原体。
发明内容
本公开内容大体提供了鉴别取自宿主的样品中的非宿主核酸和存在宿主核酸的样品中的非宿主核酸的方法。这样的方法具有多种应用,包括例如通过分析取自宿主的无细胞样品鉴别宿主内的感染性或致病生物体。通常,本文所述的方法可包括相对于宿主样品(例如来自所述宿主的无细胞血浆样品)中衍生的宿主核酸选择性富集非宿主核酸。然后可以分析所述富集的核酸以鉴别所述宿主内所述非宿主核酸的存在和病原体或感染性生物体的存在。鉴别非宿主核酸、病原体或感染性生物体的存在可实现对所述宿主经历的感染性疾病或病症的检测、诊断、预后、监测或分期。
在一个实例中,本公开内容提供了鉴别宿主中的病原体的方法,其中所述方法通过提供来自所述宿主的无细胞血液或血浆样品开始。然后相对于宿主来源的核酸对血液或血浆样品富集非宿主来源的核酸,并随后分析所述富集的样品的所述非宿主来源的核酸,并随后可以从所述非宿主核酸鉴别所述宿主中的任何病原体。
在一个方面,本公开内容提供了一种引发或捕获来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含宿主核酸和非宿主核酸;(b)将来自所述宿主的核酸样品与寡核苷酸集合混合,从而获得混合物,其中所述寡核苷酸集合包含至少1,000个具有不同核苷酸序列的寡核苷酸,其中所述不同核苷酸序列经特别选择以含有长度为至少10个核苷酸的非宿主核酸序列;以及(c)在所述混合物内,使所述寡核苷酸集合与所述核酸样品接触,其中所述接触导致所述混合物内的非宿主核酸与所述长度为至少10个核苷酸的非宿主核酸序列结合,从而引发或捕获非宿主核酸,并且所述接触导致至多10%的宿主核酸与所述长度为至少10个核苷酸的非宿主核酸序列结合。
在一些实施方案中,所述方法进一步包括在反应中优先扩增所述引发的或捕获的非宿主核酸。在一些实施方案中,所述方法进一步包括通过进行测序分析对所述引发的或捕获的非宿主核酸进行测序,诸如下一代测序分析、高通量测序分析、大规模平行测序分析、纳米孔测序分析或Sanger测序分析。在一些实施方案中,所述方法进一步包括优先分离所述引发的或捕获的非宿主核酸。在一些实施方案中,所述优先分离包括进行拉下(pull-down)实验。在一些实施方案中,所述方法进一步包括对所述引发的或捕获的非宿主核酸进行引物延伸反应。在一些实施方案中,所述至少1,000个具有不同核苷酸序列的寡核苷酸含有核酸标记物。在一些实施方案中,所述引发的或捕获的非宿主核酸为RNA非宿主核酸。在一些实施方案中,所述方法进一步包括对所述引发的或捕获的RNA非宿主核酸进行聚合反应。在一些实施方案中,通过逆转录酶进行所述聚合反应。
在另一个方面,本公开内容提供了一种对来自宿主的核酸样品中的非宿主序列进行测序的方法,所述方法包括:(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含宿主核酸和非宿主核酸;(b)将来自所述宿主的核酸样品与寡核苷酸集合混合,从而获得混合物,其中所述寡核苷酸集合包含至少1,000个具有不同核苷酸序列的寡核苷酸,其中所述不同核苷酸序列经特别选择以含有长度为至少10个核苷酸的非宿主核酸序列;(c)在所述混合物内,使所述寡核苷酸集合与所述核酸样品接触,其中所述接触导致所述混合物内的非宿主核酸与所述长度为至少10个核苷酸的非宿主核酸序列结合,并且所述接触导致至多10%的宿主核酸与所述长度为至少10个核苷酸的非宿主核酸序列结合;以及(d)通过进行测序分析,对与所述长度为至少10个核苷酸的非宿主核酸序列结合的非宿主核酸进行测序。
在一些实施方案中,所述方法进一步包括在反应中优先扩增所述非宿主核酸。在一些实施方案中,所述测序分析为下一代测序分析、高通量测序分析、大规模平行测序分析、纳米孔测序分析或Sanger测序分析。在一些实施方案中,所述方法进一步包括优先分离所述非宿主核酸。在一些实施方案中,所述分离包括进行拉下实验。在一些实施方案中,所述方法进一步包括对所述非宿主核酸进行引物延伸反应。在一些实施方案中,所述至少1,000个具有不同核苷酸序列的寡核苷酸含有核酸标记物。在一些实施方案中,所述非宿主核酸为RNA非宿主核酸。在一些实施方案中,所述方法进一步包括对所述RNA非宿主核酸进行聚合反应。在一些实施方案中,通过逆转录酶进行所述聚合反应。
在本文提供的方法的一些实施方案中,所述至少1,000个具有不同核苷酸序列的寡核苷酸为至少10,000个具有不同核苷酸序列的寡核苷酸。在本文提供的方法的一些实施方案中,所述至少1,000个具有不同核苷酸序列的寡核苷酸为至少100,000个具有不同核苷酸序列的寡核苷酸。在本文提供的方法的一些实施方案中,所述至少1,000个具有不同核苷酸序列的寡核苷酸为至少1,000,000个具有不同核苷酸序列的寡核苷酸。在本文提供的方法的一些实施方案中,所述至少1,000个具有不同核苷酸序列的寡核苷酸不与固体支持体缀合。在本文提供的方法的一些实施方案中,所述至少1,000个具有不同核苷酸序列的寡核苷酸具有至多200个核苷酸的长度。在本文提供的方法的一些实施方案中,所述至少1,000个具有不同核苷酸序列的寡核苷酸中的每一个包含长度为10至20个核苷酸的核苷酸结构域,其中每一个长度为10至20个核苷酸的核苷酸结构域包含不同的核苷酸序列。在本文提供的方法的一些实施方案中,每一个长度为10至20个核苷酸的核苷酸结构域的长度为12-15个核苷酸。在本文提供的方法的一些实施方案中,每一个长度为10至20个核苷酸的核苷酸结构域的长度为13-15个核苷酸。在本文提供的方法的一些实施方案中,每一个长度为10至20个核苷酸的核苷酸结构域不是哺乳动物核酸序列。在本文提供的方法的一些实施方案中,所述宿主为哺乳动物宿主,并且来自所述哺乳动物宿主的核酸样品包含哺乳动物宿主核酸和非哺乳动物核酸。在本文提供的方法的一些实施方案中,所述宿主为人宿主,并且来自所述人宿主的核酸样品包含人宿主核酸和非人核酸。在本文提供的方法的一些实施方案中,所述非人核酸包括微生物核酸。在本文提供的方法的一些实施方案中,所述非人核酸包括细菌核酸。在本文提供的方法的一些实施方案中,来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。在本文提供的方法的一些实施方案中,来自所述宿主的核酸样品选自血液、血浆、血清、唾液、脑脊髓液、滑液、灌洗液、尿液和粪便,诸如来自血液、血浆和血清。在本文提供的方法的一些实施方案中,所述样品选自血液、血浆和血清。在本文提供的方法的一些实施方案中,来自所述宿主的核酸样品为循环核酸样品。在本文提供的方法的一些实施方案中,来自所述宿主的核酸样品为循环无细胞核酸样品。在本文提供的方法的一些实施方案中,来自所述宿主的核酸样品包含核酸测序就绪(sequencing-ready)文库。在本文提供的方法的一些实施方案中,来自所述宿主的核酸样品包含单链DNA或cDNA。在本文提供的方法的一些实施方案中,所述核酸为DNA。在本文提供的方法的一些实施方案中,所述核酸为RNA。在本文提供的方法的一些实施方案中,来自所述宿主的核酸样品不包含人工片段化的核酸。在本文提供的方法的一些实施方案中,所述寡核苷酸集合包含DNA、RNA、PNA、LNA、BNA或其任意组合。在本文提供的方法的一些实施方案中,所述寡核苷酸集合包含DNA寡核苷酸。在本文提供的方法的一些实施方案中,所述寡核苷酸集合包含RNA寡核苷酸。
在本文提供的方法的一些实施方案中,所述寡核苷酸集合为DNA寡核苷酸。在本文提供的方法的一些实施方案中,所述寡核苷酸集合为RNA寡核苷酸。在本文提供的方法的一些实施方案中,所述寡核苷酸集合用核酸标记物或化学标记物进行标记。在本文提供的方法的一些实施方案中,所述化学标记物为生物素。在本文提供的方法的一些实施方案中,所述寡核苷酸集合不包含人工片段化的核酸。在本文提供的方法的一些实施方案中,所述非宿主核酸选自致病性核酸、微生物核酸、细菌核酸、病毒核酸、真菌核酸、寄生生物核酸及其任意组合。在本文提供的方法的一些实施方案中,所述非宿主核酸为微生物核酸。在本文提供的方法的一些实施方案中,所述非宿主核酸为细菌核酸。在本文提供的方法的一些实施方案中,所述非宿主核酸为病毒核酸。
在又一个方面,本公开内容提供了一种富集来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品为来自所述宿主的单链核酸样品,并且包含宿主核酸和非宿主核酸;(b)使来自所述宿主的至少一部分单链核酸复性,从而在所述样品内产生双链核酸群体;以及(c)使用核酸酶去除所述样品中的至少一部分双链核酸,从而富集来自所述宿主的核酸样品中的非宿主序列。
在一些实施方案中,所述方法进一步包括进行测序分析。在一些实施方案中,来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。在一些实施方案中,所述宿主为人。在一些实施方案中,来自所述宿主的核酸样品为循环核酸样品。在一些实施方案中,来自所述宿主的核酸样品为循环无细胞核酸样品。在一些实施方案中,来自所述宿主的核酸样品选自血液、血浆、血清、唾液、脑脊髓液、滑液、灌洗液、尿液和粪便,诸如来自血液、血浆和血清。在一些实施方案中,所述核酸为DNA。在一些实施方案中,所述核酸为RNA。在一些实施方案中,所述方法进一步包括将单链宿主序列添加至来自所述宿主的单链核酸样品中。在一些实施方案中,所述方法进一步包括使用热使所述核酸样品中的至少一部分核酸变性以产生所述单链核酸样品。在一些实施方案中,所述使至少一部分核酸复性发生在设定的时间范围内。在一些实施方案中,所述使至少一部分核酸复性发生在96小时内。在一些实施方案中,所述复性包括在三甲基氯化铵的存在下复性。在一些实施方案中,所述核酸酶为双链体特异性核酸酶、BAL-31、双链特异性DNA酶或其组合。在一些实施方案中,所述核酸酶为双链体特异性核酸酶。在一些实施方案中,所述核酸酶为BAL-31。在一些实施方案中,所述核酸酶对双链核酸是活性的。在一些实施方案中,所述核酸酶对单链核酸是非活性的。在一些实施方案中,所述核酸不是人工片段化的。
在又一个方面,本公开内容提供了一种富集来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含与核小体相关的宿主核酸和非宿主核酸;以及(b)去除至少一部分所述与核小体相关的宿主核酸,从而富集来自所述宿主的核酸样品中的非宿主核酸。
在一些实施方案中,所述方法进一步包括进行测序分析。在一些实施方案中,来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。在一些实施方案中,所述宿主为人。在一些实施方案中,来自所述宿主的核酸样品为循环核酸样品。在一些实施方案中,来自所述宿主的核酸样品为循环无细胞核酸样品。在一些实施方案中,来自所述宿主的核酸样品选自血液、血浆、血清、唾液、脑脊髓液、滑液、灌洗液、尿液和粪便,诸如来自血液、血浆和血清。在一些实施方案中,步骤(b)中的所述去除包括进行电泳。在一些实施方案中,步骤(b)中的所述去除包括进行等速电泳。在一些实施方案中,步骤(b)中的所述去除包括使用多孔过滤器。在一些实施方案中,步骤(b)中的所述去除包括使用离子交换柱。在一些实施方案中,步骤(b)中的所述去除包括使用对一种或多种组蛋白具有特异性的一种或多种抗体。在一些实施方案中,所述一种或多种组蛋白选自组蛋白H2A N端、组蛋白H2A溶剂暴露表位、组蛋白H3中Lys9的单甲基化、组蛋白H3中Lys9的二甲基化、组蛋白H3中Lys56的三甲基化、组蛋白H2B中Ser14的磷酸化以及组蛋白H2A.X中Ser139的磷酸化。在一些实施方案中,所述一种或多种抗体固定在柱上。在一些实施方案中,所述方法进一步包括去除所述一种或多种抗体。
在另一个方面,本公开内容提供了一种富集来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含宿主核酸和非宿主核酸;以及(b)去除或分离具有一个或多个长度区间的DNA,从而富集来自所述宿主的核酸样品中的非宿主核酸。
在一些实施方案中,步骤(b)包括去除具有一个或多个长度区间的DNA。在一些实施方案中,步骤(b)包括分离具有一个或多个长度区间的DNA。在一些实施方案中,所述一个或多个长度区间选自约180个碱基对、约360个碱基对、约540个碱基对、约720个碱基对和约900个碱基对。在一些实施方案中,所述一个或多个长度区间选自约150个碱基对、约300个碱基对、约450个碱基对、约600个碱基对和约750个碱基对。在一些实施方案中,所述一个或多个长度区间选自约160个碱基对、约320个碱基对、约480个碱基对、约640个碱基对和约800个碱基对。在一些实施方案中,所述一个或多个长度区间选自约170个碱基对、约340个碱基对、约510个碱基对、约680个碱基对和约850个碱基对。在一些实施方案中,所述一个或多个长度区间选自约190个碱基对、约380个碱基对、约570个碱基对、约760个碱基对和约950个碱基对。在一些实施方案中,所述一个或多个长度区间选自150个碱基对或其倍数、160个碱基对或其倍数、170个碱基对或其倍数、190个碱基对或其倍数,及其任意组合。在一些实施方案中,步骤(b)包括去除长度大于约100、120、150、175、200、250、300、400或500个碱基的DNA。在一些实施方案中,步骤(b)包括分离长度至多约100、120、150、175、200、250或300个碱基的DNA。在一些实施方案中,步骤(b)包括分离长度为约10个碱基至约100个碱基、长度为约10个碱基至约120个碱基、长度为约10个碱基至约150个碱基、长度为约10个碱基至约175个碱基、长度为约10个碱基至约200个碱基、长度为约10个碱基至约250个碱基、长度为约10个碱基至约300个碱基、长度为约30个碱基至约100个碱基、长度为约30个碱基至约120个碱基、长度为约30个碱基至约150个碱基、长度为约30个碱基至约175个碱基、长度为约30个碱基至约200个碱基、长度为约30个碱基至约250个碱基或长度为约30个碱基至约300个碱基的DNA。
在一些实施方案中,所述方法进一步包括进行测序分析。在一些实施方案中,来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。在一些实施方案中,所述宿主为人。在一些实施方案中,来自所述宿主的核酸样品为循环核酸样品。在一些实施方案中,来自所述宿主的核酸样品为循环无细胞核酸样品。
在又一个方面,本公开内容提供了一种富集来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含宿主核酸、非宿主核酸和外来体;以及(b)去除或分离至少一部分外来体,从而富集来自所述宿主的核酸样品中的非宿主序列。
在一些实施方案中,步骤(b)包括去除至少一部分外来体。在一些实施方案中,步骤(b)包括分离至少一部分外来体。在一些实施方案中,所述方法进一步包括进行测序分析。在一些实施方案中,来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。在一些实施方案中,所述宿主为人。在一些实施方案中,来自所述宿主的核酸样品选自血液、血浆、血清、唾液、脑脊髓液、滑液、灌洗液、尿液和粪便,诸如来自血液、血浆和血清。在一些实施方案中,来自所述宿主的核酸样品为循环核酸样品。在一些实施方案中,来自所述宿主的核酸样品为循环无细胞核酸样品。在一些实施方案中,所述方法进一步包括去除所述外来体内的宿主核酸。在一些实施方案中,所述方法进一步包括分离非宿主核酸。在一些实施方案中,步骤(b)中的所述去除或分离包括去除或分离白细胞衍生的外来体。在一些实施方案中,所述白细胞为巨噬细胞。在一些实施方案中,步骤(b)中的所述去除或分离包括使用免疫沉淀来去除或分离所述白细胞衍生的外来体。
在本文提供的方法的一些实施方案中,所述方法进一步包括将一个或多个核酸条形码添加至一个或多个样品中。在本文提供的方法的一些实施方案中,所述方法进一步包括向所述样品中添加一个或多个核酸,所述核酸对一个或多个下述具有特异性:致病性基因座;抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生生物抗性标志物;提供信息的基因分型区;在两种或更多种微生物、病原体、细菌、病毒、真菌和/或寄生生物之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌和/或寄生生物所特有的序列。
在又一个方面,本公开内容提供了一种引发或捕获来自宿主的核酸样品中的序列的方法,所述方法包括:(a)提供来自所述宿主的核酸样品;(b)将来自所述宿主的核酸样品与对一个或多个感兴趣区域的核酸混合,从而获得混合物,所述感兴趣区域的核酸对一个或多个下述具有特异性:致病性基因座;抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生生物抗性标志物;提供信息的基因分型区;在两种或更多种微生物、病原体、细菌、病毒、真菌和/或寄生生物之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌和/或寄生生物所特有的序列;以及(c)在所述混合物内,使所述一个或多个感兴趣区域的核酸与所述核酸样品接触,其中所述接触导致所述核酸样品中的核酸与所述一个或多个感兴趣区域的核酸结合,从而引发或捕获所述核酸。
在一些实施方案中,所述方法进一步包括使用所述一个或多个核酸进行核酸扩增反应,所述核酸对一个或多个下述具有特异性:致病性基因座;抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生生物抗性标志物;提供信息的基因分型区;在两种或更多种微生物、病原体、细菌、病毒、真菌和/或寄生生物之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌和/或寄生生物所特有的序列进行核酸扩增反应。在一些实施方案中,所述核酸扩增反应包括聚合酶链反应、逆转录、转录介导的扩增或连接酶链反应。在一些实施方案中,所述方法进一步包括分离核酸,所述核酸对一个或多个下述具有特异性:致病性基因座;抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生生物抗性标志物;提供信息的基因分型区;在两种或更多种微生物、病原体、细菌、病毒、真菌和/或寄生生物之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌和/或寄生生物所特有的序列。在一些实施方案中,所述分离包括进行拉下实验。在一些实施方案中,所述方法进一步包括进行测序分析。在一些实施方案中,所述宿主为人。在一些实施方案中,来自所述宿主的核酸样品为循环核酸样品。在一些实施方案中,来自所述宿主的核酸样品为循环无细胞核酸样品。
在另一个方面,本公开内容提供了一种寡核苷酸集合,其包含与测序衔接子序列连接的至少1,000个寡核苷酸,其中特别地选择所述包含至少1,000个寡核苷酸的寡核苷酸集合,使得:(a)所述至少1,000个寡核苷酸中的每一个均包含核苷酸结构域;(b)所述核苷酸结构域具有10至20个核苷酸的长度;(c)每个具有10至20个核苷酸的长度的核苷酸结构域具有不同的核苷酸序列;并且(d)每个具有10至20个核苷酸的长度的核苷酸结构域不存在于一个或多个基因组中。
在一些实施方案中,所述至少1,000个寡核苷酸的长度不超过200个核苷酸。在一些实施方案中,所述一个或多个基因组为一个或多个哺乳动物基因组。在一些实施方案中,所述一个或多个哺乳动物基因组选自人基因组、狗基因组、猫基因组、啮齿类动物基因组、猪基因组、牛基因组、绵羊基因组、山羊基因组、兔基因组、马基因组及其任意组合。在一些实施方案中,所述一个或多个哺乳动物基因组为人基因组。在一些实施方案中,所述一个或多个基因组为一个基因组。在一些实施方案中,每个具有10至20个核苷酸的长度的核苷酸结构域的长度为12-15个核苷酸。在一些实施方案中,每个具有10至20个核苷酸的长度的核苷酸结构域的长度为13-15个核苷酸。在一些实施方案中,所述寡核苷酸为DNA寡核苷酸。在一些实施方案中,所述寡核苷酸为RNA寡核苷酸。在一些实施方案中,所述寡核苷酸为合成的寡核苷酸。在一些实施方案中,所述寡核苷酸不包含人工片段化的核酸。在一些实施方案中,所述寡核苷酸用核酸标记物、化学标记物或光学标记物进行标记。在一些实施方案中,所述至少1,000个寡核苷酸为至少5,000个寡核苷酸。在一些实施方案中,所述至少1,000个寡核苷酸为至少10,000个寡核苷酸。在一些实施方案中,所述至少1,000个寡核苷酸为至少100,000个寡核苷酸。在一些实施方案中,所述至少1,000个寡核苷酸为至少1,000,000个寡核苷酸。在一些实施方案中,所述至少1,000个寡核苷酸包含长度为10至20个核苷酸的核苷酸结构域,该核苷酸结构域具有存在于一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物基因组中的不同序列。
在又一个方面,本公开内容提供了一种产生寡核苷酸集合的方法,所述方法包括:(a)提供至少1,000个寡核苷酸,其中所述至少1,000个寡核苷酸包含具有不同序列的长度为10至20个核苷酸的核苷酸结构域;(b)提供来自宿主的核酸样品;(c)将所述至少1,000个寡核苷酸与来自所述宿主的核酸混合;以及(d)产生寡核苷酸集合,包括分离不与来自所述宿主的核酸杂交的所述至少1,000个寡核苷酸的至少一个子集。
在一些实施方案中,所述至少1,000个寡核苷酸具有至多200个核苷酸的长度。在一些实施方案中,所述核苷酸结构域的长度为12-15个核苷酸。在一些实施方案中,所述核苷酸结构域的长度为13-15个核苷酸。在一些实施方案中,所述寡核苷酸为DNA或RNA。在一些实施方案中,所述寡核苷酸为单链。在一些实施方案中,所述寡核苷酸为合成的寡核苷酸。在一些实施方案中,来自所述宿主的核酸用核酸标记物或化学标记物进行标记。在一些实施方案中,所述化学标记物为生物素。在一些实施方案中,步骤(d)的分离包括进行电泳。在一些实施方案中,步骤(d)的分离包括进行拉下实验。在一些实施方案中,所述方法进一步包括使用热使来自所述宿主的至少一部分核酸变性。
在又一个方面,本公开内容提供了一种产生寡核苷酸集合的方法,所述方法包括:(a)确定存在于选自基因组、外显子组和转录物组的背景群体中的长度为10至20个核苷酸的核苷酸结构域;以及(b)产生包含至少1,000个寡核苷酸的寡核苷酸集合,其中所述至少1,000个寡核苷酸包含长度为10至20个核苷酸的核苷酸结构域,该核苷酸结构域具有不存在于所述背景群体中的不同序列。
在一些实施方案中,所述至少1,000个寡核苷酸具有至多200个核苷酸的长度。在一些实施方案中,所述核苷酸结构域的长度为12-15个核苷酸。在一些实施方案中,所述核苷酸结构域的长度为13-15个核苷酸。在一些实施方案中,所述宿主为人。在一些实施方案中,所述背景群体为基因组。在一些实施方案中,所述背景群体为外显子组。在一些实施方案中,所述背景群体为转录物组。在一些实施方案中,所述确定以计算方式进行。
在另一个方面,本公开内容提供了一种鉴别宿主中的病原体的方法,所述方法包括:提供来自所述宿主的样品;相对于宿主来源的核酸对样品富集非宿主来源的核酸,其中所述富集包括优先从所述样品中去除长度大于约300个碱基的核酸;分析所述非宿主来源的核酸;以及从所述非宿主核酸鉴别所述宿主中的病原体。
在本文所述的方法的一些实施方案中,所述富集步骤包括优先去除所述样品中长度大于约120、约150、约200或约250个碱基的核酸。在本文所述的方法的一些实施方案中,所述富集步骤包括优先富集所述样品中长度为约10个碱基至约60个碱基、长度为约10个碱基至约120个碱基、长度为约10个碱基至约150个碱基、长度为约10个碱基至约300个碱基、长度为约30个碱基至约60个碱基、长度为约30个碱基至约120个碱基、长度为约30个碱基至约150个碱基、或长度为约30个碱基至约200个碱基、长度为约30个碱基至约300个碱基的核酸。在本文所述的方法的一些实施方案中,所述富集步骤包括优先消化宿主来源的核酸。在本文所述的方法的一些实施方案中,所述富集步骤包括优先复制所述非宿主来源的核酸。在本文所述的方法的一些实施方案中,使用与不存在于所述宿主来源的核酸中的一个或多个核苷酸结构域互补的一个或多个引发或捕获寡核苷酸优先复制所述非宿主核酸。在本文所述的方法的一些实施方案中,所述核苷酸结构域的长度为10至20个核苷酸。在本文所述的方法的一些实施方案中,所述核苷酸结构域的长度为12至15个核苷酸。在本文所述的方法的一些实施方案中,所述核苷酸结构域为13-聚体或14-聚体。在本文所述的方法的一些实施方案中,所述宿主为真核宿主。在本文所述的方法的一些实施方案中,所述宿主为脊椎动物宿主。在本文所述的方法的一些实施方案中,所述宿主为哺乳动物宿主。在本文所述的方法的一些实施方案中,所述非宿主DNA包含来自致病生物体的DNA。在本文所述的方法的一些实施方案中,所述样品包含血液或血浆样品。在本文所述的方法的一些实施方案中,所述样品为无细胞样品。在本文所述的方法的一些实施方案中,所述富集步骤将非宿主来源的核酸相对于宿主来源的核酸的比例提高了至少2X、至少3X、至少4X、至少5X、至少6X、至少7X、至少8X、至少9X、至少10X、至少11X、至少12X、至少13X、至少14X、至少15X、至少16X、至少17X、至少18X、至少19X、至少20X、至少30X、至少40X、至少50X、至少60X、至少70X、至少80X、至少90X、至少100X、至少1000X、至少5000X或至少10,000X。
在另一个方面,本公开内容提供了一种ultramer寡核苷酸,其在单个寡核苷酸中包含10个寡核苷酸序列,其中:(a)所述10个寡核苷酸序列中的每一个均被尿嘧啶残基或无嘌呤/无嘧啶位点隔开;(b)所述10个寡核苷酸序列中的每一个均包含核苷酸结构域;(c)所述核苷酸结构域具有10至20个核苷酸的长度;并且(d)每个具有10至20个核苷酸的长度的核苷酸结构域具有不同的核苷酸序列。在一些实施方案中,所述10个寡核苷酸序列的长度不超过200、150、100、50、40、30或20个核苷酸。在一些实施方案中,所述10个寡核苷酸序列具有相同的长度。在一些实施方案中,每个具有10至20个核苷酸的长度的核苷酸结构域不存在于一个或多个基因组中。在一些实施方案中,所述一个或多个基因组为一个或多个哺乳动物基因组。在一些实施方案中,所述一个或多个哺乳动物基因组选自人基因组、狗基因组、猫基因组、啮齿类动物基因组、猪基因组、牛基因组、绵羊基因组、山羊基因组、兔基因组、马基因组及其任意组合。在一些实施方案中,所述一个或多个哺乳动物基因组为人基因组。在一些实施方案中,所述一个或多个基因组为一个基因组。在一些实施方案中,每个具有10至20个核苷酸的长度的核苷酸结构域的长度为12-15个核苷酸。在一些实施方案中,每个具有10至20个核苷酸的长度的核苷酸结构域的长度为13-15个核苷酸。在一些实施方案中,每个具有10至20个核苷酸的长度的核苷酸结构域包含混合碱基。在一些实施方案中,每个具有10至20个核苷酸的长度的核苷酸结构域包含1个或多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、11个或更多个、12个或更多个、或13个或更多个混合碱基。在一些实施方案中,所述混合碱基选自N(A、C、G、T)、D(A、G、T)、V(A、C、G)、B(C、G、T)、H(A、C、T)、W(A、T)、S(C、G)、K(G、T)、M(A、C)、Y(C、T)、R(A、G)及其任意组合。在一些实施方案中,所述10个寡核苷酸序列具有相同的简并度。在一些实施方案中,所述10个寡核苷酸序列具有2、3、4、6、8、9、12、16、18、24、27、32、36、48、54、64、72、81、96、108、128、144、162、192、216、243或256的简并度。在一些实施方案中,所述10个寡核苷酸序列具有质因子(prime factor)选自2和3的简并度。在一些实施方案中,所述10个寡核苷酸序列为DNA。在一些实施方案中,所述10个寡核苷酸序列为RNA。在一些实施方案中,所述10个寡核苷酸序列是合成的。在一些实施方案中,所述ultramer寡核苷酸包含约或至少约10、20、30、40、50、60、70、80、90、100、200、300、400或500个寡核苷酸序列。在一些实施方案中,所述ultramer寡核苷酸包含至多约10、20、30、40、50、60、70、80、90、100、200、300、400或500个寡核苷酸序列。在一些实施方案中,所述10个寡核苷酸序列包含长度为10至20个核苷酸的核苷酸结构域,该核苷酸结构域具有存在于一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物基因组中的不同序列。
在另一个方面,本公开内容提供了一种产生寡核苷酸集合的方法,所述方法包括:(a)提供本文公开的ultramer寡核苷酸;以及(b)使所述ultramer寡核苷酸水解,从而产生寡核苷酸集合。在一些实施方案中,步骤(b)包括使所述ultramer中的无嘌呤/无嘧啶位点水解。在一些实施方案中,使用内切核酸酶IV或内切核酸酶VII进行步骤(b)。在一些实施方案中,所述方法进一步包括使所述ultramer寡核苷酸中的尿嘧啶残基水解以形成无嘌呤/无嘧啶位点。在一些实施方案中,所述使尿嘧啶残基水解使用尿嘧啶DNA糖基化酶来进行。在一些实施方案中,所述方法进一步包括对所述寡核苷酸集合中的寡核苷酸进行生物素化。在一些实施方案中,所述生物素化通过酶促(例如,使用T4多核苷酸激酶)或化学方式进行。在一些实施方案中,所述方法进一步包括将探针附接至所述寡核苷酸集合中的寡核苷酸。在一些实施方案中,所述探针为洋地黄毒苷或荧光探针。
援引并入
本说明书中提到的所有出版物、专利和专利申请均通过引用而整体并入本文,其引用程度如同特别地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。
附图说明
本发明的新颖特征在所附权利要求中特别地提出。通过参考以下对利用了本发明的原理的说明性实施方案进行阐述的详细描述以及附图,将获得对本发明的特征和优点的更好的理解,在附图中:
图1示出了使用寡核苷酸集合来富集核酸群体的引发策略。
图2示出了使用寡核苷酸集合来富集核酸群体的下拉策略。
图3示出了使用基于杂交的方法产生寡核苷酸集合的方法。
图4示出了核苷酸结构域的长度和序列覆盖率。大约96.5%的长度为13个核苷酸的核苷酸结构域为人核苷酸结构域。
图5示出了使用寡核苷酸集合的感兴趣群体的估计序列覆盖。大肠杆菌基因组的覆盖使用寡核苷酸集合示出,其中所述寡核苷酸包含长度为13个核苷酸的非人类核苷酸结构域。
图6示出了人无细胞DNA长度的周期性。
图7示出了核小体特异性抗体的核小体消耗。
图8A图示了无细胞DNA的量与宿主和非宿主无细胞DNA的DNA片段长度的图。图8B示出了短片段无细胞DNA的选择性富集过程的结果。
图9A示出了示例性的ultramer寡核苷酸设计。图9B示出了含有具有N混合碱基的寡核苷酸序列的ultramer寡核苷酸。图9C示出了含有具有两个N混合碱基的寡核苷酸序列的ultramer寡核苷酸。图9D示出了含有具有两个混合碱基的寡核苷酸序列的ultramer寡核苷酸。
图10A图示了从ultramer寡核苷酸产生寡核苷酸集合的反应方案。图10B示出了消化ultramer寡核苷酸后的消化反应产物的示例。
图11A示出了具有混合碱基位点的代表性寡核苷酸。图11B示出了根据简并度分组的非人13-聚体探针池的分析。
图12A提供了寡核苷酸的酶促生物素化过程的示意图。图12B提供了寡核苷酸的化学生物素化过程的示意图。
具体实施方式
总体概述
本公开内容提供了用于富集患者样品中的病原体核酸的新的快速的方法,其中所述患者自身的核酸构成了所述样品的压倒性高比例。由于本公开内容能够检测样品中的多种病原体核酸,因此即使在假设不知情的情况下,如在患者的照护者对患者可能已经感染了何种病原体没有清楚的想法或怀疑的情况下,也可以检测到病原体。通常,本文提供的组合物和方法被设计为富集含有核酸的生物样品,以便相比于来自宿主的核酸增加病原体核酸的表现度。样品内病原体核酸的富集可减少与所述样品的分析相关的时间和成本,特别是当分析涉及测序反应时。
本公开内容提供了几种进行富集的方式。在一些情况下,本公开内容提供了用于产生优先结合样品中的非宿主核酸组的新的寡核苷酸集合的方法。寡核苷酸集合可用于在多种不同类型的分子生物学测定中优先检测非宿主核酸。例如,寡核苷酸集合可用作引物延伸反应、PCR反应或逆转录反应中的引物。另外,寡核苷酸集合可以用于杂交和/或下拉实验以优先结合和分离病原体核酸。在一些情况下,寡核苷酸集合不仅可以用于富集病原体核酸,而且可以为这些核酸添加标签。
本文还提供了额外的富集技术;这些技术可以单独使用或与寡核苷酸集合或与另一种富集方法结合使用。这些额外的富集技术的实例包括:(a)自主杂交技术,其中核酸样品中的主要群体比所述样品中的次要群体更快地自杂交;(b)从游离DNA中消耗核小体相关的DNA;(c)去除和/或分离特定长度区间的DNA;(d)外来体消耗或富集;以及(e)策略性捕获感兴趣区域。
本文提供的富集方法特别适合于检测存在于感染患者血液样品中的微生物核酸,如循环或循环无细胞微生物核酸。它们在任何其他涉及检测主要群体占优势的混合物中的次要核酸群体的情况下也是有用的。
图1提供了本文公开的用于检测人类患者样品内的病原体或其他非人核酸的一般方法。在一些情况下,从感染(或疑似感染)病原体(例如,微生物、细菌、病毒、真菌或寄生生物)的人类患者(110)中获得血液样品(120)或血浆样品(130)。所述血液样品可含有核酸,如可与本文提供的寡核苷酸集合(150)接触的循环无细胞核酸(140)。所述寡核苷酸集合可优先与病原体或非人核酸序列(170)结合。所述寡核苷酸集合可与标记物(160)连接,所述标记物可包括核酸标记物、条形码、样品特异性条形码、通用引物序列、测序引物结合位点、能够扩增条形码的引物结合位点、与测序仪兼容的序列和/或衔接子(例如,测序衔接子)。在核酸样品包含RNA的一些情况下,所述寡核苷酸集合可用于从RNA模板(170)引发cDNA合成,以优先引发非宿主RNA。在一些情况下,可在引物延伸反应(170)中使用寡核苷酸集合以优先引发样品内的病原体DNA序列。所述引物延伸反应也可将突出端序列附加至所述病原体核酸。例如,可通过所述引物延伸反应将标记物(160)内的序列(例如,衔接子、条形码等)附加至所述病原体核酸。可进行PCR反应以制备最终文库(180),其可以经受测序分析(190)以帮助检测和鉴别样品内的病原体物种(195)。
图2示出了本文提供的涉及杂交和下拉步骤的另一种方法中的步骤。样品可以如图1所示提供(210、220、230)。所述样品可用于制备测序就绪文库,并且所述样品(240)内的核酸可用标记物(250)标记。所述样品可与寡核苷酸集合(260)接触,每个寡核苷酸均可与标记物(如生物素标签(270))缀合。所述寡核苷酸可与所述样品内的非人序列杂交(280、285),然后可在使用例如附接于固体支持体的抗生物素蛋白或链霉抗生物素蛋白的下拉实验(285)中优先进行下拉。然后可对所述文库进行测序(290)以鉴别感染宿主(例如,人)内的非宿主物种(例如,病原体)(295)。
本文提供的方法和组合物提供了许多优于目前检测复杂混合物中感兴趣核酸的次要群体的方法的优点。一个优点为它们通过减小文库大小或分析的序列读数的数目来减少测序成本。而且,使用靶向寡核苷酸如本文提供的寡核苷酸集合可以加快引发、捕获或扩增次要群体的过程,特别是在与其他方法(如依赖消耗背景群体核酸(例如,来自所述样品的人核酸)的方法)相比时。它们可用来显著提高检测样品中特定群体(例如,病原体或微生物)的灵敏度和特异性。此外,所述寡核苷酸集合可用来产生DNA或RNA测序文库;在一些情况下,它们可用来从相同的样品中产生DNA和RNA测序文库。因此,本文提供的方法和组合物提供了检测包括肺炎、结核、HIV感染、肝炎感染(例如,Hep A、B或C)、败血症、人乳头瘤病毒(HPV)感染、衣原体感染、梅毒感染、埃博拉感染、多重耐药感染、金黄色葡萄球菌感染、肠球菌感染和流感的新的有效方法。在另一个实例中,所述方法和组合物可用于监测可能经历或可能没有经历与感染相关的症状的宿主中一种或多种微生物(例如,在微生物组中)的存在。
用于序列富集的寡核苷酸集合
本公开内容提供了用于在复杂的核酸混合物中富集、捕获或引发核酸的特定群体(“感兴趣群体”)的寡核苷酸集合。所述感兴趣群体可以是包含宿主(例如,人)和非宿主核酸的群体中的非宿主核酸(例如,非人、微生物或病原体核酸)。通常,所述感兴趣群体构成复杂的核酸混合物的一小部分,该核酸混合物可包含构成复杂的核酸混合物的更大部分的另一个核酸群体(“背景”群体,例如宿主核酸)。在一些情况下,当所述感兴趣群体构成样品中总核酸的至多1%或0.1%时,本文提供的方法和组合物是特别有用的。
通常,本文提供的方法涉及使用寡核苷酸以引发、捕获或富集感兴趣群体。通常,所述感兴趣群体具有特定的属性或特征,并且所述寡核苷酸被设计为引发、捕获或富集感兴趣群体,而不设计为引发、捕获或富集可能占总核酸群体大部分的另一群体(例如,“背景”群体)。例如,所述感兴趣群体可以是包含宿主和非宿主核酸的群体中的非宿主(例如,非哺乳动物、非人、病原体、微生物、病毒、细菌、真菌或寄生生物)核酸的子集。在一些情况下,所述寡核苷酸可被设计为去除、隔离、分离或消耗背景群体(例如,人核酸),从而富集感兴趣群体(例如,非人核酸)。在一些情况下,所述寡核苷酸可包含具有可以匹配(完全或基本上)或可以与某些感兴趣序列群体(例如,非人核酸序列)互补(完全或基本上)的序列的核苷酸结构域。
本文提供的寡核苷酸集合可包含能够结合或识别感兴趣群体的核酸序列。所述寡核苷酸集合可用于特异性靶向和检测样品中的感兴趣群体,该样品例如包含来自背景群体(例如,宿主或人)和感兴趣群体(例如,非宿主或非人)的核酸的样品。例如,所述寡核苷酸集合可用作引物以特异性引发、捕获、扩增、复制或检测包含宿主和非宿主核酸的样品中的非宿主核酸。更具体地,在一些情况下,它们可用于从存在于样品中的RNA模板引发cDNA合成。在一些情况下,它们可用于引物延伸反应以将核酸标记物或序列附加至靶序列。在一些情况下,它们可用作饵剂以从DNA、cDNA或RNA的文库中捕获非宿主序列。所述引发的、扩增的或捕获的非宿主核酸可通过本领域已知的任何方法进行鉴别,如通过进行测序分析,特别是高通量测序分析、下一代(Next Generation)测序平台、大规模平行测序平台、纳米孔测序分析或本领域已知的另一种测序分析。
寡核苷酸集合可包含一个或多个寡核苷酸。在一些情况下,所述寡核苷酸集合可包含约100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;4×106;5×106;6×106;7×106;8×106;9×106;107;5×107;108;5×108;或109个寡核苷酸。在一些情况下,所述寡核苷酸集合可包含至多100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;4×106;5×106;6×106;7×106;8×106;9×106;107;5×107;108;5×108;或109个寡核苷酸。在一些情况下,所述寡核苷酸集合可包含至少100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;3.5×106;4×106;4.5×106;5×106;5.5×106;6×106;6.5×106;7×106;7.5×106;8×106;8.5×106;9×106;9.5×106;107;5×107;108;5×108;或109个寡核苷酸。
寡核苷酸集合中的寡核苷酸可具有相同或不同的长度。在一些情况下,所述寡核苷酸集合中的两个或更多个寡核苷酸具有相同的长度。在一些情况下,所述寡核苷酸集合中的所有寡核苷酸具有相同的长度。在一些情况下,所述寡核苷酸集合中的寡核苷酸具有不同的长度。在一些情况下,所述寡核苷酸集合中的寡核苷酸具有约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或20个不同的长度。在一些情况下,所述寡核苷酸集合中的寡核苷酸具有至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或20个长度。在一些情况下,所述寡核苷酸集合中的寡核苷酸具有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或20个长度。
在一些情况下,所述寡核苷酸的长度可为约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、400、500、600、700、800、900或1,000个核苷酸。在一些情况下,所述寡核苷酸的长度可为至多10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、400、500、600、700、800、900或1,000个核苷酸。在一些情况下,所述寡核苷酸的长度可为至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、400、500、600、700、800、900或1,000个核苷酸。在一些情况下,所述寡核苷酸的长度可为10-1,000、10-500、10-400、10-300、10-200、10-100、10-90、10-80、10-70、10-60、10-50、10-40、10-30、10-20、10-15、11-1,000、11-500、11-400、11-300、11-200、11-100、11-90、11-80、11-70、11-60、11-50、11-40、11-30、11-20、11-15、12-1,000、12-500、12-400、12-300、12-200、12-100、12-90、12-80、12-70、12-60、12-50、12-40、12-30、12-20、12-15、13-1,000、13-500、13-400、13-300、13-200、13-100、13-90、13-80、13-70、13-60、13-50、13-40、13-30、13-20、13-15、13-14、14-1,000、14-500、14-400、14-300、14-200、14-100、14-90、14-80、14-70、14-60、14-50、14-40、14-30、14-20或14-15个核苷酸。
寡核苷酸集合中的寡核苷酸可具有不同的核苷酸序列。在一些情况下,所述寡核苷酸集合可包含约100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;4×106;5×106;6×106;7×106;8×106;9×106;或107个具有不同核苷酸序列的寡核苷酸。在一些情况下,所述寡核苷酸集合可包含至多100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;4×106;5×106;6×106;7×106;8×106;9×106;或107个具有不同核苷酸序列的寡核苷酸。在一些情况下,所述寡核苷酸集合可包含至少100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;4×106;5×106;6×106;7×106;8×106;9×106;或107个具有不同核苷酸序列的寡核苷酸。
具有不同序列的寡核苷酸可以以多个拷贝存在于寡核苷酸集合中。寡核苷酸集合可含有具有相同核苷酸序列的寡核苷酸。在一些情况下,所述寡核苷酸集合可包含相同核苷酸序列的约1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;150;200;250;300;350;400;450;500;600;700;800;900或1,000个拷贝。在一些情况下,所述寡核苷酸集合可包含相同核苷酸序列的至多1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;150;200;250;300;350;400;450;500;600;700;800;900或1,000个拷贝。在一些情况下,所述寡核苷酸集合可包含相同核苷酸序列的至少1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;150;200;250;300;350;400;450;500;600;700;800;900或1,000个拷贝。
在一些情况下,所述寡核苷酸集合内的一个或多个寡核苷酸未被标记;在一些情况下,所述寡核苷酸集合内的一个或多个寡核苷酸被标记。在一些情况下,一个或多个寡核苷酸例如用核酸标记物、化学标记物或光学标记物进行标记。在一些情况下,一个或多个寡核苷酸与固体支持体缀合。在一些情况下,一个或多个寡核苷酸不与固体支持体缀合。在一些情况下,标记物可以附接在寡核苷酸的5’或3’端或寡核苷酸内部。在一些情况下,所述寡核苷酸集合内的一个或多个寡核苷酸用多于一个标记物进行标记。
寡核苷酸可包含核酸标记物。在一些情况下,核酸标记物可包括以下的一种或多种:条形码(例如,样品条形码)、通用引物序列、引物结合位点(例如,用于测序或读取条形码,包括但不限于DNA测序引物结合位点、样品条形码测序引物结合位点和与各种测序平台要求兼容的扩增引物结合位点)、与测序仪兼容的序列、附接到测序平台的序列、测序衔接子序列或衔接子。核酸标记物可附接到所述寡核苷酸上(例如,通过连接或通过合成设计)。在一些情况下,核酸标记物的长度被包含在寡核苷酸的长度中。在一些情况下,核酸标记物的长度不包含在寡核苷酸的长度中。
寡核苷酸可包含化学标记物。化学标记物的一些非限制性实例包括生物素、抗生物素蛋白、链霉抗生物素蛋白、放射性标记物、多肽和聚合物。寡核苷酸可包含光学标记物。光学标记物的一些非限制性实例包括荧光团、荧光蛋白、染料和量子点。寡核苷酸可与固体支持体缀合。在一些情况下,寡核苷酸不与固体支持体缀合。固体支持体的一些非限制性实例包括珠、磁珠、聚合物、载玻片、芯片、表面、板、通道、盒、微流体装置和微阵列。一种或多种寡核苷酸可与用于亲和色谱法的固体支持体缀合。在一些情况下,每个寡核苷酸具有不同的标记物。在一些情况下,每个寡核苷酸具有相同的标记物。在一些情况下,寡核苷酸的每个拷贝具有相同的标记物。在一些情况下,每个具有不同序列的寡核苷酸具有不同的标记物。
本文提供的寡核苷酸通常包含一个或多个核苷酸。在一些情况下,核苷酸可为脱氧核糖核苷酸(例如,A、C、G或T)、核糖核苷酸(例如,A、C、G或U)、修饰的核苷酸或合成的核苷酸。在一些情况下,寡核苷酸可包含DNA、RNA、cDNA、dsDNA、ssDNA、mRNA或cRNA。在一些情况下,寡核苷酸可包含DNA或RNA。在一些情况下,寡核苷酸可包含DNA和RNA。在一些情况下,寡核苷酸可包含DNA。在一些情况下,寡核苷酸可包含RNA。在一些情况下,寡核苷酸可包含修饰的或合成的核苷酸。在一些情况下,寡核苷酸可包含一个或多个修饰或合成的核酸,如肽核酸(PNA)、锁核酸(LNA)或桥接核酸(BNA)。在一些情况下,寡核苷酸可包含DNA、RNA、PNA、LNA、BNA或其任意组合。在一些情况下,寡核苷酸不包含人工片段化的核酸。在一些情况下,寡核苷酸集合不包含人工片段化的核酸。在一些情况下,寡核苷酸包含合成的核酸(例如,通过DNA合成)。在一些情况下,寡核苷酸集合包含合成的核酸(例如,通过DNA合成)。在一些情况下,寡核苷酸集合可被冻干或干燥。在一些情况下,寡核苷酸集合可包含水或缓冲溶液(例如,水性缓冲溶液)。
在一些情况下,所述寡核苷酸可包含约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、400、500、600、700、800、900、1,000个或更多个PNA、LNA和/或BNA连接。在一些情况下,所述寡核苷酸可包含约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的PNA、LNA和/或BNA连接。
核苷酸结构域
寡核苷酸可包含一个或多个核苷酸结构域。在一些情况下,所述寡核苷酸包含一个核苷酸结构域。在一些情况下,所述核苷酸结构域为所述寡核苷酸。在一些情况下,具有不同核苷酸序列的寡核苷酸的部分出现在核苷酸结构域内。在一些情况下,具有不同核苷酸序列的寡核苷酸的部分构成整个寡核苷酸。在一些情况下,具有不同核苷酸序列的寡核苷酸的部分构成所述寡核苷酸的子集(如所述寡核苷酸内的核苷酸结构域)。在一些情况下,寡核苷酸集合可包含寡核苷酸,其中所述寡核苷酸包含具有不同序列的核苷酸结构域,其中所述寡核苷酸可以以多个拷贝存在。在一些情况下,核苷酸结构域不包含人工片段化的核酸。在一些情况下,核苷酸结构域是合成的(例如,通过DNA合成)。
在一些情况下,寡核苷酸集合可包含寡核苷酸,其中每个寡核苷酸包含具有不同核苷酸序列的核苷酸结构域。在一些情况下,所述寡核苷酸集合可包含约100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;4×106;5×106;6×106;7×106;8×106;9×106;或107个寡核苷酸,其中每个寡核苷酸包含具有不同核苷酸序列的核苷酸结构域。在一些情况下,所述寡核苷酸集合可包含至多100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;4×106;5×106;6×106;7×106;8×106;9×106;或107个寡核苷酸,其中每个寡核苷酸包含具有不同核苷酸序列的核苷酸结构域。在一些情况下,所述寡核苷酸集合可包含至少100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;106;1.1×106;1.2×106;1.3×106;1.4×106;1.5×106;1.6×106;1.7×106;1.8×106;1.9×106;2×106;2.1×106;2.2×106;2.3×106;2.4×106;2.5×106;2.6×106;2.7×106;2.8×106;2.9×106;3×106;4×106;5×106;6×106;7×106;8×106;9×106;或107个寡核苷酸,其中每个寡核苷酸包含具有不同核苷酸序列的核苷酸结构域。
寡核苷酸集合中的寡核苷酸可包含具有相同核苷酸序列的核苷酸结构域。在一些情况下,所述寡核苷酸集合可包含约1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;150;200;250;300;350;400;450;500;600;700;800;900或1,000个含有具有相同核苷酸序列的核苷酸结构域的寡核苷酸。在一些情况下,所述寡核苷酸集合可包含至多1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;150;200;250;300;350;400;450;500;600;700;800;900或1,000个含有具有相同核苷酸序列的核苷酸结构域的寡核苷酸。在一些情况下,所述寡核苷酸集合可包含至少1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;150;200;250;300;350;400;450;500;600;700;800;900或1,000个含有具有相同核苷酸序列的核苷酸结构域的寡核苷酸。
在一些情况下,寡核苷酸集合中的每个寡核苷酸可包含不存在于一个或多个背景群体中的核苷酸结构域。在一些情况下,寡核苷酸集合中的每个寡核苷酸可以包含不存在于宿主基因组、外显子组或转录物组中的核苷酸结构域。在一些情况下,寡核苷酸集合中的每个寡核苷酸可以包含不存在于一个或多个脊椎动物基因组、外显子组或转录物组中的核苷酸结构域。在一些情况下,寡核苷酸集合中的每个寡核苷酸可以包含不存在于一个或多个哺乳动物基因组、外显子组或转录物组中的核苷酸结构域。在一些情况下,寡核苷酸集合中的每个寡核苷酸可以包含不存在于一个或多个人基因组、外显子组或转录物组中的核苷酸结构域。在一些情况下,寡核苷酸集合中的每个寡核苷酸可以包含不存在于一个或多个人基因组、外显子组或转录物组和一个或多个细菌基因组、外显子组或转录物组中的核苷酸结构域。在一些情况下,寡核苷酸集合中的每个寡核苷酸可以包含不存在于一个或多个人基因组、外显子组或转录物组和一个或多个病毒基因组、外显子组或转录物组中的核苷酸结构域。
在一些情况下,所述核苷酸结构域可包含与一个或多个感兴趣群体相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含与感兴趣群体的子集相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含与感兴趣群体中约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核酸相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含与感兴趣群体中至多0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核酸相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含与感兴趣群体中至少0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核酸相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含核苷酸序列,其中约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核苷酸序列与感兴趣群体中的核酸相同、几乎相同、互补或几乎互补。在一些情况下,所述核苷酸结构域可包含核苷酸序列,其中至多0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核苷酸序列与感兴趣群体中的核酸相同、几乎相同、互补或几乎互补。在一些情况下,所述核苷酸结构域可包含核苷酸序列,其中至少0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核苷酸序列与感兴趣群体中的核酸相同、几乎相同、互补或几乎互补。在一些情况下,所述核苷酸结构域可包含不与一个或多个感兴趣群体相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可保留感兴趣群体的覆盖,如图4和图5所示。
在一些情况下,所述核苷酸结构域可包含不与一个或多个背景群体相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含不与背景群体的子集相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含不与背景群体中约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核酸相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含不与背景群体中至多0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核酸相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含不与背景群体中至少0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核酸相同、几乎相同、互补或几乎互补的核苷酸序列。在一些情况下,所述核苷酸结构域可包含核苷酸序列,其中约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核苷酸序列不与背景群体中的核酸相同、几乎相同、互补或几乎互补。在一些情况下,所述核苷酸结构域可包含核苷酸序列,其中至多0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核苷酸序列不与背景群体中的核酸相同、几乎相同、互补或几乎互补。在一些情况下,所述核苷酸结构域可包含核苷酸序列,其中至少0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的核苷酸序列不与背景群体中的核酸相同、几乎相同、互补或几乎互补。在一些情况下,所述核苷酸结构域可包含与一个或多个背景群体相同、几乎相同、互补或几乎互补的核苷酸序列。
在一些情况下,所述核苷酸结构域可包含以错配与一个或多个背景群体核酸结合的核苷酸序列。在一些情况下,所述核苷酸结构域可包含以1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个错配与一个或多个背景群体核酸结合的核苷酸序列。在一些情况下,所述核苷酸结构域可包含以至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个错配与一个或多个背景群体核酸结合的核苷酸序列。在一些情况下,所述核苷酸结构域可包含以至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个错配与一个或多个背景群体核酸结合的核苷酸序列。
核苷酸结构域可为一个或多个长度。在一些情况下,核苷酸结构域为单一长度。在一些情况下,核苷酸结构域为不同长度。在一些情况下,所述核苷酸结构域的长度可为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。在一些情况下,所述核苷酸结构域的长度为13或14个核苷酸。在一些情况下,所述核苷酸结构域的长度为13个核苷酸。在一些情况下,所述核苷酸结构域的长度为14个核苷酸。在一些情况下,所述核苷酸结构域的长度可为至多10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。在一些情况下,所述核苷酸结构域的长度为至多13或14个核苷酸。在一些情况下,所述核苷酸结构域的长度为至多13个核苷酸。在一些情况下,所述核苷酸结构域的长度为至多14个核苷酸。在一些情况下,所述核苷酸结构域的长度可为至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。在一些情况下,所述核苷酸结构域的长度为至少13或14个核苷酸。在一些情况下,所述核苷酸结构域的长度为至少13个核苷酸。在一些情况下,所述核苷酸结构域的长度为至少14个核苷酸。在一些情况下,所述核苷酸结构域的长度可为10-20、11-20、12-20、13-20、14-20、10-19、10-18、10-17、10-16、10-15、10-14、10-13、11-19、12-19、13-19、14-19、11-18、11-17、11-16、11-15、11-14、11-13、12-18、12-17、12-16、12-15、12-14、12-13、13-18、13-17、13-16、13-15、13-14、14-18、14-17、14-16或14-15个核苷酸。在一些情况下,所述核苷酸结构域的长度为12-15个核苷酸。在一些情况下,所述核苷酸结构域的长度为13-15个核苷酸。在一些情况下,所述核苷酸结构域的长度为13-14个核苷酸。在一些情况下,所述核苷酸结构域为k-聚体,诸如10-聚体、11-聚体、12-聚体、13-聚体、14-聚体、15-聚体、16-聚体、17-聚体、18-聚体、19-聚体、20-聚体、21-聚体、22-聚体、23-聚体、24-聚体或25-聚体。在一些情况下,所述核苷酸结构域为13-聚体或14-聚体。在一些情况下,所述核苷酸结构域为13-聚体。在一些情况下,所述核苷酸结构域为14-聚体。
背景群体
如本文所使用的,背景群体通常为不是感兴趣群体的群体。核酸的背景群体可用于产生寡核苷酸集合。例如,核酸的背景群体可用于产生能够与感兴趣群体杂交的寡核苷酸集合(例如,背景群体核酸可以用作“饵剂”以从起始异质寡核苷酸集合中钓出寡核苷酸)。在一些情况下,背景群体为样品中的核酸群体。本文提供的方法和组合物可用于优先去除或分离样品中的核酸的背景群体;在一些情况下,所述方法和组合物可以用于以优先的方式特异性地靶向感兴趣群体,使得感兴趣群体(而不一定是背景群体)被分离、去除或检测。
在一些情况下,所述背景群体可衍生自宿主生物体或宿主的基因组、外显子组或转录物组中的序列(例如含有存在于宿主生物体或宿主的基因组、外显子组或转录物组中的序列或与该序列相同、几乎相同、互补或几乎互补的序列)。在一些情况下,宿主可为哺乳动物、人、非人哺乳动物、驯养动物(例如,实验室动物、家庭宠物或家畜)或非驯养动物(例如,野生动物)。在一些情况下,所述宿主可为狗、猫、啮齿类动物、小鼠、仓鼠、牛、鸟、鸡、猪、马、山羊、绵羊、兔、微生物、病原体、细菌、病毒、真菌或寄生生物。在一些情况下,所述宿主为哺乳动物。在一些情况下,所述宿主为人。所述宿主可为患者。在一些情况下,所述宿主可用抗微生物剂、抗细菌剂、抗病毒剂或抗寄生生物药物进行治疗。在一些情况下,所述宿主可能已经或可能用抗微生物剂、抗细菌剂、抗病毒剂或抗寄生生物药物进行治疗。在一些情况下,所述宿主被(例如,一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物)感染。在一些情况下,所述宿主没有被(例如,一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物)感染。在一些情况下,所述宿主是健康的。在一些情况下,所述宿主是易感的或处于感染的风险下。
在一些情况下,所述背景群体可衍生自狗、猫、啮齿类动物、小鼠、仓鼠、牛、鸟、鸡、猪、马、山羊、绵羊、兔、微生物、病原体、细菌、病毒、真菌或寄生生物。在一些情况下,所述背景群体为哺乳动物。在一些情况下,所述背景群体为人。在一些情况下,所述背景群体可衍生自宿主。在一些情况下,所述背景群体含有多个群体,诸如人和微生物核酸群体(例如,单独的人、人和病毒、人和细菌、人和真菌、人和寄生生物等)。
在一些情况下,所述背景群体可为一个或多个基因组、外显子组和/或转录物组。在一些情况下,所述背景群体可为约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个基因组、外显子组和/或转录物组。在一些情况下,所述背景群体可为至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个基因组、外显子组和/或转录物组。在一些情况下,所述背景群体可为至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个基因组、外显子组和/或转录物组。
在一些情况下,所述背景群体可为来自同一物种的多个个体哺乳动物的哺乳动物基因组、外显子组或转录物组。在一些情况下,所述背景群体可为来自一个或多个物种的多个个体哺乳动物的哺乳动物基因组、外显子组或转录物组。在一些情况下,所述背景群体可为来自同一物种的一只或多只雄性哺乳动物和一只或多只雌性哺乳动物的哺乳动物基因组、外显子组或转录物组。所述背景群体可为哺乳动物基因组DNA和哺乳动物RNA。在一些情况下,所述背景群体可为哺乳动物基因组、外显子组或转录物组以及一个或多个微生物基因组、外显子组或转录物组。在一些情况下,所述背景群体可为哺乳动物基因组、外显子组或转录物组以及一个或多个病原体基因组、外显子组或转录物组。在一些情况下,所述背景群体可为哺乳动物基因组、外显子组或转录物组以及一个或多个细菌基因组、外显子组或转录物组。在一些情况下,所述背景群体可为哺乳动物基因组、外显子组或转录物组以及一个或多个病毒基因组、外显子组或转录物组。在一些情况下,所述背景群体可为哺乳动物基因组、外显子组或转录物组以及一个或多个逆转录病毒基因组、外显子组或转录物组。在一些情况下,所述背景群体可为哺乳动物基因组、外显子组或转录物组以及一个或多个病毒基因组、外显子组或转录物组以及一个或多个细菌基因组、外显子组或转录物组。在一些情况下,所述背景群体可为哺乳动物基因组、外显子组或转录物组以及一个或多个寄生生物基因组、外显子组或转录物组。在一些情况下,一个或多个可为约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。在一些情况下,一个或多个可为至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。在一些情况下,一个或多个可为至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。在一些情况下,所述哺乳动物基因组、外显子组或转录物组为非人基因组、外显子组或转录物组。
在一些情况下,所述哺乳动物基因组、外显子组或转录物组为人基因组、外显子组或转录物组。在一些情况下,所述背景群体为人基因组、外显子组或转录物组。在一些情况下,所述背景群体可为来自多个个体人类的人基因组、外显子组或转录物组。在一些情况下,所述背景群体可为来自一个或多个男性和一个或多个女性人类的人基因组、外显子组或转录物组。所述背景群体可为人基因组DNA和人RNA。在一些情况下,所述背景群体可为人基因组、外显子组或转录物组以及一个或多个微生物基因组、外显子组或转录物组。在一些情况下,所述背景群体可为人基因组、外显子组或转录物组以及一个或多个病原体基因组、外显子组或转录物组。在一些情况下,所述背景群体可为人基因组、外显子组或转录物组以及一个或多个细菌基因组、外显子组或转录物组。在一些情况下,所述背景群体可为人基因组、外显子组或转录物组以及一个或多个病毒基因组、外显子组或转录物组。在一些情况下,所述背景群体可为人基因组、外显子组或转录物组以及一个或多个逆转录病毒基因组、外显子组或转录物组。在一些情况下,所述背景群体可为人基因组、外显子组或转录物组以及一个或多个病毒基因组、外显子组或转录物组以及一个或多个细菌基因组、外显子组或转录物组。在一些情况下,所述背景群体可为人基因组、外显子组或转录物组以及一个或多个寄生生物基因组、外显子组或转录物组。在一些情况下,一个或多个可为约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。在一些情况下,一个或多个可为至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。在一些情况下,一个或多个可为至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。
在一些情况下,所述背景群体可包含约0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的基因组、外显子组或转录物组。在一些情况下,所述背景群体可包含至多0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的基因组、外显子组或转录物组。在一些情况下,所述背景群体可包含至少0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的基因组、外显子组或转录物组。
在一些情况下,所述背景群体可包含样品中约0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的总核酸群体。在一些情况下,所述背景群体可包含样品中至多0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的总核酸群体。在一些情况下,所述背景群体可包含样品中至少0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的总核酸群体。
在一些情况下,所述背景群体可包含DNA、RNA、cDNA、mRNA、cRNA、dsDNA、ssDNA、miRNA、循环核酸、循环DNA、循环RNA、无细胞核酸、无细胞DNA、无细胞RNA、循环无细胞DNA、循环无细胞RNA或基因组DNA。所述背景群体可为DNA和RNA的混合物。所述背景群体可为基因组DNA。在一些情况下,所述背景群体包含人工片段化的核酸。在一些情况下,所述背景群体不包含人工片段化的核酸。在一些情况下,所述背景群体包含合成的核酸(例如,通过DNA合成)。在一些情况下,所述背景群体核酸是合成的(例如,通过DNA合成)。在一些情况下,所述背景群体可为基因组、外显子组或转录物组。
在一些情况下,背景群体中的一个或多个核酸未被标记;在一些情况下,背景群体中的一个或多个核酸被标记。在一些情况下,背景群体中的一个或多个核酸例如用核酸标记物、化学标记物或光学标记物进行标记。在一些情况下,背景群体中的一个或多个核酸与固体支持体缀合。在一些情况下,标记物可以附接在背景群体中的核酸的5’或3’端或背景群体中的核酸的内部。在一些情况下,背景群体中的一个或多个核酸用多于一个标记物进行标记。
背景群体中的核酸可包含核酸标记物。在一些情况下,核酸标记物可包括以下的一种或多种:条形码(例如,样品条形码)、通用引物序列、引物结合位点(例如,用于测序或读取条形码,包括但不限于DNA测序引物结合位点、样品条形码测序引物结合位点和与各种测序平台要求兼容的扩增引物结合位点)、与测序仪兼容的序列、附接到测序平台的序列、测序衔接子序列或衔接子。核酸标记物可附接到背景群体中的核酸上(例如,通过连接或通过合成设计)。在一些情况下,核酸标记物的长度被包含在背景群体中的核酸的长度中。在一些情况下,核酸标记物的长度没有被包含在背景群体中的核酸的长度中。
背景群体中的核酸可包含化学标记物。化学标记物的一些非限制性实例包括生物素、抗生物素蛋白、链霉抗生物素蛋白、放射性标记物、多肽和聚合物。背景群体中的核酸可包含光学标记物。光学标记物的一些非限制性实例包括荧光团、荧光蛋白、染料和量子点。背景群体中的核酸可与固体支持体缀合。固体支持体的一些非限制性实例包括珠、磁珠、聚合物、载玻片、芯片、表面、板、通道、盒、微流体装置和微阵列。背景群体中的核酸可与用于亲和色谱法的固体支持体缀合。在一些情况下,背景群体中的每个核酸具有不同的标记物。在一些情况下,背景群体中的每个核酸具有相同的标记物。在一些情况下,背景群体中的核酸的每个拷贝具有相同的标记物。在一些情况下,具有不同序列的背景群体中的每个核酸具有不同的标记物。
感兴趣群体
通常,感兴趣群体为具有使其区别于更大群体的其他部分的一些特征的群体。感兴趣群体可为存在于宿主和非宿主核酸的复杂混合物中的非宿主核酸(例如,细菌核酸)。
在一些情况下,所述感兴趣群体可包含DNA、RNA、cDNA、mRNA、cRNA、dsDNA、ssDNA、miRNA、循环核酸、循环DNA、循环RNA、无细胞核酸、无细胞DNA、无细胞RNA、循环无细胞DNA、循环无细胞RNA或基因组DNA。所述感兴趣群体可为DNA和RNA的混合物。所述感兴趣群体可为基因组DNA。在一些情况下,所述感兴趣群体包含人工片段化的核酸。在一些情况下,所述感兴趣群体不包含人工片段化的核酸。在一些情况下,所述感兴趣群体包含合成的核酸(例如,通过DNA合成)。在一些情况下,所述感兴趣群体是合成的(例如,通过DNA合成)。在一些情况下,所述感兴趣群体可为基因组、外显子组或转录物组。
在一些情况下,所述感兴趣群体为非宿主。在一些情况下,非宿主是指所述宿主以外的生物体。在一些情况下,非宿主是指所述宿主以外的物种。在一些情况下,非宿主可指与宿主相同物种的其他生物体。在一些情况下,非宿主可为非哺乳动物、非人、非狗、非猫、非啮齿类动物、非小鼠、非仓鼠、非牛、非鸟、非鸡、非猪、非马、非山羊、非绵羊或非兔子。在一些情况下,非宿主可为微生物、病原体、细菌、病毒、真菌、寄生生物或其组合。在一些情况下,非宿主为非哺乳动物。在一些情况下,非宿主为非人。在一些情况下,非宿主为非患者。
在一些情况下,所述感兴趣群体可为非哺乳动物或非人。在一些情况下,所述感兴趣群体可为微生物、细菌、病毒、真菌、逆转录病毒、病原体或寄生生物。在一些情况下,所述感兴趣群体可为非微生物、非细菌、非病毒、非真菌、非逆转录病毒、非病原体或非寄生生物。在一些情况下,所述感兴趣群体可衍生自微生物、病原体、细菌、病毒、真菌或寄生生物。在一些情况下,所述感兴趣群体为非哺乳动物。在一些情况下,所述感兴趣群体为非人。在一些情况下,所述感兴趣群体可衍生自感染微生物或病原体的宿主。在一些情况下,所述感兴趣群体可为非哺乳动物DNA或RNA。在一些情况下,所述感兴趣群体可为非人DNA或RNA。在一些情况下,所述感兴趣群体可为微生物、细菌、病毒、真菌、逆转录病毒、病原体或寄生生物DNA或RNA。在一些情况下,所述感兴趣群体可为非微生物、非细菌、非病毒、非真菌、非逆转录病毒、非病原体或非寄生生物DNA或RNA。
在一些情况下,所述感兴趣群体可包含一个或多个非宿主基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含约1;2;3;4;5;6;7;8;9;10;15;20;25;30;35;40;45;50;60;70;80;90;100;500;1,000;5,000;10,000;50,000或100,000个非宿主基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含至多1;2;3;4;5;6;7;8;9;10;15;20;25;30;35;40;45;50;60;70;80;90;100;500;1,000;5,000;10,000;50,000或100,000个非宿主基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含至少1;2;3;4;5;6;7;8;9;10;15;20;25;30;35;40;45;50;60;70;80;90;100;500;1,000;5,000;10,000;50,000或100,000个非宿主基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含来自相同非哺乳动物物种的多个个体的非哺乳动物基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含来自一个或多个非哺乳动物物种的多个个体的非哺乳动物基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含非哺乳动物基因组DNA和非哺乳动物RNA。在一些情况下,所述感兴趣群体可包含一个或多个微生物基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含一个或多个病原体基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含一个或多个细菌基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含一个或多个病毒基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含一个或多个逆转录病毒基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含一个或多个病毒基因组、外显子组或转录物组以及一个或多个细菌基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含一个或多个寄生生物基因组、外显子组或转录物组。在一些情况下,一个或多个可为约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。在一些情况下,一个或多个可为至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。在一些情况下,一个或多个可为至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90或100个。在一些情况下,所述非哺乳动物基因组、外显子组或转录物组为非人基因组、外显子组或转录物组。在一些情况下,所述非哺乳动物基因组、外显子组或转录物组为微生物、细菌、病毒、真菌、逆转录病毒、病原体或寄生生物基因组、外显子组或转录物组。
感兴趣群体可包含基因组、外显子组或转录物组的一部分。在一些情况下,所述感兴趣群体可包含约0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含至多0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的基因组、外显子组或转录物组。在一些情况下,所述感兴趣群体可包含至少0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的基因组、外显子组或转录物组。
感兴趣群体可占样品中总核酸群体的一部分。在一些情况下,所述感兴趣群体可包含样品中约0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%或50%的总核酸群体。在一些情况下,所述感兴趣群体可包含样品中至多0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%或50%的总核酸群体。在一些情况下,所述感兴趣群体可包含样品中至少0.000001%、0.000005%、0.00001%、0.00005%、0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%或50%的总核酸群体。
所述背景群体核酸可相对于样品中的感兴趣群体的核酸过量存在。背景群体与感兴趣群体的核酸的比例可为约1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;2,000,000;3,000,000;4,000,000;5,000,000;6,000,000;7,000,000;8,000,000;9,000,000;或10,000,000。背景群体与感兴趣群体的核酸的比例可为至多1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;2,000,000;3,000,000;4,000,000;5,000,000;6,000,000;7,000,000;8,000,000;9,000,000;或10,000,000。背景群体与感兴趣群体的核酸的比例可为至少1;2;3;4;5;6;7;8;9;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000;200,000;300,000;400,000;500,000;600,000;700,000;800,000;900,000;1,000,000;2,000,000;3,000,000;4,000,000;5,000,000;6,000,000;7,000,000;8,000,000;9,000,000;或10,000,000。所述比例可根据浓度、摩尔数或质量来计算。
感兴趣群体可包含衍生自一个或多个物种的核酸。在一些情况下,所述感兴趣群体可包含衍生自约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1,000、5,000、10,000、50,000或100,000个物种的核酸。在一些情况下,所述感兴趣群体可包含衍生自至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1,000、5,000、10,000、50,000或100,000个物种的核酸。在一些情况下,所述感兴趣群体可包含衍生自至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1,000、5,000、10,000、50,000或100,000个物种的核酸。在一些情况下,所述物种为非哺乳动物物种。在一些情况下,所述物种为非人物种。在一些情况下,所述物种为微生物、细菌、病毒、真菌、逆转录病毒、病原体或寄生生物。在一些情况下,所述感兴趣群体可包含衍生自约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌或病毒物种的核酸。在一些情况下,所述感兴趣群体可包含衍生自至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌或病毒物种的核酸。在一些情况下,所述感兴趣群体可包含衍生自至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌或病毒物种的核酸。在一些情况下,所述感兴趣群体可包含衍生自约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌和病毒物种的至少一种核酸。在一些情况下,所述感兴趣群体可包含衍生自至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌和病毒物种的至少一种核酸。在一些情况下,所述感兴趣群体可包含衍生自至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌和病毒物种的至少一种核酸。在一些情况下,所述感兴趣群体可包含衍生自约1个细菌物种和1个病毒物种、2个细菌物种和2个病毒物种、3个细菌物种和3个病毒物种、4个细菌物种和4个病毒物种、5个细菌物种和5个病毒物种、6个细菌物种和6个病毒物种、7个细菌物种和7个病毒物种、8个细菌物种和8个病毒物种、9个细菌物种和9个病毒物种、10个细菌物种和10个病毒物种、15个细菌物种和15个病毒物种、20个细菌物种和20个病毒物种、25个细菌物种和25个病毒物种、30个细菌物种和30个病毒物种、35个细菌物种和35个病毒物种、40个细菌物种和40个病毒物种、45个细菌物种和45个病毒物种、50个细菌物种和50个病毒物种、60个细菌物种和60个病毒物种、70个细菌物种和70个病毒物种、80个细菌物种和80个病毒物种、90个细菌物种和90个病毒物种、100个细菌物种和100个病毒物种、200个细菌物种和200个病毒物种、300个细菌物种和300个病毒物种、400个细菌物种和400个病毒物种、500个细菌物种和500个病毒物种或1,000个细菌物种和1,000个病毒物种的至少一种核酸。在一些情况下,所述感兴趣群体可包含衍生自至多1个细菌物种和1个病毒物种、2个细菌物种和2个病毒物种、3个细菌物种和3个病毒物种、4个细菌物种和4个病毒物种、5个细菌物种和5个病毒物种、6个细菌物种和6个病毒物种、7个细菌物种和7个病毒物种、8个细菌物种和8个病毒物种、9个细菌物种和9个病毒物种、10个细菌物种和10个病毒物种、15个细菌物种和15个病毒物种、20个细菌物种和20个病毒物种、25个细菌物种和25个病毒物种、30个细菌物种和30个病毒物种、35个细菌物种和35个病毒物种、40个细菌物种和40个病毒物种、45个细菌物种和45个病毒物种、50个细菌物种和50个病毒物种、60个细菌物种和60个病毒物种、70个细菌物种和70个病毒物种、80个细菌物种和80个病毒物种、90个细菌物种和90个病毒物种、100个细菌物种和100个病毒物种、200个细菌物种和200个病毒物种、300个细菌物种和300个病毒物种、400个细菌物种和400个病毒物种、500个细菌物种和500个病毒物种或1,000个细菌物种和1,000个病毒物种的至少一种核酸。在一些情况下,所述感兴趣群体可包含衍生自至少1个细菌物种和1个病毒物种、2个细菌物种和2个病毒物种、3个细菌物种和3个病毒物种、4个细菌物种和4个病毒物种、5个细菌物种和5个病毒物种、6个细菌物种和6个病毒物种、7个细菌物种和7个病毒物种、8个细菌物种和8个病毒物种、9个细菌物种和9个病毒物种、10个细菌物种和10个病毒物种、15个细菌物种和15个病毒物种、20个细菌物种和20个病毒物种、25个细菌物种和25个病毒物种、30个细菌物种和30个病毒物种、35个细菌物种和35个病毒物种、40个细菌物种和40个病毒物种、45个细菌物种和45个病毒物种、50个细菌物种和50个病毒物种、60个细菌物种和60个病毒物种、70个细菌物种和70个病毒物种、80个细菌物种和80个病毒物种、90个细菌物种和90个病毒物种、100个细菌物种和100个病毒物种、200个细菌物种和200个病毒物种、300个细菌物种和300个病毒物种、400个细菌物种和400个病毒物种、500个细菌物种和500个病毒物种或1,000个细菌物种和1,000个病毒物种的至少一种核酸。
在一些情况下,感兴趣群体中的一个或多个核酸未被标记;在一些情况下,感兴趣群体中的一个或多个核酸被标记。在一些情况下,感兴趣群体中的一个或多个核酸例如用核酸标记物、化学标记物或光学标记物进行标记。在一些情况下,感兴趣群体中的一个或多个核酸与固体支持体缀合。在一些情况下,标记物可以附接在感兴趣群体中的核酸的5’或3’端或感兴趣群体中的核酸的内部。在一些情况下,感兴趣群体中的一个或多个核酸用多于一个标记物进行标记。
感兴趣群体中的核酸可包含核酸标记物。在一些情况下,核酸标记物可包括以下的一种或多种:条形码(例如,样品条形码)、通用引物序列、引物结合位点(例如,用于测序或读取条形码,包括但不限于DNA测序引物结合位点、样品条形码测序引物结合位点和与各种测序平台要求兼容的扩增引物结合位点)、与测序仪兼容的序列、附接到测序平台的序列、测序衔接子序列或衔接子。核酸标记物可附接到感兴趣群体中的核酸上(例如,通过连接或通过合成设计)。在一些情况下,核酸标记物的长度被包含在感兴趣群体中的核酸的长度中。在一些情况下,核酸标记物的长度没有被包含在感兴趣群体中的核酸的长度中。
感兴趣群体中的核酸可包含化学标记物。化学标记物的一些非限制性实例包括生物素、抗生物素蛋白、链霉抗生物素蛋白、放射性标记物、多肽和聚合物。感兴趣群体中的核酸可包含光学标记物。光学标记物的一些非限制性实例包括荧光团、荧光蛋白、染料和量子点。感兴趣群体中的核酸可与固体支持体缀合。固体支持体的一些非限制性实例包括珠、磁珠、聚合物、载玻片、芯片、表面、板、通道、盒、微流体装置和微阵列。感兴趣群体中的核酸可与用于亲和色谱法的固体支持体缀合。在一些情况下,感兴趣群体中的每个核酸具有不同的标记物。在一些情况下,感兴趣群体中的每个核酸具有相同的标记物。在一些情况下,感兴趣群体中的核酸的每个拷贝具有相同的标记物。在一些情况下,具有不同序列的感兴趣群体中的每个核酸具有不同的标记物。
可通过本文提供的方法检测的微生物的一些非限制性实例包括细菌、古菌、原生动物、原生生物、真菌、藻类、病毒、逆转录病毒、病原体或寄生生物。在一些情况下,所述微生物为原核生物。在一些情况下,所述微生物为真核生物。细菌的一些非限制性实例包括芽孢杆菌属、鲍特杆菌属、疏螺旋体属、布鲁杆菌、弯曲杆菌属、衣原体属、嗜衣原体、梭菌属、棒状杆菌属、肠球菌属、埃希杆菌属、弗朗西斯菌、嗜血杆菌属、螺杆菌属、军团菌属、钩端螺旋体属、利斯特菌属、分枝杆菌属、支原体属、奈瑟菌属、假单胞菌属、立克次体属、沙门菌属、志贺菌属、葡萄球菌属、金黄色葡萄球菌、链球菌属、密螺旋体属、弧菌属和耶尔森菌属(Bacillus,Bordetella,Borrelia,Brucella,Campylobacter,Chlamydia,Chlamydophila,Clostridium,Corynebacterium,Enterococcus,Escherichia,Francisella,Haemophilus,Helicobacter,Legionella,Leptospira,Listeria,Mycobacterium,Mycoplasma,Neisseria,Pseudomonas,Rickettsia,Salmonella,Shigella,Staphylococcus,Staphyloccus Aures,Streptococcus,Treponema,Vibrio,and Yersinia)。真菌的一些非限制性实例包括假丝酵母属、曲霉属、隐球菌属、组织胞浆菌属、肺囊虫属和葡萄穗霉属(Candida,Aspergillus,Cryptococcus,Histoplasma,Pneumocystis,and Stachybotrys)。在一些情况下,通过本文提供的方法检测的微生物为耐药性微生物或多重耐药病原体。耐药性或多重耐药病原体的非限制性实例包括:在一些情况下,艰难梭菌(C.difficile)耐药性菌株、耐碳青霉烯肠杆菌(CRE)、耐药性淋病奈瑟菌(耐头孢菌素)、多重耐药性不动杆菌、耐药性弯曲杆菌、耐氟康唑假丝酵母(一种真菌)、产生超广谱β-内酰胺酶的肠杆菌科(ESBL)、耐万古霉素肠球菌(VRE)、多重耐药性铜绿假单胞菌、耐药性非伤寒沙门菌、耐药性伤寒沙门菌、耐药性志贺菌、耐甲氧西林金黄色葡萄球菌(MRSA)、耐药性肺炎链球菌、耐药性结核(MDR和XDR)、多重耐药性金黄色葡萄球菌、耐万古霉素金黄色葡萄球菌(VRSA)、耐红霉素链球菌A组或耐克林霉素链球菌B组。
在一些情况下,本文提供的方法和组合物可用于检测病毒如逆转录病毒或慢病毒。在一些情况下,所述病毒为巴尔的摩病毒分类系统中的第I组、第II组、第III组、第IV组、第V组、第VI组或第VII组的成员。在一些情况下,病毒为腺病毒科、指环病毒科、沙粒病毒科、星状病毒科、布尼亚病毒科、嵌杯病毒科、冠状病毒科、纤丝病毒科、黄病毒科、嗜肝病毒科、肝炎病毒科、疱疹病毒科、正黏病毒科、乳头状瘤病毒科、乳多空病毒科、副黏病毒科、细小病毒科、细小RNA病毒科、多瘤病毒科、痘病毒科、呼肠孤病毒科、逆转录病毒科、弹状病毒科或披膜病毒科(Adenoviridae,Anelloviridae,Arenaviridae,Astroviridae,Bunyaviridae,Caliciviridae,Coronaviridae,Filoviridae,Flaviviridae,Hepadnaviridae,Hepeviridae,Herpesviridae,Orthomyxoviridae,Papillomaviridae,Papovaviridae,Paramyxoviridae,Parvoviridae,Picornaviridae,Polyomaviridae,Poxviridae,Reoviridae,Retroviridae,Rhabdoviridae,or Togaviridae)的成员。在一些情况下,病毒为腺病毒、阿穆尔病毒、安第斯病毒、动物病毒、星状病毒、禽肾炎病毒、禽正呼肠孤病毒、禽呼肠孤病毒、版纳病毒、刚果热病毒、蝙蝠传播病毒、BK病毒、蓝莓休克病毒、鸡贫血病毒、牛腺病毒、牛冠状病毒、4型牛疱疹病毒、牛细小病毒、夜莺冠状病毒HKU11、卡里萨尔病毒、洪都拉斯病毒、金迪普拉病毒、斑点叉尾鲴病毒、Choclo病毒、科蜱病毒、柯萨奇病毒、蟋蟀麻痹病毒、克里米亚-刚果出血热病毒、巨细胞病毒、登革热病毒、多布拉伐-贝尔格莱德病毒、埃博拉病毒、埃博拉病毒、埃尔莫洛峡谷病毒、大象内皮刺激性疱疹病毒、EB病毒、猫白血病病毒、口蹄疫病毒、Gou病毒、瓜纳瑞托病毒、汉滩河病毒、汉坦病毒、HCoV-EMC/2012、亨德拉病毒、亨尼波病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、丁型肝炎病毒、戊型肝炎病毒、1型单纯疱疹病毒、2型单纯疱疹病毒、HIV、人星状病毒、人博卡病毒、人巨细胞病毒、8型人疱疹病毒、人疱疹病毒8型、人免疫缺陷病毒(HIV)、人偏肺病毒、人乳头状瘤病毒、伊姆病毒、流感病毒、Isla Vista病毒、JC病毒、胡宁病毒、哈巴罗夫斯克病毒、锦鲤疱疹病毒、昆津病毒、拉沙病毒、石灰岩峡谷病毒、Lloviu奎瓦病毒、Lloviu病毒、Lujo病毒、麦丘波病毒、Magboi病毒、马尔堡马尔堡病毒、马尔堡病毒、马尔堡病毒、麻疹病毒、马六甲病毒、梅南高病毒、中东呼吸综合征冠状病毒、1型长翼蝙蝠状病毒、长翼蝙蝠状病毒HKU8、猴痘病毒、莫农加希拉病毒、茂朱病毒、腮腺炎病毒、尼帕病毒、诺沃克病毒、环状病毒、副流感病毒、细小病毒B19、植物呼肠孤病毒、伏蝙蝠冠状病毒HKU5、脊髓灰质炎病毒、猪腺病毒、希望山病毒、夸尔亚病毒、狂犬病病毒、Ravn病毒、呼吸道合胞病毒、Reston病毒、网状内皮组织增生病毒、鼻疽猴蝙蝠冠状病毒HKU2、鼻病毒、玫瑰疹病毒、罗斯河病毒、轮状病毒、棕果蝠冠状病毒HKU9、风疹病毒、萨列马岛病毒、萨比亚病毒、Sangassou病毒、小黃蝠冠狀病毒512、Serang病毒、严重急性呼吸综合征病毒、休普乳头瘤病毒、猴泡沫病毒、辛诺柏病毒、天花、Soochong病毒、苏丹埃博拉病毒、苏丹病毒、塔伊森林埃博拉病毒、塔伊森林病毒、Tanganya病毒、索托帕拉雅病毒、托普格拉夫病毒、震颤病毒、图拉病毒、火鸡冠状病毒、火鸡痘病毒、扁颅蝠冠状病毒HKU4、水痘带状疱疹病毒、水痘-带状疱疹病毒、西尼罗河病毒、土拨鼠肝炎病毒、黄热病病毒、寨卡病毒或扎伊尔埃博拉病毒(Adenovirus,Amurvirus,Andes virus,Animal virus,Astrovirus,Avian nephritis virus,Avianorthoreovirus,Avian Reovirus,Banna virus,Bas-Congo virus,Bat-borne virus,BKvirus,Blueberry shock virus,Chicken anaemia virus,Bovine adenovirus,Bovinecoronavirus,Bovine herpesvirus 4,Bovine parvovirus,Bulbul coronavirus HKU11,Carrizal virus,Catacamas virus,Chandipura virus,Channel catfish virus,Choclovirus,Coltivirus,Coxsackievirus,Cricket paralysis virus,Crimean-Congohemorrhagic fever virus,Cytomegalovirus,dengue virus,Dobrava-Belgrade virus,Ebola virus,Ebolavirus,El Moro Canyon virus,Elephant endotheliotropicherpesvirus,Epstein-Barr virus,Feline leukemia virus,Foot-and-mouth diseasevirus,Gou virus,Guanarito virus,Hantaan River virus,Hantavirus,HCoV-EMC/2012,Hendra virus,Henipavirus,Hepatitis A virus,Hepatitis B virus,Hepatitis Cvirus,Hepatitis D,Hepatitis E virus,Herpes simplex type 1,Herpes simplex type2,Herpes simplex virus type 1,Herpes simplex virus type 2,HIV,Humanastrovirus,Human bocavirus,Human cytomegalovirus,Human herpesvirus type 8,Human herpesvirus type 8,Human immunodeficiency virus(HIV),Humanmetapneumovirus,Human papillomavirus,Imjin virus,Influenza virus,Isla Vistavirus,JC virus,Junin virus,Khabarovsk virus,Koi herpes virus,Kunjin virus,Lassa virus,Limestone Canyon virus,Lloviu cuevavirus,Lloviu virus,Lujo virus,Machupo virus,Magboi virus,Marburg marburgvirus,Marburg virus,Marburgvirus,Measles virus,Melaka virus,Menangle virus,Middle East respiratory syndromecoronavirus,Miniopterus Bat coronavirus 1,Miniopterus Bat coronavirus HKU8,Monkeypox virus,Monongahela virus,Muju virus,Mumps virus,Nipah virus,Norwalkvirus,Orbivirus,Parainfluenza virus,Parvovirus B19,Phytoreovirus,Pipistrellusbat coronavirus HKU5,Poliovirus,Porcine adenovirus,Prospect Hill virus,Qalyubvirus,Rabies virus,Ravn virus,Respiratory syncytial virus,Reston virus,Reticuloendotheliosis virus,Rhinolophus Bat coronavirus HKU2,rhinovirus,Roseolovirus,Ross River virus,Rotavirus,Rousettus bat coronavirus HKU9,Rubella virus,Saaremaa virus,Sabiávirus,Sangassou virus,Scotophilus Batcoronavirus 512,Serang virus,Severe acute respiratory syndrome virus,Shopepapilloma virus,Simian foamy virus,Sin Nombre virus,Smallpox,Soochong virus,Sudan ebolavirus,Sudan virus,Forest ebolavirus,Forest virus,Tanganyavirus,Thottapalayam virus,Topografov virus,Tremovirus,Tula virus,Turkeycoronavirus,Turkeypox virus,Tylonycteris bat coronavirus HKU4,Varicellazoster virus,Varicella-zoster virus,West Nile virus,Woodchuck hepatitisvirus,yellow fever virus,Zika virus,or Zaire ebolavirus)。
病原体的一些非限制性实例包括病毒、细菌、朊病毒、真菌、寄生生物、原生动物和微生物。病原体的一些非限制性实例包括棘阿米巴属、蜱螨亚纲、鲍氏不动杆菌、以色列放线菌、戈氏放线菌、丙酸两酸杆菌、足菌肿、足分支菌病、腺病毒科、甲病毒属、无形体属、无形体科、巴西钩虫、十二指肠钩虫、美洲板口线虫、脊形管圆线虫、异尖属、蜘蛛纲蜱属、软蜱科、溶血隐秘杆菌、姬鼠属、念珠念珠棘头虫、沙粒病毒科、人蛔虫、蛔虫属、人蛔虫、曲霉属、星状病毒科、巴贝虫属、分歧巴贝虫、B.bigemina、马巴贝斯虫、B.microfti、邓肯巴贝虫、巴贝斯虫属、炭疽杆菌、蜡状芽孢杆菌、拟杆菌属、巴氏阿米巴原虫、结肠小袋纤毛虫、汉赛巴尔通体、贝利蛔线虫属、浣熊拜林蛔线虫、短尖伯特绦虫、司氏伯特绦虫、BK病毒、芽囊原虫属、人芽囊原虫、皮炎芽生菌、百日咳博德特氏菌、伯氏疏螺旋体、疏螺旋体属的种、疏螺旋体属、布鲁氏菌属、马来丝虫、帝纹布鲁丝虫、布尼亚病毒科、洋葱伯克霍尔德菌、伯克霍尔德菌属的种、鼻疽伯克霍尔德菌、类鼻疽伯霍尔德菌、嵌杯病毒科、弯曲杆菌属、白假丝酵母、假丝酵母属的种、多节绦虫亚纲、多头绦虫、沙眼衣原体、沙眼衣原体、淋病奈瑟氏菌、肺炎衣原体、鹦鹉热衣原体、臭虫科温带臭虫、华枝睾吸虫;Clonorchis viverrini、肉毒梭菌、艰难梭菌、产气荚膜梭菌、产气荚膜梭菌、梭菌属的种、破伤风梭菌、粗球孢子菌、Coccidioides posadasii、螺旋锥蝇、科罗拉多壁虱热病毒(CTFV)、冠状病毒科、白喉棒状杆菌、伯内特考克斯体、克里米亚-刚果出血热病毒、新型隐球菌、隐孢子虫、隐孢子虫属、环孢子虫、巨细胞病毒、毛囊蠕形螨/脂蠕形螨/犬蠕形螨、登革病毒(DEN-1、DEN-2、DEN-3和DEN-4)、虫媒病毒、人皮蝇、分支双腔吸虫、脆双核阿米巴、肾膨结线虫、裂头属、阔节裂头绦虫、麦地那龙线虫、埃博拉病毒(EBOV)、棘球属、细粒棘球绦虫、多房棘球绦虫、沃氏棘球绦虫、少节棘球绦虫、沙费埃里希体、埃里希体、埃里希体属、溶组织内阿米巴、溶组织内阿米巴、蠕形住肠蛲虫、格氏蛲虫、肠球菌属、肠道病毒属、肠道病毒、柯萨奇A病毒、肠道病毒71型(EV71)、絮状麦皮癣菌、红色毛癣菌、须毛癣菌、EB病毒、大肠杆菌O157:H7、O111和O104:H4、肝片吸虫、大片吸虫、布氏姜片吸虫、丝虫总科、纤丝病毒科、黄病毒科、裴氏着色霉、土拉热弗朗西丝菌、梭杆菌属、白地霉、肠贾第虫、兰伯贾第虫、棘颚口线虫、刚棘颚口虫、A组链球菌、葡萄球菌、瓜纳瑞托病毒、杜克雷嗜血杆菌、流感嗜血菌、Halicephalobusgingivalis、中原病毒、幽门螺杆菌、嗜肝DNA病毒、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、丁型肝炎病毒、戊型肝炎病毒、1和2型单纯疱疹病毒(HSV-1和HSV-2)、疱疹病毒科、夹膜组织胞浆菌、HIV(人体免疫缺陷病毒)、威尼克外瓶霉、人博卡病毒(HBoV)、6型人疱疹病毒(HHV-6)、7型人疱疹病毒(HHV-7)、人偏肺病毒(hMPV)、人乳头瘤病毒(HPV)、人副流感病毒(HPIV)、微小膜壳绦虫、缩小膜壳绦虫、贝氏等孢子球虫、JC病毒、胡宁病毒、金氏金氏杆菌、肉芽肿杆菌、拉沙病毒、嗜肺军团病杆菌、利什曼原虫属、钩端螺旋体属、锯齿状舌形虫、单核细胞增生利斯特菌、罗阿罗阿丝虫、淋巴细胞性脉络丛脑膜炎病毒(LCMV)、麦丘波病毒、马拉色霉菌属、链尾曼森线虫、马尔堡病毒、麻疹病毒、横川后殖吸虫、微孢子虫门、中东呼吸综合征冠状病毒、传染性软疣病毒(MCV)、猴痘病毒、毛霉目(毛霉菌病)、虫霉目(虫霉菌病)、腮腺炎病毒、麻风分枝杆菌、弥漫型麻风分枝杆菌、结核分枝杆菌、溃疡分枝杆菌、肺炎支原体、福氏耐格里原虫、淋病奈瑟球菌、脑膜炎奈瑟球菌、星形诺卡菌、诺卡菌属的种、狂蝇总科、丽蝇科、麻蝇科、旋盘尾丝虫、麝猫后睾吸虫、猫后睾吸虫、华支睾吸虫、正黏病毒科、乳头状瘤病毒科、巴西副球孢子菌、非洲并殖吸虫;卡里并殖吸虫;猫肺并殖吸虫;斯区并殖吸虫;双侧宫并殖吸虫、卫氏并殖吸虫、并殖吸虫属的种、副黏液病毒科、寄生性双翅目蝇幼虫、微小病毒科、细小病毒B19、巴斯德菌属、人虱、头虱、体虱、阴虱、细小RNA病毒科、何德毛结节菌、恶性疟原虫、间日疟原虫、卵形疟原虫curtisi亚种、卵形疟原虫wallikeri亚种、三日疟原虫、诺氏疟原虫、疟原虫属、杰氏肺囊虫、脊髓灰质炎病毒、多瘤病毒科、痘病毒科、普氏菌属、PRNP、耻阴虱、致痒蚤、狂犬病病毒、呼肠孤病毒科、呼吸道合胞病毒(RSV)、逆转录病毒科、弹状病毒科、西伯鼻孢子菌、鼻病毒、鼻病毒、冠状病毒、小蛛立克次体、立克次体属、普氏立克次体、立氏立克次体、斑疹伤寒立克次体、立夫特山谷热病毒、轮状病毒、风疹病毒、清风藤属、肠炎沙门氏菌、伤寒杆菌、沙门菌属、牛-人肉孢子虫、猪-人肉孢子虫、疥螨、SARS冠状病毒、血吸虫属、埃及血吸虫、日本血吸虫、曼森血吸虫和刚果血吸虫、湄公河血吸虫、血吸虫属的种、志贺菌属、Sin Nombre病毒、刺猬绦虫、申克孢子丝菌、葡萄球菌属、无乳链球菌、肺炎链球菌、酿脓链球菌、粪类圆线虫、绦虫属、无钩绦虫、有钩绦虫、细菌肠杆菌科、加利福尼亚吸吮线虫、结膜吸吮线虫病、披膜病毒科、犬弓蛔虫、猫弓蛔虫、弓形虫、梅毒螺旋体、旋毛线虫、布氏旋毛虫、纳氏旋毛虫、本地毛形线虫、Trichobilharzia regenti、裂体科、阴道毛滴虫、发癣菌属、红色毛癣菌、断发毛癣菌、贝吉尔毛孢子菌、毛首鞭形线虫、毛首鞭形线虫、狐毛首线虫、布氏锥虫、克氏锥虫、穿皮潜蚤、解脲支原体、水痘带状疱疹病毒(VZV)、重型天花、类天花、委内瑞拉马脑炎病毒、霍乱弧菌、西尼罗病毒、班氏吴策线虫、班氏吴策线虫、马来丝虫、黄热病毒、小肠结肠炎耶尔森菌、鼠疫耶尔森菌和假结核耶尔森氏菌(Acanthamoeba,Acari,Acinetobacter baumannii,Actinomyces israelii,Actinomyces gerencseriae,Propionibacterium propionicus,Actinomycetoma,Eumycetoma,Adenoviridae,Alphavirus,Anaplasma genus,Anaplasma phagocytophilum,Ancylostoma braziliense,Ancylostoma duodenale,Necator americanus,Angiostrongylus costaricensis,Anisakis,Arachnida Ixodidae,Argasidae,Arcanobacterium haemolyticum,Archiacanthocephala,Moniliformis moniliformis,Arenaviridae,Ascaris lumbricoides,Ascaris sp.Ascaris lumbricoides,Aspergillusgenus,Astroviridae,Babesia B.divergens,B.bigemina,B.equi,B.microfti,B.duncani,Babesia genus,Bacillus anthracis,Bacillus cereus,Bacteroides genus,Balamuthia mandrillaris,Balantidium coli,Bartonella henselae,Baylisascarisgenus,Baylisascaris procyonis,Bertiella mucronata,Bertiella studeri,BK virus,Blastocystis,Blastocystis hominis,Blastomyces dermatitidis,Bordetellapertussis,Borrelia burgdorferi,Borrelia species,Borrelia genus,Brucellagenus,Brugia malayi,Brugia timori,Bunyaviridae,Burkholderia cepacia,Burkholderia species,Burkholderia mallei,Burkholderia pseudomallei,Caliciviridae,Campylobacter genus,Candida albicans,Candida species,Cestoda,Taenia multiceps,Chlamydia trachomatis,Chlamydia trachomatis,Neisseriagonorrhoeae,Chlamydophila pneumoniae,Chlamydophila psittaci,Cimicidae Cimexlectularius,Clonorchis sinensis;Clonorchis viverrini,Clostridium botulinum,Clostridium difficile,Clostridium perfringens,Clostridium perfringens,Clostridium species,Clostridium tetani,Coccidioides immitis,Coccidioidesposadasii,Cochliomyia hominivorax,Colorado tick fever virus(CTFV),Coronaviridae,Corynebacterium diphtheriae,Coxiella burnetii,Crimean-Congohemorrhagic fever virus,Cryptococcus neoformans,Cryptosporidium,Cryptosporidium genus,Cyclospora cayetanensis,Cytomegalovirus,Demodexfolliculorum/brevis/canis,Dengue viruses(DEN-1,DEN-2,DEN-3 and DEN-4),Flaviviruses,Dermatobia hominis,Dicrocoelium dendriticum,Dientamoebafragilis,Dioctophyme renale,Diphyllobothrium,Diphyllobothrium latum,Dracunculus medinensis,Ebolavirus(EBOV),Echinococcus genus,Echinococcusgranulosus,Echinococcus multilocularis,E.vogeli,E.oligarthrus,Ehrlichiachaffeensis,Ehrlichia ewingii,Ehrlichia genus,Entamoeba histolytica,Entamoebahistolytica,Enterobius vermicularis,Enterobius gregorii,Enterococcus genus,Enterovirus genus,Enteroviruses,Coxsackie A virus,Enterovirus 71(EV71),Epidermophyton floccosum,Trichophyton rubrum,Trichophyton mentagrophytes,Epstein-Barr Virus(EBV),Escherichia coli O157:H7,O111 and O104:H4,Fasciolahepatica,Fasciola gigantica,Fasciolopsis buski,Filarioidea superfamily,Filoviridae,Flaviviridae,Fonsecaea pedrosoi,Francisella tularensis,Fusobacterium genus,Geotrichum candidum,Giardia intestinalis,Giardia lamblia,Gnathostoma spinigerum,Gnathostoma hispidum,Group A Streptococcus,Staphylococcus,Guanarito virus,Haemophilus ducreyi,Haemophilus influenzae,Halicephalobus gingivalis,Heartland virus,Helicobacter pylori,Hepadnaviridae,Hepatitis A Virus,Hepatitis B Virus,Hepatitis C Virus,Hepatitis D Virus,Hepatitis E Virus,Hepeviridae,Herpes simplex virus 1 and 2(HSV-1 and HSV-2),Herpesviridae,Histoplasma capsulatum,HIV(Human immunodeficiency virus),Hortaea werneckii,Human bocavirus(HBoV),Human herpesvirus6(HHV-6),Humanherpesvirus 7(HHV-7),Human metapneumovirus(hMPV),Human papillomavirus(HPV),Human parainfluenza viruses(HPIV),Hymenolepis nana,Hymenolepis diminuta,Isospora belli,JC virus,Junin virus,Kingella kingae,Klebsiella granulomatis,Lassa virus,Legionella pneumophila,Leishmania,Leptospira genus,Linguatulaserrata,Listeria monocytogenes,Loa loa filaria,Lymphocytic choriomeningitisvirus(LCMV),Machupo virus,Malassezia genus,Mansonella streptocerca,Marburgvirus,Measles virus,Metagonimus yokagawai,Microsporidia phylum,Middle Eastrespiratory syndrome coronavirus,Molluscum contagiosum virus(MCV),Monkeypoxvirus,Mucorales order(Mucormycosis),Entomophthorales order(Entomophthoramycosis),Mumps virus,Mycobacterium leprae,Mycobacteriumlepromatosis,Mycobacterium tuberculosis,Mycobacterium ulcerans,Mycoplasmapneumoniae,Naegleria fowleri,Neisseria gonorrhoeae,Neisseria meningitidis,Nocardia asteroides,Nocardia species,Oestroidea,Calliphoridae,Sarcophagidae,Onchocerca volvulus,Opisthorchis viverrini,Opisthorchis felineus,Clonorchissinensis,Orthomyxoviridae,Papillomaviridae,Paracoccidioides brasiliensis,Paragonimus africanus;Paragonimus caliensis;Paragonimus kellicotti;Paragonimus skrjabini;Paragonimus uterobilateralis,Paragonimus westermani,Paragonimus species,Paramyxoviridae,parasitic dipterous fly larvae,Parvoviridae,Parvovirus B19,Pasteurella genus,Pediculus humanus,Pediculushumanus capitis,Pediculus humanus corporis,Phthirus pubis,Picornaviridae,Piedraia hortae,Plasmodium falciparum,Plasmodium vivax,Plasmodium ovalecurtisi,Plasmodium ovale wallikeri,Plasmodium malariae,Plasmodium knowlesi,Plasmodium genus,Pneumocystis jirovecii,Poliovirus,Polyomaviridae,Poxviridae,Prevotella genus,PRNP,Pthirus pubis,Pulex irritans,Rabies virus,Reoviridae,Respiratory syncytial virus(RSV),Retroviridae,Rhabdoviridae,Rhinosporidiumseeberi,Rhinovirus,rhinoviruses,coronaviruses,Rickettsia akari,Rickettsiagenus,Rickettsia prowazekii,Rickettsia rickettsii,Rickettsia typhi,RiftValley fever virus,Rotavirus,Rubella virus,Sabia,Salmonella entericasubsp.enterica,serovar typhi,Salmonella genus,Sarcocystis bovihominis,Sarcocystis suihominis,Sarcoptes scabiei,SARS coronavirus,Schistosoma genus,Schistosoma haematobium,Schistosoma japonicum,Schistosoma mansoni andSchistosoma intercalatum,Schistosoma mekongi,Schistosoma sp.,Shigella genus,Sin Nombre virus,Spirometra erinaceieuropaei,Sporothrix schenckii,Staphylococcus genus,Streptococcus agalactiae,Streptococcus pneumoniae,Streptococcus pyogenes,Strongyloides stercoralis,Taenia genus,Taeniasaginata,Taenia solium,the bacterial family Enterobacteriaceae,Thelaziacaliforniensis,Thelazia callipaeda,Togaviridae,Toxocara canis,Toxocara cati,Toxoplasma gondii,Treponema pallidum,Trichinella spiralis,Trichinellabritovi,Trichinella nelsoni,Trichinella nativa,Trichobilharzia regenti,Schistosomatidae,Trichomonas vaginalis,Trichophyton genus,Trichophytonrubrum,Trichophyton tonsurans,Trichosporon beigelii,Trichuris trichiura,Trichuris trichiura,Trichuris vulpis,Trypanosoma brucei,Trypanosoma cruzi,Tunga penetrans,Ureaplasma urealyticum,Varicella zoster virus(VZV),Variolamajor,Variola minor,Venezuelan equine encephalitis virus,Vibrio cholerae,WestNile virus,Wuchereria bancrofti,Wuchereria bancrofti,Brugia malayi,Yellowfever virus,Yersinia enterocolitica,Yersinia pestis,and Yersiniapseudotuberculosis)。
产生寡核苷酸集合的方法
本公开内容提供了产生用于本文提供的方法,特别是用于靶向或检测感兴趣群体(例如,微生物或病原体核酸)的寡核苷酸集合的多种途径。在一些情况下,产生寡核苷酸集合的方法可以是基于生物信息学、计算、基于杂交或基于消化的方法。
在一些情况下,背景群体核酸如宿主(例如,人)基因组DNA可用于从含有宿主和非宿主(例如,非人、病原体)序列的寡核苷酸群体中去除宿主序列。所述方法可包括提供含有能够结合宿主(例如,人)和非宿主核酸的寡核苷酸的异质寡核苷酸集合(例如,寡核苷酸乱序体(randomer)的集合,如例如5’-NNNNNNNNNNNNN-3’,其中N为A、C、G或T)。在一些情况下,可在促进所述宿主基因组DNA与异质寡核苷酸集合中的互补序列结合的条件下将宿主基因组DNA引入到所述异质寡核苷酸集合中。所述方法可包括从异质寡核苷酸集合中消耗与所述宿主基因组DNA结合的寡核苷酸。通常,在这些方法中,相对于所述异质寡核苷酸集合,所述宿主核酸(例如,宿主基因组核酸)被过量提供。所述消耗可通过本文提供的方法来完成,如通过从所述异质寡核苷酸集合中去除杂交的或结合的寡核苷酸、破坏杂交的或结合的寡核苷酸或优先分离未结合的寡核苷酸。
图3示出了产生寡核苷酸集合(370)的图示示例。所述方法可包括提供异质寡核苷酸集合(310)。在一些情况下,所述异质寡核苷酸集合可包含用核酸标记物、化学标记物或光学标记物标记的寡核苷酸(320)。所述方法可包括消耗包含核苷酸结构域的寡核苷酸,该核苷酸结构域具有与来自异质寡核苷酸集合的背景群体核酸(例如,宿主核酸,人核酸等)相同、几乎相同、互补或几乎互补的序列。在一些情况下,通过使所述异质寡核苷酸集合与背景群体核酸(340)(例如,人基因组DNA)接触(360),使得所述背景群体核酸与在异质寡核苷酸集合内的寡核苷酸的互补或几乎互补的核苷酸结构域杂交或以其他方式特异性结合来实现所述消耗。所述杂交反应可包括变性步骤和/或复性步骤。例如,为了使所述反应中的核酸变性,可以将所述核酸加热或使其经受分层加热(例如,在95℃下10秒以及在65℃下3分钟)。为了使核酸复性,可将核酸在36℃下温育一定的时间,如数小时或数周。在一些情况下,从宿主中衍生或分离背景群体核酸(330)。在一些情况下,所述背景群体核酸用核酸标记物、化学标记物或光学标记物进行标记(350)。在一些情况下,所述方法进一步包括使至少一部分所述背景群体核酸变性,例如通过加热。
在一些情况下,一种或多种阻断剂寡核苷酸可以存在于所述杂交步骤(360)期间,并且可以包含在杂交步骤之前或期间。在一些情况下,阻断剂寡核苷酸包含DNA、RNA、PNA、LNA、BNA或其任意组合。阻断剂寡核苷酸可以与核苷酸结构域外部的寡核苷酸序列互补,因此可被设计为不与所述核苷酸结构域杂交,而是“阻断”存在于同一链上的其他核苷酸。所述阻断剂寡核苷酸的存在可帮助降低所述核苷酸结构域外部的序列与寡核苷酸的背景群体(例如,人基因组DNA)结合的可能性。因此,所述阻断剂寡核苷酸可促进所述寡核苷酸集合对寡核苷酸背景群体的结合特异性。在一些具体实例中,所述异质寡核苷酸集合可在包含阻断剂寡核苷酸(例如,0.5X PBS、阻断剂寡核苷酸、RNA酶抑制剂)的缓冲溶液中与基因组DNA杂交。
通常,用作起始群体以产生本文提供的寡核苷酸集合的异质寡核苷酸集合是随机产生的核酸序列的集合(例如,寡核苷酸乱序体的集合,例如5’-NNNNNNNNNNNNN-3’,其中N为A、C、G或T)。在一些情况下,异质寡核苷酸集合可以被合成(例如,通过DNA合成)。在一些情况下,异质寡核苷酸集合不包含人工片段化的核酸。在一些情况下,异质寡核苷酸集合包含含有核苷酸结构域的寡核苷酸,其中存在核苷酸结构域的约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的可能的序列。在一些情况下,异质寡核苷酸集合包含含有核苷酸结构域的寡核苷酸,其中存在核苷酸结构域的至多5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的可能的序列。在一些情况下,异质寡核苷酸集合包含含有核苷酸结构域的寡核苷酸,其中存在核苷酸结构域的至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的可能的序列。
在一些情况下,所述异质寡核苷酸集合包含含有核苷酸结构域的寡核苷酸,该核苷酸结构域具有与背景群体核酸或来自感兴趣群体的核酸相同、几乎相同、互补或几乎互补的序列。在一些情况下,所述异质寡核苷酸集合包含含有核苷酸结构域的寡核苷酸,该核苷酸结构域具有与一个或多个背景群体相同、几乎相同、互补或几乎互补的序列。在一些情况下,所述异质寡核苷酸集合包含含有核苷酸结构域的寡核苷酸,该核苷酸结构域具有不与一个或多个背景群体相同、几乎相同、互补或几乎互补的序列。在一些情况下,所述异质寡核苷酸集合包含含有核苷酸结构域的寡核苷酸,该核苷酸结构域具有与一个或多个感兴趣群体相同、几乎相同、互补或几乎互补的序列。在一些情况下,所述异质寡核苷酸集合包含含有核苷酸结构域的寡核苷酸,该核苷酸结构域具有不与一个或多个感兴趣群体相同、几乎相同、互补或几乎互补的序列。
在一些情况下,所述异质寡核苷酸集合内的一个或多个寡核苷酸未被标记;在一些情况下,所述异质寡核苷酸集合内的一个或多个寡核苷酸被标记。在一些情况下,一个或多个寡核苷酸例如用核酸标记物、化学标记物或光学标记物进行标记。在一些情况下,一个或多个寡核苷酸与固体支持体缀合。在一些情况下,一个或多个寡核苷酸不与固体支持体缀合。在一些情况下,标记物可以附接在寡核苷酸的5’或3’端或寡核苷酸的内部。在一些情况下,所述异质寡核苷酸集合内的一个或多个寡核苷酸用多于一个标记物进行标记。
所述背景群体核酸可相对于异质寡核苷酸集合过量提供。背景群体与寡核苷酸的比例可为约0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000或10,000。背景群体与寡核苷酸的比例可为至多0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000或10,000。背景群体与寡核苷酸的比例可为至少0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000或10,000。背景群体与寡核苷酸的比例可以是饱和的。背景群体与寡核苷酸的比例可以是不饱和的。所述比例可根据浓度、摩尔数或质量来计算。
在一些情况下,所述核酸为单链。在一些情况下,使双链核酸变性为单链核酸。可使用热使核酸变性。在一些情况下,将核酸加热至约35、40、45、50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99℃。在一些情况下,将核酸加热约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟。在一些情况下,使用化学变性剂(例如,酸、碱、溶剂、离液剂、盐)使核酸变性。
可以使单链核酸的样品复性或杂交。在一些情况下,使单链核酸样品与异质寡核苷酸集合杂交。在一些情况下,使异质寡核苷酸集合与阻断剂寡核苷酸杂交。在一些情况下,使单链核酸的至少一部分复性或杂交。在一些情况下,使核酸在约0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、40、45、50、55、60、65、68或70℃下复性或杂交。在一些情况下,使核酸在冰上复性或杂交。在一些情况下,使核酸在室温下复性或杂交。在一些情况下,使核酸复性或杂交约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟,或2、3、4、5、10、15、20、22、24、30、40、46、48、50、60、70、72、80或96小时。温度、缓冲液组成、反应时间和浓度可影响杂交的程度。在一些情况下,在三甲基氯化铵的存在下使核酸复性。
所述消耗可通过本文提供的方法来完成,如通过从异质寡核苷酸集合中去除杂交的核酸。所述背景群体可被化学标记并去除,从而去除杂交的寡核苷酸。所述背景群体可与磁珠缀合并用磁铁去除,从而去除杂交的寡核苷酸。所述背景群体可用核酸标签进行标记。所述核酸标签可与缀合固体支持体或用化学标签标记的核酸序列结合或杂交。杂交的寡核苷酸可通过尺寸分离(例如,凝胶电泳、毛细管电泳等)、亲和分离(例如,DNA下拉实验、色谱法等)或其他方法来去除。在一些情况下,可使用分离方法如凝胶电泳、毛细管电泳或色谱法基于非杂交寡核苷酸和杂交的寡核苷酸的大小差异来分离杂交的寡核苷酸。在一些情况下,不去除未杂交的背景群体核酸。
在一些情况下,所述消耗可通过使与背景群体核酸杂交的寡核苷酸失活来完成。失活可防止与背景群体核酸杂交的寡核苷酸充当引物,例如通过使所述寡核苷酸与标记的背景群体核酸化学结合,然后仅使用未结合的寡核苷酸进行扩增。
在一些情况下,所述寡核苷酸集合被设计为使用生物信息学或计算工具靶向感兴趣群体(例如,病原体核酸、非人核酸),然后根据所述设计进行合成。在一些情况下,所述合成方法为DNA合成。所述方法可包括获得一定长度的随机产生的寡核苷酸的数据库。所述方法可包括生物信息学或计算确定存在于一个或多个背景群体(例如,人基因组核酸)中的核苷酸结构域。然后可从随机产生的异质寡核苷酸集合中通过计算减去与这些核苷酸结构域相关的序列,使得得到的寡核苷酸集合具有很少或没有特定长度(例如,10、11、12、13、14或15个核苷酸等)的背景群体序列。
非宿主寡核苷酸集合的合成
鉴别非宿主寡核苷酸序列后,非宿主寡核苷酸集合的合成可以通过无数种方法来完成。例如,非宿主寡核苷酸可以通过逐步添加核苷酸基于个体来合成以产生具有期望长度的寡核苷酸(例如,13-聚体)。
在一些情况下,使用ultramer寡核苷酸来合成本文提供的寡核苷酸集合。通常,ultramer寡核苷酸为含有多个串联在一起的寡核苷酸序列单元的长寡核苷酸,其中每一个单元被一个或多个间隔核苷酸隔开。可以将所述间隔核苷酸切割或以其他方式分开,以从单个ultramer寡核苷酸产生一组寡核苷酸。图9A示出了代表性的ultramer寡核苷酸的总体设计。在此,单独的寡核苷酸序列被用作间隔核苷酸的脱氧尿嘧啶核苷酸(U)所隔开。可通过尿嘧啶-DNA糖基化酶(UDG)(其通过切割N-糖苷键从DNA中切除尿嘧啶残基)和对无碱基位点(例如,无嘌呤/无嘧啶位点或AP位点)具有特异性的内切核酸酶的双重作用来消化所述ultramer寡核苷酸,从而产生单个寡核苷酸(例如,13-聚体寡核苷酸)。在一些情况下,使用内切核酸酶IV或内切核酸酶VII水解所述ultramer寡核苷酸。示例性的反应在图10A中进行了描述。图10B示出了用UDG和内切核酸酶VII消化ultramer寡核苷酸后的消化反应产物的示例。
可以设计ultramer寡核苷酸,使得同一ultramer链内的各个寡核苷酸单元具有相同的简并度。简并性通常是指可从单个可变序列产生的不同独特序列的数目。这可以通过在寡核苷酸单元内的某些位置插入一个或多个混合碱基来实现。混合碱基可以指一组碱基中的任一个(例如,四个规范碱基:A、C、G或T碱基中的任一个碱基)。例如,在标准编码方案中,“N”混合碱基可以是A、C、G或T碱基中的任何一个。类似地,“D”混合碱基可以是A、G或T;“V”混合碱基可以是A、C或G;“B”混合碱基可以是C、G或T;“H”混合碱基可以是A、C或T;“W”混合碱基可以是A或T;“S”混合碱基可以是C或G;“K”混合碱基可以是C或G;“M”混合碱基可以是A或C;“Y”混合碱基可以是C或T;以及“R”混合碱基可以是A或G。在这样的编码方案下,如图9B和图11A所示,含有一个N混合碱基的寡核苷酸序列的简并度将为4,因为可产生四个可能的序列。同样地,如图9C和图11A所示,含有两个N混合碱基的寡核苷酸序列的简并度将为4×4=16,因为可以产生16个可能的序列。如图9D所示,含有一个N混合碱基和一个W、S、K、M、Y或R混合的碱基的寡核苷酸序列的简并度将为4×2=8,因为可以产生8个可能的序列。含有一个R混合碱基和一个D混合碱基的寡核苷酸序列的简并度将为2×3=6,因为可以产生6个可能的序列。
当ultramer内的寡核苷酸序列具有相同的简并度时,在消化ultramer后,所述ultramer内的每个寡核苷酸序列可能以相同的数目表示。例如,当ultramer内的寡核苷酸序列各自的简并度为4时,则每个寡核苷酸序列单元的所述四个不同的独特寡核苷酸中的每一个将以近似相等的量存在于所得的合成池中。然而,例如,如果ultramer含有一个简并度为2的寡核苷酸单元和9个简并度为4的寡核苷酸单元,则在所得到的合成和消化池中,相对于来自9个4度单元的36个寡核苷酸各自以约2.5%的比例表示,来自一个2度单元的两个寡核苷酸将各自以约5%的比例过量表示。因此,含有具有共享简并度的寡核苷酸单元的ultramer可产生具有均匀分布的独特序列的寡核苷酸集合。
非宿主寡核苷酸序列可通过计算来鉴别,并通过简并度来分组。序列的简并性可通过将只有一定数量的位置不同的序列(例如,除了位置1和2之外的所有相同的序列)一起藉由计算排序来确定。将多个简并序列分组为具有一个或多个混合碱基的单个可变序列所需的混合碱基的数目和类型可确定简并度。图11示出了通过简并度对非宿主寡核苷酸进行计算分组。图11A示出了具有1、2或3个“N”混合碱基位点的代表性寡核苷酸。图11B中的直方图示出了基于简并度的非人13-聚体的分组(bucketing)。图11B中的第一列示出了具有简并度“2”的非人13-聚体的数目,这意味着它们含有表示两个可能的碱基的单个混合碱基(例如,W混合碱基、S混合碱基、K混合碱基、M混合碱基、Y混合碱基或R混合碱基)。第二列示出了简并度为3(例如,D、V、B或H混合碱基)的非人13-聚体的数目。剩余的列表示简并度为4、6、8、9、12或16的非人13-聚体的数目。例如,简并度为4的非人13-聚体可包含一个N混合碱基或选自W、S、K、M、Y和R的任何两个混合碱基。
如图9所示,非宿主(例如,非人)寡核苷酸(例如,13-聚体)的每个简并组的代表可与相同简并度的其他代表组合成ultramer寡核苷酸,如在本文其他地方讨论的。然后可通过常规的核酸合成方法和服务提供商例如IDT来合成设计的ultramer寡核苷酸。
含有具有共享简并度的寡核苷酸单元(或序列)的ultramer的消化可在许多不同步骤中的任何一个中进行。在一些情况下,将所有包含具有共享简并度的单元的ultramer组进行组合,然后消化。例如,可以将所有携带具有相同简并度的寡核苷酸序列的多个ultramer寡核苷酸以等摩尔浓度组合并消化以维持所得寡核苷酸的等摩尔浓度。在另一种方法中,可首先单独消化ultramer,然后可在这样的消化后将得到的寡核苷酸单元以等摩尔浓度组合。
含有具有不同简并度的寡核苷酸单元(或序列)的ultramer的消化可以在许多不同步骤中的任何一个中进行。在一些情况下,将各自包含具有不同简并度的单元的ultramer组进行组合,然后消化。例如,可以将各自携带具有不同简并度的寡核苷酸序列的多个ultramer寡核苷酸以合适的比例组合并消化以产生所得寡核苷酸的等摩尔浓度。在另一种方法中,可首先单独消化ultramer,然后可以在这样的消化后将得到的寡核苷酸单元以合适的比例组合以产生所得寡核苷酸的等摩尔浓度。
本文提供的ultramer寡核苷酸可包含任何数目的寡核苷酸单元(或序列)。例如,ultramer寡核苷酸可以包含5、6、7、8、9、10、15、20、25、50、100或200个或更多个寡核苷酸单元或序列。在一些情况下,所述寡核苷酸单元或序列包含具有某一长度的核苷酸结构域,如长度为5至100个核苷酸(例如,5、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸)。优选地,所述核苷酸结构域为13-聚体。在一些实施方案中,每个核苷酸结构域包含1个或多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、11个或更多个、12个或更多个、或13个或更多个混合碱基。在一些实施方案中,所述混合碱基选自N(A、C、G、T)、D(A、G、T)、V(A、C、G)、B(C、G、T)、H(A、C、T)、W(A、T)、S(C、G)、K(G、T)、M(A、C)、Y(C、T)、R(A、G)及其任意组合。在一些实施方案中,所述寡核苷酸序列具有相同的简并度。在一些实施方案中,所述寡核苷酸序列的简并度为2、3、4、6、8、9、12、16、18、24、27、32、36、48、54、64、72、81、96、108、128、144、162、192、216、243或256。
如图12所示,单独的寡核苷酸可被生物素化,例如使用T4多核苷酸激酶(T4PNK)或化学方法。如果需要表面固定或磁珠纯化,则该步骤可能是特别有用的。例如,可使所述生物素化的寡核苷酸与样品结合,并使其与所述样品内的非宿主寡核苷酸杂交。可以将链霉抗生物素蛋白包被的珠子添加至所述样品中,并用于下拉或者以其他方式分离所述非宿主寡核苷酸。
本文提供的产生寡核苷酸的ultramer方法具有几个优点。在一些情况下,这种方法可减少产生高度多样化的寡核苷酸集合(例如,高度多样化13-聚体寡核苷酸的集合)所需的合成运行次数。这种方法还可降低合成成本、减少过量寡核苷酸的合成、将寡核苷酸混合在一起的手动步骤最小化,或以高产量实现了寡核苷酸的合成。
使用寡核苷酸集合
在一些情况下,寡核苷酸的集合可用作PCR扩增、cDNA合成、测序或引物延伸反应的引物或捕获剂,如图1和图2所示。在一些情况下,将寡核苷酸集合(150)与核酸样品(140)混合。在一些情况下,核酸样品衍生自生物样品,例如来自宿主(110)的血液样品(120)或血浆(130)。在寡核苷酸集合用于引发扩增、cDNA合成、测序或引物延伸的许多情况下,可以将寡核苷酸和样品核酸与合适的聚合酶诸如DNA聚合酶、逆转录酶、RNA聚合酶等结合。在核酸样品包含RNA的一些情况下,寡核苷酸集合可用于从RNA模板引发cDNA合成(150)。在核酸样品包含DNA的一些情况下,寡核苷酸集合可用于引物延伸反应(170)。引物延伸反应可将突出端序列附加到感兴趣群体的核酸上,例如添加核酸标记物、核酸标签、条形码(例如,样品条形码)、通用引物序列、引物结合位点(例如,用于测序或读取条形码,包括但不限于DNA测序引物结合位点、样品条形码测序引物结合位点和与各种测序平台要求兼容的扩增引物结合位点)、与测序仪兼容的序列、附接到测序平台的序列、测序衔接子序列或衔接子。在一些情况下,引物延伸反应可仅将测序衔接子添加至感兴趣群体(例如,非哺乳动物、非人、微生物或病原体)的核酸。在一些情况下,寡核苷酸集合可用作PCR反应的引物以扩增感兴趣群体的核酸。在一些情况下,标记的寡核苷酸集合可用于标记感兴趣的群体。然后可分离经标记的感兴趣群体的核酸,例如通过基于杂交的方法或下拉方法。
当寻求富集由DNA或RNA制备的文库中的非宿主序列时,任何特定长度的非宿主寡核苷酸池可能是不同的。例如,相对于去除与宿主外显子组完全互补的N-聚体,在去除与宿主基因组完全互补的N-聚体后,所有可能的N-聚体中的更大部分可能保留。相对于非宿主基因组,可探测非宿主外显子组的更大部分,从而可能在一些情况下提供更高的灵敏度。另外,当试图利用相同数量的寡核苷酸来探测非宿主基因组和外显子组时,不与宿主外显子组互补的更多数量的寡核苷酸可在选择池中包含的非互补寡核苷酸方面提供额外的余地(versatility),从而使得能够选择具有期望的序列特征的寡核苷酸。
在一些情况下,寡核苷酸集合可用于核酸下拉,如图2所示。例如,寡核苷酸集合(250)可用作饵剂以从核酸样品(240)中捕获感兴趣的群体。在一些情况下,寡核苷酸集合被标记或与固体支持体缀合。寡核苷酸集合中的寡核苷酸可与样品内互补的或几乎互补的感兴趣群体的核酸杂交或以其他方式特异性结合(260)。在一些情况下,标记的寡核苷酸集合起到PCR扩增的引物的作用。在一些情况下,PCR扩增产物被下拉。在一些情况下,寡核苷酸集合的寡核苷酸上的标记物用于分离寡核苷酸集合和杂交的或结合的感兴趣群体的核酸(例如,通过生物素-抗生物素蛋白、生物素-链霉抗生物素蛋白或核酸杂交相互作用)。在一些情况下,核酸样品包含循环核酸如循环无细胞核酸。在一些情况下,核酸样品包含扩增的、纯化的或分离的核酸,如核酸的测序就绪文库。
在一些情况下,寡核苷酸集合可用于核酸下拉,其作为用于在文库制备后富集非宿主(例如,病原体)序列的方法。在一些情况下,标记的寡核苷酸集合(例如,用生物素化学标记的寡核苷酸集合)可与单链DNA或cDNA文库杂交。在一些情况下,聚合酶可用于沿文库片段延伸杂交的寡核苷酸,例如在高保真条件下。可使用标记物的结合配偶体(如针对生物素标记物的链霉抗生物素蛋白)将延伸的杂交寡核苷酸拉出(pull out)。在一些情况下,富集的文库可进行扩增,例如通过PCR。这种方法的优点包括其为开放式富集方法,在该方法中对宿主核酸进行负选择(select against)。在一些情况下,富集方法可用于DNA或cDNA文库。在一些情况下,非宿主文库片段的正选择导致改进的动力学和热力学。在一些情况下,在标准文库制备后应用所述方法允许批处理可单独条形码化的多个样品。
在一些情况下,核酸(例如,循环核酸)样品中的感兴趣群体(例如,非宿主)序列可通过以下步骤引发或捕获:(a)提供核酸样品,其中核酸样品包含背景群体(例如,宿主)核酸和感兴趣群体的核酸;(b)将核酸样品与寡核苷酸集合混合,从而获得混合物,其中寡核苷酸集合包含具有核苷酸结构域的寡核苷酸;以及(c)在混合物内,使寡核苷酸集合与核酸样品接触,其中该接触导致混合物内的感兴趣群体的核酸与核苷酸结构域结合,从而引发或捕获感兴趣群体的核酸。
可进一步对引发的或捕获的核酸进行分析或处理。在一些情况下,引发的或捕获的核酸可在反应中优先扩增(例如,PCR反应)。在一些情况下,引发的或捕获的核酸可通过进行测序分析(例如,下一代测序分析、高通量测序分析、大规模平行测序分析、纳米孔测序分析或Sanger测序分析)来测序。在一些情况下,优先分离引发的或捕获的核酸(例如,通过进行下拉实验)。在一些情况下,对引发的或捕获的核酸进行引物延伸反应(例如,以将核酸标记物附接至引发或捕获的核酸上)。在一些情况下,引发的或捕获的核酸为RNA,并且对引发的或捕获的RNA核酸进行聚合反应(例如,通过逆转录酶)。
在一些情况下,核酸(例如,循环核酸)样品中的感兴趣群体(例如,非宿主)序列可通过以下步骤进行测序:(a)提供核酸样品,其中核酸样品包含背景群体(例如,宿主)核酸和感兴趣群体的核酸;(b)将核酸样品与寡核苷酸集合混合,从而获得混合物,其中寡核苷酸集合包含具有核苷酸结构域的寡核苷酸;以及(c)在混合物内,使寡核苷酸集合与核酸样品接触,其中该接触导致混合物内的感兴趣群体的核酸与核苷酸结构域结合;以及(d)通过进行测序分析(例如,下一代测序分析、高通量测序分析、大规模平行测序分析、纳米孔测序分析或Sanger测序分析)来对结合的感兴趣群体的核酸进行测序。在一些情况下,在测序之前,优先在反应(例如,PCR反应)中扩增结合的感兴趣群体的核酸。在一些情况下,在测序之前,优先分离结合的感兴趣群体的核酸(例如,通过进行下拉实验)。在一些情况下,在测序之前,对结合的感兴趣群体的核酸进行引物延伸反应(例如,以将核酸标记物附接至结合的核酸上)。在一些情况下,结合的感兴趣群体的核酸为RNA。在一些情况下,对作为RNA的结合的感兴趣群体的核酸进行聚合反应(例如,通过逆转录酶)。
使寡核苷酸集合与核酸如循环核酸的样品接触可导致一部分背景群体(例如,宿主)核酸与核苷酸结构域结合。在一些情况下,接触导致约0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、20%、25%、30%、35%、40%、45%或50%的背景群体核酸与核苷酸结构域结合。在一些情况下,接触导致至多0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、20%、25%、30%、35%、40%、45%或50%的背景群体核酸与核苷酸结构域结合。在一些情况下,接触导致至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、20%、25%、30%、35%、40%、45%或50%的背景群体核酸与核苷酸结构域结合。
相对于样品核酸,所述寡核苷酸集合可过量提供。寡核苷酸与样品核酸的比例可为约0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。寡核苷酸与样品核酸的比例可为至多0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。寡核苷酸与样品核酸的比例可为至少0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。寡核苷酸与样品核酸的比例可以是饱和的。寡核苷酸与样品核酸的比例可以是不饱和的。所述比例可根据浓度、摩尔数或质量来计算。
相对于感兴趣群体的核酸,所述寡核苷酸集合可过量提供。寡核苷酸与感兴趣群体的核酸的比例可为约0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。寡核苷酸与感兴趣群体的核酸的比例可为至多0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。寡核苷酸与感兴趣群体的核酸的比例可为至少0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。寡核苷酸与感兴趣群体的核酸的比例可以是饱和的。寡核苷酸与感兴趣群体的核酸的比例可以是不饱和的。所述比例可根据浓度、摩尔数或质量来计算。
在一些情况下,所述核酸如循环核酸或测序就绪文库为单链。在一些情况下,使双链核酸变性为单链核酸。可使用热使核酸变性。在一些情况下,将核酸加热至约35、40、45、50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99℃。在一些情况下,将核酸加热约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟。在一些情况下,使用化学变性剂(例如,酸、碱、溶剂、离液剂、盐)使核酸变性。
可以使单链核酸(如单链循环核酸或测序就绪文库)的样品复性或杂交。在一些情况下,使单链核酸样品与寡核苷酸集合杂交。在一些情况下,使寡核苷酸集合与阻断剂寡核苷酸杂交。在一些情况下,使单链核酸的至少一部分复性或杂交。在一些情况下,使核酸在约0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、40、45、50、55、60、65、68或70℃下复性或杂交。在一些情况下,使核酸在冰上复性或杂交。在一些情况下,使核酸在室温下复性或杂交。在一些情况下,使核酸复性或杂交约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟,或2、3、4、5、10、15、20、22、24、30、40、46、48、50、60、70、72、80或96小时。温度、缓冲液组成、反应时间和浓度可影响杂交的程度。在一些情况下,在三甲基氯化铵的存在下使核酸复性。
自我杂交方法
本文也提供了用于引发、捕获或富集核酸样品内的感兴趣群体的另外的方法和组合物。在一些情况下,通过自我杂交方法,例如利用基于浓度的杂交动力学的方法来富集感兴趣的群体。核酸杂交动力学依赖于杂交链的浓度。通常,高浓度核酸比低浓度核酸更快地杂交。在复杂的核酸群体中,丰富的核酸(例如,背景群体)比稀有的核酸(例如,感兴趣群体)更快地杂交。这种浓度依赖性可用于通过在核酸群体部分杂交后去除至少一部分双链核酸或者分离至少一部分单链核酸来减少样品中丰富的核酸的量并富集稀有核酸的量。因此,可以减少背景群体(例如,人)核酸的量,并且可以富集感兴趣群体(例如,非人、微生物或病原体)核酸的量。
在一些情况下,获得包含背景群体DNA(例如,人DNA)和感兴趣群体DNA(例如,非人或病原体DNA)的DNA样品(例如,循环DNA或循环无细胞DNA)。可使样品中的核酸变性以产生单链DNA的样品。在一些情况下,样品中的核酸为单链DNA,并且不需要变性。在一些情况下,随后使样品在限定的缓冲液中复性限定的时间段,预期背景群体DNA比感兴趣群体DNA更快地杂交,因为背景群体DNA以比感兴趣群体DNA更高的浓度存在。然后可以使样品经受去除双链DNA的条件-如通过使用双链体特异性核酸酶-从而优先去除样品中的背景群体DNA。在一些情况下,将包含RNA的样品与单链背景群体(例如,人)外显子组序列的混合物合并。在一些情况下,使样品复性限定的时间段,从而允许更丰富的外显子组序列与RNA杂交。然后去除DNA-RNA双链体,从而优先去除样品中的背景群体(例如,人)RNA。
在一些情况下,所述核酸如循环核酸为单链。在一些情况下,使双链核酸变性为单链核酸。在一些情况下,约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的核酸为单链。在一些情况下,至多1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的核酸为单链。在一些情况下,至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的核酸为单链。可使用热使核酸变性。在一些情况下,将核酸加热至约35、40、45、50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99℃。在一些情况下,将核酸加热至至多35、40、45、50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99℃。在一些情况下,将核酸加热至至少35、40、45、50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99℃。在一些情况下,将核酸加热约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟。在一些情况下,将核酸加热至多0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟。在一些情况下,将核酸加热至少0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟。在一些情况下,使用化学变性剂(例如,酸、碱、溶剂、离液剂、盐)使核酸变性。
可使单链核酸(如单链循环核酸)的样品复性或杂交。在一些情况下,使至少一部分单链核酸复性或杂交。在一些情况下,使约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的单链核酸复性或杂交。在一些情况下,使至多1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的单链核酸复性或杂交。在一些情况下,使至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的单链核酸复性或杂交。在一些情况下,使核酸在约0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、40、45、50、55、60、65、68或70℃复性或杂交。在一些情况下,使核酸在至多0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、40、45、50、55、60、65、68或70℃复性或杂交。在一些情况下,使核酸在至少0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、40、45、50、55、60、65、68或70℃复性或杂交。在一些情况下,使核酸在冰上复性或杂交。在一些情况下,使核酸在室温下复性或杂交。在一些情况下,使核酸复性或杂交约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟,或2、3、4、5、10、15、20、22、24、30、40、46、48、50、60、70、72、80或96小时。在一些情况下,使核酸复性或杂交至多0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟,或2、3、4、5、10、15、20、22、24、30、40、46、48、50、60、70、72、80或96小时。在一些情况下,使核酸复性或杂交至少0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或60分钟,或2、3、4、5、10、15、20、22、24、30、40、46、48、50、60、70、72、80或96小时。温度、缓冲液组成、反应时间和浓度可影响杂交的程度。在一些情况下,在三甲基氯化铵的存在下使核酸复性。
复性后,可使单链核酸杂交或退火为双链核酸。在一些情况下,双链核酸为双链DNA、双链RNA或DNA-RNA双链体。可去除至少一部分双链核酸以产生富集的核酸群体。在一些情况下,去除约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的双链核酸。在一些情况下,去除至多1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的双链核酸。在一些情况下,去除至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的双链核酸。
在一些情况下,去除至少一部分双链核酸以产生富集的核酸群体。在一些情况下,分离至少一部分单链核酸以产生富集的核酸群体。在一些情况下,使用如凝胶电泳或毛细管电泳的分离方法去除至少一部分双链核酸。在一些情况下,使用如凝胶电泳或毛细管电泳的分离方法分离至少一部分单链核酸。在一些情况下,使用一种或多种核酸酶去除至少一部分双链核酸。在一些情况下,所述核酸酶作用于双链核酸。在一些情况下,所述核酸酶作用于双链DNA。在一些情况下,所述核酸酶作用于DNA-RNA双链体。在一些情况下,所述核酸酶不作用于单链核酸。在一些情况下,所述核酸酶不作用于单链DNA。在一些情况下,所述核酸酶不作用于单链RNA。核酸酶的一些非限制性实例包括双链体特异性核酸酶(DSN)(例如,来自堪察加螃蟹)、热不稳定DSN-TL、BAL-31、双链特异性DNA酶(例如,来自北方虾北极虾(Pandalus borealis))、外切核酸酶III和分泌的内切核酸酶(例如,来自致倦库蚊(Culex quinquefasciatus))。温度、缓冲液组成、反应时间、浓度以及核酸酶与底物的比例可影响核酸酶的特异性或活性。例如,据报道来自北方虾的双链特异性DNA酶在镁存在下对双链DNA具有底物优先性,但所述核酸酶在钙存在下变得对单链DNA有活性(Nilsen等人,“The Enzyme and the cDNA Sequence of a Thermolabile and Double-StrandSpecific DNase from Northern Shrimps(Pandalus borealis)PLOS One 2010)。核酸酶的组合可串联或并联使用。在一些情况下,在核酸酶处理后对核酸进行纯化以置换缓冲液组合物和/或去除核酸酶、核苷酸和/或短核酸片段。
在一些情况下,将包含核酸的样品与单链背景群体(例如,人)核酸的混合物结合。使样品复性限定的时间段,从而允许更丰富的背景群体核酸与样品中的核酸杂交。然后去除双链核酸,从而优先去除样品中的背景群体(例如,人)核酸。在一些情况下,样品包含RNA。在一些情况下,双链核酸为DNA-RNA双链体。在一些情况下,背景群体核酸为外显子组序列。在一些情况下,通过使包含核酸的样品与背景群体核酸接触,使得背景群体核酸与样品内互补或几乎互补的背景群体核酸杂交或以其他方式特异性结合来实现所述消耗。在一些情况下,所述方法进一步包括使至少一部分背景群体核酸变性例如通过加热。在一些情况下,可通过生物信息学或计算方法鉴别背景群体核酸序列。在一些情况下,背景群体核酸是合成的。在一些情况下,背景群体核酸为DNA。
所述背景群体核酸可相对于所述样品核酸过量提供。背景群体核酸与样品核酸的比例可为约0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。背景群体核酸与样品核酸的比例可为至多0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。背景群体核酸与样品核酸的比例可为至少0.1;0.2;0.3;0.4;0.5;0.6;0.7;0.8;0.9;1.0;1.1;1.2;1.3;1.4;1.5;1.6;1.7;1.8;1.9;2.0;2.5;3.0;3.5;4.0;4.5;5.0;5.5;6.0;6.5;7.0;7.5;8.0;8.5;9.0;9.5;10;11;12;13;14;15;16;17;18;19;20;25;30;35;40;45;50;55;60;65;70;75;80;85;90;95;100;200;300;400;500;600;700;800;900;1,000;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000。所述背景群体与样品核酸的比例可以是饱和的。所述背景群体与样品核酸的比例可以是不饱和的。所述比例可根据浓度、摩尔数或质量来计算。
在一些情况下,去除至少一部分双链核酸以产生富集的核酸群体。背景群体核酸可被化学标记并去除,从而去除双链核酸。背景群体核酸可与磁珠缀合并用磁铁去除,从而去除双链核酸。背景群体核酸可用核酸标记物进行标记。核酸标记物可与缀合固体支持体或用化学标记物标记的核酸序列结合或杂交。双链核酸可通过尺寸分离(例如,凝胶电泳、毛细管电泳等)、亲和分离(例如,下拉实验、色谱法等)或其他方法去除。在一些情况下,可使用分离方法如凝胶电泳、毛细管电泳或色谱法基于单链核酸和双链核酸的尺寸差异来分离双链核酸。在一些情况下,不去除未杂交的背景群体核酸。
通过核小体消耗进行富集
本文提供的富集方法的另一个实例为核小体消耗方法。如图6所示,纯化的人无细胞DNA具有大约180个碱基对的长度周期,表明大多数人无细胞DNA与核小体中的组蛋白相关。如图6所示,细菌DNA不具有特定的长度周期。消耗核小体或核小体相关DNA可提供用于富集感兴趣群体的方法。
在一些情况下,从游离DNA(例如,非核小体DNA或与非核小体相关的DNA)分离核小体DNA或核小体相关DNA的方法包括基于质量和/或净电荷进行分离的电泳和等速电泳、基于形状和/或尺寸进行分离的多孔过滤器、基于电荷进行分离的离子交换柱(核小体具有带正电荷的尾部的组蛋白,DNA具有带负电荷的骨架)、以及特异于宿主组蛋白以免疫消耗宿主核小体和相关DNA的抗体。在一些情况下,一部分宿主核酸是与核小体相关的,而一部分宿主核酸不是与核小体相关的。
在一些情况下,可以使用一种或多种抗体来免疫消耗组蛋白或核小体,如图7所示。在一些情况下,抗体(750)可能对背景群体(例如,宿主)组蛋白或核小体(710)具有特异性。在一些情况下,抗体可能对哺乳动物组蛋白或核小体具有特异性。在一些情况下,抗体可能对人组蛋白或人核小体具有特异性。在一些情况下,一种或多种抗体对一种或多种组蛋白具有特异性。在一些情况下,组蛋白可为组蛋白变体或具有组蛋白修饰。在一些情况下,免疫耗竭可保留感兴趣群体(例如,非宿主)核小体DNA(730)、感兴趣群体非核小体DNA(740)和背景群体(例如,宿主)非核小体DNA(720)。在一些情况下,免疫耗竭可包括免疫沉淀、染色质免疫沉淀、抗体的批量结合或采用柱固定的抗体的亲和色谱法。在一些情况下,一种或多种抗体固定在柱上。在一些情况下,去除一种或多种抗体(例如,使用与珠缀合的或附接至柱的抗免疫球蛋白抗体)。在一些情况下,所述一种或多种抗体是单克隆的。在一些情况下,所述一种或多种抗体靶向一种或多种组蛋白的C-末端。在一些情况下,所述一种或多种抗体靶向一种或多种组蛋白的N-末端。
组蛋白、组蛋白变体和组蛋白修饰的非限制性实例包括:组蛋白H2A N端、组蛋白H2A溶剂暴露表位、组蛋白H3中Lys9的单甲基化、组蛋白H3中Lys9的二甲基化、组蛋白H3中Lys56的三甲基化、组蛋白H2B中Ser14的磷酸化、组蛋白H2A.X中Ser139的磷酸化、H2A-H2B酸性补丁基序、组蛋白H1、组蛋白H1.0、组蛋白H1.1、组蛋白H1.2、组蛋白H1.3、组蛋白H1.4、组蛋白H1.5、组蛋白H1.oo、精子细胞特异性接头组蛋白H1样蛋白、组蛋白H1t、组蛋白H1t2、组蛋白H1FNT、1-B/E型组蛋白H2A(例如,组蛋白H2A.2、组蛋白H2A/a、组蛋白H2A/m)、2-A型组蛋白H2A(例如,组蛋白H2A.2、组蛋白H2A/o)、1-D型组蛋白H2A(例如,组蛋白H2A.3、组蛋白H2A/g)、1型组蛋白H2A(例如,H2A.1、组蛋白H2A/p)、2-C型组蛋白H2A(例如,组蛋白H2A-GL101、组蛋白H2A/q)、1-A型组蛋白H2A(例如,组蛋白H2A/r)、1-C型组蛋白H2A(例如,组蛋白H2A/l)、1-H型组蛋白H2A(例如,组蛋白H2A/s)、1-J型组蛋白H2A(例如,组蛋白H2A/e)、2-B型组蛋白H2A、3型组蛋白H2A、组蛋白H2AX(例如,H2a/x、组蛋白H2A.X、组蛋白H2A.Z、H2A/z、H2A.Z.1、H2A.Z.2)、组蛋白H2A.V(例如,H2A.F/Z)、组蛋白H2A.J(例如,H2a/j)、mH2A1、mH2A2、1型组蛋白H2A-Bbd(例如,H2A巴氏体缺陷型,H2A.Bbd)、2/3型组蛋白H2A-Bbd(例如,H2A巴氏体缺陷型,H2A.Bbd)、核心组蛋白macro-H2A.1(例如,组蛋白macroH2A1、mH2A1、组蛋白H2A.y、H2A/y、成神经管细胞瘤抗原MU-MB-50.205、macroH2A)、核心组蛋白macroH2A.2、组蛋白H2A、组蛋白H2A.J、组蛋白H2B、1-C/E/F/G/I型组蛋白H2B(例如,组蛋白H2B.1A、组蛋白H2B.a、H2B/a、组蛋白H2B.g、H2B/g、组蛋白H2B.h、H2B/h、组蛋白H2B.k、H2B/k、组蛋白H2B.l、H2B/l)、H2BE、1-H型组蛋白H2B、1-A型组蛋白H2B(例如,来自睾丸的组蛋白H2B、TSH2B.1、睾丸特异性组蛋白H2B、TSH2B)、1-B型组蛋白H2B(例如,组蛋白H2B.1、组蛋白H2B.f、H2B/f)、1-D型组蛋白H2B(例如,HIRA相互作用蛋白2、组蛋白H2B.1B、组蛋白H2B.b、H2B/b)、1-J型组蛋白H2B(例如,组蛋白H2B.1、组蛋白H2B.r、H2B/r)、1-O型组蛋白H2B(例如,组蛋白H2B.2、组蛋白H2B.n、H2B/n)、2-E型组蛋白H2B(例如,组蛋白H2B-GL105、组蛋白H2B.q、H2B/q)、1-H型组蛋白H2B(例如,组蛋白H2B.j、H2B/j)、1-M型组蛋白H2B(例如,组蛋白H2B.e、H2B/e)、1-L型组蛋白H2B(例如,组蛋白H2B.c、H2B/c)、1-N型组蛋白H2B(例如,组蛋白H2B.d、H2B/d)、F-S型组蛋白H2B(例如,组蛋白H2B.s、H2B/s)、推定2-C型组蛋白H2B(例如,组蛋白H2B.t、H2B/t)、1-K型组蛋白H2B(例如,H2B K、HIRA相互作用蛋白1)、2-F型组蛋白H2B、2-E型组蛋白H2B、3-B型组蛋白H2B(例如,12型H2B)、F-M型组蛋白H2B(例如,组蛋白H2B.s、H2B/s)、推定2-D型组蛋白H2B、W-T型组蛋白H2B(例如,睾丸特异性H2B组蛋白家族成员W)、组蛋白1H2bn同种型CRA_b、1-N型组蛋白H2B、H2B组蛋白家族成员M、F-M型组蛋白H2B、1-J型组蛋白H2B、H2BFWT、组蛋白H3、组蛋白H3.1(例如,组蛋白H3/a、组蛋白H3/b、组蛋白H3/c、组蛋白H3/d、组蛋白H3/f、组蛋白H3/h、组蛋白H3/i、组蛋白H3/j、组蛋白H3/k、组蛋白H3/l)、组蛋白H3.2(例如,组蛋白H3/m、组蛋白H3/o)、组蛋白H3.3C(例如,组蛋白H3.5)、组蛋白H3.1t(例如,H3/t、H3t、H3/g)、组蛋白H3.3、组蛋白H3样着丝粒蛋白A(例如,着丝粒自身抗原A、着丝粒蛋白A、CENP-A)、组蛋白H3.3(cDNA FLJ57905)、组蛋白H3.4、组蛋白H3.5、组蛋白H3.X、组蛋白H3.Y、组蛋白H4、G型组蛋白H4样蛋白、HIST1H4J蛋白、智人H4组蛋白家族成员N和组蛋白H5。
方法可消耗背景群体核小体相关DNA。背景群体核小体相关DNA可被消耗约5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。背景群体核小体相关DNA可被消耗至多5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。背景群体核小体相关DNA可被消耗至少5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
通过去除或分离特定长度区间的DNA进行富集
在一些情况下,本文提供的富集方法涉及去除特定长度区间的DNA,如特定长度区间的无细胞DNA,和/或分离特定长度区间的DNA,如特定长度区间的无细胞DNA。在一个实例中,在无细胞DNA样品中,宿主无细胞DNA与非宿主无细胞DNA的比例可具有一些可预测性的显著变化,使得可能存在宿主DNA与非宿主DNA的比例可处于局部最小值的无细胞DNA长度范围。在可能有兴趣分析无细胞样品中的非宿主DNA的情况下,可通过富集非宿主DNA与宿主DNA的比例更有利的DNA长度范围来相对于宿主DNA富集非宿主DNA。举例来说,图6图示了比较衍生自人的样品的DNA长度的图,其中上面的柱反映宿主或人DNA,而下面的柱表示非宿主DNA。在许多情况下,人DNA与组蛋白的缔合导致长度为大约175个碱基的第一尺寸片段以及长度为大约147个碱基的片段(即反映围绕单个组蛋白核的DNA长度)。如图6所示,峰示出了人DNA的尺寸分布,其还提供了在其他片段长度的局部最大值和局部最小值。
通过选择其中宿主DNA与非宿主DNA比例处于低点的尺寸范围,例如,如所示的,长度小于约120bp、约240至约280bp或约425bp至约475bp,可相对富集非宿主DNA。因此,根据本公开内容的某些方面,富集无细胞核酸样品的相对较短的片段,以相对于宿主核酸富集非宿主核酸。在许多情况下,富集过程富集长度约10个碱基至约300个碱基、约10个碱基至约200个碱基、约10个碱基至约175个碱基、约10个碱基至约150个碱基、约10个碱基至120个碱基、约10个碱基至约60个碱基、约30个碱基至约300个碱基、约30个碱基至约200个碱基、约30个碱基至约175个碱基、约30个碱基至约150个碱基、约30个碱基至120个碱基、或约30个碱基至约60个碱基的片段。如将会理解的,对选择过程的上限和下限的选择可靶向上述尺寸选择的上限和下限中的任一个。如将会理解的,上述的尺寸选择不旨在叙述确切的尺寸,而是将聚焦关于上述具有围绕所述片段尺寸的普通尺寸分布的范围的尺寸选择。举例来说,在叙述为选择给定片段尺寸范围的情况下,将会理解富集的样品内的主要尺寸范围将落入该范围,例如富集的样品中至少50%、至少60%、至少70%、至少80%、或在一些情况下至少90%的片段将反映叙述的尺寸范围。在其他情况下,将会理解,在富集的样品中反映的片段将包含基本上超出所述范围的所述上限和下限不大于约30%、不大于20%、不大于10%,以及一些情况下,超出所述范围的上限或下限不大于5%的片段。
在这种方法中,获得包含感兴趣群体(例如,病原体)DNA和背景群体(例如,人)DNA的核酸样品(例如,循环DNA样品)。在一些情况下,可针对背景群体DNA富集特定长度区间的DNA,并且可以从样品中消耗特定长度区间的DNA,从而优先富集感兴趣群体DNA。在一些情况下,可针对感兴趣群体DNA富集特定长度区间的DNA,并且可以从样品中分离特定长度区间的DNA,从而优先富集感兴趣群体DNA。在一些情况下,用于去除和/或分离特定长度区间的DNA的方法包括电泳(例如,凝胶电泳或毛细管电泳)、色谱法(例如,液相色谱法)、无细胞核酸纯化(例如,二氧化硅膜柱、缓冲液优化)和/或基于质量、尺寸和/或净电荷进行分离的质谱。
在一些情况下,可使用二氧化硅膜(例如二氧化硅膜柱,如QIAamp Mini柱)或商业试剂盒(例如,QIAamp循环核酸试剂盒)进行无细胞核酸纯化。通常,无细胞核酸纯化包括四个步骤:裂解、结合、洗涤和洗脱。
所述裂解步骤可从蛋白质、脂质和/或囊泡中释放核酸,可使DNA酶和/或RNA酶失活,并且可在变性条件下,在升高的温度下和/或在蛋白酶K的存在下发生。所述裂解步骤可使用缓冲液ACL和/或蛋白酶K。
所述结合步骤可将核酸结合或吸附到二氧化硅膜上。所述结合步骤可使用缓冲液ACB或包含按体积计约或至少约35%、40%、45%、50%、55%、60%、65%、66%、70%或75%的醇(例如,异丙醇)的结合缓冲液,例如包含约40%或约66%异丙醇的结合缓冲液。在一些情况下,相对于制造商推荐的方案,在无细胞核酸纯化期间使用额外的市售缓冲液(例如,缓冲液ACB)。例如,在一些情况下,添加的额外的市售缓冲液的体积为约或至少约1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、6.0、7.0、8.0、9.0或10.0倍的制造商推荐的方案中指定的体积。在一些情况下,每个二氧化硅膜柱或来自1mL样品(例如,血清或血浆)的每个裂解物使用约或至少约1.5、1.8、2.0、2.5、3.0、3.5、4.0、5.0、5.3、5.4、5.5、6.0、7.0、8.0、9.0、10.0、11.0、12.0、13.0、14.0、15.0或16.0mL的结合缓冲液或缓冲液ACB。
所述洗涤步骤可去除残留的污染物并且可以包括多个洗涤步骤。洗涤步骤可使用缓冲液ACW1、缓冲液ACW2、乙醇,和/或包含按体积计约或至少约50%、55%、56.8%、60%、65%、66%、69.8%、70%、75%、80%、85%、86%、87%、87.4%、88%、89%、90%、95%、96%、97%、98%、99%或100%的醇(例如乙醇)的洗涤缓冲液,例如包含约56.8%、约69.8%、约87.4%、约89%或约100%的乙醇的洗涤缓冲液。在一些情况下,乙醇可指96-100%的乙醇。在一些情况下,所述乙醇不是变性的醇。在一些情况下,所述乙醇不含甲醇或甲基乙基酮。在一些情况下,所述洗涤步骤可包括使用缓冲液ACW1(例如,每个二氧化硅膜柱600μL)的第一洗涤步骤、使用缓冲液ACW2(例如,每个二氧化硅膜柱750μL)的第二洗涤步骤,以及使用乙醇(例如,每个二氧化硅膜柱750μL)的第三洗涤步骤。在一些情况下,相对于制造商推荐的方案,在无细胞核酸纯化期间将额外的乙醇(例如,无水乙醇)添加至市售缓冲液(例如,Qiagen ACW1缓冲液、ACW2缓冲液)中。例如,在一些情况下,添加的额外的乙醇的体积为约或至少约每600μL或750μL市售缓冲液0.5、0.6、0.7、0.8、0.9、1.0、1.05、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.75、1.8、1.9、2.0、2.5、3.0、3.5、4.0、4.5、5.0、6.0、7.0、8.0、9.0或10.0mL。在一些情况下,添加的额外的乙醇的体积为至多约每600μL或750μL市售缓冲液0.5、0.6、0.7、0.8、0.9、1.0、1.05、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.75、1.8、1.9、2.0、2.5、3.0、3.5、4.0、4.5、5.0、6.0、7.0、8.0、9.0或10.0mL。
在一些情况下,相对于制造商推荐的方案,在无细胞核酸纯化期间将额外的氯化胍添加至市售缓冲液(例如,Qiagen ACW1缓冲液)中。例如,在一些情况下,添加的额外的氯化胍的量为约或至少约每600μL市售缓冲液0.1、0.2、0.3、0.31、0.32、0.33、0.34、0.35、0.36、0.37、0.38、0.39、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.75、1.8、1.9或2.0g。在一些情况下,添加的额外的氯化胍的量为至多约每600μL市售缓冲液或洗涤缓冲液0.1、0.2、0.3、0.31、0.32、0.33、0.34、0.35、0.36、0.37、0.38、0.39、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.75、1.8、1.9或2.0g。在一些情况下,洗涤缓冲液可包含约或至少约每600μL洗涤缓冲液0.1、0.2、0.3、0.31、0.32、0.33、0.34、0.35、0.36、0.37、0.38、0.39、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.75、1.8、1.9或2.0g氯化胍。
在一些情况下,相对于制造商推荐的方案,在无细胞核酸纯化期间将额外的乙醇(例如,无水乙醇)和额外的氯化胍添加至市售缓冲液(例如,Qiagen ACW1缓冲液)中。在一些情况下,所述洗涤步骤可包括采用包含氯化胍和约89.0%乙醇的第一洗涤缓冲液的第一洗涤步骤,采用包含约87.4%乙醇的第二洗涤缓冲液的第二洗涤步骤,和采用乙醇的第三洗涤步骤。在一些情况下,每种洗涤缓冲液均包含至少约60%、65%、66%、69.8%、70%、75%、80%、85%、86%、87%或87.4%的乙醇。
所述洗脱步骤可从二氧化硅膜上释放核酸。所述洗脱可使用缓冲液AVE。
例如,制造商推荐的用于Qiagen循环核酸(CNA)试剂盒的方案可进行以下修改:(a)使用3x体积的ACB缓冲液,(b)按照制造商的建议制备ACW1缓冲液,并且每600μL的ACW1缓冲液补充额外1.75mL的无水乙醇和0.36g的氯化胍,以及(c)根据制造商的建议制备ACW2缓冲液,并且每750μL ACW2缓冲液补充1.05mL无水乙醇。
除了其他核小体靶向的消耗方法之外,如本文其他地方所述,核酸的尺寸选择/分离方法在本领域中是公知的。例如,可使用色谱方法如凝胶电泳、凝胶排阻色谱法等来选择性分离所需长度的核酸。此外,基于珠的电荷分离方法可用于选择性分离期望尺寸范围的核酸。例如,从例如Beckman Coulter获得的SPRI珠系统和从例如New England Biolabs获得的AMPure珠系统可容易地用于进行无细胞DNA的尺寸选择纯化,其可以相对于宿主DNA富集非宿主DNA,如上所述。
在一些情况下,尺寸选择富集可提供非宿主DNA与宿主DNA比例至少约1.5X、至少约2X、至少约3X、至少约4X、至少约5X、至少约6X、至少约7X、至少约8X、至少约9X、至少约10X、至少约20X、至少约30X、至少约40X、至少约50X、至少约100X,以及在一些情况下高达约500X或更大的增加。仅用于说明的目的,如果非宿主DNA与宿主DNA以1:100的比例存在于无细胞样品中,则产生2X增加的富集将产生1:50的比例。在一些情况下,非宿主DNA与宿主DNA比例的增加将在约1.5X、2X、3X、4X或5X与约10X、20X、30X、40X、50X、100X、500X或更多之间。
可去除一个或多个长度区间的DNA。在一些情况下,所述一个或多个长度区间可选自约140个碱基对、约145个碱基对、约150个碱基对、约155个碱基对、约160个碱基对、约165个碱基对、约170个碱基对、约175个碱基对、约180个碱基对、约185个碱基对、约190个碱基对、约195个碱基对、约200个碱基对、约205个碱基对和约210个碱基对的一个或多个倍数。在一些情况下,倍数在每次出现时独立地选自1、2、3、4、5、6、7、8、9和10的倍数。例如,约180个碱基对是约180个碱基对的1的倍数,而约360个碱基对是约180个碱基对的2的倍数。在一些情况下,所述一个或多个长度区间可为约180个碱基对、约360个碱基对、约540个碱基对、约720个碱基对或约900个碱基对。
可分离一个或多个长度区间的DNA。在一些情况下,所述一个或多个长度区间可选自约10个碱基对、约20个碱基对、约30个碱基对、约40个碱基对、约50个碱基对、约60个碱基对、约70个碱基对、约80个碱基对、约90个碱基对、约100个碱基对、约110个碱基对、约120个碱基对、约130个碱基对、约140个碱基对、约150个碱基对、约160个碱基对、约170个碱基对、至多约10个碱基对、至多约20个碱基对、至多约30个碱基对、至多约40个碱基对、至多约50个碱基对、至多约60个碱基对、至多约70个碱基对、至多约80个碱基对、至多约90个碱基对、至多约100个碱基对、至多约110个碱基对、至多约120个碱基对、至多约130个碱基对、至多约140个碱基对、至多约150个碱基对、至多约160个碱基对、至多约170个碱基对,以及选自约70个碱基对、约75个碱基对、约80个碱基对、约85个碱基对、约90个碱基对、约95个碱基对、约100个碱基对和约105个碱基对的一个或多个倍数。在一些情况下,倍数在每次出现时独立地选自1、3、5、7、9、11、13、15、17和19的倍数。例如,约90个碱基对是约90个碱基对的1的倍数,而约270个碱基对是约90个碱基对的3的倍数。在一些情况下,所述一个或多个长度区间可为约90个碱基对、约270个碱基对、约450个碱基对、约630个碱基对或约810个碱基对。
方法可分离或去除一个或多个长度区间的DNA。可分离或去除约5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特定长度区间的DNA。可分离或去除至多5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特定长度区间的DNA。可分离或去除至少5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特定长度区间的DNA。
用于背景群体消耗和/或感兴趣群体富集的外来体
本文提供的富集方法的另一个实例包括靶向从宿主获得的生物样品内的外来体核酸以消耗或富集样品的感兴趣群体(例如,非宿主)核酸。外来体和其他细胞外囊泡由细胞分泌并存在于生物流体中。它们可通过在质膜上直接萌芽或通过多泡体途径释放。
在一些情况下,感兴趣群体(例如,病原体、非人)的核酸可不对称地分布在外来体的内部或外部。在一些情况下,背景群体核酸(例如,人)不对称地分布在外来体的内部或外部。在感兴趣群体(例如,非宿主、病原体)的核酸存在于外来体外部的情况下,所述方法可包括从样品中去除外来体以富集在外来体外部的感兴趣群体的核酸。类似地,当外来体内存在背景群体(例如,宿主或人)核酸时,所述方法可包括去除外来体以富集在外来体外部的感兴趣群体核酸。在一些情况下,在从样品中分离核酸如循环核酸之前,从生物样品中分离或去除外来体。
在外来体内存在感兴趣群体(例如,微生物或病原体)核酸的情况下,所述方法可包括捕获外来体以富集在外来体内部的感兴趣群体的核酸。在感兴趣群体的核酸存在于白细胞(例如,巨噬细胞)内或由白细胞(例如,巨噬细胞)处理的情况下,所述方法可包括优先分离白细胞衍生的外来体,例如通过用抗体来免疫沉淀白细胞衍生的外来体。同样地,在外来体外部存在背景群体(例如,宿主或人)核酸的情况下,所述方法可包括从样品中捕获外来体以富集外来体内部的感兴趣群体的核酸。
在一些情况下,背景群体核酸不对称地分布在外来体的内部或外部。例如,人核酸如人无细胞核酸可以不对称地分布在外来体的内部或外部。一般来说,血浆中的大部分人无细胞RNA是在外来体内发现的,这可能是因为血浆中存在大量的RNA酶。由于无细胞RNA的降解,使用循环核酸试剂盒直接提取无细胞RNA可能不会产生高质量的RNA。外来体分离可产生高质量的RNA,包括完整的mRNA、18S和28S核糖体RNA。大多数人无细胞mRNA可能在外来体内。因此,在一些情况下,本文提供的方法可包括从样品中消耗外来体以从样品中消耗人无细胞mRNA。相比之下,通常血浆中大部分的人无细胞DNA可能不在外来体中,这可能是因为外来体包裹胞液。因此,在一些情况下,本文提供的方法可包括富集样品中的外来体以从样品中消耗人无细胞DNA。
在一些情况下,所述方法可包括确定血浆、分离的外来体和/或外来体消耗的血浆中的感兴趣群体核酸与背景群体核酸的比例。例如,所述方法可包括确定血浆、分离的外来体和/或外来体消耗的血浆中的微生物核酸与人核酸的比例。在一些情况下,所述方法可包括确定血浆、分离的外来体和/或外来体消耗的血浆中的微生物DNA与人DNA的比例。在一些情况下,所述方法可包括确定血浆、分离的外来体和/或外来体消耗的血浆中的微生物RNA与人RNA的比例。在一些情况下,所述方法可包括确定血浆、分离的外来体和/或外来体消耗的血浆中的感兴趣群体的核酸的量、百分比或浓度。
在感兴趣群体的核酸存在于白细胞(例如,巨噬细胞)内或由白细胞(例如,巨噬细胞)处理的情况下,所述方法可包括优先分离白细胞衍生的外来体,例如通过用抗体来免疫沉淀白细胞衍生的外来体。在微生物或病原体核酸存在于白细胞内或由白细胞处理的情况下,所述方法可包括优先分离白细胞衍生的外来体,例如通过用抗体来免疫沉淀白细胞衍生的外来体。在一些情况下,所述方法可包括富集衍生自哺乳动物白细胞(例如,巨噬细胞)的外来体。在一些情况下,所述方法可包括富集衍生自人白细胞(例如,巨噬细胞)的外来体。在一些情况下,所述方法可包括富集衍生自宿主白细胞(例如,巨噬细胞)的外来体。由于外来体重新进入血流而大多数巨噬细胞不能,因此所述方法可提供关于深部组织感染的信息。
方法可分离或去除外来体。可分离或去除约5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的外来体。可分离或去除至多5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的外来体。可分离或去除至少5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的外来体。用于从血浆中分离外来体的可用试剂盒和方案的一些非限制性实例包括:外旋(Exo-spin)血液外来体纯化试剂盒(CellGuidance Systems)、exoRNeasy血清/血浆试剂盒(Qiagen)、总外来体分离试剂(LifeTechnologies)、ExoQuick(System Biosciences)、外流(Exo-Flow)外来体免疫纯化(System Biosciences)、ME试剂盒(新英格兰肽(New England Peptide))、Vn96肽(新英格兰肽)、PureExo外来体分离试剂盒(101Bio)和血浆/血清循环和外来体RNA纯化试剂盒(Norgen Biotek Corp)。
靶向的宿主DNA消耗
在一些情况下,无细胞样品中宿主核酸的消耗可利用靶向特异性序列、序列结构或核酸特征或修饰,上述任何一个对于宿主核酸或非宿主核酸之一都可能是特异性的。例如,可靶向特定的序列基序、结构、碱基修饰等作为结合、拉出、沉淀、消化或以其他方式去除或选择宿主核酸或非宿主核酸之一的机制。举例来说,在许多情况下,人核酸可包含在非宿主或病原体相关的核酸中可能不反映的碱基修饰。这样的修饰包括例如甲基化模式,如胞嘧啶甲基化。例如,甲基胞嘧啶可发现于高等生物的CpG岛中。虽然存在于一些真核病原体中,但与任何其他生物相比,其在脊椎动物中的存在相当高。
在一些情况下,可以使用对甲基化基序具有特异性的内切核酸酶(例如,McrBC、FspEI、LpnPI、MspJI内切核酸酶)靶向这些类型的修饰。这些内切核酸酶通常需要靠近的两个碱基修饰以进行消化。所述分离可为50bp至3kbp的任何长度,例如至少50bp、至少60bp、至少70bp、至少80bp、至少90bp、至少100bp、至少200bp、至少300bp、至少400bp、至少500bp、至少600bp、至少700bp、至少800bp、至少900bp、至少1kbp、至少1.5kbp、至少2kbp、至少2.5kbp或至少3kbp。这可导致人cfDNA片段差的消化效率,因为它们大部分长度为147-175bp。这可通过在制备测序文库期间的连接步骤中提供的两个衔接子之一中引入配偶体碱基修饰来改善。例如,即使在原始人cfDNA片段中仅存在一个甲基胞嘧啶,携带P5序列的衔接子也可以包含在CpG岛中的甲基胞嘧啶以刺激McrBC消化后连接。因此,在一些情况下,可以通过在用于制备序列文库的衔接子序列内包含甲基化的碱基,将“辅助”修饰的碱基人工地引入到序列文库中。因此,可在衔接子连接至序列片段后使用消化步骤,以预先消化宿主衍生的文库元件,同时允许非宿主衍生的文库元件通过扩增和测序进行处理。
在替代或另外的方法中,可使用可能需要两个或更多个这样的位点之间的间隔距离的成对识别序列,以选择性地或优先消化比这种所需的间隔距离更长的序列。例如,在McrBC内切核酸酶可识别相隔50个或更多个碱基(例如,50bp至约3kbp)的两个甲基化胞嘧啶的情况下,可在附接至任一端的衔接子序列上提供甲基化的碱基。因此,在相反衔接子上的甲基化碱基之间保持多于50个碱基的片段将被McrBC内切核酸酶消化,从而富集样品的更短的核酸片段,这导致非宿主片段更大的富集,如本文其他地方所述。
组合的富集方法
虽然上述富集方案是单独描述的,但应理解,上述方法中的任一种或全部可以以各种组合用于相对于宿主DNA富集样品中的非宿主DNA。例如,可首先对无细胞样品进行基于尺寸选择的DNA纯化方案,例如使用SPRI珠系统,随后进行色谱尺寸选择方案、核小体免疫沉淀方案等中的一种或多种。
同样,如上所述,在一些情况下,非宿主DNA的单步或多步富集可导致样品中非宿主DNA与宿主DNA的比例增加约2X至约10,000X。在一些情况下,所述比例可增加至少2X、至少3X、至少4X、至少5X、至少6X、至少7X、至少8X、至少9X、至少10X、至少11X、至少12X、至少13X、至少14X、至少15X、至少16X、至少17X、至少18X、至少19X、至少20X、至少30X、至少40X、至少50X、至少60X、至少70X、至少80X、至少90X、至少100X、至少1000X、至少5000X,或在一些情况下,增加至少10,000X。
通过核酸掺入法对样品进行分子条形码化
样品可采用核酸条形码掺入(spike-ins)进行条形码化。所述核酸条形码可为一个或多个长度。在一些情况下,所述核酸条形码可为寡核苷酸、双链体longmer、PCR产物和/或质粒。在一些情况下,所述核酸条形码可为DNA、RNA、PNA、LNA、BNA或其任意组合。在一些情况下,所述核酸条形码可包含一个或多个背景群体例如人基因组或病原体基因组中缺失的序列。在一些情况下,所述核酸条形码可包含一个或多个感兴趣群体中缺失的序列。
在一些情况下,与样品管外部的标记物不同,条形码为样品的一部分。在一些情况下,可在任何阶段添加条形码,包括在添加生物样品之前,并且可以在任何阶段读出条形码(例如,通过PCR或测序)。在一些情况下,条形码可用于追踪样品、检测交叉污染和/或追踪试剂。在一些情况下,条形码可用于减少样品混淆。在一些情况下,核酸条形码可用于增加总核酸浓度以增加低浓度样品的回收率。在一些情况下,条形码可用于将已知输入与测量的输出进行比较或用于通过提供用于比较或标准化的参考标准(例如,标准化寡核苷酸)来推断样品输入。在一些情况下,条形码可用于通过测量文库复杂性、样品损失、灵敏度和/或尺寸偏差利用质量控制和开发来改善性能。
在一些情况下,样品(例如,生物样品或核酸样品)可以掺入标准化寡核苷酸。在一些情况下,标准化寡核苷酸可用于监测DNA操作、纯化和/或扩增步骤的效率。例如,可将感兴趣群体(例如,非宿主或病原体)测序读取的绝对数目与回收的标准化寡核苷酸读取的绝对数目进行比较,以使样品之间的分子操作效率的差异标准化。在一些情况下,所述标准化寡核苷酸可用于条形码化的目的或用于标准化和条形码化两个目的。
感兴趣区域的策略性捕获
本文提供的寡核苷酸集合和方法可进一步包含含有与感兴趣区域相同、几乎相同、互补或几乎互补的核酸序列的寡核苷酸。感兴趣区域的一些非限制性实例包括致病性基因座(例如,艰难梭菌中的致病性基因座);抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生虫抗性标志物;提供信息的基因分型区(例如,来自宿主、人、微生物、病原体、细菌、病毒、真菌或寄生虫);在两种或更多种微生物、病原体、细菌、病毒、真菌和/或寄生虫之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌或寄生虫所特有的序列。在一些情况下,感兴趣区域可存在于非宿主、细菌、病毒、病原体、真菌或微生物基因组中。在一些情况下,感兴趣区域可存在于宿主、哺乳动物或人基因组中。包括与感兴趣区域相同、几乎相同、互补或几乎互补的核酸序列可以实现基因分型、抗微生物抗性检测、抗生素抗性检测、抗病毒抗性检测、抗寄生虫抗性检测和/或增强病原体检测灵敏度。与感兴趣区域相同、几乎相同、互补或几乎互补的核酸序列可以是生物信息学或计算设计的和/或化学合成的,例如通过DNA合成。所述核酸序列可用作核酸扩增或检测的引物,以从RNA模板中引发cDNA合成,用于测序、引物延伸反应、DNA/RNA杂交和/或DNA/RNA下拉。
抗生素抗性标志物可包含赋予抗生素抗性的一个或多个突变、单核苷酸多态性、基因或基因产物。抗生素抗性标志物可通过一种或多种机制赋予抗生素抗性,所述机制例如但不限于抗生素外排、抗生素失活、抗生素靶标改变、抗生素靶标保护、抗生素靶标替换和/或降低对抗生素的渗透性。在一些情况下,可能在以下生物中找到抗生素抗性标志物:艰难梭菌(C.difficile)、耐碳青霉烯肠杆菌(CRE)、耐药奈瑟球菌、淋病奈瑟氏菌(耐头孢菌素)、多重耐药不动杆菌、耐药弯曲杆菌、耐氟康唑念珠菌(一种真菌)、产生超广谱β-内酰胺酶的肠杆菌(ESBL)、耐万古霉素肠球菌(VRE)、多重耐药铜绿假单胞菌、耐药非伤寒沙门菌、耐药伤寒沙门菌、耐药志贺菌、耐甲氧西林金黄色葡萄球菌(MRSA)、耐药肺炎链球菌、耐药结核(MDR和XDR)、多重耐药金黄色葡萄球菌、耐万古霉素金黄色葡萄球菌(VRSA)、耐红霉素链球菌A组或耐克林霉素链球菌B组。在一些情况下,抗生素抗性标志物可赋予抗生素针对以下物质的抗性:吖啶染料、氨基香豆素抗生素、氨基糖苷、氨基核苷抗生素、β-内酰胺、二氨基嘧啶、elfamycin、氟喹诺酮、糖肽抗生素、林可酰胺、脂肽抗生素、大环抗生素、大环内酯、核苷抗生素、有机砷抗生素、噁唑烷酮抗生素、肽抗生素、苯丙醇、截短侧耳素类抗生素、聚胺抗生素、利福霉素抗生素、链霉杀阳菌素抗生素、磺酰胺、砜、四环素衍生物或其任意组合。在一些情况下,抗生素抗性标志物可赋予抗生素针对以下物质的抗性:β-内酰胺、盘尼西林、氨基青霉素、初代头孢菌素、β-内酰胺酶抑制剂组合、广谱头孢菌素、碳青霉烯、氟喹诺酮、氨基糖苷、四环素、甘氨酰四环素类(glycycline)、多粘菌素、盘尼西林、甲氧西林、红霉素、庆大霉素、头孢他啶、万古霉素、左氧氟沙星、亚胺培南、利奈唑胺、头孢曲松、头孢洛林或其任意组合。
抗生素抗性标志物的非限制性实例包括:aac2ia、aac2ib、aac2ic、aac2id、aac2i、aac3ia、aac3iia、aac3iib、aac3iii、aac3iv、aac3ix、aac3vi、aac3viii、aac3vii、aac3x、aac6i、aac6ia、aac6ib、aac6ic、aac6ie、aac6if、aac6ig、aac6iia、aac6iib、aad9、aad9ib、aadd、acra、acrb、adea、adeb、adec、amra、amrb、ant2ia、ant2ib、ant3ia、ant4iia、ant6ia、aph33ia、aph33ib、aph3ia、aph3ib、aph3ic、aph3iiia、aph3iva、aph3va、aph3vb、aph3via、aph3viia、aph4ib、aph6ia、aph6ib、aph6ic、aph6id、arna、baca、bcra、bcrc、bl1_acc、bl1_ampc、bl1_asba、bl1_ceps、bl1_cmy2、bl1_ec、bl1_fox、bl1_mox、bl1_och、bl1_pao、bl1_pse、bl1_sm、bl2a_1、bl2a_exo、bl2a_iii2、bl2a_iii、bl2a_kcc、bl2a_nps、bl2a_okp、bl2a_pc、bl2be_ctxm、bl2be_oxy1、bl2be_per、bl2be_shv2、bl2b_rob、bl2b_tem1、bl2b_tem2、bl2b_tem、bl2b_tle、bl2b_ula、bl2c_bro、bl2c_pse1、bl2c_pse3、bl2d_lcr1、bl2d_moxa、bl2d_oxa10、bl2d_oxa1、bl2d_oxa2、bl2d_oxa5、bl2d_oxa9、bl2d_r39、bl2e_cbla、bl2e_cepa、bl2e_cfxa、bl2e_fpm、bl2e_y56、bl2f_nmca、bl2f_sme1、bl2_ges、bl2_kpc、bl2_len、bl2_veb、bl3_ccra、bl3_cit、bl3_cpha、bl3_gim、bl3_imp、bl3_l、bl3_shw、bl3_sim、bl3_vim、ble、blt、bmr、cara、cata10、cata11、cata12、cata13、cata14、cata15、cata16、cata1、cata2、cata3、cata4、cata5、cata6、cata7、cata8、cata9、catb1、catb2、catb3、catb4、catb5、ceoa、ceob、cml_e1、cml_e2、cml_e3、cml_e4、cml_e5、cml_e6、cml_e7、cml_e8、dfra10、dfra12、dfra13、dfra14、dfra15、dfra16、dfra17、dfra19、dfra1、dfra20、dfra21、dfra22、dfra23、dfra24、dfra25、dfra25、dfra25、dfra26、dfra5、dfra7、dfrb1、dfrb2、dfrb3、dfrb6、emea、emrd、emre、erea、ereb、erma、ermb、ermc、ermd、erme、ermf、ermg、ermh、ermn、ermo、ermq、ermr、erms、ermt、ermu、ermv、ermw、ermx、ermy、fosa、fosb、fosc、fosx、fusb、fush、ksga、lmra、lmrb、lnua、lnub、lsa、maca、macb、mdte、mdtf、mdtg、mdth、mdtk、mdtl、mdtm、mdtn、mdto、mdtp、meca、mecr1、mefa、mepa、mexa、mexb、mexc、mexd、mexe、mexf、mexh、mexi、mexw、mexx、mexy、mfpa、mpha、mphb、mphc、msra、norm、oleb、opcm、opra、oprd、oprj、oprm、oprn、otra、otrb、pbp1a、pbp1b、pbp2b、pbp2、pbp2x、pmra、qac、qaca、qacb、qnra、qnrb、qnrs、rosa、rosb、smea、smeb、smec、smed、smee、smef、srmb、sta、str、sul1、sul2、sul3、tcma、tcr3、tet30、tet31、tet32、tet33、tet34、tet36、tet37、tet38、tet39、tet40、teta、tetb、tetc、tetd、tete、tetg、teth、tetj、tetk、tetl、tetm、teto、tetpa、tetpb、tet、tetq、tets、tett、tetu、tetv、tetw、tetx、tety、tetz、tlrc、tmrb、tolc、tsnr、vana、vanb、vanc、vand、vane、vang、vanha、vanhb、vanhd、vanra、vanrb、vanrc、vanrd、vanre、vanrg、vansa、vansb、vansc、vansd、vanse、vansg、vant、vante、vantg、vanug、vanwb、vanwg、vanxa、vanxb、vanxd、vanxyc、vanxye、vanxyg、vanya、vanyb、vanyd、vanyg、vanz、vata、vatb、vatc、vatd、vate、vgaa、vgab、vgba、vgbb、vph、ykkc和ykkd。
富集
本文所述的方法可富集感兴趣群体的核酸。在一些情况下,感兴趣核酸群体可富集约5%;10%;15%;20%;25%;30%;35%;40%;45%;50%;55%;60%;65%;70%;75%;80%;85%;90%;95%;100%;150%;200%;250%;300%;350%;400%;450%;500%;550%;600%;650%;700%;750%;800%;850%;900%;950%;1,000%;2,000%;3,000%;4,000%;5,000%;6,000%;7,000%;8,000%;9,000%;10,000%;20,000%;30,000%;40,000%;50,000%;60,000%;70,000%;80,000%;90,000%;100,000%;200,000%;300,000%;400,000%;500,000%;600,000%;700,000%;800,000%;900,000%;1,000,000%;2,000,000%;3,000,000%;4,000,000%;5,000,000%;6,000,000%;7,000,000%;8,000,000%;9,000,000%;10,000,000%;20,000,000%;30,000,000%;40,000,000%;50,000,000%;60,000,000%;70,000,000%;80,000,000%;90,000,000%;或100,000,000%。在一些情况下,感兴趣群体的核酸可富集至多5%;10%;15%;20%;25%;30%;35%;40%;45%;50%;55%;60%;65%;70%;75%;80%;85%;90%;95%;100%;150%;200%;250%;300%;350%;400%;450%;500%;550%;600%;650%;700%;750%;800%;850%;900%;950%;1,000%;2,000%;3,000%;4,000%;5,000%;6,000%;7,000%;8,000%;9,000%;10,000%;20,000%;30,000%;40,000%;50,000%;60,000%;70,000%;80,000%;90,000%;100,000%;200,000%;300,000%;400,000%;500,000%;600,000%;700,000%;800,000%;900,000%;1,000,000%;2,000,000%;3,000,000%;4,000,000%;5,000,000%;6,000,000%;7,000,000%;8,000,000%;9,000,000%;10,000,000%;20,000,000%;30,000,000%;40,000,000%;50,000,000%;60,000,000%;70,000,000%;80,000,000%;90,000,000%;或100,000,000%。在一些情况下,感兴趣群体的核酸可富集至少5%;10%;15%;20%;25%;30%;35%;40%;45%;50%;55%;60%;65%;70%;75%;80%;85%;90%;95%;100%;150%;200%;250%;300%;350%;400%;450%;500%;550%;600%;650%;700%;750%;800%;850%;900%;950%;1,000%;2,000%;3,000%;4,000%;5,000%;6,000%;7,000%;8,000%;9,000%;10,000%;20,000%;30,000%;40,000%;50,000%;60,000%;70,000%;80,000%;90,000%;100,000%;200,000%;300,000%;400,000%;500,000%;600,000%;700,000%;800,000%;900,000%;1,000,000%;2,000,000%;3,000,000%;4,000,000%;5,000,000%;6,000,000%;7,000,000%;8,000,000%;9,000,000%;10,000,000%;20,000,000%;30,000,000%;40,000,000%;50,000,000%;60,000,000%;70,000,000%;80,000,000%;90,000,000%;或100,000,000%。例如,如果样品含有总核酸群体中5%的感兴趣群体的核酸,并且富集至含有总核酸群体中10%的感兴趣群体的核酸,则所述感兴趣群体的核酸被富集100%。在一些情况下,感兴趣群体的核酸可富集约1.5倍;2倍;2.5倍;3倍;3.5倍;4倍;4.5倍;5倍;5.5倍;6倍;6.5倍;7倍;7.5倍;8倍;8.5倍;9倍;9.5倍;10倍;15倍;20倍;25倍;30倍;35倍;40倍;45倍;50倍;55倍;60倍;65倍;70倍;75倍;80倍;85倍;90倍;95倍;100倍;150倍;200倍;250倍;300倍;350倍;400倍;450倍;500倍;550倍;600倍;650倍;700倍;750倍;800倍;850倍;900倍;950倍;1,000倍;2,000倍;3,000倍;4,000倍;5,000倍;6,000倍;7,000倍;8,000倍;9,000倍;10,000倍;20,000倍;30,000倍;40,000倍;50,000倍;60,000倍;70,000倍;80,000倍;90,000倍;100,000倍;200,000倍;300,000倍;400,000倍;500,000倍;600,000倍;700,000倍;800,000倍;900,000倍;或1,000,000倍。在一些情况下,感兴趣群体的核酸可富集至多1.5倍;2倍;2.5倍;3倍;3.5倍;4倍;4.5倍;5倍;5.5倍;6倍;6.5倍;7倍;7.5倍;8倍;8.5倍;9倍;9.5倍;10倍;15倍;20倍;25倍;30倍;35倍;40倍;45倍;50倍;55倍;60倍;65倍;70倍;75倍;80倍;85倍;90倍;95倍;100倍;150倍;200倍;250倍;300倍;350倍;400倍;450倍;500倍;550倍;600倍;650倍;700倍;750倍;800倍;850倍;900倍;950倍;1,000倍;2,000倍;3,000倍;4,000倍;5,000倍;6,000倍;7,000倍;8,000倍;9,000倍;10,000倍;20,000倍;30,000倍;40,000倍;50,000倍;60,000倍;70,000倍;80,000倍;90,000倍;100,000倍;200,000倍;300,000倍;400,000倍;500,000倍;600,000倍;700,000倍;800,000倍;900,000倍;或1,000,000倍。在一些情况下,感兴趣群体的核酸可富集至少1.5倍;2倍;2.5倍;3倍;3.5倍;4倍;4.5倍;5倍;5.5倍;6倍;6.5倍;7倍;7.5倍;8倍;8.5倍;9倍;9.5倍;10倍;15倍;20倍;25倍;30倍;35倍;40倍;45倍;50倍;55倍;60倍;65倍;70倍;75倍;80倍;85倍;90倍;95倍;100倍;150倍;200倍;250倍;300倍;350倍;400倍;450倍;500倍;550倍;600倍;650倍;700倍;750倍;800倍;850倍;900倍;950倍;1,000倍;2,000倍;3,000倍;4,000倍;5,000倍;6,000倍;7,000倍;8,000倍;9,000倍;10,000倍;20,000倍;30,000倍;40,000倍;50,000倍;60,000倍;70,000倍;80,000倍;90,000倍;100,000倍;200,000倍;300,000倍;400,000倍;500,000倍;600,000倍;700,000倍;800,000倍;900,000倍;或1,000,000倍。例如,如果样品含有总核酸群体中5%的感兴趣群体的核酸,并且富集至含有总核酸群体中10%的感兴趣群体的核酸,则所述感兴趣群体的核酸被富集了2倍。
本文所述的方法可消耗背景群体核酸。在一些情况下,背景群体核酸可消耗约5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些情况下,背景群体核酸可消耗至多5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些情况下,背景群体核酸可消耗至少5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。例如,如果样品含有总核酸群体中50%的背景群体核酸,并且被消耗至含有总核酸群体中10%的背景群体核酸,则背景群体核酸消耗了80%。在一些情况下,背景群体核酸可富集约1.5倍;2倍;2.5倍;3倍;3.5倍;4倍;4.5倍;5倍;5.5倍;6倍;6.5倍;7倍;7.5倍;8倍;8.5倍;9倍;9.5倍;10倍;15倍;20倍;25倍;30倍;35倍;40倍;45倍;50倍;55倍;60倍;65倍;70倍;75倍;80倍;85倍;90倍;95倍;100倍;150倍;200倍;250倍;300倍;350倍;400倍;450倍;500倍;550倍;600倍;650倍;700倍;750倍;800倍;850倍;900倍;950倍;1,000倍;2,000倍;3,000倍;4,000倍;5,000倍;6,000倍;7,000倍;8,000倍;9,000倍;10,000倍;20,000倍;30,000倍;40,000倍;50,000倍;60,000倍;70,000倍;80,000倍;90,000倍;100,000倍;200,000倍;300,000倍;400,000倍;500,000倍;600,000倍;700,000倍;800,000倍;900,000倍;或1,000,000倍。在一些情况下,背景群体核酸可富集至多1.5倍;2倍;2.5倍;3倍;3.5倍;4倍;4.5倍;5倍;5.5倍;6倍;6.5倍;7倍;7.5倍;8倍;8.5倍;9倍;9.5倍;10倍;15倍;20倍;25倍;30倍;35倍;40倍;45倍;50倍;55倍;60倍;65倍;70倍;75倍;80倍;85倍;90倍;95倍;100倍;150倍;200倍;250倍;300倍;350倍;400倍;450倍;500倍;550倍;600倍;650倍;700倍;750倍;800倍;850倍;900倍;950倍;1,000倍;2,000倍;3,000倍;4,000倍;5,000倍;6,000倍;7,000倍;8,000倍;9,000倍;10,000倍;20,000倍;30,000倍;40,000倍;50,000倍;60,000倍;70,000倍;80,000倍;90,000倍;100,000倍;200,000倍;300,000倍;400,000倍;500,000倍;600,000倍;700,000倍;800,000倍;900,000倍;或1,000,000倍。在一些情况下,背景群体核酸可富集至少1.5倍;2倍;2.5倍;3倍;3.5倍;4倍;4.5倍;5倍;5.5倍;6倍;6.5倍;7倍;7.5倍;8倍;8.5倍;9倍;9.5倍;10倍;15倍;20倍;25倍;30倍;35倍;40倍;45倍;50倍;55倍;60倍;65倍;70倍;75倍;80倍;85倍;90倍;95倍;100倍;150倍;200倍;250倍;300倍;350倍;400倍;450倍;500倍;550倍;600倍;650倍;700倍;750倍;800倍;850倍;900倍;950倍;1,000倍;2,000倍;3,000倍;4,000倍;5,000倍;6,000倍;7,000倍;8,000倍;9,000倍;10,000倍;20,000倍;30,000倍;40,000倍;50,000倍;60,000倍;70,000倍;80,000倍;90,000倍;100,000倍;200,000倍;300,000倍;400,000倍;500,000倍;600,000倍;700,000倍;800,000倍;900,000倍;或1,000,000倍。例如,如果样品含有总核酸群体中50%的背景群体核酸,并且被消耗至含有总核酸群体中10%的背景群体核酸,则背景群体核酸消耗了5倍。
样品
本文提供的方法和组合物可用于检测从受试者(例如,人宿主)获得的各种不同样品中的核酸。生物样品的一些非限制性实例包括血液、血浆、血清、全血、粘液、唾液、脑脊液、滑液、灌洗液、尿液、组织活检物、细胞样品、皮肤样品和粪便。该样品可包含核酸,如循环核酸,包括循环无细胞核酸(例如,循环无细胞DNA,循环无细胞RNA)。在一些情况下,从受试者获得的样品经历进一步处理。例如,可对样品进行处理以提取可使用本文提供的方法来分析的DNA或RNA。
在一些情况下,核酸样品可以是这样的样品,如含有核酸如循环核酸的生物样品、分离的核酸样品或纯化的核酸样品。在一些情况下,核酸样品可含有宿主序列和非宿主序列,例如,人序列和非人序列。在一些情况下,对核酸样品中的核酸进行扩增(例如,通过PCR扩增反应),如核酸的测序就绪文库。在一些情况下,核酸样品中的核酸未被人工片段化(例如,通过超声处理、剪切、酶消化或化学片段化)。在一些情况下,由于核酸的长度相对较短,因此核酸片段化不是必要的。在一些情况下,核酸样品中的核酸被人工片段化。循环核酸样品可以是这样的样品,如含有循环核酸如循环无细胞核酸的生物样品、分离的核酸样品或纯化的核酸样品。在一些情况下,循环无细胞核酸样品可以是这样的样品,如含有循环无细胞核酸如循环无细胞DNA或循环无细胞RNA的生物样品、分离的核酸样品或纯化的核酸样品。在一些情况下,单链核酸样品可以是这样的样品,如含有单链核酸如单链循环核酸或单链循环无细胞核酸的生物样品、分离的核酸样品或纯化的核酸样品。
在一些情况下,核酸可以是DNA、RNA、cDNA、mRNA、cRNA、dsDNA、ssDNA、miRNA、循环核酸、循环DNA、循环RNA、无细胞核酸、无细胞DNA、无细胞RNA、循环无细胞DNA、循环无细胞RNA或基因组DNA。在一些情况下,循环核酸为循环DNA、循环RNA、无细胞核酸或循环无细胞核酸。在一些情况下,无细胞核酸可以是无细胞DNA、无细胞RNA、循环无细胞DNA或循环无细胞RNA。在一些情况下,循环无细胞核酸可以是循环无细胞DNA或循环无细胞RNA。
在一些情况下,样品内的核酸可以是未标记的;在一些情况下,例如用核酸标记物、化学标记物或光学标记物标记核酸。在一些情况下,核酸缀合至固体支持体。在一些情况下,标记物可附接在核酸的5'或3'端或核酸内部。在一些情况下,用超过一种标记物标记核酸。
可用核酸标记物标记样品中的核酸。在一些情况下,核酸标记物可包括以下一种或多种:条形码(例如,样品条形码)、通用引物序列、引物结合位点(例如,用于测序或用于读取条形码,包括但不限于符合各种测序平台要求的DNA测序引物结合位点、样品条形码测序引物结合位点和扩增引物结合位点)、测序仪兼容的序列、附接至测序平台的序列、测序衔接子序列或衔接子。核酸标记物可附接至核酸(例如,通过连接,或通过合成设计)。
核酸标记物可包括化学标记物。化学标记物的一些非限制性实例包括生物素、抗生物素蛋白、链霉抗生物素蛋白、放射性标记物、多肽和聚合物。核酸标记物可包括光学标记物。光学标记物的一些非限制性实例包括荧光团、荧光蛋白、染料和量子点。核酸标记物可缀合至固体支持体。固体支持体的一些非限制性实例包括珠子、磁珠、聚合物、载玻片、芯片、表面、板、通道、盒、微流体装置和微阵列。核酸可缀合至用于亲和色谱法的固体支持体。在一些情况下,每个核酸均具有不同的标记物。在一些情况下,每个核酸均具有相同的标记物。在一些情况下,样品中的核酸未缀合至固体支持体。
测序方法
在一些情况下,对富集的核酸群体进行测序。在一些情况下,本文所述的方法进一步包括进行测序分析。可通过本领域已知的任何方法来鉴别扩增或捕获的感兴趣群体的核酸,如通过进行测序分析,特别是高通量测序分析、下一代测序平台、大规模平行测序平台、纳米孔测序分析、Sanger测序或本领域已知的另一种测序分析。测序分析的一些非限制性实例包括高通量测序分析、下一代测序平台、大规模平行测序平台、纳米孔测序和Sanger测序。测序机器的类型的一些非限制性实例包括Illumina、Roche 454、Ion Torrent和Nanopore。
本文所述的过程还可与用于区分宿主核酸序列和非宿主核酸序列的其他方法联合使用,这些方法包括例如可区分宿主序列和非宿主序列的应用于所得序列数据的信息学数据分类方法。例如,这样的过程的实例包括在公布的美国专利申请号2015-0133391中描述的那些过程,该申请的全部公开内容通过引用整体并入本文用于所有目的。
应用
所述方法和组合物可用于分析来自被一种或多种非宿主物种(例如,微生物、病原体、细菌、病毒、真菌或寄生生物)感染的宿主的生物样品。本文提供的方法和组合物特别适用于检测、预测、诊断或监测疾病或病症,特别是由微生物或病原体引起的疾病或病症。本文提供的方法和组合物还可用于检测从被感染的宿主获得的某些类型的样品(如包含循环无细胞DNA或循环无细胞RNA的样品)中的感兴趣群体。
所述方法和组合物还可用于使得能够对样品中的病原体进行基因分型。该方法和组合物还特别适用于检测微生物或病原体基因组中的改变。例如,它们可用于检测细菌的抗生素抗性菌株或追踪影响病原体、特别是病毒和细菌的毒力的改变。
在其他情况下,所述方法和组合物可用于监测例如微生物组中一种或多种微生物的存在。例如,该方法和组合物可用于监测健康或未感染宿主中微生物组的存在。该方法和组合物还可用于监测含有多种微生物的样品内的微生物特征(signatures)。
本文提供的方法和组合物还可使得能够对来源于一种或多种非宿主生物体(例如,微生物、病原体、细菌、病毒、真菌或寄生生物)的核酸进行无假设检测,或对疾病、病症或感染进行无假设诊断或监测。因此,本文提供的方法可不同于其他筛选特定靶标(例如,一种或多种特定核酸序列、蛋白质或抗体)并且局限于测试选定靶标的诊断方法。在一些情况下,本文提供的方法和组合物的无假设特征可有助于检测罕见感染、检测两种或更多种疾病或病症的同时发生、鉴别感染源,或区分具有相似或共同症状的多种疾病或病症。
在一些特定实例中,所述方法可以以任何顺序或组合包括以下步骤中的一个或多个:(a)提供来自患有或疑似患有致病性感染的受试者或患者的核酸样品;(b)使该核酸样品与本文提供的寡核苷酸集合,特别是经选择性富集以结合非宿主序列的寡核苷酸集合接触;(c)使该样品和寡核苷酸集合经受促进该寡核苷酸集合与该核酸样品内的核酸分子进行杂交的条件;(d)对与该寡核苷酸集合杂交的核酸进行测定,如扩增测定、下拉测定或测序分析;以及(e)对杂交的核酸的序列进行分析,以便检测该样品中的特定病原体。通常,如本文进一步所述,所检测到的特定病原体的数目相当大,如超过10、20、30、40、50种或更多种不同病原体的数量级。通常,病原体的检测可使得能够对传染病、传染性病症、感染或其他疾病或病症(例如,癌症)进行检测、预后、监测或诊断。在一些情况下,这样的检测可促进疾病或病症的分期,或提供对致病性感染程度的指示。
在一些情况下,本文所述的方法进一步包括检测至少一个感兴趣序列群体(例如,致病性或其他非宿主或非人序列)。在一些情况下,本文所述的方法进一步包括检测至少五个感兴趣序列群体。在一些情况下,本文所述的方法进一步包括检测至少五种非哺乳动物序列。在一些情况下,本文所述的方法进一步包括检测来自至少五个非哺乳动物物种中的每一个的至少一种非哺乳动物序列。在一些情况下,本文所述的方法进一步包括检测至少五种非人序列。在一些情况下,本文所述的方法进一步包括检测来自至少五个非人物种中的每一个的至少一种非人序列。在一些情况下,本文所述的方法进一步包括检测至少一种细菌序列和至少一种病毒序列。在一些情况下,本文所述的方法进一步包括采用超过一个时间点,例如,2、3、4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65,70、75、80、85、90、95或100个时间点。在一些情况下,本文所述的方法进一步包括采用在治疗(例如,抗微生物药物)之前和之后的时间点。
在一些情况下,本文所述的方法进一步包括检测来源于约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1,000、5,000、10,000、50,000或100,000个物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1,000、5,000、10,000、50,000或100,000个物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、1,000、5,000、10,000、50,000或100,000个物种的至少一种核酸。在一些情况下,该物种为非宿主物种。在一些情况下,该物种为非哺乳动物物种。在一些情况下,该物种为非人物种。在一些情况下,该物种为微生物、细菌、病毒、真菌、逆转录病毒、病原体或寄生生物。在一些情况下,本文所述的方法进一步包括检测来源于约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌或病毒物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌或病毒物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌或病毒物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌和病毒物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌和病毒物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500或1,000个细菌和病毒物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于约1个细菌物种和1个病毒物种、2个细菌物种和2个病毒物种、3个细菌物种和3个病毒物种、4个细菌物种和4个病毒物种、5个细菌物种和5个病毒物种、6个细菌物种和6个病毒物种、7个细菌物种和7个病毒物种、8个细菌物种和8个病毒物种、9个细菌物种和9个病毒物种、10个细菌物种和10个病毒物种、15个细菌物种和15个病毒物种、20个细菌物种和20个病毒物种、25个细菌物种和25个病毒物种、30个细菌物种和30个病毒物种、35个细菌物种和35个病毒物种、40个细菌物种和40个病毒物种、45个细菌物种和45个病毒物种、50个细菌物种和50个病毒物种、60个细菌物种和60个病毒物种、70个细菌物种和70个病毒物种、80个细菌物种和80个病毒物种、90个细菌物种和90个病毒物种、100个细菌物种和100个病毒物种、200个细菌物种和200个病毒物种、300个细菌物种和300个病毒物种、400个细菌物种和400个病毒物种、500个细菌物种和500个病毒物种,或1,000个细菌物种和1,000个病毒物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于至多1个细菌物种和1个病毒物种、2个细菌物种和2个病毒物种、3个细菌物种和3个病毒物种、4个细菌物种和4个病毒物种、5个细菌物种和5个病毒物种、6个细菌物种和6个病毒物种、7个细菌物种和7个病毒物种、8个细菌物种和8个病毒物种、9个细菌物种和9个病毒物种、10个细菌物种和10个病毒物种、15个细菌物种和15个病毒物种、20个细菌物种和20个病毒物种、25个细菌物种和25个病毒物种、30个细菌物种和30个病毒物种、35个细菌物种和35个病毒物种、40个细菌物种和40个病毒物种、45个细菌物种和45个病毒物种、50个细菌物种和50个病毒物种、60个细菌物种和60个病毒物种、70个细菌物种和70个病毒物种、80个细菌物种和80个病毒物种、90个细菌物种和90个病毒物种、100个细菌物种和100个病毒物种、200个细菌物种和200个病毒物种、300个细菌物种和300个病毒物种、400个细菌物种和400个病毒物种、500个细菌物种和500个病毒物种,或1,000个细菌物种和1,000个病毒物种的至少一种核酸。在一些情况下,本文所述的方法进一步包括检测来源于至少1个细菌物种和1个病毒物种、2个细菌物种和2个病毒物种、3个细菌物种和3个病毒物种、4个细菌物种和4个病毒物种、5个细菌物种和5个病毒物种、6个细菌物种和6个病毒物种、7个细菌物种和7个病毒物种、8个细菌物种和8个病毒物种、9个细菌物种和9个病毒物种、10个细菌物种和10个病毒物种、15个细菌物种和15个病毒物种、20个细菌物种和20个病毒物种、25个细菌物种和25个病毒物种、30个细菌物种和30个病毒物种、35个细菌物种和35个病毒物种、40个细菌物种和40个病毒物种、45个细菌物种和45个病毒物种、50个细菌物种和50个病毒物种、60个细菌物种和60个病毒物种、70个细菌物种和70个病毒物种、80个细菌物种和80个病毒物种、90个细菌物种和90个病毒物种、100个细菌物种和100个病毒物种、200个细菌物种和200个病毒物种、300个细菌物种和300个病毒物种、400个细菌物种和400个病毒物种、500个细菌物种和500个病毒物种,或1,000个细菌物种和1,000个病毒物种的至少一种核酸。
在一些情况下,本文所述的方法包括确定感染是活动性的还是潜伏性的。在一些情况下,基因表达定量可提供用于检测、预测、诊断或监测活动性感染的方法。在一些情况下,本文所述的方法包括检测活动性感染。在一些情况下,基因表达可通过感兴趣群体的检测或测序来定量。在一些情况下,基因表达定量可提供用于检测、预测、诊断或监测潜伏性感染的方法。在一些情况下,本文所述的方法包括检测潜伏性感染。
示例性的疾病和病症包括任何与感染相关的疾病或病症,例如,脓毒症、肺炎、结核病、HIV感染、肝炎感染(例如,甲型肝炎、乙型肝炎或丙型肝炎)、人乳头瘤病毒(HPV)感染、衣原体感染、梅毒感染、埃博拉感染、金黄色葡萄球菌感染或流感。本文提供的方法特别适用于检测包括多重耐药微生物在内的耐药微生物引起的感染。疾病和病症的一些非限制性实例包括阿尔茨海默病、肌萎缩性侧索硬化症、神经性厌食症、焦虑症、哮喘、动脉粥样硬化、注意力缺陷多动症、自闭症、自身免疫疾病、双相型障碍、癌症、慢性疲劳综合征、慢性阻塞性肺病、克罗恩病、冠心病、痴呆、抑郁、1型糖尿病、2型糖尿病、扩张型心肌病、癫痫、Guillain-Barre综合征、肠易激综合征、腰痛、狼疮、代谢综合征、多发性硬化、心肌梗死、肥胖症、强迫症、恐慌症、帕金森病、银屑病、类风湿性关节炎、结节病、精神分裂症、中风、血栓闭塞性脉管炎、Tourette综合征、血管炎、鼠疫、肺结核、炭疽、昏睡病、痢疾、弓形体病、癣、念珠菌病、组织胞浆菌病、埃博拉、不动杆菌感染、放线菌病、非洲昏睡病(非洲锥虫病)、AIDS(获得性免疫缺陷综合症)、阿米巴病、无形体病、炭疽、溶血隐秘杆菌感染、阿根廷出血热、蛔虫病、曲霉病、星状病毒感染、巴贝斯虫病、蜡状芽孢杆菌感染、细菌性肺炎、细菌性阴道病(BV)、拟杆菌感染、小袋虫病、蛔虫感染、BK病毒感染、黑色发结节病、人芽囊原虫感染、芽生菌病、玻利维亚出血热、包柔氏螺旋体感染、肉毒中毒(和婴儿肉毒中毒)、巴西出血热、布氏杆菌病、腺鼠疫、伯克霍尔德菌感染、Buruli溃疡、嵌杯样病毒感染(诺罗病毒和札幌病毒)、弯曲杆菌病、念珠菌病(念珠菌性疾病;鹅口疮)、猫抓病、蜂窝织炎、Chagas病(美洲锥虫病)、软下疳、水痘、切昆贡亚热、衣原体、肺炎衣原体感染(台湾急性呼吸病原体(Taiwanacute respiratory agent)或TWAR)、霍乱、着色芽生菌病、支睾吸虫病、艰难梭菌感染、球孢子菌病、科罗拉多壁虱热(CTF)、普通感冒(急性病毒性鼻咽炎;急性鼻炎)、Creutzfeldt-Jakob病(CJD)、Crimean-Congo出血热(CCHF)、隐球菌病、隐孢子虫病、皮肤幼虫移行症(CLM)、原球虫病、囊虫病、巨细胞病毒感染、登革热、双核阿米巴病、白喉、裂头绦虫病、麦地那龙线虫病、埃博拉出血热、包虫病、埃里希体病、蛲虫病(蛲虫感染)、肠球菌感染、肠道病毒感染、流行性斑疹伤寒、传染性红斑(第五病)、幼儿急疹(第六病)、姜片虫症、肝片吸虫病、致死性家族性失眠症(FFI)、丝虫病、产气荚膜梭菌引起的食物中毒、自生生活阿米巴感染、梭杆菌感染、气性坏疽(梭菌性肌坏死)、地霉菌病、Gerstmann--Scheinker综合征(GSS)、贾第虫病、鼻疽、腭口线虫病、淋病、腹股沟肉芽肿(第五性病)、A群链球菌感染、B群链球菌感染、流感嗜血杆菌感染、手足口病(HFMD)、汉坦病毒肺综合征(HPS)、Heartland病毒疾病、幽门螺旋杆菌感染、溶血性尿毒综合征(HUS)、肾综合征出血热(HFRS)、甲型肝炎、乙型肝炎、丙型肝炎、丁型肝炎、戊型肝炎、单纯性疱疹、组织胞浆菌病、钩虫感染、人博卡病毒感染、人埃翁氏埃里希体病、人粒细胞无形体病(HGA)、人偏肺病毒感染、人单核细胞埃里希体病、人乳头瘤病毒(HPV)感染、人副流感病毒感染、膜壳绦虫病、EB病毒传染性单核细胞增多症(Mono)、流行性感冒(流感)、等孢球虫病、川崎病、角膜炎、金氏金氏杆菌感染、库鲁病、拉沙热、军团杆菌病(军团病)、军团杆菌病(庞蒂亚克热)、利什曼病、麻风病、钩端螺旋体病、李斯特菌病、莱姆病(莱姆包柔螺旋体)、淋巴丝虫病(象皮肿)、淋巴细胞性脉络丛脑膜炎、疟疾、马尔堡出血热(MHF)、麻疹、中东呼吸综合征(MERS)、类鼻疽(Whitmore病)、脑膜炎、脑膜炎球菌病、后殖吸虫病、微孢子虫病、传染性软疣(MC)、猴痘、流行性腮腺炎、鼠型斑疹伤寒(地方性斑疹伤寒)、支原体肺炎、马杜拉分枝菌病、蝇蛆病、新生儿结膜炎(新生儿眼炎)、(新)变异型Creutzfeldt-Jakob病(vCJD,nvCJD)、诺卡菌病、盘尾丝虫病(河盲症)、副球孢子菌病(南美芽生菌病)、并殖吸虫病、巴斯德菌病、头虱病(头虱)、体虱病(体虱)、阴虱病(阴虱,蟹虱)、盆腔炎性疾病(PID)、百日咳(百日咳)、鼠疫、肺炎球菌感染、肺孢子虫性肺炎(PCP)、肺炎、脊髓灰质炎、普雷沃菌感染、原发性阿米巴性脑膜脑炎(PAM)、进行性多灶性白质脑病、鹦鹉热、Q热、狂犬病、呼吸道合胞病毒感染、鼻孢子菌病、鼻病毒感染、立克次体感染、立克次体痘、裂谷热(RVF)、洛矶山斑疹热(RMSF)、轮状病毒感染、风疹、沙门氏菌病、严重急性呼吸系统综合征(SARS)、疥疮、血吸虫病、脓毒症、志贺氏菌病(细菌性痢疾)、带状疱疹(带状疱疹)、天花(天花病)、孢子丝菌病、葡萄球菌食物中毒、葡萄球菌感染、类圆线虫病、亚急性硬化性全脑炎、梅毒、绦虫病、破伤风(牙关紧闭症)、须癣(颜面癣)、头癣(头皮癣)、体癣(体癣)、股癣(股癣)、手癣(手癣)、掌黑癣、脚癣(运动员脚癣)、甲癣(甲真菌病)、花斑癣(花斑糠疹)、弓蛔虫病(眼幼虫移行症(OLM))、弓蛔虫病(内脏幼虫移行症(VLM))、沙眼、Trinochccliasis、Trichinlosis、滴虫病、鞭虫病(鞭虫感染)、肺结核、土拉菌病、伤寒、解脲支原体感染、溪谷热、委内瑞拉马脑炎、委内瑞拉出血热、病毒性肺炎、西尼罗河热、白色毛结节菌病(白秃疮)、假结核耶尔森菌感染、耶尔森菌病、黄热病和接合菌病(sepsis,pneumonia,tuberculosis,HIV infection,hepatitis infection(e.g.,Hep A,B,or C),human papilloma virus(HPV)infection,chlamydial infection,syphilitic infection,Ebola infection,staphylococcus aureus infection,orinfluenza.The methods provided herein are particularly useful for detectinginfections by drug-resistant microbes,including multi-drug resistantmicrobes.Some non-limiting examples of diseases and disorders includeAlzheimer’s disease,amyotrophic lateral sclerosis,anorexia nervosa,anxietydisorder,asthma,atherosclerosis,attention deficit hyperactivity disorder,autism,autoimmune disease,bipolar disorder,cancer,chronic fatigue syndrome,chronic obstructive pulmonary disease,Crohn’s disease,coronary heart disease,dementia,depression,diabetes mellitus type1,diabetes mellitus type 2,dilatedcardiomyopathy,epilepsy,Guillain-Barre syndrome,irritable bowel syndrome,lowback pain,lupus,metabolic syndrome,multiple sclerosis,myocardial infarction,obesity,obsessive-compulsive disorder,panic disorder,Parkinson’s disease,psoriasis,rheumatoid arthritis,sarcoidosis,schizophrenia,stroke,thromboangiitis obliterans,Tourette syndrome,vasculitis,plague,tuberculosis,anthrax,sleeping sickness,dysentery,toxoplasmosis,ringworm,candidiasis,histoplasmosis,ebola,Acinetobacter infections,Actinomycosis,African sleepingsickness(African trypanosomiasis),AIDS(Acquired immunodeficiency syndrome),Amebiasis,Anaplasmosis,Anthrax,Arcanobacterium haemolyticum infection,Argentine hemorrhagic fever,Ascariasis,Aspergillosis,Astrovirus infection,Babesiosis,Bacillus cereus infection,Bacterial pneumonia,Bacterial vaginosis(BV),Bacteroides infection,Balantidiasis,Baylisascaris infection,BK virusinfection,Black piedra,Blastocystis hominis infection,Blastomycosis,Bolivianhemorrhagic fever,Borrelia infection,Botulism(and Infant botulism),Brazilianhemorrhagic fever,Brucellosis,Bubonic plague,Burkholderia infection,Buruliulcer,Calicivirus infection(Norovirus and Sapovirus),Campylobacteriosis,Candidiasis(Moniliasis;Thrush),Cat-scratch disease,Cellulitis,Chagas Disease(American trypanosomiasis),Chancroid,Chickenpox,Chikungunya,Chlamydia,Chlamydophila pneumoniae infection(Taiwan acute respiratory agent or TWAR),Cholera,Chromoblastomycosis,Clonorchiasis,Clostridium difficile infection,Coccidioidomycosis,Colorado tick fever(CTF),Common cold(Acute viralrhinopharyngitis;Acute coryza),Creutzfeldt-Jakob disease(CJD),Crimean-Congohemorrhagic fever(CCHF),Cryptococcosis,Cryptosporidiosis,Cutaneous larvamigrans(CLM),Cyclosporiasis,Cysticercosis,Cytomegalovirus infection,Denguefever,Dientamoebiasis,Diphtheria,Diphyllobothriasis,Dracunculiasis,Ebolahemorrhagic fever,Echinococcosis,Ehrlichiosis,Enterobiasis(Pinworminfection),Enterococcus infection,Enterovirus infection,Epidemic typhus,Erythema infectiosum(Fifth disease),Exanthem subitum(Sixth disease),Fasciolopsiasis,Fasciolosis,Fatal familial insomnia(FFI),Filariasis,Foodpoisoning by Clostridium perfringens,Free-living amebic infection,Fusobacterium infection,Gas gangrene(Clostridial myonecrosis),Geotrichosis,Gerstmann--Scheinker syndrome(GSS),Giardiasis,Glanders,Gnathostomiasis,Gonorrhea,Granuloma inguinale(Donovanosis),Group Astreptococcal infection,Group B streptococcal infection,Haemophilusinfluenzae infection,Hand,foot and mouth disease(HFMD),Hantavirus PulmonarySyndrome(HPS),Heartland virus disease,Helicobacter pylori infection,Hemolytic-uremic syndrome(HUS),Hemorrhagic fever with renal syndrome(HFRS),Hepatitis A,Hepatitis B,Hepatitis C,Hepatitis D,Hepatitis E,Herpes simplex,Histoplasmosis,Hookworm infection,Human bocavirus infection,Human ewingiiehrlichiosis,Human granulocytic anaplasmosis(HGA),Human metapneumovirusinfection,Human monocytic ehrlichiosis,Human papillomavirus(HPV)infection,Human parainfluenza virus infection,Hymenolepiasis,Epstein-Barr VirusInfectious Mononucleosis(Mono),Influenza(flu),Isosporiasis,Kawasaki disease,Keratitis,Kingella kingae infection,Kuru,Lassa fever,Legionellosis(Legionnaires'disease),Legionellosis(Pontiac fever),Leishmaniasis,Leprosy,Leptospirosis,Listeriosis,Lyme disease(Lyme borreliosis),Lymphatic filariasis(Elephantiasis),Lymphocytic choriomeningitis,Malaria,Marburg hemorrhagicfever(MHF),Measles,Middle East respiratory syndrome(MERS),Melioidosis(Whitmore's disease),Meningitis,Meningococcal disease,Metagonimiasis,Microsporidiosis,Molluscum contagiosum(MC),Monkeypox,Mumps,Murine typhus(Endemic typhus),Mycoplasma pneumonia,Mycetoma,Myiasis,Neonatalconjunctivitis(Ophthalmia neonatorum),(New)Variant Creutzfeldt-Jakob disease(vCJD,nvCJD),Nocardiosis,Onchocerciasis(River blindness),Paracoccidioidomycosis(South American blastomycosis),Paragonimiasis,Pasteurellosis,Pediculosis capitis(Head lice),Pediculosis corporis(Bodylice),Pediculosis pubis(Pubic lice,Crab lice),Pelvic inflammatory disease(PID),Pertussis(Whooping cough),Plague,Pneumococcal infection,Pneumocystispneumonia(PCP),Pneumonia,Poliomyelitis,Prevotella infection,Primary amoebicmeningoencephalitis(PAM),Progressive multifocal leukoencephalopathy,Psittacosis,Q fever,Rabies,Respiratory syncytial virus infection,Rhinosporidiosis,Rhinovirus infection,Rickettsial infection,Rickettsialpox,Rift Valley fever(RVF),Rocky Mountain spotted fever(RMSF),Rotavirusinfection,Rubella,Salmonellosis,SARS(Severe Acute Respiratory Syndrome),Scabies,Schistosomiasis,Sepsis,Shigellosis(Bacillary dysentery),Shingles(Herpes zoster),Smallpox(Variola),Sporotrichosis,Staphylococcal foodpoisoning,Staphylococcal infection,Strongyloidiasis,Subacute sclerosingpanencephalitis,Syphilis,Taeniasis,Tetanus(Lockjaw),Tinea barbae(Barber'sitch),Tinea capitis(Ringworm of the Scalp),Tinea corporis(Ringworm of theBody),Tinea cruris(Jock itch),Tinea manum(Ringworm of the Hand),Tinea nigra,Tinea pedis(Athlete’s foot),Tinea unguium(Onychomycosis),Tinea versicolor(Pityriasis versicolor),Toxocariasis(Ocular Larva Migrans(OLM)),Toxocariasis(Visceral Larva Migrans(VLM)),Trachoma,Trinochccliasis,Trichinlosis,Trichomoniasis,Trichuriasis(Whipworm infection),Tuberculosis,Tularemia,Typhoid Fever,Ureaplasma urealyticum infection,Valley fever,Venezuelan equineencephalitis,Venezuelan hemorrhagic fever,Viral pneumonia,West Nile Fever,White piedra(Tinea blanca),Yersinia pseudotuberculosis infection,Yersiniosis,Yellow fever,and Zygomycosis)。
如本文所用的,除非另有说明,术语“或”用于指非排他性的“或”,如“A或B”包括“A而不是B”、“B而不是A”和“A和B”。
如本文所用的,当提及数字或数字范围时,术语“约”是指所提及的数字或数字范围是实验可变性内(或统计实验误差内)的近似值,并且该数字或数字范围可在例如所述数字或数字范围的1%至15%之间变化。在实例中,术语“约”是指所述数字或数值的±10%。
实施例
实施例1:从患者全血样品制备无细胞RNA
从疑似患有传染病的患者抽取全血并置于酸性柠檬酸右旋糖(ACD)采血管中。将ACD收集管中的一部分(1.5mL)血液移出并置于1.5mL微量离心管中。向血液中掺加10μL标准化寡核苷酸并充分混合。将混合物在4℃下以1,600g离心10min,并移出550μL上清液(“标准化血浆”)并置于新的微量离心管中。将标准化血浆在4℃下以16,000g离心10min。将上清液(“标准化的无细胞血浆”)移出并置于新的管中并储存在-80℃下。
将标准化的无细胞血浆在室温下解冻10min。将标准化的无细胞血浆在4℃下以16,000g离心10min以除去碎片。使用血浆/血清循环和外来体RNA纯化试剂盒(SlurryFormat)(Norgen Biotek Corp.)根据制造商的说明分离无细胞RNA。将无细胞RNA储存在-80℃下。
实施例2:通过计算设计和合成制备非人寡核苷酸集合
约6.7×106种可能的不同核苷酸结构域的长度为13个核苷酸。从这个理论序列池中,丢弃任何在人DNA中发现的13个核苷酸的序列,留下约2.3×106个或占总数3.5%的独特的13个核苷酸的序列。基于以下标准,从这2.3×106个13个核苷酸的非人序列中选择约1×106个包含在非人序列池中:1)解链温度均匀性,2)足够的序列复杂性,3)已知病原体中结合位点的丰度,以及4)已知病原体中的结合位点分布。向这组约1×106个13个核苷酸的非人序列添加长度为14-20个核苷酸的额外的非人序列,以增强对感兴趣区域如战略病原体序列的覆盖,并且这些引物基于以下参数进行设计:1)解链温度,2)序列复杂性,3)已知病原体中结合位点的丰度,以及4)已知病原体中的结合位点分布。长度为13-20个核苷酸的核苷酸结构域的总池被称为完整的非人序列池。向该非人序列池中的每个13-20个核苷酸的序列添加含有一个或多个以下核酸标记物的长约15-25个核苷酸的额外的5’序列:符合各种测序平台要求的1)DNA测序引物结合位点,2)样品条形码,3)样品条形码测序引物结合位点,以及4)扩增引物结合位点。该寡核苷酸集合被称为非人引物池。化学合成该非人引物池。或者,化学合成完整的非人序列池,并且添加(例如,通过连接)一个或多个核酸标记物以形成非人引物池。
实施例3:采用基于杂交的方法制备非人寡核苷酸集合
化学合成约6700万种不同的13个核苷酸的序列(例如,5’-NNNNNNNNNNNNN-3’,其中N为A、C、G或T),其附接有含有一个或多个以下核酸标记物的15-25个核苷酸的突出端:符合各种测序平台要求的1)DNA测序引物结合位点,2)样品条形码,3)样品条形码测序引物结合位点,以及4)扩增引物结合位点。在杂交缓冲液(0.5X PBS,24μM阻断寡核苷酸,RNA酶抑制剂)中,使这种异质寡核苷酸集合与1000倍质量过量的生物素化人单链基因组DNA(gDNA)片段杂交,在95℃下持续10秒、在65℃下持续3min并在36℃下持续数小时至数周的预定时间长度。在温育期结束时,用链霉抗生物素蛋白珠子除去人gDNA片段,以及已与该片段杂交的探针。向在这些条件下未结合人gDNA的剩余探针池补充长度为14-20个核苷酸的额外的非人序列,以增强对感兴趣区域如战略病原体序列的覆盖,并且这些引物基于以下参数进行设计:1)解链温度,2)序列复杂性,3)已知病原体中结合位点的丰度,以及4)已知病原体中的结合位点分布。该寡核苷酸集合被称为非人引物池。
实施例4:以高产率制备具有高简并性的非人寡核苷酸集合
通过生成所有可能的13聚体序列并除去出现在参考人基因组中的那些序列来计算性地确定非人13聚体。然后按照简并度对这些非人13聚体进行分组。图11B中的柱状图示出了非人13聚体的基于简并度的分组。
下一步,将相同简并度的非人13聚体的可变寡核苷酸序列单元分组成ultramer寡核苷酸。包括在ultramer中的简并寡核苷酸序列单元的数目可基于每个单元的长度和可以可靠地合成的ultramer长度。图9示出了若干种这样的ultramer寡核苷酸的总体设计。单个简并的13聚体可由脱氧尿嘧啶核苷酸(U)隔开。然后可通过常规核酸合成过程以及由服务提供商(例如,IDT)来合成所设计的ultramer寡核苷酸。
然后用尿嘧啶-DNA糖基化酶(UDG)和在无碱基位点(例如,无嘌呤/无嘧啶位点或AP位点)处具有特异性的内切核酸酶将ultramer寡核苷酸消化成单个简并的非人13聚体寡核苷酸。对于携带简并度相同的简并13聚体的全部ultramer寡核苷酸,该消化在同一管中进行。示例性的反应在图10中示出。
然后,可使用例如T4多核苷酸激酶(T4PNK)或如图12所示以化学方式对单个简并的13聚体进行生物素化。该步骤是任选的,例如在需要表面固定或磁珠纯化时。在此可应用除生物素外的其他探针(例如,洋地黄毒苷、荧光探针等)。
实施例5:使用非人寡核苷酸集合制备增强的测序文库
将来自实施例1的无细胞RNA与非人引物池(如实施例2或3所述制备)在杂交缓冲液(0.5X PBS,24μM阻断寡核苷酸,RNA酶抑制剂)中在95℃下杂交10秒、在65℃下杂交3min并在36℃下杂交过夜。在36℃下添加第一链cDNA合成主混合物(逆转录酶,阻断的第二链合成寡核苷酸,dNTP,RNA酶抑制剂和合适的缓冲液),随后升温至42℃,持续90分钟,以允许第一链cDNA合成。然后将该混合物在70℃下温育10分钟以灭活逆转录酶,并保持在4℃。
使用商用试剂盒来纯化第一链cDNA产物。使用与在先前步骤中添加至第一链cDNA的5’和3’端的固定序列杂交的引物,通过PCR来生成第二链cDNA。在通过PCR合成第二链后,可通过额外轮次的PCR来添加一个或多个以下的核酸标记物:符合各种测序平台要求的1)DNA测序引物结合位点,2)样品条形码,3)样品条形码测序引物结合位点,以及4)扩增引物结合位点。利用可商购的试剂盒,根据制造商的说明来纯化最终的cDNA文库。
实施例6:使用非人寡核苷酸集合从DNA或cDNA文库制备富集非人序列的测序文库
制备测序就绪文库。如实施例2或3所述制备非人引物池,并使其经受促进该池中的单个寡核苷酸的5’生物素化的条件。然后,向杂交/聚合缓冲液(缓冲剂,核苷酸,阻断寡核苷酸)中的500ng测序就绪文库添加1pmol的5’-生物素化非人引物池。在一些情况下,寡核苷酸与增强DNA杂交反应的速度或特异性的分子进行预温育可改善非宿主核酸片段如RecA或MutS的捕获。将DNA在95℃下变性10min。将非人引物与测序文库在50℃下杂交4小时。将缺少5’外切核酸酶的链置换DNA聚合物添加至该混合物中。将该混合物在55℃下温育15分钟,以将该非人引物延伸至至少25个碱基或足够用于后续步骤中的稳定的双链DNA杂交的长度。将链霉抗生物素蛋白珠子添加至该混合物中以结合DNA片段。洗涤珠子上捕获的DNA片段。通过使用对DNA测序文库片段末端处的衔接子具有特异性的引物并以珠子上捕获的DNA片段作为模板,采用标准PCR扩增方法来扩增所捕获的文库DNA片段。使用标准DNA纯化方法来纯化所富集的文库。
利用KAPA DNA文库定量试剂盒(KAPA Biosystems)对文库进行定量,并准备用于根据制造商的说明在NextSeq 500(Illumina)上进行测序。测序由150个循环的单端读取加上8个循环的条形码读取组成。
将序列读取以计算方式映射至病原体的基因组,以鉴别一个或多个核酸的一种或多种来源。
实施例7:使用抗人组蛋白抗体和抗免疫球蛋白抗体的人核小体相关的DNA消耗
通过基于离心的方法或通过白蛋白和免疫球蛋白去除方法来制备无细胞DNA。在任一方法中,首先将1mL人血浆在4℃下以1,600g离心10min。对于基于离心的方法,收集上清液(950μL)并将其转移至纯净的试管中,并在4℃下以1,6000g再次离心10min。收集900μL含有无细胞DNA的上清液并将其转移至新的试管中。在白蛋白和免疫球蛋白去除方法中,收集来自第一次离心的上清液(950μL)并使其通过人白蛋白和人免疫球蛋白结合柱(例如,来自GE Healthcare的白蛋白和IgG消耗SpinTrap或来自Life Technologies的白蛋白/IgG去除试剂盒)。收集含有无细胞DNA的流过物并将其转移到新的试管中。
将如上所述通过离心或通过白蛋白和免疫球蛋白去除制备的无细胞DNA与5μg的一种或多种抗人组蛋白抗体混合,并在4℃缓慢旋转下温育1hr至过夜。该抗体与核小体结合形成复合物。将与抗免疫球蛋白抗体缀合的磁珠的混合物添加至该反应,以从血浆样品中分离人核小体-抗体复合物。该抗免疫球蛋白抗体包括结合在先前步骤中添加的抗人组蛋白抗体的亚型(isotopes)所需的抗体的组合。将混合物在室温下温育1hr,或在4℃下温育5hr至过夜。在磁力架上将结合有人核小体-抗体复合物的磁珠沉淀。仔细收集上清液,不收集任何磁珠部分的残留物。使用可商购的试剂盒(例如,QIAamp Circulating NucleicAcid Kit,Qiagen)纯化所获得的上清液以富集病原体无细胞DNA。
实施例8:使用抗人组蛋白抗体和与蛋白A和/或G缀合的磁珠的人核小体相关的DNA消耗
将含有采用实施例6中的白蛋白和免疫球蛋白去除方法制备的无细胞DNA的流过物与5μg的一种或多种抗人组蛋白抗体混合,并在4℃缓慢旋转下温育1hr至过夜。通过添加与蛋白A和/或G缀合的磁珠将人核小体-抗体复合物从溶液中分离。将混合物在室温下温育1hr,或在4℃下温育5hr至过夜。在磁力架上将结合有人核小体-抗体复合物的磁珠沉淀。仔细收集上清液,不收集任何磁珠部分的残留物。使用可商购的试剂盒(例如,QIAampCirculating Nucleic Acid Kit,Qiagen)纯化所获得的上清液以富集病原体无细胞DNA。
实施例9:使用抗人组蛋白抗体和旋转柱的人核小体相关的DNA消耗
将含有采用实施例6中的抗白蛋白-免疫球蛋白方法制备的无细胞DNA的流过物与5μg的一种或多种抗人组蛋白抗体混合,并在4℃缓慢旋转下温育1hr至过夜。通过使该溶液流过用蛋白A/G或抗免疫球蛋白抗体官能化的旋转柱来纯化掉核小体-抗体复合物。收集流过物,并使用可商购的试剂盒(例如,QIAamp Circulating Nucleic Acid Kit,Qiagen)进行纯化以富集病原体无细胞DNA。
实施例10:通过DNA沉淀的人核小体相关的DNA消耗
在使用DNA凝聚剂(例如,精胺)进行血浆离心后,无核小体的无细胞DNA和核小体结合的无细胞DNA沉淀出来。通过离心收集该沉淀物,并丢弃上清液。将沉淀物溶解在针对与人核小体结合的抗人组蛋白抗体优化的缓冲液中。通过将所得的抗原-抗体复合物结合至与蛋白A/G或抗免疫球蛋白抗体缀合的磁珠、在磁力架上将磁珠沉淀下来并收集上清液来分离所得的抗原-抗体复合物。使用可商购的试剂盒(例如,QIAamp CirculatingNucleic Acid Kit,Qiagen)纯化所获得的上清液以富集病原体无细胞DNA。
实施例11:针对非人寡核苷酸集合中的核苷酸结构域优化核苷酸长度
在选择非人引物池中核苷酸结构域的长度时优化了若干个参数。目的在于产生具有最少数目的不同序列的池,从而提供检测非人核酸的最大灵敏度。当核苷酸结构域的长度增加时,由于长度为k的核苷酸结构域具有4k种排列,因此需要更多的不同探针来覆盖序列空间。将该池中探针的数目保持得尽可能小,使得每个单独的序列均以更高的浓度存在,从而有利于更快的杂交动力学。这种考虑偏好较短的引物。同时,当引物长度增加时,具有该长度的全部可能的序列中有较少部分将结合人序列。这意味着总基因组空间的更大部分将被留在非人引物池中,这使得非人序列的覆盖更高并且提供更高的灵敏度。例如,长度为13个核苷酸的可能序列中仅有3.5%(230万个)未见于人参考基因组中,这意味着长度为13个核苷酸的非人序列池将仅结合非人核酸中所有可能的13核苷酸序列段的3.5%。相反,长度为14个核苷酸的可能序列中有15.2%(4070万个)未见于人参考基因组中。理论上可检测到非人核酸中所有可能的14核苷酸序列段的15.2%。4070万个探针可能过多而无法由某些现有供应商合理地合成。如果每个探针均以总探针浓度的4070万分之一存在,则任何单个探针的浓度可能过低而不能在平衡时有利地与其互补序列结合,除非采取其他措施来促进杂交。该结果可排除长度大于13个核苷酸的探针集。另外,长度小于13个核苷酸的序列在人参考基因组中过于常见,使得几乎所有引物都被从非人池中去除。例如,在长度为12个核苷酸时,99.74%的可能序列见于人参考基因组中。这意味着该非人引物池将仅结合病原体中0.26%左右的可能的12个核苷酸的序列,并将提供有限的灵敏度。长度为13个核苷酸的核苷酸结构域提供足够的灵敏度(非人基因组中每30个核苷酸约1个结合位点),具有足够少的探针(少于1000万种不同的探针),因此在杂交反应中具有合理的动力学。
实施例12:无细胞DNA中短片段的选择性富集
针对具有相对较短的片段长度的无细胞DNA的选择优化了大小富集方案。使用具有以下改变的Qiagen CNA试剂盒从人无细胞血浆中提取无细胞DNA:(a)使用3x体积的ACB缓冲液,(b)根据制造商的推荐制备ACW1缓冲液,并且每600μL ACW1缓冲液补充额外1.75mL无水乙醇和0.36g盐酸胍,并且(c)根据制造商的推荐制备ACW2缓冲液,并且每750μL ACW2缓冲液补充1.05mL无水乙醇。因此,在NuGen的Ovation Ultralow V2文库试剂盒中使用所分离的无细胞DNA,在衔接子连接和文库扩增后具有1.8x Ampure纯化步骤。然后对文库进行测序并将读取映射至人和病原体数据库。然后研究所映射的读取。
特别地,图8A示出了对于宿主或人DNA(染色体21)以及非宿主或病原体DNA,无细胞DNA的量(作为序列读取数目的函数而测量的)相对于衍生出DNA序列的片段长度的图。如图所示,在约30个碱基至约100个碱基的片段长度下,非宿主DNA具有远优于宿主DNA的比例。因此,预期对在该大小范围内的片段的富集将相对于宿主DNA富集非宿主DNA。
使用改进的Qiagen CNA纯化试剂盒,在包含等摩尔的无细胞合成DNA大小对照(配置成不映射至已知的人或病原体序列)的DNA样品上测试了对所需大小范围的片段的富集(例如,32、52、75、100、125、150、175和350bp的片段)。
图8B示出了使用针对较大片段选择的正常CNA试剂盒方案处理的样品的片段大小分布(例如,长度为100至200个碱基,其在8个DNA大小对照片段长度中的最大富集在175bp处),而改进的方案选择性地富集30个碱基至约120个碱基的片段,在8个DNA大小对照片段长度中的最大富集在75bp处。
虽然本文已经示出并描述了本发明的优选实施方案,但对于本领域技术人员而言显而易见的是,这样的实施方案仅作为示例提供。在不偏离本发明的情况下,本领域技术人员现将想到许多变化、改变和替换。应理解,可使用本文描述的本发明的实施方案的各种替代方案来实施本发明。旨在用以下权利要求来限定本发明的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同物。

Claims (215)

1.一种引发或捕获来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:
(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含宿主核酸和非宿主核酸;
(b)将来自所述宿主的核酸样品与寡核苷酸集合混合,从而获得混合物,其中所述寡核苷酸集合包含至少1,000个具有不同核苷酸序列的寡核苷酸,其中所述不同核苷酸序列经特别选择以含有长度为至少10个核苷酸的非宿主核酸序列;以及
(c)在所述混合物内,使所述寡核苷酸集合与所述核酸样品接触,其中所述接触导致所述混合物内的非宿主核酸与所述长度为至少10个核苷酸的非宿主核酸序列结合,从而引发或捕获非宿主核酸,并且所述接触导致至多10%的宿主核酸与所述长度为至少10个核苷酸的非宿主核酸序列结合。
2.如权利要求1所述的方法,进一步包括在反应中优先扩增所述引发的或捕获的非宿主核酸。
3.如权利要求1所述的方法,进一步包括通过进行测序分析对所述引发的或捕获的非宿主核酸进行测序。
4.如权利要求3所述的方法,其中所述测序分析为下一代测序分析、高通量测序分析、大规模平行测序分析、纳米孔测序分析或Sanger测序分析。
5.如权利要求1所述的方法,进一步包括优先分离所述引发的或捕获的非宿主核酸。
6.如权利要求5所述的方法,其中所述优先分离包括进行拉下实验。
7.如权利要求1所述的方法,进一步包括对所述引发的或捕获的非宿主核酸进行引物延伸反应。
8.如权利要求7所述的方法,其中所述至少1,000个具有不同核苷酸序列的寡核苷酸含有核酸标记物。
9.如权利要求1所述的方法,其中所述引发的或捕获的非宿主核酸为RNA非宿主核酸。
10.如权利要求9所述的方法,进一步包括对所述引发的或捕获的RNA非宿主核酸进行聚合反应。
11.如权利要求10所述的方法,其中通过逆转录酶进行所述聚合反应。
12.一种对来自宿主的核酸样品中的非宿主序列进行测序的方法,所述方法包括:
(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含宿主核酸和非宿主核酸;
(b)将来自所述宿主的核酸样品与寡核苷酸集合混合,从而获得混合物,其中所述寡核苷酸集合包含至少1,000个具有不同核苷酸序列的寡核苷酸,其中所述不同核苷酸序列经特别选择以含有长度为至少10个核苷酸的非宿主核酸序列;
(c)在所述混合物内,使所述寡核苷酸集合与所述核酸样品接触,其中所述接触导致所述混合物内的非宿主核酸与所述长度为至少10个核苷酸的非宿主核酸序列结合,并且所述接触导致至多10%的宿主核酸与所述长度为至少10个核苷酸的非宿主核酸序列结合;以及
(d)通过进行测序分析,对与所述长度为至少10个核苷酸的非宿主核酸序列结合的非宿主核酸进行测序。
13.如权利要求12所述的方法,进一步包括在反应中优先扩增所述非宿主核酸。
14.如权利要求12所述的方法,其中所述测序分析为下一代测序分析、高通量测序分析、大规模平行测序分析、纳米孔测序分析或Sanger测序分析。
15.如权利要求12所述的方法,进一步包括优先分离所述非宿主核酸。
16.如权利要求15所述的方法,其中所述分离包括进行拉下实验。
17.如权利要求12所述的方法,进一步包括对所述非宿主核酸进行引物延伸反应。
18.如权利要求17所述的方法,其中所述至少1,000个具有不同核苷酸序列的寡核苷酸含有核酸标记物。
19.如权利要求12所述的方法,其中所述非宿主核酸为RNA非宿主核酸。
20.如权利要求19所述的方法,进一步包括对所述RNA非宿主核酸进行聚合反应。
21.如权利要求20所述的方法,其中通过逆转录酶进行所述聚合反应。
22.如权利要求1或权利要求12所述的方法,其中所述至少1,000个具有不同核苷酸序列的寡核苷酸为至少10,000个具有不同核苷酸序列的寡核苷酸。
23.如权利要求1或权利要求12所述的方法,其中所述至少1,000个具有不同核苷酸序列的寡核苷酸为至少100,000个具有不同核苷酸序列的寡核苷酸。
24.如权利要求1或权利要求12所述的方法,其中所述至少1,000个具有不同核苷酸序列的寡核苷酸为至少1,000,000个具有不同核苷酸序列的寡核苷酸。
25.如权利要求1或权利要求12所述的方法,其中所述至少1,000个具有不同核苷酸序列的寡核苷酸不与固体支持体缀合。
26.如权利要求1或权利要求12所述的方法,其中所述至少1,000个具有不同核苷酸序列的寡核苷酸具有至多200个核苷酸的长度。
27.如权利要求1或权利要求12所述的方法,其中所述至少1,000个具有不同核苷酸序列的寡核苷酸中的每一个包含长度为10至20个核苷酸的核苷酸结构域,其中每一个长度为10至20个核苷酸的核苷酸结构域包含不同的核苷酸序列。
28.如权利要求27所述的方法,其中每一个长度为10至20个核苷酸的核苷酸结构域的长度为12-15个核苷酸。
29.如权利要求27所述的方法,其中每一个长度为10至20个核苷酸的核苷酸结构域的长度为13-15个核苷酸。
30.如权利要求27所述的方法,其中每一个长度为10至20个核苷酸的核苷酸结构域不是哺乳动物核酸序列。
31.如权利要求1或权利要求12所述的方法,其中所述宿主为哺乳动物宿主,并且其中来自所述哺乳动物宿主的核酸样品包含哺乳动物宿主核酸和非哺乳动物核酸。
32.如权利要求1或权利要求12所述的方法,其中所述宿主为人宿主,并且其中来自所述人宿主的核酸样品包含人宿主核酸和非人核酸。
33.如权利要求32所述的方法,其中所述非人核酸包括微生物核酸。
34.如权利要求32所述的方法,其中所述非人核酸包括细菌核酸。
35.如权利要求1或权利要求12所述的方法,其中来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。
36.如权利要求1或权利要求12所述的方法,其中来自所述宿主的核酸样品选自血液、血浆、血清、唾液、脑脊髓液、滑液、灌洗液、尿液和粪便。
37.如权利要求36所述的方法,其中所述样品选自血液、血浆和血清。
38.如权利要求1或权利要求12所述的方法,其中来自所述宿主的核酸样品为循环核酸样品。
39.如权利要求1或权利要求12所述的方法,其中来自所述宿主的核酸样品为循环无细胞核酸样品。
40.如权利要求1或权利要求12所述的方法,其中来自所述宿主的核酸样品包含核酸测序就绪文库。
41.如权利要求1或权利要求12所述的方法,其中来自所述宿主的核酸样品包含单链DNA或cDNA。
42.如权利要求1或权利要求12所述的方法,其中所述核酸为DNA。
43.如权利要求1或权利要求12所述的方法,其中所述核酸为RNA。
44.如权利要求1或权利要求12所述的方法,其中来自所述宿主的核酸样品不包含人工片段化的核酸。
45.如权利要求1或权利要求12所述的方法,其中所述寡核苷酸集合包含DNA、RNA、PNA、LNA、BNA或其任意组合。
46.如权利要求1或权利要求12所述的方法,其中所述寡核苷酸集合包含DNA寡核苷酸。
47.如权利要求1或权利要求12所述的方法,其中所述寡核苷酸集合包含RNA寡核苷酸。
48.如权利要求1或权利要求12所述的方法,其中所述寡核苷酸集合用核酸标记物或化学标记物进行标记。
49.如权利要求48所述的方法,其中所述化学标记物为生物素。
50.如权利要求1或权利要求12所述的方法,其中所述寡核苷酸集合不包含人工片段化的核酸。
51.如权利要求1或权利要求12所述的方法,其中所述非宿主核酸选自致病性核酸、微生物核酸、细菌核酸、病毒核酸、真菌核酸、寄生生物核酸及其任意组合。
52.如权利要求1或权利要求12所述的方法,其中所述非宿主核酸为微生物核酸。
53.如权利要求1或权利要求12所述的方法,其中所述非宿主核酸为细菌核酸。
54.如权利要求1或权利要求12所述的方法,其中所述非宿主核酸为病毒核酸。
55.一种富集来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:
(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品为来自所述宿主的单链核酸样品,并且包含宿主核酸和非宿主核酸;
(b)使来自所述宿主的至少一部分单链核酸复性,从而在所述样品内产生双链核酸群体;以及
(c)使用核酸酶去除所述样品中的至少一部分双链核酸,从而富集来自所述宿主的核酸样品中的非宿主序列。
56.如权利要求55所述的方法,进一步包括进行测序分析。
57.如权利要求55所述的方法,其中来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。
58.如权利要求55所述的方法,其中所述宿主为人。
59.如权利要求55所述的方法,其中来自所述宿主的核酸样品为循环核酸样品。
60.如权利要求55所述的方法,其中来自所述宿主的核酸样品为循环无细胞核酸样品。
61.如权利要求55所述的方法,其中来自所述宿主的核酸样品选自血液、血浆、血清、唾液、脑脊髓液、滑液、灌洗液、尿液和粪便。
62.如权利要求55所述的方法,其中所述核酸为DNA。
63.如权利要求55所述的方法,其中所述核酸为RNA。
64.如权利要求55所述的方法,进一步包括将单链宿主序列添加至来自所述宿主的单链核酸样品中。
65.如权利要求55所述的方法,进一步包括使用热使所述核酸样品中的至少一部分核酸变性以产生所述单链核酸样品。
66.如权利要求55所述的方法,其中所述使至少一部分核酸复性发生在设定的时间范围内。
67.如权利要求55所述的方法,其中所述使至少一部分核酸复性发生在96小时内。
68.如权利要求55所述的方法,其中所述复性包括在三甲基氯化铵的存在下复性。
69.如权利要求55所述的方法,其中所述核酸酶为双链体特异性核酸酶、BAL-31、双链特异性DNA酶或其组合。
70.如权利要求55所述的方法,其中所述核酸酶为双链体特异性核酸酶。
71.如权利要求55所述的方法,其中所述核酸酶为BAL-31。
72.如权利要求55所述的方法,其中所述核酸酶对双链核酸是活性的。
73.如权利要求55所述的方法,其中所述核酸酶对单链核酸是非活性的。
74.如权利要求55所述的方法,其中所述核酸不是人工片段化的。
75.一种富集来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:
(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含与核小体相关的宿主核酸和非宿主核酸;以及
(b)去除至少一部分所述与核小体相关的宿主核酸,从而富集来自所述宿主的核酸样品中的非宿主核酸。
76.如权利要求75所述的方法,进一步包括进行测序分析。
77.如权利要求75所述的方法,其中来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。
78.如权利要求75所述的方法,其中所述宿主为人。
79.如权利要求75所述的方法,其中来自所述宿主的核酸样品为循环核酸样品。
80.如权利要求75所述的方法,其中来自所述宿主的核酸样品为循环无细胞核酸样品。
81.如权利要求75所述的方法,其中来自所述宿主的核酸样品选自血液、血浆、血清、唾液、脑脊髓液、滑液、灌洗液、尿液和粪便。
82.如权利要求75所述的方法,其中步骤(b)中的所述去除包括进行电泳。
83.如权利要求75所述的方法,其中步骤(b)中的所述去除包括进行等速电泳。
84.如权利要求75所述的方法,其中步骤(b)中的所述去除包括使用多孔过滤器。
85.如权利要求75所述的方法,其中步骤(b)中的所述去除包括使用离子交换柱。
86.如权利要求75所述的方法,其中步骤(b)中的所述去除包括使用对一种或多种组蛋白具有特异性的一种或多种抗体。
87.如权利要求86所述的方法,其中所述一种或多种组蛋白选自组蛋白H2A N端、组蛋白H2A溶剂暴露表位、组蛋白H3中Lys9的单甲基化、组蛋白H3中Lys9的二甲基化、组蛋白H3中Lys56的三甲基化、组蛋白H2B中Ser14的磷酸化以及组蛋白H2A.X中Ser139的磷酸化。
88.如权利要求86所述的方法,其中所述一种或多种抗体固定在柱上。
89.如权利要求86所述的方法,进一步包括去除所述一种或多种抗体。
90.一种富集来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:
(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含宿主核酸和非宿主核酸;以及
(b)去除或分离具有一个或多个长度区间的DNA,从而富集来自所述宿主的核酸样品中的非宿主核酸。
91.如权利要求90所述的方法,其中步骤(b)包括去除具有一个或多个长度区间的DNA。
92.如权利要求90所述的方法,其中步骤(b)包括分离具有一个或多个长度区间的DNA。
93.如权利要求90所述的方法,其中所述一个或多个长度区间选自约180个碱基对、约360个碱基对、约540个碱基对、约720个碱基对和约900个碱基对。
94.如权利要求90所述的方法,其中所述一个或多个长度区间选自150个碱基对或其倍数、160个碱基对或其倍数、170个碱基对或其倍数、190个碱基对或其倍数,及其任意组合。
95.如权利要求90所述的方法,其中步骤(b)包括去除长度大于约300个碱基的DNA。
96.如权利要求90所述的方法,其中步骤(b)包括分离长度至多约300个碱基的DNA。
97.如权利要求90所述的方法,进一步包括进行测序分析。
98.如权利要求90所述的方法,其中来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。
99.如权利要求90所述的方法,其中所述宿主为人。
100.如权利要求90所述的方法,其中来自所述宿主的核酸样品为循环核酸样品。
101.如权利要求90所述的方法,其中来自所述宿主的核酸样品为循环无细胞核酸样品。
102.一种富集来自宿主的核酸样品中的非宿主序列的方法,所述方法包括:
(a)提供来自所述宿主的核酸样品,其中来自所述宿主的核酸样品包含宿主核酸、非宿主核酸和外来体;以及
(b)去除或分离至少一部分外来体,从而富集来自所述宿主的核酸样品中的非宿主序列。
103.如权利要求102所述的方法,其中步骤(b)包括去除至少一部分外来体。
104.如权利要求102所述的方法,其中步骤(b)包括分离至少一部分外来体。
105.如权利要求102所述的方法,进一步包括进行测序分析。
106.如权利要求102所述的方法,其中来自所述宿主的核酸样品包含至少五个非宿主核酸序列,并且所述方法进一步包括检测所述至少五个非宿主核酸序列。
107.如权利要求102所述的方法,其中所述宿主为人。
108.如权利要求102所述的方法,其中来自所述宿主的核酸样品选自血液、血浆、血清、唾液、脑脊髓液、滑液、灌洗液、尿液和粪便。
109.如权利要求102所述的方法,其中来自所述宿主的核酸样品为循环核酸样品。
110.如权利要求102所述的方法,其中来自所述宿主的核酸样品为循环无细胞核酸样品。
111.如权利要求102所述的方法,进一步包括去除所述外来体内的宿主核酸。
112.如权利要求102所述的方法,进一步包括分离非宿主核酸。
113.如权利要求102所述的方法,其中步骤(b)中的所述去除或分离包括去除或分离白细胞衍生的外来体。
114.如权利要求113所述的方法,其中所述白细胞为巨噬细胞。
115.如权利要求113所述的方法,其中步骤(b)中的所述去除或分离包括使用免疫沉淀来去除或分离所述白细胞衍生的外来体。
116.如权利要求1-115中任一项所述的方法,进一步包括将一个或多个核酸条形码添加至一个或多个样品中。
117.如权利要求1-115中任一项所述的方法,进一步包括向所述样品中添加一个或多个核酸,所述核酸对一个或多个下述具有特异性:致病性基因座;抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生生物抗性标志物;提供信息的基因分型区;在两种或更多种微生物、病原体、细菌、病毒、真菌或寄生生物之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物所特有的序列。
118.一种引发或捕获来自宿主的核酸样品中的序列的方法,所述方法包括:
(a)提供来自所述宿主的核酸样品;
(b)将来自所述宿主的核酸样品与对一个或多个感兴趣区域的核酸混合,从而获得混合物,所述感兴趣区域的核酸对一个或多个下述具有特异性:致病性基因座;抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生生物抗性标志物;提供信息的基因分型区;在两种或更多种微生物、病原体、细菌、病毒、真菌或寄生生物之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物所特有的序列;以及
(c)在所述混合物内,使所述一个或多个感兴趣区域的核酸与所述核酸样品接触,其中所述接触导致所述核酸样品中的核酸与所述一个或多个感兴趣区域的核酸结合,从而引发或捕获所述核酸。
119.如权利要求118所述的方法,进一步包括使用所述一个或多个核酸进行核酸扩增反应,所述核酸对一个或多个下述具有特异性:致病性基因座;抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生生物抗性标志物;提供信息的基因分型区;在两种或更多种微生物、病原体、细菌、病毒、真菌或寄生生物之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物所特有的序列。
120.如权利要求119所述的方法,其中所述核酸扩增反应包括聚合酶链反应、逆转录、转录介导的扩增或连接酶链反应。
121.如权利要求118所述的方法,进一步包括分离所述核酸,所述核酸对一个或多个下述具有特异性:致病性基因座;抗微生物抗性标志物;抗生素抗性标志物;抗病毒抗性标志物;抗寄生生物抗性标志物;提供信息的基因分型区;在两种或更多种微生物、病原体、细菌、病毒、真菌或寄生生物之间共同的序列;整合至宿主基因组中的非宿主序列;掩蔽非宿主序列;非宿主模拟序列;掩蔽宿主序列;宿主模拟序列;以及一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物所特有的序列。
122.如权利要求121所述的方法,其中所述分离包括进行拉下实验。
123.如权利要求118所述的方法,进一步包括进行测序分析。
124.如权利要求118所述的方法,其中所述宿主为人。
125.如权利要求118所述的方法,其中来自所述宿主的核酸样品为循环核酸样品。
126.如权利要求118所述的方法,其中来自所述宿主的核酸样品为循环无细胞核酸样品。
127.一种寡核苷酸集合,其包含与测序衔接子序列连接的至少1,000个寡核苷酸,其中特别地选择所述包含至少1,000个寡核苷酸的寡核苷酸集合,使得:
(a)所述至少1,000个寡核苷酸中的每一个均包含核苷酸结构域;
(b)所述核苷酸结构域具有10至20个核苷酸的长度;
(c)每个具有10至20个核苷酸的长度的核苷酸结构域具有不同的核苷酸序列;并且
(d)每个具有10至20个核苷酸的长度的核苷酸结构域不存在于一个或多个基因组中。
128.如权利要求127所述的寡核苷酸集合,其中所述至少1,000个寡核苷酸的长度不超过200个核苷酸。
129.如权利要求127所述的寡核苷酸集合,其中所述一个或多个基因组为一个或多个哺乳动物基因组。
130.如权利要求129所述的寡核苷酸集合,其中所述一个或多个哺乳动物基因组选自人基因组、狗基因组、猫基因组、啮齿类动物基因组、猪基因组、牛基因组、绵羊基因组、山羊基因组、兔基因组、马基因组及其任意组合。
131.如权利要求130所述的寡核苷酸集合,其中所述一个或多个哺乳动物基因组为人基因组。
132.如权利要求127所述的寡核苷酸集合,其中所述一个或多个基因组为一个基因组。
133.如权利要求127所述的寡核苷酸集合,其中每个具有10至20个核苷酸的长度的核苷酸结构域的长度为12-15个核苷酸。
134.如权利要求133所述的寡核苷酸集合,其中每个具有10至20个核苷酸的长度的核苷酸结构域的长度为13-15个核苷酸。
135.如权利要求127所述的寡核苷酸集合,其中所述寡核苷酸为DNA寡核苷酸。
136.如权利要求127所述的寡核苷酸集合,其中所述寡核苷酸为RNA寡核苷酸。
137.如权利要求127所述的寡核苷酸集合,其中所述寡核苷酸为合成的寡核苷酸。
138.如权利要求127所述的寡核苷酸集合,其中所述寡核苷酸不包含人工片段化的核酸。
139.如权利要求127所述的寡核苷酸集合,其中所述寡核苷酸用核酸标记物、化学标记物或光学标记物进行标记。
140.如权利要求127所述的寡核苷酸集合,其中所述至少1,000个寡核苷酸为至少5,000个寡核苷酸。
141.如权利要求140所述的寡核苷酸集合,其中所述至少1,000个寡核苷酸为至少10,000个寡核苷酸。
142.如权利要求140所述的寡核苷酸集合,其中所述至少1,000个寡核苷酸为至少100,000个寡核苷酸。
143.如权利要求140所述的寡核苷酸集合,其中所述至少1,000个寡核苷酸为至少1,000,000个寡核苷酸。
144.如权利要求127所述的寡核苷酸集合,其中所述至少1,000个寡核苷酸包含长度为10至20个核苷酸的核苷酸结构域,该核苷酸结构域具有存在于一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物基因组中的不同序列。
145.一种产生寡核苷酸集合的方法,所述方法包括:
(a)提供至少1,000个寡核苷酸,其中所述至少1,000个寡核苷酸包含具有不同序列的长度为10至20个核苷酸的核苷酸结构域;
(b)提供来自宿主的核酸样品;
(c)将所述至少1,000个寡核苷酸与来自所述宿主的核酸混合;以及
(d)产生寡核苷酸集合,包括分离不与来自所述宿主的核酸杂交的所述至少1,000个寡核苷酸的至少一个子集。
146.如权利要求145所述的方法,其中所述至少1,000个寡核苷酸具有至多200个核苷酸的长度。
147.如权利要求145所述的方法,其中所述核苷酸结构域的长度为12-15个核苷酸。
148.如权利要求147所述的方法,其中所述核苷酸结构域的长度为13-15个核苷酸。
149.如权利要求145所述的方法,其中所述寡核苷酸为DNA或RNA。
150.如权利要求145所述的方法,其中所述寡核苷酸为单链的。
151.如权利要求145所述的方法,其中所述寡核苷酸为合成的寡核苷酸。
152.如权利要求145所述的方法,其中来自所述宿主的核酸用核酸标记物或化学标记物进行标记。
153.如权利要求152所述的方法,其中所述化学标记物为生物素。
154.如权利要求145所述的方法,其中步骤(d)的分离包括进行电泳。
155.如权利要求145所述的方法,其中步骤(d)的分离包括进行拉下实验。
156.如权利要求145所述的方法,进一步包括使用热使来自所述宿主的至少一部分核酸变性。
157.一种产生寡核苷酸集合的方法,所述方法包括:
(a)确定存在于选自基因组、外显子组和转录物组的背景群体中的长度为10至20个核苷酸的核苷酸结构域;以及
(b)产生包含至少1,000个寡核苷酸的寡核苷酸集合,其中所述至少1,000个寡核苷酸包含长度为10至20个核苷酸的核苷酸结构域,该核苷酸结构域具有不存在于所述背景群体中的不同序列。
158.如权利要求157所述的方法,其中所述至少1,000个寡核苷酸具有至多200个核苷酸的长度。
159.如权利要求157所述的方法,其中所述核苷酸结构域的长度为12-15个核苷酸。
160.如权利要求157所述的方法,其中所述核苷酸结构域的长度为13-15个核苷酸。
161.如权利要求157所述的方法,其中所述宿主为人。
162.如权利要求157所述的方法,其中所述背景群体为基因组。
163.如权利要求157所述的方法,其中所述背景群体为外显子组。
164.如权利要求157所述的方法,其中所述背景群体为转录物组。
165.如权利要求157所述的方法,其中所述确定以计算方式进行。
166.一种鉴别宿主中的病原体的方法,所述方法包括:
提供来自所述宿主的样品;
相对于宿主来源的核酸对所述样品富集非宿主来源的核酸,其中所述富集包括优先从所述样品中去除长度大于约300个碱基的核酸;
分析所述非宿主来源的核酸;以及
从所述非宿主核酸鉴别所述宿主中的病原体。
167.如权利要求166所述的方法,其中所述富集步骤包括优先去除所述样品中长度大于约200个碱基的核酸。
168.如权利要求166所述的方法,其中所述富集步骤包括优先去除所述样品中长度大于约150个碱基的核酸。
169.如权利要求166所述的方法,其中所述富集步骤包括优先去除所述样品中长度大于约120个碱基的核酸。
170.如权利要求166所述的方法,其中所述富集步骤包括优先富集所述样品中长度为约10个碱基至约120个碱基的核酸。
171.如权利要求166所述的方法,其中所述富集步骤包括优先富集所述样品中长度为约30个碱基至约120个碱基的核酸。
172.如权利要求166所述的方法,其中所述富集步骤导致所述样品中长度为约10个碱基至约300个碱基的核酸的相对增加。
173.如权利要求166所述的方法,其中所述富集步骤包括优先消化宿主来源的核酸。
174.如权利要求166所述的方法,其中所述富集步骤包括优先复制所述非宿主来源的核酸。
175.如权利要求174所述的方法,其中使用与不存在于所述宿主来源的核酸中的一个或多个核苷酸结构域互补的一个或多个引发寡核苷酸优先复制所述非宿主来源的核酸。
176.如权利要求175所述的方法,其中所述核苷酸结构域的长度为10至20个核苷酸。
177.如权利要求175所述的方法,其中所述核苷酸结构域的长度为12至15个核苷酸。
178.如权利要求175所述的方法,其中所述核苷酸结构域为13-聚体或14-聚体。
179.如权利要求166所述的方法,其中所述宿主为真核宿主。
180.如权利要求166所述的方法,其中所述宿主为脊椎动物宿主。
181.如权利要求166所述的方法,其中所述宿主为哺乳动物宿主。
182.如权利要求166所述的方法,其中所述非宿主来源的核酸包含来自致病生物体的DNA。
183.如权利要求166所述的方法,其中所述样品包含血液或血浆样品。
184.如权利要求166所述的方法,其中所述样品为无细胞样品。
185.一种ultramer寡核苷酸,其在单个寡核苷酸中包含10个寡核苷酸序列,其中:
(a)所述10个寡核苷酸序列中的每一个均被尿嘧啶残基或无嘌呤/无嘧啶位点隔开;
(b)所述10个寡核苷酸序列中的每一个均包含核苷酸结构域;
(c)所述核苷酸结构域具有10至20个核苷酸的长度;并且
(d)每个具有10至20个核苷酸的长度的核苷酸结构域具有不同的核苷酸序列。
186.如权利要求185所述的ultramer寡核苷酸,其中所述10个寡核苷酸序列的长度不超过200个核苷酸。
187.如权利要求185所述的ultramer寡核苷酸,其中所述10个寡核苷酸序列具有相同的长度。
188.如权利要求185所述的ultramer寡核苷酸,其中每个具有10至20个核苷酸的长度的核苷酸结构域不存在于一个或多个基因组中。
189.如权利要求188所述的ultramer寡核苷酸,其中所述一个或多个基因组为一个或多个哺乳动物基因组。
190.如权利要求188所述的ultramer寡核苷酸,其中所述一个或多个哺乳动物基因组选自人基因组、狗基因组、猫基因组、啮齿类动物基因组、猪基因组、牛基因组、绵羊基因组、山羊基因组、兔基因组、马基因组及其任意组合。
191.如权利要求188所述的ultramer寡核苷酸,其中所述一个或多个哺乳动物基因组为人基因组。
192.如权利要求188所述的ultramer寡核苷酸,其中所述一个或多个基因组为一个基因组。
193.如权利要求185所述的ultramer寡核苷酸,其中每个具有10至20个核苷酸的长度的核苷酸结构域的长度为12-15个核苷酸。
194.如权利要求185所述的ultramer寡核苷酸,其中每个具有10至20个核苷酸的长度的核苷酸结构域的长度为13-15个核苷酸。
195.如权利要求185所述的ultramer寡核苷酸,其中每个具有10至20个核苷酸的长度的核苷酸结构域包含混合碱基。
196.如权利要求195所述的ultramer寡核苷酸,其中所述混合碱基选自N(A、C、G、T)、D(A、G、T)、V(A、C、G)、B(C、G、T)、H(A、C、T)、W(A、T)、S(C、G)、K(G、T)、M(A、C)、Y(C、T)、R(A、G)及其任意组合。
197.如权利要求185所述的ultramer寡核苷酸,其中每个具有10至20个核苷酸的长度的核苷酸结构域包含1个或多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、11个或更多个、12个或更多个、或13个或更多个混合碱基。
198.如权利要求185所述的ultramer寡核苷酸,其中所述10个寡核苷酸序列具有相同的简并度。
199.如权利要求185所述的ultramer寡核苷酸,其中所述10个寡核苷酸序列具有2、3、4、6、8、9、12、16、18、24、27、32、36、48、54、64、72、81、96、108、128、144、162、192、216、243或256的简并度。
200.如权利要求185所述的ultramer寡核苷酸,其中所述10个寡核苷酸序列为DNA。
201.如权利要求185所述的ultramer寡核苷酸,其中所述10个寡核苷酸序列为RNA。
202.如权利要求185所述的ultramer寡核苷酸,其中所述10个寡核苷酸序列是合成的。
203.如权利要求185所述的ultramer寡核苷酸,其包含50个寡核苷酸序列。
204.如权利要求185所述的ultramer寡核苷酸,其包含100个寡核苷酸序列。
205.如权利要求185所述的ultramer寡核苷酸,其包含500个寡核苷酸序列。
206.如权利要求185所述的ultramer寡核苷酸,其中所述10个寡核苷酸序列包含长度为10至20个核苷酸的核苷酸结构域,该核苷酸结构域具有存在于一种或多种微生物、病原体、细菌、病毒、真菌或寄生生物基因组中的不同序列。
207.一种产生寡核苷酸集合的方法,所述方法包括:
(a)提供权利要求185所述的ultramer寡核苷酸;以及
(b)使所述ultramer寡核苷酸水解,从而产生寡核苷酸集合。
208.如权利要求207所述的方法,其中步骤(b)包括使所述ultramer寡核苷酸中的无嘌呤/无嘧啶位点水解。
209.如权利要求208所述的方法,其中使用内切核酸酶IV或内切核酸酶VII进行步骤(b)。
210.如权利要求207所述的方法,进一步包括使所述ultramer寡核苷酸中的尿嘧啶残基水解以形成无嘌呤/无嘧啶位点。
211.如权利要求210所述的方法,其中所述使尿嘧啶残基水解使用尿嘧啶DNA糖基化酶来进行。
212.如权利要求207所述的方法,进一步包括对所述寡核苷酸集合中的寡核苷酸进行生物素化。
213.如权利要求212所述的方法,其中所述生物素化通过酶促或化学方式进行。
214.如权利要求207所述的方法,进一步包括将探针附接至所述寡核苷酸集合中的寡核苷酸。
215.如权利要求214所述的方法,其中所述探针为洋地黄毒苷或荧光探针。
CN201680042387.4A 2015-05-18 2016-05-17 用于富集核酸群体的组合物和方法 Pending CN107922971A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562163273P 2015-05-18 2015-05-18
US62/163,273 2015-05-18
US201662334348P 2016-05-10 2016-05-10
US62/334,348 2016-05-10
PCT/US2016/032936 WO2016187234A1 (en) 2015-05-18 2016-05-17 Compositions and methods for enriching populations of nucleic acids

Publications (1)

Publication Number Publication Date
CN107922971A true CN107922971A (zh) 2018-04-17

Family

ID=57320699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680042387.4A Pending CN107922971A (zh) 2015-05-18 2016-05-17 用于富集核酸群体的组合物和方法

Country Status (11)

Country Link
US (2) US11111520B2 (zh)
EP (1) EP3298169A4 (zh)
JP (3) JP6873921B2 (zh)
CN (1) CN107922971A (zh)
AU (1) AU2016264102A1 (zh)
BR (1) BR112017024747A2 (zh)
CA (1) CA2986036C (zh)
HK (1) HK1251946A1 (zh)
IL (1) IL255647B (zh)
WO (1) WO2016187234A1 (zh)
ZA (1) ZA201708264B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109355365A (zh) * 2018-11-25 2019-02-19 中国农业科学院兰州兽医研究所 一种小rna高通量测序检测微生物的方法
CN111239392A (zh) * 2020-02-26 2020-06-05 浙江诺迦生物科技有限公司 一种新型冠状病毒肺炎(covid-19)血清学诊断试剂盒
CN111254190A (zh) * 2020-01-20 2020-06-09 中国医学科学院病原生物学研究所 一种血浆病毒组学的纳米孔三代测序检测方法
WO2020118543A1 (zh) * 2018-12-12 2020-06-18 深圳华大生命科学研究院 分离和/或富集宿主源核酸和病原核酸的方法和试剂及其制备方法
CN112888791A (zh) * 2019-04-29 2021-06-01 伊鲁米那股份有限公司 通过快速温育和核酸富集来鉴定和分析微生物样本
CN113201599A (zh) * 2021-06-03 2021-08-03 北京大学人民医院 一种基于PCR和nanopore测序检测脑脊液感染哪些病原体的方法
CN113454218A (zh) * 2018-12-20 2021-09-28 夸登特健康公司 用于改进核酸分子的回收的方法、组合物和系统

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107406875B (zh) 2014-12-20 2021-12-07 阿克生物公司 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法
AU2016264102A1 (en) 2015-05-18 2017-12-21 Karius, Inc. Compositions and methods for enriching populations of nucleic acids
EP3337898B1 (en) 2015-08-19 2021-07-28 Arc Bio, LLC Capture of nucleic acids using a nucleic acid-guided nuclease-based system
US11725233B2 (en) 2015-11-16 2023-08-15 Revere Biosensors, Llc Systems and methods for identifying and distinguishing genetic samples
CA3185611A1 (en) 2016-03-25 2017-09-28 Karius, Inc. Synthetic nucleic acid spike-ins
EP3559255A1 (en) 2016-12-23 2019-10-30 Grail, Inc. Methods for high efficiency library preparation using double-stranded adapters
GB2559319B (en) 2016-12-23 2019-01-16 Cs Genetics Ltd Reagents and methods for the analysis of linked nucleic acids
WO2018140452A1 (en) * 2017-01-30 2018-08-02 Counsyl, Inc. Enrichment of cell-free dna from a biological sample
JP6637218B2 (ja) * 2017-03-27 2020-01-29 積水メディカル株式会社 抗体を用いた標的核酸濃縮及び回収法
US11274344B2 (en) 2017-03-30 2022-03-15 Grail, Inc. Enhanced ligation in sequencing library preparation
WO2018183897A1 (en) * 2017-03-31 2018-10-04 Grail, Inc. Higher target capture efficiency using probe extension
CA3059370C (en) 2017-04-12 2022-05-10 Karius, Inc. Methods for concurrent analysis of dna and rna in mixed samples
WO2018195951A1 (en) * 2017-04-28 2018-11-01 Coyote Diagnostics Lab (Beijing) Co., Ltd. Integrated sample collection, processing and analysis systems
WO2018208804A1 (en) 2017-05-09 2018-11-15 Revere Biosensors, Llc Systems and methods for identifying and distinguishing genetic samples
EP3697798A4 (en) * 2017-10-18 2021-08-11 Day Zero Diagnostics, Inc. SELECTIVE ENRICHMENT OF A POPULATION OF DNA IN A MIXED DNA SAMPLE BY TARGETED DELETION OF DNA AMPLIFICATION
CN108220479B (zh) * 2018-01-05 2021-08-13 浙江农林大学 能检测多种猪猝死症病原的多重连接探针扩增鉴别试剂盒
WO2019178188A1 (en) * 2018-03-13 2019-09-19 Microinvestigate, Llc Direct-to-consumer genomic diagnostic device
CN110272984A (zh) * 2018-03-13 2019-09-24 深圳华大生命科学研究院 测序获取寄生虫核酸信息及对寄生虫分类的方法和系统
EP3765592A4 (en) 2018-03-16 2021-12-08 Karius Inc. SERIES OF SAMPLES TO DIFFERENTIATE TARGET NUCLEIC ACIDS FROM CONTAMINATING NUCLEIC ACIDS
EP3768856A1 (en) 2018-03-19 2021-01-27 Illumina, Inc. Methods and compositions for selective cleavage of nucleic acids with recombinant nucleases
GB201810571D0 (en) * 2018-06-27 2018-08-15 Cs Genetics Ltd Reagents and methods for the analysis of circulating microparticles
US20210375391A1 (en) 2018-06-29 2021-12-02 Roche Sequencing Solutions, Inc Detection of microsatellite instability
JP2022512829A (ja) * 2018-10-25 2022-02-07 クアドラント、バイオサイエンシズ、インコーポレイテッド 疾患診断のための方法及び機械学習
EP3884065A4 (en) 2018-11-21 2022-08-31 Karius Inc. DIRECT-TO-LIBRARY METHODS, SYSTEMS AND COMPOSITIONS
JP7132100B2 (ja) * 2018-11-21 2022-09-06 株式会社日立製作所 生体分子分析装置及び生体分子分析方法
BR112021009706A2 (pt) * 2018-11-21 2021-08-17 Karius, Inc. detecção e predição de doença infecciosa
GB201902887D0 (en) * 2019-03-04 2019-04-17 St Georges Hospital Medical School Detection and antibiotic resistance profiling of microorganisms
WO2020198664A1 (en) * 2019-03-28 2020-10-01 The Regents Of The University Of California Methods and systems for sequencing cell-free microbiome dna
US11396679B2 (en) 2019-05-31 2022-07-26 Universal Diagnostics, S.L. Detection of colorectal cancer
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
EP4010489A1 (en) * 2019-12-04 2022-06-15 Illumina, Inc. Preparation of dna sequencing libraries for detection of dna pathogens in plasma
EP4077659A1 (en) * 2019-12-16 2022-10-26 QIAGEN GmbH Enrichment method
US11530453B2 (en) * 2020-06-30 2022-12-20 Universal Diagnostics, S.L. Systems and methods for detection of multiple cancer types
US20220315986A1 (en) * 2021-04-01 2022-10-06 Diversity Arrays Technology Pty Limited Processes for enriching desirable elements and uses therefor

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100297710A1 (en) * 2006-05-31 2010-11-25 Sequenom, Inc. Methods and compositions for the extraction and amplification of nucleic acid from a sample
WO2011143659A2 (en) * 2010-05-14 2011-11-17 Fluidigm Corporation Nucleic acid isolation methods
US20120100549A1 (en) * 2010-10-01 2012-04-26 Ibis Biosciences, Inc. Targeted genome amplification methods
WO2014029792A1 (en) * 2012-08-21 2014-02-27 Qiagen Gmbh Virus particle stabilisation and method for isolating viral nucleic acids
WO2015085105A1 (en) * 2013-12-04 2015-06-11 University Of Alaska Fairbanks Methods and compositions for enriching non-host sequences in host samples

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9220773D0 (en) 1992-10-02 1992-11-18 Mini Agriculture & Fisheries Detection of antigens and nucleic acids
US6759217B2 (en) 1996-03-26 2004-07-06 Oncomedx, Inc. Method enabling use of extracellular RNA extracted from plasma or serum to detect, monitor or evaluate cancer
USRE39920E1 (en) 1997-05-30 2007-11-13 Xenomics, Inc. Methods for detection of nucleic acid sequences in urine
US6753137B2 (en) 2001-01-31 2004-06-22 The Chinese University Of Hong Kong Circulating epstein-barr virus DNA in the serum of patients with gastric carcinoma
US20050202414A1 (en) 2001-11-15 2005-09-15 The Regents Of The University Of California Apparatus and methods for detecting a microbe in a sample
US7727720B2 (en) * 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
EP1606417A2 (en) 2003-03-07 2005-12-21 Rubicon Genomics Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
EP1647600A3 (en) 2004-09-17 2006-06-28 Affymetrix, Inc. (A US Entity) Methods for identifying biological samples by addition of nucleic acid bar-code tags
US7914982B2 (en) 2005-02-17 2011-03-29 Trovagene, Inc. Methods for detecting pathogen specific nucleic acids in urine
ITRM20050068A1 (it) 2005-02-17 2006-08-18 Istituto Naz Per Le Malattie I Metodo per la rivelazione di acidi nucleici di agenti patogeni batterici o di parassiti nelle urine.
ITRM20050067A1 (it) 2005-02-17 2006-08-18 Istituto Naz Per Le Malattie I Metodo per la rivelazione di acidi nucleici virali o di origine virale nelle urine.
PL1856295T3 (pl) 2005-02-17 2013-08-30 Trovagene Inc Kompozycje i sposoby wykrywania w moczu kwasów nukleinowych swoistych dla wirusów
EP1885877A2 (en) 2005-02-17 2008-02-13 Istituto Nazionale per le Malattie Infettive "Lazzaro Spallanzani" IRCCS Compositions and methods for detecting pathogen specific nucleic acids in urine
US20060292585A1 (en) * 2005-06-24 2006-12-28 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
ES2660785T3 (es) 2007-08-22 2018-03-26 Trovagene, Inc. Métodos de uso de ARNmi para la detección de la muerte de células in vivo
DE102007041864B4 (de) 2007-09-04 2012-05-03 Sirs-Lab Gmbh Verfahren zum Nachweis von Bakterien und Pilzen
CA2697640C (en) 2007-09-21 2016-06-21 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
EP2255014A4 (en) 2008-02-12 2011-05-18 Pacific Biosciences California COMPOSITIONS AND METHODS FOR USE IN ANALYTICAL REACTIONS
EP2315850B1 (en) * 2008-07-18 2015-02-25 TrovaGene, Inc. Methods for pcr-based detection of "ultra short" nucleic acid sequences
US20120190663A1 (en) 2009-08-06 2012-07-26 Cedars-Sinai Medical Center Use of free dna as an early predictor of severity in acute pancreatitis
WO2011057094A1 (en) * 2009-11-05 2011-05-12 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
AU2010315084A1 (en) 2009-11-06 2012-05-31 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
US20110257031A1 (en) 2010-02-12 2011-10-20 Life Technologies Corporation Nucleic acid, biomolecule and polymer identifier codes
US20120077185A1 (en) 2010-08-06 2012-03-29 Tandem Diagnostics, Inc. Detection of genetic abnormalities and infectious disease
EP2426217A1 (en) 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
US20120184449A1 (en) 2010-12-23 2012-07-19 Sequenom, Inc. Fetal genetic variation detection
CN109280713A (zh) 2011-04-01 2019-01-29 澳康姆生物实验室公司 用于检测无细胞的病原体特异性核酸的方法和试剂盒
US20140179726A1 (en) 2011-05-19 2014-06-26 Virginia Commonwealth University Gut microflora as biomarkers for the prognosis of cirrhosis and brain dysfunction
CN103797486A (zh) 2011-06-06 2014-05-14 皇家飞利浦有限公司 用于组装核酸序列数据的方法
US20130024127A1 (en) 2011-07-19 2013-01-24 John Stuelpnagel Determination of source contributions using binomial probability calculations
GB201115095D0 (en) 2011-09-01 2011-10-19 Singapore Volition Pte Ltd Method for detecting nucleosomes containing nucleotides
EP2758538B1 (en) 2011-09-22 2018-10-31 Lineage Biosciences, Inc. Methods for analyzing heterogeneous samples
CA2850785C (en) 2011-10-06 2022-12-13 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2861856C (en) 2012-01-20 2020-06-02 Sequenom, Inc. Diagnostic processes that factor experimental conditions
CA2863035C (en) 2012-01-27 2023-08-29 The Board Of Trustees Of The Leland Stanford Junior University Methods for profiling and quantitating cell-free rna
WO2013134261A1 (en) * 2012-03-05 2013-09-12 President And Fellows Of Harvard College Systems and methods for epigenetic sequencing
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
JP6411995B2 (ja) 2012-03-13 2018-10-24 ザ チャイニーズ ユニバーシティー オブ ホンコン 非侵襲的出生前診断のために大量並列シークエンシング・データを分析する方法
US10385396B2 (en) 2012-04-19 2019-08-20 The Medical College Of Wisconsin, Inc. Highly sensitive surveillance using detection of cell free DNA
EP2653562A1 (en) 2012-04-20 2013-10-23 Institut Pasteur Anellovirus genome quantification as a biomarker of immune suppression
ES2905448T3 (es) * 2012-05-10 2022-04-08 Massachusetts Gen Hospital Métodos para determinar una secuencia nucleotídica
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP2861765B1 (en) 2012-06-15 2019-01-23 Progenity, Inc. Methods of detecting diseases or conditions
CN104619858B (zh) 2012-07-31 2017-06-06 深圳华大基因股份有限公司 胎儿健康状态的无创性检测
US9316802B2 (en) 2012-08-24 2016-04-19 Commscope Technologies Llc Optical fiber cable having reinforcing layer of tape heat-bonded to jacket
WO2014149134A2 (en) 2013-03-15 2014-09-25 Guardant Health Inc. Systems and methods to detect rare mutations and copy number variation
IL305303A (en) 2012-09-04 2023-10-01 Guardant Health Inc Systems and methods for detecting rare mutations and changes in number of copies
US20140066317A1 (en) 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP3026124A1 (en) 2012-10-31 2016-06-01 Genesupport SA Non-invasive method for detecting a fetal chromosomal aneuploidy
GB201302900D0 (en) 2013-02-19 2013-04-03 Genome Res Ltd Nucleic acid marker molecules for identifying and detecting cross contaminationof nucleic acid samples
US20140242582A1 (en) 2013-02-28 2014-08-28 Ariosa Diagnostics, Inc. Detection of genetic abnormalities using ligation-based detection and digital pcr
CA3156663A1 (en) 2013-03-15 2014-09-18 Verinata Health, Inc. Generating cell-free dna libraries directly from blood
CN113337604A (zh) 2013-03-15 2021-09-03 莱兰斯坦福初级大学评议会 循环核酸肿瘤标志物的鉴别和用途
EP2992471A4 (en) 2013-05-03 2016-12-14 Webroot Inc METHOD AND DEVICE FOR PROVIDING FORENSIC VISIBILITY IN SYSTEMS AND NETWORKS
US9499870B2 (en) * 2013-09-27 2016-11-22 Natera, Inc. Cell free DNA diagnostic testing standards
US20150119260A1 (en) 2013-10-18 2015-04-30 National Taiwan University Circulating cancer biomarker and its use
CA3207499A1 (en) * 2013-11-07 2015-05-14 The Board Of Trustees Of The Leland Stanford Junior University Cell-free nucleic acids for the analysis of the human microbiome and components thereof
AU2016264102A1 (en) 2015-05-18 2017-12-21 Karius, Inc. Compositions and methods for enriching populations of nucleic acids

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100297710A1 (en) * 2006-05-31 2010-11-25 Sequenom, Inc. Methods and compositions for the extraction and amplification of nucleic acid from a sample
WO2011143659A2 (en) * 2010-05-14 2011-11-17 Fluidigm Corporation Nucleic acid isolation methods
US20120100549A1 (en) * 2010-10-01 2012-04-26 Ibis Biosciences, Inc. Targeted genome amplification methods
WO2014029792A1 (en) * 2012-08-21 2014-02-27 Qiagen Gmbh Virus particle stabilisation and method for isolating viral nucleic acids
WO2015085105A1 (en) * 2013-12-04 2015-06-11 University Of Alaska Fairbanks Methods and compositions for enriching non-host sequences in host samples

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MOJSIN, M等: ""rapid detection and purification of sequence specific DNA binding proteins using magnetic separation"", 《JOURNAL OF THE SERBIAN CHEMICAL SOCIETY》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109355365A (zh) * 2018-11-25 2019-02-19 中国农业科学院兰州兽医研究所 一种小rna高通量测序检测微生物的方法
WO2020118543A1 (zh) * 2018-12-12 2020-06-18 深圳华大生命科学研究院 分离和/或富集宿主源核酸和病原核酸的方法和试剂及其制备方法
CN113039283A (zh) * 2018-12-12 2021-06-25 深圳华大生命科学研究院 分离和/或富集宿主源核酸和病原核酸的方法和试剂及其制备方法
CN113039283B (zh) * 2018-12-12 2023-12-26 深圳华大生命科学研究院 分离和/或富集宿主源核酸和病原核酸的方法和试剂及其制备方法
CN113454218A (zh) * 2018-12-20 2021-09-28 夸登特健康公司 用于改进核酸分子的回收的方法、组合物和系统
CN112888791A (zh) * 2019-04-29 2021-06-01 伊鲁米那股份有限公司 通过快速温育和核酸富集来鉴定和分析微生物样本
CN111254190A (zh) * 2020-01-20 2020-06-09 中国医学科学院病原生物学研究所 一种血浆病毒组学的纳米孔三代测序检测方法
CN111239392A (zh) * 2020-02-26 2020-06-05 浙江诺迦生物科技有限公司 一种新型冠状病毒肺炎(covid-19)血清学诊断试剂盒
CN113201599A (zh) * 2021-06-03 2021-08-03 北京大学人民医院 一种基于PCR和nanopore测序检测脑脊液感染哪些病原体的方法

Also Published As

Publication number Publication date
CA2986036A1 (en) 2016-11-24
EP3298169A1 (en) 2018-03-28
JP2021112200A (ja) 2021-08-05
HK1251946A1 (zh) 2019-05-03
US11111520B2 (en) 2021-09-07
IL255647A (en) 2018-01-31
CA2986036C (en) 2022-07-26
ZA201708264B (en) 2022-03-30
US20220154246A1 (en) 2022-05-19
US20170016048A1 (en) 2017-01-19
WO2016187234A1 (en) 2016-11-24
JP2023110928A (ja) 2023-08-09
JP2018520652A (ja) 2018-08-02
BR112017024747A2 (pt) 2018-11-13
EP3298169A4 (en) 2018-10-24
JP6873921B2 (ja) 2021-05-19
IL255647B (en) 2022-04-01
AU2016264102A1 (en) 2017-12-21

Similar Documents

Publication Publication Date Title
CN107922971A (zh) 用于富集核酸群体的组合物和方法
Firth et al. The genomics of emerging pathogens
Xu et al. Metagenomic analysis of fever, thrombocytopenia and leukopenia syndrome (FTLS) in Henan Province, China: discovery of a new bunyavirus
Seib et al. The key role of genomics in modern vaccine and drug design for emerging infectious diseases
Kim et al. Phylogeographic analysis of hemorrhagic fever with renal syndrome patients using multiplex PCR-based next generation sequencing
Santos et al. Genomic comparison among global isolates of L. interrogans serovars Copenhageni and Icterohaemorrhagiae identified natural genetic variation caused by an indel
Selhorst et al. Molecular characterization of chikungunya virus during the 2019 outbreak in the Democratic Republic of the Congo
Chang et al. Genomic epidemiology of meticillin-resistant Staphylococcus aureus ST22 widespread in communities of the Gaza Strip, 2009
Moldal et al. First detection of European bat lyssavirus type 2 (EBLV-2) in Norway
Splettstoesser et al. Rapid differentiation of Francisella species and subspecies by fluorescent in situ hybridization targeting the 23S rRNA
Jeyasekaran et al. Multiplex polymerase chain reaction-based assay for the specific detection of toxin-producing Vibrio cholerae in fish and fishery products
Kreuder et al. RNAseq reveals complex response of Campylobacter jejuni to ovine bile and in vivo gallbladder environment
Mediannikov et al. Epidemic of venereal treponematosis in wild monkeys: a paradigm for syphilis origin
Zwe et al. Bacterial antagonism of Chromobacterium haemolyticum and characterization of its putative type VI secretion system
Bai et al. Analysis of the diversity of tick-borne viruses at the border areas in Liaoning Province, China
Koeppel et al. SARS-CoV-2 reverse zoonoses to pumas and lions, South Africa. Viruses. 2022; 14: 120
Coppola et al. The in vivo transcriptomic blueprint of Mycobacterium tuberculosis in the lung
Beare et al. Efficient method of cloning the obligate intracellular bacterium Coxiella burnetii
Kissinger et al. Enrichment of Cryptosporidium parvum from in vitro culture as measured by total RNA and subsequent sequence analysis
Maina Sero-epidemiology and molecular characterization of Rickettsiae infecting humans, selected animals and arthropod vectors in Asembo, western Kenya, 2007-201
Sánchez Selection of Aptamers Against Pathogenic Bacteria of Interest in Aquaculture and Public Health
Vitt et al. A collection of diverse bacteriophages for biocontrol of ESBL-and AmpC-β-lactamase-producing E. coli
Mogotsi Genomic investigation of the faecal RNA virome in children from Oukasie clinic, North West Province, South Africa
Hamed et al. Phylogenetic analysis of the neuraminidase segment gene of Influenza A/H1N1 strains isolated from Monastir Region (Tunisia) during the 2017–2018 outbreak
Soll White-opaque switching in Candida albicans: cell biology, regulation, and function

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination