CN111201323A - 利用唯一分子标识符的文库制备的方法和系统 - Google Patents

利用唯一分子标识符的文库制备的方法和系统 Download PDF

Info

Publication number
CN111201323A
CN111201323A CN201880054130.XA CN201880054130A CN111201323A CN 111201323 A CN111201323 A CN 111201323A CN 201880054130 A CN201880054130 A CN 201880054130A CN 111201323 A CN111201323 A CN 111201323A
Authority
CN
China
Prior art keywords
sequencing
umi
primers
region
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880054130.XA
Other languages
English (en)
Inventor
Z·阿普泰
J·里奇曼
D·阿尔莫纳西德
J·吉门尼兹
R·奥尔蒂斯
E·莫拉莱斯
P·科瓦鲁比亚斯
E·奥利瓦雷斯
N·奥尔丹尼斯
L·莱奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Prosomegen
Psomagen Inc
Original Assignee
Prosomegen
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Prosomegen filed Critical Prosomegen
Publication of CN111201323A publication Critical patent/CN111201323A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

用于进行与微生物相关联的测序的方法100和/或系统200或文库制备的实施方案可以包括:制备与一个或多个靶标相关联的一组基于唯一分子标识符(UMI)的分子;制备一组基于测序的引物;基于一组基于UMI的分子,和与一个或多个靶标相关联的一个或多个样品,来生成一组经标记的靶分子;和/或,基于经标记的靶分子和一组基于测序的引物,来生成一组准备测序的经标记的靶分子。

Description

利用唯一分子标识符的文库制备的方法和系统
相关申请的交叉引用
本申请要求于2017年6月20日提交的美国临时申请序列号62/522,293和于2017年11月06日提交的美国临时申请序列号62/582,162的权益,上述美国临时申请的全部内容通过引用并入本文中。
技术领域
本公开总体上涉及基因组学和分子生物学。
背景技术
下一代测序(NGS)技术(例如,NGS平台)可以降低DNA测序和/或其他核酸测序的成本,提高所获得的信息的质量,和/或提高测序过程的可扩展性。NGS技术可以促进以高分析深度,对少量到大量的DNA和/或其他核酸样品进行测序,从而可以允许对精确的DNA靶序列和/或其他合适的序列进行检测和解密。可以同时对不同的核酸(例如,不同的DNA核酸等)的混合物进行分析,从而可以促进对复杂混合物的组成(例如,从复杂生态群落,包括微生物等,提取的DNA和/或其他核酸),和/或来自保守序列池的罕见DNA序列变异体(例如,较大组织的少量细胞中生成罕见的突变等)进行分析。构建用于NGS和/或其他测序方法的测序文库可以包括文库制备过程(例如,DNA操纵、扩增等),但文库制备过程可能引入多种偏差(例如,关于不同的靶标如DNA靶标,关于靶标之间的比率,等等)。另外,测序读取序列(read)的数量不一定代表核酸分子(例如,DNA分子)在文库或原始混合物中的正比例,从而在生成绝对定量数据(例如,所分析的原始生物样品的组成的精确数量或估值,等等)方面可能存在困难。
此外,NGS技术和/或其他合适的测序技术可用于扩增子关联测序(例如,与单一或少量基因区域相关联的分析,例如用于识别生物样品中的一个或多个微生物类群,等等),或宏基因组关联测序(例如,与微生物群落和/或生物样品的其他合适的生态群落,如包括DNA的整个群落,相关联的分析,这与对单一基因扩增子的分析相对,等等)。然而,扩增子关联测序或宏基因组关联测序各自均具有独特的优点和缺点。
附图说明
图1包括方法实施方案的变型的流程图;
图2包括方法实施方案的变型的流程图;
图3包括方法实施方案的变型的流程图;
图4包括方法实施方案的变型的流程图;
图5包括方法实施方案的变型的流程图;
图6包括对于与经典测序引物或与基于UMI的引物(包括4N UMI区域)组合的16S测序文库,所分配的读取序列的对比的具体实施例;
图7包括对于与基于UMI的引物(包括4N UMI区域或8N UMI区域)组合的16S测序文库,所分配的读取序列的对比的具体实施例;
图8包括对于使用基于UMI的引物(包括8N UMI区域)的PCR过程,通过添加标记促进分子改进靶标扩增的具体实施例;
图9A至图9B包括当使用4N UMI区域、8N UMI区域和标记促进分子时,每一样品所分配的UMI总数的对比的具体实施例;
图10A至图10B包括当使用4N UMI区域、5N UMI区域和标记促进分子时,每一样品所分配的测序读取序列总数的对比的具体实施例;
图11A至图11B包括当使用4N UMI区域、8N UMI区域和标记促进分子时,每一样品所分配的唯一UMI百分比的对比的具体实施例;
图12包括接头区域,对于利用基于UMI的引物(包括8N UMI区域)进行16S扩增的效果的具体实施例。
具体实施方式
以下对实施方案的描述并非意在将本发明限制为这些实施方案,而是使本领域技术人员能够进行实现和使用。
1.概述
如图1和图4所示,用于与微生物相关联的测序(例如,下一代测序(NGS),等等)的文库制备方法100的实施方案可以包括:制备(例如,确定、生成等)与一个或多个靶标(例如,一组核酸靶标;与微生物相关联的靶标;等等)相关联的一组基于唯一分子标识符(unique molecular identifier,UMI)的分子(例如,基于UMI的引物等)S110;制备一组基于测序的引物(例如,适于促进与微生物相关联的测序,如下一代测序;等等)S120;基于所述一组基于UMI的分子,和与所述一个或多个靶标(例如,一种或多种生物样品,包括与一个或多个核酸靶标相关联的核酸;等等)相关联的一种或多种生物样品(例如,至少一种生物样品),生成一组经标记的靶分子S130;和/或,基于所述经标记的靶分子和所述一组基于测序的引物,生成一组准备测序的、经标记的靶分子(例如,准备NGS的经标记的靶分子;等等)S140。
在一个具体实施例中,方法100(例如,用于与微生物相关联的NGS,等等)可以包括:制备与一组核酸靶标相关联的一组基于UMI的引物(例如,基于UMI的引物,包括与所述一组核酸靶标中的一个或多个核酸靶标序列互补的基因序列;等等),该一组核酸靶标与微生物相关联,其中所述一组基于UMI的引物中的每一基于UMI的引物均包括UMI区域、靶标关联区域、接头区域(例如,定位在UMI区域与靶标关联区域之间;等等)和/或衔接子区域(例如,包括外部衔接子区域,该外部衔接子区域被配置为促进后续处理,用于制备准备测序的分子;等等),其中UMI区域包括一组随机“N”碱基,其中每一N碱基均选自“A”碱基、“G”碱基、“T”碱基和“C”碱基中的任一种,其中靶标关联区域与所述一组核酸靶标中的至少一个核酸靶标相关联(例如,一靶标关联区域,其包括与所述至少一个核酸靶标序列互补的基因序列;等等);制备一组基于测序的引物,其中,所述一组基于测序的引物中的每一基于测序的引物均包括衔接子区域(例如,与基于UMI的引物的衔接子区域不同、相似或相同;等等),该衔接子区域与NGS相关联(例如,一衔接子区域,其包括被配置成促进使用一种或多种NGS技术进行NGS的测序衔接子,和/或包括与基于UMI的引物衔接子区域的外部衔接子区域相关联的外部衔接子区域;等等),和/或包括索引区域(例如,测序索引区域,用于促进不同样品的组合标记;用于促进多重化;等等);利用所述一组基于UMI的引物,和与所述一组核酸靶标相关联的至少一种生物样品,进行第一扩增过程(例如,第一聚合酶链反应(PCR)过程,等等),来生成一组经标记的靶分子;和,利用所述经标记的靶分子和所述一组基于测序的引物,进行第二扩增过程(例如,第二PCR过程,等等),来生成一组准备NGS的、经标记的靶分子。
附加或可选地,如图2、图3和图5所示,方法100的实施方案可以包括制备组合测序文库S150,其中组合测序文库与和微生物相关联的扩增子关联测序和宏基因组关联测序相关联。在实施方案中,方法100(例如,方法100的实施方案的多个部分包括制备组合测序文库,等等)可以包括:利用一组扩增子生成引物(例如,基于UMI的引物等),和来自与微生物相关联的至少一种生物样品的一组靶标,进行扩增过程(例如,第一PCR过程;等等),来生成一组靶标关联扩增子S152;基于对来自所述至少一种生物样品的一组总核酸进行处理(例如,将mRNA转化为cDNA;进行靶标捕获过程;片段化;等等),来生成与微生物群落(例如,对应于微生物;等等)相关联的一组宏基因组关联片段S154;和/或,基于所述一组靶标关联扩增子、所述一组宏基因组关联片段和一组基于测序的引物(例如,基于第二扩增过程,如使用靶标关联扩增子和/或宏基因组关联片段进行的第二PCR过程;等等),来生成一组准备测序的靶分子S158。
附加或可选地,方法100的实施方案可以包括:对来自一个或多个使用者(例如,受试者;人类;动物;患者;植物;等等)的一种或多种生物样品,如从一个或多个采集位点采集的生物样品进行处理(例如,采集;样品制备,以用于促进方法100的实施方案的多个部分;执行方法100的实施方案的多个部分;等等),该采集部位可以包括肠道部位(例如,基于粪便样品所分析的,等等)、皮肤部位、鼻子部位、口部位、生殖器部位和/或其他合适的生理部位中的一种或多种;基于微生物序列数据集(例如,利用方法100的实施方案的多个部分生成的测序文库进行测序,所生成的微生物序列数据集;由与测序的UMI区域,如准备测序的经标记的靶分子的UMI区域,相关联的生物信息学分析所生成的微生物序列数据集;等等),来确定微生物组特征(例如,微生物组成特征;微生物功能特征;与微生物有关情况,如与诊断和/或治疗相关的微生物有关情况相关联的特征;等等)。然而,方法100的实施方案可以附加或可选地包括任何合适的过程。
方法100和/或系统200的实施方案可以用于:减少与测序技术相关联的偏差(例如,与常规的DNA文库制备方法相关联的偏差;影响来自一种或多种原始生物样品的各分子的原始比率的偏差;与NGS技术相关联的偏差;等等);改进对核酸(例如,DNA分子;一种或多种原始样品中的核酸;等等)和/或其他合适组分(例如,基于对样品中定义拷贝数量的基因所分配的UMI数量,对测序数据进行标准化;等等)的定量分析(例如,绝对量的分析;对分子、等位基因、基因变异体和/或其他组分的绝对定量;等等);改进与RNA转录的标准化相关联的过程(例如,在RNA转化为DNA之后;等等);改进对低频突变的检测;改进定量单细胞RNA测序;改进对免疫组库细胞的组成的定量分析;和/或,改进与测序技术相关联的其他应用,例如通过改进UMI(例如,基于UMI的分子;基于UMI的分子的UMI区域,等等)进入测序文库中(进入靶分子和/或其他待测序的合适分子中;等等)的处理(例如,并入;改进与并入有关的效率;改进与并入有关的通用性;制备;确定;等等),来改进用于测序的文库制备。在一个具体实施例中,方法100可以包括进行第一PCR过程和第二PCR过程(例如,高效的两步PCR法;等等),用于标记(例如,利用UMI区域;等等)和扩增靶分子。在一个具体实施例中,并入的UMI区域可以例如利用NGS技术、计算系统和/或其他合适的部件,对UMI区域进行测序和/或进行生物信息学分析,促进对复杂混合物(例如,包括微生物群落的复杂混合物;等等)中的各靶分子和/或其他合适的分子(例如,宏基因组关联片段;等等)进行追踪。
附加或可选地,方法100和/或系统200的实施方案可用于使得能够制备组合测序文库,例如用于促进同时(例如,组合;等等)进行扩增子关联测序和宏基因组关联测序(例如,利用NGS技术和/或其他合适的测序技术进行的测序;等等),从而利用扩增子关联测序和宏基因组关联测序两者(例如,扩增子关联测序的优势,诸如能够分析微生物群落中的大部分有机体,包括靶基因和/或其他靶标;宏基因组关联测序的优势,诸如能够基于整个群落DNA对微生物群落进行无偏差分析,诸如能够在微生物组组成、微生物组功能、相关多样性和/或其他合适的特征方面对微生物群落进行表征;等等)的优势(例如,可以抵消劣势;可以促进以下的新优势:降低对微生物群落的丰富微生物的分析偏差,降低对靶标表征程度诸如引物设计的要求,其包括靶标的保守区域以及用于与其他分类群区分开的可变区域,诸如与分类学标志物如16S rRNA、rpoB和/或其他标志物相关;等等)。
在一个具体实施例中,方法100可以包括生成组合扩增子(例如,对于分类学相关基因,如16S、18S、ITS等)和宏基因组DNA文库(例如,用于能够对功能关联基因如抗生素基因、毒力基因、人类遗传标志物进行宏基因组检测;用于能够检测多种RNA有机体,如病毒;用于能够通过mRNA,从生物样品检测宿主和微生物的转录基因;等等)。在一个具体实施例中,方法100可以包括生成广泛的靶核酸(例如,DNA)文库。
附加或可选地,方法100和/或系统200的实施方案可以有助于提供对一种或多种生物样品中的有机体进行定向分类学剖析(和/或其他合适的组成相关分析)的数据(例如,微生物序列数据等),以及有助于(例如,通过宏基因组关联法,如宏基因组关联测序等)提供对有机体进行基因功能剖析(和/或其他合适的功能相关分析)的数据(例如,微生物序列数据等),诸如基于标准或已知的基因组,以另外或可选的方式来进行功能相关分析(例如,确定微生物组的功能特征,等等)。
附加地或可选地,方法100和/或系统200的实施方案可用来促进微生物的相关检测(例如,对样品的有机体的分类学检测,和对同一样品中存在或表达的基因的检测;以定向方式,对具有保守分类学基因的有机体的检测,和/或无偏差地检测一种或多种生物样品中具有已表征或先前未经表征的DNA的其他真核生物、原核生物、病毒有机体和/或其他合适的微生物;使用无偏差的宏基因组测序和/或宏转录组测序,对新的、未知的和/或未识别的潜在核酸靶标的检测,诸如通过基于互补富集的方案,如特定靶标或区域如16S、18S、ITS的扩增,或任何其他基于位点定向的技术;以无偏差的方式,对已知或已识别的核酸靶标,如与抗生素抗性相关联的核酸靶、与毒力因子分子标志物相关联的核酸靶标和感兴趣的其他合适的靶标的检测,诸如通过基于互补富集的方案;等等)。然而,方法100和/或系统200的实施方案可以包括任何合适的功能。
方法100和/或系统200的实施方案优选地促进与NGS(例如,NGS技术)相关联的文库制备。NGS可以包括以下项中的任何一种或多种:高通量测序(例如,通过高通量测序技术;大规模并行签名测序,聚合酶克隆测序(Polony sequencing),454焦磷酸测序,Illumina测序,SOLiD测序,Ion Torrent半导体测序,DNA纳米球测序,Heliscope单分子测序,单分子实时(SMRT)测序,纳米孔(Nanopore)DNA测序,等等),任一代的测序技术(例如,第二代测序技术、第三代测序技术、第四代测序技术,等等),扩增子关联测序(例如,靶向扩增子测序),宏基因组关联测序(例如,宏转录组测序、宏基因组测序等),边合成边测序,隧道电流测序,杂交测序,质谱测序,基于显微术的技术,和/或任何合适的NGS技术。
附加地或可选地,方法100和/或系统200的实施方案可以促进文库制备和/或与任何合适的测序相关联的其他合适的过程(例如,任何合适的测序技术,等等),该过程可以包括以下项中的任一种或多种:毛细管测序,桑格(Sanger)测序(例如,微流体Sanger测序,等等),焦磷酸测序,纳米孔测序(牛津纳米孔测序,等等),和/或通过任何合适的测序技术促进的任何其他合适类型的测序。
方法100和/或系统200的实施方案可以改进测序文库的制备,以促进(例如,基于对测序文库进行测序所得到的微生物序列数据集;等等)对一种或多种微生物相关状况的表征和/或治疗,所述一种或多种与微生物相关的状况可以包括以下项中的一种或多种:疾病,症状,原因(例如,诱因等),失调,相关联风险(例如,倾向得分等),关联严重度,行为(例如,咖啡因消耗、习惯、饮食等),和/或与微生物相关状况相关联的其他任何合适的方面。微生物相关状况可以包括一种或多种疾病相关状况,其可以包括以下项中的任一种或多种:与胃肠道相关的状况(例如,肠易激综合征、炎症性肠病、溃疡性结肠炎、乳糜泻、克罗恩(Crohn)病、腹胀、痔疮疾病、便秘、反流、大便带血、痢疾等);与过敏相关的状况(例如,与小麦、麸质、乳制品、大豆、花生、贝类、树坚果、蛋等相关联的过敏和/或不耐症);与皮肤相关的状况(例如,痤疮、皮肌炎、湿疹、红斑痤疮、皮肤干燥、牛皮癣、头皮屑、光敏感,等等);与运动相关的状况(例如,痛风、类风湿性关节炎、骨关节炎、反应性关节炎、多发性硬化症、帕金森氏病等);与癌症相关的状况(例如,淋巴瘤;白血病;胚细胞瘤;生殖细胞瘤;上皮癌(carcinoma);肉瘤;乳腺癌、前列腺癌;基底细胞癌;皮肤癌;结肠癌;肺癌;与任何合适的生理区域相关联的癌症状况;等等);与心血管相关的状况(例如,冠心病、炎性心脏病、瓣膜性心脏病、肥胖症、中风,等等),贫血状况(例如,地中海贫血;镰状细胞;恶性贫血;范可尼贫血;溶血;再生障碍性贫血;缺铁性贫血;等等),与神经系统相关的状况(例如,ADHD、ADD、焦虑症、阿斯伯格综合征、自闭症、慢性疲劳综合征、抑郁症等),与自身免疫相关的状况(例如,口炎性腹泻(Sprue)、AIDS、干燥综合征(Sjogren’s)、狼疮,等等),与内分泌相关的状况(例如,肥胖症、格雷夫斯病(Graves’disease)、桥本甲状腺炎(Hashimoto’sthyroiditis)、代谢性疾病、I型糖尿病、II型糖尿病,等等),莱姆病状况,与沟通相关的状况,与睡眠相关的状况,与代谢相关的状况,与体重相关的状况,与疼痛相关的状况,与遗传相关的状况,慢性疾病,和/或任何其他合适类型的疾病相关状况。附加或可选地,微生物相关状况可以包括一种或多种人行为状况,其可以包括以下项中的任一种或多种:咖啡因消耗,酒精消耗,其他食品消耗,膳食补充物消耗,益生菌相关行为(例如,消耗,避免,等等),其他饮食行为,习惯行为(例如,吸烟;运动状况,比如低、中和/或极端运动状况;等等),更年期,其他生物过程,社会行为,其他行为,和/或任何其他合适的人类行为状况。状况可以与任何合适的表型(例如,人、动物、植物、真菌体可测量的表型,等等)相关联。
方法100和/或系统200的实施方案可以针对来自单一使用者的一种或多种生物样品来实施,诸如涉及进行方法100的实施方案的多个部分,用于从单一使用者的一种或多种生物样品来制备测序文库。附加或可选地,实施方案可以针对以下项来实施:来自一组使用者(例如,受试者群体,包括使用者、排除使用者等)的生物样品,其中,所述一组使用者可以包括,在任何其他合适类型的特征(例如,关于微生物相关状况、人口统计学特征行为、微生物组的组成和/或功能,等等)上,与任何其他受试者相似和/或不相似的受试者;使用者的子集(例如,共享特征,诸如影响方法100的实施方案的多个部分的特征;等等);植物、动物、微生物(例如,来自环境微生物群落;等等),和/或任何其他合适的实体。因此,从一组使用者(例如,受试者群体、一组受试者、使用者子集,等等)得到的信息可以用于为后续使用者提供额外的了解(例如,关于在实施方法100的实施方案的多个部分中使用的实验参数,等等)。在一变型中,生物样品集合可以与广泛的使用者相关联,且进行处理,以对比不同类型的使用者的扩增子相关联特征和宏基因组相关联特征(例如,其中,扩增子相关联特征和宏基因组相关联特征,可以基于从用于同时进行扩增子关联测序和宏基因组关联测序的组合测序文库得到的微生物序列数据集来确定,等等),其中广泛的使用者诸如包括具有以下一种或多种特征的使用者:不同的人口统计学特征(例如,性别、年龄、婚姻状况、种族、国籍、社会经济状况、性取向,等等),不同的微生物相关状况(例如,健康和疾病状态;不同的遗传配置;等等),不同的生活状况(例如,单独生活、与宠物生活、与重要的他人生活、与儿童生活,等等),不同的饮食习惯(例如,杂食、素食、严格素食、糖消耗、酸消耗、咖啡因消耗,等等),不同的行为倾向(例如,体力活动水平、用药、饮酒,等等),不同的流动性水平(例如,与给定时间段内行进的距离有关),和/或任何其他合适的特征(例如,影响微生物组的组成和/或功能特征、与其相关或以其他方式与其相关联的特征,等等)。在实施例中,随着使用者数量的增加,在方法100的实施方案的多个部分中实施的过程,诸如在基于多种使用者的微生物组对其进行表征(例如,关于使用者样品的不同采集部位,等等)上,预测能力会提高。然而,方法100和/或系统200的实施方案的多个部分可以对任何一个或多个合适的实体,以任何合适的方式执行和/或配置。
本文所述的数据(例如,与扩增过程如PCR过程相关联的数据;与UMI相关联标记相关联的数据;与测序相关联的数据,诸如测序读取序列、微生物序列数据集和/或其他合适的测序数据;微生物组特征;使用者数据;补充数据;与微生物相关状况相关联的数据;等等)可以与任何合适的时间指标(例如,秒、分钟、小时、天、周,等等)相关联,其中时间指标包括以下项中的一种或多种:指示何时进行数据的采集(例如,指示何时采集样品的时间指标;等等)、确定(例如,指示何时开始、完成样品处理操作的时间指标,等等)、传输、接收和/或以其他方式处理的时间指标;为数据所描述的内容提供背景(context)的时间指标;时间指标的变化(例如,样品处理操作的输出随时间的变化,诸如在PCR周期内的产物的变化;等等);和/或,与时间有关的其他合适的指标。本文所述的分子和/或任何合适的生物组分可以包括任何合适的尺寸(例如,序列长度,等等)。
附加或可选地,参数、度量、输入、输出和/或其他合适的数据可以与数值类型相关联,这些数值类型包括以下项中的一种或多种:得分,单个数值,合计值,二进制值,相对值,类别,置信度,标识符,沿频谱的值,和/或任何其他合适类型的数值。本文所述的任何合适类型的数据、组分(例如,生物组分)、产物(例如,样品处理操作的产物,等等)可以用作输入(例如,用于不同样品处理操作、模型、混合物、测序技术等),生成为输出(例如,不同模型、模块、样品处理操作的产物的输出,等等),和/或以与方法100和/或系统200相关联的任何合适的组分的任何合适的方式来操作。
可以通过和/或使用本文所述的系统200、组分和/或实体的一个或多个实例,以时间相关性(例如,基本上同时、响应性、连续地、在之前、在之后等)触发事件(例如,实施方法100的实施方案的一部分),和/或以任何其他合适的顺序,在任何合适的时间和以任何合适的频率,不同时地(例如,顺序地)、同时地(例如,多重化;在方法100的实施方案的多个部分中处理多个样品;与测序分析和/或方法100的实施方案的多个部分相关联的并行数据处理;等等)进行本文所述的方法100和/或过程的实施方案的一个或多个实例和/或部分。
附加或可选地,对于于2016年8月18日提交的美国申请号15/240,919、于2017年7月13日提交的美国申请号15/649,497、于2017年11月6日提交的美国临时申请号62/582,191、于2017年11月13日提交的美国申请号15/811,544以及于2018年9月18日提交的美国申请号15/707,907中所描述的内容,方法100和/或系统200的实施方案的多个部分可以促进(例如,在方法100和/或系统200的实施方案的多个部分的输出随后可以用作输入;等等)、改进、与之结合使用(例如,连续地、并行地,等等)、使用(例如,作为方法100和/或系统200的实施方案的多个部分的输入;等等)、与之具有任何合适的时间关系、增加、修改、包括,和/或可以以其他方式与之相关联,这些申请的全部内容均通过引用并入本文中。
然而,方法100和/或系统200可以以任何合适的方式进行配置。
2.1制备基于UMI的分子
方法100的实施方案可以包括制备(例如,确定、生成,等等)与一个或多个靶标(例如,一组核酸靶标;与微生物相关联的靶标;等等)相关联的一组基于UMI的分子(例如,基于UMI的引物,等等)S110,其可以用来制备用于促进对一个或多个靶标进行标记(例如,利用基于UMI的分子;UMI区域;衔接子区域;接头区域;索引区域;等等)、扩增和/或其他合适处理的分子。
靶标(例如,感兴趣的靶标;已知或已识别的靶标;未知或先前未识别的靶标;等等)可以包括下项中的任何一种或多种:生物标志物;基因(例如,基因表达标志物,等等);序列区域(例如,基因序列;识别基因、染色体、微生物相关状况、保守序列、突变、多态性的序列;氨基酸序列;核苷酸序列;等等);核酸(例如,基因组DNA、染色体DNA、染色体外DNA、线粒体DNA、质体DNA、质粒DNA、粘粒DNA、噬菌粒DNA、合成DNA、获自RNA的cDNA、单链和双链DNA,等等)细胞;小分子;蛋白质;肽;与一种或多种微生物相关状况相关联的靶标(例如,提供与一种或多种微生物相关状况相关联的诊断、预后、预测和/或治疗的信息的靶标;等等);与微生物组成(例如,指示样品中存在的微生物的分类学类别的靶标;指示任何合适的分类的微生物的存在、丰度和/或不存在的标志物;等等)和/或微生物功能(例如,指示与微生物相关联的功能特征的靶标;等等)相关联的靶标;脂质;总核酸;全微生物;代谢物;碳水化合物;和/或任何合适类型的靶标。方法100的实施方案的多个部分可以促进利用靶标进行文库制备,以促进(例如,通过使用UMI,等等)对任何合适的靶标进行改进的测序(例如,NGS)和/或分析。
基于UMI的分子优选地与一个或多个靶标(例如,微生物相关的核酸靶标,等等)相关联(例如,包括靶标关联区域,所述靶标关联区域包括与一个或多个靶标(例如,核酸靶标等)的一个或多个序列区域互补的一个或多个序列区域;靶向;可扩增;可处理;能够标记;等等),但是可以附加或可选地与任何合适的组分相关联。基于UMI的分子优选地包括基于UMI的引物(例如,用于在一个或多个扩增过程中,诸如用于一个或多个PCR过程中,等等),但是出于任何合适的目的,可以附加或可选地包括任何合适类型的基于UMI的分子。
基于UMI的分子(和/或其他合适的分子,诸如本文中所描述的引物和/或其他分子)优选地包括一个或多个UMI区域(例如,其中,基于UMI的分子可以包括单一的UMI区域;其中,基于UMI的分子可以包括多个UMI区域;等等)。在一个实施例中,UMI区域可以包括具有一组随机“N”碱基(例如,N脱氧核苷酸碱基)的UMI区域,其中,每一随机“N”碱基均选自“A”碱基、“G”碱基、“T”碱基和“C”碱基中的任一种。“N”碱基可以是连续的(例如,大量的“N”碱基,等等),(例如,通过限定的碱基;通过任何合适的序列区域;等等)分开的,和/或位于基于UMI的分子的任何合适的序列位置。UMI区域可以包括任何合适的序列长度(例如,至少2个“N”碱基;少于21个“N”碱基;任何合适数量的“N”碱基;等等)。UMI区域序列长度可以基于待处理(例如,定量、区分,等等)的靶标的数量和/或类型来确定,诸如其中,较长的UMI区域可以促进较大数量的随机碱基的组合和较大组的唯一标识符(例如,以用于分析较多类型的待区分的靶标;以用于分析包括大量模板和/或基因变异体的样品;等等)。在一个实施例中,UMI区域可以包括4N UMI区域(例如,包括4个“N”碱基的UMI区域等)。在一个具体实施例中,UMI区域可以包括8N UMI区域,诸如用于16S基因的扩增过程,诸如同时添加一种或多种标记促进分子,诸如MgCl2、二甲基亚砜(DMSO)、热稳定核酸结合蛋白(例如,极高热稳定单链DNA结合蛋白等)和/或其他合适的组分中的一种或多种。然而,UMI区域可以任何合适的方式配置。
基于UMI的分子(和/或其他合适的分子,诸如本文所述的引物和/或其他分子)优选地包括一个或多个靶标关联区域。靶标关联区域优选地包括序列区域(例如,基因序列,等等),但是可以附加或可选地包括任何合适类型的组分(例如,与靶标相关联的任何合适的组分,诸如可结合、可偶联、可连接、影响、报告、修改靶标,和/或与靶标具有任何合适的关系;等等)。靶标关联区域优选地与一个或多个靶标(例如,核酸靶标的序列区域;核酸靶标的其他合适的组分;等等)相关联(例如,具有序列互补性;靶向;可扩增;可对其进行处理;等等)。在一个实施例中,靶标关联区域可以包括可与(例如,核酸靶标的)互补靶标DNA序列退火的DNA序列。靶标关联区域优选地使聚合酶(例如,DNA聚合酶)能够拷贝和扩增核酸靶标和/或其他合适的组分,但是靶标关联区域可以包括任何合适的功能。靶标关联区域可以包括任何合适的长度(例如,至少15个碱基的长度;任何合适数量的碱基;等等)。可选地,基于UMI的分子可以不包括靶标关联区域。然而,靶标关联区域(和/或其他合适的分子)可以任何合适的方式配置。
基于UMI的分子(和/或其他合适的分子,诸如本文所述的引物和/或其他分子)可以包括一个或多个接头区域。接头区域优选地与一个或多个核酸靶标(例如,与靶标关联区域相关联的核酸靶标;等等)没有完全互补性(例如,无互补性、部分互补性,等等)。接头区域可以包括任何合适的长度(例如,其中,诸如对于一组基于UMI的引物中的每一基于UMI的引物,接头区域包括少于21个碱基的长度;任何合适数量的碱基的长度;等等)。接头区域优选地位于UMI区域与靶标关联区域之间(例如,将UMI序列区域与靶标关联序列区域分开;等等),但是可以位于任何合适的位置(例如,任何合适的序列位置;等等),诸如其中,对于每一基于UMI的分子(例如,对于一组基于UMI的引物中的每一基于UMI的引物;等等),接头区域位于基于UMI的分子的UMI区域与靶标关联区域之间。在一个具体的实施例中,基于UMI的分子可以包括具有7个碱基长度的接头区域,该接头区域位于靶标关联区域(例如,退火区域)和UMI区域之间,其中基于UMI的分子可以用于获赠来自大肠杆菌(E.coli)基因组的16S片段,其中接头区域的存在可以提高16S扩增的效率(例如,其中,当使用包括8N UMI区域且不包括接头区域的基于UMI的引物时,16S区域的扩增较少;等等)。可选地,基于UMI的分子(和/或其他合适的分子)可以不包括接头区域。然而,接头区域可以以任何合适的方式配置。
基于UMI的分子(和/或其他合适的分子,诸如本文所述的引物和/或其他分子)可以包括一个或多个衔接子区域。衔接子区域优选地包括外部衔接子区域(例如,其中衔接子区域可以包括一个或多个外部衔接子区域;等等),该外部衔接子区域优选地包括用于促进测序文库制备(例如,用于促进NGS文库的构建和测序;等等)的序列区域(例如,序列等),但是外部衔接子区域可以附加或可选地包括用于促进测序的任何合适的组分。外部衔接子区域可以包括任何合适的长度(例如,序列长度;任何合适数量的碱基;等等)和/或任何合适的序列区域(例如,任何合适的碱基组合,等等),其可以基于测序的类型(例如,所使用的测序技术的类型;等等)来确定。可选地,基于UMI的分子(和/或其他合适的分子)可以不包括衔接子区域。然而,衔接子区域可以以任何合适的方式配置。
在一个具体的实施例中,基于UMI的分子(例如,基于UMI的引物)可以包括具有“5′-外部衔接子-唯一分子标识符-接头-DNA靶序列-3′”的配置,但是基于UMI的分子可以包括任何合适的配置。
基于UMI的分子可以包括任何合适的尺寸(例如,任何合适的序列长度,等等),并且可以在方法100的实施方案的多个部分中制备和/或使用任何合适数量和/或类型的基于UMI的分子。
制备基于UMI的分子可以在方法100的实施方案的任何合适的部分之前和/或之后(例如,在制备一组基于测序的引物之前或之后;在生成经标记的靶分子之前或期间;在生成经标记的靶分子之后,以重复生成经标记的靶分子;等等)进行,和/或在任何合适的时间和以任何合适的频率进行。
然而,制备基于UMI的分子可以以任何合适的方式执行。
2.2制备基于测序的引物
方法100的实施方案可以包括制备一组基于测序的引物S120,其可用来制备引物,该引物用于促进生成准备测序(例如,准备NGS)的分子,诸如涉及改进与微生物相关联的测序。
基于测序的引物(和/或本文所述的其他合适的分子)优选地包括一个或多个衔接子区域。基于测序的引物的衔接子区域优选地包括一个或多个测序衔接子区域,其优选地包括促进NGS的序列区域(例如,进行测序的一种或多种NGS技术所需的序列区域;基于所使用的NGS技术类型确定的序列区域;促进NGS技术;等等),但是测序衔接子区域可以以任何合适的方式配置。附加或可选地,任何合适的衔接子区域可以包括测序衔接子区域。基于测序的引物的衔接子区域优选地包括一个或多个外部衔接子区域(例如,与其他衔接子区域的外部衔接子区域,诸如基于UMI的分子的衔接子区域等相同、相似、不同、互补,等等),但是任何合适的衔接子区域可以包括一个或多个外部衔接子区域。基于测序的引物的衔接子区域优选地包括一个或多个索引区域(例如,测序索引区域;等等),所述一个或多个索引区域优选地被配置为促进不同样品(和/或样品的组分,待测序的组分)的多重化、组合标记,和/或与NGS和/或其他测序相关联的其他合适的功能。索引区域优选地包括限定的条码序列(例如,包括至少2个碱基且少于11个碱基的长度;包括任何合适数量的碱基长度;等等),但是可以附加或可选地包括具有任何合适长度的任何合适的组分。在一个具体实施例中,基于测序的引物可以包括具有“5′-测序衔接子-测序索引-外部衔接子-3′”的配置。衔接子区域可以包括与外部衔接子区域分隔开、邻接和/或以其他方式相对定位的测序衔接子区域,但是任何合适的区域可以包括与其他区域相对的任何合适的位置和/或任何合适的位置。附加或可选地,基于测序的引物可以包括任何合适的区域(例如,本文关于引物所描述的,等等)和/或其他合适的组分。然而,基于测序的引物可以任何合适的方式配置。
制备基于测序的引物可以在方法100的实施方案的任何合适的部分之前和/或之后(例如,在制备一组基于UMI的分子之前或之后,在生成经标记的靶分子之前或之后,等等)进行,和/或在任何合适的时间和以任何合适的频率进行。然而,制备一组基于测序的引物可以任何合适的方式执行。
2.3生成经标记的靶分子
方法100的实施方案可以包括基于一组基于UMI的分子,和与一个或多个靶标相关联的一种或多种生物样品(例如,包括该一个或多个靶标的生物样品;缺乏该一个或多个靶标的生物样品;等等),来生成一组经标记的靶分子S130,其可以用来获得经标记的靶标,以促进下游样品处理和/或生物信息学分析,从而用于确定微生物相关的特征。
经标记的靶分子优选地包括经一个或多个基于UMI的分子标记(例如,附接;连接;偶联;等等)的靶标(例如,包括靶标的组分,比如包括靶序列区域的总核酸和/或核酸片段,等等),但是可以附加或可选地包括与一个或多个靶标相关联并经任何合适的分子标记的任何合适的组分。生成一组经标记的靶分子优选地是基于(例如,使用;使用其进行处理;使用其进行扩增过程;等等)一组基于UMI的分子(例如,基于UMI的引物,等等)和一种或多种生物样品(例如,用一组基于UMI的分子和/或一组基于UMI的分子的组分,标记一种或多种生物样品的组分;等等)的,但是可以附加或可选地基于任何合适的组分。
生成一组经标记的靶分子优选地基于(例如,包括;使用其输出;等等)一个或多个扩增过程。扩增过程(例如,与生成一组经标记的靶分子相关联;与方法100的实施方案的任何合适的部分相关联;等等)优选地包括一个或多个PCR过程(例如,固相PCR、RT-PCR、qPCR、多重PCR、降落PCR、纳米PCR、巢式PCR、热启动PCR,等等),但是可以附加或可选地包括以下项中的一种或多种:解旋酶依赖性扩增(HDA)、环介导等温扩增(LAMP)、自我持续序列复制(3SR)、核酸序列依赖性扩增(NASBA)、链置换扩增(SDA)、滚环扩增(RCA)、连接酶链反应(LCR)和/或任何其他合适的扩增过程。在一个具体实施例中,进行PCR过程可以包括使用一组基于UMI的引物(例如,具有包括20nM和2000nM或在20nM与2000nM之间的浓度;具有任何合适的浓度;等等),诸如使用DNA聚合酶(例如,包括0.02单位/uL和0.08单位/uL或在0.02单位/uL与0.08单位/uL之间的DNA聚合酶;具有任何合适的浓度;等等),在热循环仪中进行PCR,对一个或多个DNA靶序列进行扩增。在一个具体实施例中,进行PCR过程可以包括进行2或3个或在其之间的PCR循环(例如,以产生各靶分子的单一拷贝,各靶分子的两侧是UMI区域和外部衔接子区域;利用一种或多种标记促进分子进行PCR过程;等等)。然而,进行任何合适的PCR过程和/或其他扩增过程(例如,涉及生成一组经标记的靶分子;涉及方法100的实施方案的任何合适的部分;等等)可以以任何合适的方式执行。
生成一组经标记的靶分子可以附加或可选地基于(例如,使用;利用其进行处理;利用其进行扩增过程;等等)一种或多种标记促进分子(例如,其可用于提高与标记,诸如基于UMI的分子并入核酸靶标中,有关的效率和/或通用性;其可用于改进扩增过程,诸如改进扩增过程的效率;等等)。标记促进分子可以包括以下项中的任一种或多种:MgCl2、二甲基亚砜(DMSO)、热稳定核酸结合蛋白、甜菜碱、甲酰胺、吐温、Triton、NP-40、四甲基氯化铵(TMAC)、牛血清白蛋白(BSA)、有机和/或无机增强剂元素、化合物、盐、小分子、生物分子,和/或促进标记的任何其他合适的分子。
在一个实施例中,生成一组经标记的靶分子可以包括,利用一组基于UMI的引物、至少一种生物样品和一组标记促进分子来进行第一扩增过程,其中一组标记促进分子包括MgCl2、二甲基亚砜(DMSO)和热稳定核酸结合蛋白中的至少一种。在一个具体实施例中,热稳定核酸结合蛋白可以包括热稳定单链DNA结合蛋白,其中,生成一组经标记的靶分子可以包括利用一组基于UMI的蛋白、至少一种生物样品和一组标记促进分子来进行第一扩增过程,其中一组标记促进分子包括MgCl2和热稳定单链DNA结合蛋白。
在一个实施例中,热稳定核酸结合蛋白可以包括极高热稳定单链DNA结合蛋白(例如,分离自极端嗜热微生物;具有在高温,诸如在扩增过程中观测到的温度下,孵育阈值时间段之后仍保持活性的能力;等等)。
在一个具体实施例中,执行PCR过程可以基于(例如,使用,等等):一组标记促进分子,其包括MgCl2和热稳定核酸结合蛋白(例如,极高热稳定单链DNA结合蛋白);一组基于UMI的引物,其包括5N UMI区域;和,一种或多种生物样品,诸如其中使用一组标记促进分子可以改进基于UMI的引物与一种或多种生物样品的组分的合并。PCR过程可以利用热循环仪(例如,常规热循环仪)和/或用于促进PCR过程的任何其他合适的系统来执行(例如,在其上,与其相关联,等等)。
生成经标记的靶分子(和/或标记任何合适的分子)可以在任何合适的时间和以任何合适的频率来进行(例如,在生成准备测序的经标记的靶分子之前;在生成准备测序的经标记的靶分子期间或之后,诸如在重复的产物生成法中,等等)。
在一变型中,生成一组经标记的靶分子可以包括进行一个或多个片段化过程、连接过程和/或其他合适的过程(例如,除了基于PCR的过程之外或作为基于PCR的过程的替代,等等),以利用基于UMI的分子来标记一个或多个靶标,诸如核酸靶标(和/或,一种或多种生物样品的其他合适的组分等)。在一个实施例中,生成一组经标记的靶分子可以包括:利用一种或多种生物样品,基于酶促过程和机械过程中的至少一种(例如,酶促和/或机械片段化,等等),来生成片段(例如,以生成片段,该片段包括一个或多个核酸靶标,诸如与感兴趣的靶标相对应的靶序列;以从一种或多种生物样品生成片段;等等);和,诸如在扩增靶分子(例如,靶NDA;用于测序文库的构建;等等)之前,对基于UMI的分子和上述片段进行连接过程(例如,利用连接酶进行平末端连接;等等)(例如,将基于UMI的分子连接至片段;等等)。在一个实施例中,生成一组经标记的靶分子可以包括:从至少一种生物样品生成核酸片段;和,将一组基于UMI的分子与该核酸片段连接。在实施例中,进行一个或多个片段化过程和/或连接过程可不加选择地标记所有可用分子(例如,在溶液中),而在实施例中,利用PCR过程(例如,本文所描述,等等)生成一组经标记的靶分子可以促进(例如,对DNA靶序列)UMI标记的特定靶向。用于UMI标记的连接过程可以使用,与在PCR过程中使用的基于UMI的分子的类型相同、相似或不同的基于UMI的分子(例如,以标记生成的片段和/或其他分子;等等),用于生成片段化过程的经标记的靶分子。在一个具体的实施例中,可以连接基于UMI的分子,包括DNA衔接子,包括UMI区域(例如,包括具有“外部衔接子-唯一分子标识符-接头-DNA靶序列”的配置,等等)。附加或可选地,可以在连接过程之前、期间和/或之后,(例如,诸如通过PCR过程,诸如通过使用具有包括“5′-测序衔接子-测序索引-外部衔接子-3′”的配置的引物,添加附加的区域,等等)添加附加的组分(例如,区域,等等)。然而,进行一个或多个片段化过程和/或连接过程,可以以任何合适的方式进行。
在一个变型中,生成一组经标记的靶分子可以包括至少一个PCR过程和至少一个连接过程的组合(例如,连续组合;平行组合;等等)。例如,生成一组经标记的靶分子可以包括利用一组引物(例如,包括一个或多个靶标关联区域、接头区域和/或任何其他合适的组分,等等)进行PCR过程,以提高PCR效率和靶标扩增;和,利用一种或多种基于UMI的分子(例如,包括一个或多个UMI区域、衔接子区域和/或其他合适的组分,等等)进行连接过程,用于将基于UMI的分子添加至PCR过程的产物(例如,扩增的核酸靶标;等等)。在一个实施例中,生成一组经标记的靶分子可以包括:基于至少一种生物样品和一组引物来进行PCR过程,其中该一组引物包括与一组靶标中的至少一个靶标相关联的靶标关联区域;和,将一组基于UMI的分子与PCR过程的产物连接。在一个具体实施例中,利用一种或多种基于UMI的分子进行连接过程可以包括,基于同源性进行一个或多个连接过程,使用对单链DNA进行靶向降解的核酸外切酶、聚合酶、连接酶和/或其他合适的组分。在一个具体的实施例中,基于UMI的分子可以包括寡核苷酸,该寡核苷酸包括衔接子区域(例如,包括外部衔接子)、UMI区域、3′端任何长度的区域和/或促进连接过程的任何其他合适的区域,其中3′端任何长度的区域与至少一个PCR过程生成的一种或多种扩增子的5′端同源。然而,进行至少一个PCR过程和至少一个连接过程的组合可以以任何合适的方式进行。
生成一组经标记的靶分子(和/或方法100的实施方案的合适部分)可以包括进行一个或多个纯化过程(例如,以纯化任何合适的组分;以去除任何合适的组分;等等)。在一个实施例中,生成一组经标记的靶分子可以包括,利用第一扩增过程的产物来进行纯化过程,以从第一扩增过程的产物中去除一组基于UMI的引物中的基于UMI的引物(和/或,去除其他合适的组分,等等)。在实施例中,方法100可以包括对由本文所述的扩增过程(例如,用于生成经标记的靶分子产物池的PCR过程,等等)获得的产物进行纯化过程,诸如对利用第一组基于UMI的引物进行的基于PCR的扩增过程所得到的产物进行纯化。纯化过程可以包括以下项中的任一种或多种:硅基DNA结合微型柱;固相可逆固定(SPRI)磁珠(例如,用于按比例放大和自动化,等等);从生物样品中沉淀核酸(例如,使用基于醇的沉淀方法);基于液-液的纯化技术(例如,苯酚-氯仿萃取);基于层析的纯化技术(例如,柱吸附);涉及使用结合部分结合颗粒(例如,磁珠、浮力珠、具有尺寸分布的珠子、超声响应珠子,等等)的纯化技术,其中该结合部分结合颗粒被配置为结合核酸,并被配置为在洗脱环境存在的情况下(例如,具有洗脱液,提供pH偏移,提供温度变化,等等)释放核酸;和/或,任何合适的纯化过程。在一个具体的实施例中,磁珠可以诸如通过DNA与羧基包覆的珠子的静电相互作用,能够纯化少量的PCR过程的产物。在一个具体的实施例中(例如,作为替代方案,等等),利用磁珠进行纯化过程可以包括,使用1∶1.2至1∶0.6的样品与珠子体积比率(例如,其中小DNA分子与珠子的相互作用是不利的,并且消除尺寸优选为等于和小于100bp的非特异性产物,等等)。在一个具体的实施例中(例如,作为替代方案,等等),利用磁珠进行纯化过程可以包括,使用5至100单位的核酸外切酶I,和/或任何其他单链DNA降解酶,以添加至通过任何合适的PCR过程获得的产物中,以选择性降解基于UMI的分子(例如,DNA引物;没有标记样品分子的基于UMI的分子;等等)和/或其他合适的组分(例如,来自第一PCR)。在一个具体的实施例中,利用磁珠进行纯化过程可以包括,通过添加1至100单位的DpnI限制性内切酶来补充该过程,以降解PCR模板的DNA。在一个具体的实施例中,除了PCR产物净化方法之外或作为PCR产物净化方法的替代,可以使用酶处理和/或其他合适的过程的组合。附加或可选地,纯化过程可以任何合适的方式进行(例如,与方法100的实施方案的任何合适的部分相关,等等)。
然而,生成经标记的靶分子可以任何合适的方式进行。
2.4生成准备测序的经标记的靶分子
方法100的实施方案可以包括基于一组经标记的靶分子和一组基于测序的引物,生成一组准备测序的经标记的靶分子(例如,准备NGS的经标记的靶分子;等等)S140,其可以用于对靶分子(例如,经标记的靶分子)进行处理以准备测序(例如,NGS,等等)。
制备用于测序的分子优选地包括制备用于测序的经标记的靶分子(例如,通过添加一个或多个衔接子区域和/或更多的索引区域,等等),但是可以附加或可选地包括制备用于测序的任何合适的分子。
生成一组准备测序的经标记的靶分子优选地是基于(例如,使用;使用其进行处理;使用其进行扩增过程;等等)一组经标记的靶分子和一组基于测序的引物(例如,用于将基于测序的引物与一组经标记的靶分子合并;用于将基于测序的引物区域添加至一组经标记的靶分子;等等)的,但可以附加或可选地基于任何合适的组分。在一个实施例中,一组基于UMI的引物中的每一基于UMI的引物(例如,用于生成一组经标记的靶分子;等等)可以包括,与NGS相关联的外部衔接子区域;其中,一组经标记的靶分子(例如,使用基于UMI的引物生成;等等)包括外部衔接子区域;并且其中,生成一组准备测序的经标记的靶分子(例如,准备NGS的经标记的靶分子;等等)包括,一组基于测序的引物(例如,包括衔接子区域,其包括外部衔接子区域,诸如互补的外部衔接子区域,等等),在经标记的靶分子的外部衔接子区域处,与经标记的靶分子进行退火。在一个实施例中,方法100可以包括,基于第一扩增过程,生成一组经标记的靶分子,该第一扩增过程包括第一PCR过程;基于第二扩增过程,生成一组准备测序的经标记的靶分子(例如,准备NGS的经标记的靶分子),该第二扩增过程包括第二PCR过程,利用经标记的靶分子和一组基于测序的引物;其中,一组基于测序的引物中的每一基于测序的引物均包括衔接子区域(例如,与测序,诸如NGS相关联,等等),和被配置为促进与NGS相关联的多重化的索引区域;并且其中,生成一组NGS读取的经标记的靶分子包括,基于第二PCR过程,利用经标记的靶分子和一组基于测序的引物,将索引区域和衔接子区域添加至一组经标记的靶分子中的经标记的靶分子。在一个具体的实施例中,对于24~45个之间和/或包括24~45个PCR循环,进行PCR过程(例如,用于生成一组准备测序的经标记的靶分子的第二PCR过程)可以包括,使用0.02~0.08单位/μL之间和/或包括0.02~0.08单位/μL的DNA聚合酶。在一个具体的实施例中,进行PCR过程(例如,第二PCR过程,等等)可以使得能够对由生成一组经标记的靶分子得到的干净的DNA产物(例如,由进行第一PCR过程得到的产物,等等)进行扩增,其可以将核酸靶标(例如,靶分子)的DNA浓度增加至适合测序的水平(例如,NGS;诸如至少1pM)。在一个具体的实施例中,生成一组准备测序的经标记的靶分子可以包括,将一个或多个衔接子区域、索引区域(例如,用于促进多重化,等等)和/或其他合适的区域,添加至经标记的靶分子和/或其他合适的组分。在一个具体的实施例中,生成一组准备测序的经标记的靶分子可以包括,添加来自一组基于测序的引物的区域,包括具有“5′-测序衔接子-测序索引-外部衔接子-3′”的配置。
生成一组准备测序的经标记的靶分子(和/或,方法100的实施方案的合适部分)可以附加或可选地包括进行一个或多个补充扩增过程(例如,其可用于增加经标记的靶分子和/或任何其他合适的组分的浓度,等等)。在一个实施例中,方法100可以包括,诸如基于(例如,使用、利用,等等)退火在测序衔接子区域处的引物,进行补充PCR过程(例如,第三PCR过程,其中生成经标记的靶分子包括进行第一PCR过程,并且其中生成一组准备测序的经标记的靶分子包括进行第二PCR过程;等等),其中测序衔接子区域通过在生成一组准备测序的经标记的靶向分子中所使用的PCR过程(例如,第二PCR过程,等等)添加。在一个具体的实施例中,进行补充PCR过程可以基于满足阈值条件(例如,低于1pM的浓度,等等)的浓度(例如,产物浓度;由生成一组准备测序的经标记的靶分子得到的产物的浓度;来自第二PCR过程的产物;等等)。
然而,生成一组准备测序的经标记的靶分子可以以任何合适的方式进行。
2.5制备组合测序文库
附加或可选地,如图2、图3和图5所示,方法100的实施方案可以包括制备与扩增子关联测序和宏基因组关联测序相关联的组合测序文库S150,其可用于促进与扩增子关联测序和宏基因组关联测序相关联的组合测序技术,其中扩增子关联测序和宏基因组关联测序与微生物相关联。在一个实施例中,方法100的实施方案的多个部分可以包括,基于来源于一组准备测序的靶分子的微生物序列数据集(例如,基于对一组准备测序的靶分子的测序所得),从微生物群落中,识别出特定的微生物(和/或,对微生物组的组成、功能和/或合适的微生物有关方面进行合适的微生物组表征)(例如,确定一个或多个微生物类群的丰度、存在、缺乏,等等)。
组合序列文库优选地包括,与扩增子关联测序(例如,包括扩增子的组分;经处理的扩增子,诸如用于制备以进行测序,诸如经与宏基因组关联组分相关的处理,诸如经平衡与扩增子关联组分与宏基因组组分之间的浓度比率的处理,诸如经标记的扩增子;与扩增子生成和/或处理相关联的输出;等等)和宏基因组关联测序(包括总核酸片段的组分;经处理的片段,诸如用于促进测序,诸如经与扩增子关联组分相关的处理;经标记的片段;总核酸本身;等等)相关联的组分(例如,可测序的组分、靶标、经标记的分子、总核酸的片段、扩增子关联组分、宏基因组关联组分,等等),但是可以附加或可选地包括任何合适的组分。
扩增子优选地包括来自PCR过程的扩增产物(例如,包括一个或多个靶标,诸如核酸靶标的产物),但是可以附加或可选地包括与扩增过程相关联的任何合适的产物。扩增子关联测序优选地包括与单一或少量靶标(例如,基因区域)的分析相关联的测序,用于识别生物样品中的一种或多种微生物类群,但是可以附加或可选地包括与扩增子相关联的任何合适的测序。宏基因组关联测序优选地包括,与微生物群落和/或其他合适的生态群落(例如,存在于一种或多种生物样品中),诸如包括与单一基因扩增子相对的完整DNA群的分析相关联的测序,但是可以附加或可选地包括与微生物群落(例如,涉及与组成相关的分析;与功能相关的分析;等等)、生态群落、微生物群和/或宏基因组有关方面相关联的任何合适的测序。
可以与方法100的实施方案的多个部分以任何合适的关系(例如,时间关系,诸如之前、之后、期间、连续、并行;关于用作输入和/或生成为输出的组分的关系;等等),进行制备组合测序文库的部分。
在变型中,制备一个或多个组合测序文库的部分可以包括,关于标记靶分子S130所描述的任何合适的过程(和/或类似过程),和/或方法100的实施方案的合适部分。
然而,制备组合测序文库可以以任何合适的方式执行。
2.5.A生成靶标关联扩增子
方法100的实施方案(例如,方法100的实施方案的包括制备组合测序文库的部分,等等)可以包括,利用一组扩增子生成引物,和来自与微生物相关联的至少一种生物样品的一组靶标(例如,核酸靶标等),进行扩增过程,来生成一组靶标关联扩增子S152,其可以用于生成促进扩增子关联测序的扩增子。
生成一组靶标关联扩增子优选地基于(例如,包括;使用;利用其进行处理;等等),诸如使用一组扩增子生成引物的PCR过程(例如,方法100的实施方案中,用于制备组合测序文库的三步PCR过程中的第一PCR过程),但是可以附加或可选地基于任何合适的扩增过程。扩增子生成引物优选地包括一个或多个衔接子区域(例如,与靶标关联扩增子相关联的衔接子区域,以用于促进靶向,以在方法100的实施方案的部分的后续过程中促进与后续引物的结合,以促进后续PCR过程,等等)和一个或多个靶标关联区域(例如,用于促进与一个或多个靶标的结合、退火和/或其他合适的偶联,等等)。在一个实施例中,一组扩增子生成引物可以包括:第一子集的扩增子生成引物,第一子集的每一扩增子生成引物均包括第一扩增子关联衔接子区域和第一靶标关联区域,该第一靶标关联区域与一组核酸靶标中的至少一个核酸靶标的正向序列相关联;和,第二子集的扩增子生成引物,第二子集的每一扩增子生成引物均包括第二扩增子关联衔接子区域和第二靶标关联区域,该第二靶标关联区域与一组核酸靶标中的至少一个核酸靶标的反向序列相关联,诸如其中,生成一组靶标关联扩增子包括,利用第一子集的扩增子生成引物和第二子集的扩增子生成引物,基于扩增(例如,PCR过程,等等)来生成一组靶标关联扩增子。在一个具体的实施例中,一组扩增子生成引物可以包括第一引物,该第一引物对应于第一引物类型并包括具有“5′-衔接子A1-DNA靶序列-正向-3′”的配置;包括第二引物,该第二引物与第二引物类型相对应并包括具有“5′-衔接子A2-DNA靶序列-反向-3′的配置;其中,“DNA靶序列”可以包括使得能够对一个或多个核酸靶标(例如,感兴趣的基因片段,等等)进行扩增的任何测序,其中,“衔接子A1”和“衔接子A2”可以包括扩增子关联衔接子区域,其能够在诸如方法100的实施方案的后续部分(例如,后续的PCR过程;诸如关于生成准备测序的靶分子;诸如在生成准备测序的分子中;等等)中结合引物和/或其他合适的分子。在一个具体的实施例中,扩增子生成引物可以包括衔接子区域,该衔接子区域具有外部衔接子区域(例如,用于促进与基于测序的引物,诸如基于测序的引物的衔接子区域退火、结合和/或其他合适的相关联,等等)。然而,扩增子生成引物可以包括任何合适的组分,并且可以任何合适的方式配置。
在一变型中,生成一组靶标关联扩增子可以包括对一个或多个靶标(例如,通过扩增过程,等等)进行标记,诸如利用一个或多个基于UMI的分子(例如,UMI区域和/或基于UMI的分子的其他区域,等等)对一个或多个靶标进行标记。在一个实施例中,一组扩增子生成引物可以包括基于UMI的引物(例如,用于在对应的扩增过程中,等等)。在一个具体的实施例中,一组扩增子生成引物可以包括第一子集的扩增子生成引物和第二子集的扩增子生成引物,其中,第一子集的扩增子生成引物可以包括第一基于UMI的引物,该第一基于UMI的引物中的每一基于UMI的引物均包括第一扩增子关联衔接子区域、第一靶标关联区域和第一UMI区域;其中,第二子集的扩增子生成引物可以包括第二基于UMI的引物,该第二基于UMI的引物中的每一基于UMI的引物均包括第二扩增子关联衔接子区域、第二靶标关联区域和第二UMI区域。然而,对一个或多个靶标(例如,核酸靶标,等等)进行标记,和/或利用与生成靶标关联扩增子相关的基于UMI的分子和/或UMI区域进行任何合适的过程,可以以任何合适的方式进行。
扩增子可以包括任何合适的尺寸(例如,任何合适的序列长度,等等),并且可以通过对任何合适的数量和/或类型的靶标和/或其他合适的组分进行扩增而生成。然而,生成一组靶标关联扩增子可以以任何合适的方式进行。
2.5.B生成宏基因组关联片段
方法100的实施方案(例如,方法100的实施方案的包括制备组合测序文库的部分,等等)可以包括,基于对来自一种或多种生物样品的一组总核酸进行处理,来生成与微生物群落相关联的一组宏基因组关联片段(例如,宏基因组关联核酸片段,等等)S154,其可用于生成促进宏基因组关联测序的片段。
宏基因组关联片段可以包括总核酸的原片段(例如,对一种或多种生物样品的总核酸进行片段化过程的产物,等等),总核酸的经处理的片段(例如,标记有和/或包括一个或多个衔接子区域、基于UMI的分子、任何合适的区域和/或任何合适的组分的片段;预处理的总核酸和/或其他合适的组分的片段;纯化的片段;等等),和/或一种或多种生物样品的总核酸和/或其他合适的组分的任何合适的片段。
宏基因组关联片段优选地与一个或多个微生物群落相关联。微生物群落优选地包括来自多个类群(例如,包括多个界、门、纲、目、科、属、种、亚种、品系和/或任何其他合适的微生物组;等等)的微生物(例如,共享共同的生存空间,诸如使用者的生理区域,诸如使用者的样品采集位点;等等),但是可以可选地仅包括来自单个类群的微生物。附加或可选地,微生物群落可以包括微生物之间的相互作用,微生物之间的相互作用的产物,微生物之间的关系,与微生物和/或微生物群落相关联的功能特征(例如,功能模式,等等),与微生物和/或微生物群落相关联的组成特征(例如,分类学概况,等等),和/或与微生物和/或微生物群落相关联的任何其他合适的组分和/或特征。
生成一组宏基因组关联片段优选地基于对一组总核酸的处理,但是可以附加或可选地是基于对任何合适的组分(例如,核酸片段,靶标诸如核酸靶标,其他合适的成分,等等)的处理。
生成一组宏基因组关联片段(例如,对一组总核酸进行处理)优选地包括利用来自一组总核酸中的总核酸(例如,来自一种或多种生物样品的一组总核酸的全部或子集,等等)进行一个或多个片段化过程(例如,片段化;生成其片段;等等),但是可以附加或可选地包括促进宏基因组关联片段生成的任何合适的过程。进行一个或多个片段化过程(例如,关于生成一组宏基因组关联片段;关于方法100的实施方案的任何合适的部分;等等)可以包括酶促过程(例如,使用转座酶型的酶,用于向切割的核酸,比切割的DNA,的一个或多个末端添加定义的序列,等等),机械过程(例如,对得到的总核酸的DNA片段进行末端修复,以及将基于UMI的分子和/或其他合适的标记分子与修复的DNA末端连接),和/或任何合适类型的片段化过程中的任一种或多种。添加至片段化过程的输出(例如,总核酸的片段)的区域(例如,序列)可以包括衔接子区域(例如,宏基因组关联片段生成衔接子区域;等等),诸如在诸如方法100的实施方案的后续部分(例如,后续的PCR过程;诸如关于生成准备测序的靶分子;等等)中,能够结合引物和/或其他合适的分子的衔接子区域。然而,进行一种或多种片段化过程(例如,一种或多种酶促过程;一种或多种机械过程;等等)和/或添加衔接子区域和/或其他合适的组分(例如,区域,等等)可以以任何合适的方式进行。
在变型中,生成一组宏基因组关联片段可以包括对一个或多个片段(例如,总核酸的片段,等等)和/或与宏基因组关联片段和/或总核酸相关联的其他合适的组分进行标记,诸如利用一个或多个基于UMI的分子和/或其他合适的组分(例如,促进利用基于测序的引物进行后续处理的衔接子区域,诸如用于使基于测序的引物退火的衔接子区域,等等)进行标记。在一个实施例中,生成一组宏基因组关联片段可以包括,基于利用酶促过程和机械过程中的至少一种对一组总核酸进行处理,来生成片段;和,基于将基于UMI的分子与该片段连接,来生成一组宏基因组关联片段。在一个实施例中,生成一组宏基因组关联片段可以包括进行扩增过程(例如,PCR过程),以向片段(例如,总核酸的片段,等等)添加衔接子区域(例如,外部衔接子区域、宏基因组关联衔接子区域,等等)、UMI区域和/或任何其他合适的组分。然而,对一个或多个片段进行标记可以以任何合适的方式(例如,通过扩增过程,诸如PCR过程;等等)进行。
生成一组宏基因组关联片段可以附加或可选地包括对一组总核酸进行预处理(例如,在进行一个或多个片段化过程之前;反复地进行片段化过程;等等)。预处理(例如,一组总核酸;任何合适的组分)可以包括以下项中的任一种或多种:转化核酸(例如,将mRNA转化为cDNA),执行靶标捕获过程(例如,富集过程、排除过程,等等),进行纯化过程,补充的扩增过程,和/或进行任何合适的预处理过程。在一个实施例中,生成一组宏基因组关联片段可以包括对一组总核酸(例如,在片段化之前,等等)进行预处理,其中,对一组总核酸进行预处理包括以下项中的至少一种:将来自一组总核酸的mRNA转化为cDNA;进行第一靶标捕获过程,以选择性地富集第一序列,该第一序列对应于一组总核酸中的第一核酸;和,进行第二靶标捕获过程,以选择性地排除(例如,消耗,等等)第二序列,该第二序列对应于一组总核酸中的第二核酸。转化核酸可用于促进对靶基因和/或其他靶标(例如,一种或多种生物样品中的核酸靶标)的表达进行检测,和/或检测病毒(例如,具有基于RNA的基因组的病毒,等等)的存在和/或其他合适的特征。在一个实施例中,预处理可以包括,在片段化之前,通过逆转录酶PCR(RT-PCR)(例如,其中,RT-PCR可以使用随机引物来进行,以逆转录样品中的所有或基本上所有的mRNA;或者,使用靶向感兴趣的mRNA的引物;等等)和/或其他合适的转化过程,将总核酸中的mRNA转化为cDNA,诸如促进片段化过程且包括在组合测序文库中。进行靶标捕获过程可以包括富集或排除与靶序列相对应的核酸,和/或富集或排除(例如,消耗)合适类型的靶标(例如,在片段化过程之前,等等),诸如其中,靶标捕获过程可以包括基于寡核苷酸的过程(例如,使用固定或附着于珠子系统的寡核苷酸,其中寡核苷酸可以与靶核酸,诸如靶DNA片段中的序列杂交,等等)。然而,对一组总核酸进行预处理可以,作为使总核酸和/或其他合适的组分片段化的增加部分和/或替代进行,作为方法100的实施方案中的生成一组宏基因组关联片段的任何合适的部分的增加部分和/或替代进行,和/或以任何合适方式进行。
然而,生成宏基因组关联片段可以以任何合适的方式进行。
2.5.C生成准备测序的靶分子
方法100的实施方案(例如,方法100的实施方案的包括制备组合测序文库的部分,等等)可以包括,基于一组靶标关联扩增子、一组宏基因组关联片段(例如,宏基因组关联核酸片段,等等)和一组基于测序的引物,来生成一组准备测序(例如,准备NGS)的靶分子(例如,与一个或多个靶标,诸如核酸靶标相关联,等等)S158,其可以用于对一个或多个靶标关联扩增子和/或宏基因组关联片段,和/或其他合适的混合物(例如,扩增子关联组分和宏基因组关联组分的混合物,等等)进行处理,以为测序(例如,NGS;包括同时进行扩增子关联测序和宏基因组关联测序的测序;等等)作准备。
准备测序的靶分子优选地与一个或多个靶标(例如,与扩增子相关联)和微生物群落(例如,与宏基因组关联片段相关联;其中,靶标包括总核酸;其中,靶标与多个类群的微生物相关联;等等)相关联,但是可以附加或可选地与以下项相关联:一个或多个独立于微生物群落的靶标;独立于一个或多个靶标的微生物群落;和/或,感兴趣的任何其他合适的靶标。生成准备测序的靶分子优选地基于(例如,包括)利用一组靶标关联扩增子、一组宏基因组关联片段和一组基于测序的引物,进行扩增过程(例如,包括第二PCR过程的第二扩增过程,其中,生成靶标关联扩增子可以包括具有第一PCR过程的第一扩增过程;等等)。PCR过程优选地包括有限的循环(例如,小于阈值,等等),但是可以包括任何合适数量的循环,等等。进行扩增过程优选地包括将一个或多个衔接子区域和/或一个或多个索引区域(例如,通过扩增过程),添加至诸如包括靶标关联扩增子和/或宏基因组关联片段的组分(例如,混合物),但是衔接子区域、索引区域和/或其他合适的区域可以以任何合适的方式(例如,连接过程,等等)添加。在一个实施例中,基于测序的引物可以包括被配置为促进与测序(例如,NGS,等等)相关联的多重化的索引区域(例如,包括测序索引区域,等等),与测序(例如,NGS,等等)相关联的衔接子区域,和一个或多个引物和/或衔接子区域(例如,用于生成靶标关联扩增子的引物,诸如引物的衔接子区域;靶标关联扩增子的衔接子区域;宏基因组关联片段的衔接子区域;其中,基于测序的引物可以包括与靶标关联扩增子的衔接子区域和/或宏基因组关联片段的衔接子区域,互补、退火和/或以其他方式相关联的衔接子区域;和/或,其他合适的组分;等等)。在一个具体的实施例中,基于测序的引物可以包括具有“5′-测序衔接子-测序索引-外部衔接子-3′”的配置。在一变型中,基于测序的引物可以包括,被配置为与靶标关联扩增子和/或宏基因组关联片段的衔接子区域(例如,扩增子关联衔接子区域;宏基因组关联衔接子区域;扩增子生成衔接子区域;宏基因组关联片段生成衔接子区域;等等)退火的区域(例如,衔接子区域,等等),和/或其他合适的组分(例如,包括在含靶标关联扩增子和宏基因组关联片段的混合物中,等等)。在一个实施例中,基于测序的引物可以包括,被配置为与扩增子生成衔接子区域和/或其他合适的衔接子区域(例如,宏基因组关联片段的宏基因组关联衔接子区域,等等)退火的区域。附加或可选地,与S158相关联的基于测序的引物,可以与S140相关联的基于测序的引物相同、相似或不同。然而,基于测序的引物可以以任何合适的方式配置,并且进行与生成准备测序的靶分子有关的扩增过程(例如,PCR过程)可以以任何合适的方式进行。
在变型中,生成准备测序的靶分子可以包括进行一个或多个预处理过程和/或后处理过程。在一个实施例中,生成准备测序的靶分子可以包括:利用靶标关联扩增子、宏基因组关联片段和一组基于测序的引物,来进行PCR过程;和,利用PCR过程的产物,进行清洗、大小选择、进行补充的扩增过程、纯化、富集、排除和/或进行任何合适的过程(例如,用于制备适合于任何合适的测序技术的准备测序的靶分子;等等)。
在变型中,基于靶标关联扩增子、宏基因组关联片段和/或基于测序的引物来生成一组准备测序的靶分子,可以包括关于(例如,基于经标记的靶分子和/或基于测序的引物;等等)生成准备测序的经标记的靶分子S140中所描述的任何合适的过程(和/或类似过程)。然而,生成准备测序的靶分子可以以任何合适的方式执行。
3.实施例
在一个实施例中,可以进行方法100的实施方案的多个部分,以生成靶向细菌16S核糖体基因的测序文库。生成测序文库可以包括使用DNA模板,该DNA模板包括可以两个细菌DNA池的定义的混合物,其可以反比例混合(例如,如图6中所示)。在对比分配给池中各成员的测序读取序列的数量时,可以看出,在各种条件下和对检测的每一有机体,对于排除UMI的引物(例如,不具有UMI区域的引物,等等)和基于UMI的引物,可以获得相当数量的读取序列。
在一个实施例中,包括4N UMI区域或8N UMI区域的基于UMI的引物可以用于生成测序文库,诸如其中,对于特定的应用(例如,如图7所示),当“N”碱基的数量从4N增加到8N(和/或一般地增加)时,所分配的测序读取序列的数量可以减少,诸如其中标记效率可以与“N”碱基的数量具有逆相关。在实施例中,可以添加标记促进分子,以提高标记效率(例如,与生成经标记的靶分子的PCR过程相关联的效率;等等)。在如图8所示的具体实施例中,向使用基于UMI的引物(包括8N UMI区域)的PCR过程,添加一组标记促进分子,包括MgCl2、DMSO和/或极高热稳定的极高热稳定性单链DNA结合蛋白,可以提高扩增和/或标记效率(例如,其中,如图8所示,如通过琼脂糖凝胶电泳所分析的,对于一系列的DNA输入,可以改进使用大肠杆菌E.coli基因组DNA的单一DNA模板,对16S基因的扩增;等等)。在一个具体的实施例中,如图9A至图9B所示,为使用基于UMI的引物(包括4N UMI区域或8N UMI区域)进行的PCR过程,添加标记促进分子可以提高标记效率(例如,较大数量的不同的UMI标记,等等)。在一个具体的实施例中,如图10A至图10B所示,为使用基于UMI的引物(包括4N UMI区域或5N UMI区域)进行的PCR过程(例如,如图10A至图10B所示),添加标记促进分子可以得到增加数量的读取序列(例如,用于微生物群落标准样品,等等),诸如其中,在一个具体实施例(例如,如图11A至图11B所示)中,30%的靶序列可以显示出唯一UMI。然而,添加标记促进分子可以赋予任何合适的改进程度。
在一个实施例中,使用包括一个或多个接头区域(例如,将UMI区域与靶标关联区域分隔开)的基于UMI的分子,可以提高利用引物进行扩增的效率(例如,其中,使用较大“N”长度的UMI区域,等等)。在一个具体的实施例中,如图12所示,可以通过使用基于UMI的引物,其包括将UMI区域与靶标关联区域分隔开的7碱基长度的接头区域,来改进对16S区域的扩增。
在一个实施例中,方法100的实施方案的多个部分可以包括从人粪便生物样品制备组合测序文库,但是可以附加或可选地从任何合适的生物样品(例如,从任何合适的使用者;从任何合适的采集位点;等等)制备组合序列文库。在具体实施例中,可以从单一使用者的粪便样品构建组合序列文库;来自对样品进行多次(例如,数百次,等等)测序运行的细菌类群分析,可以显示出在统计学上显著的可重现的多样性(例如,指示稳健性和一致性;等等)。在一个具体的实施例中,组合测序文库可以导致下述结果,该结果表明,包括了在组合测序文库的扩增子关联组分中所示的所有物种(和/或其他合适的类群),较高地表示出在使用仅以扩增子为中心的方法时表示不足的细菌类群(例如,软壁菌门TenericutesphVlum,等等)。在具体实施例中,通过使用扩增子关联过程来识别给定微生物的存在或缺乏(例如,包括和/或基于16S区域、18S区域、ITS,等等),和通过使用宏基因组关联过程来识别感兴趣的核酸靶标(例如,抗生素抗性基因、毒力因子、分泌系统,等等)和/或其他合适的靶标,与制备组合测序文库相关联的过程可以用于识别不同的有机体和感兴趣的特定核酸靶标。
在实施例中,方法100和/或系统200可以赋予优于常规方法的改进。方法100和/或系统200的具体实施例可以至少为与常规方法相关联的挑战,赋予源于技术上的解决方案。在实施例中,该技术可以将实体(例如,生物样品,靶标如核酸靶标,引物,基于UMI的分子,使用者,等等)转化为不同的状态或事物。在一具体实施例中,核酸靶标可以转化为准备测序的靶分子和/或准备测序的经标记的靶分子,其诸如适用于改进的测序(例如,与减少偏差、改进分析,如改进量化相关联的测序,等等)。在一具体实施例中,可以制备改进的测序文库,得到对微生物组的改进的表征,诸如用于促进与一种或多种微生物关联状况相关联的改进的诊断和/或治疗,从而改变一个或多个使用者。然而,在实施例中,该技术可以以任何合适的方式转化实体。
在实施例中,该技术可以至少改进测序文库制备、样品处理、基因组学、分子生物学、微生物学、诊断学、治疗学、数字医学、建模的技术领域,和/或其他合适的技术领域。然而,在具体实施例中,该技术可以诸如通过进行方法100和/或系统200的实施方案的多个部分,来提供任何其他合适的改进。
方法100和/或系统200的实施方案可以包括,多种系统组分和多种方法过程的各种组合和排列方式,包括任何变体(例如,实施方案、变型、实施例、具体实施例、附图,等等),其中,本文中所描述的方法100和/或过程的实施方案的多个部分可以通过和/或使用本文所述的系统200和/或其他实体的一个或多个实例、要素、组分和/或其他方面,不同时(例如,顺序地)、同时(例如,并行地)或以任何其他合适的顺序进行。
本文所述的任何变体(例如,实施方案、变型、实施例、具体实施例、附图,等等)和/或本文所述的变体的任何部分,可以附加或可选地组合、聚合、排除、使用、顺序进行、并行执行,和/或以其他方式应用。
方法100和/或系统200的实施方案的多个部分可以至少部分地作为机器来实施和/或实现,该机器被配置为接收存储计算机可读指令的计算机可读介质。指令可以由可以与系统集成的计算机可执行组件来执行。计算机可读介质可以存储在任何合适的计算机可读介质上,这些计算机可读介质比如为RAM、ROM、闪存、EEPROM、光学设备(CD或DVD)、硬盘驱动器、软盘驱动器或任何合适的设备。计算机可执行组件可以是通用处理器或专用处理器,但是任何合适的专用硬件或硬件/固件组合设备可以可选或附加地执行指令。
如本领域技术人员将从先前的详细描述,和从附图和权利要求中认识到的,在不背离权利要求书所限定的范围的情况下,可以对方法100、系统200和/或变体的实施方案进行修改和改变。

Claims (22)

1.一种用于下一代测序(NGS)的文库制备的方法,所述方法包括:
制备一组基于唯一分子标识符(UMI)的引物,所述一组基于UMI的引物与一组核酸靶标相关联,其中,所述一组基于UMI的引物中的每一基于UMI的引物均包括:
UMI区域,包括一组随机“N”碱基,其中,每一随机“N”碱基均选自“A”碱基、“G”碱基、“T”碱基和“C”碱基中的任一种,和
靶标关联区域,与所述一组核酸靶标中的至少一个核酸靶标相关联;
制备一组基于测序的引物,其中,所述一组基于测序的引物中的每一基于测序的引物均包括与NGS相关联的衔接子区域;
利用所述一组基于UMI的引物,和与所述一组核酸靶标相关联的至少一种样品,进行第一扩增过程,生成一组经标记的靶分子;和
利用所述经标记的靶分子和所述一组基于测序的引物,进行第二扩增过程,生成一组准备NGS的经标记的靶分子。
2.根据权利要求1所述的方法,其中,所述一组基于UMI的引物中的每一基于UMI的引物还包括接头区域,所述接头区域不与和所述靶标关联区域相关联的至少一个核酸靶标完全互补。
3.根据权利要求2所述的方法,其中,所述接头区域包括少于21个碱基的长度。
4.根据权利要求2所述的方法,其中,对于所述一组基于UMI的引物中的每一基于UMI的引物,所述接头区域位于所述UMI区域与所述靶标关联区域之间。
5.根据权利要求2所述的方法,
其中,所述一组基于UMI的引物中的每一基于UMI的引物还包括与所述NGS相关联的外部衔接子区域,
其中,所述一组经标记的靶分子包括所述外部衔接子区域,和
其中,生成所述一组准备NGS的经标记的靶分子包括,所述一组基于测序的引物,在所述经标记的靶分子的外部衔接子区域处,与所述经标记的靶分子退火。
6.根据权利要求1所述的方法,其中,生成所述一组经标记的靶分子包括,利用所述一组基于UMI的引物、至少一种生物样品和一组标记促进分子来进行所述第一扩增过程,其中所述一组标记促进分子包括MgCl2、二甲基亚砜(DMSO)、热稳定核酸结合蛋白、甜菜碱、甲酰胺、吐温、Triton、NP-40、四甲基氯化铵(TMAC)和牛血清白蛋白(BSA)中的至少一种。
7.根据权利要求6所述的方法,其中,所述热稳定核酸结合蛋白包括热稳定单链DNA结合蛋白,并且
其中,生成所述一组经标记的靶分子包括,利用所述一组基于UMI的蛋白、至少一种样品和所述一组标记促进分子来进行所述第一扩增过程,所述一组标记促进分子包括MgCl2和所述热稳定单链DNA结合蛋白。
8.根据权利要求1的方法,其中,生成所述一组经标记的靶分子包括,利用所述第一扩增过程的产物来进行纯化过程,以从所述第一扩增过程的产物中去除所述一组基于UMI的引物中的基于UMI的引物。
9.根据权利要求1所述的方法,
其中,所述第一扩增过程包括第一聚合酶链反应(PCR)过程,
其中,所述第二扩增过程包括第二PCR过程,
其中,所述一组基于测序的引物中的每一基于测序的引物还包括索引区域,所述索引区域被配置为促进与NGS相关联的多重化;和
其中,生成所述一组准备NGS的经标记的靶分子包括,利用所述经标记的靶分子和所述一组基于测序的引物,基于所述第二PCR过程,将所述索引区域和所述衔接子区域添加至所述一组经标记的靶分子中的经标记的靶分子。
10.一种用于下一代测序(NGS)测序的文库制备的方法,所述方法包括:
利用一组扩增子生成引物和来自至少一种样品的一组核酸靶标,基于第一扩增过程,生成一组靶标关联扩增子;
基于对来自所述至少一种样品的一组总核酸进行处理,生成一组宏基因组关联片段;
基于所述一组靶标关联扩增子、所述一组宏基因组关联片段和一组基于测序的引物,生成一组准备测序的靶分子,其中,所述一组准备测序的靶分子与所述一组核酸靶标相关联。
11.根据权利要求10所述的方法,其中,所述一组扩增子生成引物包括:
第一子集的扩增子生成引物,所述第一子集的每一扩增子生成引物均包括:第一扩增子关联衔接子区域,和,与所述一组核酸靶标中的至少一个核酸靶标的正向序列相关联的第一靶标关联区域;和
第二子集的扩增子生成引物,所述第二子集的每一扩增子生成引物均包括:第二扩增子关联衔接子区域,和,与所述一组核酸靶标中的至少一个核酸靶标的反向序列相关联的第二靶标关联区域,
其中,生成所述一组靶标关联扩增子包括,基于利用所述第一子集的扩增子生成引物和所述第二子集的扩增子生成引物进行的扩增,生成所述一组靶标关联扩增子。
12.根据权利要求11所述的方法,
其中,所述第一子集的扩增子生成引物包括第一基于唯一分子标识符(UMI)的引物,所述第一基于UMI的引物中的每一基于UMI的引物均包括所述第一扩增子关联衔接子区域、所述第一靶标关联区域和第一UMI区域;
其中,所述第二子集的扩增子生成引物包括第二基于UMI的引物,所述第二基于UMI的引物中的每一基于UMI的引物均包括所述第二扩增子关联衔接子区域、所述第二靶标关联区域和第二UMI区域。
13.根据权利要求11所述的方法,其中,生成所述一组宏基因组关联片段包括,基于连接过程和扩增过程中的至少一种,生成所述一组宏基因组关联片段,所述一组宏基因组关联片段包括添加的衔接子。
14.根据权利要求13的方法,其中,所述一组基于测序的引物包括:
宏基因组关联衔接子区域,与所述NGS和所述一组宏基因组关联片段的添加的衔接子相关联。
15.根据权利要求14所述的方法,其中,所述一组基于测序的引物各自包括:
索引区域,所述索引区域被配置为促进与所述NGS相关联的多重化;和
衔接子区域,所述衔接子区域与所述NGS、所述一组靶标关联扩增子和所述一组宏基因组关联片段相关联。
16.根据权利要求15所述的方法,其中,所述一组基于测序的引物的衔接子区域与以下项相关联:所述NGS,所述一组宏基因组关联片段的添加的衔接子,所述第一子集的扩增子生成引物的第一扩增子关联衔接子区域,和所述第二子集的扩增子生成引物的第二扩增子关联衔接子区域。
17.根据权利要求10所述的方法,其中,生成所述一组宏基因组关联片段包括:
基于利用酶促过程和机械过程中的至少一种,对所述一组总核酸进行处理,来生成片段;和
基于将基于唯一分子标识符(UMI)的分子与所述片段连接,来生成所述一组宏基因组关联片段。
18.根据权利要求10所述的方法,其中,生成所述一组宏基因组关联片段包括,在片段化之前,对所述一组总核酸进行预处理,其中,对所述一组总核酸进行预处理包括以下项中的至少一项:
将来自所述一组总核酸的mRNA转化为cDNA,
进行第一靶标捕获过程,以选择性地富集第一序列,其中所述第一序列对应于所述一组总核酸中的第一核酸,和
进行第二靶标捕获过程,以选择性地排除第二序列,其中所述第二序列对应于所述一组总核酸中的第二核酸。
19.根据权利要求10所述的方法,进一步包括,基于微生物序列数据集,从微生物群落中识别特定的微生物,其中所述微生物序列数据集来源于所述一组准备测序的靶分子。
20.一种用于与微生物相关联的测序的文库制备的方法,所述方法包括:
制备与一组核酸靶标相关联的一组基于唯一分子标识符(UMI)的分子,其中,所述一组基于UMI的分子中的每一基于UMI的分子均包括UMI区域,所述UMI区域包括一组随机“N”碱基,其中,每一随机“N”碱基均选自“A”碱基、“G”碱基、“T”碱基和“C”碱基中的任一种;
制备一组基于测序的引物,其中,所述一组基于测序的引物中的每一基于测序的引物均被配置为促进测序;
基于所述一组基于UMI的分子,和与所述一组核酸靶标相关联的至少一种样品,生成一组经标记的靶分子;和
利用所述一组经标记的靶分子和所述一组基于测序的引物,进行扩增过程,生成一组准备测序的经标记的靶分子。
21.根据权利要求20所述的方法,其中,生成所述一组经标记的靶分子包括:
基于所述至少一种样品和一组引物,来进行聚合酶链反应(PCR)过程,其中该一组引物包括,与所述一组核酸靶标中的至少一个核酸靶标相关联的靶标关联区域;和
将所述一组基于UMI的分子与所述PCR过程的产物连接。
22.根据权利要求20所述的方法,其中,生成所述一组经标记的靶分子包括:
从所述至少一种样品,生成核酸片段;和
将所述一组基于UMI的分子与所述核酸片段连接。
CN201880054130.XA 2017-06-20 2018-06-20 利用唯一分子标识符的文库制备的方法和系统 Pending CN111201323A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762522293P 2017-06-20 2017-06-20
US62/522,293 2017-06-20
US201762582162P 2017-11-06 2017-11-06
US62/582,162 2017-11-06
PCT/US2018/038628 WO2018237092A1 (en) 2017-06-20 2018-06-20 METHOD AND SYSTEM FOR LIBRARY PREPARATION WITH UNIQUE MOLECULAR IDENTIFIERS

Publications (1)

Publication Number Publication Date
CN111201323A true CN111201323A (zh) 2020-05-26

Family

ID=62904596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880054130.XA Pending CN111201323A (zh) 2017-06-20 2018-06-20 利用唯一分子标识符的文库制备的方法和系统

Country Status (7)

Country Link
US (2) US20200123539A1 (zh)
EP (1) EP3642357A1 (zh)
JP (1) JP2020528740A (zh)
CN (1) CN111201323A (zh)
AU (1) AU2018288849A1 (zh)
SG (1) SG11201912798VA (zh)
WO (1) WO2018237092A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112176032A (zh) * 2020-10-16 2021-01-05 广州市达瑞生物技术股份有限公司 一个呼吸道病原体的纳米孔测序建库的引物组合及其应用
CN113621609A (zh) * 2021-09-15 2021-11-09 深圳泛因医学有限公司 文库构建引物组及其在高通量检测中的应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022548000A (ja) * 2019-09-11 2022-11-16 パランカ・リミテッド シーケンシングライブラリーの多重製造方法
CN115349128A (zh) 2020-02-13 2022-11-15 齐默尔根公司 宏基因组文库和天然产物发现平台
WO2022125939A1 (en) * 2020-12-10 2022-06-16 The United States Government Methods for detecting homogenous targets in a population with next generation sequencing
CN112687339B (zh) * 2021-01-21 2021-12-14 深圳吉因加医学检验实验室 一种统计血浆dna片段测序数据中序列错误的方法和装置
WO2023154746A2 (en) * 2022-02-11 2023-08-17 The Broad Institute, Inc. Compositions and methods for characterizing low frequency mutations

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013173394A2 (en) * 2012-05-14 2013-11-21 Cb Biotechnologies, Inc. Method for increasing accuracy in quantitative detection of polynucleotides
WO2016118719A1 (en) * 2015-01-23 2016-07-28 Qiagen Sciences, Llc High multiplex pcr with molecular barcoding

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009036525A2 (en) * 2007-09-21 2009-03-26 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
BR112013033462A2 (pt) * 2011-06-27 2017-03-01 Univ Florida método para a redução de complexidade do genoma e detecção de polimorfismo
EP2825675B1 (en) * 2012-03-13 2017-12-27 Patel, Abhijit Ajit Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
CA2941917C (en) * 2013-03-14 2021-05-18 University Of Ottawa Methods for the diagnosis and treatment of inflammatory bowel disease
CN108026524A (zh) * 2015-09-11 2018-05-11 赛卢拉研究公司 用于核酸文库标准化的方法和组合物

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013173394A2 (en) * 2012-05-14 2013-11-21 Cb Biotechnologies, Inc. Method for increasing accuracy in quantitative detection of polynucleotides
WO2016118719A1 (en) * 2015-01-23 2016-07-28 Qiagen Sciences, Llc High multiplex pcr with molecular barcoding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112176032A (zh) * 2020-10-16 2021-01-05 广州市达瑞生物技术股份有限公司 一个呼吸道病原体的纳米孔测序建库的引物组合及其应用
CN112176032B (zh) * 2020-10-16 2021-10-26 广州市达瑞生物技术股份有限公司 一个呼吸道病原体的纳米孔测序建库的引物组合及其应用
CN113621609A (zh) * 2021-09-15 2021-11-09 深圳泛因医学有限公司 文库构建引物组及其在高通量检测中的应用

Also Published As

Publication number Publication date
US20180362967A1 (en) 2018-12-20
US20200123539A1 (en) 2020-04-23
EP3642357A1 (en) 2020-04-29
KR20200059208A (ko) 2020-05-28
SG11201912798VA (en) 2020-01-30
AU2018288849A1 (en) 2020-02-06
WO2018237092A1 (en) 2018-12-27
JP2020528740A (ja) 2020-10-01

Similar Documents

Publication Publication Date Title
CN111201323A (zh) 利用唯一分子标识符的文库制备的方法和系统
CN111315884B (zh) 测序文库的归一化
CN111032881B (zh) 核酸的精确和大规模平行定量
JP2020513856A (ja) 大腸癌の複合バイオマーカーを特定するための配列ベースの糞便微生物群調査データの活用
US20210403991A1 (en) Sequencing Process
EP3378948B1 (en) Method for quantifying target nucleic acid and kit therefor
US20230183818A1 (en) Antibiotic susceptibility of microorganisms and related markers, compositions, methods and systems
JP7208230B2 (ja) 核酸配列を特性決定するための単一分子シーケンシング及び固有の分子識別子
JP6588536B2 (ja) 異なる種属の微生物間の種類と存在比を比較するための人工外来性参照分子
JP2016197331A (ja) 微生物叢解析システム、判定システム、微生物叢解析方法及び判定方法
KR102683229B1 (ko) 고유 분자 식별자를 갖는 라이브러리 제조 방법 및 시스템
CN109385468B (zh) 检测链特异性效率的成套试剂与方法
CN115992267B (zh) 一种高通量高精度检出多种病原菌的引物组、试剂盒及方法
Ogundolie et al. Microbiome characterization and identification: key emphasis on molecular approaches
CN114736970A (zh) 一种鉴别不同人群的方法
Bustin Tenth annual nucleic acid-based technologies: time to stop and think
CN113227396A (zh) 用于定量生物靶的稀释标签

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200526

WD01 Invention patent application deemed withdrawn after publication