CN112888794A - 用于处理或分析多物种核酸样品的组合物、方法和系统 - Google Patents

用于处理或分析多物种核酸样品的组合物、方法和系统 Download PDF

Info

Publication number
CN112888794A
CN112888794A CN201980050741.1A CN201980050741A CN112888794A CN 112888794 A CN112888794 A CN 112888794A CN 201980050741 A CN201980050741 A CN 201980050741A CN 112888794 A CN112888794 A CN 112888794A
Authority
CN
China
Prior art keywords
nucleic acid
acid molecules
human
biological sample
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980050741.1A
Other languages
English (en)
Inventor
约翰·韦斯特
理查德·陈
克里斯蒂安·豪登斯奇德
盖博·巴尔萨
骆淑君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pansennaris Co ltd
Original Assignee
Pansennaris Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pansennaris Co ltd filed Critical Pansennaris Co ltd
Publication of CN112888794A publication Critical patent/CN112888794A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/708Specific hybridization probes for papilloma
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/159Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/501Detection characterised by immobilisation to a surface being an array of oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Virology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本文提供用于样品处理和/或数据分析的组合物、方法和系统。样品处理可包括核酸样品处理和后续的测序。本公开内容的方法和系统可用于例如分析来自人类、非人类及其组合的核酸样品。

Description

用于处理或分析多物种核酸样品的组合物、方法和系统
交叉引用
本申请要求于2018年8月7日提交的美国专利申请第16/056,982号和于2018年5月31日提交的美国临时专利申请第62/678,475号的优先权,其全部内容通过引用合并于本文中。
背景技术
用于全基因组和/或外显子组测序的当前方法可能是昂贵的并且不能捕获许多生物医学上重要的变体。例如,市售的外显子组富集试剂盒(例如,Illumina的TruSeq外显子组富集和Agilent的SureSelect外显子组富集)可能无法靶向生物医学感兴趣的非外显子组(non-exomic)区域和外显子组区域。通常,使用标准测序方法进行的全基因组和/或外显子组测序在具有非常高的CG含量(>70%)的内容区域中执行不佳。此外,全基因组和/或外显子组测序也不能提供基因组中重复元件的充分和/或有成本效益的测序。
本文公开的方法提供了专门的测序方案或技术来解决这些问题,并将分析扩展到单个样本中的人类和非人类基因组。
发明内容
本文公开了一种用于处理从受试者获得的生物样品的方法,包括(a)使用核酸探针池从该生物样品中产生核酸分子的亚组(subset),其中所述探针包括(i)被配置为靶向人类基因组的元件的第一多个核酸探针和(ii)被配置为靶向一种或多种非人类基因组的元件的第二多个核酸探针;以及(b)对所述核酸分子的亚组进行测定以产生包括以下序列的序列信息:(i)来自所述受试者的生物样品的人类核酸和(ii)来自所述受试者的生物样品的非人类核酸。在一些情况下,(i)的第一多个核酸探针被配置为靶向源自人类基因组的元件。在一些情况下,受试者可以是人类。在一些情况下,第二多个核酸探针被配置为靶向来自一种或多种物种的非人类基因组序列中的元件,所述一种或多种物种选自病毒、细菌、细菌噬菌体、真菌、原生生物、古细菌、变形虫、蠕虫、藻类、遗传修饰的细胞和遗传修饰的载体。一方面,从生物样品产生核酸分子的亚组包括进行一个或多个杂交反应。在一些情况下,方法还包括从受试者获得生物样品。在一些情况下,受试者的生物样品可以来源于肿瘤活检、全血或血浆。在一些方面,方法还包括将核酸分子的亚组的序列与一种或多种参考序列进行比对(align)。在一些情况下,一种或多种参考序列包括多个参考序列。在一些情况下,多个参考序列对应于两种或更多种不同的物种。方法还可以包括基于比对来鉴定(identify)亚组中核酸分子的来源。在一些情况下,方法还可以包括产生包括鉴定生物样品中的核酸分子来源的输出。在一些情况下,在核酸探针池中,第二多个核酸探针的浓度大于第一多个核酸探针的浓度。一方面,在探针池中的第二多个核酸探针的相对浓度大于在核酸探针池中的第一多个核酸探针的相对浓度。一方面,第一多个核酸探针包括人外显子组捕获探针组。在一些情况下,第一多个核酸探针包括被配置成靶向由人V(D)J重排或重组产生的连接序列的探针。在一些情况下,第二多个核酸探针包括一种或多种被配置为靶向人乳头瘤病毒E6基因和/或E7基因的探针。在一些情况下,第二多个核酸探针包括被配置为靶向细菌16S核糖体RNA基因的一种或多种元件的探针。一方面,(b)的测定包括进行测序以产生长度为130个碱基至280个碱基的双端读段序列(paired-end read sequence)。一方面,方法还可以包括产生一份或多份生物医学报告,该一份或多份报告包含选自以下的一组或多组数据:(i)候选肿瘤新抗原,(ii)检测到的非人类物种,(iii)检测到的CDR3序列及其任何组合。一方面,检测到的非人类物种是抗原。在一些情况下,CDR3序列是通过V(D)J重排或重组产生的。在一些情况下,CDR3序列对应于对抗原的免疫应答。在一些情况下,一份或多份生物医学报告包括(i)-(iii)。
本文公开了一种用于处理从受试者获得的生物样品的方法,所述方法包括(a)从所述生物样品中产生核酸分子的亚组,其中所述核酸分子的亚组包括(i)来自受试者的第一多个核酸分子和(ii)不是来自所述受试者的第二多个核酸分子,并且其中所述生物样品中的所述第一多个核酸分子的丰度大于所述第二多个核酸分子的丰度;(b)对所述核酸分子的亚组进行测定以产生包括以下序列的序列信息:(i)所述第一多个核酸分子和(ii)所述第二多个核酸分子。在一些情况下,(i)的核酸分子源自受试者的基因组。在一些情况下,所述受试者是人类。在一些情况下,不是来自所述受试者的第二多个核酸分子包括一个或多个选自以下的成员:病毒、细菌、细菌噬菌体、真菌、原生生物、古细菌、变形虫、蠕虫、藻类、基因修饰的细胞以及基因修饰的载体。一方面,从生物样品产生核酸分子的亚组包括进行一个或多个杂交反应。一方面,方法还包括从受试者获得生物样品。在一些情况下,受试者的生物样品来源于肿瘤活检、全血或血浆。一方面,方法还包括将核酸分子的亚组的序列与一种或多种参考序列进行比对。一方面,一种或多种参考序列包括多个参考序列。一方面,多个参考序列对应于两种以上的不同物种。方法还可以包括基于比对来鉴定亚组中核酸分子的来源。一方面,方法还包括产生包括生物样品中鉴定的核酸分子来源的输出。在一些情况下,生物样品中第一多个核酸分子的丰度大于第一多个核酸分子的丰度。在一些情况下,亚组中的第二多个核酸分子的相对丰度大于亚组中的第一多个核酸分子的相对丰度。
本文公开了一种组合物,其包含被配置为与(i)来自受试者的一个或多个人类序列和(ii)来自受试者的一个或多个非人类序列杂交的探针池。一方面,探针池是多个捕获探针。一方面,探针池是多个扩增探针。
本文公开了一种用于处理受试者的生物样品的系统,其包括:包括一个或多个计算机处理器的处理单元,所述一个或多个计算机处理器被单独地或共同地编程以对核酸分子的亚组进行测定,以产生包括以下序列的序列信息:i)来自受试者的生物样品的人类核酸和(ii)来自受试者的生物样品的非人类核酸,所述核酸分子的亚组是使用核酸探针池从该生物样品中产生的,其中所述探针包括(i)被配置为靶向人类基因组的元件的第一多个核酸探针和(ii)被配置为靶向一种或多种非人类基因组的元件的第二多个核酸探针;以及被配置为存储序列信息的计算机存储器。在一些实施方案中,对一个或多个计算机处理器进行编程以生成序列与一种或多种参考序列的比对。在一些实施方案中,一种或多种参考序列包括多个参考序列,并且其中多个参考序列对应于两种或更多种不同的物种。在一些实施方案中,对一个或多个计算机处理器进行编程以基于比对来鉴定亚组中的核酸分子的来源。在一些实施方案中,对一个或多个计算机处理器进行编程以产生一份或多份生物医学报告,该一份或多份报告包括选自以下的信息:(i)候选肿瘤新抗原,(ii)检测到的非人类物种,(iii)检测到的互补决定区3(CDR3)序列及其任何组合。
本文公开了一种用于处理受试者的生物样品的系统,其包括:包括一个或多个计算机处理器的处理单元,所述一个或多个计算机处理器被单独地或共同地编程以对核酸分子的亚组进行测定以产生包括以下序列的序列信息:i)第一多个核酸分子和(ii)第二多个核酸分子,所述核酸分子的亚组是从生物样品中产生的,其中所述核酸分子的亚组包括(i)来自受试者的第一多个核酸分子和(ii)不是来自受试者的第二多个核酸分子,其中生物样品中的第一多个核酸分子的丰度大于第二多个核酸分子的丰度;以及被配置为存储序列信息的计算机存储器。在一些实施方案中,对一个或多个计算机处理器进行编程以生成序列与一种或多种参考序列的比对。在一些实施方案中,一种或多种参考序列包括多个参考序列,并且其中多个参考序列对应于两种或更种不同的物种。在一些实施方案中,对一个或多个计算机处理器进行编程以基于比对来鉴定亚组中的核酸分子的来源。在一些实施方案中,对一个或多个计算机处理器进行编程以产生一份或多份生物医学报告,该一份或多份报告包含选自以下的信息:(i)候选肿瘤新抗原,(ii)检测到的非人类物种,(iii)检测到的互补决定区3(CDR3)序列及其任何组合。
本公开内容的另一方面提供了一种包括机器可执行代码的非暂时性计算机可读介质,该机器可执行代码在由一个或多个计算机处理器执行时实现本文上述或本文其他地方的任何方法。
本公开内容的另一方面提供一种系统,该系统包括一个或多个计算机处理器和与其耦合的计算机存储器。该计算机存储器包括机器可执行代码,该机器可执行代码在由一个或多个计算机处理器执行时实现本文上述或本文其他地方的任何方法。
通过下文的详细描述,本公开内容的其他方面和优点对于本领域技术人员将变得显而易见,其中仅示出和描述了本公开的说明性实施方案。如将认识到的,本公开内容能够具有其他和不同的实施方案,并且其多个细节能够在各种明显的方面进行修改,所有这些都不脱离本公开内容。因此,附图和描述本质上应被认为是说明性的,而不是限制性的。
援引并入
本说明书中提到的所有出版物、专利和专利申请都以引用的方式并入本文,其程度如同每个单独的出版物、专利或专利申请被特别地并单独地指出通过引用并入一样。
附图说明
在所附的权利要求书中具体阐述了本发明的新颖特征。通过参考对其中利用了本发明的原理的示例性实施方案加以阐述的以下详细描述和附图(本文中也称为“图”),可以更好地理解本发明的特征和优点,在附图中:
图1示意性地示出了使用第一多个核酸探针和第二多个核酸探针产生核酸分子的亚组的方法;
图2示意性地示出了使用第一多个核酸探针和第二多个核酸探针产生核酸分子的亚组的方法。所述第一多个核酸探针可以结合非人类基因组;
图3示意性地示出了使用第一多个核酸探针和第二多个核酸探针产生核酸分子的亚组的方法。所述第一多个核酸探针可以结合分段的转录组;
图4示意性地示出了使用多个核酸探针产生核酸分子的亚组的方法。所述多个核酸探针可以包括靶向受试者的外显子组的探针组和靶向非受试者核酸序列的探针组;
图5示出了被编程或以其他方式配置为实现本公开内容的方法的计算机系统;
图6A示出了工作流程的示意图。Prep 1和Prep 2是指核酸的亚组。测定1、分析1和输出是指本文所述的任何测定、分析和输出。图6B示出了工作流程的示意图。Prep 1和Prep2是指核酸的亚组。测定1、测定2、分析1和输出是指本文所述的任何测定、分析和输出。图6C示出了工作流程的示意图。Prep 1和Prep 2是指核酸的亚组。测定1、测定2、分析1、分析2和输出是指本文所述的任何测定、分析和输出。图6D示出了工作流程的示意图,该工作流程包括(1)将核酸样品分离成用多种方案处理的多个亚组。这些方案可涉及对不同基因组区域或非基因组区域的富集,并包括一种或多种不同的扩增操作以制备用于测定的核酸分子文库。这些文库中的某些可以合并(2)以供测定。一些测定的结果可以合并(3)以供后续分析。变体调用(call)或对序列或遗传状态的其他评估可以进一步合并(4),以在测定所针对的东部(east)基因座产生组合评估。方案1-4是指本文所述的任何方法。测定1、测定2、测定3、分析1、分析2和输出是指本文所述的任何测定、分析和输出;
图7描绘了本文所述的测定工作流程的示例;
图8示出了本公开内容的工作流程的示意图;
图9示出了本公开内容的工作流程的示意图;
图10示出了剪切时间对片段大小的影响;
图11示出了珠比率对片段大小的影响;
图12示出了剪切时间对片段大小的影响;
图13描绘了核酸文库构建工作流程的示意图;
图14示出了用于开发针对多种生物医学应用的多线程测定的方法;
图15描绘了包括针对不同基因组区域富集的DNA的多个亚组的测定工作流程的示例,所述亚组在被合并用于测序测定之前经历一些独立的处理操作。将来自两个或更多个亚组的读段在a)测序设备中或b)随后在计算机中(例如,使用一种或多种算法)进行组合,以产生针对两个或更多个亚组的结合所寻址的区域的单个测试结果,并且产生可用于一份或多份生物医学报告的数据池。补充提取物(pullout)可以包括人类靶序列和非人类靶序列;
图16描绘了包括针对不同基因组区域富集的DNA的多个亚组的测定工作流程的示例,所述亚组在被独立地测序和分析变体之前经历一些独立的处理操作。来自两个亚组的变体可以被合并以产生针对通过两个或更多个亚组的结合所寻址的区域的结果,并且产生可以用于一份或多份生物医学报告的数据池。补充提取物可以包括人类靶序列和非人类靶序列;
图17描绘了包括针对不同基因组区域富集的DNA的多个亚组的测定工作流程的示例,所述亚组在被独立测序之前经历一些独立的处理操作并产生可以包括序列读段的原始数据。来自两个或更多个测定的原始数据可以被组合和分析(例如,通过一个或多个软件程序或算法),以产生由两个或更多个亚组的结合所寻址的所有区域的结果,从而产生可用于一份或多份生物医学报告的数据池。补充提取物可以包括人类靶序列和非人类靶序列;
图18描绘了多线程测定法,其包括通过大小选择产生DNA的两个亚组,并且基于GC含量进一步分成富集用于不同基因组区域的DNA的两个亚组。较长的分子可以使用适用于较长分子的技术进行测序。可以根据适合于亚组的Tm的方案进一步制备和扩增两个较短的分子亚组,然后将其合并以在高通量短读段测序仪HiSeq上进行测序。来自测序的原始数据可以被合并和分析(例如,通过一个或多个软件程序或算法),以产生针对亚组所寻址的所有区域的单个最佳结果,并产生可用于一份或多份生物医学报告的数据池。补充提取物可以包括人类靶序列和非人类靶序列。
具体实施方式
尽管已经在本文中示出和描述了本发明的各种实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员可以想到许多变化、改变和替代。应当理解,可以采用本文所述的本发明的实施方案的各种可替选方案。
人体经常携带大量微生物物种,在一些情况下超过1000种。这些微生物物种已被人类微生物组计划和其他研究记录,并且可能包括许多病毒、细菌、细菌噬菌体、真菌、原生生物、古细菌以及一些变形虫、蠕虫和藻类。这些非人类物种可能是有益的,但它们也可能引起或调节疾病,包括癌症。它们的作用可以是直接的(例如引起人细胞突变从而导致癌症)或间接的(例如刺激免疫系统,这影响其抵抗疾病的能力)。可以通过对从人的样品中提取的核酸进行测序来鉴定和表征个体中的微生物物种。这些微生物中的许多生活在人体与其周围环境的界面处(例如,皮肤、唾液、鼻道、肠道、肠、生殖器)。可以通过擦拭、活检、取粪便或尿液、取唾液或类似方法从这些界面中取样。已经开发出多种方法来对这些样品中的微生物核酸进行序列分析。这些既包括靶向PCR扩增(例如16S核糖体RNA基因的子部分的),也包括使用深度测序的非靶向(元基因组)方法。这些方法中的许多方法都涉及样品类型和/或富集方法,这些方法试图使人类DNA的量最小化,从而优化对预期微生物靶标的敏感性。人类基因组(约30亿个碱基)是典型细菌基因组(小于一百万个碱基至最高达数百万个碱基)的约1,000倍,是大多数病毒基因组大小(通常为数千至最高达数万个碱基)的数千倍。因此,如果没有用于避免或减少它的采样方法或检测技术,则人类DNA含量会占用大部分检测能力。
许多疾病的进展也受到人类细胞遗传学的影响。这可以包括遗传的遗传变体、癌症中的体细胞变体、免疫细胞中的VDJ重组、不同细胞类型中的差异基因表达以及其他特性。这些也可以通过对通常来自血液(最常见PBMC的DNA或无细胞DNA)或来自患病组织(例如肿瘤活检)核酸进行测序来测定。已经开发了多种方法对这些样品中的核酸进行序列分析,包括扩增子组(通常用于高达数百个基因)、杂交捕获(通常用于大量基因,包括外显子组)和非靶向方法(全基因组测序)。这些方法中有许多涉及针对其预期的人类核酸靶标进行优化的样品类型和/或富集方法。
用于微生物分析的样品类型可以与用于人类遗传分析的样品类型不同。例如,虽然粪便样品可用于分析肠道微生物组,但在检测遗传性人类遗传疾病(如囊性纤维化)方面,粪便样品可能是差的样品。可以对血液中的白细胞(PBMC)进行测序,以寻找遗传性遗传病的原因,但由于免疫系统在很大程度上将细菌排除在血液之外,因此通常对于细菌分析而言可能不是一个好的选择。用于人类和微生物分析的测定方法也有所不同。例如,任何一种都可以使用PCR,但是由于PCR产生非常狭窄的集中结果(即扩增子各自通常代表目标物种基因组的一小部分),因此人类和微生物靶标通常不会在单一的基于PCR测定中结合在一起。非靶向测定可用于人类遗传学(即全人类基因组测序)和微生物宏基因组学,但由于上述基因组大小存在巨大差异,因此通常最好分别各自进行测定,并针对各自来优化原料和测定。由于相同的原因,已经为特定的(通常是哺乳动物)物种(例如人外显子或牛外显子)开发了杂交捕获测定技术(例如外显子组)。
癌症可能是特例。许多肿瘤使用检查点基因和其他方法来部分或完全排除免疫系统。因此,设法渗透到肿瘤中的微生物可能能够在那里生存甚至繁衍。完整的活细菌(例如梭菌属(Fusobacterium))可能已是癌细胞并包括通过细胞分裂的周期并通过转移完全生活在其中。细菌可能导致癌症(例如幽门螺杆菌(Helicobacter pylori)是引起胃癌的原因),它们会影响癌症的进展并对癌症治疗剂应答(例如免疫检查点抑制剂)。病毒也可能进入细胞,并在一些情况下是引起癌症的原因,和/或可能会将其基因组整合到人类染色体中。因此,肿瘤活检可以包含人类和微生物组物种,以及它们的核酸。当这些细胞死亡时,它们的多物种核酸可能会掉入其周围环境中,并最终在血浆中被检测为无细胞核酸。
肿瘤活检的样品量通常非常有限,使得更难对同一样品中的人类遗传靶标和微生物遗传靶标进行多种不同的测定。当样品量有限时,可以同时提供来自人类和微生物组物种的序列数据的综合测定法可以是有利的。血浆中无细胞的DNA和RNA的量通常也很有限。可以从单个小血浆样品中同时提供来自人类和微生物组物种的序列数据的综合测定法也可以是有利的。
本文公开了一种测定法,其支持在同一时间从同一样品并行检测广泛的人类遗传数据以及微生物组数据。可以执行不需要与等效的仅人类测定可能所需的样品相比任何更多样品的单一测定。此测定法可以使用人类外显子组捕获试剂盒(例如Agilent临床研究外显子组v2)。探针池的试剂盒或组合物可以使用与其所靶向的人类序列互补的杂交探针。通过使用超过50,000种捕获探针、方法、试剂盒或组合物可以靶向大多数预定人类基因的外显子。例如,在将癌症样本中的核酸与该试剂盒的探针进行杂交反应之前,我们添加了一组已将其设计为靶向非人类序列的额外的捕获探针。非人类序列可以来自病毒、细菌、真菌或古细菌基因组,即来自人的微生物组。一旦将人类外显子组探针与非人类微生物组的探针组合,该探针混合物就可用于与从患者样品中提取的核酸进行基于杂交的捕获反应(图2)。之后,可以对已经捕获的核酸进行测序。在我们的实验室中,此测序是使用IlluminaNovaSeq-6000 DNA测序仪器进行的。
通过与人和微生物组物种参考序列比对,可以分离出由该过程产生的混合(人类和非人类)DNA序列。通过比对分离序列是可能的,因为人类基因组在进化过程中已经与微生物基因组发生了很大的差异。
由于PCR难以同时靶向多个基因,因此使用捕获探针可以比基于聚合酶链反应(PCR)的测定来富集和靶向感兴趣的序列有利。为了靶向多个基因,PCR可需要大量的引物,例如多达潜在的100,000个引物来扩增和靶向50,000个序列,并且需要酶促操作以产生用于鉴定的核酸分子。优化多个基因的PCR引物的比例也可能很困难,并且可能导致有偏差的扩增结果,其可能无法代表核酸样品中靶核酸的相对量。
如说明书和权利要求书中所使用的,单数形式“一”、“一个(种)”和“所述(the)”包括复数个指称物,除非上下文另外明确指出。例如,术语“一嵌合跨膜受体多肽”包括多个嵌合跨膜受体多肽。
术语“约”或“近似”是指在本领域普通技术人员所确定的特定数值的可接受误差范围内,这将部分取决于该数值是如何测量或确定的,即测量系统的极限值。例如,根据本领域的实践,“约”可以表示在1个或大于1个标准偏差之内。或者,“约”可以表示给定数值的至多20%、至多10%、至多5%或至多1%的范围。或者,例如关于生物系统或过程,该术语可以表示在数值的一个数量级内,或在数值的5倍内或在2倍之内。在本申请和权利要求书中描述了特定数值的情况下,除非另有说明,否则应假设术语“约”表示在该特定数值的可接受的误差范围内。
如本文所用,“细胞”通常是指生物细胞。细胞可以是活生物体的基本结构单元、功能单元和/或生物学单元。细胞可以源自具有一种或多种细胞的任何生物。一些非限制性示例包括:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物体的细胞、原生动物细胞、来自植物的细胞(例如来自植物作物、水果、蔬菜、谷物、大豆、玉米、玉蜀黍、小麦、种子、番茄、稻、木薯、甘蔗、南瓜、干草、土豆、棉花、大麻、烟草、开花植物、针叶树、裸子植物、蕨类、石松类(clubmosses)、角苔类(hornworts)、苔类(liverworts)、藓类(mosses)的细胞)、藻类细胞(例如布朗葡萄藻(Botryococcus braunii)、莱茵衣藻(Chlamydomonasreinhardtii)、微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorellapyrenoidosa)、展枝马尾藻(Sargassum patens C.Agardh)等)、海藻类(例如海藻)、真菌细胞(例如酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如鱼、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、来自哺乳动物(例如猪、牛、山羊、绵羊、啮齿动物、大鼠、小鼠、非人类灵长类动物、人类等)的细胞等等。有时细胞不是来自天然生物(例如细胞可以是人工合成的,有时也称为人造细胞)。
如本文所用,术语“核苷酸”通常是指基础糖磷酸酯(base-sugar-phosphate)的组合。核苷酸可以包含合成核苷酸。核苷酸可包含合成核苷酸类似物。核苷酸可以是核酸序列的单体单元(例如脱氧核糖核酸(DNA)和核糖核酸(RNA))。术语核苷酸可以包括核糖核苷三磷酸腺苷三磷酸(ATP)、尿苷三磷酸(UTP)、胞嘧啶三磷酸(CTP)、鸟苷三磷酸(GTP)和脱氧核糖核苷三磷酸,例如dATP、dCTP、dITP、dUTP、dGTP、dTTP或其衍生物。这样的衍生物可以包括例如[αS]dATP、7-脱氮-dGTP和7-脱氮-dATP,以及在包含它们的核酸分子上赋予核酸酶抗性的核苷酸衍生物。本文所用的术语核苷酸可以指双脱氧核糖核苷三磷酸(ddNTP)及其衍生物。双脱氧核糖核苷三磷酸的示例性示例可包括但不限于ddATP、ddCTP、ddGTP、ddITP和ddTTP。核苷酸可以是未标记的或可检测地标记的。标记也可以用量子点进行。可检测的标记可以包括例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可包括但不限于荧光素、5-羧基荧光素(FAM)、2'7'-二甲氧基-4'5-二氯-6-羧基荧光素(JOE)、若丹明、6-羧基若丹明(R6G)、N,N,N',N'-四甲基-6-羧基若丹明(TAMRA)、6-羧基-X-若丹明(ROX)、4-(4'二甲基氨基苯基偶氮)苯甲酸(DABCYL)、Cascade Blue、俄勒冈绿、德克萨斯红、青色素和5-(2'-氨基乙基)氨基萘-1-磺酸(EDANS)。荧光标记的核苷酸的具体示例可包括可从加利福尼亚的福斯特城的Perkin Elmer获得的[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP和[dROX]ddTTP;可从伊利诺伊州阿林顿高地的Amersham获得的FluoroLink Deoxy Nucleotides、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLinkCy3-dUTP和FluoroLink Cy5-dUTP;可从印第安纳州印第安纳波利斯的BoehringerMannheim获得的荧光素15-dATP、荧光素-12-dUTP、四甲基罗丹明6-dUTP、IR770-9-dATP、荧光素-12-ddUTP、荧光素-12-UTP和荧光素-15-2'-dATP;和可从美国俄勒冈州尤金市的Molecular Probes获得的染色体标记的核苷酸、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、Cascade Blue-7-dUTP、Cascade Blue-7-dUTP、荧光素-12-UTP、荧光素-12-dUTP、俄勒冈绿488-5-dUTP、若丹明绿-5-UTP、若丹明绿-5-dUTP、四甲基若丹明-6-UTP、四甲基若丹明-6-dUTP、德克萨斯红-5-UTP、德克萨斯红-5-dUTP和德克萨斯红-12-dUTP。核苷酸也可以通过化学修饰来标记或标志。化学修饰的单个核苷酸可以是生物素-dNTP。生物素化的dNTP的一些非限制性示例可以包括生物素-dATP(例如,生物素-N6-ddATP、生物素-l4-dATP)、生物素-dCTP(例如,生物素-11-dCTP、生物素-14-dCTP)和生物素-dUTP(例如生物素-11-dUTP、生物素-16-dUTP、生物素-20-dUTP)。
如本文所用,术语“基因组”通常用于指受试者的基因组的一部分或受试者的全部基因组。例如,基因组可以指受试者的基因序列。基因组可以指受试者的整个基因组序列。
术语“多核苷酸”、“寡核苷酸”和“核酸”可用于互换地指聚合形式的任何长度的核苷酸,单链、双链或多链形式的脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸对于细胞可以是外源的或内源的。多核苷酸可以存在于无细胞的环境中。多核苷酸可以是基因或其片段。多核苷酸可以是DNA。多核苷酸可以是RNA。多核苷酸可以具有任何三维结构,并且可以执行任何功能。多核苷酸可以包括一种或多种类似物(例如,改变的骨架、糖或核碱基)。如果存在的话,可以在聚合物组装之前或之后对核苷酸结构进行修饰。类似物的一些非限制性示例包括:5-溴尿嘧啶、肽核酸、异种核酸、吗啉代、锁核酸、乙二醇核酸、苏糖核酸、双脱氧核苷酸、虫草素、7-脱氮-GTP、荧光团(例如与糖连接的若丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化核苷酸、肌苷、硫代尿苷、假尿嘧啶、二氢尿苷、q苷和丫苷(wyosine)。多核苷酸的非限制性示例包括基因或基因片段的编码区或非编码区、通过连锁分析定义的基因座(locus)、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、无细胞多核苷酸(包括无细胞DNA(cfDNA)和无细胞RNA(cfRNA))、核酸探针和引物。核苷酸的序列可以被非核苷酸成分中断。任何前述核酸分子都可以是工程化的或合成的。
如本文所用,术语“基因”是指涉及编码RNA转录物的核酸(例如DNA,例如基因组DNA和cDNA)及其相应的核苷酸序列。如本文所用,关于基因组DNA的术语包括中间的非编码区以及调控区,并且可以包括5′末端和3′末端。在某些用途中,该术语涵盖转录的序列,包括5'和3'非翻译区(5'-UTR和3'-UTR)、外显子和内含子。在某些基因中,转录区将包含编码多肽的“开放阅读框”。在该术语的某些用途中,“基因”仅包含编码多肽所需的编码序列(例如,“开放阅读框”或“编码区”)。在一些情况下,基因不编码多肽,例如核糖体RNA基因(rRNA)和转移RNA(tRNA)基因。在一些情况下,术语“基因”不仅包括转录的序列,而且还包括非转录区(包括上游和下游调控区)、增强子和启动子。基因可以指在生物体基因组中处于其自然位置的“内源基因”或天然基因。基因可以指“外源基因”或非天然基因。非天然基因可以指通常不在宿主生物体中存在但通过基因转移引入宿主生物体中的基因。非天然基因还可以指不在生物体(诸如遗传修饰的生物体)的基因组中处于其天然位置的基因。非天然基因还可以指包含突变、插入和/或缺失的天然存在的核酸或多肽序列(例如,非天然序列)。
如本文所用,术语“同一性百分比(%)”是指在比对序列并引入缺口(如果需要,以获得最大的同一性百分比(例如,可以在候选序列和参考序列之一或两者中引入缺口以实现最佳比对,并且出于比较目的,可以忽略非同源序列))后与参考序列的氨基酸或核酸残基相同的候选序列的氨基酸或核酸残基百分比。为了确定同一性百分比,可以以多种方式实现比对,例如,使用计算机软件,例如BLAST、ALIGN或Megalign(DNASTAR)软件。两个序列的同一性百分比可以通过以下来计算:使用BLAST将测试序列与比较序列进行比对,确定比对的测试序列中与比较序列相同位置的氨基酸或核苷酸相同的氨基酸或核苷酸的数目,并将相同氨基酸或核苷酸的数目除以比较序列中的氨基酸或核苷酸的数目。
如本文所用,术语“受试者”通常是指任何动物,例如哺乳动物或有袋动物。受试者可以是患者。对于疾病或病症,受试者可以是有症状的或无症状的。受试者可以是灵长类动物(例如,人类)、非人类灵长类动物(例如恒河猴或其他类型的猕猴)、狗、猫、小鼠、猪、马、驴、牛、绵羊、大鼠和家禽。哺乳动物包括但不限于鼠类、猿猴、人类、农场动物、运动动物(sport animal)和宠物。还包括体内获得或体外培养的生物实体的组织、细胞及其后代。宿主是可以携带非宿主的生物体。受试者可能对于疾病无症状。作为备选,受试者对于疾病不是无症状的。
如本文所用,术语“治疗”是指用于获得有益或期望结果的方法,包括但不限于治疗性益处和/或预防性益处。例如,治疗可以包括施用本文公开的系统或细胞群体。治疗性益处是指对一种或多种治疗中的疾病、病况或症状的任何治疗上相关的改善或作用。为了预防性益处,可以将组合物施用于具有患有特定疾病、病况或症状的风险的受试者,或施用于报告具有疾病的一种或多种生理症状的受试者,即使可能尚未表现出疾病、病况或症状。
在一些情况下,本公开内容还提供了用于处理和分析生物样品的组合物和方法。在一些情况下,来自受试者的生物样品可以包含来自受试者的核酸和不是来自受试者的核酸分子。在一些情况下,生物样品可以包含来自人类和非人类基因组的核酸。在一些情况下,非人类基因组可以来自病毒、细菌、细菌噬菌体、真菌、原生生物、古细菌、变形虫、蠕虫、藻类或其组合。在一些情况下,非人类基因组的来源可能对人类宿主有益。在一些情况下,非人类基因组的来源可能参与调节疾病,例如癌症。在一些情况下,包含非人类基因组的非人类生物体的来源可以通过在人类细胞中引起突变从而在受试者中引起癌症而直接地表现出来。在一些情况下,非人类基因组的来源可以例如通过刺激人类宿主的免疫系统来影响其抵抗疾病的能力而间接地表现出来。在一些情况下,本公开内容还提供了一种方法,所述方法包括鉴定样品中非人类基因组和人类基因组的存在。
样品可以来自皮肤、唾液、鼻道、肠道、肠、生殖器或其组合。在一些情况下,可以通过擦拭、活检、收集粪便、收集尿液、收集唾液等来获取样品。
人类基因组(约30亿个碱基)是非人类基因组(例如细菌基因组)的1000倍,是大多数病毒基因组大小的数千倍。在一些情况下,方法可以包括一种采样方法,以富集混合样品中的非人类基因组。
本公开内容还提供了一种方法,该方法包括对来自样品的微生物核酸进行序列(或测序)分析。测序分析可包括PCR扩增(例如16S核糖体RNA基因的分段),以及使用深度测序的非靶向宏基因组学方法。该方法可以包括选择样品类型和/或富集方法,其可以寻求最小化人类基因组的量,从而优化对非人类基因组的敏感性。
一方面,第一多个核酸分子可以来自受试者。受试者可以是人类,因此本公开内容还提供了人类核酸分子。本公开内容还提供了使用可以来自人类基因组的多个核酸探针的第一亚组或产物。本公开内容还提供了人类基因组。在一些情况下,人类基因组可包括例如遗传的遗传变体、体细胞变体、免疫细胞中的VDJ重组、不同细胞类型中的差异基因表达以及其他特性。前述中的至少一些可以促成受试者的疾病或与之相关联(例如,癌症中的体细胞变体)。基因组可以包含基因、外显子、UTR、调控区、剪接位点、重组基因、备选序列、重组装基因、基因定相、外源序列等。
在一些情况下,可以通过测序分析生物样品中的核酸。在一些情况下,可以对通常来自血液或患病组织的核酸进行测序。在一些情况下,血液样品可以包含外周血单核细胞、无细胞DNA或其组合。在一些情况下,患病组织可能包含癌症。在一些情况下,来自血液样品或患病组织样品的核酸的序列分析可包括扩增子组的产生、杂交捕获和非靶向方法,例如全基因组测序。在一些情况下,方法可以涉及样品类型、人类基因组富集方法及其组合的选择。
在一些情况下,生物样品可以包含受试者核酸、非受试者核酸及其组合。在一些情况下,生物样品可以包含宿主核酸、非宿主核酸及其组合。在一些情况下,生物样品可以包含编码受体的基因组。在一些情况下,受体可以来自免疫细胞。在一些情况下,来自免疫细胞的受体可以是T细胞受体(TCR)、B细胞受体(BCR)、嵌合抗原受体(CAR)等。
在一些情况下,本文提供的方法包括对核酸分子进行测定以产生序列信息。该测定可以包括对包含VDJ重排或VDJ重组的核酸进行测序。在一些情况下,VDJ重排或重组可以指细胞受体。例如,体细胞超突变可以产生编码抗体的B细胞受体(BCR)序列,以实现显著的抗原多样性。在一些情况下,可以对BCR进行测序。本文提供的方法可以包括对BCR进行测序以阐明抗体如何发育。例如,方法可以包括序列分析,以将每个碱基注释为来自V、D或J基因中的特定基因,或来自N加成(又称为非模板化插入)。在一些情况下,VDJ重组可以产生CDR3序列。在一些情况下,CDR3序列可以产生结合抗原例如肿瘤抗原的多肽。在一些情况下,CDR3序列可以产生结合抗原例如新抗原的多肽。
在一些情况下,本文提供的方法可以包括对编码候选肿瘤新抗原或与候选肿瘤新抗原相关的核酸进行测序。在一些情况下,本文提供的方法可以包括对检测到的CDR3序列进行测序。在一些方面,可以使用多种方法来鉴定受试者TCR。在一些情况下,可以使用全外显子组测序(whole-exomic sequencing)来鉴定TCR。例如,TCR可以靶向通过靶细胞的全外显子组测序鉴定的新抗原或新表位。或者,可以从自体、同种异体或异种库中鉴定出TCR。在一些情况下,可以包含产生新抗原或新表位的突变的基因可以是ABL1、ACOl 1997、ACVR2A、AFP、AKT1、ALK、ALPPL2、ANAPC1、APC、ARID1A、AR、AR-v7、ASCL2、β2Μ、BRAF、BTK、C15ORF40、CDH1、CLDN6、CNOT1、CT45A5、CTAG1B、DCT、DKK4、EEF1B2、EEF1DP3、EGFR、EIF2B3、env、EPHB2、ERBB3、ESR1、ESRP1、FAM11 IB、FGFR3、FRG1B、GAGE1、GAGE 10、GATA3、GBP3、HER2、IDH1、JAK1、KIT、KRAS、LMAN1、MABEB 16、MAGEA1、MAGEA10、MAGEA4、MAGEA8、MAGEB 17、MAGEB4、MAGEC1、MEK、MLANA、MLL2、MMP13、MSH3、MSH6、MYC、NDUFC2、NRAS、NY-ESO、PAGE2、PAGE5、PDGFRa、PIK3CA、PMEL、pol蛋白、POLE、PTEN、RAC1、RBM27、RNF43、RPL22、RUNX1、SEC31A、SEC63、SF3B 1、SLC35F5、SLC45A2、SMAP1、SMAP1、SPOP、TFAM、TGFBR2、THAP5、TP53、TTK、TYR、UBR5、VHL、XPOT。
本公开内容还提供了包括获得或提供包含一个或多个基因组的核酸样品或核酸分子的亚组的方法。本文公开的方法可以分析从生物样品产生的核酸分子的核酸亚组。亚组可以包含来自受试者的核酸分子和不是来自受试者的核酸分子。例如,可以使用靶标捕获和序列来富集人和微生物序列。一个或多个基因组可包含一个或多个基因组特征。
基因组特征可以包括整个基因组或其一部分。基因组特征可以包括整个外显子组或其一部分。基因组特征可以包括一组或多组基因。基因组特征可以包括一种或多种基因。基因组特征可以包括一组或多组调控元件。基因组特征可包括一种或多种调控元件。基因组特征可以包括一组多态性。基因组特征可以包括一种或多种多态性。在一些情况下,多态性是指基因型中的突变。多态性可包括一个或多个碱基的改变、一个或多个碱基的插入、重复或缺失。基因组特征可以包括拷贝数变体(CNV)、颠换、其他重排以及其他形式的遗传变异。在一些情况下,核酸样品亚组的一个或多个特征可以是多态性标记,包括限制性片段长度多态性、可变数目串联重复序列(VNTR)、高变区、小卫星序列、双核苷酸重复序列、三核苷酸重复序列、四核苷酸重复序列、简单序列重复序列、以及插入元件(例如Alu)。在一些情况下,核酸分子的第一亚组和核酸分子的第二亚组之间的差异可以是多态性标记,包括限制性片段长度多态性、可变数目串联重复序列(VNTR)、高变区、小卫星序列、双核苷酸重复序列、三核苷酸重复序列、四核苷酸重复序列、简单序列重复序列和插入元件(例如Alu)。在选定群体中最频繁出现的等位基因形式有时被称为野生型形式。二倍体生物体对于等位基因形式可以是纯合的或杂合的。双等位基因的多态性有两种形式。三等位基因的多态性具有三种形式。多态性可以包括单核苷酸多态性(SNP)。在本公开内容的一些方面,一种或多种多态性包括一个或多个单核苷酸变异、inDel、小插入、小缺失、结构变体连接、可变长度的串联重复序列、侧翼序列或其组合。一种或多种多态性可以位于编码和/或非编码区域内。一种或多种多态性可以位于基因、外显子、内含子、剪接位点、非翻译区或其组合之内、周围或附近。一种或多种多态性可以跨越基因、外显子、内含子、非翻译区的至少一部分。在一些情况下,基因组特征可能与一种或多种核酸分子的GC含量、复杂性和/或可映射性有关。基因组特征可以包括一个或多个简单串联重复序列(STR)、不稳定的扩展重复序列、片段重复、单个和成对的读段的变性映射得分、GRCh38或GRCh37斑块或其组合。基因组特征可包括一个或多个来自全基因组测序(WGS)的低平均覆盖区域、来自WGS的零平均覆盖区域、经过验证的压缩或其组合。基因组特征可以包括一个或多个备选或非参考序列。
基因组特征可以包括一个或多个基因定相和重组装基因。定相和重组装基因的示例包括但不限于一种或多种主要组织相容性复合物、血液分型和淀粉酶基因家族。在一些情况下,基因定相和/或重组装基因可以包括与血液分型相关的基因。血液分型基因可以包括ABO、RHD、RHCE或其组合。
在一些情况下,基因组特征可以包括重组装基因。重组装基因可以包括参与免疫应答的基因。参与免疫应答的基因可包括涉及主要组织相容性复合物、免疫受体和细胞功能的基因。一种或多种主要组织相容性复合物可包括一种或多种HLA I类、HLA II类或其组合。HLA I类可以是HLA-A、HLA-B、HLA-C或其组合中的任何一种。HLAII类可以是HLA-DP、HLA-DM、HLA-DOA、HLA-DOB、HLA-DQ、HLA-DR或其组合中的任何一种。参与免疫应答的基因可以是RAG1、RAG2及其组合。在一些情况下,重组装基因可以包括参与VDJ重组的基因。例如,为了在B细胞和T细胞受体(BCR和TCR)中建立多样性,可以通过重组预先存在的基因片段来生成基因。在一些情况下,一组有限的基因片段的不同组合会产生能够鉴定无限数量的外来基因组或非人类基因组的受体。VDJ重组可以包括切割包含重组信号序列(RSS)的DNA。在一些情况下,可以使用细胞修复机制重组装片段化的序列。本公开内容还提供了包括对来自VDJ重组的基因组的片段化的部分进行测序的方法。例如,本公开内容提供了包括在VDJ重组位点处进行测序的方法。
在本公开内容的一些方面,一个或多个基因组特征可以不是互斥的。例如,包括整个基因组或其一部分的基因组特征可以与另外的基因组特征(例如整个外显子组或其一部分、一种或多种基因、一个或多个调控元件等)重叠。或者,一个或多个基因组特征可以是互斥的。例如,包含整个基因组的非编码部分的基因组可以不与基因组特征(例如外显子组或其部分或基因的编码部分)重叠。可替选地或另外地,一个或多个基因组特征是部分排斥的或部分包含的。例如,包含整个外显子组或其一部分的基因组可以与包含基因的外显子部分的基因组部分重叠。但是,包含整个外显子组或其部分的基因组可以不与包含基因内含子部分的基因组重叠。因此,包含基因或其一部分的基因组特征可以部分排斥和/或部分包括包含整个外显子组或其部分的基因组特征。在一些情况下,基因特征可以与物种相关,从而可以区分多于一种的物种。在一些情况下,基因特征可以与物种相关,从而可以区分人类基因特征和细菌基因特征。在一些情况下,核酸分子的第一亚组对一种物种具有特异性,而核酸分子的第二亚组对第二种物种具有特异性。
生物样品可以包含人类基因组、非人类基因组或其组合。在一些情况下,可以处理生物样品。在一些情况下,可以对生物样品进行富集受试者(例如人类)的核酸序列,或可以富集不是来自受试者(例如非人类)的核酸序列,同时检测样品中人类基因组和非人类基因组。生物样品可以包含无细胞的核酸分子,例如无细胞DNA(cfDNA)或无细胞RNA。无细胞核酸分子可以是循环肿瘤核酸分子(例如循环肿瘤DNA)。无细胞DNA可以包含突变,所述突变可以指示疾病,与疾病相关或与之相关联,所述疾病例如为癌症。
生物样品可以具有包含工程化的序列的核酸分子。例如,生物样品中的核酸可包含外源或替代序列(例如标签)、外源受体(例如嵌合抗原受体(CAR)受体)、质粒序列和新抗原特异性序列,仅举几例。在一些情况下,工程化的序列可以用作诊断标记。在一些情况下,可以利用工程化的序列来确定治疗剂是否运输至靶标,例如肿瘤靶标。替代序列可以是外源的或内源的。在一些情况下,替代序列可以包括或来自质粒序列。质粒序列可以是DNA或RNA。在一些情况下,质粒序列也可以是DNA小环序列或狗骨头序列。
本公开内容还提供了包括获得或提供包含一个或多个转录组的核酸样品或核酸分子的亚组的方法。核酸样品可以包含mRNA。mRNA可以来自受试者的不同组织。样品中的mRNA的量可用于分析组织中mRNA或蛋白质的表达水平和受试者特定种类。例如,样品中的mRNA的量可以与受试者中的特定特征或疾病(例如,癌症)有关。另外,样品中mRNA的量可以指示受试者中特定组织类型中表达的变化或相对差异。在一些情况下,可以将mRNA处理形成cDNA。例如,可以使用逆转录酶对mRNA进行逆转录以合成cDNA分子。可以对cDNA分子进行捕获、分离、富集、扩增、测序或可以对核酸进行的其他反应,如本文其他地方所述。
来自包含受试者和非受试者序列的生物样品中的核酸可以在单个池中富集和测序,并通过计算机分离。例如,可以通过与人类和非人类物种参考序列比对来对混合的人类基因组和非人类基因组进行分离。通过比对分离序列是可能的,因为人类基因组在进化过程中已与微生物基因组发生了差异。基因组,例如来自非人类基因组(例如微生物物种)的DNA通常与人类基因组比对不上,反之亦然。非人类基因组,例如微生物基因组,可以具有与其他非人类基因组相同或相似的区段。人类基因组和非人类基因组混合物中的多于一个的非人类基因组可能需要进行额外的比对,以鉴定非人类物种。
在一些情况下,方法可以包括从生物样品中产生核酸分子的亚组。在一些情况下,方法可以包括通过进行一个或多个杂交反应从生物样品中产生核酸分子的亚组。杂交反应可包括富集。在一些情况下,可以进行富集。可以通过各种方法进行富集。在一些情况下,可以通过杂交捕获、阵列捕获、珠子捕获等来进行富集。在一些情况下,杂交捕获可以在溶液中或在固体支持物上,例如在阵列上。在一些情况下,可以通过分子倒置探针(MIP)进行富集。可以通过扩增来进行富集,例如使用PCR。在一些情况下,出于富集的目的,方法可以包括通过扩增人类基因组或非人类基因组来产生核酸的亚组。在一些情况下,扩增可以包括以下中的一项:基于聚合酶链反应(PCR)的技术(例如,固相PCR、RT-PCR、qPCR、多重PCR、降落PCR、纳米PCR、嵌套式PCR、热启动PCR等)、解旋酶依赖性扩增(HDA)、环介导的等温扩增(LAMP)、自我维持的序列复制(3SR)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、滚环扩增(RCA)、连接酶链反应(LCR)和其他任何合适的扩增技术。
核酸探针池可包含人类外显子组捕获试剂盒,例如Agilent临床研究外显子组v2(图1)。核酸探针池可包含与其所靶向的人类序列互补的杂交探针。核酸探针池可包含约50,000个捕获探针,以靶向大多数预定的人类基因的基因组等。可将捕获探针设计为靶向基因、外显子、UTR、调控区、剪接位点、重组装基因、替代序列和其他基因组内容物。在一些情况下,方法可以包括被设计成靶向非人类序列的核酸探针池。在一些情况下,核酸探针池可对例如来自病毒、细菌、真菌或古细菌的基因组(即来自人类微生物组)的非人类基因组具有特异性。在一些情况下,核酸探针池可与和第一核酸探针池相比对第二种物种特异的第二核酸探针池组合(图2)。核酸探针池可被配置为结合人类序列和非人类序列,并且核酸探针池可结合来自分段转录组的序列(图3)。在一些情况下,核酸探针池可结合人类序列,并且核酸探针池可结合非人类序列(图4)。在一些情况下,核酸探针池可用于与从患者样品中提取的核酸进行基于杂交的捕获反应。在一些情况下,方法可以包括对已经捕获的核酸池进行测序。捕获或富集的核酸可以是人类序列、非人类序列,或人类序列和非人类序列,测序可包括Illumina NovaSeq-6000 DNA测序仪。在一些情况下,可以将靶向微生物物种的捕获探针设计为靶向一种或多种物种不同的微生物物种序列的区域,或直接与一种或多种物种不同的区域相邻,例如非人类或人类。在一些情况下,方法包括靶向非人类序列(例如微生物序列)之间的不同区域,从而能够使用少量捕获探针从大量潜在的非人类微生物组物种中捕获核酸。通过使用可能包含共有序列区但与可变区相邻的捕获探针,许多可以被捕获的非人类序列可以跨越这两者。
在一些情况下,然后可以通过一个或多个物种独特性区域将来自非人类基因组的序列分配给其来源物种。例如,几乎所有细菌中都存在的16S核糖体RNA基因具有大约9个区域,在该区域中,序列因物种而异,与共享序列的区域交错。在一些情况下,然后可以基于来自可变区部分的序列,将序列从这些共享区延伸到可变区的捕获分子分配给它们的来源物种。通过使用真菌基因组的大亚基核糖体RNA基因的部分保守的D2区,可以类似地评估真菌核酸序列。可以分析基因组的外显子组。可以分析基因组的内含子区域。外显子组主要靶向人类基因组的编码区,并且可以占全部人类基因组的不到2%。通过排除人类基因组的大多数内含子和基因间部分,人类序列的数量可以减少约98%。可以增加外显子以包括非编码内容物。外显子组的测序,例如在癌症中,可以允许深度测序,从而改善对等位基因频率低的体细胞变体的检测,也可以改善对从样品中共捕获的非人类序列的检测。
本公开内容还提供了用于处理生物样品的组合物和方法。可以从诸如成人或儿童的受试者获得生物样品。在一些情况下,用于处理生物样品的方法可以包括(a)使用核酸探针池从生物样品中产生核酸分子的亚组,其中所述探针包括(i)被配置为靶向人类基因组的元件的第一多个核酸探针;和(ii)被配置为靶向一种或多种非人类基因组的元件的第二多个核酸探针;(b)对所述核酸分子的亚组进行测定以产生包括以下序列的序列信息:(i)来自所述受试者的生物样品的人类核酸和(ii)来自所述受试者的生物样品的非人类核酸。
所公开的方法可以包括检测、监测、定量或评价一种或多种非人类核酸分子或由一种或多种非人类基因组或非宿主基因组引起的一种或多种疾病或病况。在一些情况下,捕获探针可以靶向不同的属。在一些情况下,捕获探针可以靶向不同的物种。在一些方面,捕获探针可以靶向多于一种的生物体的不同的目。在一些情况下,捕获探针可以靶向植物界、动物界、真菌、原生生物(protest)、真细菌和/或古细菌。在一些情况下,捕获探针可以靶向病毒、细菌、细菌噬菌体、真菌、原生生物、古细菌、变形虫、蠕虫、藻类、基因修饰的细胞、基因修饰的载体及其组合。在一些情况下,非人类序列可以是细菌。例如,细菌序列可以来自酸细菌(acidiobacteria)、放线菌纲(actiniobacteria)、产水菌纲(Aquificae)、装甲菌门(armatimonadetes)、拟杆菌门(Bacteroidetes)、嗜热丝菌门(caldiserica)、衣原体门(chlamydiae)、绿菌门(Chlorobi)、绿弯菌门(chloroflexi)、产金菌门(chrysiogenetes)、蓝藻菌门(cyanobacteria)、脱铁杆菌门(deferribacteres)、异常球菌属-栖热菌属(deinococcus-thermus)、网团菌纲(dictyoglomi)、迷踪菌门(elusimicrobia)、纤维杆菌门(fibrobacteres)、硬壁菌门(firmicutes)、梭杆菌门(fusobacteria)、芽单胞菌门(gemmatimonadetes)、黏胶球形菌纲(lentisphaerae)、硝化螺旋菌门(Nitrospirae)、浮霉菌门(planctomycetes)、变形菌(Proteobacteria)、螺旋体门(spirochaetes)、互养菌门(synergistetes)、软壁菌门(tenericutes)、热脱硫杆菌门(thermodesulfobacteria)、热微菌门(thermomicrobia)、热袍菌门(thermotogae)和/或疣微菌门(verrucomicrobia)。在一些情况下,非人类序列可以来自但不限于:博德特氏菌属(Bordetella)、疏螺旋体属(Borrelia)、布鲁杆菌属(Brucella)、弯曲杆菌属(Campylobacter)、衣原体属(Chlamydia)、嗜衣原体属(Chlamydophila)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、肠球菌属(Enterococcus)、埃希氏菌属(Escherichia)、弗朗西丝菌属(Francisella)、嗜血菌属(Haemophilus)、螺杆菌属(Helicobacter)、军团菌属(Legionella)、钩端螺旋体属(Leptospira)、利斯特菌属(Listeria)、分枝杆菌属(Mycobacterium)、支原体属(Mycoplasma)、奈瑟菌属(Neisseria)、假单胞菌属(Pseudomonas)、立克次体属(Rickettsia)、沙门菌属(Salmonella)、志贺氏菌属(Shigella)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、密螺旋体属(Treponema)、弧菌属(Vibrio)或耶尔森氏菌属(Yersinia)。其他病原体包括但不限于结核分枝杆菌(Mycobacterium tuberculosis)、链球菌属、假单胞菌属、志贺氏菌属、弯曲杆菌属和沙门菌属。在一些情况下,捕获探针可以靶向真菌,例如芽枝霉门(blastocladiomycota)、壶菌门(chytridiomycota)、球囊菌门(Glomeromycota)、微孢子门(Microsporidia)、新丽鞭毛菌门(Neocallimastigomycota)、半知菌门(Deuteromycota)、子囊菌门(Ascomycota)、盘菌亚门(Pezizomycotina)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、担子菌门(Basidiomycota)、伞菌亚门(Agaricomycotina)、柄锈菌亚门(Pucciniomycotina)、黑粉菌亚门(Ustilaginomycotina)、虫霉菌亚门(Entomophthoromycotina)、梳霉亚门(Kickxellomycotina)、毛霉亚门(Mucoromycotina)、捕虫霉亚门(Zoopagomycotina)等。在一些情况下,非人类或非宿主可以来自牛、马、鱼、驴、兔、大鼠、小鼠、仓鼠、狗、猫、猪、蛇、绵羊、山羊等。
由一种或多种非人类基因组引起或与之相关的疾病或病况可以包括结核病、肺炎、食源性疾病、破伤风、伤寒、白喉、梅毒、麻风、细菌性阴道病、细菌性脑膜炎、细菌性肺炎、泌尿道感染、细菌肠胃炎、细菌性皮肤感染或其任何组合。细菌性皮肤感染的示例包括但不限于可由金黄色葡萄球菌(Staphylococcus aureus)或化脓性链球菌(Streptococcuspyogenes)引起的脓疱病;可由链球菌感染深表皮并淋巴扩散引起的丹毒;以及可由正常皮肤菌群或外源细菌引起的蜂窝织炎。
非受试者核酸序列可以源自真菌,例如念珠菌属(Candida)、曲霉属(Aspergillus)、隐球菌属(Cryptococcus)、组织胞浆菌属(Histoplasma)、肺囊虫属(Pneumocystis)和葡萄穗霉属(Stachybotrys)。由真菌引起的疾病或病况的示例包括但不限于股癣、酵母菌感染、金钱癣和脚癣。
在一些情况下,非受试者或非宿主的核酸序列可以来自原生生物。原生生物可以包括原生动物、原生植物、霉菌及其组合。原生生物可以是原始色素体生物。原始色素体生物可以是红藻门(Rhodophyta)或灰色藻门(Glaucophyta)。原生生物可以是Sar或Harosa。SAR可以是包括不等鞭毛类(stramenopiles)、有泡类(alveolates)和有孔虫界(Rhizaria)(SAR)的进化枝。另外,进化枝SAR可以包括不等鞭毛类、囊泡虫类(Alveolata)、顶复门(Apicomplexa)、纤毛亚门(Ciliophora)、腰鞭毛目(Dinoflagellata)、有孔虫界、丝足虫类(Cercozoa)、有孔虫类(Foraminifera)、放射虫类(Radiolaria)及其组合。在一些情况下,原生生物可以是古虫界(Excavata)。古虫界可以是眼虫动物界(Euglenozoa)、透色门(Percolozoa)、后滴门(Metamonada)及其组合。在一些情况下,非宿主可以是变形虫界(Amoebozoa)、Hacrobia、无根虫门(Apusozoa)、后鞭毛生物(Opisthokonta)和/或领鞭毛虫门(Choanozoa)。
非受试者核酸序列可以源自病毒。病毒的示例包括但不限于腺病毒、柯萨奇病毒、爱泼斯坦-巴尔病毒、肝炎病毒(例如甲型、乙型和丙型肝炎)、单纯疱疹病毒(1型和2型)、巨细胞病毒、疱疹病毒、HIV、流感病毒、麻疹病毒、腮腺炎病毒、乳头瘤病毒、副流感病毒、脊髓灰质炎病毒、呼吸道合胞病毒、风疹病毒和水痘-带状疱疹病毒。由病毒引起的疾病或病况的示例包括但不限于感冒、流感、肝炎、艾滋病、水痘、风疹、腮腺炎、麻疹、疣和小儿麻痹症。
非受试者核酸可以源自原生动物,例如棘阿米巴属(Acanthamoeba)(例如,阿斯特罗尼棘阿米巴(A.astronyxis)、卡氏棘阿米巴(A.castellanii)、柯氏棘阿米巴(A.culbertsoni)、哈氏棘阿米巴(A.hatchetti)、多噬棘阿米巴(A.polyphaga)、条脊棘阿米巴(A.rhysodes)、A.healyi、A.divionensis)、短粒虫属(Brachiola)(例如康氏短粒虫(B.connori)、小泡短粒虫(B.vesicularum))、隐孢子虫属(Cryptosporidium)(例如微小隐孢子虫(C.parvum))、环孢子虫属(Cyclospora)(例如圆孢子虫(C.cayetanensis))、脑炎微孢子虫属(Encephalitozoon)(例如兔脑炎微孢子虫(E.cuniculi)、海伦脑炎微孢子虫(E.hellem)、肠脑炎微孢子虫(E.intestinalis))、内阿米巴属(Entamoeba)(例如溶组织内阿米巴(E.histolytica))、肠微孢子虫属(Enterocytozoon)(例如毕氏肠微孢子虫(E.bieneusi))、贾第虫属(Giardia)(例如蓝氏贾第虫(G.lamblia))、等孢子球虫属(Isospora)(例如贝氏等孢子球虫(I.belli))、微孢子虫属(Microsporidium)(例如非洲微孢虫(M.africanum)、锡兰微孢虫(M.ceylonensis)、纳氏虫属(Naegleria)(例如福氏耐格里变形虫(N.fowleri))、微粒子虫属(Nosema)(例如阿尔及尔微粒子虫(N.algerae)、眼小孢子虫(N.ocularum))、具褶孢虫属(Pleistophora)、气管普孢虫属(Trachipleistophora)(例如害人气管普孢虫(T.anthropophthera)、人气管普孢虫(T.hominis))和Vittaforma(例如角膜条微孢子虫(V.corneae))。
可以例如通过进行细胞级分的分离而从受试者的生物样品中提取和/或分离核酸。在变型中,样品处理因此可以包括以下中的一项或多项:裂解样品、破坏样品细胞中的膜、从样品中分离不需要的元件(例如RNA、蛋白质)、纯化样品中的核酸(例如DNA)以产生包含样品的非人类微生物组核酸内容物和人类基因组核酸内容物的核酸样品、从该核酸样品中扩增核酸、进一步纯化核酸样品的扩增后的核酸、对核酸样品的扩增后的核酸进行测序,及其任何组合。在变型中,裂解样品和/或破坏样品细胞中的膜可包括细胞裂解/膜破坏的物理方法(例如,珠打、氮气减压、均质化、超声处理),其省略了在测序时在表现某些微生物种类方面产生偏差的某些试剂。另外或替代地,裂解或破坏可以涉及化学方法(例如,使用去污剂、使用溶剂、使用表面活性剂等)。
在变型中,从样品中分离不需要的元件可以包括使用RNase去除RNA和/或使用蛋白酶去除蛋白质。在变型中,纯化样品中的核酸以产生核酸样品可以包括以下中的一种或多种:从生物样品中沉淀核酸(例如使用基于醇的沉淀方法);基于液-液的纯化技术(例如苯酚-氯仿萃取);基于色谱的纯化技术(例如柱吸附);在在洗脱环境(例如具有洗脱液、提供pH变化、提供温度变化等)的存在下,涉及使用被配置为结合核酸和被配置为释放核酸的结合部分结合的颗粒(例如磁珠、浮力珠、具有大小分布的珠、超声响应珠等)的纯化技术以及任何其他合适的纯化技术。
可以从生物样品中提取和/或分离核酸,以便可以进行提取和分离和/或分离,其可以在对任何污染物质(例如可能影响样品中的核酸或可促使污染核酸的物质)进行消毒的环境(例如无菌实验室通风柜、无菌室)中进行,可以控制环境温度、控制氧含量、控制二氧化碳含量和/或控制光暴露(例如,暴露于紫外线)。提取可包括裂解以破坏细胞膜并促进核酸从生物样品中的细胞释放。在一个非限制性示例中,裂解可以包括珠磨设备(例如,组织裂解仪),其被配置为与和样品混合并用于搅动样品的生物内容物的珠一起使用。在一些情况下,生物样品的处理可以包括以下中的一种或多种的组合:裂解试剂(例如蛋白酶)、加热模块和任何其他合适的裂解装置。
为了从裂解的样品中分离核酸,将样品的非核酸内容物与样品的核酸内容物分离。样品处理方法的纯化模块可以包括基于力的分离、基于大小的分离、基于结合部分的分离(例如,具有磁性结合部分、具有浮力结合部分等),和/或任何其他合适形式的分离。例如,方法的纯化操作可包括以下中的一项或多项:便于上清液提取的离心机、过滤器(例如滤板)、被配置为将裂解的样品与结合核酸内容物和/或样品废料的部分结合的流体输送模块、洗涤试剂输送系统、洗脱试剂输送系统以及用于纯化样品中核酸内容物的任何其他合适的设备。
可以对核酸分子的亚组进行测定以产生序列信息。产生序列信息的测定可以诱导测序反应。在一些情况下,测序可以针对RNA。例如,测序可以针对RNA转录。RNA测序可以包括以下中的任意一项:通过RNA纯化的染色质分离(ChlRP-Seq),全局运行测序(GRO-Seq),核糖体谱分析测序(Ribo-Seq)/ARTseqTM,RNA免疫沉淀测序(RIP-Seq)),CLIP cDNA文库的高通量测序(HITS-CLIP),交联和免疫沉淀测序(CLIP-Seq),可光活化的核糖核苷增强的交联和免疫沉淀(PAR-CLIP),单个核苷酸分辨率CLIP(iCLIP),天然延长转录测序(NET-Seq),多聚核糖体mRNA的靶向纯化(TRAP-Seq),交联、连接和杂交测序(CLASH-Seq),RNA末端测序的平行分析测序(PARE-Seq),未封端的转录本的全基因组映射(Genome-Wide Mapping ofUncapped Transcripts,GMUCT),转录本同工型测序(TIF-Seq),TSS的双端分析(PEAT)及其任何组合。在一些情况下,测序可以包含RNA结构。对RNA结构的测序可包含以下中的任一项:通过引物延伸测序(SHAPE-Seq)分析的选择性2'-羟基酰化、RNA结构的平行分析(PARS-Seq)、片段化测序(FRAG-Seq)、CXXC亲和纯化测序(CAP-Seq)、小牛肠碱性磷酸酶-烟草酸性焦磷酸酶测序(CIP-TAP)、肌苷化学清除测序(ICE)、m6A特异性甲基化RNA免疫沉淀测序(MeRIP-Seq)及其任何组合。在一些情况下,测序可以包括低水平RNA检测。低水平RNA检测可以包括:数字RNA测序、单细胞的完整转录本扩增(Quartz-Seq)、设计的基于引物的RNA测序(DP-Seq)、RNA模板的5'端的转换机制(Smart-Seq)、RNA模板版本2的5'端的转换机制(Smart-Seq2)、独特的分子标识符(UMI)、通过线性扩增测序(CEL-Seq)进行细胞表达、单细胞标记的逆转录测序(STRT-Seq)及其任何组合。在一些情况下,测序可以针对DNA。DNA测序可包括低水平DNA检测。包括低水平DNA检测的DNA测序可以包括单分子分子倒置探针(smMIP)、多置换扩增(MDA)、基于多次退火和成环的扩增循环(MALBAC)、寡核苷酸选择性测序(OS-Seq)、双重测序(Duplex-Seq)及其任意组合中的至少一种。在一些方面,测序可以包括DNA甲基化。DNA甲基化可包含以下中的至少一项:亚硫酸氢盐测序(BS-Seq)、亚硫酸氢盐后衔接子标签化(PBAT)、基于标签化的全基因组亚硫酸氢盐测序(T-WGBS)、氧化亚硫酸盐测序(oxBS-Seq)、Tet辅助的亚硫酸氢盐测序(TAB-Seq)、甲基化DNA免疫沉淀测序(MeDIP-Seq)、甲基化捕获(MethylCap)测序、甲基结合域捕获(MBDCap)测序、还原表示亚硫酸氢盐测序(RRBS-Seq)及其组合。在一些情况下,测序可以包括DNA-蛋白质相互作用。例如,包括DNA-蛋白质相互作用的测序可以包括:DNase1超敏位点测序(DNase-Seq)、MNase辅助的核小体分离测序(MAINE-Seq)、染色质免疫沉淀测序(ChIP-Seq)、甲醛辅助的调控元件分离(FAIRE-Seq)、用于转座酶可及染色质测序的测定(ATAC-Seq)、通过双端标签测序(ChlA-PET)进行染色质相互作用分析、染色质构象捕获(Hi-C/3C-Seq)、环状染色质构象捕获(4-C或4C-Seq)、染色质构象捕获碳拷贝(5-C)及其组合。在一些情况下,测序可以包括重排。序列重排的测序可包括以下中的至少一种:逆转录转座子捕获测序(RC-Seq)、转座子测序(Tn-Seq)或插入测序(INSeq)、易位捕获测序(TC-Seq)及其组合。
测序分析可以包括PCR扩增,例如16S核糖体RNA基因的分段,以及使用深度测序的非靶向宏基因组学方法。在一些实施方案中,方法可以包括,用于下一代扩增和测序的方法,包括:同时扩增一组微生物中的每一种的整个16S区域,使所述一组微生物中的每一种的整个16S区域的扩增子片段化以产生一组扩增子片段,并基于该组扩增子片段生成分析,其中所述分析包括微生物种群特征、微生物物种鉴定和鉴定的靶微生物序列中的至少一个。在一些情况下,可以利用整个外显子组测序。
在一些情况下,方法可以包括在非人类基因组的遗传水平上进行比对。例如,比对可以包括相对于18S序列、相对于ITS序列等比对16S序列。因此,输出可用于鉴定感兴趣的特征,该感兴趣的特征可用于表征生物样品的微生物组,其中所述特征可以是非人类的(例如,存在细菌属),基于遗传的(例如,基于特定遗传区域和/或序列的表现),和/或基于任何其他合适的等级。
在变型中,可以使用包括以下中的一种或多种的比对算法来进行对参考非人类基因组(例如细菌基因组)(例如,由国家生物技术信息中心提供)的比对和映射:Needleman-Wunsch算法,其基于全局比对的评分(例如,在插入、缺失、匹配、错配方面),以终止条件执行两个读段(例如,测序读段和参考读段)的全局比对;Smith-waterman算法,其执行两个读段(例如测序读段和参考读段)的局部比对,并对局部比对进行评分(例如,在插入、缺失、匹配、错配方面);基本局部比对搜索工具(Basic Local Alignment Search Tool,BLAST),其鉴定序列(例如,测序读段和参考读段)之间的局部相似性区域;FPGA加速比对工具;使用BWA工具进行的BWT索引;使用SOAP工具进行的BWT索引;使用Bowtie工具进行的BWT索引;通过散列算法(SSAHA2)进行的序列搜索和比对(SSAHA2),该散列算法使用单词散列(wordhashing)和动态编程将核酸测序读段映射到基因组参考序列上;以及任何其他合适的比对算法。未鉴定序列的映射还可包括映射到参考病毒基因组和/或真菌基因组,以便进一步鉴定个体的微生物组的病毒和/或真菌成分。例如,可以用平行或串联的并与细菌标记、真菌标记和真核标记中的一种或多种相关联的多种标记(例如,第一标记、第二标记、第三标记、第N标记)进行PCR。此外,可以基于比对算法的输出来组装重叠的读段(例如,由双端测序(paired-end sequencing)产生的读段),或者可以将比对的序列读段与参考序列合并(例如,使用隐马尔可夫模型带技术、使用Durbin-Holmes技术)。但是,比对和映射可以实现任何其他合适的算法或技术。在一些情况下,可以对序列读段进行编码,以便于进行比对和映射操作。在一个示例中,根据排列0000TGCA,可以将序列的每个碱基编码为字节,其中如果碱基被测序为可能包含碱基A(例如,A表示为00000001),则最低有效位为1;如果碱基被测序为可能包含碱基C(例如,C表示为00000010),则下一个有效位为1;如果碱基被测序为可能包含碱基G(例如,G表示为00000100),则下一个有效位为1;如果基序被测序为可能包含碱基T(例如T表示为00001000),则下一个有效位为1。在该示例中,将四个最高有效位设置为零。但是,示例的可替选变型可以以任何其他合适的方式编码碱基。此外,扩增期间使用的预定引物序列可用于修整序列读段以省略引物序列,以提高比对和映射的效率。
核酸分子的亚组可以包含一个或多个本文公开的基因组。核酸分子的亚组可包含1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、11个或更多、12个或更多、13个或更多、14个或更多、15个或更多、20个或更多、25个或更多、30个或更多、35个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多或100个或更多的基因组。一个或多个基因组可以是相同、相似、不同的,或其组合。在一些情况下,存在两个核酸亚组,图6A。
核酸分子的亚组可包含本文公开的一个或多个基因组特征。核酸分子的亚组可包含1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、11个或更多、12个或更多、13个或更多、14个或更多、15个或更多、20个或更多、25个或更多、30个或更多、35个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多或100个或更多的基因组特征。一个或更多的基因组特征可以是相同、相似、不同的,或其组合。
核酸分子亚组可以包含不同大小的核酸分子。核酸分子亚组中的核酸分子的长度可以被称为核酸分子的大小。核酸分子亚组中的核酸分子的平均长度可以被称为核酸分子的平均大小。如本文所用,术语“核酸分子的大小”、“核酸分子的平均大小”、“分子大小”和“平均分子大小”可以互换使用。核酸分子的大小可用于区分两个或更多个核酸分子亚组。核酸分子亚组中的核酸分子的平均大小与另一个核酸分子亚组中的核酸分子的平均大小之差可用于区分核酸分子的两个亚组。一个核酸分子亚组中的核酸分子的平均大小可以大于至少一个其他核酸分子亚组中的核酸分子的平均大小。一个核酸分子亚组中的核酸分子的平均大小可以小于少一个其他核酸分子亚组中的核酸分子的平均大小。两个或更多个核酸分子亚组之间的平均分子大小之差可为至少约50;75;100;125;150;175;200;225;250;275;300;350;400;450;500;550;600;650;700;750;800;850;900;950;1,000;1100;1200;1300;1400;1500;1600;1700;1800;1900;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;15,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000个或更多个碱基或碱基对。在本公开内容的一些方面,两个或更多个核酸分子亚组之间的平均分子大小之差为至少约200个碱基或碱基对。或者,两个或更多个核酸分子亚组之间的平均分子大小之差为至少约300个碱基或碱基对。
核酸分子亚组可以包含不同测序大小的核酸分子。在待测序的核酸分子亚组中的核酸分子的长度可以称为核酸分子的测序大小。核酸分子亚组中的核酸分子的平均长度可以称为核酸分子的平均测序大小。如本文所用,术语“核酸分子的测序大小”、“核酸分子的平均测序大小”、“分子测序大小”和“平均分子测序大小”可以互换使用。一个或多个核酸分子亚组的平均分子测序大小可以为至少约50;75;100;125;150;175;200;225;250;275;300;350;400;450;500;550;600;650;700;750;800;850;900;950;1,000;1100;1200;1300;1400;1500;1600;1700;1800;1900;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;15,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000个或更多个碱基或碱基对。核酸分子的测序大小可用于区分两个或更多个核酸分子亚组。核酸分子亚组中的核酸分子的平均测序大小与另一个核酸分子亚组中的核酸分子的平均测序大小之差可用于区分两个核酸分子亚组。一个核酸分子亚组中的核酸分子的平均测序大小可以大于至少一个其他核酸分子亚组中的核酸分子的平均测序大小。一个核酸分子亚组中的核酸分子的平均测序大小可以小于至少一个其他核酸分子亚组中的核酸分子的平均测序大小。两个或更多个核酸分子亚组之间的平均分子测序大小之差可以是至少约50;75;100;125;150;175;200;225;250;275;300;350;400;450;500;550;600;650;700;750;800;850;900;950;1,000;1100;1200;1300;1400;1500;1600;1700;1800;1900;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;15,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000个或更多个碱基或碱基对。在本公开内容的一些方面,两个或更多个核酸分子亚组之间的平均分子测序大小之差为至少约200个碱基或碱基对。或者,两个或更多个核酸分子亚组之间的平均分子测序大小之差为至少约300个碱基或碱基对。
本文公开的方法可以包括一种或多种捕获探针、多种捕获探针或一种或多种捕获探针组。通常,捕获探针包含核酸结合位点。捕获探针可以与捕获的核酸杂交。捕获探针可以包含与捕获的核酸互补的核酸序列。在一些情况下,捕获探针可以包含与捕获的核酸的一部分完全互补的核酸序列。例如,捕获探针中的每个核酸可以与捕获的核酸中的碱基互补。捕获探针可以比捕获的核酸更长。例如,捕获的核酸中的每个碱基可以与捕获探针中的碱基互补,但是捕获探针中的所有碱基并非都与捕获的核酸中的碱基互补。捕获探针可以比捕获的核酸短。例如,捕获探针的每个碱基可以与捕获的核酸的碱基互补,但是捕获的核酸中的所有碱基并非都可以与捕获探针互补。
捕获探针可以在溶液中进行捕获反应。捕获探针可以在溶液中并且可以在溶液中捕获核酸。如本文其他地方所述,随后可以分离和/或洗脱捕获的核酸。捕获探针可以在溶液中捕获核酸,然后捕获探针可以随后连接至支持物,例如固体支持物(例如,阵列或珠子)。在一些情况下,支持物可以由半固体材料(例如,凝胶)形成。
与支持物的附接可以是非共价附接。例如,核酸可以被生物素化的探针捕获,该生物素化的探针随后与抗生物素蛋白/链霉亲和素珠结合,从而将捕获的核酸复合物附接至抗生物素蛋白/链霉亲和素珠。可以使用其他结合对将捕获探针附接至表面。捕获探针可以共价附接于支持物。例如,支持物可以具有可以与捕获探针反应的化学反应性连接子,使得捕获探针与载体共价连接。
捕获探针可以附接至支持物并进行捕获反应。例如,捕获探针可以与支持物联接并且随后捕获核酸分子。支持物可以是固体或半固体(例如凝胶)材料。支持物的示例包括但不限于珠、载玻片和碎片。支持物可以是例如玻璃、二氧化硅、硅、塑料(例如聚苯乙烯)、琼脂或琼脂糖。
捕获探针还可以包含一个或多个连接子。捕获探针还可以包含一种或多种标记。一个或多个连接子可将一种或多种标记附接于核酸结合位点。在一些情况下,捕获探针可以被设计成与16S基因序列的共享区杂交。可以被设计成靶向16S基因序列共享区的捕获探针可以用于捕获来自多种物种的核酸分子,甚至还没有被鉴定和表征的物种。在一些情况下,方法可以包括被配置为靶向人类基因组序列的元件的第一多个核酸探针。在一些情况下,方法可以包括被配置为靶向非人类物种的基因组序列的元件的第二多个核酸探针。
本文公开的方法可以包括1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多、1000个或更多、5000个或更多、10,000个或更多、20,000个或更多、30,000个或更多、40,000个或更多、50,000个或更多、60,000个或更多、70,000个或更多、80,000个或更多、90,000个或更多、100,0000个或捕获探针或捕获探针组。在一些情况下,方法可包括约50,000个捕获探针。一个或多个捕获探针或捕获探针组可以是不同的、相似的、相同的,或其组合。与其他捕获探针相比,一种或多种捕获探针或捕获探针组的相对浓度可以变化。例如,某些捕获探针的浓度可以更高,以捕获可能难以捕获的核酸(例如,具有高GC含量的序列、由于序列重组而产生的序列、具有大量突变的序列、具有高突变率的序列),从而增加捕获特定核酸的可能性。
一种或多种捕获探针可包含与核酸分子样品或核酸分子亚组中的一种或多种核酸分子或其变体或其衍生物的至少一部分杂交的核酸结合位点。捕获探针可包含与一个或多个基因组杂交的核酸结合位点。捕获探针可以与不同、相似和/或相同的基因组杂交。一种或多种捕获探针可以与一种或多种核酸分子或其变体或其衍生物至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或更高互补。
捕获探针可以包含一个或多个核苷酸。捕获探针可以包括1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多的核苷酸。捕获探针可以包含约100个核苷酸。捕获探针可包含约10至约500个核苷酸、约20至约450个核苷酸、约30至约400个核苷酸、约40至约350个核苷酸、约50至约300个核苷酸、约60至约250个核苷酸、约70至约200个核苷酸或约80至约150个核苷酸。在本公开内容的一些方面,捕获探针包含约80个核苷酸至约100个核苷酸。
多个捕获探针或捕获探针组可包含具有相同、相似和/或不同的核酸结合位点序列、连接子和/或标记的两个或更多个捕获探针。例如,两个或更多个捕获探针包含相同的核酸结合位点。在另一个示例中,两个或更多个捕获探针包含相似的核酸结合位点。在另一个示例中,两个或更多个捕获探针包含不同的核酸结合位点。两个或更多个捕获探针还可以包含一个或多个连接子。两个或更多个捕获探针还可以包含不同的连接子。两个或更多个捕获探针还可以包含相似的连接子。两个或更多个捕获探针还可以包含相同的连接子。两个或更多个捕获探针还可以包含一种或多种标记。两个或更多个捕获探针还可以包含不同的标记。两个或更多个捕获探针还可以包含相似的标记。两个或更多个捕获探针还可以包含相同的标记。
测定可以包括但不限于测序、扩增、杂交、富集、分离、洗脱、片段化、检测、定量一种或多种核酸分子。测定可以包括用于制备一种或多种核酸分子的方法。测定可以包括常规测定、长读段、高GC含量和杂交测定,图9。可以执行任何数量的测定。多个测定可以是1、2、3、4、5、6、7、8、9或多达10个测定。例如,图6B示出了显示利用两个测定的示意图。类似地,可以对来自一个或多个测定的数据进行任何数量的分析。分析的数量可以是对来自一个或多个测定的数据的1、2、3、4、5、6、7、8、9或至多10个分析。例如,图6C示出了正在执行的两个不同的分析。在一些情况下,分析是生物信息学分析,图8。可以使用任何数量的方案进行测定。例如,可以使用1、2、3、4、5、6、7、8、9或多达10种方案。图6D提供了利用4种方案的示意图。
本文公开的方法可以包括对样品中的一种或多种核酸分子进行一个或多个测序反应。本文公开的方法可包括对样品中的一种或多种核酸分子进行1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、15个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、200个或更多、300个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多个测序反应。测序反应可以同时进行、依次进行或以其组合进行。测序反应可以包括全基因组测序或外显子组测序。测序反应可包括Maxim-Gilbert、链终止或高通量系统。可替选地或另外地,测序反应可以包括HelioscopeTM单分子测序、纳米孔DNA测序、Lynx Therapeutics的大规模平行签名测序(MPSS)、454焦磷酸测序、单分子实时(RNAP)测序、Illumina(Solexa)测序、SOLiD测序、Ion TorrentTM、离子半导体测序、单分子SMRT(TM)测序、Polony测序、DNA纳米球测序、VisiGen Biotechnologies方法或其组合。可替选地或另外地,测序反应可以包含一个或多个测序平台,包括但不限于Illumina提供的Genome Analyzer IIx、HiSeq和MiSeq、单分子实时(SMRTTM)技术(例如由Pacific Biosciences(加利福尼亚)和SolexaSequencer提供的PacBioRS系统)、真正单分子测序(tSMSTM)技术(例如由Helicos Inc.(剑桥,马萨诸塞州)提供的HeliScopeTM Sequencer)。测序反应还可以包括电子显微镜或化学敏感的场效应晶体管(chemFET)阵列。在本公开内容的一些方面,测序反应包括毛细管测序、下一代测序、Sanger测序、通过合成的测序、通过连接的测序、通过杂交的测序、单分子测序或其组合。通过合成的测序可包括可逆终止子测序、渐进性单分子测序、顺序流测序或其组合。顺序流测序可以包括焦磷酸测序、pH介导的测序、半导体测序或其组合。
本文公开的方法可以包括进行至少一种长读段测序反应和至少一种短读段测序反应。图18中示出了包括长读段和短读段测序的方法的示例。可以对核酸分子亚组的至少一部分进行长读段测序反应和/或短读段测序反应。可以对两个或更多个核酸分子亚组的至少一部分进行长读段测序反应和/或短读段测序反应。可以在一个或多个核酸分子亚组的至少一部分上进行长读段测序反应和短读段测序反应。
对一种或多种核酸分子或其亚组的测序可包含至少约5;10;15;20;25;30;35;40;45;50;60;70;80;90;100;200;300;400;500;600;700;800;900;1,000;1500;2,000;2500;3,000;3500;4,000;4500;5,000;5500;6,000;6500;7,000;7500;8,000;8500;9,000;10,000;25,000;50,000;75,000;100,000;250,000;500,000;750,000;10,000,000;25,000,000;50,000,000;100,000,000;250,000,000;500,000,000;750,000,000;1,000,000,000或更多个测序读段。
测序反应可包括对一种或多种核酸分子的至少约50;60;70;80;90;100;110;120;130;140;150;160;170;180;190;200;210;220;230;240;250;260;270;280;290;300;325;350;375;400;425;450;475;500;600;700;800;900;1,000;1500;2,000;2500;3,000;3500;4,000;4500;5,000;5500;6,000;6500;7,000;7500;8,000;8500;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000或更多个碱基或碱基对进行测序。测序反应可包括对一种或多种核酸分子的至少约50;60;70;80;90;100;110;120;130;140;150;160;170;180;190;200;210;220;230;240;250;260;270;280;290;300;325;350;375;400;425;450;475;500;600;700;800;900;1,000;1500;2,000;2500;3,000;3500;4,000;4500;5,000;5500;6,000;6500;7,000;7500;8,000;8500;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000或更多个连续碱基或碱基对进行测序。
在本公开内容的方法中使用的测序技术可以产生每次运行至少100个读段、每次运行至少200个读段、每次运行至少300个读段、每次运行至少400个读段、每次运行至少500个读段、至少600个每次运行的读段次数、每次运行至少700个读段、每次运行至少800个读段、每次运行至少900个读段、每次运行至少1000个读段、每次运行至少5,000个读段、每次运行至少10,000个读段、每次运行至少50,000个读段、每次运行至少100,000个读段、每次运行至少500,000个读段、或者每次运行至少1,000,000个读段。或者,在本公开内容的方法中使用的测序技术可以产生每次运行至少1,500,000个读段、每次运行至少2,000,000个读段、每次运行至少2,500,000个读段、每次运行至少3,000,000个读段、每次运行至少3,500,000个读段、每次运行至少4,000,000个读段、每次运行至少4,500,000个读段或者每次运行至少5,000,000个读段。
在本公开内容的方法中使用的测序技术可以产生每个读段至少约30个碱基对、至少约40个碱基对、至少约50个碱基对、至少约60个碱基对、至少约70个碱基对、至少约80个碱基对、至少约90个碱基对、至少约100个碱基对、至少约110个、至少约120个碱基对、至少约150个碱基对、至少约200个碱基对、至少约250个碱基对、至少约300个碱基对、至少约350个碱基对、至少约400个碱基对、至少约450个碱基对、至少约500个碱基对、至少约550个碱基对、约600个碱基对、至少约700个碱基对、至少约800个碱基对、至少约900个碱基对或至少大约1,000个碱基对。或者,在本公开内容的方法中使用的测序技术可以产生长的测序读段。在一些情况下,在本公开内容的方法中使用的测序技术可以产生至少约1200个碱基对/读段、至少约1500个碱基对/读段、至少约1800个碱基对/读段、至少约2000个碱基对/读段、至少约2500个碱基对/读段、至少约3,000个碱基对/读段、至少约3500个碱基对/读段、至少约4,000个碱基对/读段、至少约4,500个碱基对/读段、至少约5,000个碱基对/读段、至少约6,000个碱基对/读段、至少约7,000个碱基对/读段、至少约8,000个碱基对/读段、至少约9,000个碱基对/读段、至少约10,000个碱基对/读段、20,000个碱基对/读段、30,000个碱基对/读段、40,000个碱基对/读段、50,000个碱基对/读段、60,000个碱基对/读段、70,000个碱基对/读段、80,000个碱基对/读段、90,000个碱基对/读段或100,000个碱基对/读段。
高通量测序系统可允许在将测序的核苷酸掺入到生长链中之后或时立即检测测序的核苷酸,即实时或基本实时的序列检测。在一些情况下,高通量测序每小时产生至少1,000、至少5,000、至少10,000、至少20,000、至少30,000、至少40,000、至少50,000、至少100,000或至少500,000个序列读段;其中每个读段为至少50、至少60、至少70、至少80、至少90、至少100、至少120、至少150、至少200、至少250、至少300、至少350、至少400、至少450或至少500个碱基/读段。可以使用本文所述的核酸例如基因组DNA、源自RNA转录物的cDNA或RNA作为模板来进行测序。
本文公开的方法可以包括对样品中的一种或多种核酸分子进行一个或多个扩增反应。术语“扩增”是指产生核酸分子的至少一个拷贝的任何过程。术语“扩增子”和“扩增的核酸分子”是指核酸分子的拷贝并且可以互换使用。扩增反应可以包括基于PCR的方法、基于非PCR的方法或其组合。基于非PCR的方法的示例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环-环扩增。基于PCR的方法可以包括但不限于PCR、HD-PCR、下一代PCR、数字RTA或其任何组合。其他PCR方法包括但不限于线性扩增、等位基因特异性PCR、Alu PCR、组装PCR、不对称PCR、液滴PCR、乳液PCR、解旋酶依赖性扩增HDA、热启动PCR、反向PCR、指数后线性(LATE)-PCR(linear-after-the-exponential(LATE)-PCR)、长PCR、多重PCR、嵌套式PCR、半嵌套式PCR、定量PCR、RT-PCR、实时PCR、单细胞PCR和降落PCR。
本文公开的方法可以包括对样品中的一种或多种核酸分子进行一个或多个杂交反应。杂交反应可以包括一种或多种捕获探针与核酸分子的样品或亚组中的一种或多种核酸分子的杂交。杂交反应可以包括使一种或多种捕获探针组与核酸分子的样品或亚组中的一种或多种核酸分子杂交。杂交反应可包括一个或多个杂交阵列、多重杂交反应、杂交链反应、等温杂交反应、核酸杂交反应或其组合。一个或多个杂交阵列可包括杂交阵列基因分型、杂交阵列比例感测、DNA杂交阵列、宏阵列、微阵列、高密度寡核苷酸阵列、基因组杂交阵列、比较杂交阵列或其组合。杂交反应可包含一种或多种捕获探针、一种或多种珠子、一种或多种标记、一个或多个核酸分子亚组、一个或多个核酸样品、一种或多种试剂、一种或多种洗涤缓冲液、一种或多种洗脱缓冲液、一种或多种杂交缓冲液、一个或多个杂交室、一个或多个培养箱、一个或多个分离器或其组合。
本文公开的方法可以包括对样品中的一种或多种核酸分子进行一个或多个富集反应。富集反应可包括使样品与一种或多种珠子或珠子组接触。富集反应可以包括基于一个或多个基因组特征的两个或更多个核酸分子亚组的差异扩增。例如,富集反应包括基于GC含量的两个或更多个核酸分子亚组的差异扩增。可替选地或另外地,富集反应包括基于甲基化状态的两个或更多个核酸分子亚组的差异扩增。富集反应可以包括一个或多个杂交反应。富集反应还可以包括对一种或多种杂交的核酸分子、一种或多种珠子结合的核酸分子、一种或多种游离的核酸分子(例如无捕获探针的核酸分子、不含珠子的核酸分子)、一种或多种标记的核酸分子、一种或多种未标记的核酸分子、一种或多种扩增子、一种或多种未扩增的核酸分子或其组合的分离和/或纯化。可替选地或另外地,富集反应可以包括富集样品中的一种或多种细胞类型。一种或多种细胞类型可通过流式细胞术富集。
一个或多个富集反应可以产生一种或多种富集的核酸分子。富集的核酸分子可以包含核酸分子或其变体或其衍生物。例如,富集的核酸分子包括一种或多种杂交的核酸分子、一种或多种珠子结合的核酸分子、一种或多种游离的核酸分子(例如无捕获探针的核酸分子、不含珠子的核酸分子)、一种或多种标记的核酸分子、一种或多种未标记的核酸分子、一种或多种扩增子、一种或多种未扩增的核酸分子或其组合。可以通过GC含量、分子大小、基因组、基因组特征或其组合将富集的核酸分子与非富集的核酸分子区分开。富集的核酸分子可以源自一个或多个测定、上清液、洗脱液或其组合。富集的核酸分子可以在平均大小、平均GC含量、基因组或其组合方面与未富集的核酸分子不同。在一些情况下,富集可包括针对不同的基因组区域富集的多个DNA亚组,其在组合用于测序测定之前经历独立的处理操作,图15。在一些情况下,富集可包括针对不同的基因组区域富集的多个DNA亚组,其在被独立测序和分析之前经历独立的处理操作,图16。
本文公开的方法可以包括对样品中的一种或多种核酸分子进行一个或多个分离或纯化反应。分离或纯化反应可包括使样品与一种或多种珠子或珠子组接触。分离或纯化反应可以包括一个或多个杂交反应、富集反应、扩增反应、测序反应或其组合。分离或纯化反应可包括使用一个或多个分离器。一个或多个分离器可包括磁性分离器。分离或纯化反应可包括将珠子结合的核酸分子与不含珠子的核酸分子分离。分离或纯化反应可以包括将捕获探针杂交的核酸分子与无捕获探针的核酸分子分离。分离或纯化反应可包括将核酸分子的第一亚组与核酸分子的第二亚组分离,其中核酸分子的第一亚组与核酸分子的第二亚组在平均大小、平均GC含量、基因组或其组合方面不同。
本文公开的方法可以包括对样品中的一种或多种核酸分子进行一个或多个洗脱反应。洗脱反应可包括使样品与一种或多种珠子或珠子组接触。洗脱反应可包括将珠子结合的核酸分子与不含珠子的核酸分子分离。洗脱反应可包括将捕获探针杂交的核酸分子与无捕获探针的核酸分子分离。洗脱反应可包括将核酸分子的第一亚组与核酸分子的第二亚组分离,其中核酸分子的第一亚组与核酸分子的第二亚组在平均大小、平均GC含量、基因组或其组合方面不同。
本文公开的方法可以包括一个或多个片段化反应。片段化反应可以包括使核酸分子的样品或亚组中的一种或多种核酸分子片段化以产生一种或多种片段化的核酸分子。一种或多种核酸分子可通过超声处理、针剪切、雾化、剪切(例如声学剪切、机械剪切、点-槽剪切(point-sink shearing))、通过French压力池的通道或酶消化来进行片段化。酶消化可以通过核酸酶消化来进行(例如,微球菌核酸酶消化、核酸内切酶、核酸外切酶、RNA酶H或DNA酶I)。一种或多种核酸分子的片段化可产生约100个碱基对至约2000个碱基对、约200个碱基对至约1500个碱基对、约200个碱基对至约1000个碱基对、约200个碱基对至约500个碱基对、约500个碱基对至约1500个碱基对以及约500个碱基对至约1000个碱基对的片段大小。一个或多个片段化反应可产生约50个碱基对至约1000个碱基对的片段大小。一个或多个片段化反应可产生约100个碱基对、150个碱基对、200个碱基对、250个碱基对、300个碱基对、350个碱基对、400个碱基对、450个碱基对、500个碱基对、550个碱基对、600个碱基对、650个碱基对、700个碱基对、750个碱基对、800个碱基对、850个碱基对、900个碱基对、950个碱基对、1000个碱基对或更大的片段大小。
使一种或多种核酸分子片段化可包括在一段时间内机械剪切样品中的一种或多种核酸分子。片段化反应可能发生至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150,175、200、225、250、275、300、325、350、375、400、425、450、475、500或更多秒。
使一种或多种核酸分子片段化可包括使核酸样品与一种或多种珠子接触。使一种或多种核酸分子片段化可包括使核酸样品与多个珠子接触,其中多个珠子的体积与核酸样品的体积的比值为约0.10、0.20、0.30、0.40、0.50,0.60、0.70、0.80、0.90、1.00、1.10、1.20、1.30、1.40、1.50、1.60、1.70、1.80、1.90、2.00或更高。使一种或多种核酸分子片段化可包括使核酸样品与多个珠子接触,其中多个珠子的体积与核酸的体积的比值为约2.00、1.90、1.80、1.70、1.60,1.50、1.40、1.30、1.20、1.10、1.00、0.90、0.80、0.70、0.60、0.50、0.40、0.30、0.20、0.10、0.05、0.04、0.03、0.02、0.01或更低。
本文公开的方法可以包括对样品中的一种或多种核酸分子进行一个或多个检测反应。检测反应可以包括一个或多个测序反应。或者,进行检测反应包括光学感测、电气感测或其组合。光学感测可以包括对光致发光光子发射、荧光光子发射、焦磷酸盐光子发射、化学发光光子发射或其组合的光学感测。电气感测可以包括对离子浓度、离子电流调制、核苷酸电场、核苷酸隧穿电流或其组合的电气感测。
本文公开的方法可以包括对样品中的一种或多种核酸分子进行一个或多个定量反应。定量反应可以包括测序、PCR、qPCR、数字PCR或其组合。
本文公开的方法可以包括一个或多个样品。本文公开的方法可以包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个样品。该样品可以源自受试者。两个或更多个样品可以源自单个受试者。两个或更多个样品可以源自2、3、4、5、6、7、8、9、10、11、12、13、14、15、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个不同的受试者。受试者可以是哺乳动物、爬行动物、两栖动物、禽类和鱼类。哺乳动物可以是人类、猿、猩猩、猴子、黑猩猩、牛、猪、马、啮齿动物、狗、猫或其他动物。爬行动物可能是蜥蜴、蛇、短吻鳄、海龟、鳄鱼和陆龟。两栖动物可以是蟾蜍、青蛙、水螈和火蜥蜴。禽类的示例包括但不限于鸭、鹅、企鹅、鸵鸟和猫头鹰。鱼类的示例包括但不限于鲶鱼、鳗鱼、鲨鱼和剑鱼。受试者可以是人类。受试者可以患有疾病或病况。
可以在1、2、3、4、5、6、7、8、9、10、11、12、15、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个或时间点上收集两个或更多个样品。时间点可以发生在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60或更多个小时的时间段。时间点可以发生在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60或更多天的时间段。时间点可以发生在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60或更多个星期的时间段。时间点可以发生在1、2、3、4、5、6、7、8、9、10、11、12、13、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60或更多个月的时间段。时间点可以发生在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60或更多年的时间段。
在一些情况下,方法可以包括从受试者获得生物样品。受试者可以是人类或非人类。受试者可以是成人或儿童。在一些情况下,成年受试者可以是18岁或18岁以上。在一些情况下,受试者的生物样品可以来源于肿瘤活检、全血或血浆。在一些情况下,生物样品可以来自体液、细胞、皮肤、组织、器官或其组合。样品可以是血液、血浆、血液级分、唾液、痰、尿液、精液、经阴道液、脑脊髓液、粪便、细胞或组织活检。样品可以来自肾上腺、阑尾、膀胱、大脑、耳朵、食道、眼睛、胆囊、心脏、肾脏、大肠、肝、肺、口、肌肉、鼻子、胰腺、甲状旁腺、松果腺、垂体腺、皮肤、小肠、脾脏、胃、胸腺、甲状腺、气管、子宫、蠕虫状阑尾、角膜、皮肤、心脏瓣膜、动脉或静脉。
样品可包含一种或多种核酸分子。核酸分子可以是DNA分子、RNA分子(例如mRNA、cRNA或miRNA)和DNA/RNA杂合体。DNA分子的示例包括但不限于双链DNA、单链DNA、单链DNA发夹、cDNA、基因组DNA。核酸可以是RNA分子,例如双链RNA、单链RNA、ncRNA、RNA发夹和mRNA。ncRNA的示例包括但不限于siRNA、miRNA、snoRNA、piRNA、tiRNA、PASR、TASR、aTASR、TSSa-RNA、snRNA、RE-RNA、uaRNA、x-ncRNA、hYRNA、usRNA、snaR和vtRNA。
本文公开的方法可以包括一个或多个容器。本文公开的方法可以包括1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多个容器。一个或多个容器可以是不同的、相似的、相同的,或其组合。容器的示例包括但不限于板、微板、PCR板、孔、微孔、管、Eppendorf管、小瓶、阵列、微阵列和碎片。
本文公开的方法可以包括一个或多个试剂。本文公开的方法可以包括1个或更多个、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多个试剂。一个或多个试剂可以是不同的、相似的、相同的,或其组合。试剂可以提高一个或多个测定的效率。试剂可以提高核酸分子或其变体或其衍生物的稳定性。试剂可以包括但不限于酶、蛋白酶、核酸酶、分子、聚合酶、逆转录酶、连接酶和化合物。本文公开的方法可以包括进行包括一种或多种抗氧化剂的测定。通常,抗氧化剂是抑制另一分子氧化的分子。抗氧化剂的示例包括但不限于抗坏血酸(例如维生素C)、谷胱甘肽、硫辛酸、尿酸、胡萝卜素、α-生育酚(例如维生素E)、泛醇(例如辅酶Q)和维生素A。
本文公开的方法可以包括一个或多个缓冲液或溶液。本文公开的方法可以包括1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多个缓冲液或溶液。一个或多个缓冲液或溶液可以是不同的、相似的、相同的,或其组合。缓冲液或溶液可以提高一个或多个测定的效率。缓冲液或溶液可以提高核酸分子或其变体或其衍生物的稳定性。缓冲液或溶液可包括但不限于洗涤缓冲液、洗脱缓冲液和杂交缓冲液。
本文公开的方法可以包括一种或多种珠子、多个珠子或一种或多种珠子组。本文公开的方法可以包括1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多个一种或多种珠子或珠子组。一个或多个珠子或珠子组可以是不同的、相似的、相同的,或其组合。珠子可以是磁性的、抗体包被的、蛋白A交联的、蛋白G交联的、链霉亲和素包被的、寡核苷酸缀合的、二氧化硅包被的或其组合。珠子的示例包括但不限于Ampure珠子、AMPure XP珠子、链霉亲和素珠子、琼脂糖珠子、磁性珠子、
Figure BDA0002923581330000481
Figure BDA0002923581330000482
微珠、抗体缀合的珠子(例如抗免疫球蛋白微珠)、蛋白A缀合的珠子、蛋白G缀合的珠子、蛋白A/G缀合的珠子、蛋白L缀合的珠子、寡聚胸腺嘧啶核苷酸(oligo-dT)缀合的珠子、二氧化硅珠子、类二氧化硅珠子、抗生物素微珠、抗荧光染料微珠和BcMagTM羧基端接的磁珠。在本公开内容的一些方面,一种或多种珠子包括一种或多种Ampure珠子。可替选地或另外地,一种或多种珠子包括AMPure XP珠子。
本文公开的方法可以包括一种或多种引物、多个引物或一种或多种引物组。引物还可以包含一个或多个连接子。引物还可以包含一种或多种标记。引物可用于一个或多个测定中。例如,引物用于一个或多个测序反应、扩增反应或其组合中。本文公开的方法可以包括1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多个一种或多种引物或引物组。引物可包含约100个核苷酸。引物可包含约10至约500个核苷酸、约20至约450个核苷酸、约30至约400个核苷酸、约40至约350个核苷酸、约50至约300个核苷酸、约60至约250个核苷酸、约70至约200个核苷酸或约80至约150个核苷酸。在本公开内容的一些方面,引物包含约80个核苷酸至约100个核苷酸。一个或多个引物或引物组可以是不同的、相似的、相同的,或其组合。
引物可与核酸分子的样品或亚组中的一种或多种核酸分子或其变体或其衍生物的至少一部分杂交。引物可以与一个或多个基因组杂交。引物可以与不同、相似和/或相同的基因组杂交。一种或多种引物可以与一种或多种核酸分子或其变体或其衍生物互补至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或更高。
引物可以包含一个或多个核苷酸。引物可包含1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多个核苷酸。引物可包含约100个核苷酸。引物可包含约10至约500个核苷酸、约20至约450个核苷酸、约30至约400个核苷酸、约40至约350个核苷酸、约50至约300个核苷酸、约60至约250个核苷酸、约70至约200个核苷酸或约80至约150个核苷酸。在本公开内容的一些方面,引物包含约80个核苷酸至约100个核苷酸。
多个引物或引物组可以包含具有相同、相似和/或不同序列、连接子和/或标记的两个或更多个引物。例如,两个或更多个引物包含相同的序列。在另一个示例中,两个或更多个引物包含相似的序列。在又一个示例中,两个或更多个引物包含不同的序列。两个或更多个引物还可以包含一个或多个连接子。两个或更多个引物还可以包含不同的连接子。两个或更多个引物还可以包含相似的连接子。两个或更多个引物还可以包含相同的连接子。两个或更多个引物还可以包含一种或多种标记。两个或更多个引物还可以包含不同的标记。两个或更多个引物还可以包含相似的标记。两个或更多个引物还可以包含相同的标记。
在一些情况下,可以使用通用引物,并且通用引物可以包含以下中的一种或多种:8F引物、27F引物、CC[F]引物、357F引物、515F引物、533F引物、16S.1100.F16引物、1237F引物、519R引物、CD[R]引物、907R引物、1391R引物、l492R(I)引物、1492R(s)引物、U1492R引物、928F引物、336R引物、1100F引物、1100R引物、337F引物、785F引物、805R引物、518R引物和任何其他合适的通用引物。或者,对于特异性引物可能适合的样品,可以使用特异性引物进行扩增。在示例中,特异性的引物可以包括:CYA106引物(用于蓝藻菌)、CYA359F引物(用于蓝藻菌)、895F引物(用于不包括质体和蓝藻菌的细菌)、CYA781R引物(用于蓝藻菌)、902R引物(用于不包括质体和蓝藻菌的细菌)、904R引物(用于不包括质体和蓝藻菌的细菌)、1100R引物(用于细菌)、1l85mR引物(用于不包括质体和蓝藻菌的细菌)、1l85aR引物(用于地衣相关的根瘤菌目)、1381R引物(用于不包括星绿藻属(Asterochloris)物种质体的细菌)或任何其他合适的特异性引物。
捕获探针、引物、标记和/或珠子可包含一种或多种核苷酸。一种或多种核苷酸可包含RNA、DNA、DNA和RNA残基的混合物或它们的修饰类似物,例如2'-OMe或2'-氟(2'-F)、锁核酸(LNA)或无碱基位点。
本文公开的方法可以包括一种或多种标记。本文公开的方法可以包括1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多个的一种或多种标记。一个或多个标记可以是不同的、相似的、相同的,或其组合。
标记的示例包括但不限于化学标记、生化标记、生物标记、比色标记、酶促标记、荧光标记和发光标记。标记包括染料、光交联剂、细胞毒性化合物、药物、亲和性标记、光亲和性标记、反应性化合物、抗体或抗体片段、生物材料、纳米颗粒、自旋标记、荧光团、含有金属的部分、放射性部分、新的官能团、与其他分子共价或非共价相互作用的基团、光笼部分(photocaged moiety)、光化性辐射可激发部分、配体、可光异构化的部分、生物素、生物素类似物、结合重原子的部分、可化学裂解基团、可光裂解基团、氧化还原活性剂、同位素标记的部分、生物物理探针、磷光性基团、化学发光基团、电子致密基团、磁性基团、嵌入基团、发色团、能量转移剂、生物活性剂、可检测标记或其组合。
标记可以是化学标记。化学标记的示例可以包括但不限于生物素和放射性同位素(例如,碘、碳、磷酸盐、氢)。
本文公开的方法、试剂盒和组合物可包含生物标记。生物标记可以包括代谢标记,包括但不限于生物正交叠氮化物修饰的氨基酸、糖和其他化合物。
本文公开的方法、试剂盒和组合物可以包含酶标记。酶标记可以包括但不限于辣根过氧化物酶(HRP)、碱性磷酸酶(AP)、葡萄糖氧化酶和β-半乳糖苷酶。酶标记可以是荧光素酶。
本文公开的方法、试剂盒和组合物可包含荧光标记。荧光标记可以是有机染料(例如,FITC)、生物荧光团(例如,绿色荧光蛋白)或量子点。荧光标记的非限制性列表包括异硫氰酸荧光素(FITC)、DyLight Fluors、荧光素、若丹明(异硫氰酸四甲基若丹明,TRITC)、香豆素、荧光黄(Lucifer Yellow)和BODIPY。标记可以是荧光团。荧光团的示例包括但不限于:吲哚碳菁(C3)、吲哚二碳菁(C5)、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、德克萨斯红、太平洋蓝、俄勒冈绿488、Alexa
Figure BDA0002923581330000511
-355、Alexa Fluor 488、Alexa Fluor 532、Alexa Fluor 546、Alexa Fluor-555、Alexa Fluor 568、Alexa Fluor 594、Alexa Fluor 647、Alexa Fluor660、Alexa Fluor 680、JOE、Lissamine、若丹明绿、BODIPY、异硫氰酸荧光素(FITC)、羧基荧光素(FAM)、藻红蛋白、若丹明、二氯若丹明(dRhodamine)、羧基四甲基若丹明(TAMRA)、羧基-X-若丹明(ROXTM)、LIZTM、VICTM、NEDTM、PETTM、SYBR、PicoGreen、RiboGreen等。荧光标记可以是绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、黄色荧光蛋白、藻胆蛋白(例如别藻蓝蛋白、藻青蛋白、藻红蛋白和藻红蓝蛋白)。
本文公开的方法可包含一个或多个连接子。本文公开的方法可以包括1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、20个或更多、30个或更多、40个或更多、50个或更多、60个或更多、70个或更多、80个或更多、90个或更多、100个或更多、125个或更多、150个或更多、175个或更多、200个或更多、250个或更多、300个或更多、350个或更多、400个或更多、500个或更多、600个或更多、700个或更多、800个或更多、900个或更多或1000个或更多的一个或多个连接子。一个或多个连接子可以是不同的、相似的、相同的或其组合。
合适的连接子包括能够连接至本文公开的标记、引物和/或捕获探针的任何化合物或生物化合物。如果连接子同时连接到标记和引物或捕获探针,则合适的连接子可能够充分分离标记和引物或捕获探针。合适的连接子可不会显著干扰引物和/或捕获探针与核酸分子、其部分或其变体或其衍生物杂交的能力。合适的连接子可不会显著干扰待检测标记的能力。连接子可以是刚性的。连接子可以是柔性的。连接子可以是半刚性的。连接子可以是蛋白水解稳定的(例如,对蛋白水解切割具有抗性)。连接子可以是蛋白水解不稳定的(例如,对蛋白水解切割敏感)。连接子可以是螺旋的。连接子可以是非螺旋的。连接子可以是盘绕的。连接子可以是β-链的。连接子可包含转角构象。连接子可以是单链。连接子可以是长链。连接子可以是短链。连接子可包含至少约5个残基、至少约10个残基、至少约15个残基、至少约20个残基、至少约25个残基、至少约30个残基或至少约40个残基或更多个残基。
连接子的示例包括但不限于腙、二硫键、硫醚和肽连接子。连接子可以是肽连接子。肽连接子可包含脯氨酸残基。肽连接子可包含精氨酸、苯丙氨酸、苏氨酸、谷氨酰胺、谷氨酸或其任何组合。连接子可以是异双功能交联剂。
本文公开的方法可包括在包含一种或多种核酸分子的样品上进行的1个或更多、2个或更多、3个或更多、4个或更多、5个或更多、6个或更多、7个或更多、8个或更多、9个或更多、10个或更多、11个或更多、12个或更多、13个或更多、14个或更多、15个或更多、20个或更多、25个或更多、30个或更多、35个或更多、40个或更多、45个或更多或50个或更多个测定。两个或更多个测定可以是不同的、相似的、相同的,或其组合。例如,本文公开的方法包括进行两个或更多个测序反应。在另一个示例中,本文公开的方法包括进行两个或更多个测定,其中两个或更多个测定中的至少一个包括测序反应。在又一个示例中,本文公开的方法包括进行两个或更多个测定,其中两个或更多个测定中的至少两个包括测序反应和杂交反应。两个或更多个测定可以顺序地、同时地或以其组合来进行。例如,两个或更多个测序反应可以同时进行。在另一个示例中,本文公开的方法包括进行杂交反应,然后进行测序反应。在又一个示例中,本文公开的方法包括同时进行两个或更多个杂交反应,随后同时进行两个或更多个测序反应。可以通过一个或多个装置进行两个或更多个测定。例如,可以通过PCR仪进行两个或更多个扩增反应。在另一个示例中,可以由两个或更多个测序仪进行两个或更多个测序反应。
本文公开的方法可以包括一个或多个装置。本文公开的方法可以包括一个或多个测定,其包括一个或多个装置。本文公开的方法可以包括使用一个或多个装置来进行一个或多个操作或测定。本文公开的方法可以包括在一个或多个操作或测定中使用一个或多个装置。例如,进行测序反应可以包括一个或多个测序仪。在另一示例中,产生核酸分子的亚组可包括使用一个或多个磁性分离器。在又一个示例中,可以在一个或多个核酸样品的分析中使用一个或多个处理器。装置的示例包括但不限于测序仪、热循环仪、实时PCR仪器、磁性分离器、传输装置、杂交室、电泳仪、离心机、显微镜、成像仪、荧光计、光度计、酶标仪、计算机、处理器和生物分析仪。
本文公开的方法可以包括一个或多个测序仪。一个或多个测序仪可包括一个或多个HiSeq、MiSeq、HiScan、Genome Analyzer IIx、SOLiD测序仪、Ion Torrent PGM、454 GSJunior、Pac Bio RS或其组合。一个或多个测序仪可包括一个或多个测序平台。一个或多个测序平台可包括454 Life Technologies/Roche的GS FLX、Solexa/Illumina的基因组分析仪、Applied Biosystems的SOLiD、Complete Genomics的CGA Platform,PacificBiosciences的PacBio RS或其组合。
本文公开的方法可以包括一个或多个热循环仪。一个或多个热循环仪可用于扩增一种或多种核酸分子。本文公开的方法可以包括一个或多个实时PCR仪器。一个或多个实时PCR仪器可以包括热循环仪和荧光计。一个或多个热循环仪可用于扩增和检测一种或多种核酸分子。
本文公开的方法可以包括一个或多个磁性分离器。一个或多个磁性分离器可用于从悬浮液中分离顺磁性和铁磁性颗粒。一个或多个磁性分离器可包括一个或多个LifeStepTM生物磁性分离器、SPHEROTM FlexiMag分离器、SPHEROTM MicroMag分离器、SPHEROTM HandiMag分离器、SPHEROTM MiniTube Mag分离器、SPHEROTM UltraMag分离器、DynaMagTM磁体、DynaMagTM-2磁体,或其组合。
本文公开的方法可以包括一个或多个生物分析仪。在一些情况下,生物分析仪是一种基于芯片的毛细管电泳仪,其可以分析RNA、DNA和蛋白质。一个或多个生物分析仪可以包括Agilent的2100生物分析仪。
本文公开的方法可以包括一个或多个处理器。一个或多个处理器可以分析、编译、存储、分类、组合、评估或以其他方式处理来自一个或多个测定的一个或多个数据和/或结果、基于或源自一个或多个测定的一个或多个数据和/或结果、来自一个或多个测定的一个或多个输出、基于或源自一个或多个测定的一个或多个输出、来自一个或多个数据和/或结果的一个或多个输出、基于或源自一个或多个数据和/或结果的一个或多个输出,或其组合。在一些情况下,本文公开的方法可以包括组合数据以进行分析,如图17所示。一个或多个处理器可以发送来自一个或多个测定的一个或多个数据、结果或输出;基于或源自一个或多个测定的一个或多个数据、结果或输出;来自一个或多个数据或结果的一个或多个输出;基于或源自一个或多个数据或结果的一个或多个输出,或其组合。一个或多个处理器可以接收和/或存储来自用户的请求。一个或多个处理器可以产生或生成一个或多个数据、结果、输出。一个或多个处理器可以产生或生成一份或多份生物医学报告。一个或多个处理器可以发送一份或多份生物医学报告。一个或多个处理器可以分析、编译、存储、分类、组合、评估或以其他方式处理来自一个或多个数据库的信息、一个或多个数据或结果、一个或多个输出,或其组合。一个或多个处理器可以分析、编译、存储、分类、组合、评估或以其他方式处理来自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30或更多个数据库的信息。一个或多个处理器可以向一个或多个用户、处理器、计算机、计算机系统、存储器位置、装置、数据库或其组合发送一个或多个请求、数据、结果、输出和/或信息。一个或多个处理器可以从一个或多个用户、处理器、计算机、计算机系统、存储器位置、装置、数据库或其组合接收一个或多个请求、数据、结果、输出和/或信息。一个或多个处理器可以从一个或多个用户、处理器、计算机、计算机系统、存储器位置、装置、数据库或其组合中检索一个或多个请求、数据、结果、输出和/或信息。本公开内容还提供了一种可用于多种生物医学应用的方法。在一些情况下,可以将变体、基因、重组装基因、外显子、UTR、调控区、剪接位点、替代序列和感兴趣的人类或非人类基因组的其他内容物从多个数据库中组合,以生成适用于多份生物医学报告的汇总内容物集。然后可以基于局部或总体基因组背景、核苷酸内容物、测序性能和解释要求对这种内容进行分类,然后将其分组为用于特定方案、测定开发等的亚组。在一些情况下,将变体、基因、外显子、UTR、调控区、剪接位点、替代序列和其他感兴趣的内容物从多个数据库中组合,以产生可适用于多份生物医学报告的汇总内容物集。然后基于局部或总体基因组背景、核苷酸内容物、测序性能和解释要求对该内容进行分类,然后随后将其分组为用于特定方案和测定开发的亚组,图14。在一些情况下,方案和/或测定可包括补充提取物。补充提取物可以包含人类靶序列、非人类靶序列及其组合。补充提取物可以包含来自受试者的核酸分子(例如,源于来自自受试者的组织的细胞)和不是来自受试者的核酸分子(例如,来自微生物(共生或寄生)、病原体或移植物)。图15-17提供了包括补充提取物的测定工作流程的示例,所述补充提取物用于针对不同基因组区域富集的多个DNA亚组中的一个或多个。
本文所揭示的方法可包含一个多个存储器位置。一个或多个存储器位置可以存储信息、数据、结果、输出、请求或其组合。一个或多个存储器位置可以从一个或多个用户、处理器、计算机、计算机系统、装置或其组合接收信息、数据、结果、输出、请求或其组合。
可以借助于一个或多个计算机和/或计算机系统来实现本文所述的方法。计算机或计算机系统可以包括具有用于执行本公开内容中提供的方法的机器可执行代码的电子存储位置(例如,数据库、存储器),以及用于执行机器可执行代码的一个或多个处理器。
本文公开的方法可以包括基于一个或多个生物医学输出来治疗和/或预防受试者的疾病或病况。一个或多个生物医学输出可以推荐一种或多种疗法。一个或多个生物医学输出可以建议、选择、指定、推荐或以其他方式确定疾病和病况的治疗和/或预防过程。一个或多个生物医学输出可以建议修改或继续一种或多种疗法。修改一种或多种疗法可以包括施用、起始、减少、增加和/或终止一种或多种疗法。一种或多种疗法包括抗癌、抗病毒、抗菌、抗真菌、免疫抑制疗法或其组合。一种或多种疗法可以治疗、减轻或预防一种或多种疾病或适应症。
抗癌疗法的示例包括但不限于外科手术、化学疗法、放射疗法、免疫疗法/生物疗法、光动力疗法。抗癌疗法可包括化学疗法、单克隆抗体(例如利妥昔单抗、曲妥珠单抗)、癌症疫苗(例如治疗性疫苗、预防性疫苗)、基因疗法或其组合。
一种或多种疗法可包括抗微生物剂。通常,抗微生物剂是指杀死或抑制微生物(例如细菌、真菌、病毒或原生动物)生长的物质。抗微生物药物杀死微生物(杀微生物的),或者阻止微生物的生长(抑微生物的)。主要有两类抗微生物药物,它们是从天然来源(例如抗生素,蛋白质合成抑制剂(例如氨基糖苷类、大环内酯类、四环素类、氯霉素类、多肽))和合成剂(例如磺胺类、磺胺甲基异恶唑、喹诺酮类)获得的。在一些情况下,抗微生物药物是抗生素、抗病毒、抗真菌、抗疟疾、抗结核药、抗麻风病或抗原生动物药。
抗生素通常用于治疗细菌感染。抗生素可分为两类:杀菌抗生素和抑菌抗生素。通常,杀菌剂可直接杀死细菌,而抑菌剂可阻止细菌分裂。抗生素可以源自活生物体,也可以包括合成抗菌剂,例如磺胺类。抗生素可以包括氨基糖苷类,例如阿米卡星、庆大霉素、卡那霉素、新霉素、奈替米星、妥布霉素和巴龙霉素。或者,抗生素可以是安沙霉素类(例如格尔德霉素、除草霉素)、cabacephems(例如氯碳头孢)、碳青霉烯类(例如厄他培南、多利培南、亚胺培南、西司他丁、美罗培南)、糖肽类(例如替考拉宁、万古霉素、替拉万星)、林可胺类(例如克林霉素、林可霉素、达托霉素)、大环内酯类(例如阿奇霉素、克拉霉素、地红霉素、红霉素、罗红霉素、醋竹桃霉素、替利霉素、大观霉素、螺旋霉素)、硝基呋喃类(例如呋喃唑酮、呋喃妥因)和多肽类(例如杆菌肽、粘菌素、多粘菌素B)。
在一些情况下,抗生素疗法包括头孢菌素类,例如头孢羟氨苄、头孢唑啉、头孢噻吩、头孢氨苄、头孢克洛、头孢孟多、头孢西丁、头孢丙烯、头孢呋辛、头孢克肟、头孢地尼、头孢托仑、头孢哌酮、头孢噻肟、头孢泊肟、头孢他啶、头孢布烯、头孢唑肟、头孢曲松、头孢吡肟、头孢洛林酯和头孢比普。
抗生素治疗也可包括青霉素类。青霉素类的示例包括阿莫西林、氨苄青霉素、阿洛西林、羧苄西林、氯唑西林、双氯西林、氟氯西林、美洛西林、甲氧西林、萘夫西林、苯唑西林、青霉素g、青霉素v、哌拉西林、替莫西林和替卡西林。
或者,喹啉类可用于治疗细菌感染。喹啉类的示例包括环丙沙星、依诺沙星、加替沙星、左氧氟沙星、洛美沙星、莫西沙星、萘啶酸、诺氟沙星、氧氟沙星、曲伐沙星、格帕沙星、司帕沙星和替马沙星。
在一些情况下,抗生素疗法包括两种或更多种疗法的组合。例如,阿莫西林和克拉维酸盐、氨苄青霉素和舒巴坦、哌拉西林和他唑巴坦、或替卡西林和克拉维酸盐可用于治疗细菌感染。
磺胺类也可用于治疗细菌感染。磺胺类的示例包括但不限于磺胺米隆、磺酰胺基柯衣定(sulfonamidochrysoidine)、磺胺醋酰、磺胺嘧啶、磺胺嘧啶银、磺胺甲二唑、磺胺甲恶唑、磺胺二甲异恶唑、柳氮磺吡啶、磺胺异恶唑、甲氧苄氨嘧啶、甲氧苄氨嘧啶-磺胺甲异恶唑合剂(复方新诺明)(tmp-smx)。
四环素类是抗生素的另一个示例。四环素类可以通过与mRNA翻译复合物中的30S核糖体亚基结合来抑制氨酰基-tRNA与mRNA核糖体复合物的结合。四环素类包括地美环素、多西环素、米诺环素、土霉素和四环素。可用于治疗细菌感染的其他抗生素包括胂凡纳明、氯霉素、磷霉素、夫西地酸、利奈唑胺、甲硝唑、莫匹罗星、平板霉素、奎奴普丁/达福普汀、利福昔明、甲砜霉素、替加环素、替硝唑、氯法齐明、氨苯砜、卷曲霉素、环丝氨酸、乙胺丁醇、乙硫异烟胺、异烟肼、吡嗪酰胺、利福平、利福霉素、利福布汀、利福喷汀和链霉素。
抗病毒疗法是一类专门用于治疗病毒感染的药物。像抗生素一样,特定的抗病毒药也用于特定的病毒。它们对宿主相对无害,因此可用于治疗感染。抗病毒疗法可以抑制病毒生命周期的各个阶段。例如,抗病毒疗法可以抑制病毒到细胞受体的附接。此类抗病毒疗法可包括模仿病毒相关蛋白(VAP)并与细胞受体结合的药剂。其他抗病毒疗法可以抑制病毒进入、病毒脱壳(例如金刚烷胺、金刚乙胺、普来可那立)、病毒合成、病毒整合、病毒转录或病毒翻译(例如福米韦生)。在一些情况下,抗病毒疗法是吗啉代反义疗法。应将抗病毒疗法与杀病毒剂区分开来,后者可以使体外的病毒颗粒有效失活。
许多可用的抗病毒药物被设计用于治疗逆转录病毒(主要是HIV)的感染。抗逆转录病毒药物可包括蛋白酶抑制剂、逆转录酶抑制剂和整合酶抑制剂的种类。治疗HIV的药物可包括蛋白酶抑制剂(例如因服雷、沙奎那韦、克力芝、洛匹那韦、福沙那韦、呋山那韦、诺韦、利托那韦、辈力、duranavir、瑞塔滋、泛罗赛)、整合酶抑制剂(例如雷特格韦)、转录酶抑制剂(例如、阿巴卡韦、赛进、agenerase、氨普那韦、替拉那韦(aptivus)、替拉那韦(tipranavir)、佳息患、茚地那韦、复得维、沙奎那韦、IntelenceTM、依曲韦林、艾生特、韦瑞德)、逆转录酶抑制剂(例如地拉韦定、依非韦伦、益平维、havid、奈韦拉平、齐多夫定、AZT、stuvadine、特鲁瓦达、惠妥滋)、融合抑制剂(例如恩夫韦、恩夫韦肽)、趋化因子共受体拮抗剂(例如马拉维若(selzentry)、emtriva、恩曲他滨、epzicom或三协唯)。或者,抗逆转录病毒疗法可以是联合疗法,例如atripla(例如,依非韦伦、恩曲他滨和富马酸替诺福韦二吡呋酯)和完全剂(embricitabine、利匹韦林和富马酸替诺福韦二吡呋酯)。通常用核苷类似物阿昔洛韦治疗可能引起唇疱疹和生殖器疱疹的疱疹病毒。病毒性肝炎(A-E)由五种无关的嗜肝病毒引起,根据感染类型的不同,通常也会用抗病毒药物治疗。甲型和乙型流感病毒是用于开发新型流感治疗方法的重要目标,以克服对现有神经氨酸苷酶抑制剂(如奥司他韦)的耐药性。
在一些情况下,抗病毒疗法可包含逆转录酶抑制剂。逆转录酶抑制剂可以是核苷逆转录酶抑制剂或非核苷逆转录酶抑制剂。核苷逆转录酶抑制剂可包括但不限于双汰芝、emtriva、益平维、epzicom、havid、立妥威、三协唯、特鲁瓦达、惠妥滋ec、惠妥滋、韦瑞德、赛瑞特和赛进。非核苷逆转录酶抑制剂可包括edurant、intelence、rescriptor、sustiva和维乐命(立即释放或延长释放)。
蛋白酶抑制剂是抗病毒药物的另一个示例,可以包括但不限于,agenerase、aptivus、佳息患、复得维、因服雷、克力芝、福沙那韦、爱治威、辈力、瑞塔滋和维拉赛特。或者,抗病毒疗法可以包含融合抑制剂(例如恩夫韦肽(Enfuviride))或进入抑制剂(例如马拉韦罗)。
抗病毒药物的其他示例包括阿巴卡韦、阿昔洛韦、阿德福韦、金刚烷胺、氨普那韦、安普利根、阿比朵尔、阿扎那韦、atripla、波普瑞韦、西多福韦、双汰芝、达芦那韦、地拉韦啶、去羟肌苷、二十二烷醇、依度尿苷、依非韦伦、恩曲他滨、恩夫韦肽、恩替卡韦、泛昔洛韦、福米韦生、呋山那韦、膦甲酸、膦乙酸、融合抑制剂、更昔洛韦、伊巴他滨、伊姆诺韦、碘苷、咪喹莫特、茚地那韦、肌苷、整合酶抑制剂、干扰素类(例如I、II、III型干扰素)、拉米夫定、洛匹那韦、洛韦胺、马拉韦罗、吗啉胍、美替沙腙、奈非那韦、奈韦拉平、奈沙韦尔(nexavir)、核苷类似物、奥司他韦、聚乙二醇干扰素α-2a、喷昔洛韦、帕拉米韦、普来可那立、鬼臼毒素、蛋白酶抑制剂、雷特格韦、逆转录酶抑制剂、利巴韦林、金刚烷胺、利托那韦、pyramidine、沙奎那韦、司他夫定、茶树油、替诺福韦、替诺福韦二吡呋酯、替拉那韦、曲氟尿苷、三协唯、曲金刚胺、特鲁瓦达、伐昔洛韦、缬更昔洛韦、韦克利韦洛克(vicriviroc)、阿糖腺苷、盐酸塔利韦林(viramidine)、扎西他滨、扎那米韦和齐多夫定。
抗真菌药物是可以用于治疗真菌感染的药物,真菌感染例如足癣、金钱癣、念珠菌病(鹅口疮)、严重的全身感染(例如隐球菌性脑膜炎)等。抗真菌剂通过利用哺乳动物和真菌细胞之间的差异而杀死真菌生物体而起作用。与细菌不同,真菌和人类都是真核生物。因此,真菌和人类细胞在分子水平上是相似的,这使得更难找到抗真菌药物攻击的靶标,而该靶标在被感染的生物体中也不存在。
抗寄生虫药是一类用于治疗寄生虫如线虫、绦虫、吸虫、感染性原生动物和变形虫的药物。像抗真菌剂一样,它们必须杀死感染性害虫而不会严重损害宿主。
本公开内容的方法可以通过系统、试剂盒、文库或其组合来实现。本公开内容的方法可以包括一个或多个系统。本公开内容的系统可以通过试剂盒、文库或两者来实现。系统可以包括一个或多个执行本文公开的任何方法或任何方法的操作的部件。例如,系统可以包括一个或多个试剂盒、装置、文库或其组合。系统可以包括一个或多个测序仪、处理器、存储器位置、计算机、计算机系统或其组合。系统可以包括传输装置。
试剂盒可包含用于实施本文公开的各种操作(包括样品处理和/或分析操作)的各种试剂。试剂盒可包含用于实施本文公开的至少一些操作的说明书。试剂盒可包含一种或多种捕获探针、一种或多种珠子、一个或多个标记、一个或多个连接子、一个或多个装置、一种或多种试剂、一种或多种缓冲液、一个或多个样品、一个或多个数据库,或其组合。
文库可包含一种或多种捕获探针。文库可以包含一个或多个核酸分子亚组。文库可以包含一个或多个数据库。文库可以由本文公开的任何方法、试剂盒或系统产生或生成。数据库文库可以由一个或多个数据库产生。用于产生一个或多个文库的方法可以包括:(a)从一个或多个数据库中汇总信息以产生汇总的数据集;(b)分析汇总的数据集;(c)从汇总的数据集中产生一个或多个数据库文库。图13提供了文库构建工作流程的示例。在一些情况下,文库可以被合并,图7。
计算机系统
本公开内容提供被编程为实现本公开内容的方法的计算机系统。图5示出了计算机系统501,其被编程或以其他方式配置为映射和/或比对序列读段以鉴定核酸分子的来源(例如,人类或非人类、宿主或非宿主)、鉴定一个或多个特征(例如,遗传变体),或其任何组合。计算机系统501可以调节如本公开内容中提供的处理测序信息的各个方面,例如,将序列读段与一种或多种参考序列进行比对,以鉴定生物样品中核酸序列的来源。计算机系统501可以是用户的电子装置或相对于电子装置远程定位的计算机系统。该电子装置可以是移动电子装置。
计算机系统501包括中央处理单元(CPU,此处也称为“处理器”和“计算机处理器”)505,其可以是单核或多核处理器,或者是用于并行处理的多个处理器。计算机系统501还包括存储器或存储器位置510(例如,随机存取存储器、只读存储器、闪存)、电子存储单元515(例如,硬盘)、用于与一个或多个其他系统通信的通信接口520(例如,网络适配器),以及外围装置525(例如,高速缓存、其他存储器、数据存储器和/或电子显示适配器)。存储器510、存储单元515、接口520和外围装置525通过诸如主板的通信总线(实线)与CPU 505通信。存储单元515可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统501可以借助于通信接口520可操作地耦合到计算机网络(“网络”)530。网络530可以是因特网、互联网和/或外联网,或与因特网通信的内联网和/或外联网。在一些情况下,网络530是电信和/或数据网络。网络530可以包括一个或多个计算机服务器,其可以启用诸如云计算的分布式计算。在一些情况下,网络530在计算机系统501的帮助下可以实现对等网络,该对等网络可以使耦合到计算机系统501的装置能够充当客户端或服务器。
CPU505可以执行一系列机器可读指令,其可以体现在程序或软件中。指令可以存储在诸如存储器510的存储器位置中。指令可以被导送到CPU505,其可以随后对CPU505进行编程或以其他方式配置CPU505以实现本公开内容的方法。由CPU505执行的操作的示例可以包括获取、解码、执行和写回。
CPU505可以是电路,例如集成电路的一部分。电路中可以包括系统501的一个或多个其他部件。在一些情况下,电路是专用集成电路(ASIC)。
存储单元515可以存储文件,例如驱动器、文库和保存的程序。存储单元515可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统501可以包括位于计算机系统501外部的一个或多个其他数据存储单元,其例如位于通过内联网或因特网与计算机系统501通信的远程服务器上。
计算机系统501可以通过网络530与一个或多个远程计算机系统通信。例如,计算机系统501可以与用户(例如,医疗保健提供者)的远程计算机系统通信。远程计算机系统的示例包括个人计算机(例如便携式PC)、平板计算机或平板电脑(例如
Figure BDA0002923581330000621
iPad、
Figure BDA0002923581330000622
Galaxy Tab)、电话、智能电话(例如
Figure BDA0002923581330000623
iPhone、Android使能性装置、
Figure BDA0002923581330000624
)或个人数字助理。用户可以通过网络1130访问计算机系统501。
可以通过存储在计算机系统501的电子存储位置(例如存储器510或电子存储单元515)上的机器(例如,计算机处理器)可执行代码的方式来实现本文所述的方法。机器可执行或机器可读代码可以以软件的形式提供。在使用期间,代码可以由处理器505执行。在一些情况下,可以从存储单元515中检索代码并将其存储在存储器510上,以供处理器505随时访问。在一些情况下,可以省去电子存储单元515,并且将机器可执行指令存储在存储器510中。
可以对代码进行预编译并配置为与具有适用于执行代码的处理器的机器一起使用,或者可以在运行时进行编译。可以以可选择的编程语言来提供代码,以使代码能够以预编译或即时编译(as-compiled)的方式执行。
本文提供的系统和方法(例如计算机系统501)的各个方面可以体现在编程中。可以将技术的各个方面视为通常以在机器可读介质类型上承载或以机器可读介质类型实施的机器(或处理器)可执行代码和/或关联数据的形式的“产品”或“制造品”。机器可执行代码可以存储在电子存储单元上,例如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘上。“存储”型介质可以包括计算机的任何或所有有形存储器、处理器等,或其相关模块,例如可以在任何时间为软件编程提供非暂时性存储的各种半导体存储器、磁带驱动器、磁盘驱动器等。全部软件或部分软件可以在任何时刻通过因特网或各种其他电信网络进行通信。例如,这样的通信可以使得软件能够从一个计算机或处理器加载到另一个计算机或处理器中,例如从管理服务器或主机加载到应用服务器的计算机平台中。因此,可以承载软件元件的另一类型的介质包括诸如跨本地装置之间的物理接口、通过有线和光学陆线网络以及通过各种空中链路而使用的光波、电波和电磁波。携载此类波的物理元件,诸如有线或无线链路、光学链路等,也可以被认为是承载软件的介质。如本文所使用,除非限制于非暂时性、有形“存储”介质,否则诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。
因此,诸如计算机可执行代码的机器可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,诸如任何计算机中的任何存储设备等,诸如可以用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,诸如这样的计算机平台的主存储器。有形传输介质包括同轴缆线;铜线和光纤,包括构成计算机系统内总线的线。载波传输介质可以采取电信号或电磁信号的形式,或者采取声波或光波的形式,诸如在射频(RF)和红外(IR)数据通信期间生成的那些。因此,计算机可读介质的常见形式例如包括:软磁盘、软盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡纸带、任何其他具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或存储器盒、传输数据或指令的载波、传输这样的载波的线缆或链路,或者任何其他计算机可从中读取编程代码和/或数据的介质。这些形式的计算机可读介质中的许多介质可以涉及将一个或多个指令的一个或多个序列加载到处理器以供执行。
计算机系统501可以包括电子显示器535或与之通信,该电子显示器535包括用户界面(UI)540,用于提供例如一份或多份生物医学报告,该一份或多份报告包括一个或多个选自以下的数据组:i)候选肿瘤新抗原,(ii)检测到的非人类物种,(iii)检测到的CDR3序列,及其任何组合。UI的示例包括但不限于图形用户界面(GUI)和基于web的用户界面。
可通过一种或多种算法来实现本公开内容的方法和系统。可以通过软件在由中央处理单元505在执行时来实现算法。该算法可以例如映射和/或比对序列读段、调用变体、注释序列信息或其任何组合。
实施例
实施例1.基因组DNA的制备
使用以下操作从包含基因组DNA的样品中制备核酸分子亚组:
1.用M220将包含基因组DNA的样品剪切15-35秒。
2.连接后用SPRI珠子纯化片段化的gDNA(SPRI珠子与DNA样品的体积比为1),并将DNA洗脱到100μL的洗脱缓冲液(EB)中。
3.将50μL的SPRI珠子添加到100μL的DNA中。
4.将上清液转移至新管中。
5.从剩余的结合DNA的珠子中洗脱DNA。该洗脱的DNA称为长插入物。
6.将10μL的SPRI珠子添加到操作4的上清液中。
7.将操作6的上清液转移到新管中。
8.从操作6的剩余的结合DNA的珠子中洗脱DNA。该洗脱的DNA称为中等插入物。
9.将20μL的SPRI珠子添加到操作7的上清液中。
10.将操作9的上清液转移到新管中。
11.从操作9的剩余的结合DNA的珠子中洗脱DNA。该洗脱的DNA称为短插入物。
实施例2.获取生物样品
使患有可评价的转移癌的受试者接受肿瘤切除。使来自肿瘤的淋巴细胞、肿瘤浸润淋巴细胞(TIL)生长和扩展。使TIL的多个单个片段或多个单个培养物生长。单独扩增单个培养物,当从每种培养物中扩增出足够的TIL产量(约108个细胞)时,将TIL冷冻保存,取等分试样进行免疫学测试。对原始肿瘤的等分试样进行外显子组和转录组测序,以鉴定与正常细胞相比独特存在于肿瘤中的突变。测序还鉴定了包括微生物在内的非人类基因组的存在和同一性。
实施例3.从生物样品中提取基因组物质
根据制造商的建议,使用QIAGEN AllPrep DNA/RNA试剂盒(目录号80204)从各种肿瘤和匹配的正常血液成分单采样品中纯化基因组DNA(gDNA)和总RNA。将肿瘤样品经福尔马林固定、石蜡包埋(FFPE),并按照制造商的指示使用Covaris truXTRACTM FFPE DNA试剂盒提取gDNA。
实施例4.生物样品的测序分析
使用Agilent Technologies的SureSelectXT靶标富集系统(目录号5190-8646),为偶联人类全外显子V6 RNA诱饵(目录号5190-8863)(Agilent Technologies,圣克拉拉,加利福尼亚,美国)和细菌RNA诱饵的双端文库制备全外显子文库构建和大约20,000个编码基因的外显子捕获。随后在NextSeq 500台式测序仪(Illumina,圣地亚哥,加利福尼亚,美国)上对全外显子组测序(WES)文库进行测序。按照制造商的方案,使用来自新鲜肿瘤组织样品的3μg gDNA和来自FFPE肿瘤样品的200ng gDNA制备文库。使用Illumina高输出流动池试剂盒(300个循环)(目录号FC-404-2004)完成双端测序。使Tu-1、Tu-2A和Tu-2B样品最初在试剂/流动池试剂盒的v1上运行,随后使用试剂/流动池试剂盒的v2进行同一文库制备的后续运行。使肿瘤样品在v2试剂/流动池试剂盒上运行。如肿瘤得生物信息学程序等位基因特异性拷贝数分析(ASCAT)1所估计的那样,确定每个样品中肿瘤的平均测序深度和百分比(肿瘤纯度)。按照制造商的方案,使用2μg总RNA和Illumina TruSeq RNA链文库制备试剂盒制备RNA-seq文库。在NextSeq 500台式测序仪(Illumina,圣地亚哥,加利福尼亚,美国)上对RNA-seq文库进行双端测序。对WES进行比对、处理和变体调用,使用来自novocraft(http://www.novocraft.com/)的novoalign MPI对人类基因组构建hg19进行比对。使用Picard的MarkDuplicates工具标记重复项。根据GATK最佳实践工作流程(https://www.broadinstitute.org/gatk/)进行In/del重新比对和碱基重新校准。清理数据后,使用以下标准用samtools(http://samtools.sourceforge.net)创建堆积文件(pileup file),使用Varscan2(http://varscan.sourceforge.net)调用体细胞变体:肿瘤和正常读段计数为10或更高、变体等位基因频率为10%或更高、肿瘤变体读段为4或更高。然后使用Annovar(http://annovar.openbioinformatics.org)注释这些变体。对于RNA-seq,使用STAR(https://github.com/alexdobin/STAR)two pass法对人类基因组构建hg19进行比对。使用Picard的MarkDuplicates工具标记重复项。使用GATK SplitNTrim工具拆分和修剪读段。之后,使用GATK工具箱执行In/del重新比对和碱基重新校准。使用最终重新校准的bam文件和samtools mpileup创建堆积文件。最后,使用Varscan2调用变体。
实施例5:非人类基因组的序列比对
将从测序分析中提取的基因组信息与核糖体RNA基因16S(基因组参考)进行比对。鉴定出与16S基因完全匹配的读段。被设计为与16S基因的共享区杂交的捕获探针可用于捕获来自多种物种的核酸分子,甚至尚未鉴定和表征的物种。基于来自可变区部分的序列,将其序列从这些共享区延伸到可变区的捕获分子分配给它们的来源物种。
实施例6.剪切时间和片段大小
通过改变Covaris设置的剪切时间来剪切基因组DNA(gDNA)。然后分析通过各种剪切时间产生的gDNA片段。结果示于图10和表1中。
表1.剪切时间和平均片段大小
编号 剪切时间(秒) 平均片段大小(碱基对)
1 375 150
2 175 200
3 80 200
4 40 400
5 32 500
6 25 800
实施例7.珠子比值和片段大小
改变珠子体积与核酸样品体积的比值,并分析这些比值对平均片段大小的影响。如图11所示,将珠子体积与核酸样品体积的体积比从0.8(线1)、0.7(线2)、0.6(线3)、0.5(线4)和0.4(线5)改变,导致DNA片段的平均大小的变化。通常,似乎比值越低,平均片段大小越大。
实施例8.连接反应和片段大小
在核酸样品上进行了两种不同的剪切时间和三种不同的连接反应的组合。将样品1剪切25秒,并在长插入物DNA上进行连接反应。将样品2剪切32秒,并在长插入物DNA上进行连接反应。将样品3剪切25秒,并在中等插入物DNA上进行连接反应。将样品4剪切32秒,并在中等插入物DNA上进行连接反应。将样品5剪切25秒,并在短插入物DNA上进行连接反应。将样品6剪切32秒,并在短插入物DNA上进行连接反应。图12显示了六个反应的平均片段大小。
实施例9.感兴趣的核酸的捕获
从受试者获得核酸样品。可以将该样品分为两个单独的样品,并且可以使每个单独的样品经历不同的探针池和条件。通过将Agilent临床研究外显子组试剂盒(基于GRCh37参考基因组中的外显子组)与另外的感兴趣的探针(包括对应于GRCh38参考序列、HLA特异性探针、T细胞受体和B细胞受体重组特异性探针的外显子组区域(即对应于V(D)J区域的区域)、微卫星不稳定性区域和肿瘤病毒序列)结合,生成第一生物素化的捕获探针池。将另外的探针滴定到池中以调整核酸的相对捕获率。这对于下游测序反应增加一组捕获核酸的测序深度或敏感性可以是有益的。第二探针池(例如靶向特定序列或序列亚组的探针的“加强组”)可以捕获具有难以捕获的序列的核酸。加强组的探针可以包括具有高GC含量的GRCh37和GRCh38参考序列的外显子组、与癌症疗法有关的探针、另外的T细胞受体和B细胞重组特异性探针。将由第一池捕获的核酸分子和由第二池捕获的核酸分子组合以生成捕获探针和捕获的核酸的组合池。可以通过组合不同比例的两个捕获分子池的来创建组合池,以调整与每个池相对应的捕获核酸的相对量。这对于下游的测序反应以增加一组捕获核酸的深度或灵敏度可以是有益的。将杂交的捕获探针和捕获核酸与磁性链霉亲和素珠子一起温育。将磁性分离器放在装有样品的管的外部,并允许捕获探针固定磁性链霉亲和素珠子。倒出液体,并添加另外的缓冲液以洗涤珠子并去除任何未结合的核酸。对捕获的核酸进行扩增反应以附加衔接子,以进行进一步的下游测序反应。
实施例10.微生物组和肿瘤病毒的鉴定
从受试者获得核酸样品。可以将该样品分为两个单独的样品,并且可以使每个单独的样品经历不同的探针池和条件。通过将Agilent临床研究外显子组试剂盒(基于GRCh37参考基因组中的外显子组)与另外感兴趣的探针(包括对应于GRCh38参考序列的外显子组区域),与细菌、真菌、古细菌和原生生物基因(包括幽门螺杆菌(Helicobacter pylori)和梭菌属(Fusobacterium)的基因)的16S rRNA区域具有同源性的探针,病毒基因(包括人乳头瘤病毒、乙型肝炎病毒、丙型肝炎病毒)的探针以及与致病性相关的基因的探针组合在一起,生成第一生物素化的捕获探针池。将另外的探针滴定到库中以调整核酸的相对捕获率。第二探针池(例如靶向特定序列或序列亚组的探针的“加强组”)可以捕获具有难以捕获的序列的核酸。加强组的探针可以包括由于多个替代基因序列或具有高突变率的基因而具有高GC含量或低基因同源性的GRCh37和GRCh38参考序列的外显子组。将由第一池捕获的核酸分子和由第二池捕获的核酸分子组合以生成核酸的组合池。将这两个池合并,并以不同的比例进行滴定,以提高一个池相对于另一个池的灵敏度。将杂交的捕获探针和捕获核酸与磁性链霉亲和素珠子一起温育。将磁性分离器放置在装有样品和捕获探针的管的外部,并使其固定磁性链霉亲和素珠子。倒出液体,并添加另外的缓冲液以洗涤珠子并去除任何未结合的核酸。对捕获的核酸进行扩增反应以附加衔接子,以进行进一步的下游测序反应。将该序列与参考序列比对以鉴定受试者的微生物组中特定微生物的存在或鉴定任何引起疾病的病原体。
实施例11.鉴定或CAR-T细胞
从受试者获得核酸样品。生成两个探针池,其中第一池由生物素化的Agilent临床研究外显子组试剂盒探针组成。将补充的生物素化探针组添加到第一池中,所述第一池包括对CAR-T细胞中发现的嵌合抗原受体具有特异性的序列。第二生物素化的捕获探针池(例如,靶向特定序列或序列亚组的探针的“加强组”)包含针对具有高GC含量的CAR序列的序列和/或由于突变或重组而与捕获的核酸具有低的总序列同源性的序列。将样品分为两个样品池,使第一样品池经历第一探针池,使第二样品池经历第二探针池,以允许捕获探针从每个样品池捕获核酸。将与捕获的核酸杂交的第一探针池和第二探针池合并。将磁性链霉亲和素珠子添加到混合物中,并使生物素化的探针与珠子结合。将磁性分离器放置在装有样品和捕获探针的管的外部,并使其固定磁性链霉亲和素珠子。倒出液体,并添加另外的缓冲液以洗涤珠子并去除任何未结合的核酸。将捕获的核酸重新悬浮在新鲜缓冲液中,并进行扩增反应以附加衔接子,然后对捕获的核酸进行测序。分析序列读段,并将其与CAR-T基因参考序列进行比对,以鉴定CAR-T相关核酸的存在。
实施例12:分段转录组的鉴定
从受试者的不同组织类型获得样品。将样品通过酶消化处理以去除DNA和多种类型的RNA分子(rRNA、tRNA、miRNA)。不消化mRNA,然后对其进行逆转录以生成cDNA分子。产生与大约20,000个基因具有序列同源性的生物素化的探针组,并将其与cDNA样品混合。将磁性链霉亲和素珠子添加到混合物中,并使生物素化的探针与珠子结合。将磁性分离器放置在装有样品和捕获探针的管的外部,并使其固定磁性链霉亲和素珠子子。倒出液体,并添加另外的缓冲液以洗涤珠子并去除任何未结合的核酸。将捕获的核酸重新悬浮在新鲜缓冲液中,并进行扩增反应以附加衔接子,随后对捕获的核酸进行测序。分析序列读段,并与参考序列进行比对,以确定每个样品中基因的同一性,并将其与样品的组织类型相关联。对其中以不同比例滴定了生物素化探针的样品进行多重复制。通过分析与提供给样品的探针的量有关的核酸的特异性信号,可以确定每个基因的表达水平。转录组分析可以与外显子组或基因组分析并行进行。外显子组或基因组探针可以用作第一探针池,而cDNA捕获探针可以用作第二探针池。在这种情况下,可以将样品分成几部分,并进行DNA特异性或mRNA特异性反应。如先前实施例中所公开的,可以将捕获的核酸合并在一起并进行测序反应以确定核酸的同一性。
实施例13.鉴定和捕获与癌症有关的无细胞DNA(cfDNA)
从全血或血清中获得核酸样品提取物。通过离心去除血液样品的细胞,获得无细胞的样品。产生与大约20,000个基因具有序列同源性的生物素化的探针组,并将其与无细胞样品混合。通过将Agilent临床研究外显子组试剂盒(基于GRCh37参考基因组中的外显子组)与另外感兴趣的探针(包括对应于GRCh38参考序列的外显子组区域)以及与和癌症相关的基因具有同源性的探针相结合,产生第一生物素化的捕获探针池。将另外的探针滴定到池中以调整核酸的相对捕获率。第二探针池(例如,靶向特定序列或序列亚组的探针的“加强组”)可以捕获具有难以捕获的序列的核酸。加强组的探针可以包括由于多个替代基因序列或具有高突变率的基因而具有高GC含量或低基因同源性的GRCh37和GRCh38参考序列的外显子组。将磁性链霉亲和素珠子添加到混合物中,并使生物素化的探针与珠子结合。将磁性分离器放置在装有样品和捕获探针的管的外部,并使其固定磁性链霉亲和素珠子。倒出液体,并添加另外的缓冲液以洗涤珠子并去除任何未结合的核酸。将捕获的核酸重新悬浮在新鲜缓冲液中,并进行扩增反应以附加衔接子,然后对捕获的核酸进行测序。分析序列读段并将其与参考序列进行比对,以确定每个样品中基因的同一性。通过将基因组DNA应用于与cfDNA所进行的相同或相似的探针组,cfDNA分析可与基因组DNA的外显子组测序并行进行。
虽然本文已经示出并描述了本发明的优选实施方案,但是对于本领域技术人员将显而易见的是,这些实施方案仅以示例的方式提供。并非旨在通过说明书中提供的具体示例来限制本发明。尽管已经参考前述说明书描述了本发明,但对本文实施方案的描述和说明并不意味着以限制性的意义来解释。本领域技术人员在不脱离本发明的情况下现将想到多种变化、改变和替代。此外,应当理解,本发明的所有方面不限于本文阐述的取决于各种条件和变量的具体描述、配置或相对比例。应当理解,本文所述的本发明实施方案的各种可替选方案可用于实施本发明。因此,考虑到本发明还应当涵盖任何这样的替选、修改、变化或等同方案。所附权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同方案。

Claims (41)

1.一种用于处理受试者的生物样品的方法,包括:
(a)使用核酸探针池从所述生物样品产生核酸分子的亚组,其中所述探针包括(i)被配置为靶向人类基因组的元件的第一多个核酸探针和(ii)被配置为靶向一种或多种非人类基因组的元件的第二多个核酸探针;以及
(b)对所述核酸分子的亚组进行测定以产生包括以下序列的序列信息:(i)来自所述受试者的所述生物样品的人类核酸和(ii)来自所述受试者的所述生物样品的非人类核酸。
2.根据权利要求1所述的方法,其中(i)的所述第一多个核酸探针被配置成靶向源自所述人类基因组的元件。
3.根据权利要求1所述的方法,其中所述第二多个核酸探针被配置成靶向选自一种或多种物种的非人类基因组序列的元件,所述一种或多种物种选自病毒、细菌、细菌噬菌体、真菌、原生生物、古细菌、变形虫、蠕虫、藻类、遗传修饰的细胞和遗传修饰的载体。
4.根据权利要求1所述的方法,其中从所述生物样品产生所述核酸分子的亚组包括进行一个或多个杂交反应。
5.根据权利要求1所述的方法,还包括从所述受试者获得所述生物样品,其中所述生物样品源自肿瘤活检、全血或血浆。
6.根据权利要求1所述的方法,还包括将所述核酸分子的亚组的所述序列与一种或多种参考序列进行比对。
7.根据权利要求6所述的方法,其中所述一种或多种参考序列包括多个参考序列,并且其中所述多个参考序列对应于两种或更多种不同的物种。
8.根据权利要求6所述的方法,还包括基于所述比对来鉴定所述亚组中所述核酸分子的来源。
9.根据权利要求8所述的方法,还包括产生包括所述生物样品中的所述核酸分子的所述来源的输出。
10.根据权利要求1所述的方法,其中在所述核酸探针池中,所述第二多个核酸探针的浓度大于所述第一多个核酸探针的浓度。
11.根据权利要求1所述的方法,其中在所述探针池中的所述第二多个核酸探针的浓度大于在所述核酸探针池中的所述第一多个核酸探针的浓度。
12.根据权利要求1所述的方法,其中所述第一多个核酸探针包括人类外显子组捕获探针组。
13.根据权利要求1所述的方法,其中所述第一多个核酸探针包括被配置成靶向由人V(D)J重排或重组产生的连接序列的探针。
14.根据权利要求1所述的方法,其中所述第二多个核酸探针包括一种或多种被配置为靶向人乳头瘤病毒E6基因、E7基因和/或细菌16S核糖体RNA基因的一种或多种元件的探针。
15.根据权利要求1所述的方法,其中(b)的所述测定包括进行测序以产生长度为130个碱基至280个碱基的双端读段序列。
16.根据权利要求1所述的方法,还包括产生一份或多份生物医学报告,所述一份或多份生物医学报告包含选自以下的一组或多组数据:(i)候选肿瘤新抗原,(ii)检测到的非人类物种,(iii)检测到的互补决定区3(CDR3)序列,及其任何组合。
17.根据权利要求16所述的方法,其中所述检测到的非人类物种是抗原,并且其中所述CDR3序列能够结合抗原。
18.根据权利要求16所述的方法,其中所述一份或多份生物医学报告包括(i)-(iii)中的任何两个。
19.一种用于处理受试者的生物样品的方法,包括:
(a)从所述生物样品产生核酸分子的亚组,其中所述核酸分子的亚组包括(i)来自所述受试者的第一多个核酸分子和(ii)不是来自所述受试者的第二多个核酸分子,并且其中所述生物样品中,所述第一多个核酸分子的丰度大于所述第二多个核酸分子的丰度;和
(b)对所述核酸分子的亚组进行测定以产生包括以下序列的序列信息:(i)所述第一多个核酸分子和(ii)所述第二多个核酸分子。
20.根据权利要求19所述的方法,其中(i)的所述核酸分子源自所述受试者的基因组。
21.根据权利要求19所述的方法,其中所述不是来自所述受试者的所述第二多个核酸分子包括包括一个或多个选自以下的成员:病毒、细菌、细菌噬菌体、真菌、原生生物、古细菌、变形虫、蠕虫、藻类、基因修饰细胞以及基因修饰载体。
22.根据权利要求19所述的方法,其中从所述生物样品产生所述核酸分子的亚组包括进行一个或多个杂交反应。
23.根据权利要求19所述的方法,还包括从所述受试者获得所述生物样品,其中所述生物样品源自肿瘤活检、全血或血浆。
24.根据权利要求19所述的方法,还包括将所述核酸分子的亚组的所述序列与一种或多种参考序列进行比对。
25.根据权利要求24所述的方法,其中所述一种或多种参考序列包括多个参考序列,并且其中所述多个参考序列对应于两种以上的不同物种。
26.根据权利要求24所述的方法,还包括基于所述比对来鉴定所述亚组中的所述核酸分子的来源。
27.根据权利要求26所述的方法,还包括产生包括所述生物样品中的所述核酸分子的鉴定来源的输出。
28.根据权利要求19所述的方法,其中在所述生物样品中,所述第一多个核酸分子的丰度大于所述第一多个核酸分子的丰度。
29.根据权利要求19所述的方法,其中所述亚组中的所述第二多个核酸分子的相对丰度大于所述亚组中的所述第一多个核酸分子的相对丰度。
30.一种用于处理受试者的生物样品的系统,包括:
包括一个或多个计算机处理器的处理单元,所述一个或多个计算机处理器被单独地或共同地编程以对核酸分子的亚组进行测定,以产生包括以下序列的序列信息:(i)来自所述受试者的所述生物样品的人类核酸和(ii)来自所述受试者的所述生物样品的非人类核酸,所述核酸分子的亚组是使用核酸探针池从所述生物样品中产生的,其中所述探针包含(i)被配置为靶向人类基因组的元件的第一多个核酸探针;和(ii)被配置为靶向一种或多种非人类基因组的元件的第二多个核酸探针;以及
被配置为存储所述序列信息的计算机存储器。
31.根据权利要求30所述的系统,其中对所述一个或多个计算机处理器进行编程以生成所述序列与一种或多种参考序列的比对。
32.根据权利要求31所述的系统,其中所述一种或多种参考序列包括多个参考序列,并且其中所述多个参考序列对应于两种或更多种不同的物种。
33.根据权利要求31所述的系统,其中对所述一个或多个计算机处理器进行编程以基于所述比对来鉴定所述亚组中的所述核酸分子的来源。
34.根据权利要求33所述的系统,其中对所述一个或多个计算机处理器进行编程以生成包括所述生物样品中的所述核酸分子的所述来源的输出。
35.根据权利要求30所述的系统,其中对所述一个或多个计算机处理器进行编程以产生一份或多份生物医学报告,所述一份或多份生物医学报告包括选自以下的信息:(i)候选肿瘤新抗原,(ii)检测到的非人类物种,(iii)检测到的互补决定区3(CDR3)序列及其任何组合。
36.一种用于处理受试者的生物样品的系统,包括:
包括一个或多个计算机处理器的处理单元,所述一个或多个计算机处理器被单独或共同编程以对核酸分子的亚组进行测定以产生包括以下序列的序列信息:(i)第一多个核酸分子和(ii)第二多个核酸分子,所述核酸分子的亚组是从所述生物样品产生的,其中所述核酸分子的亚组包括(i)来自所述受试者的第一多个核酸分子和(ii)不是来自所述受试者的第二多个核酸分子,并且其中在所述生物样品中,所述第一多个核酸分子的丰度大于所述第二多个核酸分子的丰度;以及
被配置为存储所述序列信息的计算机存储器。
37.根据权利要求36所述的系统,其中对所述一个或多个计算机处理器进行编程以生成所述序列与一种或多种参考序列的比对。
38.根据权利要求37所述的系统,其中所述一种或多种参考序列包括多个参考序列,并且其中所述多个参考序列对应于两种或更多种不同的物种。
39.根据权利要求37所述的系统,其中对所述一个或多个计算机处理器进行编程以基于所述比对来鉴定所述亚组中的所述核酸分子的来源。
40.根据权利要求38所述的系统,其中对所述一个或多个计算机处理器进行编程以生成包括所述生物样品中的所述核酸分子的所述来源的输出。
41.根据权利要求36所述的系统,其中对所述一个或多个计算机处理器进行编程以产生一份或多份生物医学报告,所述一份或多份生物医学报告包括选自以下的信息:(i)候选肿瘤新抗原,(ii)检测到的非人类物种,(iii)检测到的互补决定区3(CDR3)序列及其任何组合。
CN201980050741.1A 2018-05-31 2019-05-24 用于处理或分析多物种核酸样品的组合物、方法和系统 Pending CN112888794A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862678475P 2018-05-31 2018-05-31
US62/678,475 2018-05-31
US16/056,982 US10801064B2 (en) 2018-05-31 2018-08-07 Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US16/056,982 2018-08-07
PCT/US2019/034023 WO2019231856A1 (en) 2018-05-31 2019-05-24 Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples

Publications (1)

Publication Number Publication Date
CN112888794A true CN112888794A (zh) 2021-06-01

Family

ID=68694486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980050741.1A Pending CN112888794A (zh) 2018-05-31 2019-05-24 用于处理或分析多物种核酸样品的组合物、方法和系统

Country Status (7)

Country Link
US (2) US10801064B2 (zh)
EP (1) EP3802854A4 (zh)
JP (2) JP2021525515A (zh)
CN (1) CN112888794A (zh)
GB (1) GB2590197A (zh)
SG (1) SG11202011464VA (zh)
WO (1) WO2019231856A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109321569A (zh) * 2018-10-29 2019-02-12 凯杰(苏州)转化医学研究有限公司 一种引物探针组合物及其应用
CN114369650A (zh) * 2022-03-21 2022-04-19 深圳市仙湖植物园(深圳市园林研究中心) 捕获探针的设计方法、捕获探针及其应用

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
US11814750B2 (en) 2018-05-31 2023-11-14 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US10801064B2 (en) 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
CN112501280B (zh) * 2020-01-22 2023-03-17 微岩医学科技(北京)有限公司 一种基于高通量测序的泡型包虫高灵敏度检测方法
CA3174332A1 (en) 2020-04-21 2021-10-28 Jason PERERA Tcr/bcr profiling
CN111518956B (zh) * 2020-05-20 2023-06-23 广西壮族自治区兽医研究所 一种检测禽呼肠孤病毒的纳米pcr方法、试剂盒及应用
CN113999898B (zh) * 2021-12-31 2022-04-19 北京恩泽康泰生物科技有限公司 m6A RNA甲基化位点检测方法
US20230212561A1 (en) * 2022-01-04 2023-07-06 Enumerix, Inc. Accurate sequencing library generation via ultra-high partitioning

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110105353A1 (en) * 2009-11-05 2011-05-05 The Chinese University of Hong Kong c/o Technology Licensing Office Fetal Genomic Analysis From A Maternal Biological Sample
US20130261196A1 (en) * 2010-06-11 2013-10-03 Lisa Diamond Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same
US20150057160A1 (en) * 2011-07-22 2015-02-26 Ucl Business Plc Pathogen screening
US20160019341A1 (en) * 2013-08-30 2016-01-21 Personalis, Inc. Methods and systems for genomic analysis
US20180127807A1 (en) * 2016-09-15 2018-05-10 ArcherDX, Inc. Methods of nucleic acid sample preparation for analysis of cell-free dna

Family Cites Families (139)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
AU601021B2 (en) 1987-03-11 1990-08-30 Molecular Diagnostics, Inc. Assay for necleic acid sequences in a sample
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
DK1013666T3 (da) 1990-06-27 2006-08-14 Univ Princeton Proteinkompleks p53/p90
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
JP2553322Y2 (ja) 1992-05-11 1997-11-05 サンデン株式会社 飲料抽出装置のフィルタ送り機構
US5432065A (en) 1993-03-30 1995-07-11 United States Biochemical Corporation Cycle sequencing with non-thermostable DNA polymerases
US5472672A (en) 1993-10-22 1995-12-05 The Board Of Trustees Of The Leland Stanford Junior University Apparatus and method for polymer synthesis using arrays
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
AU698953B2 (en) 1994-04-29 1998-11-12 Applied Biosystems, Llc System for real time detection of nucleic acid amplification products
US5641658A (en) 1994-08-03 1997-06-24 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid with two primers bound to a single solid support
US7122304B2 (en) 1997-05-12 2006-10-17 Whatman, Inc. Methods for the storage and synthesis of nucleic acids using a solid support
US7921068B2 (en) 1998-05-01 2011-04-05 Health Discovery Corporation Data mining platform for knowledge discovery from heterogeneous data types and/or heterogeneous data sources
US6295153B1 (en) 1998-06-04 2001-09-25 Board Of Regents, The University Of Texas System Digital optical chemistry micromirror imager
US6212519B1 (en) 1998-06-30 2001-04-03 Simulconsult, Inc. Systems and methods for quantifying qualitative medical expressions
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6444223B1 (en) 1999-05-28 2002-09-03 Alkermes Controlled Therapeutics, Inc. Method of producing submicron particles of a labile agent and use thereof
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6582938B1 (en) 2001-05-11 2003-06-24 Affymetrix, Inc. Amplification of nucleic acids
US7361488B2 (en) 2000-02-07 2008-04-22 Illumina, Inc. Nucleic acid detection methods using universal priming
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US6807490B1 (en) 2000-02-15 2004-10-19 Mark W. Perlin Method for DNA mixture analysis
US6988040B2 (en) 2001-01-11 2006-01-17 Affymetrix, Inc. System, method, and computer software for genotyping analysis and identification of allelic imbalance
EP1368497A4 (en) 2001-03-12 2007-08-15 California Inst Of Techn METHOD AND DEVICE FOR ANALYZING POLYNUCLEOTIDE SEQUENCES BY ASYNCHRONOUS BASE EXTENSION
US7211654B2 (en) 2001-03-14 2007-05-01 Regents Of The University Of Michigan Linkers and co-coupling agents for optimization of oligonucleotide synthesis and purification on solid supports
AU785425B2 (en) 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
US20070184436A1 (en) 2001-06-07 2007-08-09 Joel Myerson Generic capture probe arrays
US7083975B2 (en) 2002-02-01 2006-08-01 Roland Green Microarray synthesis instrument and method
DE60324253D1 (de) 2002-02-08 2008-12-04 Olympus Corp Spezifische multiplex-analyse von nukleinsäuren
EP1342794B1 (en) 2002-03-05 2005-12-14 Epigenomics AG Method and device for determination of tissue specificity of free floating DNA in bodily fluids
US7324928B2 (en) 2002-03-06 2008-01-29 Kitchen Scott G Method and system for determining phenotype from genotype
US7300788B2 (en) 2002-10-08 2007-11-27 Affymetrix, Inc. Method for genotyping polymorphisms in humans
CA2513889A1 (en) 2003-01-29 2004-08-19 454 Corporation Double ended sequencing
US7534561B2 (en) 2003-04-02 2009-05-19 Agilent Technologies, Inc. Nucleic acid array in situ fabrication methods and arrays produced using the same
WO2004092333A2 (en) 2003-04-09 2004-10-28 Omicia Inc. Methods of selection, reporting and analysis of genetic markers using broad based genetic profiling applications
AU2003902299A0 (en) 2003-05-13 2003-05-29 Flinders Medical Centre A method of analysing a marker nucleic acid molecule
US7939310B2 (en) 2003-08-06 2011-05-10 University Of Massachusetts Systems and methods for analyzing nucleic acid sequences
US20050086035A1 (en) 2003-09-02 2005-04-21 Pioneer Hi-Bred International, Inc. Computer systems and methods for genotype to phenotype mapping using molecular network models
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US20050250125A1 (en) 2003-12-19 2005-11-10 Novakoff James L Method for conducting pharmacogenomics-based studies
WO2005098046A2 (en) 2004-04-01 2005-10-20 Immunivest Corporation Methods for the determination of cell specific biomarkers
US7745118B2 (en) 2004-04-08 2010-06-29 Roche Nimblegen, Inc. Comparative genomic resequencing
WO2006047787A2 (en) 2004-10-27 2006-05-04 Exact Sciences Corporation Method for monitoring disease progression or recurrence
US20060278241A1 (en) 2004-12-14 2006-12-14 Gualberto Ruano Physiogenomic method for predicting clinical outcomes of treatments in patients
US20060184489A1 (en) 2004-12-17 2006-08-17 General Electric Company Genetic knowledgebase creation for personalized analysis of medical conditions
WO2006089091A2 (en) 2005-02-18 2006-08-24 Memorial Sloan-Kettering Cancer Center Methods for detecting minimum residual disease
ES2387878T3 (es) 2005-06-23 2012-10-03 Keygene N.V. Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
DK1924704T3 (da) 2005-08-02 2011-09-05 Rubicon Genomics Inc Sammensætninger og fremgangsmåder til bearbejdning og mangfoldiggørelse af DNA, herunder ved anvendelse af flere enzymer i en enkelt reaktion
WO2007055244A1 (ja) 2005-11-08 2007-05-18 National University Corporation Nagoya University 遺伝子変異検出用アレイ及び検出方法
US20070111247A1 (en) 2005-11-17 2007-05-17 Stephens Joel C Systems and methods for the biometric analysis of index founder populations
CA2911569C (en) 2005-11-29 2019-11-26 Children's Hospital Medical Center Optimization and individualization of medication selection and dosing
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
EP2029777B1 (en) 2006-05-31 2017-03-08 Sequenom, Inc. Methods and compositions for the extraction of nucleic acid from a sample
EP2653861B1 (en) 2006-12-14 2014-08-13 Life Technologies Corporation Method for sequencing a nucleic acid using large-scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2126765B1 (en) 2007-01-26 2011-08-24 Illumina Inc. Nucleic acid sequencing system and method
US8140270B2 (en) 2007-03-22 2012-03-20 National Center For Genome Resources Methods and systems for medical sequencing analysis
WO2009099602A1 (en) 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits
US20090326832A1 (en) 2008-06-27 2009-12-31 Microsoft Corporation Graphical models for the analysis of genome-wide associations
KR20110053995A (ko) 2008-08-08 2011-05-24 네이비제닉스 인크. 개인별 활동 계획을 위한 방법 및 체계
US20100035252A1 (en) 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
EP4335932A2 (en) 2008-11-07 2024-03-13 Adaptive Biotechnologies Corporation Methods of monitoring conditions by sequence analysis
CN102209791B (zh) 2008-11-12 2014-02-12 香港中文大学 Hla基因型的检测
WO2010059742A1 (en) 2008-11-18 2010-05-27 Collabrx, Inc. Individualized cancer treatment
EP2401616A4 (en) 2009-02-24 2012-08-01 Baylor College Medicine ANTIGENIC APPROACH TO THE DETECTION AND ISOLATION OF MICROPARTICLES ASSOCIATED WITH FETAL DNA
WO2010129301A2 (en) 2009-04-27 2010-11-11 New York University Method, computer-accessible medium and system for base-calling and alignment
CN102460155B (zh) 2009-04-29 2015-03-25 考利达基因组股份有限公司 用于关于参考多核苷酸序列标注样本多核苷酸序列中的变异的方法和系统
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US9524369B2 (en) 2009-06-15 2016-12-20 Complete Genomics, Inc. Processing and analysis of complex nucleic acid sequence data
US20170147577A9 (en) 2009-09-30 2017-05-25 Gennady LAPIR Method and system for extraction
US20110098193A1 (en) 2009-10-22 2011-04-28 Kingsmore Stephen F Methods and Systems for Medical Sequencing Analysis
PL2496720T3 (pl) 2009-11-06 2021-01-11 The Board Of Trustees Of The Leland Stanford Junior University Nieinwazyjna diagnoza odrzucenia przeszczepu u pacjentów z przeszczepem narządu
AU2011207544A1 (en) 2010-01-19 2012-09-06 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US20130210645A1 (en) 2010-02-18 2013-08-15 The Johns Hopkins University Personalized tumor biomarkers
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
DK3327148T3 (da) 2010-06-18 2021-04-12 Myriad Genetics Inc Fremgangsmåder til forudsigelse af status for brca1- og brca2-gener i en cancercelle
US20130102477A1 (en) 2010-06-23 2013-04-25 Ryan D. Morin Biomarkers for non-hodgkin lymphomas and uses thereof
DK2601609T3 (en) 2010-08-02 2017-06-06 Population Bio Inc COMPOSITIONS AND METHODS FOR DISCOVERING MUTATIONS CAUSING GENETIC DISORDERS
WO2012027446A2 (en) 2010-08-24 2012-03-01 Mayo Foundation For Medical Education And Research Nucleic acid sequence analysis
AU2011293635B2 (en) 2010-08-24 2015-11-26 Children's Medical Center Corporation Methods for predicting anti-cancer response
EP3822975A1 (en) 2010-09-09 2021-05-19 Fabric Genomics, Inc. Variant annotation, analysis and selection tool
US9133523B2 (en) 2010-09-23 2015-09-15 Washington University Compositions and methods for detecting cancer metastasis
WO2012048340A2 (en) 2010-10-08 2012-04-12 President And Fellows Of Harvard College High-throughput immune sequencing
US20150370959A9 (en) 2011-04-13 2015-12-24 The Board Of Trustees Of The Leland Stanford Junior University Phased Whole Genome Genetic Risk In A Family Quartet
RS64230B1 (sr) 2011-05-24 2023-06-30 BioNTech SE Individualizovane vakcine protiv kancera
US10347359B2 (en) 2011-06-16 2019-07-09 The Board Of Trustees Of The Leland Stanford Junior University Method and system for network modeling to enlarge the search space of candidate genes for diseases
WO2013103945A1 (en) 2012-01-06 2013-07-11 Synapdx Corporation Composite assay for developmental disorders
HUE051845T2 (hu) 2012-03-20 2021-03-29 Univ Washington Through Its Center For Commercialization Módszerek a tömegesen párhuzamos DNS-szekvenálás hibaarányának csökkentésére duplex konszenzus szekvenálással
US8595219B1 (en) 2012-05-16 2013-11-26 Trans Union, Llc System and method for contextual and free format matching of addresses
KR20150035818A (ko) 2012-06-15 2015-04-07 해리 스타일리 순환 병든 세포를 사용하여 질환 또는 병태를 검출하는 방법
WO2014053295A1 (de) 2012-10-02 2014-04-10 Binder + Co Ag Vorrichtung und verfahren zur klassierung von polydispersem aufgabegut
WO2014062717A1 (en) 2012-10-15 2014-04-24 Life Technologies Corporation Compositions, methods, systems and kits for target nucleic acid enrichment
ES2703764T3 (es) 2012-12-14 2019-03-12 Chronix Biomedical Biomarcadores personalizados para el cáncer
WO2014113204A1 (en) 2013-01-17 2014-07-24 Personalis, Inc. Methods and systems for genetic analysis
CN105518151B (zh) 2013-03-15 2021-05-25 莱兰斯坦福初级大学评议会 循环核酸肿瘤标志物的鉴别和用途
JP6308724B2 (ja) 2013-05-09 2018-04-11 ジェノダイブファーマ株式会社 Hla遺伝子のマルチプレックスdnaタイピング方法及びキット
EP2818867A1 (en) 2013-06-27 2014-12-31 INSERM (Institut National de la Santé et de la Recherche Médicale) Antibodies conjugated to at least one nucleic acid molecule and their use in multiplex immuno-detection assays
US10174375B2 (en) 2013-09-20 2019-01-08 The Chinese University Of Hong Kong Sequencing analysis of circulating DNA to detect and monitor autoimmune diseases
GB2535066A (en) 2013-10-03 2016-08-10 Personalis Inc Methods for analyzing genotypes
CN105283555A (zh) 2013-10-20 2016-01-27 特罗瓦基因公司 核酸序列的合成和富集
KR102429186B1 (ko) 2013-10-21 2022-08-03 베리나타 헬스, 인코포레이티드 사본수 변동을 결정함에 있어서 검출의 감수성을 향상시키기 위한 방법
WO2015077717A1 (en) 2013-11-25 2015-05-28 The Broad Institute Inc. Compositions and methods for diagnosing, evaluating and treating cancer by means of the dna methylation status
EP4156194A1 (en) 2014-01-14 2023-03-29 Fabric Genomics, Inc. Methods and systems for genome analysis
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
EP3140427B1 (en) 2014-05-09 2020-10-14 Memorial Sloan Kettering Cancer Center Biomarkers for response to pi3k inhibitors
US20180173845A1 (en) 2014-06-05 2018-06-21 Natera, Inc. Systems and Methods for Detection of Aneuploidy
CN106795562B (zh) 2014-07-18 2022-03-25 香港中文大学 Dna混合物中的组织甲基化模式分析
WO2016061111A1 (en) 2014-10-13 2016-04-21 Life Technologies Corporation Methods, kits & compositions for determining gene copy numbers
US10125399B2 (en) 2014-10-30 2018-11-13 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
JP2017538404A (ja) 2014-11-14 2017-12-28 リキッド ジェノミクス,インコーポレイティド 癌を診断及び/又は観察するための循環無細胞rnaの使用
EP3227464B1 (en) 2014-12-05 2022-04-20 Foundation Medicine, Inc. Multigene analysis of tumor samples
CN105044108B (zh) * 2015-07-10 2018-08-24 港龙生物技术(深圳)有限公司 微阵列芯片点样质量自动化判断系统及判断方法
AU2016369519B2 (en) 2015-12-16 2023-04-20 Gritstone Bio, Inc. Neoantigen identification, manufacture, and use
KR20220018627A (ko) 2016-02-29 2022-02-15 파운데이션 메디신 인코포레이티드 종양 돌연변이 부담을 평가하기 위한 방법 및 시스템
EP3433373B1 (en) 2016-03-22 2022-01-12 Myriad Women's Health, Inc. Combinatorial dna screening
WO2017181146A1 (en) 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
WO2017205823A1 (en) 2016-05-27 2017-11-30 Personalis, Inc. Personalized genetic testing
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
CA3033650A1 (en) 2016-08-17 2018-02-22 The Regents Of The University Of California A novel immunoprobe-based method to assess organ injury status through a biofluid-based cell-free dna (cfdna) assay
US20200048711A1 (en) 2016-10-12 2020-02-13 Bellwether Bio, Inc Determining cell type origin of circulating cell-free dna with molecular counting
WO2018085862A2 (en) 2016-11-07 2018-05-11 Grail, Inc. Methods of identifying somatic mutational signatures for early cancer detection
EP3601615A4 (en) 2017-03-20 2020-12-09 Caris MPI, Inc. GENOMIC STABILITY PROFILING
JP7123975B2 (ja) 2017-05-16 2022-08-23 ガーダント ヘルス, インコーポレイテッド 無細胞dnaについての体細胞起源または生殖系列起源の識別
ES2960914T3 (es) 2018-03-16 2024-03-07 Gopath Laboratories Llc Métodos para la detección personalizada de la reaparición del cáncer o de la metástasis y/o evaluación de la respuesta al tratamiento
US10801064B2 (en) 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110105353A1 (en) * 2009-11-05 2011-05-05 The Chinese University of Hong Kong c/o Technology Licensing Office Fetal Genomic Analysis From A Maternal Biological Sample
US20130261196A1 (en) * 2010-06-11 2013-10-03 Lisa Diamond Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same
US20150057160A1 (en) * 2011-07-22 2015-02-26 Ucl Business Plc Pathogen screening
US20160019341A1 (en) * 2013-08-30 2016-01-21 Personalis, Inc. Methods and systems for genomic analysis
US20180127807A1 (en) * 2016-09-15 2018-05-10 ArcherDX, Inc. Methods of nucleic acid sample preparation for analysis of cell-free dna

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SANJA STEVANOVIC ET AL.: "Landscape of immunogenic tumor antigens in successful immunotherapy of virally induced epithelial cancer", 《SCIENCE》, vol. 356, no. 6334, pages 200 - 205, XP055659875, DOI: 10.1126/science.aak9510 *
ZACHARY W BENT ET AL.: "Enriching pathogen transcripts from infected samples: a capture-based approach to enhanced host-pathogen RNA sequencing", 《ANALBIOCHEM》, vol. 438, no. 1, pages 91 *
ZHENMING YU ET AL.: "Mung bean nuclease treatment increases capture specificity of microdroplet-PCR based targeted DNA enrichment", 《PLOS ONE》, vol. 9, no. 7, pages 1 - 7 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109321569A (zh) * 2018-10-29 2019-02-12 凯杰(苏州)转化医学研究有限公司 一种引物探针组合物及其应用
CN114369650A (zh) * 2022-03-21 2022-04-19 深圳市仙湖植物园(深圳市园林研究中心) 捕获探针的设计方法、捕获探针及其应用
CN114369650B (zh) * 2022-03-21 2022-06-17 深圳市仙湖植物园(深圳市园林研究中心) 捕获探针的设计方法、捕获探针及其应用

Also Published As

Publication number Publication date
EP3802854A1 (en) 2021-04-14
JP2021525515A (ja) 2021-09-27
GB202020171D0 (en) 2021-02-03
SG11202011464VA (en) 2020-12-30
US20210054452A1 (en) 2021-02-25
WO2019231856A1 (en) 2019-12-05
US11634767B2 (en) 2023-04-25
EP3802854A4 (en) 2022-04-06
US20190367978A1 (en) 2019-12-05
GB2590197A (en) 2021-06-23
US10801064B2 (en) 2020-10-13
JP2023155473A (ja) 2023-10-20

Similar Documents

Publication Publication Date Title
US11634767B2 (en) Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US11591653B2 (en) Methods and systems for genetic analysis
US11935625B2 (en) Methods and systems for genomic analysis
Wang et al. Recent advances and application of whole genome amplification in molecular diagnosis and medicine
US11814750B2 (en) Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
CN111295713A (zh) 稳定同位素标记的核酸作为内标物的核酸定量方法及其用途
Dongare et al. Harnessing Genetic Code: Futuristic Approach of Next-Generation Sequencing for Sustainable Future

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination