CN110023509A - 基因型分型测定中的非独特条形码 - Google Patents

基因型分型测定中的非独特条形码 Download PDF

Info

Publication number
CN110023509A
CN110023509A CN201780069559.1A CN201780069559A CN110023509A CN 110023509 A CN110023509 A CN 110023509A CN 201780069559 A CN201780069559 A CN 201780069559A CN 110023509 A CN110023509 A CN 110023509A
Authority
CN
China
Prior art keywords
bar code
method described
sequencing
nucleic acid
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780069559.1A
Other languages
English (en)
Inventor
M·索森
V·沃克里斯科
L·迪亚斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Private Gene Diagnosis Co
Personal Genome Diagnostics Inc
Original Assignee
Private Gene Diagnosis Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Private Gene Diagnosis Co filed Critical Private Gene Diagnosis Co
Publication of CN110023509A publication Critical patent/CN110023509A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/131Allele specific probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/159Reduction of complexity, e.g. amplification of subsets, removing duplicated genomic regions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开涉及ctDNA测定,其以高精确性和准确性从单个样本中查询多个区域,同时评估包括序列突变和结构改变的多种形式的癌症相关的基因组改变。本公开提供了通过使用有限的非独特条形码池与内源条形码组合分析癌症基因来实现高灵敏性和特异性的简化但稳健的方法。使用高覆盖率下一代测序捕获并测序样本,以允许识别肿瘤特异性体细胞突变、扩增和易位。

Description

基因型分型测定中的非独特条形码
相关申请(一个或多个)的交叉引用
本申请要求2016年11月15日提交的美国临时申请序号62/422,355的权益和优先权,其内容以其整体通过引用并入本文。
技术领域
本发明总体上涉及用于分析肿瘤特异性生物标志的核酸的条形码化(barcoding)策略。
背景技术
仅在美国,癌症每年导致多于五十万人死亡。目前治疗的成功取决于癌症的类型及其被检测到时的分期。多种治疗包括昂贵且痛苦的手术和化学疗法,并且通常是不成功的。
突变的早期且准确检测对于有效的癌症治疗是必要的。个人化癌症治疗中的一个有前景的领域是分析循环肿瘤DNA(ctDNA)。ctDNA从肿瘤组织释放到血液中,携带肿瘤特异性基因改变,并且可以通过非侵入性液体活组织检查方法进行分析,以识别癌症患者中的基因改变。液体活组织检查提供了相当大的优势,因为它们可以消除对侵入性程序的需要,允许治疗反应的早期测量,并且允许在治疗过程中检测多个转移性病灶的改变。
然而,由于当前基因型分型技术的限制,查询(interrogate)血液中的ctDNA一直有问题。从血液样本中获得的ctDNA的分数通常非常低(<1.0%)并且可能难以检测。大多评估ctDNA的方法查询单个热点突变或仅一些基因改变。在无细胞DNA(游离DNA,cell-freeDNA)中的常规基因型分型具有约1%的错误率,这使得难以或不可能使用常规分子条形码化技术识别样本中具有<1%流行率(普遍性,prevalence)的突变。目前的方法不提供足够的分析灵敏性和特异性。
发明内容
本公开涉及ctDNA测定,其以高精确性和准确性从单个样本查询多个基因组区域,同时评估包括序列突变和结构改变的多种形式的癌症相关基因组改变。本公开提供了通过利用有限的非独特条形码池与内源条形码组合分析癌症基因来实现高灵敏性和特异性的简化但稳健的方法。使用高覆盖率下一代测序(high coverage next-generationsequencing)来捕获并测序,以允许识别肿瘤特异性体细胞突变和易位。针对序列突变或重排的分析可以一起或单独进行——取决于目标的具体改变。所公开的方法针对诊断、法医、系谱和临床目的提供了增加的测序灵敏性和特异性。
所公开的方法尤其适于适应(accommodating)低丰度样本DNA,如在液体活组织检查中。液体活组织检查评估血液中DNA的循环肿瘤DNA。循环肿瘤DNA(ctDNA)可以通过肿瘤细胞的凋亡进入血流,并且当被检测到时,允许诊断、基因型分型和疾病监测,而无需传统的侵入性活组织检查程序。然而,ctDNA水平总体上非常低,尤其是对于早期肿瘤,这使得其难以依赖ctDNA进行检测和分析。本发明用识别含有限量DNA模板的样本中的稀有突变的方法解决了此问题。本发明的方法降低了大规模平行测序仪器中固有的错误率的影响(effect)。没有本公开的方法,那些仪器中固有的错误率通常太高而不能识别多数样本中的稀有突变。
方法可包括从血浆样本中提取和分离无细胞DNA,并将外源条形码分配至每个片段以产生DNA文库。外源条形码来自有限的非独特条形码池,例如8种不同的条形码。条形码化的片段基于它们的外源条形码和由每个无细胞DNA分子的片段末端的基因组位置产生的内源条形码的组合而被分化。DNA文库被冗余测序,并协调(调整,reconcile)具有匹配条形码的序列。将协调的序列与人类基因组参考比对,并将比对序列中存在的变体识别为真实突变。
本发明认识到完全独特的条形码序列是不必要的。相反,预定组的非独特序列与内源条形码的组合可以针对生物学相关的DNA量提供与独特条形码可提供的相同的灵敏性和特异性水平。有限的条形码池比传统的独特组更稳健,且更易于创建和使用。例如,方法可用于测定一组充分表征的癌症基因。该方法还可用于评估肿瘤组织中的亚克隆突变。
本发明的方面涉及分析核酸的方法。核酸可以是无细胞DNA、循环肿瘤DNA或RNA。方法涉及获得包含核酸片段的样本、将非独特条形码组引入片段以产生基因组文库、识别片段的末端部分、对片段进行测序以产生序列读数(sequence reads)、和比对序列读数从而识别突变。
获得步骤可包括获得血浆样本、提取核酸和使核酸片段化。引入非独特条形码组步骤可包括末端修复、加A尾(A-tailing)和衔接子(adapter)连接。在一些实施方式中,非独特条形码组由八组非独特条形码组成。条形码可包括测序衔接子。
识别末端部分的步骤可包括杂交捕获或全基因组测序。DNA片段的末端部分可包括内源条形码。杂交捕获可涉及一组充分表征的癌症基因,包括例如,ABL1、AKT1、ALK、APC、AR、ATM、BCR、BRAF、CDH1、CDK4、CDK6、CDKN2A、CSF1R、CTNNB1、DNMT3A、EGFR、ERBB2、ERBB4、ESR1、EZH2、FBXW7、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、KRAS、MAP2K1、MET、MLH1、MPL、MYC、NPM1、NRAS、NTRK1、PDGFRA、PDGFRB、PIK3CA、PIK3R1、PTEN、PTPN11、RARA、RB1、RET、ROS1、SMAD4、SMARCB1、SMO、SRC、STK11、TERT、TP53、和/或VHL。
测序步骤可涉及单末端或配对末端(双末端,paired-end)测序。测序步骤可涉及冗余测序及使用冗余序列读数来确定共有序列。可以2x、10x、50x、100x等的深度进行冗余测序。比对步骤可包括确定条形码化片段的基因座在冗余序列读数的预定百分比(如50%、60%、70%、80%、90%、99%等)上是否相同。
在相关方面,本发明涉及分子条形码化的方法,其包括以下步骤:获得包含核酸片段的样本、提供多个非独特条形码组、和用条形码标记核酸片段以产生基因组文库,其中每个核酸片段用与基因组文库中另一不同的核酸片段相同的条形码标记。
在实施方式中,多个组限于二十个或更少的独特条形码。在其它实施方式中,多个组限于十个或更少的独特条形码。
方法可进一步包括以下步骤中的一个或多个:识别片段的末端部分;冗余测序基因组文库,以产生每个核酸片段的多个冗余序列读数;协调类似标记的核酸片段的冗余序列读数;和将协调的序列读数与参考比对,从而确定共有序列。
附图说明
图1显示了利用非独特条形码与内源条形码组合进行基因型分型的方法。
图2显示了根据本公开的条形码化方法。
图3和4显示了用于本发明的充分表征的癌症基因组(panels)。
图5显示了基因型分型方法的流程图。
图6显示了泛癌(pan-cancer)细胞系序列突变观察到的和预期的突变等位基因频率结果。
图7显示了内部对照乳腺癌(internal control breast cancer)细胞系观察到的和预期的突变等位基因频率结果。
具体实施方式
循环肿瘤DNA(ctDNA)的高通量测序有望使癌症诊断和治疗个人化,同时消除多种侵入性活组织检查程序的需要。但是,血液中低量的无细胞DNA(cfDNA)和测序技术的限制存在挑战。测序假象(artifacts)的普遍性限制了涉及ctDNA液体活组织检查的测定的灵敏性。例如,Illumina测序具有上至1%的错误率。错误源于测序中的模板制备、文库制备和碱基判定错误期间。在寻找低频突变时,那些错误尤其成问题。本文公开的方法解决了那些和其它问题。
本发明的方法提供了对基因变体具有高灵敏性和特异性的癌症基因组的高通量分析。方法针对研究和临床目的两者提供了ctDNA的非侵入性基因型分型和检测。本发明利用非独特条形码与靶核酸的内源条形码的组合以在基因型分型测定中提供高灵敏性和特异性。方法可用于低丰度样本DNA,如ctDNA。
cfDNA的输入分子(即,基因组当量)的数量通常在血浆中非常小,使得ctDNA的回收成为挑战。文库制备和测序引入对于查询稀有突变构成显著障碍的错误。本发明的方法在cfDNA中实现高检测极限(低至0.05-0.1%),并且能够在多种恶性肿瘤中发现用传统方法将检测不到的突变。这些方法提高了检测低频等位基因的灵敏性和特异性。本发明认识到,非独特条形码和DNA分子的分子末端的组合可以高灵敏性和特异性水平用于区分DNA。
方法总体上涉及用非独特条形码池标记cfDNA片段并配对末端测序以识别外源条形码和片段特异性内源条形码。虽然多数现有的条形码化方法是基于PCR的,但是本公开的方法使用基于捕获的方法,其中有限的预定条形码组分层在内源条形码的顶部上。基于捕获的方法涉及生成基因组文库并捕获某些区域。由于可量测性、灵活性和覆盖均匀性的增加,这种方法优于基于PCR的策略。基于捕获的方法可以高灵敏性和特异性同时查询数千个基因组位置。利用此方法,测序片段的每个末端以区分与外源条形码组合的片段末端的内源条形码序列。外源条形码池与DNA片段的映射位置的组合以足够的灵敏性和特异性提供了识别片段所需的所有复杂度。
例如,如果在片段——其可以通过随机剪切、核酸外切酶消化或可能与无细胞DNA一起存在的天然片段化产生——的任一端存在100个不同的内源条形码,则可以使用配对末端测序评估10,000个不同的分子。例如,分配8个非独特条形码池将因此产生80,000种组合。这种测定可识别0.1至0.05%范围内的突变。对于需要此灵敏性水平的测定,本公开显示了有限的非独特条形码组提供了这种测定中所需的所有多样性。根据本发明,非独特的外源条形码的小池可被分层到内源末端区域上,以提供稳健的测定,其实现与传统的、更复杂的条形码化方案相当的灵敏性水平,同时极大降低成本和复杂性。这些数目仅仅是实例,并且可以根据需要增加或减少以适应特定的测定。
测序可以2x、10x、50x、100x、1,000x、10,000x、50,000x或更大的深度进行。比较并协调冗余序列读数,以区分体细胞突变与测序或其它处理错误。如果原始DNA分子中存在突变,则应该在该基因座的每个序列读数中看到突变,尽管存在任何后续的测序错误。例如,如果一定百分比的读数含有推定突变,则突变可以被判定。进行突变判定的阈值百分比可以是25%、50%、60%、75%、90%、95%、99%等。可以基于获得的序列读数的数量和测定的特定需要来设定阈值。同样,在模板DNA中不发生的突变预期不会出现在很大百分比的读数中,并且那些变体可以被误认为测序错误、复制错误或其它处理错误。可以通过比较和协调序列读数来确定共有序列。
本发明的方法涉及将核酸与样本分离。核酸可以是包括ctDNA的cfDNA。方法对于cfDNA尤其有用,但其它类型的核酸也可以被使用,包括RNA。样本可包括,例如,无细胞核酸(包括DNA或RNA)或与肿瘤组织样本分离的核酸,所述肿瘤组织样本如活组织检查组织、福尔马林固定石蜡包埋组织(FFPE)、冷冻组织、细胞系、DNA和肿瘤移植物。作为FFPE块或冷冻组织提供的样本可经历病理学检查以确定肿瘤细胞性(cellularity)。肿瘤可被宏观解剖或微观解剖以去除污染的正常组织。样本也可以来自患者淋巴细胞、血液、唾液、通过口腔拭子(buccal swab)获得的细胞或其它未受影响的组织。无细胞核酸可以是存在于患者血流中的DNA或核糖核酸(RNA)片段。在优选的实施方案中,循环的无细胞核酸是从患者的血浆或血清中获得的一个或多个DNA片段。
可以根据本领域已知的技术分离无细胞核酸,并且包括,例如来自Qiagen(Venlo,Netherlands)的QIAmp系统、Triton/Heat/Phenol方案(THP)(Xue,et al.,Optimizing theYield and Utility of Circulating Cell-Free DNA from Plasma and Serum",Clin.Chim.Acta.,2009;404(2):100-104)、平末端连接介导的全基因组扩增(BL-WGA)(Li,et al.,"Whole Genome Amplification of Plasma-Circulating DNA Enables ExpandedScreening for Allelic Imbalance in Plasma",J.Mol Diagn.2006Feb;8(1):22-30)、或来自Macherey-Nagel,GmbH&Co.KG(Duren,Germany)的NucleoSpin系统。在示例性实施方式中,从患者中获得血液样本,并通过离心分离血浆。然后可通过上述技术中的任一种分离循环的无细胞核酸。
总体上,可通过多种技术提取、分离、扩增或分析核酸,所述多种技术如通过Greenand Sambrook,Molecular Cloning:A Laboratory Manual(Fourth Edition),ColdSpring Harbor Laboratory Press,Woodbury,NY 2,028pages(2012)描述的那些技术;或在美国专利7,957,913;美国专利7,776,616;美国专利5,234,809;美国专利2010/0285578;和美国专利2002/0190663中所描述的技术。
从生物样本中获得的核酸可以被片段化以产生用于分析的合适片段。片段化核酸的方法是本领域已知的。可以使用各种机械、化学和/或酶方法将模板核酸片段化或剪切至所需长度。可以通过超声处理、短暂暴露于DNase/RNase、水力剪切仪器、一种或多种限制酶、转座酶或切口酶、暴露于热加镁、或通过剪切来剪切核酸。与无细胞DNA的情况一样,核酸也可以是天然片段化的。可以根据需要在去污剂或表面活性剂的存在下裂解、均质化或分级分离生物样本。适合的去污剂可包括离子去污剂(例如,十二烷基硫酸钠或N-月桂酰肌氨酸)或非离子去污剂(如,由Uniqema Americas(Paterson,NJ)以商标TWEEN销售的聚山梨醇酯80或C14H22O(C2H4)n,称为TRITON X-100)。得到的片段可以是任何大小的,例如10bp、50bp、100bp、500bp、1,000bp、5,000bp或更大。剪切后可进行末端修复和加A尾。可以根据标准测序方案连接测序衔接子。
利用可选择的寡核苷酸的杂交捕获探针可用于获得目标核酸。参见,例如Lapidus(美国专利号7,666,593),其内容以其整体通过引用并入本文。制备和使用杂交探针的常规方法可以在标准实验室手册中找到,如:Genome Analysis:A Laboratory Manual Series(Vols.I-IV),Cold Spring Harbor Laboratory Press;PCR Primer:A LaboratoryManual,Cold Spring Harbor Laboratory Press;和Sambrook,J et al.,(2001)Molecular Cloning:A Laboratory Manual,2nd ed.(Vols.1-3),Cold Spring HarborLaboratory Press。
在诸如上述那些处理步骤之后,核酸可被测序。可以通过本领域已知的任何方法进行测序。DNA测序技术包括使用标记的终止子或引物和平板或毛细管中的凝胶分离的经典双脱氧测序反应(Sanger方法),和下一代测序方法,如通过利用可逆终止的标记核苷酸合成测序;焦磷酸测序;454测序;Illumina/Solexa测序;与标记的寡核苷酸探针文库的等位基因特异性杂交;这样的测序——通过利用与标记的克隆文库的等位基因特异性杂交合成,然后连接、实时监测聚合步骤期间标记的核苷酸的并入;polony测序;和SOLiD测序。可以利用聚合酶或连接酶,通过连续或单一延伸反应,以及通过与探针文库的单一或连续差异杂交来测序分离分子。
可使用的测序技术包括,例如,使用454Life Sciences,a Roche company(Branford,CT)以商标为GS JUNIOR、GS FLX+和454SEQUENCING销售的合成测序(sequencing-by-synthesis)系统,和通过Margulies,M.et al.,Genome sequencing inmicro-fabricated high-density picotiter reactors,Nature,437:376-380(2005);美国专利5,583,024;美国专利5,674,713;和美国专利5,700,673所述,其内容以其整体通过引用并入本文。
DNA测序技术的其它实例包括来自Life Technologies Corporation(Carlsbad,CA)的Applied Biosystems的SOLiD技术和离子半导体测序,所述离子半导体测序利用例如Ion Torrent by Life Technologies(South San Francisco,CA)以商标名ION TORRENT销售的系统。离子半导体测序描述于,例如Rothberg,et al.,An integrated semiconductordevice enabling non-optical genome sequencing,Nature 475:348-352(2011);美国公开2010/0304982;美国公开2010/0301398;美国公开2010/0300895;美国公开2010/0300559;和美国公开2009/0026082,其每个内容以其整体通过引用并入。
可以使用的测序技术的另一实例是Illumina测序。Illumina测序基于使用折回(fold-back)PCR和锚定引物,在固体表面上扩增DNA。衔接子被添加到天然或实验上片段化的DNA的5'和3'末端。附接于流动细胞通道表面的DNA片段被延伸并被桥接扩增。片段变成双链的,并且双链分子被变性。多个循环的固相扩增随后变性可以在每个流动细胞通道中产生相同模板的大约1,000个拷贝的单链DNA分子的数百万个簇。使用引物、DNA聚合酶和四种荧光团标记的可逆终止核苷酸进行连续测序。在核苷酸并入后,使用激光激发荧光团,并捕获图像和记录第一碱基的特性。去除来自每个并入的碱基的3'终止子和荧光团,并重复并入、检测和鉴定步骤。根据本技术的测序描述于美国专利7,960,120;美国专利7,835,871;美国专利7,232,656;美国专利7,598,035;美国专利6,911,345;美国专利6,833,246;美国专利6,828,100;美国专利6,306,597;美国专利6,210,891;美国公开2011/0009278;美国公开2007/0114362;美国公开2006/0292611;和美国公开2006/0024681,其中每个以其整体通过引用并入。
测序技术的一个限制是测序假象的普遍性。降低测序假象的常用方法是分子条形码化。大多条形码化方法涉及用标识符(identifier)——其可以在整个测定过程中被跟踪——标记DNA片段,使得可以将体细胞突变与测序错误区分。
术语条形码包括外源条形码和内源条形码,所述外源条形码被引入样本DNA片段,所述内源条形码是通过生物学或实验剪切使DNA片段化而产生的末端序列。条形码可包含任何数量的核苷酸,如2、4、8、16或更多个核苷酸。
外源条形码可以通过本领域已知的方法产生。例如,它们可以通过将随机核苷酸添加到组装在基质上的短序列来产生。它们可以通过简并合成模板上的聚合酶延伸酶促产生,或者它们可以在具有衔接子序列的单个单元中合成。合成条形码允许更大地控制其成分,但可能是昂贵的。因此,使用有限的条形码池允许更具成本效益地进行测定。
条形码可以是完全随机的,或者它们可用某些预定序列被工程化。它们可具有随机区域或半随机区域和其它固定区域。条形码可以包括其它区域,如引发位点、衔接子、或将有助于进一步处理和分析的其它互补(complimentary)区域。
外源条形码可以通过本领域已知的方法附接于核酸片段,如通过PCR或酶促连接。它们可以附接在片段的一个末端或两个末端处。条形码分子可以商购获得,如从Integrated DNA Technologies(Coralville,IA)获得。在某些实施方式中,一个或多个条形码附接于每个、任一个或所有片段。条形码序列总体上包括使序列在测序反应中有用的某些特征。设计条形码序列组的方法显示于,例如美国专利6,235,475,其内容以其整体通过引用并入本文。将条形码序列附接于核酸模板显示于美国公开2008/0081330和美国公开2011/0301042中,其中每个的内容以其整体通过引用并入本文。用于设计条形码序列组的方法和用于附接条形码序列的其它方法显示于美国专利6,138,077;6,352,828;5,636,400;6,172,214;6235,475;7,393,665;7,544,473;5,846,719;5,695,934;5,604,097;6,150,516;RE39,793;7,537,897;6172,218;和5,863,722,其中每个内容以其整体通过引用并入本文。用于测序和拷贝数估计的条形码描述于美国公开2016/0046986,以其整体通过引用并入。
本公开利用非独特条形码以在基因型分型测定中提供高灵敏性和特异性。在其它上下文中,如上面引用的出版物,条形码可以被称为独特标识符(UID)。此处,我们避免此术语,因为本方法的外源条形码不必是独特的。传统的条形码化方法强调需要生成数千或数百万个条形码序列或组合,以高度确定地确保没有两个片段接收相同的条形码。本公开证明,与传统观点相反,分层到内源条形码上的较小的非独特条形码池可以与传统方案具有相同水平的多样性,同时降低复杂度并增加测定稳健性。
本发明认识到虽然某一条形码化水平在测序测定中是降低背景噪音所必需的,但现有技术的条形码化方法高估了此问题。传统上,方法涉及生成数千或数百万条形码组合。生成那些条形码使基因型分型测定过度复杂化并使其较不稳健。本公开显示,可以显著更低的复杂度实现相同水平的特异性。
当被条形码化的片段被测序时,生成多个读数。读数的长度可以在约50至200个碱基之间。在一些实施方式中,可以获得更短的读数,例如,长度小于约50或约30个碱基。一些测序技术可以产生长度为数百或数千碱基的读数。
可以通过本领域已知的任何适当的方法分析序列读数组。例如,在一些实施方式中,通过作为测序(sequence)仪器的部分提供的硬件或软件分析序列读数。在一些实施方式中,通过视觉(例如,在计算机监测器上)审查个别序列读数。
序列组装可以通过本领域已知的方法进行,包括基于参考的组装、从头组装(denovo assemblies)、通过比对组装或组合方法。在一些实施方式中,序列组装使用低覆盖率序列组装软件(LOCAS)工具,其由Klein,et al.,在LOCAS-A low coverage sequenceassembly tool for re-sequencing projects,PLoS One 6(8)article 23455(2011)中描述,其内容以其整体特此通过引用并入。序列组装描述于美国专利8,165,821;美国专利7,809,509;美国专利6,223,128;美国公开2011/0257889;和美国公开2009/0318310,其中每个的内容以其整体特此通过引用并入。
图1显示了根据本公开的用于分析核酸的方法100。方法100涉及获得包括核酸片段的样本的步骤113。步骤113可包括从患者中获得血浆样本并提取核酸片段。核酸可包括无细胞DNA、循环肿瘤DNA、肿瘤DNA或RNA。片段可被末端修复、加A尾、和用衔接子连接。在步骤119中,引入非独特条形码组以生成基因组文库。在步骤125中,片段被测序以产生序列读数,并比对序列读数。测序可涉及冗余测序每个片段。在步骤131中,识别片段末端的基因组位置。在步骤137中,通过非独特条形码和片段末端的基因组位置的组合确定来识别存在于多个分子中的突变。
方法可包括在基因组文库上进行杂交捕获。杂交捕获可涉及充分表征的癌症基因组,如ABL1、AKT1、ALK、APC、AR、ATM、BCR、BRAF、CDH1、CDK4、CDK6、CDKN2A、CSF1R、CTNNB1、DNMT3A、EGFR、ERBB2、ERBB4、ESR1、EZH2、FBXW7、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、KRAS、MAP2K1、MET、MLH1、MPL、MYC、NPM1、NRAS、NTRK1、PDGFRA、PDGFRB、PIK3CA、PIK3R1、PTEN、PTPN11、RARA、RB1、RET、ROS1、SMAD4、SMARCB1、SMO、SRC、STK11、TERT、TP53、和VHL。
图2显示了根据本公开的用于分子条形码化的方法200。方法200包括获得具有核酸片段的样本的步骤209和提供多个非独特条形码组的步骤215。在步骤221中,用条形码标记核酸片段以产生基因组文库。因为存在有限数量的非独特条形码组(例如,八个不同组),每个核酸片段被标记有与基因组文库中的至少一个其它不同核酸片段相同的条形码。外源条形码因此为“非独特的”。片段的基因组位置可通过核酸片段化产生的内源条形码来识别。
在一些实施方式中,方法200进一步涉及冗余测序基因组文库以产生每个核酸片段的多个冗余序列读数。方法200可以进一步包括协调类似标记的核酸片段的冗余序列读数。方法200可进一步包括将协调的序列读数与参考比对以确定共有序列。
所公开的方法可用于需要高灵敏性和特异性水平的任何测序测定。方法尤其适用于测序从血浆中分离的少量cfDNA并查询他们的体细胞突变。
实施例
进行了验证研究以供研究使用。研究的目标是证明下一代文库制备与使用组的靶基因捕获相结合对于在Illumina HiSeq测序平台上的测序是可重现的和准确的。正在研究的组是靶向的充分表征的癌症基因组,称为PlasmaSelectTM组,目前由PGDx(Baltimore,MD)开发。使用组合衍生的细胞系和临床血浆样本验证这种方法,能够识别与临床和生物医学癌症研究相关的一组基因中的肿瘤特异性序列突变、扩增和易位。方法验证的范围是将此测定法用于利用来自癌症患者的血浆样本的研究,以评估图3和4中所示的基因。
方法和处理描述
1.样本制备、文库生成和DNA捕获
DNA提取和处理
对衍生的细胞系和来自血浆的无细胞DNA(cfDNA)进行靶基因测序分析以识别肿瘤特异性(体细胞)改变。以液体活组织检查的形式实施这些方法的两个技术挑战包括获得的有限量的DNA和与这些改变相关的低突变等位基因频率。据记载,每毫升血浆获得少至几千个基因组当量,并且突变等位基因频率的范围可在<0.01%至>50%(Bettegowdaet.al.,2014)的总cfDNA之间。所公开的技术克服了此问题并提高了测试灵敏性,优化了将无细胞DNA转化为基因组文库的方法,和数字测序方法以提高下一代测序方法的特异性。利用具有冗余测序错误校正方法的数字测序技术有效地降低了由下一代测序引入的错误率,并且允许准确识别序列突变(参见图5,单碱基和小插入和缺失)。
文库制备和靶向捕获
简而言之,无细胞DNA被从细胞系或血浆样本中提取,并通过末端修复、加A尾和衔接子连接用寡核苷酸条形码被制备成适于下一代测序的基因组文库。针对序列突变组(图3)和结构改变组(图4)两者进行利用120个碱基对(bp)RNA寡核苷酸的溶液内杂交捕获。
2.测序
使用配对末端Illumina HiSeq2500测序化学测序富集的细胞系或血浆衍生的捕获的DNA文库,对于每个靶向碱基,序列突变为>20,000倍的平均靶向总覆盖率,或异位为>5,000倍的覆盖。将序列数据映射到参考人类基因组序列,并检验编码和内含子区域的体细胞改变。
3.生物信息学
使用包括新遗传分析方法(novel genetic analysis methods)和专有数据分析算法(proprietary data analysis algorithms)的复杂(sophisticated)生物信息学方法分析数据,以灵敏地和特异地识别肿瘤特异性改变,并整合序列信息、基因组数据和癌症基因及途径,从而提供最完整的和信息化的数据组来指导患者管理。简而言之,这些步骤包括:
1.初步处理下一代测序数据
2.使用ELAND和Novoalign比对下一代测序数据与人类参考基因组
3.分析下一代序列数据的序列突变
4.分析下一代序列数据的局灶扩增(Focal Amplifications)
5.分析下一代序列数据的易位
研究计划和样本组
样本类型
使用泛癌细胞系(表1)、来自晚期乳腺癌患者、结肠癌患者和肺癌患者的血浆以及来自健康供体的样本的组合进行验证研究以评估测定性能(图1-4以及图6和7)。通过ILSBio(Chestertown,MD)回顾性获得来自健康供体和晚期癌症患者的临床样本。从ATCC(Manassas,VA)获得细胞系样本,从中提取DNA,剪切并纯化至与从血浆获得的无细胞DNA一致的片段长度分布。然后,根据相关的标准操作程序(SOP),使用PlasmaSelectTM R 64组评估这些样本。
表1.泛癌细胞系和序列突变
表2.针对PlasmaSelectTM R 64方法验证进行序列突变和扩增分析
*通过针对给定的DNA输入,以指定比率滴定肿瘤和正常DNA来产生细胞系样本的肿瘤纯度,从而产生指定的肿瘤纯度。对于文库制备中使用的试剂,遵循制造商指南。
表3.针对PlasmaSelectTM R 64方法验证进行重排分析
*通过针对给定的DNA输入,以指定比率滴定肿瘤和正常DNA来产生细胞系样本的肿瘤纯度,从而产生指定的肿瘤纯度。对于文库制备中使用的试剂,遵循制造商指南。
表4.从18名乳腺癌、结肠癌、肺癌患者中获得的临床血浆样本
测试性能接受标准:
1.准确性
序列突变
通过比较来自靶捕获组和下一代测序方法之间的专有(proprietary)细胞系的结果与针对该病例公开的独立获得的Sanger测序结果来评估准确性。已知在专有细胞系中突变的总共19个位置被包括在靶组中,并且使用250ng DNA以1%、2%、5%、20%、25%和100%肿瘤纯度进行评估。此外,使用250ng DNA以100%和1%肿瘤纯度评估含有12个序列突变的组合癌细胞系。最后,通过分析来自健康供体的18个血浆样本来评估特异性,预期其中没有一个将聚藏(harbor)任何体细胞改变。
性能指标
灵敏性 100.0%
特异性(人为(contrived)病 99.9997%
例)
特异性(健康供体) 99.9996%
扩增
通过比较来自靶捕获组和下一代测序方法之间的专有细胞系的结果与针对该病例公开的独立获得的SNP阵列结果来评估准确性。存在被包括在目标靶区域中的3个扩增,并使用250ng DNA以20%、25%和100%肿瘤纯度进行评估。另外,通过分析来自健康供体的18个血浆样本来评估特异性,预期其中没有一个将聚藏任何体细胞改变。
性能指标
灵敏性 100.0%
特异性(人为病例) 91.7%
特异性(健康供体) 100.0%
重排
通过比较来自靶捕获组和下一代测序方法之间的各种专有细胞系的结果与针对这些病例公开的、使用250ng DNA以1%、2%、20%和100%肿瘤纯度的组合独立获得的结果(Shibata et.al.,2010and Koivunen et.al.,2008)来评估准确性。另外,通过分析来自健康供体的18个血浆样本来评估特异性,预期其中没有一个将聚藏任何体细胞改变。
性能指标
灵敏性 100.0%
特异性(人为病例) 100.0%
特异性(健康供体) 99.7%
2.分析灵敏性(检测极限):
序列突变
通过比较来自靶捕获组和下一代测序方法之间的专有细胞系的结果与针对该病例公开的独立获得的Sanger测序结果来评估分析灵敏性。已知在专有细胞系中突变的总共19个位置被包括在靶组中,并使用250ng DNA以0.1%、0.2%、0.5%、1%和2%肿瘤纯度一式两份,以及使用25ng DNA以0.5%、1%、2%、5%和10%肿瘤纯度一式两份进行评估。此外,使用250ng DNA以0.1%、0.2%、0.5%和1%肿瘤纯度和使用25ng DNA以0.5%、1.0%、2.0%和5%肿瘤纯度评估含有12个序列突变的组合突变细胞系。
性能指标
分析灵敏性 99.4%
扩增
通过比较来自靶捕获组和下一代测序方法之间的专有细胞系的结果与针对该病例公开的独立获得的SNP阵列结果来评估分析灵敏性。存在被包括在目标靶区域中的3个扩增,并使用250ng DNA以60%、40%和20%肿瘤纯度一式两份,以及使用25ng DNA以60%、40%和20%肿瘤纯度一式两份进行评估。
性能指标
分析灵敏性 97.2%
重排
通过比较来自靶捕获组和下一代测序方法之间的各种专有细胞系的结果与针对这些病例公开的、以使用250ng DNA的0.1%、0.5%和1.0%肿瘤纯度和使用25ng DNA的0.5%、1.0%和2.0%肿瘤纯度的组合独立获得的结果(Shibata et.al.,2010andKoivunen et.al.,2008)来评估分析灵敏性。
性能指标
分析灵敏性 94.4%
3.精确性和稳健性(测定内和测定间的可重现性):
序列突变
通过比较来自靶捕获组和下一代测序方法之间的专有细胞系的结果与针对该病例公开的独立获得的Sanger测序结果来评估精确性和稳健性。已知在专有细胞系中突变的总共19个位置被包括在靶组中,并在样本制备内和样本制备间(不同操作者在不同天)使用150ng DNA以2%肿瘤纯度进行评估。
性能指标
测定内一致性 100.0%
测定间一致性 100.0%
扩增
通过比较来自靶捕获组和下一代测序方法之间的专有细胞系的结果与针对该病例公开的独立获得的SNP阵列结果来评估精确性和稳健性。存在被包括在目标靶区域中的3种扩增,并在样本制备内和样本制备间(不同操作者在不同天)使用100ng DNA以20%肿瘤纯度进行评估。
性能指标
测定内一致性 94.7%
测定间一致性 89.5%
重排
通过比较来自靶捕获组和下一代测序方法之间的各种专有细胞系的结果与针对这些病例公布的、在样本制备内和样本制备间(不同的操作者在不同天)使用25ng和150ngDNA以2%和5%肿瘤纯度独立获得的结果(Shibata et.al.,2010and Koivunen et.al.,2008)来评估精确性和稳健性。
性能指标
测定内一致性 100.0%
测定间一致性 100.0%
4.失败率
总共有113个序列组(PS_Seq2)和112个结构组(PS_Str2)下一代测序文库生成,其中6个文库并且处理失败(6/225,2.7%)。
5.血液采集管类型的比较
为了评估血液采集管类型对PlasmaSelectTMR 64方法性能的影响,从9名癌症患者获得4x10ml抽血,其中2x10ml血液以K2EDTA血液采集管采集,并且2x10ml以Streck血液采集管采集,并根据PGDx(K2EDTA)或制造商的说明书(Streck)被处理成血浆。这些数据表明总体报告结果之间的非常高的一致性。
性能指标
序列突变一致性 100.0%[MAF≥0.50%]
扩增一致性 98.8%
重排一致性 100.0%
6.稳定性
对样本文库制备中使用的试剂遵循制造指南,并且按照相同的样本方案和处理程序收集所有样本。
图6显示泛癌细胞系序列突变观察到的和预期的突变等位基因频率结果。将计算的突变等位基因频率(MAF)与针对来自组合癌细胞系的准确性、分析灵敏性以及精确性和稳健性方法验证研究中评估的病例的预期MAF进行比较(对于每种病例,n=12个预期改变)。
图7显示内部对照乳腺癌细胞系观察到的和预期的突变等位基因频率结果。将计算的突变等位基因频率(MAF)与针对来自组合癌细胞系的准确性、分析灵敏性以及精确性和稳健性方法验证研究中评估的病例的预期MAF进行比较(对于每种病例,n=19个预期改变)。
结论和建议
已经验证了,针对液体活组织检查,对于从癌症患者血浆中获得的无细胞DNA中的序列突变(SBS/indel)、扩增和易位的检测,PlasmaSelectTM测定实现了高的灵敏性和特异性水平。
性能指标(25ng的最小样本输入):
表5.PlasmaSelectTM R 64性能指标总结
*为序列突变分析提供每个碱基特异性[评估了99,359个碱基]
通过引用并入
在整个此公开中作出的对其它文件的任何和所有引用和引述出于所有目的特此以其整体通过引用并入本文,所述其它文件如专利、专利申请、专利公开、期刊、书籍、论文、网页内容。
等同物
在不脱离本发明的精神或必要特征的情况下,本发明可以其它特定形式实施。因此,前述实施方式在所有方面被视为示例性的而不是对本文所述发明的限制。

Claims (23)

1.用于分析核酸的方法,所述方法包括:
获得包含核酸片段的样本;
将非独特条形码组引入所述片段以生成基因组文库;
测序所述片段以产生序列读数;
比对所述序列读数;
识别片段末端的基因组位置;以及
识别存在于多个分子中的突变,通过非独特条形码和片段末端的基因组位置的组合进行确定。
2.权利要求1所述的方法,其中获得步骤包括获得血浆样本,并提取核酸。
3.权利要求1所述的方法,其中引入非独特条形码组包括末端修复、加A尾和衔接子连接。
4.权利要求1所述的方法,其中所述非独特条形码组由八个非独特条形码组组成。
5.权利要求1所述的方法,其中识别片段末端的基因组位置包括杂交捕获或全基因组测序。
6.权利要求1所述的方法,其中片段末端的基因组位置包含内源条形码。
7.权利要求5所述的方法,其中杂交捕获涉及充分表征的癌症基因组。
8.权利要求7所述的方法,其中所述癌症基因包括ABL1、AKT1、ALK、APC、AR、ATM、BCR、BRAF、CDH1、CDK4、CDK6、CDKN2A、CSF1R、CTNNB1、DNMT3A、EGFR、ERBB2、ERBB4、ESR1、EZH2、FBXW7、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、KRAS、MAP2K1、MET、MLH1、MPL、MYC、NPM1、NRAS、NTRK1、PDGFRA、PDGFRB、PIK3CA、PIK3R1、PTEN、PTPN11、RARA、RB1、RET、ROS1、SMAD4、SMARCB1、SMO、SRC、STK11、TERT、TP53、和VHL。
9.权利要求1所述的方法,其中测序包括单末端测序或配对末端测序。
10.权利要求1所述的方法,其中测序包括冗余测序。
11.权利要求10所述的方法,进一步包括使用冗余序列读数来确定共有序列。
12.权利要求10所述的方法,其中以10x的深度进行冗余测序。
13.权利要求1所述的方法,其中基于使用非独特条形码和片段末端的基因组位置在DNA分子中检测的突变,所述片段末端的基因组位置在所述DNA分子的冗余序列读数的预定百分比上是相同的。
14.权利要求13所述的方法,其中所述预定百分比为90%。
15.权利要求1所述的方法,其中核酸包含无细胞DNA、循环肿瘤DNA、来自肿瘤的DNA、或RNA。
16.权利要求1所述的方法,其中所述条形码包含测序衔接子。
17.用于分子条形码化的方法,所述方法包括:
获得包含核酸片段的样本;
提供多个非独特条形码组;以及
用所述条形码标记所述核酸片段以生成基因组文库;
其中用与所述基因组文库中的另一不同核酸片段相同的条形码标记每个核酸片段。
18.权利要求17所述的方法,其中所述多个组由二十个或更少的独特条形码组成。
19.权利要求17所述的方法,其中所述多个组由十个或更少的独特条形码组成。
20.权利要求17所述的方法,进一步包括识别片段末端的基因组位置。
21.权利要求17所述的方法,进一步包括冗余测序所述基因组文库,以产生每个核酸片段的多个冗余序列读数。
22.权利要求21所述的方法,进一步包括协调类似标记的核酸片段的所述冗余序列读数。
23.权利要求22所述的方法,进一步包括将协调的序列读数与参考进行比对以确定共有序列。
CN201780069559.1A 2016-11-15 2017-11-14 基因型分型测定中的非独特条形码 Pending CN110023509A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662422355P 2016-11-15 2016-11-15
US62/422,355 2016-11-15
PCT/US2017/061447 WO2018093744A2 (en) 2016-11-15 2017-11-14 Non-unique barcodes in a genotyping assay

Publications (1)

Publication Number Publication Date
CN110023509A true CN110023509A (zh) 2019-07-16

Family

ID=62107294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780069559.1A Pending CN110023509A (zh) 2016-11-15 2017-11-14 基因型分型测定中的非独特条形码

Country Status (7)

Country Link
US (2) US20180135044A1 (zh)
EP (1) EP3541951A4 (zh)
JP (2) JP2019534051A (zh)
CN (1) CN110023509A (zh)
AU (1) AU2017362946A1 (zh)
CA (1) CA3042434A1 (zh)
WO (1) WO2018093744A2 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012242847B2 (en) 2011-04-15 2017-01-19 The Johns Hopkins University Safe sequencing system
US11525163B2 (en) 2012-10-29 2022-12-13 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
US11597967B2 (en) 2017-12-01 2023-03-07 Personal Genome Diagnostics Inc. Process for microsatellite instability detection
AU2021251780A1 (en) * 2020-04-07 2022-10-20 Personal Genome Diagnostics Inc. Floating barcodes

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140065621A1 (en) * 2012-09-04 2014-03-06 Natera, Inc. Methods for increasing fetal fraction in maternal blood
US20140066317A1 (en) * 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583024A (en) 1985-12-02 1996-12-10 The Regents Of The University Of California Recombinant expression of Coleoptera luciferase
US5234809A (en) 1989-03-23 1993-08-10 Akzo N.V. Process for isolating nucleic acid
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
AU9317198A (en) 1997-09-17 1999-04-05 Gentra Systems, Inc. Apparatuses and methods for isolating nucleic acid
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
US6223128B1 (en) 1998-06-29 2001-04-24 Dnstar, Inc. DNA sequence assembly system
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
GB9901475D0 (en) 1999-01-22 1999-03-17 Pyrosequencing Ab A method of DNA sequencing
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
WO2001023610A2 (en) 1999-09-29 2001-04-05 Solexa Ltd. Polynucleotide sequencing
US6448717B1 (en) 2000-07-17 2002-09-10 Micron Technology, Inc. Method and apparatuses for providing uniform electron beams from field emission displays
US7809509B2 (en) 2001-05-08 2010-10-05 Ip Genesis, Inc. Comparative mapping and assembly of nucleic acid sequences
WO2005042781A2 (en) 2003-10-31 2005-05-12 Agencourt Personal Genomics Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
EP1910537A1 (en) 2005-06-06 2008-04-16 454 Life Sciences Corporation Paired end sequencing
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
US7329860B2 (en) 2005-11-23 2008-02-12 Illumina, Inc. Confocal imaging methods and apparatus
US7702468B2 (en) 2006-05-03 2010-04-20 Population Diagnostics, Inc. Evaluating genetic disorders
US20080081330A1 (en) 2006-09-28 2008-04-03 Helicos Biosciences Corporation Method and devices for analyzing small RNA molecules
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8725425B2 (en) 2007-01-26 2014-05-13 Illumina, Inc. Image data efficient genetic sequencing method and system
US8165821B2 (en) 2007-02-05 2012-04-24 Applied Biosystems, Llc System and methods for indel identification using short read sequencing
US8271206B2 (en) 2008-04-21 2012-09-18 Softgenetics Llc DNA sequence assembly methods of short reads
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
WO2010056728A1 (en) 2008-11-11 2010-05-20 Helicos Biosciences Corporation Nucleic acid encoding for multiplex analysis
EP2394152B1 (en) 2009-02-03 2019-05-01 ANDE Corporation Nucleic acid purification
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US20110257889A1 (en) 2010-02-24 2011-10-20 Pacific Biosciences Of California, Inc. Sequence assembly and consensus sequence determination
ES2660989T3 (es) * 2013-12-28 2018-03-27 Guardant Health, Inc. Métodos y sistemas para detectar variantes genéticas
WO2016149261A1 (en) * 2015-03-16 2016-09-22 Personal Genome Diagnostics, Inc. Systems and methods for analyzing nucleic acid

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140065621A1 (en) * 2012-09-04 2014-03-06 Natera, Inc. Methods for increasing fetal fraction in maternal blood
US20140066317A1 (en) * 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AARON M NEWMAN等: "Integrated digital error suppression for improved detection of circulating tumor DNA", 《NAT BIOTECHNOL.》, vol. 34, no. 5, pages 2 - 4 *

Also Published As

Publication number Publication date
EP3541951A4 (en) 2020-06-03
US20200248244A1 (en) 2020-08-06
EP3541951A2 (en) 2019-09-25
US20180135044A1 (en) 2018-05-17
JP2019534051A (ja) 2019-11-28
JP2023110017A (ja) 2023-08-08
CA3042434A1 (en) 2018-05-24
WO2018093744A2 (en) 2018-05-24
WO2018093744A3 (en) 2018-08-02
AU2017362946A1 (en) 2019-05-30

Similar Documents

Publication Publication Date Title
JP7119014B2 (ja) まれな変異およびコピー数多型を検出するためのシステムおよび方法
JP6921888B2 (ja) 遺伝的バリアントを検出するための方法およびシステム
JP7506408B2 (ja) 血漿dnaの単分子配列決定
CN104254618B (zh) 母体血浆中胎儿dna分数的基于大小的分析
CN110023509A (zh) 基因型分型测定中的非独特条形码
KR101858344B1 (ko) 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법
US20230407400A1 (en) Methods for preparing dna reference materials and controls
CN114574581A (zh) 检测稀有突变和拷贝数变异的系统和方法
US11862299B2 (en) Algorithms for sequence determinations
KR102145417B1 (ko) 무세포 핵산으로부터 수득된 서열 분석 데이터에 대한 배경 대립인자의 빈도 분포를 생성하는 방법 및 이를 이용하여 무세포 핵산으로부터 변이를 검출하는 방법
JP2024113130A (ja) 血漿dnaの単分子配列決定
WO2019173991A1 (zh) 恶性淋巴瘤标志物及其应用
CA3170856A1 (en) Reference ladders and adaptors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination