CN111868260A - 用于评估和治疗癌症的方法和材料 - Google Patents

用于评估和治疗癌症的方法和材料 Download PDF

Info

Publication number
CN111868260A
CN111868260A CN201880066039.XA CN201880066039A CN111868260A CN 111868260 A CN111868260 A CN 111868260A CN 201880066039 A CN201880066039 A CN 201880066039A CN 111868260 A CN111868260 A CN 111868260A
Authority
CN
China
Prior art keywords
subject
cancer
biomarkers
detecting
members
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880066039.XA
Other languages
English (en)
Inventor
B·福格斯坦
K·W·金茨勒
J·科恩
N·帕帕多波洛斯
A·M·列侬
C·托马塞蒂
Y·王
G·J·内托
R·卡尔金
C·杜维尔
S·哈纳斯
S·施普林格
A·格罗尔曼
K·迪克曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Foundation of State University of New York
Johns Hopkins University
University of Texas System
Original Assignee
Research Foundation of State University of New York
Johns Hopkins University
University of Texas System
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Foundation of State University of New York, Johns Hopkins University, University of Texas System filed Critical Research Foundation of State University of New York
Publication of CN111868260A publication Critical patent/CN111868260A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/30Detection characterised by liberation or release of label
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/514Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/625Detection means characterised by use of a special device being a nucleic acid test strip device, e.g. dipsticks, strips, tapes, CD plates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/56Staging of a disease; Further complications associated with the disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本文提供了用于检测和/或治疗患有癌症的受试者(例如人)的方法和材料。在一些实施方案中,提供了用于鉴定受试者患有癌症(例如,局部癌症)的方法和材料,其中检测两个或更多个类别的生物标记物的一个或多个成员的存在。在一些实施方案中,提供了用于鉴定受试者患有癌症(例如,局部癌症)的方法和材料,其中检测至少一个类别的生物标记物的一个或多个成员的存在以及非整倍性的存在。在一些实施方案中,本文所述的方法提供增加的检测受试者(例如人)中的癌症的敏感性和/或特异性。

Description

用于评估和治疗癌症的方法和材料
关于联邦政府资助的声明
本发明是根据美国国立卫生研究院的批准号CA062924和HG007804在美国政府支持下进行的。美国政府在本发明中享有某些权利。
序列表
本申请包括通过电子申请系统提交给美国专利商标局的电子格式的序列表,并且以引用的方式整体并入本文。所述序列表创建于2018年8月6日,名为448070306WO1SL.txt,并且大小为208,305字节。
电子申请表格
本申请包括通过电子申请系统提交给美国专利商标局的电子格式的表格。ASCII文本文件,各自以引用的方式整体并入本文,包括名为Table1.txt的文本文件,创建于2018年8月7日,大小为152,000字节;名为Table2.txt的文本文件,创建于2018年8月7日,大小为351,000字节;名为Table3.txt的文本文件,创建于2018年8月7日,大小为438,000字节;名为Table4.txt的文本文件,创建于2018年8月7日,大小为1,081,000字节;名为Table5.txt的文本文件,创建于2018年8月7日,大小为31,000字节;名为Table6.txt的文本文件,创建于2018年8月7日,大小为103,000字节;名为Table7.txt的文本文件,创建于2018年8月7日,大小为25,000字节;名为Table8.txt的文本文件,创建于2018年8月7日,大小为59,000字节;名为Table9.txt的文本文件,创建于2018年8月7日,大小为38,000字节;名为Table10.txt的文本文件,创建于2018年8月7日,大小为22,000字节;名为Table11.txt的文本文件,创建于2018年8月7日,大小为17,000字节;名为Table12.txt的文本文件,创建于2018年8月7日,大小为14,000字节;名为Table13.txt的文本文件,创建于2018年8月7日,大小为104,000字节;名为Table14.txt的文本文件,创建于2018年8月7日,大小为106,000字节;名为Table15.txt的文本文件,创建于2018年8月7日,大小为370,000字节;名为Table16.txt的文本文件,创建于2018年8月7日,大小为262,000字节;名为Table17.txt的文本文件,创建于2018年8月7日,大小为8,000字节;名为Table18.txt的文本文件,创建于2018年8月7日,大小为52,000字节;名为Table19.txt的文本文件,创建于2018年8月7日,大小为41,000字节;名为Table20.txt的文本文件,创建于2018年8月7日,大小为14,000字节;名为Table21.txt的文本文件,创建于2018年8月7日,大小为6,000字节;名为Table22.txt的文本文件,创建于2018年8月7日,大小为19,000字节;名为Table23.txt的文本文件,创建于2018年8月7日,大小为6,000字节;名为Table24.txt的文本文件,创建于2018年8月7日,大小为42,000字节;名为Table25.txt的文本文件,创建于2018年8月7日,大小为25,000字节;名为Table26.txt的文本文件,创建于2018年8月7日,大小为14,000字节;名为Table27.txt的文本文件,创建于2018年8月7日,大小为5,000字节;名为Table28.txt的文本文件,创建于2018年8月7日,大小为10,000字节;名为Table29.txt的文本文件,创建于2018年8月7日,大小为9,000字节;名为Table30.txt的文本文件,创建于2018年8月7日,大小为3,000字节;名为Table31.txt的文本文件,创建于2018年8月7日,大小为2,000字节;名为Table32.txt的文本文件,创建于2018年8月7日,大小为9,000字节;名为Table33.txt的文本文件,创建于2018年8月7日,大小为3,000字节;名为Table34.txt的文本文件,创建于2018年8月7日,大小为22,000字节;名为Table35.txt的文本文件,创建于2018年8月7日,大小为1,536,000字节;名为Table36.txt的文本文件,创建于2018年8月7日,大小为1,591,000字节;名为Table37.txt的文本文件,创建于2018年8月7日,大小为13,000字节;名为Table38.txt的文本文件,创建于2018年8月7日,大小为5,000字节;名为Table39.txt的文本文件,创建于2018年8月7日,大小为30,000字节;名为Table40.txt的文本文件,创建于2018年8月7日,大小为9,000字节;名为Table41.txt的文本文件,创建于2018年8月7日,大小为4,000字节;名为Table42.txt的文本文件,创建于2018年8月7日,大小为8,000字节;名为Table43.txt的文本文件,创建于2018年8月7日,大小为25,000字节;名为Table44.txt的文本文件,创建于2018年8月7日,大小为11,000字节;名为Table45.txt的文本文件,创建于2018年8月7日,大小为11,000字节;名为Table46.txt的文本文件,创建于2018年8月7日,大小为18,000字节;名为Table47.txt的文本文件,创建于2018年8月7日,大小为18,000字节;名为Table48.txt的文本文件,创建于2018年8月7日,大小为8,000字节;名为Table49.txt的文本文件,创建于2018年8月7日,大小为167,000字节;名为Table50.txt的文本文件,创建于2018年8月7日,大小为312,000字节;名为Table51.txt的文本文件,创建于2018年8月7日,大小为20,000字节;名为Table52.txt的文本文件,创建于2018年8月7日,大小为1,000字节;名为Table53.txt的文本文件,创建于2018年8月7日,大小为3,000字节;名为Table54.txt的文本文件,创建于2018年8月7日,大小为3,000字节;名为Table55.txt的文本文件,创建于2018年8月7日,大小为8,000字节;名为Table56.txt的文本文件,创建于2018年8月7日,大小为1,000字节;名为Table57.txt的文本文件,创建于2018年8月7日,大小为14,000字节;名为Table58.txt的文本文件,创建于2018年8月7日,大小为3,000字节;以及名为Table59.txt的文本文件,创建于2018年8月7日,大小为309,000字节。
发明背景
1.技术领域
本文提供了用于检测和/或治疗患有癌症的受试者(例如人)的方法和材料。在一些实施方案中,提供了用于鉴定受试者患有癌症(例如,局部癌症)的方法和材料,其中检测两个或更多个类别的生物标记物的两个或更多个成员的存在。在一些实施方案中,提供了用于鉴定受试者患有癌症(例如,局部癌症)的方法和材料,其中检测至少一个类别的生物标记物的两个或多个成员的存在以及非整倍性的存在。在一些实施方案中,本文所述的方法提供增加的检测受试者(例如人)中的癌症的敏感性和/或特异性。
2.背景技术
癌症今年将杀死592,000名美国人,并且据疾病控制中心报告,癌症将很快成为美国的主要死亡原因。如何才能避免这种严峻形势?如今,绝大多数转化性癌症研究都关注于延长晚期疾病患者的存活。我们的研究观点是不同的:从长远来看,预防总比治疗好。这种观点的价值的实例很多,从传染病到心血管疾病。心血管疾病尤其重要,因为在过去60年中,对于这种疾病的一级和二级预防措施的组合已使死亡人数减少了75%。相比之下,在同一时期内,总体癌症死亡人数几乎没有变化。
通过进行癌症的血液测试进行的早期检测,可以看作是二级预防的一种形式。“更早”一词的更字特别重要。对于所有已研究的癌症,早期局部疾病治愈的概率比晚期疾病高得多。越早期,仅通过手术即可治愈肿瘤的可能性越大。此外,当癌症处于待治愈的初始阶段时,不必检测到它们。从理论上讲,对治疗的反应取决于治疗前癌细胞的总数和人细胞中的突变率。癌细胞越多,它们中的至少一个将包含或产生赋予对任何形式治疗的抗性的突变的可能性越大,无论是常规化疗、放疗、靶向疗法还是免疫疗法。临床上,大量研究已表明,药物在辅助环境下可以是治愈的,但在晚期疾病的患者中不是。例如,通过辅助疗法可以治愈近一半的将死于其疾病的III期结直肠癌患者,但几乎没有IV期结直肠癌患者可以用相同的方案治愈。
在许多癌症中,肿瘤分期与预后之间存在很强的相关性(Ansari D,等人(2017)Relationship between tumour size and outcome in pancreatic ductaladenocarcinoma.Br J Surg 104(5):600-607)。诊断时具有远处转移的极少数患有肺癌、结肠癌、食道癌或胃癌的患者存活超过五年(Howlader N等人(2016)SEER CancerStatistics Review,1975-2013,National Cancer Institute.Bethesda,MD,http://seer.cancer.gov/csr/1975_2013/,基于2015年11月的SEER数据提交,2016年4月发布到SEER网站)。从广义上讲,癌症的大小也很重要,因为在诊断时,较小的肿瘤往往比较大的肿瘤具有更少的转移,并且因此更可能仅通过手术即可治愈。即使癌症已经转移到远处部位时,与大块病变相比,较小的疾病负担更容易控制(Bozic I等人(2013)Evolutionarydynamics of cancer in response to targeted combination therapy.Elife 2:e00747)。因此,向具有由结直肠癌引起的微小转移的患者施用辅助化疗剂可以治愈接近50%的病例(Semrad TJ,Fahrni AR,Gong IY和Khatri VP(2015)IntegratingChemotherapy into the Management of Oligometastatic Colorectal Cancer:Evidence-Based Approach Using Clinical Trial Findings.Ann Surg Oncol增刊223:S855-862;Moertel CG等人(1995)Fluorouracil plus levamisole as effectiveadjuvant therapy after resection of stage III colon carcinoma:a finalreport.Ann Intern Med 122(5):321-326;Andre T等人(2009)Improved overallsurvival with oxaliplatin,fluorouracil,and leucovorin as adjuvant treatmentin stage II or III colon cancer in the MOSAIC trial.J Clin Oncol 27(19):3109-3116)。向具有放射可见的转移性病变的患者递送相同的化疗剂几乎不产生治愈(Dy GK等人(2009)Long-term survivors of metastatic colorectal cancer treated withsystemic chemotherapy alone:a North Central Cancer Treatment Group review of3811 patients,N0144.Clin Colorectal Cancer 8(2):88-93)。
因此,很明显,癌症的早期检测是减少由这些疾病(包括胰腺癌)导致的死亡的一个关键。除了提供手术切除的可能性之外,毫无疑问,新开发的辅助化疗和新兴的免疫治疗方案证明在具有最小疾病的患者中比在手术可治愈的患者中更有效(Huang AC等人(2017)T-cell invigoration to tumour burden ratio associated with anti-PD-1response.Nature 545(7652):60-65)。循环中的生物标记物提供原理上检测早期癌症的最佳方法之一。从历史上看,用于监测癌症的生物标记物的类型是蛋白质(Liotta LA&Petricoin EF,3rd(2003)The promise of proteomics.Clin Adv Hematol Oncol 1(8):460-462),并且包括癌胚抗原(CEA)、碳水化合物抗原19-9(CA19-9)和癌症抗原125(CA125)。这些生物标记物已证明可用于追踪具有已知疾病的患者,但尚未被批准用于筛选目的,部分原因是它们的敏感性或特异性较低(Lennon AM&Goggins M(2010)Diagnosticand Therapeutic Response Markers.Pancreatic Cancer,(Springer New York,NewYork,NY),第675-701页;Clarke-Pearson DL(2009)Clinical practice.Screening forovarian cancer.N Engl J Med 361(2):170-177;Locker GY等人(2006)ASCO 2006update of recommendations for the use of tumor markers in gastrointestinalcancer.J Clin Oncol 24(33):5313-5327)。最近,已经研究了突变体DNA作为生物标记物。这种方法(通常被称为“液体活检”)的基本概念是癌细胞,与正常的自我更新细胞一样,频繁周转。从死亡细胞释放的DNA可以逃离到体液,诸如尿液、粪便和血浆中(Haber DA&Velculescu VE(2014)Blood-based analyses of cancer:circulating tumor cells andcirculating tumor DNA.Cancer Discov 4(6):650-661;Dawson SJ等人(2013)Analysisof circulating tumor DNA to monitor metastatic breast cancer.N Engl J Med 368(13):1199-1209;Bettegowda C等人(2014)Detection of circulating tumor DNA inearly-and late-stage human malignancies.Science translational medicine 6(224):224ra224;Kinde I等人(2013)Evaluation of DNA from the Papanicolaou testto detect ovarian and endometrial cancers.Science translational medicine 5(167):167ra164;Wang Y等人(2015)Detection of somatic mutations and HPV in thesaliva and plasma of patients with head and neck squamous cellcarcinomas.Science translational medicine 7(293):293ra104;Wang Y等人(2015)Detection of rumor-derived DNA in cerebrospinal fluid of patients withprimary rumors of the brain and spinal cord.Proc Natl Acad Sci USA 112(31):9704-9709;Wang Y等人(2016)Diagnostic potential of tumor DNA from ovarian cystfluid.Elife 5;Springer S等人(2015)A Combination of Molecular Markers andClinical Features Improve the Classification of PancreaticCysts.Gastroenterology 149(6):1501-1510;Forshew T等人(2012)Noninvasiveidentification and monitoring of cancer mutations by targeted deep sequencingof plasma DNA.Science translational medicine 4(136):136ra168;Vogelstein B和Kinzler KW(1999)Digital PCR.Proc Natl Acad Sci USA 96(16):9236-9241;DressmanD,Yan H,Traverso G,Kinzler KW和Vogelstein B(2003)Transforming single DNAmolecules into fluorescent magnetic particles for detection and enumerationof genetic variations.Proc Natl Acad Sci USA 100(15):8817-8822)。在循环中使用突变体DNA作为生物标记物的优点在于其出色的特异性。癌症中的每个细胞在负责其克隆生长的驱动基因中都有一组核心体细胞突变(Vogelstein B等人(2013)Cancer genomelandscapes.Science 339(6127):1546-1558)。相比之下,正常细胞在成年期不进行克隆扩增,并且具有任何特定体细胞突变的正常细胞比例极低。
循环肿瘤DNA(ctDNA)的大多数研究都关注于追踪癌症患者,而不是评估其在筛选环境中的使用。现有数据表明,ctDNA在>85%的患有许多癌症类型的晚期形式的患者中升高(Bettegowda C等人(2014)Detection of circulating tumor DNA in early-andlate-stage human malignancies.Science translational medicine 6(224):224ra224;Wang Y等人(2015)Detection of somatic mutations and HPV in the saliva andplasma of patients with head and neck squamous cell carcinomas.Sciencetranslational medicine 7(293):293ra104)。然而,患有早期癌症的患者中有相当少的一部分在血浆中具有可检测水平的ctDNA(Bettegowda C等人(2014)Detection ofcirculating tumor DNA in early-and late-stage human malignancies.Sciencetranslational medicine 6(224):224ra224;Wang Y等人(2015)Detection of somaticmutations and HPV in the saliva and plasma of patients with head and necksquamous cell carcinomas.Science translational medicine 7(293):293ra104)。
大多数局部癌症可以仅通过手术治愈,无需任何全身性疗法(Siegel等人,2017CA Cancer J Clin 67:7-30)。然而,一旦发生远处转移,手术切除很少能治愈。因此,癌症研究的一个主要目标是在它们转移到远处部位之前检测癌症。根据癌症类型的不同,成人典型的癌症似乎需要20至30年才能从初期的赘生病变进展为晚期癌症(Vogelstein等人,2013 Science 339:1546-1558;Jones等人,2008 Proc Natl Acad Sci USA 105:4283-4288;以及Yachida等人,2012 Clin Cancer Res 18:6339-6347)。仅在这一漫长过程的最后几年,赘生性细胞似乎才成功播种并引起转移性病变(Vogelstein等人,2013 Science339:1546-1558;Jones等人,2008 Proc Natl Acad Sci USA 105:4283-4288;Yachida等人,2012 Clin Cancer Res 18:6339-6347;以及Vogelstein等人,2015 N Engl J Med373:1895-1898)。因此,在转移发作之前检测癌症有很大的机会。然而,一旦形成了大的转移性肿瘤,当前的疗法就是无效的(Bozic等人,2013 Elife 2:e00747;Semrad等人,2015Ann Surg Oncol 22(增刊3):S855-862;Moertel等人,1995 Ann Intern Med 122:321-326;Huang等人,2017 Nature 545:60-65)。
胰腺导管腺癌(以下简称“胰腺癌”)是癌症死亡的第三大主要原因,并且预计到2030年将成为美国第二大最常见原因(Rahib L,等人(2014)Projecting cancerincidence and deaths to 2030:the unexpected burden of thyroid,liver,andpancreas cancers in the United States.Cancer Res 74(11):2913-2921)。众所周知,胰腺癌是致命的,只有小于9%的患者在诊断后存活了五年(Siegel RL,Miller KD,&JemalA(2016)Cancer statistics,2016.CA Cancer J Clin 66(1):7-30)。胰腺癌患者预后较差的部分原因是,放射学研究发现当肿瘤侵入周围主要血管或远处转移时,80%至85%的患者被诊断为晚期(Ryan DP,Hong TS,&Bardeesy N(2014)Pancreatic adenocarcinoma.NEngl J Med 371(22):2140-2141)。在这种疾病的晚期,胰腺癌不适合手术切除,并且3年存活率<5%。相比之下,对于非常小的局部肿瘤,据报道其五年存活率接近60%;在可切除的癌症中,肿瘤越小,预后越好(Ansari D,等人(2017)Relationship between tumour sizeand outcome in pancreatic ductal adenocarcinoma.Br J Surg 104(5):600-607;JungKW,等人(2007)Clinicopathological aspects of 542 cases of pancreatic cancer:aspecial emphasis on small pancreatic cancer.J Korean Med Sci 22增刊:S79-85;Egawa S,等人(2004)Clinicopathological aspects of small pancreaticcancer.Pancreas 28(3):235-240;Ishikawa O,等人(1999)Minute carcinoma of thepancreas measuring 1cm or less in diameter--collective review of Japanesecase reports.Hepatogastroenterology 46(25):8-15;Tsuchiya R,等人(1986)Collective review of small carcinomas of the pancreas.Ann Surg 203(1):77-81)。
胰腺癌与其他癌症并无不同,在肿瘤分期与预后之间存在很强的相关性(AnsariD,等人(2017)Relationship between tumour size and outcome in pancreatic ductaladenocarcinoma.Br J Surg 104(5):600-607)。诊断时具有远处转移的极少数患有肺癌、结肠癌、食道癌或胃癌的患者存活超过五年(Howlader N等人(2016)SEER CancerStatistics Review,1975-2013,National Cancer Institute.Bethesda,MD,http://seer.cancer.gov/csr/1975_2013/,基于2015年11月的SEER数据提交,2016年4月发布到SEER网站)。从广义上讲,癌症的大小也很重要,因为在诊断时,较小的肿瘤往往比较大的肿瘤具有更少的转移,并且因此更可能仅通过手术即可治愈。即使癌症已经转移到远处部位时,与大块病变相比,较小的疾病负担更容易控制(Bozic I等人(2013)Evolutionarydynamics of cancer in response to targeted combination therapy.Elife 2:e00747)。因此,向具有由结直肠癌引起的微小转移的患者施用辅助化疗剂可以治愈接近50%的病例(Semrad TJ,Fahrni AR,Gong IY和Khatri VP(2015)IntegratingChemotherapy into the Management of Oligometastatic Colorectal Cancer:Evidence-Based Approach Using Clinical Trial Findings.Ann Surg Oncol增刊223:S855-862;Moertel CG等人(1995)Fluorouracil plus levamisole as effectiveadjuvant therapy after resection of stage III colon carcinoma:a finalreport.Ann Intern Med 122(5):321-326;Andre T等人(2009)Improved overallsurvival with oxaliplatin,fluorouracil,and leucovorin as adjuvant treatmentin stage II or III colon cancer in the MOSAIC trial.J Clin Oncol 27(19):3109-3116)。向具有放射可见的转移性病变的患者递送相同的化疗剂几乎不产生治愈(Dy GK等人(2009)Long-term survivors of metastatic colorectal cancer treated withsystemic chemotherapy alone:a North Central Cancer Treatment Group review of3811 patients,N0144.Clin Colorectal Cancer 8(2):88-93)。
因此,很明显,癌症的早期检测是减少由这些疾病(包括胰腺癌)导致的死亡的一个关键。除了提供手术切除的可能性之外,毫无疑问,新开发的辅助化疗和新兴的免疫治疗方案证明在具有最小疾病的患者中比在手术可治愈的患者中更有效(Huang AC等人(2017)T-cell invigoration to tumour burden ratio associated with anti-PD-1response.Nature 545(7652):60-65)。循环中的生物标记物提供原理上检测早期癌症的最佳方法之一。从历史上看,用于监测癌症的生物标记物的类型是蛋白质(Liotta LA&Petricoin EF,3rd(2003)The promise of proteomics.Clin Adv Hematol Oncol 1(8):460-462),并且包括癌胚抗原(CEA)、碳水化合物抗原19-9(CA19-9)和癌症抗原125(CA125)。这些生物标记物已证明可用于追踪具有已知疾病的患者,但尚未被批准用于筛选目的,部分原因是它们的敏感性或特异性较低(Lennon AM&Goggins M(2010)Diagnosticand Therapeutic Response Markers.Pancreatic Cancer,(Springer New York,NewYork,NY),第675-701页;Clarke-Pearson DL(2009)Clinical practice.Screening forovarian cancer.N Engl J Med 361(2):170-177;Locker GY等人(2006)ASCO 2006update of recommendations for the use of tumor markers in gastrointestinalcancer.J Clin Oncol 24(33):5313-5327)。最近,已经研究了突变体DNA作为生物标记物。这种方法(通常被称为“液体活检”)的基本概念是癌细胞,与正常的自我更新细胞一样,频繁周转。从死亡细胞释放的DNA可以逃离到体液,诸如尿液、粪便和血浆中(Haber DA&Velculescu VE(2014)Blood-based analyses of cancer:circulating tumor cells andcirculating tumor DNA.Cancer Discov 4(6):650-661;Dawson SJ等人(2013)Analysisof circulating tumor DNA to monitor metastatic breast cancer.N Engl J Med 368(13):1199-1209;Bettegowda C等人(2014)Detection of circulating tumor DNA inearly-and late-stage human malignancies.Science translational medicine 6(224):224ra224;Kinde I等人(2013)Evaluation of DNA from the Papanicolaou testto detect ovarian and endometrial cancers.Science translational medicine 5(167):167ra164;Wang Y等人(2015)Detection of somatic mutations and HPV in thesaliva and plasma of patients with head and neck squamous cellcarcinomas.Science translational medicine 7(293):293ra104;Wang Y等人(2015)Detection of tumor-derived DNA in cerebrospinal fluid of patients withprimary tumors of the brain and spinal cord.Proc Natl Acad Sci USA 112(31):9704-9709;Wang Y等人(2016)Diagnostic potential of tumor DNA from ovarian cystfluid.Elife 5;Springer S等人(2015)A Combination of Molecular Markers andClinical Features Improve the Classification of PancreaticCysts.Gastroenterology 149(6):1501-1510;Forshew T等人(2012)Noninvasiveidentification and monitoring of cancer mutations by targeted deep sequencingof plasma DNA.Science translational medicine 4(136):136ra168;Vogelstein B和Kinzler KW(1999)Digital PCR.Proc Natl Acad Sci USA 96(16):9236-9241;DressmanD,Yan H,Traverso G,Kinzler KW和Vogelstein B(2003)Transforming single DNAmolecules into fluorescent magnetic particles for detection and enumerationof genetic variations.Proc Natl Acad Sci USA 100(15):8817-882)。在循环中使用突变体DNA作为生物标记物的优点在于其出色的特异性。癌症中的每个细胞在负责其克隆生长的驱动基因中都有一组核心体细胞突变(Vogelstein B等人(2013)Cancer genomelandscapes.Science 339(6127):1546-1558)。相比之下,正常细胞在成年期不进行克隆扩增,并且具有任何特定体细胞突变的正常细胞比例极低。
循环肿瘤DNA(ctDNA)的大多数研究都关注于追踪癌症患者,而不是评估其在筛选环境中的使用。现有数据表明,ctDNA在>85%的患有许多癌症类型的晚期形式的患者中升高(Bettegowda C等人(2014)Detection of circulating tumor DNA in early-andlate-stage human malignancies.Science translational medicine 6(224):224ra224;Wang Y等人(2015)Detection of somatic mutations and HPV in the saliva andplasma of patients with head and neck squamous cell carcinomas.Sciencetranslational medicine 7(293):293ra104)。然而,患有早期癌症的患者中有相当少的一部分在血浆中具有可检测水平的ctDNA(Bettegowda C等人(2014)Detection ofcirculating tumor DNA in early-and late-stage human malignancies.Sciencetranslational medicine 6(224):224ra224;Wang Y等人(2015)Detection of somaticmutations and HPV in the saliva and plasma of patients with head and necksquamous cell carcinomas.Science translational medicine 7(293):293ra104)。
本领域中持续需要在保持高特异性的条件下增加对可切除或可以其他方式治疗的癌症的检测的敏感性。
Papanicolaou(巴氏)测试已大大降低了筛选群体中宫颈癌的发病率和死亡率。不幸的是,巴氏测试通常无法检测子宫内膜癌或卵巢癌((L.Geldenhuys,M.L.Murray,Sensitivity and specificity of the Pap smear for glandular lesions of thecervix and endometrium.Acta cytologica 51,47-50(2007);A.B.Ng,J.W.Reagan,S.Hawliczek,B.W.Wentz,Significance of endometrial cells in the detection ofendometrial carcinoma and its precursors.Acta cytologica 18,356-361(1974);P.F.Schnatz,M.Guile,D.M.O′Sullivan,J.I.Sorosky,Clinical significance ofatypical glandular cells on cervical cytology.Obstetrics and gynecology 107,701-708(2006);C.Zhao,A.Florea,A.Onisko,R.M.Austin,Histologic follow-upresults in 662 patients with Pap test findings of atypical glandular cells:results from a large academic womens hospital laboratory employing sensitivescreening methods.Gynecologic oncology 114,383-389(2009))。鉴于巴氏测试在检测早期可治愈的宫颈癌方面的成功,因此在常规执行巴氏测试的国家,卵巢癌和子宫内膜癌分别是当前最致命和最常见的妇科恶性肿瘤(N.Howladeret al.,SEER CancerStatistics Review,1975-2014,National Cancer Institute.(2017))。子宫内膜癌和卵巢癌合计每年占约25,000例死亡,并且是美国女性中癌症相关的死亡率的第三大主要原因(N.Howlader et al.,SEER Cancer Statistics Review,1975-2014,National CancerInstitute.(2017))。这些死亡大多数是由高级别肿瘤亚型引起的,所述亚型倾向于在症状发作之前转移(R.J.Kurman,M.Shih Ie,The origin and pathogenesis of epithelialovarian cancer:a proposed unifying theory.The American journal of surgicalpathology 34,433-443(2010);K.N.Moore,A.N.Fader,Uterine papillary serouscarcinoma.Clin Obstet Gynecol 54,278-291(2011))。
子宫内膜癌是最常见的妇科恶性肿瘤,2017年在美国估计有61,380例新病例(N.Howlader et al.,SEER Cancer Statistics Review,1975-2014,National CancerInstitute.(2017))。子宫内膜癌的发病率随着肥胖的增加和预期寿命的增加而上升(M.Arnoldet al.,Global burden of cancer attributable to high body-mass indexin 2012:a population-based study.The Lancet.Oncology 16,36-46(2015))。同时,相对存活率在过去几十年中没有改善(N.Howlader et al.,SEER Cancer StatisticsReview,1975-2014,National Cancer Institute.(2017);L.Rahib et al.,Projectingcancer incidence and deaths to 2030:the unexpected burden of thyroid,liver,and pancreas cancers in the United States.Cancer research 74,2913-2921(2014))。已经针对开发这种癌症类型的筛选测试做出了很多努力。最常见的诊断测试是经阴道超声(TVUS),其测量子宫内膜的厚度。由于TVUS不能可靠地区分良性与恶性病变,从而使没有癌症的女性经历不必要的侵入性程序及其相关并发症,削弱了TVUS作为筛选测试的潜力。在经历额外的诊断程序后,TVUS测试呈阳性的50名女性中只有仅仅一位被证实患有子宫内膜癌,这一事实证明了其较高的假阳性率(Jacobs et al.,Sensitivity oftransvaginal ultrasound screening for endometrial cancer in postmenopausalwomen:a case-control study within the UKCTOCS cohort.The Lancet.Oncology 12,38-48(2011))。
卵巢癌是美国和欧洲第二常见的妇科恶性肿瘤。它通常在晚期被诊断,在晚期时5年存活率小于30%(N.Howlader et al.,SEER Cancer Statistics Review,1975-2014,National Cancer Institute.(2017))。高死亡率已使开发有效的筛选测试成为当务之急。大型随机试验已评估了CA-125和TVUS作为卵巢癌的潜在筛查测试的使用(Buys et al.,Effect of screening on ovarian cancer mortality:the Prostate,Lung,Colorectaland Ovarian(PLCO)Cancer Screening Randomized Controlled Trial.JAMA 305,2295-2303(2011);Kobayashi et al.,A randomized study of screening for ovariancancer:a multicenter study in Japan.Int J Gynecol Cancer 18,414-420(2008);Jacobs et al.,Ovarian cancer screening and mortality in the UK CollaborativeTrial of Ovarian Cancer Screening(UKCTOCS):a randomised controlledtrial.Lancet 387,945-956(2016);Menon et al.,Risk Algorithm Using SerialBiomarker Measurements Doubles the Number of Screen-Detected Cancers ComparedWith a Single-Threshold Rule in the United Kingdom Collaborative Trial ofOvarian Cancer Screening.J Clin Oncol 33,2062-2071(2015))。然而,不建议对一般群体使用当前的诊断方法进行筛选,因为它会导致“重大危害,包括在没有癌症的女性中的重大外科干预”(V.A.Moyer,U.S.P.S.T.Force,Screening for ovarian cancer:U.S.Preventive Services Task Force reaffirmation recommendationstatement.Annals of internal medicine 157,900-904(2012))。因此,迫切需要新的诊断方法。
在卵巢癌中,高级别浆液性癌(HGSC)占所有卵巢癌死亡人数的90%。越来越多的证据表明,大多数HGSC发生在输卵管中,并且随后移植到卵巢表面(16-21R.J.Kurman,M.Shih Ie,Molecular pathogenesis and extraovarian origin of epithelialovarian cancer--shifting the paradigm.Human pathology 42,918-931(2011);Lee etal.,A candidate precursor to serous carcinoma that originates in the distalfallopian tube.The Journal of pathology 211,26-35(2007)A candidate precursorto serous carcinoma that originates in the distal fallopian tube.The Journalof pathology 211,26-35(2007);Eckert et al.,Genomics of Ovarian CancerProgression Reveals Diverse Metastatic Trajectories Including IntraepithelialMetastasis to the Fallopian Tube.Cancer Discov 6,1342-1351(2016);A.M.Karst,K.Levanon,R.Drapkin,Modeling high-grade serous ovarian carcinogenesis fromthe fallopian tube.Proc Natl Acad Sci USA 108,7547-7552(2011);Zhai et al.,High-grade serous carcinomas arise in the mouse oviduct via defects linked tothe human disease.The Journal of pathology 243,16-25(2017);R.J.Kurman,M.ShihIe,The Dualistic Model of Ovarian Carcinogenesis:Revisited,Revised,andExpanded.Am J Pathol 186,733-747(2016))。最近对有症状女性进行的一项前瞻性研究报道,大多数早期诊断的HGSC具有卵巢外来源(Gilbert et al.Assessment ofsymptomatic women for early diagnosis of ovarian cancer:results from theprospective DOvE pilot project.The Lancet.Oncology 13,285-291(2012))。当未检测到卵巢异常时,这可能解释了TVUS对早期疾病的低敏感性。血清CA-125水平的多模态筛选改善了敏感性,然而CA-125缺乏特异性并且在多种常见良性病状中升高(H.Meden,A.Fattahi-Meibodi,CA 125 in benign gynecological conditions.Int J BiolMarkers 13,231-237(1998))。
与和赘生物形成相关联的标记物不同,癌症驱动基因突变是赘生物形成的致病物,并且在非赘生病状中是不存在的。已表明,在卵巢癌女性的阴道中可以检测到肿瘤DNA(Erickson et al.,Detection of somatic TP53 mutations in tampons of patientswith high-grade serous ovarian cancer.Obstetrics and gynecology 124,881-885(2014))。此外,最近的一项原理证明研究表明,子宫内膜癌和卵巢癌脱落的细胞聚集在宫颈处,从而允许在常规的巴氏测试期间获得的流体中发现可检测水平的肿瘤DNA(Kinde etal.,Evaluation of DNA from the Papanicolaou test to detect ovarian andendometrial cancers.Sci Transl Med 5,167ra164(2013))。用插入子宫颈管的刷子(“巴氏刷”)对这些细胞进行采样。然后将刷子浸入防腐流体中。为了检测宫颈癌,将流体中的细胞施加在载玻片上进行细胞学检查(经典的巴氏涂片)。另外,通常从流体中纯化DNA以寻找HPV序列。
膀胱癌(BC)是最常见的尿路恶性肿瘤。根据美国癌症协会,2017年仅在美国估计就有79,030例膀胱癌新病例和18,540例死亡[Siegel RL,Miller KD,Jemal A(2017)Cancer Statistics,2017.CA Cancer J Clin 67:7-30]。主要根据尿路上皮组织学,浸润性BC起源于非浸润性乳头状或扁平前体。许多BC患者在进展之前经历了多次复发,为转移前的早期检测和治疗提供了充足的准备时间[Netto GJ(2013)Clinical applications ofrecent molecular advances in urologic malignancies:no longer chasing a″mirage″?.Adv Anat Pathol 20:175-203]。用经尿道活检(TURB)进行的尿液细胞学检查和膀胱镜检查是当前用于膀胱癌诊断和随访的黄金标准。尽管尿液细胞学检查具有检测高级别赘生物的价值,但它无法检测到绝大多数低级别肿瘤[Netto GJ,Tafe LJ(2016)Emerging Bladder Cancer Biomarkers and Targets of Therapy.Urol Clin North Am43:63-76;Lotan Y,Roehrborn CG(2003)Sensitivity and specificity of commonlyavailable bladder tumor markers versus cytology:results of a comprehensiveliterature review and meta-analyses.Urology 61:109-18;讨论118;Zhang ML,Rosenthal DL,VandenBussche CJ(2016)The cytomorphological features of low-grade urothelial neoplasms vary by specimen type.Cancer Cytopathol 124:552-564]。这一事实,加上反复进行膀胱镜检查和TURB程序的高成本和侵入性,已导致了许多开发新颖的非侵入性策略的尝试。这些包括基于尿液或血清的遗传和蛋白质测定法,用于筛选和监视[Kawauchi等人,(2009)9p21 Index as Estimated by Dual-ColorFluorescence in Situ Hybridization is Useful to Predict Urothelial CarcinomaRecurrence in Bladder Washing Cytology.Hum Pathol 40:1783-1789;Kruger S,MessF,Bohle A,Feller AC(2003)Numerical aberrations of chromosome 17 and the 9p21locus are independent predictors of tumor recurrence in non-invasivetransitional cell carcinoma of the urinary bladder.Int J Oncol 23:41-48;Skacel等人,(2003)Multitarget fluorescence in situ hybridization assay detectstransitional cell carcinoma in the maj ority of patients with bladder cancerand atypical or negative urine cytology.J Urol 169:2101-2105;Sarosdy等人,(2006)Use of a multitarget fluorescence in situ hybridization assay todiagnose bladder cancer in patients with hematuria.J Urol 176:44-47;Moonen等人,(2007)UroVysion compared with cytology and quantitative cytology in thesurveillance of non-muscle-invasive bladder cancer.Eur Urol 51:1275-80;讨论1280;Fradet Y,Lockhard C(1997)Performance characteristics of a new monoclonalantibody test for bladder cancer:ImmunoCyt trade mark.Can J Urol 4:400-405;Yafi等人,(2015)Prospective analysis of sensitivity and specificity of urinarycytology and other urinary biomarkers for bladder cancer.Urol Oncol 33:66.e25-66.e31;Serizawa等人,(2010)Integrated genetic and epigenetic analysisof bladder cancer reveals an additive diagnostic value of FGFR3 mutations andhypermethylation events.Int J Cancer;Kinde等人,(2013)TERT promoter mutationsoccur early in urothelial neoplasia and are biomarkers of early disease anddisease recurrence in urine.Cancer Res 73:7162-7167;Hurst CD,Platt FM,KnowlesMA(2014)Comprehensive mutation analysis of the TERT promoter in bladdercancer and detection of mutations in voided urine.Eur Urol 65:367-369;Wang等人,(2014)TERT promoter mutations are associated with distant metastases inupper tract urothelial carcinomas and serve as urinary biomarkers detected bya sensitive castPCR.Oncotarget 5:12428-12439;Ralla等人,(2014)Nucleic acid-based biomarkers in body fluids of patients with urologic malignancies.CritRev Clin Lab Sci 51:200-231;Ellinger J,Muller SC,Dietrich D(2015)Epigeneticbiomarkers in the blood of patients with urological malignancies.Expert RevMol Diagn 15:505-516;Bansal N,Gupta A,Sankhwar SN,Mahdi AA(2014)Low-and high-grade bladder cancer appraisal via serum-based proteomics approach.Clin ChimActa 436:97-103;Goodison S,Chang M,Dai Y,Urquidi V,Rosser CJ(2012)A multi-analyte assay for the non-invasive detection of bladder cancer.PLoS One 7:e47469;Allory等人,(2014)Telomerase reverse transcriptase promoter mutationsin bladder cancer:high frequency across stages,detection in urine,and lack ofassociation with outcome.Eur Urol 65:360-366]。当前可用的美国食品药品管理局(FDA)批准的测定方法包括ImmunoCyt测试(Scimedx Corp)、核基质蛋白22(NMP22)免疫测定测试(Matritech)和多靶标FISH(UroVysion)[Kawauchi等人,(2009)9p21 Index asEstimated by Dual-Color Fluorescence in Situ Hybridization is Useful toPredict Urothelial Carcinoma Recurrence in Bladder Washing Cytology.HumPathol 40:1783-1789;Kruger S,Mess F,Bohle A,Feller AC(2003)Numericalaberrations of chromosome 17 and the 9p21 locus are independent predictors oftumor recurrence in non-invasive transitional cell carcinoma of the urinarybladder.Int J Oncol 23:41-48;Skacel等人,(2003)Multitarget fluorescence insitu hybridization assay detects transitional cell carcinoma in the majorityof patients with bladder cancer and atypical or negative urine cytology.JUrol 169:2101-2105;Sarosdy等人,(2006)Use of a multitarget fluorescence insitu hybridization assay to diagnose bladder cancer in patients withhematuria.J Urol 176:44-47;Moonen等人,(2007)UroVysion compared with cytologyand quantitative cytology in the surveillance of non-muscle-invasive bladdercancer.Eur Urol 51:1275-80;讨论1280;Fradet Y,Lockhard C(1997)Performancecharacteristics of a new monoclonal antibody test for bladder cancer:ImmunoCyt trade mark.Can J Urol 4:400-405;Yafi等人,(2015)Prospective analysisof sensitivity and specificity of urinary cytology and other urinarybiomarkers for bladder cancer.Urol Oncol 33:66.e25-66.e31]。已报道,这些测试中的一些的敏感性在62%与69%之间,并且特异性在79%至89%之间。然而,由于测定性能不一致、成本或所需的技术专长,尚未将此类测定整合到常规临床实践中。
膀胱癌通常分为三种类型,其开始于膀胱内膜的细胞。在一些实施方案中,膀胱癌以变成恶性(癌性)的细胞类型命名,包括移行细胞癌、鳞状细胞癌和腺癌。移行细胞癌开始于膀胱最内组织层的细胞。移行细胞癌可以是低级别或高级别的。低级别移行细胞癌可以在治疗后复发,但很少扩散到膀胱的肌肉层或身体的其他部位。高级别移行细胞癌可以在治疗后复发,并且经常扩散到膀胱的肌肉层中,扩散到身体的其他部位以及扩散到淋巴结。几乎所有的膀胱癌造成的死亡都是由于高级别疾病。鳞状细胞癌开始于鳞状细胞,其是在长期感染或刺激后可能在膀胱中形成的薄的扁平细胞。腺癌开始于膀胱内膜中存在的腺(分泌)细胞,并且是一种非常罕见的膀胱癌类型。
发现TERT基因上游启动子的活化突变率在大多数BC以及其他癌症类型中很高[Huang FW,Hodis E,Xu MJ,Kryukov GV,Chin L,Garraway LA(2013)Highly recurrentTERT promoter mutations in human melanoma.Science 339:957-959;Killela等人,(2013)TERT promoter mutations occur frequently in gliomas and a subset oftumors derived from cells with low rates of self-renewal.Proc Natl Acad SciUSA 110:6021-6026;Scott GA,Laughlin TS,Rothberg PG(2014)Mutations of the TERTpromoter are common in basal cell carcinoma and squamous cell carcinoma.ModPathol 27:516-523]。TERT启动子突变主要影响两个热点,即g.1295228 C>T和g.1295250C>T。它们导致产生CCGGAA/T或GGAA/T基序,从而改变ETS转录因子的结合位点,并随后增加TERT启动子活性[Huang FW,Hodis E,Xu MJ,Kryukov GV,Chin L,Garraway LA(2013)Highly recurrent TERT promoter mutations in human melanoma.Science 339:957-959;Horn等人,(2013)TERT promoter mutations in familial and sporadicmelanoma.Science 339:959-961]。TERT启动子突变发生在多达80%的膀胱和上尿路的浸润性尿路上皮癌及其若干种组织学变体中[Kinde等人,(2013)TERT promoter mutationsoccur early in urothelial neoplasia and are biomarkers of early disease anddisease recurrence in urine.Cancer Res 73:7162-7167;Killela等人,(2013)TERTpromoter mutations occur frequently in gliomas and a subset of tumors derivedfrom cells with low rates of self-renewal.Proc Natl Acad Sci USA 110:6021-6026;Allory等人,(2014)Telomerase reverse transcriptase promoter mutations inbladder cancer:high frequency across stages,detection in urine,and lack ofassociation with outcome.Eur Urol 65:360-366;Cowan等人,(2016)Detection ofTERT promoter mutations in primary adenocarcinoma of the urinary bladder.HumPathol 53:8-13;Nguyen等人,(2016)High prevalence of TERT promoter mutations inmicropapillary urothelial carcinoma.Virchows Arch 469:427-434]。此外,TERT启动子突变发生在60%-80%的BC前体(包括低恶性潜力的乳头状尿路上皮赘生物[Rodriguez等人,(2017)Spectrum of genetic mutations in de novo PUNLMP of the urinarybladder.Virchows Arch]、非浸润性低级别乳头状尿路上皮癌、非浸润性高级别乳头状尿路上皮癌和“扁平”原位癌(CIS))以及这些患者的子集的尿液细胞中[Kinde等人,(2013)TERT promoter mutations occur early in urothelial neoplasia and arebiomarkers of early disease and disease recurrence in urine.Cancer Res 73:7162-7167]。因此,TERT启动子突变已被确定为BC中最常见的遗传改变[Kinde等人,(2013)TERT promoter mutations occur early in urothelial neoplasia and arebiomarkers of early disease and disease recurrence in urine.Cancer Res 73:7162-7167;Cheng L,Montironi R,Lopez-Beltran A(2017)TERT Promoter MutationsOccur Frequently in Urothelial Papilloma and Papillary Urothelial Neoplasm ofLow Malignant Potential.Eur Urol 71:497-498]。其他致癌基因活化突变包括FGFR3、RAS和PIK3CA中的那些突变,这些突变已表明在很大一部分非肌肉浸润性膀胱癌中发生[International Agency for Research on Cancer.(2016)WHO Classification ofTumours of the Urinary System and Male Genital Organs.World HealthOrganization;第4版;Netto GJ(2011)Molecular biomarkers in urothelial carcinomaof the bladder:are we there yet?.Nat Rev Urol 9:41-51]。在肌肉浸润性膀胱癌中,还经常发现TP53、CDKN2A、MLL和ERBB2中的突变[Netto GJ(2011)Molecular biomarkersin urothelial carcinoma of the bladder:are we there yet?.Nat Rev Urol 9:41-51;Mo等人,(2007)Hyperactivation of Ha-ras oncogene,but not Ink4a/Arfdeficiency,triggers bladder tumorigenesis.J Clin Invest 117:314-325;Sarkis等人,(1993)Nuclear overexpression of p53 protein in transitional cell bladdercarcinoma:a marker for disease progression.J Natl Cancer Inst 85:53-59;Lin等人,(2010)Increase sensitivity in detecting superficial,low grade bladdercancer by combination analysis of hypermethylation of E-cadherin,p16,p14,RASSF1A genes in urine.Urol Oncol 28:597-602;Sarkis等人,(1994)Association ofP53 nuclear overexpression and tumor progression in careinoma in situ of thebladder.J Urol 152:388-392;Wu XR(2005)Urothelial tumorigenesis:a tale ofdivergent pathways.Nat Rev Cancer 5:713-725;Cancer Genome Atlas ResearchNetwork(2014)Comprehensive molecular characterization of urothelial bladdercarcinoma.Nature 507:315-322]。
由于尿液细胞学检查对于复发的检测相对不敏感,因此在美国此类患者中,膀胱镜检查尽可能每三个月执行一次。事实上,这些患者的管理成本总计高于任何其他类型的癌症的管理成本,并且每年的总计达30亿美元[Netto GJ,Epstein JI(2010)Theranosticand prognostic biomarkers:genomic applications in urologicalmalignancies.Pathology 42:384-394]。因此,可以预测其中哪些患者最有可能发展为复发性BC的非侵入性测试在医学和经济上均十分重要。
每年全世界诊断出超过400,000例泌尿系统移行细胞癌新病例(Antoni,S.,Ferlay,J.,Soerjomataram,I.,Znaor,A.,Jemal,A.,&Bray,F.(2017).Bladder CancerIncidence and Mortality:A Global Overview and Recent Trends.Eur Urol,71(1),96-108.doi:10.1016/j.eururo.2016.06.010)。尽管这些尿路上皮癌大多数发生在下尿路的膀胱中,但5%-10%起源于肾盂和/或输尿管的上尿路(Roupret,M.,Babjuk,M.,Comperat,E.,Zigeuner,R.,Sylvester,R.J.,Burger,M.,Cowan,N.C.,Bohle,A.,VanRhijn,B.W.,Kaasinen,E.,Palou,J.,&Shariat,S.F.(2015).European Association ofUrology Guidelines on Upper Urinary Tract Urothelial Cell Carcinoma:2015Update.Eur Urol,68(5),868-879.doi:10.1016/j.eururo.2015.06.044;Soria,F.,Shariat,S.F.,Lerner,S.P.,Fritsche,H.M.,Rink,M.,Kassouf,W.,Spiess,P.E.,Lotan,Y.,Ye,D.,Fernandez,M.I.,Kikuchi,E.,Chade,D.C.,Babjuk,M.,Grollman,A.P.和Thalmann,G.N.(2017).Epidemiology,diagnosis,preoperative evaluation andprognostic assessment of upper-tract urothelial carcinoma(UTUC).World J Urol,35(3),379-387.doi:10.1007/s00345-016-1928-x)。在西方国家,这些上尿路尿路上皮癌(UTUC)的年发病率为每100,000人1-2例,但是在暴露于马兜铃酸(AA)的群体中发生率要高得多(Chen,C.H.,Dickman,K.G.,Moriya,M.,Zavadil,J.,Sidorenko,V.S.,Edwards,K.L.,Gnatenko,D.V.,Wu,L.,Turesky,R.J.,Wu,X.R.,Pu,Y.S.,&Grollman,A.P.(2012).Aristolochic acid-associated urothelial cancer in Taiwan.Proc Natl Acad SciUSA,109(21),8241-8246.doi:10.1073/pnas.1119920109;Grollman,A.P.(2013).Aristolochic acid nephropathy:Harbinger of a global iatrogenicdisease.Environ Mol Mutagen,54(1),1-7.doi:10.1002/em.21756;Lai,M.N.,Wang,S.M.,Chen,P.C.,Chen,Y.Y.,&Wang,J.D.(2010).Population-based case-control studyof Chinese herbal products containing aristolochic acid and urinary tractcancer risk.J Natl Cancer Inst,102(3),179-186.doi:10.1093/jnci/djp467;TaiwanCancer Registry.(2017).Bureau of Health Promotion,Dept.of Health,Taiwan.Theincidence of renal pelvic and ureteral tumor in Taiwan.Taiwan cancerregistry.2017年8月14日从URL cris.bhp.doh.gov.tw/pagepub/Home.aspx?itemNo=cr.q.10检索)。AA是由马兜铃属(Aristolochia)植物产生的致癌性和肾毒性硝基菲羧酸(Hsieh,S.C.,Lin,I.H.,Tseng,W.L.,Lee,C.H.,&Wang,J.D.(2008).Prescriptionprofile of potentially aristolochic acid containing Chinese herbal products:an analysis of National Health Insurance data in Taiwan between 1997 and2003,Chin Med,3,13.doi:10.1186/1749-8546-3-13;National Toxicology Program.(2011).Aristolochic acids.Rep Carcinog,12,45-49)。已在两个不同的群体中建立了AA暴露与UTUC之间的病因学联系。第一群体居住在巴尔干地区,这里的马兜铃属植物在麦田中自然生长(Jelakovic,B.,Karanovic,S.,Vukovic-Lela,I.,Miller,F.,Edwards,K.L.,Nikolic,J.,Tomic,K.,Slade,N.,Brdar,B.,Turesky,R.J.,Stipancic,Z.,Dittrich,D.,Grollman,A.P.,&Dickman,K.G.(2012).Aristolactam-DNA adducts are a biomarker ofenvironmental exposure to aristolochic acid.Kidney Int,81(6),559-567.doi:10.1038/ki.2011.371)。第二个群体在亚洲,这里的马兜铃属草药被广泛用于中药实践(Grollman,2013;National Toxicology Program,2011)。以台湾马兜铃属草药的药用造成的公共卫生威胁为例,台湾具有世界上最高的UTUC发病率(Chen,C.H.,Dickman,K.G.,Moriya,M.,Zavadil,J.,Sidorenko,V.S.,Edwards,K.L.,Gnatenko,D.V.,Wu,L.,Turesky,R.J.,Wu,X.R.,Pu,Y.S.,&Grollman,A.P.(2012).Aristolochic acid-associatedurothelial cancer in Taiwan.Proc Natl Acad Sci USA,109(21),8241-8246.doi:10.1073/pnas.1119920109;Yang,M.H.,Chen,K.K.,Yen,C.C.,Wang,W.S.,Chang,Y.H.,Huang,W.J.,Fan,F.S.,Chiou,T.J.,Liu,J.H.,&Chen,P.M.(2002).Unusually highincidence of upper urinary tract urothelial carcinoma in Taiwan.Urology,59(5),681-687)。台湾有超过三分之一的成年群体被开具含有AA的草药处方(Hsieh,S.C.,Lin,I.H.,Tseng,W.L.,Lee,C.H.,&Wang,J.D.(2008).Prescription profile ofpotentially aristolochic acid containing Chinese herbal products:an analysisof National Health Insurance data in Taiwan between 1997 and 2003.Chin Med,3,13.doi:10.1186/1749-8546-3-13),从而导致UTUC病例相对于所有尿路上皮癌的比例异常高(37%)(Taiwan Cancer Registry.(2017).Bureau of Health Promotion,Dept.ofHealth,Taiwan.The incidence of renal pelvic and ureteral tumor inTaiwan.Taiwan cancer registry.2017年8月14日从URL cris.bhp.doh.gov.tw/pagepub/Home.aspx?itemNo=cr.q.10检索)。
肾输尿管切除术可以治愈早期检测到的UTUC患者(Li,C.C.,Chang,T.H.,Wu,W.J.,Ke,H.L.,Huang,S.P.,Tsai,P.C.,Chang,S.J.,Shen,J.T.,Chou,Y.H.,&Huang,C.H.(2008).Significant predictive factors for prognosis of primary upper urinarytract cancer after radical nephroureterectomy in Taiwanese patients.Eur Urol,54(5),1127-1134.doi:10.1016/j.eururo.2008.01.054)。然而,直到明显的临床症状(通常是血尿)发作之前,这些癌症大多数都是沉默的,并且因此,大多数患者只能在晚期被诊断出(Roupret,M.,Babjuk,M.,Comperat,E.,Zigeuner,R.,Sylvester,R.J.,Burger,M.,Cowan,N.C.,Bohle,A.,Van Rhijn,B.W.,Kaasinen,E.,Palou,J.,&Shariat,S.F.(2015).European Association of Urology Guidelines on Upper Urinary Tract UrothelialCell Carcinoma:2015Update.Eur Urol,68(5),868-879.doi:10.1016/j.eururo.2015.06.044)。当前用于检测早期UTUC的诊断测试不可用。因此,需要可用于在具有发展这种恶性肿瘤类型的风险的群体中鉴定早期UTUC的临床工具。手术后的复发也是一个问题,因为UTUC可以在对侧上尿路和/或膀胱中复发(Roupret,M.,Babjuk,M.,Comperat,E.,Zigeuner,R.,Sylvester,R.J.,Burger,M.,Cowan,N.C.,Bohle,A.,VanRhijn,B.W.,Kaasinen,E.,Palou,J.,&Shariat,S.F.(2015).European Association ofUrology Guidelines on Upper Urinary Tract Urothelial Cell Carcinoma:2015Update.Eur Urol,68(5),868-879.doi:10.1016/j.eururo.2015.06.044;Soria,F.,Shariat,S.F.,Lerner,S.P.,Fritsche,H.M.,Rink,M.,Kassouf,W.,Spiess,P.E.,Lotan,Y.,Ye,D.,Fernandez,M.I.,Kikuchi,E.,Chade,D.C.,Babjuk,M.,Grollman,A.P.和Thalmann,G.N.(2017).Epidemiology,diagnosis,preoperative evaluation andprognostic assessment of upper-tract urothelial carcinoma(UTUC).World J Urol,35(3),379-387.doi:10.1007/s00345-016-1928-x)。因此,对恶性肿瘤体征的警惕监视是UTUC患者随访护理的基本部分,并且复发性疾病的非侵入性测试可以显著改善手术后的管理,特别是因为尿液细胞学检查无法检测到大多数UTUC(Baard,J.,de Bruin,D.M.,Zondervan,P.J.,Kamphuis,G.,de la Rosette,J.,&Laguna,M.P.(2017).Diagnosticdilemmas in patients with upper tract urothelial carcinoma.Nat Rev Urol,14(3),181-191.doi:10.1038/nrurol.2016.252)。
发明内容
总体来讲,本文提供了与鉴定受试者中癌症的存在的常规方法相比以增加的敏感性和特异性鉴定受试者中癌症的存在的方法和材料。在一些实施方案中,本文提供的用于以增加的敏感性和特异性鉴定受试者中癌症的存在的方法是对从受试者获得的液体样品(例如血液、血浆或血清)执行的,而鉴定受试者中癌症的存在的常规方法在对从受试者获得的液体样品执行检测时不能达到敏感性水平、特异性水平或两者。在一些实施方案中,本文提供的用于以增加的敏感性和特异性鉴定受试者中癌症的存在的方法在确定受试者已经患有癌症之前、在确定受试者携带癌细胞之前和/或在受试者表现出与癌症相关联的症状之前执行。在一些实施方案中,本文提供的用于以增加的敏感性和特异性鉴定受试者中癌症的存在的方法被用作第一线检测方法,而不是简单地用作对受试者患有癌症的另一种检测方法的确认(例如,“高估(overcall)”)。
在一些实施方案中,本文提供了用于鉴定受试者中胰腺癌的存在的方法,其包括:在从受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:KRAS、TP53、CDKN2A或SMAD4;在从受试者获得的第二生物样品中检测一个或多个以下蛋白质生物标记物的水平:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)或骨桥蛋白(OPN);将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平相比较;以及在检测到一个或多个遗传生物标记物的存在、一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平或两者时,鉴定受试者中胰腺癌的存在。在用于鉴定受试者中胰腺癌的存在的方法的一些中,第一生物样品、第二生物样品或两者包括血浆。在用于鉴定受试者中胰腺癌的存在的方法的一些中,第一生物样品和第二生物样品是相同的。在用于鉴定受试者中胰腺癌的存在的方法的一些中,检测以下各者中一个或多个遗传生物标记物的存在:KRAS、TP53、CDKN2A和SMAD4。在用于鉴定受试者中胰腺癌的存在的方法的一些中,检测以下各者的水平:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)和骨桥蛋白(OPN)。在用于鉴定受试者中胰腺癌的存在的方法的一些中,使用基于PCR的多重测序测定检测以下一者或多者中一个或多个遗传生物标记物的存在:KRAS、TP53、CDKN2A或SMAD4,所述基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在用于鉴定受试者中胰腺癌的存在的方法的一些中,在不知道受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测一个或多个蛋白质生物标记物的水平或两者。在用于鉴定受试者中胰腺癌的存在的方法的一些中,向受试者施用一种或多种治疗性干预(例如,手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法和/或免疫检查点抑制剂)。
在一些实施方案中,本文提供了用于鉴定受试者中癌症的存在的方法,其包括:在从受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS;在从受试者获得的第二生物样品中检测一个或多个以下蛋白质生物标记物的水平:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1或MPO;将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平相比较;以及在检测到一个或多个遗传生物标记物的存在、一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平或两者时,鉴定受试者中癌症的存在。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,第一生物样品、第二生物样品或两者包括血浆。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,第一生物样品和第二生物样品是相同的。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,检测以下各者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,检测以下各者的水平:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和MPO。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,使用基于PCR的多重测序测定检测以下一者或多者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS,所述基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,在不知道受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测一个或多个蛋白质生物标记物的水平或两者。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,向受试者施用一种或多种治疗性干预(例如,手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法和/或免疫检查点抑制剂)。
在一些实施方案中,本文提供了用于鉴定受试者中癌症的存在的方法,其包括:在从受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS;在从受试者获得的第二生物样品中检测一个或多个以下蛋白质生物标记物的水平:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF或CA15-3;将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平相比较;以及在检测到一个或多个遗传生物标记物的存在、一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平或两者时,鉴定受试者中癌症的存在。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,第一生物样品、第二生物样品或两者包括血浆。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,第一生物样品和第二生物样品是相同的。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,检测以下各者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,检测以下各者的水平:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,使用基于PCR的多重测序测定检测以下一者或多者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS,所述基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,在不知道受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测一个或多个蛋白质生物标记物的水平或两者。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,向受试者施用一种或多种治疗性干预(例如,手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法和/或免疫检查点抑制剂)。
在一些实施方案中,本文提供了用于鉴定受试者中癌症的存在的方法,其包括:在从受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS;在从受试者获得的第二生物样品中检测一个或多个以下蛋白质生物标记物的水平:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1或CA15-3;将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平相比较;以及在检测到一个或多个遗传生物标记物的存在、一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平或两者时,鉴定受试者中癌症的存在。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,第一生物样品、第二生物样品或两者包括血浆。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,第一生物样品和第二生物样品是相同的。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,检测以下各者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,检测以下各者的水平:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,使用基于PCR的多重测序测定检测以下一者或多者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS,所述基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,在不知道受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测一个或多个蛋白质生物标记物的水平或两者。在用于鉴定受试者中癌症的存在的方法的一些实施方案中,向受试者施用一种或多种治疗性干预(例如,手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法和/或免疫检查点抑制剂)。
在一些实施方案中,本文提供了用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在的方法,其包括:在从受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL;在从受试者获得的第二生物样品中检测TERT启动子中至少一个突变的存在;以及在从受试者获得的第三生物样品中检测非整倍性的存在;以及在检测到一个或多个遗传生物标记物的存在、TERT启动子中至少一个突变的存在、检测到非整倍性的存在或其组合时,鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在。在用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在的方法的一些实施方案中,第一生物样品和第二生物样品是相同的;第一生物样品和第三生物样品是相同的;第二生物样品和第三生物样品是相同的;或者第一生物样品、第二生物样品和第三生物样品是相同的。在用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在的方法的一些实施方案中,第一生物样品、第二生物样品或第三生物样品是尿液样品。在用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在的方法的一些实施方案中,在染色体臂5q、8q或9p中的一个或多个上检测非整倍性的存在。在用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在的方法的一些实施方案中,检测以下各者中一个或多个遗传生物标记物的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL。在用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在的方法的一些实施方案中,使用基于PCR的多重测序测定检测以下一者或多者中一个或多个遗传生物标记物的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL,所述基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在的方法的一些实施方案中,在不知道受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测TERT启动子中至少一个突变的存在或检测非整倍性的存在。在用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的存在的方法的一些实施方案中,向受试者施用一种或多种治疗性干预(例如,手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法和/或免疫检查点抑制剂)。
在一些实施方案中,本文提供了用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法,其包括:在从受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A;在从受试者获得的第二生物样品中检测非整倍性的存在;以及在检测到一个或多个遗传生物标记物的存在、检测到非整倍性的存在或两者时,鉴定受试者中卵巢癌或子宫内膜癌的存在。在用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法的一些实施方案中,第一生物样品和第二生物样品是相同的。在用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法的一些实施方案中,第一生物样品或第二生物样品是宫颈样品或子宫内膜样品。在用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法的一些实施方案中,在染色体臂4p、7q、8q或9q中的一个或多个上检测非整倍性的存在。在用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法的一些实施方案中,检测以下各者中一个或多个遗传生物标记物的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A。在用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法的一些实施方案中,使用基于PCR的多重测序测定检测以下一者或多者中一个或多个遗传生物标记物的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A,所述基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法的一些实施方案中,所述方法还包括:在从受试者获得的循环肿瘤DNA(ctDNA)样品中检测一个或多个以下基因中至少一个遗传生物标记物的存在:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN或TP53。在用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法的一些实施方案中,在不知道受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在或检测非整倍性的存在。在用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法的一些实施方案中,向受试者施用一种或多种治疗性干预(例如,手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法和/或免疫检查点抑制剂)。
除非另外定义,否则本文所用的所有技术和科学术语都具有与本发明所属领域中的普通技术人员通常所理解的相同的含义。本文描述了用于本发明的方法和材料;也可以使用本领域已知的其他合适的方法和材料。材料、方法和实例仅为说明性的,并且不意图为限制性的。本文提及的所有出版物、专利申请、专利、序列、数据库条目和其他参考文献均以引用的方式整体并入本文。当发生冲突时,以本说明书(包括定义)为准。在本文的各个部分中使用的标题不应被解释为将所述部分的公开内容限制于标题的主题,也不应被解释为将其他部分的公开内容限制于标题之外的主题。此类标题是示例性的,并且为了易于阅读而被简单地包括在内。此类标题也不意图将所述部分的适用性或通用性限制于本公开的其他部分。
本发明的其他特征和优点通过以下详细描述和附图以及权利要求书将显而易见。
附图说明
图1包含示出了用于检测和定位癌症的CancerSEEK测试的示意图。
图2包含示出了用于鉴定血浆样品中的肿瘤特异性突变的基于PCR的测定的发展的图。彩色曲线表示随着短(<40bp)扩增子数量的增加可以检测到的本研究中评估的八种类型的癌症的比例。检测的敏感性随扩增子数量的增加而增加,但在约60个扩增子处达到平台期。彩色圆点表示在我们的研究中评估的805例癌症中使用61扩增子组套检测到的癌症分数,其平均值为82%(参见正文)。可公开获得的测序数据从癌症体细胞突变目录(COSMIC)数据库获得。
图3包含示出了所评估的805例原发肿瘤中可检测突变的数量的分布的图。
图4包含示出了CancerSEEK的性能的图。(A)CancerSEEK的接受者操作特征(ROC)曲线。曲线上的红点表示在>99%的特异性下测试的平均性能(61%)。误差棒代表此特定点的敏感性和特异性的95%置信区间。如正文所述,在所评估的8种癌症类型中,中值性能为70%。(B)按分期的CancerSEEK的敏感性。误差棒代表中值的标准误差。(C)按肿瘤类型的CancerSEEK的敏感性。误差棒代表95%置信区间。
图5包含CancerSEEK中使用的ctDNA和八种蛋白质特征的瀑布图,说明了健康供体和健康患者之间的分离。值从高(左)到低(右)排序。每列代表个别患者样品(红色,癌症患者;蓝色,健康对照)。
图6包含示出了在CancerSEEK中使用的ctDNA和八种蛋白质特征的主成分分析的图。每个点代表个别患者样品(红色,癌症患者;蓝色,健康对照)。
图7包含示出了个别CancerSEEK特征对敏感性的影响的图。(A)按肿瘤类型的CancerSEEK的敏感性,如图4C中一样。(B-J)每个图板均显示从逻辑回归中排除特定的CancerSEEK特征时达到的敏感性。敏感性相对于通过CancerSEEK达到的敏感性的差异反映了每个生物标记物对CancerSEEK测试的性能的相对贡献。
图8包含示出了由监督式机器学习对被CancerSEEK分类为阳性的患者进行的癌症类型鉴定的图。百分比对应于按两种最可能的类型(浅蓝色和深蓝色棒的总和)之一或最可能的类型(浅蓝色棒)正确分类的患者的比例。表6提供了针对所有患者对所有癌症类型的预测。误差棒代表95%置信区间。
图9包含示出了将ctDNA KRAS突变与蛋白质生物标记物组合增加PDAC早期检测的敏感性的图。(A)关于AJCC分期,仅ctDNA KRAS突变、ctDNA KRAS突变加CA19-9以及ctDNAKRAS突变与CA19-9和其他蛋白质(组合测定)的敏感性。(B)关于肿瘤大小,仅ctDNA KRAS突变、ctDNA KRAS突变加CA19-9以及ctDNA KRAS突变与CA19-9和其他蛋白质(组合测定)的敏感性。误差棒代表95%置信区间。
图10包含示出了将ctDNA和蛋白质标记物组合增加敏感性的图,因为只通过一个标记物就检测到大部分患者。通过ctDNA KRAS突变(红色圆圈)、CA19-9(绿色圆圈)和三个其他蛋白质生物标记物(蓝色圆圈)及其组合(重叠区域)检测到的患者人数。八十名患者(总数的36%)无法通过三个标记物中的任一者检测到。
图11包含示出了KRAS和TP53突变的突变体等位基因频率(MAF)在12名患者的血浆中强烈相关(皮尔逊r=0.885)的图,所述患者的血浆中含有可检测量的两种突变,从而提供了对ctDNA测定及其定量性质的可靠性的验证。阴影区域代表95%置信区间。
图12包含了本研究中包括的221名PDAC患者按AJCC分期(IA期或IB期:蓝色曲线,IIA期或IIB期:红色曲线)分层的Kaplan-Meier存活曲线。
图13包含示出了三重测定标记物与肿瘤大小之间的相关性的图。(A)发现KRAS突变的频率在较大的肿瘤中比在较小的肿瘤中更高,但是突变体等位基因频率与肿瘤的大小不相关(皮尔逊r=0.039)。(B)在CA19-9升高的患者中,CA19-9血浆浓度与肿瘤大小之间弱相关性(皮尔逊r=0.287)。(C-E)CEA、HGF和OPN的血浆水平对肿瘤大小的依赖性小于KRAS突变或CA19-9(CEA皮尔逊r=0.153;HGF皮尔逊r=0.037;OPN皮尔逊r=0.018)。阴影区域代表95%置信区间。
图14包含示出了催乳素(G)和中期因子(E)的水平在施用麻醉后但在手术切除之前收集的样品中显著升高的图。相比之下,具有突变体KRAS ctDNA的样品比例(A)、CA19-9血浆浓度(B)、CEA血浆浓度(C)、HGF血浆浓度(D)和OPN血浆浓度在施用麻醉之前或之后收集的样品之间未观察到差异。N.S.不显著,P>0.05(精确置换t检验)。
图15包含示出了在施用麻醉之前和之后立即收集的29对血浆样品中蛋白质生物标记物水平的倍数变化的图。在评估的六个标记物中,仅发现催乳素和中期因子通过麻醉而升高,完全符合收集部位与蛋白质水平之间的相关性。
图16包含通过多元分析鉴定的总体存活的独立预测因子进行分层的Kaplan-Meier存活曲线:(A)组合测定状态(HR=1.76,95%CI,1.10-2.84,p=0.018);(B)分化程度(低分化,HR=1.72,95%CI 1.11-2.66,p=0.015);(C)淋巴管浸润(存在,HR=1.81,95%CI 1.06-3.09,p=0.028);(D)结节病(nodal disease)(存在,HR=2.35,95%CI 1.20-4.61,p=0.013);(E)边缘状态(HR=1.59,95%CI 1.01-2.55,p=0.050)
图17包含(A)KRAS突变、(B)CA19-9、(C)CEA、(D)HGF、(E)OPN和(F)组合测定的接受者操作特征(ROC)曲线。(A-E)ROC曲线独立地示出每个组合测定生物标记物的性能。曲线上的红点表示在组合测定中使用的阈值下的标记物性能。误差棒代表在特定阈值下(红色字体)敏感性和特异性的95%置信区间。(D)表示在以下情况时组合测定的性能的ROC曲线:改变KRAS阈值并将CA19-9、CEA、HGF和OPN阈值固定在组合测定中使用的水平(黑色曲线),改变CA19-9阈值并将KRAS、CEA、HGF和OPN阈值固定在组合测定中使用的水平(红色曲线),改变CEA阈值并将KRAS、CA19-9、HGF和OPN阈值固定在组合测定中使用的水平(蓝色曲线),改变HGF阈值并将KRAS、CA19-9、CEA和OPN阈值固定在组合测定中使用的水平(绿色曲线),以及改变OPN阈值并将KRAS、CA19-9、CEA和HGF的阈值固定在组合测定中使用的水平(橙色曲线)。这三条曲线的交点指定了三重测定的总体性能(64%敏感性,99.5%敏感性)。
图18示出了用于鉴定8种癌症类型中的癌症的标记物组套的性能。(A)数值数据。(B)图形数据。
图19包含用于检测子宫内膜癌或卵巢癌患者的巴氏刷、陶氏刷和血浆样品中的肿瘤DNA的示例性PapSEEK测试的示意图。从卵巢癌或子宫内膜癌中脱落的肿瘤细胞被带入子宫腔,它们可以在子宫腔内被陶氏刷收集。可以通过常规巴氏测试中使用的巴氏刷捕获向下进入子宫颈管的肿瘤细胞。将这些刷子浸入液体固定剂中,从中分离DNA并测序。分析序列的体细胞突变和非整倍性。此外,可以通过ctDNA分析检测脱落到血流中的肿瘤DNA。
图20包含示出了对来自健康对照以及子宫内膜癌和卵巢癌患者的巴氏刷(A)和陶氏刷(B)样品中的非整倍性和体细胞突变(PapSEEK)的检测的图。误差棒代表95%置信区间。
图21包含示出了在巴氏刷(A)和陶氏刷(B)样品中体细胞突变和非整倍性的组合测试增加对卵巢癌和子宫内膜癌二者的敏感性的维恩图。对于卵巢癌,与仅测试任一样品类型(C)相比,巴氏刷和血浆样品的组合测试也增加敏感性。
图22包含示出了按分期使用PapSEEK检测巴氏刷或陶氏刷样品中的子宫内膜癌(A)或卵巢癌(B)的图。误差棒代表95%置信区间。
图23包含示出了在巴氏刷和血浆样品中检测卵巢癌的图。误差棒代表95%置信区间。
图24包含示出了在巴氏刷、陶氏刷和血浆样品中使用PapSEEK检测子宫内膜癌和卵巢癌的图。误差棒代表95%置信区间。
图25包含本研究中用于评估尿液细胞的示例性方法的示意图。
图26包含示出了早期检测队列和监视队列中的患者数量以及数据汇总的流程图。对患者的子集进行细胞学检查。
图27包含示出了在早期检测队列(A)中评估的231个尿液细胞样品和在监视队列(B)中评估的132个尿液细胞样品中的十基因组套中发现的突变分数的图。
图28包含根据早期检测队列(A)和监视队列(B)的三种测定中的每一种呈阳性的样品分布的维恩图。URO=十基因组套,TERT=TERT启动子区域,ANEU=非整倍性测试。
图29包含在早期检测队列(A)和监视队列(B)中阳性UroSEEK测试与临床水平的疾病检测之间的领先时间的条形图。
图30包含示出了在早期检测队列和监视队列中细胞学检查与UroSEEK相比在诊断低级别和高级别尿路上皮赘生物方面的性能的条形图。
图31包含通过尿液细胞DNA的遗传分析进行的上尿路尿路上皮癌(UTUC)的示例性非侵入性检测的示意图。上尿路肿瘤出现在肾盂和/或输尿管中,并直接与尿液接触。尿液含有从泌尿系统的各个部位组成性脱落的正常细胞连同恶性细胞(存在时)(蓝色)一起的混合物。UroSEEK测定依赖于对泌尿系统癌(urinary cancer)中经常突变的基因的突变分析以及对染色体丢失和获得的确定。
图32包含示出了三种UroSEEK测定中每一种的阳性结果的分布的维恩图。
图33包含示出了来自UTUC队列的匹配的肿瘤和尿液细胞DNA样品中对拷贝数变化的比较的图。原发性肿瘤在每个部分的上部示出,而尿液细胞DNA在下部示出。染色体获得为蓝色,而丢失为红色。获得和丢失的显著性水平分别设定为Z得分>3和<-3。X轴是染色体臂。Y轴是Z得分。
图34包含示出了用于分析UTUC患者的尿液细胞DNA的10基因组套中每个基因的总突变的分数的图。
图35包含示出了来自四名个别UTUC患者的匹配的肿瘤和尿液细胞DNA样品中对拷贝数变化的比较的图(图35A-35D)。Z得分>3或<-3分别被视为对染色体获得或丢失而言是显著性的。N.S.表示不显著。表28中提供了所有56名患者的数据。
图36包含示出了对示例性WALDO方法的概述的示意图。(A)单个引物对扩增约38,000个长散布核苷酸元件(long interspersed nucleotide element,LINE)。(B)将测试样品与具有相似大小的基因组DNA的七个整倍体样品匹配。(C)将基因组分成4361个区间,每个大小为500-kb。(D)将在整倍体样品中在这些500-kb基因组区间内的读长分组成4361个簇。簇中所有的500-kb基因组区间具有相似的读长深度。(E)将测试样品中每个500-kb基因组区间的读长放入预先限定的簇中。(F)统计测试(包括基于支持向量机(SVM)的算法)用于确定在样品为整倍体的情况下,每个染色体臂上所有的500-kb基因组区间的总读长是否按预期进行分布。统计测试基于观察到的读长在测试样品的簇中的分布,而不是与整倍体样品中的读长的比较。(G)LINE中已知常见多态性的位点处的生殖系序列变体提供了关于臂水平的等位基因失衡的信息,这些信息也可以用于评估个别染色体臂的非整倍性。这些相同的多态性可以用于确定任意两个样品是否来源于同一个体。(H)当有来自同一个体的匹配的正常样品可用时,WALDO可以检测LINE中单碱基取代以及插入和缺失的数量和性质。
图37包含示出了在九种癌症类型中鉴定的个别染色体臂的获得和丢失的图。图中描绘了在每个染色体臂中具有获得或丢失的肿瘤的平均分数。在两个队列中分析相同的九种肿瘤类型,但通过WALDO(红色)或GISTIC(蓝色)评估的样品之间没有重叠。WALDO采用此处报道的肿瘤的LINE测序的数据,而GISTIC采用TCGA提供的Affymetrix SNP6.0阵列的数据。
图38示出了在癌症患者血浆样品中检测的非整倍性。示出了三个范围的赘生性细胞部分的接受者操作特征(ROC)和曲线下面积(AUC)。真阳性定义为来自癌症患者的评分为阳性的那些样品,而假阳性定义为来自正常个体的得分为阳性的那些样品。如文中所述,根据驱动基因测序数据估计每个血浆样品的赘生性细胞部分。(A)赘生性细胞部分<0.5%的样品。(B)赘生性细胞部分为0.5%-1%的样品。(C)赘生性细胞部分>1%的样品。
图39包含示出了在9种不同癌症类型中,与使用Affymetrix SNP6.0和GISTIC进行的癌症基因组图谱(TCGA)相比,使用FAST-SeqS和WALDO检测的癌症的非整倍性相关性比较的图。(A)染色体臂获得的分数的相关性。(B)染色体臂丢失的分数的相关性。
图40包含示出了与癌症基因组图谱(TCGA)相比,使用WALDO框架检测的个别癌症类型的非整倍性比较的图。对于每种癌症类型,比较了每个染色体臂获得和丢失的分数。比较了WALDO与TCGA的这些获得和丢失的相关性。每个子图代表一种不同的癌症类型。(A)乳腺浸润性癌(BRCA)。(B)结肠腺癌和直肠腺癌(COAD;COADREAD)。(C)食道癌(ESCA)。(D)头颈部鳞状细胞癌(HNSC)。(E)肝细胞癌(LIHC)。(F)胰腺癌(PAAD)。(G)卵巢浆液性囊腺癌(OV)。(H)胃腺癌(STAD)。(I)子宫体子宫内膜癌(UCEC)。
图41包含示出了三体性21性能作为读长深度的函数的图。将来自三体性个体的DNA样品以2ng正常DNA和约0.2ng三体性21DNA的比率与正常外周白细胞(WBC)样品进行物理混合。产生混合物以在无创产前检测(noninvasive prenatal testing)中复制典型的胎儿分数(fetal fraction)(大约10%)。使用LINE-扩增子中的多态性,样品的三体性掺和率经估计为7.7%至10.4%)。使用2.5的z阈值,计算一定范围的读长深度的敏感性(A)和特异性(B)。
图42包含示出了在外显子组测序相对于WALDO中检测的体细胞单碱基取代(SBS)的总数的比较的图。
图43包含示出了通过外显子组测序相对于WALDO检测为A:T>T:A突变的单碱基取代突变的百分比的比较的图。
图44包含示出了单碱基取代(SBS)突变的谱的图。(A)由WALDO鉴定的SBS。(B)由外显子组测序鉴定的SBS。
图45包含示出了代表性正常WBC样品的簇中包括的基因组区间的数量的分布的图。
图46包含示出了经缩放读长的分布的图。(A)经缩放读长的分布,其示出了FAST-SeqS扩增子测序中的读长不是随机分布的。(B)代表性正常WBC样品的簇,其示出了簇中经缩放读长的正态性(normality)。(C)代表性非整倍体原发性肿瘤样品的簇,其示出了簇中经缩放读长的正态性。
图47包含示出了用于鉴定染色体臂获得或丢失的统计程序的实例的图。
图48包含示出了杂合SNP的B等位基因频率的方差的经验估计作为读长深度的函数的图。UID深度的增加改善了杂合SNP的B等位基因频率的估计。
图49示出了产生具有一个臂改变的合成物的示例性伪代码。
图50示出了产生具有多个臂改变的合成物的示例性伪代码。
图51包含示出了全基因组非整倍性得分(SVM得分)的分布作为读长深度的函数的图。较低的读长深度更有可能产生较高的得分,并且无法校正UID深度会产生假阳性。
图52包含示出了瓶颈测序方法的示例性概述的图。图上部的每种颜色代表群体中一种细胞的基因组的双链DNA。随机的非克隆点突变(红色)是个别细胞专有的。相比之下,在细胞群内的所有基因组中都存在克隆参考变化(黑色的A)。(步骤1)随机剪切产生大小可变的DNA分子。(步骤2)Illumina Y衔接子的非互补单链区域(灰色的P5和黑色的P7)表示为连接到每个DNA分子两端的叉状结构。(步骤3)稀释以随机的方式减少原始群体中DNA分子的数量(示出为五个)。DNA分子的末端与参考基因组唯一地对齐。在数据处理期间,映射坐标用作唯一分子“条形码”。(步骤4)PCR引物(黑色箭头)退火并且引物独立地延伸(虚线(hashed line))原始DNA分子的Watson和Crick模板。红色星号代表文库的PCR期间产生的错误。(步骤5)Watson和Crick模板生成两个PCR复制品(duplicate)家族。包含衔接子的P5(灰色)和P7(黑色)相对于DNA分子(插入片段)的取向区分这两个家族。P5和P7序列决定在Illumina流通池上分别以读长1与读长2进行哪个末端的测序。红色星号代表在Watson但不在Crick家族成员中传播的PCR错误。与人为误差(artifact)相比,Watson和Crick家族成员中都将存在真实突变(红色的C:G突变)。(步骤6)BotSeqS管道通过消除人为误差和克隆变化(黑色的A:T)来鉴定并量化测序数据中唯一DNA分子和点突变的数量(红色的C:G)。
图53包含示出了与对照相比,具有DNA修复缺陷或暴露于环境致癌物的个体在正常组织中核点突变增加的图。(A)在具有不同的DNA错配修复基因型(PMS2+/+或PMS2-/-)的年龄匹配的正常结肠上皮(实心圆圈)中或者在没有(无)或有(马兜铃酸或吸烟)致癌物暴露的年龄匹配的正常肾皮质(实心方形)中的核基因组(左)和线粒体基因组(右)中点突变流行率的比较。红线代表平均值。*P<0.05,t检验;**P<0.001并且***P<0.0001,采用Bonferroni多重比较后检验的单因素方差分析(one-way ANOVA);ns,不显著,表示P>0.05。(B)堆叠的柱,代表六种可能类型(参见图例)之中每种取代的取代频率(y轴)。队列标记在每个柱正上方的A中示出。产生每个突变谱的取代的数量(N)在x轴上示出。n.d.,由于用于突变谱分析的突变数量不足(N=7)而未测定。*P=0.04,Fisher精确检验;**P=2.6×10-8并且***P=1.5×10-16,采用Bonferroni多重比较校正的Fisher精确检验;ns,不显著,表示P>0.05。本图中的所有统计检验均为双尾的。
图54包含示出了正常人体组织在一生中以基因组特异性和组织特异性突变模式积累点突变的图。在四种正常组织类型中(9个个体的大脑额叶皮质、5个个体的肾皮质、11个个体的结肠上皮和1个个体的十二指肠)测量核基因组(上)和线粒体基因组(下)中的点突变流行率。评估了总计26个个体,每个个体都贡献一种正常组织类型。饼图插图示出了六种可能取代类型(参见右侧的饼图图例)之中每种取代的流行率。每个饼图都是根据其各自的散点图中所代表的个体进行编制,但省略了十二指肠。产生饼图的取代数量,对于核基因组而言,大脑为n=31,肾脏为n=73,结肠为n=94,并且对于线粒体基因组而言,大脑为n=181,肾脏为n=299,结肠为n=116。
图55包含使用MiSeqTM预运行进行的复制品计数的评估。示出了家族成员的分布(来自个别模板分子的PCR复制品,在x轴上示出)的直方图。在MiSeqTM上针对六种样品(COL373、SA_117、KID038、BRA01、BRA04、BRA07)评估两个或三个系列稀释液(103、104、105或106),以产生每个文库约5M正确配对的读长。此处使用Picard的估计文库复杂度(Picard’s Estimate Library Complexity)程序确定家族成员计数。随后将105稀释液(蓝色)产生的文库用于本研究报道的最终HiSeqTM运行。应注意,与MiSeqTM分布相比,由于每个文库测序的簇增加(约5M簇,缩放至约70M簇),HiSeqTM分布预期会向右移动。例如,未使用来自106稀释液(红色)的BotSeqS文库,因为每个家族的成员在HiSeqTM运行中将会过高,从而限制了在给定量的测序下可以评估的不同家族的数量。
图56包含示出了本研究报道的44个BotSeqS文库的家族成员计数的图。44个BotSeqS库(y轴)与每个家族的成员数量(复制品计数,x轴)的水平盒须图。白色盒代表第一个到第三个四分位距(quartile range),其中散列标示表示中值。须代表1.5*IQR(四分间距(interquartile range)),并且须外部的数据点示出为离群值。评估每个文库3.97M(范围0.38至10.91M)未过滤家族的平均值。使用基因组映射坐标作为唯一分子标识符,通过BotSeqS管道来鉴定家族。蓝色名称表示技术重复样品。应注意,Bot01-Bot06和Bot23-28是在相同样品上进行的,其稀释度相差100倍(参见表43)。
图57包含示出了考虑Watson和Crick家族成员二者减少人为误差、特别是G>T颠换的图。(A)核点突变频率(y轴),考虑在来源于大脑额叶皮质(左侧)、肾皮质(中间,阴影)或结肠上皮(右侧)的正常组织中的“Watson和/或Crick”(黑色圆圈)或“Watson和Crick”家族(黑色方形)中观察到的突变。具体地,“或”突变代表具有最少两个Watson读长的Watson家族中≥90%的突变分数,或具有最少两个Crick读长的Crick家族中≥90%的突变分数。应注意,“或”突变仅具有数据中代表的Watson或Crick家族,但没有两个家族。“和”突变代表具有最少两个Watson读长的Watson家族中≥90%的突变分数,和具有最少两个Crick读长的Crick家族中≥90%的突变分数。“和”突变是“和/或”数据集的内部子集,其是BotSeqS管道的修改版本。通过增加每个组织内的年龄来组织25个个体。(B)考虑每个正常组织类型中的Watson和/或Crick(上部饼图)或Watson和Crick(下部饼图)的来自(a)的六种可能取代类型(参见图例)之中的每种核取代频率的饼图。产生突变谱的核突变的数量,对于Watson和/或Crick而言,大脑为n=616,肾脏为n=1,257,结肠为n=2,542,并且对于Watson和Crick而言,大脑为n=33,肾脏为n=74,结肠为n=99。
图58包含示出了在结肠的正常组织中积累的罕见点突变多于在大脑中的图。按年龄分组的正常大脑额叶皮质(左侧)和正常结肠上皮(右侧)中的核基因组(上图)和线粒体基因组(下图)中的点突变频率(y轴)(婴幼儿为绿色,青年为紫色,老年为蓝色)。示出了每个年龄队列的平均值,其中误差棒代表标准偏差。使用GraphPad PrismTM 5.0f软件执行采用Bonferroni多重比较后检验的两因素方差分析,其中P值在棒上方报道。n.s.(不显著)表示P>0.05。对于大脑,组的个体数量和平均年龄如下:婴幼儿:n=3个个体,3.5岁(y/o)(BRA01、BRA02、BRA03);青年:n=3个个体,22y/o(BRA04、BRA05、BRA06);和老年:n=3个个体,93y/o(BRA07、BRA08、BRA09)。对于结肠,婴幼儿:n=2个个体,5.5y/o(COL229、COL231);青年:n=6个个体,28(COL235、COL236、COL237、COL373、COL374、COL375);老年:n=3个个体,96y/o(COL232、COL233、COL234)。
图59包含示出了同一个体的正常组织中线粒体点突变和核点突变频率的图。数据点代表同一个体的正常组织内线粒体点突变与核点突变频率之间的比率(y轴)。将个体分组成四个队列(x轴),其中n=24个个体用于对照(参见表51),n=2个个体(COL238、COL239)用于DNA修复缺陷PMS2-/-,n=3个个体(AA_105、AA_124、AA_126)用于马兜铃酸暴露,并且n=3个个体(SA_117、SA_118、SA_119)用于吸烟暴露。对照队列中的一个比率(COL229)为零,并且从本分析中省略。每个队列的平均(红线)比率,对于对照是24.5,对于DNA修复缺陷PMS2-/-是0.5,对于马兜铃酸暴露是1.1,并且对于吸烟暴露是2.0。*P<0.05,**P<0.01,采用Bonferroni多重比较后检验的单因素方差分析。
图60包含示出了来源于相同组织类型的正常组织和肿瘤具有相似突变谱的图。(A)比较来源于结肠(上图)和肾脏(下图)的正常组织(左侧)和肿瘤(右侧)的六种可能的取代类型(参见图例)之中每种取代的核频率和线粒体频率的饼图。“正常”代表来源于图54所示的正常组织的罕见突变谱数据。“核肿瘤突变”代表来自synapse.org网站上的TCGA数据集#!Synapse:syn1729383的结直肠癌(COAD/READ)或透明细胞肾癌(KIRC)的克隆突变数据。从Ju等人(2014 eLife 3)的补充文件2中的“结直肠”和“肾脏”肿瘤类型获得来自结肠和肾脏的“mtDNA肿瘤突变”。对于正常组织,评估的取代数量如下:结肠核n=94,来自13个个体;结肠mtDNA n=116,来自12个个体;肾脏核n=73,来自7个个体;以及肾脏mtDNA n=299,来自5个个体。对于肿瘤组织,评估的取代数量如下:结直肠癌核n=18,538,来自193个个体;结直肠癌mtDNA n=64,来自76个个体;透明细胞肾细胞癌核n=24,559,来自417个个体;以及肾癌mtDNA n=16,来自23个个体。(B)来自(A)中所示的队列的突变谱的主成分分析(PCA)。使用R软件执行PCA并作图。
图61包含示出了Safe-SeqS的元件的示意图。第一步,为每个待分析的片段分配唯一标识(UID)序列(画有金属色阴影线或点的条)。第二步,扩增带唯一标签的片段,从而产生UID家族,其每个成员都具有相同的UID。超突变体定义为≥95%的家族成员具有相同突变的UID家族。
图62包含示出了具有内源UID加捕获的示例性Safe-SeqS的示意图。通过随机剪切产生的每个片段的末端的序列(画有不同阴影的条)用作唯一标识符(UID)。将这些片段连接到衔接子(画有大地色阴影线和交叉阴影线的条),以便随后可以通过PCR对其进行扩增。从双链模板的每条链产生一个唯一可标识片段;仅示出了一条链。所关注片段被捕获在含有与所关注序列互补的寡核苷酸的固相上。在用含有5′“移植”序列的引物(填充粘合剂的和画有浅色点的条)进行PCR扩增以产生UID家族之后,执行测序,并且超突变体如图61所定义。
图63包含示出了使用外源UID的示例性Safe-SeqS的示意图。使用一组基因特异性引物扩增DNA(剪切或未剪切的)。所述引物之一具有位于其基因特异性序列的5′端的形成唯一标识符(UID;画有不同阴影的条)的随机DNA序列(例如,一组14N的序列),并且两个引物都具有允许在下一步骤中进行通用扩增的序列(画有大地色阴影线和交叉阴影线的条)。如图所示,两个UID分配循环由每个双链模板分子产生两个片段,每个片段具有不同的UID。随后用也包含“移植”序列的通用引物(填充粘合剂的和画有浅色点的条)进行PCR,产生被直接测序的UID家族。超突变体如图61的图例所定义。
图64包含示出了常规分析和Safe-SeqS分析鉴定的单碱基取代的图。图63中所描绘的外源UID策略用于由三个正常的无关的个体的CTNNBl基因产生PCR片段。每个位置代表87个可能的单碱基取代之一(分析了3个可能的取代/碱基x29个碱基)。这些片段在Illumina GA IIx仪器上进行测序,并以常规方式(A)或使用Safe-SeqS(B)进行分析。Safe-SeqS结果以与常规分析相同的比例尺显示,用于直接比较;插图是放大视图。应注意,通过常规分析鉴定的大多数变体很可能代表测序错误,如其相对于Safe-SeqS的高频率及其在无关样品中的一致性所示出的。
图65包含示出了具有内源UID加反向PCR的示例性Safe-SeqS的示意图。通过随机剪切产生的每个片段的末端的序列用作唯一标识符(UID;画有不同阴影的条)。如标准Illumina文库制备中一样,将这些片段连接到衔接子(画有大地色阴影线和交叉阴影线的条)。从双链模板的每条链产生一个带唯一标签的片段;仅示出了一条链。用连接酶环化之后,用也包含5′“移植”序列的基因特异性引物(填充粘合剂的和画有浅色点的条)进行反向PCR。此PCR产生被直接测序的UID家族。超突变体如图61所定义。
图66包含示出了用亚磷酰胺和Phusion合成的寡核苷酸中的单碱基取代位置相对于错误频率的图。通过Safe-SeqS分析由亚磷酰胺(A)或Phusion聚合酶(B)合成的相同的31碱基DNA片段的代表性部分。绘制每种类型的七个独立实验的平均值和标准偏差。在亚磷酰胺合成的片段和Phusion产生的片段中分别鉴定出1,721±383和196±143个SBS超突变体的平均值。v轴表示在指示位置处总错误的比例。应注意,亚磷酰胺合成的DNA片段中的错误在七个重复样品之间是一致的,正如在本身合成过程中系统地引入错误的情况下所预期的一样。相比之下,Phusion产生的片段中的错误在样品之间似乎是不均一的,正如从随机过程中所预期的一样(Luria和Delbruck,1943 Genetics 28:491-511)。
图67包含示出了UID家庭成员分布的图。图63所描绘的外源UID策略用于由三个正常的无关个体的CTNNB1区域产生PCR片段(表53);示出了由一个个体产生的具有≤300个成员(总UID家族的99%)的UID家族的代表性实例。y轴表示包含在x轴上示出的家庭成员数量的不同UID家族的数量。
图68包含用于肿瘤位置分类的示例性随机森林模型树。(A)示出了完整树,并且(B)-(K)包含如(A)所示的完整树的部分的放大图像。
图69包含从随机森林模型中提取的组织识别的示例性规则。来自randomForest软件包(v4.6-14)的randomForest函数应用于来自CancerSEEK项目的蛋白质数据。蛋白质数据具有33种蛋白质和被CancerSEEK正确预测为癌症的626个肿瘤样品。如果每种蛋白质的值小于正常样品中第25个分位数的值,则将它们设定为零。为了获取特定的决策规则(表58),应用inTrees软件包(v1.2)从randomForest创建的所有500棵树中提取所有长度小于或等于6的规则。使用inTrees软件包中的函数(selectRuleRRF、buildLearner、applyLearner)从这组规则中选择相关和非冗佘规则,创建分类器、将其应用于数据,并且提取最终规则列表。此最终规则列表的执行与完整随机森林类似,并且代表与完整森林的良好近似。
具体实施方式
定义
如本文所用,名词之前的单词“一个/种(a)”代表特定名词的一个/种或多个/种。例如,短语“遗传改变”涵盖“一个或多个遗传改变”。
如本文所用,术语“约”意指大约、在其范围内、大致或左右。当结合数值范围使用时,术语“约”通过扩展到所列出的数值以上和以下的界限来改变所述范围。总体来讲,本文使用术语“约”来使一个数值改变到所指出的值以上和以下的10%偏差值。
如本文所用,术语“非整倍性”是指具有小于或大于天然二倍体数量的染色体或与整倍性有任何偏差的状况。
如本文在循环肿瘤DNA或无细胞DNA的情境中所用,短语“来源于基因”意指循环肿瘤DNA是从肿瘤细胞(例如,已裂解或以其他方式死亡的肿瘤细胞)脱落的。例如,循环肿瘤DNA“来源于KRAS基因”意指循环肿瘤DNA最初存在于肿瘤细胞中。当检测来源于基因的循环肿瘤DNA中存在的突变时,不必首先在肿瘤细胞本身中鉴定所述突变。
如本文所用,短语“遗传生物标记物”和“遗传标记物”是指受试者的癌症的单独的或与其他遗传标记物或其他生物标记物组合的特征性核酸。遗传生物标记物可以包括基因中的修饰(例如,突变)。修饰的实例包括但不限于单碱基取代、插入、缺失、插入/缺失、易位和拷贝数变化。在一些实施方案中,遗传生物标记物包括肿瘤抑制基因中的修饰(例如,失活修饰)。在一些实施方案中,遗传生物标记物包括致癌基因中的修饰(例如,活化修饰)。本文更详细地描述了各个遗传生物标记物和遗传生物标记物组套。
如本文所用,术语“突变”、“遗传修饰”和“遗传改变”可互换使用以指示野生型核酸序列中的变化。例如,在一些实施方案中,本文描述了检测无细胞DNA(例如,ctDNA)中的突变的方法。应当理解,此类方法可以可互换地描述为检测突变、遗传修饰或遗传改变。
如本文所用,短语“蛋白质生物标记物”、“蛋白质标记物”、“肽生物标记物”和“肽标记物”是指受试者的癌症的单独的或与其他蛋白质或其他生物标记物组合的特征性蛋白质。在一些实施方案中,与没有癌症的参考受试者相比,蛋白质生物标记物在受试者(例如,患有癌症的受试者,而不论所述受试者是否已知患有癌症)中包含升高水平的蛋白质。在一些实施方案中,与没有癌症的参考受试者相比,蛋白质生物标记物在受试者(例如,患有癌症的受试者,而不论所述受试者是否已知患有癌症)中包含降低水平的蛋白质。如本文所用,短语“检测蛋白质生物标记物”可以是指检测蛋白质生物标记物的水平(例如,增加的水平或降低的水平)。本文更详细地描述了各个蛋白质生物标记物和蛋白质生物标记物组套。在一些实施方案中,在本文提供的方法中使用与蛋白质生物标记物不同的肽。
如本文关于蛋白质生物标记物所用,短语“升高水平”是指大于通常在来自健康受试者(例如,不表现出特定疾病或病状的受试者)的样品(例如,参考样品)中观察到的蛋白质生物标记物的参考水平的蛋白质生物标记物的水平。在一些实施方案中,参考样品可以是从没有癌症的受试者(例如,不同受试者或参考受试者)获得的样品。例如,对于与结直肠癌相关联的蛋白质生物标记物,参考样品可以是从没有结直肠癌的不同受试者或参考受试者获得的样品。在一些实施方案中,参考样品可以是从在其中观察到升高水平的蛋白质生物标记物的同一受试者获得的样品,其中所述参考样品是在癌症发作之前获得的。在一些实施方案中,将从同一受试者获得的这种参考样品冷冻或以其他方式保存,将来用作参考样品。在一些实施方案中,当参考样品具有不可检测水平的蛋白质生物标记物时,升高水平可以是蛋白质生物标记物的任何可检测水平。应当理解,当确定特定水平是否是升高水平时,可以使用来自可比样品的水平。
如本文关于蛋白质生物标记物所用,短语“参考水平”是指通常存在于健康受试者(例如,不表现出特定疾病或病状的受试者)中的蛋白质生物标记物的水平。蛋白质生物标记物的参考水平可以是在不表现出疾病或病状(例如,癌症)的参考受试者中存在的水平。例如,对于与结直肠癌相关联的蛋白质生物标记物,参考样品可以是从没有结直肠癌的受试者获得的样品。作为另一个实例,蛋白质生物标记物的参考水平可以是在受试者的疾病或病状(例如,癌症)发作之前存在于所述受试者中的水平。在一些实施方案中,当一个或多个蛋白质生物标记物的测量或检测水平高于所述一个或多个蛋白质生物标记物的参考水平时,可以在受试者中鉴定疾病或病状。
如本文所用,术语“敏感性”是指方法正确鉴定或诊断受试者中疾病的存在的能力(例如,方法的敏感性可以描述为所述方法鉴定真阳性率的能力或检测受试者中的病状的概率)。例如,当关于本文所述的可以检测受试者中癌症的存在的各种方法中的任一种使用时,高敏感性意指所述方法在大部分时间中正确鉴定了受试者中癌症的存在。例如,本文所述的在执行方法的95%的时间中正确检测了受试者中癌症的存在的方法,被称为具有95%的敏感性。在一些实施方案中,本文所述的可以检测受试者中癌症的存在的方法提供至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高)的敏感性。在一些实施方案中,与包括仅检测一个类别的生物标记物的一个或多个成员的方法相比,本文提供的包括检测两个或更多个类别的生物标记物(例如遗传生物标记物和/或蛋白质生物标记物)的一个或多个成员的存在的方法提供了更高的敏感性。
如本文所用,术语“特异性”是指方法正确驳斥受试者中疾病的存在的能力(例如,方法的特异性可以描述为所述方法鉴定真阴性率的能力或正确确定受试者中不存在病状的概率。例如,当关于本文所述的可以检测受试者中癌症的存在的各种方法中的任一种使用时,高特异性意指所述方法在大部分时间中正确鉴定受试者中不存在癌症(例如,所述方法在大部分时间中不会错误地鉴定受试者中不存在癌症)。例如,本文所述的在执行方法的95%的时间中正确检测了受试者中不存在癌症的方法,被称为具有95%的特异性。在一些实施方案中,本文所述的可以检测受试者中不存在癌症的方法提供至少80%(例如,至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高)的特异性。在一些实施方案中,与包括仅检测一个类别的生物标记物的一个或多个成员的方法相比,本文提供的包括检测两个或更多个类别的生物标记物(例如遗传生物标记物和/或蛋白质生物标记物)的一个或多个成员的存在的方法提供了更高的特异性。
如本文所用,术语“受试者”与术语“患者”可互换使用,并且意指包括哺乳动物纲的任何成员在内的脊椎动物,包括人、家畜和农场动物以及动物园动物、竞技动物或宠物动物,诸如小鼠、兔、猪、绵羊、山羊、牛、马(例如赛马)和高等灵长类动物。在一些实施方案中,受试者是人。在一些实施方案中,受试者患有疾病。在一些实施方案中,受试者患有癌症。在一些实施方案中,受试者是携带癌细胞的人。在一些实施方案中,受试者是携带癌细胞但是不知道携带癌细胞的人。在一些实施方案中,受试者患有病毒性疾病。在一些实施方案中,受试者患有细菌性疾病。在一些实施方案中,受试者患有真菌性疾病。在一些实施方案中,受试者患有寄生性疾病。在一些实施方案中,受试者患有哮喘。在一些实施方案中,受试者患有自身免疫疾病。在一些实施方案中,受试者患有移植物抗宿主疾病。
如本文所用,术语“治疗”与短语“治疗性干预”可互换使用。
测试从白细胞(例如,与年龄相关联的克隆性造血作用(例如,克隆性造血扩增,也称为不确定潜力或CHIP的克隆性造血作用)或脊髓发育不良过程中产生的白细胞克隆)分离或获得的DNA中是否存在与癌症相关联的遗传突变以便确定遗传改变是否来源于受试者的癌细胞的方法在本文中统称为“验证针对白细胞的遗传改变”、“验证针对来自白细胞的DNA的遗传改变”、“白细胞验证”以及类似短语。
概述
总体来讲,本文提供了与鉴定受试者中癌症的存在的常规方法相比以高敏感性和特异性检测或鉴定受试者中癌症的存在的方法和材料。在一些实施方案中,对从受试者获得的液体样品(例如血液、血浆或血清)执行本文提供的用于以高敏感性和特异性鉴定受试者中癌症的存在的方法,而鉴定受试者中癌症的存在的常规方法在对从受试者获得的液体样品执行时不能达到敏感性水平、特异性水平或两者。在一些实施方案中,本文提供的用于以高敏感性和特异性鉴定受试者中癌症的存在的方法在确定受试者已经患有癌症之前、在确定受试者携带癌细胞之前和/或在受试者表现出与癌症相关联的症状之前执行。因此,在一些实施方案中,本文提供的用于以高敏感性和特异性鉴定受试者中癌症的存在的方法被用作第一线检测方法,而不是简单地用作对受试者患有癌症的另一种检测方法的确认(例如,“高估”)。
在一些实施方案中,本文提供的方法和材料在癌症的检测或诊断中提供高敏感性(例如,正确鉴定受试者患有癌症的高频率或发生率)。在一些实施方案中,本文提供的方法和材料提供至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的敏感性。在一些实施方案中,本文提供的方法和材料在检测单个类型的癌症时提供高敏感性。在一些实施方案中,本文提供的方法和材料在检测两个或更多个类型的癌症时提供高敏感性。各种癌症类型中的任一种可以使用本文提供的方法和材料来检测(参见例如,标题为“癌症”的部分)。在一些实施方案中,可以使用本文提供的方法和材料检测的癌症包括胰腺癌。在一些实施方案中,可以使用本文提供的方法和材料检测的癌症包括肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌或乳腺癌。在一些实施方案中,可以使用本文提供的方法和材料检测的癌症包括女性生殖道的癌症(例如,宫颈癌、子宫内膜癌、卵巢癌或输卵管癌)。在一些实施方案中,可以使用本文提供的方法和材料检测的癌症包括膀胱癌或上尿路尿路上皮癌。
在一些实施方案中,本文提供的方法和材料在癌症的检测或诊断中提供高特异性(例如,当受试者没有癌症时,错误地鉴定所述受试者患有癌症的低频率或发生率)。在一些实施方案中,本文提供的方法和材料提供至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的特异性。如本领域普通技术人员将理解的,99%的特异性意指仅1%的没有癌症的受试者被错误地鉴定为患有癌症。在一些实施方案中,本文提供的方法和材料在检测单个癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述单个癌症类型的很低的概率)。在一些实施方案中,本文提供的方法和材料在检测两种或更多种癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述两种或更多种癌症类型的很低的概率)。
如本领域普通技术人员将理解的,可以基于各种因素来选择在癌症的检测或诊断中的适当的敏感性或特异性。作为一个非限制性实例,被设计成在癌症的检测或诊断中提供较低特异性的方法可以被设计成具有增加的敏感性。作为另一个非限制性实例,被设计成在癌症的检测或诊断中提供增加的特异性的方法可以被设计成具有较低的敏感性。在一些实施方案中,即使是低敏感性也可以是有利的(例如,在筛选正常未被筛选的群体时)。在一些实施方案中,在癌症(例如,特定类型的癌症)流行的群体中,即使以降低的特异性为代价,检测或诊断癌症的存在的方法也可以被设计成具有相对较高的敏感性。在一些实施方案中,本文提供的各种检测方法的敏感性和特异性是基于特定患者群体中疾病的患病率来确定的。例如,对于不知道患有癌症的一般患者群体的筛选测试可以被选择成具有高特异性(以便消除假阳性诊断和不必要的进一步诊断测试和/或监测)。作为另一个实例,对于高风险群体(例如,其中患有或发展癌症的风险高于总体一般群体的群体,例如由于所述群体从事或曾经从事风险行为、具有风险家族史的人、经历或经历过风险环境、等)的癌症筛选测试可以被选择成具有高敏感性(以便增加检测存在的癌症的确定性,甚至以额外的进一步诊断测试和/或监测为代价,这可能不适合一般群体)。作为一个非限制性实例,在患病率为0.01%的群体中,具有90%敏感性和95%特异性的测试将具有15%的阳性预测值(PPV)和>99%的阴性预测值(NPV),而如果患病率为40%(高风险群体),则两个预测值都可以大于99%。PPV可以如下进行计算:#真阳性(TP)/(#真阳性+#假阳性)。PPV也可以如下进行计算:(敏感性X患病率)/(敏感性X患病率)+((1-特异性)x(1-患病率))。NPV可以如下进行计算:#真阴性/#阴性识别数。PPV也可以如下进行计算:特异性X(1-患病率)/((1-敏感性)x患病率)+(特异性X(1-患病率)。参见例如,以引用的方式整体并入本文的Lalkhen和McCluskey,Clinical tests:sensitivity and specificity,Continuing Education inAnaesthesia,Critical Care&Pain,第8卷,2008。
检测方法
本文提供了用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)的存在和/或非整倍性的存在的方法和材料。在一些实施方案中,同时测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在一种测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在一些实施方案中,依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在两个或更多个不同的时间点进行的两种或更多种不同的测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在同时测试和依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在的一些实施方案中,所述测试可以对单个样品执行,或者可以对两个或更多个不同的样品(例如,从同一受试者获得的两个或更多个不同样品)执行。
本文所述的各种检测方法中的任一种(参见例如,标题为“遗传生物标记物的检测”,“蛋白质生物标记物的检测”和“非整倍性的检测”的部分)可以用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。在一些实施方案中,一个或多个类别的生物标记物的一个或多个成员和/或一个或多个类别的生物标记物与受试者中的疾病相关联。在一些实施方案中,非整倍性与受试者中的疾病相关联。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种类型的癌症中的任一种)。在一些实施方案中,所述一个或多个成员是一类遗传生物标记物的成员。在一些实施方案中,所述一个或多个成员是一类蛋白质生物标记物的成员。在一些实施方案中,包括在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在的方法还包括在从受试者获得的样品中检测非整倍性的存在。例如,包括在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。作为另一个实例,包括在从受试者获得的样品中检测一类蛋白质生物标记物的一个或多个成员的存在的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。在一些实施方案中,包括在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在以及检测一类蛋白质生物标记物的一个或多个成员的存在两者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或者两个或更多个不同样品)中检测非整倍性的存在。
在一些实施方案中,本文提供的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的一个或多个样品中检测非整倍性(例如,遗传生物标记物或蛋白质生物标记物)的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。
在一些实施方案中,可以测试从受试者获得的单个样品以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。替代地,可以从受试者获得两个或更多个样品,并且可以单独测试所述两个或更多个样品中的每一个,以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。作为一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,蛋白质生物标记物)中一个或多个成员的存在。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测一类生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测非整倍性的存在。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在并检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,同时可以测试从受试者获得的第二样品以检测非整倍性的存在。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传或蛋白质生物标记物)的一个或多个成员的存在并检测非整倍性的存在,同时可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,与在第一样品中测试的第一类别的生物标记物不同的一类生物标记物)的一个或多个成员的存在。
在一些实施方案中,从受试者获得的样品中一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,通过本文公开的各种方法中的任一种检测)与疾病相关联,并指示所述受试者患有所述疾病。在一些实施方案中,当在从受试者获得的样品中检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(所述生物标记物和/或非整倍性与疾病相关联)时,诊断受试者患有疾病。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种癌症中的任一种)。在一些实施方案中,在检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在之前,不知道受试者患有疾病(例如,癌症)。在一些实施方案中,在检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在之前,不知道受试者携带癌细胞。在一些实施方案中,在检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在之前,受试者未表现出与癌症相关联的症状。
诊断方法
本文还提供了通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在来诊断或鉴定受试者中疾病的存在(例如,鉴定受试者患有癌症)的方法和材料。在诊断或鉴定受试者中疾病的存在(例如,鉴定受试者患有癌症)的一些实施方案中,同时测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在一种测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在诊断或鉴定受试者中疾病的存在(例如,鉴定受试者患有癌症)的一些实施方案中,依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在两个或更多个不同的时间点进行的两种或更多种不同的测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在包括同时测试或依次测试(或两者)一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在的诊断或鉴定受试者中疾病的存在(例如,鉴定受试者患有癌症)的一些实施方案中,所述测试可以对单个样品执行,或者可以对两个或更多个不同的样品(例如,从同一受试者获得的两个或更多个不同样品)执行。
本文所述的各种检测方法中的任一种(参见例如,标题为“遗传生物标记物的检测”,“蛋白质生物标记物的检测”和“非整倍性的检测”的部分)可以用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。在一些实施方案中,一个或多个类别的生物标记物的一个或多个成员和/或一个或多个类别的生物标记物与受试者中的疾病相关联。在一些实施方案中,非整倍性与受试者中的疾病相关联。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种类型的癌症中的任一种)。在一些实施方案中,所述一个或多个成员是一类遗传生物标记物的成员。在一些实施方案中,所述一个或多个成员是一类蛋白质生物标记物的成员。在一些实施方案中,包括通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)的方法还包括在从受试者获得的样品中检测非整倍性的存在。例如,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。作为另一个实例,包括通过在从受试者获得的样品中检测一类蛋白质生物标记物的一个或多个成员的存在来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。在一些实施方案中,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在以及检测一类蛋白质生物标记物的一个或多个成员的存在两者来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或者两个或更多个不同样品)中检测非整倍性的存在。
在一些实施方案中,本文提供的方法包括通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)。在一些实施方案中,本文提供的方法包括通过在从受试者获得的一个或多个样品中检测非整倍性(例如,遗传生物标记物或蛋白质生物标记物)的存在来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)。在一些实施方案中,本文提供的方法包括通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)。在一些实施方案中,本文提供的方法包括通过在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)。在一些实施方案中,本文提供的方法包括通过在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在来诊断受试者中癌症的存在(例如,鉴定受试者患有癌症)。
在一些实施方案中,可以测试从受试者获得的单个样品以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断受试者患有癌症(例如,鉴定受试者患有癌症)。替代地,可以从受试者获得两个或更多个样品,并且可以单独测试两个或更多个样品中的每一个,以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断受试者患有癌症(例如,鉴定受试者患有癌症)。作为一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在和/或检测到第二类别的生物标记物的一个或多个成员的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到第二类别的生物标记物的一个或多个成员的存在时),诊断受试者患有癌症(例如,鉴定受试者患有癌症)。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测一类生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到所述类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断受试者患有癌症(例如,鉴定受试者患有癌症)。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在并且检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,同时可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断受试者患有癌症(例如,鉴定受试者患有癌症)。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在并且检测非整倍性的存在,同时可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,与在第一样品中测试的第一类别的生物标记物不同的一类生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断受试者患有癌症(例如,鉴定受试者患有癌症)。
在诊断或鉴定受试者中疾病(例如,癌症)的存在的一些实施方案中(例如,使用本文所述的各种方法中的任一种),受试者还被鉴定为进行进一步诊断测试的候选者。在诊断或鉴定受试者中疾病(例如,癌症)的存在的一些实施方案中(例如,使用本文所述的各种方法中的任一种),受试者还被鉴定为进行增加监测的候选者。在诊断或鉴定受试者中疾病(例如,癌症)的存在的一些实施方案中(例如,使用本文所述的各种方法中的任一种),受试者还被鉴定为将对或可能对治疗(例如,本文所述的各种治疗性干预中的任一种)有反应的候选者。在诊断或鉴定受试者中疾病(例如,癌症)的存在的一些实施方案中(例如,使用本文所述的各种方法中的任一种),还向受试者施用治疗(例如,本文所述的各种治疗性干预中的任一种)。
鉴定受试者具有患有或发展疾病的风险的方法
本文提供了通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)的存在和/或非整倍性的存在来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法和材料。在鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的一些实施方案中,同时测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在一种测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的一些实施方案中,依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在两个或更多个不同的时间点进行的两种或更多种不同的测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在包括同时测试或依次测试(或两者)一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在的鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的一些实施方案中,所述测试可以对单个样品执行,或者可以对两个或更多个不同的样品(例如,从同一受试者获得的两个或更多个不同样品)执行。
本文所述的各种检测方法中的任一种(参见例如,标题为“遗传生物标记物的检测”,“蛋白质生物标记物的检测”和“非整倍性的检测”的部分)可以用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。在一些实施方案中,一个或多个类别的生物标记物的一个或多个成员和/或一个或多个类别的生物标记物与受试者中的疾病相关联。在一些实施方案中,非整倍性与受试者中的疾病相关联。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种类型的癌症中的任一种)。在一些实施方案中,所述一个或多个成员是一类遗传生物标记物的成员。在一些实施方案中,所述一个或多个成员是一类蛋白质生物标记物的成员。在一些实施方案中,包括通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法还包括在从受试者获得的样品中检测非整倍性的存在。例如,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。作为另一个实例,包括通过在从受试者获得的样品中检测一类蛋白质生物标记物的一个或多个成员的存在来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。在一些实施方案中,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在以及检测一类蛋白质生物标记物的一个或多个成员的存在两者来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或者两个或更多个不同样品)中检测非整倍性的存在。
在一些实施方案中,本文提供的用于鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法包括在从受试者获得的一个或多个样品中检测非整倍性(例如,遗传生物标记物或蛋白质生物标记物)的存在。在一些实施方案中,本文提供的用于鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。在一些实施方案中,本文提供的用于鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。
在一些实施方案中,可以测试从受试者获得的单个样品以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)。替代地,可以从受试者获得两个或更多个样品,并且可以单独测试两个或更多个样品中的每一个,以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)。作为一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在和/或检测到第二类别的生物标记物的一个或多个成员的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到第二类别的生物标记物的一个或多个成员的存在时),鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测一类生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到所述类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在并且检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,同时可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在并且检测非整倍性的存在,同时可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,与在第一样品中测试的第一类别的生物标记物不同的一类生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)。
在鉴定受试者具有患有或发展疾病的风险(例如,增加的风险)(例如,使用本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为进行进一步诊断测试的候选者。在鉴定受试者具有患有或发展疾病的风险(例如,增加的风险)(例如,使用本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为进行增加监测的候选者。在鉴定受试者具有患有或发展疾病的风险(例如,增加的风险)(例如,使用本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为将对或可能对治疗(例如,本文所述的各种治疗性干预中的任一种,包括但不限于化学预防)有反应的候选者。在鉴定受试者具有患有或发展疾病的风险(例如,增加的风险)(例如,使用本文所述的各种方法中的任一种)的一些实施方案中,还向受试者施用治疗(例如,本文所述的各种治疗性干预中的任一种,包括但不限于化学预防)。
治疗方法
本文还提供了通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法和材料。在治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的一些实施方案中,同时测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在一种测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的一些实施方案中,依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在两个或更多个不同的时间点进行的两种或更多种不同的测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在包括同时测试或依次测试(或两者)一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在的治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的一些实施方案中,所述测试可以对单个样品执行,或者可以对两个或更多个不同的样品(例如,从同一受试者获得的两个或更多个不同样品)执行。
本文所述的各种检测方法中的任一种(参见例如,标题为“遗传生物标记物的检测”,“蛋白质生物标记物的检测”和“非整倍性的检测”的部分)可以用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。在一些实施方案中,一个或多个类别的生物标记物的一个或多个成员和/或一个或多个类别的生物标记物与受试者中的疾病相关联。在一些实施方案中,非整倍性与受试者中的疾病相关联。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种类型的癌症中的任一种)。在一些实施方案中,所述一个或多个成员是一类遗传生物标记物的成员。在一些实施方案中,所述一个或多个成员是一类蛋白质生物标记物的成员。在一些实施方案中,包括通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法还包括在从受试者获得的样品中检测非整倍性的存在。例如,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。作为另一个实例,包括通过在从受试者获得的样品中检测一类蛋白质生物标记物的一个或多个成员的存在来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。在一些实施方案中,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在以及检测一类蛋白质生物标记物的一个或多个成员的存在两者来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或者两个或更多个不同样品)中检测非整倍性的存在。
在一些实施方案中,本文提供的用于治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法包括在从受试者获得的一个或多个样品中检测非整倍性(例如,遗传生物标记物或蛋白质生物标记物)的存在。在一些实施方案中,本文提供的用于治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。在一些实施方案中,本文提供的用于治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。
在一些实施方案中,可以测试从受试者获得的单个样品以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以治疗受试者。替代地,可以从受试者获得两个或更多个样品,并且可以单独测试两个或更多个样品中的每一个,以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以治疗受试者。作为一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在和/或检测到第二类别的生物标记物的一个或多个成员的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到第二类别的生物标记物的一个或多个成员的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以治疗受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测一类生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到所述类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或治疗受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在并且检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,同时可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或治疗受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在并且检测非整倍性的存在,同时可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,与在第一样品中测试的第一类别的生物标记物不同的一类生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或治疗受试者。
在通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在来治疗已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者的一些实施方案中,所述治疗是本文公开的各种治疗性干预中的任一种,其包括但不限于化疗、新辅助化疗、放疗、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法(例如,嵌合抗原受体和/或具有野生型或修饰的T细胞受体的T细胞)、靶向疗法诸如施用激酶抑制剂(例如,靶向特定遗传病变(诸如易位或突变)的激酶抑制剂)、(例如,激酶抑制剂、抗体、双特异性抗体)、信号转导抑制剂、双特异性抗体或抗体片段(例如BiTE)、单克隆抗体、免疫检查点抑制剂、手术(例如,手术切除)或以上的任意组合。在其中疾病是癌症的一些实施方案中,治疗性干预降低了癌症的严重性、减轻了癌症的症状和/或减少了受试者体内存在的癌细胞的数量。
在治疗已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者(例如,通过本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为将对或可能对所述治疗有反应的受试者。在治疗已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者(例如,通过本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为进行进一步诊断测试的候选者(例如,在施用治疗之前和/或施用治疗之后,以确定所述治疗的效果和/或所述受试者是否是额外施用同一治疗或不同治疗的候选者)。在治疗已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者(例如,通过本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为进行增加监测的候选者(例如,在施用治疗之前和/或施用治疗之后,以确定所述治疗的效果和/或所述受试者是否是额外施用同一治疗或不同治疗的候选者)。
鉴定治疗的方法
本文还提供了通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法和材料。在鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的一些实施方案中,同时测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在一种测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的一些实施方案中,依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在两个或更多个不同的时间点进行的两种或更多种不同的测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在包括同时测试或依次测试(或两者)一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在的鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的一些实施方案中,所述测试可以对单个样品执行,或者可以对两个或更多个不同的样品(例如,从同一受试者获得的两个或更多个不同样品)执行。
本文所述的各种检测方法中的任一种(参见例如,标题为“遗传生物标记物的检测”,“蛋白质生物标记物的检测”和“非整倍性的检测”的部分)可以用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。在一些实施方案中,一个或多个类别的生物标记物的一个或多个成员和/或一个或多个类别的生物标记物与受试者中的疾病相关联。在一些实施方案中,非整倍性与受试者中的疾病相关联。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种类型的癌症中的任一种)。在一些实施方案中,所述一个或多个成员是一类遗传生物标记物的成员。在一些实施方案中,所述一个或多个成员是一类蛋白质生物标记物的成员。在一些实施方案中,包括通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法还包括在从受试者获得的样品中检测非整倍性的存在。例如,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。作为另一个实例,包括通过在从受试者获得的样品中检测一类蛋白质生物标记物的一个或多个成员的存在来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。在一些实施方案中,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在以及检测一类蛋白质生物标记物的一个或多个成员的存在两者来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或者两个或更多个不同样品)中检测非整倍性的存在。
在一些实施方案中,本文提供的用于鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法包括在从受试者获得的一个或多个样品中检测非整倍性(例如,遗传生物标记物或蛋白质生物标记物)的存在。在一些实施方案中,本文提供的用于鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。在一些实施方案中,本文提供的用于鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。
在一些实施方案中,可以测试从受试者获得的单个样品以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以鉴定对于受试者的治疗。替代地,可以从受试者获得两个或更多个样品,并且可以单独测试两个或更多个样品中的每一个,以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以鉴定对于受试者的治疗。作为一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在和/或检测到第二类别的生物标记物的一个或多个成员的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到第二类别的生物标记物的一个或多个成员的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定对于受试者的治疗。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测一类生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到所述类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定对于受试者的治疗。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在并且检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,同时可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定对于受试者的治疗。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在并且检测非整倍性的存在,同时可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,与在第一样品中测试的第一类别的生物标记物不同的一类生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定对于受试者的治疗。
在通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在来鉴定对于已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者的治疗的一些实施方案中,所述治疗是本文公开的各种治疗性干预中的任一种,其包括但不限于化疗、新辅助化疗、放疗、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法(例如,嵌合抗原受体和/或具有野生型或修饰的T细胞受体的T细胞)、靶向疗法诸如施用激酶抑制剂(例如,靶向特定遗传病变(诸如易位或突变)的激酶抑制剂)、(例如,激酶抑制剂、抗体、双特异性抗体)、信号转导抑制剂、双特异性抗体或抗体片段(例如BiTE)、单克隆抗体、免疫检查点抑制剂、手术(例如,手术切除)或以上的任意组合。在其中疾病是癌症的一些实施方案中,鉴定的治疗性干预降低了癌症的严重性、减轻了癌症的症状和/或减少了受试者体内存在的癌细胞的数量。
在鉴定对于已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者的治疗(例如,通过本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为将对或可能对所述治疗有反应的受试者。在鉴定对于已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者的治疗(例如,通过本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为进行进一步诊断测试的候选者。在鉴定对于已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者的治疗(例如,通过本文所述的各种方法中的任一种)的一些实施方案中,受试者还被鉴定为进行增加监测的候选者。在鉴定对于已被诊断或鉴定为患有疾病或已被鉴定为具有患有或发展疾病的风险(例如,增加的风险)的受试者的治疗(例如,通过本文所述的各种方法中的任一种)的一些实施方案中,还向受试者施用治疗(例如,本文所述的各种治疗性干预中的任一种)。
鉴定将对或可能对治疗有反应的受试者
本文还提供了通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在来鉴定将对或可能对治疗有反应的受试者的方法和材料。在鉴定将对或可能对治疗有反应的受试者的一些实施方案中,同时测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在一种测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在鉴定将对或可能对治疗有反应的受试者的一些实施方案中,依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在两个或更多个不同的时间点进行的两种或更多种不同的测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在包括同时测试或依次测试(或两者)一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在的鉴定将对或可能对治疗有反应的受试者的一些实施方案中,所述测试可以对单个样品执行,或者可以对两个或更多个不同的样品(例如,从同一受试者获得的两个或更多个不同样品)执行。
本文所述的各种检测方法中的任一种(参见例如,标题为“遗传生物标记物的检测”,“蛋白质生物标记物的检测”和“非整倍性的检测”的部分)可以用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。在一些实施方案中,一个或多个类别的生物标记物的一个或多个成员和/或一个或多个类别的生物标记物与受试者中的疾病相关联。在一些实施方案中,非整倍性与受试者中的疾病相关联。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种类型的癌症中的任一种)。在一些实施方案中,所述一个或多个成员是一类遗传生物标记物的成员。在一些实施方案中,所述一个或多个成员是一类蛋白质生物标记物的成员。在一些实施方案中,包括通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在来鉴定将对或可能对治疗有反应的受试者的方法还包括在从受试者获得的样品中检测非整倍性的存在。例如,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在来鉴定将对或可能对治疗有反应的受试者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。作为另一个实例,包括通过在从受试者获得的样品中检测一类蛋白质生物标记物的一个或多个成员的存在来鉴定将对或可能对治疗有反应的受试者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。在一些实施方案中,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在以及检测一类蛋白质生物标记物的一个或多个成员的存在两者来鉴定将对或可能对治疗有反应的受试者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或者两个或更多个不同样品)中检测非整倍性的存在。
在一些实施方案中,本文提供的用于鉴定将对或可能对治疗有反应的受试者的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定将对或可能对治疗有反应的受试者的方法包括在从受试者获得的一个或多个样品中检测非整倍性(例如,遗传生物标记物或蛋白质生物标记物)的存在。在一些实施方案中,本文提供的用于鉴定将对或可能对治疗有反应的受试者的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。在一些实施方案中,本文提供的用于鉴定将对或可能对治疗有反应的受试者的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定将对或可能对治疗有反应的受试者的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。
在一些实施方案中,可以测试从受试者获得的单个样品以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以鉴定受试者为将对或可能对治疗有反应的受试者。替代地,可以从受试者获得两个或更多个样品,并且可以单独测试两个或更多个样品中的每一个,以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以鉴定受试者为将对或可能对治疗有反应的受试者。作为一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在和/或检测到第二类别的生物标记物的一个或多个成员的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到第二类别的生物标记物的一个或多个成员的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为将对或可能对治疗有反应的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测一类生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到所述类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为将对或可能对治疗有反应的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在并且检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,同时可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为将对或可能对治疗有反应的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在并且检测非整倍性的存在,同时可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,与在第一样品中测试的第一类别的生物标记物不同的一类生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为将对或可能对治疗有反应的受试者。
在通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在来鉴定将对或可能对治疗有反应的受试者的一些实施方案中,所述受试者被鉴定为将对或可能对治疗有反应的受试者,所述治疗是本文公开的各种治疗性干预中的任一种,其包括但不限于化疗、新辅助化疗、放疗、激素疗法、细胞毒性疗法、免疫疗法、过继性T细胞疗法(例如,嵌合抗原受体和/或具有野生型或修饰的T细胞受体的T细胞)、靶向疗法诸如施用激酶抑制剂(例如,靶向特定遗传病变(诸如易位或突变)的激酶抑制剂)、(例如,激酶抑制剂、抗体、双特异性抗体)、信号转导抑制剂、双特异性抗体或抗体片段(例如BiTE)、单克隆抗体、免疫检查点抑制剂、手术(例如,手术切除)或以上的任意组合。在其中疾病是癌症的一些实施方案中,被鉴定为将对或可能对所鉴定的治疗性干预有反应的受试者的受试者被鉴定为其中治疗性干预将或可能降低癌症的严重性、减轻癌症的症状和/或减少受试者体内存在的癌细胞的数量的受试者。
在一些实施方案中,被鉴定为将对或可能对治疗有反应的受试者的受试者(例如,使用本文所述的各种方法中的任一种)还被鉴定进行进一步诊断测试。在一些实施方案中,被鉴定为将对或可能对治疗有反应的受试者的受试者(例如,使用本文所述的各种方法中的任一种)还被鉴定进行增加监测。另外或替代地,还向被鉴定为将对或可能对治疗有反应的受试者的受试者(例如,使用本文所述的各种方法中的任一种)施用治疗(例如,本文所述的各种治疗性干预中的任一种)。
鉴定受试者为进行进一步诊断测试的候选者的方法
本文还提供了通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在鉴定受试者为进行进一步诊断测试的候选者的方法和材料。在鉴定受试者为进行进一步诊断测试的候选者的一些实施方案中,同时测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在一种测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在鉴定受试者为进行进一步诊断测试的候选者的一些实施方案中,依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在两个或更多个不同的时间点进行的两种或更多种不同的测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在包括同时测试或依次测试(或两者)一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在的鉴定受试者为进行进一步诊断测试的候选者的一些实施方案中,所述测试可以对单个样品执行,或者可以对两个或更多个不同的样品(例如,从同一受试者获得的两个或更多个不同样品)执行。
本文所述的各种检测方法中的任一种(参见例如,标题为“遗传生物标记物的检测”,“蛋白质生物标记物的检测”和“非整倍性的检测”的部分)可以用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。在一些实施方案中,一个或多个类别的生物标记物的一个或多个成员和/或一个或多个类别的生物标记物与受试者中的疾病相关联。在一些实施方案中,非整倍性与受试者中的疾病相关联。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种类型的癌症中的任一种)。在一些实施方案中,所述一个或多个成员是一类遗传生物标记物的成员。在一些实施方案中,所述一个或多个成员是一类蛋白质生物标记物的成员。在一些实施方案中,包括通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在来鉴定受试者为进行进一步诊断测试的候选者的方法还包括在从受试者获得的样品中检测非整倍性的存在。例如,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在来鉴定受试者为进行进一步诊断测试的候选者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。作为另一个实例,包括通过在从受试者获得的样品中检测一类蛋白质生物标记物的一个或多个成员的存在来鉴定受试者为进行进一步诊断测试的候选者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。在一些实施方案中,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在以及检测一类蛋白质生物标记物的一个或多个成员的存在两者来鉴定受试者为进行进一步诊断测试的候选者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或者两个或更多个不同样品)中检测非整倍性的存在。
在一些实施方案中,本文提供的用于鉴定受试者为进行进一步诊断测试的候选者的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定受试者为进行进一步诊断测试的候选者的方法包括在从受试者获得的一个或多个样品中检测非整倍性(例如,遗传生物标记物或蛋白质生物标记物)的存在。在一些实施方案中,本文提供的用于鉴定受试者为进行进一步诊断测试的候选者的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。在一些实施方案中,本文提供的用于鉴定受试者为进行进一步诊断测试的候选者的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定受试者为进行进一步诊断测试的候选者的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。
在一些实施方案中,可以测试从受试者获得的单个样品以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者患有疾病(例如,癌症)或处于患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以鉴定受试者为进行进一步诊断测试的候选者的受试者。替代地,可以从受试者获得两个或更多个样品,并且可以单独测试两个或更多个样品中的每一个,以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以鉴定受试者为进行进一步诊断测试的候选者的受试者。作为一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在和/或检测到第二类别的生物标记物的一个或多个成员的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到第二类别的生物标记物的一个或多个成员的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为进行进一步诊断测试的候选者的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测一类生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到所述类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为进行进一步诊断测试的候选者的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在并且检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,同时可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为进行进一步诊断测试的候选者的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在并且检测非整倍性的存在,同时可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,与在第一样品中测试的第一类别的生物标记物不同的一类生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为进行进一步诊断测试的候选者的受试者。
在通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在来鉴定受试者为进行进一步诊断测试的候选者的一些实施方案中,所述受试者进行本文公开的各种类型的进一步诊断测试中的任一种,其包括但不限于扫描(例如,计算机断层成像(CT)、CT血管造影(CTA)、钡餐造影(钡吞咽)、钡灌肠、磁共振成像(MRI)、PET扫描、正电子发射断层成像和计算机断层成像(PET-CT)扫描、超声(例如,支气管内超声、内镜超声)、X射线或DEXA扫描)或体格检查(例如肛门镜检查、支气管镜检查(例如,自发荧光支气管镜检查、白光支气管镜检查、导航支气管镜检查)、结肠镜检查、数字乳腺断层合成术、内窥镜逆行胰胆管造影(ERCP)、上消化道内视镜、乳房摄影术、巴氏涂片或盆腔检查)。
在一些实施方案中,鉴定为进行进一步诊断测试的候选者的受试者(例如,使用本文所述的各种方法中的任一种)还被鉴定为进行增加监测的候选者。另外或替代地,鉴定为进行进一步诊断测试的候选者的受试者(例如,使用本文所述的各种方法中的任一种)还被鉴定为将对或可能对治疗有反应的受试者。另外或替代地,还向被鉴定为进行进一步诊断测试的候选者的受试者(例如,使用本文所述的各种方法中的任一种)施用治疗(例如,本文所述的各种治疗性干预中的任一种)。
鉴定受试者为进行增加监测的候选人的方法
本文还提供了通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个成员)和/或非整倍性的存在鉴定受试者为进行增加监测的候选者的方法和材料。在鉴定受试者为进行增加监测的候选者的一些实施方案中,同时测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在一种测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在鉴定受试者为进行增加监测的候选者的一些实施方案中,依次测试一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在(例如,在两个或更多个不同的时间点进行的两种或更多种不同的测试程序中,包括其中测试程序本身可能包括多种离散测试方法或系统的实施方案)。在包括同时测试或依次测试(或两者)一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在的鉴定受试者为进行增加监测的候选者的一些实施方案中,所述测试可以对单个样品执行,或者可以对两个或更多个不同的样品(例如,从同一受试者获得的两个或更多个不同样品)执行。
本文所述的各种检测方法中的任一种(参见例如,标题为“遗传生物标记物的检测”,“蛋白质生物标记物的检测”和“非整倍性的检测”的部分)可以用于在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在。在一些实施方案中,一个或多个类别的生物标记物的一个或多个成员和/或一个或多个类别的生物标记物与受试者中的疾病相关联。在一些实施方案中,非整倍性与受试者中的疾病相关联。在一些实施方案中,所述疾病是癌症(例如,本文所述的各种类型的癌症中的任一种)。在一些实施方案中,所述一个或多个成员是一类遗传生物标记物的成员。在一些实施方案中,所述一个或多个成员是一类蛋白质生物标记物的成员。在一些实施方案中,包括通过在从受试者获得的样品中检测一个或多个类别的生物标记物的一个或多个成员的存在来鉴定受试者为进行增加监测的候选者的方法还包括在从受试者获得的样品中检测非整倍性的存在。例如,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在来鉴定受试者为进行增加监测的候选者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。作为另一个实例,包括通过在从受试者获得的样品中检测一类蛋白质生物标记物的一个或多个成员的存在来鉴定受试者为进行增加监测的候选者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或两个不同样品)中检测非整倍性的存在。在一些实施方案中,包括通过在从受试者获得的样品中检测一类遗传生物标记物的一个或多个成员的存在以及检测一类蛋白质生物标记物的一个或多个成员的存在两者来鉴定受试者为进行增加监测的候选者的方法还可以包括在从受试者获得的样品(例如,来自受试者的同一样品或者两个或更多个不同样品)中检测非整倍性的存在。
在一些实施方案中,本文提供的用于鉴定受试者为进行增加监测的候选者的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定受试者为进行增加监测的候选者的方法包括在从受试者获得的一个或多个样品中检测非整倍性(例如,遗传生物标记物或蛋白质生物标记物)的存在。在一些实施方案中,本文提供的用于鉴定受试者为进行增加监测的候选者的方法包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。在一些实施方案中,本文提供的用于鉴定受试者为进行增加监测的候选者的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在。在一些实施方案中,本文提供的用于鉴定受试者为进行增加监测的候选者的方法包括在从受试者获得的一个或多个样品中检测两个或更多个类别的生物标记物(例如,遗传生物标记物和蛋白质生物标记物)的一个或多个成员的存在以及在从受试者获得的一个或多个样品中检测非整倍性的存在。
在一些实施方案中,可以测试从受试者获得的单个样品以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以鉴定受试者为进行增加监测的候选者的受试者。替代地,可以从受试者获得两个或更多个样品,并且可以单独测试两个或更多个样品中的每一个,以检测一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在,并且当检测到一个或多个类别的生物标记物的一个或多个成员的存在和/或非整倍性的存在时,可以诊断或鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或可以鉴定受试者为进行增加监测的候选者的受试者。作为一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在和/或检测到第二类别的生物标记物的一个或多个成员的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到第二类别的生物标记物的一个或多个成员的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为进行增加监测的候选者的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测一类生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在,并且可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到所述类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到所述类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为进行增加监测的候选者的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物)的一个或多个成员的存在并且检测第二类别的生物标记物(例如,蛋白质生物标记物)的一个或多个成员的存在,同时可以测试从受试者获得的第二样品以检测非整倍性的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为进行增加监测的候选者的受试者。作为另一个非限制性实例,可以测试从受试者获得的第一样品以检测第一类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在并且检测非整倍性的存在,同时可以测试从受试者获得的第二样品以检测第二类别的生物标记物(例如,与在第一样品中测试的第一类别的生物标记物不同的一类生物标记物)的一个或多个成员的存在,其中当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在和/或检测到非整倍性的存在时(例如,当检测到第一类别的生物标记物的一个或多个成员的存在、检测到第二类别的生物标记物的一个或多个成员的存在并且检测到非整倍性的存在时),诊断或鉴定受试者患有疾病(例如,癌症)或具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)和/或鉴定受试者为进行增加监测的候选者的受试者。
在一些实施方案中,鉴定为进行增加监测的候选者的受试者(例如,使用本文所述的各种方法中的任一种)还被鉴定为进行进一步诊断测试的候选者。另外或替代地,鉴定为进行增加监测的候选者的受试者(例如,使用本文所述的各种方法中的任一种)还被鉴定为将对或可能对治疗有反应的受试者。另外或替代地,还向被鉴定为进行增加监测的候选者的受试者(例如,使用本文所述的各种方法中的任一种)施用治疗(例如,本文所述的各种治疗性干预中的任一种)。
遗传生物标记物与蛋白质生物标记物的组合
一方面,本文提供了用于在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在来诊断或鉴定受试者中疾病的存在(例如,鉴定受试者患有癌症)的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在来鉴定将对或可能对治疗有反应的受试者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在来鉴定受试者为进行进一步诊断测试的候选者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在来鉴定受试者为进行增加监测的候选者的方法和材料。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法在癌症的检测或诊断中提供高敏感性(例如,正确鉴定受试者患有癌症的高频率或发生率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法在癌症的检测或诊断中提供的敏感性(例如,正确鉴定受试者患有癌症的高频率或发生率)高于通过分别检测遗传生物标记物组套的一个或多个成员的存在或蛋白质生物标记物组套的一个或多个成员的存在而提供的敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料提供至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料在检测单个类型的癌症时提供高敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料在检测两个或更多个类型的癌症时提供高敏感性。各种癌症类型中的任一种可以使用本文提供的方法和材料来检测(参见例如,标题为“癌症”的部分)。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料检测的癌症包括胰腺癌。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料检测的癌症包括肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌或乳腺癌。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料检测的癌症包括女性生殖道的癌症(例如,宫颈癌、子宫内膜癌、卵巢癌或输卵管癌)。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料检测的癌症包括膀胱癌或上尿路尿路上皮癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法在癌症的检测或诊断中提供高特异性(例如,当受试者没有癌症时,错误地鉴定所述受试者患有癌症的低频率或发生率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法在癌症的检测或诊断中提供的特异性(例如,正确鉴定受试者患有癌症的高频率或发生率)高于通过分别检测遗传生物标记物组套的一个或多个成员的存在或蛋白质生物标记物组套的一个或多个成员的存在而提供的特异性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料提供至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的特异性。如本领域普通技术人员将理解的,99%的特异性意指仅1%的没有癌症的受试者被错误地鉴定为患有癌症。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料在检测单个癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述单个癌症类型的很低的概率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法和材料在检测两种或更多种癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述两种或更多种癌症类型的很低的概率)。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和髓过氧化物酶(MPO)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3或4个)以下基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和/或SMAD4,以及2)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和SMAD4,以及2)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3或4个)以下基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和/或SMAD4,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF和OPN。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和SMAD4,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF和OPN。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3或4个)以下基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和/或SMAD4,以及2)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN,受试者被确定为患有(例如,被诊断为患有)胰腺癌或被确定为(例如,被诊断为)具有升高的患有或发展胰腺癌的风险。
从受试者获得的样品可以是本文所述的包含无细胞DNA(例如,ctDNA)和/或蛋白质的各种样品中的任一种。在一些实施方案中,从受试者获得的样品中的无细胞DNA(例如,ctDNA)和/或蛋白质来源于肿瘤细胞。在一些实施方案中,从受试者获得的样品中的无细胞DNA(例如,ctDNA)包括一个或多个遗传生物标记物。在一些实施方案中,从受试者获得的样品中的蛋白质包括一个或多个蛋白质生物标记物。其中可以检测到遗传生物标记物和/或蛋白质生物标记物的样品的非限制性实例包括血液、血浆和血清。在一些实施方案中,在从受试者获得的单个样品中检测一个或多个遗传生物标记物的存在和一个或多个蛋白质生物标记物的存在。在一些实施方案中,在从受试者获得的第一样品中检测一个或多个遗传生物标记物的存在,并且在从受试者获得的第二样品中检测一个或多个蛋白质生物标记物的存在。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在(例如,遗传生物标记物组套的每个成员)和蛋白质生物标记物组套的一个或多个成员的存在(例如,蛋白质生物标记物组套的每个成员)的方法,可以检测到所述蛋白质生物标记物组套的一个或多个成员的升高水平。例如,蛋白质生物标记物的升高水平可以是高于参考水平的水平。参考水平可以是与癌症的存在无关的蛋白质生物标记物的任何水平。例如,蛋白质生物标记物的参考水平可以是在没有癌症或不携带癌细胞的参考受试者中存在的水平。蛋白质生物标记物的参考水平可以是在没有癌症或不携带癌细胞的多个参考受试者中存在的平均水平。被确定患有癌症的受试者中的蛋白质生物标记物的参考水平可以是癌症发作之前受试者中存在的水平。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以升高水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7个或每一个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以升高水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7、8、9或10个或每一个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以升高水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7、8个或每一个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以升高水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3个或每一个):CA19-9、CEA、HGF和/或OPN。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在(例如,遗传生物标记物组套的每个成员)和蛋白质生物标记物组套的一个或多个成员的存在(例如,蛋白质生物标记物组套的每个成员)的方法,可以检测到所述蛋白质生物标记物组套的一个或多个成员的降低水平。例如,蛋白质生物标记物的降低水平可以是低于参考水平的水平。参考水平可以是与癌症的存在无关的蛋白质生物标记物的任何水平。例如,蛋白质生物标记物的参考水平可以是在没有癌症或不携带癌细胞的参考受试者中存在的水平。蛋白质生物标记物的参考水平可以是在没有癌症或不携带癌细胞的多个参考受试者中存在的平均水平。被确定患有癌症的受试者中的蛋白质生物标记物的参考水平可以是癌症发作之前受试者中存在的水平。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以降低水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7个或每一个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以降低水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7、8、9或10个或每一个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以降低水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7、8个或每一个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以降低水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3个或每一个):CA19-9、CEA、HGF和/或OPN。
在一些实施方案中,当受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险(例如,通过检测:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)在本文中描述为可与该遗传生物标记物组套一起使用的任一组套中一个或多个蛋白质生物标记物的存在)时,所述受试者被选择作为进一步诊断测试(例如,本文所述的各种进一步诊断测试方法中的任一种)的候选者(例如,被选择用于进一步诊断测试),所述受试者被选择作为增加监测(例如,本文所述的各种增加监测方法中的任一种)的候选者(例如,被选择用于增加监测),所述受试者被鉴定为将对或可能对治疗有反应的受试者(例如,本文所述的各种治疗性干预中的任一种),所述受试者被选择为治疗的候选者(例如,被选择用于治疗),选择对于所述受试者的治疗(例如,本文所述的各种治疗性干预中的任一种),和/或向受试者施用治疗(例如,本文所述的各种治疗性干预中的任一种)。例如,当受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险时,受试者可以经历进一步诊断测试,所述进一步诊断测试可以确认受试者中癌症的存在。另外或替代地,可以增加的频率来监测受试者。在受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险的一些实施方案中,其中所述受试者经历进一步诊断测试和/或增加监测,可以向所述受试者额外施用治疗性干预。在一些实施方案中,在向受试者施用治疗性干预之后,所述受试者经历额外的进一步诊断测试(例如,与先前进行的相同类型的进一步诊断测试和/或不同类型的进一步诊断测试)和/或继续增加监测(例如,以与先前相同或不同的频率进行的增加监测)。在实施方案中,在向受试者施用治疗性干预并且所述受试者经历额外的进一步诊断测试和/或额外的增加监测之后,向所述受试者施用另一种治疗性干预(例如,与先前施用的相同的治疗性干预和/或不同的治疗性干预)。在一些实施方案中,在向受试者施用治疗性干预后,测试受试者中一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)在本文中描述为可与该遗传生物标记物组套一起使用的任一组套中一个或多个蛋白质生物标记物的存在。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品,或不同的样品)中检测非整倍性的存在。可以检测任何染色体或其部分(例如,染色体的臂)中非整倍性的存在。在包括检测遗传生物标记物、蛋白质生物标记物和非整倍性的存在的方法的一些实施方案中,检测染色体臂5q、8q和9p中的一个或多个上非整倍性的存在。在包括检测遗传生物标记物、蛋白质生物标记物和非整倍性的存在的方法的一些实施方案中,检测染色体臂4p、7q、8q和9q中的一个或多个上非整倍性的存在。
在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和髓过氧化物酶(MPO),所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),以及3)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,以及3)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS,以及2)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,2)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,以及3)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3或4个)以下基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和/或SMAD4,以及2)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和SMAD4,以及2)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3或4个)以下基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和/或SMAD4,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF和OPN,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和SMAD4,以及2)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF和OPN,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在以及蛋白质生物标记物组套的一个或多个成员的存在一者或两者的同一样品或不同样品)中检测非整倍性的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3或4个)以下基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和/或SMAD4,以及2)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN,受试者被确定为患有(例如,被诊断为患有)胰腺癌或被确定为(例如,被诊断为)具有升高的患有或发展胰腺癌的风险。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的各种方法中的任一种还包括检测一个或多个额外类别的生物标记物的一个或多个成员的存在。此类额外类别的生物标记物的非限制性实例包括:拷贝数变化、DNA甲基化变化、其他核酸(例如,mRNA、miRNA、lncRNA、circRNA、mtDNA、端粒DNA、易位和基因组重排)、肽和/或代谢物。
在一些实施方案中,一个或多个额外类别的生物标记物包括代谢物生物标记物。在一些实施方案中,如果生物样品含有一种或多种指示癌症的代谢物,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的代谢物,则受试者被确定为患有癌症。指示癌症的代谢物的非限制性实例包括:5-甲基硫代腺苷(MTA)、还原型谷胱甘肽(GSH)、N-乙酰谷氨酸盐、乳糖、N-乙酰神经氨酸盐、UDP-乙酰氨基葡萄糖、UDP-乙酰半乳糖胺、UDP-葡糖醛酸盐、泛酸盐、花生四烯酸盐(20:4n6)、胆碱、胞苷5′-二磷酸胆碱、二高亚麻酸盐(20:3n3)、二十二碳五烯酸盐(DPA 22:5n3)、二十碳五烯酸盐(EPA 20:5n3)、甘油磷酰胆碱(GPC)、二十二碳六烯酸盐(DHA 22:6n3)、亚油酸盐(18:2n6)、5′-单磷酸胞苷(5′-CMP)、γ-谷氨酰谷氨酸盐、X-14577、X-11583、异戊酰肉碱、磷酸肌酸、2-氨基己二酸、葡萄糖酸、O-乙酰肉碱、天冬氨酸、脱酰胺基-NAD+、谷氨酸、异丁酰肉碱、肉碱、吡哆醛、柠檬酸、腺苷、ATP、缬氨酸、XC0061、异亮氨酸、γ-丁酰甜菜碱(γ-Butyrobetaine)、乳酸、丙氨酸、苯丙氨酸、葡糖酸内酯、亮氨酸、二价谷胱甘肽(GSSG)、酪氨酸、NAD+、XC0016、UTP、肌酸、可可碱、CTP、GTP、3-甲基组氨酸、琥珀酸、3-磷酸甘油、谷氨酰胺、5-氧脯氨酸、硫胺素、丁酰肉碱、4-乙酰胺基丁酸、UDP-葡萄糖、UDP-半乳糖、苏氨酸、N-乙酰甘氨酸、脯氨酸、ADP、胆碱、苹果酸、S-腺苷甲硫氨酸、泛酸、半胱氨酸亚磺酸、6-氨基己酸、高半胱氨酸、羟脯氨酸、甲硫氨酸亚砜、3-胍基丙酸、6-磷酸葡萄糖、苯乙尿酸、苏糖酸、色氨酸、吡哆醇、N-乙酰天冬氨酸、4-胍基丁酸、丝氨酸、瓜氨酸、甜菜碱、N-乙酰天冬酰胺、2-羟基戊二酸、精氨酸、谷胱甘肽(GSH)、肌酐、磷酸二羟丙酮、组氨酸、甘氨酸、1-磷酸葡萄糖、N-甲酰基甘氨酸、酮洛芬、赖氨酸、β-丙氨酸、N-乙酰谷氨酸、2-氨基-2-(羟甲基)-1,3-丙二醇、鸟氨酸、磷酸胆碱、甘油磷酸胆碱、对苯二甲酸、3-磷酸甘油醛、Gly-Asp、牛磺酸、1,6-二磷酸果糖、3-氨基异丁酸、亚精胺、GABA、三乙醇胺、甘油、N-乙酰丝氨酸、N-乙酰鸟氨酸、二乙醇胺、AMP、半胱氨酸谷胱甘肽二硫化物、二价硫酸链霉素+H2O、反式谷氨酸、烟酸、异丁胺、甜菜碱醛+H2O、尿刊酸、1-氨基环丙烷-1-羧酸高丝氨酸内酯、5-氨基戊酸、3-羟基丁酸、乙醇胺、异戊酸、N-甲基谷氨酸、胱硫醚、精胺、肌肽、1-甲基烟酰胺、N-乙酰神经氨酸、肌氨酸、GDP、N-甲基丙氨酸、棕榈酸、1,2-二油酰基-sn-甘油-3-磷酸-rac-甘油胆固醇5α,6α环氧羊毛甾醇、木蜡酸、1油酰基_rac_GL、胆固醇_环氧化物、芥酸、T-LCA、油酰基-L-肉碱、齐墩果酸、3-磷酸甘油酸盐、5-羟基正缬氨酸、5-甲氧基色胺、5-单磷酸腺苷、α-酮戊二酸盐、天冬酰胺、苯甲酸、次黄嘌呤、麦芽糖、麦芽三糖、甲硫氨酸亚砜、降烟碱、苯酚、磷酸乙醇胺、焦磷酸盐、丙酮酸、奎尼酸、牛磺酸、尿酸、肌苷、乳酰胺、5-羟基正缬氨酸NIST、胆固醇、脱氧戊糖醇、2-羟基雌酮、2-羟基雌二醇、2-甲基雌酮、2-甲氧基雌二醇、2-羟基雌酮-3-甲基醚、4-羟基雌酮、4-甲氧基雌酮、4-甲氧基雌二醇、16α-羟基雌酮、17-表雌三醇、雌三醇、16-酮雌二醇、16-表雌三醇、酰基肉碱C18:1、氨基酸瓜氨酸和反式4-羟基脯氨酸、甘油磷脂PC aa C28:1、PC ae C30:0和PC ae C30:2以及鞘脂SM(OH)C14:1。参见例如,Halama等人,Nesting of colon and ovarian cancer cells in the endothelial niche isassociated with alterations in glycan and lipid metabolism,Scientific Reports第7卷,论文编号:39999(2017);Hur等人,Systems approach to characterize themetabolism of liver cancer stem cells expressing CD133,Sci Rep.,7:45557,doi:10.1038/srep45557,(2017);Eliassen等人,Urinary Estrogens and EstrogenMetabolites and Subsequent Risk of Breast Cancer among Premenopausal Women,Cancer Res;72(3);696-706(2011);Gangi等人,Metabolomic profile in pancreaticcancer patients:a consensus-based approach to identify highly discriminatingmetabolites,Oncotarget,2月2日;7(5):5815-5829(2016);Kumar等人,Serum and PlasmaMetabolomic Biomarkers for Lung Cancer,Bioinformation,13(6):202-208,doi:10.6026/97320630013202(2017);Schmidt等人,Pre-diagnostic metaboliteconcentrations and prostate cancer risk in 1077 cases and 1077 matchedcontrols in the European Prospective Investigation into Cancer and Nutrition,BMC Med.,15:122,doi:10.1186/s12916-017-0885-6(2017);其中的每个以引用的方式整体并入本文。
在一些实施方案中,一个或多个额外类别的生物标记物包括肽(例如,与本文所述的可用于一种或多种方法的各个蛋白质生物标记物不同的肽)。在一些实施方案中,如果生物样品含有一种或多种指示癌症的肽,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的肽,则受试者被确定为患有癌症。在一些实施方案中,肽来源于蛋白质(例如,所述肽包含存在于蛋白质生物标记物或不同蛋白质中的氨基酸序列)。指示癌症的肽的非限制性实例包括以下肽和来源于以下蛋白质的肽:CEACAM、CYFRA21-1、CA125、PKLK、ProGRP、NSE、TPA 6、TPA 7、TPA 8、NRG、NRG100、CNDP、APOB100、SCC、VEGF、EGFR、PIK3CA、HER2、BRAF、ROS、RET、NRAS、MET、MEK1、HER2、C4.4A、PSF3、FAM83B、ECD、CTNNB、VIM、S100A4、S100A7、COX2、MUC1、KLKB1、SAA、HP-β链、C9、Pgrmc1、Ciz1、转铁蛋白、α-1抗胰蛋白酶、载脂蛋白1、补体c3a、窖蛋白-1(Caveolin-1)、激肽释放酶6(Kallikrein 6)、葡萄糖调节蛋白-8、α防御素-1、-2、-3、血清C-肽、α-2-HS乙二醇蛋白、胰蛋白酶KRT 8肽、血浆乙二醇蛋白、连环蛋白、防御素α6、MMP、细胞周期蛋白D(Cyclin D)、S100 P、核纤层蛋白A/C(Lamin A/C)丝蛋白、热休克蛋白、醛脱氢酶、Txl-2(硫氧还蛋白样蛋白-2)、P53、nm23、u-PA、VEGF、Eph B4、CRABP2、WT-1、Rab-3D、间皮素、ERα、ANXA4、PSAT1、SPB5、CEA5、CEA6、A1AT、SLPI、APOA4、VDBP、HE4、IL-1、IL-6、IL-7、IL-8、IL-10、IL-11、IL-12、IL-16、IL-18、IL-21、IL-23、IL-28A、IL-33、LIF、TNFR1-2、HVEM(TNFRSF14)、IL1R-a、IL1R-b、IL-2R、M-CSF、MIP-1a、TNF-α、CD40、RANTES、CD40L、MIF、IFN-β、MCP-4(CCL13)、MIG(CXCL9)、MIP-1δ(CCL15)、MIP3a(CCL20)、MIP-4(CCL18)、MPIF-1、SDF-1a+b(CXCL12)、CD137/4-1BB、淋巴细胞趋化因子(lymphotactin)(XCL1)、嗜酸性粒细胞趋化因子-1(eotaxin-1)(CCL11)、嗜酸性粒细胞趋化因子-2(CCL24)、6Ckine/CCL21)、BLC(CXCL13)、CTACK(CCL27)、BCA-1(CXCL13)、HCC4(CCL16)、CTAP-3(CXCL7)、IGF1、VEGF、VEGFR3、EGFR、ErbB2、CTGF、PDGF AA、PDGF BB、PDGFRb、bFGF、TGFbRIII、β-细胞素、IGFBP1-4、IGFBP1-6、BDNF、PEDF、血管生成素-2、肾素、溶血磷脂酸、β2-微球蛋白、唾液酸TN(sialylTN)、ACE、CA 19-9、CEA、CA 15-3、CA-50、CA 72-4、OVX1、间皮素、唾液酸TN、MMP-2、-3、-7、-9、VAP-1、TIMP1-2、肌腱蛋白C(tenascin C)、VCAM-1、骨桥蛋白、KIM-1、NCAM、四连接素(tetranectin)、巢蛋白-2(nidogen-2)、组织蛋白酶L、前列腺蛋白(prostasin)、蛋白裂解酶(matriptase)、激肽释放酶2、6、10、胱抑素C、紧密连接蛋白(claudin)、脊椎蛋白2(spondin2)、SLPI、bHCG、尿促性腺激素肽、抑制素、瘦素、脂联素、GH、TSH、ACTH、PRL、FSH、LH、皮质醇、TTR、骨钙素、胰岛素、饥饿素(ghrelin)、GIP、GLP-1、胰淀素、胰高血糖素、肽YY、卵泡抑素、铁调素、CRP、Apo A1、CIII、H、转甲状腺素蛋白、SAA、SAP、补体C3、4、补体因子H、白蛋白、铜蓝蛋白、结合珠蛋白(haptoglobin)、β-血红蛋白、转铁蛋白、铁蛋白、纤维蛋白原、凝血酶、血管性血友病因子、肌红蛋白、免疫抑制酸性蛋白、脂质结合唾液酸、S100A12(EN-RAGE)、胎球蛋白A(fetuin A)、聚集素(clusterin)、α1-抗胰蛋白酶、a2-巨球蛋白、丝氨酸蛋白酶抑制剂1(serpin1)(人纤溶酶原激活物抑制剂-1)、Cox-1、Hsp27、Hsp60、Hsp80、Hsp90、凝集素型氧化LDL受体1、CD14、脂质运载蛋白2(lipocalin 2)、ITIH4、sFasL、Cyfra21-1、TPA、穿孔素、DcR3、AGRP、肌酸激酶-MB、人乳脂肪球1-2、NT-Pro-BNP、神经元特异性烯醇化酶、CASA、NB/70K、AFP、afamin、胶原蛋白、抗增殖蛋白、角蛋白-6、PARC、B7-H4、YK-L40、AFP-L3、DCP、GPC3、OPN、GP73、CK19、MDK、A2、5-HIAA、CA15-3、CA19-9、CA27.29、CA72-4、降钙素、CGA、BRAF V600E、BAP、BCT-ABL融合蛋白、KIT、KRAS、PSA、乳酸脱氢酶、NMP22、PAI-1、uPA、纤维蛋白D-二聚体、S100、TPA、甲状腺球蛋白、CD20、CD24、CD44、RS/DJ-1、p53、α-2-HS-糖蛋白、亲脂素B(lipophilin B)、β-珠蛋白(beta-globin)、血液结合素(hemopexin)、UBE2N、PSMB6、PPP1CB、CPT2、COPA、MSK1/2、Pro-NPY、分离蛋白-1(Secernin-1)、纽蛋白(Vinculin)、NAAA、PTK7、TFG、MCCC2、TRAP1、IMPDH2、PTEN、POSTN、EPLIN、eIF4A3、DDAH1、ARG2、PRDX3&4、P4HB、YWHAG、烯酰辅酶A水合酶(Enoyl CoA-hydrase)、PHB、TUBB、KRT2、DES、HSP71、ATP5B、CKB、HSPD1、LMNA、EZH2、AMACR、FABP5、PPA2、EZR、SLP2、SM22、Bax、Smac/Diablo磷酸化Bcl2、STAT3和Smac/Diablo表达、PHB、PAP、AMACR、PSMA、FKBP4、PRDX4、KRT7/8/18、GSTP1、NDPK1、MTX2、GDF15、PCa-24、窖蛋白-2、凝血酶原、抗凝血酶-III、结合珠蛋白、血清淀粉样蛋白A-1蛋白、ZAG、ORM2、APOC3、CALML5、IGFBP2、MUC5AC、PNLIP、PZP、TIMP1、AMBP、间-α-胰蛋白酶抑制剂重链H1、间-α-胰蛋白酶抑制剂重链H2、间-α-胰蛋白酶抑制剂重链H3、V型质子ATP酶亚基B肾同种型、肝细胞生长因子样蛋白、血清淀粉样蛋白P-组分、酰基甘油激酶、含有富亮氨酸重复序列的蛋白质9、β-2-糖蛋白1、血浆蛋白酶C1抑制剂、含有脂氧合酶同源结构域的蛋白质1、原钙粘蛋白α-13。参见例如,Kuppusamy等人,第24卷,第6期,2017年9月,第1212-1221页;Elzek和Rodland,Cancer Metastasis Rev.2015年3月;34(1):83-96;Noel和Lokshin,Future Oncol.2012年1月;8(1):55-71;Tsuchiya等人,WorldJ Gastroenterol.2015年10月7日;21(37):10573-10583;Lou等人,BiomarkCancer.2017;9:1-9;Park等人,Oncotarget.2017年6月27日;8(26):42761-42771;Saraswat等人,Cancer Med.2017年7月;6(7):1738-1751;Zamay等人,Cancers(Basel).2017年11月;9(11):155;Tanase等人,Oncotarget.2017年3月14日;8(11):18497-18512,其中的每个以引用的方式整体并入本文。
在一些实施方案中,一个或多个额外类别的生物标记物包括核酸病变或变异(例如,与本文所述的可用于一种或多种方法的各个遗传生物标记物不同的核酸病变或变异)。在一些实施方案中,如果生物样品含有一种或多种指示癌症的核酸病变或变异,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的核酸病变或变异,则受试者被确定为患有癌症。核酸病变或变异的非限制性实例包括拷贝数变化、DNA甲基化变化和/或其他核酸(例如,mRNA、miRNA、lncRNA、circRNA、mtDNA、端粒DNA、易位和基因组重排)。易位和基因组重排已与各种癌症(例如,前列腺癌、胶质瘤、肺癌、非小细胞肺癌、黑色素瘤和甲状腺癌)相关,并且已用作生物标记物多年(例如,Demeure等人,2014,World J Surg.,38:1296-305;Hogenbirk等人,2016,PNASUSA,113:E3649-56;Gasi等人,2011,PLoS One,6:e16332;Ogiwara等人,2008,Oncogene,27:4788-97;美国专利号9,745,632;以及美国专利号6,576,420)。另外,拷贝数变化已用作各种癌症的生物标记物,所述癌症包括但不限于头颈部鳞状细胞癌、淋巴瘤(例如,非霍奇金淋巴瘤)和结直肠癌(Kumar等人,2017,Tumour Biol,39:1010428317740296;Kumar等人,2017,Tumour Biol.,39:1010428317736643;Henrique等人,2014,ExpertRev.Mol.Diagn.,14:419-22;以及美国专利号9,816,139)。DNA甲基化和DNA甲基化变化(例如,低甲基化,超甲基化)也被用作癌症的生物标记物。例如,低甲基化已与肝细胞癌(参见例如,Henrique等人,2014,Expert Rev.Mol.Diagn.,14:419-22)、食管癌变(参见例如,Alvarez等人,2011,PLoS Genet.,7:e1001356)以及胃和肝癌(参见例如,美国专利号8,728,732)相关联,并且超甲基化已与结直肠癌相关联(参见例如,美国专利号9,957,570;)。除了全基因组甲基化变化之外,特定基因内的特定甲基化变化也可以指示特定的癌症(参见例如,美国专利号8,150,626)。Li等人(2012,J.Epidemiol.,22:384-94)提供了多种癌症(例如,乳腺癌、膀胱癌、胃癌、肺癌、前列腺癌、头颈部鳞状细胞癌和鼻咽癌)与异常甲基化之间的关联的综述。另外或替代地,其他类型的核酸或核酸特征已与各种癌症相关联。此类核酸或核酸特征的非限制性实例包括各种微小RNA(miRNA)的存在或不存在,其已用于诊断结肠癌、前列腺癌、结直肠癌和卵巢癌(参见例如,D′Souza等人,2018,PLos One,13:e0194268;Fukagawa等人,2017,Cancer Sci.,108:886-96;Giraldez等人,2018,MethodsMol.Biol.,1768:459-74;美国专利号8,343,718;9,410,956;以及9,074,206)。关于miR-22与癌症的特定关联的综述,参见Wang等人(2017,Int.J.Oncol.,50:345-55);长非编码RNA(lncRNA)的异常表达也用作癌症的生物标记物,所述癌症诸如前列腺癌、结直肠癌、宫颈癌、黑色素瘤、非小细胞肺癌、胃癌、子宫内膜癌和肝细胞癌(参见例如,Wang等人,2017,Oncotarget,8:58577086;Wang等人,2018,Mol.Cancer,17:110;Yu等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:4812-9;Yu等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:993-1002;Zhang等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:4820-7;Zhang等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:2304-9;Xie等人,2018,EBioMedicine,33:57-67;以及美国专利号9,410,206);环状RNA(circRNA)的存在或不存在已用作肺癌、乳腺癌、胃癌、结直肠癌和肝癌(例如,Geng等人,2018,J.Hematol.Oncol.,11:98)和黑色素瘤(例如,Zhang等人,2018,Oncol.Lett.,16:1219-25)的生物标记物;端粒DNA的变化(例如,长度或杂合性的变化)或着丝粒DNA的变化(例如,着丝粒基因表达的变化)也已与癌症(例如,前列腺癌、乳腺癌、肺癌、淋巴瘤和尤文氏肉瘤)相关联(参见例如,Baretton等人,1994,CancerRes.,54:4472-80;Liscia等人,1999,Br.J.Cancer,80:821-6;Proctor等人,2009,Biochim.Biophys.Acta,1792:260-74;以及Sun等人,2016,Int.J.Cancer,139:899-907);线粒体DNA(mtDNA)中的各种突变(例如,缺失)、重排和/或拷贝数变化已用于各种癌症(例如,前列腺癌、黑色素瘤、乳腺癌、肺癌和结直肠癌)的预后和诊断。参见例如,Maragh等人,2015,Cancer Biomark.,15:763-73;Shen等人,2010,Mitochondrion,10:62-68;Hosgood等人,2010,Carcinogen.,31:847-9;Thyagarajan等人,2012,Cancer Epid.Biomarkers&Prev.,21:1574-81;以及美国专利号9,745,632;并且信使RNA(mRNA)的异常存在、不存在或量也已与各种癌症相关,所述癌症包括但不限于乳腺癌、维尔姆斯瘤(Wilms′tumor)和宫颈癌(参见例如,Guetschow et al.,2012,Anal.Bioanaly.Chem.,404:399-406;Schwienbacher等人,2000,Cancer Res.,60:1521-5;以及Ngan等人,1997,GenitourinMed.,73:54-8)。这些引文中的每个以引用的方式整体并入本文。
本文件提供了用于评估和/或治疗患有癌症或怀疑患有癌症的哺乳动物(例如,人)的方法和材料。在一些实施方案中,本文件提供了用于将哺乳动物鉴定为患有癌症的方法和材料。例如,可以评估从哺乳动物获得的样品(例如,血液样品),以至少部分地基于样品中一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平来确定所述哺乳动物是否患有癌症。本文所述的生物标记物组(例如,一组一个或多个生物标记物)可以包括两个或更多个(例如,三、五、九、10、25、100、250、500、1000、1500、2000、2500个或更多个)生物标记物(例如,与癌症相关联的生物标记物)的存在。在一些实施方案中,生物标记物组可以包括约2,011个生物标记物(例如,约2,001个基因组生物标记物和约10个肽生物标记物)。在一些实施方案中,本文所述的方法和材料还可以包括鉴定哺乳动物中癌症的位置(例如,解剖部位)。例如,可以评估从哺乳动物获得的样品(例如,血液样品),以至少部分地基于一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平来确定哺乳动物中癌症的位置。在一些实施方案中,本文所述的方法和材料还可以包括治疗患有癌症的哺乳动物(例如,施用一种或多种癌症治疗以治疗所述哺乳动物)。例如,可以评估从哺乳动物获得的样品(例如,血液样品),以至少部分地基于一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平来确定所述哺乳动物是否患有癌症,并施用一种或多种癌症治疗以治疗所述哺乳动物(例如,降低癌症的严重性、减轻癌症的症状和/或减少哺乳动物体内存在的癌细胞的数量)。
如本文所用,相对于肽生物标记物的水平,术语“升高水平”是指大于通常在来自一个或多个健康哺乳动物的样品(例如,参考样品)中观察到的肽的参考水平的任何水平。在一些实施方案中,参考样品可以是从没有癌症的哺乳动物获得的样品。例如,对于与结直肠癌相关联的肽生物标记物,参考样品可以是从没有结直肠癌的受试者获得的样品。在一些实施方案中,参考样品可以是从在其中观察到升高水平的肽生物标记物的同一哺乳动物获得的样品,其中所述参考样品是在癌症发作之前获得的。在一些实施方案中,将从相同哺乳动物获得的这种参考样品冷冻或以其他方式保存,将来用作参考样品。在一些实施方案中,当参考样品具有不可检测水平的肽生物标记物时,升高水平可以是肽生物标记物的任何可检测水平。应当理解,当确定特定水平是否是升高水平时,使用来自可比样品的水平。
可以如本文所述评估和/或治疗任何适当的哺乳动物。哺乳动物可以是患有癌症的哺乳动物。哺乳动物可以是怀疑患有癌症的哺乳动物。在一些实施方案中,可以评估人或其他灵长类动物(诸如猴子)中一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平,如本文所述。在一些实施方案中,可以评估狗、猫、马、牛、猪、绵羊、小鼠和大鼠中一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平,如本文所述。例如,如本文所述,可以评估人中一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平,如本文所述,并且任选地可以使用如本文所述的一种或多种癌症治疗来治疗。
可以评估来自哺乳动物的任何适当的样品中一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平。在一些实施方案中,样品可以包括DNA(例如,基因组DNA)。在一些实施方案中,样品可包含无细胞DNA(例如,循环肿瘤DNA(ctDNA))。在一些实施方案中,样品可以包括肽。例如,样品可以包括循环肽(例如,癌症相关肽)。如本文所用,“循环肽”是可以在哺乳动物体内的任何封闭系统(例如,循环系统)中检测到的肽。在一些实施方案中,样品可以是流体样品(例如,液体活检)。可以含有DNA和/或肽的样品的实例包括但不限于血液(例如,全血、血清或血浆)、羊膜、组织、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水、巴氏涂片、母乳和呼出气冷凝物。例如,可以评估血浆样品中一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平,如本文所述。
在一些实施方案中,可以处理样品(例如,从样品中分离和/或纯化DNA和/或肽)。例如,DNA分离和/或纯化可以包括细胞裂解(例如,使用去污剂和/或表面活性剂)、蛋白质去除(例如,使用蛋白酶)和/或RNA去除(例如,使用RNA酶)。作为另一个实例,肽分离和/或纯化可以包括细胞裂解(例如,使用去污剂和/或表面活性剂)、DNA去除(例如,使用DNA酶)和/或RNA去除(例如,使用RNA酶)。
如本文所述,可以使用任何适当的生物标记物(例如,以至少部分地基于样品中一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平来确定哺乳动物是否患有癌症)。生物标记物的实例包括但不限于遗传生物标记物、肽生物标记物、代谢产物、mRNA转录物、miRNA、甲基化模式(例如,DNA甲基化模式)、蛋白质(例如,抗体)和染色质模式。在一些实施方案中,可以使用一个或多个遗传生物标记物的存在来鉴定哺乳动物患有癌症。在一些实施方案中,可以使用一个或多个肽生物标记物的升高水平来鉴定哺乳动物患有癌症。在一些实施方案中,可以使用一个或多个遗传生物标记物的存在和一个或多个肽生物标记物的升高水平的组合来鉴定哺乳动物患有癌症。在一些实施方案中,与单独检测遗传生物标记物或肽生物标记物相比,组合检测一个或多个遗传生物标记物的存在和一个或多个肽生物标记物的升高水平可以增加检测的特异性和/或敏感性。
遗传生物标记物可以是任何适当的遗传生物标记物。例如,遗传生物标记物可以是与癌症相关联的遗传生物标记物。遗传生物标记物可以包括基因中的修饰。修饰的实例包括但不限于单碱基取代、插入、缺失、插入/缺失、易位和拷贝数变化。遗传生物标记物可以在任何适当的基因中。在一些实施方案中,遗传生物标记物可以包括肿瘤抑制基因中的修饰(例如,失活修饰)。在一些实施方案中,遗传生物标记物可以包括致癌基因中的修饰(例如,活化修饰)。可以包括遗传生物标记物的基因的实例包括但不限于NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A、GNAS、JUN、ABCA7、ACVR1B、ACVR2A、AJUBA、AKT1、ALB、ALDOB、ALK、AMBRA1、AMER1、AMOT、ANKRD46、APC、AR、ARHGAP35、ARID1A、ARID1B、ARID2、ARID4B、ARL15、ARMCX1、ASXL1、ASXL2、ATAD2、ATG14、ATG5、ATM、ATRX、ATXN2、AXIN1、B2M、BAP1、BCL9、BCLAF1、BCOR、BIRC6、BIRC8、BLVRA、BRAF、BRCA1、BRCA2、BRD7、BRE、BRWD3、BTBD7、BTRC、C11orf70、C12orf57、C2CD5、C3orf62、C8orf34、CAMKV、CAPG、CASP8、CBFB、CBX4、CCAR1、CCDC117、CCDC88A、CCM2、CCNC、CCND1、CCR3、CD1D、CD79B、CDC73、CDCP1、CDH1、CDK12、CDK4、CDKN1A、CDKN1B、CDKN2A、CEBPA、CELF1、CENPB、CEP128、CHD2、CHD4、CHD8、CHEK2、CHRDL1、CHUK、CIC、CLEC4C、CMTR2、CNN2、CNOT1、CNOT4、COL11A1、COPS4、COX7B2、CREBBP、CSDE1、CSMD3、CTCF、CTDNEP1、CTNNB1、CUL1、CUL2、CYB5B、DACH1、DCHS1、DCUN1D1、DDX3X、DDX5、DHX15、DHX16、DICER1、DIRC2、DIS3、DIXDC1、DKK2、DNAJB5、DNER、DNM1L、DNMT3A、EED、EGFR、EIF1AX、EIF2AK3、EIF2S2、EIF4A1、EIF4A2、ELF3、EMG1、EMR3、EP300、EPB41L4A、EPHA2、EPS8、ERBB2、ERBB3、ERRFI1、EXO5、EZH2、F5、FANCM、FAT1、FBN2、FBXW7、FCER1G、FGFR1、FGFR2、FGFR3、FLT3、FN1、FOXA1、FUBP1、FUS、GALNTL5、GATA3、GGCT、GIGYF2、GK2、GLIPR2、GNPTAB、GNRHR、GOLM1、GOT2、GPS2、GPX7、GRK1、GSE1、GZMA、HDAC1、HERC1、HERC4、HGF、HIST1H2BO、HLA-A、HLA-B、HMCN1、HNRNPA1、HRAS、HSP90AB1、ID3、IDH1、IDH2、IFNGR2、IFT88、IKZF2、INO80C、INPP4A、INPPL1、IWS1、JAK1、JAK2、KANSL1、KAT8、KATNAL1、KBTBD7、KCNMB4、KDM5C、KDM6A、KEAP1、KIAA1467、KLF4、KMT2A、KMT2B、KMT2C、KMT2D、KMT2E、KRAS、KRT15、LAMTOR1、LARP4B、LPAR2、LYN、MAP2K1、MAP2K2、MAP2K4、MAP3K1、MAP4K3、MAPK1、MAX、MB21D2、MBD1、MBD6、MBNL1、MBNL3、MED12、MED23、MEN1、MGA、MKLN1、MLLT4、MOAP1、MORC4、MS4A1、MSI1、MTOR、MYC、MYCN、MYD88、MYL6、MYO1B、MYO6、NAA15、NAA25、NAP1L2、NAP1L4、NCOA2、NCOR1、NEK9、NF1、NF2、NFE2L2、NFE2L3、NIPBL、NIT1、NKX3-1、NME4、NOTCH1、NOTCH2、NPM1、NRAS、NSD1、PBRM1、PCBP1、PCOLCE2、PHF6、PIK3CA、PIK3CB、PIK3R1、POLA2、POT1、PPARD、PPM1D、PPP2R1A、PPP6C、PRKACA、PRKCI、PRPF40A、PSIP1、PTEN、PTH2、PTMS、PTN、PTPN11、RAB18、RAC1、RAF1、RANBP3L、RAPGEF6、RASA1、RB1、RBBP6、RBM10、RBM26、RC3H2、REL、RERE、RFC4、RHEB、RHOA、RIMS2、RIT1、RNF111、RNF43、RPL11、RPL5、RQCD1、RRAS2、RUNX1、RXRA、SARM1、SCAF11、SEC22A、SENP3、SENP8、SETD1B、SETD2、SF3A3、SF3B1、SFPQ、SIN3A、SKAP2、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB 1、SMARCC2、SNCB、SOS1、SOX4、SOX9、SP3、SPEN、SPOP、SPSB2、STAG2、STK11、STK31、SUFU、TAF1A、TARDBP、TAS2R30、TBL1XR1、TBX3、TCF12、TCF7L2、TET2、TEX11、TFDP2、TGFBR2、THRAP3、TM9SF1、TMCO2、TMED10、TMEM107、TMEM30A、TMPO、TNFRSF9、TNRC6B、TP53、TP53BP1、TRAF3、TRIM8、TRIP12、TSC1、TTK、TTR、TUBA3C、U2AF1、UBE2D3、UBR5、UNC13C、UNKL、UPP1、USO1、USP28、USP9X、VHL、VN1R2、VPS33B、WAC、WDR33、WDR47、WT1、WWP1、XPO1、YOD1、ZC3H13、ZDHHC4、ZFHX3、ZFP36L1、ZFP36L2、ZGRF1、ZMYM3、ZMYM4、ZNF234、ZNF268、ZNF292、ZNF318、ZNF345、ZNF600、ZNF750和ZNF800。例如,遗传生物标记物可以在以下的一个或多个中:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS。在一些实施方案中,本文所述的方法和材料可以包括检测一个或多个遗传生物标记物(例如,一个或多个基因中的一个或多个修饰)。例如,本文所述的方法和材料可以包括检测编码实施例1中列出的任一蛋白质的一个或多个基因中的或者表3或表5中列出的一个或多个基因中的突变。在一些实施方案中,本文所述的方法和材料可以包括检测表3或表5中列出的一个或多个修饰。在一些实施方案中,本文所述的方法和材料可以包括检测约16个基因中的约2,001个修饰的存在或不存在。例如,本文所述的方法和材料可以包括检测约NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS中的一个或多个中的约2,001个修饰的存在或不存在。在一些实施方案中,遗传生物标记物可以如其他地方所述(参见例如,Bettegowda等人,2014Science translational medicine 6:224ra224;Haber等人,2014 Cancer Discov 4:650-661;Dawson等人,2013 N Engl J Med 368:1199-1209;Wang等人,2015 Sciencetranslational medicine 7:293ra104;Forshew等人,2012 Science translationalmedicine 4:136ra168;Abbosh等人,2017 Nature 545:446-451;Beddowes等人,2017Breast 34(Suppl 1):S31-S35;以及Phallen等人,2017 Science translationalmedicine 9)。
如本文所述,可以使用任何适当的方法来检测一个或多个生物标记物(例如,遗传生物标记物)的存在或不存在。在一些实施方案中,可以独立地检测一个或多个遗传生物标记物(例如,通过单重肽工具)。在一些实施方案中,可以同时检测一个或多个遗传生物标记物(例如,通过诸如“芯片”或微阵列的多重DNA工具)。用于检测遗传生物标记物的方法的实例包括但不限于测序(例如,基于PCR的测序,诸如基于PCR的多重测序)、DNA杂交方法(例如,DNA印迹)、限制性酶消化方法、基于PCR的多重方法、数字PCR方法、微滴数字PCR(ddPCR)方法、基于PCR的单重PCR方法、Sanger测序方法、下一代测序方法(例如,单分子实时测序、纳米孔测序和Polony测序)、定量PCR方法、连接方法和微阵列方法。在一些实施方案中,本文所述的方法和材料可以包括基于PCR的多重测序。例如,本文所述的方法和材料可以包括如实施例1列出的基于PCR的多重测序。在本文提供的方法的一些实施方案中,使用执行可以利用错误减少技术来增加大规模并行测序仪器的敏感性的方法来检测从受试者获得的样品中存在的一个或多个突变的存在。例如,此类技术可以允许检测5,000至1,000,000个野生型模板中的1个突变体模板范围内的罕见突变体等位基因。在一些实施方案中,通过扩增DNA(例如,从样品中的细胞获得的DNA或无细胞DNA)形成扩增子家族来检测从受试者获得的样品中存在的一个或多个突变的存在,其中家族的每个成员均来源于无细胞DNA中的单个模板分子,其中家族的每个成员用共同的寡核苷酸条形码标记,并且其中每个家族用不同的寡核苷酸条形码标记。例如,可以通过为每个模板分子分配唯一标识符(UID)、扩增每个带唯一标签的模板分子以产生UID家族并对扩增产物进行冗佘测序来检测从受试者获得的样品中存在的一个或多个突变的存在。在一些实施方案中,通过用共同包含多个寡核苷酸条形码的引物群体扩增的步骤,将寡核苷酸条形码引入到模板分子中。在一些实施方案中,寡核苷酸条形码对于模板分子是内源的,并且包含DNA合成引发位点的衔接子连接至模板分子的与寡核苷酸条形码相邻的末端。参见例如,Kinde等人,2011 Proc Natl AcadSci USA 108:9530-9535。
在本文提供的方法的一些实施方案中,使用测序技术(例如,下一代测序技术)检测从受试者获得的样品中存在的一个或多个突变的存在。各种测序技术是本领域中已知的。例如,用于检测和表征无细胞DNA中循环肿瘤DNA的方法可以在其他地方描述(参见例如,Haber和Velculescu,2014 Cancer Discov.,4:650-61)。此类技术的非限制性实例包括SafeSeqs(参见例如,Kinde等人,2011 Proc Natl Acad Sci USA;108:9530-5)、OnTarget(参见例如,Forshew等人,2012 Sci Transl Med;4:136ra68,)和TamSeq(例如参见Thompson等人,2012 PLoS ONE,7:e31597)。在一些实施方案中,使用微滴数字PCR(ddPCR)检测从受试者获得的样品中存在的一个或多个突变的存在,所述微滴数字PCR是已知对突变检测高度敏感的方法。在一些实施方案中,使用其他测序技术检测从受试者获得的样品中存在的一个或多个突变的存在,所述其他测序技术包括但不限于链终止技术、鸟枪技术、边测序边合成方法、利用微流体的方法、其他捕获技术或本领域已知的可用于检测样品中的少量DNA(例如,无细胞DNA样品中的ctDNA)的任何其他测序技术。
在一些实施方案中,使用基于阵列的方法检测从受试者获得的样品中存在的一个或多个突变的存在。例如,使用DNA微阵列执行检测无细胞DNA中的遗传改变(例如,一个或多个遗传改变)的步骤。在一些实施方案中,DNA微阵列可以检测多个癌细胞突变中的一个或多个。在一些实施方案中,在检测遗传改变之前扩增无细胞DNA。可用于本文所述的任一方法中的基于阵列的方法的非限制性实例包括:互补DNA(cDNA)微阵列(参见例如,Kumar等人2012 J.Pharm.Bioallied Sci.4(1):21-26;Laere等人2009 Methods Mol.Biol.512:71-98;Mackay等人2003 Oncogene 22:2680-2688;Alizadeh等人1996 Nat.Genet.14:457-460)、寡核苷酸微阵列(参见例如,Kim等人2006 Carcinogenesis 27(3):392-404;Lodes等人2009 PLoS One 4(7):e6229)、细菌人工染色体(BAC)克隆芯片(参见例如,Chung等人2004 Genome Res.14(1):188-196;Thomas等2005 Genome Res.15(12):1831-1837)、单核苷酸多态性(SNP)微阵列(参见例如,Mao等人2007 Curr.Genomics 8(4):219-228;Jasmine等人2012 PLoS One 7(2):e31968)、基于微阵列的比较基因组杂交阵列(array-CGH)(参见例如Beers和Nederlof,2006 Breast Cancer Res.8(3):210;Pinkel等人2005Nat.Genetics 37:S11-S17;Michels等人2007 Genet.Med.9:574-584)、分子倒置探针(MIP)测定(参见例如,Wang等人2012Cancer Genet 205(7-8):341-55;Lin等人2010 BMCGenomics 11:712)。在一些实施方案中,cDNA微阵列是Affymetrix微阵列(参见例如,Irizarry 2003 Nucleic Acids Res 31:e15;Dalma-Weiszhausz等人2006 MethodsEnzymol.410:3-28)、NimbleGen微阵列(参见例如,Wei等人2008 Nucleic Acids Res 36(9):2926-2938;Albert等人2007 Nat.Methods 4:903-905)、Agilent微阵列(参见例如,Hughes等人。2001 Nat.Biotechnol.19(4):342-347),或BeadArray阵列(参见例如,Liu等人2017 Biosens Bioelectron 92:596-601)。在一些实施方案中,寡核苷酸微阵列是DNA嵌合阵列(参见例如,Mockler和Ecker,2005 Genomics 85(1):1-15;Bertone等人2006Genome Res 16(2):271-281)。其他合适的基于阵列的方法是本领域中已知的。
在一些实施方案中,基于PCR的多重测序可以包括许多扩增子,其提供了改进的对一个或多个遗传生物标记物的检测的敏感性。例如,基于PCR的多重测序可以包含约60个扩增子(例如50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69或70个扩增子)。在一些实施方案中,基于PCR的多重测序可以包括61个扩增子。使用基于PCR的多重测序生产的扩增子可以包括具有以下长度的核酸:约15bp至约1000bp(例如,约25bp至约1000bp、约35bp至约1000bp、约50bp至约1000bp、约100bp至约1000bp、约250bp至约1000bp、约500bp至约1000bp、约750bp至约1000bp、约15bp至约750bp、约15bp至约500bp、约15bp至约300bp、约15bp至约200bp、约15bp至约100bp、约15bp至约80bp、约15bp至约75bp、约15bp至约50bp、约15bp至约40bp、约15bp至约30bp、约15bp至约20bp、约20bp至约100bp、约25bp至约50bp或约30bp至约40bp)。例如,使用基于PCR的多重测序产生的扩增子可以包括具有约33bp的长度的核酸。
肽生物标记物可以是任何适当的肽生物标记物。在一些实施方案中,肽生物标记物可以是与癌症相关联的肽生物标记物。例如,肽生物标记物可以是在癌症中具有升高水平的肽(例如,与肽的参考水平相比)。肽生物标记物的实例包括但不限于AFP、血管生成素2、AXL、CA125、CA15-3、CA19-9、CD44、CEA、CYFRA 21-1、DKK1、内皮糖蛋白、FGF2、卵泡抑素、半乳凝素-3、G-CSF、GDF15、HE4、HGF、IL-6、IL-8、激肽释放酶-6、瘦素、LRG-1、间皮素、中期因子、髓过氧化物酶、NSE、OPG、OPN、PAR、催乳素、sEGFR、sfas、SHBG、sHER2/sEGFR2/sErbB2、sPECAM-1、TGFa、血小板反应蛋白2、TIMP-1、TIMP-2和玻连蛋白。例如,肽生物标记物可以包括OPN、IL-6、CEA、CA125、HGF、髓过氧化物酶、CA19-9、中期因子和/或TIMP-1中的一个或多个。在一些实施方案中,本文所述的方法和材料可以包括一个或多个肽生物标记物(例如,一个或多个肽在癌症中具有升高水平)。例如,本文所述的方法和材料可以包括实施例1中列出的一个或多个肽生物标记物。例如,本文所述的方法和材料可以包括升高水平的表4中列出的一个或多个肽生物标记物。在一些实施方案中,本文所述的方法和材料可以包括检测约10个肽的水平。例如,本文所述的方法和材料可以包括检测OPN、IL-6、CEA、CA125、HGF、髓过氧化物酶、CA19-9、中期因子和/或TIMP-1的水平。在一些实施方案中,肽生物标记物可以如其他地方所述(参见例如,Liotta等人,2003 Clin Adv Hematol Oncol 1:460-462;Wang等人,2016 Expert Rev Proteomics 13:99-114;以及Patz,Jr.等人,2007 J ClinOncol 25:5578-5583)。
如本文所述,可以使用任何适当的方法来检测一个或多个生物标记物(例如,肽生物标记物)的水平(例如,升高水平)。在一些实施方案中,可以独立地检测一个或多个肽生物标记物的水平(例如,通过单重肽工具)。在一些实施方案中,可以同时检测一个或多个肽生物标记物的水平(例如,通过诸如“芯片”或微阵列的多重肽工具)。检测肽水平的方法的实例包括但不限于光谱方法(例如,高效液相色谱(HPLC)和液相色谱-质谱(LC/MS))、抗体依赖性方法(例如,酶联免疫吸附测定(ELISA)、蛋白质免疫沉淀、免疫电泳、蛋白质印迹和蛋白质免疫染色)和适体依赖性方法。在一些实施方案中,可以如实施例中所述检测一个或多个肽生物标记物的水平。例如,可以通过多重免疫测定来检测一个或多个肽生物标记物的水平。
可以如本文所述鉴定和/或治疗任何适当的癌症。在一些实施方案中,癌症可以是常见癌症。在一些实施方案中,癌症可以是没有基于血液的测试可用的癌症。在一些实施方案中,癌症可以是没有用于早期检测的测试可用的癌症。在一些实施方案中,癌症可以是I期癌症。在一些实施方案中,癌症可以是II期癌症。在一些实施方案中,癌症可以是III期癌症。在一些实施方案中,癌症可以是IV期癌症。在一些实施方案中,癌症可以是手术可切除的癌症。如本文所述鉴定(例如,至少部分地基于一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平)的癌症的实例包括但不限于肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌和前列腺癌。
本文提供的方法和材料还可以鉴定哺乳动物中癌症的位置(例如,可以确定癌症部位和/或类型)。可以确定如本文所述的一个或多个遗传生物标记物和/或一个或多个肽生物标记物中具有突变的任何癌症的位置(例如,癌症部位和/或类型)。在一些实施方案中,本文提供的材料和方法可以鉴定结直肠癌的存在。例如,从哺乳动物获得的样品中的一个或多个APC、KRAS和/或TP53基因突变中一个或多个遗传生物标记物的存在以及CEA的升高水平可以用于鉴定哺乳动物中结直肠癌的存在。在一些实施方案中,本文提供的材料和方法可以鉴定肝癌的存在。例如,从哺乳动物获得的样品中的一个或多个TP53、CTNNB1和/或TERT中一个或多个遗传生物标记物的存在以及AFP的升高水平可以用于鉴定哺乳动物中肝癌的存在。在一些实施方案中,本文提供的材料和方法可以鉴定卵巢癌的存在。例如,从哺乳动物获得的样品中的TP53中一个或多个遗传生物标记物的存在以及CA125的升高水平可以用于鉴定哺乳动物中卵巢癌的存在。在一些实施方案中,本文提供的材料和方法可以鉴定胰腺癌的存在。例如,在从哺乳动物获得的样品中的KRAS(例如,KRAS密码子12)中一个或多个遗传生物标记物的存在以及CA19-9的升高水平可以用于鉴定哺乳动物中胰腺癌的存在。
在一些实施方案中,如本文所述鉴定为患有癌症(例如,至少部分地基于一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平)的哺乳动物可以使用任何适当方法来确认癌症诊断。可用于诊断或确认癌症诊断的方法的实例包括但不限于体格检查(例如,盆腔检查)、影像学测试(例如,超声或CT扫描)、细胞学检查和组织检查(例如,活检)。
在一些实施方案中,可以对先前已经经历过癌症治疗的受试者执行本文公开的各种方法中的任一种。在一些实施方案中,本文提供的方法可以用于确定治疗的功效。例如,可以向患有癌症的受试者施用治疗(在本文中也称为“治疗性干预”),之后通过检测一个或多个基因(例如NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS)中一个或多个突变的存在和/或一个或多个肽生物标记物(例如,OPN、IL-6、CEA、CA125、HGF、髓过氧化物酶、CA19-9、中期因子和/或TIMP-1)的升高水平来确定癌症的持续存在或癌症的量(或癌症的缺乏)。
在一些实施方案中,一旦已经确定受试者患有癌症,就可以另外监测或选择所述受试者进行增加监测。在一些实施方案中,本文提供的方法可以用于在常规技术能够诊断患有早期癌症的受试者的时间段之前的时间段选择所述受试者进行增加监测。例如,当受试者通过常规方法未被诊断为患有癌症时和/或当不知道受试者携带癌症时,可以使用本文提供的用于选择受试者进行增加监测的方法。在一些实施方案中,与未被选择进行增加监测的受试者相比,可以增加的频率向被选择进行增加监测的受试者施用诊断测试(例如,本文公开的任何诊断测试)。例如,可以每天两次、每天一次、每两周一次、每周一次、每两月一次、每月一次、每季度一次、每半年一次、每年一次或其中的任何频率向被选择进行增加监测的受试者施用诊断测试。在一些实施方案中,与未被选择进行增加监测的受试者相比,可以向被选择进行增加监测的受试者施用一次或多次额外的诊断测试。例如,可以向被选择进行增加监测的受试者施用两次诊断测试,而仅向未被选择进行增加监测的受试者施用单次诊断测试(或不进行诊断测试)。在一些实施方案中,还可以选择已经被选择进行增加监测的受试者进行进一步诊断测试。一旦已经鉴定出癌细胞的存在(例如,通过本文公开的各种方法中的任一种),使受试者同时经历增加监测(例如,评估受试者中肿瘤或癌症的进展和/或评估额外的癌细胞突变的发展)和进一步诊断测试(例如,确定携带癌细胞的肿瘤的大小和/或确切位置)可能是有益的。在一些实施方案中,向被选择用于在检测到癌细胞突变后进行增加监测的受试者施用治疗性干预。可以施用本文公开的或本领域已知的任何治疗性干预。例如,如果在整个增加监测时间段内维持癌细胞的存在,则可以进一步监测已经被选择进行增加监测的受试者,并且可以施用治疗性干预。另外或替代地,可以向已经被选择进行增加监测的受试者施用治疗性干预,并且随着治疗性干预的进行进一步监测。在一些实施方案中,在向已经被选择进行增加监测的受试者施用治疗性干预之后,增加监测将揭示一个或多个额外的癌细胞突变。在一些实施方案中,此类一个或多个额外的癌细胞突变将提供施用不同治疗性干预的原因(例如,在治疗性干预期间,癌细胞中可能会产生耐药性突变,所述携带耐药性突变的癌细胞对原始治疗性干预具有耐药性)。
在一些实施方案中,一旦已经确定受试者患有癌症,就可以向所述受试者施用进一步测试或可以选择所述受试者进行进一步诊断测试。在一些实施方案中,本文提供的方法可以用于在常规技术能够诊断患有早期癌症的受试者的时间段之前的时间段选择所述受试者进行进一步诊断测试。例如,当受试者通过常规方法未被诊断为患有癌症时和/或当不知道受试者携带癌症时,可以使用本文提供的用于选择受试者进行进一步诊断测试的方法。在一些实施方案中,与未被选择进行进一步诊断测试的受试者相比,可以增加的频率向被选择进行进一步诊断测试的受试者施用诊断测试(例如,本文公开的任何诊断测试)。例如,可以每天两次、每天一次、每两周一次、每周一次、每两月一次、每月一次、每季度一次、每半年一次、每年一次或其中的任何频率向被选择进行进一步诊断测试的受试者施用诊断测试。在一些实施方案中,与未被选择进行进一步诊断测试的受试者相比,可以向被选择进行进一步诊断测试的受试者施用一次或多次额外的诊断测试。例如,可以向被选择进行进一步诊断测试的受试者施用两次诊断测试,而仅向未被选择进行进一步诊断测试的受试者施用单次诊断测试(或不进行诊断测试)。在一些实施方案中,诊断测试方法可以确定与最初检测到的癌症类型相同的癌症的存在。另外或替代地,诊断测试方法可以确定与最初检测到的癌症类型不同的癌症的存在。在一些实施方案中,诊断测试方法是扫描。在一些实施方案中,扫描是计算机断层成像(CT)、CT血管造影(CTA)、钡餐造影(钡吞咽)、钡灌肠、磁共振成像(MRI)、PET扫描、超声(例如,支气管内超声、内镜超声)、X射线、DEXA扫描。在一些实施方案中,诊断测试方法是身体检查,诸如肛门镜检查、支气管镜检查(例如,自发性荧光支气管镜检查、白光支气管镜检查、导航支气管镜检查)、结肠镜检查、数字乳腺断层合成、内镜逆行胰胆管造影(ERCP)、食道胃十二指肠镜检查、乳腺摄影、巴氏涂片、盆腔检查、正电子发射断层成像与计算机断层成像(PET-CT)扫描。在一些实施方案中,还可以选择已经被选择进行进一步诊断测试的受试者进行增加监测。一旦已经鉴定出癌细胞的存在(例如,通过本文公开的各种方法中的任一种),使受试者同时经历增加监测(例如,评估受试者中肿瘤或癌症的进展和/或评估额外的癌细胞突变的发展)和进一步诊断测试(例如,确定携带癌细胞的肿瘤的大小和/或确切位置)可能是有益的。在一些实施方案中,向被选择用于在检测到癌细胞突变后进行进一步诊断测试的受试者施用治疗性干预。可以施用本文公开的或本领域已知的任何治疗性干预。例如,如果确认了癌细胞的存在,则可以向已经被选择进行进一步诊断测试的受试者施用进一步诊断测试,并且可以施用治疗性干预。另外或替代地,可以向已经被选择进行进一步诊断测试的受试者施用治疗性干预,并且可以随着治疗性干预的进行进一步监测。在一些实施方案中,在向已经被选择进行一步诊断测试的受试者施用治疗性干预之后,额外的测试将揭示一个或多个额外的癌细胞突变。在一些实施方案中,此类一个或多个额外的癌细胞突变将提供施用不同治疗性干预的原因(例如,在治疗性干预期间,癌细胞中可能会产生耐药性突变,所述携带耐药性突变的癌细胞对原始治疗性干预具有耐药性)。
一旦如本文所述被鉴定为患有癌症(例如,至少部分基于一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平和/或非整倍性的存在),可以用一种或多种癌症治疗(在本文中也称为“治疗性干预”)来治疗哺乳动物。
在某些方面,本文提供了可以检测释放到血流中的癌细胞中的突变的最新测试。在一些实施方案中,可以检测一种或多种癌症类型。如本文所述的测定可以以改进敏感性同时保留特异性的方式用作癌症筛选测试。例如,此类测定可以将遗传生物标记物的检测(例如,循环肿瘤DNA(ctDNA)中的突变)与血浆中阈值化蛋白质标记物的检测组合。在一些实施方案中,单独测试遗传生物标记物(例如,循环肿瘤DNA(ctDNA)中的突变)。在一些实施方案中,单独测试蛋白质生物标记物。在一些实施方案中,遗传生物标记物(例如,循环肿瘤DNA(ctDNA)中的突变)和蛋白质标记物的组合可以优于任何单个标记物。在一项对1,703名患者(1,240名癌症和463名健康对照)的示例性先导研究中,ctDNA和蛋白质生物标记物组具有64%的敏感性和99.35%的特异性。
在一些实施方案中,如本文所述的测定可以应用于明显健康的个体。例如,如本文所述的测定可以通过在常规的寻医就诊期间进行的血液测试来检测症状前癌症,从而减少死亡和罹患癌症。另外,如本文所述的测定可以应用于患有局部癌症的患者,特别是已经或可以治疗或切除的那些癌症。如本文所述的测定可以通过较早地检测到复发来改善管理和预后。
在一些实施方案中,可以在从受试者(例如,人受试者)获得的各种生物样品中的任一种中测试遗传生物标记物(例如,无细胞DNA(例如,ctDNA)中的突变),所述各种生物样品包括但不限于血液、血浆、血清、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。
在一些实施方案中,可以在测定中测试10个示例性基因(AKT1、APC、BRAF、CDKN2A、CTNNB1、FBXW7、FGF2、GNAS、HRAS、KRAS)中的遗传生物标记物(例如,ctDNA中的突变)和血清中11个示例性蛋白标记物的升高超过阈值(CA19-9(>92U/ml)、CEA(>7,507pg/ml)、CA125(>577U/ml)、AFP(>21,321pg/ml)、催乳素(>145,345pg/ml)、HGF(>899pg/ml)、OPN(>157,772pg/ml)、TIMP-1(>176,989pg/ml)、卵泡抑素(>1,970pg/ml)、G-CSF(>800pg/ml)和CA15-3(>98U/ml))。在一些实施方案中,可以在测定中测试16个示例性基因(KT1、APC、BRAF、CDKN2、CTNNB1、FBXW7、FGFR2、GNAS、HRAS、KRAS、PPP2R1A、TP53、PTEN、PIK3CA、EGFR和NRAS)中的遗传生物标记物(例如,ctDNA中的突变)和血清中11个示例性蛋白生物标记物的升高超过阈值(CA19-9(>92U/ml)、CEA(>7,507pg/ml)、CA125(>577U/ml)、AFP(>21,321pg/ml)、催乳素(>145,345pg/ml)、HGF(>899pg/ml)、OPN(>157,772pg/ml)、TIMP-1(>176,989pg/ml)、卵泡抑素(>1,970pg/ml)、G-CSF(>800pg/ml)和CA15-3(>98U/ml))。在一些实施方案中,遗传生物标记物(例如,突变)的存在或任一个蛋白质生物标记物的超过阈值的升高构成阳性结果(例如,鉴定受试者中的癌症)。在一些实施方案中,遗传生物标记物(例如,突变)的存在或两个或更多个蛋白质生物标记物的升高构成阳性结果。例如,二、三、四、五、六、七、八、九或十个示例性基因中遗传生物标记物(例如,突变)的存在和/或二、三、四、五、六、七、八、九、十或十一个蛋白质生物标记物的升高构成阳性结果。
在一些实施方案中,可以在从受试者(例如,人受试者)获得的各种生物样品中的任一种中测试蛋白质(例如,蛋白质生物标记物),所述各种生物样品包括但不限于血液、血浆、血清、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。可以测试在癌症中大量发现的蛋白质(例如,蛋白质生物标记物)中健康人受试者中不存在的蛋白质的量。可以测试其中的任一、二、三、四、五、六、七、八、九、十或十一个的蛋白质(例如,蛋白质生物标记物)的实例包括但不限于碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3。当获得正常健康人受试者不高于其但患有癌症的人受试者高于其的阈值时,可以使用本领域已知的任何蛋白质生物标记物。
在一些实施方案中,CA19-9的阈值水平可以为至少约92U/mL(例如,约92U/mL)。在一些实施方案中,CA19-9的阈值水平可以为92U/mL。在一些实施方案中,CEA的阈值水平可以为至少约7,507pg/ml(例如,约7,507pg/ml)。在一些实施方案中,CEA的阈值水平可以为7.5ng/mL。在一些实施方案中,HGF的阈值水平可以为至少约899pg/ml(例如,约899pg/ml)。在一些实施方案中,HGF的阈值水平可以为0.92ng/mL。在一些实施方案中,OPN的阈值水平可以为至少约157,772pg/ml(例如,约157,772pg/ml)。在一些实施方案中,OPN的阈值水平可以为158ng/mL。在一些实施方案中,CA125的阈值水平可以为至少约577U/ml(例如,约577U/ml)。在一些实施方案中,CA125的阈值水平可以为577U/mL。在一些实施方案中,AFP的阈值水平可以为至少约21,321pg/ml(例如,约21,321pg/ml)。在一些实施方案中,AFP的阈值水平可以为21,321pg/ml。在一些实施方案中,催乳素的阈值水平可以为至少约145,345pg/ml(例如,约145,345pg/ml)。在一些实施方案中,催乳素的阈值水平可以为145,345pg/ml。在一些实施方案中,TIMP-1的阈值水平可以为至少约176,989pg/ml(例如,约176,989pg/ml)。在一些实施方案中,TIMP-1的阈值水平可以为176,989pg/ml。在一些实施方案中,卵泡抑素的阈值水平可以为至少约1,970pg/ml(例如,约1,970pg/ml)。在一些实施方案中,卵泡抑素的阈值水平可以为1,970pg/ml。在一些实施方案中,G-CSF的阈值水平可以为至少约800pg/ml(例如,约800pg/ml)。在一些实施方案中,G-CSF的阈值水平可以为800pg/ml。在一些实施方案中,CA15-3的阈值水平可以为至少约98U/ml(例如,约98U/ml)。在一些实施方案中,CA15-3的阈值水平可以为98U/ml。在一些实施方案中,CA19-9、CEA和/或OPN的阈值水平可以比以上列出的阈值水平大5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%或更大(例如,大于以下阈值水平:CA-19-9的92U/mL、CEA的7,507pg/ml、HGF的899pg/ml、OPN的157,772pg/ml、CA125的577U/ml、AFP的21,321pg/ml、催乳素的145,345pg/ml、TIMP-1的176,989pg/ml、卵泡抑素的1,970pg/ml、G-CSF的800pg/ml和/或CA15-3的98U/ml)。
在一些实施方案中,蛋白质生物标记物的阈值水平可以大于通常出于诊断或临床目的测试的水平。例如,CA19-9的阈值水平可以大于约37U/ml(例如,大于约40、45、50、55、60、65、70、75、80、85、90、95U/mL或更大)。另外或替代地,CEA的阈值水平可以大于约2.5ug/L(例如,大于约3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5ug/L或更大)。另外或替代地,CA125的阈值水平可以大于约35U/mL(例如,大于约40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550U/mL或更大)。另外或替代地,AFP的阈值水平可以大于约21ng/mL(例如,大于约25、30、40、50、60、70、80、90、100、150、200、250、300、350、400ng/mL或更大)。另外或替代地,TIMP-1的阈值水平可以大于约2300ng/mL(例如,大于约2,500、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000ng/mL或更大)。另外或替代地,卵泡抑素的阈值水平可以大于约2ug/mL(例如,大于约2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5ug/mL或更大)。另外或替代地,CA15-3的阈值水平可以大于约30U/mL(例如,大于约35、40、45、50、55、60、65、70、75、80、85、90、95U/mL或更大)。在一些实施方案中,以高于在传统诊断或临床测定中通常测试的阈值水平检测一个或多个蛋白质生物标记物可以改进癌症检测的敏感性。
在一些实施方案中,测定包括检测生物样品(例如,本文公开的任何生物样品,诸如血浆)中的阈值化蛋白质生物标记物,而不检测遗传生物标记物(例如,循环肿瘤DNA(ctDNA)中的突变)。例如,测定可以包括检测生物样品中的CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3中的一个或多个。在一些实施方案中,测定可以包括以本文公开的任一阈值水平检测生物样品中的CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3中的一个或多个。在一些实施方案中,一旦执行了包括检测生物样品中的阈值化蛋白质生物标记物的测定,就执行随后的测试或监测(例如,本文公开的各种进一步诊断测试或增加监测技术中的任一种)。在一些实施方案中,一旦执行了包括检测生物样品中的阈值化蛋白质标记物的测定,就可以执行包括检测遗传生物标记物(例如,无细胞DNA(例如,ctDNA)中存在的遗传生物标记物)的第二测定(例如,检测如本文所述的无细胞DNA或ctDNA中存在的遗传生物标记物中的各个遗传改变中的任一个)。
在一些实施方案中,测定包括检测生物样品(例如,本文公开的任何生物样品,诸如血浆)中的循环肿瘤DNA(ctDNA)中的遗传生物标记物,而不检测阈值化蛋白质生物标记物。例如,测定可以包括检测本文公开的任何基因中的一个或多个中的遗传生物标记物(例如,遗传改变),所述基因包括但不限于CDKN2A、FGF2、GNAS、ABL1、EVI1、MYC、APC、IL2、TNFAIP3、ABL2、EWSR1、MYCL1、ARHGEF12、JAK2、TP53、AKT1、FEV、MYCN、ATM、MAP2K4、TSC1、AKT2、FGFR1、NCOA4、BCL11B、MDM4、TSC2、ATF1、FGFR1OP、NFKB2、BLM、MEN1、VHL、BCL11A、FGFR2、NRAS、BMPR1A、MLH1、WRN、BCL2、FUS、NTRK1、BRCA1、MSH2、WT1、BCL3、GOLGA5、NUP214、BRCA2、NF1、BCL6、GOPC、PAX8、CARS、NF2、BCR、HMGA1、PDGFB、CBFA2T3、NOTCH1、BRAF、HMGA2、PIK3CA、CDH1、NPM1、CARD11、HRAS、PIM1、CDH11、NR4A3、CBLB、IRF4、PLAG1、CDK6、NUP98、CBLC、JUN、PPARG、SMAD4、PALB2、CCND1、KIT、PTPN11、CEBPA、PML、CCND2、KRAS、RAF1、CHEK2、PTEN、CCND3、LCK、REL、CREB1、RB1、CDX2、LMO2、RET、CREBBP、RUNX1、CTNNB1、MAF、ROS1、CYLD、SDHB、DDB2、MAFB、SMO、DDX5、SDHD、DDIT3、MAML2、SS18、EXT1、SMARCA4、DDX6、MDM2、TCL1A、EXT2、SMARCB1、DEK、MET、TET2、FBXW7、SOCS1、EGFR、MITF、TFG、FH、STK11、ELK4、MLL、TLX1、FLT3、SUFU、ERBB2、MPL、TPR、FOXP1、SUZ12、ETV4、MYB、USP6、GPC3、SYK、ETV6、IDH1和/或TCF3。在一些实施方案中,测定可以包括检测AKT1、APC、BRAF、CDKN2A、CTNNB1、FBXW7、FGF2、GNAS、HRAS、KRAS中的一个或多个中的遗传生物标记物(例如,遗传改变)。在一些实施方案中,测定可以包括检测KT1、APC、BRAF、CDKN2、CTNNB1、FBXW7、FGFR2、GNAS、HRAS、KRAS、PPP2R1A、TP53、PTEN、PIK3CA、EGFR和NRAS中的一个或多个中的遗传生物标记物(例如,遗传改变)。在一些实施方案中,一旦执行了包括检测生物样品中的ctDNA中存在的遗传生物标记物的测定,就执行随后的测试或监测(例如,本文公开的各种进一步诊断测试或增加监测技术中的任一种)。在一些实施方案中,一旦执行了包括检测生物样品中的ctDNA中存在的遗传生物标记物的测定,就可以执行包括以高阈值检测蛋白质生物标记物的第二测定(例如,检测本文所述的各个蛋白质生物标记物中的任一个,包括但不限于碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3及其组合)。
在一些实施方案中,可以测试肿瘤抑制基因或致癌基因的至少两个密码子或至少两个扩增子。在一些实施方案中,可以测定个别肿瘤抑制基因或致癌基因的至少三个、至少四个或至少五个或更多个密码子或扩增子。在一些实施方案中,突变在基因中的分布越多,可以有利地测试的密码子或扩增子就越多。
可以测试的肿瘤抑制基因和致癌基因的示例性密码子包括但不限于以下密码子中的一个或多个及其周围的剪接位点:AKT1的密码子16-18;APC的密码子1304-1311、1450-1459;BRAF的密码子591-602;CDKN2A的密码子51-58、76-88;CTNNB1的密码子31-39、38-47;EGFR的密码子856-868;FBXW7的密码子361-371、464-473、473-483、498-507;FGFR2的密码子250-256;GNAS的密码子199-208;HRAS的密码子7-19;KRAS的密码子7-14、57-65、143-148;NRAS的密码子3-15、54-63;PIK3CA的密码子80-90、343-348、541-551、1038-1050;PPP2R1A的密码子175-187;PTEN的密码子90-98、125-132、133-146、145-154;和TP53的密码子10-22、25-32、33-40、40-52、52-64、82-94、97-110、112-125、123-125、126-132、132-142、150-163、167-177、175-186、187-195、195-206、207-219、219-224、226-237、232-245、248-261、261-268、272-283、279-290、298-307、307-314、323-331、333-344、344-355、367-375、374-386。可以测试这些区域的全部或部分。在一些实施方案中,突变可以在KRAS中,例如在密码子12或61中。在其他实施方案中,突变可以在KRAS的其他密码子中。在一些实施方案中,突变可以在CDKN2A中(例如,实施例2中鉴定的CDKN2A突变中的任一个),在一些实施方案中,突变可以在肿瘤抑制基因或致癌基因中,其包括但不限于ABL1;EV11;MYC;APC;IL2;TNFAIP3;ABL2;EWSR1;MYCL1;ARHGEF12;JAK2;TP53;AKT1;FEV;MYCN;ATM;MAP2K4;TSC1;AKT2;FGFR1;NCOA4;BCL11B;MDM4;TSC2;ATF1;FGFR1OP;NFKB2;BLM;MEN1;VHL;BCL11A;FGFR2;NRAS;BMPR1A;MLH1;WRN;BCL2;FUS;NTRK1;BRCA1;MSH2;WT1;BCL3;GOLGA5;NUP214;BRCA2;NF1;BCL6;GOPC;PAX8;CARS;NF2;BCR;HMGA1;PDGFB;CBFA2T3;NOTCH1;BRAF;HMGA2;PIK3CA;CDH1;NPM1;CARD11;HRAS;PIM1;CDH11;NR4A3;CBLB;IRF4;PLAG1;CDK6;NUP98;CBLC;JUN;PPARG;SMAD4;PALB2;CCND1;KIT;PTPN11;CEBPA;PML;CCND2;KRAS;RAF1;CHEK2;PTEN;CCND3;LCK;REL;CREB1;RB1;CDX2;LMO2;RET;CREBBP;RUNX1;CTNNB1;MAF;ROS1;CYLD;SDHB;DDB2;MAFB;SMO;DDX5;SDHD;DDIT3;MAML2;SS18;EXT1;SMARCA4;DDX6;MDM2;TCL1A;EXT2;SMARCB1;DEK;MET;TET2;FBXW7;SOCS1;EGFR;MITF;TFG;FH;STK11;ELK4;MLL;TLX1;FLT3;SUFU;ERBB2;MPL;TPR;FOXP1;SUZ12;ETV4;MYB;USP6;GPC3;SYK;ETV6;IDH1和TCF3。测试可以包括扩增和/或测序。
在一些实施方案中,当分析物以少量和/或低比例存在时,高准确度的序列确定可能是有利的。高准确性序列确定可以采用内源或外源的寡核苷酸条形码。例如,在外源条形码的情况下,可以通过扩增将这些引入到模板分析物中。替代地,可以例如通过连接将寡核苷酸衔接子分子附接到内源寡核苷酸条形码来使用内源寡核苷酸条形码。衔接子分子可以含有用于DNA合成和/或与固体表面杂交的引发位点。衔接子可以紧邻内源条形码或与内源条形码相距固定数量的核苷酸。
在一些实施方案中,寡核苷酸条形码允许在处理,特别是扩增之前标记样品中的个别模板分子。例如,通过要求所有或很高比例或阈值比例的家族成员(具有相同的寡核苷酸条形码)展示突变,可以过滤掉或最小化在扩增和/或其他DNA合成或处理期间出现的假阳性突变。参见例如,Kinde I,Wu J,Papadopoulos N,Kinzler KW,&Vogelstein B(2011)Detection and quantification of rare mutations with massively parallelsequencing.Proc Natl Acad Sci USA 108(23):9530-9535,其内容明确地以引用的方式并入。另外或替代地,使之称为突变的突变阈值在两个不同的家族中发生。可以应用这种性质的多个过滤器。
在一些实施方案中,本文提供的方法可以用于检测无细胞DNA中存在的循环肿瘤DNA中的遗传生物标记物(例如,遗传改变(例如,一个或多个遗传改变)),其中无细胞DNA的存在量小于约1500ng,例如小于约1400ng、小于约1300ng、小于约1200ng、小于约1100ng、小于约1000ng、小于约900ng、小于约800ng、小于约700ng、小于约600ng、小于约500ng、小于约400ng、小于约300ng、小于约200ng、小于约150ng、小于约100ng、小于约95ng、小于约90ng、小于约85ng、小于约80ng、小于约75ng、小于约70ng、小于约65ng、小于约60ng、小于小于约55ng、小于约50ng、小于约45ng、小于约40ng、小于约35ng、小于约30ng、小于约25ng、小于约20ng、小于约15ng、小于约10ng或小于约5ng。在一些实施方案中,本文提供的方法可以用于检测无细胞DNA中存在的循环肿瘤DNA中的遗传生物标记物(例如,遗传改变(例如,一个或多个遗传改变)),其中循环肿瘤DNA代表100%的无细胞DNA。在一些实施方案中,本文提供的方法可以用于检测无细胞DNA中存在的循环肿瘤DNA中的遗传生物标记物(例如,遗传改变(例如,一个或多个遗传改变)),其中循环肿瘤DNA代表小于100%的无细胞DNA,例如约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约45%、约40%、约35%、约30%、约25%、约20%、约15%、约10%、约5%、约4%、约3%、约2%、约1%、约0.95%、约0.90%、约0.85%、约0.80%、约0.75%、约0.70%、约0.65%、约0.60%、约0.55%、约0.50%、约0.45%、约0.40%、约0.35%、约0.30%、约0.25%、约0.20%、约0.15%、约0.10%、约0.09%、约0.08%、约0.07%、约0.06%、约0.05%的无细胞DNA或更少。
在一些实施方案中,无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物和/或一个或多个蛋白质生物标记物可以从受试者(例如,人受试者)分离或获得的各种生物样品中的任一种进行测试,所述各种生物样品包括但不限于血液、血浆、血清、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。在一些实施方案中,无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物和一个或多个蛋白质生物标记物可以从同一样品进行测试。例如,可以从受试者分离或获得单个样品,可以测试所述单个样品的无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物、一个或多个蛋白质生物标记物或两者。可以同时或在不同时间测试样品中的无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物和一个或多个蛋白质生物标记物。例如,可以在第一时间测试样品中的无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物,并在第二时间测试一个或多个蛋白质生物标记物,或反之亦然。在一些实施方案中,样品可以冷藏、冷冻或以其他方式储存以用于将来的测试。在一些实施方案中,可以测试不同样品中的无细胞DNA(例如,ctDNA)中存在的一一个或多个遗传生物标记物和一个或多个蛋白质生物标记物。例如,可以从受试者分离或获得第一样品并测试其中的无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物,并且可以从受试者分离或获得第二样品并测试其中的一个或多个蛋白质生物标记物。第一样品和第二样品可以是相同类型(例如,血浆或血清)或不同类型。第一样品和/或第二样品可以冷藏、冷冻或以其他方式储存以用于将来的测试。
在一些实施方案中,可以重复本文公开的各种测定中的任一种以增加突变检测的准确性。例如,测定可以一式两份或一式三份进行。在一些实施方案中,可以对来自患者的同一初始样品重复阳性测定。另外或替代地,例如,当发现阳性结果时,可以稍后从患者获得第二样品。本文所述的各种测定中的任一种,包括ctDNA和/或蛋白质生物标记物,都可以重复或以平行重复方式运行。
在一些实施方案中,可以将放射、超声或其他技术应用于在其中检测突变的任何受试者(例如,人受试者)。所述技术可以应用于整个身体、单个器官或身体的区域。所述技术可以用于例如探明存在特定类型的癌症、确认存在癌症或鉴定癌症在体内的位置。在一些实施方案中,所述技术是扫描。在一些实施方案中,扫描是计算机断层成像(CT)、CT血管造影(CTA)、钡餐造影(钡吞咽)、钡灌肠、磁共振成像(MRI)、PET扫描、超声(例如,支气管内超声、内镜超声)、X射线、DEXA扫描或正电子发射断层成像与计算机断层成像(PET-CT)扫描。在一些实施方案中,所述技术是身体检查,诸如肛门镜检查、支气管镜检查(例如,自发性荧光支气管镜检查、白光支气管镜检查、导航支气管镜检查)、结肠镜检查、数字乳腺断层合成、内镜逆行胰胆管造影(ERCP)、食道胃十二指肠镜检查、乳腺摄影、巴氏涂片或盆腔检查。在一些实施方案中,所述技术是活检(例如,骨髓穿刺、组织活检)。在一些实施方案中,通过细针穿刺或通过手术切除来进行活检。在一些实施方案中,所述技术还包括获得生物样品(例如,组织样品、尿液样品、血液样品、检查拭子、唾液样品、粘膜样品(例如,痰液、支气管分泌物)、乳头抽吸液、分泌物或排泄物)。在一些实施方案中,所述技术包括确定外泌体蛋白(例如,外泌体表面蛋白(例如,CD24、CD147、PCA-3))(Soung等人(2017)Cancers 9(1):pii:E8)。在一些实施方案中,诊断测试方法是oncotype
Figure GDA0002675196410001441
测试(Baehner(2016)Ecancermedicalscience 10:675)。
在一些实施方案中,本文所述的各种方法可以用于检测选自由以下组成的组的癌症:胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌和乳腺癌及其组合。
在一些实施方案中,本文提供的方法(例如,其中在从受试者分离的生物样品中检测无细胞DNA(例如,ctDNA)中存在的遗传生物标记物和高阈值蛋白质生物标记物的方法)可以用于选择对于受试者的治疗。例如,一旦通过本文公开的各种方法中的任一种确定受试者患有癌症(例如,胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌或乳腺癌),可以选择适当的治疗(例如,本文所述的各种治疗性干预中的任一种)。在一些实施方案中,本文提供的方法(例如,其中在从受试者分离的生物样品中检测无细胞DNA(例如,ctDNA)中存在的遗传生物标记物和高阈值蛋白质生物标记物的方法)可以用于选择受试者进行治疗。例如,一旦通过本文公开的各种方法中的任一种确定受试者患有癌症(例如,胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌或乳腺癌),所述受试者可以被鉴定为接收治疗(例如,本文所述的各种治疗性干预中的任一种)的适当受试者。在一些实施方案中,本文提供的方法(例如,其中在从受试者分离的生物样品中检测无细胞DNA(例如,ctDNA)中存在的遗传生物标记物和高阈值蛋白质生物标记物的方法)可以用于选择受试者进行增加监测。例如,一旦通过本文公开的各种方法中的任一种确定受试者患有癌症(例如,胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌或乳腺癌),所述受试者可以被鉴定为接收增加监测(例如,本文所述的各种监测技术中的任一种)的适当受试者。在一些实施方案中,本文提供的方法(例如,其中在从受试者分离的生物样品中检测无细胞DNA(例如,ctDNA)中存在的遗传生物标记物和高阈值蛋白质生物标记物的方法)可以用于选择受试者进行进一步诊断测试。例如,一旦通过本文公开的各种方法中的任一种确定受试者患有癌症(例如,胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌或乳腺癌),所述受试者可以被鉴定为接收进一步诊断测试(例如,本文所述的各种诊断技术中的任一种)的适当受试者。
在一些实施方案中,本文提供的方法可以用于在诊断受试者患有早期癌症之前的时间段和/或在受试者表现出与癌症相关联的症状之前的时间检测癌症(例如,胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌或乳腺癌)的存在。例如,当受试者未被诊断为患有癌症时和/或当不知道受试者携带癌细胞时,可以使用本文提供的方法。
在一些实施方案中,可以以高阈值水平检测某些蛋白质生物标记物以检测特定类型的癌症。例如,可以检测CA19-9的高阈值水平以指示胰腺癌的存在。另外或替代地,可以检测CEA的高阈值水平以指示例如结肠癌、胃癌、胰腺癌、肺癌和/或乳腺癌的存在。另外或替代地,可以检测CA-125的高阈值水平以指示例如卵巢癌的存在。另外或替代地,可以检测AFP的高阈值水平以指示肝癌的存在。另外或替代地,可以检测催乳素的高阈值水平以指示例如卵巢癌、乳腺癌和/或肺癌的存在。另外或替代地,可以检测到HFG的高阈值水平以指示例如食道癌、胃癌和/或肝癌的存在。另外或替代地,可以检测OPN的高阈值水平以指示例如卵巢癌、乳腺癌和/或肺癌的存在。另外或替代地,可以检测TIMP-1的高阈值水平以指示例如结肠癌和/或胰腺癌的存在。另外或替代地,可以检测卵泡抑素的高阈值水平以指示例如卵巢癌和/或肺癌的存在。另外或替代地,可以检测G-CSF的高阈值水平以指示例如卵巢癌的存在。另外或替代地,可以检测CA15-3的高阈值水平以指示例如乳腺癌的存在。实施例2示出了在各种癌症类型中检测到的示例性蛋白质生物标记物。
在一些实施方案中,遗传生物标记物(例如,遗传改变)的测定可以与升高的蛋白质生物标记物的测定组合以增加血液测试对早期胰腺癌的敏感性。在一些实施方案中,可以通过此组合测试检测到50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的此类癌症,包括具有良好预后的一些患者。在一些实施方案中,可以通过此组合测试检测到64%的此类癌症,包括具有良好预后的一些患者。本文提出的某些研究的设计特征之一是仅包括患有可切除胰腺癌的患者,而患有晚期疾病(即III期或IV期)的患者被排除在外。尽管这种排除降低了通过评估所有胰腺癌患者(不论其分期如何)本来可以达到的敏感性,但可切除病例都代表一个有前途的群体,在评估筛选技术方面具有有利的临床意义。在一些实施方案中,本文提供的方法可以用于检测受试者(例如,人受试者)的所有胰腺癌。
在本公开之前,尚不知道将ctDNA中存在的遗传生物标记物和蛋白质标记物组合起来是否可以相对单独检测增加敏感性。实际上,可以想象,具有可检测的循环蛋白质标记物的相同患者在很大程度上与将DNA释放到循环中的那些患者重叠。这是早期癌症患者特别关注的问题,因为已知晚期癌症患者的ctDNA和基于蛋白质的标记物都比早期癌症患者高得多(Lennon AM&Goggins M(2010)Diagnostic and Therapeutic ResponseMarkers.Pancreatic Cancer,(Springer New York,New York,NY),第675-701页;LockerGY,等人(2006)ASCO 2006 update of recommendations for the use of tumor markersin gastrointestinal cancer.J Clin Oncol 24(33):5313-5327;Bettegowda C,等人(2014)Detection of circulating tumor DNA in early-and late-stage humanmalignancies.Science translational medicine 6(224):224ra224)。
在本文提供的方法的一些实施方案中,可以实现非常高的特异性(例如,99.5%:95%CI 97%-100%)。例如,在本文提出的研究中,在182个平均年龄64岁的健康个体中仅观察到一个假阳性。考虑到一般群体中的癌症相对不频繁,对于胰腺癌的任何可能有用的基于血液的筛选测试的特异性优选较高,例如,优选地>99%。否则,假阳性的数量将大大超过真阳性的数量(即具有次优的阳性预测值)(Lennon AM,等人(2014)The EarlyDetection of Pancreatic Cancer:What Will It Take to Diagnose and TreatCurable Pancreatic Neoplasia?Cancer Res 74(13):3381-3389)。监测患有已知癌症的患者的疾病的测试通常不需要筛选测试的这种严格性。对于监测而言,为了获得更高的敏感性,可以稍微放宽特异性。用本文公开的各种方法以至少两种方式实现了高特异性。首先,使用ctDNA作为测试的组分之一。KRAS突变对赘生物形成非常具有特异性,并且传统上,其特异性受到技术因素而非生物因素的限制。将分子条形码技术掺入到本文所述的各种测定中(例如,使用Safe-SeqS技术)可以使来自测序的假阳性结果最小化,所述假阳性结果传统上是任何基于ctDNA的测定所面临的主要技术问题。KRAS突变特别适用于早期检测策略,因为它们很少出现在与年龄相关联的克隆性造血作用过程中产生的克隆中。此类克隆可能代表脊髓发育不良的早期形式,是假阳性ctDNA测定的潜在来源。此类突变中的绝大多数发生在9个基因内(DNMT3A、TET2、JAK2、ASXL1、TP53、GNAS、PPM1D、BCORL1和SF3B1)(48-50),在将这些基因在基于ctDNA的测定中用作生物标记物时面临挑战。第二,使用高阈值将蛋白质标记物评分为阳性。这些阈值基于文献中的先前研究或一组独立的对照,从而避免绝大多数健康患者的阳性得分(Kim JE,等人(2004)Clinical usefulness of carbohydrateantigen 19-9 as a screening test for pancreatic cancer in an asymptomaticpopulation.J Gastroenterol Hepatol 19(2):182-186)。在一些实施方案中,可以在没有敏感性的总体降低的情况下使用此类高阈值,因为ctDNA测定本身增加敏感性,并且ctDNA阳性病例仅与蛋白质生物标记物阳性病例部分重叠(参见例如,图9、图10和实施例2)。
过去,蛋白质生物标记物已彼此组合来实现更高的敏感性(Dong T,Liu CC,Petricoin EF,&Tang LL(2014)Combining markers with and without the limit ofdetection.Stat Med 33(8):1307-132)。例如,已表明CA19-9和TIMP-1的组合对于PDAC的检测比单独任一个生物标记物更敏感(Zhou W,等人(1998)Identifying markers forpancreatic cancer by gene expression analysis.Cancer Epidemiol BiomarkersPrev 7(2):109-112)。最近,表明CA19-9、TIMP-1和LRG-1的组合对于早期PDAC的检测比单独的CA19-9更敏感(Dong T,Liu CC,Petricoin EF,&Tang LL(2014)Combining markerswith and without the limit of detection.Stat Med 33(8):1307-1320)。如本文所公开的,蛋白质生物标记物与超灵敏ctDNA的组合是不同的。最近的研究针对胰腺癌评估了ctDNA和CA19-9的组合,但发现与单独CA19-9相比组合生物标记物没有任何益处。不受理论的束缚,可能得出这一结论,因为用于检测KRAS突变的测试敏感性不足(Le Calvez-KelmF,等人(2016)KRAS mutations in blood circulating cell-free DNA:a pancreaticcancer case-control.Oncotarget 7(48):78827-78840)。此外,在此研究中实现的ctDNA特异性相对较低,降低了其筛选适用性。
在一些实施方案中,本文提供的方法可以用于通过非侵入性血液测试在大多数患者中检测可切除的癌症。
在一些实施方案中,使用本文公开的各种方法中的任一种获得的结果可能低估了早期检测的存活益处。尽管本文中研究的大多数患者患有可切除的癌症,但是他们都是有症状的,并且他们的癌症仅通过其症状才能发现。因此,本文所述的队列中77%的患者为IIB期,并且这些患者中的肿瘤的中值大小为3cm。在一些实施方案中,在无症状个体的筛选研究中,可以使用本文公开的各种方法中的任一种来发现更大比例的具有较小肿瘤的早期患者。在一些实施方案中,即使所有肿瘤都可以通过手术切除,本文公开的各种方法中的任一种对于具有较大肿瘤和预后较差的患者的检测可能比对于具有较小肿瘤的患者更敏感(参见例如,图9B和实施例2)。在一些实施方案中,可以在患有胰腺癌以外的癌症类型(主要是肺的那些癌症)的患者的循环中发现KRAS突变(Herbst RS,Heymach JV,&Lippman SM(2008)Lung cancer.N Engl J Med 359(13):1367-1380),并且CA19-9、CEA、HGF和OPN表达在若干种其他癌症类型中也可以升高(Kim JE,等人(2004)Clinical usefulness ofcarbohydrate antigen 19-9 as a screening test for pancreatic cancer in anasymptomatic population.J Gastroenterol Hepatol 19(2):182-186;Thomas DS,等人(2015)Evaluation of serum CEA,CYFRA21-1 and CA125 for the early detection ofcolorectal cancer using longitudinal preclinical samples.Br J Cancer 113(2):268-274;Di Renzo MF,等人(1995)Overexpression and amplification of the met/HGFreceptor gene during the progression of colorectal cancer.Clin Cancer Res 1(2):147-154;El-Tanani MK,等人(2006)The regulation and role of osteopontin inmalignant transformation and cancer.Cytokine Growth Factor Rev 17(6):463-474)。因此,在一些实施方案中,使用本文公开的各种方法中的任一种测试为阳性的患者可以经历额外的适当成像研究以鉴定肿瘤位置。
在一些实施方案中,本文提供的方法为评估具有PDAC高风险的患者以及实施早期检测策略奠定了基础(Kalinich M,等人(2017)An RNA-based signature enables highspecificity detection of circulating tumor cells in hepatocellularcarcinoma.Proc Natl Acad Sci USA 114(5):1123-1128)。例如,已知新发糖尿病与胰腺癌的风险增加相关联。在首次符合糖尿病标准的3年内,大约1%的50岁及以上的糖尿病患者被诊断患有胰腺癌(Chari ST,等人(2005)Probability of pancreatic cancerfollowing diabetes:a population-based study.Gastroenterology 129(2):504-511)。发病率为1%时,本文公开的某些组合测定的PPV/NPV预期在此群体中分别为54%和99.6%,这完全在当前批准的癌症筛选测试的范围内。
现有证据表明,许多癌症在其早期阶段都具有ctDNA中存在的可检测的遗传生物标记物,通常比胰腺癌中观察到的更为常见(Bettegowda C,等人(2014)Detection ofcirculating tumor DNA in early-and late-stage human malignancies.Sciencetranslational medicine 6(224):224ra224)。类似地,已经描述了用于检测多种癌症类型的大量蛋白质生物标记物(Liotta LA&Petricoin EF,3rd(2003)The promise ofproteomics.Clin Adv Hematol Oncol 1(8):460-462)。可以根据本文所述的各种方法中的任一种对这些蛋白质生物标记物进行阈值化,从而允许使用ctDNA-蛋白质组合检测多种癌症类型(Bettegowda C,等人(2014)Detection of circulating tumor DNA in early-and late-stage human malignancies.Science translational medicine 6(224):224ra224)。
在某些方面,本文提供了可以以改进敏感性同时保留特异性的方式用作癌症筛选测试的测定。在一些实施方案中,所述测定将对循环肿瘤DNA(ctDNA)中存在的遗传生物标记物中突变的检测与对血浆中阈值化蛋白质生物标记物的检测组合起来。在一些实施方案中,单独测试ctDNA中遗传生物标记物的存在。在一些实施方案中,单独测试蛋白质生物标记物。在一些实施方案中,ctDNA中存在的遗传生物标记物和蛋白质标记物的组合可以优于任何单个标记物。例如,在一些实施方案中,所述组合可以检测到近三分之二的在手术切除时没有远处转移迹象的胰腺癌。在一些实施方案中,当分析物以少量和/或低比例存在时,高准确度的序列确定可能是有利的。高准确性序列确定可以采用内源或外源的寡核苷酸条形码。例如,在外源条形码的情况下,可以通过扩增将这些引入到模板分析物中。替代地,可以例如通过连接将寡核苷酸衔接子分子附接到内源寡核苷酸条形码来使用内源寡核苷酸条形码。衔接子分子可以含有用于DNA合成和/或与固体表面杂交的引发位点。衔接子可以紧邻内源条形码或与内源条形码相距固定数量的核苷酸。
在一些实施方案中,寡核苷酸条形码允许在处理,特别是扩增之前标记样品中的个别模板分子。例如,通过要求所有或很高比例或阈值比例的家族成员(具有相同的寡核苷酸条形码)展示突变,可以过滤掉或最小化在扩增和/或其他DNA合成或处理期间出现的假阳性突变。参见例如,Kinde I,Wu J,Papadopoulos N,Kinzler KW,&Vogelstein B(2011)Detection and quantification of rare mutations with massively parallelsequencing.Proc Natl Acad Sci USA 108(23):9530-9535,其内容明确地以引用的方式并入。另外或替代地,使之称为突变的突变阈值在两个不同的家族中发生。可以应用这种性质的多个过滤器。
在一些实施方案中,本文提供的方法可以用于检测无细胞DNA中存在的循环肿瘤DNA中的遗传改变(例如,一个或多个遗传改变),其中无细胞DNA的存在量小于约1500ng,例如小于约1400ng、小于约1300ng、小于约1200ng、小于约1100ng、小于约1000ng、小于约900ng、小于约800ng、小于约700ng、小于约600ng、小于约500ng、小于约400ng、小于约300ng、小于约200ng、小于约150ng、小于约100ng、小于约95ng、小于约90ng、小于约85ng、小于约80ng、小于约75ng、小于约70ng、小于约65ng、小于约60ng、小于小于约55ng、小于约50ng、小于约45ng、小于约40ng、小于约35ng、小于约30ng、小于约25ng、小于约20ng、小于约15ng、小于约10ng或小于约5ng。在一些实施方案中,本文提供的方法可以用于检测无细胞DNA中存在的循环肿瘤DNA中的遗传改变(例如,一个或多个遗传改变),其中循环肿瘤DNA代表100%的无细胞DNA。在一些实施方案中,本文提供的方法可以用于检测无细胞DNA中存在的循环肿瘤DNA中的遗传改变(例如,一个或多个遗传改变),其中循环肿瘤DNA代表小于100%的无细胞DNA,例如约95%、约90%、约85%、约80%、约75%、约70%、约65%、约60%、约55%、约50%、约45%、约40%、约35%、约30%、约25%、约20%、约15%、约10%、约5%、约4%、约3%、约2%、约1%、约0.95%、约0.90%、约0.85%、约0.80%、约0.75%、约0.70%、约0.65%、约0.60%、约0.55%、约0.50%、约0.45%、约0.40%、约0.35%、约0.30%、约0.25%、约0.20%、约0.15%、约0.10%、约0.09%、约0.08%、约0.07%、约0.06%、约0.05%的无细胞DNA或更少。
在一些实施方案中,可以在从受试者(例如,人受试者)分离或获得的各种生物样品中的任一种中测试遗传生物标记物(例如,无细胞DNA(例如,ctDNA)中的突变)的存在,所述各种生物样品包括但不限于血液、血浆、血清、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。在一些实施方案中,无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物和一个或多个蛋白质生物标记物可以从同一样品进行测试。例如,可以从受试者分离或获得单个样品,可以测试所述单个样品的无细胞DNA(例如,ctDNA)中存在的遗传生物标记物、一个或多个蛋白质生物标记物或两者。可以同时或在不同时间测试样品中的无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在和一个或多个蛋白质生物标记物的存在。例如,可以在第一时间测试样品中的无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在,并在第二时间测试一个或多个蛋白质生物标记物的存在,或反之亦然。在一些实施方案中,样品可以冷藏、冷冻或以其他方式储存以用于将来的测试。在一些实施方案中,可以测试不同样品中的无细胞DNA(例如,ctDNA)中遗传生物标记物的存在和一个或多个蛋白质生物标记物的存在。例如,可以从受试者分离或获得第一样品并测试其中的无细胞DNA(例如,ctDNA)中遗传生物标记物的存在,并且可以从受试者分离或获得第二样品并测试其中一个或多个蛋白质生物标记物的存在。第一样品和第二样品可以是相同类型(例如,血浆或血清)或不同类型。第一样品和/或第二样品可以冷藏、冷冻或以其他方式储存以用于将来的测试。
在一些实施方案中,可以重复本文公开的各种测定中的任一种以增加突变检测的准确性。例如,测定可以一式两份或一式三份进行。在一些实施方案中,可以对来自患者的同一初始样品重复阳性测定。另外或替代地,例如,当发现阳性结果时,可以稍后从患者获得第二样品。本文所述的各种测定中的任一种,包括ctDNA和/或蛋白质生物标记物,都可以重复或以平行重复方式运行。
在一些实施方案中,遗传生物标记物(例如,无细胞DNA中的突变)可以在肿瘤抑制基因或致癌基因中。例如,遗传生物标记物(例如,突变)可以在突变的热点中,例如在肿瘤或其他癌症中经常被突变的位点。在一些实施方案中,突变可以在KRAS中,例如在密码子12或61中。在其他实施方案中,遗传生物标记物(例如,突变)可以在KRAS的其他密码子中。在一些实施方案中,遗传生物标记物(例如,突变)可以在CDKN2A中(例如,实施例2中鉴定的CDKN2A突变中的任一个),在一些实施方案中,遗传生物标记物(例如,突变)可以在肿瘤抑制基因或致癌基因中,其包括但不限于ABL1;EVI1;MYC;APC;IL2;TNFAIP3;ABL2;EWSR1;MYCL1;ARHGEF12;JAK2;TP53;AKT1;FEV;MYCN;ATM;MAP2K4;TSC1;AKT2;FGFR1;NCOA4;BCL11B;MDM4;TSC2;ATF1;FGFR1OP;NFKB2;BLM;MEN1;VHL;BCL11A;FGFR2;NRAS;BMPR1A;MLH1;WRN;BCL2;FUS;NTRK1;BRCA1;MSH2;WT1;BCL3;GOLGA5;NUP214;BRCA2;NF1;BCL6;GOPC;PAX8;CARS;NF2;BCR;HMGA1;PDGFB;CBFA2T3;NOTCH1;BRAF;HMGA2;PIK3CA;CDH1;NPM1;CARD11;HRAS;PIM1;CDH11;NR4A3;CBLB;IRF4;PLAG1;CDK6;NUP98;CBLC;JUN;PPARG;SMAD4;PALB2;CCND1;KIT;PTPN11;CEBPA;PML;CCND2;KRAS;RAF1;CHEK2;PTEN;CCND3;LCK;REL;CREB1;RB1;CDX2;LMO2;RET;CREBBP;RUNX1;CTNNB1;MAF;ROS1;CYLD;SDHB;DDB2;MAFB;SMO;DDX5;SDHD;DDIT3;MAML2;SS18;EXT1;SMARCA4;DDX6;MDM2;TCL1A;EXT2;SMARCB1;DEK;MET;TET2;FBXW7;SOCS1;EGFR;MITF;TFG;FH;STK11;ELK4;MLL;TLX1;FLT3;SUFU;ERBB2;MPL;TPR;FOXP1;SUZ12;ETV4;MYB;USP6;GPC3;SYK;ETV6;IDH1和TCF3。在一些实施方案中,可以在从受试者(例如,人受试者)分离或获得的各种生物样品中的任一种中测试蛋白质生物标记物,所述各种生物样品包括但不限于血液、血浆、血清、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。可以测试在癌症中大量发现的蛋白质蛋白质生物标记物中健康人受试者中不存在的蛋白质生物标记物的量。可以测试的蛋白质生物标记物的实例中的任一、二、三或四个,包括但不限于碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)和骨桥蛋白(OPN)。在一些实施方案中,CA19-9的阈值水平可以为至少约100U/mL(例如,约100U/mL)。在一些实施方案中,CA19-9的阈值水平可以为100U/mL。在一些实施方案中,CEA的阈值水平可以为至少约7.5ng/mL(例如,约7.5ng/mL)。在一些实施方案中,CEA的阈值水平可以为7.5ng/mL。在一些实施方案中,HGF的阈值水平可以为至少约0.92ng/mL(例如,约0.92ng/mL)。在一些实施方案中,HGF的阈值水平可以为0.92ng/mL。在一些实施方案中,OPN的阈值水平可以为至少约158ng/mL(例如,约158ng/mL)。在一些实施方案中,OPN的阈值水平可以为158ng/mL。在一些实施方案中,CA19-9、CEA和/或OPN的阈值水平可以比以上列出的阈值水平大5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%或更大(例如,大于以下阈值水平:CA-19-9的100U/mL、CEA的7.5ng/mL、HGF的0.92ng/mL和/或OPN的158ng/mL)。
当获得正常健康人受试者不高于其但患有癌症的人受试者高于其的阈值时,可以使用本领域已知的任何蛋白质生物标记物。此类蛋白质生物标记物的非限制性实例包括翻译延伸因子(EEF1A1);3-磷酸甘油醛脱氢酶(GAPDH);肌动蛋白γ(ACTG1);铁蛋白,重多肽1(FTH1);真核翻译延伸因子1γ(EEF1G);核糖体蛋白,大亚基,P0(RPLP0);热休克蛋白90kDaα(胞质),B类成员1(HSP90AB1);丙酮酸激酶,肌肉(PKM2);铁蛋白,轻多肽(FTL);和核糖体蛋白L3(RPL3)。已知在血清中过表达的蛋白质生物标记物包括但不限于转铁蛋白、α-1抗胰蛋白酶、载脂蛋白1、补体c3a、窖蛋白-1、激肽释放酶6、葡萄糖调节蛋白-8、α防御素-1、α防御素-2、α防御素-3、血清C肽、α-2-HS乙二醇蛋白、连环蛋白、防御素α6、MMP、细胞周期蛋白D、S100P、核纤层蛋白A/C丝蛋白和Tx1-2(硫氧还蛋白样蛋白2)。
在一些实施方案中,测定包括检测生物样品(例如,本文公开的任何生物样品,诸如血浆)中的阈值化蛋白质生物标记物,而不检测遗传生物标记物(例如,循环肿瘤DNA(ctDNA)中的突变)。例如,测定可以包括检测生物样品中的CA19-9、CEA、HGF和/或OPN中的一个或多个。在一些实施方案中,测定可以包括以本文公开的任一阈值水平检测生物样品中的CA19-9、CEA、HGF和/或OPN中的一个或多个。在一些实施方案中,一旦执行了包括检测生物样品中的阈值化蛋白质生物标记物的测定,就执行随后的测试或监测(例如,本文公开的各种进一步诊断测试或增加监测技术中的任一种)。在一些实施方案中,一旦执行了包括检测生物样品中的阈值化蛋白质生物标记物的测定,就可以执行包括检测无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物的第二测定(例如,检测如本文所述的无细胞DNA或ctDNA中存在的各个遗传改变中的任一个)。
在一些实施方案中,测定包括检测生物样品(例如,本文公开的任何生物样品,诸如血浆)中的循环肿瘤DNA(ctDNA)中存在的一个或多个遗传生物标记物,而不检测阈值化蛋白质生物标记物。例如,测定可以包括检测本文公开的任何基因中的一个或多个中的遗传生物标记物(例如,遗传改变),所述基因包括但不限于CDKN2A、FGF2、GNAS、ABL1、EVI1、MYC、APC、IL2、TNFAIP3、ABL2、EWSR1、MYCL1、ARHGEF12、JAK2、TP53、AKT1、FEV、MYCN、ATM、MAP2K4、TSC1、AKT2、FGFR1、NCOA4、BCL11B、MDM4、TSC2、ATF1、FGFR1OP、NFKB2、BLM、MEN1、VHL、BCL11A、FGFR2、NRAS、BMPR1A、MLH1、WRN、BCL2、FUS、NTRK1、BRCA1、MSH2、WT1、BCL3、GOLGA5、NUP214、BRCA2、NF1、BCL6、GOPC、PAX8、CARS、NF2、BCR、HMGA1、PDGFB、CBFA2T3、NOTCH1、BRAF、HMGA2、PIK3CA、CDH1、NPM1、CARD11、HRAS、PIM1、CDH11、NR4A3、CBLB、IRF4、PLAG1、CDK6、NUP98、CBLC、JUN、PPARG、SMAD4、PALB2、CCND1、KIT、PTPN11、CEBPA、PML、CCND2、KRAS、RAF1、CHEK2、PTEN、CCND3、LCK、REL、CREB1、RB1、CDX2、LMO2、RET、CREBBP、RUNX1、CTNNB1、MAF、ROS1、CYLD、SDHB、DDB2、MAFB、SMO、DDX5、SDHD、DDIT3、MAML2、SS18、EXT1、SMARCA4、DDX6、MDM2、TCL1A、EXT2、SMARCB1、DEK、MET、TET2、FBXW7、SOCS1、EGFR、MITF、TFG、FH、STK11、ELK4、MLL、TLX1、FLT3、SUFU、ERBB2、MPL、TPR、FOXP1、SUZ12、ETV4、MYB、USP6、GPC3、SYK、ETV6、IDH1和/或TCF3。在一些实施方案中,测定可以包括检测KRAS中(例如,KRAS的密码子12和/或61中)的遗传改变。在一些实施方案中,一旦执行了包括检测生物样品中的ctDNA中存在的一个或多个遗传生物标记物的测定,就执行随后的测试或监测(例如,本文公开的各种进一步诊断测试或增加监测技术中的任一种)。在一些实施方案中,一旦执行了包括检测生物样品中的ctDNA中存在的一个或多个遗传生物标记物的测定,就可以执行包括以高阈值检测一个或多个蛋白质生物标记物的第二测定(例如,检测本文所述的各个蛋白质生物标记物中的任一个,包括但不限于碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)及其组合)。
在一些实施方案中,无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物和/或一个或多个蛋白质生物标记物可以从受试者(例如,人受试者)分离或获得的各种生物样品中的任一种进行测试,所述各种生物样品包括但不限于血液、血浆、血清、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。在一些实施方案中,无细胞DNA(例如,ctDNA)中存在的一个或多个遗传生物标记物和一个或多个蛋白质生物标记物可以从同一样品进行测试。例如,可以从受试者分离或获得单个样品,可以测试所述单个样品的无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在、一个或多个蛋白质生物标记物的存在或两者。可以同时或在不同时间测试样品中的无细胞DNA(例如,ctDNA)中存在的遗传生物标记物和一个或多个蛋白质生物标记物。例如,可以在第一时间测试样品中的无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在,并在第二时间测试一个或多个蛋白质生物标记物,或反之亦然。在一些实施方案中,样品可以冷藏、冷冻或以其他方式储存以用于将来的测试。在一些实施方案中,可以测试不同样品中的无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在和一个或多个蛋白质生物标记物的存在。例如,可以从受试者分离或获得第一样品并测试其中的无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在,并且可以从受试者分离或获得第二样品并测试其中一个或多个蛋白质生物标记物的存在。第一样品和第二样品可以是相同类型(例如,血浆或血清)或不同类型。第一样品和/或第二样品可以冷藏、冷冻或以其他方式储存以用于将来的测试。
在一些实施方案中,可以测试肿瘤抑制基因或致癌基因中的多个密码子或基因区域,以鉴定遗传生物标记物(例如,突变)。例如,可以在基因中测试至少两个、至少三个、至少四个、至少五个或更多个密码子或基因区域。另外或替代地,可以测试多个基因的突变以增加针对更多类型的癌症或单个类型内的更多癌症的测定范围。
在一些实施方案中,可以将放射、超声或其他技术应用于在其中检测遗传生物标记物(例如,突变)的任何受试者(例如,人受试者)。所述技术可以应用于整个身体、单个器官或身体的区域。所述技术可以用于例如探明存在特定类型的癌症、确认存在癌症或鉴定癌症在体内的位置。在一些实施方案中,所述技术是扫描。在一些实施方案中,扫描是计算机断层成像(CT)、CT血管造影(CTA)、钡餐造影(钡吞咽)、钡灌肠、磁共振成像(MRI)、PET扫描、超声(例如,支气管内超声、内镜超声)、X射线、DEXA扫描或正电子发射断层成像与计算机断层成像(PET-CT)扫描。在一些实施方案中,所述技术是身体检查,诸如肛门镜检查、支气管镜检查(例如,自发性荧光支气管镜检查、白光支气管镜检查、导航支气管镜检查)、结肠镜检查、数字乳腺断层合成、内镜逆行胰胆管造影(ERCP)、食道胃十二指肠镜检查、乳腺摄影、巴氏涂片或盆腔检查。在一些实施方案中,所述技术是活检(例如,骨髓穿刺、组织活检)。在一些实施方案中,通过细针穿刺或通过手术切除来进行活检。在一些实施方案中,所述技术还包括获得生物样品(例如,组织样品、尿液样品、血液样品、检查拭子、唾液样品、粘膜样品(例如,痰液、支气管分泌物)、乳头抽吸液、分泌物或排泄物)。在一些实施方案中,所述技术包括确定外泌体蛋白(例如,外泌体表面蛋白(例如,CD24、CD147、PCA-3))(Soung等人(2017)Cancers 9(1):pii:E8)。在一些实施方案中,诊断测试方法是oncotype
Figure GDA0002675196410001581
测试(Baehner(2016)Ecancermedicalscience 10:675)。
在一些实施方案中,可以根据本文所述的各种方法中的任一种来检测胰腺癌以外的器官的癌症。
在一些实施方案中,本文提供的方法(例如,其中在从受试者分离的生物样品中检测无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在和一个或多个高阈值蛋白质生物标记物的存在的方法)可以用于选择对于受试者的治疗。例如,一旦通过本文公开的各种方法中的任一种确定受试者患有癌症(例如,胰腺癌),可以选择适当的治疗(例如,本文所述的各种治疗性干预中的任一种)。在一些实施方案中,本文提供的方法(例如,其中在从受试者分离的生物样品中检测无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在和一个或多个高阈值蛋白质生物标记物的存在的方法)可以用于选择受试者进行治疗。例如,一旦通过本文公开的各种方法中的任一种确定受试者患有癌症(例如,胰腺癌),所述受试者可以被鉴定为接收治疗(例如,本文所述的各种治疗性干预中的任一种)的适当受试者。在一些实施方案中,本文提供的方法(例如,其中在从受试者分离的生物样品中检测无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在和一个或多个高阈值蛋白质生物标记物的存在的方法)可以用于选择受试者进行增加监测。例如,一旦通过本文公开的各种方法中的任一种确定受试者患有癌症(例如,胰腺癌),所述受试者可以被鉴定为接收增加监测(例如,本文所述的各种监测技术中的任一种)的适当受试者。在一些实施方案中,本文提供的方法(例如,其中在从受试者分离的生物样品中检测无细胞DNA(例如,ctDNA)中一个或多个遗传生物标记物的存在和一个或多个高阈值蛋白质生物标记物的存在的方法)可以用于选择受试者进行进一步诊断测试。例如,一旦通过本文公开的各种方法中的任一种确定受试者患有癌症(例如,胰腺癌),所述受试者可以被鉴定为接收进一步诊断测试(例如,本文所述的各种诊断技术中的任一种)的适当受试者。
在一些实施方案中,本文提供的方法可以用于在诊断受试者患有早期癌症之前的时间段和/或在受试者表现出与癌症相关联的症状之前的时间检测癌症(例如,胰腺癌)的存在。例如,当受试者未被诊断为患有癌症时和/或当不知道受试者携带癌细胞时,可以使用本文提供的方法。
在本文所述的任一方法的一些实施方案中,可以向受试者施用本文所述的任一治疗性干预的单个剂量或多个剂量(例如,二、三、四、五、六、七、八、九或十个剂量)。
在一些实施方案中,遗传生物标记物(例如,遗传改变)的测定可以与升高的蛋白质生物标记物的测定组合以增加血液测试对早期胰腺癌的敏感性。在一些实施方案中,可以通过此组合测试检测到50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的此类癌症,包括具有良好预后的一些患者。在一些实施方案中,可以通过此组合测试检测到64%的此类癌症,包括具有良好预后的一些患者。本文提出的某些研究的设计特征之一是仅包括患有可切除胰腺癌的患者,而患有晚期疾病(即III期或IV期)的患者被排除在外。尽管这种排除降低了通过评估所有胰腺癌患者(不论其分期如何)本来可以达到的敏感性,但可切除病例都代表一个有前途的群体,在评估筛选技术方面具有有利的临床意义。在一些实施方案中,本文提供的方法可以用于检测受试者(例如,人受试者)的所有胰腺癌。
在本公开之前,尚不知道将ctDNA中存在的遗传生物标记物和蛋白质标记物生物标记物组合起来是否可以相对于单独检测增加敏感性。实际上,可以想象,具有可检测的循环蛋白质生物标记物的相同患者在很大程度上与将DNA释放到循环中的那些患者重叠。这是早期癌症患者特别关注的问题,因为已知晚期癌症患者的ctDNA和基于蛋白质的生物标记物都比早期癌症患者高得多(Lennon AM&Goggins M(2010)Diagnostic andTherapeutic Response Markers.Pancreatic Cancer,(Springer New York,New York,NY),pp 675-701;Locker GY,et al.(2006)ASCO 2006 update of recommendations forthe use of tumor markers in gastrointestinal cancer.J Clin Oncol 24(33):5313-5327;Bettegowda C,et al.(2014)Detection of circulating tumor DNA in early-andlate-stage human malignancies.Science translational medicine 6(224):224ra224)。
在本文提供的方法的一些实施方案中,可以实现非常高的特异性(例如,99.5%:95%CI 97%-100%)。例如,在本文提出的研究中,在182个平均年龄64岁的健康个体中仅观察到一个假阳性。考虑到一般群体中的癌症相对不频繁,对于胰腺癌的任何可能有用的基于血液的筛选测试的特异性优选较高,例如,优选地>99%。否则,假阳性的数量将大大超过真阳性的数量(即具有次优的阳性预测值)(Lennon AM,et al.(2014)The EarlyDetection of Pancreatic Cancer:What Will It Take to Diagnose and TreatCurable Pancreatic Neoplasia?Cancer Res 74(13):3381-3389)。监测患有已知癌症的患者的疾病的测试通常不需要筛选测试的这种严格性。对于监测而言,为了获得更高的敏感性,可以稍微放宽特异性。用本文公开的方法以至少两种方式实现了高特异性。首先,使用ctDNA作为测试的组分之一。KRAS突变对赘生物形成非常具有特异性,并且传统上,其特异性受到技术因素而非生物因素的限制。将分子条形码技术掺入到本文所述的各种测定中(例如,使用Safe-SeqS技术)可以使来自测序的假阳性结果最小化,所述假阳性结果传统上是任何基于ctDNA的测定所面临的主要技术问题。KRAS突变特别适用于早期检测策略,因为它们很少出现在与年龄相关联的克隆性造血作用过程中产生的克隆中。此类克隆可能代表脊髓发育不良的早期形式,是假阳性ctDNA测定的潜在来源。此类突变中的绝大多数发生在9个基因内(DNMT3A、TET2、JAK2、ASXL1、TP53、GNAS、PPM1D、BCORL1和SF3B1)(48-50),在将这些基因在基于ctDNA的测定中用作生物标记物时面临挑战。第二,使用高阈值将蛋白质生物标记物评分为阳性。这些阈值基于文献中的先前研究或一组独立的对照,从而避免绝大多数健康患者的阳性得分(Kim JE,et al.(2004)Clinical usefulness of carbohydrateantigen 19-9 as a screening test tor pancreatic cancer in an asymptomaticpopulation.J Gastroenterol Hepatol 19(2):182-186)。在一些实施方案中,可以在没有敏感性的总体降低的情况下使用此类高阈值,因为ctDNA测定本身增加敏感性,并且ctDNA阳性病例仅与蛋白质生物标记物阳性病例部分重叠(参见例如,图9、图10和实施例2)。
过去,蛋白质生物标记物已彼此组合来实现更高的敏感性(Dong T,Liu CC,Petricoin EF,&Tang LL(2014)Combining markers with and without the limit ofdetection.Stat Med 33(8):1307-1320)。例如,已表明CA19-9和TIMP-1的组合对于PDAC的检测比单独任一个生物标记物更敏感(Zhou W,et al.(1998)Identifying markers forpancreatic cancer by gene expression analysis.Cancer Epidemiol BiomarkersPrev 7(2):109-112)。最近,表明CA19-9、TIMP-1和LRG-1的组合对于早期PDAC的检测比单独的CA19-9更敏感(Capello M,et al.(2017)Sequential Validation of Blood-BasedProtein Biomarker Candidates for Early-Stage Pancreatic Cancer.J Natl CancerInst 109(4))。如本文所公开的,蛋白质生物标记物与超灵敏ctDNA的组合是不同的。最近的研究针对胰腺癌评估了ctDNA和CA19-9的组合,但发现与单独CA19-9相比组合生物标记物没有任何益处。不受理论的束缚,可能得出这一结论,因为用于检测KRAS突变的测试敏感性不足(Le Calvez-Kelm F,et al.(2016)KRAS mutations in blood circulating cell-free DNA:a pancreatic cancer case-control.Oncotarget 7(48):78827-78840)。此外,在此研究中实现的ctDNA特异性相对较低,降低了其筛选适用性。
在一些实施方案中,本文提供的方法可以用于通过非侵入性血液测试在大多数患者中检测可切除的胰腺癌。
在一些实施方案中,使用本文公开的各种方法中的任一种获得的结果可能低估了早期检测的存活益处。尽管本文中研究的大多数患者患有可切除的癌症,但是他们都是有症状的,并且他们的癌症仅通过其症状才能发现。因此,本文所述的队列中77%的患者为IIB期,并且这些患者中的肿瘤的中值大小为3cm。在一些实施方案中,在无症状个体的筛选研究中,可以使用本文公开的各种方法中的任一种来发现更大比例的具有较小肿瘤的早期患者。在一些实施方案中,即使所有肿瘤都可以通过手术切除,本文公开的各种方法中的任一种对于具有较大肿瘤和预后较差的患者的检测可能比对于具有较小肿瘤的患者更敏感(参见例如,图9B和实施例2)。在一些实施方案中,可以在患有胰腺癌以外的癌症类型(主要是肺的那些癌症)的患者的循环中发现KRAS突变(Herbst RS,Heymach JV,&Lippman SM(2008)Lung cancer.N Engl J Med 359(13):1367-1380),并且CA19-9、CEA、HGF和OPN表达在若干种其他癌症类型中也可以升高(Kim JE,et al.(2004)Clinical usefulness ofcarbohydrate antigen 19-9 as a screening test for pancreatic cancer in anasymptomatic population.J Gastroenterol Hepatol 19(2):182-186;Thomas DS,etal.(2015)Evaluation of serum CEA,CYFRA21-1 and CA125 for the early detectionof colorectal cancer using longitudinal preclinical samples.Br J Cancer 113(2):268-274;Di Renzo MF,et al.(1995)Overexpression and amplification of themet/HGF receptor gene during the progression of colorectal cancer.Clin CancerRes 1(2):147-154;E1-Tanani MK,et al.(2006)The regulation and role ofosteopontin in malignant transformation and cancer.Cytokine Growth Factor Rev17(6):463-474)。因此,在一些实施方案中,使用本文公开的各种方法中的任一种测试为阳性的患者可以经历额外的适当成像研究以鉴定肿瘤位置。
在一些实施方案中,本文提供的方法为评估具有PDAC高风险的患者以及实施早期检测策略奠定了基础(Kalinich M,et al.(2017)An RNA-based signature enables highspecificity detection of circulating tumor cells in hepatocellularcarcinoma.Proc Natl Acad Sci USA 114(5):1123-1128)。例如,已知新发糖尿病与胰腺癌的风险增加相关联。在首次符合糖尿病标准的3年内,大约1%的50岁及以上的糖尿病患者被诊断患有胰腺癌(Chari ST,et al.(2005)Probability of pancreatic cancerfollowing diabetes:a population-based study.Gastroenterology 129(2):504-511)。发病率为1%时,本文公开的某些组合测定的PPV/NPV预期在此群体中分别为54%和99.6%,这完全在当前批准的癌症筛选测试的范围内。
现有证据表明,许多癌症在其早期阶段都具有可检测的ctDNA,通常比胰腺癌中观察到的更为常见(Bettegowda C,et al.(2014)Detection of circulating tumor DNA inearly-and late-stage human malignancies.Science translational medicine 6(224):224ra224)。类似地,已经描述了用于检测多种癌症类型的大量蛋白质生物标记物(Liotta LA&Petricoin EF,3rd(2003)The promise of proteomics.Clin AdV HematolOncol 1(8):460-462)。可以根据本文所述的各种方法中的任一种对这些蛋白质生物标记物进行阈值化,从而允许使用ctDNA-蛋白质组合检测多种癌症类型(Bettegowda C,et al.(2014)Detection of circulating tumor DNA in early-and late-stage humanmalignancies.Science translational medicine 6(224):224ra224)。
遗传生物标记物与非整倍性的组合
一方面,本文提供了用于在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在来诊断或鉴定受试者中疾病的存在(例如,鉴定受试者患有癌症)的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定将对或可能对治疗有反应的受试者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定受试者为进行进一步诊断测试的候选者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定受试者为进行增加监测的候选者的方法和材料。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法在癌症的检测或诊断中提供高敏感性(例如,正确鉴定受试者患有癌症的高频率或发生率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法在癌症的检测或诊断中提供的敏感性(例如,正确鉴定受试者患有癌症的高频率或发生率)高于通过分别检测遗传生物标记物组套的一个或多个成员的存在或非整倍性的存在而提供的敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料提供至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料在检测单个类型的癌症时提供高敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料在检测两个或更多个类型的癌症时提供高敏感性。各种癌症类型中的任一种可以使用本文提供的方法和材料来检测(参见例如,标题为“癌症”的部分)。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料检测的癌症包括胰腺癌。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料检测的癌症包括肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌或乳腺癌。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料检测的癌症包括女性生殖道的癌症(例如,宫颈癌、子宫内膜癌、卵巢癌或输卵管癌)。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料检测的癌症包括膀胱癌或上尿路尿路上皮癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法在癌症的检测或诊断中提供高特异性(例如,当受试者没有癌症时,错误地鉴定所述受试者患有癌症的低频率或发生率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法在癌症的检测或诊断中提供的特异性(例如,正确鉴定受试者患有癌症的高频率或发生率)高于通过分别检测遗传生物标记物组套的一个或多个成员的存在或非整倍性的一个或多个成员的存在而提供的特异性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料提供至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的特异性。如本领域普通技术人员将理解的,99%的特异性意指仅1%的没有癌症的受试者被错误地鉴定为患有癌症。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料在检测单个癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述单个癌症类型的很低的概率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料在检测两种或更多种癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述两种或更多种癌症类型的很低的概率)。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因中一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因中一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,以及2)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:宫颈癌、子宫内膜癌、卵巢癌或输卵管癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因中一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,2)TERT启动子突变(例如,TERT启动子中的遗传生物标记物)的存在,以及3)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)以下每个基因中的一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL,2)TERT启动子突变(例如,TERT启动子中的遗传生物标记物)的存在,以及3)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因中一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,2)TERT启动子突变(例如,TERT启动子中的遗传生物标记物)的存在,以及3)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:膀胱癌或上尿路尿路上皮癌。
从受试者获得的样品可以是本文所述的含有DNA(例如,血液中的ctDNA,或存在于膀胱、宫颈、子宫内膜或子宫样品中的DNA)和/或蛋白质的各种样品中的任一种。在一些实施方案中,从受试者获得的样品中的DNA(例如,无细胞DNA(例如,ctDNA),或存在于膀胱、宫颈、子宫内膜或子宫样品中的DNA)和/或蛋白质来源于肿瘤细胞。在一些实施方案中,从受试者获得的样品中的DNA(例如,无细胞DNA(例如,ctDNA)包括一个或多个遗传生物标记物和或非整倍体DNA。在一些实施方案中,从受试者获得的样品中的蛋白质包括一个或多个蛋白质生物标记物。可以检测遗传生物标记物和/或蛋白质生物标记物和/或非整倍性的样品的非限制性实例包括血液样品、血浆样品、血清样品、尿液样品、子宫内膜样品、宫颈样品和子宫样品。在一些实施方案中,在从受试者获得的单个样品中检测一个或多个遗传生物标记物的存在和非整倍性的存在。在一些实施方案中,在从受试者获得的第一样品中检测一个或多个遗传生物标记物的存在,并且在从受试者获得的第二样品中检测非整倍性的存在。
在一些实施方案中,当受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险(例如,通过检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因中一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,以及2)非整倍性的存在)时,所述受试者被选择作为进一步诊断测试(例如,本文所述的各种进一步诊断测试方法中的任一种)的候选者(例如,被选择用于进一步诊断测试),所述受试者被选择作为增加监测(例如,本文所述的各种增加监测方法中的任一种)的候选者(例如,被选择用于增加监测),所述受试者被鉴定为将对或可能对治疗有反应的受试者(例如,本文所述的各种治疗性干预中的任一种),所述受试者被选择为治疗的候选者(例如,被选择用于治疗),选择对于所述受试者的治疗(例如,本文所述的各种治疗性干预中的任一种),和/或向受试者施用治疗(例如,本文所述的各种治疗性干预中的任一种)。在一些实施方案中,当受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险(例如,通过检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因中一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,2)TERT启动子突变(例如,TERT启动子中的遗传生物标记物)的存在,以及3)非整倍性的存在)时,所述受试者被选择作为进一步诊断测试(例如,本文所述的各种进一步诊断测试方法中的任一种)的候选者(例如,被选择用于进一步诊断测试),所述受试者被选择作为增加监测(例如,本文所述的各种增加监测方法中的任一种)的候选者(例如,被选择用于增加监测),所述受试者被鉴定为将对或可能对治疗有反应的受试者(例如,本文所述的各种治疗性干预中的任一种),所述受试者被选择为治疗的候选者(例如,被选择用于治疗),选择对于所述受试者的治疗(例如,本文所述的各种治疗性干预中的任一种),和/或向受试者施用治疗(例如,本文所述的各种治疗性干预中的任一种)。例如,当受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险时,受试者可以经历进一步诊断测试,所述进一步诊断测试可以确认受试者中癌症的存在。另外或替代地,可以增加的频率来监测受试者。在受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险的一些实施方案中,其中所述受试者经历进一步诊断测试和/或增加监测,可以向所述受试者额外施用治疗性干预。在一些实施方案中,在向受试者施用治疗性干预之后,所述受试者经历额外的进一步诊断测试(例如,与先前进行的相同类型的进一步诊断测试和/或不同类型的进一步诊断测试)和/或继续增加监测(例如,以与先前相同或不同的频率进行的增加监测)。在实施方案中,在向受试者施用治疗性干预并且所述受试者经历额外的进一步诊断测试和/或额外的增加监测之后,向所述受试者施用另一种治疗性干预(例如,与先前施用的相同的治疗性干预和/或不同的治疗性干预)。在一些实施方案中,在向受试者施用治疗性干预之后,测试受试者中以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因中一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,以及2)非整倍性的存在。在一些实施方案中,在向受试者施用治疗性干预之后,测试受试者中以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因中一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,2)TERT启动子突变(例如,TERT启动子中的遗传生物标记物)的存在,以及3)非整倍性的存在。
在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法还包括在从受试者获得的一个或多个样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测蛋白质生物标记物组套的一个或多个成员的存在。可以检测各个蛋白质生物标记物中的任一个(例如,本文所述的各个蛋白质生物标记物和/或蛋白质生物标记物组套中的任一个)。
在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因中一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,和2)非整倍性的存在,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测蛋白质生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A,和2)非整倍性的存在,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测蛋白质生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因中一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,2)非整倍性的存在,以及3)蛋白质生物标记物组套的一个或多个成员的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:宫颈癌、子宫内膜癌、卵巢癌或输卵管癌。
在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因中一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,2)TERT启动子突变(例如,TERT启动子中的遗传生物标记物)的存在,以及3)非整倍性的存在,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测蛋白质生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下每个基因中的一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL,2)TERT启动子突变(例如,TERT启动子中的遗传生物标记物)的存在,以及3)非整倍性的存在,所述方法还包括在从受试者获得的样品(例如,用于检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测蛋白质生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因中一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,2)TERT启动子突变(例如,TERT启动子中的遗传生物标记物)的存在,3)非整倍性的存在,以及4)蛋白质生物标记物组套的一个或多个成员的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:膀胱癌或上尿路尿路上皮癌。
在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下蛋白质生物标记物中的一个或多个(例如,1、2、3、4、5、6、7或8个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和髓过氧化物酶(MPO)。
在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下蛋白质生物标记物中的一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3。
在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下蛋白质生物标记物中的一个或多个(例如,1、2、3、4、5、6、7、8或9个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3。
在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下蛋白质生物标记物中的一个或多个(例如,1、2、3或4个):CA19-9、CEA、HGF和/或OPN。在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF和OPN。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的各种方法中的任一种还包括检测一个或多个额外类别的生物标记物的一个或多个成员的存在。此类额外类别的生物标记物的非限制性实例包括:拷贝数变化、DNA甲基化变化、其他核酸(例如,mRNA、miRNA、lncRNA、circRNA、mtDNA、端粒DNA、易位和基因组重排)、肽和/或代谢物。
在一些实施方案中,一个或多个额外类别的生物标记物包括代谢物生物标记物。在一些实施方案中,如果生物样品含有一种或多种指示癌症的代谢物,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的代谢物,则受试者被确定为患有癌症。指示癌症的代谢物的非限制性实例包括:5-甲基硫代腺苷(MTA)、还原型谷胱甘肽(GSH)、N-乙酰谷氨酸盐、乳糖、N-乙酰神经氨酸盐、UDP-乙酰氨基葡萄糖、UDP-乙酰半乳糖胺、UDP-葡糖醛酸盐、泛酸盐、花生四烯酸盐(20:4n6)、胆碱、胞苷5′-二磷酸胆碱、二高亚麻酸盐(20:3n3)、二十二碳五烯酸盐(DPA 22:5n3)、二十碳五烯酸盐(EPA 20:5n3)、甘油磷酰胆碱(GPC)、二十二碳六烯酸盐(DHA 22:6n3)、亚油酸盐(18:2n6)、5′-单磷酸胞苷(5′-CMP)、γ-谷氨酰谷氨酸盐、X-14577、X-11583、异戊酰肉碱、磷酸肌酸、2-氨基己二酸、葡萄糖酸、O-乙酰肉碱、天冬氨酸、脱酰胺基-NAD+、谷氨酸、异丁酰肉碱、肉碱、吡哆醛、柠檬酸、腺苷、ATP、缬氨酸、XC0061、异亮氨酸、γ-丁酰甜菜碱、乳酸、丙氨酸、苯丙氨酸、葡糖酸内酯、亮氨酸、二价谷胱甘肽(GSSG)、酪氨酸、NAD+、XC0016、UTP、肌酸、可可碱、CTP、GTP、3-甲基组氨酸、琥珀酸、3-磷酸甘油、谷氨酰胺、5-氧脯氨酸、硫胺素、丁酰肉碱、4-乙酰胺基丁酸、UDP-葡萄糖、UDP-半乳糖、苏氨酸、N-乙酰甘氨酸、脯氨酸、ADP、胆碱、苹果酸、S-腺苷甲硫氨酸、泛酸、半胱氨酸亚磺酸、6-氨基己酸、高半胱氨酸、羟脯氨酸、甲硫氨酸亚砜、3-胍基丙酸、6-磷酸葡萄糖、苯乙尿酸、苏糖酸、色氨酸、吡哆醇、N-乙酰天冬氨酸、4-胍基丁酸、丝氨酸、瓜氨酸、甜菜碱、N-乙酰天冬酰胺、2-羟基戊二酸、精氨酸、谷胱甘肽(GSH)、肌酐、磷酸二羟丙酮、组氨酸、甘氨酸、1-磷酸葡萄糖、N-甲酰基甘氨酸、酮洛芬、赖氨酸、β-丙氨酸、N-乙酰谷氨酸、2-氨基-2-(羟甲基)-1,3-丙二醇、鸟氨酸、磷酸胆碱、甘油磷酸胆碱、对苯二甲酸、3-磷酸甘油醛、Gly-Asp、牛磺酸、1,6-二磷酸果糖、3-氨基异丁酸、亚精胺、GABA、三乙醇胺、甘油、N-乙酰丝氨酸、N-乙酰鸟氨酸、二乙醇胺、AMP、半胱氨酸谷胱甘肽二硫化物、二价硫酸链霉素+H2O、反式谷氨酸、烟酸、异丁胺、甜菜碱醛+H2O、尿刊酸、1-氨基环丙烷-1-羧酸高丝氨酸内酯、5-氨基戊酸、3-羟基丁酸、乙醇胺、异戊酸、N-甲基谷氨酸、胱硫醚、精胺、肌肽、1-甲基烟酰胺、N-乙酰神经氨酸、肌氨酸、GDP、N-甲基丙氨酸、棕榈酸、1,2--二油酰基-sn-甘油-3-磷酸-rac-甘油胆固醇5α,6α环氧羊毛甾醇、木蜡酸、1油酰基_rac_GL、胆固醇_环氧化物、芥酸、T-LCA、油酰基-L-肉碱、齐墩果酸、3-磷酸甘油酸盐、5-羟基正缬氨酸、5-甲氧基色胺、5-单磷酸腺苷、α-酮戊二酸盐、天冬酰胺、苯甲酸、次黄嘌呤、麦芽糖、麦芽三糖、甲硫氨酸亚砜、降烟碱、苯酚、磷酸乙醇胺、焦磷酸盐、丙酮酸、奎尼酸、牛磺酸、尿酸、肌苷、乳酰胺、5-羟基正缬氨酸NIST、胆固醇、脱氧戊糖醇、2-羟基雌酮、2-羟基雌二醇、2-甲基雌酮、2-甲氧基雌二醇、2-羟基雌酮-3-甲基醚、4-羟基雌酮、4-甲氧基雌酮、4-甲氧基雌二醇、16α-羟基雌酮、17-表雌三醇、雌三醇、16-酮雌二醇、16-表雌三醇、酰基肉碱C18:1、氨基酸瓜氨酸和反式4-羟基脯氨酸、甘油磷脂PC aa C28:1、PC aeC30:0和PC ae C30:2以及鞘脂SM(OH)C14:1。参见例如,Halama等人,Nesting of colonand ovarian cancer cells in the endothelial niche is associated withalterations in glycan and lipid metabolism,Scientific Reports第7卷,论文编号:39999(2017);Hur等人,Systems approach to characterize the metabolism of livercancer stem cells expressing CD133,Sci Rep.,7:45557,doi:10.1038/srep45557,(2017);Eliassen等人,Urinary Estrogens and Estrogen Metabolites and SubsequentRisk of Breast Cancer among Premenopausal Women,Cancer Res;72(3);696-706(2011);Gangi等人,Metabolomic profile in pancreatic cancer patients:aconsensus-based approach to identify highly discriminating metabolites,Oncotarget,2月2日;7(5):5815-5829(2016);Kumar等人,Serum and Plasma MetabolomicBiomarkers for Lung Cancer,Bioinformation,13(6):202-208,doi:10.6026/97320630013202(2017);Schmidt等人,Pre-diagnostic metabolite concentrations andprostate cancer risk in 1077 cases and 1077 matched controls in the EuropeanProspective Investigation into Cancer and Nutrition,BMC Med.,15:122,doi:10.1186/s12916-017-0885-6(2017);其中的每个以引用的方式整体并入本文。
在一些实施方案中,一个或多个额外类别的生物标记物包括肽(例如,与本文所述的可用于一种或多种方法的各个蛋白质生物标记物不同的肽)。在一些实施方案中,如果生物样品含有一种或多种指示癌症的肽,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的肽,则受试者被确定为患有癌症。在一些实施方案中,肽来源于蛋白质(例如,所述肽包含存在于蛋白质生物标记物或不同蛋白质中的氨基酸序列)。指示癌症的肽的非限制性实例包括以下肽和来源于以下蛋白质的肽:CEACAM、CYFRA21-1、CA125、PKLK、ProGRP、NSE、TPA 6、TPA 7、TPA 8、NRG、NRG100、CNDP、APOB100、SCC、VEGF、EGFR、PIK3CA、HER2、BRAF、ROS、RET、NRAS、MET、MEK1、HER2、C4.4A、PSF3、FAM83B、ECD、CTNNB、VIM、S100A4、S100A7、COX2、MUC1、KLKB1、SAA、HP-β链、C9、Pgrmc1、Ciz1、转铁蛋白、α-1抗胰蛋白酶、载脂蛋白1、补体c3a、窖蛋白-1、激肽释放酶6、葡萄糖调节蛋白-8、α防御素-1、-2、-3、血清C-肽、α-2-HS乙二醇蛋白、胰蛋白酶KRT 8肽、血浆乙二醇蛋白、连环蛋白、防御素α6、MMP、细胞周期蛋白D、S100P、核纤层蛋白A/C丝蛋白、热休克蛋白、醛脱氢酶、Txl-2(硫氧还蛋白样蛋白-2)、P53、nm23、u-PA、VEGF、Eph B4、CRABP2、WT-1、Rab-3D、间皮素、ERα、ANXA4、PSAT1、SPB5、CEA5、CEA6、A1AT、SLPI、APOA4、VDBP、HE4、IL-1、IL-6、IL-7、IL-8、IL-10、IL-11、IL-12、IL-16、IL-18、IL-21、IL-23、IL-28A、IL-33、LIF、TNFR1-2、HVEM(TNFRSF14)、IL1R-a、IL1R-b、IL-2R、M-CSF、MIP-1a、TNF-α、CD40、RANTES、CD40L、MIF、IFN-β、MCP-4(CCL13)、MIG(CXCL9)、MIP-1δ(CCL15)、MIP3a(CCL20)、MIP-4(CCL18)、MPIF-1、SDF-1a+b(CXCL12)、CD137/4-1BB、淋巴细胞趋化因子(XCL1)、嗜酸性粒细胞趋化因子-1(CCL11)、嗜酸性粒细胞趋化因子-2(CCL24)、6Ckine/CCL21)、BLC(CXCL13)、CTACK(CCL27)、BCA-1(CXCL13)、HCC4(CCL16)、CTAP-3(CXCL7)、IGF1、VEGF、VEGFR3、EGFR、ErbB2、CTGF、PDGF AA、PDGF BB、PDGFRb、bFGF、TGFbRIII、β-细胞素、IGFBP1-4、IGFBP1-6、BDNF、PEDF、血管生成素-2、肾素、溶血磷脂酸、β2-微球蛋白、唾液酸TN、ACE、CA19-9、CEA、CA 15-3、CA-50、CA 72-4、OVX1、间皮素、唾液酸TN、MMP-2、-3、-7、-9、VAP-1、TIMP1-2、肌腱蛋白C、VCAM-1、骨桥蛋白、KIM-1、NCAM、四连接素、巢蛋白-2、组织蛋白酶L、前列腺蛋白、蛋白裂解酶、激肽释放酶2、6、10、胱抑素C、紧密连接蛋白、脊椎蛋白2、SLPI、bHCG、尿促性腺激素肽、抑制素、瘦素、脂联素、GH、TSH、ACTH、PRL、FSH、LH、皮质醇、TTR、骨钙素、胰岛素、饥饿素、GIP、GLP-1、胰淀素、胰高血糖素、肽YY、卵泡抑素、铁调素、CRP、Apo A1、CIII、H、转甲状腺素蛋白、SAA、SAP、补体C3、4、补体因子H、白蛋白、铜蓝蛋白、结合珠蛋白、β-血红蛋白、转铁蛋白、铁蛋白、纤维蛋白原、凝血酶、血管性血友病因子、肌红蛋白、免疫抑制酸性蛋白、脂质结合唾液酸、S100A12(EN-RAGE)、胎球蛋白A、聚集素、α1-抗胰蛋白酶、a2-巨球蛋白、丝氨酸蛋白酶抑制剂1(人纤溶酶原激活物抑制剂-1)、Cox-1、Hsp27、Hsp60、Hsp80、Hsp90、凝集素型氧化LDL受体1、CD14、脂质运载蛋白2、ITIH4、sFasL、Cyfra21-1、TPA、穿孔素、DcR3、AGRP、肌酸激酶-MB、人乳脂肪球1-2、NT-Pro-BNP、神经元特异性烯醇化酶、CASA、NB/70K、AFP、afamin、胶原蛋白、抗增殖蛋白、角蛋白-6、PARC、B7-H4、YK-L40、AFP-L3、DCP、GPC3、OPN、GP73、CK19、MDK、A2、5-HIAA、CA15-3、CA19-9、CA27.29、CA72-4、降钙素、CGA、BRAF V600E、BAP、BCT-ABL融合蛋白、KIT、KRAS、PSA、乳酸脱氢酶、NMP22、PAI-1、uPA、纤维蛋白D-二聚体、S100、TPA、甲状腺球蛋白、CD20、CD24、CD44、RS/DJ-1、p53、α-2-HS-糖蛋白、亲脂素B、β-珠蛋白、血液结合素、UBE2N、PSMB6、PPP1CB、CPT2、COPA、MSK1/2、Pro-NPY、分离蛋白-1、纽蛋白、NAAA、PTK7、TFG、MCCC2、TRAP1、IMPDH2、PTEN、POSTN、EPLIN、eIF4A3、DDAH1、ARG2、PRDX3&4、P4HB、YWHAG、烯酰辅酶A水合酶、PHB、TUBB、KRT2、DES、HSP71、ATP5B、CKB、HSPD1、LMNA、EZH2、AMACR、FABP5、PPA2、EZR、SLP2、SM22、Bax、Smac/Diablo磷酸化Bcl2、STAT3和Smac/Diablo表达、PHB、PAP、AMACR、PSMA、FKBP4、PRDX4、KRT7/8/18、GSTP1、NDPK1、MTX2、GDF15、PCa-24、窖蛋白-2、凝血酶原、抗凝血酶-III、结合珠蛋白、血清淀粉样蛋白A-1蛋白、ZAG、ORM2、APOC3、CALML5、IGFBP2、MUC5AC、PNLIP、PZP、TIMP1、AMBP、间-α-胰蛋白酶抑制剂重链H1、间-α-胰蛋白酶抑制剂重链H2、间-α-胰蛋白酶抑制剂重链H3、V型质子ATP酶亚基B肾同种型、肝细胞生长因子样蛋白、血清淀粉样蛋白P-组分、酰基甘油激酶、含有富亮氨酸重复序列的蛋白质9、β-2-糖蛋白1、血浆蛋白酶C1抑制剂、含有脂氧合酶同源结构域的蛋白质1、原钙粘蛋白α-13。参见例如,Kuppusamy等人,第24卷,第6期,2017年9月,第1212-1221页;Elzek和Rodland,Cancer Metastasis Rev.2015年3月;34(1):83-96;Noel和Lokshin,Future Oncol.2012年1月;8(1):55-71;Tsuchiya等人,World JGastroenterol.2015年10月7日;21(37):10573-10583;Lou等人,Biomark Cancer.2017;9:1-9;Park等人,Oncotarget.2017年6月27日;8(26):42761-42771;Saraswat等人,CancerMed.2017年7月;6(7):1738-1751;Zamay等人,Cancers(Basel).2017年11月;9(11):155;Tanase等人,Oncotarget.2017年3月14日;8(11):18497-18512,其中的每个以引用的方式整体并入本文。
在一些实施方案中,一个或多个额外类别的生物标记物包括核酸病变或变异(例如,与本文所述的可用于一种或多种方法的各个遗传生物标记物不同的核酸病变或变异)。在一些实施方案中,如果生物样品含有一种或多种指示癌症的核酸病变或变异,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的核酸病变或变异,则受试者被确定为患有癌症。核酸病变或变异的非限制性实例包括拷贝数变化、DNA甲基化变化和/或其他核酸(例如,mRNA、miRNA、lncRNA、circRNA、mtDNA、端粒DNA、易位和基因组重排)。易位和基因组重排已与各种癌症(例如,前列腺癌、胶质瘤、肺癌、非小细胞肺癌、黑色素瘤和甲状腺癌)相关,并且已用作生物标记物多年(例如,Demeure等人,2014,World J Surg.,38:1296-305;Hogenbirk等人,2016,PNASUSA,113:E3649-56;Gasi等人,2011,PLoS One,6:e16332;Ogiwara等人,2008,Oncogene,27:4788-97;美国专利号9,745,632;以及美国专利号6,576,420)。另外,拷贝数变化已用作各种癌症的生物标记物,所述癌症包括但不限于头颈部鳞状细胞癌、淋巴瘤(例如,非霍奇金淋巴瘤)和结直肠癌(Kumar等人,2017,Tumour Biol,39:1010428317740296;Kumar等人,2017,Tumour Biol.,39:1010428317736643;Henrique等人,2014,ExpertRev.Mol.Diagn.,14:419-22;以及美国专利号9,816,139)。DNA甲基化和DNA甲基化变化(例如,低甲基化,超甲基化)也被用作癌症的生物标记物。例如,低甲基化已与肝细胞癌(参见例如,Henrique等人,2014,Expert Rev.Mol.Diagn.,14:419-22)、食管癌变(参见例如,Alvarez等人,2011,PLoS Genet.,7:e1001356)以及胃和肝癌(参见例如,美国专利号8,728,732)相关联,并且超甲基化已与结直肠癌相关联(参见例如,美国专利号9,957,570;)。除了全基因组甲基化变化之外,特定基因内的特定甲基化变化也可以指示特定的癌症(参见例如,美国专利号8,150,626)。Li等人(2012,J.Epidemiol.,22:384-94)提供了多种癌症(例如,乳腺癌、膀胱癌、胃癌、肺癌、前列腺癌、头颈部鳞状细胞癌和鼻咽癌)与异常甲基化之间的关联的综述。另外或替代地,其他类型的核酸或核酸特征已与各种癌症相关联。此类核酸或核酸特征的非限制性实例包括各种微小RNA(miRNA)的存在或不存在,其已用于诊断结肠癌、前列腺癌、结直肠癌和卵巢癌(参见例如,D′Souza等人,2018,PLos One,13:e0194268;Fukagawa等人,2017,Cancer Sci.,108:886-96;Giraldez等人,2018,MethodsMol.Biol.,1768:459-74;美国专利号8,343,718;9,410,956;以及9,074,206)。关于miR-22与癌症的特定关联的综述,参见Wang等人(2017,Int.J.Oncol.,50:345-55);长非编码RNA(lncRNA)的异常表达也用作癌症的生物标记物,所述癌症诸如前列腺癌、结直肠癌、宫颈癌、黑色素瘤、非小细胞肺癌、胃癌、子宫内膜癌和肝细胞癌(参见例如,Wang等人,2017,Oncotarget,8:58577086;Wang等人,2018,Mol.Cancer,17:110;Yu等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:4812-9;Yu等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:993-1002;Zhang等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:4820-7;Zhang等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:2304-9;Xie等人,2018,EBioMedicine,33:57-67;以及美国专利号9,410,206);环状RNA(circRNA)的存在或不存在已用作肺癌、乳腺癌、胃癌、结直肠癌和肝癌(例如,Geng等人,2018,J.Hematol.Oncol.,11:98)和黑色素瘤(例如,Zhang等人,2018,Oncol.Lett.,16:1219-25)的生物标记物;端粒DNA的变化(例如,长度或杂合性的变化)或着丝粒DNA的变化(例如,着丝粒基因表达的变化)也已与癌症(例如,前列腺癌、乳腺癌、肺癌、淋巴瘤和尤文氏肉瘤)相关联(参见例如,Baretton等人,1994,CancerRes.,54:4472-80;Liscia等人,1999,Br.J.Cancer,80:821-6;Proctor等人,2009,Biochim.Biophys.Acta,1792:260-74;以及Sun等人,2016,Int.J.Cancer,139:899-907);线粒体DNA(mtDNA)中的各种突变(例如,缺失)、重排和/或拷贝数变化已用于各种癌症(例如,前列腺癌、黑色素瘤、乳腺癌、肺癌和结直肠癌)的预后和诊断。参见例如,Maragh等人,2015,Cancer Biomark.,15:763-73;Shen等人,2010,Mitochondrion,10:62-68;Hosgood等人,2010,Carcinogen.,31:847-9;Thyagarajan等人,2012,Cancer Epid.Biomarkers&Prev.,21:1574-81;以及美国专利号9,745,632;并且信使RNA(mRNA)的异常存在、不存在或量也已与各种癌症相关,所述癌症包括但不限于乳腺癌、维尔姆斯瘤和宫颈癌(参见例如,Guetschow et al.,2012,Anal.Bioanaly.Chem.,404:399-406;Schwienbacher等人,2000,Cancer Res.,60:1521-5;以及Ngan等人,1997,Genitourin Med.,73:54-8)。这些引文中的每个以引用的方式整体并入本文。
在某些方面,本文提供了检测受试者(例如,人)的疾病的方法。本文公开的各种方法提供了用于非侵入性检测受试者中的癌症(例如癌症,诸如但不限于子宫内膜癌或卵巢癌)的广泛适用的方法。本文公开的各种方法提供了用于在非侵入性检测受试者中的癌症(例如癌症,诸如但不限于子宫内膜癌或卵巢癌)之后治疗患有或怀疑患有癌症的受试者的广泛适用的方法。
在一些实施方案中,本文提供的方法包括在从受试者获得的样品(例如,宫颈或子宫内膜样品)中检测存在的细胞中的一个或多个基因中的遗传生物标记物(例如,突变)。例如,本文提供的方法可以用于检测一个或多个选自以下组成的组的基因中一个或多个遗传生物标记物(例如,突变)的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A,其中一个或多个基因中一个或多个遗传生物标记物(例如,突变)的存在指示受试者中卵巢癌或子宫内膜癌的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的样品中检测非整倍性(例如,单体性或三体性)的存在,其中非整倍性的存在指示受试者中卵巢癌或子宫内膜癌的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的样品中检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)的存在以及非整倍性(例如,单体性或三体性)的存在中的每一者。在一些实施方案中,包括在从受试者获得的样品中检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)的存在以及非整倍性(例如,单体性或三体性)的存在中的每一者的方法,与单独测试任一方面的方法相比,更好地指示受试者患有癌症(例如,子宫内膜癌或卵巢癌)。
在一些实施方案中,可以使用巴氏刷收集用于检测癌症(例如,卵巢癌或子宫内膜癌)的存在的样品。在本文提供的各种方法中的任一种的一些实施方案中,可以使用陶氏刷收集用于检测癌症(例如,卵巢癌或子宫内膜癌)的存在的样品。
在一些实施方案中,本文提供的方法还包括测试从受试者获得的样品(例如,血浆样品)中作为循环肿瘤DNA(ctDNA)存在的核酸中的遗传生物标记物。例如,可以测试样品(例如,血浆样品)以检测在以下一个或多个基因中携带一个或多个突变的核酸中的遗传生物标记物:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN和/或TP53。
在本文提供的其中在受试者获得的样品(例如,宫颈或子宫内膜样品)中检测存在的细胞中的基因中一个或多个遗传生物标记物(例如,突变)的方法的各种实施方案中,可以检测NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A的一个或多个中的遗传生物标记物(例如,突变)。在一些实施方案中,可以检测这些基因的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个中的一个或多个遗传生物标记物(例如,突变)。在一些实施方案中,可以检测这些基因的全部18个中的一个或多个遗传生物标记物(例如,突变)。在一些实施方案中,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是表15中所示的突变。在一些实施方案中,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是表16中所示的突变。在一些实施方案中,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是表17中所示的突变。在一些实施方案中,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是表15中所示的基因突变。在一些实施方案中,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是表16中所示的基因突变。在一些实施方案中,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是表17中所示的基因突变。在一些实施方案中,本文提供的通过检测一个或多个以下基因中一个或多个遗传生物标记物(例如,突变)的存在来检测卵巢癌或子宫内膜癌的存在的方法:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPPF2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,可以与非整倍性、ctDNA中存在的遗传生物标记物(例如,突变)或两者的检测组合。在一些实施方案中,将非整倍性的检测、ctDNA中存在的遗传生物标记物(例如,突变)的检测或两者组合可以增加检测卵巢癌或子宫内膜癌时的特异性和/或敏感性。在一些实施方案中,使用巴氏刷收集样品。在一些实施方案中,使用陶氏刷收集样品。
在一些实施方案中,本文提供的方法可以用于检测子宫内膜癌的存在。例如,本文提供的方法可以用于检测一个或多个以下基因中一个或多个遗传生物标记物(例如,突变)的存在:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A,其中一个或多个基因中一个或多个遗传生物标记物(例如,突变)的存在指示受试者中子宫内膜癌的存在。在一些实施方案中,可以检测这些基因的1、2、3、4、5、6、7、8、9、10或11个中的一个或多个遗传生物标记物(例如,突变)。在一些实施方案中,可以检测这些基因的全部12个中的一个或多个遗传生物标记物(例如,突变)。在一些实施方案中,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是本文所述的任何突变(例如,如表15、16或17中任一个所示的突变)。在一些实施方案中,本文提供的通过检测一个或多个以下基因中一个或多个遗传生物标记物(例如,突变)的存在来检测子宫内膜癌的存在的方法:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A,可以与非整倍性、ctDNA中存在的遗传生物标记物(例如,突变)或两者的检测组合。在一些实施方案中,将非整倍性的检测、ctDNA中存在的遗传生物标记物(例如,突变)的检测或两者组合可以增加检测子宫内膜癌时的特异性和/或敏感性。在一些实施方案中,使用巴氏刷收集样品。在一些实施方案中,使用陶氏刷收集样品。
在一些实施方案中,本文提供的方法可以用于检测卵巢癌的存在。例如,本文提供的方法可以用于检测TP53中一个或多个遗传生物标记物(例如,突变)的存在,其中一个或多个基因中一个或多个遗传生物标记物(例如,突变)的存在指示受试者中卵巢癌的存在。在一些实施方案中,通过检测TP53中遗传生物标记物(例如,突变)的存在而检测到的卵巢癌可以是高级别卵巢癌。在一些实施方案中,TP53中的一个或多个遗传生物标记物(例如,突变)可以是本文所述的任何TP53突变(例如,如表15、16或17中任一个所示的TP53突变)。在一些实施方案中,本文提供的通过检测TP53中一个或多个遗传生物标记物(例如,突变)的存在来检测子宫内膜癌的存在的方法可以与非整倍性的检测、ctDNA中存在的遗传生物标记物(例如,突变)的检测或两者组合。在一些实施方案中,将非整倍性的检测、ctDNA中存在的突变的检测或两者组合可以增加检测卵巢癌时的特异性和/或敏感性。在一些实施方案中,使用巴氏刷收集样品。在一些实施方案中,使用陶氏刷收集样品。
可以通过用于检测本文所述的突变的任何示例性技术来检测本文所述的一个或多个基因中的遗传生物标记物(例如,突变)。此外,本领域普通技术人员将知道用于检测这些基因中的遗传生物标记物(例如,突变)的其他合适方法。
在一些实施方案中,本文提供的方法(例如,包括本文所述的任一基因中一个或多个遗传生物标记(例如,突变)的检测、非整倍性的检测或两者的方法)还包括测试从受试者获得的样品(例如,血浆样品)中作为循环肿瘤DNA(ctDNA)存在的核酸中的遗传生物标记物。在一些实施方案中,样品包括在一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中携带一个或多个遗传生物标记物(例如,突变)的核酸,所述核酸可以根据本文公开的各种方法中的任一种进行测定。在一些实施方案中,血浆样品包括在一个或多个基因(例如,AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN和/或TP53)中携带一个或多个遗传生物标记物(例如,突变)的核酸,所述核酸可以根据本文公开的各种方法中的任一种进行测定。在一些实施方案中,可以在样品(例如,血浆样品)中检测表15中列出的基因中一个或多个遗传生物标记物(例如,突变)的存在。在一些实施方案中,可以在样品(例如,血浆样品)中检测表15中列出的一个或多个遗传生物标记物(例如,突变)的存在。在一些实施方案中,可以在样品(例如,血浆样品)中检测表16中列出的基因中一个或多个遗传生物标记物(例如,突变)的存在。在一些实施方案中,可以在样品(例如,血浆样品)中检测表16中列出的一个或多个遗传生物标记物(例如,突变)的存在。在一些实施方案中,可以在样品(例如,血浆样品)中检测表17中列出的基因中一个或多个遗传生物标记物(例如,突变)的存在。在一些实施方案中,可以在样品(例如,血浆样品)中检测表17中列出的一个或多个遗传生物标记物(例如,突变)的存在。如本领域普通技术人员将理解的,此类ctDNA可以代表从癌细胞(例如,宫颈癌、子宫内膜癌细胞、卵巢癌细胞和/或输卵管癌细胞)脱落的核酸,并且因此可以使用本文提供的各种方法中的任一种来测定,以确定受试者中癌症的存在。在一些实施方案中,用于检测ctDNA中一个或多个突变的存在的样品是或可以包括血液(例如全血、血清或血浆)、羊膜、组织、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液(例如,卵巢囊液)、粪便、腹水、巴氏涂片、腹膜液、腹膜灌洗液、子宫灌洗液及其组合。ctDNA中的突变可以通过用于检测本文所述的突变的任何示例性技术来检测。此外,本领域普通技术人员将知道用于检测ctDNA中的突变的其他合适方法。
在一些实施方案中,本文提供的方法包括在从受试者获得的样品(例如,宫颈或子宫内膜样品)中检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)和/或非整倍性(例如,单体性或三体性)的存在。在一些实施方案中,样品是宫颈样品。在一些实施方案中,样品是子宫内膜样品。在一些实施方案中,样品包含来自宫颈和子宫内膜中每一个的组织或细胞。在一些实施方案中,用巴氏刷获得样品。在一些实施方案中,用陶氏刷获得样品。在一些实施方案中,方法包括从样品的其余部分中分离细胞。例如,细胞可以与样品的其他组分完全分离,或者可以分离到一定程度,使得分离的细胞仅包含样品中少量的其他物质。在一些实施方案中,可以使用本文提供的各种方法中的任一种测定从样品中分离的细胞中存在的核酸。例如,可以分离并测定样品中的细胞中存在的核酸。
在一些实施方案中,本文提供的方法包括在从受试者获得的样品(例如,宫颈或子宫内膜样品)中检测一个或多个以下基因中一个或多个遗传生物标记物(例如,突变)的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,其中遗传生物标记物中的至少一个(例如,突变中的至少一个)以低频率存在于样品中。例如,当遗传生物标记物(例如,突变)存在于样品中的0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%或更少的细胞中时,本文提供的方法可以检测所述遗传生物标记物(例如,突变)。在一些实施方案中,当遗传生物标记物(例如,突变)存在于样品中存在的小于0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%或1%的总核酸中时,本文提供的方法可以检测所述遗传生物标记物(例如,突变)。
在本文公开的各种方法中的任一种的一些实施方案中,其中一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)的存在和/或非整倍性(例如,单体性或三体性)的存在,细胞学检查可与所述方法组合执行或者独立于所述方法执行。例如,细胞学检查可以与本文公开的各种方法中的任一种组合执行,以改善受试者中癌症(例如,卵巢癌或子宫内膜癌)的检测。在一些实施方案中,将细胞学检查与检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)的存在和/或非整倍性(例如,单体性或三体性)的存在组合执行增加测定的敏感性(例如,至少增加10%、20%、30%、40%、50%、60%或更多)。在一些实施方案中,将细胞学检查与检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)的存在和/或非整倍性(例如,单体性或三体性)的存在组合执行增加测定的特异性(例如,至少增加10%、20%、30%、40%、50%、60%或更多)。在一些实施方案中,将细胞学检查与检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)的存在和/或非整倍性(例如,单体性或三体性)的存在组合执行允许检测仅使用细胞学检查原本无法检测到或仅很少检测到的癌症(例如,低级别肿瘤)。作为另一个实例,一旦通过检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)和/或非整倍性(例如,单体性或三体性)的存在确定了癌症(例如,卵巢癌或子宫内膜癌)的存在,就可以独立地执行细胞学检查以确认所述癌症的存在。在一些实施方案中,本文提供的方法包括检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)的存在以及非整倍性(例如,单体性或三体性)的存在中的每一者,以及执行细胞学检查。
在一些实施方案中,可以对先前已经经历过癌症(例如,卵巢癌或子宫内膜癌)治疗的受试者执行本文公开的各种方法中的任一种。在一些实施方案中,本文提供的方法可以用于确定治疗的功效。例如,可以向患有卵巢癌或子宫内膜癌的受试者施用治疗(在本文中也称为“治疗性干预”),此后癌症的持续存在或癌症的量(或其缺乏)通过检测一个或多个基因(例如,NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A)中一个或多个遗传生物标记物(例如,突变)的存在和/或非整倍性(例如,单体性或三体性)的存在来确定。
在某些方面,本文提供了检测受试者(例如,人)的疾病的方法。本文公开的各种方法提供了用于非侵入性检测癌症(例如,早期癌症,诸如但不限于膀胱癌或上尿路尿路上皮癌(UTUC))的广泛适用的方法。在一些实施方案中,所检测的疾病是癌症。在一些实施方案中,所检测的癌症是恶性的。在一些实施方案中,所检测的疾病与尿路有关。在一些实施方案中,所检测的疾病是影响尿路的癌症。在一些实施方案中,所检测的疾病是膀胱癌。在一些实施方案中,所检测的疾病与肾盂有关。在一些实施方案中,所检测的疾病是影响肾盂的癌症。在一些实施方案中,所检测的疾病是UTUC。
在一些实施方案中,本文提供的方法包括在从受试者获得的样品(例如,尿液样品)中检测一个或多个基因的突变。例如,本文提供的方法可以用于检测一个或多个以下基因中一个或多个遗传生物标记物(例如,一个或多个突变)的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL。在一些实施方案中,本文提供的方法包括在从受试者获得的样品中检测TERT启动子中至少一个遗传生物标记物(例如,突变)的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的样品中检测非整倍性(例如,单倍性或三倍性)的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的样品中检测以下两个或更多个:一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中的遗传生物标记物(例如,突变)、非整倍性(例如,单体性或三体性)的存在和TERT启动子中至少一个遗传生物标记物(例如,突变)的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的样品中检测以下每一个:一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,一个或多个突变)的存在、非整倍性(例如,单体性或三体性)的存在和TERT启动子中至少一个遗传生物标记物(例如,突变)的存在。在一些实施方案中,包括在从受试者获得的样品中检测以下每一个:一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)的存在和TERT启动子中至少一个遗传生物标记物(例如,突变)的存在的方法,与其中测试少于所有这三个参数的方法相比,可更好地指示受试者患有癌症(例如,膀胱癌或UTUC)。在一些实施方案中,包括在从受试者获得的样品中检测以下每一个:一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)的存在和TERT启动子中至少一个遗传生物标记物(例如,突变)的存在的方法,可以增加检测卵巢癌或子宫内膜癌(例如,膀胱癌或UTUC)时的特异性和/或敏感性。
在本文提供的其中在从受试者获得的样品(例如,尿液样品)中检测基因中一个或多个遗传生物标记物(例如,一个或多个突变)的方法的各种实施方案中,可以检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL中的一个或多个中的遗传生物标记物(例如,突变)。在一些实施方案中,可以检测这些基因的1、2、3、4、5、6、7、8或9个中的遗传生物标记物(例如,突变)。在一些实施方案中,可以检测这些基因的全部10个中的遗传生物标记物(例如,突变)。在一些实施方案中,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是本文公开的任何突变。例如,这些基因中的一个或多个遗传生物标记物(例如,突变)可以是表19或表29中所示的突变。在一些实施方案中,检测TR53或FGFR3的一个中的至少一个遗传生物标记物(例如,突变)。在一些实施方案中,在TR53或FGFR3的每一个中检测至少一个遗传生物标记(例如,至少一个突变)。
在一些实施方案中,本文提供的方法包括在从受试者获得的样品(例如,尿液样品)中检测TERT启动子中至少一个遗传生物标记物(例如,突变)的存在。可以检测本文公开的TERT启动子中的任何遗传生物标记物(例如,突变)。例如,可以使用本文提供的方法检测表26或表30中所示的各种TERT启动子遗传生物标记物(例如,突变)中的任一种。在一些实施方案中,可以根据本文提供的各种方法检测的TERT启动子遗传生物标记物(例如,突变)包括g.1295228 C>T和/或g.1295250 C>T突变。在一些实施方案中,可以根据本文提供的各种方法检测的TERT启动子遗传生物标记物(例如,突变)包括在位置hg1295228和/或hg1295250处的突变,其分别在转录起始位点上游66bp和88bp。在一些实施方案中,使用单重PCR测定鉴定TERT启动子中的遗传生物标记物(例如,突变)。在一些实施方案中,使用多重PCR测定鉴定TERT启动子中的遗传生物标记物(例如,突变)。在一些实施方案中,单个扩增引物可以用于扩增包含已知在癌症(例如,膀胱癌或UTUC)中携带遗传生物标记物(例如,突变)的TERT启动子区域的片段。
如本文所用,术语“TERT”是指基因和/或由所述基因编码的蛋白质,其是端粒酶逆转录酶,一种端粒酶的催化亚基,其与端粒酶RNA组分(TERC)一起包括端粒酶复合物的最重要单元。在大多数BC以及其他癌症类型中,发现TERT基因的上游启动子中的活化突变率很高。TERT启动子突变通常会影响两个热点:g.1295228 C>T和g.1295250 C>T。这些突变导致产生CCGGAA/T或GGAA/T基序,从而改变ETS转录因子的结合位点,并随后增加TERT启动子活性。TERT启动子突变发生在多达80%的膀胱和上尿路的浸润性尿路上皮癌及其若干种组织学变体中。此外,TERT启动子突变发生在60%-80%的BC前体中,包括低恶性潜力的乳头状尿路上皮赘生物、非浸润性低级别乳头状尿路上皮癌、非浸润性高级别乳头状尿路上皮癌和“扁平”原位癌(CIS)以及这些患者的子集的尿液细胞中。因此,TERT启动子突变已被确定为BC中最常见的遗传改变。人TERT启动子序列是本领域已知的。
可以通过用于检测本文所述的突变的任何示例性技术来检测本文所述的一个或多个基因中的遗传生物标记物(例如,突变)。此外,本领域普通技术人员将知道用于检测这些基因中的遗传生物标记物(例如,突变)的其他合适方法。
在一些实施方案中,本文提供的方法包括在从受试者获得的样品(例如,尿液样品)中检测一个或多个以下基因中一个或多个遗传生物标记物(例如,突变)的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,TERT启动子中至少一个遗传生物标记物(例如,至少一个突变)的存在,或两者。在一些实施方案中,样品是尿液样品。在本文提供的一些实施方案中,方法包括从样品的其余部分中分离此类细胞。例如,细胞可以与样品的其他组分完全分离,或者可以分离到一定程度,使得分离的细胞仅包含样品中少量的其他物质。在一些实施方案中,可以使用本文提供的各种方法中的任一种来测定从样品中分离的细胞中存在的核酸中遗传生物标记物的存在和/或从样品中分离的细胞中非整倍性的存在。例如,可以从样品中分离细胞中存在的核酸,并测定一个或多个遗传生物标记物的存在和/或非整倍性的存在。在一些实施方案中,在分离细胞的核酸进行分析之前,不从样品中分离细胞。在一些实施方案中,样品包括在一个或多个基因(例如,TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中携带一个或多个遗传生物标记物(例如,突变)、在TERT启动子中携带至少一个遗传生物标记物(例如,突变)和/或携带非整倍性(例如,单倍体或三倍体)的核酸,所述核酸根据本文公开的各种方法中的任一种进行测定。如本领域普通技术人员将理解的,此类核酸可以代表从癌细胞(例如,膀胱癌细胞或来自UTUC的细胞)脱落的核酸,并且因此可以使用本文提供的各种方法中的任一种来测定,以确定受试者中癌症的存在。
在一些实施方案中,本文提供的方法包括在从受试者获得的样品(例如,尿液样品)中检测一个或多个以下基因中一个或多个遗传生物标记物(例如,突变)的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,TERT启动子中至少一个遗传生物标记物(例如,突变)的存在,或两者,其中遗传生物标记物中的至少一个(例如,突变中的至少一个)以低频率存在于样品中。例如,当遗传生物标记物(例如,突变)存在于样品中的0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%或更少的细胞中时,本文提供的方法可以检测所述遗传生物标记物(例如,突变)。在一些实施方案中,当遗传生物标记物(例如,突变)存在于样品中的0.03%或更少的细胞中时,本文提供的方法可以检测所述遗传生物标记物(例如,突变)。在一些实施方案中,当遗传生物标记物(例如,突变)存在于样品中存在的小于0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%或1%的总核酸中时,本文提供的方法可以检测所述遗传生物标记物(例如,突变)。
在本文公开的各种方法中的任一种的一些实施方案中,其中检测一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)的存在和/或TERT启动子中至少一个遗传生物标记物(例如,突变)的存在,细胞学检查可与所述方法组合执行或者独立于所述方法执行。例如,细胞学检查可以与本文公开的各种方法中的任一种组合执行,以改善受试者中癌症(例如,膀胱癌或UTUC)的检测。在一些实施方案中,将细胞学检查与检测一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)的存在和/或TERT启动子中至少一个遗传生物标记物(例如,突变)的存在组合执行,与单独的细胞学检查相比增加测定的敏感性(例如,增加至少10%、20%、30%、40%、50%、60%或更多)。在一些实施方案中,将细胞学检查与检测一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)的存在和/或TERT启动子中至少一个突变(例如,TERT启动子中的遗传生物标记物)的存在组合执行,与单独的细胞学检查相比增加测定的特异性(例如,增加至少10%、20%、30%、40%、50%、60%或更多)。在一些实施方案中,将细胞学检查与检测一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)的存在和/或TERT启动子中至少一个遗传生物标记物(例如,突变)的存在组合执行,允许检测单独的细胞学检查原本无法检测到或仅很少检测到的癌症(例如,低级别肿瘤)。作为另一个实例,一旦通过检测一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)和/或TERT启动子中至少一个遗传生物标记物(例如,突变)的存在确定了癌症(例如,膀胱癌或UTUC)的存在,就可以独立地执行细胞学检查以确认所述癌症的存在。在一些实施方案中,本文提供的方法包括检测以下每一个:一个或多个基因(例如TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)的存在、TERT启动子中至少一个遗传生物标记物(例如,突变)的存在,以及执行细胞学检查。
在一些实施方案中,可以对先前已经经历过癌症(例如,膀胱癌或UTUC)治疗的受试者执行本文公开的各种方法中的任一种。在一些实施方案中,本文提供的方法可以用于确定治疗的功效。例如,可以向患有膀胱癌或UTUC的受试者施用治疗(在本文中也称为“治疗性干预”),此后癌症的持续存在或癌症的量(或其缺乏)通过检测一个或多个基因(例如,TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL)中一个或多个遗传生物标记物(例如,突变)的存在、非整倍性(例如,单体性或三体性)的存在和/或TERT启动子中至少一个遗传生物标记物(例如,突变)的存在来确定。
本文提供的方法的一些实施方案包括测试细胞学标本的癌症。在一些实施方案中,一种或多种细胞学测试用于诊断或筛选。在一些实施方案中,一种或多种细胞学测试用于诊断癌症。在一些实施方案中,一种或多种细胞学测试用于筛选癌症。在一些实施方案中,一种或多种细胞学测试用于分类疾病或病状。在一些实施方案中,一种或多种细胞学测试用于分类癌症。
可以使用各种方法来收集样品,包括但不限于针吸细胞学检查(例如,细针抽吸)、脱落细胞学检查(例如,印压涂片和组织刮擦)、膀胱镜检查。
在一些实施方案中,细胞学测试包括肉眼检查。在一些实施方案中,细胞学测试包括组织学检查。在一些实施方案中,细胞学测试包括冷冻切片检查。在一些实施方案中,细胞学测试与另一种方法或测试一起施用。在一些实施方案中,另一种方法或测试包括组织化学染色。在一些实施方案中,另一种方法或测试包括免疫组织化学染色。在一些实施方案中,另一种方法或测试包括电子显微镜检查。在一些实施方案中,另一种方法或测试包括流式细胞术。在一些实施方案中,另一种方法或测试包括图像细胞术。在一些实施方案中,另一种方法或测试包括遗传测试。例如,遗传测试可以包括但不限于细胞遗传测试、荧光原位杂交(FISH)测试和/或分子遗传测试。
在一些实施方案中,对细胞学样品(例如,还对其执行细胞学检查的样品)使用分子遗传测试来检测PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A中一个或多个遗传生物标记物(例如,突变)的存在。在一些实施方案中,对细胞学样品(例如,还对其执行细胞学检查的样品)使用分子遗传测试来检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL中一个或多个遗传生物标记物(例如,突变)的存在。在一些实施方案中,对细胞学样品(例如,还对其执行细胞学检查的样品)使用分子遗传测试来检测NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A中一个或多个遗传生物标记物(例如,突变)的存在。在一些实施方案中,对细胞学样品(例如,还对其执行细胞学检查的样品)使用分子遗传测试来检测TP53L中一个或多个遗传生物标记物(例如,突变)的存在。
蛋白质生物标记物与非整倍性的组合
一方面,本文提供了用于在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在来诊断或鉴定受试者中疾病的存在(例如,鉴定受试者患有癌症)的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定将对或可能对治疗有反应的受试者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定受试者为进行进一步诊断测试的候选者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在来鉴定受试者为进行增加监测的候选者的方法和材料。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法在癌症的检测或诊断中提供高敏感性(例如,正确鉴定受试者患有癌症的高频率或发生率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测一组标记物生物标记物的一个或多个成员的存在和非整倍性的存在的方法在癌症的检测或诊断中提供的敏感性(例如,正确鉴定受试者患有癌症的高频率或发生率)高于通过分别检测蛋白质生物标记物组套的一个或多个成员的存在或非整倍性的存在而提供的敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料提供至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料在检测单个类型的癌症时提供高敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料在检测两个或更多个类型的癌症时提供高敏感性。各种癌症类型中的任一种可以使用本文提供的方法和材料来检测(参见例如,标题为“癌症”的部分)。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料检测的癌症包括胰腺癌。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料检测的癌症包括肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌或乳腺癌。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料检测的癌症包括女性生殖道的癌症(例如,宫颈癌、子宫内膜癌、卵巢癌或输卵管癌)。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料检测的癌症包括膀胱癌或上尿路尿路上皮癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法在癌症的检测或诊断中提供高特异性(例如,当受试者没有癌症时,错误地鉴定所述受试者患有癌症的低频率或发生率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测一组标记物生物标记物的一个或多个成员的存在和非整倍性的存在的方法在癌症的检测或诊断中提供的特异性(例如,正确鉴定受试者患有癌症的高频率或发生率)高于通过分别检测蛋白质生物标记物组套的一个或多个成员的存在或非整倍性的存在而提供的特异性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料提供至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的特异性。如本领域普通技术人员将理解的,99%的特异性意指仅1%的没有癌症的受试者被错误地鉴定为患有癌症。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料在检测单个癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述单个癌症类型的很低的概率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法和材料在检测两种或更多种癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述两种或更多种癌症类型的很低的概率)。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和髓过氧化物酶(MPO),以及非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),以及2)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,以及2)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测遗传生物标记物组套的一个或多个成员的存在和蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下物质的存在:1)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,以及2)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症之一或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF和OPN,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法包括检测以下物质的存在:1)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN,以及2)非整倍性的存在,受试者被确定为患有(例如,被诊断为患有)胰腺癌或被确定为(例如,被诊断为)具有升高的患有或发展胰腺癌的风险。
从受试者获得的样品可以是本文所述的含有DNA(例如,血液中的ctDNA,或存在于膀胱宫颈、子宫内膜或子宫样品中的DNA)和/或蛋白质的各种样品中的任一种。在一些实施方案中,从受试者获得的样品中的DNA(例如,无细胞DNA(例如,ctDNA),或存在于膀胱、宫颈、子宫内膜或子宫样品中的DNA)和/或蛋白质来源于肿瘤细胞。在一些实施方案中,从受试者获得的样品中的DNA(例如,无细胞DNA(例如,ctDNA)包括一个或多个遗传生物标记物和或非整倍体DNA。在一些实施方案中,从受试者获得的样品中的蛋白质包括一个或多个蛋白质生物标记物。可以检测遗传生物标记物和/或蛋白质生物标记物和/或非整倍性的样品的非限制性实例包括血液样品、血浆样品、血清样品、尿液样品、子宫内膜样品、宫颈样品和子宫样品。在一些实施方案中,在从受试者获得的单个样品中检测一个或多个蛋白质生物标记物的存在和非整倍性的存在。在一些实施方案中,在从受试者获得的第一样品中检测一个或多个蛋白质生物标记物的存在,并且在从受试者获得的第二样品中检测非整倍性的存在。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在(例如,蛋白质生物标记物组套的每个成员)和非整倍性的存在的方法,可以检测到所述蛋白质生物标记物组套的一个或多个成员的升高水平。例如,蛋白质生物标记物的升高水平可以是高于参考水平的水平。参考水平可以是与癌症的存在无关的蛋白质生物标记物的任何水平。例如,蛋白质生物标记物的参考水平可以是在没有癌症或不携带癌细胞的参考受试者中存在的水平。蛋白质生物标记物的参考水平可以是在没有癌症或不携带癌细胞的多个参考受试者中存在的平均水平。被确定患有癌症的受试者中的蛋白质生物标记物的参考水平可以是癌症发作之前受试者中存在的水平。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以升高水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7个或每一个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以升高水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7、8、9或10个或每一个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以升高水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7、8个或每一个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以升高水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3个或每一个):CA19-9、CEA、HGF和/或OPN。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在(例如,蛋白质生物标记物组套的每个成员)和非整倍性的存在的方法,可以检测到所述蛋白质生物标记物组套的一个或多个成员的降低水平。例如,蛋白质生物标记物的降低水平可以是低于参考水平的水平。参考水平可以是与癌症的存在无关的蛋白质生物标记物的任何水平。例如,蛋白质生物标记物的参考水平可以是在没有癌症或不携带癌细胞的参考受试者中存在的水平。蛋白质生物标记物的参考水平可以是在没有癌症或不携带癌细胞的多个参考受试者中存在的平均水平。被确定患有癌症的受试者中的蛋白质生物标记物的参考水平可以是癌症发作之前受试者中存在的水平。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以降低水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7个或每一个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以降低水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7、8、9或10个或每一个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以降低水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3、4、5、6、7、8个或每一个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在一些实施方案中,其中蛋白质生物标记物组套的一个或多个成员以降低水平存在的所述蛋白质生物标记物组套包括以下中的一个或多个(例如,1、2、3个或每一个):CA19-9、CEA、HGF和/或OPN。
在一些实施方案中,当受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险(例如,通过检测:1)非整倍性的存在,以及2)在本文中描述为可与非整倍性的存在一起使用的任一组中一个或多个蛋白质生物标记物的存在)时,所述受试者被选择作为进一步诊断测试(例如,本文所述的各种进一步诊断测试方法中的任一种)的候选者(例如,被选择用于进一步诊断测试),所述受试者被选择作为增加监测(例如,本文所述的各种增加监测方法中的任一种)的候选者(例如,被选择用于增加监测),所述受试者被鉴定为将对或可能对治疗有反应的受试者(例如,本文所述的各种治疗性干预中的任一种),所述受试者被选择为治疗的候选者(例如,被选择用于治疗),选择对于所述受试者的治疗(例如,本文所述的各种治疗性干预中的任一种),和/或向受试者施用治疗(例如,本文所述的各种治疗性干预中的任一种)。例如,当受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险时,受试者可以经历进一步诊断测试,所述进一步诊断测试可以确认受试者中癌症的存在。另外或替代地,可以增加的频率来监测受试者。在受试者被确定为患有(例如,被诊断为患有)癌症或被确定为(例如,被诊断为)具有升高的患有或发展癌症的风险的一些实施方案中,其中所述受试者经历进一步诊断测试和/或增加监测,可以向所述受试者额外施用治疗性干预。在一些实施方案中,在向受试者施用治疗性干预之后,所述受试者经历额外的进一步诊断测试(例如,与先前进行的相同类型的进一步诊断测试和/或不同类型的进一步诊断测试)和/或继续增加监测(例如,以与先前相同或不同的频率进行的增加监测)。在实施方案中,在向受试者施用治疗性干预并且所述受试者经历额外的进一步诊断测试和/或额外的增加监测之后,向所述受试者施用另一种治疗性干预(例如,与先前施用的相同的治疗性干预和/或不同的治疗性干预)。在一些实施方案中,在向受试者施用治疗性干预后,测试受试者中1)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物的存在:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),以及2)非整倍性的存在。在一些实施方案中,在向受试者施用治疗性干预后,测试受试者中1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物的存在:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,以及2)非整倍性的存在。在一些实施方案中,在向受试者施用治疗性干预后,测试受试者中1)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物的存在:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,以及2)非整倍性的存在。在一些实施方案中,在向受试者施用治疗性干预后,测试受试者中1)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物的存在:CA19-9、CEA、HGF和/或OPN,以及2)非整倍性的存在。
在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,所述方法还包括在从受试者获得的一个或多个样品(例如,用于检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测遗传生物标记物组套的一个或多个成员的存在。可以检测各个遗传生物标记物中的任一个(例如,本文所述的各个遗传生物标记物和/或遗传生物标记物组套中的任一个)。
在一些实施方案中,本文提供的方法包括在从受试者获得的一个或多个样品中检测以下物质的存在:1)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),以及2)非整倍性的存在,所述方法还包括在从受试者获得的一个或多个样品(例如,用于检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测遗传生物标记物组套的一个或多个成员的存在。在一些实施方案中,本文提供的方法包括在从受试者获得的一个或多个样品中检测以下物质的存在:1)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和髓过氧化物酶(MPO),以及非整倍性的存在,所述方法还包括在从受试者获得的一个或多个样品(例如,用于检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测遗传生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),2)非整倍性的存在,以及3)遗传生物标记物组套的一个或多个成员的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,以及2)非整倍性的存在,所述方法还包括在从受试者获得的一个或多个样品(例如,用于检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测遗传生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3,以及2)非整倍性的存在,所述方法还包括在从受试者获得的一个或多个样品(例如,用于检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测遗传生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,2)非整倍性的存在,以及3)遗传生物标记物组套的一个或多个成员的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在本文提供的在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,以及2)非整倍性的存在,所述方法还包括在从受试者获得的一个或多个样品(例如,用于检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测遗传生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3,以及2)非整倍性的存在,所述方法还包括在从受试者获得的一个或多个样品(例如,用于检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测遗传生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3,2)非整倍性的存在,以及3)遗传生物标记物组套的一个或多个成员的存在,受试者被确定为患有(例如,被诊断为患有)以下类型的癌症或被确定为(例如,被诊断为)具有升高的患有或发展以下类型的癌症之一的风险:肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和/或乳腺癌。
在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN,以及2)非整倍性的存在,所述方法还包括在从受试者获得的一个或多个样品(例如,用于检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在一者或两者的同一样品,或不同的样品)中检测遗传生物标记物组套的一个或多个成员的存在。在本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在的方法的一些实施方案中:1)以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF和OPN,以及2)非整倍性的存在。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测以下物质的存在:1)一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN,2)非整倍性的存在,以及3)遗传生物标记物组套的一个或多个成员的存在,受试者被确定为患有(例如,被诊断为患有)胰腺癌或被确定为(例如,被诊断为)具有升高的患有或发展胰腺癌的风险。
在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS。在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下基因的每一个中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS。
在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测一个或多个(例如,1、2、3或4个)以下基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和/或SMAD4。在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下基因的每一个中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和SMAD4。
在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因中的一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL。在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下基因的每一个中的一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL。
在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因中的一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A。在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下基因的每一个中的一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A。
在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11或12个)以下基因中的一个或多个遗传生物标记物:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A。在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下基因的每一个中的一个或多个遗传生物标记物:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和PPP2R1A。
在本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中的一个或多个遗传生物标记物:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN和/或TP53。在本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在和非整倍性的存在的方法的一些实施方案中,可以进一步检测以下基因的每一个中的一个或多个蛋白质生物标记物:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN和TP53。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测蛋白质生物标记物组套的一个或多个成员的存在和非整倍性的存在的各种方法中的任一种还包括检测一个或多个额外类别的生物标记物的一个或多个成员的存在。此类额外类别的生物标记物的非限制性实例包括:拷贝数变化、DNA甲基化变化、其他核酸(例如,mRNA、miRNA、lncRNA、circRNA、mtDNA、端粒DNA、易位和基因组重排)、肽和/或代谢物。
在一些实施方案中,一个或多个额外类别的生物标记物包括代谢物生物标记物。在一些实施方案中,如果生物样品含有一种或多种指示癌症的代谢物,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的代谢物,则受试者被确定为患有癌症。指示癌症的代谢物的非限制性实例包括:5-甲基硫代腺苷(MTA)、还原型谷胱甘肽(GSH)、N-乙酰谷氨酸盐、乳糖、N-乙酰神经氨酸盐、UDP-乙酰氨基葡萄糖、UDP-乙酰半乳糖胺、UDP-葡糖醛酸盐、泛酸盐、花生四烯酸盐(20:4n6)、胆碱、胞苷5′-二磷酸胆碱、二高亚麻酸盐(20:3n3)、二十二碳五烯酸盐(DPA 22:5n3)、二十碳五烯酸盐(EPA 20:5n3)、甘油磷酰胆碱(GPC)、二十二碳六烯酸盐(DHA 22:6n3)、亚油酸盐(18:2n6)、5′-单磷酸胞苷(5′-CMP)、γ-谷氨酰谷氨酸盐、X-14577、X-11583、异戊酰肉碱、磷酸肌酸、2-氨基己二酸、葡萄糖酸、O-乙酰肉碱、天冬氨酸、脱酰胺基-NAD+、谷氨酸、异丁酰肉碱、肉碱、吡哆醛、柠檬酸、腺苷、ATP、缬氨酸、XC0061、异亮氨酸、γ-丁酰甜菜碱、乳酸、丙氨酸、苯丙氨酸、葡糖酸内酯、亮氨酸、二价谷胱甘肽(GSSG)、酪氨酸、NAD+、XC0016、UTP、肌酸、可可碱、CTP、GTP、3-甲基组氨酸、琥珀酸、3-磷酸甘油、谷氨酰胺、5-氧脯氨酸、硫胺素、丁酰肉碱、4-乙酰胺基丁酸、UDP-葡萄糖、UDP-半乳糖、苏氨酸、N-乙酰甘氨酸、脯氨酸、ADP、胆碱、苹果酸、S-腺苷甲硫氨酸、泛酸、半胱氨酸亚磺酸、6-氨基己酸、高半胱氨酸、羟脯氨酸、甲硫氨酸亚砜、3-胍基丙酸、6-磷酸葡萄糖、苯乙尿酸、苏糖酸、色氨酸、吡哆醇、N-乙酰天冬氨酸、4-胍基丁酸、丝氨酸、瓜氨酸、甜菜碱、N-乙酰天冬酰胺、2-羟基戊二酸、精氨酸、谷胱甘肽(GSH)、肌酐、磷酸二羟丙酮、组氨酸、甘氨酸、1-磷酸葡萄糖、N-甲酰基甘氨酸、酮洛芬、赖氨酸、β-丙氨酸、N-乙酰谷氨酸、2-氨基-2-(羟甲基)-1,3-丙二醇、鸟氨酸、磷酸胆碱、甘油磷酸胆碱、对苯二甲酸、3-磷酸甘油醛、Gly-Asp、牛磺酸、1,6-二磷酸果糖、3-氨基异丁酸、亚精胺、GABA、三乙醇胺、甘油、N-乙酰丝氨酸、N-乙酰鸟氨酸、二乙醇胺、AMP、半胱氨酸谷胱甘肽二硫化物、二价硫酸链霉素+H2O、反式谷氨酸、烟酸、异丁胺、甜菜碱醛+H2O、尿刊酸、1-氨基环丙烷-1-羧酸高丝氨酸内酯、5-氨基戊酸、3-羟基丁酸、乙醇胺、异戊酸、N-甲基谷氨酸、胱硫醚、精胺、肌肽、1-甲基烟酰胺、N-乙酰神经氨酸、肌氨酸、GDP、N-甲基丙氨酸、棕榈酸、1,2-二油酰基-sn-甘油-3-磷酸-rac-甘油胆固醇5α,6α环氧羊毛甾醇、木蜡酸、1油酰基_rac_GL、胆固醇_环氧化物、芥酸、T-LCA、油酰基-L-肉碱、齐墩果酸、3-磷酸甘油酸盐、5-羟基正缬氨酸、5-甲氧基色胺、5-单磷酸腺苷、α-酮戊二酸盐、天冬酰胺、苯甲酸、次黄嘌呤、麦芽糖、麦芽三糖、甲硫氨酸亚砜、降烟碱、苯酚、磷酸乙醇胺、焦磷酸盐、丙酮酸、奎尼酸、牛磺酸、尿酸、肌苷、乳酰胺、5-羟基正缬氨酸NIST、胆固醇、脱氧戊糖醇、2-羟基雌酮、2-羟基雌二醇、2-甲基雌酮、2-甲氧基雌二醇、2-羟基雌酮-3-甲基醚、4-羟基雌酮、4-甲氧基雌酮、4-甲氧基雌二醇、16α-羟基雌酮、17-表雌三醇、雌三醇、16-酮雌二醇、16-表雌三醇、酰基肉碱C18:1、氨基酸瓜氨酸和反式4-羟基脯氨酸、甘油磷脂PC aa C28:1、PC aeC30:0和PC ae C30:2以及鞘脂SM(OH)C14:1。参见例如,Halama等人,Nesting of colonand ovarian cancer cells in the endothelial niche is associated withalterations in glycan and lipid metabolism,Scientific Reports第7卷,论文编号:39999(2017);Hur等人,Systems approach to characterize the metabolism of livercancer stem cells expressing CD133,Sci Rep.,7:45557,doi:10.1038/srep45557,(2017);Eliassen等人,Urinary Estrogens and Estrogen Metabolites and SubsequentRisk of Breast Cancer among Premenopausal Women,Cancer Res;72(3);696-706(2011);Gangi等人,Metabolomic profile in pancreatic cancer patients:aconsensus-based approach to identify highly discriminating metabolites,Oncotarget,2月2日;7(5):5815-5829(2016);Kumar等人,Serum and Plasma MetabolomicBiomarkers for Lung Cancer,Bioinformation,13(6):202-208,doi:10.6026/97320630013202(2017);Schmidt等人,Pre-diagnostic metabolite concentrations andprostate cancer risk in 1077 cases and 1077 matched controls in the EuropeanProspective Investigation into Cancer and Nutrition,BMC Med.,15:122,doi:10.1186/s12916-017-0885-6(2017);其中的每个以引用的方式整体并入本文。
在一些实施方案中,一个或多个额外类别的生物标记物包括肽(例如,与本文所述的可用于一种或多种方法的各个蛋白质生物标记物不同的肽)。在一些实施方案中,如果生物样品含有一种或多种指示癌症的肽,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的肽,则受试者被确定为患有癌症。在一些实施方案中,肽来源于蛋白质(例如,所述肽包含存在于蛋白质生物标记物或不同蛋白质中的氨基酸序列)。指示癌症的肽的非限制性实例包括以下肽和来源于以下蛋白质的肽:CEACAM、CYFRA21-1、CA125、PKLK、ProGRP、NSE、TPA 6、TPA 7、TPA 8、NRG、NRG100、CNDP、APOB100、SCC、VEGF、EGFR、PIK3CA、HER2、BRAF、ROS、RET、NRAS、MET、MEK1、HER2、C4.4A、PSF3、FAM83B、ECD、CTNNB、VIM、S100A4、S100A7、COX2、MUC1、KLKB1、SAA、HP-β链、C9、Pgrmc1、Ciz1、转铁蛋白、α-1抗胰蛋白酶、载脂蛋白1、补体c3a、窖蛋白-1、激肽释放酶6、葡萄糖调节蛋白-8、α防御素-1、-2、-3、血清C-肽、α-2-HS乙二醇蛋白、胰蛋白酶KRT 8肽、血浆乙二醇蛋白、连环蛋白、防御素α6、MMP、细胞周期蛋白D、S100P、核纤层蛋白A/C丝蛋白、热休克蛋白、醛脱氢酶、Txl-2(硫氧还蛋白样蛋白-2)、P53、nm23、u-PA、VEGF、Eph B4、CRABP2、WT-1、Rab-3D、间皮素、ERα、ANXA4、PSAT1、SPB5、CEA5、CEA6、A1AT、SLPI、APOA4、VDBP、HE4、IL-1、IL-6、IL-7、IL-8、IL-10、IL-11、IL-12、IL-16、IL-18、IL-21、IL-23、IL-28A、IL-33、LIF、TNFR1-2、HVEM(TNFRSF14)、IL1R-a、IL1R-b、IL-2R、M-CSF、MIP-1a、TNF-α、CD40、RANTES、CD40L、MIF、IFN-β、MCP-4(CCL13)、MIG(CXCL9)、MIP-1δ(CCL15)、MIP3a(CCL20)、MIP-4(CCL18)、MPIF-1、SDF-1a+b(CXCL12)、CD137/4-1BB、淋巴细胞趋化因子(XCL1)、嗜酸性粒细胞趋化因子-1(CCL11)、嗜酸性粒细胞趋化因子-2(CCL24)、6Ckine/CCL21)、BLC(CXCL13)、CTACK(CCL27)、BCA-1(CXCL13)、HCC4(CCL16)、CTAP-3(CXCL7)、IGF1、VEGF、VEGFR3、EGFR、ErbB2、CTGF、PDGF AA、PDGF BB、PDGFRb、bFGF、TGFbRIII、β-细胞素、IGFBP1-4、IGFBP1-6、BDNF、PEDF、血管生成素-2、肾素、溶血磷脂酸、β2-微球蛋白、唾液酸TN(sialylTN)、ACE、CA 19-9、CEA、CA 15-3、CA-50、CA 72-4、OVX1、间皮素、唾液酸TN、MMP-2、-3、-7、-9、VAP-1、TIMP1-2、肌腱蛋白C、VCAM-1、骨桥蛋白、KIM-1、NCAM、四连接素、巢蛋白-2、组织蛋白酶L、前列腺蛋白、蛋白裂解酶、激肽释放酶2、6、10、胱抑素C、紧密连接蛋白、脊椎蛋白2、SLPI、bHCG、尿促性腺激素肽、抑制素、瘦素、脂联素、GH、TSH、ACTH、PRL、FSH、LH、皮质醇、TTR、骨钙素、胰岛素、饥饿素、GIP、GLP-1、胰淀素、胰高血糖素、肽YY、卵泡抑素、铁调素、CRP、Apo A1、CIII、H、转甲状腺素蛋白、SAA、SAP、补体C3、4、补体因子H、白蛋白、铜蓝蛋白、结合珠蛋白、β-血红蛋白、转铁蛋白、铁蛋白、纤维蛋白原、凝血酶、血管性血友病因子、肌红蛋白、免疫抑制酸性蛋白、脂质结合唾液酸、S100A12(EN-RAGE)、胎球蛋白A、聚集素、α1-抗胰蛋白酶、a2-巨球蛋白、丝氨酸蛋白酶抑制剂1(人纤溶酶原激活物抑制剂-1)、Cox-1、Hsp27、Hsp60、Hsp80、Hsp90、凝集素型氧化LDL受体1、CD14、脂质运载蛋白2、ITIH4、sFasL、Cyfra21-1、TPA、穿孔素、DcR3、AGRP、肌酸激酶-MB、人乳脂肪球1-2、NT-Pro-BNP、神经元特异性烯醇化酶、CASA、NB/70K、AFP、afamin、胶原蛋白、抗增殖蛋白、角蛋白-6、PARC、B7-H4、YK-L40、AFP-L3、DCP、GPC3、OPN、GP73、CK19、MDK、A2、5-HIAA、CA15-3、CA19-9、CA27.29、CA72-4、降钙素、CGA、BRAF V600E、BAP、BCT-ABL融合蛋白、KIT、KRAS、PSA、乳酸脱氢酶、NMP22、PAI-1、uPA、纤维蛋白D-二聚体、S100、TPA、甲状腺球蛋白、CD20、CD24、CD44、RS/DJ-1、p53、α-2-HS-糖蛋白、亲脂素B、β-珠蛋白、血液结合素、UBE2N、PSMB6、PPP1CB、CPT2、COPA、MSK1/2、Pro-NPY、分离蛋白-1、纽蛋白、NAAA、PTK7、TFG、MCCC2、TRAP1、IMPDH2、PTEN、POSTN、EPLIN、eIF4A3、DDAH1、ARG2、PRDX3&4、P4HB、YWHAG、烯酰辅酶A水合酶、PHB、TUBB、KRT2、DES、HSP71、ATP5B、CKB、HSPD1、LMNA、EZH2、AMACR、FABP5、PPA2、EZR、SLP2、SM22、Bax、Smac/Diablo磷酸化Bcl2、STAT3和Smac/Diablo表达、PHB、PAP、AMACR、PSMA、FKBP4、PRDX4、KRT7/8/18、GSTP1、NDPK1、MTX2、GDF15、PCa-24、窖蛋白-2、凝血酶原、抗凝血酶-III、结合珠蛋白、血清淀粉样蛋白A-1蛋白、ZAG、ORM2、APOC3、CALML5、IGFBP2、MUC5AC、PNLIP、PZP、TIMP1、AMBP、间-α-胰蛋白酶抑制剂重链H1、间-α-胰蛋白酶抑制剂重链H2、间-α-胰蛋白酶抑制剂重链H3、V型质子ATP酶亚基B肾同种型、肝细胞生长因子样蛋白、血清淀粉样蛋白P-组分、酰基甘油激酶、含有富亮氨酸重复序列的蛋白质9、β-2-糖蛋白1、血浆蛋白酶C1抑制剂、含有脂氧合酶同源结构域的蛋白质1、原钙粘蛋白α-13。参见例如,Kuppusamy等人,第24卷,第6期,2017年9月,第1212-1221页;Elzek和Rodland,Cancer Metastasis Rev.2015年3月;34(1):83-96;Noel和Lokshin,Future Oncol.2012年1月;8(1):55-71;Tsuchiya等人,WorldJGastroenterol.2015年10月7日;21(37):10573-10583;Lou等人,Biomark Cancer.2017;9:1-9;Park等人,Oncotarget.2017年6月27日;8(26):42761-42771;Saraswat等人,CancerMed.2017年7月;6(7):1738-1751;Zamay等人,Cancers(Basel).2017年11月;9(11):155;Tanase等人,Oncotarget.2017年3月14日;8(11):18497-18512,其中的每个以引用的方式整体并入本文。
在一些实施方案中,一个或多个额外类别的生物标记物包括核酸病变或变异(例如,与本文所述的可用于一种或多种方法的各个遗传生物标记物不同的核酸病变或变异)。在一些实施方案中,如果生物样品含有一种或多种指示癌症的核酸病变或变异,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的核酸病变或变异,则受试者被确定为患有癌症。核酸病变或变异的非限制性实例包括拷贝数变化、DNA甲基化变化和/或其他核酸(例如,mRNA、miRNA、lncRNA、circRNA、mtDNA、端粒DNA、易位和基因组重排)。易位和基因组重排已与各种癌症(例如,前列腺癌、胶质瘤、肺癌、非小细胞肺癌、黑色素瘤和甲状腺癌)相关,并且已用作生物标记物多年(例如,Demeure等人,2014,World J Surg.,38:1296-305;Hogenbirk等人,2016,PNASUSA,113:E3649-56;Gasi等人,2011,PLoS One,6:e16332;Ogiwara等人,2008,Oncogene,27:4788-97;美国专利号9,745,632;以及美国专利号6,576,420)。另外,拷贝数变化已用作各种癌症的生物标记物,所述癌症包括但不限于头颈部鳞状细胞癌、淋巴瘤(例如,非霍奇金淋巴瘤)和结直肠癌(Kumar等人,2017,Tumour Biol,39:1010428317740296;Kumar等人,2017,Tumour Biol.,39:1010428317736643;Henrique等人,2014,ExpertRev.Mol.Diagn.,14:419-22;以及美国专利号9,816,139)。DNA甲基化和DNA甲基化变化(例如,低甲基化,超甲基化)也被用作癌症的生物标记物。例如,低甲基化已与肝细胞癌(参见例如,Henrique等人,2014,Expert Rev.Mol.Diagn.,14:419-22)、食管癌变(参见例如,Alvarez等人,2011,PLoS Genet.,7:e1001356)以及胃和肝癌(参见例如,美国专利号8,728,732)相关联,并且超甲基化已与结直肠癌相关联(参见例如,美国专利号9,957,570;)。除了全基因组甲基化变化之外,特定基因内的特定甲基化变化也可以指示特定的癌症(参见例如,美国专利号8,150,626)。Li等人(2012,J.Epidemiol.,22:384-94)提供了多种癌症(例如,乳腺癌、膀胱癌、胃癌、肺癌、前列腺癌、头颈部鳞状细胞癌和鼻咽癌)与异常甲基化之间的关联的综述。另外或替代地,其他类型的核酸或核酸特征已与各种癌症相关联。此类核酸或核酸特征的非限制性实例包括各种微小RNA(miRNA)的存在或不存在,其已用于诊断结肠癌、前列腺癌、结直肠癌和卵巢癌(参见例如,D′Souza等人,2018,PLos One,13:e0194268;Fukagawa等人,2017,Cancer Sci.,108:886-96;Giraldez等人,2018,MethodsMol.Biol.,1768:459-74;美国专利号8,343,718;9,410,956;以及9,074,206)。关于miR-22与癌症的特定关联的综述,参见Wang等人(2017,Int.J.Oncol.,50:345-55);长非编码RNA(lncRNA)的异常表达也用作癌症的生物标记物,所述癌症诸如前列腺癌、结直肠癌、宫颈癌、黑色素瘤、非小细胞肺癌、胃癌、子宫内膜癌和肝细胞癌(参见例如,Wang等人,2017,Oncotarget,8:58577086;Wang等人,2018,Mol.Cancer,17:110;Yu等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:4812-9;Yu等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:993-1002;Zhang等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:4820-7;Zhang等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:2304-9;Xie等人,2018,EBioMedicine,33:57-67;以及美国专利号9,410,206);环状RNA(circRNA)的存在或不存在已用作肺癌、乳腺癌、胃癌、结直肠癌和肝癌(例如,Geng等人,2018,J.Hematol.Oncol.,11:98)和黑色素瘤(例如,Zhang等人,2018,Oncol.Lett.,16:1219-25)的生物标记物;端粒DNA的变化(例如,长度或杂合性的变化)或着丝粒DNA的变化(例如,着丝粒基因表达的变化)也已与癌症(例如,前列腺癌、乳腺癌、肺癌、淋巴瘤和尤文氏肉瘤)相关联(参见例如,Baretton等人,1994,CancerRes.,54:4472-80;Liscia等人,1999,Br.J.Cancer,80:821-6;Proctor等人,2009,Biochim.Biophys.Acta,1792:260-74;以及Sun等人,2016,Int.J.Cancer,139:899-907);线粒体DNA(mtDNA)中的各种突变(例如,缺失)、重排和/或拷贝数变化已用于各种癌症(例如,前列腺癌、黑色素瘤、乳腺癌、肺癌和结直肠癌)的预后和诊断。参见例如,Maragh等人,2015,Cancer Biomark.,15:763-73;Shen等人,2010,Mitochondrion,10:62-68;Hosgood等人,2010,Carcinogen.,31:847-9;Thyagarajan等人,2012,Cancer Epid.Biomarkers&Prev.,21:1574-81;以及美国专利号9,745,632;并且信使RNA(mRNA)的异常存在、不存在或量也已与各种癌症相关,所述癌症包括但不限于乳腺癌、维尔姆斯瘤和宫颈癌(参见例如,Guetschow et al.,2012,Anal.Bioanaly.Chem.,404:399-406;Schwienbacher等人,2000,Cancer Res.,60:1521-5;以及Ngan等人,1997,Genitourin Med.,73:54-8)。这些引文中的每个以引用的方式整体并入本文。
单个类别的生物标记物或非整倍性
一方面,本文提供了用于在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在来诊断或鉴定受试者中疾病的存在(例如,鉴定受试者患有癌症)的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在来鉴定受试者具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在来治疗已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在来鉴定对于已被诊断或鉴定为患有疾病(例如,癌症)或已被鉴定为具有患有或发展疾病(例如,癌症)的风险(例如,增加的风险)的受试者的治疗的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在来鉴定将对或可能对治疗有反应的受试者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在来鉴定受试者为进行进一步诊断测试的候选者的方法和材料。另一方面,本文提供了通过在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在来鉴定受试者为进行增加监测的候选者的方法和材料。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法在癌症的检测或诊断中提供高敏感性(例如,正确鉴定受试者患有癌症的高频率或发生率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法提供至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法在检测单个类型的癌症时提供高敏感性。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法在检测两个或更多个类型的癌症时提供高敏感性。各种癌症类型中的任一种可以使用本文提供的方法和材料来检测(参见例如,标题为“癌症”的部分)。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法和材料检测的癌症包括肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌或乳腺癌。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法和材料检测的癌症包括胰腺癌。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法和材料检测的癌症包括女性生殖道的癌症(例如,宫颈癌、子宫内膜癌、卵巢癌或输卵管癌)。在一些实施方案中,可以使用包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法和材料检测的癌症包括膀胱癌或上尿路尿路上皮癌。
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法
在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法在癌症的检测或诊断中提供高特异性(例如,当受试者没有癌症时,错误地鉴定所述受试者患有癌症的低频率或发生率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法提供至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的特异性。如本领域普通技术人员将理解的,99%的特异性意指仅1%的没有癌症的受试者被错误地鉴定为患有癌症。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法在检测单个癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述单个癌症类型的很低的概率)。在一些实施方案中,本文提供的包括在从受试者获得的一个或多个样品中检测单个类别的生物标记物(例如,遗传生物标记物或蛋白质生物标记物)的一个或多个成员的存在或非整倍性的存在的方法在检测两种或更多种癌症时提供高特异性(例如,错误地鉴定所述受试者患有所述两种或更多种癌症类型的很低的概率)。
在一些实施方案中,本文提供的包括检测单个类别的生物标记物的一个或多个成员的存在的方法包括检测遗传生物标记物组套的一个或多个成员的存在。
在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个)以下基因中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS。在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测以下基因中的每一个中的一个或多个遗传生物标记物:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS。
在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3或4个)以下基因中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和/或SMAD4。在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测以下基因中的每一个中的一个或多个遗传生物标记物:KRAS(例如,密码子12和/或61中的遗传生物标记物)、TP53、CDKN2A和SMAD4。
在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因中的一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A。在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测以下基因中的每一个中的一个或多个遗传生物标记物:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A。在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11或12个)以下基因中的一个或多个遗传生物标记物:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A。在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测以下基因中的每一个中的一个或多个遗传生物标记物:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和PPP2R1A。在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测TP53中的一个或多个遗传生物标记物
在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因中的一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL。在一些实施方案中,本文提供的包括检测遗传生物标记物组套的一个或多个成员的存在的方法包括检测以下基因中的每一个中的一个或多个遗传生物标记物:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL。
在一些实施方案中,本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3、4、5、6、7、8、9或8个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在一些实施方案中,本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和髓过氧化物酶(MPO)。在一些实施方案中,本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3、4、5、6、7、8、9、10或11个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在一些实施方案中,本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3。在一些实施方案中,本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3、4、5、6、7、8或9个)以下蛋白质生物标记物:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在一些实施方案中,本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3。在一些实施方案中,本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测一个或多个(例如,1、2、3或4个)以下蛋白质生物标记物:CA19-9、CEA、HGF和/或OPN。在一些实施方案中,本文提供的包括检测蛋白质生物标记物组套的一个或多个成员的存在的方法包括检测以下蛋白质生物标记物中的每一个:CA19-9、CEA、HGF和OPN。
在一些实施方案中,本文提供的包括检测非整倍性的存在的方法包括检测染色体臂5q、8q和/或9p中的一个或多个上的非整倍性。在一些实施方案中,本文提供的包括检测非整倍性的存在的方法包括检测染色体臂4p、7q、8q和/或9q中的一个或多个上的非整倍性。
在一些实施方案中,本文提供的包括检测单个类别的生物标记物的一个或多个成员的存在的方法包括检测一类生物标记物的一个或多个成员的存在,其包括但不限于:拷贝数变化、DNA甲基化变化、其他核酸(例如,mRNA、miRNA、lncRNA、circRNA、mtDNA、端粒DNA、易位和基因组重排)、肽或代谢物。
在一些实施方案中,本文提供的方法包括检测一种或多种代谢物的存在。在一些实施方案中,如果生物样品含有一种或多种指示癌症的代谢物,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的代谢物,则受试者被确定为患有癌症。指示癌症的代谢物的非限制性实例包括:5-甲基硫代腺苷(MTA)、还原型谷胱甘肽(GSH)、N-乙酰谷氨酸盐、乳糖、N-乙酰神经氨酸盐、UDP-乙酰氨基葡萄糖、UDP-乙酰半乳糖胺、UDP-葡糖醛酸盐、泛酸盐、花生四烯酸盐(20:4n6)、胆碱、胞苷5′-二磷酸胆碱、二高亚麻酸盐(20:3n3)、二十二碳五烯酸盐(DPA 22:5n3)、二十碳五烯酸盐(EPA 20:5n3)、甘油磷酰胆碱(GPC)、二十二碳六烯酸盐(DHA 22:6n3)、亚油酸盐(18:2n6)、5′-单磷酸胞苷(5′-CMP)、γ-谷氨酰谷氨酸盐、X-14577、X-11583、异戊酰肉碱、磷酸肌酸、2-氨基己二酸、葡萄糖酸、O-乙酰肉碱、天冬氨酸、脱酰胺基-NAD+、谷氨酸、异丁酰肉碱、肉碱、吡哆醛、柠檬酸、腺苷、ATP、缬氨酸、XC0061、异亮氨酸、γ-丁酰甜菜碱、乳酸、丙氨酸、苯丙氨酸、葡糖酸内酯、亮氨酸、二价谷胱甘肽(GSSG)、酪氨酸、NAD+、XC0016、UTP、肌酸、可可碱、CTP、GTP、3-甲基组氨酸、琥珀酸、3-磷酸甘油、谷氨酰胺、5-氧脯氨酸、硫胺素、丁酰肉碱、4-乙酰胺基丁酸、UDP-葡萄糖、UDP-半乳糖、苏氨酸、N-乙酰甘氨酸、脯氨酸、ADP、胆碱、苹果酸、S-腺苷甲硫氨酸、泛酸、半胱氨酸亚磺酸、6-氨基己酸、高半胱氨酸、羟脯氨酸、甲硫氨酸亚砜、3-胍基丙酸、6-磷酸葡萄糖、苯乙尿酸、苏糖酸、色氨酸、吡哆醇、N-乙酰天冬氨酸、4-胍基丁酸、丝氨酸、瓜氨酸、甜菜碱、N-乙酰天冬酰胺、2-羟基戊二酸、精氨酸、谷胱甘肽(GSH)、肌酐、磷酸二羟丙酮、组氨酸、甘氨酸、1-磷酸葡萄糖、N-甲酰基甘氨酸、酮洛芬、赖氨酸、β-丙氨酸、N-乙酰谷氨酸、2-氨基-2-(羟甲基)-1,3-丙二醇、鸟氨酸、磷酸胆碱、甘油磷酸胆碱、对苯二甲酸、3-磷酸甘油醛、Gly-Asp、牛磺酸、1,6-二磷酸果糖、3-氨基异丁酸、亚精胺、GABA、三乙醇胺、甘油、N-乙酰丝氨酸、N-乙酰鸟氨酸、二乙醇胺、AMP、半胱氨酸谷胱甘肽二硫化物、二价硫酸链霉素+H2O、反式谷氨酸、烟酸、异丁胺、甜菜碱醛+H2O、尿刊酸、1-氨基环丙烷-1-羧酸高丝氨酸内酯、5-氨基戊酸、3-羟基丁酸、乙醇胺、异戊酸、N-甲基谷氨酸、胱硫醚、精胺、肌肽、1-甲基烟酰胺、N-乙酰神经氨酸、肌氨酸、GDP、N-甲基丙氨酸、棕榈酸、1,2--二油酰基-sn-甘油-3-磷酸-rac-甘油胆固醇5α,6α环氧羊毛甾醇、木蜡酸、1油酰基_rac_GL、胆固醇_环氧化物、芥酸、T-LCA、油酰基-L-肉碱、齐墩果酸、3-磷酸甘油酸盐、5-羟基正缬氨酸、5-甲氧基色胺、5-单磷酸腺苷、α-酮戊二酸盐、天冬酰胺、苯甲酸、次黄嘌呤、麦芽糖、麦芽三糖、甲硫氨酸亚砜、降烟碱、苯酚、磷酸乙醇胺、焦磷酸盐、丙酮酸、奎尼酸、牛磺酸、尿酸、肌苷、乳酰胺、5-羟基正缬氨酸NIST、胆固醇、脱氧戊糖醇、2-羟基雌酮、2-羟基雌二醇、2-甲基雌酮、2-甲氧基雌二醇、2-羟基雌酮-3-甲基醚、4-羟基雌酮、4-甲氧基雌酮、4-甲氧基雌二醇、16α-羟基雌酮、17-表雌三醇、雌三醇、16-酮雌二醇、16-表雌三醇、酰基肉碱C18:1、氨基酸瓜氨酸和反式4-羟基脯氨酸、甘油磷脂PC aa C28:1、PC ae C30:0和PC ae C30:2以及鞘脂SM(OH)C14:1。参见例如,Halama等人,Nesting of colon andovarian cancer cells in the endothelial niche is associated with alterationsin glycan and lipid metabolism,Scientific Reports第7卷,论文编号:39999(2017);Hur等人,Systems approach to characterize the metabolism of liver cancer stemcells expressing CD133,Sci Rep.,7:45557,doi:10.1038/srep45557,(2017);Eliassen等人,Urinary Estrogens and Estrogen Metabolites and Subsequent Risk of BreastCancer among Premenopausal Women,Cancer Res;72(3);696-706(2011);Gangi等人,Metabolomic profile in pancreatic cancer patients:a consensus-based approachto identify highly discriminating metabolites,Oncotarget,2月2日;7(5):5815-5829(2016);Kumar等人,Serum and Plasma Metabolomic Biomarkers for Lung Cancer,Bioinformation,13(6):202-208,doi:10.6026/97320630013202(2017);Schmidt等人,Pre-diagnostic metabolite concentrations and prostate cancer risk in 1077cases and 1077 matched controls in the European Prospective Investigationinto Cancer and Nutrition,BMC Med.,15:122,doi:10.1186/s12916-017-0885-6(2017);其中的每个以引用的方式整体并入本文。
在一些实施方案中,本文提供的方法包括检测一种或多种肽的存在(例如,与本文所述的可用于一种或多种方法的各个蛋白质生物标记物不同的一种或多种肽)。在一些实施方案中,如果生物样品含有一种或多种指示癌症的肽,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的肽,则受试者被确定为患有癌症。在一些实施方案中,肽来源于蛋白质(例如,所述肽包含存在于蛋白质生物标记物或不同蛋白质中的氨基酸序列)。指示癌症的肽的非限制性实例包括以下肽和来源于以下蛋白质的肽:CEACAM、CYFRA21-1、CA125、PKLK、ProGRP、NSE、TPA 6、TPA 7、TPA 8、NRG、NRG 100、CNDP、APOB100、SCC、VEGF、EGFR、PIK3CA、HER2、BRAF、ROS、RET、NRAS、MET、MEK1、HER2、C4.4A、PSF3、FAM83B、ECD、CTNNB、VIM、S100A4、S100A7、COX2、MUC1、KLKB1、SAA、HP-β链、C9、Pgrmc1、Ciz1、转铁蛋白、α-1抗胰蛋白酶、载脂蛋白1、补体c3a、窖蛋白-1、激肽释放酶6、葡萄糖调节蛋白-8、α防御素-1、-2、-3、血清C-肽、α-2-HS乙二醇蛋白、胰蛋白酶KRT 8肽、血浆乙二醇蛋白、连环蛋白、防御素α6、MMP、细胞周期蛋白D、S100P、核纤层蛋白A/C丝蛋白、热休克蛋白、醛脱氢酶、Txl-2(硫氧还蛋白样蛋白-2)、P53、nm23、u-PA、VEGF、Eph B4、CRABP2、WT-1、Rab-3D、间皮素、ERα、ANXA4、PSAT1、SPB5、CEA5、CEA6、A1AT、SLPI、APOA4、VDBP、HE4、IL-1、IL-6、IL-7、IL-8、IL-10、IL-11、IL-12、IL-16、IL-18、IL-21、IL-23、IL-28A、IL-33、LIF、TNFR1-2、HVEM(TNFRSF14)、IL1R-a、IL1R-b、IL-2R、M-CSF、MIP-1a、TNF-α、CD40、RANTES、CD40L、MIF、IFN-β、MCP-4(CCL13)、MIG(CXCL9)、MIP-1δ(CCL15)、MIP3a(CCL20)、MIP-4(CCL18)、MPIF-1、SDF-1a+b(CXCL12)、CD137/4-1BB、淋巴细胞趋化因子(XCL1)、嗜酸性粒细胞趋化因子-1(CCL11)、嗜酸性粒细胞趋化因子-2(CCL24)、6Ckine/CCL21)、BLC(CXCL13)、CTACK(CCL27)、BCA-1(CXCL13)、HCC4(CCL16)、CTAP-3(CXCL7)、IGF1、VEGF、VEGFR3、EGFR、ErbB2、CTGF、PDGF AA、PDGF BB、PDGFRb、bFGF、TGFbRIII、β-细胞素、IGFBP1-4、IGFBP1-6、BDNF、PEDF、血管生成素-2、肾素、溶血磷脂酸、β2-微球蛋白、唾液酸TN、ACE、CA 19-9、CEA、CA 15-3、CA-50、CA 72-4、OVX1、间皮素、唾液酸TN、MMP-2、-3、-7、-9、VAP-1、TIMP1-2、肌腱蛋白C、VCAM-1、骨桥蛋白、KIM-1、NCAM、四连接素、巢蛋白-2、组织蛋白酶L、前列腺蛋白、蛋白裂解酶、激肽释放酶2、6、10、胱抑素C、紧密连接蛋白、脊椎蛋白2、SLPI、bHCG、尿促性腺激素肽、抑制素、瘦素、脂联素、GH、TSH、ACTH、PRL、FSH、LH、皮质醇、TTR、骨钙素、胰岛素、饥饿素、GIP、GLP-1、胰淀素、胰高血糖素、肽YY、卵泡抑素、铁调素、CRP、Apo A1、CIII、H、转甲状腺素蛋白、SAA、SAP、补体C3、4、补体因子H、白蛋白、铜蓝蛋白、结合珠蛋白、β-血红蛋白、转铁蛋白、铁蛋白、纤维蛋白原、凝血酶、血管性血友病因子、肌红蛋白、免疫抑制酸性蛋白、脂质结合唾液酸、S100A12(EN-RAGE)、胎球蛋白A、聚集素、α1-抗胰蛋白酶、a2-巨球蛋白、丝氨酸蛋白酶抑制剂1(人纤溶酶原激活物抑制剂-1)、Cox-1、Hsp27、Hsp60、Hsp80、Hsp90、凝集素型氧化LDL受体1、CD14、脂质运载蛋白2、ITIH4、sFasL、Cyfra21-1、TPA、穿孔素、DcR3、AGRP、肌酸激酶-MB、人乳脂肪球1-2、NT-Pro-BNP、神经元特异性烯醇化酶、CASA、NB/70K、AFP、afamin、胶原蛋白、抗增殖蛋白、角蛋白-6、PARC、B7-H4、YK-L40、AFP-L3、DCP、GPC3、OPN、GP73、CK19、MDK、A2、5-HIAA、CA15-3、CA19-9、CA27.29、CA72-4、降钙素、CGA、BRAF V600E、BAP、BCT-ABL融合蛋白、KIT、KRAS、PSA、乳酸脱氢酶、NMP22、PAI-1、uPA、纤维蛋白D-二聚体、S100、TPA、甲状腺球蛋白、CD20、CD24、CD44、RS/DJ-1、p53、α-2-HS-糖蛋白、亲脂素B、β-珠蛋白、血液结合素、UBE2N、PSMB6、PPP1CB、CPT2、COPA、MSK1/2、Pro-NPY、分离蛋白-1、纽蛋白、NAAA、PTK7、TFG、MCCC2、TRAP1、IMPDH2、PTEN、POSTN、EPLIN、eIF4A3、DDAH1、ARG2、PRDX3&4、P4HB、YWHAG、烯酰辅酶A水合酶、PHB、TUBB、KRT2、DES、HSP71、ATP5B、CKB、HSPD1、LMNA、EZH2、AMACR、FABP5、PPA2、EZR、SLP2、SM22、Bax、Smac/Diablo磷酸化Bcl2、STAT3和Smac/Diablo表达、PHB、PAP、AMACR、PSMA、FKBP4、PRDX4、KRT7/8/18、GSTP1、NDPK1、MTX2、GDF15、PCa-24、窖蛋白-2、凝血酶原、抗凝血酶-III、结合珠蛋白、血清淀粉样蛋白A-1蛋白、ZAG、ORM2、APOC3、CALML5、IGFBP2、MUC5AC、PNLIP、PZP、TIMP1、AMBP、间-α-胰蛋白酶抑制剂重链H1、间-α-胰蛋白酶抑制剂重链H2、间-α-胰蛋白酶抑制剂重链H3、V型质子ATP酶亚基B肾同种型、肝细胞生长因子样蛋白、血清淀粉样蛋白P-组分、酰基甘油激酶、含有富亮氨酸重复序列的蛋白质9、β-2-糖蛋白1、血浆蛋白酶C1抑制剂、含有脂氧合酶同源结构域的蛋白质1、原钙粘蛋白α-13。参见例如,Kuppusamy等人,第24卷,第6期,2017年9月,第1212-1221页;Elzek和Rodland,Cancer Metastasis Rev.2015年3月;34(1):83-96;Noel和Lokshin,Future Oncol.2012年1月;8(1):55-71;Tsuchiya等人,WorldJ Gastroenterol.2015年10月7日;21(37):10573-10583;Lou等人,Biomark Cancer.2017;9:1-9;Park等人,Oncotarget.2017年6月27日;8(26):42761-42771;Saraswat等人,CancerMed.2017年7月;6(7):1738-1751;Zamay等人,Cancers(Basel).2017年11月;9(11):155;Tanase等人,Oncotarget.2017年3月14日;8(11):18497-18512,其中的每个以引用的方式整体并入本文。
在一些实施方案中,本文提供的方法包括检测一种或多种核酸病变或变异的存在(例如,与本文所述的可用于一种或多种方法的各个遗传生物标记物不同的一种或多种核酸病变或变异)。在一些实施方案中,如果生物样品含有一种或多种指示癌症的核酸病变或变异,则受试者被确定具有升高的患有或发展癌症的风险。在一些实施方案中,如果生物样品含有一种或多种指示癌症的核酸病变或变异,则受试者被确定为患有癌症。核酸病变或变异的非限制性实例包括拷贝数变化、DNA甲基化变化和/或其他核酸(例如,mRNA、miRNA、lncRNA、circRNA、mtDNA、端粒DNA、易位和基因组重排)。易位和基因组重排已与各种癌症(例如,前列腺癌、胶质瘤、肺癌、非小细胞肺癌、黑色素瘤和甲状腺癌)相关,并且已用作生物标记物多年(例如,Demeure等人,2014,World J Surg.,38:1296-305;Hogenbirk等人,2016,PNAS USA,113:E3649-56;Gasi等人,2011,PLoS One,6:e16332;Ogiwara等人,2008,Oncogene,27:4788-97;美国专利号9,745,632;以及美国专利号6,576,420)。另外,拷贝数变化已用作各种癌症的生物标记物,所述癌症包括但不限于头颈部鳞状细胞癌、淋巴瘤(例如,非霍奇金淋巴瘤)和结直肠癌(Kumar等人,2017,Tumour Biol,39:1010428317740296;Kumar等人,2017,Tumour Biol.,39:1010428317736643;Henrique等人,2014,ExpertRev.Mol.Diagn.,14:419-22;以及美国专利号9,816,139)。DNA甲基化和DNA甲基化变化(例如,低甲基化,超甲基化)也被用作癌症的生物标记物。例如,低甲基化已与肝细胞癌(参见例如,Henrique等人,2014,Expert Rev.Mol.Diagn.,14:419-22)、食管癌变(参见例如,Alvarez等人,2011,PLoS Genet.,7:e1001356)以及胃和肝癌(参见例如,美国专利号8,728,732)相关联,并且超甲基化已与结直肠癌相关联(参见例如,美国专利号9,957,570;)。除了全基因组甲基化变化之外,特定基因内的特定甲基化变化也可以指示特定的癌症(参见例如,美国专利号8,150,626)。Li等人(2012,J.Epidemiol.,22:384-94)提供了多种癌症(例如,乳腺癌、膀胱癌、胃癌、肺癌、前列腺癌、头颈部鳞状细胞癌和鼻咽癌)与异常甲基化之间的关联的综述。另外或替代地,其他类型的核酸或核酸特征已与各种癌症相关联。此类核酸或核酸特征的非限制性实例包括各种微小RNA(miRNA)的存在或不存在,其已用于诊断结肠癌、前列腺癌、结直肠癌和卵巢癌(参见例如,D′Souza等人,2018,PLos One,13:e0194268;Fukagawa等人,2017,Cancer Sci.,108:886-96;Giraldez等人,2018,MethodsMol.Biol.,1768:459-74;美国专利号8,343,718;9,410,956;以及9,074,206)。关于miR-22与癌症的特定关联的综述,参见Wang等人(2017,Int.J.Oncol.,50:345-55);长非编码RNA(lncRNA)的异常表达也用作癌症的生物标记物,所述癌症诸如前列腺癌、结直肠癌、宫颈癌、黑色素瘤、非小细胞肺癌、胃癌、子宫内膜癌和肝细胞癌(参见例如,Wang等人,2017,Oncotarget,8:58577086;Wang等人,2018,Mol.Cancer,17:110;Yu等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:4812-9;Yu等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:993-1002;Zhang等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:4820-7;Zhang等人,2018,Eur.Rev.Med.Pharmacol.Sci.,22:2304-9;Xie等人,2018,EBioMedicine,33:57-67;以及美国专利号9,410,206);环状RNA(circRNA)的存在或不存在已用作肺癌、乳腺癌、胃癌、结直肠癌和肝癌(例如,Geng等人,2018,J.Hematol.Oncol.,11:98)和黑色素瘤(例如,Zhang等人,2018,Oncol.Lett.,16:1219-25)的生物标记物;端粒DNA的变化(例如,长度或杂合性的变化)或着丝粒DNA的变化(例如,着丝粒基因表达的变化)也已与癌症(例如,前列腺癌、乳腺癌、肺癌、淋巴瘤和尤文氏肉瘤)相关联(参见例如,Baretton等人,1994,CancerRes.,54:4472-80;Liscia等人,1999,Br.J.Cancer,80:821-6;Proctor等人,2009,Biochim.Biophys.Acta,1792:260-74;以及Sun等人,2016,Int.J.Cancer,139:899-907);线粒体DNA(mtDNA)中的各种突变(例如,缺失)、重排和/或拷贝数变化已用于各种癌症(例如,前列腺癌、黑色素瘤、乳腺癌、肺癌和结直肠癌)的预后和诊断。参见例如,Maragh等人,2015,Cancer Biomark.,15:763-73;Shen等人,2010,Mitochondrion,10:62-68;Hosgood等人,2010,Carcinogen.,31:847-9;Thyagarajan等人,2012,Cancer Epid.Biomarkers&Prev.,21:1574-81;以及美国专利号9,745,632;并且信使RNA(mRNA)的异常存在、不存在或量也已与各种癌症相关,所述癌症包括但不限于乳腺癌、维尔姆斯瘤和宫颈癌(参见例如,Guetschow et al.,2012,Anal.Bioanaly.Chem.,404:399-406;Schwienbacher等人,2000,Cancer Res.,60:1521-5;以及Ngan等人,1997,Genitourin Med.,73:54-8)。这些引文中的每个以引用的方式整体并入本文。
验证检测到的遗传生物标记物
在一些实施方案中,本文提供的方法可以用于验证在无细胞DNA中存在的循环肿瘤DNA中检测到的遗传生物标记物,指示受试者中癌细胞的存在。在一些实施方案中,本文提供的方法可以用于验证在无细胞DNA中存在的循环肿瘤DNA中检测到的遗传改变(例如,一个或多个遗传改变),指示受试者中癌细胞的存在。例如,癌细胞中存在的某些遗传生物标记物(例如,遗传改变)也出现在人体内的其他非癌细胞中。此类非癌细胞包括但不限于在与年龄相关联的克隆性造血作用(例如,克隆性造血扩增(也称为不确定潜力或CHIP的克隆性造血作用)或脊髓发育不良)过程中产生的白细胞克隆。结果,此类克隆可能代表脊髓发育不良的早期形式,是基于ctDNA的测定中假阳性的潜在来源。在此类情况下,检测无细胞DNA中的遗传生物标记物(例如,遗传改变)会导致癌症的错误诊断,因为遗传生物标记物(例如,遗传改变)来自造血白细胞而不是癌症(例如,实体瘤)。本文提供的方法可以减少或消除此类错误的癌症诊断。
通过确定在无细胞DNA中检测到的一个或多个遗传生物标记物(例如,遗传改变)是否来源于造血白细胞而不是癌细胞,本文提供的方法可以用于减少或消除错误的癌症诊断。例如,可以从受试者的白细胞分离或获得DNA,可以测试所述DNA以确定在来自受试者的无细胞DNA中鉴定的遗传生物标记物(例如,遗传改变)是否存在,所述遗传生物标记物(例如,遗传改变)与癌症相关联。在一些实施方案中,如果在来自白细胞的DNA中鉴定出遗传生物标记物(例如,遗传改变),则指示在无细胞DNA中鉴定出的遗传生物标记物(例如,遗传改变)来源于白细胞,而不是来源于受试者体内存在的癌细胞。在一些实施方案中,如果在来自白细胞的DNA中未鉴定出遗传生物标记物(例如,遗传改变),则指示在无细胞DNA中鉴定出的遗传生物标记物(例如,遗传改变)来源于受试者体内存在的癌细胞,而不是来源于白细胞。测试从白细胞分离或获得的DNA是否存在与癌症相关联的遗传生物标记物(例如,遗传突变),以确定遗传生物标记物(例如,遗传改变)是否来源于受试者的癌细胞的方法,在本文中统称为“验证针对白细胞的遗传改变”、“验证针对来自白细胞的DNA的遗传改变”、“白细胞验证”以及类似短语。
可以使用本文所述的方法来验证与癌症相关联的任何遗传生物标记物(例如,遗传改变)。与癌症相关联的遗传生物标记物(例如,具有遗传改变的基因)的实例包括但不限于ABCA7、ABL1、ABL2、ACVR1B、ACVR2A、AJUBA、AKT1、AKT2、ALB、ALDOB、ALK、AMBRA1、AMER1、AMOT、ANKRD46、APC、AR、ARHGAP35、ARHGEF12、ARID1A、ARID1B、ARID2、ARID4B、ARL15、ARMCX1、ASXL1、ASXL2、ATAD2、ATF1、ATG14、ATG5、ATM、ATRX、ATXN2、AXIN1、B2M、BAP1、BCL11A、BCL11B、BCL2、BCL3、BCL6、BCL9、BCLAF1、BCOR、BCR、BIRC6、BIRC8、BLM、BLVRA、BMPR1A、BRAF、BRCA1、BRCA2、BRD7、BRE、BRWD3、BTBD7、BTRC、C11orf70、C12orf57、C2CD5、C3orf62、C8orf34、CAMKV、CAPG、CARD11、CARS、CASP8、CBFA2T3、CBFB、CBLC、CBX4、CCAR1、CCDC117、CCDC88A、CCM2、CCNC、CCND1、CCND2、CCND3、CCR3、CD1D、CD79B、CDC73、CDCP1、CDH1、CDH11、CDK12、CDK4、CDK6、CDKN1A、CDKN1B、CDKN2A、CDX2、CEBPA、CELF1、CENPB、CEP128、CHD2、CHD4、CHD8、CHEK2、CHRDL1、CHUK、CIC、CLEC4C、CMTR2、CNN2、CNOT1、CNOT4、COL11A1、COPS4、COX7B2、CREB1、CREBBP、CSDE1、CSMD3、CTCF、CTDNEP1、CTNNB1、CUL1、CUL2、CYB5B、CYLD、DACH1、DCHS1、DCUN1D1、DDB2、DDIT3、DDX3X、DDX5、DDX6、DEK、DHX15、DHX16、DICER1、DIRC2、DIS3、DIXDC1、DKK2、DNAJB5、DNER、DNM1L、DNMT3A、EED、EGFR、EIF1AX、EIF2AK3、EIF2S2、EIF4A1、EIF4A2、ELF3、ELK4、EMG1、EMR3、EP300、EPB41L4A、EPHA2、EPS8、ERBB2、ERBB3、ERRFI1、ETV4、ETV6、EVI1、EWSR1、EXO5、EXT1、EXT2、EZH2、F5、FANCM、FAT1、FBN2、FBXW7、FCER1G、FEV、FGF2、FGFR1、FGFR1OP、FGFR2、FGFR3、FH、FLT3、FN1、FOXA1、FOXP1、FUBP1、FUS、GALNTL5、GATA3、GGCT、GIGYF2、GK2、GLIPR2、GNAS、GNPTAB、GNRHR、GOLGA5、GOLM1、GOPC、GOT2、GPC3、GPS2、GPX7、GRK1、GSE1、GZM[A、HDAC1、HERC1、HERC4、HGF、HIST1H2BO、HLA-A、HLA-B、HMCN1、HMGA1、HMGA2、HNRNPA1、HRAS、HSP90AB1、ID3、IDH1、IDH2、IFNGR2、IFT88、IKZF2、IL2、INO80C、INPP4A、INPPL1、IRF4、IWS1、JAK1、JAK2、JUN、KANSL1、KAT8、KATNAL1、KBTBD7、KCNMB4、KDM5C、KDM6A、KEAP1、KIAA1467、KIT、KLF4、KMT2A、KMT2B、KMT2C、KMT2D、KMT2E、KRAS、KRT15、LAMTOR1、LARP4B、LCK、LMO2、LPAR2、LYN、MAF、MAFB、MAML2、MAP2K1、MAP2K2、MAP2K4、MAP3K1、MAP4K3、MAPK1、MAK、MB21D2、MBD1、MBD6、MBNL1、MBNL3、MDM2、MDM4、MED12、MED23、MEN1、MET、MGA、MITF、MKLN1、MLH1、MLL、MLLT4、MOAP1、MORC4、MPL、MS4A1、MSH2、MSI1、MTOR、MYB、MYC、MYCL1、MYCN、MYD88、MYL6、MYO1B、MYO6、NAA15、NAA25、NAP1L2、NAP1L4、NCOA2、NCOA4、NCOR1、NEK9、NF1、NF2、NFE2L2、NFE2L3、NFKB2、NIPBL、NIT1、NKX3-1、NME4、NOTCH1、NOTCH2、NPM1、NR4A3、NRAS、NSD1、NTRK1、NUP214、NUP98、PALB2、PAX8、PBRM1、PCBP1、PCOLCE2、PDGFB、PHF6、PIK3CA、PIK3CB、PIK3R1、PIM1、PLAG1、PML、POLA2、POT1、PPARD、PPARG、PPM1D、PPP2R1A、PPP6C、PRKACA、PRKCI、PRPF40A、PSIP1、PTEN、PTH2、PTMS、PTN、PTPN11、RAB18、RAC1、RAF1、RANBP3L、RAPGEF6、RASA1、RB1、RBBP6、RBM10、RBM26、RC3H2、REL、RERE、RET、RFC4、RHEB、RHOA、RIMS2、RIT1、RNF111、RNF43、ROS1、RPL11、RPL5、RQCD1、RRAS2、RUNX1、RXRA、SARM1、SCAF11、SDHB、SDHD、SEC22A、SENP3、SENP8、SETD1B、SETD2、SF3A3、SF3B1、SFPQ、SIN3A、SKAP2、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMARCC2、SMO、SNCB、SOCS1、SOS1、SOX4、SOX9、SP3、SPEN、SPOP、SPSB2、SS18、STAG2、STK11、STK31、SUFU、SUFU、SUZ12、SYK、TAF1A、TARDBP、TAS2R30、TBL1XR1、TBX3、TCF12、TCF3、TCF7L2、TCL1A、TET2、TEX11、TFDP2、TFG、TGFBR2、THRAP3、TLX1、TM9SF1、TMCO2、TMED10、TMEM107、TMEM30A、TMPO、TNFAIP3、TNFRSF9、TNRC6B、TP53、TP53BP1、TPR、TRAF3、TRIM8、TRIP12、TSC1、TSC2、TTK、TTR、TUBA3C、U2AF1、UBE2D3、UBR5、UNC13C、UNKL、UPP1、USO1、USP28、USP6、USP9X、VHL、VN1R2、VPS33B、WAC、WDR33、WDR47、WRN、WT1、WWP1、XPO1、YOD1、ZC3H13、ZDHHC4、ZFHX3、ZFP36L1、ZFP36L2、ZGRF1、ZMYM3、ZMYM4、ZNF234、ZNF268、ZNF292、ZNF318、ZNF345、ZNF600、ZNF750和/或ZNF800。在一些实施方案中,可以针对从受试者分离或获得的白细胞DNA进行验证的与癌症相关联的遗传生物标记物(例如,具有遗传改变的基因)包括肿瘤抑制基因或致癌基因。在一些实施方案中,可以根据本文公开的方法测试一个或多个密码子和/或其周围的剪接位点。可以测试的肿瘤抑制基因和致癌基因的示例性密码子包括但不限于以下密码子中的一个或多个及其周围的剪接位点:AKT1的密码子16-18;APC的密码子1304-1311、1450-1459;BRAF的密码子591-602;CDKN2A的密码子51-58、76-88;CTNNB1的密码子31-39、38-47;EGFR的密码子856-868;FBXW7的密码子361-371、464-473、473-483、498-507;FGFR2的密码子250-256;GNAS的密码子199-208;HRAS的密码子7-19;KRAS的密码子7-14、57-65、143-148;NRAS的密码子3-15、54-63;PIK3CA的密码子80-90、343-348、541-551、1038-1050;PPP2R1A的密码子175-187;PTEN的密码子90-98、125-132、133-146、145-154;和TP53的密码子10-22、25-32、33-40、40-52、52-64、82-94、97-110、112-125、123-125、126-132、132-142、150-163、167-177、175-186、187-195、195-206、207-219、219-224、226-237、232-245、248-261、261-268、272-283、279-290、298-307、307-314、323-331、333-344、344-355、367-375、374-386。在一些实施方案中,可以针对从受试者分离或获得的白细胞DNA进行验证的与癌症相关联的遗传生物标记物(例如,具有遗传改变的基因)包括表11或表12中鉴定的一个或多个遗传生物标记物(例如,遗传改变)。测试从白细胞分离或获得的DNA可以包括对此类DNA进行扩增和/或测序(例如,使用本文所述的任一方法,包括但不限于Safe-SeqS方法)。当测试从白细胞分离或获得的DNA时,使用诸如Safe-SeqS的技术具有对应的优势,就像测试受试者的无细胞DNA一样。
在一些实施方案中,针对从白细胞分离或获得的DNA来验证单个遗传生物标记物(例如,遗传改变)。在一些实施方案中,针对从白细胞分离或获得的DNA来验证一个以上的遗传生物标记物(例如,遗传改变)。例如,可以使用本文所述的方法针对从白细胞分离或获得的DNA来验证2、3、4、5、6、7、8、9、10个或更多个遗传生物标记物(例如,遗传改变)。在一些实施方案中,使用从白细胞分离或获得的多个样品针对从白细胞分离或获得的DNA来验证一个或多个遗传生物标记物(例如,遗传改变)。例如,可以通过从两个从受试者分离或获得的白细胞样品中分离DNA针对从白细胞分离或获得的DNA来验证一个或多个遗传生物标记物(例如,遗传改变)。使用多个样品针对从白细胞分离或获得的DNA来验证遗传生物标记物(例如,遗传改变)可以增加测试的敏感性,从而导致更准确的诊断。
在一些实施方案中,在没有额外的诊断测试方法的情况下,通过针对从白细胞分离或获得的DNA来验证遗传生物标记物(例如,遗传改变),可以确定一个或多个遗传生物标记物(例如,遗传改变)是否来源于受试者的癌细胞。在一些实施方案中,与额外的诊断测试方法组合,通过针对从白细胞分离或获得的DNA来验证遗传生物标记物(例如,遗传改变),可以确定一个或多个遗传生物标记物(例如,遗传改变)是否来源于受试者的癌细胞。在一些实施方案中,此类额外的诊断测试方法可以包括本文所述的诊断测试方法中的一种或多种。在一些实施方案中,此类额外的诊断测试方法可以包括测试蛋白质生物标记物(例如,本文公开的蛋白质生物标记物中的一个或多个)。在一些实施方案中,此类额外的诊断测试方法可以包括测试一定阈值水平的蛋白质生物标记物(例如,本文公开的蛋白质生物标记物中的一个或多个)。可以与白细胞验证组合的蛋白质生物标记物的实例包括但不限于碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3。本文公开的此类蛋白质生物标记物的各种阈值水平中的任一种都可以与无细胞DNA中发现的一个或多个遗传生物标记物(例如,遗传改变)的白细胞验证组合使用。某些蛋白质生物标记物的示例性和非限制性阈值水平包括:CA19-9(>92U/ml)、CEA(>7,507pg/ml)、CA125(>577U/ml)、AFP(>21,321pg/ml)、催乳素(>145,345pg/ml)、HGF(>899pg/ml)、OPN(>157,772pg/ml)、TIMP-1(>176,989pg/ml)、卵泡抑素(>1,970pg/ml)、G-CSF(>800pg/ml)和CA15-3(>98U/ml)。在一些实施方案中,蛋白质生物标记物的阈值水平可以比本文所述的示例性阈值水平高(例如,约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约100%或更高)。在一些实施方案中,蛋白质生物标记物的阈值水平可以比本文所述的示例性阈值水平低(例如,约10%、约20%、约30%、约40%、约50%或更低)。在某些实施方案中,将测试单个蛋白质生物标记物与无细胞DNA中发现的遗传生物标记物(例如,遗传改变)的白细胞验证组合。在某些实施方案中,将测试一个以上蛋白质生物标记物(二、三、四、五、六、七、八、九、十、十一或更多个蛋白质生物标记物)与无细胞DNA中发现的遗传生物标记物(例如,遗传改变)的白细胞验证组合。
在一些实施方案中,针对从白细胞分离或获得的DNA来验证多个遗传生物标记物(例如,遗传生物标记物组套)。在一些实施方案中,针对从白细胞分离或获得的DNA来验证的多个遗传生物标记物包括NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS中的一个或多个。在一些实施方案中,针对从白细胞分离或获得的DNA来验证的多个遗传生物标记物包括NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS中的每一个。在一些实施方案中,与额外的诊断测试方法组合,通过针对从白细胞分离或获得的DNA来验证遗传生物标记物,可以确定包括NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS中的一个或多个(例如,每一个)的一个或多个遗传生物标记物(例如,遗传改变)是否来源于受试者的癌细胞。此类额外的诊断测试方法包括但不限于测试一个或多个蛋白质生物标记物的存在和/或非整倍性的存在。在一些实施方案中,一个或多个蛋白质生物标记物可以是CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1或髓过氧化物酶(MPO)中的一个或多个(例如,每一个)。在一些实施方案中,一个或多个蛋白质生物标记物可以是CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1或CA15-3中的一个或多个(例如,每一个)。在一些实施方案中,一个或多个蛋白质生物标记物可以是CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF或CA15-3中的一个或多个(例如,每一个)。
在一些实施方案中,针对从白细胞分离或获得的DNA来验证的多个遗传生物标记物包括KRAS、TP53、CDKN2A或SMAD4中的一个或多个。在一些实施方案中,针对从白细胞分离或获得的DNA来验证的多个遗传生物标记物包括KRAS、TP53、CDKN2A和SMAD4中的每一个。在一些实施方案中,与额外的诊断测试方法组合,通过针对从白细胞分离或获得的DNA来验证遗传生物标记物,可以确定包括KRAS、TP53、CDKN2A或SMAD4中的一个或多个(例如,每一个)的一个或多个遗传生物标记物(例如,遗传改变)是否来源于受试者的癌细胞。此类额外的诊断测试方法包括但不限于测试一个或多个蛋白质生物标记物的存在和/或非整倍性的存在。在一些实施方案中,一个或多个蛋白质生物标记物可以是CA19-9、CEA、HGF或OPN中的一个或多个(例如,每一个)。
在一些实施方案中,针对从白细胞分离或获得的DNA来验证的多个遗传生物标记物包括NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A中的一个或多个。在一些实施方案中,针对从白细胞分离或获得的DNA来验证的多个遗传生物标记物包括NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A中的每一个。在一些实施方案中,与额外的诊断测试方法组合,通过针对从白细胞分离或获得的DNA来验证遗传生物标记物,可以确定包括NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A中的一个或多个(例如,每一个)的一个或多个遗传生物标记物(例如,遗传改变)是否来源于受试者的癌细胞。此类额外的诊断测试方法包括但不限于测试一个或多个蛋白质生物标记物的存在和/或非整倍性(例如,与癌症的存在相关联的一个或多个染色体或染色体臂中的非整倍性)的存在。在一些实施方案中,可以检测染色体臂4p、7q、8q或9q中的一个或多个上的非整倍性的存在。
在一些实施方案中,针对从白细胞分离或获得的DNA来验证的多个遗传生物标记物包括TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL中的一个或多个。在一些实施方案中,针对从白细胞分离或获得的DNA来验证的多个遗传生物标记物包括TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL中的每一个。.在一些实施方案中,与额外的诊断测试方法组合,通过针对从白细胞分离或获得的DNA来验证遗传生物标记物,可以确定包括TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL CDKN2A中的一个或多个(例如,每一个)的一个或多个遗传生物标记物(例如,遗传改变)是否来源于受试者的癌细胞。此类额外的诊断测试方法包括但不限于测试一个或多个蛋白质生物标记物的存在和/或非整倍性(例如,与癌症的存在相关联的一个或多个染色体或染色体臂中的非整倍性)的存在。在一些实施方案中,可以检测染色体臂5q、8q或9p中的一个或多个上的非整倍性的存在。
在一些实施方案中,从受试者分离或获得的用于分离或获得白细胞DNA的样品可以与从受试者分离或获得的用于测试无细胞DNA中的遗传生物标记物和/或蛋白质生物标记物的样品相同。例如,样品可以是血液样品(例如,全血),所述血液样品随后被分离为血浆级分和白细胞级分。这种分离可以例如通过密度梯度离心来实现,其中血浆与白细胞分离,白细胞通常在血沉棕黄层中发现。这种分离之后,可以分离并测试血沉棕黄层中的白细胞的DNA,同时还可以分离并测试血浆级分中的无细胞DNA中的遗传生物标记物。在一些实施方案中,使血浆级分凝结以便获得血清级分。在一些实施方案中,样品在测试和/或分级之前和/或之后被冷冻、冷藏或以其他方式储存。在一些实施方案中,样品的一个或多个级分在测试之前和/或之后被冷冻、冷藏或以其他方式储存。
在一些实施方案中,从受试者分离或获得的用于分离或获得白细胞DNA的样品可以与从受试者分离或获得的用于测试无细胞DNA中的遗传生物标记物和/或蛋白质生物标记物的样品不同。例如,可以从受试者分离或获得第一样品,所述第一样品用于测试无细胞DNA中的遗传生物标记物和/或蛋白质生物标记物。在分离或获得第一样品之前、同时或之后,可以从受试者中分离或获得第二样品,所述第二样品用于从白细胞分离或获得DNA以验证在无细胞DNA中鉴定的一个或多个遗传生物标记物(例如,遗传改变)。可以如本文所述将第二样品分级(例如,通过密度梯度离心)。在一些实施方案中,第一和/或第二样品(或其级分)在测试和/或分级之前和/或之后被冷冻、冷藏或以其他方式储存。
在一些实施方案中,一旦已针对从白细胞分离或获得的DNA验证了遗传生物标记物(例如,遗传改变)并且确定所述遗传生物标记物(例如,遗传改变)不存在于从白细胞分离或获得的DNA中(例如,确定所述遗传生物标记物(例如,遗传改变)来源于受试者的癌细胞),受试者就可以经历进一步诊断测试或增加监测(例如,使用本文公开的诊断测试和/或监测方法中的一种或多种)。在一些实施方案中,一旦已针对从白细胞分离或获得的DNA验证了遗传生物标记物(例如,遗传改变)并且确定所述遗传生物标记物(例如,遗传改变)不存在于从白细胞分离或获得的DNA中(例如,确定所述遗传生物标记物(例如,遗传改变)来源于受试者的癌细胞),就可以向受试者施用治疗性干预(例如,本文公开的治疗性干预中的一种或多种)。
样品分类
本公开提供了基于一个或多个蛋白质生物标记物(例如,全血或血浆中的蛋白质浓度)来鉴定受试者中癌症的存在的方法。可以使用各种方法来确定受试者是否患有癌症和/或受试者患有癌症的可能性。这些方法涉及本文所述的各种类型的统计技术和方法,包括例如回归模型、逻辑回归模型、神经网络、聚类模型、主成分分析、相关成分分析、最近邻分类器分析、线性判别分析、二次判别分析、支持向量机、决策树、随机森林、遗传算法、使用装袋法(bagging)的分类器优化、使用增强法(boosting)的分类器优化、使用随机子空间法的分类器优化、投影追踪以及遗传规划和加权投票等。
在一些实施方案中,回归分析可以用于确定受试者是否患有癌症。可以对蛋白质生物标记物组套、遗传生物标记物组套(例如,突变)和/或包括蛋白质蛋白标记物和遗传生物标记物二者的组套执行回归分析。在一些实施方案中,对一个或多个突变(例如,最高突变)和/或蛋白质生物标记物组套的Ω得分执行回归分析。
在一些实施方案中,基于具有以下形式的数学模型执行回归分析:
V=α+∑βif(Xi)
在这种模型的形式中,V是指示受试者患有癌症的可能性得分的值。在一些实施方案中,可能性得分指示测试受试者患有癌症的概率。Xi代表每个生物标记物的值(例如,Ω得分、血浆中的蛋白质浓度等)。βi是f(Xi)的系数,它是对应于生物标记物的值的变量。函数f(x)是给出x的对应值的函数。在一些实施方案中,f(x)=x。因此,数学模型可以具有V=α+∑βi Xi的形式。在一些其他实施方案中,f(x)可以是用于归一化或标准化的函数。在一些实施方案中,所述式可以包括额外的参数以说明年龄、性别和种族类别。
在一些实施方案中,V是指示受试者患有癌症的可能性得分的值。在一些实施方案中,V是实际概率(在0与1之间变化的数字)。在其他实施方案中,V是可以从其导出概率的值。
在一些实施方案中,数学模型是回归模型,例如,逻辑回归模型或线性回归模型。回归模型可以用于测试各个组的生物标记物。
在线性回归模型的情况下,所述模型可以用于分析来自测试受试者的表达数据并提供指示测试受试者的定量量度的结果,例如,所述受试者患有癌症的可能性。
总体来讲,线性回归方程表示为
Y=α+β1X12X2+...+βkXk
Y,因变量,指示生物学特征的定量度量(例如,患有癌症或不患有癌症的可能性)。因变量Y取决于k个解释变量(生物标记物的测量特征值),加上包括各种未指定的省略因素的误差项。在上述鉴定的模型中,参数β1计量第一解释变量X1对因变量Y的影响。β2给出解释变量X2对Y的影响。
逻辑回归模型是线性回归的非线性变换。逻辑回归模型通常称为“logit”模型并且可以表示为
ln[p/(1-p)]=α+β1X12X2+...+βkXk
其中,
α是常数;
ε是误差项;
ln是自然对数log(e),其中e=2.71828...,
p是事件Y发生的概率,
p/(1-p)是“发生化”,
ln[p/(1-p)]是对数发生比或“logit”。
本领域技术人员将理解,α和ε可以折叠成单个常数,并表示为α。在一些实施方案中,使用单个项α,并且省略ε。“逻辑”分布是一个S形分布函数。logit分布将估计概率(p)限制在0与1之间。
在一些实施方案中,逻辑回归模型表示为
Y=α+∑βi Xi
在此,Y是一个值(例如,可能性得分),所述值指示给定受试者的所述组的生物标记物是否应与病例组(例如,患有癌症的受试者组)一起进行分类,而不是对照组(例如,没有癌症的受试者组)。所述组的生物标记物与病例组而不是对照组一起分类的概率,由此的受试者患有癌症的概率,可以从Y导出。得分越高,受试者患有癌症的概率越高。
Xi是第i个生物标记物的值。在一些实施方案中,它可以是血浆中的蛋白质浓度、性别、年龄或来源于遗传标记物的得分(例如,Ω得分)。βi是生物标记物的逻辑回归方程系数,α是可以为零的逻辑回归方程常数,并且βi和α是对病例组和对照组应用逻辑回归分析的结果。
在一些实施方案中,逻辑回归模型通过最大似然估计(MLE)拟合。系数(例如,α、β1、β2、...)由最大似然率决定。似然率是条件概率(例如,P(Y|X),给定X的Y的概率)。似然函数(L)测量观察特定因变量值集(Y1、Y2、...、Yn)出现在样品数据集中的概率。在一些实施方案中,它被写为观察Y1、Y2、...、Yn的概率的乘积:
L=Prob(Y1,Y2,...,Yn)=Prob(Y1)*Prob(Y2)*...Prob(Yn)
似然函数越高,观察样品中Y的概率就越高。MLE涉及求出系数(α、β1、β2、...),其使似然函数的对数(LL<0)尽可能大,或者使似然函数的对数的-2倍(-2LL)尽可能小。在MLE中,对参数α、β1、β2等进行了一些初始估计。然后,计算给定这些参数估计值的数据的似然率。改进参数估计值,重新计算数据的似然率。重复此过程,直到参数估计值基本上保持不变(例如,小于0.01或0.001的变化)。逻辑回归和拟合逻辑回归模型的实例可在Hastie,The Elements of Statistical Learning,Springer,N.Y.,2001,第95-100页中找到。
一旦确定了逻辑回归方程系数和逻辑回归方程常数,就可以将模型轻松地应用于测试受试者以获得Y。在一些实施方案中,可以通过求解函数Y=ln(p/(1-p))将Y用于计算概率(p)。
在一些实施方案中,解释变量在拟合到模型中之前被归一化或标准化。标准化系数(或β系数)是通过回归分析得出的估计值,这些估计值已经标准化,使得因变量和解释变量的方差为1。因此,标准化系数代表解释变量每增加一个标准偏差,因变量将改变多少个标准偏差。对于一元回归,标准化系数的绝对值等于相关系数。通常执行系数的标准化,以鉴定多元回归分析中哪个解释变量对因变量的影响更大。在一些实施方案中,变量在拟合到逻辑回归模型中之前被归一化或标准化。标准化的逻辑回归系数(或标准化的β系数)是对已标准化的变量执行逻辑回归分析得出的估计值。在一些实施方案中,仅解释变量被标准化,并且在一些其他实施方案中,仅因变量被标准化。此外,在一些实施方案中,解释变量和因变量都被标准化。在一些实施方案中,标准化回归系数等于对应的未标准化系数乘以比率std(Xi)/std(Y),其中“std”表示标准偏差。
在一些实施方案中,Ω得分(例如,最高突变的Ω得分)可以用作逻辑回归中的解释变量。在一些实施方案中,逻辑回归可以包括一个或多个其他解释变量(例如,蛋白质的浓度)。在一些实施方案中,可以基于Mann-Whitney-Wilcoxon测试来选择蛋白质生物标记物。在一些实施方案中,在癌症样品中选择的蛋白质生物标记物具有比正常样品中更高的中值。在一些实施方案中,前向选择用于从所有生物标记物(包括遗传生物标记物和蛋白质生物标记物)中选择解释变量。
将数学模型应用于数据可以生成一个或多个分类器。分类器是具有适当参数(例如,回归模型中的β系数)的数学模型。这些参数可以通过将数学模型应用于训练数据集(例如,既包括对照受试者又包括患有癌症的受试者组的数据集)来确定。
可以使用本领域普通技术人员已知的方法来评估分类器在数据集(例如,训练数据集或验证数据集)中正确表征每个受试者的能力。可以使用各种统计标准,例如,曲线下面积(AUC)、正确预测的百分比、敏感性和/或特异性。在一些实施方案中,分类器通过交叉验证、留一交叉验证(LOOCV)、n倍交叉验证和刀切分析(jackknife analysis)来评估。在一些实施方案中,评估每个分类器在未用于生成分类器的数据集(“测试数据集”)中正确表征那些受试者的能力。
在一些实施方案中,用于评估分类器在数据集中正确表征每个受试者的能力的方法是评估分类器的敏感性(真阳性分数)和1-特异性(真阴性分数)的方法。在一些实施方案中,用于测试分类器的方法是接受者操作特征(ROC),其提供了若干个参数来评估所生成的方程的结果的敏感性和特异性二者。在一些实施方案中,ROC面积(曲线下面积)用于评估方程。ROC面积优选大于0.5、0.6、0.7、0.8、0.9。完美的ROC面积得分1.0指示100%敏感性和100%特异性二者。在一些实施方案中,基于评估得分来选择分类器。在一些实施方案中,所使用的评估得分系统是由ROC曲线下面积确定的接受者操作特征(ROC)曲线得分。在一些实施方案中,选择得分大于0.95、0.9、0.85、0.8、0.7、0.65、0.6、0.55或0.5的分类器。在一些实施方案中,在特异性对于分类器的使用很重要的情况下,可以设定敏感性阈值,并且选择基于特异性排序的分类器。例如,可以选择具有大于0.95、0.9、0.85、0.8、0.7、0.65、0.6、0.55、0.5或0.45的特异性的临界值的分类器。类似地,可以设定特异性阈值,并且可以选择基于敏感性(例如,大于0.95、0.9、0.85、0.8、0.7、0.65、0.6、0.55、0.5或0.45)排序的分类器。因此,在一些实施方案中,仅选择排名前十的分类器、排名前二十的分类器或排名前一百的分类器。可以通过各种统计工具来计算ROC曲线,所述工具包括但不限于统计分析系统
Figure GDA0002675196410002461
R和
Figure GDA0002675196410002462
统计分析软件。
如本领域普通技术人员将理解的,由数学模型确定的组合和分类器的效用将取决于用于生成模型的输入数据的群体的某些特征(例如,种族、年龄组、性别、病史)。可以选择单独鉴定的生物标记物或单独鉴定的基因的子集,并测试所选的生物标记物的所有可能组合以鉴定生物标记物组的可用组合。
在一些实施方案中,受试者的可能性得分(例如,逻辑回归中的Y值)可以用于鉴定受试者是否可能患有癌症。因此,如果可能性得分大于预定参考阈值,则受试者可能患有癌症。在一些实施方案中,如果可能性得分小于参考阈值,则受试者不太可能患有癌症。本领域技术人员将理解,每个分类器的适当参考阈值可以是不同的,并且可以针对各种统计量度(例如,敏感性、特异性、正确预测的百分比)进行优化。在一些实施方案中,参考阈值通过实验或在临床试验中确定。
在一些实施方案中,创建出于给定目的令人满意的多个分类器(例如,全部具有足够的AUC和/或敏感性和/或特异性)。在一些实施方案中,生成利用一个以上分类器的式。例如,可以生成利用串联的分类器的式。分类器的其他可能的组合和权重将被理解并包含在本文中。
在一些实施方案中,受试者患有癌症的概率可以从可能性得分中导出。因此,如果概率大于预定阈值,例如0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9,则将向受试者施用癌症治疗。在一些实施方案中,如果概率小于预定阈值,例如0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9,则不会向受试者施用癌症治疗。在一些实施方案中,治疗的预定阈值为0.4、0.5或0.6,而不治疗或中止治疗的预定阈值为0.4、0.5或0.6。在一些实施方案中,预定阈值通过实验或在临床试验中确定。
本领域技术人员还将理解,所述方法的敏感性和特异性取决于参考阈值(或截止点)。当参考阈值升高时,敏感性会降低,但特异性会增加。在一些实施方案中,参考阈值可以针对敏感性、特异性或正确预测的百分比进行优化。
确定起源组织
本公开提供了确定癌症类型或者癌细胞或肿瘤细胞的起源的方法。可以将数学模型应用于如本文所述的各种生物标记物(例如,各种生物标记物的蛋白质浓度,各种生物标记物中的遗传突变)。
根据本公开可用的数学模型包括使用监督和无监督学习技术两者的那些模型。在一些实施方案中,所选择的数学模型使用监督学习结合训练数据集来评估生物标记物的每个可能的组合。可以使用各种数学模型,例如回归模型、逻辑回归模型、神经网络、聚类模型、主成分分析、相关成分分析、最近邻分类器分析、线性判别分析、二次判别分析、支持向量机、决策树、随机森林、遗传算法、使用bagging的分类器优化、使用boosting的分类器优化、使用随机子空间方法的分类器优化、投影寻踪以及遗传规划和加权投票等。
在一些实施方案中,监督式学习模型用于确定癌细胞或肿瘤细胞的起源。监督学习模型是指学习基于示例性输入输出对将输入映射到输出的功能的模型。它可以从由一组训练实例组成的加标记的训练数据中推断出功能。在监督式学习中,每个实例都是一对,其由输入对象(通常是向量,例如蛋白质生物标记物的向量)和所需输出值(也称为监督信号,例如癌症类型或起源组织)组成。监督式学习算法分析训练数据并产生推断函数,其可以用于映射从测试受试者获得的生物标记物。可以使用许多监督式机器学习方法。这些方法包括但不限于支持向量机、回归分析、线性回归、逻辑回归、朴素贝叶斯、线性判别分析、决策树、k-最近邻算法、神经网络(例如,多层感知器)。
在一些实施方案中,无监督学习模型用于确定癌细胞或肿瘤细胞的起源。无监督机器学习是指推断描述“未标记”数据(即,尚未分类或归类的数据)的结构的功能的机器学习任务。这是在以下假设下进行的:如果样品具有相同起源,则相关生物标记物具有更多相似性。无监督机器学习可以鉴定这些共享特征,并且将这些模型应用于从测试受试者获得的生物标记物,从而确定受试者中癌细胞或肿瘤细胞的起源。可以使用许多无监督机器学习方法。所述方法包括但不限于聚类(例如,k-均值聚类、混合模型聚类和层次聚类等)、异常检测、无监督神经网络(例如,自动编码器、深度信任网络、赫布学习、生成对抗网络和自组织映射等)。
在一些实施方案中,使用随机森林。随机森林是指一种用于分类、回归和其他任务的学习方法,其通过在训练时构建大量决策树并输出作为个体树的类(分类)或平均值预测(回归)的模式的类来进行操作。随机森林可以通过各种程序来实现,例如,通过随机森林软件包(Liaw,Andy和Matthew Wiener.″Classification and regression byrandomForest.″R news 2.3(2002):18-22)。在一些实施方案中,随机森林基于一个或多个蛋白质生物标记物(例如,全血或血浆中的蛋白质浓度)鉴定受试者中癌症的存在。在一些实施方案中,可以进行超过10轮的10倍交叉验证。
在一些实施方案中,支持向量机(SVM)可以用于确定起源组织。SVM由一组训练实例开始,每个训练实例都标记为属于两个类别(例如,癌症类型)中的一个或另一个。SVM训练算法建立了一个模型,所述模型为一个类别或另一个分配新的实例,使其成为非概率二进制线性分类器(例如,来自特定起源的癌症和不是来自特定起源的癌症)。SVM模型是将实例表示为空间中的点,进行映射,使得单独类别的实例被尽可能宽的明显间隙分开。
这些数学模型可以应用于如本文所述的各种生物标记物或生物标记物组套(例如,蛋白质生物标记物),以确定癌细胞的起源。在一些实施方案中,这些方法仅应用于已预测患有癌症的受试者。
在一些实施方案中,一旦确定受试者患有癌症或确定为可能患癌症,就如图68所示确定癌症的起源组织。例如,可以在图68所示的树的每个分支处做出决策,并且一旦到达末端(例如,不再做出其他决策),就可以如图所示预测或确定起源组织。图68所示的树为从业者预测或确定癌症的起源组织(例如,乳腺癌、结直肠癌、肝癌、肺癌、卵巢癌、胰腺癌和胃肠道癌)提供了框架。
图68所示的树是示例性而非限制性的。例如,在一些决策点处,可以确定蛋白质生物标记物(例如,一个或多个蛋白质生物标记物)的水平(例如,从受试者获得的样品中存在的蛋白质生物标记物的水平),并且可以将所述一个或多个蛋白质生物标记物的水平与图68所示的树上指示的水平进行比较。在一些实施方案中,确定蛋白质生物标记物的水平(例如,从受试者获得的样品中存在的蛋白质生物标记物的水平),并且将此蛋白质生物标记物的水平与不同于图68所示的树上指示的水平的水平进行比较。在一些实施方案中,图68所示的树上的蛋白质生物标记物(例如,一个或多个蛋白质生物标记物)的不同水平与图68所示的树上一个或多个决策点处所示的蛋白质生物标记物的水平约10%不同(例如,大于约10%或小于10%)、约15%不同(例如,大于约15%或小于15%)、约20%不同(例如,大于约20%或小于20%)、约25%不同(例如,大于约25%或小于25%)、约30%不同(例如,大于约30%或小于30%)、约35%不同(例如,大于约35%或小于35%)、约40%不同(例如,大于约40%或小于40%)、约45%不同(例如,大于约45%或小于45%)、约50%不同(例如,大于约50%或小于50%)。在一些决策点处,确定受试者的性别(例如,生物性别),并且与图68所示的树上指示的一个或多个决策点处的性别进行比较。在一些决策点处,可以确定受试者为女性。在一些决策点处,可以确定受试者为男性。
在一些实施方案中,一旦确定受试者患有癌症或确定为可能患癌症,就根据图69和下表所示的规则列表确定癌症的起源组织。例如,可以确定蛋白质生物标记物(例如,一个或多个蛋白质生物标记物)的水平(例如,从受试者获得的样品中存在的蛋白质生物标记物的水平),并且可以将所述一个或多个蛋白质生物标记物的水平与图69和下表所示的规则中指示的水平进行比较。作为一个非限制性实例,规则[条件=CA125>102.76&sFas<=830.345&性别%in%c(′F′),预测=卵巢]意指如果女性(%in%c(′F′))具有CA125>102.76和sFas<=830.345,则所述女性患有卵巢癌或预测将患卵巢癌。本领域技术人员将能够检测受试者中一个或多个蛋白质生物标记物的水平和/或确定受试者的性别(例如,生物性别),并且确定受试者患有或可能患图69上列出的癌症类型。在一些实施方案中,一旦确定受试者患有或确定为可能患癌症,当受试者中一个或多个蛋白质生物标记物的水平和/或性别(例如,生物性别)不遵循图69和下表所示的任何特定规则时,就确定癌症的起源组织为结直肠。在一些实施方案中,确定蛋白质生物标记物的水平(例如,从受试者获得的样品中存在的蛋白质生物标记物的水平),并且将此蛋白质生物标记物的水平与不同于图69和下表所示的规则中指示的水平的水平进行比较。在一些实施方案中,图69所示的规则中蛋白质生物标记物(例如,一个或多个蛋白质生物标记物)的不同水平与图69和下表所示的规则中一个或多个决策点处所示的蛋白质生物标记物的水平约10%不同(例如,大于约10%或小于10%)、约15%不同(例如,大于约15%或小于15%)、约20%不同(例如,大于约20%或小于20%)、约25%不同(例如,大于约25%或小于25%)、约30%不同(例如,大于约30%或小于30%)、约35%不同(例如,大于约35%或小于35%)、约40%不同(例如,大于约40%或小于40%)、约45%不同(例如,大于约45%或小于45%)、约50%不同(例如,大于约50%或小于50%)。在一些实施方案中,确定受试者的性别(例如,生物性别),并且与图69和下表所示的一种或多种规则中的性别进行比较。在一些实施方案中,可以确定受试者为女性(例如,“性别%in%c(′F′)”)。在一些实施方案中,可以确定受试者为男性(例如,“性别%in%c(′M′)”)。对于下表,指示了示例性和非限制性规则以及癌症类型预测。“否则”指示如果不满足其他示例性规则,则可以预测癌症为结直肠癌。
Figure GDA0002675196410002511
Figure GDA0002675196410002521
对于图68和图69以及以上所示的表,某些蛋白质生物标记物的单位在以下图例中指示:
Figure GDA0002675196410002522
Figure GDA0002675196410002531
检测遗传生物标记物
各种技术中的任一种都可以用于检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物(例如,突变)的存在。此类技术的非限制性实例包括基于PCR的多重测定、数字PCR测定、微滴数字PCR(ddPCR)测定、基于PCR的单重PCR测定、Sanger测序测定、下一代测序测定、定量PCR测定、连接测定和微阵列测定。本领域普通技术人员将知道用于检测从受试者获得的样品中存在的一个或多个遗传生物标记物(例如,突变)的存在的其他合适技术。
在本文提供的方法的一些实施方案中,使用可以通过误差减少技术增加大规模平行测序仪器的敏感性的方法来检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物(例如,突变)的存在。例如,此类技术可以允许以100至1,000,000个野生型模板(例如,500至1,000,000个野生型模板)中的1个突变体模板的范围检测罕见突变体等位基因。在一些实施方案中,当罕见突变体等位基因以模板总数的低比例存在时(例如,当罕见突变体等位基因以总模板的小于约1%、小于约0.1%、小于约0.01%、小于约0.001%、小于约0.00001%或更低的比例或这些示例性比例之间的任何比例存在时),此类技术可以允许检测罕见突变体等位基因。在一些实施方案中,通过扩增DNA(例如,从样品中的细胞获得的DNA或无细胞DNA)形成扩增子家族来检测从受试者获得的样品中存在的一个或多个遗传生物标记物(例如,突变)的存在,其中家族的每个成员均来源于无细胞DNA中的单模板分子,其中家族的每个成员均通过共同的寡核苷酸条形码标记,并且其中每个家族均通过不同的寡核苷酸条形码标记。例如,可以通过以下来检测从受试者获得的样品中存在的一个或多个遗传生物标记物(例如,突变)的存在:为每个模板分子以分子方式分配唯一标识符(UID),扩增每个带唯一标签的模板分子来产生UID家族,并且对扩增产物进行冗佘测序。在一些实施方案中,通过用共同包含多个寡核苷酸条形码的引物群体扩增的步骤,将寡核苷酸条形码引入到模板分子中。在一些实施方案中,寡核苷酸条形码对于模板分子是内源的,并且包含DNA合成引发位点的衔接子连接至模板分子的与寡核苷酸条形码相邻的末端。参见例如,Kinde I,Wu J,Papadopoulos N,Kinzler KW,Vogelstein B(2011)Detection and quantification ofrare mutations with massively parallel sequencing.Proc Natl Acad Sci USA 108:9530-9535,其内容以引用的方式整体并入本文。
在本文提供的方法的一些实施方案中,使用测序技术(例如,下一代测序技术)来检测从受试者获得的样品(例如,宫颈、子宫内膜或血浆样品)中存在的一个或多个遗传生物标记物(例如,突变)的存在。各种测序技术是本领域中已知的。例如,在以下中描述了各种用于检测和表征无细胞DNA中循环肿瘤DNA的技术:Haber和Velculescu,Blood-BasedAnalyses of Cancer:Circulating Tumor Cells and Circulating Tumor DNA,CancerDiscov.,6月;4(6):650-61.doi:10.1158/2159-8290.CD-13-1014,2014,以引用的方式整体并入本文。此类技术的非限制性实例包括SafeSeqs(Kinde等人,Detection andquantification of rare mutations with massively parallel sequencing,Proc NatlAcad Sci USA;108,9530-5,2011)、OnTarget(Forshew等人,Noninvasive identificationand monitoring of cancer mutations by targeted deep sequencing of plasma DNA,Sci Transl Med;4:136ra68,2012)和TamSeq(Thompson等人,Winnowing DNA for raresequences:highly specific sequence and methylation based enrichment.PLoS ONE,7:e31597,2012),其中的每个以引用的方式整体并入本文。在一些实施方案中,使用微滴数字PCR(ddPCR)检测从受试者获得的样品中存在的一个或多个突变的存在,所述微滴数字PCR是已知对突变检测高度敏感的方法。在一些实施方案中,使用其他测序技术检测从受试者获得的样品中存在的一个或多个突变的存在,所述其他测序技术包括但不限于链终止技术、鸟枪技术、边测序边合成方法、利用微流体的方法、其他捕获技术或本领域已知的可用于检测样品中的少量DNA(例如,无细胞DNA样品中的ctDNA)的任何其他测序技术。
在一些实施方案中,使用基于阵列的方法来检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物(例如,突变)的存在。例如,可以使用DNA微阵列来进行检测无细胞DNA中的遗传改变(例如,一个或多个遗传改变)的步骤。在一些实施方案中,DNA微阵列可以检测多个遗传生物标记物(例如,癌细胞突变)中的一个多个。在一些实施方案中,在检测遗传生物标记物(例如,遗传改变)之前扩增无细胞DNA。可以用于本文所述的方法中的任何一种的基于阵列的方法的非限制性实例包括:互补DNA(cDNA)微阵列(Kumar等人(2012)J.Pharm.BioalliedSci.4(1):21-26;Laere等人(2009)Methods Mol.Biol.512:71-98;Mackay等人(2003)Oncogene 22:2680-2688;Alizadeh等人(1996)Nat.Genet.14:457-460)、寡核苷酸微阵列(Kim等人(2006)Carcinogenesis 27(3):392-404;Lodes等人(2009)PLoS One 4(7):e6229)、细菌人工染色体(BAC)克隆芯片(Chung等人(2004)Genome Res.14(1):188-196;Thomas等人(2005)Genome Res.15(12):1831-1837)、单核苷酸多态性(SNP)微阵列(Mao等人(2007)Curr.Genomics 8(4):219-228;Jasmine等人(2012)PLoS One 7(2):e31968)、基于微阵列的比较基因组杂交阵列(阵列-CGH)(Beers和Nederlof(2006)Breast CancerRes.8(3):210;Pinkel等人(2005)Nat.Genetics 37:S11-S17;Michels等人(2007)Genet.Med.9:574-584)、分子倒置探针(MIP)测定(Wang等人(2012)Cancer Genet 205(7-8):341-55;Lin等人(2010)BMC Genomics 11:712)。在一些实施方案中,cDNA微阵列是Affymetrix微阵列(Irizarry(2003)Nucleic Acids Res 31:e15;Dalma-Weiszhausz等人(2006)Methods Enzymol.410:3-28)、NimbleGen微阵列(Wei等人(2008)Nucleic AcidsRes 36(9):2926-2938;Albert等人(2007)Nat.Methods 4:903-905)、Agilent微阵列(Hughes等人(2001)Nat.Biotechnol.19(4):342-347)或BeadArray阵列(Liu等人(2017)Biosens Bioelectron 92:596-601)。在一些实施方案中,寡核苷酸微阵列是DNA覆瓦阵列(Mockler和Ecker(2005)Genomics 85(1):1-15;Bertone等人(2006)Genome Res 16(2):271-281)。其他合适的基于阵列的方法是本领域中已知的。
在一些实施方案中,一旦已经确定受试者患有癌症(例如,卵巢癌、子宫内膜癌、膀胱癌或UTUC),就可以额外监测所述受试者或选择其进行增加监测。在一些实施方案中,本文提供的方法可以用于在常规技术能够诊断患有早期癌症的受试者的时间段之前的时间段选择所述受试者进行增加监测。例如,当受试者通过常规方法未被诊断为患有癌症时和/或当不知道受试者携带癌症时,可以使用本文提供的用于选择受试者进行增加监测的方法。在一些实施方案中,与未被选择进行增加监测的受试者相比,可以增加的频率向被选择进行增加监测的受试者施用诊断测试(例如,本文公开的任何诊断测试)。例如,可以每天两次、每天一次、每两周一次、每周一次、每两月一次、每月一次、每季度一次、每半年一次、每年一次或其中的任何频率向被选择进行增加监测的受试者施用诊断测试。在一些实施方案中,与未被选择进行增加监测的受试者相比,可以向被选择进行增加监测的受试者施用一次或多次额外的诊断测试。例如,可以向被选择进行增加监测的受试者施用两次诊断测试,而仅向未被选择进行增加监测的受试者施用单次诊断测试(或不进行诊断测试)。在一些实施方案中,还可以选择已经被选择进行增加监测的受试者进行进一步诊断测试。一旦已经鉴定出癌细胞的存在(例如,通过本文公开的各种方法中的任何一种),对受试者经历两种增加的监测(例如,评估受试者中肿瘤或癌症的进展和/或评估额外的遗传生物标记物(例如,癌细胞突变)的发展和/或非整倍性)以及进一步的诊断测试(例如,确定携带癌细胞的肿瘤的大小和/或确切位置)可能是有益的。在一些实施方案中,在检测到遗传生物标记物(例如,癌细胞突变)和/或非整倍性之后,向被选择进行增加监测的受试者施用治疗性干预。可以施用本文公开的或本领域已知的任何治疗性干预。例如,如果在整个增加监测时间段内维持癌细胞的存在,则可以进一步监测已经被选择进行增加监测的受试者,并且可以施用治疗性干预。另外或替代地,可以向已经选择进行增加监测的受试者施用治疗性干预,并且随着治疗性干预的进行进一步监测。在一些实施方案中,在已经向被选择进行增加监测的受试者施用治疗性干预之后,增加监测将显示一个或多个遗传生物标记物(例如,一个或多个额外的癌细胞突变)和/或非整倍性。在一些实施方案中,此类一个或多个遗传生物标记物(例如,一个或多个额外的癌细胞突变)和/或非整倍性将提供施用不同治疗性干预的原因(例如,在治疗性干预期间,癌细胞中可能会产生耐药性突变,所述携带耐药性突变的癌细胞对原始治疗性干预具有耐药性)。
在一些实施方案中,一旦已经确定受试者患有癌症(例如,卵巢癌、子宫内膜癌、膀胱癌或UTUC),就可以向所述受试者施用进一步测试或选择其进行进一步诊断测试。在一些实施方案中,本文提供的方法可以用于在常规技术能够诊断患有早期癌症的受试者的时间段之前的时间段选择所述受试者进行进一步诊断测试。例如,当受试者通过常规方法未被诊断为患有癌症时和/或当不知道受试者携带癌症时,可以使用本文提供的用于选择受试者进行进一步诊断测试的方法。在一些实施方案中,与未被选择进行进一步诊断测试的受试者相比,可以增加的频率向被选择进行进一步诊断测试的受试者施用诊断测试(例如,本文公开的任何诊断测试)。例如,可以每天两次、每天一次、每两周一次、每周一次、每两月一次、每月一次、每季度一次、每半年一次、每年一次或其中的任何频率向被选择进行进一步诊断测试的受试者施用诊断测试。在一些实施方案中,与未被选择进行进一步诊断测试的受试者相比,可以向被选择进行进一步诊断测试的受试者施用一次或多次额外的诊断测试。例如,可以向被选择进行进一步诊断测试的受试者施用两次诊断测试,而仅向未被选择进行进一步诊断测试的受试者施用单次诊断测试(或不进行诊断测试)。在一些实施方案中,诊断测试方法可以确定与最初检测到的癌症类型相同的癌症的存在。另外或替代地,诊断测试方法可以确定与最初检测到的癌症类型不同的癌症的存在。在一些实施方案中,诊断测试方法是扫描。在一些实施方案中,扫描是计算机断层成像(CT)、CT血管造影(CTA)、钡餐造影(钡吞咽)、钡灌肠、磁共振成像(MRI)、PET扫描、超声(例如,支气管内超声、内镜超声)、X射线、DEXA扫描。在一些实施方案中,诊断测试方法是身体检查,诸如肛门镜检查、支气管镜检查(例如,自发性荧光支气管镜检查、白光支气管镜检查、导航支气管镜检查)、结肠镜检查、数字乳腺断层合成、内镜逆行胰胆管造影(ERCP)、食道胃十二指肠镜检查、乳腺摄影、宫颈涂片、盆腔检查、正电子发射断层成像与计算机断层成像(PET-CT)扫描。在一些实施方案中,还可以选择已经被选择进行进一步诊断测试的受试者进行增加监测。一旦已经鉴定出癌细胞的存在(例如,通过本文公开的各种方法中的任何一种),对受试者经历两种增加的监测(例如,评估受试者中肿瘤或癌症的进展和/或评估额外的遗传生物标记物(例如,额外的癌细胞突变)的发展和/或非整倍性)以及进一步的诊断测试(例如,确定携带癌细胞的肿瘤的大小和/或确切位置)可能是有益的。在一些实施方案中,在检测到遗传生物标记物(例如,癌细胞突变)和/或非整倍性之后,向被选择进行进一步诊断测试的受试者施用治疗性干预。可以施用本文公开的或本领域已知的任何治疗性干预。例如,如果确认了癌细胞的存在,则可以向已经被选择进行进一步诊断测试的受试者施用进一步诊断测试,并且可以施用治疗性干预。另外或替代地,可以向已经选择进行进一步诊断测试的受试者施用治疗性干预,并且可以随着治疗性干预的进行进一步监测。在一些实施方案中,在已经向被选择进行进一步诊断测试的受试者施用治疗性干预之后,额外的测试将显示一个或多个额外的遗传生物标记物(例如,癌细胞突变)和/或非整倍性。在一些实施方案中,此类一个或多个额外的遗传生物标记物(例如,癌细胞突变)和/或非整倍性将提供施用不同治疗性干预的原因(例如,在治疗性干预期间,癌细胞中可能会产生耐药性突变,所述携带耐药性突变的癌细胞对原始治疗性干预具有耐药性)。
在一些实施方案中,使用国际专利申请公布号WO 2017/132438中所述的各种瓶颈测序系统方法中的任何一种检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物的存在,所述国际专利的内容以引用的方式整体并入本文。瓶颈测序系统(BotSeqS)是一种下一代测序方法,其同时定量跨线粒体和核基因组的罕见体细胞点突变。BotSeqS在即将进行文库扩增之前将分子条形码技术与简单的稀释步骤组合。BotSeqS可以用于显示罕见突变的年龄和组织依赖性积累,并且证明正常组织中的体细胞突变负荷可能变化若干数量级,这取决于生物和环境因素。BotSeqS已经用于显示正常组织中线粒体和核基因组的突变模式之间的主要差异。BotSeqS已经显示正常组织的突变谱彼此相同,但是与其中发生的癌症的突变谱相似。
根据BotSeqS的一些实施方案,提供了一种用于获得DNA的序列的方法。将衔接子连接到DNA群体的随机片段的末端以形成衔接子连接的片段的文库,使得在衔接子连接的片段的文库中扩增片段时,片段的每个末端具有不同的末端。将衔接子连接的片段的文库稀释以形成稀释的衔接子连接的片段。将稀释的衔接子连接的片段的至少一部分扩增以从衔接子连接的片段的单链形成家族。对家族成员进行测序以获得衔接子连接的片段的多个家族成员的核苷酸序列。
根据BotSeqS的一些实施方案,提供了一种用于对DNA测序的方法。将衔接子连接到片段化的双链DNA分子群体的末端以形成衔接子连接的片段的文库,使得在衔接子连接的片段的文库中扩增片段时,片段的每个末端具有不同的末端。将衔接子连接的片段的文库稀释以形成稀释的衔接子连接的片段。将稀释的衔接子连接的片段的至少一部分扩增以从衔接子连接的片段的单链形成家族。对家族成员进行测序以获得衔接子连接的片段的多个家族成员的核苷酸序列。将第一家族的成员的核苷酸序列与参考序列比对。鉴定第一家族的成员与参考序列之间的差异。如果发现差异在来自衔接子连接的片段的单链的相反链的第二家族中,则将差异鉴定为潜在的罕见或潜在的非克隆突变。
根据BotSeqS的一些实施方案,提供了一种用于对DNA测序的方法。将来自样品的双链DNA群体随机片段化,以形成片段文库。将衔接子连接到片段的末端以形成衔接子连接的片段的文库,使得在衔接子连接的片段的文库中扩增片段时,片段的每个末端具有不同的末端。将衔接子连接的片段的文库稀释以形成稀释的衔接子连接的片段。将稀释的衔接子连接的片段的至少一部分扩增以从衔接子连接的片段的单链形成家族。对家族成员进行测序以获得衔接子连接的片段的多个家族成员的核苷酸序列。将第一家族的成员的核苷酸序列与参考序列比对。鉴定第一家族的成员与参考序列之间的差异。如果发现差异在来自衔接子连接的片段的单链的相反链的第二家族中,则将差异鉴定为潜在的罕见或潜在的非克隆突变。
在检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物(例如,突变)的存在的一些实施方案中,定量跨线粒体和核基因组的罕见体细胞点突变。此类方法的一个或多个实施方案非正式地被称为BotSeqS,它是瓶颈测序系统的简称。在即将进行文库扩增之前使用分子条形码技术(外源或内源)和简单稀释步骤,所述方法允许例如基于年龄或正常组织的组织类型确定突变负荷。本文所述的各种BotSeqS方法也可以用于证明诱变剂和环境伤害对于突变率的影响。本文所述的各种BotSeqS方法设计来以完全无偏的方式准确检测任何分子条形码化文库中的罕见点突变。
BotSeqS可以与任何分子条形码技术策略一起使用,诸如内源位置标界的条形码,在Kinde,I等人,Detection and quantification of rare mutations with massivelyparallel sequencing.Proceedings of the National Academy of Sciences of theUnited States of America 108,9530-9535(2011)中描述,以及外源添加的匹配条形码(Kinde,I等人,Detection and quantification of rare mutations with massivelyparallel sequencing.Proceedings of the National Academy of Sciences of theUnited States of America 108,9530-9535(2011);Jabara等人,Accurate sampling anddeep sequencing of the HIV-1 protease gene using a Primer ID.Proceedings ofthe National Academy of Sciences of the United States of America 108,20166-20171(2011);Schmitt,M.W.等人Detection of ultra-rare mutations by next-generation sequencing.Proceedings of the National Academy of Sciences of theUnited States of America 109,14508-14513(2012);Hiatt等人,Single moleculemolecular inversion probes for targeted,high-accuracy detection of low-frequency variation.Genome research 23,843-854(2013);Kivioja,T.等人Countingabsolute numbers of molecules using unique molecular identifiers.Naturemethods 9,72-74(2012);Kinde,I.等人Evaluation of DNA from the Papanicolaoutest to detect ovarian and endometrial cancers.Science translational medicine5,167ral64(2013);Kumar,A.等人Deep sequencing of multiple regions of glialtumors reveals spatial heterogenelty for mutations in clinically relevantgenes.Genome biology 15,530(2014);Keys,J.R.等人Primer ID Informs Next-Generation Sequencing Platforms and Reveals Preexisting Drug ResistanceMutations in the HIV-1 Reverse Transcriptase Coding Domain.AIDS Res HumRetroviruses 31,658-668(2015))。在一些实施方案中,BotSeqS以完全无偏的方式测量全基因组范围内的非常罕见的突变,而SafeSeqS在预定的靶向基因座上测量相对频繁但不是克隆的突变(即,“亚克隆”)。
从概念上讲,可以将BotSeqS设想为实现随机采样的基因组基因座的低覆盖,而Safe-SeqS通过对靶向基因座的超高覆盖来发挥作用。
可以视为本文所述的各种BotSeqS方法的特征的低基因组覆盖允许罕见突变在此基因组位置处构成信号的主要部分,从而有助于方法的敏感性。此类方法的应用是多种多样的。它们可以用于测量非常罕见的体细胞突变。它们可以用于评估体细胞镶嵌性、细胞谱系发育、衰老理论、环境致癌物暴露以及癌症风险评估。在本文的实施例中证明了许多这些应用。
可以将各种过滤器应用于使用各种BotSeqS测序方法生成的数据。可以应用的一种过滤器仅用于mtDNA;仅Watson和Crick重复家族,排除包括高频率突变的模板(即均聚物,每个模板>1个突变),并且排除映射到repeatMasker的模板。可以应用的另一种过滤器仅用于核DNA;仅Watson和Crick重复家族,排除包括高频率突变的模板(即均聚物,每个模板>1个突变),并且排除映射到重复DNA或结构变体的模板。可以应用的另一种过滤器仅用于mtDNA,仅单碱基取代,平均质量得分大于或等于30,读长1>=2个Watson重复,仅具有>=90%突变部分,读长2>=2个Crick重复,仅具有>=90%突变部分,排除WGS中识别的所有变体,排除dbSNP142中的所有变体,排除映射到repeatMasker的识别,排除视觉人为误差和高频率突变(即,均聚物,第6和第7周期,每个模板>1个变化,每个变化>1个模板)。可以应用的另一种过滤器是仅核DNA,仅单碱基取代,平均质量得分>=30,读长1>=2个PCR重复,仅具有>=90%突变部分,读长2>=2个PCR重复,仅具有>=90%突变部分,排除WGS中识别的所有变体,排除dbSNP130和dbSNP142中的所有变体,排除映射到重复DNA或结构变体的识别,排除视觉人为误差和高频率突变(即,均聚物,第6和第7周期,每个模板>1个变化)。
使用各种数据库来比对和过滤数据,包括:dbSNP build 130、基因组变体数据库、片段重复、间断重复序列片段、简单串联重复序列、Repeat Masker、dbSNP build 142、更新的基因组变体数据库、更新的基因组变体数据库、更新的片段重复、更新的间断重复序列片段、更新的简单串联重复序列、更新的Repeat Masker。使用了来自USCS人类基因组浏览器的GRCh37/hgl9基因组组装。
双链DNA的片段可以使用本领域已知的任何技术由更长链的聚合物制成,所述技术包括但不限于酶消化、超声处理和剪切。替代地,一些DNA来源已经片段化为合适的大小。此类来源包括但不限于唾液、痰液、尿液、血浆和粪便。如果DNA来源的大小已经进行适当改变,则片段无需进一步片段化。理想地,无论是内源的还是人为的,片段化过程都是随机的。片段的理想大小可以取决于测序读长的长度。片段可以小于2kbp、小于1500bp、小于1kbp、小于500bp、小于400bp、小于200bp或小于100bp。例如,理想地,片段可以大于读长长度的两倍。例如,片段可以是至少50bp、至少100bp、至少150bp、至少200bp、至少300bp、至少400bp、至少500bp。
在一些实施方案中,片段连接到衔接子。在一些实施方案中,片段的每个末端具有不同的衔接子。这可能是一个费力的过程,可能涉及进行大量筛选和处理以获得每端具有两个不同衔接子的片段。实现此目标的一种方式是使用Y、U或发夹形衔接子,其含有或者可以加工成在Watson和Crick链上含有序列非互补序列。如果衔接子中存在非互补区,则扩增时,衔接子连接的片段的扩增将在来源于每条链的片段上产生具有不同衔接子取向的双链片段。
可以使用对于来源适当的任何稀释水平来进行衔接子连接的片段的文库的稀释。浓缩程度较低的样品可以进行较少的稀释,而浓缩程度较高的样品可以进行较多的稀释。样品的复杂性也会影响所需的稀释度。可以方便地使用任何稀释系列,诸如两倍稀释、五倍稀释、十倍稀释等。在一些实施方案中,选择将产生每个衔接子连接的片段~5-10个家族成员的稀释水平。这受多少片段进行测序的影响。例如,在一个特定稀释度下,对-20百万个簇进行测序将产生1-4个成员,而对75百万个簇进行测序将产生5-10个成员(参见图55)。测序的分子越多,每个家族中存在的成员数量就越高。在对来源于稀释的衔接子连接的片段的家族成员进行测序时,理想地获得了衔接子连接的片段的4-100个家族成员的核苷酸序列。
稀释可以有益地实现相对低水平的基因组覆盖。即,可以对基因组进行采样,而不是彻底且重复地测序。在一些实施方案中,稀释是足够的,使得来自核DNA的少于10个家族在非衔接子部分中包含20个或更多个重叠的核苷酸。在一些实施方案中,稀释是足够的,使得来自核DNA的少于5个家族在非衔接子部分中包含20个或更多个重叠的核苷酸。在一些实施方案中,稀释是足够的,使得少于10个家族包含在测试序列与参考序列之间检测到的潜在的罕见差异或潜在的非克隆差异。在一些实施方案中,稀释是足够的,使得少于5个家族包含在测试序列与参考序列之间检测到的潜在的罕见差异或潜在的非克隆差异。
在一些实施方案中,稀释实现三个特征。第一,稀释可以实现代表性基因座对一个或几个分子的较低覆盖,以“不覆盖”罕见突变。第二,稀释可以增加初始分子的两条链都被冗佘测序的机会。第三,稀释可以促进以最少的测序量进行对基因组的随机采样。
扩增可以通过本领域已知的任何技术进行。通常,将使用聚合酶链反应。可以使用其他技术,无论是线性的还是对数的。
通常,将在扩增中使用与衔接子序列互补的引物。
测序可以通过本领域已知的任何技术完成。可以使用下一代测序方法。片段的序列可以与参考序列比对。可以基于内源或外源条形码将它们分组为各家族。内源条形码通常包含与衔接子相邻的N个核苷酸。可以方便地选择N的值,并且提供足够的多样性/复杂性。可以通过扩增引物在单独的连接步骤中添加外源条形码,或者它们可以是衔接子的一部分。在一些实施方案中,条形码是随机的。在一些实施方案中,对2至1000个家族成员进行测序。在一些实施方案中,对少于100个家族成员进行测序。在一些实施方案中,对至少4个家族成员进行测序。在一些实施方案中,对4至10个家族成员进行测序。
根据本文所述的各种方法,不需要物理上分开或单独分析核基因组和线粒体基因组。这允许人们比较同一细胞中两个基因组的比率。
外源条形码技术可以用于鉴定单个片段、样品、组织、患者等。尽管本文提供的实例采用内源条形码技术,但可以用外源条形码技术补充或被外源条形码技术替代。在一些实施方案中,条形码群体的复杂性大于待条形码化的片段群体的复杂性,使得条形码代表特定的片段。可以使用本领域已知的任何技术将条形码添加到片段群体中,所述技术包括但不限于通过扩增或连接,或者所述条形码作为通过连接添加的衔接子分子的一部分。可以在确定的核苷酸序列与参考核苷酸序列之间检测到的差异包括但不限于突变(诸如点突变)、插入/缺失(例如,1-6个碱基的插入或缺失)和/或取代。如果两个不同的家族中存在相同的突变,则其具有更高的确定性程度(例如,它更有可能在生物样品中而不是在实验过程中出现)。两个家族可以具有源自双链片段的相同序列,但是相对于衔接子序列可以具有不同的取向。为了获得更高的确定性程度,可能需要两个家族中每个家族的至少两个成员具有序列差异。为了获得更高的确定性程度,可能需要一个家族的90%或更多成员具有序列差异。
作为过滤掉生殖系或克隆突变的一种方法,可以对未扩增并且来自同一样品的片段的文库进行测序。由于其重复出现,生殖系和克隆突变通过检查中将很明显。
BotSeqS方法是基于NGS的简单实现方法,其可以无偏全基因组的方式准确地测量罕见点突变。使用BotSeqS,实现了若干重要目标:(i)限定了跨全基因组的罕见突变频率的估计;(ii)同时评估同一细胞群体的核基因组和线粒体基因组两者中的罕见突变;(iii)比较了不同年龄个体的各种正常组织、DNA修复能力或接触史的罕见突变频率;以及(iv)鉴定了正常组织中罕见突变的谱,从而允许其与癌症中的克隆突变的谱进行比较。
本文呈现的数据显示突变随着年龄而增加,这一结果与文献基本上一致(Kennedy,S.R.,Loeb,L.A.&Herr,A.J.Somatic mutations in aging,cancer andneurodegeneration.Mech Ageing Dev 133,118-126(2012);vijg,J.Somatic mutations,genome mosaicism,cancer and aging.Current opinion in genetics&development 26,141-149(2014)。大脑中突变的增加率不如结肠或肾中的突变增加率高,大概是因为结肠和肾在整个成年生命中都是自我更新的组织,而大脑则不然。另一方面,鉴于通常认为前额叶皮层中的主要细胞类型是有丝分裂后的,因此突变频率在童年后全部增加的事实令人惊讶(Spalding等人,Retrospective birth dating of cells in humans.Cell 122,133-143(2005))。不受理论的束缚,对此增加有若干潜在的解释。少数细胞比神经元或神经胶质细胞更活跃地复制可能是增加的原因。此类细胞可以包括小神经胶质细胞或浸润性淋巴细胞或其他炎性细胞。替代地,这些突变可能表示与DNA复制无关的自发性DNA损伤的结果。最近对人神经元进行的单细胞测序研究表明,转录期间会发生自发性损伤(Lodato,M.A等人Somatic mutation in single human neurons tracks developmental andtranscriptional history.Science 350,94-98(2015))。然而,与单细胞测序相反,BotSeqS测量两条链上均存在的突变。因此,为了自发性DNA损伤的解释具有合理性,通过BotSeqS鉴定的突变必须已经进行DNA修复。与这种可能性一致,已知DNA修复过程在有丝分裂后的神经元和神经胶质细胞中活跃(Madabhushi,R.,Pan,L.&Tsai,L.H.DNA damage andits links to neurodegeneration.Neuron 83,266-282(2014))。
第三种可能性是这些突变是我们用来检测它们的程序的人为误差。吸引人的是,这种形式上的可能性基本上是不可能排除的,因为突变可能仅在所研究的组织的一个细胞中存在,并且来自此细胞的DNA不再可用于后续评估。另外,没有其他技术可用于以通过本文所述的各种BotSeqS方法实现的敏感性来观察此类突变。当前,敏感性仅受用于所述项目的测序量的限制。使用一小部分的HiSeqTM 2500流通池,很容易检测以6x10-8/bp发生的突变。估计使用整个流通池可以检测到<10-9/bp的突变。Loeb及其同事已经描述了唯一接近这种敏感性的其他方法(Schmitt,M.W.等人Detection of ultra-rare mutations bynext-generation sequencing.Proceedings of the National Academy of Sciences ofthe United States of America 109,14508-14513(2012);Kennedy,S.R.等人Detectingultralow-frequency mutations by Duplex Sequencing.Nature protocols 9,2586-2606(2014)),但这仅适用于基因组的预定义区域(-0.001%)。在没有直接确认的情况下,人们被迫使用相关性和其他方法来支持本文所述的技术的准确性。这些相关性包括以下,如表51中详述:在相同样品的不同DNA等分试样中鉴定出的相似突变频率和谱;在相似年龄的不同个体的相同组织中鉴定出的相似的突变频率和谱;突变频率随着年龄的预期增加;突变频率的年龄依赖性增加的组织特异性差异;缺乏错配修复或暴露于环境诱变剂的正常组织中较高的突变频率;以及正常组织中的突变谱与先前在来自相同组织的癌症中观察到的突变谱一致。实施例7中描述了用于评估BotSeqS的准确性的其他计算机和实验方法。
还可以比较相同组织的线粒体基因组和核基因组中的突变频率。在没有暴露于诱变剂的正常个体中,线粒体中的突变频率比核基因组中的突变频率高得多(中值比为26.2)。这与以下一致:与核基因组相比,线粒体中DNA修复的效率相对较差。然而,同样重要的是,在暴露于香烟烟雾或AA的个体的正常肾脏中,线粒体与核突变频率的比率大大降低(中值为1.3)。这一发现与线粒体中DNA的已知修复效率较低不一致。此外,在暴露于AA的个体的正常肾脏的核DNA中,存在朝向AA突变签名的偏移,A:T向T:A颠换,而在mtDNA中几乎没有。不受理论的束缚,一种可能性是,与其对于核基因组的影响相比,mtDNA中较高的突变流行率可能掩盖了环境诱变剂对于线粒体基因组的影响。另一个可能性是,这些诱变剂在这两个细胞器中引起DNA损伤的方式上存在意料之外的明显差异。
本文呈现的数据的另一个新颖发现是,即使在没有暴露于已知诱变剂的情况下,正常组织之间的突变谱也不同。尚不清楚此类差异是否反映了对尚未鉴定的普遍遇到的诱变剂的不同暴露或组织特异性修复过程。在一些实施方案中,发现正常组织中的罕见突变谱与癌症中存在的克隆突变相似。尽管癌症中的不同突变谱常常被归因于癌症特异性过程,但是本文呈现的数据表明,这些突变的至少一个子集实际上反映了组织特异性过程。这个概念与癌症中存在的大部分突变发生在正常干细胞中的观点是一致的(Tomasetti,C.&Vogelstein,B.Cancer etiology.Variation in cancer risk among tissues can beexplained by the number of stem cell divisions.Science 347,78-81(2015);Tomasetti,C,Vogelstein,B.&Parmigiani,G.Half or more of the somatic mutationsin cancers of self-renewing tissues originate prior to tumorinitiation.Proceedings of the National Academy of Sciences of the UnitedStates ofAmerica 110,1999-2004(2013)。本文所述的各种BotSeqS方法可以易于测量任何目标组织或细胞类型中非常罕见的突变,将适用于所关注的广泛生物医学问题。
在一些实施方案中,使用美国专利申请号9,476,095中所述的各种方法中的任何一种检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物的存在,所述美国专利的内容以引用的方式整体并入本文。一小部分DNA模板中存在的突变的鉴定有利于生物医学研究的若干领域的进展。尽管大规模平行测序仪器在原理上非常适合此任务,但是此类仪器中的错误率通常过高,无法可靠地鉴定罕见变体。为此,本文提供了一种可以明显增加大规模平行测序仪器的敏感性的方法。此方法的一个实例,被称为(安全测序系统)的“Safe-SeqS”,包括:(i)为每个模板分子分配唯一标识符(UID);(ii)扩增每个带唯一标签的模板分子以产生UID家族;以及(iii)对扩增产物进行冗佘测序。如果其中≥95%含有相同的突变,则具有相同UID的PCR片段是真正的突变体(“超突变体”)。此方法可用于例如确定聚合酶的保真度、体外合成的寡核苷酸的准确性以及正常细胞的核基因组和线粒体基因组中突变的流行率。
在本文提供的方法的一些实施方案中,使用连接到多个分析物核酸片段中的每一个的第一末端以形成唯一鉴定的分析物核酸片段的唯一标识符(UID)核酸序列来检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物的存在,冗余地确定唯一鉴定的分析物核酸片段的核苷酸序列,其中所确定的共享UID的核苷酸序列形成一个成员家族,并且当至少1%的家族成员含有一个核苷酸序列时,所述核苷酸序列被鉴定为准确代表分析物核酸片段。
在本文提供的方法的一些实施方案中,使用唯一标识符序列(UID)来检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物的存在,所述唯一标识符序列使用第一引物和第二引物进行至少两个扩增循环连接到多个分析物DNA片段中的每一个的第一末端以形成唯一鉴定的分析物DNA片段。在此类实施方案中,在扩增期间UID相对于分析物DNA片段可以是过量的,第一引物可以包含与所需扩增子互补的第一片段;含有UID的第二片段;以及含有用于后续扩增的通用引发位点的第三片段,第二引物可以包含用于后续扩增的通用引发位点,每个扩增循环可以将一个通用引发位点连接到一条链,唯一鉴定的分析物DNA片段可以扩增以由每个唯一鉴定的分析物DNA片段形成唯一鉴定的分析物DNA片段的家族,并且可以确定所述家族的多个成员的核苷酸序列。
在本文提供的方法的一些实施方案中,使用内源唯一标识符序列(UID)来检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物(例如,突变)的存在。例如,可以获得包括30至2000个碱基(包括端值)的片段的片段化分析物DNA。片段的每个末端都可以形成片段的内源UID。衔接子寡核苷酸可以连接到片段的末端以形成衔接的片段。可以任选地通过使用与分析物DNA中的所选基因互补的捕获寡核苷酸捕获片段的子集或通过扩增与所选基因互补的片段来富集代表一个或多个所选基因的片段。可以使用与衔接子寡核苷酸互补的引物扩增衔接的片段,以形成衔接片段的家族。可以针对多个家族成员确定核苷酸序列。可以比较多个家族成员的核苷酸序列。当至少1%的家族成员含有一个核苷酸序列时,所述核苷酸序列可以被鉴定为准确代表分析物DNA片段。
在一些实施方案中,本文提供了包含引物对群体的组合物,其中每对包含用于扩增和鉴定基因或基因部分的第一引物和第二引物。第一引物可以包含与基因或基因部分互补的第一部分(例如,10-100个核苷酸)和包含用于与第三引物杂交的位点的第二部分(例如,10至100个核苷酸)。第二引物可以包含与基因或基因部分互补的第一部分(例如,10-100个核苷酸)和包含用于与第四引物杂交的位点的第二部分(例如,10至100个核苷酸)。在一些实施方案中,介于第二引物的第一部分与第二部分之间的是第三部分,其由形成唯一标识符(UID)的2至4000个核苷酸组成。群体中的唯一标识符可以具有至少4个不同的序列。第一引物和第二引物可以与基因或基因部分的相反链互补。试剂盒可以包含引物群体以及与第一引物和第二引物中的每一个的第二部分互补的第三和第四引物。
在本文提供的方法的一些实施方案中,使用被称为“Safe-SeqS”(来自安全测序系统)的方法来检测从受试者获得的样品(例如,宫颈、子宫内膜、尿液、唾液、ctDNA、血液、血清和/或血浆样品)中存在的一个或多个遗传生物标记物(例如,突变)的存在。在一个实施方案中,Safe-SeqS涉及两个基本步骤(图61):第一步是为待分析的每个核酸模板分子分配唯一标识符(UID),并且第二步是扩增每个带唯一标签的模板,使得生成许多具有相同序列的子分子(定义为UID家族)。如果在用于扩增的模板分子中预先存在突变,则此突变应存在于一定比例或甚至所有含有此UID的子分子中(除非存在任何后续复制或测序错误)。每个家族成员(或某个预定比例)具有相同突变的UID家族称为“超突变体”。原始模板中未发生的突变,诸如在扩增步骤期间发生的或由于碱基识别错误而发生的那些突变不应产生超突变体(例如,在UID家族中不会以预定频率存在)。在一些实施方案中,扩增不是必要的。
各种Safe-SeqS方法中的任何一种都可以用于需要从序列数据中获得非常高水平的准确性和敏感性的任何目的。如本文所述,所述方法可以用于评估聚合酶的保真度、体外合成的核酸合成的准确性以及正常细胞的核或线粒体核酸中突变的流行率。所述方法可以用于检测和/或定量镶嵌体和体细胞突变。
在本文提供的Safe-SeqS方法的一些实施方案中,可以使用随机片段形成技术(诸如机械剪切、超声处理或使核酸经受其他物理或化学应力)来获得核酸片段。片段可能不是严格随机的,因为一些位点可能比其他位点更易于受应力影响。随机或特定片段化的核酸内切酶也可以用于生成片段。在各种Safe-SeqS方法中的任何一种的一些实施方案中,可以使用不产生随机片段的技术来获得核酸片段。片段的大小可能会变化,但是理想地将在30与5,000个碱基对之间、100与2,000个碱基对之间、150与1,000个碱基对之间或者在这些端点的不同组合的范围内。核酸可以是例如RNA或DNA。也可以使用修饰形式的RNA或DNA。
在本文提供的Safe-SeqS方法的一些实施方案中,外源UID与分析物核酸片段的连接可以通过本领域已知的任何方法进行,包括酶促方法、化学方法或生物学方法。一种方法采用聚合酶链反应。另一种方法采用连接酶。所述酶可以是例如哺乳动物酶或细菌酶。可以在连接之前,使用其他酶(诸如T4DNA聚合酶的Klenow片段)修复片段的末端。可以用于连接的其他酶是其他聚合酶。可以将UID添加到片段的一端或两端。UID可以包含在核酸分子中,所述核酸分子含有用于其他预期功能的其他区域。例如,可以添加通用引发位点来实现以后的扩增。另一个额外位点可以是与分析物核酸中的特定区域或基因互补的区域。例如,UID的长度可以是2至4,000、100至1000、4至400个碱基。在一些实施方案中,UID的长度是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、600、700、800、900、1000个核苷酸或更多,或者可以是这些长度之间的任何长度。在使用两个或更多个UID的实施方案中,UID可以具有相同或不同的长度。
在本文提供的Safe-SeqS方法的一些实施方案中,可以使用随机添加核苷酸以形成用作标识符的短序列来制备UID。在每个添加位置处,可以使用来自四个脱氧核糖核苷酸之一的选择。替代地,可以使用来自三个、两个或一个脱氧核糖核苷酸之一的选择。因此,UID在某些位置中可以是完全随机的、一定程度上随机的或非随机的。制备UID的另一种方式利用在芯片上组装的预定核苷酸。以这种方式制备,有计划地获得了复杂性。在一些实施方案中,将UID连接到片段的每个末端可能是有利的,从而增加了片段上的UID群体的复杂性。
添加外源UID的聚合酶链反应的循环是指双链分子的热变性、第一引物与所得单链的杂交、引物的延伸以形成与原始单链杂交的新第二链。第二循环是指来自原始单链的新第二链的变性、第二引物与新第二链的杂交以及第二引物的延伸以形成与新第二链杂交的新第三链。例如,当分析物是稀释的或存在抑制剂时,可以采用多个循环来增加效率。
在内源UID的情况下,可以通过各种方法中的任何一种将衔接子添加到片段的末端,所述方法包括但不限于连接。在一些实施方案中,可以通过在固相上或在液体步骤中的捕获步骤来降低分析物片段的复杂性。在一些实施方案中,捕获步骤采用与代表所关注的基因或一组基因的探针的杂交。在一些实施方案中,如果在固相上,则将非结合片段与结合片段分开。本领域已知的合适固相包括过滤器、膜、珠、珠粒等。在一些实施方案中,如果在液相中,则可以添加捕获试剂,其例如通过生物素-亲和素类型的相互作用与探针结合。捕获之后,可以洗脱所需的片段以进行进一步处理。添加衔接子和捕获的顺序并不重要。降低分析物片段的复杂性的另一种非限制性方法包括扩增一个或多个特定基因或区域。实现此目的的一种示例性方式是使用反向PCR。可以使用基因特异性的引物,从而富集,同时形成文库。任选地,基因特异性引物可以含有移植序列,用于随后连接到大规模平行测序平台。
因为在一些实施方案中,内源UID提供有限数量的唯一可能性,这取决于片段大小和测序读长长度,所以可以使用内源和外源UID两者的组合。在一些实施方案中,在扩增时引入额外序列会增加可用UID,并且从而增加敏感性。例如,在扩增之前,可以将模板分到96孔中,并且在扩增期间可以使用96种不同的引物;这有效地将可用UID增加96倍,因为可以区分多达96个具有相同内源UID的模板。此技术也可以与外源UID一起使用,使得每个孔的引物将一个唯一的孔特异性序列添加到扩增产物,这也可以提高罕见模板的检测的特异性。
在本文提供的Safe-SeqS方法的一些实施方案中,可以根据已知的生成片段家族的技术进行含有UID的片段的扩增。可以使用聚合酶链反应。还可以方便地使用其他扩增方法。可以使用反向PCR,也可以使用滚环扩增。片段的扩增通常使用引物进行,所述引物与和UID同时连接到片段的引发位点互补。在一些实施方案中,引发位点在UID的远端,使得扩增包括UID。在一些实施方案中,扩增形成片段家族,每个家族成员共享相同的UID。由于UID的多样性通常大大超过片段的多样性,因此每个家族都应来源于分析物中的单个片段分子。用于扩增的引物可以被化学修饰以使其对核酸外切酶更具抗性。此类修饰的非限制性实例包括在一个或多个3′核苷酸与硼酸磷酸酯(boranophosphates)之间使用硫代磷酸酯键。
在本文提供的Safe-SeqS方法的一些实施方案中,对家族成员进行测序并且比较以鉴定家族内的任何差异。在一些实施方案中,在大规模平行测序平台上进行测序,其中许多是可商购获得的。如果测序平台采用进行“移植”的序列,即连接到测序装置,则可以在添加UID或衔接子期间或单独地添加这种序列。移植序列可以是UID引物、通用引物、基因靶特异性引物、用于形成家族的扩增引物的一部分或单独部分。冗佘测序是指对单个家族的多个成员进行测序。
可以设定阈值以鉴定分析物中的遗传生物标记物(例如,突变)。如果“突变”出现在家族的所有成员中,则它来源于分析物。如果它并非出现在所有成员中,则它可能是在分析期间引入的。可以将识别突变的阈值设定为例如1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、97%、98%或100%。可以基于进行测序的家族成员的数量以及特定目的和情况来设定阈值。
在本文提供的Safe-SeqS方法的一些实施方案中,引物对群体用于连接外源UID。例如,第一引物可以包含与基因或基因部分互补的第一部分(例如,10-100个核苷酸)和包含用于与第三引物杂交的位点的第二部分(例如,10至100个核苷酸)。在一些实施方案中,第一引物的第一部分和/或第二部分的长度是10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸或其之间的任何长度。第二引物可以包含与基因或基因部分互补的第一部分(例如,10-100个核苷酸)和包含用于与第四引物杂交的位点的第二部分(例如,10至100个核苷酸)。在一些实施方案中,第二引物的第一部分和/或第二部分的长度是10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸或其之间的任何长度。在一些实施方案中,介于第二引物的第一部分与第二部分之间的是第三部分(例如,2至4,000个核苷酸,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、600、700、800、900、1000个核苷酸或这些值之间的任何数量的核苷酸),其形成唯一标识符(UID)。在一些实施方案中,介于第一引物和第二引物两者的第一部分与第二部分之间的是第三部分(例如,2至4,000个核苷酸,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、600、700、800、900、1000个核苷酸或这些值之间的任何数量的核苷酸),其中的每个形成唯一标识符(UID)。在一些实施方案中,第一引物的第三部分与第二引物的第三部分长度相同。在一些实施方案中,第一引物的第三部分与第二引物的第三部分长度不同。在一些实施方案中,群体中的唯一标识符具有至少4、至少16、至少64、至少256、至少1,024、至少4,096、至少16,384、至少65,536、至少262,144、至少1,048,576、至少4,194,304、至少16,777,216或至少67,108,864个不同序列。在一些实施方案中,第一引物和第二引物与基因或基因部分的相反链互补。可以制备一种试剂盒,其含有用于连接外源UID的引物以及扩增引物,即与第一引物和第二引物中的每一个的第二部分互补的第三引物和第四引物。第三引物和第四引物可以任选地含有额外的移植或索引序列。UID可以包含随机选择的序列、预定义的核苷酸序列或者随机选择的序列和预定义的核苷酸两者。如果两者都可以,则可以将它们以嵌段连接在一起或散布。
在本文提供的Safe-SeqS方法的一些实施方案中,分析方法可以用于定量以及确定序列。例如,可以使用本文所述的方法比较两个分析物DNA片段的相对丰度。
本文所述的结果证明,Safe-SeqS方法可以明显提高大规模平行测序的准确性(表52和表53)。Safe-SeqS可以通过内源或外源引入的UID(或两者)来实施,并且可以应用于几乎任何样品制备工作流或测序平台。如本文所证明,Safe-SeqS可以易于用于鉴定DNA模板群体中的罕见突变体,以测量聚合酶错误率并判断寡核苷酸合成的可靠性。所述策略的优点之一是,它产生分析模板的数量以及含有变体碱基的模板的比例。先前所述的用于检测少量模板分子的体外方法(例如,Dressman D,Yan H,Traverso G,Kinzler K W,&Vogelstein B(2003)Transforming single DNA molecules into fluorescent magneticparticles for detection and enumeration of genetic variations.Proc Natl AcadSci USA 100:8817-8822;Li J等人(2008)Replacing PCR with COLD-PCR enrichesvariant DNA sequences and redefines the sensitivity of genetic testing.NatMed 14:579-584)允许确定突变体模板的比例,但无法确定原始样品中突变体和正常模板的数量。
所关注的是将Safe-SeqS与其他用于减少下一代测序中的错误的方法进行比较。已经开发了增加碱基识别准确性的复杂算法(例如,(ErlichY,Mitra P,delaBastide M,McCombie W R,&Hannon G J(2008)Alta-Cyclic:a self-optimizing base caller fornext-generaion sequencing.Nat Methods 5:679-682;Rougemont J等人(2008)Probabilistic base calling of Solexa sequencing data.BMC Bioinformatics 9:431;Druley T E等人(2009)Quantification of rare allelic variants from pooledgenomic DNA,Nat Methods 6:263-265;Vallania F L等人(2010)High-throughputdiscovery of rare insertions and deletions in large cohorts.Genome Res 20:1711-1718))。这些肯定可以减少假阳性识别,但是它们的敏感性仍然受到文库制备所需的PCR步骤期间发生的人为突变以及碱基识别错误(数量减少)的限制。例如,当前研究中采用的算法使用非常严格的碱基识别标准,并且应用于较短的读长长度,但是仍不能将错误率降低至小于2.0×10-4个错误/bp的平均值。此错误频率至少与其他算法报告的错误频率一样低。为了进一步提高敏感性,这些碱基识别改进可以与Safe-SeqS一起使用。Travers等人已描述了另一种用于减少错误的有效策略(Eid J等人(2009)Real-time DNA sequencingfrom single polymerase molecules.Science 323:133-138)。使用这种技术,每个模板分子的两条链在多个制备型酶促步骤之后都进行了冗佘测序。然而,这种方法只能在特定仪器上进行。此外,对于许多临床应用,初始样品中的模板分子相对较少,并且需要对几乎所有模板分子进行评估才能获得所需的敏感性。在一些实施方案中,本文所述的采用外源引入的UID的方法(图63)通过将UID分配步骤与很少有分子丢失的后续扩增结合而解决了这一问题。
通过以下观察提供了支持通过当前研究中的常规分析鉴定的突变代表人为误差而非原始模板中的真实突变的事实的强有力证据:除了一个实验以外的所有实验中的突变流行率是相似的-2.0×10-4至2.4×10-4个突变/bp(表52和表53)。使用由亚磷酰胺合成的寡核苷酸进行的实验是一个例外,其中在严格的碱基识别标准下使用时,合成过程的错误率明显高于常规Illumina分析的错误率。相比之下,Safe-SeqS的突变流行率变化更大,从0.0至1.4×10-5个突变/bp,这取决于模板和实验。此外,在最受控的实验(其中测量了聚合酶保真度)中通过Safe-SeqS测量的突变流行率(表53A)几乎与先前实验所预测的相同,在所述先前实验中,通过生物测定测量了聚合酶保真度。本文提供的来自正常细胞的DNA中突变流行率的测量值与一些先前的实验数据一致。然而,这些流行率的估计值变化很大,并且可能取决于细胞类型和所分析的序列(参见SI文本)。因此,不能肯定地说,Safe-SeqS显示的少量突变代表测序方法中发生的错误,而不是原始DNA模板中存在的真实突变。SI文本中描述了Safe-SeqS方法中潜在的错误来源。
Safe-SeqS的另一个潜在应用是最小化PCR污染,这对临床实验室而言是一个严重的问题。在内源或外源UID分配的情况下,可以将突变体模板的UID与先前实验中鉴定的那些UID简单进行比较;当突变不频繁时,来自两个独立样品的相同突变在不同实验中具有相同UID的概率可忽略不计。另外,在外源UID的情况下,使用相同模板但没有UID分配PCR循环(图63)的对照实验可以确保模板制备中不存在DNA污染;在没有UID分配循环的情况下应没有模板被扩增,并且因此应观察不到适当大小的PCR产物。
已经证明,外源UID策略可以用于深度分析单个扩增子。此技术可能不适用于必须从含有有限数量模板的样品分析多个扩增子的情况。UID分配循环(图63)中的多重复用可以为这一挑战提供解决方案。第二个潜在问题是临床样品可能含有降低此步骤效率的抑制剂。有可能可以通过在UID分配PCR步骤(图63)中进行多于两个循环来克服此问题,尽管这可能使确定分析模板的数量变得复杂。Safe-SeqS的特异性当前受UID分配PCR步骤中使用的聚合酶保真度的限制,即在进行两个循环的当前实施中为8.8×10-7个突变/bp。将UID分配PCR步骤中的循环数增加至五个将使总体特异性降低至~2×10-6个突变/bp。然而,此特异性可以通过需要多于一个超突变体用于突变鉴定来增加-导入相同的人为突变两次或三次的概率是非常低的(分别为[2×10-6]2或[2×10-6]3)。总之,有若干简单的方法来进行Safe-SeqS变型和分析变型,以满足特定实验的需求。
Luria和Delbrück在1943年的经典论文中写道,他们的“预测无法被直接验证,因为当我们计数培养物中抗性细菌的数量时,我们所观察的不是发生的突变的数量,而是由突变的那些细菌繁殖产生的抗性细菌的数量,繁殖量取决于突变发生的时间”。如在聚合酶保真度实验中所指出的,在此所述的各种Safe-SeqS程序都可以验证此类预测,因为可以根据数据估计每个突变的数量和发生时间。除了在体外通过聚合酶生成的模板之外,相同的方法还可以应用于来自细菌、病毒和哺乳动物细胞的DNA。因此,预期此策略将为各种重要的生物医学问题提供明确的答案。
在一些实施方案中,使用美国专利申请公布号2018/0208999中描述的各种方法中的任一种检测遗传生物标记物(例如,一个或多个遗传生物标记物),所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括分析无细胞核酸的计数、片段化模式和大小,所述无细胞核酸例如是血浆DNA和血清DNA,包括来自病原体诸如病毒的核酸。各种实施方案涉及分析无细胞核酸的计数、片段化模式和大小的应用(例如,生物样品的分类),所述无细胞核酸例如是血浆DNA和血清DNA,包括来自病原体诸如病毒的核酸。本申请的一些实施方案可以确定受试者是否患有特定病状。例如,一种方法可以确定受试者是否患有癌症或肿瘤或其他病理。另一种应用的实施方案可以用于评估病状的阶段或病状随时间的进展。例如,一种方法可以用于确定受试者的癌症阶段或受试者的癌症随时间的进展(例如,使用在不同时间从受试者获得的样品)。根据一个实施方案,从无细胞核酸分子的混合物的测序获得的序列读长可以用于确定与对应于病毒的参考基因组比对的序列读长的量。可以将与参考基因组比对的序列读长的量与临界值进行比较以筛选病理。根据另一个实施方案,可以使用病毒核酸分子(例如,与对应于病毒的参考基因组比对的那些)的大小。可以确定来自病毒的核酸分子的大小分布的统计值。可以通过针对临界值处理统计值来确定受试者的病理水平。根据另一个实施方案,确定在对应于病毒的参考基因组的一个或多个第一窗口内终止的无细胞核酸分子的第一量。每个第一窗口至少包括第一组基因组位置中的一个,在所述基因组位置处,无细胞核酸分子的末端以高于患有与病毒相关联的癌症(或其他病理)的受试者中的第一阈值的比率存在。可以通过使用第二量的无细胞核酸分子归一化第一量来计算相对丰度,所述第二量的无细胞核酸分子包括在包括第一组基因组位置的一个或多个第一窗口之外在第二组基因组位置处终止的无细胞核酸分子。可以通过针对临界值处理相对丰度来确定受试者的癌症水平。实施方案可以组合各种技术。例如,第一测定可以基于计数、基于大小或基于片段化。第二测定可以是其他技术之一。作为实例,可以使用多数投票法,或者可以确定两种技术的临界值,从而由两种技术确定对应于特定病理水平的一组数据点。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0203974中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种计算机实现的方法,其涉及在包括处理器和计算机可读介质的计算机中接收数据集,其中所述计算机可读介质包括指令,所述指令在由处理器执行时使计算机例如鉴定生物测试样品中的体细胞突变;并且生成包含所述体细胞突变的体细胞突变谱;以及基于突变签名的暴露权重来检测患者中癌症的存在。另外或替代地,遗传生物标记物的检测可以包括使用非负矩阵分解(NMF)方法来构建签名矩阵,所述签名矩阵可以用于鉴定患者中的隐性签名。在其他实施方案中,所述方法可以使用主成分分析(PCA)或矢量量化(VQ)方法来构建签名矩阵。在一个实例中,患者样品是无细胞核酸样品(例如,无细胞DNA(cfDNA)和/或无细胞RNA(cfRNA))。使用非负矩阵分解的签名矩阵构建可以推广到与癌症检测和/或分类相关的多个特征。在一些实施方案中,签名矩阵包括多个签名,其中表示多个特征中的每一个的出现概率。相关特征的实例包括但不限于碱基取代突变的上游序列环境、碱基取代突变的下游序列环境、插入、缺失、体细胞拷贝数改变(SCNA)、易位、基因组甲基化状态、染色质状态、测序覆盖深度、早期与晚期复制区、有义链与反义链、突变间距离、变体等位基因频率、片段起始/终止、片段长度和基因表达状态或其任何组合。在一个实施方案中,上游和/或下游序列环境可以包含长度范围为约2至约40bp、诸如约3至约30bp、诸如约3至约20bp、或者诸如约2至约10bp的碱基取代突变的序列环境的核酸区域。在一个实施方案中,上游和/或下游序列环境可以是碱基取代突变的三联体序列环境、四联体序列环境、五联体序列环境、六联体序列环境或七联体序列环境。在一些实施方案中,上游和/或下游序列环境可以是碱基取代突变的三联体序列环境。在一个实施方案中,所述方法用于鉴定受试者(例如,无症状受试者)的cfDNA样品中的隐性体细胞突变签名,以用于癌症的早期检测。在另一个实施方案中,所述方法用于基于在患者的cfDNA样品中鉴定的隐性突变签名来推断患者癌症的起源组织。在又一个实施方案中,所述方法用于鉴定患者的cfDNA样品中的隐性突变签名,所述隐性突变签名可以用于针对不同类型的疗法将患者分类。在又一个实施方案中,将非负矩阵分解应用于在体细胞变体(突变)识别测定中学习错误模式。例如,可以鉴定测定所基于的系统错误(例如,在文库制备、PCR、杂交捕获和/或测序期间贡献的错误)并对其分配唯一签名,所述唯一签名可以用于区分来自真实体细胞变体的贡献和由测定中的技术过程产生的假变体的贡献。在又一个实施方案中,非负矩阵分解可以用于鉴定与健康衰老相关联的突变签名。与衰老相关联的突变过程被分配了突变签名,所述突变签名可以用于区分与患者年龄相关联的健康体细胞突变和由患者的癌症过程贡献并指示患者的癌症过程的体细胞突变。在另一个实施方案中,可以随时间监测一个或多个突变签名并将其用于癌症的诊断、监测和/或分类。例如,可以评估在两个或更多个时间点从患者样品观察到的cfDNA中的突变谱。在一些实施方案中,可以作为不同突变签名的组合评估两个或更多个突变签名过程。在又一个实施方案中,可以随时间(例如,在多个时间点)监测一个或多个突变签名以监测治疗方案或其他癌症治疗的有效性。癌症基因组中的体细胞突变(即,驱动突变和乘客突变)通常是DNA损伤和修复的一个或多个突变过程的累积结果。尽管不希望受理论的束缚,但是据信暴露于每个突变过程(例如,环境因素和DNA修复过程)的强度和持续时间导致受试者(例如,癌症患者)中体细胞突变的唯一概况。这些突变类型的唯一组合形成了癌症患者的唯一“突变签名”。此外,如本领域中熟知的,体细胞突变或突变谱可能取决于突变的特定序列环境。例如,当碱基变化在(-T|C|-)C(A|T|C|G)的序列环境内发生时,UV损伤通常导致C至T的碱基变化。在此实例中,C是突变碱基,并且C的上游碱基(T或C)和下游碱基(A、T、C或G)影响UV辐射下突变的概率。在另一个实例中,当碱基变化在(A|T|C|G)C(-|-|-|G)的序列环境内发生时,5-甲基胞嘧啶的自发脱氨反应通常导致C至T的碱基变化。因此,在一个实施方案中,所鉴定的突变的序列环境可以用作癌症的检测和/或分类中分析体细胞突变的特征。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/119399中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于从含DNA的测试样品制备测序文库的方法,其包括用于使一个或多个部分连接的DNA片段复位以增强文库制备转化效率的方法。所述方法还可以用于改进从双链DNA取得双链体序列信息。另外或替代地,遗传生物标记物的检测可以包括一种用于制备双链DNA测序文库的方法,所述方法包括以下步骤:(a)获得包含多个双链DNA(dsDNA)片段的测试样品,其中所述dsDNA片段包含正向链和反向链;(b)将双链DNA衔接子连接到dsDNA片段的两端;以及(c)用DNA聚合酶延伸dsDNA片段的未连接的3′末端以产生dsDNA片段-适配子模板来制备测序文库。在一些实施方案中,在测序之前进一步扩增dsDNA片段-衔接子模板。在一些实施方案中,所述方法的一个或多个步骤可以在单个反应步骤中进行。例如,步骤(b)至(c)可以在单个反应管中,利用包含第一组dsDNA衔接子、连接酶、聚合酶(任选地具有链置换活性)、末端脱氧核苷酰转移酶以及第二组ssDNA寡核苷酸或引物(例如,包括测序衔接子和/或通用引物)的反应混合物进行。任选地,可以在连接步骤(b)之前从测试样品纯化dsDNA分子,并任选地使其片段化。另外或替代地,遗传生物标记物的检测可以包括一种用于制备双链DNA测序文库的方法,所述方法包括以下步骤:(a)获得包含多个双链DNA(dsDNA)片段的测试样品,所述dsDNA片段包含正向链和反向链;(b)将双链衔接子添加到dsDNA片段并且将双链衔接子连接到dsDNA片段的两端;(c)用聚合酶延伸dsDNA片段的未连接的3′末端以产生dsDNA片段-衔接子模板,其中所述聚合酶还具有链置换活性;(d)将多腺嘌呤尾部添加到dsDNA片段-衔接子模板的3′末端;(e)添加一组ssDNA寡核苷酸(或引物)并将ssDNA寡核苷酸与dsDNA片段-衔接子模板杂交;以及(f)延伸所述组的ssDNA寡核苷酸以产生dsDNA测序文库。在一些实施方案中,所述方法的一个或多个步骤可以在单个反应步骤中进行。例如,步骤(b)至(f)可以在单个反应管中,利用包含第一组dsDNA衔接子、连接酶、聚合酶(任选地具有链置换活性)、末端脱氧核苷酰转移酶以及第二组ssDNA寡核苷酸或引物(例如,包括测序衔接子和/或通用引物)的反应混合物进行。任选地,可以在连接步骤(b)之前从测试样品纯化dsDNA分子,并任选地使其片段化。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/119438中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括分析测序数据以在核酸样品中检测CNV的方法。在从人受试者获得的核酸样品中检测CNV可以为确定受试者中癌症的存在提供信息。在一个实施方案中,在从人受试者获得的核酸样品中检测CNV可以用于早期检测受试者中的癌症。在各种实施方案中,所述方法确定个体核苷酸碱基处由靶向测序读长确定的覆盖。覆盖变化的来源可以在碱基水平下进行校正。对于靶向基因组套的每个基因,可以考虑跨基因碱基的所确定的碱基水平覆盖,以更有效地检测每个基因的CNV。通常,可以使用从健康个体收集的训练数据对每个碱基位置处存在的基线覆盖偏差进行建模。因此,当分析从受试者获得的测试样品时,可以鉴于通过建模获得的预期覆盖偏差,确定每个碱基位置的碱基水平覆盖。具体地,如果从受试者获得的测试样品的碱基位置处的覆盖偏差与通过建模获得的预期覆盖偏差不同,则可以对覆盖偏差进行归一化和去除。对于靶向基因组套中的基因,分析跨基因的碱基位置的碱基水平覆盖,以确定所述基因的覆盖是否与先前使用从健康个体收集的训练数据确定的基因的预期覆盖水平不同。如果是这样,则可以识别CNV。CNV的识别可以指示受试者中癌症的存在或者受试者易患癌症的可能性增加。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/111872中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括基于多个RNA分子制备测序文库,所述多个RNA分子通过以下进行加标签和扩增:用与通过逆转录酶(例如,MMLV RT)的末端转移酶活性引入的polyC尾部杂交的寡核苷酸对分子加标签,并且使用连接酶(例如,T4 RNA连接酶)将寡核苷酸连接到RNA分子,并且基于mRNA和链置换逆转录酶(例如,MMLV RT)产生cDNA分子,并且产生第二cDNA链以便产生用于测序的dsDNA文库。在一些实施方案中,所述方法包括对测序文库的至少一部分进行测序以从测试样品(例如,来自受试者的生物样品)获得测序数据或序列读长。在一个实施方案中,用于从包含RNA的测试样品制备测序文库的方法包括以下步骤:(a)获得包含RNA序列的测试样品,并且纯化来自测试样品的RNA序列;(b)基于RNA序列和cDNA链的尾部为C的3′末端合成第一互补DNA(cDNA)链;(c)将互补模板转换寡核苷酸与cDNA的C尾部退火,并且将互补模板转换寡核苷酸连接到RNA序列的5′末端以产生RNA模板;以及(d)使用链置换逆转录酶从RNA模板合成多条cDNA链。在一些实施方案中,所述方法的一个或多个步骤可以在单个反应步骤中进行。例如,步骤(b)至(d)可以在单个反应管中,利用包含RNA引物(例如,无规六聚体RNA引物、polyT引物或其组合)、链置换逆转录酶(例如,MMLV逆转录酶)、RNA连接酶(例如,T4 RNA连接酶)和任选地多核苷酸激酶(例如,T4多核苷酸激酶)的反应混合物进行。在一些实施方案中,用于从包含RNA的测试样品制备测序文库的方法包括以下步骤:(a)获得包含一个或多个RNA序列的测试样品,并且纯化来自测试样品的一个或多个RNA序列;(b)将第一RNA引物与一个或多个RNA序列退火;(c)使用逆转录酶在第一核酸延伸反应中延伸第一RNA引物以生成与一个或多个RNA模板互补的多个DNA序列,其中所述逆转录酶具有逆转录和末端转移酶活性,并且其中互补DNA(cDNA)序列在cDNA序列的3′末端处还包含多个非模板碱基;(d)将互补核酸序列与在cDNA序列的3′末端处的非模板碱基退火,其中所述互补核酸序列还包含唯一分子标识符(UMI)或唯一序列标签;(e)将互补核酸序列连接到一个或多个RNA序列的5′末端以生成一个或多个RNA模板,其中一个或多个RNA模板包含共价连接到互补核酸序列的一个或多个原始RNA序列,所述互补核酸序列包含UMI或唯一序列标签;(f)将一个或多个第二RNA引物与一个或多个RNA模板退火;以及(g)使用链置换逆转录酶在第二核酸延伸反应中延伸所述一个或多个第二RNA引物,以生成与所述一个或多个RNA模板互补的多个DNA序列,其中所述多个互补DNA(cDNA)序列各自包含互补DNA序列和UMI或唯一序列标签。在一些实施方案中,所述方法的一个或多个步骤可以在单个反应步骤中进行。例如,在一些实施方案中,步骤(b)至(g)可以在单个反应管中,利用包含RNA引物(例如,无规六聚体RNA引物、polyT引物或其组合)、链置换逆转录酶(例如,MMLV逆转录酶)、RNA连接酶(例如,T4 RNA连接酶)和任选地多核苷酸激酶(例如,T4多核苷酸激酶)的反应混合物进行。在一个实施方案中,所述方法涉及从包含RNA分子的测试样品制备测序文库,所述方法包括以下步骤:(a)获得包含一个或多个RNA序列的测试样品,并且纯化来自测试样品的一个或多个RNA序列;(b)将第一RNA引物与一个或多个RNA序列退火;(c)使用逆转录酶在第一核酸延伸反应中延伸第一RNA引物以生成与一个或多个RNA序列互补的多个DNA序列,其中所述逆转录酶具有逆转录和末端转移酶活性,其中末端转移酶活性将胞嘧啶(C)尾部添加到互补DNA(cDNA)序列的3′末端;(d)将模板转换寡核苷酸与cDNA序列的3′-胞嘧啶尾部退火,其中所述模板转换寡核苷酸包含唯一分子标识符(UMI)或唯一序列标签;(e)使用T4 RNA连接酶将模板转换寡核苷酸连接到一个或多个RNA序列的5′末端以生成一个或多个RNA模板,其中一个或多个RNA模板包含共价连接到模板转换寡核苷酸和UMI或唯一序列标签的一个或多个原始RNA序列;(f)将多个第二RNA引物与一个或多个RNA模板退火;以及(g)使用链置换逆转录酶在第二核酸延伸反应中延伸所述多个第二RNA引物,以生成与所述一个或多个RNA模板互补的多个DNA序列,其中所述多个互补DNA(cDNA)各自包含互补DNA序列和UMI或唯一序列标签。在一些实施方案中,方法的一个或多个步骤可以在单个反应步骤中进行。例如,步骤(b)至(g)可以在单个反应管中,利用包含RNA引物(例如,无规六聚体RNA引物、polyT引物或其组合)、链置换逆转录酶(例如,MMLV逆转录酶)、RNA连接酶(例如,T4 RNA连接酶)和任选地多核苷酸激酶(例如,T4多核苷酸激酶)的反应混合物进行。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/085862中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于鉴定体细胞突变签名以用于检测、诊断、监测和/或分类已知患有或被怀疑患有癌症的患者的癌症的方法和系统。在各种实施方案中,所述方法使用非负矩阵分解(NMF)方法来构建签名矩阵,所述签名矩阵可以用于鉴定患者样品中的隐性签名以用于检测和分类癌症。在其他实施方案中,所述方法可以使用主成分分析(PCA)或矢量量化(VQ)方法来构建签名矩阵。在一个实例中,患者样品是无细胞核酸样品(例如,无细胞DNA(cfDNA)和/或无细胞RNA(cfRNA))。使用非负矩阵分解的签名矩阵构建可以推广到与癌症检测和/或分类相关的多个特征。在一些实施方案中,签名矩阵包括多个签名,其中表示多个特征中的每一个的出现概率。相关特征的实例包括但不限于碱基取代突变的上游序列环境、碱基取代突变的下游序列环境、插入、缺失、体细胞拷贝数改变(SCNA)、易位、基因组甲基化状态、染色质状态、测序覆盖深度、早期与晚期复制区、有义链与反义链、突变间距离、变体等位基因频率、片段起始/终止、片段长度和基因表达状态或其任何组合。在一个实施方案中,上游和/或下游序列环境可以包含长度范围为约2至约40bp、诸如约3至约30bp、诸如约3至约20bp、或者诸如约2至约10bp的碱基取代突变的序列环境的核酸区域。在一个实施方案中,上游和/或下游序列环境可以是碱基取代突变的三联体序列环境、四联体序列环境、五联体序列环境、六联体序列环境或七联体序列环境。在一些实施方案中,上游和/或下游序列环境可以是碱基取代突变的三联体序列环境。在一个实施方案中,所述方法用于鉴定受试者(例如,无症状受试者)的cfDNA样品中的隐性体细胞突变签名,以用于癌症的早期检测。在另一个实施方案中,所述方法用于基于在患者的cfDNA样品中鉴定的隐性突变签名来推断患者癌症的起源组织。在又一个实施方案中,所述方法用于鉴定患者的cfDNA样品中的隐性突变签名,所述隐性突变签名可以用于针对不同类型的疗法将患者分类。在又一个实施方案中,将非负矩阵分解应用于在体细胞变体(突变)识别测定中学习错误模式。例如,可以鉴定测定所基于的系统错误(例如,在文库制备、PCR、杂交捕获和/或测序期间贡献的错误)并对其分配唯一签名,所述唯一签名可以用于区分来自真实体细胞变体的贡献和由测定中的技术过程产生的假变体的贡献。在又一个实施方案中,非负矩阵分解可以用于鉴定与健康衰老相关联的突变签名。与衰老相关联的突变过程被分配了突变签名,所述突变签名可以用于区分与患者年龄相关联的健康体细胞突变和由患者的癌症过程贡献并指示患者的癌症过程的体细胞突变。在另一个实施方案中,可以随时间监测一个或多个突变签名并将其用于癌症的诊断、监测和/或分类。例如,可以评估在两个或更多个时间点从患者样品观察到的cfDNA中的突变谱。在一些实施方案中,可以作为不同突变签名的组合评估两个或更多个突变签名过程。在又一个实施方案中,可以随时间(例如,在多个时间点)监测一个或多个突变签名以监测治疗方案或其他癌症治疗的有效性。在一个实施方案中,所鉴定的突变的序列环境可以用作癌症的检测和/或分类中分析体细胞突变的特征。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0163201中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于制备包含多个RNA分子的测序文库的方法。在一个实施方案中,用于从包含RNA的测试样品制备测序文库的方法包括以下步骤:(a)获得包含RNA序列的测试样品,并且纯化来自测试样品的RNA序列;(b)基于RNA序列和cDNA链的尾部为C的3′末端合成第一互补DNA(cDNA)链;(c)将互补模板转换寡核苷酸与cDNA的C尾部退火,并且将互补模板转换寡核苷酸连接到RNA序列的5′末端以产生RNA模板;以及(d)使用链置换逆转录酶从RNA模板合成多条cDNA链。在一些实施方案中,所述方法的一个或多个步骤可以在单个反应步骤中进行。例如,步骤(b)至(d)可以在单个反应管中,利用包含RNA引物(例如,无规六聚体RNA引物、polyT引物或其组合)、链置换逆转录酶(例如,MMLV逆转录酶)、RNA连接酶(例如,T4 RNA连接酶)和任选地多核苷酸激酶(例如,T4多核苷酸激酶)的反应混合物进行。在一个实施方案中,所述方法包括以下步骤:(a)获得包含一个或多个RNA序列的测试样品,并且纯化来自测试样品的一个或多个RNA序列;(b)将第一RNA引物与一个或多个RNA序列退火;(c)使用逆转录酶在第一核酸延伸反应中延伸第一RNA引物以生成与一个或多个RNA模板互补的多个DNA序列,其中所述逆转录酶具有逆转录和末端转移酶活性,并且其中互补DNA(cDNA)序列在cDNA序列的3′末端处还包含多个非模板碱基;(d)将互补核酸序列与在cDNA序列的3′末端处的非模板碱基退火,其中所述互补核酸序列还包含唯一分子标识符(UMI)或唯一序列标签;(e)将互补核酸序列连接到一个或多个RNA序列的5′末端以生成一个或多个RNA模板,其中一个或多个RNA模板包含共价连接到互补核酸序列的一个或多个原始RNA序列,所述互补核酸序列包含UMI或唯一序列标签;(f)将一个或多个第二RNA引物与一个或多个RNA模板退火;以及(g)使用链置换逆转录酶在第二核酸延伸反应中延伸所述一个或多个第二RNA引物,以生成与所述一个或多个RNA模板互补的多个DNA序列,其中所述多个互补DNA(cDNA)序列各自包含互补DNA序列和UMI或唯一序列标签。在一些实施方案中,所述方法的一个或多个步骤可以在单个反应步骤中进行。例如,在一些实施方案中,步骤(b)至(g)可以在单个反应管中,利用包含RNA引物(例如,无规六聚体RNA引物、polyT引物或其组合)、链置换逆转录酶(例如,MMLV逆转录酶)、RNA连接酶(例如,T4 RNA连接酶)和任选地多核苷酸激酶(例如,T4多核苷酸激酶)的反应混合物进行。在一个实施方案中,方法涉及从包含RNA分子的测试样品制备测序文库,所述方法包括以下步骤:(a)获得包含一个或多个RNA序列的测试样品,并且纯化来自测试样品的一个或多个RNA序列;(b)将第一RNA引物与一个或多个RNA序列退火;(c)使用逆转录酶在第一核酸延伸反应中延伸第一RNA引物以生成与一个或多个RNA序列互补的多个DNA序列,其中所述逆转录酶具有逆转录和末端转移酶活性,其中末端转移酶活性将胞嘧啶(C)尾部添加到互补DNA(cDNA)序列的3′末端;(d)将模板转换寡核苷酸与cDNA序列的3′-胞嘧啶尾部退火,其中所述模板转换寡核苷酸包含唯一分子标识符(UMI)或唯一序列标签;(e)使用T4 RNA连接酶将模板转换寡核苷酸连接到一个或多个RNA序列的5′末端以生成一个或多个RNA模板,其中一个或多个RNA模板包含共价连接到模板转换寡核苷酸和UMI或唯一序列标签的一个或多个原始RNA序列;(f)将多个第二RNA引物与一个或多个RNA模板退火;以及(g)使用链置换逆转录酶在第二核酸延伸反应中延伸所述多个第二RNA引物,以生成与所述一个或多个RNA模板互补的多个DNA序列,其中所述多个互补DNA(cDNA)各自包含互补DNA序列和UMI或唯一序列标签。在一些实施方案中,方法的一个或多个步骤可以在单个反应步骤中进行。例如,步骤(b)至(g)可以在单个反应管中,利用包含RNA引物(例如,无规六聚体RNA引物、polyT引物或其组合)、链置换逆转录酶(例如,MMLV逆转录酶)、RNA连接酶(例如,T4 RNA连接酶)和任选地多核苷酸激酶(例如,T4多核苷酸激酶)的反应混合物进行。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/081130中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种从受试者获得第一生物样品的方法,其中第一生物样品包含来自受试者的无细胞核酸和潜在地来自病原体的无细胞核酸。在一些实施方案中,所述方法包括进行第一测定,所述第一测定包括测量来自第一生物样品中的病原体的无细胞核酸的拷贝数。在一些实施方案中,所述方法包括从受试者获得第二生物样品,其中第二生物样品包含来自受试者的无细胞核酸和潜在地来自病原体的无细胞核酸。在一些实施方案中,所述方法包括进行第二测定,所述第二测定包括对第二生物样品中的无细胞核酸进行大规模平行测序以生成序列读长。在一些实施方案中,所述方法包括确定与病原体的参考基因组比对的序列读长的量。在一些实施方案中,所述方法包括确定无细胞核酸分子的量,所述无细胞核酸分子具有在给定范围内的大小并基于大规模平行测序与病原体的参考基因组比对。在一些实施方案中,所述方法包括基于进行第一测定和进行第二测定来筛选肿瘤,所述第一测定包括测量来自第一生物样品中的病原体的无细胞核酸的拷贝数,所述第二测定包括对第二生物样品中的无细胞核酸进行大规模平行测序以生成序列读长。在一些实施方案中,第一生物样品和第二生物样品是相同的。在一些实施方案中,所述方法还包括确定与病原体的参考基因组比对的序列读长的百分比。在一些实施方案中,所述方法还包括将与病原体的参考基因组比对的序列读长的百分比与临界值进行比较。在一些实施方案中,所述方法还包括确定来自第二生物样品的与具有给定范围内的大小的病原体的参考基因组比对的无细胞核酸分子的第一部分与来自第二生物样品的与具有给定范围内的大小的受试者的参考基因组比对的无细胞核酸分子的第二部分的大小比。在一些实施方案中,所述方法还包括确定大小指数,其中所述大小指数是大小比的倒数;以及将大小指数与第二临界值进行比较。在一些实施方案中,肿瘤是鼻咽癌。在一些实施方案中,病原体是Epstein-Barr病毒(EBV)。在一些实施方案中,测量来自第一生物样品中的病原体的无细胞核酸的拷贝数包括扩增。在一些实施方案中,扩增包括聚合酶链反应(PCR)。在一些实施方案中,PCR包括定量PCR(qPCR)。在一些实施方案中,第一生物样品和第二生物样品是血浆。在一些实施方案中,所述方法包括从受试者获得第一生物样品,其中第一生物样品包含来自受试者的无细胞核酸和潜在地来自病原体的无细胞核酸。在一些实施方案中,所述方法包括进行第一测定,所述第一测定包括测量来自第一生物样品中的病原体的无细胞核酸的拷贝数,其中所述第一测定包括受试者中肿瘤存在的阳性预测值。在一些实施方案中,所述方法包括对来自受试者的第二生物样品进行第二测定,其中所述第二生物样品包含来自受试者的无细胞核酸和潜在地来自病原体的无细胞核酸,并且其中第一测定和第二测定的受试者中肿瘤存在的阳性预测值是第一测定的阳性预测值的至少5倍。在一些实施方案中,第一测定和第二测定的受试者中肿瘤存在的阳性预测值是第一测定的阳性预测值的至少7.5倍。在一些实施方案中,第一测定和第二测定的受试者中肿瘤存在的阳性预测值为至少15%。在一些实施方案中,第一测定和第二测定的受试者中肿瘤存在的阳性预测值为至少25%。在一些实施方案中,第一生物样品和第二生物样品是相同的。在一些实施方案中,第一生物样品和第二生物样品是血浆。在一些实施方案中,肿瘤是鼻咽癌。在一些实施方案中,病原体是Epstein-Barr病毒(EBV)。在一些实施方案中,测量来自第一生物样品中的病原体的无细胞核酸的拷贝数包括扩增。在一些实施方案中,扩增包括聚合酶链反应(PCR)。在一些实施方案中,PCR包括定量PCR(qPCR)。在一些实施方案中,第二测定包括第二生物样品中的无细胞核酸的大规模平行测序以产生序列读长。在一些实施方案中,第二测定包括确定与病原体的参考基因组比对的序列读长的量。在一些实施方案中,第二测定包括确定第二生物样品中的无细胞核酸分子的量,所述无细胞核酸分子具有在给定范围内的大小并与病原体的参考基因组比对。在一些实施方案中,所述方法包括从受试者获得第一生物样品,其中第一生物样品包含来自受试者的无细胞核酸和潜在地来自病原体的无细胞核酸。在一些实施方案中,所述方法包括进行第一测定,所述第一测定包括测量来自第一生物样品中的病原体的无细胞核酸的拷贝数,其中所述第一测定具有受试者中存在肿瘤的假阳性率。在一些实施方案中,所述方法包括对来自受试者的第二生物样品进行第二测定,其中所述第二生物样品包含来自受试者的无细胞核酸和潜在地来自病原体的无细胞核酸,其中第一测定和第二测定的受试者中存在肿瘤的假阳性率是第一测定的假阳性率的至少5倍低。在一些实施方案中,在第一测定和第二测定的受试者中肿瘤存在的假阳性率是第一测定的假阳性率的至少10倍低。在一些实施方案中,第一测定和第二测定的受试者中肿瘤存在的假阳性率小于1%。在一些实施方案中,第一生物样品和第二生物样品是相同的。在一些实施方案中,第一生物样品和第二生物样品是血浆。在一些实施方案中,肿瘤是鼻咽癌。在一些实施方案中,病原体是Epstein-Barr病毒(EBV)。在一些实施方案中,测量来自第一生物样品中的病原体的无细胞核酸的拷贝数包括扩增。在一些实施方案中,扩增包括聚合酶链反应(PCR)。在一些实施方案中,PCR包括定量PCR(qPCR)。在一些实施方案中,第二测定包括第二生物样品中的无细胞核酸的大规模平行测序以产生序列读长。在一些实施方案中,第二测定包括确定与病原体的参考基因组比对的序列读长的量。在一些实施方案中,第二测定包括确定第二生物样品中的无细胞核酸分子的量,所述无细胞核酸分子具有在给定范围内的大小并与病原体的参考基因组比对。在一些实施方案中,所述方法包括分析生物样品以确定从其获得生物样品的受试者的病理水平,所述生物样品包含无细胞核酸分子的混合物,所述混合物包含来自受试者的核酸分子和潜在地来自病原体的核酸分子。在一些实施方案中,所述方法包括分析来自受试者的生物样品的多个第一无细胞核酸分子,其中所述分析包括确定参考基因组中对应于所述多个第一无细胞核酸分子的至少一端的基因组位置,所述参考基因组对应于病原体。在一些实施方案中,所述方法包括确定在第一窗口中的一个内终止的多个第一无细胞核酸分子的第一量,每个第一窗口至少包括第一组基因组位置中的一个,在所述基因组位置处,无细胞核酸分子的末端以高于患有与病原体相关联的病理的受试者中的第一阈值的比率存在。在一些实施方案中,所述方法包括通过使用第二量的来自生物样品的多个第一无细胞核酸分子归一化第一量来计算在第一窗口中的一个内终止的多个第一无细胞核酸分子的相对丰度,其中所述第二量的多个第一无细胞核酸分子包括在包括第一组基因组位置的第一窗口之外在第二组基因组位置处终止的无细胞核酸分子。在一些实施方案中,所述方法包括通过针对一个或多个临界值处理相对丰度来确定受试者的病理水平。在一些实施方案中,针对一个或多个临界值的相对丰度包括确定相对丰度是否大于一个或多个临界值。在一些实施方案中,所述方法还包括确定在第二窗口中的一个内终止的多个第一无细胞核酸分子的第二量,每个第二窗口至少包括第二组基因组位置中的一个,在所述基因组位置处,无细胞核酸分子的末端以高于没有由病原体引起的病理的受试者中的第二阈值的比率存在,其中归一化第一量包括使用第一量和第二量计算相对丰度。在一些实施方案中,所述方法还包括鉴定第二组基因组位置。在一些实施方案中,鉴定包括通过计算机系统分析来自没有病理的参考受试者的参考样品的无细胞核酸分子。在一些实施方案中,分析多个无细胞核酸分子中的每一个包括确定参考基因组中对应于无细胞核酸分子的至少一端的基因组位置。在一些实施方案中,所述参考受试者是健康的。在一些实施方案中,相对丰度包括第一量和第二量的比率。在一些实施方案中,所述方法还包括鉴定第一组基因组位置,在所述基因组位置处,无细胞核酸分子的末端以高于第一阈值的比率发生。在一些实施方案中,鉴定第一组基因组位置包括通过计算机系统分析来自至少一个第一额外样品的多个第二无细胞核酸分子,以鉴定多个第二无细胞核酸分子的终止位置,其中已知所述至少一个第一额外样品具有与病原体相关联的病理并且与生物样品的样品类型相同。在一些实施方案中,所述方法还包括针对多个基因组窗口中的每个基因组窗口,计算在所述基因组窗口上终止的多个第二无细胞核酸分子的对应数量,以及将所述对应数量与参考值进行比较以确定在基因组窗口内的一个或多个基因组位置上终止的无细胞核酸分子的比率是否高于第一阈值。在一些实施方案中,多个基因组窗口中的第一基因组窗口具有至少一个基因组位置的宽度,并且其中如果所述对应数量超过参考值,则第一基因组窗口内的基因组位置中的每一个被鉴定为具有高于第一阈值的在基因组位置上终止的无细胞核酸分子的比率。在一些实施方案中,第一组基因组位置具有对应数量的最高N值,其中N为至少100。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号20180119216中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于从双链DNA(例如,双链cfDNA)样品制备和分析单链测序文库的方法。在一些实施方案中,样品包括双链DNA(dsDNA)分子和受损dsDNA(例如,带切口的dsDNA)分子。在一些实施方案中,样品包括单链DNA(ssDNA)分子。所述方法有助于从样品中的dsDNA、ssDNA和受损DNA(例如,带切口的DNA)分子收集信息,包括链配对和连接性信息,从而提供与使用常规方法制备的测序文库相比增强的诊断信息。另外或替代地,遗传生物标记物的检测可以包括制备用于测序的单链DNA(ssDNA)文库。例如,遗传生物标记物的检测可以包括使用ssDNA文库制备,其中双链DNA片段的正向(有义)和反向(反义)链两者用相同的或基本上相同的唯一序列标签(例如,分区特异性条形码(partition-specific barcode)或UMI)加标签,所述唯一序列标签允许鉴定和分析来自dsDNA分子的互补链。在一个实施方案中,所述方法包括制备用于测序的单链DNA文库,所述方法包括以下步骤:(a)获得包含双链DNA(dsDNA)的测试样品,并且从测试样品中分离dsDNA;(b)将dsDNA样品分成多个个体反应隔室;(c)向所述个体反应隔室中的每一个中添加反应混合物,所述反应混合物包含多个具有唯一序列标签的寡核苷酸;(d)使dsDNA变性以产生单链DNA(ssDNA)片段;以及(e)将唯一序列标签连接到ssDNA片段。在另一个实施方案中,提供了一种用于制备用于测序的无细胞DNA文库的方法,所述方法包括以下步骤:(a)获得包含无细胞双链DNA(dsDNA)的测试样品,并且从测试样品中分离dsDNA;(b)将dsDNA样品分成多个个体反应液滴;(c)向所述个体液滴中的每一个中添加反应混合物,所述反应混合物包含多个DNA捕获珠粒,其中所述DNA捕获珠粒中的每一个包含多个具有唯一序列标签的附接寡核苷酸;(d)加热液滴以使dsDNA变性或使dsDNA化学变性以产生单链DNA(ssDNA)片段并且从所述珠粒释放唯一序列标签;以及(e)将唯一序列标签连接到ssDNA片段的3′末端。在一些实施方案中,所述珠粒选自包括以下的组:链霉亲和素涂覆的珠粒、固相可逆固定(SPRI)珠粒和磁性珠粒。在另一个实施方案中,提供了一种用于制备用于测序的单链DNA文库的方法,所述方法包括以下步骤:(a)提供多个分区,其中多个分区中的个体分区包括:(i)测试样品的一部分,其包含例如从一个或多个个体中分离的受损和/或未受损的双链DNA(dsDNA);和(ii)多个寡核苷酸,其中所述多个寡核苷酸包含分区特异性条形码;(b)在适于使双链DNA变性为单链DNA的条件下温育所述分区;以及(c)将单链DNA连接到寡核苷酸,其中所述连接将分区特异性条形码共价连接到单链DNA,并且产生分区特异性条形码化的单链DNA。在一些实施方案中,所述方法还包括组合多个分区。在一些实施方案中,所述方法还包括将寡核苷酸引物与分区特异性条形码化的单链DNA杂交并延伸引物,从而产生分区特异性条形码化的双链DNA。在一些实施方案中,所述方法包括扩增分区特异性条形码化的单链DNA和/或分区特异性条形码化的双链DNA。在一些实施方案中,所述方法还包括使从一个或多个个体中分离的双链DNA脱磷酸。在一些实施方案中,所述方法包括使从一个或多个个体中分离的双链DNA脱磷酸,并且然后分割从一个或多个个体中分离的双链DNA,从而提供多个分区。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0087105中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于从混合的无细胞DNA(cfDNA)样品制备和分析测序文库的方法,其中所述混合的样品包含双链DNA(dsDNA)、受损dsDNA(例如,带切口的dsDNA)和单链DNA(ssDNA)分子。本发明的方法有助于从样品中的dsDNA、ssDNA和受损DNA(例如,带切口的DNA)分子收集信息,从而提供与由单独的dsDNA制备的测序文库相比增强的诊断信息。在一些实施方案中,所述方法包括通过以下从混合的cfDNA样品制备组合的无细胞DNA(cfDNA)测序文库:将包含唯一序列标签的通用衔接子连接到混合的cfDNA样品中的至少一个单链DNA(ssDNA)分子;延伸通用衔接子以生成ssDNA衍生的双链DNA(dsDNA)分子;以及从ssDNA衍生的dsDNA分子生成组合的cfDNA测序文库。在一些实施方案中,一种方法还包括在生成组合的cfDNA测序文库之前,将测序Y衔接子连接到ssDNA衍生的dsDNA分子。在一些实施方案中,测序Y衔接子包含唯一序列标签。在一些实施方案中,第一唯一序列标签和第二唯一序列标签是不同的。在一些实施方案中,所述方法还包括:延伸第二测序Y衔接子以生成第二切口衍生的dsDNA分子;将第三测序Y衔接子连接到第二切口衍生的dsDNA分子;以及从第一和第二切口衍生的dsDNA分子生成组合的cfDNA测序文库。在一些实施方案中,用于从混合的cfDNA样品制备组合的cfDNA测序文库的方法包括:将第一测序Y衔接子连接到混合的cfDNA样品中带切口的dsDNA分子的第一末端,其中带切口的dsDNA分子包含带切口链和无切口链;将第二测序Y衔接子连接到混合的cfDNA样品中带切口的dsDNA分子的第二末端;使测序Y衔接子连接的带切口的dsDNA分子变性,以生成来源于无切口链的第一ssDNA分子、来源于带切口链的第二ssDNA分子和来源于带切口链的第三ssDNA分子;延伸第二测序Y衔接子以生成第一个切口衍生的dsDNA分子;将第三测序Y衔接子连接到第一切口衍生的dsDNA分子;以及从第一切口衍生的dsDNA分子生成组合的cfDNA测序文库。在一些实施方案中,第一测序Y衔接子包含第一唯一序列标签,第二测序Y衔接子包含第二唯一序列标签,并且第三测序Y衔接子包含第三唯一序列标签。在一些实施方案中,第一、第二和第三唯一序列标签是相同的。在一些实施方案中,第一、第二和第三唯一序列标签是不同的。在一些实施方案中,第一和第二唯一序列标签是相同的,而第三唯一序列标签是不同的。在一些实施方案中,第一和第三唯一序列标签是相同的,而第二唯一序列标签是不同的。在一些实施方案中,第二和第三唯一序列标签是相同的,而第一唯一序列标签是不同的。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0002749中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于对来自单一来源样品的RNA和DNA两者进行测序的方法、组合物、反应混合物、试剂盒和系统。在一些实施方案中,处理RNA以便将RNA序列与来源于同一样品的DNA序列区分开。在一些实施方案中,RNA和DNA是无细胞多核苷酸。在一些实施方案中,所述方法提高了突变(例如,罕见序列变体)的鉴定中测序方法的敏感性和/或碱基识别准确性。在一些实施方案中,所述方法包括:(a)获得包含RNA和DNA两者的样品;(b)逆转录RNA以产生cDNA/RNA杂交分子;(c)降解杂交分子的RNA以产生单链cDNA;(d)在包括单链DNA连接酶的反应中,优先将包含标签序列的标签寡核苷酸与单链cDNA连接,以产生带标签的cDNA;以及(e)对DNA和带标签的cDNA进行测序;其中逆转录、优先连接和测序在DNA的存在下进行。在一些实施方案中,RNA和DNA是无细胞核酸。核酸(包括无细胞核酸)可以从多种来源中的任一种中分离,诸如血液、血液级分(例如,血清或血浆)、尿液和其他体液。在一些实施方案中,逆转录包括延伸包含随机序列的引物(例如,在一个或多个位置处从一组两个或更多个不同核苷酸随机选择的一个或多个核苷酸,在一个或多个位置处选择的不同核苷酸中的每一个在包含随机序列的寡核苷酸池中表示)。在一些实施方案中,逆转录包括沿可以包含通用转换引物序列的模板转换寡核苷酸(TSO)延伸杂交体的cDNA。在一些实施方案中,标签寡核苷酸与单链cDNA的3′末端连接。在一些实施方案中,标签寡核苷酸包含引物结合序列。在一些实施方案中,测序包括扩增标记的cDNA以产生双链的标记的cDNA。在一些实施方案中,扩增带标签的cDNA包括延伸与引物结合序列杂交的引物。在一些实施方案中,测序包括将测序衔接子与带标签的cDNA和DNA连接。在一些实施方案中,标签寡核苷酸包含唯一分子标识符(UMI),其中多个带标签的cDNA分子中的每一个可基于UMI与多个带标签的cDNA分子中的其他分子区别(例如,如通过UMI的序列所确定的,任选地与cDNA的序列组合)。在一些实施方案中,样品是血液、血液级分、血浆、血清、唾液、痰液、尿液、精液、经阴道液、脑脊髓液或粪便。在一些实施方案中,样品是血液或血液级分(例如,血清或血浆)。在一些实施方案中,所述方法还包括基于标签序列或标签序列的互补序列的存在或不存在,使用处理器将RNA衍生序列与DNA衍生序列分开分组。在一些实施方案中,所述方法还包括基于RNA衍生序列和DNA衍生序列鉴定受试者的病状(例如,癌症)的存在或不存在。在一些实施方案中,所述方法还包括基于RNA衍生序列和DNA衍生序列治疗受试者。在一些实施方案中,所述方法包括:(a)获得包含RNA和DNA两者的样品;(b)在包括RNA连接酶的反应中,将包含标签序列的标签寡核苷酸与RNA连接以产生带标签的RNA;(c)逆转录带标签的RNA以产生带标签的cDNA;以及(d)对DNA和带标签的cDNA进行测序;其中连接、逆转录和测序在DNA的存在下进行。在一些实施方案中,RNA和DNA是无细胞核酸。在一些实施方案中,所述方法还包括在连接标签序列之前使RNA片段化以产生片段化的RNA。在一些实施方案中,片段化的RNA具有在预定范围内的平均大小(例如,长度为约10至约1,000个核苷酸,诸如在10-800、10-500、50-500、90-200或50-150个核苷酸之间的平均或中值长度;或长度为小于1500、1000、750、500、400、300、250个或更少核苷酸的平均或中值长度)。在一些实施方案中,使RNA片段化包括使RNA和DNA经受优先使RNA片段化的条件。在一些实施方案中,使RNA片段化包括超声处理、化学片段化或加热。在一些实施方案中,所述方法还包括使片段化的RNA的3′末端脱磷酸。在一些实施方案中,标签寡核苷酸与RNA的3′末端连接。在一些实施方案中,标签寡核苷酸包含引物结合序列。在一些实施方案中,逆转录包括延伸与引物结合序列杂交的引物。在一些实施方案中,逆转录包括沿可以包含通用转换引物序列的模板转换寡核苷酸(TSO)延伸带标签的cDNA。在一些实施方案中,测序包括扩增带标签的cDNA以产生双链的带标签的cDNA。在一些实施方案中,测序包括将测序衔接子与带标签的cDNA和DNA连接。在一些实施方案中,标签寡核苷酸包含唯一分子标识符(UMI),其中多个带标签的cDNA分子中的每一个可基于UMI与多个带标签的cDNA分子中的其他分子区别(例如,如通过UMI的序列所确定的,任选地与cDNA的序列组合)。在一些实施方案中,样品是血液、血液级分、血浆、血清、唾液、痰液、尿液、精液、经阴道液、脑脊髓液或粪便。在一些实施方案中,样品是血液或血液级分(例如,血清或血浆)。在一些实施方案中,逆转录包括延伸包含随机序列的引物。在一些实施方案中,所述方法还包括基于标签序列或标签序列的互补序列的存在或不存在,使用处理器将RNA衍生序列与DNA衍生序列分开分组。在一些实施方案中,所述方法还包括基于RNA衍生序列和DNA衍生序列鉴定受试者的病状(例如,癌症)的存在或不存在。在一些实施方案中,所述方法还包括基于RNA衍生序列和DNA衍生序列治疗受试者。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/218512中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于富集样品中的多个靶核酸的方法,所述方法包括提供核酸内切酶系统,其中多个靶核酸中的每一个包含第一变体和第二变体,其中核酸内切酶系统包含多个成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)或其衍生物(每个crRNA包含靶向序列)以及多个CRISPR相关(Cas)蛋白或其变体,每个Cas蛋白能够结合靶核酸上的前间区序列邻近基序(PAM)位点,其中每个靶核酸的第一变体包含邻近与crRNA靶向序列互补的区域的PAM位点,并且其中第二变体不包含PAM位点或不包含与邻近PAM位点的crRNA靶向序列互补的区域;以及使样品与核酸内切酶系统接触,从而耗尽样品中多个靶核酸中的每一个的第一变体并富集第二变体。在一些实施方案中,每个靶核酸的第一变体包含邻近与crRNA靶向序列互补的区域的PAM位点,并且第二变体不包含PAM位点。在一些实施方案中,每个靶核酸的第一变体包含邻近与crRNA靶向序列互补的区域的PAM位点,并且第二变体不包含与邻近PAM位点的crRNA靶向序列互补的区域。在一些实施方案中,每个靶核酸的第一变体包含邻近与crRNA靶向序列互补的区域的PAM位点,并且第二变体不包含与crRNA靶向序列互补的区域。在一些实施方案中,所述方法包括扩增多个靶核酸的富集的第二变体以产生富集的测序文库。在一些实施方案中,所述方法包括对富集的测序文库进行测序以检测样品中的靶核酸中的结构重排或突变。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/127741中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于高保真度测序和鉴定罕见核酸变体的方法和系统。所述系统和方法可以用于鉴定无细胞核酸样品中的罕见变体,诸如主要包含正常基因组核酸的样品中的肿瘤特异性突变。所述系统和方法允许可靠地鉴定样品中以低于1∶10,000的频率发生的突变。此类罕见变体的鉴定是通过优化测序方法中的若干步骤,接着基于被称为集合体的比对的读长对分析测序读长而得出的。所述系统和方法可以应用于罕见变体鉴定之外的应用,诸如针对所需水平的性能或敏感性的测序优化。所述方法包括对核酸进行测序。所述方法的步骤可以包括:获得核酸的测序读长;鉴定包含两个或更多个具有共享的起始坐标和读长长度的测序读长的集合体;确定集合体所包含的测序分子的数量;鉴定集合体中的候选变体;以及使用似然估计模型和所确定的测序分子的数量,确定候选变体为真实变体的似然率。在某些实施方案中,获得测序读长的步骤还可以包括从核酸制备测序文库,扩增测序文库,以及使用下一代测序(NGS)对测序文库进行测序。在某些实施方案中,可以在被配置来允许衔接子堆叠的条件下将衔接子连接到核酸。测序文库的制备可以包括在约16摄氏度的温度下使用约16小时的反应时间将衔接子连接到核酸。扩增步骤可以包括PCR扩增,并且所述方法还可以包括使用计算机模型来选择检测样品中指定浓度的变体所需的过度扩增因子和PCR循环数。在各种实施方案中,所述方法包括基于包括以下的因素设计杂交捕获板以靶向基因组区域:鸟嘌呤-胞嘧啶(GC)含量、靶群体中的突变频率和序列唯一性;以及在测序步骤之前使用杂交捕获板来捕获扩增的核酸。捕获步骤可以包括使用靶向靶基因座的有义链的第一杂交捕获板和靶向靶基因座的反义链的第二杂交捕获板。在某些实施方案中,可以在扩增测序文库之前将合成核酸对照(还称为对照序列、加标对照或阳性对照)添加到核酸中,并且然后可以使用合成核酸对照的测序读长确定错误率。合成核酸对照可以包含已知序列,所述已知序列跨核酸所来源的物种具有低多样性,并且具有多个非天然存在的与已知序列的错配,并且在某些实施方案中,所述多个非天然存在的错配可以是4。合成核酸对照可以包括代表杂交捕获板的靶基因座的鸟嘌呤-胞嘧啶(GC)含量分布,或者可以包含多个核酸,所述多个核酸包含与杂交捕获板的下拉探针的不同重叠。可以使用合成核酸对照的测序读长来确定错误率或候选变变体频率。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,902,992中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于检测拷贝数变化的方法,其包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中细胞外多核苷酸中的每个任选地附接到唯一条形码;b)过滤掉不满足设定阈值的读长;c)将从步骤(a)获得的序列读长映射到参考序列;d)定量/计数参考序列的两个或更多个预定义区域中的映射读长;e)通过以下方式确定一个或多个所述预定义区域中的拷贝数变化:(i)将预定义区域中的读长的数量彼此归一化和/或将预定义区域中的唯一条形码的数量彼此归一化;和(ii)将在步骤(i)中获得的归一化数量与从对照样品获得的归一化数量进行比较。另外或替代地,遗传生物标记物的检测可以包括一种用于在从受试者获得的无细胞或基本上无细胞的样品中检测罕见突变的方法,其包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;b)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;c)过滤掉不满足设定阈值的读长;d)将从测序得出的序列读长映射到参考序列;e)鉴定在每个可映射碱基位置处与参考序列的变体比对的映射序列读长的子集;f)对于每个可映射碱基位置,计算(a)与参考序列相比包括变体的映射序列读长的数量与(b)每个可映射碱基位置的总序列读长的数量的比率;g)归一化每个可映射碱基位置的变异的比率或频率,并且确定一个或多个潜在罕见变体或突变;h)以及将具有一个或多个潜在罕见变体或突变的每个区域的所得数量与从参考样品相似得到的数量进行比较。另外或替代地,遗传生物标记物的检测可以包括表征受试者的异常病状的异质性的方法,所述方法包括生成受试者中细胞外多核苷酸的遗传谱,其中所述遗传谱包括由拷贝数变化和/或其他罕见突变(例如,遗传改变)分析产生的多个数据。在一些实施方案中,同时报告和定量在受试者中鉴定的每种罕见变体的流行率/浓度。在其他实施方案中,报告了关于受试者中罕见变体的流行率/浓度的置信得分。在一些实施方案中,细胞外多核苷酸包含DNA。在其他实施方案中,细胞外多核苷酸包含RNA。多核苷酸可以是片段或在分离之后片段化。另外或替代地,遗传生物标记物的检测可以包括一种用于循环核酸分离和提取的方法。在一些实施方案中,细胞外多核苷酸从身体样品中分离,所述身体样品可以选自由以下组成的组:血液、血浆、血清、尿液、唾液、粘膜分泌物、痰液、粪便和泪液。在一些实施方案中,所述方法还包括确定所述身体样品中具有拷贝数变化或其他罕见遗传改变(例如,序列变体)的序列的百分比的步骤。在一些实施方案中,通过计算具有高于或低于预定阈值的多核苷酸的量的预限定区域的百分比,确定所述身体样品中具有拷贝数变化的序列的百分比。另外或替代地,遗传生物标记物的检测可以包括一种用于在从受试者获得的无细胞或基本上无细胞的样品中检测罕见突变的方法,其包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;b)过滤掉不满足设定阈值的读长;c)将从测序得出的序列读长映射到参考序列;d)鉴定在每个可映射碱基位置处与参考序列的变体比对的映射序列读长的子集;e)对于每个可映射碱基位置,计算(a)与参考序列相比包括变体的映射序列读长的数量与(b)每个可映射碱基位置的总序列读长的数量的比率;f)归一化每个可映射碱基位置的变异的比率或频率,并且确定一个或多个潜在罕见变体或其他遗传改变;以及g)比较每个区域的所得数量。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:a.提供至少一组带标签的亲本多核苷酸,并且对于每组带标签的亲本多核苷酸;b.扩增所述组中带标签的亲本多核苷酸以产生一组对应的扩增子代多核苷酸;c.对所述组的扩增子代多核苷酸的子集(包括真子集)进行测序,以产生一组测序读长;以及d.折叠所述组的测序读长以生成一组共有序列,每个共有序列对应于所述组的带标签的亲本多核苷酸中的唯一多核苷酸。在某些实施方案中,所述方法还包括:e.分析每组带标签的亲本分子的所述组的共有序列。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/064629中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种诱饵组组套,其包括针对基因组的一个或多个核小体相关区域选择性富集的一个或多个诱饵组,所述核小体相关区域包括具有一个或多个具有差异核小体占据的基因组碱基位置的基因组区域,其中差异核小体占据是起源细胞或组织类型或疾病状态的特征。在一些实施方案中,诱饵组组套的一个或多个核小体相关区域中的每一个包含以下中的至少一个:(i)显著结构变化,其包括核小体定位的变化,所述结构变化选自由以下组成的组:插入、缺失、易位、基因重排、甲基化状态、微卫星、拷贝数变化、拷贝数相关结构变化或指示差异的任何其他变化;和(ii)不稳定性,其包括基因组分割图中的一个或多个显著波动或峰,所述一个或多个显著波动或峰指示基因组中核小体图破坏的一个或多个位置。在一些实施方案中,诱饵组组套的一个或多个诱饵组被配置来基于多个参考核小体占据谱的功能捕获基因组的核小体相关区域,所述多个参考核小体占据谱(i)与一种或多种疾病状态和一种或多种非疾病状态相关联;(ii)与已知体细胞突变(诸如SNV、CNV、插入/缺失或重排)相关联;和/或(iii)与差异表达模式相关联。在一个实施方案中,诱饵组组套的一个或多个诱饵组针对无细胞脱氧核糖核酸(cfDNA)样品中的一个或多个核小体相关区域选择性富集。另外或替代地,遗传生物标记物的检测可以包括一种用于针对基因组的核小体相关区域富集核酸样品的方法,其包括:(a)使核酸样品与诱饵组组套接触,所述诱饵组组套包括针对基因组的一个或多个核小体相关区域选择性富集的一个或多个诱饵组;以及(b)针对基因组的一个或多个核小体相关区域富集核酸样品。另外或替代地,遗传生物标记物的检测可以包括一种用于生成诱饵组的方法,其包括:(a)鉴定基因组的一个或多个区域,所述区域与核小体谱相关联;以及(b)选择诱饵组以选择性捕获所述区域。在一个实施方案中,诱饵组组套中的诱饵组针对无细胞脱氧核糖核酸样品中的一个或多个核小体相关区域选择性地富集。另外或替代地,遗传生物标记物的检测可以包括一种用于针对多个基因组区域富集的方法,其包括:使预定量的核酸样品与包括以下的诱饵组套接触:(i)第一诱饵组,其与核酸样品的第一组基因组区域选择性杂交,所述第一诱饵组以小于第一诱饵组的饱和点的第一浓度比提供,和(ii)第二诱饵组,其与核酸样品的第二组基因组区域选择性杂交,所述第二诱饵组以与第二诱饵组的饱和点相关联的第二浓度比提供;以及针对第一组基因组区域和第二组基因组区域富集核酸样品。另外或替代地,遗传生物标记物的检测可以包括一种用于提高从来源于受试者的身体样品中的无细胞脱氧核糖核酸(cfDNA)分子的多个序列读长中检测插入或缺失(插入/缺失)的准确性的方法,所述多个序列读长通过核酸测序生成,所述方法包括(a)对于与无细胞DNA分子相关联的多个序列读长中的每一个,提供:在多个序列读长的一个或多个序列读长中检测到插入/缺失的预定期望;鉴于已经在一个或多个序列读长中检测到插入/缺失,所检测到的插入/缺失是无细胞DNA分子的给定无细胞DNA分子中存在的真实插入/缺失的预定期望;以及鉴于已经在一个或多个序列读长中检测到插入/缺失,所检测到的插入/缺失是通过非生物错误引入的预定期望;(b)提供表示通过核酸测序生成的序列读长的特征的一个或多个模型参数的定量测量值;(c)检测与无细胞DNA分子相关联的多个序列读长中的一个或多个候选插入/缺失;以及(d)对于每个候选插入/缺失,使用一个或多个模型参数进行假设测试以将所述候选插入/缺失分类为真实插入/缺失或引入的插入/缺失,从而提高检测插入/缺失的准确性。另外或替代地,遗传生物标记物的检测可以包括一种试剂盒,其包括:(a)包含预定量的DNA的样品;和(b)诱饵组组套,其包括(i)第一诱饵组,其与核酸样品的第一组基因组区域选择性杂交,所述第一诱饵组以小于第一诱饵组的饱和点的第一浓度比提供,和(ii)第二诱饵组,其与核酸样品的第二组基因组区域选择性杂交,所述第二诱饵组以与第二诱饵组的饱和点相关联的第二浓度比提供。另外或替代地,遗传生物标记物的检测可以包括一种用于针对多个基因组区域富集的方法,其包括:(a)使预定量的来自样品的核酸与包含以下的诱饵混合物接触:(i)第一诱饵组,其与来自样品的核酸的第一组基因组区域选择性杂交,所述第一诱饵组以小于第一诱饵组的饱和点的第一浓度提供,和(ii)第二诱饵组,其与核酸样品的第二组基因组区域选择性杂交,所述第二诱饵组以与第二诱饵组的饱和点相关联的第二浓度提供;以及(b)针对第一组基因组区域和第二组基因组区域富集核酸样品。另外或替代地,遗传生物标记物的检测可以包括一种用于富集多个基因组区域的方法,其包括:(a)使预定量的来自样品的核酸与包含以下的诱饵混合物接触:(i)第一诱饵组,其与来自样品的核酸的第一组基因组区域选择性杂交,所述第一诱饵组以小于第一诱饵组的饱和点的第一浓度提供,和(ii)第二诱饵组,其与来自样品的核酸的第二组基因组区域选择性杂交,所述第二诱饵组以处于第二诱饵组的饱和点下或高于所述饱和点的第二浓度提供;以及(b)针对第一组基因组区域和第二组基因组区域富集来自样品的核酸,从而产生富集的核酸。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,790,559中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于检测拷贝数变化的方法,其包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中细胞外多核苷酸中的每一个任选地附接到唯一条形码;b)过滤掉不满足设定阈值的读长;c)将从步骤(a)获得的序列读长映射到参考序列;d)定量/计数参考序列的两个或更多个预定义区域中的映射读长;e)通过以下方式确定一个或多个所述预定义区域中的拷贝数变化:(i)将预定义区域中的读长的数量彼此归一化和/或将预定义区域中的唯一条形码的数量彼此归一化;和(ii)将在步骤(i)中获得的归一化数量与从对照样品获得的归一化数量进行比较。另外或替代地,遗传生物标记物的检测可以包括一种用于在从受试者获得的无细胞或基本上无细胞的样品中检测罕见突变的方法,其包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;b)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;c)过滤掉不满足设定阈值的读长;d)将从测序得出的序列读长映射到参考序列;e)鉴定在每个可映射碱基位置处与参考序列的变体比对的映射序列读长的子集;f)对于每个可映射碱基部分,计算(a)与参考序列相比包括变体的映射序列读长的数量与(b)每个可映射碱基位置的总序列读长的数量的比率;g)归一化每个可映射碱基位置的变异的比率或频率,并且确定一个或多个潜在罕见变体或突变;h)以及将具有一个或多个潜在罕见变体或突变的每个区域的所得数量与从参考样品相似得到的数量进行比较。另外或替代地,遗传生物标记物的检测可以包括表征受试者的异常病状的异质性的方法,所述方法包括生成受试者中细胞外多核苷酸的遗传谱,其中所述遗传谱包括由拷贝数变化和/或其他罕见突变(例如,遗传改变)分析产生的多个数据。另外或替代地,遗传生物标记物的检测可以包括一种系统,其包括用于进行以下步骤的计算机可读介质:选择基因组中的预限定区域;枚举预限定区域中的序列读长的数量;归一化跨预限定区域的序列读长的数量;并且确定预限定区域中拷贝数变化的百分比。在一些实施方案中,分析整个基因组或基因组的至少10%、20%、30%、40%、50%、60%、70%、80%或90%。在一些实施方案中,计算机可读介质为终端用户提供血浆或血清中癌症DNA或RNA百分比的数据。另外或替代地,遗传生物标记物的检测可以包括一种用于在从受试者获得的无细胞或基本上无细胞的样品中检测罕见突变的方法,其包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;b)过滤掉不满足设定阈值的读长;c)将从测序得出的序列读长映射到参考序列;d)鉴定在每个可映射碱基位置处与参考序列的变体比对的映射序列读长的子集;e)对于每个可映射碱基位置,计算(a)与参考序列相比包括变体的映射序列读长的数量与(b)每个可映射碱基位置的总序列读长的数量的比率;f)归一化每个可映射碱基位置的变异的比率或频率,并且确定一个或多个潜在罕见变体或其他遗传改变;以及g)比较每个区域的所得数量。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:a.提供至少一组带标签的亲本多核苷酸,并且对于每组带标签的亲本多核苷酸;b.扩增所述组中带标签的亲本多核苷酸以产生一组对应的扩增子代多核苷酸;c.对所述组的扩增子代多核苷酸的子集(包括真子集)进行测序,以产生一组测序读长;以及d.折叠所述组的测序读长以生成一组共有序列,每个共有序列对应于所述组的带标签的亲本多核苷酸中的唯一多核苷酸。在某些实施方案中,所述方法还包括:e.分析每组带标签的亲本分子的所述组的共有序列。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:a.提供至少一组带标签的亲本多核苷酸,并且对于每组带标签的亲本多核苷酸;b.扩增所述组中带标签的亲本多核苷酸以产生一组对应的扩增子代多核苷酸;c.对所述组的扩增子代多核苷酸的子集(包括真子集)进行测序,以产生一组测序读长;d.折叠所述组的测序读长以生成一组共有序列,每个共有序列对应于所述组的带标签的亲本多核苷酸中的唯一多核苷酸;以及e.过滤掉共有序列中不满足质量阈值的那些。在一个实施方案中,质量阈值考虑了从扩增子代多核苷酸折叠成共有序列的序列读长的数量。在另一个实施方案中,质量阈值考虑了从扩增子代多核苷酸折叠成共有序列的序列读长的数量。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:a.提供至少一组带标签的亲本多核苷酸,其中每组映射到一个或多个基因组中的不同参考序列,并且对于每组带标签的亲本多核苷酸;i.扩增第一多核苷酸以产生一组扩增的多核苷酸;ii.对所述组的扩增多核苷酸的子集进行测序,以产生一组测序读长;并且iii.通过以下折叠序列读长:1.将从扩增子代多核苷酸测序的序列读长分为各个家族,每个家族由相同的带标签的亲本多核苷酸扩增。在一个实施方案中,折叠还包括:2.确定每个家族中序列读长的定量测量值。在另一个实施方案中,所述方法还包括(包括a)包括a):b确定唯一家族的定量测量值;以及c.基于(1)唯一家族的定量测量值和(2)每组中序列读长的定量测量值,推断所述组中唯一带标签的亲本多核苷酸的测量值。在另一个实施方案中,使用统计或概率模型来进行推断。在另一个实施方案中,所述方法还包括使用对照样品或一组对照样品来校正两组之间的扩增或代表事件偏差。在另一个实施方案中,所述方法还包括确定组之间的拷贝数变化。在另一个实施方案中,所述方法还包括(包括a、b、c):d.确定各家族中多态形式的定量测量值;以及e.基于确定的多态形式的定量测量值,推断所推断的唯一带标签的亲本多核苷酸的数量中的多态形式的定量测量值。在另一个实施方案中,其中多态形式包括但不限于:取代、插入、缺失、倒位、微卫星变化、颠换、易位、融合、甲基化、超甲基化、羟甲基化、乙酰化、表观遗传变体、调节相关变体或蛋白质结合位点。在其中所述组来源于共同样品的另一个实施方案中,所述方法还包括:a.基于映射到多个参考序列中的每一个的每组中带标签的亲本多核苷酸的推断数量的比较,推断多个组的拷贝数变化。在另一个实施方案中,还推断每组中多核苷酸的原始数量。另外或替代地,遗传生物标记物的检测可以包括一种系统,其包括用于进行前述方法的计算机可读介质。另外或替代地,遗传生物标记物的检测可以包括一种传达关于至少一个个体多核苷酸分子的序列信息的方法,其包括:a.提供至少一个个体多核苷酸分子;b.编码至少一个个体多核苷酸分子中的序列信息以产生信号;c.通过信道传递信号的至少一部分,以产生包括关于至少一个个体多核苷酸分子的核苷酸序列信息的接收信号,其中接收信号包括噪声和/或失真;d.解码接收信号以产生包括关于至少一个个体多核苷酸分子的序列信息的消息,其中解码减少了消息中的噪声和/或失真;以及e.将信息提供给接收者。在一个实施方案中,噪声包括不正确的核苷酸细胞。在另一个实施方案中,失真包括与其他个体多核苷酸分子相比,所述个体多核苷酸分子的不均匀扩增。在另一个实施方案中,失真是由扩增或测序偏差引起的。另外或替代地,遗传生物标记物的检测可以包括一种用于在从受试者获得的无细胞或基本上无细胞的样品中检测罕见突变的方法,其包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序读长;b)在各区域上进行多重测序,或者如果不进行富集,则进行全基因组测序;c)过滤掉不满足设定阈值的读长;d)将从测序得出的序列读长映射到参考序列;e)鉴定在每个可映射碱基位置处与参考序列的变体比对的映射序列读长的子集;f)对于每个可映射碱基位置,计算(a)与参考序列相比包括变体的映射序列读长的数量与(b)每个可映射碱基位置的总序列读长的数量的比率;g)归一化每个可映射碱基位置的变异的比率或频率,并且确定一个或多个潜在罕见变体或突变;以及h)将具有一个或多个潜在罕见变体或突变的每个区域的所得数量与从参考样品相似得到的数量进行比较。另外或替代地,遗传生物标记物的检测可以包括一种表征受试者的异常病状的异质性的方法,所述方法包括生成受试者中细胞外多核苷酸的遗传谱,其中所述遗传谱包括由拷贝数变化和罕见突变分析产生的多个数据。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括使用多重测序在从受试者获得的无细胞或基本上无细胞的样品中确定拷贝数变化或进行罕见突变分析。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:a)提供至少一组带标签的亲本多核苷酸,并且对于每组带标签的亲本多核苷酸;b)扩增所述组中带标签的亲本多核苷酸以产生一组对应的扩增子代多核苷酸;c)对所述组的扩增子代多核苷酸的子集(包括真子集)进行测序,以产生一组测序读长;d)折叠所述组的测序读长以生成一组共有序列,每个共有序列对应于所述组的带标签的亲本多核苷酸中的唯一多核苷酸;以及e)过滤掉共有序列中不满足质量阈值的那些。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,700,286中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种血浆/血清测量中的癌症检测测定,其通过添加和比较癌症患者的血浆/血清中某些基因的反映基因扩增和基因过表达的DNA和RNA的量来进行。因此,基因扩增(通过更多DNA观察到)和基因过表达(更多RNA)是相互关联的。另外或替代地,遗传生物标记物的检测可以包括一种用于诊断或随访癌症演变的方法,其包括:在被怀疑携带癌症的患者的体液中对进行扩增和过表达两者的任何基因一起测量基因过表达(RNA)和基因扩增(DNA);以及与健康对照进行比较。更具体地,从体液(诸如血浆、血清、痰液、唾液等)中提取RNA和DNA,纯化并扩增,并且分析过表达的RNA和扩增的DNA并与唯一管家基因进行比较。在一些实施方案中,通过逆转录酶链反应(RT-PCR)扩增核酸,并且通过凝胶着色、通过放射免疫技术(RIA)、通过酶联免疫吸附测试(ELISA)或通过微芯片测试(基因阵列)进行分析,并且可以通过任何核酸定量方法进行定量。在一些实施方案中,通过实时PCR诸如“TAQMANTM”或在毛细管上的“LIGHTCYCLERTM”或任何公司的实时PCR和RT PCR,进行RNA和DNA的定量。在一些实施方案中,可以将分析的基因与对应于唯一管家基因的表达(RNA)和数量(DNA)的参考核酸提取物(DNA和RNA),或与对应于管家编码基因的表达的参考RNA,或与对应于唯一基因的参考DNA进行比较,或者可以参考用细胞系的核酸获得的标准曲线进行估计。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0195131中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括检测融合体基因的方法,所述融合体基因可以用于检测疾病,诸如癌症。另外或替代地,遗传生物标记物的检测可以包括用于富集断点片段,诸如以检测和表征可能与疾病诸如癌症相关联的融合体基因的方法。另外或替代地,遗传生物标记物的检测可以包括一种用于向患有或被怀疑患有癌症的受试者提供诊断性或治疗性干预的方法,其包括:(a)提供来自受试者的包含无细胞核酸分子的生物样品;(b)在足以产生探针捕获的多核苷酸的杂交条件下,使来自生物样品的无细胞核酸分子与探针组接触,所述探针组包含多个多核苷酸探针,其中多个多核苷酸探针中的每一个具有(i)与融合体基因的序列互补性和(ii)对融合体基因的亲和力,所述亲和力大于具有与融合体基因互补的序列并且仅含有未修饰核苷酸的多核苷酸;(c)从混合物中分离探针捕获的多核苷酸,以产生富集分离的多核苷酸的样品,所述分离的多核苷酸包含融合体基因的断点片段;(d)对分离的多核苷酸进行测序以产生序列;(e)基于所述序列检测包含融合体基因的断点的多核苷酸;以及(f)基于断点片段的检测提供诊断性或治疗性干预。另外或替代地,遗传生物标记物的检测可以包括一种用于捕获融合体基因的断点片段的方法,其包括:(a)提供含有或被怀疑含有包含融合体基因的断点片段的无细胞核酸分子的生物样品;以及(b)在以下条件下使生物样品与多核苷酸探针接触,所述条件足以:(i)允许多核苷酸探针与断点片段之间的杂交以提供在混合物中的探针捕获的多核苷酸,所述多核苷酸探针具有与断点片段的序列互补性,并且具有对融合体基因的亲和力,所述亲和力大于具有与融合体基因互补的序列并且仅含有未修饰核苷酸的多核苷酸;和(ii)从混合物中富集或分离探针捕获的多核苷酸,其中多核苷酸探针具有与断点片段的序列互补性。另外或替代地,遗传生物标记物的检测可以包括一种包含多个多核苷酸探针的探针组,其中多核苷酸探针中的每一个具有(i)与作为无细胞核酸分子的一部分的融合体基因的序列互补性,和(ii)对融合体基因的亲和力,所述亲和力大于具有与融合体基因的序列互补性并且仅含有未修饰核苷酸的多核苷酸。另外或替代地,遗传生物标记物的检测可以包括一种高亲和力多核苷酸,其包含被配置来与无细胞核酸分子中的融合体基因相关联的核酸序列特异性杂交的序列。另外或替代地,遗传生物标记物的检测可以包括一种高亲和力多核苷酸,其被配置来与融合体基因特异性杂交。在一个实施方案中,高亲和力多核苷酸包含一个或多个锁核酸核苷酸。在另一个实施方案中,高亲和力多核苷酸的解链温度比具有相同序列的仅包含天然核苷酸的多核苷酸高至少1℃、2℃、3℃、4℃、5℃、10℃、15℃或20℃中的任一个。在另一个实施方案中,高亲和力多核苷酸的解链温度比具有相同序列的仅包含天然核苷酸的多核苷酸高至少2%、4%、6%、8%或10%中的任一个。在另一个实施方案中,高亲和力多核苷酸被配置来与癌症融合体基因特异性杂交。另外或替代地,遗传生物标记物的检测可以包括一种高亲和力多核苷酸探针,其包含被配置来与融合体基因特异性杂交的高亲和力多核苷酸。在一个实施方案中,高亲和力多核苷酸包含一个或多个锁核酸核苷酸。在另一个实施方案中,探针具有选自可检测标记、结合部分或固体支撑物的功能。在另一个实施方案中,探针被配置来与融合体基因的断点片段杂交。在另一个实施方案中,断点片段具有约140个核苷酸与约180个核苷酸之间的长度。在另一个实施方案中,所述片段是无细胞脱氧核糖核酸(DNA)或基因组DNA。在另一个实施方案中,高亲和力多核苷酸结合到固体支撑物。另外或替代地,遗传生物标记物的检测可以包括一种用于捕获融合体基因的断点片段的方法,其包括在严格杂交条件下使断点片段与高亲和力多核苷酸探针接触并允许杂交,其中多核苷酸探针结合到固体支撑物,并且其中多核苷酸探针具有与断点片段的核苷酸序列基本上或完全互补的核苷酸序列。在一个实施方案中,高亲和力多核苷酸包含一个或多个锁核酸核苷酸。另外或替代地,遗传生物标记物的检测可以包括一种用于富集包含融合体基因的断点的多核苷酸的样品的方法,其包括:a)在杂交条件下使如权利要求20所述的探针组与多核苷酸的混合物接触以产生探针捕获的多核苷酸;以及b)从混合物中分离探针捕获的多核苷酸,以产生富集包含融合体基因的断点片段的多核苷酸的样品。在一个实施方案中,高亲和力多核苷酸包含一个或多个锁核酸核苷酸。在另一个实施方案中,多核苷酸包含无细胞DNA或片段化的基因组DNA。在另一个实施方案中,所述方法还包括从探针中分离捕获的多核苷酸。在另一个实施方案中,所述方法还包括对分离的多核苷酸进行测序。另外或替代地,遗传生物标记物的检测可以包括一种诊断受试者的癌症的方法,其包括:a)提供来自受试者的包含多核苷酸的样品;b)在杂交条件下使来自样品的无细胞DNA(cfDNA)与如权利要求20所述的探针组接触以产生探针捕获的多核苷酸;c)从混合物中分离探针捕获的多核苷酸,以产生富集包含融合体基因的断点片段的多核苷酸的样品;d)对分离的多核苷酸进行测序以产生序列;e)基于所述序列检测包含融合体基因的断点的多核苷酸;以及f)基于断点片段的检测来诊断癌症。在一个实施方案中,高亲和力多核苷酸包含一个或多个锁核酸核苷酸。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0120291中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于分析受试者的疾病状态的方法,其包括:(a)使用遗传分析仪来从在(i)两个或更多个时间点或(ii)基本上相同的时间点处获得的受试者的生物样品中的核酸分子生成遗传数据,其中遗传数据与受试者的遗传信息相关,并且其中生物样品包括无细胞生物样品;(b)从遗传分析仪接收遗传数据;(c)用一个或多个程序化计算机处理器,使用遗传数据产生表征受试者的遗传信息的调整的测试结果;以及(d)将调整的测试结果输出到计算机存储器中。在一些实施方案中,遗传数据包括当前序列读长和在先序列读长,并且其中(c)包括将当前序列读长与在先序列读长进行比较,并且相对于受试者的遗传信息的表征对应地更新诊断置信度指示,所述诊断置信度指示是指示在受试者的生物样品中鉴定到一个或多个遗传变异的概率。在一些实施方案中,所述方法还包括获得随后表征并且将诊断置信度指示按原样留在从头信息的随后表征中。在一些实施方案中,所述方法还包括确定在遗传数据中包括的序列读长的集合中检测到的一个或多个遗传变体的频率,并且至少部分地通过比较两个或更多个时间点处的一个或多个遗传变体的频率来产生调整的测试结果。在一些实施方案中,所述方法还包括确定在遗传数据中包括的序列读长的集合中检测到的一个或多个遗传基因座处的拷贝数变化的量,并且至少部分地通过比较两个或更多个时间点处的量来产生调整的测试结果。在一些实施方案中,所述方法还包括使用调整的测试结果来为受试者提供(i)治疗性干预或(ii)健康或疾病的诊断。在一些实施方案中,遗传数据包括第一组遗传数据和第二组遗传数据,其中第一组遗传数据处于检测阈值下或低于检测阈值,并且第二组遗传数据高于检测阈值。在一些实施方案中,检测阈值是噪声阈值。在一些实施方案中,所述方法还包括在(c)中,当在多个采样情况或时间点中,在第一组遗传数据和第二组遗传数据中检测到相同遗传变体时,将受试者的诊断从阴性或不确定调整为阳性。在一些实施方案中,所述方法还包括在(c)中,当在较早时间点的第一组遗传数据中和在较晚时间点的第二组遗传数据中检测到相同遗传变体时,在来自较早时间点的表征中将受试者的诊断从阴性或不确定调整为阳性。另外或替代地,遗传生物标记物的检测可以包括一种检测来自受试者的生物样品中的癌症多核苷酸的量随时间的趋势的方法,其包括:使用或多个程序化计算机处理器确定多个时间点中的每一个处的癌症多核苷酸的频率;确定多个时间点中的每一个处的频率的误差范围,以至少提供第一时间点处的第一误差范围和在第一时间点之后的第二时间点处的第二误差范围;以及确定(1)第一误差范围是否与第二误差范围重叠,所述重叠指示在多个时间点处癌症多核苷酸的频率稳定性,(2)第二误差范围是否大于第一误差范围,从而指示在多个时间点处癌症多核苷酸的频率增加,或者(3)第二误差范围是否小于第一误差范围,从而指示在多个时间点处癌症多核苷酸的频率降低。另外或替代地,遗传生物标记物的检测可以包括一种在受试者中检测一个或多个遗传变异和/或遗传变异的量的方法,其包括:用遗传分析仪对受试者的无细胞核酸样品中的核酸分子进行测序,以在第一时间点处生成第一组序列读长;将第一组序列读长与在第一时间点之前的至少第二时间点处获得的至少第二组序列读长进行比较,以产生第一组序列读长与至少第二组序列读长的比较;使用比较来对应地更新诊断置信度指示,所述诊断置信度指示是指示在受试者的无细胞核酸样品中鉴定到一个或多个遗传变异的概率;以及基于诊断置信度指示在受试者的无细胞核酸样品中的核酸分子中检测一个或多个遗传变异的存在或不存在和/或遗传变异的量。在一些实施方案中,所述方法还包括获得无细胞核酸。另外或替代地,遗传生物标记物的检测可以包括一种用于在受试者的无细胞核酸样品中检测突变的方法,其包括:(a)通过将从遗传分析仪获得的当前序列读长与来自先前时间段的在先序列读长进行比较以产生比较,并基于所述比较更新诊断置信度指示来确定共有序列,其中每个共有序列对应于来源于无细胞核酸样品的一组带标签的亲本多核苷酸中的唯一多核苷酸;以及(b)基于诊断置信度,生成受试者中的细胞外多核苷酸的遗传谱,其中所述遗传谱包括由拷贝数变化或突变分析产生的数据。另外或替代地,遗传生物标记物的检测可以包括一种检测异常细胞活性的方法,其包括:提供来源于受试者的生物样品的至少一组带标签的亲本多核苷酸;扩增所述组中的带标签的亲本多核苷酸以产生一组对应的扩增子代多核苷酸;使用遗传分析仪来对所述组的扩增子代多核苷酸的子集进行测序以产生一组测序读长;以及通过将当前序列读长与来自至少一个先前时间段的在先序列读长进行比较并对应地更新诊断置信度指示来折叠所述组的序列读长以生成一组共有序列,所述诊断置信度指示是指示在受试者的生物样品中鉴定到一个或多个遗传变异的概率,其中每个共有序列对应于所述组的带标签的亲本多核苷酸中的唯一多核苷酸。另外或替代地,遗传生物标记物的检测可以包括一种用于在受试者的无细胞或基本上无细胞的样品中检测突变的方法,其包括:(a)用遗传分析仪对来自受试者的身体样品的细胞外多核苷酸进行测序;(b)对于每个细胞外多核苷酸,生成多个测序读长;(c)过滤掉不满足设定阈值的读长;(d)将从测序得出的序列读长映射到参考序列;(e)鉴定在每个可映射碱基位置处与参考序列的变体比对的映射序列读长的子集;(f)对于每个可映射碱基位置,计算(i)与参考序列相比包括变体的映射序列读长的数量(ii)每个可映射碱基位置的总序列读长的数量的比率;以及(g)使用一个或多个程序化计算机处理器来将所述序列读长与来自至少一个先前时间点的其他序列读长进行比较并且对应地更新诊断置信度指示,所述诊断置信度指示是指示鉴定到变体的概率。另外或替代地,遗传生物标记物的检测可以包括一种用于操作遗传测试设备的方法,其包括:提供从受试者获得的身体样品获得的初始起始遗传物质;将来自初始起始遗传物质的双链多核苷酸分子转化成至少一组非带唯一标签的亲本多核苷酸,其中一组中的每个多核苷酸可映射到参考序列;以及对于每组带标签的亲本多核苷酸:(i)扩增所述组中带标签的亲本多核苷酸以产生一组对应的扩增子代多核苷酸;(ii)对所述组的扩增子代多核苷酸进行测序以产生一组测序读长;(iii)折叠所述组的测序读长以生成一组共有序列,其中折叠使用来自标签和以下中的至少一者的序列信息:(1)序列读长的开始区域处的序列信息,(2)序列读长的末端区域处的序列信息,和(3)序列读长的长度,其中所述组的共有序列的每个共有序列对应于所述组的带标签的亲本多核苷酸中的多核苷酸分子;以及(iv)分析每组带标签的亲本分子的所述组的共有序列;(v)将当前序列读长与来自至少一个其他时间点的在先序列读长进行比较;以及(vi)对应地更新诊断置信度指示,所述诊断置信度指示是指示在受试者的身体样品中鉴定到一个或多个遗传变异的概率。另外或替代地,遗传生物标记物的检测可以包括一种用于在受试者中检测一个或多个遗传变体的方法,其包括:(a)从所述受试者的一个或多个无细胞生物样品获得核酸分子;(b)测定所述核酸分子以产生第一组遗传数据和第二组遗传数据,其中所述第一组遗传数据和/或所述第二组遗传数据在检测阈值内;(c)将所述第一组遗传数据与所述第二组遗传数据进行比较,以在所述第一组遗传数据或所述第二组遗传数据中鉴定所述一个或多个遗传变体;以及(d)基于(c)中鉴定的所述一个或多个遗传变体,使用一个或多个程序化计算机处理器更新用于在所述受试者的无细胞生物样品中鉴定所述一个或多个遗传变体的诊断置信度指示。另外或替代地,遗传生物标记物的检测可以包括一种用于识别来自受试者的无细胞脱氧核糖核酸(cfDNA)中的遗传变体的方法,其包括:(a)使用DNA测序系统对来自在第一时间点处从受试者获取的样品的cfDNA进行测序;(b)在从第一时间点测序的cfDNA中检测遗传变体,其中检测到低于诊断限值的水平的遗传变体;(c)使用DNA测序系统对来自在一个或多个后续时间点处从受试者获取的样品的cfDNA进行测序;(d)在从一个或多个后续时间点测序的cfDNA中检测遗传变体,其中检测到低于诊断限值的水平的遗传变体;(e)基于在多个时间点处获取的样品中检测到低于诊断限值的遗传变体,将样品识别为对于遗传变体是阳性的。另外或替代地,遗传生物标记物的检测可以包括一种用于识别来自受试者的无细胞脱氧核糖核酸(cfDNA)中的遗传变体的方法,其包括:(a)使用脱氧核糖核酸(DNA)测序系统对来自受试者的样品的cfDNA进行测序;(b)在测序的cfDNA中检测遗传变体,其中检测到低于诊断限值的水平的遗传变体;(c)使用DNA测序系统对来自从受试者获取的样品的cfDNA进行测序,其中对样品再测序一次或多次;(d)在来自一次或多次再测序的样品的测序cfDNA中检测遗传变体,其中检测到低于诊断限值的水平的遗传变体;以及(e)基于在再测序的样品中检测到低于诊断限值的遗传变体,将样品识别为对于遗传变体是阳性的。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0240972中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于确定基因融合体的系统和方法,其通过以下进行:确定含有融合染色体DNA分子的至少一部分的测序数据的融合读长;确定基因组上的预定点,其中融合读长的至少一个映射部分在所述预定点(断点)处被剪接;鉴定来自两个断点(断点对)的两个映射读长部分作为潜在融合体候选者;基于断点对产生一个或多个融合体组并且将融合体组聚类为一个或多个融合体簇;以及将满足预定标准的每个融合体簇鉴定为基因融合体。另外或替代地,遗传生物标记物的检测可以包括一种用于处理来自样品的遗传序列读长数据的方法,所述方法包括:确定含有融合染色体DNA分子的至少一部分的测序数据的融合读长;确定基因组上的预定点,其中融合读长的至少一个映射部分在所述预定点(断点)处被剪接;鉴定来自两个断点(断点对)的两个映射读长部分作为潜在融合体候选者;基于断点对产生一个或多个融合体组并且将融合体组聚类为一个或多个融合体簇;以及将满足预定标准的每个融合体簇鉴定为基因融合体。在一些实施方案中,所述方法包括为每个读长分配唯一分子或读长标识符(读长ID)。在一些实施方案中,所述方法包括从一侧或两侧剪接读长的每个映射部分。在一些实施方案中,断点的身份独立于读长,并且通过符号、染色体和位置来鉴定。在一些实施方案中,断点保持统计,包括在断点处被剪接或分裂的读长和分子的数量,以及通过断点的野生型读长和分子的数量。在一些实施方案中,所述方法包括选择具有属于两个具有适当符号的断点的共同读长ID的每两个映射读长部分作为潜在融合体候选者。在一些实施方案中,映射之前的原始读长中的潜在融合体候选者位置显示读长部分为最初彼此相邻。在一些实施方案中,所述方法包括检查读长部分是否被映射在一条链上以寻找断点符号的差异。在一些实施方案中,所述方法包括追踪融合体组统计。另外或替代地,遗传生物标记物的检测可以包括一种分析遗传信息的系统,其包括DNA测序仪;耦合到DNA测序仪的处理器,所述处理器运行计算机代码来处理来自样品的遗传序列读长数据,所述计算机代码包括用于以下的指令:确定含有融合染色体DNA分子的一部分的测序数据的融合读长;确定基因组上的至少一个预定点,其中融合读长的至少一个映射部分在所述预定点(断点)处被剪接;鉴定来自两个断点(断点对)的两个映射读长部分作为潜在融合体候选者;基于断点对产生一个或多个融合体组并且将融合体组聚类为一个或多个融合体簇;以及将满足预定标准的每个融合体簇鉴定为基因融合体。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:用DNA测序仪对DNA分子进行测序以生成序列的集合;将序列的集合映射到参考基因组;从映射的集合中鉴定融合读长,其中融合读长含有子序列,其中第一子序列映射到第一遗传基因座并且第二子序列映射到不同的第二遗传基因座;对于每个融合读长,鉴定在第一遗传基因座处的第一断点和在第二遗传基因座处的第二断点,其中断点是参考基因组上融合读长的序列被剪接的点,并且其中第一断点和第二断点形成断点对;生成融合读长的组,每个组包括具有相同断点对的融合读长;聚类融合读长的组,其中每个簇由具有在第一预定核苷酸距离内的第一断点和在第二预定核苷酸距离内的第二断点的融合读长的组形成;以及确定一个或多个簇的基因融合体,其中簇的基因融合体具有作为第一融合体基因断点的选自所述簇中的第一断点的断点以及作为第二融合体基因断点的选自所述簇中的第二断点的断点,并且其中第一融合体基因断点和第二融合体基因断点各自基于选择标准来选择。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:用DNA测序仪对多个DNA分子进行测序;用标识符对多个序列分子中的每一个加标签;将每个带标签的序列映射到参考基因组;从映射的带标签的序列中鉴定剪接读长,其中剪接读长是含有映射部分和剪接部分的带标签的序列,其中所述映射部分映射到遗传基因座并且剪接部分不映射到遗传基因座;确定每个剪切读长的断点,其中断点是参考基因组上剪接读长的序列被剪接的点;产生断点组,每个断点组包括具有相同断点的剪接读长的标识符;通过比较断点组的对产生断点对的组,断点对的每个组包括存在于比较的断点组的对的两个成员中的标识符;聚类断点对的组,其中每个簇包括具有在第一预定遗传距离内的断点对的第一断点和在第二预定遗传距离内的断点对的第二断点的断点对的组;以及确定一个或多个簇的基因融合体,其中簇的基因融合体具有作为第一融合体基因断点的选自所述簇中的第一断点的断点以及作为第二融合体基因断点的选自所述簇中的第二断点的断点,并且其中第一融合体基因断点和第二融合体基因断点各自基于选择标准来选择。在一些实施方案中,选择标准包括在簇中具有大部分融合读长的断点。另外或替代地,遗传生物标记物的检测可以包括一种用于鉴定融合体基因断点的方法,所述方法包括:确定含有融合染色体DNA分子的至少一部分的测序数据的融合读长;确定基因组上的预定点,其中融合读长的至少一个映射部分在所述预定点(断点)处被剪接;鉴定来自两个断点(断点对)的两个映射读长部分作为潜在融合体候选者;基于断点对产生一个或多个融合体组并且将融合体组聚类为一个或多个融合体簇;将满足预定标准的每个融合体簇鉴定为基因融合体,并且将基因融合体的断点鉴定为融合体基因断点。另外或替代地,遗传生物标记物的检测可以包括一种用于诊断受试者的病状的方法,所述方法包括:确定含有融合染色体DNA分子的至少一部分的测序数据的融合读长;确定基因组上的预定点,其中融合读长的至少一个映射部分在所述预定点(断点)处被剪接;鉴定来自两个断点(断点对)的两个映射读长部分作为潜在融合体候选者;基于断点对产生一个或多个融合体组并且将融合体组聚类为一个或多个融合体簇;以及将满足预定标准的每个融合体簇鉴定为基因融合体,其中所述基因融合体指示所述病状。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0240973中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种方法,其包括:(a)获得受试者的无细胞体液样品的脱氧核糖核酸(DNA)分子的测序读长;(b)从序列读长生成第一数据集,其包括多个遗传基因座中的每个遗传基因座的与测序读长覆盖(“读长覆盖”)相关的定量测量值;(c)通过进行饱和平衡校正和探针效率校正来校正第一数据集;(d)确定第一数据集的基线读长覆盖,其中基线读长覆盖与饱和平衡和探针效率相关;以及(e)相对于基线读长覆盖确定多个遗传基因座中的每个遗传基因座的拷贝数状态。在一些实施方案中,对于多个遗传基因座中的每个遗传基因座,第一数据集包括与遗传基因座的(i)鸟嘌呤-胞嘧啶含量(“GC含量”)相关的定量测量值。在一些实施方案中,所述方法包括在(c)之前,从第一数据集中去除作为高变异性遗传基因座的遗传基因座,其中去除包括:(i)拟合一种模型,所述模型将与鸟嘌呤-胞嘧啶含量相关的定量测量值与遗传基因座的测序读长覆盖的定量测量值关联起来;以及(ii)从遗传基因座中去除至少10%的遗传基因座,其中去除遗传基因座包括去除与模型最不同的遗传基因座,从而提供基线化遗传基因座的第一数据集。在一些实施方案中,所述方法包括去除至少45%的遗传基因座。在一些实施方案中,确定拷贝数状态包括将遗传基因座的读长覆盖与基线读长覆盖进行比较。在一些实施方案中,无细胞体液选自由血清、血浆、尿液和脑脊髓液组成的组。在一些实施方案中,通过将测序读长映射到参考基因组来确定读长覆盖。在一些实施方案中,获得测序读长包括将衔接子连接到来自受试者的无细胞体液的DNA分子。在一些实施方案中,DNA分子是双链体DNA分子,并且衔接子连接到双链体DNA分子,使得每个衔接子不同地对DNA分子的互补链加标签以提供带标签的链。在一些实施方案中,确定与来源于遗传基因座的DNA链在测序读长内被代表的概率相关的定量测量值包括将测序读长分类为配对读长和非配对读长,其中(i)每个配对读长对应于由来源于所述组中的双链多核苷酸分子的第一带标签链和第二不同带标签的互补链生成的序列读长,并且(ii)每个非配对读长代表来源于在所述组的序列读长中的所述序列读长中代表的双链多核苷酸分子的第一带标签链,所述第一带标签链不具有第二不同带标签的互补链。在一些实施方案中,所述方法还包括确定映射到一个或多个遗传基因座中的每一个的(i)所述配对读长和(ii)所述非配对读长的定量测量值,以基于与映射到每个基因座的配对读长和非配对读长相关的定量测量值确定与所述样品中映射到所述一个或多个遗传基因座中的每一个的总双链DNA分子相关的定量测量值。在一些实施方案中,衔接子包含条形码序列。在一些实施方案中,确定读长覆盖包括基于将测序读长映射到参考基因组和条形码序列的位置来折叠测序读长。在一些实施方案中,遗传基因座包含一个或多个癌基因。在一些实施方案中,一种方法包括通过确定受试者的生殖系基因是杂合的基线化遗传基因组内变体的相对数量来确定基线化遗传基因座的至少一个子集在受试者的肿瘤细胞中经历了拷贝数改变。在一些实施方案中,变体的相对数量不近似相等。在一些实施方案中,将变体的相对数量不近似相等的基线化遗传基因座从基线化遗传基因座中去除,从而提供等位基因频率校正的基线化遗传基因座。在一些实施方案中,等位基因频率校正的基线化遗传基因座在如前述权利要求中任一项所述的方法中用作基线化基因座。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:将受试者的无细胞体液样品的脱氧核糖核酸(DNA)分子的测序读长接收到存储器中;用计算机处理器执行代码以进行以下步骤:从序列读长生成第一数据集,其包括多个遗传基因座中的每个遗传基因座的与测序读长覆盖(“读长覆盖”)相关的定量测量值;通过进行饱和平衡校正和探针效率校正来校正第一数据集;确定第一数据集的基线读长覆盖,其中基线读长覆盖与饱和平衡和探针效率相关;以及相对于基线读长覆盖确定多个遗传基因座中的每个遗传基因座的拷贝数状态。另外或替代地,遗传生物标记物的检测可以包括一种系统,其包括:网络;数据库,其包括被配置来存储连接到网络的核酸(例如,DNA)序列数据的计算机存储器;生物信息学计算机,其包括计算机存储器和一个或多个计算机处理器,所述计算机连接到网络;其中所述计算机还包括机器可执行代码,其在由一个或多个计算机处理器执行时复制存储在数据库上的核酸(例如,DNA)序列数据,将复制的数据写入生物信息学计算机中的存储器并且进行包括以下的步骤:从核酸(例如,DNA)序列数据生成第一数据集,其包括多个遗传基因座中的每个遗传基因座的与测序读长覆盖(“读长覆盖”)相关的定量测量值;通过进行饱和平衡校正和探针效率校正来校正第一数据集;确定第一数据集的基线读长覆盖,其中基线读长覆盖与饱和平衡和探针效率相关;以及相对于基线读长覆盖确定多个遗传基因座中的每个遗传基因座的拷贝数状态。在一些实施方案中,数据库连接到DNA测序仪。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0260590中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种方法,其包括:(a)对来自受试者的生物样品的癌细胞的多核苷酸进行测序;(b)鉴定和定量多核苷酸中的体细胞突变;(c)显示出受试者中的肿瘤异质性的概况,其指示多核苷酸中多个体细胞突变的存在和相对数量,其中不同的相对数量指示肿瘤异质性;以及(d)针对表现出肿瘤异质性的癌症确定治疗性干预,其中所述治疗性干预针对具有确定的肿瘤异质性概况的癌症是有效的。在一些实施方案中,癌细胞在空间上是不同的。在一些实施方案中,治疗性干预针对呈现多个体细胞突变的癌症比针对呈现体细胞突变中的任一个但并非所有的癌症更有效。在一些实施方案中,所述方法还包括:(e)监测受试者中肿瘤异质性随时间的变化,并且基于所述变化随时间确定不同治疗性干预。在一些实施方案中,所述方法还包括:(e)显示治疗性干预。在一些实施方案中,所述方法还包括:(e)实施治疗性干预。在一些实施方案中,所述方法还包括:(e)基于肿瘤概况生成肿瘤演变的系统发育;其中确定治疗性干预将系统发育考虑在内。在一些实施方案中,借助于计算机执行的算法来进行确定。在一些实施方案中,通过测序生成的序列读长在鉴定和定量之前经受降噪。在一些实施方案中,降噪包括分子追踪从样品中的单个多核苷酸生成的序列。在一些实施方案中,确定治疗性干预将肿瘤相关遗传改变的相对频率考虑在内。在一些实施方案中,治疗性干预包括组合地或串联地施用多种药物,其中每种药物针对呈现以不同相对频率发生的不同体细胞突变的癌症相对更有效。在一些实施方案中,以更高的量施用针对呈现以更高相对频率发生的体细胞突变的癌症相对更有效的药物。在一些实施方案中,以进行分级以反映DNA中的变体的相对量的剂量递送药物。在一些实施方案中,呈现至少一种所述遗传变体的癌症对于至少一种所述药物具有抗性。在一些实施方案中,确定治疗性干预将癌症起源组织考虑在内。在一些实施方案中,基于已证实对于具有以每个所述体细胞突变为特征的肿瘤异质性的癌症具有治疗性的干预的数据库来确定治疗性干预。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括为患有具有可以由其推断肿瘤异质性的肿瘤概况的癌症的受试者提供治疗性干预,其中所述治疗性干预针对具有肿瘤概况的癌症是有效的。在一些实施方案中,肿瘤概况指示多个更多体细胞突变的相对频率。在一些实施方案中,所述方法还包括监测受试者中相对频率随时间的变化,并且基于所述变化随时间确定不同治疗性干预。在一些实施方案中,治疗性干预针对呈现体细胞突变中的每一个的癌症比针对呈现体细胞突变中的任一个但并非所有的癌症更有效。在一些实施方案中,治疗性干预包括组合地或串联地施用多种药物,其中每种药物针对呈现以不同相对频率发生的不同体细胞突变的癌症相对更有效。在一些实施方案中,以更高的量施用针对呈现以更高相对频率发生的体细胞突变的癌症相对更有效的药物。在一些实施方案中,以进行分级以反映DNA中的变体的相对量的剂量递送药物。在一些实施方案中,呈现至少一种所述遗传变体的癌症对于至少一种所述药物具有抗性。另外或替代地,遗传生物标记物的检测可以包括一种系统,其包括计算机可读介质,所述计算机可读介质包括机器可执行代码,所述机器可执行代码在由计算机处理器执行时实施一种方法,所述方法包括:(a)将映射到遗传基因座的多核苷酸的测序读长接收到存储器中;(b)在所述序列读长中确定在映射到基因座的序列读长总数中在基因座处与参考序列的碱基不同的碱基的身份;(c)报告所确定的碱基的身份和相对数量及其在基因组中的位置;以及(d)基于(c)中的信息推断给定样品的异质性。在一些实施方案中,所实施的方法还包括:将在多个不同时间处来源于样品的序列读长接收到存储器中,并且计算两个样品之间的多个碱基的相对量和身份的差异。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:(a)对来自受试者的疾病细胞(例如,空间上不同的疾病细胞)的生物分子聚合物进行生物分子分析;(b)鉴定和定量生物分子大分子中的生物分子变体;(c)显示出受试者中的疾病细胞异质性的概况,其指示生物分子大分子中多个变体的存在和相对数量,其中不同的相对数量指示疾病细胞异质性;以及(d)针对表现出疾病细胞异质性的疾病确定治疗性干预,其中所述治疗性干预针对具有确定的疾病细胞异质性概况的疾病是有效的。在一些实施方案中,疾病细胞是空间上不同的疾病细胞。在一些实施方案中,基于已证实对于具有以每个所述体细胞突变为特征的肿瘤异质性的癌症具有治疗性的干预的数据库来确定治疗性干预。另外或替代地,遗传生物标记物的检测可以包括一种检测受试者中的疾病细胞异质性的方法,其包括:a)定量来自受试者的样品的多核苷酸中在多个遗传基因座中的每一个处具有序列变体的多核苷酸,其中样品包含来自体细胞和疾病细胞的多核苷酸;b)针对每个基因座确定具有序列变异体的多核苷酸的拷贝数变化(CNV)的测量值;c)针对每个基因座确定在基因座处具有序列变体的多核苷酸的数量作为基因座处的CNV的函数的加权测量值;以及d)比较多个基因座中的每一个处的加权测量值,其中不同的加权测量值指示疾病细胞异质性。在一些实施方案中,疾病细胞是肿瘤细胞。在一些实施方案中,多核苷酸包含cfDNA。另外或替代地,遗传生物标记物的检测可以包括一种从样品中经历细胞分裂的细胞推断DNA负荷的测量值的方法,其包括测量由一个或多个基因组基因座接近细胞的复制起点所诱导的拷贝数变化,其中增加的CNV指示细胞正在进行细胞分裂。在一些实施方案中,负荷是在无细胞DNA中测量的。在一些实施方案中,负荷的测量值与样品中的肿瘤细胞或来自肿瘤细胞的DNA的基因组等效物的比例相关。在一些实施方案中,由于接近复制起点而引起的CNV由一组对照样品或细胞系推断。在一些实施方案中,使用隐马尔可夫模型、回归模型、基于主成分分析的模型或基因型修饰的模型来接近由于复制起点引起的变异。在一些实施方案中,负荷的测量值是进行细胞分裂的细胞的存在或不存在。在一些实施方案中,邻近度在复制起点的1kb内。另外或替代地,遗传生物标记物的检测可以包括一种通过改善由于接近复制起点而引起的变异的作用来增加确定基因相关拷贝数变化的敏感性和/或特异性的方法。在一些实施方案中,所述方法包括:测量基因座处的CNV;确定由于基因座接近与复制起点而引起的CNV的量;以及例如通过减去可归因于细胞分裂的CNV量来校正所测量的CNV以反映基因组CNV。在一些实施方案中,基因组数据从无细胞DNA获得。在一些实施方案中,负荷的测量值与样品中的肿瘤细胞或DNA的基因组等效物的比例相关。在一些实施方案中,由于复制起点而引起的变异由一组对照样品或细胞系推断。在一些实施方案中,使用隐马尔可夫模型、回归模型、基于主成分分析的模型或基因型修饰的模型来接近由于复制起点引起的变异。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0061072中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于在受试者的无细胞生物样品中,诸如在来自体细胞和生殖系来源的核酸分子的混合物中检测来自体细胞来源的单核苷酸变异(SNV)的方法和系统。在一些实施方案中,所述系统和方法在受试者的无细胞生物样品中检测来自体细胞来源的单核苷酸变异(SNV),其通过以下进行:生成具有类别标记的训练数据;形成分别对于腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)碱基识别中的每一个具有一个输出的机器学习单元;用生物样品的训练组训练机器学习单元;以及应用机器学习单元以在无细胞生物样品中检测来自体细胞来源的SNV,其中无细胞生物样品可以包含来自体细胞和生殖系来源的核酸分子(例如,脱氧核糖核酸(DNA))的混合物,例如包含体细胞突变和生殖系DNA的细胞。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0058332中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种检测体细胞或生殖系变体的方法,其包括:向测定混合物提供预定的基因组DNA(gDNA);使用基因分析仪捕获受试者的遗传信息的样品并且从遗传信息中检测遗传变体;以及如果存在于长度比无细胞DNA(cfDNA)衍生的分子长的gDNA衍生的分子中,则将变体分类为来自生殖系来源。在一些实施方案中,gDNA具有多于约200个碱基的片段长度。在一些实施方案中,gDNA具有至少400个碱基或至少500个碱基的片段长度。在一些实施方案中,gDNA片段长度高于cfDNA片段长度分布。在一些实施方案中,将gDNA添加到测定混合物中。在一些实施方案中,在过滤操作之后,将gDNA留在测定混合物中。在一些实施方案中,在离心操作之后,将gDNA留在测定混合物中。在一些实施方案中,将约1%至5%gDNA添加到测定混合物中。在一些实施方案中,将至少1%gDNA添加到测定混合物中。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:提供来自受试者的包含基因组DNA(gDNA)和无细胞DNA(cfDNA)两者的样品;确定来自gDNA的至少一个遗传基因座的受试者生殖系基因型;确定cfDNA中每个遗传基因座处至少一个遗传变体的定量测量值;确定遗传变体的定量测量值是否与生殖系基因型一致;以及如果定量测量值与生殖系基因型一致,则将遗传变体识别为生殖系变体,或者如果定量测量值与生殖系基因型不一致,则将遗传突变体识别为体细胞突变体。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:确定在来自受试者的无细胞DNA(cfDNA)中检测到的遗传变体的定量测量值;确定所述测量值与受试者中的杂合基因型一致;确定来自基因组DNA(gDNA)的基因座处受试者的可能基因型;将来自gDNA的基因座处的基因型与cfDNA中检测到的变体进行比较;以及如果在cfDNA中检测到的变体与来自gDNA的基因座处的基因型不一致,则将所述变体识别为体细胞突变。在一些实施方案中,如果确定来自gDNA的基因座处的基因型是纯合的,则将所述变体识别为体细胞突变。在一些实施方案中,如果以一定置信度确定来自gDNA的基因座处的基因型是杂合的,则将所述变体识别为体细胞突变,所述置信度选自由以下组成的组:至少70%、至少80%、至少90%、至少95%或至少99%。在一些实施方案中,确定遗传变体的定量测量值包括对cfDNA进行测序。在一些实施方案中,确定受试者的可能基因型包括对来自受试者的基因组DNA进行测序。在一些实施方案中,测序选自由以下组成的组:靶向测序、单分子实时测序、外显子测序、基于电子显微镜的测序、组套测序、晶体管介导的测序、直接测序、随机鸟枪测序、Sanger双脱氧终止测序、全基因组测序、杂交测序、焦磷酸测序、毛细管电泳、凝胶电泳、双重测序、循环测序、单碱基延伸测序、固相测序、高通量测序、大规模平行签名测序、乳液PCR、低变性温度共扩增PCR(COLD-PCR)、多重PCR、通过可逆染料终止子的测序、双端测序、近期测序、核酸外切酶测序、边测序边连接、短读长测序、单分子测序、边测序边合成、实时测序、反向终止子测序、纳米孔测序、454测序、Solexa基因组分析仪测序、SOLiDTM测序、MS-PET测序及其组合。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/119452中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于分析核酸群体的方法、组合物和系统,所述核酸群体包含选自双链DNA、单链DNA和单链RNA的至少两种形式的核酸。在一些实施方案中,所述方法包括:(a)将所述形式的核酸中的至少一种与至少一种标签核酸连接以区分彼此的形式;(b)扩增所述形式的核酸以产生扩增的核酸,所述形式的核酸中的至少一种连接到至少一种核酸标签,其中所述核酸和连接的核酸标签(如果存在的话)被扩增,其中从所述至少一种形式扩增的那些核酸带标签;(c)测定其中至少一些带标签的扩增核酸的序列数据;以及(d)解码扩增核酸的标签核酸分子,以揭示群体中所述形式的核酸,从而为连接到标签核酸分子的测定其序列数据的扩增核酸提供原始模板。在一些实施方案中,所述方法还包括相对于一种或多种其他形式富集至少一种形式。在一些实施方案中,在步骤(b)中扩增群体中每种形式的核酸的至少70%的分子。在一些实施方案中,群体中存在至少三种形式的核酸,并且至少两种形式连接到不同的标签核酸形式,从而将三种形式中的每一种彼此区分。在一些实施方案中,群体中至少三种形式的核酸中的每一种都连接到不同的标签。在一些实施方案中,相同形式的每个分子连接到包含相同鉴定信息标签的标签(例如,具有相同序列或包含相同序列的标签)。在一些实施方案中,相同形式的分子连接到不同类型的标签。在一些实施方案中,步骤(a)包括:用带标签的引物将群体经受逆转录,其中将带标签的引物掺入到群体中由RNA生成的cDNA中。在一些实施方案中,逆转录是序列特异性的。在一些实施方案中,逆转录是随机的。在一些实施方案中,所述方法还包括将双链连接的RNA降解为cDNA。在一些实施方案中,所述方法还包括将单链DNA与双链DNA分离,并且将核酸标签连接到双链DNA。在一些实施方案中,通过与一个或多个捕获探针杂交来分离单链DNA。在一些实施方案中,所述方法还包括使用对单链核酸起作用的连接酶用单链标签差异地对单链DNA加标签,并且使用对双链核酸起作用的连接酶用双链衔接子差异地对双链DNA加标签。在一些实施方案中,所述方法还包括在测定之前,汇集包含不同形式的核酸的带标签的核酸。在一些实施方案中,所述方法还包括在个体测定中单独分析分割的DNA的池。测定可以是相同的、基本上相似的、等同的或不同的。在以上任何方法中,序列数据可以指示体细胞或生殖系变体或拷贝数变化或单核苷酸变异或插入/缺失或基因融合体的存在。另外或替代地,遗传生物标记物的检测可以包括一种分析包含具有不同程度的修饰的核酸的核酸群体的方法。另外或替代地,遗传生物标记物的检测可以包括用于筛选与疾病相关联的特征(例如,5’甲基胞嘧啶)的方法。所述方法包括使核酸群体与优先结合带有修饰的核酸的剂(诸如甲基结合结构域或蛋白质)接触;将结合所述剂的第一核酸池与未结合所述剂的第二核酸池分离,其中第一核酸池对于修饰过度代表,并且第二池中的核酸对于修饰代表性不足;将第一池和/或第二池中的核酸连接到区分第一池和第二池中的核酸的一个或多个核酸标签,以产生带标签的核酸群体;扩增带标签的核酸,其中核酸和连接的标签被扩增;测定扩增的核酸和连接的标签的序列数据;解码标签以揭示测定其序列数据的核酸是否由第一池或第二池中的模板扩增。另外或替代地,遗传生物标记物的检测可以包括一种用于分析核酸群体的方法,其中至少一些核酸包含一个或多个修饰的胞嘧啶残基。所述方法包括将捕获部分(例如,生物素)连接到群体中的核酸以充当用于扩增的模板;进行扩增反应以从模板产生扩增产物;将连接到捕获部分的模板从扩增产物中分离;通过亚硫酸氢盐测序测定连接到捕获部分的模板的序列数据;以及测定扩增产物的序列数据。另外或替代地,遗传生物标记物的检测可以包括一种分析包含具有不同程度的5-甲基胞嘧啶的核酸的核酸群体的方法。所述方法包括(a)核酸群体与优先结合5-甲基化核酸的剂接触;(b)将结合到所述剂的第一核酸池与未结合到所述剂的第二核酸池分离,其中第一核酸池对于5-甲基胞嘧啶过度代表,并且第二池中的核酸对于5-甲基胞嘧啶代表性不足;(c)将第一池和/或第二池中的核酸连接到区分第一池和第二池中的核酸的一个或多个核酸标签,其中连接到第一池中的核酸的核酸标签包含捕获部分(例如,生物素);(d)扩增加标记的核酸,其中核酸和连接的标签被扩增;(e)将带有捕获部分的扩增的核酸与不带有捕获部分的扩增的核酸分离;以及(f)测定分离的扩增核酸的序列数据。另外或替代地,遗传生物标记物的检测可以包括一种分析核酸群体的方法,所述核酸群体包含选自双链DNA、单链DNA和单链RNA的至少两种形式的核酸,其中至少两种形式中的每一种包含多个分子,所述方法包括:将所述形式的核酸中的至少一种与至少一种标签核酸连接以区分彼此的形式;扩增所述形式的核酸以产生扩增的核酸,所述形式的核酸中的至少一种连接到至少一种核酸标签,其中所述核酸和连接的核酸标签被扩增,其中从所述至少一种形式扩增的那些核酸带标签;测定其中至少一些带标签的扩增核酸的序列数据;其中所述测定获得足够的序列信息来解码扩增核酸的标签核酸分子,以揭示群体中所述形式的核酸,从而为连接到标签核酸分子的测定其序列数据的扩增核酸提供原始模板。在一个实施方案中,所述方法还包括以下步骤:解码扩增核酸的标签核酸分子,以揭示群体中所述形式的核酸,从而为连接到标签核酸分子的测定其序列数据的扩增核酸提供原始模板。在另一个实施方案中,所述方法还包括相对于一种或多种其他形式富集至少一种形式。在另一个实施方案中,扩增群体中每种形式的核酸的至少70%的分子。在另一个实施方案中,群体中存在至少三种形式的核酸,并且至少两种形式连接到不同的标签核酸形式,从而将三种形式中的每一种彼此区分。在另一个实施方案中,群体中至少三种形式的核酸中的每一种都连接到不同的标签。在另一个实施方案中,相同形式的每个分子连接到包含相同标签信息的标签。在另一个实施方案中,相同形式的分子连接到不同类型的标签。在另一个实施方案中,所述方法还包括用带标签的引物将群体经受逆转录,其中将带标签的引物掺入到群体中由RNA生成的cDNA中。在另一个实施方案中,逆转录是序列特异性的。在另一个实施方案中,逆转录是随机的。在另一个实施方案中,所述方法还包括将双链连接的RNA降解为cDNA。在另一个实施方案中,所述方法还包括将单链DNA与双链DNA分离,并且将核酸标签连接到双链DNA。在另一个实施方案中,通过与一个或多个捕获探针杂交来分离单链DNA。在另一个实施方案中,所述方法还包括用环化连接酶环化单链DNA,并且将核酸标签连接到双链DNA。在另一个实施方案中,所述方法包括在测定之前,汇集包含不同形式的核酸的带标签的核酸。在另一个实施方案中,核酸群体来自体液样品。在另一个实施方案中,体液样品是血液、血清或血浆。在另一个实施方案中,核酸群体是无细胞核酸群体。在另一个实施方案中,体液样品来自被怀疑患有癌症的受试者。在另一个实施方案中,序列数据指示体细胞或生殖系变体的存在。在另一个实施方案中,序列数据指示拷贝数变化的存在。在另一个实施方案中,序列数据指示单核苷酸变异(SNV)、插入/缺失或基因融合的存在。在另一个实施方案中,序列数据指示单核苷酸变异(SNV)、插入/缺失或基因融合的存在。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:提供从受试者的身体样品获得的核酸分子群体;基于一个或多个特征对核酸分子群体进行分级以生成多组核酸分子,其中所述多组中的每组的核酸分子包含不同的标识符;汇集多组核酸分子;对汇集的多组核酸分子进行测序以生成多组序列读长;以及基于标识符对序列读长进行分级。另外或替代地,遗传生物标记物的检测可以包括一种用于分析无细胞DNA的片段化模式的方法,其包括:提供来自生物样品的无细胞DNA群体;对无细胞DNA群体进行,从而生成无细胞DNA的亚群;对无细胞DNA的至少一个亚群进行测序,从而生成序列读长;将序列读长与参考基因组进行比对;以及通过分析以下任何数量来确定每个亚群中无细胞DNA的片段化模式:映射到参考基因组中的每个碱基位置的每个序列读长的长度;映射到参考基因组中的碱基位置的序列读长作为序列读长长度的函数的数量;在参考基因组中的每个碱基位置处开始的序列读长的数量;或者在参考基因组中的每个碱基位置处终止的序列读长的数量。在另一个实施方案中,一个或多个特征包括选自由以下组成的组的化学修饰:甲基化、羟甲基化、甲酰化、乙酰化和糖基化。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/009723中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于使用无细胞核酸(例如,cfDNA)进行核小体谱分析的方法、系统和组合物。这可以用于鉴定新的驱动基因,确定拷贝数变化(CNV),鉴定体细胞突变和结构变异(诸如融合和插入/缺失),以及鉴定可以用于多重测定以检测任何以上变异的区域。另外或替代地,遗传生物标记物的检测可以包括无细胞核酸(例如,DNA或RNA)的各种用途。此类用途包括检测、监测和确定患有或被怀疑患有健康状况诸如疾病(例如,癌症)的受试者的治疗。所提供的方法可以在具有或不具有体细胞变体信息的情况下,以宏观和整体的方式使用序列信息,以评估可以代表起源组织、疾病、进展等的片段组谱。另外或替代地,遗传生物标记物的检测可以包括一种用于确定来自从受试者获得的无细胞DNA的脱氧核糖核酸(DNA)片段中遗传畸变的存在或不存在的计算机实现的方法,所述方法包括:(a)通过计算机构建DNA片段在基因组中多个碱基位置上的多参数分布;以及(b)在不考虑第一基因座中每个碱基位置的碱基身份的情况下,使用多参数分布来确定受试者中第一基因座中遗传畸变的存在或不存在。在一些实施方案中,遗传畸变包括序列畸变。在一些实施方案中,序列畸变包括单核苷酸变体(SNV)。在一些实施方案中,序列畸变包括插入或缺失(插入/缺失)或基因融合。在一些实施方案中,序列畸变包括选自由以下组成的组的两个或更多个不同成员:(i)单核苷酸变体(SNV),(ii)插入或缺失(插入/缺失)和(iii)基因融合。在一些实施方案中,遗传畸变包括拷贝数变化(CNV)。在一些实施方案中,多参数分布包括指示与基因组中的多个碱基位置中的每一个比对的DNA片段的长度的参数。在一些实施方案中,多参数分布包括指示与基因组中的多个碱基位置中的每一个比对的DNA片段的数量的参数。在一些实施方案中,多参数分布包括指示在基因组中的多个碱基位置中的每一个处开始或终止的DNA片段的数量的参数。在一些实施方案中,多参数分布包括指示以下两个或更多个的参数:(i)与基因组中的多个碱基位置中的每一个比对的DNA片段的长度,(ii)与基因组中的多个碱基位置中的每一个比对的DNA片段的数量,以及(iii)在基因组中的多个碱基位置中的每一个处开始或终止的DNA片段的数量。在一些实施方案中,多参数分布包括指示以下的参数:(i)与基因组中的多个碱基位置中的每一个比对的DNA片段的长度,(ii)与基因组中的多个碱基位置中的每一个比对的DNA片段的数量,以及(iii)在基因组中的多个碱基位置中的每一个处开始或终止的DNA片段的数量。另外或替代地,遗传生物标记物的检测可以包括一种生成用于确定受试者属于一个或多个类别的临床意义的可能性的分类器的方法,所述方法包括:a)提供训练集,针对一个或多个类别的临床意义中的每一个,所述训练集包括来自属于所述类别的临床意义的物种的多个受试者中的每一个和来自不属于所述类别的临床意义的物种的多个受试者中的每一个的无细胞DNA群体;b)对来自无细胞DNA群体的无细胞DNA片段进行测序以产生多个DNA序列;c)对于每个无细胞DNA群体,将多个DNA序列映射到所述物种的参考基因组中的一个或多个基因组区域中的每一个,每个基因组区域包含多个遗传基因座;d)为每个无细胞DNA群体制备数据集以产生训练集,对于多个遗传基因座中的每一个,所述数据集包括指示选自以下的至少一个特征的定量测量值的值:(i)映射到遗传基因座的DNA序列,(ii)在基因座处开始的DNA序列,和(iii)在遗传基因座处结束的DNA序列;以及e)在训练集上训练基于计算机的机器学习系统,从而生成用于确定受试者属于一个或多个类别的临床意义的可能性的分类器。另外或替代地,遗传生物标记物的检测可以包括一种确定受试者中的异常生物状态的方法,所述方法包括:a)对来自受试者的无细胞DNA的无细胞DNA片段进行测序以产生DNA序列;b)将DNA序列映射到受试者的物种的参考基因组中的一个或多个基因组区域中的每一个,每个基因组区域包含多个遗传基因座;c)制备数据集,对于多个遗传基因座中的每一个,所述数据集包括指示选自以下的至少一个特征的定量测量值的值:(i)映射到遗传基因座的DNA序列,(ii)在基因座处开始的DNA序列,和(iii)在遗传基因座处结束的DNA序列;以及d)基于数据集,确定异常生物状态的可能性。另外或替代地,遗传生物标记物的检测可以包括一种用于生成指示来自从受试者获得的无细胞DNA的脱氧核糖核酸(DNA)片段中遗传畸变的存在或不存在的输出的计算机实现的方法,所述方法包括:(a)通过计算机构建来自无细胞DNA的DNA片段在基因组中多个碱基位置上的分布;以及(b)对于一个或多个遗传基因座中的每一个,通过计算机计算定量测量值,所述定量测量值指示(1)具有与来自所述一个或多个遗传基因座的基因座相关联的双核小体保护的DNA片段的数量与(2)具有与遗传基因座相关联的单核小体保护的DNA片段的数量的比率或反之亦然;以及(c)使用对于一个或多个遗传基因座中的每一个的定量测量值,确定指示受试者中一个或多个遗传基因座中遗传畸变的存在或不存在的所述输出。在一些实施方案中,所述分布包括一个或多个多参数分布。另外或替代地,遗传生物标记物的检测可以包括一种用于对来自从受试者获得的无细胞DNA的脱氧核糖核酸(DNA)片段的分布解卷积的计算机实现的方法,所述方法包括:(a)通过计算机构建来自无细胞DNA的DNA片段在基因组中多个碱基位置上的覆盖分布;和(b)对于一个或多个遗传基因座中的每一个,通过计算机对覆盖分布解卷积,从而生成与选自由以下组成的组的一个或多个成员相关联的分数贡献:拷贝数(CN)分量、细胞清除分量和基因表达分量。另外或替代地,遗传生物标记物的检测可以包括一种用于使用来自从测试受试者获得的无细胞DNA的脱氧核糖核酸(DNA)片段确定测试受试者中的遗传畸变的计算机实现的分类器,其包括:(a)从多个受试者中的每一个获得的无细胞DNA的一个或多个群体中的每一个的一组分布得分的输入,其中每个分布得分至少基于以下中的一个或多个来生成:(i)与基因组中的多个碱基位置中的每一个比对的DNA片段的长度,(ii)与基因组中的多个碱基位置中的每一个比对的DNA片段的数量,以及(iii)在基因组中的多个碱基位置中的每一个处开始或终止的DNA片段的数量;以及(b)测试受试者中一个或多个遗传畸变的分类的输出。另外或替代地,遗传生物标记物的检测可以包括一种用于产生训练的分类器的计算机实现的方法,其包括:(a)提供多个不同的类别,其中每个类别代表一组具有共享特征的受试者;(b)对于从每个类别获得的多个无细胞DNA群体中的每一个,提供代表来自无细胞DNA群体的无细胞脱氧核糖核酸(DNA)片段的多参数模型,从而提供训练数据集;以及(c)通过计算机在训练数据集上训练学习算法以产生一个或多个训练的分类器,其中每个训练的分类器被配置来将来自测试受试者的无细胞DNA测试群体分类为多个不同类别中的一个或多个。另外或替代地,遗传生物标记物的检测可以包括一种对来自受试者的测试样品进行分类的方法,其包括:(a)提供代表来自受试者的无细胞DNA测试群体的无细胞脱氧核糖核酸(DNA)片段的多参数模型;以及(b)使用训练的分类器对无细胞DNA测试群体进行分类。另外或替代地,遗传生物标记物的检测可以包括一种计算机实现的方法,其包括:(a)通过计算机从来自受试者的无细胞DNA片段生成序列信息;(b)基于序列信息,通过计算机将无细胞DNA片段映射到参考基因组;以及(c)通过计算机分析映射的无细胞DNA片段,以确定在参考基因组中多个碱基位置中的每一个处的多个测量值,所述多个测量值选自由以下组成的组:(i)映射到碱基位置的无细胞DNA片段的数量;(ii)映射到碱基位置的每个无细胞DNA片段的长度;(iii)映射到碱基位置的无细胞DNA片段作为无细胞DNA片段的长度的函数的数量;(iv)在碱基位置处开始的无细胞DNA片段的数量;(v)在碱基位置处终止的无细胞DNA片段的数量;(vi)在碱基位置处开始的无细胞DNA片段作为长度的函数的数量;以及(vii)在碱基位置处终止的无细胞DNA片段作为长度的函数的数量。另外或替代地,遗传生物标记物的检测可以包括一种用于对来自从受试者获得的无细胞DNA的脱氧核糖核酸(DNA)片段的分布解卷积的计算机实现的方法,所述方法包括:(a)通过计算机构建来自无细胞DNA的DNA片段在基因组中多个碱基位置上的覆盖分布;和(b)对于一个或多个遗传基因座中的每一个,通过计算机对覆盖分布解卷积,从而生成与选自由以下组成的组的一个或多个成员相关联的分数贡献:拷贝数(CN)分量、细胞清除分量和基因表达分量。在一些实施方案中,所述方法还包括至少基于分数贡献的一部分来生成指示遗传畸变的存在或不存在的输出。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/181146中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括可以用于早期癌症检测的方法和系统。在一些实施方案中,所述方法包括(a)提供来自受试者的包含cfDNA的样品,其中所述受试者没有可检测地表现出癌症;(b)从样品中捕获被测序组套覆盖的cfDNA分子,其中所述测序组套包含来自多个不同基因中的每一个的一个或多个区域,其中:(i)测序组套不多于50,000个核苷酸;(ii)在不同基因的任一个中存在肿瘤标记物指示所述受试者患有癌症;并且(iii)至少80%的患有癌症的受试者具有存在于多个不同基因中的至少一个中的肿瘤标记物;以及(c)对捕获的cfDNA分子测序到足以在低至0.01%的频率下在样品中检测肿瘤标记物的读长深度。在一些实施方案中,肿瘤标记物选自由以下组成的组:单碱基取代、拷贝数变化、插入/缺失、基因融合、颠换、易位、倒位、缺失、非整倍性、部分非整倍性、多倍性、染色体不稳定性、染色体结构改变、染色体融合、基因截短、基因扩增、基因重复、染色体病变、DNA病变、核酸化学修饰的异常变化、表观遗传模式的异常变化和核酸甲基化的异常变化。在一些实施方案中,至少85%、至少90%、至少93%、至少95%、至少97%)、至少98%或至少99%的患有癌症的受试者具有存在于多个不同基因中的至少一个中的肿瘤标记物。一些实施方案包括对捕获的cfDNA分子测序到足以在低至0.005%、0.001%或0.0005%的频率下在样品中检测肿瘤标记物的读长深度。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:a.提供包含来自受试者的无细胞核酸(cfNA)分子的样品,其中所述受试者没有可检测地表现出癌症;b.从样品中捕获被测序组套覆盖的cfNA分子,其中所述测序组套包含来自多个不同基因中的每一个的一个或多个区域,其中:i.测序组套不多于50,000个核苷酸;ii.在不同基因的任一个中存在肿瘤标记物指示所述受试者患有癌症;并且iii.至少80%的患有癌症的受试者具有存在于多个不同基因中的至少一个中的肿瘤标记物;以及c.对捕获的cfDNA分子测序到足以在低至1.0%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.025%、0.01%或0.005%的频率下在样品中检测肿瘤标记物的读长深度。另外或替代地,遗传生物标记物的检测可以包括一种用于检测受试者中的癌症的方法,其包括:在至少50,000个读长/碱基的深度下,对来自受试者的循环无细胞DNA(cfDNA)进行测序,以检测与癌症相关联的一个或多个遗传变体。在一些实施方案中,测序在至少100,000个读长/碱基的深度下进行。在一些实施方案中,测序在约120,000个读长/碱基的深度下进行。在一些实施方案中,测序在约150,000个读长/碱基的深度下进行。在一些实施方案中,测序在约200,000个读长/碱基的深度下进行。在一些实施方案中,读长/碱基代表至少5,000个原始核酸分子、至少10,000个原始核酸分子、至少20,000个原始核酸分子、至少30,000个原始核酸分子、至少40,000个原始核酸分子或至少50,000个原始核酸分子。在一些实施方案中,所述方法还包括将来自cfDNA的序列信息与从健康个体队列、癌症患者队列或受试者的生殖系DNA获得的序列信息进行比较。在一些实施方案中,所述方法还包括在测序之前扩增cfDNA,并根据从测序获得的序列读长确定共有序列,以减少扩增或测序的错误。在一些实施方案中,确定共有序列在逐个分子的基础上进行。在一些实施方案中,确定共有序列在逐个碱基的基础上进行。在一些实施方案中,共有序列的检测是基于以下:基于观察到的测序输出以及个体样品、一批样品或参考组样品的测序和扩增错误谱特征,评估每个潜在核苷酸的概率。在一些实施方案中,使用对来源于受试者的个体cfDNA分子加标签的分子条形码来进行确定共有序列。在一些实施方案中,将具有不同于人参考的共有序列的一组分子与在实验室中处理的其他样品中观察到的那些进行比较,以确定和排除任何潜在的污染事件。在一些实施方案中,通过将共有序列与从健康个体队列、癌症患者队列或受试者的生殖系DNA获得的那些共有序列进行比较来优化确定共有序列。在一些实施方案中,所述方法还包括用条形码对cfDNA分子加标签,使得来源于受试者的样品中至少20%的cfDNA带标签。在一些实施方案中,通过连接包含条形码的衔接子来进行加标签。在一些实施方案中,衔接子包含平端衔接子、限制性酶突出衔接子或具有单核苷酸突出的衔接子中的任一个或全部。在一些实施方案中,具有单核苷酸突出的衔接子包括C尾部衔接子、A尾部衔接子、T尾部衔接子和/或G尾部衔接子。在一些实施方案中,使用具有条形码的引物通过PCR扩增进行加标签。在一些实施方案中,条形码是单链的。在一些实施方案中,条形码是双链的。在一些实施方案中,所述方法还包括将cfDNA分为各个分区。在一些实施方案中,每个分区中的cfDNA相对于每个其他分区是带唯一标签的。在一些实施方案中,每个分区中的cfDNA相对于每个其他分区不是带唯一标签的。在一些实施方案中,每个分区中的cfDNA没有被加标签。另外或替代地,遗传生物标记物的检测可以包括一种用于在被怀疑患有癌症或患有癌症的受试者中检测肿瘤的方法,其包括:(a)对来源于从受试者获得的无细胞DNA(cfDNA)样品的无细胞DNA(cfDNA)分子进行测序;(b)分析从测序得出的序列读长以鉴定(i)cfDNA分子中的循环肿瘤DNA(ctDNA)和(ii)cfDNA中的一个或多个驱动突变;以及(c)使用关于ctDNA分子中一个或多个驱动突变的存在、不存在或量的信息来鉴定(i)受试者中的肿瘤以及(ii)受试者采取的治疗肿瘤的行动,其中所述方法以至少85%的敏感性、至少99%的特异性和至少99%的诊断准确性检测受试者中的肿瘤。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/136603中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于检测或监测癌症演变的方法和系统。另外或替代地,遗传生物标记物的检测可以包括一种计算机实现的方法,其包括:(a)在第一时间点处获得关于多个患有癌症的受试者的信息,其中对于所述多个受试者中的每一个受试者,所述信息至少包括通过对来自无细胞体液的核酸进行基因分型而获得的肿瘤的遗传谱和在第一时间点之前提供给受试者的任何治疗,并且基于第一时间点处的信息确定多个受试者中的每一个的第一状态,以产生一组第一状态;(b)在第一时间点之后的一个或多个第二时间点处获得关于多个受试者的信息,并且基于在一个或多个第二时间点中的一个给定时间点处的信息来确定一个或多个第二时间点中的每一个处多个受试者中的每一个的第二状态,以产生一组后续状态;以及(c)使用来自(a)的所述组的第一状态和来自(b)的所述组的后续状态来生成预测算法,所述预测算法被配置来确定给定第一状态将在给定第一状态之后的较晚时间点处产生一组状态中的第二状态的概率。在一些实施方案中,所述方法还包括:(d)对于较早时间点的一组状态中的给定第一状态,确定给定第一状态将在较晚时间点产生所述组状态中的第二状态的概率;以及(e)生成指示在(d)中确定的概率的电子输出。另外或替代地,遗传生物标记物的检测可以包括一种计算机实现的方法,其包括:(a)在第一时间点处获得关于多个患有癌症的受试者的信息,其中对于所述多个受试者中的每一个受试者,所述信息至少包括通过对至少50个基因进行基因分型而获得的肿瘤的遗传谱和在第一时间点之前提供给受试者的任何治疗,并且基于第一时间点处的信息确定多个受试者中的每一个的第一状态,以产生一组第一状态;(b)在第一时间点之后的一个或多个第二时间点处获得关于多个受试者的信息,并且基于在一个或多个第二时间点中的一个给定时间点处的信息来确定一个或多个第二时间点中的每一个处多个受试者中的每一个的第二状态,以产生一组后续状态;以及(c)使用来自(a)的所述组的第一状态和来自(b)的所述组的后续状态来生成预测算法,所述预测算法被配置来确定给定第一状态将在给定第一状态之后的较晚时间点处产生一组状态中的第二状态的概率。在一些实施方案中,所述方法还包括:(d)对于较早时间点的一组状态中的给定第一状态,确定给定第一状态将在较晚时间点产生所述组状态中的第二状态的概率;以及(e)生成指示在(d)中确定的概率的电子输出。在一些实施方案中,获得信息包括对来自多个受试者的无细胞脱氧核糖核酸(cfDNA)进行测序,并且任选地对多个受试者中的每一个进行医疗访谈。在一些实施方案中,在第一时间点之前向受试者提供治疗。在一些实施方案中,所述方法包括生成一个或多个决策树,每个决策树包括根节点、一个或多个决策分支、一个或多个决策节点以及一个或多个终节点,其中根节点处的状态代表第一时间点,一个或多个决策分支代表替代性治疗,并且一个或多个决策节点和一个或多个终节点代表后续状态。在一些实施方案中,所述一个或多个决策分支包括多个决策分支。在一些实施方案中,后续状态包括受试者的存活状态,其指示受试者是活着的还是已死亡。在一些实施方案中,后续状态包括受试者存活率。在一些实施方案中,第一状态中的每一个包括一组共同的一个或多个体细胞突变。在一些实施方案中,所述信息还包括受试者概况。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:(a)在第一时间点处获得关于患有癌症的受试者的信息,其中所述信息包括来自患者概况、肿瘤概况或治疗的受试者的至少一个特征;(b)基于第一时间点处的信息确定受试者的初始状态;(c)基于受试者的初始状态确定在一个或多个后续时间点中的每一个处多个后续状态中的每一个的概率,从而提供关于状态结果的一组概率;(d)至少部分地基于关于状态结果的所述组的概率来生成针对受试者获得特定结果的概率优化的癌症治疗建议;以及(e)生成指示在(d)中生成的建议的电子输出。在一些实施方案中,所述概率至少部分地是来自多种治疗选择中的一种治疗选择的函数。在一些实施方案中,一个或多个后续时间点包括多个后续时间点。在一些实施方案中,所述方法还包括确定多个后续时间点处的概率。在一些实施方案中,所述时间点包括至少三个时间点。在一些实施方案中,所述时间点包括至少四个时间点。在一些实施方案中,所述第一时间点在受试者接受治疗之前,并且所述后续时间点在受试者接受治疗之后。在一些实施方案中,基于后续时间点处的后续状态,在后续时间点之后施用第二治疗。在一些实施方案中,受试者的至少一个特征来自患者概况并且选自由以下组成的组:年龄、性别、遗传谱、酶水平、器官功能、生活质量、医疗干预的频率、缓解状态以及患者结果。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:(a)通过通信网络与一个或多个医疗服务提供商建立一个或多个通信链路;(b)通过通信网络从一个或多个医疗服务提供商接收关于一个或多个受试者的医疗信息;(c)从医疗服务提供商接收来自一个或多个受试者中的每一个的包含无细胞脱氧核糖核酸(cfDNA)的一个或多个样品;(d)对cfDNA进行测序并且鉴定cfDNA中存在的一个或多个遗传变体;(e)用一个或多个受试者中的每一个的信息创建或补充数据库,所述信息包括已鉴定的遗传变体和所接收的医疗信息两者;(f)使用数据库和计算机实现的算法,生成至少一种预测模型,所述至少一种预测模型基于受试者的初始状态来预测多个不同治疗性干预中的每一个的后续状态的概率。另外或替代地,遗传生物标记物的检测可以包括一种非暂时性计算机可读介质,其包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实施一种方法,所述方法包括:(a)在第一时间点处获得关于多个患有癌症的受试者的信息,其中对于所述多个受试者中的每一个受试者,所述信息至少包括通过对来自无细胞体液的核酸进行基因分型而获得的肿瘤的遗传谱和在第一时间点之前提供给受试者的任何治疗,并且基于第一时间点处的信息确定多个受试者中的每一个的第一状态,以产生一组第一状态;(b)在第一时间点之后的一个或多个第二时间点处获得关于多个受试者的信息,并且基于在一个或多个第二时间点中的一个给定时间点处的信息来确定一个或多个第二时间点中的每一个处多个受试者中的每一个的第二状态,以产生一组后续状态;以及(c)使用来自(a)的所述组的第一状态和来自(b)的所述组的后续状态来生成预测算法,所述预测算法被配置来确定给定第一状态将在给定第一状态之后的较晚时间点处产生一组状态中的第二状态的概率。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:(a)获得关于受试者的信息,所述信息至少包括肿瘤的遗传谱和先前或当前提供给受试者的治疗(如果有的话),并且基于所述信息确定受试者的初始状态;(b)提供决策树,其中根节点代表初始受试者状态,决策分支代表受试者可用的替代性治疗,机会节点代表不确定点,并且决策节点或终节点代表后续状态;(c)为受试者提供使受试者在终节点处实现生存状态的概率最大化的疗程;以及(d)向受试者施用疗程。在一些实施方案中,所述方法还包括:(e)在初始状态之后的第二时间点,获得关于受试者的信息,所述信息至少包括肿瘤的遗传谱和先前或当前提供给受试者的治疗(如果有的话),并且基于所述信息确定受试者的多个随后状态中的第二状态;(f)基于第二状态,为受试者提供随后的疗程,所述疗程使受试者在终节点处实现存活状态的概率最大化;以及(g)向受试者施用随后的疗程。在一些实施方案中,所述方法还包括:(e)在初始状态之后的第二时间点,获得关于受试者的信息,所述信息至少包括肿瘤的遗传谱和先前或当前提供给受试者的治疗(如果有的话),并且基于所述信息确定受试者的多个随后状态中的第二状态;(f)基于第二状态,为受试者提供随后的疗程,所述疗程使受试者在终节点处实现存活状态的概率最大化;以及(g)向受试者施用随后的疗程。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号10,017,759中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于制备核酸片段的文库的方法,更具体地,用于使用蛋白酶在单个管中制备核酸片段的文库,以用于多种应用,包括例如下一代DNA测序的方法。另外,一种制备带标签的核酸片段的文库的方法包括:(a)使细胞群体与裂解试剂直接接触以生成细胞裂解液,其中所述裂解试剂具有一种或多种蛋白酶,并且其中所述细胞裂解液含有靶核酸;(b)使一种或多种蛋白酶失活以形成失活的细胞裂解液;以及(c)在靶核酸和至少一种含有转移链的转座子末端组合物经历转座反应的条件下将至少一种转座酶和所述转座子末端组合物直接施加到失活的细胞裂解液中以生成混合物,其中(i)将靶核酸片段化以生成多个靶核酸片段,并且(ii)将转座子末端组合物的转移链与多个靶核酸片段的每一个的5′末端连接以生成多个5′带标签的靶核酸片段。在一些实施方案中,步骤(a)、(b)和(c)在单一反应混合物中,例如在管中进行。在一些实施方案中,细胞群体是最小细胞群体。在一些实施方案中,最小细胞群体含有1、2、3、4或5个细胞。在一些实施方案中,靶核酸是双链DNA,并且其中在步骤(c)中施加转座酶和转座子末端组合物之前,靶核酸保持为双链DNA。在一些实施方案中,靶核酸是基因组DNA。在一些实施方案中,靶核酸含有染色体DNA或其片段。在一些实施方案中,靶核酸包括基因组或部分基因组。在一些实施方案中,所述方法还包括(d)在3′标签与5′带标签的靶核酸片段连接的条件下,将来自步骤(c)的混合物用至少一种核酸修饰酶直接温育,以生成多个带双标签的靶核酸片段。在一些实施方案中,步骤(a)、(b)、(c)和(d)在单个反应管中进行。在一些实施方案中,所述方法还包括(e)扩增一个或多个带双标签的靶核酸片段,以生成在带双标签的核酸片段的5′末端和/或3′末端处具有额外序列的带标签的核酸片段的文库。在一些实施方案中,步骤(a)、(b)、(c)、(d)和(e)在单个反应管中进行。在一些实施方案中,扩增包括使用聚合酶链反应(PCR)、链置换扩增反应、滚环扩增反应、连接酶链反应、转录介导的扩增反应或环介导的扩增反应中的一种或多种。在一些实施方案中,扩增包括使用与带双标签的靶DNA片段的3′标签互补的单个引物的PCR。在一些实施方案中,扩增包括使用第一引物和第二引物的PCR,其中第一引物的至少3′末端部分与带双标签的靶核酸片段的3′标签的至少一部分互补,并且其中第二引物的至少3′末端部分显示带双标签的靶核酸片段的5′标签的至少一部分的序列。在一些实施方案中,第一引物的5′末端部分与带双标签的靶核酸片段的3′标签不互补,并且第二引物的5′末端部分不显示带双标签的靶核酸片段的5′标签的至少一部分的序列。在一些实施方案中,第一引物包含第一通用序列,并且/或者其中第二引物包含第二通用序列。在一些实施方案中,所述方法还包括对带标签的核酸片段进行测序。在一些实施方案中,带标签的核酸片段的测序包括使用以下中的一种或多种:边测序边合成、桥式PCR、链终止测序、边测序边杂交、纳米孔测序和边测序边连接。在一些实施方案中,带标签的核酸片段的测序包括使用下一代测序。在一些实施方案中,所述方法还包括分析拷贝数变化。在一些实施方案中,所述方法还包括分析单核苷酸变异。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,944,924中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括在下一代测序中使用专用捕获引物。一种修饰固定的捕获引物的方法可以包括:a)提供具有固定的专用捕获引物的固体支撑物,所述专用捕获引物包含:i)包括专用捕获区域的3′部分,和ii)包括通用捕获区域的5′部分;b)在足以进行杂交的条件下使专用多核苷酸与专用捕获引物接触以产生固定的专用多核苷酸;以及c)去除未与专用多核苷酸杂交的专用捕获引物的专用捕获区域,以将未杂交的专用捕获引物转化为通用捕获引物。在一些实施方案中,去除专用捕获区域的一部分。在一些实施方案中,专用捕获引物包含多个不同的固定的专用捕获引物。在一些实施方案中,专用多核苷酸包含多个不同的专用多核苷酸。在一些实施方案中,专用捕获区域包括靶特异性捕获区域,并且专用多核苷酸包括靶多核苷酸。在一些实施方案中,专用捕获区域包括转座子末端(TE)区域,并且专用多核苷酸包括TE寡核苷酸。在一些实施方案中,所述方法还包括在执行步骤c)之前在足以使寡核苷酸与专用捕获引物的通用捕获区域杂交的条件下施加寡核苷酸以产生双链DNA区域。在某些实施方案中,寡核苷酸是P5至P7寡核苷酸。在一些实施方案中,所述方法还包括在执行步骤c)之前在足以使寡核苷酸与专用捕获引物的专用捕获区域杂交的条件下施加寡核苷酸以产生双链DNA区域。在一些实施方案中,所述方法还包括使专用捕获引物与核酸酶接触,其中通过核酸酶去除未与专用多核苷酸杂交的专用捕获引物的专用捕获区域。在一些实施方案中,核酸酶是核酸外切酶。在一些实施方案中,核酸外切酶是核酸外切酶I。在一些实施方案中,核酸外切酶是核酸外切酶III。在一些实施方案中,核酸酶是核酸内切酶。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,992598中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于扩增子制备的方法。所述方法包括:(a)在足以进行杂交的条件下将包含多个靶多核苷酸的核酸样品与至少一种引物接触,所述至少一种引物含有衔接子;(b)通过聚合酶链反应(PCR)扩增多个靶多核苷酸以产生多个扩增子;(c)在足以进行杂交的条件下使固定在固体支撑物上的多个靶特异性捕获引物与多个扩增子直接接触以产生多个固定的第一扩增子,所述固体支撑物还包括多个通用捕获引物;(d)延伸多个靶特异性捕获引物以产生与靶多核苷酸互补的多个固定的延伸产物;(e)将多个通用捕获引物与多个固定的延伸产物退火;以及(f)通过PCR扩增多个固定的延伸产物以产生多个固定的第二扩增子,其中固定的扩增子群体具有85%或更大的均匀度。所述方法可以与10ng或更少的输入核酸一起使用,并且还可以包括对多个固定的第二扩增子进行测序。所述方法还可以用于确定与病症或疾病相关联的基因,包括癌症相关基因的存在。所述方法中也可以使用无细胞DNA。另外,遗传生物标记物的检测可以包括一种用于增加核酸序列变体的检测敏感性的方法,其包括:(a)在足以进行杂交的条件下使包含多个靶多核苷酸的核酸样品与基因特异性正向和反向引物接触,基因特异性正向引物的每个物种包含唯一序列索引和衔接子;(b)通过聚合酶链反应(PCR)扩增多个靶多核苷酸以产生多个扩增子;(c)在足以进行杂交的条件下使固定在固体支撑物上的多个靶特异性捕获引物与多个扩增子直接接触以产生多个固定的第一扩增子,所述固体支撑物还包括多个通用捕获引物;(d)延伸多个靶特异性捕获引物以产生与靶多核苷酸互补的多个固定的延伸产物;(e)将多个通用捕获引物与多个固定的延伸产物退火;(f)通过PCR扩增多个固定的延伸产物以产生多个固定的第二扩增子,其中多个固定的第二扩增子具有85%或更大的均匀度;(g)对多个固定的第二扩增子进行测序;以及(h)通过比较靶多核苷酸物种的变体位置处的三个或更多个核苷酸序列来消除一个或多个靶多核苷酸的随机序列错误,其中通过唯一序列索引鉴定靶多核苷酸物种,从而确定一个或多个靶多核苷酸中的真实核苷酸序列。所述方法可以检测到变体核苷酸位置的0.3%或更小的错配率。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,879,312中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于选择性富集核酸的方法。一些实施方案包括选择性富集包含靶核酸的长核酸。一些实施方案包括选择性富集PCR产物。所述方法的一些实施方案包括(a)使核酸群体与切口酶接触,从而产生带切口的核酸群体;(b)使带切口的核酸群体与核酸外切酶接触,从而生成具有单链部分的核酸,其中所述单链部分包含靶的至少一部分;(c)使捕获探针与所述靶的至少一部分接触,其中探针与靶杂交;以及(d)将与捕获探针杂交的核酸与未结合到捕获探针的核酸分离。在其他实施方案中,所述方法包括(a)获得核酸群体,其中所述群体中的至少一些核酸包含靶;(b)使核酸群体与切口酶接触,从而产生带切口的核酸群体;(c)使带切口的核酸群体与核酸外切酶接触,从而生成具有单链部分的核酸,其中所述单链部分包含靶的至少一部分;(d)使捕获探针与所述靶的至少一部分接触,其中探针与靶杂交;以及(e)将与捕获探针杂交的核酸与未结合捕获探针的核酸分离。所述方法的一些实施方案还包括从捕获探针释放杂交的核酸的步骤。其他实施方案还包括扩增所述靶。再其他的实施方案另外包括对靶的至少一部分进行测序。在一些实施方案中,一个或多个过程步骤,例如步骤(a),还可以包括使双链核酸群体与包括切口酶的同裂酶的II型限制性核酸内切酶接触;以及在有利于个体核酸的分子内重新环化的条件下使切割的双链核酸重新环化。在此类实施方案中,可以使用各种II型限制性核酸内切酶或II型限制性核酸内切酶的组合。在一些实施方案中,例如,限制性核酸内切酶包括BbvCI。在其他实施方案中,切口酶包括Nb.BbvCI和Nt.BbvCI。在所述方法的一些实施方案中,探针包含捕获部分。在一些此类实施方案中,捕获部分包括生物素或链霉亲和素。在一些实施方案中,将与捕获探针杂交的核酸与未结合到捕获探针的核酸分离的步骤还包括使杂交的靶和探针与结合部分接触。在一些实施方案中,结合部分包括亲和素和链霉亲和素。在一些实施方案中,结合部分还包括珠粒、微球或其他粒子。所述方法的实施方案还包括重复所述过程的一个或多个步骤。在某些实施方案中,重复全部方法步骤。在所述方法的一些实施方案中,靶包含第一捕获部分,并且探针包含第二捕获部分。一些此类实施方案还包括使第一捕获部分与第一结合部分接触,从而提供靶的富集,以及使第二捕获部分与第二结合部分接触,从而提供探针的富集。除了上述内容之外,所述方法的一些实施方案还提供了选择性富集核酸,其包括以下步骤:(a)提供核酸群体,其中所述群体中的至少一些核酸包含与捕获探针杂交的靶;(b)将杂交的探针锁定到靶;以及(c)将锁定到探针的核酸与未锁定到探针的核酸分离。在其他实施方案中,所述方法包括(a)获得核酸群体,其中所述群体中的至少一些核酸包含靶;(b)将靶与捕获探针杂交;(c)将杂交的探针锁定到靶;以及(d)将锁定到探针的核酸与未锁定到探针的核酸分离。除了上述内容之外,所述方法的一些实施方案还包括用于选择性富集核酸的方法,其包括:(a)提供核酸群体,其中所述群体中的至少一些核酸包含靶,所述靶包含核酸的5′末端的一部分和核酸的3′末端的一部分,所述靶与包含一起退火的第一寡核苷酸和第二寡核苷酸的选择器探针杂交,其中第一寡核苷酸与核酸的5′末端的至少一部分互补并且与第二寡核苷酸的至少一部分互补,并且第二寡核苷酸与核酸的3′末端的至少一部分互补;(b)将选择器探针与靶连接;以及(c)将与选择器探针连接的核酸与未与选择器探针连接的核酸分离。富集方法的其他实施方案包括以下步骤:(a)获得核酸群体,其中所述群体中的至少一些核酸包含靶,所述靶包含核酸的5′末端的一部分和核酸的3′末端的一部分;(b)获得包含一起退火的第一寡核苷酸和第二寡核苷酸的选择器探针,其中第一寡核苷酸与核酸的5′末端的至少一部分互补并且与第二寡核苷酸的至少一部分互补,并且第二寡核苷酸与核酸的3′末端的至少一部分互补;(c)使选择器探针与靶接触,其中探针与靶杂交;(d)将选择器探针与靶连接;以及(e)将与选择器探针连接的核酸与未与选择器探针连接的核酸分离。除了上述内容之外,所述方法的一些实施方案还包括用于选择性富集核酸的方法,其包括:(a)提供单链核酸群体,其中所述群体中的至少一些核酸包含靶,所述靶包含核酸的5′末端和核酸的3′末端,所述靶与包含一起退火的第一寡核苷酸和第二寡核苷酸的选择器探针杂交,其中第一寡核苷酸包含与核酸的3′末端互补的5′部分、间隔子部分以及与核酸的5′末端互补的3′部分,并且第二寡核苷酸与间隔子部分互补;(b)将选择器探针与靶连接;以及(c)将与选择器探针连接的核酸与未与选择器探针连接的核酸分离。所述方法的其他实施方案还包括:(a)获得单链核酸群体,其中所述群体中的至少一些核酸包含靶,所述靶包含核酸的5′末端和核酸的3′末端;(b)获得包含一起退火的第一寡核苷酸和第二寡核苷酸的选择器探针,其中第一寡核苷酸包含与核酸的3′末端互补的5′部分、间隔子部分以及与核酸的5′末端互补的3′部分,并且第二寡核苷酸与间隔子部分互补;(c)使选择器探针与靶接触,其中探针与靶杂交;(d)将选择器探针与靶连接;以及(e)将与选择器探针连接的核酸与未与选择器探针连接的核酸分离。一些实施方案还包括用于归一化扩增的核酸的方法,其包括:选择第一寡核苷酸群体,对于第一寡核苷酸群体,其具有包含捕获部分的寡核苷酸与缺乏捕获部分的寡核苷酸的一定比率;获得第二寡核苷酸群体;将靶核酸与第一寡核苷酸群体和第二寡核苷酸群体一起扩增;以及将具有并入的包含捕获部分的寡核苷酸的扩增靶与缺乏掺入的寡核苷酸捕获部分的扩增靶分离。在一些实施方案中,分离步骤还包括使杂交的靶和探针与结合部分接触。在一些实施方案中,结合部分包括亲和素和链霉亲和素。在一些实施方案中,结合部分还包括珠粒、微球或其他粒子。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,828,672中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于核酸制备的试剂,其包含铁载体。在一些实施方案中,铁载体是细菌铁载体。在一些实施方案中,铁载体是去铁胺B(DFO-B)甲磺酸盐。在一些实施方案中,所述试剂可以包含DNA聚合酶。在一些实施方案中,所述试剂可以包含dNTP。在一些实施方案中,所述试剂不含EDTA。一些实施方案提供了用于制备核酸文库的方法,其包括:提供来自样品的多个核酸分子;以及在包含铁载体的用于核酸制备的试剂中操纵多个核酸分子。在一些实施方案,操纵多个核酸分子包括将多个核酸分子与多个寡核苷酸探针杂交。在一些实施方案中,将多个核酸分子和/或多个寡核苷酸探针固定在支撑物上。在一些实施方案中,通过与支撑物的结合配偶体对将多个核酸分子和/或多个寡核苷酸探针固定在支撑物上。在一些实施方案中,所述支撑物是磁性珠粒。在一些实施方案中,操纵多个核酸分子包括去除未特异性结合到多个核酸分子的寡核苷酸探针。在一些实施方案中,所述方法包括修饰未特异性结合到多个核酸分子的寡核苷酸探针。在一些实施方案中,所述方法包括使多个核酸分子片段化。在一些实施方案中,所述方法包括将衔接子添加到多个核酸分子中。在一些实施方案中,通过扩增将衔接子添加到多个核酸分子中。一些实施方案提供了用于减少对核酸分子的氧化损伤的方法,所述方法包括在不存在EDTA的情况下制备核酸分子。在一些实施方案中,制备核酸分子包括在铁载体的存在下制备核酸分子。在一些实施方案中,铁载体是细菌铁载体。在一些实施方案中,铁载体是去铁胺B(DFO-B)甲磺酸盐。在一些实施方案中,制备核酸分子包括将核酸分子暴露于Fe(III)。在一些实施方案中,制备核酸分子包括将核酸分子暴露于磁性珠粒。在一些实施方案中,氧化损伤包括核酸分子中的点突变。在一些实施方案中,点突变是C至A颠换。一些实施方案提供了用于增加测序反应的Q(phred)得分的方法,所述方法包括在不存在EDTA的情况下制备核酸分子。在一些实施方案中,制备核酸分子包括在铁载体的存在下制备核酸分子。在一些实施方案中,铁载体是细菌铁载体。在一些实施方案中,铁载体是去铁胺B(DFO-B)甲磺酸盐。在一些实施方案中,Q得分大于约34。在一些实施方案中,Q得分大于约38。在一些实施方案中,Q得分大于约42。在一些实施方案中,测序反应是深度测序应用。在一些实施方案中,深度测序应用是癌症相关的深度测序应用。在一些实施方案中,所述方法包括在不存在EDTA的情况下对核酸分子进行测序。一些实施方案提供了包含至少一个容器装置的试剂盒,其中所述至少一个容器装置包含用于核酸制备的包含铁载体的试剂。在一些实施方案中,铁载体是去铁胺B(DFO-B)甲磺酸盐。在一些实施方案中,所述试剂不含EDTA。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,708,655中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于使用锚定到或邻近纳米孔的系链来检测事件的组合物、系统和方法。在一些实施方案中,组合物包含纳米孔,其包括第一侧、第二侧和延伸通过第一侧和第二侧的通孔;以及永久性系链,其包括头部区域、尾部区域和设置在其之间的细长体。头部区域可以锚定到或邻近纳米孔的第一侧或第二侧。包括报告子区域的细长体可以响应于邻近纳米孔的第一侧发生的第一事件而在通孔内移动。在一个非限制性实例中,头部区域可以锚定到设置在纳米孔的第一侧或第二侧上的分子,诸如蛋白质。在一些实施方案中,一种方法包括提供纳米孔,所述纳米孔包括第一侧、第二侧和延伸通过第一侧和第二侧的通孔;以及提供永久性系链,所述永久性系链包括头部区域、尾部区域和置于其之间的细长体。头部区域可以锚定到或邻近纳米孔的第一侧或第二侧,并且细长体可以包括报告子区域。所述方法可以包括响应于邻近纳米孔的第一侧发生的第一事件而在通孔内移动报告子。在一些实施方案中,报告子区域可响应于第一事件在通孔内平移移动。另外或替代地,报告子区域可以响应于第一事件在通孔内旋转地移动。另外或替代地,报告子区域可以响应于第一事件在通孔内在构象上移动。在一些实施方案中,头部区域通过共价键锚定到或邻近纳米孔的第一侧或第二侧。头部区域可以锚定到纳米孔的第一侧。尾部区域可以自由地朝向纳米孔的第二侧延伸。在一些实施方案中,报告子区域可响应于第一事件朝向纳米孔的第一侧平移移动。在第一事件之后,报告子区域可以朝向第二侧平移移动。报告子区域还可以响应于邻近纳米孔的第一侧发生的第二事件朝向第一侧平移移动,第二事件在第一事件之后。报告子区域还可以在第二事件之后朝向第二侧平移移动。在一些实施方案中,第一事件包括将第一核苷酸添加到多核苷酸中。在包括第二事件的实施方案中,第二事件可以包括将第二核苷酸添加到多核苷酸中。报告子区域的电或通量阻挡特征可以与细长体的另一区域的电或通量阻挡特征不同。在一些实施方案中,一种系统可以包括一种组成和测量电路,其被配置来测量当报告子区域响应于第一事件移动时通过通孔的第一电流或通量或测量第一光信号。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,670,530中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括确定含有基因组DNA的高分子量片段的DNA样品的单倍型或部分单倍型的方法。此类方法的特征在于以下操作:(a)处理DNA样品以产生富集的DNA样品,其富集来自第一高分子量片段的DNA,所述第一高分子量片段具有来自第一单倍型的多个等位基因;(b)对富集的DNA样品中的DNA进行测序以产生多个序列读长,其长度短于第一高分子量片段,其中所述序列读长中的一些含有第一单倍型的第一等位基因,并且所述序列读长中的其他含有第一个单倍型的第二等位基因;(c)将序列读长与参考基因组比对以产生比对读长,其中来自第一高分子量片段的比对读长倾向于在参考基因组上聚类成岛;(d)确定将参考基因组上比对读长的相邻读长间隔开的距离,其中相邻比对读长之间的间隔距离落入可通过其间隔距离的数量级区分的至少两个组中;(e)选择第一组比对读长,其与相邻比对读长的间隔距离小于临界值,从而排除具有更大间隔距离的比对读长,其中第一组比对读长的至少一部分属于参考基因组上的同一岛;以及(f)使用来自第一组比对读长的等位基因来限定第一单倍型或第一部分单倍型。在一些实施方案中,所述方法具有从第一部分单倍型和其他部分单倍型确定完整单倍型的额外操作。在一些实施方案中,选择第一组比对读长包括确定临界值。例如,确定临界值包括:(i)由相邻比对读长之间的间隔距离生成混合物模型,其中所述混合物模型使两个分布适合所述间隔距离;以及(ii)根据两个分布中的至少一个的特性确定临界值。在一些情况下,两个分布中的每个均具有自己的中心趋势(例如,高斯分布的平均值)。在某些实施方案中,选择第一组比对读长包括确定临界值。例如,确定临界值包括:(i)由相邻比对读长之间的间隔距离生成混合物模型,其中所述混合物模型使两个分布适合所述间隔距离;以及(ii)根据两个分布中的至少一个的特性确定临界值。在一些情况下,两个分布中的每个均具有自己的中心趋势(例如,高斯分布的平均值)。在某些实施方案中,生成混合物模型涉及将期望最大化程序应用于相邻比对读长之间的间隔距离。在一些实施方式中,确定临界值包括鉴定含有较短间隔距离的分布的概率质量的分数的操作。例如,含有较短间隔距离的分布的概率质量的分数可以是大约80%或更大。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,587,273中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种从复杂混合物中选择核酸序列的代表性样品的方法。所述方法包括:(a)在足以进行杂交的条件下使核酸的复杂混合物与捕获探针群体接触,所述捕获探针群体与包含共同存在于复杂混合物中的序列的预定部分的一个或多个核酸互补,以形成一个或多个核酸与探针群体的杂交复合物,捕获探针群体附接到固体支撑物;以及(b)去除未杂交的核酸以选择具有复杂混合物的少于10%但多于0.001%的复杂性的核酸的代表性样品,其中所述代表性样品包含核酸拷贝,所述拷贝中的每个序列相对于拷贝中的所有其他序列的比例与复杂混合物内的一个或多个核酸的预定部分中的序列的比例基本上相同。另外或替代地,遗传生物标记物的检测可以包括一种从完整基因组中选择基因组序列的代表性样品的方法。在一些实施方案中,所述方法还提供了一种核酸群体,其包括具有复杂混合物的少于10%但多于0.001%的复杂性的代表性样品,所述代表性样品包含核酸拷贝,所述拷贝中的每个序列相对于拷贝中的所有其他序列的比例与复杂混合物内的共同存在于一个或多个核酸中的序列的预定部分中的序列的比例基本上相同。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,574,234中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于分析核酸序列的方法和组合物。在一些实施方案中,所述方法利用已经捕获在珠粒上的克隆对象,例如DNA球。一些实施方案提供了具有珠粒和一个克隆对象的组合物,其中所述克隆对象例如通过珠粒表面上的膜片(诸如亲和结合膜片或杂交膜片)与珠粒亲和结合或杂交。在一些方面,膜片包括附接到珠粒表面上的单个区域的多个多核苷酸。一些实施方案还提供了具有亲和结合或杂交的克隆对象的珠粒群体。在具体实施方案中,每个克隆对象通过每个珠粒表面上的膜片(诸如亲和结合膜片或杂交膜片)与珠粒亲和结合或杂交。群体中珠粒与结合或杂交的克隆对象的比率可以是1∶1。在具体实施方案中,不多于一个克隆对象与群体中任何给定的珠粒结合或杂交。使用这些方法,可以制造组合物,其中珠粒和一个克隆对象通过附接到珠粒表面上的膜片彼此亲和结合或杂交。一些实施方案可以提供一种制造在珠粒上的亲和结合膜片的方法,其通过以下进行:提供具有多个捕获部分的珠粒;提供具有多个捕获补体部分的固体表面,其中所述捕获补体部分还包含可裂解部分和亲和配体;将捕获部分特异性结合到捕获补体部分,从而在固体表面上形成固定珠粒;以及使可裂解部分裂解,以便保留在珠粒上的亲和配体,从而制造在珠粒上的亲和结合膜片。在具体实施方案中,捕获部分或捕获补体部分或两者包含多核苷酸的捕获序列。因此,一些实施方案可以提供一种制造在珠粒上的亲和结合膜片的方法,其通过以下进行:提供珠粒,其具有附接到珠粒表面的多个第一多核苷酸,其中每个第一多核苷酸具有捕获序列;提供固体表面,其具有附接到固体表面的多个第二多核苷酸,其中每个第二多核苷酸具有捕获补体序列、可裂解部分和亲和配体;将第一多核苷酸的捕获序列与第二多核苷酸的捕获补体序列杂交,从而在固体表面上形成固定珠粒;以及在可裂解部分处使第二多核苷酸裂解,以便保留在多个第二多核苷酸上的亲和配体,从而制造在珠粒上的亲和结合膜片。在一些方面,所述方法还包括制造结合到亲和结合膜片的一个克隆对象,其通过以下进行:使亲和配体与结合剂接触,其中所述结合剂具有两个或更多个结合位点;以及通过一个克隆对象上的第二亲和配体将所述克隆对象结合到所述结合剂,其中所述一个克隆对象具有单个串联重复的靶核酸分子,从而制造结合到亲和结合膜片的一个克隆对象。一些实施方案可以提供一种制造具有一个克隆对象的珠粒的方法,其通过以下进行:提供具有多个第一捕获部分的珠粒;提供具有多个第二捕获部分的固体表面,所述多个第二捕获部分被图案化为表面上的膜片,其中每个第二捕获部分具有可裂解部分,其中一个克隆对象通过第二捕获部分中的一个或多个结合到表面上的一个膜片上,其中一个克隆对象具有单个串联重复的靶核酸分子;将第一捕获部分特异性结合到克隆对象,从而在固体表面上形成固定珠粒;以及使可裂解部分裂解以保留克隆对象,从而制造具有一个克隆对象的珠粒。在具体实施方案中,捕获部分包含多核苷酸。因此,一些实施方案可以提供一种制造具有一个克隆对象的珠粒的方法,其通过以下进行:提供具有多个第一多核苷酸的珠粒;提供具有多个第二多核苷酸的固体表面,所述多个第二多核苷酸被图案化为表面上的膜片,其中每个第二多核苷酸具有可裂解部分,其中一个克隆对象与表面上的一个多核苷酸膜片杂交,其中一个克隆对象具有单个串联重复的靶核酸分子;将第一多核苷酸与克隆对象杂交,从而在固体表面上形成固定珠粒;以及在可裂解部分处使第二多核苷酸裂解以保留克隆对象,从而制造具有一个克隆对象的珠粒。一些实施方案可以提供一种制造在珠粒上的杂交膜片的方法,其通过以下进行:提供珠粒,其具有附接到珠粒表面的多个第一多核苷酸,其中每个第一多核苷酸具有第一捕获序列;提供固体表面,其具有附接到固体表面的多个第二多核苷酸,其中每个第二多核苷酸具有第一捕获补体序列和第二捕获补体序列;将第一多核苷酸的第一捕获序列与第二多核苷酸的第一捕获补体序列杂交,从而在固体表面上形成固定珠粒;以及使用第二捕获补体序列作为模板,延伸固定珠粒的第一多核苷酸,从而制造在珠粒上的延伸的第一多核苷酸的杂交膜片,所述延伸的第一多核苷酸具有第二捕获序列。在一些方面,所述方法还包括制造结合到珠粒上的膜片的一个克隆对象,其通过以下进行:提供具有第二捕获补体序列的克隆对象;以及将所述克隆对象的第二捕获补体序列与珠粒的第二捕获序列杂交,从而制造结合到珠粒上的膜片的克隆对象。在所述方法的一些方面,延伸第一多核苷酸包括添加一种或多种具有亲和配体的三磷酸核苷,从而制造在珠粒上的亲和结合膜片。一些实施方案包括扩增靶核酸分子的方法。一些实施方案提供了一种扩增靶核酸分子的方法,其通过以下进行:将具有亲和结合的或杂交的克隆对象的珠粒的组合物或群体置于具有微孔的固体表面上,其中只有一个珠粒可以在空间上适配到一个微孔中;以及扩增微孔中的靶核酸分子,从而形成扩增子。在一些方面,所述方法还包括使用诸如边测序边合成、边测序边连接或边测序边杂交的方法对扩增的靶核酸分子进行测序,从而确定靶核酸分子的核酸序列。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,453,258中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括使用最小染料集、最小激发光源和最小光发射滤光器来确定序列,例如核酸序列,同时仍然允许在测序反应中区别所有四种核苷酸的掺入。另外或替代地,遗传生物标记物的检测可以包括用于确定多核苷酸的序列的方法,其包括:在测序反应中检测三种不同类型的可检测核苷酸缀合物掺入到多核苷酸中;以及基于三种不同类型的可检测核苷酸掺入到多核苷酸中的检测图案,确定第四种类型的核苷酸的掺入,从而确定多核苷酸的序列,其中从信号状态检测到三种不同类型的可检测核苷酸缀合物的掺入,并且其中从黑暗状态确定第四种类型的核苷酸的掺入。另外或替代地,遗传生物标记物的检测可以包括用于确定多核苷酸的序列的方法,其包括:向用于测序的多核苷酸样品施加包含四种修饰的核苷酸类型的溶液,其中三种修饰的核苷酸类型缀合到一个或多个检测部分和定位在核苷酸与一个或多个检测部分之间的一个或多个接头,并且其中第四种核苷酸类型缺乏检测部分,在测序反应中检测所述修饰的核苷酸的掺入图案,从而捕获第一可检测图案;向测序反应施加一种或多种组合物,从而改变第一可检测图案;检测第二可检测图案;以及基于可检测图案确定多核苷酸样品的序列。在一些实施方案中,用于测序的多核苷酸包含脱氧核糖核酸、修饰的脱氧核糖核酸、核糖核酸和修饰的核糖核酸中的一种或多种。在一些实施方案中,用于测序的多核苷酸是基因组DNA文库制备物。在一些实施方案中,核苷酸缀合物包含选自由以下组成的组的苷酸类型:dATP、dTTP、dUTP、dCTP、dGTP或其非天然核苷酸类似物。在一些实施方案中,非天然核苷酸类似物包含可逆终止子部分并且选自由以下组成的组:rbATP、rbTTP、rbCTP、rbUTP和rbGTP。在一些实施方案中,核苷酸掺入是边测序边合成、边测序边连接和边测序边杂交或其组合。在一些实施方案中,通过检测荧光部分来检测三种核苷酸类型的缀合物。在一些实施方案中,对于三种核苷酸缀合物,荧光部分是相同的,而在其他实施方案中,荧光部分是一个或多个不同的荧光部分。在一些实施方案中,一个或多个不同的荧光部分通过相同的发射滤光器来检测。在一些实施方案中,荧光部分包括荧光共振能量转移系统部分。在一些实施方案中,第四核苷酸的掺入通过缺乏检测来确定。在一些实施方案中,可检测的核酸缀合物通过荧光来检测。在一些实施方案中,通过第一成像事件和第二成像事件来检测荧光,在其他实施方案中,第一成像事件和第二成像事件在时间上是分开的。在一些实施方案中,第一成像事件检测到的荧光图案与第二成像事件检测到的荧光图案不同。在一些实施方案中,一个或多个核苷酸的掺入通过第一与第二成像事件之间的荧光图案的差异来确定。在一些实施方案中,一个或多个核苷酸类型的缀合物还包含一个或多个接头序列,在其他实施方案中,一个或多个接头序列包含可裂解接头和间隔子接头中的一种或多种。在一些实施方案中,可裂解接头包括一个或多个可裂解连接基团,其选自由以下组成的组:二硫化物、二醇、重氮、酯、砜、叠氮化物、烯丙基和甲硅烷基醚,而在优选实施方案中,可裂解连接基团是二硫化物。在一些实施方案中,间隔子接头是聚乙二醇或其多联体和2-{2-[3-(2-氨基-乙基羰基)-苯氧基]-1-叠氮基-乙氧基}-乙氧基-乙酸中的一种或多种。在一些实施方案中,一个或多个间隔子接头还包括一个或多个可裂解连接基团,其中所述可裂解连接基团选自由以下组成的组:二硫化物、二醇、重氮、酯、砜、叠氮化物、烯丙基和甲硅烷基醚。在一些实施方案中,间隔子接头是聚乙二醇或其多联体,而在其他实施方案中,间隔子接头是2-{2-[3-(2-氨基-乙基羰基)-苯氧基]-1-叠氮基-乙氧基}-乙氧基-乙酸。在一些实施方案中,一个或多个核苷酸缀合物包含聚乙二醇接头和2-{2-[3-(2-氨基-乙基羰基)-苯氧基]-1-叠氮基-乙氧基}-乙氧基-乙酸接头,其还可以或可以不包含半抗原和荧光部分。在一些实施方案中,半抗原选自由生物素、地高辛和二硝基苯酚组成的组。在一些实施方案中,一个或多个核苷酸缀合物包含链霉亲和素-荧光部分缀合物,而在其他实施方案中,一个或多个核苷酸缀合物包含选自由抗地高辛和抗二硝基苯酚组成的组的抗半抗原抗体-荧光部分缀合物。在一些实施方案中,包含聚乙二醇接头和2-{2-[3-(2-氨基-乙基羰基)-苯氧基]-1-叠氮基-乙氧基}-乙氧基-乙酸接头的核苷酸缀合物还包含两个荧光部分。在一些实施方案中,两个荧光部分构成荧光共振能量转移系统。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,441,267中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括确定靶序列中检测位置处的核苷酸的身份的方法。所述方法包括提供杂交复合物,所述杂交复合物包含靶序列和共价连接到底物表面上的微球的捕获探针。所述方法包括确定检测位置处的核苷酸。杂交复合物可以包含捕获探针、捕获辅助探针和靶序列。另外,靶序列可以包含外源衔接子序列。在另一方面,所述方法包括使微球与多个检测探针接触,每个检测探针包含在读出位置处的唯一核苷酸和唯一可检测标记。检测来自至少一个可检测标记的信号以鉴定检测位置处的核苷酸。在另一方面,检测探针不含检测标记,而是基于其特征质量例如通过质谱法进行鉴定。另外,检测探针包含基于其特征质量被检测的唯一标记。另外或替代地,遗传生物标记物的检测可以包括以下方法,其中靶序列包含直接邻近检测位置的5′的第一靶结构域。杂交复合物包含靶序列、捕获探针和与靶序列的第一靶结构域杂交的延伸引物。所述确定步骤包括在一定条件下使微球与聚合酶和各自包含共价连接的可检测标记的多个NTP接触,从而如果NTP之一与检测位置处的碱基进行碱基配对,则延伸引物通过酶延伸以掺入标记。如本领域技术人员已知的,dNTP和ddNTP是DNA聚合酶的优选底物。NTP是RNA聚合酶的优选底物。然后鉴定检测位置处的碱基。另外或替代地,遗传生物标记物的检测可以包括以下方法,其中靶序列包含直接邻近检测位置的5′的第一靶结构域,其中捕获探针充当延伸引物并且与靶序列的第一靶结构域杂交。所述确定步骤包括在一定条件下使微球与聚合酶和各自包含共价连接的可检测标记的多个NTP接触,从而如果NTP之一与检测位置处的碱基进行碱基配对,则延伸引物通过酶延伸以掺入标记。由此鉴定检测位置处的碱基。另外或替代地,遗传生物标记物的检测可以包括以下方法,其中靶序列包含(5′至3′)第一靶结构域和第二靶结构域,所述第一靶结构域包括在检测位置中包含至少一个核苷酸的重叠结构域,所述第二靶结构域与检测位置相邻。杂交复合物包含与第一靶结构域杂交的第一探针和与第二靶结构域杂交的第二探针。第二探针包含不与靶序列杂交的检测序列和可检测标记。如果第二探针包含与检测位置完全互补的碱基,则形成裂解结构。所述方法还包括使杂交复合物与使检测序列从信号传导探针裂解的裂解酶接触;以及然后与检测序列、共价连接到底物表面上的微球的捕获探针和至少一个标记形成测定复合物。由此鉴定检测位置处的碱基。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,060,431中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括阵列组合物,其包含具有包括离散位点的表面的底物。所述组合物还可以包含微球群,所述微球群至少包括第一亚群和第二亚群;每个亚群包含生物活性剂和标识符结合配体,所述标识符结合配体将结合解码器结合配体,使得可以阐明生物活性剂的身份。微球分布在表面上。一些实施方案提供了阵列组合物,其包含具有包括离散位点的表面的底物和至少包括第一亚群和第二亚群的微球群。每个亚群均包含生物活性剂,并且不包含光学签名。一些实施方案提供了制备如上所述的阵列组合物的方法。所述方法包括在底物上形成包括个体位点的表面;以及将微球分布在所述表面上,使得所述个体位点含有微球。微球至少包括第一亚群和第二亚群,每个亚群包含生物活性剂并且不包含光学签名。一些实施方案提供了制备组合物的方法,其包括:在底物上形成包括个体位点的表面;以及将微球分布在表面上,使得个体位点含有微球。微球至少包括第一亚群和第二亚群,每个亚群包含生物活性剂和标识符结合配体,所述标识符结合配体将结合解码器结合配体,使得可以阐明生物活性剂的鉴定。另外或替代地,遗传生物标记物的检测可以包括解码阵列组合物的方法,其包括:提供如上所述的阵列组合物;以及将多个解码结合配体添加到阵列组合物中,以鉴定至少多种生物活性剂的位置。另外或替代地,遗传生物标记物的检测可以包括确定样品中靶分析物的存在的方法。所述方法包括使样品与如上所述的阵列组合物接触;以及确定靶分析物的存在或不存在。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:提供包含微球群的阵列组合物,所述微球群至少包括第一亚群和第二亚群,其中每个亚群包含生物活性剂以及至少第一解码属性和第二解码属性;以及检测所述第一解码属性和第二解码属性中的每一个以鉴定所述生物活性剂中的每一个。另外或替代地,遗传生物标记物的检测可以包括一种增加在解码步骤中获得的信息的方法。所述方法包括使用简并探针作为DBL-IBL组合。另外或替代地,遗传生物标记物的检测可以包括在珠粒上使用多个解码属性。另外或替代地,遗传生物标记物的检测可以包括一种增加解码置信度的方法。所述方法包括使用解码作为质量控制措施。另外或替代地,遗传生物标记物的检测可以包括一种解码阵列组合物的方法,其包括:提供包含微球群的阵列组合物,所述微球群至少包括50个亚群,其中每个亚群包含生物活性剂;将多个解码结合配体添加到所述微球群中,以鉴定至少50种生物活性剂。另外或替代地,遗传生物标记物的检测可以包括一种确定样品中靶分析物的存在的方法,其包括:使所述样品与包含微球群的阵列组合物接触,所述微球群至少包括50个亚群,其中每个亚群包含生物活性剂;将多个解码结合配体添加到所述微球群中,以鉴定至少50种生物活性剂;以及确定所述靶分析物的存在或不存在。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,060,431中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于检测样品中的靶分析物的微流体装置。所述装置包括具有任何数量的模块的固体支撑物,所述模块包括样品进口端口和至少一个样品处理孔,所述样品处理孔包括孔进口端口和孔出口端口。所述装置通常还包括第一微通道,以允许样品入口端口与样品处理孔之间的流体接触。所述装置还包括检测模块,其包括具有包括离散位点的表面的底物和至少包括第一亚群和第二亚群的微球群,其中每个亚群包含生物活性剂。微球分布在所述表面上。所述检测模块还包括用于接收样品的检测入口端口。所述装置还包括第二微通道,以允许样品处理孔与检测入口端口之间的流体接触。另外或替代地,遗传生物标记物的检测可以包括在微流体装置中组装检测器的方法。所述方法包括提供一种微流体装置,其包括:第一微通道,以允许样品入口端口与样品处理孔之间的流体接触;第二微通道,以允许所述样品处理孔与检测入口端口之间的流体接触;以及检测模块,其包括具有包括离散位点的表面的底物。所述方法还包括使流体流过底物。所述流体包含至少包括第一亚群和第二亚群的微球群,其中每个亚群包含生物活性剂,因此珠粒流过离散位点并且随机沉积在离散位点中。所述方法另外包括使流体反向流动。另外或替代地,遗传生物标记物的检测可以包括在微流体装置中组装检测器的方法。所述方法包括提供一种微流体装置,其包括多个第一微通道以及在微通道中的微球群。所述装置还包括连接到所述微通道的接收腔室。所述方法还包括使所述微球体通过所述微通道流入所述接收腔室中。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,222,134中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于检测分子的方法、系统和组合物。具体地,用于检测固体支撑物上的多种类型的分子的方法、系统和组合物。一些实施方案涉及用于检测分子的方法。在一些实施方案中,此类方法包括以下步骤:(a)提供固体支撑物,其包含与固体支撑物上的位点缔和的分子,使得在检测步骤期间整体上检测所述分子,其中所述位点包含至少两种不同类型的分子;(b)检测对应于所述位点处的所述分子整体的信号;(c)估计所述位点处不同类型的分子的比例或者估计对应于所述位点处不同类型分子的信号量;(d)使用比例估计值来计算对应于所述位点处不同类型的分子的信号量,从而获得信号估计值,或者使用信号估计值来计算所述位点处不同类型的分子的比例,从而获得比例估计值;以及(e)迭代地更新比例估计值和信号估计值,直至估计值汇合为止,从而检测与所述位点缔和的分子。在上述方法的一些实施方案中,提供步骤还包括将分子的混合物提供到固体支撑物。在其他实施方案中,提供步骤还包括使分子与位点缔合。在再其他的实施方案中,提供步骤还包括将分子附接在所述位点处。在上述方法的一些实施方案中,通过猜测所述位点处不同类型的分子的比例或猜测对应于所述位点处不同类型的分子的信号量来进行估计步骤。在其他实施方案中,估计步骤包括进行主成分分析(PCA)。在上述方法的一些实施方案中,更新步骤包括进行数值优化算法。在一些此类方法中,数值优化算法是基于迭代映射搜索。在一些此类实施方案中,数值优化算法是基于Fienup迭代映射(Fienup′s iteration map)。在上述方法的一些实施方案中,获得一个或多个分子的序列数据。在一些此类方法中,序列数据是通过边测序边合成方法获得的。在某些实施方案中,边测序边合成方法包括焦磷酸测序方法。在上述方法的一些实施方案中,固体支撑物包括珠粒。在一些其他实施方案中,固体支撑物包括流通池。在上述方法的优选实施方案中,所述分子包含核酸。在一些此类方法中,核酸附接在所述位点处。在一些实施方案中,核酸包括核酸的第一亚群和核酸的第二亚群,其中第一亚群的核酸各自具有相同的靶区域,并且第二亚群的核酸各自具有作为靶区域的变体的相同区域。在一些实施方案中,第一亚群的核酸的靶区域的核苷酸序列具有至少1个核苷酸,其与第二亚群的核酸的靶区域的变体的核苷酸序列不同。在一些实施方案中,第一亚群的核酸的靶区域的核苷酸序列具有至少3个核苷酸,其与第二亚群的核酸的靶区域的变体的核苷酸序列不同。在一些实施方案中,第一亚群的核酸中的靶区域与第二亚群的核酸中的靶区域的变体之间的核苷酸序列差异包括选自由由以下组成的组的至少一种差异:突变、多态性、插入、缺失、取代、简单串联重复序列多态性和单核苷酸多态性(SNP)。在一些实施方案中,核酸包含来自多倍体生物的遗传基因座的等位基因。在一些其他实施方案中,核酸包括核酸的选择性剪接形式。在其他实施方案中,核酸包含来自二倍体生物的遗传基因座的等位基因。还描述了分子检测系统。分子检测系统可以包括固体支撑物,其包含与固体支撑物上的位点缔和的分子,使得整体上检测所述分子,其中所述分子包括至少两种不同类型的分子;和检测器,其被配置来检测与所述位点缔和相关的分子。在一些实施方案中,所述分子附接在所述位点处。在一个优选实施方案中,所述分子包含核酸。在分子检测系统的一些实施方案中,位点包含约2至约1011个分子、约2至约1010个分子、约2至约109个分子、约2至约108个分子、约2至约107个分子、约2至约106个分子、约2至约105个分子、约2至约104个分子。在一些实施方案中,所述分子与所述位点缔和。在其他实施方案中,所述分子附接在所述位点处。在一些实施方案中,所述分子包含核酸。上述分子检测系统的一些实施方案还可以包括流体处理系统,其被配置来将流体施加到所述位点。上述分子检测系统的其他实施方案还可以包括光源,其被配置来向所述位点提供激发光束。上述分子检测系统的一些实施方案还可以包括第一数据处理模块,其被配置来估计所述位点处不同类型的分子的比例或对应于所述位点处不同类型的分子的信号量。在一些实施方案中,第一数据处理模块还用于确定与估计值相关联的变化。在其他实施方案中,确定步骤使用单独的数据处理模块进行。在此类系统的一些实施方案中,所述系统还可以包括第二数据处理模块,其被配置来使用比例估计值来计算对应于所述位点处不同类型的分子的信号量,或者使用信号估计值来计算所述位点处不同类型的分子的比例。在此类系统的其他实施方案中,所述系统还可以包括第三数据处理模块,其被配置来迭代地更新比例估计值和信号估计值。在上述分子检测系统的一些实施方案中,所述系统被配置来鉴定核酸的靶区域的核苷酸序列。另外或替代地,遗传生物标记物的检测可以包括鉴定核酸的靶区域的方法。所述方法可以包括:(a)使核酸的第一亚群与固体支撑物上的位点缔和,其中第一亚群的核酸包含相同的靶区域;(b)使核酸的第二亚群与固体支撑物上的位点缔和,其中第二亚群的核酸包含相同的靶区域,所述靶区域是第一亚群的核酸的靶区域的变体;(c)检测对应于第一亚群核酸的靶区域的一个或多个核苷酸和第二亚群核酸的靶区域的变体的一个或多个核苷酸的信号;(d)估计与所述位点缔和的第一亚群核酸和第二亚群核酸的比例,或者估计对应于与所述位点缔和的第一亚群核酸和第二亚群核酸的信号量;(e)使用比例估计值来计算对应于与所述位点缔和的第一亚群核酸和第二亚群核酸的信号量,或者使用信号估计值来计算与所述位点缔和的第一亚群核酸和第二亚群核酸的比例;以及(f)迭代地更新比例估计值和信号估计值,直至估计值汇合为止,从而鉴定核酸的靶区域。在上述方法的一些实施方案中,步骤(a)包括将第一亚群核酸和第二亚群核酸附接到固体支撑物。在上述方法的一些实施方案中,步骤(d)包括进行主成分分析(PCA)。在上述方法的一些实施方案中,步骤(f)包括进行数值优化算法。在一些此类实施方案中,数值优化算法是基于迭代映射搜索。在一些其他实施方案中,数值优化算法是基于Fienup迭代映射。在上述方法的一些实施方案中,从第一亚群核酸和第二亚群核酸两者获得序列数据。在一些此类实施方案中,序列数据是通过边测序边合成方法获得的。在一些实施方案中,边测序边合成方法包括焦磷酸测序方法。另外或替代地,遗传生物标记物的检测可以包括用于鉴定生物签名的方法。所述方法可以包括以下步骤:(a)提供从多个受试者获得的样品,其中所述样品包含分子;(b)对来自样品的分子加标签,以鉴定每个样品所来源于的受试者;(c)使来自样品的分子与固体支撑物上的位点缔和,使得在检测步骤期间整体上检测所述分子,其中所述位点包含至少两种不同类型的分子;(d)通过以下方式获得与所述位点缔和的分子的生物签名:i)检测对应于所述位点处的所述分子整体的信号,ii)估计所述位点处不同类型的分子的比例或对应于所述位点处不同类型的分子的信号量,iii)使用比例估计值来计算对应于所述位点处不同类型的分子的信号量,或者使用信号估计值来计算所述位点处不同类型的分子的比例,并且iv)迭代地更新比例估计值和信号估计值,直至估计值汇合为止,从而获得所述位点处分子的生物签名;以及(e)将步骤(d)中获得的生物签名与参考生物签名进行比较,从而鉴定所述生物签名。在一个优选实施方案中,所述分子附接在所述位点处。在上述方法的优选实施方案中,所述分子包含核酸。在一些此类实施方案中,核酸包含来自病原体的标记物。在某些实施方案中,所述病原体包括选自由病毒、细菌和真核细胞组成的组的病原体。在一些实施方案中,真核细胞可以是癌细胞。在上述方法的一些实施方案中,样品包含异常细胞类型。在上述方法的一些实施方案中,样品从癌症患者获得。还描述了一种固体支撑物,其包含与固体支撑物上的位点缔和的核酸群体,使得整体上检测核酸群体的核酸,所述核酸群体包括第一亚群和第二亚群,其中第一亚群的核酸包含相同的靶区域,并且第二亚群的核酸包含作为靶区域的变体的相同区域。另外或替代地,遗传生物标记物的检测可以包括珠粒,其包含具有与其杂交的竞争分子的捕获核酸的第一亚群,以及包含允许互补分子的杂交的区域的捕获核酸的第二亚群。另外或替代地,遗传生物标记物的检测可以包括珠粒,其包含与包含简并标签的扩增核酸杂交的捕获核酸,所述简并标签与捕获核酸杂交。在一些实施方案中,所述珠粒存在于底物的通道中。在其他实施方案中,所述珠粒存在于多孔底物的孔中。在优选实施方案中,所述孔被配置来容纳具有与其杂交的扩增核酸的单个珠粒。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,163,283中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括包含多个核酸的组合物,每个核酸包含不变序列、可变序列和标记。另外或替代地,遗传生物标记物的检测可以包括一种用于解码阵列组合物的方法。所述方法包括提供阵列组合物,其包含具有包括离散位点的表面的底物和包括第一亚群和第二亚群的微球群,每个亚群包含标识符核酸序列,所述标识符核酸序列包含引物序列和解码器序列。所述方法还包括向阵列添加第一组组合解码探针,其包含引发序列、至少一个解码核苷酸和标记;以及检测标记的存在。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,045,796中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种检测给定基因组内所含的一个或若干个可分型基因座的方法,其中所述方法包括以下步骤:提供具有这种可分型基因座的基因组片段的扩增的代表性群体;在形成探针-片段杂交体的条件下,使所述基因组片段与具有对应于可分型基因座的序列的多个核酸探针接触;以及检测探针-片段杂交体的可分型基因座。在具体实施方案中,这些核酸探针的长度为至多125个核苷酸。然而,可以使用具有各种长度或序列中的任一种的探针,如下文更详细地列出的。另外或替代地,遗传生物标记物的检测可以包括一种检测基因组的可分型基因座的方法,其包括以下步骤:提供具有这种可分型基因座的基因组片段的扩增的代表性群体;在形成探针-片段杂交体的条件下,使所述基因组片段与具有对应于可分型基因座的序列的多个核酸探针接触;以及直接检测探针-片段杂交体的可分型基因座。另外或替代地,遗传生物标记物的检测可以包括一种检测基因组的可分型基因座的方法,其包括以下步骤:提供具有可分型基因座的基因组片段的扩增的代表性群体;在形成固定的探针-片段杂交体的条件下,使所述基因组片段与具有对应于可分型基因座的序列的多个固定的核酸探针接触;修饰固定的探针-片段杂交体;以及检测已经修饰的探针或片段,从而检测基因组的可分型基因座。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括以下步骤:(a)提供多个基因组片段,其中所述多个基因组片段具有至少100ug的具有至少1千兆碱基的复杂性的DNA;(b)使多个基因组片段与多个不同的固定核酸探针接触,其中至少500个不同的核酸探针与基因组片段杂交以形成探针-片段杂交体;以及(c)检测探针-片段杂交体的可分型基因座。另外或替代地,遗传生物标记物的检测可以包括一种方法,其还可以包括以下步骤:(a)提供多个基因组片段,其中所述多个基因组片段具有至少1ug/ul的具有至少1千兆碱基的复杂性的DNA的浓度;(b)使多个基因组片段与多个不同的固定核酸探针接触,其中至少500个不同的核酸探针与基因组片段杂交以形成探针-片段杂交体;以及(c)检测探针-片段杂交体的可分型基因座。另外或替代地,遗传生物标记物的检测可以包括一种扩增基因组DNA的方法,其包括以下步骤:提供分离的双链基因组DNA;通过使双链基因组DNA与切口剂接触来产生带切口的DNA;使此带切口的DNA与链置换聚合酶和多个引物接触,以扩增基因组DNA。另外或替代地,遗传生物标记物的检测可以包括一种用于检测基因组的可分型基因座的方法。所述方法包括以下步骤:(a)体外转录多个扩增的gDNA片段,从而获得基因组RNA(gRNA)片段;(b)将gRNA片段与具有对应于可分型基因座的序列的多个核酸探针杂交;以及(c)检测与探针杂交的gRNA片段的可分型基因座。另外或替代地,遗传生物标记物的检测可以包括一种产生基因组片段的复杂性降低的、基因座特异性的、扩增的代表性群体的方法。所述方法包括以下步骤:(a)用多个随机引物复制天然基因组,从而产生基因组片段的扩增的代表性群体;(b)用多个不同的基因座特异性引物复制基因组片段的扩增的代表性群体的亚群,从而产生基因组片段的基因座特异性的扩增的代表性群体;以及(c)分离所述亚群,从而产生基因组片段的复杂性降低的、基因座特异性的、扩增的代表性群体。另外或替代地,遗传生物标记物的检测可以包括一种用于在引物延伸测定中抑制探针的异位延伸的方法。所述方法包括以下步骤:(a)在形成探针-靶杂交体的条件下,使多个探针核酸与多个靶核酸接触;(b)在形成探针-异位延伸抑制剂杂交体的条件下,使多个探针核酸与异位延伸抑制剂接触;以及(c)与探针-异位延伸抑制剂杂交体中的探针相比,选择性修饰探针-靶杂交体中的探针。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:(a)在形成固定的探针-片段杂交体的条件下使多个基因组片段与多个不同的固定核酸探针接触;(b)在与基因组片段杂交的同时修饰固定的探针,从而形成修饰的固定的探针;(c)从所述探针-片段杂交体中去除所述基因组片段;以及(d)在去除基因组片段之后检测修饰的固定探针,从而检测基因组片段的可分型基因座。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括以下步骤:(a)代表性地扩增天然基因组,其中在等温条件下产生具有可分型基因座的基因组片段的扩增的代表性群体;(b)在形成探针-片段杂交体的条件下使所述基因组片段与具有对应于可分型基因座的序列的多个核酸探针接触;以及(c)检测探针-片段杂交体的可分型基因座。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,765,419中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于检测焦磷酸盐的方法和系统,其可以单独使用或与其他技术(诸如焦磷酸测序)结合使用。在一些实施方案中,此类方法和系统允许在背景减少的情况下检测焦磷酸盐。另外或替代地,遗传生物标记物的检测可以包括用于在背景减少的情况下对核酸进行焦磷酸测序的方法和系统。另外或替代地,遗传生物标记物的检测可以包括延迟焦磷酸盐检测的方法。所述方法可以包括以下步骤:提供焦磷酸盐螯合剂;在螯合剂的存在下生成焦磷酸盐,由此焦磷酸盐可逆地螯合;从螯合剂中释放焦磷酸盐;以及检测焦磷酸盐。另外或替代地,遗传生物标记物的检测可以包括用于对核酸进行测序的方法。所述方法可以包括以下步骤:在焦磷酸盐螯合剂和焦磷酸盐检测剂的存在下提供核苷酸或核苷酸类似物;在焦磷酸盐螯合剂的存在下将一个或多个核苷酸或核苷酸类似物掺入到多核苷酸中以延伸多核苷酸,从而生成螯合的焦磷酸盐;在焦磷酸盐检测剂的存在下去除未掺入的核苷酸或核苷酸类似物;在焦磷酸盐检测剂的存在下从螯合剂中释放焦磷酸盐;以及检测释放的焦磷酸盐,其中释放的焦磷酸盐指示一个或多个核苷酸或核苷酸类似物已经掺入到多核苷酸中。另外或替代地,遗传生物标记物的检测可以包括在对核酸分子进行测序期间调节游离焦磷酸盐的可用性的方法。这些方法可以包括以下步骤:将核苷酸或核苷酸类似物与核酸模板组合;在足以形成与全部或部分核酸模板互补的多核苷酸的条件下,将核酸模板和核苷酸或核苷酸类似物与聚合酶和焦磷酸盐螯合剂一起温育,其中温育期间生成的焦磷酸盐通过螯合剂可逆地螯合;从核酸模板去除未掺入到多核苷酸中的核苷酸或核苷酸类似物;以及通过提供释放试剂来从焦磷酸盐螯合剂中释放焦磷酸盐。另外或替代地,遗传生物标记物的检测可以包括包含具有在其上分布的多个位点的固体支撑物的阵列,其中所述位点的至少一部分包含模板核酸和能够可逆地螯合焦磷酸盐的焦磷酸盐螯合剂。在某些方面,所述位点包括孔。在某些方面,模板核酸附接到孔内的粒子或珠粒。在某些方面,所述孔还包含具有与其附接的焦磷酸盐检测剂的珠粒。在某些方面,焦磷酸盐螯合剂置于模板核酸与焦磷酸盐检测剂之间。在某些方面,焦磷酸盐检测剂包含ATP硫酸化酶和荧光素酶。在某些方面,所述孔还包含填装珠粒。在一些实施方案中,焦磷酸盐通过吸附螯合剂而可逆地螯合。在某些方面,螯合剂包括能够通过螯合、络合或吸附来螯合焦磷酸盐的阳离子剂。在某些方面,阳离子剂包括选自由以下组成的组的剂:金属、金属盐、金属氧化物或以下列出的其他剂。在某些方面,金属或金属氧化物包括Ti或TiO2。在其他方面,焦磷酸盐螯合剂包括羟基磷灰石。在其他方面,螯合剂包括铵或取代的铵盐,或含有此类基团的树脂或珠粒。在以上实施方案的某些方面,焦磷酸盐螯合剂包括粒子或珠粒。除了上述内容之外,在方法和阵列的一些实施方案中,可以通过向螯合剂提供释放试剂来从螯合剂中释放焦磷酸盐。在某些方面,释放试剂包括能够例如通过优先络合或螯合螯合剂的阳离子而从螯合剂中置换焦磷酸盐的阴离子。在某些方面,释放试剂包括选自由以下组成的组的剂:酸或酸的盐,诸如草酸、草酸盐、氨基磺酸、氨基磺酸盐、乙二胺四乙酸(EDTA)、乙二醇-双-β-氨基乙基醚N,N,N′,N′-四乙酸(EGTA)、柠檬酸、酒石酸、乙酸或其他羧酸或其盐。在其他方面,释放试剂包括磷酸盐。在其他方面,释放试剂包括双膦酸盐。在某些方面,释放试剂是酶ATP硫酸化酶。在此特定方面,ATP硫酸化酶在溶液中而不是结合到珠粒或其他表面。ATP硫酸化酶可以通过在腺苷磷酸硫酸(adenysine phosphosulfate,APS)的存在下将焦磷酸盐转化为ATP来从螯合剂中释放焦磷酸盐。通常,ATP对螯合剂的结合亲和力比焦磷酸盐低。在一些方面,阵列可以包含还包含聚合酶和核苷酸或核苷酸类似物的位点。在一些实施方案中,阵列还可以包含至少一个能够在位点的存在下产生电场的电极。另外或替代地,遗传生物标记物的检测可以包括制备阵列的方法。所述方法可以包括以下步骤:提供具有在其上分布的多个位点的固体支撑物;以及提供模板核酸和能够将焦磷酸盐可逆地螯合到所述位点的至少一部分的焦磷酸盐螯合剂。在某些方面,向多个位点提供模板核酸的步骤发生在提供焦磷酸盐螯合剂之前。在某些方面,向多个位点提供模板核酸的步骤发生在提供焦磷酸盐螯合剂之后。在某些方面,向多个位点提供模板核酸的步骤与提供焦磷酸盐螯合剂同时发生。在一些实施方案中,根据以上方法制造的阵列可以用于测序和/或焦磷酸盐螯合和释放过程。例如,在一些实施方案中,焦磷酸盐通过吸附螯合剂而可逆地螯合。在某些方面,螯合剂包括能够通过螯合、络合或吸附来螯合焦磷酸盐的阳离子剂。在某些方面,阳离子剂包括选自由以下组成的组的剂:金属、金属盐、金属氧化物或以下列出的其他剂。在某些方面,金属或金属氧化物包括Ti或TiO2。在其他方面,焦磷酸盐螯合剂包括羟基磷灰石。在其他方面,螯合剂包括铵或取代的铵盐,或含有此类基团的树脂或珠粒。在以上实施方案的某些方面,焦磷酸盐螯合剂包括粒子或珠粒。除了上述内容之外,在一些实施方案中,根据以上方法制造的阵列可以用于通过向螯合剂提供释放试剂来从螯合剂中释放焦磷酸盐的过程。在某些方面,释放试剂包括能够例如通过优先络合或螯合螯合剂的阳离子而从螯合剂中置换焦磷酸盐的阴离子。在某些方面,释放试剂包括选自由以下组成的组的剂:酸或酸的盐,诸如草酸、草酸盐、氨基磺酸、氨基磺酸盐、乙二胺四乙酸(EDTA)、乙二醇-双-β-氨基乙基醚N,N,N′,N′-四乙酸(EGTA)、柠檬酸、酒石酸、乙酸或其他羧酸或其盐。在其他方面,释放试剂包括磷酸盐。在其他方面,释放试剂包括双膦酸盐。在某些方面,释放试剂是酶ATP硫酸化酶。在此特定方面,ATP硫酸化酶在溶液中而不是结合到珠粒或其他表面。ATP硫酸化酶可以通过在腺苷磷酸硫酸(adenysine phosphosulfate,APS)的存在下将焦磷酸盐转化为ATP来从螯合剂中释放焦磷酸盐。通常,ATP对螯合剂的结合亲和力比焦磷酸盐低。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,741,630中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括检测生物样品中的靶分析物的方法,其包括:提供复合阵列,所述复合阵列包含具有表面的底物;在所述表面上的第一测定位置和第二测定位置,其中所述测定位置包含微球群,并且其中所述微球包含生物活性剂;将所述第一测定位置与所述第二测定位置分开的物理分区;在足以允许所述靶分析物结合所述生物活性剂的条件下,将所述生物样品添加到所述第一测定位置;检测所述生物活性剂与所述靶分析物的结合。在更具体的实施方案中,可以通过微球的光学签名的变化来检测生物活性剂与靶分析物的结合。靶分析物和生物活性剂可以包括例如核酸。在一些实施方案中,所述方法还可以包括检测第二生物样品中的靶分析物,其通过以下进行:将所述第二生物样品添加到所述第二测定位置,并且之后检测所述生物活性剂与所述靶分析物的结合。在某些方面,底物可以包括显微镜载玻片。另外的方法包括检测生物样品中的靶核酸,其中所述靶核酸包含在一个或多个预定位置处的一种或多种单核苷酸多态性(SNP),其包括:提供复合阵列,所述复合阵列包含具有表面的底物;微球群,其中所述微球连接到捕获探针,所述捕获探针被配置来在所述一个或多个预定位置处结合所述靶核酸;在所述表面上的第一测定位置和第二测定位置,其中所述测定位置包含所述微球群;将所述第一测定位置与所述第二测定位置分开的物理分区;在足以允许所述靶核酸结合所述捕获探针的条件下,将所述生物样品添加到所述第一测定位置;以及检测所述靶核酸与所述捕获探针的结合。另外或替代地,遗传生物标记物的检测可以包括阵列组合物,其包含刚性支撑物;至少具有包括离散位点的第一测定位置的模制层,其中模制层粘附到刚性支撑物;粘结剂层,所述粘结剂层将刚性支撑物粘附到模制层;以及至少包括第一亚群和第二亚群的微球群,其中第一亚群包含第一生物活性剂并且第二亚群包含第二生物活性剂,其中微球随机分布在位点上。另外或替代地,遗传生物标记物的检测可以包括一种用于制备至少含有第一测定位置的阵列组合物的方法,所述第一测定位置具有离散位点,所述方法包括以下步骤:使模板结构的表面与可模制材料接触,所述表面包括一组或多组突起;从模板结构的表面去除可模制材料,由此去除的可模制材料形成至少具有包括离散位点的第一测定位置的模制层;将模制层粘附到刚性支撑物;以及将微球随机分布在模制层上,使得个体离散位点包含微球,其中微球至少包括第一亚群和第二亚群,其中第一亚群包含第一生物活性剂并且第二亚群包含第二生物活性剂。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,901,897中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括复合阵列组合物,其包含第一底物,所述第一底物具有包括多个测定位置的表面,每个测定位置包括多个离散位点。所述底物还包括至少包括第一亚群和第二亚群的微球群,其中每个亚群包含生物活性剂。微球分布在测定位置中的每一个上。另外或替代地,遗传生物标记物的检测可以包括复合阵列组合物,其包含第一底物和第二底物,所述第一底物具有包括多个测定位置的表面,所述第二底物包括多个阵列位置,每个阵列位置包括离散位点。所述组合物还包含至少包括第一亚群和第二亚群的微球群,其中每个亚群包含生物活性剂。微球分布在阵列位置中的每一个上。另外或替代地,遗传生物标记物的检测可以包括解码阵列组合物的方法,其包括:提供如上所述的阵列组合物;以及将多个解码结合配体添加到复合阵列组合物中,以鉴定至少多种生物活性剂的位置。另外或替代地,遗传生物标记物的检测可以包括确定一种或多种样品中一种或多种靶分析物的存在的方法,其包括:使样品与组合物接触;以及确定所述靶分析物的存在或不存在。另外或替代地,遗传生物标记物的检测可以包括一种杂交腔室。所述杂交腔室包括基板和盖。密封剂定位在盖与基板之间,以提供气密密封。当使用两组分阵列系统时,所述腔室还包括在盖中的组分端口以固定阵列组分。也就是说,阵列组分通过盖上的端口插入。所述端口可以包括密封件,使得保持气密密封。所述腔室还可以包括夹具和对准销。另外或替代地,遗传生物标记物的检测可以包括一种杂交腔室,其中基板含有孔洞。孔洞可以呈微板阵列形式。在一个实施方案中,至少两个孔洞通过通道连接。在一个实施方案中,将柔性膜放置在基板上。当向所述膜施加压力,即真空时,在基板中的孔洞的位置处在膜中形成孔。所述设备还包括用于向所述膜递送真空或正压的气动装置。另外或替代地,遗传生物标记物的检测可以包括一种以阵列形式混合样品的方法。所述方法包括向所述膜提供真空,使得形成孔。然后向所述膜施加溶液,使得至少一个孔被液体填充。随后,间歇地向所述膜施加真空,这导致液体混合。另外或替代地,遗传生物标记物的检测可以包括一种设备,其包括杂交腔室和任何复合阵列组合物。另外或替代地,遗传生物标记物的检测可以包括在杂交腔室中解码阵列组合物的方法。另外或替代地,遗传生物标记物的检测可以包括在杂交腔室中进行确定一种或多种样品中一种或多种靶分析物的存在的方法。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,288,103中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种检测样品中的靶序列的方法,其包括:提供至少包含第一靶序列和第二靶序列的第一固体支撑物;使第一靶序列和第二靶序列分别与第一探针和第二探针接触以分别形成第一杂交复合物和第二杂交复合物,其中第一探针和第二探针中的每一个包含第一通用引发位点、与靶序列的至少一部分基本上互补的靶特异性结构域;去除未杂交的探针;使第一杂交复合物和第二杂交复合物与第一酶接触以形成修饰的第一探针和第二探针;使修饰的第一探针和第二探针分别至少与和通用引发位点杂交的第一引物、NTP和延伸酶接触,其中第一修饰的探针和第二修饰的探针进行扩增以分别形成第一扩增子和第二扩增子;以及检测扩增子。另外或替代地,遗传生物标记物的检测可以包括一种检测样品中的靶序列的方法,其包括:提供至少包含第一靶序列和第二靶序列的第一固体支撑物;使第一靶序列和第二靶序列分别与第一探针和第二探针接触以分别形成第一杂交复合物和第二杂交复合物,其中第一探针和第二探针中的每一个包含第一通用引发位点、与靶序列的至少一部分基本上互补的靶特异性结构域;去除未杂交的探针;使第一探针和第二探针接触至少与和通用引发位点杂交的第一通用引物、NTP和延伸酶接触,其中第一探针和第二探针进行延伸以分别形成第一修饰的探针和第二修饰的探针;使第一修饰的探针和第二修饰的探针分别至少与第三探针和第四探针以及第二酶接触,其中修饰的第一探针和第二探针包含检测位置,第三探针和第四探针各自包含探寻位置,其中如果探寻位置与检测位置处的碱基之间存在完全互补性,则第二种酶仅修饰第三探针和第四探针;形成第三修饰的探针和第四修饰的探针;以及检测第三修饰的探针和第四修饰的探针。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:提供多个靶核酸序列,每个靶核酸序列从3′至5′包含第一靶结构域、第二靶结构域和第三靶结构域,所述第一靶结构域包含检测位置,所述第二靶结构域是至少一个核苷酸;使靶核酸序列与每个靶序列的各组探针接触以形成一组第一杂交复合物,每组包含第一探针、第二探针,所述第一探针从5′至3′包含含有第一通用引发序列的第一结构域和包含与靶序列的第一靶结构域基本上互补的序列的第二结构域以及在3′四个末端碱基内的探寻位置,所述第二探针包含含有与靶序列的第三靶结构域基本上互补的序列的第一结构域;在一定条件下使第一杂交复合物与延伸酶和dNTP接触,从而如果探寻位置处的碱基与检测位置处的碱基完全互补,则第一探针延伸通过第二靶结构域以形成第二杂交复合物;使第二杂交复合物与连接酶接触以将延伸的第一探针连接到第二探针,以形成扩增模板。另外或替代地,遗传生物标记物的检测可以包括一种多重反应方法,其包括:提供至少包含第一靶和第二靶的样品;使第一靶和第二靶分别与第一探针和第二探针杂交,从而分别形成第一杂交复合物和第二杂交复合物;将第一杂交复合物和第二杂交复合物固定;洗涤以去除未杂交的核酸;使第一杂交复合物和第二杂交复合物与酶接触,由此第一探针和第二探针被修饰,从而分别形成修饰的第一探针和第二探针,由此修饰的第一探针和第二探针被修饰以含有分别与第一靶和第二靶中的第一检测核苷酸和第二检测核苷酸互补的第一探寻核苷酸和第二探寻核苷酸;使修饰的第一探针和第二探针分别与第一等位基因特异性引物和第二等位基因特异性引物、dNTP、聚合酶接触,由此第一等位基因特异性引物和第二等位基因特异性引物分别与修饰的第一探针和第二探针的5′处的第一探寻核苷酸和第二探寻核苷酸杂交,由此当等位基因特异性引物的靶结构域与修饰的靶探针完全互补时,第一等位基因特异性引物和第二等位基因特异性引物被修饰以形成修饰的第一等位基因特异性探针和第二等位基因特异性探针;扩增修饰的第一等位基因特异性探针和第二等位基因特异性探针以形成第一扩增子和第二扩增子;以及检测第一扩增子和第二扩增子。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:提供多个靶核酸序列,每个靶核酸序列从3′至5′包含第一靶结构域、第二靶结构域和第三靶结构域,所述第一靶结构域包含检测位置,所述第二靶结构域是至少一个核苷酸;使靶核酸序列与每个靶序列的各组探针接触以形成一组第一杂交复合物,每组包含:第一探针、第二探针,所述第一探针从5′至3′包含含有第一通用引发序列的第一结构域和包含与靶序列的第一靶结构域基本上互补的序列的第二结构域以及在3′四个末端碱基内的探寻位置,所述第二探针包含含有与靶序列的第三靶结构域基本上互补的序列的第一结构域;在一定条件下使第一杂交复合物至少与和第一通用引发序列杂交的第一通用引物、延伸酶和dNTP接触,从而如果探寻位置处的碱基与检测位置处的碱基完全互补,则第一探针延伸通过第二靶结构域形成以第二杂交复合物;使第二杂交复合物与连接酶接触以将延伸的第一探针连接到第二探针,以形成扩增模板。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,899,626中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种测量DNA的甲基化水平的方法。所述方法可以包括以下步骤:提供代表DNA的甲基化测量值的标准偏差的数据;确定样品DNA中至少一个基因座的甲基化水平;以及将所述至少一个基因座的甲基化水平与数据进行比较以确定测量值的标准偏差。另外或替代地,遗传生物标记物的检测可以包括一种比较DNA样品的甲基化水平的方法。所述方法可以包括以下步骤:提供代表DNA的甲基化测量值的标准偏差的数据;确定第一样品DNA中至少一个基因座的甲基化水平;确定第二样品DNA中至少一个基因座的甲基化水平;鉴定第一样品DNA和第二样品DNA中至少一个基因座的甲基化水平相对于所述数据的标准偏差;以及基于标准偏差确定第一样品DNA和第二样品DNA中至少一个基因座的甲基化水平是相同的或不同的。另外或替代地,遗传生物标记物的检测可以包括一种DNA甲基化水平检测系统,其包括:扫描仪,所述扫描仪用于读取样品DNA中多个基因座的甲基化水平;和第一模块,所述第一模块被配置来将甲基化水平与代表DNA的甲基化测量值的标准偏差的数据进行比较。一些实施方案涉及一种测量DNA的甲基化水平的方法,其包括:提供代表DNA的甲基化测量值的标准偏差的数据;确定样品DNA中至少一个基因座的甲基化水平;以及将所述至少一个基因座的甲基化水平与所述数据进行比较以确定所述测量值的标准偏差。在一些实施方案中,至少一个基因座包括多个基因座。在一些实施方案中,使用阵列确定甲基化水平。在一些实施方案中,多个基因座包括在所述阵列上同时测量的至少100个基因座。在一些实施方案中,数据将甲基化水平的标准偏差作为甲基化水平的函数相关。在一些实施方案中,数据包括针对不同甲基化水平的不同标准偏差值。在一些实施方案中,数据包括当与所述不同的甲基化水平相关时沿抛物线出现的所述不同的标准偏差值。在一些实施方案中,通过以下来产生数据:创建包括具有不同甲基化水平的DNA的混合物的训练集,其中所述训练集包括所述混合物的重复样品;确定所述训练集的所述混合物中至少一个基因座的甲基化水平;确定针对所述训练集的所述重复样品确定的所述甲基化水平的标准偏差值;以及将所述标准偏差值与针对所述训练集确定的所述甲基化水平相关。在一些实施方案中,训练集的混合物包含不同比率的来自具有高度甲基化DNA的细胞群和具有最低甲基化DNA的细胞群的基因组DNA。在一些实施方案中,所述训练集的混合物的甲基化水平在0至1之间变化。一些实施方案还包括:鉴定0至1的至少三个区域;确定所述区域中的每一个的甲基化水平的中值;以及将抛物线拟合到所述区域中的每一个的所述中值。在一些实施方案中,标准偏差值包括第95百分数标准偏差值。一些实施方案还包括以下步骤:确定第二样品DNA中所述至少一个基因座的甲基化水平;鉴定所述第一样品DNA和所述第二样品DNA中所述至少一个基因座的所述甲基化水平相对于所述数据的标准偏差;以及基于所述标准偏差确定所述第一样品DNA和所述第二样品DNA中所述至少一个基因座的所述甲基化水平是相同的或不同的。一些实施方案涉及一种DNA甲基化水平检测系统,其包括:扫描仪,所述扫描仪用于读取样品DNA中多个基因座的甲基化水平;和第一模块,所述第一模块被配置来将所述甲基化水平与代表DNA的甲基化测量值的标准偏差的数据进行比较。在一些实施方案中,使用阵列确定甲基化水平。在一些实施方案中,多个基因座包括在所述阵列上同时测量的至少100个基因座。在一些实施方案中,数据将甲基化水平的标准偏差作为甲基化水平的函数相关。在一些实施方案中,数据包括针对不同甲基化水平的不同标准偏差值。在一些实施方案中,数据包括当与所述不同的甲基化水平相关时沿抛物线出现的所述不同的标准偏差值。在一些实施方案中,通过以下来产生数据:创建包括具有不同甲基化水平的DNA的混合物的训练集,其中所述训练集包括所述混合物的重复样品;确定所述训练集的所述混合物中至少一个基因座的甲基化水平;确定针对所述训练集的所述重复样品确定的所述甲基化水平的标准偏差值;以及将所述标准偏差值与针对所述训练集确定的所述甲基化水平相关。一些实施方案涉及一种比较DNA样品的甲基化水平的方法,其包括:提供代表DNA的甲基化测量值的标准偏差的数据;确定第一样品DNA中至少一个基因座的甲基化水平;确定第二样品DNA中所述至少一个基因座的甲基化水平;鉴定所述第一样品DNA和所述第二样品DNA中所述至少一个基因座的所述甲基化水平相对于所述数据的标准偏差;以及基于所述标准偏差确定所述第一样品DNA和所述第二样品DNA中所述至少一个基因座的所述甲基化水平是相同的或不同的。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,776,531中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种探针组合物,其包含:(a)底物;(b)附接到所述底物的探针分子;以及(c)所述底物上的稳定化聚合物层,其中所述稳定化聚合物层涂覆探针分子。另外或替代地,遗传生物标记物的检测可以包括一种制备探针组合物的方法。所述方法包括以下步骤:(a)提供具有附接的生物聚合物探针的底物;和(b)使所述底物与稳定化聚合物接触。另外或替代地,遗传生物标记物的检测可以包括一种运送固相探针的方法。所述方法包括以下步骤:(a)提供具有附接的探针分子并且还具有稳定化聚合物层的底物;(b)将所述底物放在包装中;以及(c)将所述包装运送到远程位置。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,499,806中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括阵列组合物,其包含具有包括离散位点的表面的底物、至少一个基准以及至少包括第一亚群和第二亚群的微球群每个亚群包含生物活性剂,并且微球分布在所述表面上。每个亚群可以任选地包含唯一光学签名、标识符结合配体(其结合解码器结合配体,使得可以阐明生物活性剂的鉴定)或两者。另外或替代地,遗传生物标记物的检测可以包括组合物,其包含计算机可读存储器,以指导计算机以指定方式起作用。计算机可读存储器包括:获取模块,用于接收包括多个离散位点的随机阵列的数据图像;配准模块,用于配准数据图像;和比较模块,用于比较配准的数据图像。每个模块包括用于执行其功能的计算机代码。当底物包括光纤束、基准微球或由随机阵列生成的基准模板时,配准模块可以利用任何数量的基准,包括基准纤维。另外或替代地,遗传生物标记物的检测可以包括制备阵列组合物的方法,其包括:在底物上形成包含个体位点的表面;将微球分布在所述表面上,使得个体位点含有微球;以及将至少一个基准掺入到所述表面上。当阵列具有完全旋转自由度时,在阵列中优选至少两个基准以允许校正旋转。另外或替代地,遗传生物标记物的检测可以包括用于比较随机阵列的单独数据图像的方法。所述方法包括:使用计算机系统来配准随机阵列的第一数据图像以产生配准的第一数据图像;使用计算机系统来配准随机阵列的第二数据图像以产生配准的第二数据图像;以及比较第一和第二配准的数据图像,以确定它们之间的任何差异。另外或替代地,遗传生物标记物的检测可以包括解码随机阵列组合物的方法,其包括提供随机阵列组合物。将多个第一解码结合配体添加到阵列组合物中,并且创建第一数据图像。使用基准来生成第一配准的数据图像。将多个第二解码结合配体添加到阵列组合物中,并且创建第二数据图像。使用基准来生成第二配准的数据图像。使用计算机系统来比较第一和第二配准的数据图像,以鉴定至少两种生物活性剂的位置。另外或替代地,遗传生物标记物的检测可以包括确定样品中靶分析物的存在的方法。所述方法包括:获取随机阵列组合物的第一数据图像;和将第一数据图像配准以创建配准的第一数据图像。然后将样品添加到随机阵列中,并且从阵列获取第二数据图像。配准第二数据图像以创建配准的第二数据图像。然后将第一和第二配准的数据图像进行比较以确定靶分析物的存在或不存在。任选地,数据获取可以在不同的波长下进行。另外或替代地,遗传生物标记物的检测可以包括用于预处理或预过滤信号数据的方法,其包括:从阵列获取数据图像;以及确定来自至少一个阵列位点的第一信号与参考信号的相似性,以确定所述位点是否包含候选珠粒。另外或替代地,遗传生物标记物的检测可以包括用于配准微球阵列的分析图像的方法,其包括提供杂交强度图像。在解码微球阵列之后,基于从解码步骤获得的生物活性剂在微球上的已知位置来计算配准网格。将样品添加到微球阵列中,并且从阵列获取杂交强度图像。将亮珠粒类型分布在整个阵列中以充当基准。将配准网格重叠到图像上,并且然后对齐配准网格,使得确定阵列内每种珠粒类型在每个网格位置处的信号强度的身份。一旦获得了正确的网格位置,就为每个核心分配编号,使得可以为后续的顺序图像正确地放置网格。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,942,968中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种组合物,其包含具有包括离散位点的表面的底物、表面上的反射涂层以及分布在底物上的微球群。微球至少包括第一亚群和第二亚群。通常,至少一个亚群包含生物活性剂。另外或替代地,遗传生物标记物的检测可以包括一种组合物,其中底物包括第一表面和第二表面,其中第一表面包括离散位点,并且反射涂层在第二表面上。微球群分布在第一表面上。另外或替代地,遗传生物标记物的检测可以包括一种制备反射阵列的方法。所述方法包括提供具有包括离散位点的表面的底物,在表面上施加反射材料的涂层以及将微球分布在表面上。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中底物包括第一表面和第二表面,其中第一表面包括离散位点,反射材料在第二表面上并且微球分布在第一表面上。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:提供包括近端和远端的预成形的一体式光纤束,所述远端包括多个包含微球群的离散位点,所述群至少包括第一亚群和第二亚群;从远端对光纤束进行成像。可以将反射涂层施加到光纤束的远端或近端。另外或替代地,遗传生物标记物的检测可以包括一种阵列组合物,其包含具有包括离散位点的表面的底物,所述离散位点包括其他形状的孔。所述孔可以具有形状为正方形、六边形、星形、三角形、五边形或八边形的横截面。另外或替代地,遗传生物标记物的检测可以包括以下方法:提供具有多个离散位点的底物,所述位点包括其他形状的孔和微球群,所述群至少包括第一亚群和第二亚群;以及对底物进行成像。另外或替代地,遗传生物标记物的检测可以包括一种阵列组合物,其包含具有包括离散位点的表面的底物和分布在底物上的微球群,其中所述微球包含生物活性剂和信号转导器元件。另外或替代地,遗传生物标记物的检测可以包括检测样品中未标记的靶分析物的方法,其包括提供具有多个离散位点的底物,在所述位点上分布包含生物活性剂和信号转导器元件的微球群,使底物与样品接触,从而在靶分析物与生物活性剂结合时,来自信号转导器元件的信号发生改变,作为存在靶分析物的指示。另外或替代地,遗传生物标记物的检测可以包括一种检测样品中的手性分子的方法,其包括:提供具有表面的底物,所述表面包括至少第一离散位点和第二离散位点、分别附接到第一离散位点和第二离散位点的至少第一生物活性剂和第二生物活性剂;使所述底物与样品接触;用偏振光照射所述底物;以及在第一离散位点和第二离散位点中的至少一者中检测光的旋转,作为存在手性分子的指示。另外或替代地,遗传生物标记物的检测可以包括一种确定阵列中的微球的位置的方法,其包括:提供具有至少包括第一离散位点和第二离散位点的第一表面的底物,其中第一离散位点包含微球,但是第二离散位点不包含微球;照射所述底物;以及检测所述底物的光照,由此相对于第二离散位点在第一离散位点处减少的光照提供在第一离散位点中存在第一微球的指示。另外或替代地,遗传生物标记物的检测可以包括一种增加来自阵列的信号输出的方法,其包括:提供具有表面的底物,所述表面包括至少第一离散位点和第二离散位点以及分别附接到第一离散位点和第二离散位点的至少第一标记和第二标记;将底物至少冷却至低于室温;以及检测来自第一标记和第二标记的信号,由此所述信号相对于从未冷却的底物获得的信号增加。另外或替代地,遗传生物标记物的检测可以包括一种用于在阵列中减去背景信号的方法,其包括:提供具有表面的底物,所述表面包括至少第一离散位点和第二离散位点以及分别附接到第一离散位点和第二离散位点的至少第一标记和第二标记;在多个不同的发射中检测来自第一离散位点和第二离散位点的信号;以及从来自第一离散位点和第二离散位点的其余信号中分别减去来自第一离散位点和第二离散位点中的每一个的最低信号。另外或替代地,遗传生物标记物的检测可以包括一种校正图像非均匀性的方法,其包括:提供具有表面的底物,所述表面包括至少第一离散位点和第二离散位点、分别附接到第一离散位点和第二离散位点的至少第一标记和第二标记以及已知信号强度的至少第一内部参考点;检测分别来自第一标记和第二标记的第一信号和第二信号;检测来自内部参考点的信号;以及确定来自内部参考点的信号与内部参考点的已知信号强度之间的变化,作为所述图像非均匀性的指示。另外或替代地,遗传生物标记物的检测可以包括一种检测样品中的靶分析物的方法,其包括提供阵列,所述阵列包含具有包括离散位点的表面的底物、所述表面上的反射涂层以及分布在底物上的微球群。微球至少包括第一亚群和第二亚群,每个亚群包含不同的生物活性剂。所述方法还包括使阵列与样品接触,使得靶分析物与生物活性剂中的至少一种结合,并且检测靶分析物的存在。在优选实施方案中,所述靶分析物是加标记的。另外或替代地,遗传生物标记物的检测可以包括一种检测样品中的靶分析物的方法,其包括提供阵列,所述阵列包含具有包括离散位点的表面的底物,包含其他形状的孔以及分布在底物上的微球群。微球至少包括第一亚群和第二亚群,每个亚群包含不同的生物活性剂。所述方法还包括使阵列与样品接触,使得靶分析物与生物活性剂中的至少一种结合,并且检测靶分析物的存在。另外或替代地,遗传生物标记物的检测可以包括一种检测样品中的靶分析物的方法,其包括:提供具有表面的底物,所述表面包括至少第一离散位点和第二离散位点和分布在所述底物上的微球群,其中所述微球至少包括第一亚群和第二亚群,每个亚群包含不同的生物活性剂;使底物与样品接触,使得靶分析物结合生物活性剂中的至少一种。在一些实施方案中,所述方法包括将底物冷却至至少低于室温;以及检测信号,由此所述信号相对于从未冷却的底物获得的信号增加。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,890,764中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括组合物,其包含具有包括离散位点的表面的底物和分布在位点上的微球群。微球中的至少一个包含纳米晶体。纳米晶体可以例如使用溶胶-凝胶聚合法来包埋在微球中,或者它可以附接大微球。微球任选地包含生物活性剂和/或标识符结合配体。在另一方面,微球群至少包括第一亚群和第二亚群,其分别包含第一生物活性剂和第二生物活性剂以及分别能够鉴定每种生物活性剂的第一光学签名和第二光学签名。光学签名中的至少一个包含纳米晶体。另外或替代地,遗传生物标记物的检测可以包括制备组合物的方法,其包括:在底物上形成包括个体位点的表面;以及将微球分布在表面上,使得个体位点含有微球。所述微球包含光学签名,并且至少一个光学签名包含至少一个纳米晶体。另外或替代地,遗传生物标记物的检测可以包括一种确定样品中靶分析物的存在的方法,其包括使样品与组合物接触。所述组合物包含具有包括离散位点的表面的底物和至少包括第一亚群和第二亚群的微球群,每个亚群包含生物活性剂和能够鉴定生物活性剂的光学签名。所述微球分布在表面上,使得离散位点含有微球,并且其中光学签名中的至少一个包含至少一个纳米晶体。然后确定靶分析物的存在或不存在。另外或替代地,遗传生物标记物的检测可以包括以下方法:制备包含将纳米晶体粘附到多孔二氧化硅的组合物;以及使用溶胶-凝胶聚合法密封二氧化硅的孔。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0201992中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于使用唯一分子索引(UMI)确定核酸片段序列的方法、设备、系统和计算机程序产品。在一些实施方式中,UMI包括非随机UMI(NRUMI)或可变长度的非随机唯一分子索引(vNRUMI)。另外或替代地,遗传生物标记物的检测可以包括用于对来自样品的核酸分子进行测序的方法。所述方法包括:(a)将衔接子施加到样品中的DNA片段以获得DNA-衔接子产物,其中每个衔接子包含非随机唯一分子索引,并且其中衔接子的非随机唯一分子索引具有至少两种不同的分子长度并且形成一组可变长度的非随机唯一分子索引(vNRUMI);(b)扩增DNA-衔接子产物以获得多个扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得与所述组的vNRUMI相关联的多个读长;(d)在多个读长中鉴定与相同的可变长度的非随机唯一分子索引(vNRUMI)相关联的读长;以及(e)使用与相同vNRUMI相关联的读长确定样品中DNA片段的序列。在一些实施方式中,鉴定与相同vNRUMI相关联的读长包括针对多个读长中的每个读长获得关于所述组的vNRUMI的比对得分,每个比对得分指示读长的子序列与vNRUMI之间的相似性,其中所述子序列在来源于vNRUMI的核苷酸可能位于的读长区域中。在一些实施方式中,比对得分基于读长的子序列与vNRUMI之间的核苷酸匹配和核苷酸编辑。在一些实施方式中,核苷酸编辑包括核苷酸的取代、添加和缺失。在一些实施方式中,每个比对得分在序列开始时对错配进行罚分,但在序列结束时不对错配进行罚分。在一些实施方式中,获得读长与vNRUMI之间的比对得分包括:(a)计算vNRUMI与读长的子序列的所有可能的前缀序列中的每一个之间的比对得分;(b)计算读长的子序列与vNRUMI的所有可能的前缀序列中的每一个之间的比对得分;以及(c)获得在(a)和(b)中计算的比对得分中最大的比对得分作为读长与vNRUMI之间的比对得分。在一些实施方式中,子序列的长度等于所述组的vNRUMI中的最长vNRUMI的长度。在一些实施方式中,在(d)中鉴定与相同vNRUMI相关联的读长还包括:基于比对得分,针对多个读长中的每个读长从所述组的vNRUMI中选择至少一个vNRUMI;以及将多个读长中的每个读长与针对所述读长选择的至少一个vNRUMI相关联。在一些实施方式中,从所述组的vNRUMI中选择至少一个vNRUMI包括在所述组的vNRUMI中选择具有最高比对得分的vNRUMI。在一些实施方式中,至少一个vNRUMI包括两个或更多个vNRUMI。在一些实施方式中,所述方法还包括选择两个或更多个vNRUMI之一作为(d)和(e)的相同vNRUMI。在一些实施方式中,通过以下获得在(a)中施加的衔接子:(i)提供一组具有至少两种不同分子长度的寡核苷酸序列;(ii)从所述组的寡核苷酸序列中选择寡核苷酸序列的子集,所述寡核苷酸序列的子集的寡核苷酸序列之间的所有编辑距离均满足阈值,所述寡核苷酸序列的子集形成所述组的vNRUMI;以及(iii)合成衔接子,每个衔接子包含双链杂交区、单链5′臂、单链3′臂和所述组的vNRUMI中的至少一个vNRUMI。在一些实施方式中,阈值是3。在一些实施方式中,所述组的vNRUMI包括6个核苷酸的vNRUMI和7个核苷酸的vNRUMI。在一些实施方式中,(e)的确定包括将与相同vNRUMI相关联的读长折叠成组,以获得样品中DNA片段的序列的共有核苷酸序列。在一些实施方案中,部分基于读长的质量得分获得共有核苷酸序列。在一些实施方案中,(e)的确定包括:在与相同vNRUMI相关联的读长中,鉴定参考序列中具有相同读长位置或相似读长位置的读长;以及使用(i)与相同vNRUMI相关联并且(ii)在参考序列中具有相同读长位置或相似读长位置的读长确定DNA片段的序列。在一些实施方式中,所述组的vNRUMI包括不超过约10,000个不同的vNRUMI。在一些实施方式中,所述组的vNRUMI包括不超过约1,000个不同的vNRUMI。在一些实施方式中,所述组的vNRUMI包括不超过约200个不同的vNRUMI。在一些实施方式中,将衔接子施加到样品中的DNA片段包括将衔接子施加到样品中的DNA片段的两端。另外或替代地,遗传生物标记物的检测可以包括用于制备测序衔接子的方法,所述方法包括:(a)提供一组具有至少两种不同分子长度的寡核苷酸序列;(b)从所述组的寡核苷酸序列中选择寡核苷酸序列的子集,所述寡核苷酸序列的子集的寡核苷酸序列之间的所有编辑距离均满足阈值,所述寡核苷酸序列的子集形成一组的可变长度的非随机唯一分子索引(vNRUMI);以及(c)合成多个测序衔接子,每个测序衔接子包含双链杂交区、单链5′臂、单链3′臂和所述组的vNRUMI中的至少一个vNRUMI。在一些实施方式中,(b)包括:(i)从所述组的寡核苷酸序列中选择寡核苷酸序列;(ii)将所选的寡核苷酸添加到扩展组的寡核苷酸序列中,并且从所述组的寡核苷酸序列中去除所选的寡核苷酸以获得简化组的寡核苷酸序列;(iii)从所述简化组中选择使距离函数最大化的即时寡核苷酸序列,其中距离函数是即时寡核苷酸序列与扩展组中的任何寡核苷酸序列之间的最小编辑距离,并且其中距离函数满足阈值;(iv)将即时寡核苷酸添加到扩展组中,并且从简化组中去除即时寡核苷酸;(v)重复(iii)和(iv)一次或多次;以及(vi)提供扩展组作为形成所述组的vNRUMI的寡核苷酸序列的子集。另外或替代地,遗传生物标记物的检测可以包括一种用于对来自样品的核酸分子进行测序的方法,其包括:(a)将衔接子施加到样品中的DNA片段以获得DNA-衔接子产物,其中每个衔接子包含非随机唯一分子索引,并且其中衔接子的非随机唯一分子索引具有至少两种不同的分子长度并且形成一组可变长度的非随机唯一分子索引(vNRUMI);(b)扩增DNA-衔接子产物以获得多个扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得与所述组的vNRUMI相关联的多个读长;以及(d)在多个读长中鉴定与相同的可变长度的非随机唯一分子索引(vNRUMI)相关联的读长。另外或替代地,遗传生物标记物的检测可以包括一种用于对来自样品的核酸分子进行测序的方法,其包括:(a)将衔接子施加到样品中的DNA片段以获得DNA-衔接子产物,其中每个衔接子包含唯一分子索引(UMI),并且其中衔接子的唯一分子索引(UMI)具有至少两种不同的分子长度并且形成一组可变长度的唯一分子索引(vUMI);(b)扩增DNA-衔接子产物以获得多个扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得与所述组的vUMI相关联的多个读长;以及(d)在多个读长中鉴定与相同的可变长度的唯一分子索引(vUMI)相关联的读长。另外或替代地,遗传生物标记物的检测可以包括一种对来自样品的核酸分子进行测序的方法,其包括:(a)将衔接子施加到样品中的DNA片段以获得DNA-衔接子产物,其中每个衔接子包含一组唯一分子索引(UMI)中的唯一分子索引(UMI);(b)扩增DNA-衔接子产物以获得多个扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得与所述组的UMI相关联的多个读长;(d)针对多个读长中的每个读长获得关于所述组的UMI的比对得分,每个比对得分指示读长的子序列与UMI之间的相似性;(e)使用比对得分在多个读长中鉴定与相同UMI相关联的读长;以及(e)使用与相同UMI相关联的读长确定样品中DNA片段的序列。另外或替代地,遗传生物标记物的检测可以包括一种用于确定实施所述方法的DNA片段序列的系统、设备和计算机程序产品。另外或替代地,遗传生物标记物的检测可以包括一种计算机程序产品,其包括存储程序代码的非暂时性机器可读介质,所述程序代码在由计算机系统的一个或多个处理器执行时致使计算机系统实施用于使用唯一分子索引(UMI)确定样品中所关注的序列的序列信息。程序代码包括执行以上方法的指令。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0201974中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于DNA的靶向扩增和样品鉴定的方法和组合物。另外或替代地,遗传生物标记物的检测可以包括用于从生物样品获得核酸序列信息的方法,其包括:(a)提供包含不同靶核酸的生物样品;(b)使生物样品与多个不同的探针组接触以形成具有不同靶核酸的杂交复合物;(c)扩增来自生物样品的核酸以产生扩增子;其中在接触步骤(b)之前不纯化来自生物样品的核酸;以及(d)获得扩增样品的多个部分的核酸序列信息。另外或替代地,遗传生物标记物的检测可以包括一种从FFPE样品获得核酸序列信息的方法,其包括:(a)提供包埋在保存的组织内的包含不同靶核酸的FFPE样品;(b)使FFPE样品与多个不同的探针组接触以形成具有不同靶核酸的杂交复合物;(c)扩增来自FFPE样品的核酸以产生扩增子;其中在接触步骤(b)之前不纯化来自FFPE样品的核酸;以及(d)获得多个扩增子的核酸序列信息。在具体实施方案中,在步骤(c)中的扩增之前,不纯化来自FFPE样品的核酸。另外或替代地,遗传生物标记物的检测可以包括用于扩增来自FFPE样品的核酸的方法,其包括:(a)提供包埋在保存的组织内的包含核酸的FFPE样品,所述核酸从3′至5′具有:相邻的第一、第二和第三靶结构域;(b)使FFPE样品与多个不同的探针组接触以形成具有不同靶核酸的杂交复合物,其中每个探针组包括:(i)第一探针,其从5′至3′包含:第一引发序列和与第一靶结构域基本上互补的序列;和(ii)第二探针,其从5′至3′包含:与第三靶结构域基本上互补的序列和第二引发序列;(c)使杂交复合物与延伸酶和核苷酸接触,其中第一探针沿(b)中形成的杂交复合物的第二靶结构域延伸;(d)将延伸的第一探针连接到第二探针以形成扩增模板;以及(e)用与第一引发序列和第二引发序列互补的第一引物和第二引物扩增扩增模板以产生扩增子,并且获得多个扩增子的核酸序列信息。另外或替代地,遗传生物标记物的检测可以包括一种用于核酸样品扩增的方法,其包括:(a)提供含核酸的细胞样品;(b)用裂解试剂裂解样品的细胞以从细胞样品的细胞内释放核酸,从而形成裂解液;(c)扩增来自裂解的样品的核酸;其中在开始扩增步骤(c)之前不纯化来自裂解液的核酸;以及(d)获得扩增样品的多个部分的核酸序列信息,并且将所述序列信息与第二组序列信息进行比较。在某些方面,核酸是DNA。在某些方面,样品是血液样品。在某些方面,样品包含干血。在某些方面,样品包含FFPE组织样品。在某些方面,第二组序列信息包括完整基因组序列。在某些方面,第二组序列信息包括外显子组序列信息。在某些方面,扩增包括靶向扩增反应。在某些方面,靶向扩增反应包括两个探针的延伸和连接。在某些方面,靶向扩增反应包括使用至少两种对样品基因组的一部分具有特异性的扩增引物进行聚合酶链反应。另外或替代地,遗传生物标记物的检测可以包括一种在样品处理的不同阶段期间追踪生物样品的身份的方法,其包括:(a)提供含核酸的细胞样品;(b)将样品的一部分分成第一部分和第二部分,并且根据以上实施方案从生物样品的第一部分获得第一组核酸序列信息,其中第一组核酸序列信息包括身份信息性序列信息;(c)纯化来自第二部分的核酸并且获得第二组序列信息;以及(d)使用计算机辅助逻辑,将来自第一组核酸序列信息序列信息的身份信息性序列信息与第二组序列信息进行比较,以确认第一组序列信息和第二组序列信息是从同一来源获得的。另外或替代地,遗传生物标记物的检测可以包括一种确认两种不同生物样品的来源的方法,其包括:(a)提供含核酸的第一细胞样品;(b)根据以上实施方案中的一些从生物样品的第一部分获得第一组核酸序列信息,其中第一组核酸序列信息包括身份信息性序列信息;(c)提供包含纯化的核酸的第二核酸样品并且获得第二组序列信息;以及(d)使用计算机辅助逻辑,将来自第一组核酸序列信息序列信息的身份信息性序列信息与第二组序列信息进行比较,以确认第一组序列信息和第二组序列信息是从同一个体获得的。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0155774中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于使用锚定到邻近纳米孔的聚合酶的系链来对多核苷酸进行测序的组合物、系统和方法。根据一方面,一种组合物包含纳米孔,所述纳米孔包括第一侧、第二侧和延伸通过第一侧和第二侧的通孔。所述组合物还可以包含多个核苷酸,其中核苷酸中的每一个包含细长标签。所述组合物还可以包含第一多核苷酸和第二多核苷酸,所述第一多核苷酸与第二多核苷酸互补。所述组合物还可以包含邻近纳米孔的第一侧设置的聚合酶,所述聚合酶被配置来基于第二多核苷酸的序列将多个核苷酸的核苷酸添加到第一多核苷酸。所述组合物还可以包含永久性系链,所述永久性系链包括头部区域、尾部区域和置于其之间的细长体,所述头部区域锚定到聚合酶,其中所述细长体出现在纳米孔的通孔中。所述组合物还可以包含:设置在细长体上的第一部分,其中所述第一部分被配置来结合所述聚合酶所作用于的第一核苷酸的细长标签;以及设置在细长体上的报告子区域,其中所述报告子区域被配置来指示第一核苷酸何时与第二多核苷酸的序列中的下一个核苷酸互补或不互补。根据另一方面,一种方法可以包括提供纳米孔,所述纳米孔包括第一侧、第二侧和延伸通过第一侧和第二侧的通孔。所述方法还可以包括提供多个核苷酸,其中核苷酸中的每一个包含细长标签。所述方法还可以包括提供第一多核苷酸和第二多核苷酸,所述第一多核苷酸与第二多核苷酸互补。所述方法还可以包括提供邻近纳米孔的第一侧设置的聚合酶,所述聚合酶被配置来基于第二多核苷酸的序列将多个核苷酸的核苷酸添加到第一多核苷酸中,其中所述聚合酶锚定到永久性系链,所述永久性系链包括头部区域、尾部区域和置于其之间的细长体,所述细长体出现在纳米孔的通孔中。所述方法还可以包括基于细长标签与设置在细长体上的第一部分的结合,确定聚合酶作用于第一核苷酸。所述方法还可以包括使用设置在细长体上的报告子区域,指示第一核苷酸何时与第二多核苷酸的序列中的下一个核苷酸互补或不互补。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0141020中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括可用于将单个分子置于靶区域上的底物和方法。第一方面是一种底物,其包括固定到所述底物上的特征部的多个第一捕获引物和第二捕获引物;至少一个靶多核苷酸,一端附接到捕获引物之一并且另一端连接到靶分子,其中所述靶多核苷酸包含与第一捕获引物和第二捕获引物互补的第一捕获引物结合区域和第二捕获引物结合区域侧接的靶区域,所述第二捕获引物结合区域包含与第二捕获引物的碱基对错配;以及与固定到所述特征部的靶多核苷酸互补的多个克隆扩增子。在一些实施方案中,碱基对错配是1、2、3、4、5、6、7、8、9或10个碱基对错配。在一些实施方案中,碱基对错配是3个碱基对错配。在一些实施方案中,所述底物还包括多个特征部。在一些实施方案中,所述特征部包括单个靶分子。在一些实施方案中,所述特征部被多个克隆扩增子填充满。在一些实施方案中,所述多个特征部包括单个靶分子。在一些实施方案中,两个或更多个特征部包括不同的单个靶分子。在一些实施方案中,所述特征部被多个克隆扩增子填充满。另外或替代地,遗传生物标记物的检测可以包括将单个靶分子置于底物的特征部上的方法。在一方面,所述方法是一种通过将固定到底物上的特征部的多个第一捕获引物和第二捕获引物与至少一个靶多核苷酸杂交来将单个靶分子置于底物的特征部上的方法,其中所述靶多核苷酸包含与第一捕获引物和第二捕获引物互补的第一捕获引物结合区域和第二捕获引物结合区域侧接的靶区域,并且所述第二捕获引物结合区域包含与第二捕获引物的碱基对错配并且连接到靶分子。所述方法还包括以超过靶多核苷酸向特征部的平均转运速率的平均扩增速率扩增至少一个靶多核苷酸,以产生与靶多核苷酸互补的多个克隆扩增子。在所述方法的一些实施方案中,碱基对错配是1、2、3、4、5、6、7、8、9或10个碱基对错配。在所述方法的一些实施方案中,碱基对错配是3个碱基对错配。在所述方法的一些实施方案中,所述底物包括多个特征部。在所述方法的一些实施方案中,所述特征部包括单个靶分子。在所述方法的一些实施方案中,所述特征部被多个克隆扩增子填充满。在所述方法的一些实施方案中,所述多个特征部包括单个靶分子。在所述方法的一些实施方案中,两个或更多个特征部包括不同的单个靶分子。在所述方法的一些实施方案中,所述特征部被多个克隆扩增子填充满。在所述方法的一些实施方案中,在所述特征部处产生的后续扩增子的平均扩增速率超过第一扩增子的平均扩增速率。在一些实施方案中,靶多核苷酸包括选自由RNA、DNA和PNA组成的组的一个或多个多核苷酸。在一些实施方案中,靶多核苷酸包括双链DNA(dsDNA)。在一些实施方案中,靶多核苷酸包含少于1,000个核苷酸。在一些实施方案中,靶多核苷酸包含10至25、26至50、51至100、101至200、201至300、301至400、401至500、501至600、601至700、701至800、801至900或901至1000个碱基对的长度。在一些实施方案中,靶分子包括多肽、多核苷酸、碳水化合物、氨基酸、核苷酸、单糖、半抗原、配体、抗原、分析物、小分子有机化合物或无机化合物。在一些实施方案中,靶分子包括多肽。在一些实施方案中,多肽选自由纳米孔、结合多肽和酶组成的组。在一些实施方案中,纳米孔选自由以下组成的组:MspA、OmpF、OmpG、NalP、WZA、ClyA毒素、α-溶血素、炭疽毒素、杀白细胞素和DNA折纸纳米孔(DNA origami nanopore)。在一些实施方案中,结合多肽选自由以下组成的组:抗体、Fab、Fab′、F(ab′)2、scFV、双抗体、三抗体、微型抗体和单结构域抗体(sdAB)、T细胞受体、小菌素(microcins)、神经肽、G蛋白偶联受体、抗体、表皮生长因子受体和HER2。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0095969中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于从高通量生物和化学测定平台捕获、整合、组织、导航和查询大规模数据的方法、系统和设备。一些实施方案提供了用于将通过结构和/或功能相关的实验数据、特征和数据组与本体论或分类学中的化学、医学和/或生物术语相关联的方法、系统和接口。一些实施方案还提供了用于通过数据来源信息过滤数据,从而允许动态导航通过大量数据以找到针对特定查询最相关的结果的方法、系统和接口。一个或多个计算机的系统可以被配置来借助于在系统上安装软件、固件、硬件或其组合来进行特定操作或动作,所述软件、固件、硬件或其组合在操作中致使系统进行动作。一个或多个计算机程序可以被配置来借助于包括指令来进行特定操作或动作,所述指令在由数据处理设备执行时致使设备进行操作,所述操作包括:(a)通过一个或多个处理器从数据库中选择多个基因集,其中多个基因集中的每个基因集包括多个基因和与所述多个基因相关联的多个实验值,并且其中多个实验值在至少一个实验中与所关注的生物、化学或医学概念相关;(b)针对每个基因集并且通过一个或多个处理器,使用多个基因中的一个或多个第一基因的一个或多个实验值确定一个或多个第一基因的一个或多个实验基因得分;(c)至少部分基于一个或多个第一基因与多个基因中的一个或多个第二基因的相关性,针对每个基因集并且通过一个或多个处理器确定一个或多个第二基因的一个或多个计算机基因得分,其中所述一个或多个第一基因与所述一个或多个第二基因的相关性在数据库中除所述多个基因集之外的其他基因集中指示;(d)至少部分基于(b)中确定的一个或多个第一基因的一个或多个实验基因得分和(c)中确定的一个或多个第二基因的一个或多个计算机基因得分,通过一个或多个处理器获得一个或多个第一基因和第二基因的总得分,其中每个总得分跨多个基因集进行合计;以及(e)使用一个或多个第一基因和第二基因的总得分,通过一个或多个处理器鉴定与所关注的生物、化学或医学概念潜在相关联的基因。实施方式可以包括以下特征中的一者或多者。在一些实施方式中,针对多个基因集中的每个基因集,(c)包括:(i)从数据库中鉴定多个第二基因集,多个第二基因集中的每个基因集包括多个第二基因和与所述多个第二基因相关联的多个第二实验值,并且其中所述多个第二实验值与一个或多个第一基因中的第一基因相关。所述方法还可以包括(ii)跨多个第二基因集对实验值进行合计以获得一个或多个第一基因中的第一基因的合计值的载体。所述方法还可以包括(iii)将(i)和(ii)应用于一个或多个第一基因中的一个或多个其他基因,从而获得一个或多个第一基因中的一个或多个其他基因的实验值的一个或多个载体。所述方法还可以包括(iv)对一个或多个第一基因中的第一基因和一个或多个其他基因的合计值的载体进行合计,从而获得包括一个或多个第二基因的一个或多个计算机基因得分的一个压缩载体。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中一个或多个第一基因中的特定基因的(iv)的合计载体中的每一个与所述特定基因的实验值成比例地加权。在所述方法中,一个或多个第一基因中的特定基因的(iv)的合计载体中的每一个与针对所述特定基因鉴定的多个第二基因集的基因集的数量成比例地加权。一些实施方式提供了方法,其还包括在(d)之前确定一个或多个第三基因的一个或多个基因组得分。一些实施方式提供了方法,其中使用以下确定特定基因的每个基因组得分:(i)一个或多个基因组的基因成员,每个基因组包括与组标签相关的一组基因,其中所述组的基因包括所述特定基因;和(ii)一个或多个第一基因的一个或多个实验值中的至少一些。一些实施方式提供了方法,其中(d)包括至少部分基于一个或多个第三基因中的至少一些的基因组得分以及(b)中确定的一个或多个第一基因的一个或多个实验得分和(c)中确定的一个或多个第二基因的一个或多个计算机得分来获得一个或多个第一基因和第二基因的总得分。一些实施方式提供了方法,其中确定一个或多个第三基因的一个或多个基因组得分包括:针对一个或多个第三基因中的特定基因,鉴定每个包括所述特定基因的一个或多个基因组。所述方法还可以包括针对每个基因组确定一个或多个第一基因中的基因组成员的百分比。所述方法还可以包括针对每个基因组对作为基因组的成员的一个或多个第一基因中的至少一些的一个或多个实验值进行合计,从而获得所述基因组的总实验值。所述方法还可以包括针对一个或多个第三基因中的特定基因,使用一个或多个第一基因中的基因组成员的百分比以及所述基因组的总实验值来确定基因组得分。一些实施方式提供了方法,其中使用一个或多个第一基因中的基因组成员的百分比以及所述基因组的总实验值来确定基因组得分包括:针对每个基因组,获得成员的百分比和总实验值的乘积,从而获得一个或多个基因组的一个或多个乘积。所述方法还可以包括跨一个或多个基因组对一个或多个乘积求和,从而获得求和的乘积。所述方法还可以包括针对一个或多个第三基因中的特定基因,基于求和的乘积确定基因组得分。在一些实施方式中,所述方法还包括在(d)之前,分别确定一个或多个第四基因的相互作用组得分。在一些实施方式中,使用(i)特定基因与基因网络中连接到所述特定基因的其他基因之间的连接和(ii)一个或多个第一基因的一个或多个实验值中的至少一些来确定特定基因的每个相互作用组得分。在一些实施方式中,(d)包括至少部分基于一个或多个第四基因中的至少一些的相互作用组得分以及(b)中确定的一个或多个第一基因的一个或多个实验基因得分和(c)中确定的一个或多个第二基因的一个或多个计算机基因得分来获得至少一个或多个第一基因和一个或多个第二基因的总得分。在一些实施方式中,基因网络是基于基因、蛋白质和/或磷脂之间的相互作用和关系。在一些实施方式中,计算相互作用组得分包括将相互作用组得分计算为Ni′:
Ni′=Ni+∑((Ni+Nn)*edge_weightn)
其中Ni是特定基因i的总得分,Nn是连接到特定基因的基因n的总得分,edge_weightn是连接特定基因i和基因n的边缘的权重。在一些实施方式中,计算相互作用组得分还包括:将小于第二阈值的Ni′保存在首过字典(first pass dictionary)中;以及重复首过字典中的所有基因的计算,从而更新相互作用组得分。在一些实施方式中,所述方法还包括通过优化目标函数来训练模型。在一些实施方式中,训练模型包括将自助技术(bootstrap technique)应用于自助样品(bootstrap samples)。在一些实施方式中,目标函数与自助之后的至少一个总得分分布相关。在一些实施方式中,优化目标函数包括使训练集与验证集之间的总得分的差值最小化。在一些实施方式中,优化目标函数包括使从多个基因集获得的总得分分布与从随机基因集获得的总得分分布之间的距离最大化。在一些实施方式中,对总得分进行排序并分仓到定义大小的存储桶中,其中向存储桶分配惩罚得分,惩罚得分有利于排名较高的总得分。在一些实施方式中,目标函数仅基于排名最高的总得分。在一些实施方式中,训练模型包括在无监督机器学习方法中使用目标函数来学习模型的参数。在一些实施方式中,所述模型具有以下形式:
F(θ)=k1*c1+k2*c2+...+kn*cn
其中θ是模型的参数,ci是模型的成分,并且ki是成分的权重因子。在一些实施方式中,所述方法还包括基于实验数据类型的样品权重将模型的一个或多个成分分成子成分。在一些实施方式中,基于一个或多个随机基因集中的一个或多个第一基因和第二基因的实验值与所关注的生物、化学或医学概念相关的可能性如何,对一个或多个第一基因和第二基因的总得分进行罚分。在一些实施方案中,特定基因的每个总得分受到与等级乘积的p值成反比的罚分值的惩罚,其中等级乘积包括跨一个或多个随机基因集的特定基因的等级乘积。一个一般方面包括一种计算机程序产品,其包括存储程序代码的非暂时性机器可读介质,所述程序代码在由计算机系统的一个或多个处理器执行时致使计算机系统实施用于鉴定与所关注的生物、化学或医学概念潜在相关联的基因的方法,所述程序代码包括:(a)用于从数据库中选择多个基因集的代码,其中所述多个基因集中的每个基因集包括多个基因和与所述多个基因相关联的多个实验值,并且其中所述多个实验值在至少一个实验中与所关注的生物、化学或医学概念相关。程序代码还包括(b)用于针对每个基因集,使用多个基因中的一个或多个第一基因的一个或多个实验值确定一个或多个第一基因的一个或多个实验基因得分的代码。程序代码还包括(c)用于针对每个基因集,至少部分基于一个或多个第一基因与多个基因中的一个或多个第二基因的相关性确定一个或多个第二基因的一个或多个计算机基因得分的代码,其中所述一个或多个第一基因与所述一个或多个第二基因的相关性在数据库中除所述多个基因集之外的其他基因集中指示。程序代码还包括(d)用于至少部分基于在(b)中确定的一个或多个第一基因的一个或多个实验基因得分和在(c)中确定的一个或多个第二基因的一个或多个计算机基因得分获得一个或多个第一基因和第二基因的总得分的代码,其中每个总得分跨多个基因集进行合计。程序代码还包括(e)用于使用一个或多个第一基因和第二基因的总得分鉴定与所关注的生物、化学或医学概念潜在相关联的基因的代码。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0023119中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于制备包含来自多个单个细胞的核酸的测序文库的方法。在一个实施方案中,所述方法包括:提供来自多个细胞的分离的细胞核;将分离的细胞核经受化学处理以生成核小体耗尽的细胞核,同时维持分离的细胞核的完整性;将核小体耗尽的细胞核的子集分布到多个第一隔室中并且使每个子集与转座体复合物接触,其中每个隔室中的转座体复合物包含转座酶和与其他隔室中的第一索引序列不同的第一索引序列;将核小体耗尽的细胞核的子集中的核酸片段化为多个核酸片段并且将第一索引序列掺入到核酸片段的至少一条链中以生成包含索引的核酸片段的索引的细胞核,其中索引的核酸片段保持附接到转座酶;组合索引的细胞核以生成汇集的索引的细胞核;将汇集的索引的细胞核的子集分布到多个第二隔室中;将第二索引序列掺入到每个隔室中的索引的核酸片段中以生成双重索引片段,其中每个隔室中的第二索引序列与其他隔室中的第二索引序列不同;以及组合双重索引片段,从而产生包含来自多个单个细胞的全基因组核酸的测序文库。在一个实施方案中,化学处理包括用能够破坏核酸-蛋白质相互作用的离液剂,诸如3,5-二碘水杨酸锂进行的处理。在一个实施方案中,化学处理包括用能够破坏核酸-蛋白质相互作用的洗涤剂,诸如十二烷基硫酸钠(SDS)进行的处理。在一个实施方案中,在将分离的细胞核经受化学处理之前,用交联剂(诸如甲醛)处理所述细胞核。交联剂的浓度可以是约0.2%至约2%,并且在一个实施方案中是约1.5%。在一个实施方案中,在分布汇集的索引的细胞核的子集之后,并且在将第二索引序列掺入到每个隔室中的索引的核酸片段中之前逆转通过甲醛进行的交联。在一个实施方案中,交联的逆转包括在约55℃至约72℃下温育。在一个实施方案中,在交联逆转之前,将转座酶与索引的核酸片段解离。在一个实施方案中,使用十二烷基硫酸钠(SDS)将转座酶与索引的核酸片段解离。在一个实施方案中,在将核小体耗尽的细胞核的子集片段化为多个核酸片段并且掺入第一索引序列之前,用限制性酶处理细胞核。在一个实施方案中,在用限制性酶处理之后,用连接酶处理细胞核。在一个实施方案中,通过荧光活化的细胞核分选来进行分布核小体耗尽的细胞核的子集、分布汇集的索引的细胞核的子集或其组合。在一个实施方案中,核小体耗尽的细胞核的子集包含大约相等数量的细胞核,并且在一个实施方案中,核小体耗尽的细胞核的子集包含1至约2000个细胞核。在一个实施方案中,汇集的索引的细胞核的子集包含大约相等数量的细胞核,并且在一个实施方案中,汇集的索引的细胞核的子集包含1至约25个细胞核。在一个实施方案中,汇集的索引的细胞核的子集所包含的细胞核是核小体耗尽的细胞核的子集的至少10倍少,或者是核小体耗尽的细胞核的子集的至少100倍少。在一个实施方案中,多个第一隔室、多个第二隔室或其组合是多孔板,诸如96孔板或384孔板。在一个实施方案中,在将核小体耗尽的细胞核的子集分布到隔室中之后,将转座体复合物添加到隔室中。在一个实施方案中,每个转座体复合物包含转座子,并且每个转座子包含转移链。在一个实施方案中,转移链包含第一索引序列和第一通用序列。在一个实施方案中,将第二索引序列掺入到索引的核酸片段中包括:使每个隔室中的索引的核酸片段与第一通用引物和第二通用引物接触,所述第一通用引物和第二通用引物各自包含索引序列,并且各自包含与第一通用序列的一部分相同或互补的序列;以及进行指数扩增反应。在一个实施方案中,指数扩增反应可以是聚合酶链反应(PCR),并且在一个实施方案中,PCR可以包括15至30个循环。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0037950中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括修饰固定的捕获引物的微阵列和方法。在一方面,是一种微阵列,其包括:a)底物,所述底物包括至少一个孔、包围孔的表面和内部孔表面;b)第一层,所述第一层覆盖内部孔表面并且包括至少一个第一捕获引物对;以及c)第二层,所述第二层覆盖第一层和包围孔的表面。在另一方面,是一种微阵列,其包括:a)底物,所述底物包括至少一个孔、包围孔的表面和内部孔表面;和b)一个层,所述层覆盖内部孔表面并且包括至少一个第一捕获引物对和至少一个第二捕获引物对。在另一方面,是一种用于扩增核酸的方法,其包括:a)在底物上产生第一层,其中所述底物包括至少一个孔、包围孔的表面和内部孔表面,其中所述第一层覆盖内部孔表面;b)在第一层中沉积至少一个第一捕获引物对;c)在底物上产生覆盖第一层和包围孔的表面的第二层;d)在一定条件下使包含多个靶多核苷酸的样品与底物接触,所述条件足以使靶多核苷酸与至少一个第一捕获引物对的捕获引物杂交;以及e)进行第一动力学排除测定(KEA)以从孔内的靶多核苷酸产生扩增子的克隆群体,从而扩增靶多核苷酸。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增核酸的方法,其包括:a)在底物上产生第一层,其中所述底物包括至少一个孔、包围孔的表面和内部孔表面,其中所述第一层至少部分覆盖内部孔表面;b)在第一层中沉积至少一个第一捕获引物对,其中所述第一捕获引物对包括多个第一捕获引物和多个第二捕获引物,所述多个第一捕获引物包括包含
Figure GDA0002675196410003981
P5引物核苷酸序列的3′部分,所述多个第二捕获引物包括包含
Figure GDA0002675196410003982
P7引物核苷酸序列的3′部分;c)在底物上产生覆盖第一层和包围孔的表面的第二层;d)在第二层中沉积至少一个第二捕获引物对,其中第二捕获引物对是以3′磷酸盐为末端的,并且包括多个第一捕获引物和多个第二捕获引物,所述多个第一捕获引物包括包含
Figure GDA0002675196410003983
P5引物核苷酸序列的3′部分,所述多个第二捕获引物包括包含
Figure GDA0002675196410003984
P7引物核苷酸序列的3′部分;e)在一定条件下使包含多个靶多核苷酸的样品与底物接触,所述条件足以使每个孔的单个靶多核苷酸与至少一个第一捕获引物对的引物杂交,其中所述靶多核苷酸被互补的通用引物区侧接,每个互补的通用引物区包含互补的
Figure GDA0002675196410003985
P5′引物核苷酸序列或互补的
Figure GDA0002675196410003986
P7′引物核苷酸序列;f)进行第一KEA以从至少一个孔内的单个靶多核苷酸产生扩增子的单克隆群体,从而扩增靶多核苷酸;g)使底物与T4-激酶接触以使第二引物对的引物去阻断;以及h)进行桥式扩增或第二KEA以扩大孔以外的单个靶多核苷酸的扩增子的单克隆群体。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增核酸的方法,其包括:a)在底物上产生第一层,其中所述底物包括至少一个孔、包围孔的表面和内部孔表面,其中所述第一层至少部分覆盖内部孔表面;b)在第一层中沉积至少一个第一捕获引物对,其中所述第一捕获引物对包括多个至少一个第一捕获引物和多个至少一个第二捕获引物,所述多个至少一个第一捕获引物包括包含
Figure GDA0002675196410003987
P5引物核苷酸序列和
Figure GDA0002675196410003988
SBS3引物核苷酸序列的3′部分,所述多个至少一个第二捕获引物包括包含
Figure GDA0002675196410003989
P7引物核苷酸序列和
Figure GDA00026751964100039810
SBS8引物核苷酸序列的3′部分;c)在底物上产生覆盖第一层和包围孔的表面的第二层;d)在第二层中沉积至少一个第二捕获引物对,其中所述至少一个第二捕获引物对包括多个第一捕获引物和多个第二捕获引物,所述多个第一捕获引物包括包含
Figure GDA0002675196410003991
P5引物核苷酸序列的3′部分,所述多个第二捕获引物包括包含
Figure GDA0002675196410003992
P7核苷酸序列的3′部分;e)在一定条件下使包含多个靶多核苷酸的样品与底物接触,所述条件足以使每个孔的单个靶多核苷酸与至少一个第一捕获引物对的引物杂交,其中所述多个靶多核苷酸被互补SBS侧接,每个SBS包含互补的
Figure GDA0002675196410003993
SBS3′引物核苷酸序列或互补的
Figure GDA0002675196410003994
SBS8′核苷酸序列;以及f)进行持续延长时间的KEA以从至少一个孔内外的单个靶多核苷酸产生扩增子的单克隆群体,从而扩增孔内的单个靶多核苷酸,并且扩大至少一个孔以外的靶多核苷酸的单克隆群体。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增核酸的方法,其包括:a)在底物上产生第一层,其中所述底物包括至少一个孔、包围孔的表面和内部孔表面,其中所述第一层至少部分覆盖内部孔表面;b)在第一层中沉积至少一个第一捕获引物对,其中所述第一引物对包括多个第一捕获引物和多个第二捕获引物,所述多个第一捕获引物包括包含
Figure GDA0002675196410003995
P5引物核苷酸序列的3′部分,所述多个第二捕获引物包括包含
Figure GDA0002675196410003996
P7引物核苷酸序列的3′部分;c)在底物上产生覆盖第一层和包围孔的表面的第二层;d)在一定条件下使包含多个靶多核苷酸的样品与底物接触,所述条件足以使每个孔的单个靶多核苷酸与至少一个第一捕获引物对的引物杂交,其中所述多个多核苷酸被互补的通用引物区侧接,每个互补的通用引物区包含互补的
Figure GDA0002675196410003997
P5′引物核苷酸序列或互补的
Figure GDA0002675196410003998
P7′引物核苷酸序列;e)进行第一KEA以从至少一个孔内的单个靶多核苷酸产生扩增子的单克隆群体,从而扩增靶多核苷酸;f)在第二层中沉积至少一个第二捕获引物对,其中所述至少一个第二捕获引物对包括多个第一捕获引物和多个第二捕获引物,所述多个第一捕获引物包括包含
Figure GDA0002675196410003999
P5引物核苷酸序列的3′部分,所述多个第二捕获引物包括包含
Figure GDA00026751964100039910
P7引物核苷酸序列的3′部分;以及g)进行桥式扩增或第二KEA以扩大单个靶多核苷酸的扩增子的单克隆群体。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增核酸的方法,其包括:a)在底物上产生一个层,其中所述底物包括至少一个孔、包围孔的表面和内部孔表面,其中所述孔具有约1μm或更大的直径,并且其中所述层至少部分覆盖所述内部孔表面;b)在所述层中沉积至少一个第一捕获引物对和至少一个第二捕获引物对,其中所述至少一个第一捕获引物对的引物密度高于所述至少第二引物对的引物密度;c)在一定条件下使包含多个靶多核苷酸的样品与底物接触,所述条件足以使每个孔的单个靶多核苷酸与第二引物杂交;以及d)进行KEA以从所述孔内与第二引物杂交的单个靶多核苷酸产生扩增子的单克隆群孔,从而扩增单个靶多核苷酸。另外或替代地,遗传生物标记物的检测可以包括一种用于修饰固定的捕获引物的方法,其包括:a)在足以进行杂交的条件下,使包含多个固定的捕获引物的底物与多个模板核酸接触,以产生一个或多个固定的模板核酸,其中所述多个固定的捕获引物包括包含5′-末端通用捕获区域Y的多个第一引物和包含3′-末端通用捕获区域Z的多个第二引物,并且其中每个模板核酸酸被5′-末端和3′-末端通用捕获区域Y或Z侧接,并且包含一个或多个限制性位点,以及5′-末端通用捕获区域与一个或多个限制性位点之间或3′-末端通用捕获区域与一个或多个限制性位点之间的靶特异性捕获区;以及b)延伸一个或多个固定的捕获引物,以产生与一个或多个模板核酸互补的一个或多个固定的延伸产物。另外或替代地,遗传生物标记物的检测可以包括一种用于修饰固定的捕获引物的方法,其包括:a)在足以进行杂交的条件下使包含多个固定的捕获引物的底物与多个模板核酸接触,以产生一个或多个固定的模板核酸,其中所述多个固定的捕获引物包括多个第一引物和多个第二引物,所述多个第一引物包含3′-末端
Figure GDA0002675196410004001
P5引物核苷酸序列,所述多个第二引物包含3′-末端
Figure GDA0002675196410004002
P7引物核苷酸序列,并且其中每个模板核酸被3′-末端互补的
Figure GDA0002675196410004003
P5′引物核苷酸序列和5′-末端互补的
Figure GDA0002675196410004004
P7′引物核苷酸序列侧接,并且包含两个SapI限制性位点、SapI限制性位点之间的间隔子区以及3′末端互补的
Figure GDA0002675196410004005
P5′引物核苷酸序列与SapI限制性位点之间的靶特异性捕获区域;以及b)延伸一个或多个固定的捕获引物,以产生与一个或多个模板核酸互补的一个或多个固定的延伸产物;c)通过桥式扩增或KEA扩增一个或多个固定的延伸产物,以产生固定的双链模板核酸的一个或多个单克隆簇;d)使固定的双链模板核酸的一个或多个单克隆簇与SapI接触,以切割多个固定的双链模板核酸中的两个限制性位点,以产生包含
Figure GDA0002675196410004011
P5引物核苷酸序列和靶特异性捕获区域的多个固定的双链嵌合捕获引物以及包含
Figure GDA0002675196410004012
P7引物核苷酸序列的多个固定的双链再生通用捕获引物;以及e)任选地,使多个固定的双链嵌合捕获引物和固定的双链再生通用捕获引物与5′-3′dsDNA-核酸外切酶接触,以产生多个固定的单链嵌合捕获引物和多个固定的单链再生通用捕获引物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0356030中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于使用化学发光检测聚合物亚基的存在的组合物、系统和方法。在一方面,一种组合物包含:底物;与底物偶联的第一多核苷酸;与第一多核苷酸杂交的第二多核苷酸;以及与第二多核苷酸的第一核苷酸偶联的催化剂,所述催化剂可操作以致使致化学发光分子发射光子。在一些实施方案中,所述组合物还包含多个致化学发光分子。所述催化剂可以致使每个致化学发光分子发出对应的光子。所述组合物还可以包含多个试剂分子,所述催化剂通过使用试剂分子氧化每个致化学发光分子来致使所述致化学发光分子发射对应的光子。氧化的致化学发光分子可以具有通过发射对应的光子而衰减的激发态。一种系统可以包括被配置来检测由致化学发光分子发射的光子的前述组合物和电路中的任一个。在一些实施方案中,所述电路还被配置来基于光子的检测来检测第一核苷酸的存在。在另一方面,一种方法可以包括:提供底物;提供与底物偶联的第一多核苷酸;将第二多核苷酸与第一多核苷酸杂交;将第一催化剂与第二多核苷酸的第一核苷酸偶联;以及通过第一催化剂致使第一致化学发光分子发射光子。在另一方面,一种对第一多核苷酸进行测序的方法包括:提供待测序并与底物偶联的第一多核苷酸;b)将第二多核苷酸与第一多核苷酸杂交;以及使第二多核苷酸与聚合酶和多个核苷酸接触。多个核苷酸的第一子集包括第一部分,多个核苷酸的第二子集包括第二部分,多个核苷酸的第三子集包括第三部分,并且多个核苷酸的第四子集包括第四部分或没有部分。所述方法还可以包括基于第一多核苷酸的序列将多个核苷酸的一个核苷酸添加到第二多核苷酸中。所述方法还可以包括:将核苷酸暴露于与第五部分偶联的催化剂;将核苷酸暴露于致化学发光分子;以及从致化学发光分子检测光子的发射或光子的不存在。所述方法还可以包括:将核苷酸暴露于与第六部分偶联的催化剂;将核苷酸暴露于致化学发光分子;以及从致化学发光分子检测光子的发射或光子的不存在。所述方法还可以包括:将核苷酸暴露于切割分子;将核苷酸暴露于致化学发光分子;以及从致化学发光分子检测光子的发射或光子的不存在。所述方法还可以包括在一个或多个检测步骤或其组合处,基于从致化学发光分子检测光子的发射或光子的不存在来检测添加的核苷酸。在另一方面,一种组合物包含:催化剂,其可操作以致使致化学发光分子发射光子;底物;与底物偶联的第一多核苷酸;与第一多核苷酸杂交的第二多核苷酸;以及与第二多核苷酸的第一核苷酸偶联的淬灭剂,所述淬灭剂可操作以抑制致化学发光分子进行的光子发射。在另一方面,一种方法包括:提供可操作以致使第一致化学发光分子发射光子的催化剂;提供底物;提供与底物偶联的第一多核苷酸;将第二多核苷酸与第一多核苷酸杂交;将第一淬灭剂与第二多核苷酸的第一核苷酸偶联;以及通过第一淬灭剂抑制第一致化学发光分子进行的光子发射。在另一方面,一种对第一多核苷酸进行测序的方法包括:提供待测序并与底物偶联的第一多核苷酸;将第二多核苷酸与第一多核苷酸杂交;以及提供与第二多核苷酸足够接近偶联的催化剂,使得与第二多核苷酸偶联的淬灭剂可以抑制与所述催化剂相互作用的致化学发光分子的光子发射。所述方法还可以包括使第二多核苷酸与聚合酶和多个核苷酸接触。多个核苷酸的第一子集包括第一部分,多个核苷酸的第二子集包括第二部分,多个核苷酸的第三子集包括第三部分,并且多个核苷酸的第四子集包括第四部分或没有部分。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0137876中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种可以用于基本上减少或消除可能在第一延伸期间产生的高质量错误的方法。在另一个实施方案中,所述方法还可以用于减少在扩增的前几个循环期间由于核苷酸的错误掺入而引起的错误。另外或替代地,遗传生物标记物的检测可以包括一种以改善的准确性进行测序的方法,其包括:提供核酸模板;通过直接从模板核酸进行线性扩增,产生包含多条互补链的群体,所述多条互补链保持彼此紧密邻近或可鉴定为从同一模板核酸获得;以及对所述保持邻近的(例如,表面结合的)寡核苷酸进行测序反应。在一些实施方案中,所述方法还包括以下步骤:在几轮线性扩增之后并且在进行测序反应之前,对互补链的群体实施进一步(指数)扩增。任选地,线性扩增(直接从核酸模板进行)包括以下步骤:将所述核酸模板与第一引物杂交;延伸第一引物以产生与模板互补的链;变性以释放保持紧密邻近的互补链(例如,它保持结合到表面,并且因此在附近重杂交之前根本不行进或不扩散很远);以及重复杂交和扩增步骤以产生直接从模板核酸获得的表面结合的互补链的群体。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0101676中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于富集核酸文库中的靶序列并减少一组靶杂交探针的脱靶序列的捕获的技术。因为靶杂交探针对其核酸靶具有不完全的特异性,因此使用一组靶杂交探针进行的测序运行也可能包含一定百分比的代表脱靶序列的读长。例如,在外显子组测序反应中,某些杂交探针可能从核酸文库中下拉内含子或基因间序列以及靶序列。这些脱靶片段一旦被下拉,然后就存在于被测序的核酸片段的池中。虽然代表脱靶读长的测序信息通常被丢弃,但是本发明的技术使用这些脱靶读长的所获取的测序信息来设计杂交探针,所述杂交探针对脱靶序列具有特异性并且用于从通过靶特异性杂交探针捕获的片段的池中分离和/或去除包含这些序列的片段。脱靶杂交探针是基于对用一组靶杂交探针进行的杂交捕获测序运行的脱靶读长的分析而设计的。在某些实施方案中,靶上探针设计还可以基于跨样品的系统性脱靶分析,以改善靶杂交探针对其所需靶的特异性。另外或替代地,遗传生物标记物的检测可以包括一种减少靶向测序反应中的脱靶捕获的方法。所述方法包括以下步骤:提供一组脱靶杂交探针,其与从样品产生的核酸文库中存在的多个脱靶序列特异性结合,所述核酸文库包含多个核酸片段;以及提供一组靶特异性杂交探针,其与核酸文库中存在的多个靶序列特异性结合。所述方法还包括以下步骤:在脱靶杂交探针与脱靶序列杂交的条件下使脱靶杂交探针与核酸文库接触;以及在靶特异性杂交探针与靶序列杂交的条件下使靶特异性杂交探针与核酸文库接触。所述方法还包括以下步骤:从结合靶特异性杂交探针的核酸文库中选择一组核酸片段;以及对所述组的结合靶特异性杂交探针的核酸片段进行测序。另外或替代地,遗传生物标记物的检测可以包括一种提供用于靶向测序反应中的脱靶序列捕获的探针的方法。所述方法包括以下步骤:接收对一组靶特异性杂交探针的请求。所述方法还包括以下步骤:使靶特异性杂交探针与从参考样品产生的参考核酸文库接触以生成结合靶特异性杂交探针的靶特异性和脱靶核酸片段的参考组,所述核酸文库包含多个核酸片段;以及将结合靶特异性杂交探针的核酸片段的参考组与未结合的核酸片段分离。所述方法还包括以下步骤:对核酸片段的参考组进行测序以生成参考测序数据;在参考测序数据中鉴定脱靶序列;以及基于所鉴定的脱靶序列提供一组脱靶杂交探针。另外或替代地,遗传生物标记物的检测可以包括一种用于减少靶向测序反应中的脱靶捕获的测序试剂盒,其包括:一组脱靶杂交探针,所述脱靶杂交探针与从样品产生的核酸文库中存在的多个脱靶序列特异性结合,所述核酸文库包含多个核酸片段;以及一组靶特异性杂交探针,所述靶特异性杂交探针与核酸文库中存在的多个靶序列特异性结合。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2016/0319345中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于使用唯一分子索引(UMI)确定核酸片段序列的方法、设备、系统和计算机程序产品。在各种实施方式中,测序方法从核酸片段的两条链中确定核酸片段的序列。在一些实施方式中,所述方法采用位于测序衔接子的一条链或两条链上的物理UMI。在一些实施方式中,所述方法还采用位于核酸片段的两条链上的虚拟UMI。一个方面涉及一种用于使用唯一分子索引(UMI)对来自样品的核酸分子进行测序的方法。每个唯一分子索引(UMI)是寡核苷酸序列,其可以用于鉴定样品中的双链DNA片段的个体分子。所述方法包括:(a)将衔接子施加到样品中的双链DNA片段的两端,从而获得DNA-衔接子产物,其中每个衔接子包含双链杂交区、单链5′臂、单链3′臂以及在衔接子的一条链或每条链上的物理UMI;(b)扩增DNA-衔接子产物的两条链,以获得多个扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得各自与物理UMI相关联的多个读长;(d)鉴定与多个读长相关联的多个物理UMI;(e)鉴定与多个读长相关联的多个虚拟UMI,其中每个虚拟UMI是样品中的DNA片段中存在的序列;以及(f)使用在(c)中获得的多个读长、在(d)中鉴定的多个物理UMI和在(e)中鉴定的多个虚拟UMI,确定样品中的双链DNA片段的序列。在一些实施方式中,所述方法包括操作(f),其包括:(i)针对样品中的一个或多个双链DNA片段中的每一个,将(1)在5′至3′方向上具有第一物理UMI和至少一个虚拟UMI的读长和(2)在5′至3′方向上具有第二物理UMI和至少一个虚拟UMI的读长组合以确定共有核苷酸序列;以及(ii)针对样品中的一个或多个双链DNA片段中的每一个,使用共有核苷酸序列确定序列。在一些实施方式中,每个衔接子仅在单链5′臂或单链3′臂上的衔接子的一条链上包含物理UMI。在这些实施方式中的一些中,(f)包括:(i)将具有相同的第一物理UMI的读长折叠成第一组以获得第一共有核苷酸序列;(ii)将具有相同的第二物理UMI的读长折叠成第二组以获得第二共有核苷酸序列;以及(iii)使用第一共有核苷酸序列和第二共有核苷酸序列,确定样品中的双链DNA片段之一的序列。在一些实施方式中,(iii)包括:(1)使用第一共有核苷酸序列和第二共有核苷酸序列的定位信息和序列信息获得第三共有核苷酸序列;以及(2)使用第三共有核苷酸序列确定双链DNA片段之一的序列。在一些实施方式中,操作(e)包括鉴定多个虚拟UMI,而每个衔接子仅在单链5′臂区或单链3′臂区中的衔接子的一条链上包含物理UMI。在一些实施方式中,(f)包括:(i)将在5′至3′方向上具有第一物理UMI和至少一个虚拟UMI的读长和在5′至3′方向上具有第二物理UMI和至少一个虚拟UMI的读长组合以确定共有核苷酸序列;以及(ii)使用共有核苷酸序列确定样品中的双链DNA片段之一的序列。在以上方法的一些实施方式中,在操作(c)中获得多个读长包括:从每个扩增的多核苷酸获得两个双端读长,其中在两个双端读长中包括长读长和短读长,长读长比短读长要长。在这些实施方式中的一些中,操作(f)包括:将与第一物理UMI相关联的读长对组合成第一组,并且将与第二物理UMI相关联的读长对组合成第二组,其中第一物理UMI和第二物理UMI与样品中的双链片段唯一地相关联;以及使用第一组中的长读长的序列信息和第二组中的长读长的序列信息确定样品中的双链片段的序列。另一方面,将衔接子施加到样品中的双链DNA片段的两端,其中每个衔接子包含双链杂交区、单链5′臂、单链3′臂以及在单链5′臂或单链3′臂上的物理唯一分子索引(UMI);(b)扩增来自(a)的连接产物的两条链,从而获得多个单链扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得各自与物理UMI相关联的多个读长;(d)鉴定与多个读长相关联的多个物理UMI;以及(e)使用在(c)中获得的多个序列和在(d)中鉴定的多个物理UMI确定样品中的双链DNA片段的序列。另一方面涉及一种用于对来自样品的核酸分子进行测序的方法。所述方法包括:(a)将衔接子附接到样品中的双链DNA片段的两端,其中每个衔接子包含双链杂交区、单链5′臂、单链3′臂以及在衔接子的一条链或每条链上的短于12个核苷酸的物理唯一分子索引(UMI);(b)扩增来自(a)的连接产物的两条链,从而获得多个各自包含物理UMI的单链扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得各自与物理UMI相关联的多个读长;(d)鉴定与多个读长相关联的多个物理UMI;以及(e)使用在(c)中获得的多个读长和在(d)中鉴定的多个物理UMI确定样品中的双链DNA片段的序列。另一个方面涉及一种用于制备在每条链上具有物理UMI的双链测序衔接子的方法。所述方法包括:提供初步测序衔接子,其包含双链杂交区域、两个单链臂和包含在双链杂交区的远离两个单链臂的末端处的5′-CCANNNNANNNNTGG-3′的突出;使用所述突出为模板延伸双链杂交区的一条链,从而产生延伸产物;以及应用限制性酶Xcm1来消化延伸产物的双链末端,从而产生在每条链上具有物理UMI的双链测序衔接子。在一些实施方式中,初步测序衔接子在每条链上包含读长引物序列。另一方面涉及一种计算机程序产品,其包括存储程序代码的非暂时性机器可读介质,所述程序代码在由计算机系统的一个或多个处理器执行时致使计算机系统实施用于使用唯一分子索引(UMI)确定样品中所关注的序列的序列信息的方法。所述程序代码包括:(a)用于获得多个扩增的多核苷酸的读长的代码,其中所述多个扩增的多核苷酸是通过扩增样品中的包含所关注的序列的双链DNA片段并且将衔接子附接到双链DNA片段而获得的;(b)用于鉴定多个扩增的多核苷酸的读长中的多个物理UMI的代码,其中每个物理UMI存在于附接到双链DNA片段之一的衔接子中;(c)用于鉴定所接收的多个扩增的多核苷酸的读长中的多个虚拟UMI的代码,其中每个虚拟UMI存在于双链DNA片段之一的个体分子中;以及(c)用于使用多个扩增的多核苷酸的读长、多个物理UMI和多个虚拟UMI来确定双链DNA片段的序列,从而减少所确定的双链DNA片段的序列中的错误的代码。在一些实施方式中,每个衔接子包含双链杂交区、单链5′臂、单链3′臂和在衔接子的一条链或每条链上的物理唯一分子索引(UMI)。另一个方面涉及一种计算机系统,其包括:一个或多个处理器;系统存储器;以及一个或多个计算机可读存储介质。所述介质上存储有计算机可执行指令,其致使计算机系统实施使用唯一分子索引(UMI)确定样品中的所关注的序列的序列信息的方法,所述唯一分子索引是可以用于鉴定样品中的双链DNA片段的个体分子的寡核苷酸序列。所述指令包括:(a)接收多个扩增的多核苷酸的读长,其中所述多个扩增的多核苷酸是通过扩增样品中的包含所关注的序列的双链DNA片段并且将衔接子附接到双链DNA片段而获得的;(b)鉴定所接收的多个扩增的多核苷酸的读长中的多个物理UMI,其中每个物理UMI存在于附接到双链DNA片段之一的衔接子中;(c)鉴定所接收的多个扩增的多核苷酸的读长中的多个虚拟UMI,其中每个虚拟UMI存在于双链DNA片段之一的个体分子中;以及(d)使用多个扩增的多核苷酸的序列、多个物理UMI和多个虚拟UMI来确定双链DNA片段的序列,从而减少所确定的双链DNA片段的序列中的错误。一方面提供了用于使用非随机唯一分子索引(UMI)对来自样品的核酸分子进行测序的方法。所述方法涉及:(a)将衔接子施加到样品中的DNA片段的两端,从而获得DNA-衔接子产物,其中每个衔接子包含双链杂交区域、单链5′臂、单链3′臂以及在衔接子的一条链或每条链上的非随机唯一分子索引(UMI);(b)扩增DNA-衔接子产物以获得多个扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得与多个非随机UMI相关联的多个读长;(d)从多个读长中鉴定共享共同的非随机UMI的读长;以及(e)从所鉴定的具有共同非随机UMI的读长中确定来自样品的DNA片段的至少一部分的序列,所述DNA片段具有所施加的具有共同非随机UMI的衔接子。另一方面涉及用于使用非随机唯一分子索引(UMI)对来自样品的核酸分子进行测序的方法。在一些实施方式中,一种方法涉及:(a)将衔接子施加到样品中的双链DNA片段的两端,从而获得DNA-衔接子产物,其中每个衔接子包含双链杂交区域、单链5′臂、单链3′臂以及在衔接子的一条链或每条链上的非随机唯一分子索引(UMI),其中所述非随机UMI可以与其他信息组合以唯一地鉴定双链DNA片段的个体分子;(b)扩增DNA-衔接子产物的两条链,以获得多个扩增的多核苷酸;(c)对多个扩增的多核苷酸进行测序,从而获得各自与非随机UMI相关联的多个读长;(d)鉴定与多个读长相关联的多个非随机UMI;以及(e)使用多个读长和多个非随机UMI来确定样品中的双链DNA片段的序列。另外或替代地,遗传生物标记物的检测可以包括一种用于确定实施所公开的方法的DNA片段序列的系统、设备和计算机程序产品。一方面提供了一种计算机程序产品,其包括存储程序代码的非暂时性机器可读介质,所述程序代码在由计算机系统的一个或多个处理器执行时致使计算机系统实施使用唯一分子索引(UMI)确定样品中所关注的序列的序列信息的方法。程序代码包括执行以上方法的指令。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0360193中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于扩增核酸样品以产生核酸文库的方法、组合物和试剂盒。另外或替代地,遗传生物标记物的检测可以包括一种从核酸样品产生核酸文库的方法,所述方法包括:a)向核酸样品提供一组扩增引物,所述组的扩增引物包括多个随机引物和多个基因座特异性引物,其中所述基因座特异性引物被配置来扩增核酸文库的多个预定区域,并且其中与所述基因座特异性引物相比,所述随机引物的丰度更高;以及b)使用所述组的扩增引物扩增核酸文库,从而产生核酸文库。还提出了一种用于扩增核酸样品的试剂盒,其中所述试剂盒包括多个随机引物和被配置来扩增核酸文库的多个预定区域的多个基因座特异性引物。在某些方面,所述试剂盒还包括用于在扩增反应集中使用随机引物和基因座特异性引物的一组指令,其中与基因座特异性引物相比,随机引物的丰度更高。在某些方面,所述试剂盒还包括用于将所述组的扩增引物与核酸文库组合并扩增核酸文库的一组指令。除了上述内容之外,还提出了一种从核酸样品产生核酸文库的方法,所述方法包括:a)用富含AT的一组随机扩增引物扩增核酸样品。在某些方面,富含AT的所述组的随机扩增引物是引物的混合物。还提出了一种用于扩增核酸样品的试剂盒,其中所述试剂盒包括富含AT的一组随机扩增引物。在某些方面,所述试剂盒还包括用于将所述组的扩增引物与核酸文库组合并扩增核酸文库的一组指令。在某些其他方面,试剂盒还包括DNA聚合酶。在其他方面,富含AT的所述组的随机扩增引物是引物的混合物。另外或替代地,遗传生物标记物的检测可以包括一种从核酸样品产生核酸文库的方法,所述方法包括:a)用一组随机扩增引物扩增核酸样品,所述随机扩增引物包含富含AT的5′尾部。在某些方面,所述组的随机扩增引物是引物的混合物。还提出了一种从核酸样品产生核酸文库的方法,所述方法包括:用一组可变长度的随机扩增引物扩增核酸样品,其中每个可变长度的随机扩增引物包含随机3′部分和简并5′尾部,所述简并5′尾部在长度上与引物的随机3′部分的A/T含量成比例。在某些方面,所述组的可变长度的随机扩增引物是引物的混合物。还提出了一种从核酸样品产生核酸文库的方法,所述方法包括:a)用一组随机扩增引物扩增核酸样品,从而产生扩增产物,其中每个引物包含随机3′部分和恒定5′引发部分,其中每个扩增产物包含恒定5′引发部分;b)使扩增产物环化;以及c)使用与恒定5′引发部分杂交的引物扩增环化的扩增产物。在某些方面,步骤(c)中的扩增包括进行多重置换扩增。在某些方面,所述组的随机扩增引物是引物的混合物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0176071中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括确定序列片段相对于所述片段所来源于的较大靶核酸的接近性。例如,当个体序列读长短于所评估的靶核酸的长度时,所述方法可以用于确定相移并鉴定相对较长的靶核酸序列的单倍型。另外或替代地,遗传生物标记物的检测可以包括一种对靶核酸聚合物进行测序的方法。所述方法可以包括以下步骤:(a)修饰靶核酸聚合物以产生修饰的核酸聚合物,其中所述修饰的核酸聚合物包含来自所述靶核酸聚合物的多个序列区域;(b)在具有固体支撑物表面的容器中产生修饰的核酸聚合物的片段,每个片段包含一个序列区域;(c)在固体支撑物表面的区域中的位置处随机捕获片段;(d)通过检测所述位置处的片段来确定序列区域的核苷酸序列;以及(e)基于来自所述片段的核苷酸序列和固体支撑物表面上的位置之间的相对距离,产生靶核酸聚合物的核苷酸序列的表示。另外或替代地,遗传生物标记物的检测可以包括一种对靶核酸聚合物进行测序的方法,其包括以下步骤:(a)将插入物添加到靶核酸聚合物中以形成包含多个内部插入物的修饰的核酸聚合物;(b)在与固体支撑物表面接触的流体中产生修饰的核酸聚合物的片段,从而释放各自包含至少一部分插入物的片段;(c)在固体支撑物表面上的位置处从流体中随机捕获片段;(d)通过检测所述位置处的片段,确定来自所述片段的核苷酸序列;以及(e)基于来自所述片段的核苷酸序列和固体支撑物表面上的位置之间的相对距离,产生靶核酸聚合物的核苷酸序列的表示。另外或替代地,遗传生物标记物的检测可以包括一种对靶核酸聚合物进行测序的方法,其包括以下步骤:(a)修饰靶核酸聚合物以产生修饰的核酸聚合物,其中所述修饰的核酸聚合物包含来自所述靶核酸聚合物的多个序列区域;(b)将修饰的核酸聚合物附接到固体支撑物表面上的区域;(c)产生附接到固体支撑物表面的修饰的核酸聚合物的片段,其中所述片段附接到所述固体支撑物的区域处的位置;(d)通过检测所述位置处的片段来确定来自所述片段的核苷酸序列;以及(e)基于来自所述片段的核苷酸序列和固体支撑物表面上的位置之间的相对距离,产生靶核酸聚合物的核苷酸序列的表示。另外或替代地,遗传生物标记物的检测可以包括一种在来自不同来源的序列的混合物中确定个体序列的来源的方法。所述方法可以包括以下步骤:(a)提供来自多种不同来源的靶核酸聚合物的混合物;(b)修饰靶核酸聚合物的混合物以产生修饰的核酸聚合物的混合物,其中所述修饰的核酸聚合物的混合物包含来自不同来源的多个序列区域;(c)在具有固体支撑物表面的容器中产生修饰的核酸聚合物的片段,每个片段包含来自不同来源中的一种的序列区域;(d)在来自共同靶核酸聚合物的片段优先定位到固体支撑物表面上的近端位置的条件下,在固体支撑物表面的位置处随机捕获片段;(e)确定所述位置处的片段的核苷酸序列;以及(f)基于来自所述片段的核苷酸序列和固体支撑物表面上的位置之间的相对距离,在多种不同来源中鉴定来源于共同来源的核苷酸序列。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2014/0364323中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于确定多个样品中所关注的多个核苷酸序列的存在,同时保留每个样品的身份的方法。所述方法可以用于许多应用,包括基因分型、表达分析和鉴定复杂样品中的个体物种。在一个实施方案中,每个样品与多个探针组接触。第一探针具有第一鉴定序列和与所关注的序列的第一部分互补的第一杂交序列。第二探针具有与所关注的相同序列的第二部分互补的第二杂交序列和第二鉴定序列。如果第一杂交序列与所关注的序列的第一部分杂交,并且第二杂交序列与所关注的相同序列的第二部分杂交,则将第一探针和第二探针连接。这也可以使用连接和/或延伸方法来进行,诸如使用
Figure GDA0002675196410004121
测定设计。基于连接的探针中存在的鉴定序列代码,确定所关注的序列的存在和含有所关注的序列的样品的身份。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2013/0059741中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于使用固体支撑物来测定样品中靶分析物的存在的组合物和方法。另外或替代地,遗传生物标记物的检测可以包括一种固体支撑物,其具有固定到固体支撑物的结合蛋白(诸如抗体、抗体片段或蛋白质受体),以及固定在结合蛋白附近的至少两个单独的核酸引物。另外或替代地,遗传生物标记物的检测可以包括一种固体支撑物,其中在固定到固体支撑物的结合蛋白、靶分析物和第二结合蛋白之间形成结合复合物。在一些实施方案中,提供了一种固体支撑物,其中这种结合复合物还在固定在固体支撑物上的一种核酸引物与连接到第二结合蛋白的寡核苷酸标签之间形成杂交复合物。另外或替代地,遗传生物标记物的检测可以包括一种包含多个这些固体支撑物的阵列。在一些实施方案中,固体支撑物可以用于检测大量靶分析物的方法。在一个实施方案中,用于检测靶分析物的方法包括:提供固体支撑物,其具有固定到固体支撑物的结合蛋白和在溶液中提供的第二结合蛋白,其中第一结合蛋白识别靶分析物并且能够在第二结合蛋白的存在下结合靶分析物,所述第二结合蛋白也识别并结合相同的靶分析物;在足以允许在靶分析物与第一结合蛋白和第二结合蛋白两者之间形成结合复合物的条件下,使固体支撑物与靶分析物和第二结合蛋白接触;将连接到第二结合蛋白的寡核苷酸标签与固定在固体支撑物上的第一核酸引物杂交;延伸此第一引物,从而生成寡核苷酸标签的补体;使用固定到固体支撑物的第二核酸引物扩增新生成的补体;以及检测扩增子的存在,其中扩增子的存在指示靶分析物的存在。另外或替代地,遗传生物标记物的检测可以包括一种用于检测靶分析物的方法,其中上述方法替代地在延伸步骤之后通过以下进行:将所生成的寡核苷酸标签的补体与固定在固体支撑物上的第二核酸引物杂交,从而形成第二杂交复合物;然后使用诸如单碱基延伸或边测序边合成的方法,用至少一个加标记的核酸残基延伸第二核酸引物,其中添加到引物的核酸残基依赖于寡核苷酸标签的核酸序列;接着检测固体表面上带标记的核酸残基的存在,其中带标记的核酸残基的存在指示靶分析物的存在。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2012/0156753中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于对样品中的具有5′聚磷酸酯基团的未加帽的RNA加5′连接的标签的方法,其包括:(A)提供:(i)含有具有5′聚磷酸酯基团的未加帽的RNA的样品,其中所述样品另外含有具有5′单磷酸酯基团的RNA和/或加帽的RNA和/或具有5′羟基基团的RNA;(ii)RNA 5′聚磷酸酶;(iii)具有标签的受体寡核苷酸;和(iv)RNA连接酶;(B)在一定条件下使样品与RNA 5′聚磷酸酶接触足够的时间,其中具有5′聚磷酸酯基团的未加帽的RNA转化为具有5′单磷酸酯基团的RNA;以及(C)在一定条件下使来自步骤(B)的样品与受体寡核苷酸和RNA连接酶接触足够的时间,其中受体寡核苷酸的3′末端连接到具有5′单磷酸酯基团的RNA,但不连接到加帽的RNA,并且生成带5′连接的标签的RNA。在其他实施方案中,步骤(A)中提供的样品另外含有具有5′单磷酸酯基团的RNA,但是受体寡核苷酸仅连接到步骤(B)中的从具有5′单磷酸酯基团的未加帽的RNA转化的具有5′单磷酸酯基团的RNA,并且不连接到步骤(A)提供的已经在样品中的具有5′单磷酸酯基团的RNA,其中所述方法另外包括以下子步骤:提供RNA 5′单磷酸酶;以及在步骤(B)之前,在一定条件下使样品与RNA 5′单磷酸酶接触足够的时间,其中样品中的具有5′单磷酸酯基团的RNA转化为具有5′羟基基团的RNA;以及使RNA5′单磷酸酶失活或去除。在其他实施方案中,所述方法另外包括对样品中的加帽的RNA加5′连接的标签,其中所述方法另外包括以下子步骤:提供核酸焦磷酸酶或脱帽酶;以及在步骤(C)之前,在一定条件下使来自步骤(B)的样品与核酸焦磷酸酶或脱帽酶接触足够的时间,其中样品中的加帽的RNA转化为具有5′单磷酸酯基团的RNA,由此步骤(A)中提供的样品中含有的加帽的RNA在步骤(C)中也被加5′-连接的标签。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2012/0010091中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于从多个单个细胞制备cDNA文库的方法。在一方面,所述方法包括以下步骤:从每个单个细胞中释放mRNA以提供多个个体mRNA样品;从每个个体mRNA样品中的mRNA合成cDNA的第一链;以及将标签掺入到cDNA中以提供多个带标签的cDNA样品;汇集带标签的cDNA样品;以及扩增汇集的cDNA样品,以产生具有双链cDNA的cDNA文库。在一些实施方案中,可以通过以上方法产生cDNA文库。另外或替代地,遗传生物标记物的检测可以包括用于通过制备如上所述的cDNA文库并对文库测序来分析多个细胞中的基因表达的方法。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2011/0152111中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种检测存档的组织样品中的靶核酸序列的方法,其包括:提供由存档的组织样品制备的核酸样品;将第一组连接探针与所述靶序列杂交以形成连接结构;使用连接酶连接所述探针以形成连接的探针;扩增所述连接的探针以形成扩增子;以及检测所述扩增子。另外或替代地,遗传生物标记物的检测可以包括一种检测存档的组织样品中的多个靶核酸序列的方法,其包括:提供由存档的组织样品制备的核酸样品,所述样品包含多个靶核酸序列;添加多个检测探针,每个检测探针基本上与所述靶核酸序列之一互补;提供酶以形成修饰的检测探针;扩增所述修饰的检测探针以形成扩增子;以及检测所述扩增子。另外或替代地,遗传生物标记物的检测可以包括一种检测存档的组织样品中的多个靶核酸序列的方法,其包括:提供由存档的组织样品制备的核酸样品,所述样品包含多个靶核酸序列;将多组连接探针与所述靶序列杂交以形成多个连接结构;使用连接酶连接所述多个连接结构中的每一个以形成多个连接的探针;扩增所述连接的探针以形成多个扩增子;以及检测所述扩增子,作为所述多个靶核酸序列的存在的指示。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/019456中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括促进组织中转录组和/或基因组变异的表征,同时保留与组织中的靶核酸的起源相关的空间信息的方法和组合物。例如,所述方法可以使得能够鉴定携带异常突变的组织活检中的细胞或细胞簇的位置。因此,所述方法可用于诊断目的,例如用于癌症的诊断,并且可能有助于选择靶向疗法。另外或替代地,遗传生物标记物的检测可以包括一种用于空间检测和分析组织样品中的核酸的捕获阵列,其包含:捕获位点,所述捕获位点包含固定在表面上的一对捕获探针,其中所述对的捕获探针的第一捕获探针包含第一引物结合区域和空间地址区域,并且其中所述对的捕获探针的第二捕获探针包含第二引物结合区域和捕获区域。另外或替代地,遗传生物标记物的检测可以包括一种用于空间检测和分析组织样品中的核酸的方法,其包括:(a)提供包含捕获位点的捕获阵列,所述捕获位点包含固定在表面上的一对捕获探针,其中所述对的捕获探针的第一捕获探针包含第一引物结合区域和空间地址区域,并且其中所述对的捕获探针的第二捕获探针包含第二引物结合区域和捕获区域。另外或替代地,遗传生物标记物的检测可以包括一种用于空间检测和分析组织样品中的核酸的方法,其包括提供磁性纳米粒子,所述磁性纳米粒子包含含有捕获区域的固定的捕获探针。另外或替代地,遗传生物标记物的检测可以包括一种用于空间检测和分析组织样品中的核酸的捕获阵列,其包含含有捕获探针的捕获位点,所述捕获探针包含空间地址区域和转座子末端(TE)区域。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2016/130704中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括涉及评估保存或包埋或含在邻近性保留元件(CE)内的单个细胞的组分的方法和组合物。一方面是用于分析来自单个细胞的多种分析物类型的方法。在一些实施方案中,提供了多个邻近性保留元件(CE),每个CE包含单个细胞。在CE内裂解细胞,使得单个细胞内的多种分析物释放在CE内。在一些实施方案中,提供多种类型的报告子部分,使得每种类型的报告子部分对每种类型的分析物具有特异性。在一些实施方案中,所述报告子部分鉴定单个细胞。修饰多种分析物,使得每种类型的分析物包含对分析物类型具有特异性的报告子部分。在一些实施方案中,组合包含含有所述报告子部分的分析物的CE。在一些实施方案中,对组合的包含含有所述报告子部分的分析物的CE进行分隔室。在一些实施方案中,提供另外的报告子部分,并且与包含分析物的分析物组合,使得分析物包含两种或更多种不同的报告子部分。分析包含报告子部分的分析物,使得检测分析物的身份,并且报告子部分鉴定来自单个细胞的分析物的来源。在一些实施方案中,示例性的多种分析物包括但不限于DNA、RNA、cDNA、蛋白质、脂质、碳水化合物、细胞器(例如,细胞核、高尔基体、核糖体、线粒体、内质网、叶绿体、细胞膜等)、细胞代谢产物、组织切片、细胞、单个细胞、来自细胞或单个细胞的内含物、从细胞或单个细胞分离的核酸或者从细胞或单个细胞分离并进一步修饰的核酸或者无细胞DNA(例如,来自胎水或血浆的DNA)。在一些实施方案中,多种分析物包括基因组DNA和mRNA。在一些实施方案中,所述mRNA具有poly A尾部。在一些实施方案中,基因组DNA和mRNA同时固定在CE内的固体支撑物上。在一些实施方案中,基因组DNA的固定与将mRNA固定到固体支撑物是按顺序的。在一些实施方案中,将基因组DNA与转座体复合物组合,并且将转座子末端固定在固体支撑物上,并且通过固定在固体支撑物上的寡聚物(dT)探针的杂交将mRNA固定到固体。在一些实施方案中,将基因组DNA与转座体复合物组合,并且任选地转座子末端与固定在固体支撑物上的互补序列杂交,使得通过固定在固体支撑物上的寡聚物(dT)探针的杂交将mRNA固定到固体。其他方法也可以用于固定mRNA。在一些实施方案中,固体支撑物是珠粒。在一些实施方案中,固体支撑物是流通池表面。在一些实施方案中,固体表面是反应容器的壁。在一些实施方案中,所述方法包括对保存或包埋或含在CE内的核酸进行测序。一些实施方案涉及在CE内制备DNA以从靶核酸获得相移和序列组装信息,并且从此类模板获得相移和序列组装序列信息。具体实施方案涉及使用整合酶例如转座酶来维持片段化核酸的相关联末端的物理接近性;并且涉及使用组合索引来从每个CE产生个体文库。从CE获得单倍型信息包括区分靶核酸中的不同的等位基因(例如,SNP、遗传异常等)。此类方法可用于表征靶核酸中的不同等位基因,并减少序列信息中的错误率。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2002/012897中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括阵列组合物,其包含具有包括离散位点的表面的底物、至少一个基准以及至少包括第一亚群和第二亚群的微球群。每个亚群包含生物活性剂,并且微球分布在所述表面上。每个亚群可以任选地包含唯一光学签名、标识符结合配体(其结合解码器结合配体,使得可以阐明生物活性剂的鉴定)或两者。在另一方面,提供了包含计算机可读存储器以引导计算机以指定方式起作用的组合物。计算机可读存储器包括:获取模块,用于接收包括多个离散位点的随机阵列的数据图像;配准模块,用于配准数据图像;和比较模块,用于比较配准的数据图像。每个模块包括用于执行其功能的计算机代码。当底物包括光纤束、基准微球或由随机阵列生成的基准模板时,配准模块可以利用任何数量的基准,包括基准纤维。在一些实施方案中,制备阵列组合物的方法包括:在底物上形成包含个体位点的表面;将微球分布在所述表面上,使得个体位点含有微球;以及将至少一个基准掺入到所述表面上。当阵列具有完全旋转自由度时,在阵列中优选至少两个基准以允许校正旋转。另外或替代地,遗传生物标记物的检测可以包括用于比较随机阵列的单独数据图像的方法。所述方法包括:使用计算机系统来配准随机阵列的第一数据图像以产生配准的第一数据图像;使用计算机系统来配准随机阵列的第二数据图像以产生配准的第二数据图像;以及比较第一和第二配准的数据图像,以确定它们之间的任何差异。一些实施方案提供了解码随机阵列组合物的方法,其包括提供随机阵列组合物。将多个第一解码结合配体添加到阵列组合物中,并且创建第一数据图像。使用基准来生成第一配准的数据图像。将多个第二解码结合配体添加到阵列组合物中,并且创建第二数据图像。使用基准来生成第二配准的数据图像。使用计算机系统来比较第一和第二配准的数据图像,以鉴定至少两种生物活性剂的位置。一些实施方案提供了确定样品中靶分析物的存在的方法。所述方法包括:获取随机阵列组合物的第一数据图像;和将第一数据图像配准以创建配准的第一数据图像。然后将样品添加到随机阵列中,并且从阵列获取第二数据图像。配准第二数据图像以创建配准的第二数据图像。然后将第一和第二配准的数据图像进行比较以确定靶分析物的存在或不存在。任选地,数据获取可以在不同的波长下进行。一些实施方案提供了用于预处理或预过滤信号数据的方法,其包括:从阵列获取数据图像;以及确定来自至少一个阵列位点的第一信号与参考信号的相似性,以确定所述位点是否包含候选珠粒。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/136416中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于鉴定剪接变体的方法和系统。在一种实施方式中,一种方法包括:从来自单个生物样品的多个RNA序列读长中确定一个或多个样品剪接点;检索从多个健康RNA样品中确定的一组基线剪接点;将所述一个或多个样品剪接点与所述组的基线剪接点进行比较;以及鉴定一个或多个过滤的样品剪接点,所述过滤的样品剪接点包括不与基线剪接点重叠的样品剪接点,其中所述一个或多个过滤的样品剪接点是候选致癌事件。一些实施方案还包括输出候选致癌事件的列表。在一些实施方案中,多个健康RNA样品包括从以下一种或多种的代表性实例获取的健康RNA样品:地理区域、年龄、性别、种族、组织类型或样品保存质量类型。在一些实施方案中,多个健康RNA样品包括来自一种或多种组织类型的样品,所述组织类型选自由以下组成的组:肺、肾上腺、膀胱、乳腺、卵巢、肝脏、前列腺、皮肤和脾。在一些实施方案中,多个健康RNA样品包括来自不同年龄的供体的样品。在一些实施方案中,在确定来自单个样品的样品接点之前,确定来自多个健康RNA样品的基线剪接点。在一些实施方案中,用于基线剪接点的多个健康RNA样品不是从与单个生物样品相同的生物对象获得的。在一些实施方案中,基线接点来自与样品接点相同的基因组区域。在一些实施方案中,单个生物样品来自肿瘤样品。在一些实施方案中,样品剪接点和基线剪接点均使用普通测定来确定。在一些实施方案中,确定一个或多个样品接点包括:确定来自单个生物样品的多个RNA序列读长;检索与来自单个生物样品的RNA序列读长比对的DNA参考序列;以及与DNA参考相比,将一个或多个样品接点确定为RNA读长中缺失的连续位置。在一些实施方案中,过滤的样品剪接点不与第三方接点重叠,所述第三方接点由捕获给定基因的外显子的多个替代组合的剪接图确定。在一些实施方案中,确定所述组的基线剪接点而无需确定捕获给定基因的外显子的多个替代组合的剪接图。一些实施方案提供了一种用于鉴定剪接变体的系统。所述系统包括存储器;至少一个处理器;以及至少一种非暂时性计算机可读介质,其含有指令,所述指令在由所述至少一个处理器执行时致使所述至少一个处理器进行操作,所述操作包括:从来自单个生物样品的多个RNA序列读长中确定一个或多个样品剪接点;检索从多个健康RNA样品中确定的一组基线剪接点;将所述一个或多个样品剪接点与所述组的基线剪接点进行比较;以及鉴定一个或多个过滤的样品剪接点,所述过滤的样品剪接点包括不与所述组的基线剪接点重叠的样品剪接点,其中所述过滤的样品剪接点是候选致癌事件。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/093780中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种用于验证变体识别的计算机实现的方法。所述方法在一个或多个执行程序指令的处理器的控制下操作,所述程序指令用于:接收包括样品读长的测序数据,所述样品读长具有沿所关注的基因组序列的对应的核苷酸序列;接收在沿所关注的基因组序列的核苷酸序列内的指定位置处的潜在变体识别的指示;以及获得在一个或多个基线基因组序列内指定位置处的基线变体频率。所述方法获得在所关注的基因组序列的指定位置处的样品变体频率。所述方法分析在指定位置处的基线和样品变体频率以获得质量得分;并且基于质量得分验证所关注的基因组序列的潜在变体识别。任选地,分析操作包括获得样品变体频率与基线变体频率的分布之间的关系,质量得分是基于所述关系。任选地,分析操作包括相对于基线变体频率的分布来索引样品变体频率。所述关系可以基于非参数Wilcoxon秩和检验。基线变体频率指示沿基线基因组序列的对应位置处的背景噪声程度。任选地,所述验证还包括:将所述质量得分与阈值进行比较;以及当质量得分超过阈值时,宣布潜在变体识别为有效的变体识别。基线变体频率可以从与多于一种类型的等位基因相关联的多个基线基因组序列中得出。任选地,所述方法还包括:接收测序数据,所述测序数据包括沿基线基因组序列的核苷酸序列的多个参考读长;以及确定在指定位置处参考读长的基线变体频率。确定基线变体频率还可以包括:接收来自参考读长的当前碱基对窗口内的一组位置的测序数据;鉴定当前碱基对窗口内的一组位置中的一个或多个位置的候选变体频率;选择候选变体频率之一作为参考读长内的指定位置的基线变体频率;以及沿基线基因组序列移动碱基对窗口并且重复所述操作。根据以上实施方案,描述了减少来自系统错误的假阳性变体识别的系统和方法。由于诸如FFPE人为误差、测序错误、文库制备错误、PCR错误等的各种因素,可能会导致系统错误。变体识别静态地受基因座特异性背景误差分布的影响,所述基因座特异性背景误差分布可以从FFPE正常样品组套汇编而来,所述样品组套具有通过基于NGS的测定测序的各种组织的不同DNA质量。FFPE正常样品的相同测序数据也可以用于归一化由PCR、DNA质量、探针下拉效率或序列GC含量引起的读长覆盖的系统性偏差,以揭示测试样品中真实的拷贝数改变。为了进一步扩大CNV识别中的信噪比,可以在杂交捕获中添加额外的增强子探针,以提供基因扩增的稳健估计。另外或替代地,遗传生物标记物的检测可以包括解决噪声问题并防止系统错误导致假阳性变体识别的方法和系统。与此相关的是,使用一组正常样品来鉴定系统性偏差,以便使系统在背景噪声高的区域中增加肿瘤样品中的识别严格性。对于FFPE样品,正常FFPE样品可以用于构建基线。对于ctDNA样品,正常基因组DNA数据可以用于构建基线。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/068014中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于对多核苷酸进行测序的系统和方法。在一个实施方案中,所述系统包括:存储器,其包括参考核苷酸序列;处理器,其被配置来执行指令,所述指令进行包括以下的方法:从测序系统接收读长的第一核苷酸子序列;使用第一比对路径处理第一核苷酸子序列,以确定参考序列上读长的多个第一候选位置;基于所确定的候选位置,确定第一核苷酸子序列是否与参考序列对齐;从测序系统接收第二核苷酸子序列;使用以下处理第二核苷酸子序列,以确定与参考序列比对的读长的多个第二候选位置:如果读长与参考序列对齐,则使用第二比对路径,并且如果是其他情况,则使用第一比对路径,其中第二比对路径比第一比对路径在计算上更有效地确定读长的多个第二候选位置。在一个实施方案中,所述方法包括:在测序运行期间从测序系统接收第一核苷酸子序列;以及使用第一分析路径或第二分析路径,基于参考序列对读长的第一核苷酸子序列进行二次分析,其中在进行二次分析时,第二分析路径比第一处理路径在计算上更有效。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/057770中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括检测生物样品中的拷贝数变化。在一个实施方案中,拷贝数变体的大小可以是至少单个基因。在另一个实施方案中,拷贝数变体可以是至少140bp、140-280bp或至少500bp。在一个实施方案中,“拷贝数变体”是指通过将测试样品中所关注的序列与所关注的序列的预期水平进行比较发现拷贝数差异的核酸的序列。在一些实施方案中,参考样品来源于一组不匹配样品的测序数据,以生成归一化信息,所述归一化信息允许个体测试样品被归一化,使得可以在归一化测序数据上确定与预期拷贝数的偏差。归一化数据使用所提供的技术生成,并且允许归一化为与测试样品匹配的假设最有代表性的样品。通过对测试样品进行归一化,可以去除测序引起的噪声或其他偏差。在某些实施方案中,对来自靶向测序运行的原始测序数据覆盖进行归一化以减少技术和生物噪声以改善CNV检测。在一个实施方案中,根据所需的测序技术,诸如使用探针的测序组套来靶向所关注的靶区域的靶向测序技术,对所关注的样品(例如,固定的福尔马林石蜡包埋的样品)进行测序。一旦收集了测序数据,就对测序数据进行归一化以去除噪声,并且随后分析归一化的数据以检测CNV。在一些实施方案中,提供了一种对拷贝数进行归一化的方法,其包括以下步骤:从用户接收测序请求以对生物样品中的一个或多个所关注的区域进行测序;从与生物样品不匹配的多个基线生物样品中的一个或多个所关注的区域中获取基线测序数据;使用基线测序数据确定拷贝数归一化信息,其中拷贝数归一化信息包括一个或多个所关注的区域中的所关注的区域的至少一个拷贝数基线;以及向用户提供拷贝数归一化信息。在另一个实施方案中,提供了一种检测拷贝数变化的方法,其包括以下步骤:从生物样品中获取测序数据,其中所述测序数据包括针对相应多个所关注的区域的多个原始测序读长计数;以及对测序数据进行归一化,以去除区域依赖性覆盖。所述归一化包括:对于每个所关注的区域,将生物样品的所关注的区域中一个或多个分仓的原始测序读长计数与基线中值测序读长计数进行比较,以生成所关注的区域中一个或多个分仓的基线校正的测序读长计数,其中所关注的区域中一个或多个分仓的基线中值测序读长计数从与生物样品不匹配的多个基线样品得出,并且仅从每个所关注的区域的基线测序数据的最有代表性的部分确定;以及从基线校正的测序读长计数中去除GC偏差,以生成每个所关注的区域的归一化的测序读长计数。所述方法还包括基于每个所关注的区域中一个或多个分仓的归一化的测序读长计数来确定每个所关注的区域中的拷贝数变化。在另一个实施方案中,提供了一种评估靶向测序组套的方法,其包括以下步骤:针对靶向测序组套鉴定基因组中的多个第一靶,其中所述多个第一靶对应于相应多个基因的部分;确定多个第一靶中的每一个的GC含量;消除多个第一靶中GC含量在预定范围之外的的靶,以产生小于多个第一靶的多个第二靶;在消除之后,当个体基因的对应于个体基因的部分的靶少于预定数量时,鉴定个体基因中的另外的靶;将另外的靶添加到多个第二靶中以产生多个第三靶;以及提供包含对所述多个第三靶具有特异性的探针的测序组套。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/197027中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于富集或扩增多核苷酸的方法,并且更具体地涉及用于使用核酸内切酶系统(例如,CRISPR-Cas系统或Argonaute系统)富集或扩增靶DNA序列的方法及其应用。另外或替代地,遗传生物标记物的检测可以包括用于使用CRISPR-Cas系统扩增靶双链核酸的方法。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增靶双链核酸的方法,其包括:(a)提供一种系统,其具有:成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)或其衍生物,和CRISPR相关(Cas)蛋白或其变体,其中crRNA或其衍生物含有与靶双链核酸的第一链的区域互补的靶特异性核苷酸区域;(b)使靶双链核酸与所述系统接触以形成复合物;(c)将引物与靶双链核酸的第二链杂交,所述引物含有与靶双链核酸的第二链的区域互补的序列;以及(d)使用聚合酶从引物延伸与靶双链核酸的第二链互补的核酸。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增靶双链核酸的方法,其包括:(a)提供第一系统,其具有:第一成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)或其衍生物,和第一CRISPR相关(Cas)蛋白或其变体,其中第一crRNA或其衍生物含有与靶双链核酸的第一链的区域互补的靶特异性核苷酸区域;(b)提供第二系统,其具有:第二成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)或其衍生物,和第二CRISPR相关(Cas)蛋白或其变体,其中第二crRNA或其衍生物含有与靶双链核酸的第二链的区域互补的靶特异性核苷酸区域;(c)使靶双链核酸与第一系统和第二系统接触;(d)将第一引物与靶双链核酸的第二链杂交,所述第一引物含有与靶双链核酸的第二链的区域互补的序列,并且将第二引物与靶双链核酸的第一链杂交,所述第二引物含有与靶双链核酸的第一链的区域互补的序列;以及(e)用一种或多种聚合酶延伸第一引物和第二引物的3’末端以生成第一和第二双链靶核酸。在一些实施方案中,所述方法还包括重复步骤(a)和步骤(e)一次或多次,例如直至达到所需的扩增程度为止。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增靶双链核酸的方法,其包括:(a)提供一种系统,其具有:5’磷酸化的单链核酸或其衍生物,和Argonaute蛋白或其变体,其中所述5’磷酸化的单链核酸或其衍生物含有与靶双链核酸的第一链的区域互补的靶特异性核苷酸区域;(b)使靶双链核酸与所述系统接触以形成复合物;(c)将引物与靶双链核酸的第二链杂交,所述引物含有与靶双链核酸的第二链的区域互补的序列;以及(d)使用聚合酶从引物延伸与靶双链核酸的第二链互补的核酸。另外或替代地,遗传生物标记物的检测可以包括一种用于富集靶核酸的方法,其包括:从受试者的血浆或血清获得无细胞DNA(cfDNA)群体,所述无细胞DNA群体含有靶核酸;提供一种系统,其具有:5’磷酸化的单链核酸或其衍生物,和Argonaute蛋白或其变体,其中所述5′磷酸化的单链核酸或其衍生物含有与靶核酸的区域互补的靶特异性核苷酸区域;使靶核酸与核酸内切酶系统接触以形成复合物;以及分离所述复合物,并且从而富集靶核酸。另外或替代地,遗传生物标记物的检测可以包括一种用于检测单核苷酸变体(SNV)的方法,其包括:从受试者的血浆或血清获得无细胞DNA群体;提供第一系统,其具有:第一5’磷酸化的单链核酸或其衍生物,和第一Argonaute蛋白或其变体,其中所述第一5′磷酸化的单链核酸或其衍生物含有与第一靶核酸的区域互补的第一靶特异性核苷酸区域,并且其中第一Argonaute蛋白具有核酸酶活性;使用第一核酸内切酶系统使第一靶核酸裂解;以及使用聚合酶链反应(PCR)扩增第二靶核酸,其中第二靶核酸含有第一靶核酸的单核苷酸变体形式。另外或替代地,遗传生物标记物的检测可以包括一种用于标记靶核酸的方法,其包括:提供第一系统,其具有:5’磷酸化的单链核酸或其衍生物,和第一Argonaute蛋白或其变体,其中第一5′磷酸化的单链核酸或其衍生物含有与靶核酸的第一区域互补的第一靶特异性核苷酸区域,并且其中第一Argonaute蛋白能够生成单链切口;使含有靶核酸的双链核酸与第一核酸酶系统接触,以在靶核酸的第一区域处生成第一单链切口;以及标记靶核酸。在一些实施方案中,所述方法还包括通过标记分离靶核酸,并且从而富集靶核酸。在一些实施方案中,所述方法还包括扩增靶核酸。在一些实施方案中,所述方法还包括:提供第二系统,其具有:第二5′磷酸化的单链核酸或其衍生物,和第二Argonaute蛋白或其变体,其中所述第二5′磷酸化的单链核酸或其衍生物含有与靶核酸的第二区域互补的第二靶特异性核苷酸区域,并且其中第二Argonaute蛋白能够生成单链切口;以及使含有靶核酸的双链核酸与第二核酸酶系统接触,以在靶核酸的第二区域处生成第二单链切口,其中靶核酸的第一区域与靶核酸的第二区域不同。另外或替代地,遗传生物标记物的检测可以包括一种用于富集靶核酸的方法,其包括:提供用一组5′磷酸化的单链核酸程序化的Argonaute蛋白群体,其中所述组的5′磷酸化的单链核酸含有与靶核酸的一系列不同区域互补的5′磷酸化的单链核酸;使靶核酸与用所述组的5’磷酸化的单链核酸程序化的Argonaute蛋白群体接触以生成一系列核酸片段;以及将衔接子连接到至少一个核酸片段,其中Argonaute蛋白能够生成双链DNA断裂。另外或替代地,遗传生物标记物的检测可以包括一种用于对靶核酸进行测序的方法,其包括:提供用一组5′磷酸化的单链核酸程序化的Argonaute蛋白群体,其中所述组的5′磷酸化的单链核酸含有与跨靶核酸的一系列不同区域互补的5′磷酸化的单链核酸;使靶核酸与用所述组的5’磷酸化的单链核酸程序化的Argonaute蛋白群体接触以生成一系列核酸片段;以及对所述系列的核酸片段进行测序。另外或替代地,遗传生物标记物的检测可以包括一种用于对靶核酸进行测序的方法,其包括:提供多个Argonaute蛋白群体,每个Argonaute蛋白群体用一组不同的5′磷酸化的单链核酸程序化,其中每组5′磷酸化的单链核酸含有与跨靶核酸的不同系列区域互补的5′磷酸化的单链核酸;在单独的反应中使靶核酸与多个Argonaute蛋白群体中的每一个接触以生成不同系列的核酸片段;以及对核酸片段进行测序。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2015/198074中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于呈现序列信息的方法、设备、系统和计算机程序产品。在一些实施方案中,这包括:获得第一序列和第二序列;确定第一序列与第二序列之间的相似性,其中相似性基于第一序列与第二序列之间的距离;以及基于第一序列与第二序列之间的相似性,在矩阵图上显示交叉点处的块。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2002/099982中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种组合物,其包含具有包括离散位点的表面的底物、表面上的反射涂层以及分布在底物上的微球群。微球至少包括第一亚群和第二亚群。通常,至少一个亚群包含生物活性剂。另外或替代地,遗传生物标记物的检测可以包括一种组合物,其中底物包括第一表面和第二表面,其中第一表面包括离散位点,并且反射涂层在第二表面上。微球群分布在第一表面上。另外或替代地,遗传生物标记物的检测可以包括一种制备反射阵列的方法。所述方法包括提供具有包括离散位点的表面的底物,在表面上施加反射材料的涂层以及将微球分布在表面上。另外或替代地,遗传生物标记物的检测可以包括检测样品中未标记的靶分析物的方法,其包括提供具有多个离散位点的底物,在所述位点上分布包含生物活性剂和信号转导器元件的微球群,使底物与样品接触,从而在靶分析物与生物活性剂结合时,来自信号转导器元件的信号发生改变,作为存在靶分析物的指示。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2002/016649中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种检测靶核酸的方法。所述方法包括使靶核酸与衔接子序列接触,使得靶核酸与衔接子序列连接以形成修饰的靶核酸。另外,所述方法包括:使修饰的靶核酸与阵列接触,所述阵列包含具有包括离散位点的表面的底物和至少包括第一亚群的微球群,所述第一亚群包含第一捕获探针,使得所述第一捕获探针和所述修饰的靶核酸形成复合物,其中微球分布在表面上;以及检测靶核酸的存在。另外,所述方法包括将至少一种解码结合配体添加到阵列中,使得确定靶核酸的身份。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,914,973中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于检测基因失调的方法、组合物和试剂盒,所述基因失调诸如由基因融合和染色体易位引起的那些。所述方法、组合物和试剂盒可用于检测导致靶基因的5′区相对于靶基因的3′区的差异表达的突变。另外或替代地,遗传生物标记物的检测可以包括一种用于检测测试样品中靶基因中的失调的存在或不存在的方法。在一个实施方案中,所述方法包括:(a)用针对靶基因的5′区的部分的两个或更多个不同的5′靶引物对扩增靶基因或来源于其的cDNA(如果存在于测试样品中)的转录物的5′区的部分;(b)用针对靶基因的3′区的部分的两个或更多个不同的3′靶引物对扩增靶基因或来源于其的cDNA(如果存在于测试样品中)的转录物的3′区的部分;(c)检测通过两个或更多个5′靶引物对和两个或更多个3′靶引物对产生的扩增产物;(d)确定两个或更多个5′靶引物对中的平均循环阈值(Ct)和两个或更多个3′靶引物对中的平均Ct;(e)计算作为5′靶引物对中的平均循环阈值与3′靶引物对中的平均循环阈值之间的差值的IDE得分;以及(f)如果IDE得分与临界值显著不同,则将测试样品鉴定为(i)具有靶基因失调,并且差值指示存在靶基因失调,或者如果测试样品中的IDE得分与临界值没有显著不同,则将测试样品鉴定为(ii)不具有靶基因失调。另外或替代地,遗传生物标记物的检测可以包括一种用于诊断受试者中癌症的存在或不存在或对癌症的易感性的方法。在一个实施方案中,所述方法包括:(a)从受试者获得包含核酸的测试样品;(b)针对靶基因的5′区的部分的两个或更多个不同的5′靶引物对扩增靶基因或来源于其的cDNA(如果存在于测试样品中)的转录物的5′区的部分;(c)用针对靶基因的3′区的部分的两个或更多个不同的3′靶引物对扩增靶基因或来源于其的cDNA(如果存在于测试样品中)的转录物的3′区的部分;(d)检测通过两个或更多个5′靶引物对和两个或更多个3′靶引物对产生的扩增产物;(e)确定两个或更多个5′靶引物对中的平均循环阈值(Ct)和两个或更多个3′靶引物对中的平均Ct;(f)计算作为5′靶引物对中的平均循环阈值与3′靶引物对中的平均循环阈值之间的差值的IDE得分;以及(g)当IDE得分与临界值显著不同,则将受试者诊断为(i)患有癌症或具有对癌症的易感性,并且差值指示癌症的存在或对癌症的易感性,或者如果测试样品中的IDE得分与临界值没有显著不同,则将受试者诊断为(ii)未患由靶基因的失调引起的癌症或没有对癌症的易感性。在一些实施方案中,通过使用针对靶基因的5′区的不同部分的两个、三个、四个、五个或六个不同的引物对进行扩增来确定靶基因的5′区的表达水平。类似地,针对靶基因的3′区的不同部分的两个、三个、四个、五个或六个不同的引物对可以用于确定靶基因的3′区的表达水平。每个扩增产物的量可以归一化到内源对照基因转录物(“对照”)(例如像ABL)的量。在一些实施方案中,可以使用实时PCR并比较每个扩增子的阈值循环(Ct)来确定转录物的表达水平或相对量。靶基因的3′(avgCt3′)和5′(avgCt5′)区域中每一个的平均Ct值用于计算IDE得分,其可以计算为IDE=(avgCt5′-avgCt3′)或IDE=(avgCt5′)/(Ct对照)-(avgCt3′)/(Ct对照)或IDE=[Ln((avgCt5′)/Ct对照)]-[Ln((avgCt3′)/Ct对照)]。在一些实施方案中,将Ct值归一化到参考样品。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,783,854中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于以非常低的水平并且在大量非靶核酸的存在下检测靶核酸的方法和组合物。通常,靶和非靶核酸通过片段化位点,诸如限制性酶识别位点的存在或不存在来区分。通过断裂位点区别靶和非靶,所述方法和组合物可以与本领域已知的各种核酸检测方法一起使用,诸如PCR。另外或替代地,遗传生物标记物的检测可以包括一种用于通过在非靶核酸的存在下测试潜在地含有靶核酸的样品来检测靶核酸的存在或不存在的方法,所述方法包括:a)在一定条件下对样品核酸进行片段化,使得针对靶核酸的后续扩增与没有片段化的扩增相比引起超过非靶核酸的靶核酸检测增加;b)用一对引物扩增靶核酸,其中第一引物对靶核酸具有特异性;以及c)检测扩增产物的存在或不存在,这指示样品中靶核酸的存在或不存在。另外或替代地,遗传生物标记物的检测可以包括一种用于通过确定个体是否具有与癌症或肿瘤细胞类型相关联的突变体序列来诊断癌症或检测肿瘤细胞的存在的方法,所述方法包括:a)从个体获得包含核酸的样品;b)在一定条件下对样品核酸进行片段化,使得针对靶核酸的后续扩增与没有片段化的扩增相比引起超过非靶核酸的靶核酸检测增加;c)用一对引物扩增靶核酸,其中第一引物对靶核酸具有特异性;以及d)检测含有突变体序列的扩增产物的存在或不存在,其中通过含有突变体序列的扩增产物的存在、不存在或量来确定癌症的诊断。另外或替代地,遗传生物标记物的检测可以包括一种用于通过确定个体是否具有与癌症相关联的突变体序列来确定癌症预后的方法,所述方法包括:a)从个体获得含有核酸的样品;b)在一定条件下对突变体核酸进行片段化,使得针对突变体核酸的后续扩增与没有片段化的扩增相比引起超过非突变体核酸的突变体核酸检测增加;c)用一对引物扩增突变体核酸,其中第一引物对突变体核酸具有特异性;以及d)检测含有突变体序列的扩增产物的存在、不存在和/或量,其中个体中的结果的可能性与突变体序列的存在和或量相关联。另外或替代地,遗传生物标记物的检测可以包括一种用于确定被诊断患有癌症的个体的药物敏感性的方法,所述方法包括:a)从个体获得包含核酸的样品;b)在一定条件下对突变体核酸进行片段化,使得针对突变体核酸的后续扩增与没有片段化的扩增相比引起超过非突变体核酸的突变体核酸检测增加;c)用一对引物扩增突变体核酸,其中第一引物对突变体核酸具有特异性;d)检测含有突变体序列的扩增产物的存在、不存在和/或量;以及e)将含有突变体序列的扩增产物的存在、不存在和/或量与癌症药物敏感性相关。在一些实施方案中,突变的核酸序列是由于缺失、插入、取代和/或易位或其组合。在优选实施方案中,其中用限制性酶裂解野生型序列的核酸序列的片段化,这种预扩增消化处理允许片段化破坏或基本上减少可能扩增的野生型序列的数量。在更优选的实施方案中,使用限制性酶的片段化与突变特异性引物(或突变序列引物)的使用组合。在优选实施方案中,突变的序列破坏或扰乱存在于对应的野生型序列中的限制性酶识别位点,并且突变特异性引物可以被设计来结合序列的突变形式但不结合其野生型对应物。例如,突变特异性引物可以与边界区域重叠,所述边界区域是含有邻近突变的序列的一部分的两个野生型序列的一部分的区域。在一种方法中,通过扩增和检测所得的扩增产物来测定样品中突变的序列的存在或不存在。在优选实施方案中,靶核酸的扩增通过聚合酶链反应(PCR)来实现。可以测定单个或多个突变体序列。多个突变体序列的扩增可以在单个反应容器中同时进行,例如多重PCR。在这种情况下,探针可以可区分地标记,并且/或者扩增子可以通过大小差异来区分。替代地,所述测定可以在单独反应容器中平行进行。在这种后者情况下,探针可以具有相同的标记。在一些实施方案中,所述方法还包括核酸提取步骤。在一些实施方案中,扩增反应中的每个引物对的至少一个引物用可检测部分标记。因此,在扩增之后,可以通过大小和颜色鉴定不同靶片段。可检测部分优选是荧光染料。在一些实施方案中,多重PCR中的不同引物对可以用不同的可区分的可检测部分标记。因此,例如,HEX和FAM荧光染料可以存在于多重PCR中的不同引物上,并且与所得的扩增子相关联。在其他实施方案中,正向引物用一个可检测部分标记,而反向引物用不同的可检测部分标记,例如FAM染料用于正向引物,而HEX染料用于反向引物。使用不同的可检测部分可用于分辨长度相同或长度非常相似的扩增产物。因此,在某些实施方案中,至少两种不同的荧光染料用于标记单个扩增中使用的不同引物。在又一个实施方案中,对照引物可以用一个部分标记,而患者(或测试样品)引物可以用不同的部分标记,以允许两种样品混合(PCR后)以及同时检测和比较正常样品和测试样品的信号。在此实施方案的变型中,可以切换用于对照样品和患者样品的引物以允许进一步确认结果。
可以使用自动DNA分析仪,诸如自动DNA测序仪(例如,ABI PRISM 3100 Genetic分析仪)对来自扩增反应(诸如多重PCR)的扩增产物进行分析,所述分析仪可以基于大小(通过电泳迁移率确定)和/或相应的荧光标记来评估扩增产物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,546,404中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括针对基因失调的检测的方法、组合物和试剂盒,所述基因失调诸如由基因融合和染色体异常引起的那些,所述染色体异常例如易位、插入、倒位和缺失。在一些实施方案中,所述方法、组合物和试剂盒可用于检测导致靶基因的5′区相对于靶基因的3′区的差异表达的突变。另外或替代地,遗传生物标记物的检测可以包括一种用于检测靶基因中的失调的方法。所述方法可以包括:(a)用一个或多个与靶基因的5′区互补的5′靶引物对,扩增生物样品中的靶基因转录物(如果存在)的5′区;(b)用一个或多个与靶基因的3′区互补的3′靶引物对,扩增生物样品中的靶基因转录物(如果存在)的3′区;以及(c)检测由一个或多个5′靶引物对和一个或多个3′靶引物对产生的扩增产物的量。所述方法还可以提供:由步骤(a)和(b)产生的扩增产物的量的差异指示靶基因失调。另外或替代地,遗传生物标记物的检测可以包括一种用于检测样品中靶基因中的失调的存在或不存在的方法。所述方法可以包括:(a)测量测试样品中靶基因的5′区和靶基因的3′区的转录的量;以及(b)将测试样品中靶基因的5′区与3′区的相对表达与参考样品中靶基因的5′区与3′区的相对表达进行比较。所述方法还可以提供:测试样品中的相对表达与参考样品相比的差异指示基因失调的存在。在一个实施方案中,可以使用实时PCR并比较每个扩增子的阈循环值或Ct值来确定转录物的相对量。可以将Ct值标归一化到参考样品。另外或替代地,遗传生物标记物的检测可以包括一种用于诊断受试者中的癌症或对癌症的易感性的方法。所述方法可以包括:(a)用一个或多个与靶基因的5′区互补的5′靶引物对,扩增生物样品中的靶基因转录物(如果存在)的5′区;(b)用一个或多个与靶基因的3′区互补的3′靶引物对,扩增生物样品中的靶基因转录物(如果存在)的3′区;以及(c)检测由一个或多个5′靶引物对和一个或多个3′靶引物对产生的扩增产物的量。所述方法还可以提供:由步骤(a)和(b)产生的扩增产物的量的差异指示受试者患有由基因失调引起的癌症或易患癌症。另外或替代地,遗传生物标记物的检测可以包括一种用于诊断受试者中的前列腺癌或对前列腺癌的易感性的方法。所述方法可以包括:(a)用一个或多个与靶基因的5′区互补的5′靶引物对,扩增生物样品中的靶基因转录物(如果存在)的5′区;(b)用一个或多个与靶基因的3′区互补的3′靶引物对,扩增生物样品中的靶基因转录物(如果存在)的3′区;以及(c)检测由一个或多个5′靶引物对和一个或多个3′靶引物对产生的扩增产物的量。所述方法还可以提供:由步骤(a)和(b)产生的扩增产物的量的差异指示靶基因失调。任选地,可以对含有所关注的靶基因的核酸样品进行另一种分析以确定基因失调的性质。合适的分析包括例如比较性杂交(例如,比较性基因组杂交)。诸如比较性基因组杂交(CGH)的比较性杂交技术受到以下事实的限制:此技术仅能够检测不平衡的重排(导致遗传物质获得或丢失的重排)。比较性杂交不能充分检测染色体异常,诸如平衡易位。因此,任何方法都可以与比较性杂交技术组合使用。与单独使用比较性杂交技术相比,将所述方法与比较性杂交(例如,CGH)组合将能够检测平衡和不平衡的重排,并且提供更准确的诊断。在不平衡重排的情况下,比较性杂交技术可以用作确认测定。在一些实施方案中,靶基因失调可以由基因融合和染色体异常引起,所述染色体异常包括例如易位、缺失、倒位和插入。在一些实施方案中,在多重扩增反应中,使生物样品与一个或多个5′靶引物对和一个或多个3′靶引物接触。在一个实施方案中,使用与每个扩增产物互补的加标记的寡核苷酸探针实现检测。例如,每个寡核苷酸探针可以包含不同的可检测标记,诸如供体荧光团和淬灭剂部分。在另一个实施方案中,5′区的引物中的至少一个和/或3′区的引物中的至少一个优选地用不同的可检测标记进行可检测地标记。在说明性实施方案中,使用定量RT-PCR,例如实时RT-PCR进行扩增。在一些实施方案中,染色体异常选自由以下组成的组:易位、缺失、倒位和插入。在一个实施方案中,生物样品是来自受试者的待测试染色体异常的样品。在一些实施方案中,所述方法还包括:用与内源对照基因互补的引物对扩增生物样品中存在的内源对照基因转录物的区域;以及检测所述内源对照基因的区域的扩增。在一些实施方案中,扩增的靶基因转录物(即,5′区和3′区)的量可以被归一化到扩增的内源对照基因转录物的量。在一些实施方案中,所述方法还包括:(a)测量测试样品中第二靶基因的5′区和第二靶基因的3′区的转录的量;以及(b)将测试样品中第二靶基因的5′区与3′区的相对表达与参考样品中第二靶基因的5′区与3′区的相对表达进行比较。所述方法还可以提供:测试样品中靶基因和第二靶基因两者的相对表达与参考样品相比的差异指示靶基因:第二靶基因易位的存在。合适的生物样品包括例如全血、分离的血细胞、血浆、血清和尿液。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,911,942中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种通过比较与核酸阵列杂交的测试核酸和参考核酸的量来进行比较杂交的方法,所述量通过检测来自用相同的可检测标记加标记的杂交的核酸的信号来确定。所述方法通常适用于比较性杂交方法,尤其适用于比较性基因组杂交(CGH)。因此,对其中测试核酸和参考核酸是基因组核酸的CGH的参考应理解为涵盖其中测试核酸和参考核酸不是基因组核酸的方法。在优选实施方案中,使用基因组核酸的两个样品进行CGH;含有基因组核酸的测试样品,以及含有没有已知的染色体或遗传异常的基因组核酸的参考样品或对照样品。将测试样品和参考样品与核酸阵列共杂交,所述核酸阵列含有在离散位置处滴加到表面(诸如载玻片)上的多个核酸或核酸片段。所述阵列可以含有某些已知遗传突变或疾病状态的靶核酸标记物,或者可以代表(整体上)整个染色体或全染色体补体,以获得类似于核型分析的遗传谱。在这些方法中,可以在杂交之前或杂交之后将可检测标记附接到测试核酸和参考核酸。在另一种方法中,可以在杂交之前将可检测标记附接到测试核酸或参考核酸之一,而在杂交之后将所述标记附接到测试核酸或参考核酸中的另一个。可检测标记可以诸如通过配体-受体相互作用或通过互补核苷酸序列之间的杂交被共价或非共价连接。在一些实施方案中,可以通过可以被称为“加成”方法的另一种方法,使用相同的可检测标记进行比较性杂交。根据这种方法,测试样品核酸包含第一标签;并且参考样品核酸包含第二标签。杂交后,使表面与含有可检测标记和第一实体的第一复合物接触,使得第一复合物选择性地与第一标签结合。下一步包括确定结合阵列表面的可检测标记的位置和量(即,“读取”阵列)。一旦读取阵列以确定与包含第一标签的核酸相关联的可检测标记的量,然后使表面与第二复合物接触,所述第二复合物含有与第一复合物中存在的相同的可检测标记并且含有第二实体,使得第二复合物选择性地与第二标签结合。然后第二次读取所述阵列以确定代表两种与表面杂交的核酸的总可检测标记的位置和量。最后一步包括使用两个读长的结果以确定与第二标签相关联的杂交核酸的量。在优选方法中,从第二读长中减去第一读长,以获得代表连接到第二标签的核酸的信号。由此确定的来自两个样品的信号可以用于鉴定测试样品基因组核酸与参考样品基因组核酸之间的差异,以便检测与测试样品核酸相关联的任何染色体或遗传异常。在一些实施方案中,与第二标签相关联的杂交核酸的量可以使用杂交阵列的尚未与第一复合物接触的重复阵列来确定。因此,使重复阵列与第二复合物而不是第一复合物接触。来自此第二阵列的信号直接代表具有第二标签的杂交核酸的量,可以使其与来自仅与第一复合物接触的第一阵列并且代表与第一标签相关联的杂交核酸的量的信号的量进行比较。因为两个分析彼此独立,因此可以按任何顺序或同时处理每个阵列。在一些实施方案中,可以首先将阵列与测试核酸和参考核酸杂交,其中测试核酸和参考核酸之一已经被标记(例如,通过随机引发)。在杂交之后,读取阵列以确定与特定加标记的核酸样品对应的信号。然后使阵列与包含可检测标记和实体的复合物接触,其中所述复合物通过附接到测试核酸或参考核酸中的另一者的标签选择性地与测试核酸或参考核酸中的所述另一者反应。再次读取测定以测量两种杂交核酸的总信号。下一步包括使用两个读长的结果以确定与标签相关联的杂交核酸的量。在优选方法中,从第二读长中减去第一读长,以获得代表连接到标签的核酸的信号。由此确定的来自两个样品的信号可以用于鉴定测试样品基因组核酸与参考样品基因组核酸之间的差异,以便检测与测试样品核酸相关联的任何染色体或遗传异常。在一些实施方案中,可以使用杂交阵列的重复阵列来确定与第二标签相关联的杂交核酸,不同的是所述重复阵列是通过与不含可检测标记的测试核酸和参考核酸杂交来制备的。在这种情况下,使重复阵列与包含可检测标记和实体的复合物接触,其中所述复合物通过附接到测试核酸或参考核酸中的另一者的标签选择性地与所述测试核酸或参考核酸中的另一者反应。来自此第二阵列的信号直接代表具有第二标签的杂交核酸的量,可以使其与来自仅与第一复合物接触的第一阵列并且代表与第一标签相关联的杂交核酸的量的信号的量进行比较。因为两个分析彼此独立,因此可以按任何顺序或同时处理每个阵列。另外或替代地,遗传生物标记物的检测可以包括一种将测试样品与参考样品中的基因表达进行比较的方法。所述方法的第一步包括在杂交条件下,使由测试样品的mRNA制备的cDNA和由参考样品的mRNA制备的cDNA与含有多个核酸片段的表面接触,每个核酸片段固定在表面上的离散位置处。在这种情况下,在杂交之前或之后用相同的可检测标记来标记测试样品cDNA和参考样品cDNA,所述可检测标记通过第一连接与测试样品的cDNA连接,并且通过第二连接与参考样品的cDNA连接。第一连接或第二连接均易于选择性去除,并且确定了连接到与表面杂交的核酸的可检测标记。确定连接到与支撑物的表面杂交的核酸的可检测标记的位置和量。然后从杂交的测试样品cDNA或杂交的参考样品cDNA中选择性去除标记。然后确定留在支撑物上的可检测标记的位置和量,并且代表样品之一。去除之后剩下的位置和量与去除之前的位置和量之间的差异代表其他样品。与阵列杂交的每个样品核酸的相对量反映了与参考样品相比测试样品中基因的表达。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,871,687中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于确定多核苷酸内的连续碱基的序列的方法,所述方法依赖于使用带标记的双脱氧核苷酸终止子的单碱基引物延伸。将引物固定到固体支撑物(例如,微球或二维阵列),从而允许鉴定掺入到每个引物中的加标记的终止子。关于掺入的终止子的数据用于确定靶核酸中核苷酸的连续序列的碱基身份。另外或替代地,遗传生物标记物的检测可以包括一种用于确定包含靶核酸的至少四个碱基的连续序列的方法,其包括:(a)制备一种或多种含有靶核酸和四个或更多个与靶核酸的一部分互补的引物的反应混合物,使得每个引物具有位于待确定的序列的每个核苷酸位置的5′末端的3′末端,其中每个反应含有任何组合的一个至所有的所述引物,并且在引物与靶核酸退火的条件下;(b)在一个或多个加标记的双脱氧核苷酸的存在下,用聚合酶延伸来自步骤(a)中的一个或多个引物;(c)将所述引物固定在固体支撑物;以及(d)检测掺入到每个引物中的双脱氧核苷酸的标记,并且利用此信息来确定靶核酸的至少四个碱基的所述连续序列。引物可以在固定到固体支撑物之前延伸,即步骤(b)在步骤(c)之前发生,或者在固定到固体支撑物之后延伸,即步骤(c)在步骤(a)之前发生。在一个实施方案中,在相同的反应混合物中提供至少两种加不同标记的双脱氧核苷酸。在另一个实施方案中,在相同的反应混合物中提供四种加不同标记的双脱氧核苷酸。另外或替代地,遗传生物标记物的检测可以包括用于通过进行单重单碱基引物延伸反应或多重单碱基引物延伸反应来确定靶核酸的四个或更多个碱基的连续序列的方法。在一个实施方案中,将对应于待测序的靶核酸的整个部分的四个或更多个引物组合在单个反应混合物中。在另一个实施方案中,将两个或更多个引物组合在一种反应混合物中,并且将两个或更多个引物组合在另外的一种或多种反应混合物中。替代地,将四个或更多个引物各自添加到单独的反应混合物中。在一个实施方案中,引物包含标签序列,并且通过与缀合到固体支撑物的互补捕获寡核苷酸杂交而被固定到固体支撑物。在另一个实施方案中,引物通过共价连接固定到固体支撑物。在一个实施方案中,固体支撑物是加标记的微球。例如,微球可以由聚苯乙烯制成。在一个实施方案中,基于至少两种染料的变化浓度,光学检测每个微球的标记。在某些实施方案中,通过流式细胞术检测加标记的微球和加标记的双脱氧核苷酸。在另一个实施方案中,固体支撑物是二维阵列,并且固定的引物定位在阵列上。引物可以通过共价连接或接头序列固定到阵列。在某些实施方案中,通过扫描阵列来检测具有加标记的双脱氧核苷酸的延伸引物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,492,089中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种通过比较与核酸阵列杂交的测试核酸和参考核酸的量来进行比较杂交的方法,所述量通过检测来自用相同的可检测标记加标记的杂交的核酸的信号来确定。所述方法通常适用于比较性杂交方法,尤其适用于CGH。因此,对其中测试核酸和参考核酸是基因组核酸的CGH的参考应理解为涵盖其中测试核酸和参考核酸不是基因组核酸的方法。在优选实施方案中,使用基因组核酸的两个样品进行CGH:含有基因组核酸的测试样品,以及含有没有已知的染色体或遗传异常的基因组核酸的参考样品或对照样品。将测试样品和参考样品与核酸阵列共杂交,所述核酸阵列含有在离散位置处滴加到表面(诸如载玻片)上的多个核酸或核酸片段。所述阵列可以含有某些已知遗传突变或疾病状态的靶核酸标记物,或者可以代表(整体上)整个染色体或全染色体补体,以获得类似于核型分析的遗传谱。在这些方法中,可以在杂交之前或杂交之后将可检测标记附接到测试核酸和参考核酸。在另一种方法中,可以在杂交之前将可检测标记附接到测试核酸或参考核酸之一,而在杂交之后将所述标记附接到测试核酸或参考核酸中的另一个。可检测标记可以诸如通过配体-受体相互作用或通过互补核苷酸序列之间的杂交被共价或非共价连接。在一些实施方案中,测试样品和参考样品用可检测标记来标记;优选地,测试样品和参考样品用相同的可检测标记来标记;优选地,可检测标记是荧色物;优选地,可检测标记是dCTP-Cy3。在某些方面,提供了允许使用单个标记来确定与阵列杂交的测试核酸和参考核酸的相对量的方法。另外或替代地,遗传生物标记物的检测可以包括一种确定测试样品与参考样品中的核酸之间的差异的方法,其中所述方法涉及:扩增来自测试样品核酸的核酸序列并且扩增来自参考样品核酸的核酸序列,其中扩增反应中的一个是使用dUTP而不是dTTP进行的,并且另一个是使用dTTP而不是dUTP进行的;将包含扩增的测试样品和扩增的参考样品的溶液与核酸阵列杂交;以及确定结合阵列的杂交测试核酸和参考核酸的相对量。在某些实施方案中,确定杂交的测试核酸和参考核酸的相对量包括:a)确定与阵列杂交的可检测标记的信号,其代表杂交的测试核酸和参考核酸的总量;b)用选择性降解具有尿嘧啶残基的DNA的酶处理杂交的核酸;以及c)确定在步骤b)之后与阵列杂交的可检测标记的信号,所述信号代表杂交的测试核酸或参考核酸之一。在特别优选的实施方案中,选择性地降解具有尿嘧啶残基的DNA的酶是尿嘧啶-DNA N-糖基化酶(UNG)。另外或替代地,遗传生物标记物的检测可以包括一种确定测试样品与参考样品中的核酸之间的差异的方法,其中所述方法涉及:(a)在杂交条件下,使含有核酸的测试样品和含有核酸的参考样品与含有多个核酸片段的表面接触,每个核酸片段固定在表面上的离散位置处,其中测试样品和参考样品在杂交之前或之后用相同的可检测标记来标记;(b)确定连接到与表面杂交的核酸的可检测标记的位置和量;(c)选择性地去除杂交的测试样品核酸或杂交的参考样品核酸;(d)确定步骤(c)之后连接到与表面杂交的核酸的可检测标记的位置和量;以及(e)将步骤(b)的结果与步骤(d)的结果进行比较以检测测试样品和参考样品的核酸的差异。在一些优选的实施方案中,选择性地去除杂交的测试核酸或参考核酸的步骤是通过将核酸经受选择性地降解具有某些特性的DNA的酶来进行的;优选地,降解具有尿嘧啶残基的DNA的酶;更优选地,选择性地降解具有尿嘧啶残基的DNA的酶是尿嘧啶-DNA N-糖基化酶(UNG)。在一些实施方案中,通过将核酸经受选择性地降解具有尿嘧啶残基的DNA的酶来选择性地去除杂交的测试核酸或参考核酸的步骤是通过以下进行的:(1)扩增来自测试样品的序列并且扩增来自参考样品核酸的序列,其中扩增反应中的一个是使用dUTP而不是dTTP进行的,并且另一个是使用dTTP而不是dUTP进行的;(2)使扩增的核酸杂交;以及(3)用选择性地降解具有尿嘧啶残基的DNA的酶处理杂交的核酸。在一些实施方案中,所述方法可以用于检测测试样品与参考样品中的核酸之间的任何差异,所述差异包括具有特定序列的核酸的量的差异或核酸序列的差异。在特别优选的实施方案中,所述方法用于检测测试样品中的遗传异常。所述方法可以应用于使用染色体分散的CGH或基于阵列的CGH。在一些优选的实施方案中,提供的方法可以用于比较测试样品与参考样品中的基因表达。另外或替代地,遗传生物标记物的检测可以包括一种进行比较性杂交的方法。所述方法包括比较与核酸阵列杂交的测试核酸和参考核酸的量,其中通过检测来自杂交核酸的信号来确定杂交的测试核酸和参考核酸的量,所述杂交核酸用相同的可检测标记来标记。在一个实施方案中,通过以下确定杂交的测试核酸和参考核酸的量:a)确定与阵列杂交的可检测标记的信号,其代表杂交的测试核酸和参考核酸的总量;b)处理杂交的核酸以选择性地去除测试核酸或参考核酸之一;c)确定在步骤b)之后的与阵列杂交的可检测标记的信号,其代表杂交的测试核酸或参考核酸之一;以及d)通过使用来自c)和b)的信号来确定杂交的测试核酸或参考核酸中的另一者的信号。在某些优选的实施方案中,扩增来自测试样品的序列并且扩增来自参考样品的序列的步骤涉及使用诸如本领域中熟知的随机引发来进行扩增样品中的基因组DNA。替代地,扩增来自测试样品的序列并且扩增来自参考样品的序列的步骤可以涉及使用RNA生成cDNA,并且使用随机引发扩增cDNA和或使用特定引物扩增特定序列。在某些优选的实施方案中,可以使用一个或多个加标记的核苷酸作为用可检测标记来标记扩增的核酸的手段来进行扩增反应;优选地,测试样品核酸和参考样品核酸两者用相同的加标记的核苷酸扩增;优选地,加标记的核苷酸是dCTP-Cy3。另外或替代地,遗传生物标记物的检测可以包括一种将测试样品与参考样品中的基因表达进行比较的方法。所述方法包括将由与核酸阵列杂交的测试样品的mRNA制备的cDNA的量与由与核酸阵列杂交的参考样品的mRNA制备的cDNA的量进行比较,杂交的测试cDNA和参考cDNA的量通过检测来自用相同的可检测标记来标记的杂交的cDNA的信号确定。所述方法涉及:扩增来自由测试样品的RNA制备的cDNA的核酸序列并且扩增来自由参考样品的RNA制备的cDNA的核酸序列,其中扩增反应中的一个是使用dUTP而不是dTTP进行的,并且另一个是使用dTTP而不是dUTP进行的;将包含扩增的测试样品和扩增的参考样品的溶液与核酸阵列杂交;以及确定结合阵列的杂交测试核酸和参考核酸的相对量。在某些实施方案中,确定杂交的测试核酸和参考核酸的相对量包括:a)确定与阵列杂交的可检测标记的信号,其代表杂交的测试核酸和参考核酸的总量;b)用选择性降解具有尿嘧啶残基的DNA的酶处理杂交的核酸;以及c)确定在步骤b)之后与阵列杂交的可检测标记的信号,所述信号代表杂交的测试核酸或参考核酸之一。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,093,063中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于在不扩增且不需要完整细胞或细胞核的情况下检测测试样品中所关注的基因组核酸的方法。通常,基因组核酸与加标记的探针杂交并且通过非核酸杂交的方式锚定到固体支撑物。通过检测固体支撑物上的杂交复合物中的标记来检测基因组核酸。所述方法可以用于检测遗传异常,例如点突变、基因重复或缺失和染色体易位。所述方法也可以用于疾病的诊断或预后。另外或替代地,遗传生物标记物的检测可以包括一种用于检测基因组核酸中的靶序列的方法,其通过以下进行:a.使含有靶序列的基因组核酸的样品与对靶序列具有特异性的探针接触,并且在固体支撑物上形成由基因组核酸和与靶序列杂交的探针组成的复合物,其中所述探针含有可检测标记,基因组核酸通过非核酸杂交的方式锚定到固体支撑物,并且基因组核酸的靶序列尚未扩增;以及b.通过检测标记与固体支撑物的缔和来检测基因组核酸中靶序列的存在。另外或替代地,遗传生物标记物的检测可以包括一种用于检测基因组核酸中遗传异常的存在或不存在的方法,其通过以下进行:a.如果遗传异常存在于基因组核酸中,使基因组核酸的样品与对遗传异常具有特异性的探针接触,并且在固体支撑物上形成由基因组核酸和探针组成的复合物,基因组核酸通过非核酸杂交的方式锚定到固体支撑物,并且基因组核酸的靶序列尚未扩增;b.通过检测标记与固体支撑物的缔和来检测遗传异常的存在。另外或替代地,遗传生物标记物的检测可以包括一种用于检测基因组核酸中的遗传异常的方法,其通过以下进行:a.使含有遗传异常的基因组核酸的样品与对遗传异常具有特异性的第一探针接触,并且在固体支撑物上形成由基因组核酸和第一探针组成的第一复合物,其中所述探针含有可检测标记,基因组核酸通过非核酸杂交的方式锚定到固体支撑物,并且基因组核酸的靶序列尚未扩增;b.使基因组核酸的样品与对参考核酸具有特异性的第二探针接触,并且在固体支撑物上形成由参考核酸和第二探针组成的第二复合物,其中所述第二探针含有可检测标记;以及c.通过检测与所述复合物缔和的第一探针的可检测标记来测量形成的第一复合物的量,并且通过检测与所述复合物缔和的第二探针的可检测标记来测量形成的第二复合物的量;以及d.将第一复合物的量与第二复合物的量进行比较,其中两种复合物的量的差异指示遗传异常。在一些实施方案中,基因组核酸和参考核酸来自同一样品。在前述方面中的任一个的另一个实施方案中,基因组核酸和参考核酸来自不同的样品,所述样品可以来自相同或不同的个体。在另一个实施方案中,使用同一固体支撑物确定第一复合物和第二复合物的量,并且第一探针和第二探针的可检测标记是不同的。另外或替代地,遗传生物标记物的检测可以包括一种用于检测基因组核酸中的遗传异常的方法,其通过以下进行:a.使含有遗传异常的基因组核酸的样品与对遗传异常具有特异性的第一探针接触,并且在固体支撑物上形成由基因组核酸和第一探针组成的第一复合物,其中所述探针含有可检测标记,基因组核酸通过非核酸杂交的方式锚定到固体支撑物,并且基因组核酸的靶序列尚未扩增;b.使基因组核酸的样品与对参考核酸具有特异性的第二探针接触,并且在固体支撑物上形成由参考核酸和第二探针组成的第二复合物,其中所述第二探针含有可检测标记;以及c.通过检测与所述复合物缔和的第一探针的可检测标记来测量形成的第一复合物的量,并且通过检测与所述复合物缔和的第二探针的可检测标记来测量形成的第二复合物的量;以及d.获得第一复合物和第二复合物的量的比率;以及e.将所获得的比率与使用来自参考样品的基因组核酸类似获得的比率进行比较,其中比率的差异指示遗传异常。在优选实施方案中,基因组核酸和参考核酸通过生物素和亲和素的相互作用锚定到固体支撑物。在另一个优选实施方案中,所述固体支撑物是珠粒。在另一个优选实施方案中,第一复合物和第二复合物通过流式细胞术来检测。另外或替代地,遗传生物标记物的检测可以包括一种用于在个体中进行诊断的方法,其通过以下进行:a.如果基因组核酸含有对疾病具有特异性的核酸序列,使来自个体的基因组核酸的样品与和对疾病具有特异性的核酸序列互补的探针接触,并且在固体支撑物上形成由基因组核酸和探针组成的复合物,其中所述探针含有可检测标记,基因组核酸通过非核酸杂交的方式锚定到固体支撑物,并且基因组核酸的靶序列尚未扩增;以及b.通过检测与支撑物缔和的可检测标记的量来测量在固体支撑物上形成的络合物的量;以及c.将所形成的复合物的量与在类似条件下使用来自测定的参考样品的基因组核酸形成的复合物的量进行比较,其中与参考样品相比由个体形成的复合物的量的差异可诊断疾病。在一个实施方案中,参考样品可以从认为没有疾病的个体获得。在另一个实施方案中,参考样品可以从已知患有疾病的个体获得。在另一个实施方案中,参考样品在获得第一样品之后从同一个体获得。在一个实施方案中,所述方法可以用于测量被怀疑患有癌症的个体中的肿瘤负荷。在另一个实施方案中,所述方法可以用于疾病的预后。基因组核酸可以共价或非共价地锚定到固体支撑物。在一些实施方案中,基因组核酸可以通过“结合对”非共价地锚定到固体支撑物,所述结合对是指通过特异性相互作用形成复合物的两个分子。因此,基因组核酸可以通过连接到基因组核酸的结合对的一个成员与和固体支撑物偶联的结合对的另一成员之间的相互作用而被捕获在固体支撑物上。在优选实施方案中,结合对是生物素和亲和素或亲和素的变体,例如链霉亲和素和NeutrAvidinTM。在其他实施方案中,结合对可以是配体-受体、激素-受体、抗原-抗体。在一些实施方案中,基因组核酸可以通过共价连接锚定到固体支撑物。在一个实施方案中,基因组核酸与固体支撑物的共价连接是通过光活性基团实现的,所述光活性基团例如叠氮基、叠氮苯酰基、4-硝基苯基3-重氮丙酮酸盐、补骨脂素(psolarens)、补骨脂素衍生物。在另一个实施方案中,基因组核酸可以通过UV交联而交联到各种固体表面。在另一个实施方案中,基因组核酸可以通过使用化学接头的化学偶联来锚定到固体支撑物。在另一个优选的实施方案中,基因组核酸是基因组DNA。在另一个实施方案中,参考核酸是管家基因或染色体中的单拷贝序列。在一些实施方案中,分别含有基因组核酸和参考核酸的测试样品或参考样品可以从细胞、组织、体液、血浆、血清、尿液、中枢神经系统液、粪便、胆管、石蜡包埋的组织、细胞裂解液、组织裂解液等获得或在其中得到。测试核酸和参考核酸可以从任何数量的来源和通过任何方法获得。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,076,074中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于检测包括平衡易位的染色体异常的方法,其中所述方法涉及结合用于检测易位的探针进行基于阵列的CGH。在一方面,所述方法涉及:将基因组核酸的测试样品、核酸的参考样品和至少一个用于检测平衡易位的探针与基因组核酸阵列杂交;以及确定与阵列杂交的杂交的测试核酸和参考核酸的相对量,以及确定用于检测易位的一个或多个探针与阵列的杂交。在优选实施方案中,所述方法使用基因组核酸的两个样品进行:含有基因组核酸的测试样品,以及含有基因组核酸的参考样品或对照样品,所述基因组核酸没有已知的染色体或遗传异常。将测试样品和参考样品与核酸阵列共杂交,所述核酸阵列含有在离散位置处滴加到表面(诸如载玻片)上的多个核酸或核酸片段。所述阵列可以含有某些已知遗传突变或疾病状态的靶核酸标记物,或者可以代表(整体上)整个染色体或全染色体补体,以获得遗传谱。在这些方法中,可以在杂交之前或之后并且按任何顺序将可检测标记附接到测试核酸和参考核酸。可检测标记可以诸如通过配体-受体相互作用或通过互补核苷酸序列之间的杂交被共价或非共价连接。另外,将用于检测易位的探针与基因组DNA杂交。在一种方法中,探针与转位的基因组的移动片段互补。移动片段可以在易位断点的上游或5′或在易位断点的下游或3′。如果测试样品不含平衡易位,则探针将与野生型中移动片段位于其中的阵列杂交。如果测试样品确实含有平衡易位,则探针将再次与野生型中移动片段位于其中的阵列杂交,并且与含有现在含有移动片段的核酸的阵列区域杂交。另外,所有与正在易位的移动片段互补的多个探针可以用于单个杂交中。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,021,888中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于进行快速杂交测定的方法。所述方法可以用于减少完成溶液中的核酸与固定到固体支撑物的核酸之间的核酸杂交的时间。所述方法在与非特异性核酸的预杂交、与靶核酸的杂交中的任一个期间或在杂交后的任何洗涤步骤期间施加声表面波。在一种方法中,与固定核酸的核酸杂交包括以下步骤:a)在杂交条件下使包含一个或多个固定核酸探针分子的固体支撑物与非特异性阻断核酸接触,其中一个或多个固定核酸探针分子能够与和其互补的序列杂交;b)在杂交条件下使固体支撑物与含有核酸靶分子的测试样品接触;c)将声表面波施加到步骤a)或步骤b)或两者的杂交;以及d)确定固体支撑物的一个或多个核酸探针是否已经与测试样品核酸靶分子杂交。在另一种方法中,与固定核酸的核酸杂交包括以下步骤:a)在杂交条件下使含有一个或多个固定核酸探针分子的固体支撑物与含有一个或多个核酸靶分子的核酸测试样品接触,所述一个或多个固定核酸探针分子能够与和其互补的序列杂交;b)将声表面波施加到步骤a)的杂交;以及c)确定固体支撑物的一个或多个核酸探针是否已经与测试样品核酸靶分子杂交。所述方法还可以包括与非特异性核酸的预杂交步骤,诸如针对以上方法所描述的。在预杂交步骤或杂交步骤之后可以应用一个或多个洗涤步骤。一个或多个洗涤步骤可以包括施加声表面波。在施加声波的情况下,预杂交步骤可以被限制为小于约7小时,更优选小于约5小时,并且甚至更优选小于约3小时。与靶核酸的杂交步骤可以为小于约3小时,更优选小于约2小时,并且甚至更优选小于约1小时。洗涤步骤进行小于约1小时,更优选小于约30分钟。在优选实施方案中,所述方法进行小于约9小时,更优选小于约7小时,并且甚至更优选小于约5小时。与测试核酸靶分子杂交的方法还可以包括一个或多个参考核酸靶分子。可以用可检测剂标记测试和/或参考核酸靶分子。在一些实施方案中,固体支撑物可以含有固定核酸探针分子的阵列。在一些实施方案中,固定核酸探针分子可以包含细菌人工染色体的序列。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0142304中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于检测突变的方法和组合物,所述突变预测被诊断患有乳腺癌、结直肠癌、黑素瘤或肺癌的受试者对特定治疗性方案的响应性。在一些实施方案中,所述方法允许快速且灵敏地检测以下的靶核酸序列中的突变:AKT1、ERBB2、FOXL2、IDH2、NRAS、RET、ALK、ERBB4、GNA11、KIT、PDGFRA、SMO、BRAF、FBXW7、GNAQ、KRAS、PIK3CA、STK11、CTNNB1、FGFR2、GNAS、MAP2K1、PIK3R1、TP53、DDR2、FGFR3、HRAS、MET、PTCH1、EGFR、FGFR4、IDH1、NOTCH1和PTEN。另外或替代地,遗传生物标记物的检测可以包括一种用于检测受试者中的多个癌症相关基因中的至少一个突变的方法,其包括:(a)从受试者获得的福尔马林固定的石蜡包埋的肿瘤样品中提取基因组DNA;(b)产生包含对应于多个癌症相关基因中的每一个的扩增子的文库,所述多个癌症相关,基因包括AKT1、ERBB2、FOXL2、IDH2、NRAS、RET、ALK、ERBB4、GNA11、KIT、PDGFRA、SMO、BRAF、FBXW7、GNAQ、KRAS、PIK3CA、STK11、CTNNB1、FGFR2、GNAS、MAP2K1、PIK3R1、TP53、DDR2、FGFR3、HRAS、MET、PTCH1、EGFR、FGFR4、IDH1、NOTCH1和PTEN,其中(i)产生所述文库在不使用包含与多个扩增子中的至少一个互补的核酸序列的诱饵组的情况下进行;并且(ii)在产生文库之前不使用定量PCR评估从福尔马林固定的石蜡包埋的肿瘤样品中提取的基因组DNA的质量;(c)将衔接子序列连接到多个扩增子的末端;以及(d)使用高通量大规模平行测序检测多个扩增子中的至少一个中的至少一个突变。在所述方法的一些实施方案中,检测到的至少一个突变是EGFR、KRAS、BRAF、NRAS、ERBB2或PIK3CA中的突变。在一个实施方案中,检测到的至少一个突变选自由以下组成的组:BRAF V600E、BRAF V600K、BRAF K483Q、BRAF G466V、BRAFG464V、BRAF E501V、BRAF E501K、EGFRΔE746_A750、EGFR R680Q、EGFR G598E、KRAS A146T、KRAS R68M、KRAS L19F、KRAS G12V、KRAS G12D、KRAS G12C、KRAS G13D、KRAS G13C、KRASG12A、KRAS G12S、KRAS Q22K、NRAS Q61K、NRAS Q61R、NRAS G12R、NRAS G12D、PIK3CAC420R、PIK3CA G106R、PIK3CA R38H、PIK3CA E453K、PIK3CA H1044R、PIK3CAN1044K、PIK3CAE545K、PIK3CAQ546H、PIK3CAH1047R、PIK3CA H1043L、PIK3CA M1043V、PIK3CAE542K、PIK3CA E542Q、PIK3CA T1053A、PIK3CA I121V、PIK3CA H1047L、ERBB2 L755S、ERBB2S310Y、ERBB2 D769Y、ERBB2 S255R、DDR2 H92Y、DDR2R31L、DDR2 L34P、DDR2 P381R和DDR2K392N。在所述方法的一些实施方案中,使用不超过10ng的从福尔马林固定的石蜡包埋的肿瘤样品中提取的基因组DNA来产生包含对应于多个癌症相关基因中的每一个的扩增子的文库。在所述方法的一些实施方案中,使用不超过11-25ng的从福尔马林固定的石蜡包埋的肿瘤样品中提取的基因组DNA来产生包含对应于多个癌症相关基因中的每一个的扩增子的文库。在某些实施方案中,使用焦磷酸测序、可逆染料终止子测序、SOLiD测序、离子半导体测序、Helioscope单分子测序、边测序边合成、边测序边连接或SMRTTM测序进行高通量大规模平行测序。在所述方法的一些实施方案中,衔接子序列是P5衔接子、P7衔接子、P1衔接子、A衔接子或Ion XpressTM条形码衔接子。另外或替代地,在一些实施方案中,多个扩增子还包含唯一索引序列。在一些实施方案中,福尔马林固定的石蜡包埋的肿瘤样品是异质性肿瘤。在某些实施方案中,异质性肿瘤的5%的细胞在多个扩增子中的至少一个中携带至少一个突变。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0051329中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于确定受试者中的一个或多个基因中变体的存在的方法,其包括:(a)提供使用核酸测序仪对来自受试者的核酸样品进行的核酸测序反应生成的原始测序数据;(b)从原始测序数据中去除未通过质量过滤器的低质量读长;(c)从过滤的原始测序数据中修剪衔接子和/或分子鉴定(MID)序列;(d)将过滤的原始测序数据映射到基因组参考序列以生成映射的读长;(e)对映射的读长进行分类和索引;(f)将读长组添加到数据文件中以生成处理的序列文件;(g)产生重新对齐靶;(h)对处理的序列文件进行局部重新对齐,以生成重新对齐的序列文件;(i)从重新对齐的序列文件中去除重复读长;(j)分析所关注的编码区;以及(k)基于步骤(j)中的分析生成鉴定是否存在变体的报告,其中步骤(g)和(j)使用含有一个或多个所关注的基因的核酸区域的修改的基因组比对实用程序进行。在一些实施方案中,所述方法包括使用核酸测序仪对来自受试者的核酸样品进行核酸测序反应,以生成步骤(a)的原始测序数据。在一些实施方案中,分析所关注编码区包括在所关注区域中的每个位置处识别变体。在一些实施方案中,由额外的150个碱基填充所关注区域。在一些实施方案中,使用改进的GATK变体识别器执行变体识别。在一些实施方案中,使用Burrows Wheeler Aligner(BWA)将读长映射到基因组参考序列。在一些实施方案中,将读长映射到基因组参考序列不包括柔性剪峰(softclipping)。在一些实施方案中,基因组参考序列是GRCh37.1人基因组参考序列。在一些实施方案中,测序方法包括乳液PCR(emPCR)、滚环扩增或固相扩增。在一些实施方案中,固相扩增是克隆桥式扩增。在一些实施方案中,用于序列分析的核酸是从来自受试者的生物样品中提取的。在一些实施方案中,生物样品是流体样品或组织样品。在一些实施方案中,生物样品是血液样品。在一些实施方案中,核酸是基因组DNA。在一些实施方案中,核酸是从mRNA逆转录的cDNA。在一些实施方案中,其中核酸样品是在测序之前通过进行以下一种或多种方法制备的:(a)剪切核酸;(b)浓缩核酸样品;(c)对剪切的核酸样品中的核酸分子进行大小选择;(d)使用DNA聚合酶修复样品中核酸分子的末端;(e)附接一个或多个衔接子序列;(f)扩增核酸以增加具有附接的衔接子序列的核酸的比例;(g)富集一个或多个所关注的基因的核酸样品;和/或(h)在即将测序之前定量核酸样品引物。在一些实施方案中,一个或多个衔接子序列包括用于引发测序反应和/或核酸扩增反应的核酸序列。在一些实施方案中,一个或多个衔接子序列包含分子鉴定(MID)标签。在一些实施方案中,富集一个或多个所关注的基因的核酸样品包括使用一个或多个生物素化的RNA诱饵进行外显子捕获。在一些实施方案中,用于序列分析的核酸是从作为哺乳动物的受试者获得的。在一些实施方案中,受试者是人患者。在一些实施方案中,所述受试者是被怀疑患有癌症或被怀疑具有发展癌症的风险的人。在一些实施方案中,所提供的方法还包括通过测序确认一个或多个变体的存在。另外或替代地,遗传生物标记物的检测可以包括包含一个或多个电子处理器的系统,所述电子处理器被配置来:(a)从原始测序数据中去除未通过质量过滤器的低质量读长;(b)从过滤的原始测序数据中修剪衔接子和/或分子鉴定(MID)序列;(c)将过滤的原始测序数据映射到基因组参考序列以生成映射的读长;(d)对映射的读长进行分类和索引;(e)将读长组添加到数据文件中以生成处理的序列文件;(f)产生重新对齐靶;(g)对处理的序列文件进行局部重新对齐,以生成重新对齐的序列文件;(h)从重新对齐的序列文件中去除重复读长;以及(i)分析所关注的编码区。在一些实施方案中,分析所关注编码区包括在所关注区域中的每个位置处识别变体。在一些实施方案中,由额外的150个碱基填充所关注区域。在一些实施方案中,使用改进的GATK变体识别器执行变体识别。在一些实施方案中,使用Burrows Wheeler Aligner(BWA)将读长映射到基因组参考序列。在一些实施方案中,将读长映射到基因组参考序列不包括柔性剪峰(soft clipping)。在一些实施方案中,基因组参考序列是GRCh37.1人基因组参考序列。另外或替代地,遗传生物标记物的检测可以包括其上存储有指令的非暂时性计算机可读介质,所述指令包括:(a)去除未通过质量过滤器的低质量读长的指令;(b)从过滤的原始测序数据中修剪衔接子和MID序列的指令;(c)将过滤的原始测序数据映射到基因组参考序列以生成映射的读长的指令;(d)对映射的读长进行分类和索引的指令;(e)将读长组添加到数据文件中以生成处理的序列文件的指令;(f)产生重新对齐靶的指令;(g)对处理的序列文件进行局部重新对齐,以生成重新对齐的序列文件的指令;(h)从重新对齐的序列文件中去除重复读长的指令;以及(i)分析所关注的编码区的指令。在一些实施方案中,分析所关注编码区包括在所关注区域中的每个位置处识别变体。在一些实施方案中,由额外的150个碱基填充所关注区域。在一些实施方案中,使用改进的GATK变体识别器执行变体识别。在一些实施方案中,使用Burrows Wheeler Aligner(BWA)将读长映射到基因组参考序列。在一些实施方案中,将读长映射到基因组参考序列不包括柔性剪峰(soft clipping)。在一些实施方案中,基因组参考序列是GRCh37.1人基因组参考序列。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0316149中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于对遗传变体进行分类的设备、系统和方法。在一些实施方案中,标准化的基于规则的方法可以基于CLIA认证的实验室中的临床等级信息来提供变体致病性风险得分。这种标准化系统可以为在临床实验室环境中遇到的DNA变体提供可靠的致病性得分。在一些实施方案中,DNA样品可以从患者获得,所述患者可以被诊断患有或可以被诊断未患疾病或其他医学病状。可以从样品对患者的基因组进行全部或部分测序。然后可以将测序结果与例如一个或多个参考基因组进行比较,以鉴定患者基因组中的变体。可以将一个或多个变体与已知变体的数据库进行比较。此比较的结果可以是鉴定一个或多个先前未知的变体、一个或多个已知但未分类的变体或两者。在一些实施方案中,可以针对一个或多个客观标准来评估未分类的变体。例如,在一个实施方案中,可以为实施方案分配起始得分。应用一个或多个客观标准可能导致得分增加或减少,从而产生可以用于对变体进行分类的最终得分。在一些实施方案中,可以例如周期性地重新访问一个或多个先前分类的变体的分类,以根据自先前评估以来获得的新信息来重新评估变体。另外或替代地,遗传生物标记物的检测可以包括一种为遗传变体分配得分的方法,所述方法是基于多个评分标准并且反映变体的致病性的估计。所述方法包括鉴定从患者获得的测序DNA中的变体,并且为变体分配起始得分,其中所述起始得分是与重要性未知的变体相关联的单个数值。在一些实施方案中,所述方法还包括:计算基于次要证据的客观评估和剪接预测的第一得分调整;计算基于变体在一般群体中出现的频率的客观证据的第二得分调整;计算基于变体在临床表征的患者中出现的频率的客观证据的第三得分调整;计算基于已经观察到的变体与一个或多个已知具有致病性的其他变体共同出现的频率的客观证据的第四得分调整;计算基于变体在一个或多个家族内表现出偏聚的程度的客观证据的第五得分调整;计算基于描述一个或多个家族的数据内变体与一种或多种疾病表型之间的关联的客观证据的第六得分调整;以及计算基于关于变体是否影响已知与疾病相关联的一种或多种蛋白质的功能的客观证据的第七得分调整。在一些实施方案中,所述方法还包括基于起始值、第一得分调整、第二得分调整、第三得分调整、第四得分调整、第五得分调整、第六得分调整和第七得分调整计算变体得分,变体得分是单个数值。并且所述方法包括仅基于变体得分将变体分配到所分配的分类,其中所分配的分类是由多个分类组成的组中的一个,所述多个分类中的每个分类与对变体致病性的相应不同评估相关联。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0009287中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括检测生物体的基因组内遗传子序列的拷贝数变化的设备、系统和方法。根据一些实施方案,包括DNA的遗传物质的样品可以从若干患者取得。然后可以例如通过以下方法对患者DNA的部分进行测序,所述方法包括针对每个患者将患者的DNA纯化、浓缩和片段化。每个片段可以接受鉴定从其接受DNA的患者的分子标记,并且可以另外修饰DNA以准备进行测序(例如,通过可以包括以下一种或多种的一个或多个步骤:过滤、扩增和修饰,以便将引物附接到片段)。可以汇集来自若干患者的片段,并且所述汇集可以包括例如一个或多个包含已知遗传物质的对照。然后可以对池中的片段进行测序,并且可以将测序结果存储为例如一个或多个计算机文件。然后可以例如通过一个或多个计算机系统来处理结果,以在从其取得样品的患者中鉴定可能的拷贝数变化。例如,在一些实施方案中,可以对序列进行解复用以鉴定其每个序列代表的DNA的相应患者。然后可以将每个患者的样品与参考基因组进行比对,并且然后可以确定患者基因组上每个所关注的区域中每个碱基对的覆盖。然后可以从碱基对覆盖确定患者的基因组的一个或多个亚基的覆盖。例如,在一些实施方案中,可以确定多个外显子的覆盖。在一些实施方案中,覆盖的测量然后可以经过一个或多个归一化步骤。例如,可以将已知在常染色体上的一个或多个扩增子的平均覆盖与已知在X染色体上的一个或多个扩增子的平均覆盖进行比较,以粗略估计患者的核型中X染色体的数量(即,一或两个)。如果确定患者只有一个X染色体,则归一化可以包括将所有已知来自X染色体的扩增子的覆盖加一倍。归一化之后,可以计算每个扩增子的参考值,并且可以通过将每个患者的扩增子的实际覆盖值与计算的参考值进行比较来检测CNV。另外或替代地,遗传生物标记物的检测可以包括一种检测多个患者的DNA中的拷贝数变化(CNV)的方法。所述方法包括:接收多个样品,每个样品含有来自单个患者的DNA;以及从每个样品生成多个DNA片段。所述方法还包括:用标识符对每个片段进行条形码标记,所述标识符唯一地鉴定从其接收DNA的相应患者;将多个样品汇集到DNA文库中;以及将DNA文库经受一个或多个过滤阶段以增加多个选择的所关注的区域内片段的相对浓度。在一些实施方案中,所述方法还包括:通过对过滤的DNA文库进行测序来为多个患者产生测序数据;对测序数据进行解复用;以及对于每个患者,通过针对每个所关注的区域鉴定测序数据中每个所关注的区域的覆盖来生成覆盖数据。在一些实施方案中,所述方法包括:从覆盖数据生成归一化的覆盖数据;以及针对每个所关注的区域生成所有样品共有的参考覆盖,参考覆盖的生成基于归一化的覆盖数据。在一些实施方案中,所述方法还包括:基于将参考覆盖与归一化的覆盖数据进行比较来自动检测至少一个患者的至少一个所关注的区域的至少一个子序列的CNV;以及提供鉴定患者、子序列和CNV的输出。在一些实施方案中,从覆盖数据生成归一化的覆盖数据包括:通过基于覆盖数据生成患者的X染色体数量的估计来针对每个患者生成原始覆盖数据;以及缩放患者的已知为X连接的至少一个所关注的区域的覆盖,并且还包括从原始覆盖数据生成归一化的覆盖数据。在一些实施方案中,在不参考关于相应患者的任何人口统计信息并且不参考关于相应患者的表型的任何信息的情况下,生成每个患者的X染色体的数量的估计。替代地,在一些实施方案中,所述方法包括:针对每个患者,基于归一化的覆盖数据来生成患者的X染色体数量的第二估计,并且还包括基于第二估计来修改归一化的覆盖数据。在一些实施方案中,在不参考关于相应患者的任何人口统计信息并且不参考关于相应患者的表型的任何信息的情况下,生成每个患者的X染色体的数量的第二估计。在一些实施方案中,覆盖数据包括测序数据内每个所关注的区域的单碱基覆盖;生成原始覆盖数据包括缩放患者的已知为X连接的至少一个所关注的区域的单碱基覆盖;归一化的覆盖数据包括单碱基覆盖;参考覆盖包括每个所关注的区域内每个位置的单碱基覆盖;并且自动检测CNV是基于单碱基参考覆盖和归一化的覆盖数据。在一些实施方案中,每个所关注的区域分别正好对应于一个外显子并且含有此外显子。在一些实施方案中,所述方法包括:自动检测患者基因内的多个相邻外显子的CNV,每个相邻外显子具有相同的CNV;以及自动汇总相邻外显子的CNV。此外,在一个实施方案中,所述方法包括:自动检测患者基因内的所有外显子的CNV,所述基因内的每个外显子具有相同的CNV;以及自动将所述基因内的外显子的CNV汇总为所述基因的单个CNV。在一些实施方案中,所述方法包括将DNA文库经受一个或多个扩增阶段,使得每个所关注的区域是扩增子。在一些实施方案中,覆盖数据包括测序数据内每个所关注的区域的单碱基覆盖;归一化的覆盖数据包括单碱基覆盖;参考覆盖包括每个所关注的区域内每个位置的单碱基覆盖;并且自动检测CNV是基于单碱基参考覆盖和归一化的覆盖数据。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2009/0088328中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种确定核酸阵列的印刷质量的方法,以及确定阻断核酸阵列上的非特异性结合的程序的效率的方法。另外或替代地,遗传生物标记物的检测可以包括利用荧光检测来评估印刷的核酸阵列的质量,而无需将荧光化合物或染料添加到核酸或以其他方式连接到核酸。适用于此分析的核酸阵列是通过印刷含有核酸和一个或多个离子的溶液而形成阵列点的那些核酸阵列。因此,所述阵列是由离子溶液中的核酸形成的,并且通过与每个印刷点相关联的荧光来评估印刷质量。可以通过测量每个印刷样品的位置处的荧光强度和/或通过测量印刷样品的“形态”(即,形状)来评估印刷质量。可以通过在二维上测量带点样品上的荧光来对印刷点进行“成像”。可以将印刷点的所得图像与针对所使用的印刷设备和固相所预期的参考打印图像进行比较。所述方法可以用于确定阵列上的特定点的质量,确定阵列的特定区域的质量或确定整个阵列的质量。点质量和/或阵列质量可以在阵列印刷后立即进行检测,或者在杂交之前将阵列经受处理之后进行检测。此类步骤可以包括将阵列暴露于热、湿气、UV辐射、阻断程序和/或洗涤。在进行非特异性结合的阻断步骤的质量的情况下,可以通过在阻断程序之前和之后测量每个加载样品处的荧光来确定阻断的质量。在洗涤和/或阻断程序之后荧光的降低指示阻断和/或洗涤步骤的效率。另外或替代地,遗传生物标记物的检测可以包括一种用于在杂交之前确定核酸阵列的印刷质量的方法,所述方法包括:(a)将核酸样品的阵列印刷到固体支撑物上,每个样品包含在离子溶液中的核酸;以及(b)检测印刷样品的荧光以确定印刷质量。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2006/0292576中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括检测和分析测试样品中的所关注的染色体异常的方法。在优选实施方案中,将来自测试样品的核酸与和所关注的基因的不同片段或和所关注的染色体片段的不同片段互补的两个探针杂交。一个探针锚定到固体支撑物,而第二探针包含用于检测的可检测标记。此方法提供了同时与两个探针杂交的靶核酸的捕获和检测。第一探针和第二探针两者与相同靶核酸的杂交指示在靶核酸中检测到染色体异常,而探针中的仅一个与相同靶核酸的杂交指示靶核酸中不存在遗传异常。锚定的探针可以共价或非共价地锚定到支撑物。如果使用非共价连接,则优选方法通过“结合对”进行,其是指通过特异性相互作用形成复合物的两个分子。因此,核酸探针可以通过连接到探针的结合对的一个成员与和固体支撑物偶联的结合对的另一成员之间的相互作用而被捕获在固体支撑物上。结合对成员还可以用于将可检测标记连接到另一个核酸探针。在优选实施方案中,结合对是生物素和亲和素或链霉亲和素。在其他实施方案中,结合对包括配体-受体、激素-受体、抗原-抗体或寡核苷酸-补体。在一些实施方案中,两个探针可以与液体中的靶核酸杂交,并且然后复合物可以被固体支撑物捕获。此方法中的锚定的探针优选非共价地锚定,并且优选通过结合对锚定。在其他变体中,固体支撑物可以首先包含锚定的探针,然后其单独或与加标记的探针一起与靶核酸接触以进行杂交。另外或替代地,遗传生物标记物的检测可以包括检测测试样品中靶核酸中的遗传异常的存在或不存在的方法。所述方法包括在固体支撑物上形成包含复合物,所述复合物包含靶核酸、与靶核酸的第一片段杂交的第一核酸探针以及与靶核酸的第二片段杂交的第二核酸探针,所述第一核酸探针用可检测标记来标记,所述第二核酸探针锚定到固体支撑物。通过检测掺入的可检测标记来检测复合物,其中第一探针和第二探针两者与相同靶核酸的杂交指示靶核酸中存在遗传异常,而探针中的仅一个与相同靶核酸的杂交指示靶核酸中不存在遗传异常。另外或替代地,遗传生物标记物的检测可以包括检测测试样品的核酸中的染色体易位的方法。所述方法包括两个核酸探针的杂交,一个与供体染色体片段的序列互补,并且另一个与紧邻或邻近插入的供体染色体片段的受体染色体的序列互补。一个探针锚定到支撑物,并且另一个探针用可检测标记来标记。与两个探针杂交的基因组DNA的测试样品将在支撑物上形成复合物,或者预先形成这种复合物,并且然后捕获在固体支撑物上并通过可检测标记来检测。从测试样品捕获的加标记的复合物的数量代表测试值。如果测试值显示标记与捕获的杂交复合物缔和,则确定测试样品含有染色体易位。在一个实施方案中,可以将测试样品的测试值与来自含有靶基因但缺乏易位的参考样品的测试值进行比较。另外或替代地,遗传生物标记物的检测可以包括检测个体中特定靶染色体区域或基因中的重复或缺失的方法。所述方法包括在固体支撑物上形成复合物,所述复合物包含与从样品获得的特定染色体区域或基因缔和的核酸、与特定染色体区域或基因的第一片段杂交的加标记的核酸探针以及与特定染色体区域或基因的第二片段杂交的第二核酸探针,其中第二核酸探针锚定到固体支撑物。在优选实施方案中,靶核酸是已经片段化的基因组DNA。从测试样品捕获的加标记的复合物的数量代表测试值。可以将测试值与对照值进行比较,所述对照值可以从优选地来自同一样品的不同靶基因或染色体区域获得的复合物的数量获得。与对照值相比测试值较高指示重复或扩增,而与对照值相比测试值较低指示染色体或基因缺失。在另一种方法中,可以确定测试样品的测试值与此样品的对照值的比率,并且与代表参考样品的测试值和对照值的相似比率进行比较,所述参考样品含有在所关注的染色体区域或基因中不含缺失、重复或扩增的核酸。另外或替代地,遗传生物标记物的检测可以包括在个体中确定诊断、预测对疗法的反应、检测最小残留疾病或疾病预后的方法。在此方法中,在来自测试样品的靶核酸、包含可检测标记并与靶核酸的一个片段杂交的探针和锚定到支撑物并与靶核酸的第二片段杂交的第二探针之间形成复合物。通过检测第一探针的掺入的可检测标记来测量固体支撑物上复合物的量。将形成的复合物的量与以类似方式由从参考样品获得的样品形成的复合物的量进行比较。参考样品可以从正常个体获得,其中来自测试样品与参考样品的测量值之间的差异与疾病的诊断或预后相关。另外或替代地,遗传生物标记物的检测可以包括监测疾病的治疗或进展的方法。在此方法中,在不同时间点处(例如,在疾病的治疗方案之前和之后)从患者获得样品。在来自第一样品的靶核酸、包含可检测标记并与靶核酸的一个片段杂交的探针和锚定到支撑物并与靶核酸的第二片段杂交的第二探针之间形成复合物。将来自第一样品的在支撑物上的复合物的量与使用相同探针和来自第二样品的靶核酸形成的复合物的量进行比较。形成的复合物的量的差异可以与疾病的进展或治疗方案的成功相关。另外或替代地,遗传生物标记物的检测可以包括测量个体中的肿瘤负荷的方法。在此方法中,在固体支撑物上在来自测试样品的靶核酸、包含可检测标记并与靶核酸的一个片段杂交的探针和锚定到支撑物并与靶核酸的第二片段杂交的第二探针之间形成复合物。通过检测第一探针的掺入的可检测标记来测量固体支撑物上复合物的量。将形成的复合物的量与参考值或以类似方式由从来自肿瘤负荷已知的患者的参考样品获得的样品形成的复合物的量的一组值进行比较,以确定测试样品的肿瘤负荷。在一些实施方案中,确定肿瘤负荷的方法包括在固体支撑物上形成两种复合物。第一复合物包含来自个体的测试样品的第一靶核酸和两个核酸探针;一个探针含有可检测标记,并且另一个探针锚定到支撑物。第二复合物包含来自测试样品的第二或对照靶核酸和两个不同的核酸探针,一个探针含有可检测标记,所述可检测标记可与第一复合物的标记区分,并且另一个探针锚定到固体支撑物。测量两种复合物中的每一种的量并确定测试比率。然后将此比率与参考比率或将测试比率与肿瘤负荷相关的一组比率进行比较。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2006/0127918中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种含核酸的底物,其包含:(a)有机硅烷预处理的表面;(b)交联到有机硅烷预处理的表面的聚合物膜;和(c)结合到聚合物膜和有机硅烷预处理的表面中的一个或多个的核酸分子。在优选实施方案中,聚合物膜由包含反应性基团的聚合物形成,并且核酸分子未被共价修饰以促进反应性基团处的共价连接。核酸分子可以通过共价和/或非共价相互作用与聚合物膜和有机硅烷预处理的表面中的一个或多个缔和或结合。在优选实施方案中,核酸分子的长度为至少约250个核苷酸,并且更优选为至少约500个核苷酸。在一个实施方案中,核酸分子是以细菌人工染色体(BAC)或另一种合适的克隆载体(例如,基于大肠杆菌P1的人工染色体、质粒、粘粒等)形式存在的DNA分子。在一些实施方案中,结合的核酸分子以足以通过核酸杂交方法检测核酸靶分子的浓度存在于底物的表面上。例如,核酸分子可以至少约500个拷贝/cm2的浓度存在于底物的表面上。更合适地,核酸分子以至少约1000个拷贝/cm2和/或至少约5000个拷贝/cm2的浓度存在于底物的表面上。当在高严格性条件下进行洗涤时(例如,当在相对较高的温度下用任选包含非离子型洗涤剂的低盐缓冲剂洗涤载玻片时),核酸分子优选基本上保持附接到底物。在一些实施方案中,有机硅烷是包含烷基的修饰硅烷分子。在一个实施方案中,有机硅烷包含具有六个或更多个碳原子并且优选地具有十个或更多个碳原子的烷基。有机硅烷可以包含烷氧基。有机硅烷还可以包含卤素基团。在一些实施方案中,聚合物包含反应性基团。合适的反应性基团包括在合适的条件下与亲核基团反应的亲电基团。例如,反应性基团可以包括氨基反应性基团(即,与氨基的氮原子反应的基团)、硫醇反应性基团(即,与硫醇基团的硫原子反应的基团)、羟基反应性基团(即,与羟基的氧原子反应的基团)及其组合。在一些实施方案中,聚合物可以包括活化的酯、环氧化物、吖内酯、活化的羟基、醛、异氰酸酯、硫代异氰酸酯、羧酸氯化物、烷基卤化物、马来酰亚胺、α-碘乙酰胺或其组合。在一个实施方案中,反应性基团是活化的酯,并且具体地,活化的酯可以包括N-羟基琥珀酰亚胺酯。在一些实施方案中,含核酸的底物被配置为核酸微阵列。核酸微阵列可以适合于进行比较性基因组杂交分析。在一个实施方案中,核酸微阵列包含克隆在细菌人工染色体(BAC)中的基因组DNA。另外或替代地,遗传生物标记物的检测可以包括一种用于制备如上所述的含核酸的底物的方法。所述方法通常包括:(a)用包含有机硅烷的组合物预处理底物的表面;(b)将聚合物与有机硅烷预处理的表面偶联以形成聚合物膜;以及(c)将核酸分子结合到有机硅烷预处理的表面和聚合物膜中的一个或两个。在优选实施方案中,聚合物膜由包含反应性基团的聚合物形成,并且核酸未被共价修饰以促进反应性基团处的共价连接。核酸分子可以通过共价和/或非共价相互作用与聚合物膜和有机硅烷预处理的表面中的一个或多个缔和和/或结合。另外或替代地,遗传生物标记物的检测可以包括一种用于检测样品中靶核酸分子的存在和/或量的方法,其包括:a)使靶分子与如上所述制备的含核酸的底物在适合将靶与底物的核酸杂交的条件下接触;以及b)检测结合到底物的靶分子的存在。在优选实施方案中,含核酸的底物是核酸微阵列,并且使用比较性基因组杂交分析进行核酸靶的存在和/或量的检测。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/125892中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括与检测样品中存在的ctDNA中的突变相关的方法和多核苷酸衔接子组合物,所述样品来源于被诊断为患有癌症或被怀疑患有癌症的受试者。在一些实施方案中,所述方法允许一个或多个癌症相关基因的外显子和/或内含子中各种靶核酸序列中的ctDNA突变的快速且灵敏的检测和谱分析,所述基因包括但不限于ALK、BRAF、EGFR、ERBB2、KIT、KRAS、MET、NRAS、NTRK1、PIK3CA、ROS1和RET。所述方法为使用检测限的准确分析模型实现的超灵敏ctDNA谱分析提供了框架。与先前的方法相比,这些品质提高了DNA含量有限的样品的检测限。另外或替代地,遗传生物标记物的检测可以包括一种包含第一寡核苷酸链和第二寡核苷酸链的核酸衔接子,其中(a)第一寡核苷酸链(i)包含第一近端区域和第一远端区域,其中第一近端区域包含第一唯一分子标识符序列和具有序列5′TGACT 3′(SEQ ID NO:)的第一间隔子序列,其中第一间隔子序列位于第一唯一分子标识符序列的3’;并且(ii)不包含简并序列或半简并序列;(b)第二寡核苷酸链(i)包含第二近端区域和第二远端区域,其中第二近端区域包含第二唯一分子标识符序列和具有序列5′GTCA 3′(SEQ ID NO:)的第二间隔子序列,其中所述间隔子序列位于第二唯一分子标识符的5’;并且(ii)不包含简并序列或半简并序列;(c)第一寡核苷酸链的第一近端区域与第二寡核苷酸链的第二近端区域杂交;并且(d)第一寡核苷酸链的第一远端区域不与第二寡核苷酸链的第二远端区域杂交。在核酸衔接子的一些实施方案中,位于第一间隔子序列的3’末端的“T”核苷酸含有硫代磷酸酯键。在核酸衔接子的一些实施方案中,第一寡核苷酸链的5’末端用生物素标记。在核酸衔接子的其他实施方案中,第二寡核苷酸链的3’末端用生物素标记。在一些实施方案中,核酸衔接子用于对选自由双链DNA或双链RNA组成的组的双链靶核酸分子进行测序。双链DNA可以是剪切的基因组DNA或无细胞DNA。在一些实施方案中,本发明的技术的核酸衔接子还包含至少两个PCR引物结合位点、至少两个测序引物结合位点或其任何组合。另外或替代地,在一些实施方案中,本发明的技术的核酸衔接子还包含样品特异性条形码序列,其中所述样品特异性条形码序列包含2-20个核苷酸。另外或替代地,遗传生物标记物的检测可以包括一种用于检测从患者获得的样品中存在的双链循环肿瘤DNA(ctDNA)分子中的至少一个突变的方法,其包括:(a)将多个Y形衔接子连接到双链ctDNA分子的两端以形成双链衔接子-ctDNA复合物,每个Y形衔接子包含第一寡核苷酸链和第二寡核苷酸链;(b)扩增衔接子-ctDNA复合物的两条链,以产生第一扩增子和第二扩增子,其中第一扩增子来源于第一寡核苷酸链,并且第二扩增子来源于第二寡核苷酸链;(c)对第一扩增子和第二扩增子进行测序;(d)当在第一扩增子中检测到的突变与在第二扩增子中检测到的突变一致时,检测双链ctDNA分子中的至少一个突变。在所述方法的一些实施方案中,患者被诊断患有卵巢癌、乳腺癌、结肠癌、肺癌、前列腺癌、胃癌、胰腺癌、宫颈癌、肝癌、膀胱癌、泌尿道癌、甲状腺癌、肾癌、癌瘤、黑素瘤、头颈部癌或脑癌。在一些实施方案中,所述方法还包括用多个诱饵序列富集第一扩增子和第二扩增子,其中多个诱饵序列包含对应于多个癌症相关基因中的每一个的至少一个基因区域。多个癌症相关基因可以包括ALK、BRAF、EGFR、ERBB2、KIT、KRAS、MET、NRAS、NTRK1、PIK3CA、ROS1和RET。另外或替代地,在所述方法的一些实施方案中,多个诱饵序列是RNA诱饵、DNA诱饵或RNA诱饵和DNA诱饵的混合物。在某些实施方案中,多个诱饵序列包括RNA诱饵和DNA诱饵的1∶1混合物。在其他实施方案中,多个诱饵序列包括具有2∶1、1.5∶1、0.75∶1或0.5∶1的比率的RNA诱饵和DNA诱饵的混合物。在所述方法的某些实施方案中,双链ctDNA分子的3’末端均还包含“A”突出。在任何以上实施方案中,每个Y形衔接子还包含至少两个测序引物结合位点。另外或替代地,在一些实施方案中,每个Y形衔接子还包含患者特异性条形码序列,其中所述患者特异性条形码序列包含2-20个核苷酸。本发明的技术的每个Y形衔接子可以用生物素标记。在所述方法的一些实施方案中,样品包含不超过5ng的无细胞DNA。在其他实施方案中,样品包含至少6-30ng的无细胞DNA。在某些实施方案中,样品是全血、血清、血浆、滑液、淋巴液、腹水或组织间液。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,389,234中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于分子谱分析并且使用来自分子谱分析的结果来鉴定个体的治疗的方法和系统。在一些实施方案中,最初并未将治疗鉴定为针对疾病的治疗。另外或替代地,遗传生物标记物的检测可以包括一种为有需要的受试者鉴定候选治疗的方法,其包括:对来自受试者的样品进行免疫组织化学(IHC)分析,以确定至少五种蛋白质的IHC表达谱;对样品进行微阵列分析,以确定至少十个基因的微阵列表达谱;对样品进行荧光原位杂交(FISH)分析,以确定至少一个基因的FISH突变谱;对样品进行DNA测序,以确定至少一个基因的测序突变谱;以及将IHC表达谱、微阵列表达谱、FISH突变谱和测序突变谱与规则数据库进行比较。规则数据库包括针对癌细胞的生物学活性已知的治疗的映射,所述癌细胞:i.过表达或低表达IHC表达谱中包括的一种或多种蛋白质;ii.过表达或低表达微阵列表达谱中包括的一个或多个基因;iii.没有突变,或具有FISH突变谱中包括的一个或多个基因的一个或多个突变;和/或iv.没有突变,或具有测序突变谱中包括的一个或多个基因的一个或多个突变。在以下情况下鉴定候选治疗:i.比较步骤指示治疗应具有针对癌症的生物活性;和ii.比较步骤不禁忌用于治疗癌症的治疗。在一些实施方案中,IHC表达谱分析包括测定以下中的一个或多个:SPARC、PGP、Her2/neu、ER、PR、c-kit、AR、CD52、PDGFR、TOP2A、TS、ERCC1、RRM1、BCRP、TOPO1、PTEN、MGMT和MRP1。在一些实施方案中,微阵列表达谱分析包括测定以下中的一个或多个:ABCC1、ABCG2、ADA、AR、ASNS、BCL2、BIRC5、BRCA1、BRCA2、CD33、CD52、CDA、CES2、DCK、DHFR、DNMT1、DNMT3A、DNMT3B、ECGF1、EGFR、EPHA2、ERBB2、ERCC1、ERCC3、ESR1、FIT1、FOLR2、FYN、GART、GNRH1、GSTP1、HCK、HDAC1、HIF1A、HSP90AA1、IL2RA、HSP90AA1、KDR、KIT、LCK、LYN、MGMT、MLH1、MS4A1、MSH2、NFKB1、NFKB2、OGFR、PDGFC、PDGFRA、PDGFRB、PGR、POLA1、PTEN、PTGS2、RAF1、RARA、RRM1、RRM2、RRM2B、RXRB、RXRG、SPARC、SRC、SSTR1、SSTR2、SSTR3、SSTR4、SSTR5、TK1、TNF、TOP1、TOP2A、TOP2B、TXNRD1、TYMS、VDR、VEGFA、VHL、YES1和ZAP70。在一些实施方案中,FISH突变谱分析包括测定EGFR和/或HER2。在一些实施方案中,测序突变谱分析包括测定KRAS、BRAF、c-KIT和EGFR中的一个或多个。另外或替代地,遗传生物标记物的检测可以包括一种为有需要的受试者鉴定候选治疗的方法,其包括:对来自受试者的样品进行免疫组织化学(IHC)分析,以确定以下中的至少五个的IHC表达谱:SPARC、PGP、Her2/neu、ER、PR、c-kit、AR、CD52、PDGFR、TOP2A、TS、ERCC1、RRM1、BCRP、TOPO1、PTEN、MGMT和MRP1:对样品进行微阵列分析,以确定以下中的至少五个的微阵列表达谱:ABCC1、ABCG2、ADA、AR、ASNS、BCL2、BIRC5、BRCA1、BRCA2、CD33、CD52、CDA、CES2、DCK、DHFR、DNMT1、DNMT3A、DNMT3B、ECGF1、EGFR、EPHA2、ERBB2、ERCC1、ERCC3、ESR1、FLT1、FOLR2、FYN、GART、GNRH1、GSTP1、HCK、HDAC1、HIF1A、HSP90AA1、IL2RA、HSP90AA1、KDR、KIT、LCK、LYN、MGMT、MLH1、MS4A1、MSH2、NFKB1、NFKB2、OGFR、PDGFC、PDGFRA、PDGFRB、PGR、POLA1、PTEN、PTGS2、RAF1、RARA、RRM1、RRM2、RRM2B、RXRB、RXRG、SPARC、SRC、SSTR1、SSTR2、SSTR3、SSTR4、SSTR5、TK1、TNF、TOP1、TOP2A、TOP2B、TXNRD1、TYMS、VDR、VEGFA、VHL、YES1和ZAP70;对样品进行荧光原位杂交(FISH)分析,以确定EGFR和/或HER2的FISH突变谱;对样品进行DNA测序,以确定KRAS、BRAF、c-KIT和EGFR中至少一个的测序突变谱;以及将IHC表达谱、微阵列表达谱、FISH突变谱和测序突变谱与规则数据库进行比较。规则数据库包括针对癌细胞的生物学活性已知的治疗的映射,所述癌细胞:i.过表达或低表达IHC表达谱中包括的一种或多种蛋白质;ii.过表达或低表达微阵列表达谱中包括的一个或多个基因;iii.没有突变,或具有FISH突变谱中包括的一个或多个基因的一个或多个突变;和/或iv.没有突变,或具有测序突变谱中包括的一个或多个基因的一个或多个突变。在以下情况下鉴定候选治疗:i.比较步骤指示治疗应具有针对癌症的生物活性;和ii.比较步骤不禁忌用于治疗癌症的治疗。在一些实施方案中,对所列的生物标记物的至少50%、60%、70%、80%或90%进行IHC表达谱分析。在一些实施方案中,对所列的生物标记物的至少50%、60%、70%、80%或90%进行微阵列表达谱分析。另外或替代地,遗传生物标记物的检测可以包括一种为有需要的受试者中的癌症鉴定候选治疗的方法,其包括:对来自受试者的样品进行免疫组织化学(IHC)分析,以确定至少由以下组成的蛋白质组的IHC表达谱:SPARC、PGP、Her2/neu、ER、PR、c-kit、AR、CD52、PDGFR、TOP2A、TS、ERCC1、RRM1、BCRP、TOPO1、PTEN、MGMT和MRP1;对样品进行微阵列分析,以确定至少由以下组成的基因组的微阵列表达谱:ABCC1、ABCG2、ADA、AR、ASNS、BCL2、BIRC5、BRCA1、BRCA2、CD33、CD52、CDA、CES2、DCK、DHFR、DNMT1、DNMT3A、DNMT3B、ECGF1、EGFR、EPHA2、ERBB2、ERCC1、ERCC3、ESR1、FLT1、FOLR2、FYN、GART、GNRH1、GSTP1、HCK、HDAC1、HIF1A、HSP90AA1、IL2RA、HSP90AA1、KDR、KIT、LCK、LYN、MGMT、MLH1、MS4A1、MSH2、NFKB1、NFKB2、OGFR、PDGFC、PDGFRA、PDGFRB、PGR、POLA1、PTEN、PTGS2、RAF1、RARA、RRM1、RRM2、RRM2B、RXRB、RXRG、SPARC、SRC、SSTR1、SSTR2、SSTR3、SSTR4、SSTR5、TK1、TNF、TOP1、TOP2A、TOP2B、TXNRD1、TYMS、VDR、VEGFA、VHL、YES1和ZAP70;对样品进行荧光原位杂交(FISH)分析,以确定至少由EGFR和HER2组成的基因组的FISH突变谱;对样品进行DNA测序,以确定至少由KRAS、BRAF、c-KIT和EGFR组成的基因组的测序突变谱;以及将IHC表达谱、微阵列表达谱、FISH突变谱和测序突变谱与规则数据库进行比较。规则数据库包括针对癌细胞的生物学活性已知的治疗的映射,所述癌细胞:i.过表达或低表达IHC表达谱中包括的一种或多种蛋白质;ii.过表达或低表达微阵列表达谱中包括的一个或多个基因;iii.具有FISH突变谱中包括的一个或多个基因的零或更多个突变;和/或iv.具有测序突变谱中包括的一个或多个基因的零或更多个突变。在以下情况下鉴定候选治疗:i.比较步骤指示治疗应具有针对癌症的生物活性;和ii.比较步骤不禁忌用于治疗癌症的治疗。在一些实施方案中,使用低密度微阵列、表达微阵列、比较性基因组杂交(CGH)微阵列、单核苷酸多态性(SNP)微阵列、蛋白质组阵列或抗体阵列来进行微阵列表达谱分析。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0171337中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种方法,其包括:a)通过评估多个基因和/或基因产物来确定来自受试者的至少一个样品的分子谱;以及b)基于分子谱鉴定以下中的至少一个:i)与癌症治疗的益处相关联的至少一种治疗;ii)与缺乏癌症治疗的益处相关联的至少一种治疗;和iii)与临床试验相关联的至少一种治疗。多个基因和/或基因产物可以选自具有已知与各种化疗剂相关的功效的基因和或基因产物(例如,转录物和蛋白质)。另外或替代地,遗传生物标记物的检测可以包括对任何所需的基因组套进行的突变分析。在一个实施方案中,评估多个基因和/或基因产物还包括对以下中的至少一个,例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45或46个的突变分析:ABL1、AKT1、ALK、APC、ATM、BRAF、BRCA1、BRCA2、CDH1、CSF1R、CTNNB1、EGFR、ERBB2(HER2)、ERBB4(HER4)、FBXW7、FGFR1、FGFR2、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、JAK2、JAK3、KDR(VEGFR2)、KIT(cKIT)、KRAS、MET(cMET)、MPL、NOTCH1、NPM1、NRAS、PDGFRA、PIK3CA、PTEN、PTPN11、RB1、RET、SMAD4、SMARCB1、SMO、STK11、TP53和VHL。突变分析可以包括这些基因的任何有用的组合。突变分析可以用于评估以下中的至少一个,例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14个:突变、多态性、缺失、插入、取代、易位、融合、断裂、重复、扩增、重复序列、拷贝数变化、转录物变体和剪接变体。可以使用任何有用的实验室方法或方法组合来进行突变分析。例如,可以使用以下中的至少一种来进行突变分析:ISH、扩增、PCR、RT-PCR、杂交、微阵列、测序、焦磷酸测序、Sanger测序、高通量或下一代测序(NGS)、片段分析或RFLP。在一些实施方案中,突变分析包括下一代测序。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0175197、2017/0039328和2015/0307947以及P.C.T.公布号WO 2012/092336中描述的各种方法中的任一种,所述公布特此以引用的方式并入。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/053915中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于提供用于分析生物数据的应用程序的用户界面的系统、方法、设备和计算机程序产品。另外或替代地,遗传生物标记物的检测可以包括一种分析生物数据的方法,所述方法包括:在包括处理器和存储器的计算装置处接收多个患者的患者数据,所述患者数据对应于生物采样事件、生物处理事件、至少一种治疗方案、至少一种生物标记物状态和患者状态中的至少一种;确定生物采样事件、生物处理事件、至少一种治疗方案、至少一种生物标记物状态和患者状态中的任一种之间的至少一种相互关系;进行治疗方案分析以确定至少一种治疗方案与患者状态和至少一种生物标记物状态中的至少一种之间的相互关系的相互关系状态;以及在与计算装置进行通信的用户界面上显示至少一个图形界面,所述图形界面包括多个视觉元素,所述多个视觉元素中的每个视觉元素与患者数据相关联,至少一个视觉元素与至少一种相互关系相关联,至少一个视觉元素包括对应于相互关系状态和生物标记物状态中的至少一种的标志。另外或替代地,遗传生物标记物的检测可以包括一种分析与来自靶患者的生物样品相关联的生物数据的方法,所述方法包括:在包括处理器和存储器的计算装置处接收与靶患者相关联的患者数据,所述患者数据对应于生物采样事件、生物处理事件、治疗方案、标记物状态和患者状态;接收与多个患者相关联的参考数据,所述参考数据对应于多个生物采样事件、生物处理事件、治疗方案、标记物状态和患者状态;确定生物采样事件、生物处理事件、治疗方案、标记物状态和患者状态中的任一种之间的至少一种相互关系;进行治疗方案分析以确定至少一种治疗方案与至少一种患者状态和至少一种标记物状态中的至少一种之间的相互关系;显示至少一个图形用户界面,所述图形用户界面被配置来:i)显示与参考数据相关联的多个图形用户界面对象,ii)显示与患者数据相关联的多个图形用户界面对象,iii)在与计算装置进行通信的用户界面上的至少一个图形界面上显示主图形用户界面对象,其被配置来在接收定义对主图形用户界面对象的选择的用户输入的指示后,致使图形用户界面显示辅助图形用户界面对象;以及基于在用户界面上显示的一种或多种相互关系来协助提供患者护理。在一些实施方案中,所述方法还可以包括在选择主视觉元素后操纵主视觉元素来显示包括对应于患者数据的额外信息的辅助视觉元素。所述方法还可以包括显示辅助视觉元素,使得辅助视觉元素覆盖主视觉元素,或者调整主视觉元素的大小,使得辅助视觉元素邻近主视觉元素显示。在一些实施方案中,所述方法还可以包括基于在用户界面上显示的一种或多种相互关系来协助提供患者护理。在一些实施方案中,协助提供患者护理包括基于一种或多种相互关系协助提供诊断、提供预后、选择推荐的治疗方案、生成假设以及评估治疗方案的效率中的至少一种。在一些实施方案中,协助提供患者护理包括选择性地操纵图形界面以及在其上显示的多个视觉元素中的一个或多个,以在视觉上将靶患者与一组参考患者进行比较。在视觉上将靶患者与所述组的参考患者进行比较可以基于各种所需的属性,包括但不限于共享的患者属性、至少一种治疗方案和/或至少一种生物标记物状态。另外或替代地,遗传生物标记物的检测可以包括一种计算机可读存储介质,其是非暂时性的并且具有存储在其中的计算机可读程序代码部分,所述计算机可读程序代码部分响应于被处理器执行,致使设备至少:在包括处理器和存储器的计算装置处接收多个患者的患者数据,所述患者数据对应于生物采样事件、生物处理事件、至少一种治疗方案、至少一种生物标记物状态和患者状态中的至少一种;确定生物采样事件、生物处理事件、至少一种治疗方案、至少一种生物标记物状态和患者状态中的任一种之间的至少一种相互关系;进行治疗方案分析以确定至少一种治疗方案与患者状态和至少一种生物标记物状态中的至少一种之间的相互关系的相互关系状态;以及在与计算装置进行通信的用户界面上显示至少一个图形界面,所述图形界面包括多个视觉元素,所述多个视觉元素中的每个视觉元素与患者数据相关联,至少一个视觉元素与至少一种相互关系相关联,至少一个视觉元素包括对应于相互关系状态和生物标记物状态中的至少一种的标志。另外或替代地,遗传生物标记物的检测可以包括一种用于分析生物数据的设备,所述设备包括用户界面和与用户界面进行通信的计算装置,所述计算装置包括处理器和包括存储在其中的计算机可读程序代码的存储器,所述计算机可读代码被配置来在由处理器执行时致使所述设备:接收多个患者的患者数据,所述患者数据对应于生物采样事件、生物处理事件、至少一种治疗方案、至少一种生物标记物状态和患者状态中的至少一种;确定生物采样事件、生物处理事件、至少一种治疗方案、至少一种生物标记物状态和患者状态中的任一种之间的至少一种相互关系;进行治疗方案分析以确定至少一种治疗方案与患者状态和至少一种生物标记物状态中的至少一种之间的相互关系的相互关系状态;以及在用户界面上显示至少一个图形界面,所述图形界面包括多个视觉元素,所述多个视觉元素中的每个视觉元素与患者数据相关联,至少一个视觉元素与至少一种相互关系相关联,至少一个视觉元素包括对应于相互关系状态和生物标记物状态中的至少一种的标志。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/064229中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括结合所关注的生物标记物的适体。在一些实施方案中,寡核苷酸探针用于检测生物样品中生物标记物或其他生物实体的存在或水平。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/205686中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括识别具有所关注的表型的组织的寡核苷酸探针。在各种实施方案中,寡核苷酸探针用于诊断、预后或治疗诊断方法以表征此样品的表型。所述诊断可能与癌症相关。另外或替代地,遗传生物标记物的检测可以包括一种富集包含多个寡核苷酸的寡核苷酸文库的方法,其包括:(a)提供排列有多个样品的支撑物;(b)使支撑物与多个寡核苷酸接触;以及(c)回收结合多个样品的成员的寡核苷酸探针文库的成员,从而富集寡核苷酸探针文库。另外或替代地,遗传生物标记物的检测可以包括一种富集包含多个寡核苷酸的寡核苷酸文库的方法,所述方法包括:(a)进行至少一轮阳性选择,其中所述阳性选择包括:(i)同时使多个样品与多个寡核苷酸接触;以及(ii)回收与所述多个样品缔和的多个寡核苷酸的成员;(iii)任选地进行至少一轮阴性选择,其中所述阴性选择包括:(i)同时使多个对照样品与多个寡核苷酸接触;(ii)回收不与所述多个对照样品缔和的多个寡核苷酸的成员。在富集方法的实施方案中,选择多个样品以代表所关注的表型。另外或替代地,遗传生物标记物的检测可以包括一种表征样品中的表型的方法,其包括:(a)在底物上排列至少一个样品;(b)使底物与多个寡核苷酸接触;以及(b)测量在多个寡核苷酸的成员与排列在底物上的样品之间形成的复合物的存在或水平,其中所述存在或水平用于表征表型。另外或替代地,遗传生物标记物的检测可以包括一种试剂盒,其包括用于实施方法的至少一种试剂,所述方法包括富集和表征的方法。另外或替代地,遗传生物标记物的检测可以包括至少一种试剂用于实施所述方法的用途。所述至少一种试剂可以是任何有用的试剂,包括但不限于支撑物、多个核苷酸、过滤单元和PEG中的至少一种。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号10,011,826中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种从相同的固定生物样品中平行分离/提取各种生物分子,特别是核酸和蛋白质的方法。在一些实施方案中,所述方法还包括定量和分析通过所述方法分离的生物分子,一种用于从固定样品中平行分离/提取各种生物分子的试剂盒,以及使用所述试剂盒进行诊断、预后、决定疾病的疗法和监测疗法。在一些实施方案中,一种从通过交联固定的相同生物起始材料平行纯化各种生物分子的方法,包括:a)溶解起始材料的所述交联的步骤,b)将起始材料存在中的不同的生物分子分离成至少一个级分(A)和至少一个级分(B)的步骤,以及c)从步骤b)的所述级分(A)和(B)中的至少一个中分离或检测或者分离和检测不同的生物分子,以及一种用于进行所述方法的试剂盒。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,797,000中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种检测靶RNA的存在的方法,所述方法包括:a)提供至少一个DNA捕获探针,其中所述至少一个DNA捕获探针结合到支撑物;b)将靶RNA与所述至少一个DNA捕获探针杂交,从而产生靶RNA:DNA捕获探针复合物;c)分离靶RNA:DNA捕获探针复合物;d)提供至少一个DNA扩增探针,并且将所述至少一个DNA扩增探针与所述靶RNA:DNA捕获探针复合物杂交,从而产生靶RNA:DNA捕获/扩增探针复合物;e)提供抗RNA:DNA杂交体抗体,并且将所述靶RNA:DNA捕获/扩增探针复合物与所述抗体一起温育,从而产生靶RNA:DNA:抗体复合物;f)检测所述抗体,其中所述检测指示所述靶RNA的存在。在一些实施方案中,抗体缀合到可检测标记物,并且检测步骤包括检测标记物。在一方面,可检测标记物选自由碱性磷酸酶和辣根过氧化物酶组成的组。在一些实施方案中,检测步骤包括提供结合所述抗RNA:DNA杂交体抗体的第二抗体,其中所述第二抗体缀合到可检测标记物,并且其中所述检测还包括检测标记物。在一些实施方案中,支撑物包括磁性珠粒。在一方面,磁性珠粒缀合到至少一个链霉亲和素分子,并且至少一个DNA捕获探针缀合到生物素分子。另外或替代地,遗传生物标记物的检测可以包括一种提供用于检测的靶RNA的方法,所述方法包括:将含有靶RNA的生物样品与羧基珠粒一起温育;分离珠粒;裂解附接到分离珠粒的生物样品;以及从裂解的生物样品中分离珠粒,其中所得的上清液含有用于检测的靶RNA。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,689,047中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种在包含非靶核酸的样品中检测靶核酸的方法,所述方法包括:(a)通过以下方法从样品中纯化靶核酸,所述方法包括:(i)使样品与至少一个纯化探针接触,其中核酸探针的至少一部分与至少一个靶核酸杂交以形成DNA:RNA杂交体;(ii)通过以下方法将DNA:RNA杂交体固定到第一固体支撑物,所述方法包括使DNA:RNA杂交体与能够结合DNA:RNA杂交体的至少第一抗体接触,其中所述抗体结合到或适于结合到第一固体支撑物;以及(iii)从所述样品中分离第一固体支撑物以生成至少一种纯化的靶核酸;b.通过以下方法对纯化的靶核酸进行基因分型,所述方法包括:(i)诸如通过等温扩增,诸如全基因组扩增来扩增纯化的靶核酸的至少一部分以生成扩增子;(ii)通过以下方法将扩增子固定到第二固体支撑物,所述方法包括使扩增子与至少一个固定探针接触,其中:(α)固定探针结合到或适于结合到第二固体支撑物;并且(β)固定探针的至少一部分与至少一个靶核酸杂交;(iii)使固定的扩增子与至少一个检测探针接触,其中所述检测探针的至少一部分与所述至少一个靶核酸杂交以生成检测复合物;以及(iv)至少检测由所述检测复合物生成的第一可检测信号,其中所述可检测信号指示靶核酸的基因型。在一些实施方案中,多个纯化的靶核酸与多个固定探针接触,其中多个固定探针中的每一个对不同的纯化的靶核酸具有特异性。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:a.纯化步骤,所述纯化步骤包括:通过将至少一个靶核酸与至少包含对所述至少一个靶核酸具有特异性的第一核酸探针的杂交探针组杂交来生成所述至少一个靶核酸的双链核酸杂交体;通过使双链核酸杂交体与能够结合双链核酸杂交体的至少第一抗体接触并且将至少第一抗体结合到第一固体支撑物来将双链核酸杂交体固定到第一固体支撑物;以及从样品中分离双链核酸杂交体以生成至少一个纯化的核酸;b.扩增步骤,其中将至少一个纯化的核酸的至少一部分扩增以生成扩增的核酸;以及c.基因分型步骤,所述基因分型步骤包括:通过将扩增的核酸与包含对所述至少一个靶核酸具有特异性的至少一个多核苷酸探针的固定探针组杂交来将扩增的核酸固定到至少第二固体支撑物;以及用检测探针组检测所述至少一个靶核酸的存在,所述检测探针组包含对所述至少一个靶核酸具有特异性的至少一个多核苷酸探针。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,422,593中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种检测至少一个靶核酸的方法,其包括:(1)从样品中序列特异性分离靶核酸;(2)扩增分离的靶核酸;以及(3)使用多个可检测地加标记的核酸检测探针检测靶核酸,其中每个(a)带有与其他检测探针不同的可检测标记,和/或(b)具有与带有相同的可检测标记的探针不同的解链温度。在一些实施方案中,所述方法包括:A.通过以下方法纯化至少一个靶核酸,所述方法包括:A1.通过将至少一个靶核酸与至少包含对所述至少一个靶核酸具有特异性的第一核酸探针的杂交探针组杂交来生成所述至少一个靶核酸的双链核酸杂交体;A2.从样品中分离双链核酸杂交体以生成至少一个纯化的核酸;B.扩增至少一个纯化的核酸的至少一部分;以及C.通过以下方法检测靶核酸,所述方法包括:C1.使扩增的核酸与至少一个检测探针组接触,其中:C1(a).检测探针组的检测探针中的每一个均带有可检测标记;C1(b).检测探针组的检测探针中的至少两个携带相同的可检测标记;并且C1(c).携带相同的可检测标记的探针中的每一个的解链温度(Tm)与具有相同标记的其他探针不同;C2.通过确定加标记的探针是否已经与其核酸序列杂交来检测扩增的核酸;以及C3.检测每个检测探针与其结合的核酸序列解离的温度。在一些实施方案中,通过以下方法将双链核酸杂交体从样品中分离,所述方法包括使双链核酸杂交体与特异性结合双链核酸杂交体的分子,优选地抗DNA:RNA杂交体抗体接触。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,593,366中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种随机扩增靶核酸序列的方法,所述方法包括:使一组引物、DNA聚合酶和靶样品接触,其中所述引物是随机G缺陷引物;以及在促进靶序列的复制的条件下温育靶样品,其中靶序列的复制产生复制的链。另外或替代地,遗传生物标记物的检测可以包括一种随机扩增靶核酸序列的方法,所述方法包括:使一组引物、DNA聚合酶和靶样品接触,其中所述引物是随机G缺陷引物;以及在促进靶序列的复制的条件下温育靶样品,其中靶样品中的核酸不与靶样品中的其他材料分离。另外或替代地,遗传生物标记物的检测可以包括一种随机扩增信使RNA的方法,所述方法包括:逆转录信使RNA以产生第一链cDNA;使一组随机G缺陷引物、DNA聚合酶和第一链cDNA接触;以及在促进第一链cDNA的复制的条件下进行温育,其中第一链cDNA的复制产生复制的链,其中在复制期间,至少一条复制的链通过另一条复制的链的链置换复制而从第一链cDNA被置换。另外或替代地,遗传生物标记物的检测可以包括一种随机扩增靶核酸序列的方法,所述方法包括:(a)将一组随机G缺陷引物与靶样品混合以产生引物-靶样品混合物,并且在促进引物-靶样品混合物中的随机G缺陷引物与靶序列之间杂交的条件下温育引物-靶样品混合物;(b)将DNA聚合酶与引物-靶样品混合物混合以产生聚合酶-靶样品混合物,并且在促进靶序列的复制的条件下温育聚合酶-靶样品混合物,其中靶序列的复制产生复制的链,其中在复制期间,至少一条复制的链通过另一条复制链的链置换复制而从靶序列被置换,其中靶序列是具有极大复杂性的核酸样品。另外或替代地,遗传生物标记物的检测可以包括一种随机扩增全基因组的方法,所述方法包括:使一组随机G缺陷引物、DNA聚合酶和靶样品接触;以及在促进靶序列的复制的条件下温育靶样品。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,487,823中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于扩增所关注的核酸序列的组合物和方法。在一些实施方案中,所述方法是基于通过引物对核酸序列进行的链置换复制。在一些实施方案中,所述方法呈多重置换扩增(MDA)的形式,其可用于扩增基因组核酸样品和其他具有高复杂性的核酸样品。所述方法可以用于仅使用一个或有限数量的引物来扩增此类高度复杂的核酸样品。已经发现一个或少量的引物可以有效地扩增全基因组和其他具有高序列复杂性的核酸样品。尽管引物代表的引物序列数量有限,但是经过特殊选择或设计的引物能够引发和有效扩增高度复杂的核酸样品中存在的广泛序列。所述方法通常涉及:使具有特定核酸序列的一个、几个或更多个引物、DNA聚合酶和核酸样品接触;以及在促进核酸样品中的核酸分子的复制的条件下温育核酸样品。核酸分子的复制产生复制的链,使得在复制期间,复制的链通过另一条复制的链的链置换复制而从核酸分子被置换。复制可以引起核酸样品中全部或大部分核酸分子的扩增。在一些实施方案中,所述方法使用一种形式的全基因组链置换扩增(WGSDA),一个、几个或更多个引物用于引发基因组核酸的样品(或具有高复杂性的核酸的另一个样品)。另外或替代地,遗传生物标记物的检测可以包括一种扩增人基因组的方法,所述方法包括:使长度为至少6个核苷酸的为非简并且非随机的单个DNA引物、非人链置换DNA聚合酶和人基因组核酸样品接触以形成混合物;以及在促进人基因组核酸样品中的核酸分子的复制的条件下温育混合物;其中所述引物与基因组核酸样品中的核酸分子杂交,并且其中所述引物具有特定核苷酸序列,其中所述基因组核酸样品包含人基因组的全部或大部分;以及在等温条件下复制人基因组核酸样品中的核酸分子,其中基因组核酸样品中的核酸分子的复制通过链置换复制进行,其中基因组核酸样品中的核酸分子的复制引起基因组核酸样品中的全部或大部分核酸分子的复制。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,115,410中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种被称为靶特异性杂交捕获(“TSHC”)的核酸检测方法。另外或替代地,遗传生物标记物的检测可以包括一种检测和/或定量一个或多个靶核酸的方法,其包括靶富集、扩增和用于靶核酸序列的快速且灵敏检测的检测的步骤。在一些实施方案中,通过以下方法检测一个或多个靶核酸:通过混合靶核酸、与靶核酸互补的核酸探针(其中一个是RNA并且另一个是DNA)和固体支撑物来将靶核酸捕获到固体支撑物;去除未结合的靶核酸和核酸探针;扩增捕获的靶核酸或核酸探针,从而形成多个扩增子,其中扩增子的存在指示靶核酸的存在;以及通过将靶核酸与和靶核酸的一部分杂交的可选择且可区分的寡核苷酸(即,捕获序列探针;CSP)和与靶核酸的不同部分互补的核酸探针(即,信号序列探针;SSP)混合来检测靶核酸酸,其中探针或靶中的一个是RNA并且另一个是DNA,其中DNA:RNA杂交体通过DNA:RNA杂交体特异性结合剂来检测,所述结合剂被直接或间接标记,从而检测靶核酸。SSP不限于仅用作产生用于检测的信号的手段;它还可以通过与靶核酸杂交、使得能够用DNA:RNA杂交体特异性结合剂捕获而用于靶富集步骤。在一些实施方案中,通过以下方法检测多个靶核酸:将多个靶核酸与和所述靶核酸互补的核酸探针杂交,从而形成DNA:RNA杂交体;用缀合到固体支撑物的DNA:RNA杂交体特异性抗体捕获DNA:RNA杂交体;去除未结合的靶核酸和核酸探针;使用随机引物和DNA聚合酶扩增捕获的靶核酸或核酸探针,从而形成多个扩增子,其中多个扩增子的存在指示靶核酸的存在;将与靶核酸序列的一部分互补的杂交核酸探针杂交,从而在靶与探针之间形成DNA:RNA杂交体;将缀合到固体支撑物的寡核苷酸与靶核酸的不同部分杂交,其中固体支撑物是可选择的;选择寡核苷酸复合物;以及通过将DNA:RNA杂交体特异性结合剂结合DNA:RNA杂交体来检测多个靶核酸。在一些实施方案中,通过多重方法检测一个或多个靶DNA,所述多重方法具有以下步骤:将多个靶DNA与和所述靶DNA互补的RNA探针杂交,从而形成DNA:RNA杂交体;用缀合到珠粒的DNA:RNA杂交体特异性抗体捕获DNA:RNA杂交体;通过洗涤过量的核酸和探针来去除未结合的核酸和核酸探针;使用随机引物和DNA聚合酶等温扩增靶DNA,从而形成多个扩增子;将与靶DNA的一部分互补的RNA探针(即,SSP)杂交,从而形成DNA:RNA杂交体;将特异性DNA寡核苷酸与靶DNA的不同部分杂交,其中DNA寡核苷酸缀合到可选择的珠粒;以及通过将可检测地加标记的DNA:RNA杂交体特异性抗体结合DNA:RNA杂交体并使用可选择的寡核苷酸缀合的珠粒(即,CSP)选择靶DNA来检测多个靶DNA,其中DNA:RNA杂交体特异性抗体被可检测且可区分地标记。通过与靶形成DNA:RNA杂交体的SSP标记的DNA:RNA抗体来检测每个靶的存在,同时基于寡核苷酸缀合的珠粒(即,CSP)来分离或选择各种靶。扩增子和DNA:RNA杂交体的存在指示靶DNA的存在。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,051,606中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于制备和使用多组分核酸酶(MNAzyme)的方法。另外或替代地,遗传生物标记物的检测可以包括一种包含至少两种或更多种寡核苷酸组分的组合物,其中至少第一寡核苷酸组分和第二寡核苷酸组分在MNAzyme组装促进子的存在下进行自组装以形成催化活性的多组分核酸酶(MNAzyme),其中所述至少第一寡核苷酸组分和所述第二寡核苷酸组分中的每一个包含底物臂部分、催化核心部分和传感器臂部分;其中在进行自组装时,所述第一寡核苷酸组分和所述第二寡核苷酸组分的传感器臂部分充当MNAzyme的传感器臂,所述第一寡核苷酸组分和所述第二寡核苷酸组分的底物臂部分充当MNAzyme的底物臂,并且所述第一寡核苷酸组分和所述第二寡核苷酸组分的催化核心部分充当MNAzyme的催化核心;并且其中MNAzyme的传感器臂与所述MNAzyme组装促进子相互作用,以便使第一核苷酸组分和第二寡核苷酸组分保持接近,以使它们相应的催化核心部分缔合以形成MNAzyme的催化核心,所述催化核心能够修饰至少一种底物,并且其中所述MNAzyme的所述底物臂接合底物,使得所述MNAzyme的所述催化核心可以修饰所述底物。在一些实施方案中,组合物还可以包含至少第三寡核苷酸组分,其起到稳定所述底物臂部分或传感器臂部分中的至少一个的作用。在一些实施方案中,所述方法还可以包括至少第三寡核苷酸组分和第四寡核苷酸组分,其在至少一种另外的组装促进子的存在下进行自组装以形成至少一种另外的催化活性MNAzyme,其中所述至少第三寡核苷酸组分和第四寡核苷酸组分中的每一个包含底物臂部分、催化核心部分和传感器臂部分;其中在所述至少第三寡核苷酸组分和第四寡核苷酸组分进行自组装时,所述至少第三寡核苷酸组分和所述至少第四寡核苷酸组分的传感器臂部分形成所述至少一种另外的催化活性MNAzyme的传感器臂,所述至少第三寡核苷酸组分和所述至少第四寡核苷酸组分的底物臂部分形成所述至少一种另外的催化活性MNAzyme的底物臂,并且所述至少第三寡核苷酸组分和所述至少第四寡核苷酸组分的催化核心部分形成所述至少一种另外的催化活性MNAzyme的催化核心部分;并且其中所述至少一种另外的MNAzyme的传感器臂与所述至少一种另外的组装促进子相互作用,以便使所述至少第三寡核苷酸组分和所述至少第四寡核苷酸组分保持接近,以使它们相应的催化核心部分缔合以形成所述至少一种另外的MNAzyme的催化核心,所述催化核心能够作用于至少一种另外的底物,并且其中所述至少一种另外的MNAzyme的底物臂接合至少一种另外的底物,使得所述至少一种另外的MNAzyme的催化核心可以作用于所述至少一种另外的底物。另外或替代地,遗传生物标记物的检测可以包括一种用于检测至少一种组装促进子的存在的方法,其包括:(a)提供两种或更多种寡核苷酸组分,其中至少第一寡核苷酸组分和第二寡核苷酸组分在组装促进子的存在下进行自组装以形成至少一种催化活性的多组分核酸酶(MNAzyme);(b)在一定条件下使两种或多种寡核苷酸组分与推定含有组装促进子的样品接触,所述条件允许:(1)所述至少一种催化活性MNAzyme的自组装,和(2)所述MNAzyme的催化活性;以及(c)确定所述至少一种MNAzyme的催化活性的存在,其中所述催化活性的存在指示所述至少一种组装促进子的存在。在一些实施方案中,所述方法还可以包括扩增组装促进子的步骤。扩增步骤可以包括以下中的一种或多种:聚合酶链反应(PCR)、链置换扩增(SDA)、环介导的等温扩增(LAMP)、滚环扩增(RCA)、转录介导的扩增(TMA)、自主序列复制(3SR)、基于核酸序列的扩增(NASBA)或逆转录聚合酶链反应(RT-PCR)。另外或替代地,遗传生物标记物的检测可以包括一种用于检测至少一种组装促进子的存在的方法,其包括:(a)提供两种或更多种寡核苷酸组分,其中至少第一寡核苷酸组分和第二寡核苷酸组分在至少第一组装促进子的存在下进行自组装以形成至少第一催化活性的多组分核酸酶(MNAzyme);(b)至少提供第一底物,所述第一底物能够被所述第一MNAzyme修饰,其中所述MNAzyme对所述底物的所述修饰提供可检测作用;(c)在一定条件下使所述两种或更多种寡核苷酸组分与推定含有所述至少第一组装促进子的样品接触,所述条件允许:(1)所述至少第一MNAzyme的自组装,和(2)所述至少第一MNAzyme的催化活性;以及(d)检测所述可检测作用。在一些实施方案中,所述方法还可以包括扩增核酸的步骤。扩增步骤可以包括以下中的一种或多种:聚合酶链反应(PCR)、链置换扩增(SDA)、环介导的等温扩增(LAMP)、滚环扩增(RCA)、转录介导的扩增(TMA)、自主序列复制(3SR)、基于核酸序列的扩增(NASBA)或逆转录聚合酶链反应(RT-PCR)。另外或替代地,遗传生物标记物的检测可以包括一种用于检测至少一种靶的存在的方法,其包括:(a)提供两种或更多种寡核苷酸组分,其中至少第一寡核苷酸组分和至少第二寡核苷酸组分能够在所述靶的存在下进行自组装以形成催化活性的多组分核酸酶(MNAzyme);其中所述第一寡核苷酸组分和所述第二寡核苷酸组分中的至少一种还包含至少一个适体部分;(b)在一定条件下使所述寡核苷酸组分与推定含有所述至少一种靶的样品接触,所述条件允许:(1)所述靶与所述适体部分的结合和(2)MNAzyme的催化活性;以及(c)确定MNAzyme的催化活性的存在,其中催化活性的存在指示所述靶的存在。另外或替代地,遗传生物标记物的检测可以包括一种用于使用MNAzyme介导的信号放大级联来检测靶的方法,其包括:(a)提供第一寡核苷酸组分和第二寡核苷酸组分,所述第一寡核苷酸组分和第二寡核苷酸组分在所述靶的存在下进行自组装以形成第一催化活性的多组分核酸酶(MNAzyme);(b)提供具有附接到其的第一底物和第二底物的不溶性支撑物,所述第一底物和第二底物能够被所述第一MNAzyme修饰,其中所述第一底物和第二底物分别包含至少第三寡核苷酸组分和第四寡核苷酸组分,所述第三寡核苷酸组分和第四寡核苷酸组分能够形成第二催化活性MNAzyme,其中所述第三寡核苷酸组分和第四寡核苷酸组分在所述第一底物和第二底物被所述第一MNAzyme修饰时被释放;(c)提供具有附接到其的第三底物和第四底物的所述不溶性支撑物,所述第三底物和第四底物能够被所述第二MNAzyme修饰,其中所述第三底物和第四底物分别包含至少第五寡核苷酸组分和第六寡核苷酸组分,所述第五寡核苷酸组分和第六寡核苷酸组分能够形成第三催化活性MNAzyme,其中所述第五寡核苷酸组分和第六寡核苷酸组分在所述第三底物和第四底物被所述第二MNAzyme修饰时被释放;以及(d)提供能够促进所述第二MNAzyme和所述第三MNAzyme的组装的组装促进子;以及(e)提供能够被所述第二MNAzyme修饰以提供可检测作用的第五底物;(f)在所述组装促进子的存在下并且在具有附接到其的所述第一底物、第二底物、第三底物和第四底物的所述不溶性支撑物的存在下,在一定条件下使所述第一寡核苷酸组分和第二寡核苷酸组分与推定含有所述靶的样品接触,所述条件允许:(1)所述第一MNAzyme、第二MNAzyme和第三MNAzyme的自组装,和(2)所述第一MNAzyme、第二MNAzyme和第三MNAzyme的催化活性;以及(g)其中所述第三MNAzyme修饰所述第一底物和第二底物,从而进一步提供所述第二MNAzyme,其中所述第二MNAzyme还修饰所述第三底物、第四底物和第五底物中的至少一个,从而进一步提供所述第三MNAzyme,从而进一步提供所述可检测作用;以及(h)其中所述可检测作用的检测指示所述靶的存在。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,012,149中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于合成含有miRNA或其他小RNA的序列的cDNA的方法,所述miRNA或其他小RNA的序列可以使用标准核酸扩增方法诸如聚合酶链反应进行扩增。所述方法可以提供从小RNA合成cDNA的更高特异性,同时允许实验人员在基本上相同的反应条件下进行此合成所需的两个关键酶促反应,所述条件包括存在浓度为10毫摩尔和80毫摩尔的二价阳离子。当将这些反应条件用作小RNA,尤其是miRNA的测定的一部分时,产生更大的特异性和敏感性。在一些实施方案中,用于制备小RNA分子的cDNA拷贝的方法包括:(a)提供来自生物样品的小RNA,其中所述RNA的长度为18至28个核苷酸;(b)在向小RNA添加核苷酸以产生尾部小RNA的反应中,在选自由ATP、GTP、UTP和CTP组成的组的单个三磷酸核糖核苷酸的存在下并且在20毫摩尔与80毫摩尔之间的二价镁阳离子的最终浓度下,用能够催化在小RNA的3′末端添加核苷酸的酶温育小RNA;(c)将DNA引物与尾部小RNA退火,由此DNA模板从尾部小RNA的3′末端延伸,从而提供DNA的单链区,其可以用于指导三磷酸脱氧核糖核苷酸的聚合;以及(d)在逆转录酶和三磷酸脱氧核糖核苷酸的存在下并且在20毫摩尔与80毫摩尔之间的二价镁阳离子的最终浓度下,在允许逆转录为cDNA并且扩增退火的尾部小RNA以产生扩增产物的条件下,将退火的尾部小RNA和DNA引物温育。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,962,250中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括核酸扩增和定量的方法,诸如从核酸分子的池中扩增多个选择的核酸分子的方法,其包括:(a)在第一轮多重扩增反应中扩增多个选择的核酸分子,所述第一轮多重扩增反应包括多个外侧引物对,每对对于选择的核酸序列具有特异性,其中允许扩增反应进行到一个点,在所述点之前,扩增子之间对反应组分发生显著的竞争;以及(b)在多个第二轮扩增反应中进一步扩增选择的核酸分子,每个第二轮扩增反应包括作为模板的完成的多重反应的一部分和至少一对内侧引物,每对对于选择的核酸序列中的一个具有特异性,使得每个第二轮反应还分别扩增多个选择的核酸分子的子集。另外或替代地,遗传生物标记物的检测可以包括一种从核酸分子的池中扩增多个选择的核酸分子的方法,其包括:(a)在第一轮多重扩增反应中扩增多个选择的核酸分子,所述第一轮多重扩增反应包括多个外侧引物对,每对对于选择的核酸序列具有特异性,其中允许扩增反应进行到一个点,在所述点之前,扩增子之间对反应组分发生显著的竞争;以及(b)在多个第二轮扩增反应中进一步扩增选择的核酸分子,每个第二轮扩增反应包括作为模板的完成的多重反应的一部分和至少一对引物,每对包含一个内侧引物和一个外侧引物,并且对于选择的核酸序列中的一个具有特异性,使得每个第二轮反应还分别扩增多个选择的核酸分子的子集。另外或替代地,遗传生物标记物的检测可以包括一种从核酸分子的池中估计所选核酸分子的数量的方法,其包括:(a)在第一轮多重扩增反应中扩增多个选择的核酸分子,所述第一轮多重扩增反应包括多个外侧引物对,每对对于选择的核酸序列具有特异性,其中允许扩增反应进行到一个点,在所述点之前,扩增子之间对反应组分发生显著的竞争;(b)在多个第二轮扩增反应中进一步扩增选择的核酸分子,每个第二轮扩增反应包括可检测报告子、作为模板的完成的多重反应的一部分和至少一对内侧引物,每对对于选择的核酸序列中的一个具有特异性,由此每个第二轮反应还分别扩增多个选择的核酸分子的子集;以及(c)通过可检测报告子监测每个第二轮扩增反应,使得估计每个选择的序列的选择的核酸分子的数量。另外或替代地,遗传生物标记物的检测可以包括一种从核酸分子的池中估计所选核酸分子的数量的方法,其包括:(a)在第一轮多重扩增反应中扩增多个选择的核酸分子,所述第一轮多重扩增反应包括多个外侧引物对,每对对于选择的核酸序列具有特异性,其中允许扩增反应进行到一个点,在所述点之前,扩增子之间对反应组分发生显著的竞争;以及(b)在多个第二轮扩增反应中进一步扩增选择的核酸分子,每个第二轮扩增反应包括可检测报告子、作为模板的完成的多重反应的一部分和至少一对引物,每对包含一个内侧引物和一个外侧引物,并且对于选择的核酸序列中的一个具有特异性,使得每个第二轮反应还分别扩增多个选择的核酸分子的子集;以及(c)通过可检测报告子监测每个第二轮扩增反应,使得估计每个选择的序列的选择的核酸分子的数量。在一些实施方案中,根据第一方面和第三方面,使用多重串联聚合酶链反应(MT-PCR)方法的完全嵌套形式,由此在第一轮扩增中使用一对外侧引物并且在第二轮扩增中使用两个内侧引物扩增每个选择的核酸分子。在一些实施方案中,根据第二方面和第四方面,使用半嵌套MT-PCR方法,由此在第一轮扩增中使用一对外侧引物扩增每个选择的核酸分子,并且在第二轮扩增中使用包含与一个内侧引物配对的在第一轮扩增中使用的外侧引物中的一个的一对引物进一步扩增选择的核酸序列。在一些实施方案中,第二轮扩增反应包括多个引物对和多个荧光探针,使得通过每个对选择的核酸序列具有特异性的荧光探针来扩增和定量每个选择的序列的多个选择的核酸分子。在一些实施方案中,外侧引物中的至少一个包括UTP核苷酸,由此引物适于被UNG酶消化,并且在第一轮扩增结束时通过用UNG酶消化来去除外侧引物,从而基本上防止由第一轮引物引起的对第二轮扩增反应的污染。在一些实施方案中,所述方法用于检测多态性、突变、插入和缺失的方法中。另外或替代地,遗传生物标记物的检测可以包括一种鉴定和/或定量至少一个选择的核酸序列的方法,其包括以下步骤:(i)将一个或多个选择的核酸序列与一个或多个可检测报告子混合;(ii)通过测量由所述一个或多个可检测报告子生成的信号来生成解链曲线;(iii)根据所述解链曲线鉴定和/或定量所述一个或多个选择的核酸序列。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,877,436中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于确定含有生物材料的样品中靶核酸分子的存在的方法。在一些实施方案中,用于确定样品中靶核酸分子的存在的方法包括:a)将样品悬浮在收集介质中;b)将靶核酸分子从样品中释放到收集介质中;c)将双链靶核酸分子转化为单链靶核酸分子;d)在一定条件下使一个或多个探针与单链靶核酸分子接触,所述条件允许探针和靶单链靶核酸分子杂交,从而形成双链核酸杂交体;e)捕获双链核酸杂交体;f)将双链核酸杂交体与未结合的单链靶核酸分子分离;以及g)检测双链核酸杂交体,从而指示靶核酸的存在。在一些实施方案中,检测方法可以是自动化的、完全自动化的或部分自动化的-换言之,需要一些人工输入。在一些实施方案中,例如在一个机器或一系列机器中,同时或在非常短的时间段内在多个样品中检测靶核酸分子。另外或替代地,遗传生物标记物的检测可以包括一种收集介质,含有靶核酸分子的样品被收集到所述收集介质中。靶核酸分子可以在数周或数月的时间段内以靶核酸分子的最小程度降解保存在收集介质中。在一些实施方案中,基于DNA的靶样品材料可以在数周或数月的时间段内以靶核酸分子的最小程度降解保存在收集介质中。在一些实施方案中,基于洗涤剂的收集介质允许对样品进行快速分析和处理。在一些实施方案中,收集介质包含约0.5%至约2.0%的NP-40、约0.10%至约0.40%的脱氧胆酸钠、约25mM至约75mM的Tris-HCl、约10mM至约50mM的EDTA、约50mM至约200mM的NaCl和约0.01%至约0.10%的叠氮化钠。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,372,637中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种稳定生物样品的方法,其具有以下步骤:
a)生物样品的制备;以及b)使生物样品与具有根据以下结构式的物质的组合物接触:
Figure GDA0002675196410004841
其中R1是氢残基或甲基残基,R2和R3是具有1-20个碳链的长度的相同或不同的烃残基,并且R4是氧、硫或硒残基。烃残基R2和/或R3可以彼此独立地选自包括以下的组:烷基、长链烷基、烯基、烷氧基、长链烷氧基、环烷基、芳基、卤代烷基、烷基甲硅烷基、烷基甲硅烷氧基、亚烷基、亚烯基、亚芳基、羧酸盐和羰基。在一些实施方案中,R2和/或R3上的链长n可以具有值1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20。在一些实施方案中,R2和R3具有1-10个碳链的长度。在一些实施方案中,R2和R3具有1-5个碳链的长度。在这种情况下,链长n具体地可以具有1、2、3、4和5的值。在一些实施方案中,R2和/或R3上使用甲基和乙基残基。链长n则具有1和2的值。在一些实施方案中,组合物中使用的物质可以用作唯一的防腐剂。在一些实施方案中,所述物质还可以与其他防腐物质结合使用,或者甚至仅用作组合物中其他防腐物质的添加剂。在一些实施方案中,所述物质与组合物中的一种或多种其他防腐物质之间的体积比或重量比可以在0.01∶100至100∶0的范围内。优选地它在0.1∶100至100∶0的范围内,并且尤其优选地它在1∶100至100∶0的范围内,并且特别优选地它在5∶100至100∶0的范围内。在一些实施方案中,所使用的物质的类别是例如二烷基乙酰胺(如果R1是甲基残基)或二烷基甲酰胺(如果R1是氢残基)。在一些实施方案中,生物样品是选自包括以下的组的材料:样品材料、血浆、体液、血液、血清、细胞、白细胞级分、血块黄层、痰液、唾液、尿液、精液、粪便、法医样品、涂片、抽吸物、活检、组织样品、组织部分和器官、食物样品、环境样品、植物和植物部分、细菌、病毒、类病毒、朊病毒、酵母菌和真菌以及上述材料的片段或成分和/或分离的、合成的或修饰的蛋白质、核酸、脂质、碳水化合物、代谢产物和/或代谢物。在一些实施方案中,所述物质是选自包括以下的组的物质:N,N-二甲基乙酰胺、N,N-二乙基乙酰胺、N,N-二甲基甲酰胺、N,N-二乙基甲酰胺、N,N-二甲基硫代甲酰胺和N,N-二乙基硫代甲酰胺。其结构式如下:
Figure GDA0002675196410004861
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,043,834中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括可用于标记和检测分析物的组合物和方法。在一些实施方案中,所述组合物是三种组分的缔合体:报告子结合剂、扩增靶环和DNA聚合酶。所述组合物在用于滚环扩增反应之前进行组装,并且可以在使用前被储存和运输而活性没有实质损失。在一些实施方案中,所述组合物包含报告子结合剂、扩增靶环和DNA聚合酶,其中所述报告子结合剂包含特异性结合分子和滚环复制引物,其中所述特异性结合分子对靶分子具有特异性,其中特异性结合分子不结合靶分子,其中所述组合物不包含串联序列DNA,其中报告子结合剂、扩增靶环和DNA聚合酶彼此直接缔合并形成复合物,并且其中所述组合物不在测定或反应中。在一些实施方案中,所述组合物可以用作滚环扩增的通用试剂。出于此目的,所述组合物可以具有可以与存在的或用于标记任何所关注的靶分子的特定部分或分子相互作用的特异性结合分子。例如,试剂组合物中的特异性结合分子可以是链霉亲和素或另一种生物素特异性分子(诸如抗生物素抗体)。然后可以将任何用生物素标记的靶分子与试剂组合物缔和,并且通过由组合物介导的滚环扩增来标记和/或检测。此试剂组合物可以与任何生物素化的靶分子一起使用。类似地,将对一类抗体具有特异性的抗体(例如,抗小鼠抗体)用作试剂组合物中的特异性结合分子。此类试剂组合物可以用于在测定中标记和检测一类抗体。例如,所述试剂组合物可以用于标记和检测结合免疫测定中的抗原的所有小鼠抗体,无论个体小鼠抗体的特异性如何。这类似于在夹心免疫测定中使用对一类抗体具有特异性的抗体。与传统的免疫测定相比,所述试剂组合物提供了更大的信号放大和更严格的信号定位。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,682,790中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于分离和/或稳定生物起源材料中的核酸的组合物。所述组合物含有以下通式的阳离子化合物作为必需成分。
Y+R1R2R3R4X-
其中
Y可以表示氮或磷;
R1、R2、R3和R4彼此独立地可以表示支链或非支链的C1-C20烷基和/或C6-C20芳基以及C6-C26芳烷基;并且
X-可以代表无机酸或有机酸、一元酸或多元酸的阴离子和作为添加剂的至少一种质子供体。在一些实施方案中,阳离子化合物由铵盐组成,其中R1表示高级烷基,优选地具有12、14或16个碳原子,并且在每种情况下R2、R3和R4表示甲基。在一些实施方案中,R1表示芳烷基,优选地苄基,R2表示高级烷基-优选地具有12、14或16个碳原子-并且R3和R4表示甲基。在一些实施方案中,阴离子是溴化物、氯化物、磷酸盐、硫酸盐、甲酸盐、乙酸盐、丙酸盐、草酸盐或琥珀酸盐。在一些实施方案中,使用脂族羟基二羧酸和三羧酸,例如丙醇二酸、D-(+)、L-(-)或DL-苹果酸、(2R,3R)-(+)-酒石酸(2S,3S)-(-)-酒石酸、内消旋酒石酸和柠檬酸。在一些实施方案中,脂族酮二羧酸也可以用作添加剂,例如像中草酸和草酰乙酸,其中草酰乙酸是最特别优选的。在一些实施方案中,可以使用氨基酸,其中α-氨基酸-例如像氨基乙酸(甘氨酸)、α-氨基丙酸(丙氨酸)、α-氨基-异戊酸(缬氨酸)、α-氨基-异己酸(亮氨酸)和α-氨基-β-甲基戊酸(异亮氨酸)是优选的。作为另外的添加剂,还可以使用无机酸及其盐。优选地,使用无机酸(诸如磷酸或硫酸)与碱金属或其铵盐形成的盐。最优选使用磷酸和硫酸铵。另外或替代地,遗传生物标记物的检测可以包括一种稳定生物样品中的核酸的方法,所述方法包括:将储存稳定化组合物与含有核酸的溶液混合,其中所述组合物包含以下通式的阳离子化合物
Y+R1R2R3R4X-
其中Y代表氮或磷;
R1、R2、R3和R4独立地代表支链或非支链的C1-C20烷基和/或C6-C20芳基以及C6-C26芳烷基;
X-代表无机酸或有机酸、一元酸或多元酸的阴离子;以及
至少一种质子供体
其中所述质子供体以高于50mM至饱和的浓度存在于组合物中,并且其中所述质子供体选自由以下组成的组:饱和脂族单羧酸、不饱和烯基羧酸、饱和和/或不饱和的脂族C2-C6二羧酸、脂族羟基二羧酸和三羧酸、脂族酮羧酸、氨基酸或无机酸或其盐,单独或组合使用;使核酸稳定,其中通过与阳离子化合物形成离子络合物来使核酸稳定;任选地从溶液中分离不溶性离子络合物;以及任选地从不溶性离子络合物中释放核酸。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,683,035中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括(1)一种从生物样品中稳定和/或分离核酸的方法,其包括以下步骤:使生物样品与至少一种式(I)的阳离子化合物接触:
Figure GDA0002675196410004891
其中使用强和/或弱无机酸和/或有机酸的共轭碱作为阴离子(A),并且其中由(I)和阴离子组成的物质总体上为中性电荷,并且其中
X代表氮(N)或磷(P),
k代表整数1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24,
Bk代表脂族亚烷基桥,其可以未被取代或在一个或多个碳原子上被取代,并且其中一个或多个不相邻的碳原子可以被氧替代,并且具有结构
-(CH2)n-(OCH2)m-
其中n和m独立地代表整数0、1、2、3、4、5或6,其中n+m>0;替代地
Bk代表取代的苯基、萘基或联苯桥,另外,它可以在一个或多个碳原子上被取代并且具有结构
Figure GDA0002675196410004892
Figure GDA0002675196410004901
其中n、m、l、p、q独立地代表整数0、1、2、3、4、5或6;
R1、R2、R3k可以是相同的或不同的,并且可以未被取代或在一个或多个碳原子上被取代,它们代表氢、直链或支链的C1-C6烷基、直链或支链的C1-C6烯基、直链或支链的C1-C6炔基、具有以下结构的苯基、苄基和苯氧乙基
Figure GDA0002675196410004902
其中n、m独立地代表整数0、1、2、3、4、5或6,并且
Z代表结构-O-、-CO-、-CO2-、-OCO-、-CO-N-、-N-CO-、-O-CO-N-、-N-CO-O-、-S-或-S-S-中的一个;
或者R1、R2、R3k代表具有以下结构的苯基、苄基、苯氧乙基
Figure GDA0002675196410004903
其中n、m独立地代表整数0、1、2、3、4、5或6。
RA、RBk、RC可以是相同的或不同的,并且可以未被取代或在一个或多个碳原子上被取代,它们代表氢、直链或支链的C1-C21烷基、直链或支链的C1-C21烯基、直链或支链的C1-C21炔基和以下结构
CH3-(CH2)n-Z-(CH2)m-
其中n、m独立地代表整数0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24,并且
Z代表-O-、-CO-、-CO2-、-OCO-、-CO-N-、-N-CO-、-O-CO-N-、-N-CO-O-、-S-或-S-S-;
替代地,RA和RC一起形成具有环状结构的残基RAC
Figure GDA0002675196410004911
其中可以未被取代或在一个或多个碳原子上被取代的残基RAC代表直链或支链的C1-C8烷基、直链或支链的C1-C8烯基或直链或支链的C1-C8炔基,并且
如果k>1,则桥接基团Bk与基团RBk和R3k是相同的或不同的;
(2)一种用于稳定和/或分离核酸的试剂盒,其包括至少一种如上通过式(I)所定义的阳离子化合物;(3)一种复合物,其包含核酸和至少一种阳离子化合物,如通过(1)中的方法形成的;(4)一种物质组合物,其包含至少一种如上通过式(I)所定义的阳离子化合物;(5)一种药物组合物,其包含(4)中的物质组合物;(6)一种诊断组合物,其包含(4)中的物质组合物;以及(7)一种用于研究的组合物,其包含(4)中的物质组合物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,323,310中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于从靶RNA模板选择性地扩增RNA的扩增反应混合物,其包含:细胞RNA依赖性RNA聚合酶和至少两个与所述靶RNA模板互补的引物。在一些实施方案中,RNA依赖性RNA聚合酶(RdRp)是番茄或其他细胞RdRp。在一些实施方案中,RdRp是细胞RdRp,并且在特别优选的实施方案中,RdRp选自由以下组成的组:番茄RdRp、烟草RdRp、黄瓜RdRp和小麦RdRp。在一些实施方案中,扩增反应混合物包含细胞RdRp和至少两个与靶RNA模板互补的引物。在优选实施方案中,反应混合物还包含RNA解旋酶、能量源和任选地二价阳离子,例如像Mg2+、Mn2+或Co2+。扩增反应混合物还可以包含RNA酶抑制剂、RNA稳定剂、单链结合蛋白、rNTP和rNTP的类似物,以用于将靶RNA扩增成产物RNA。还提供了支持RdRp和RNA解旋酶活性的扩增缓冲剂。另外或替代地,遗传生物标记物的检测可以包括一种用于从RNA模板选择性地扩增RNA的方法,其包括:使模板RNA与根据权利要求1所述的扩增反应混合物接触;以及温育所述扩增反应混合物以产生扩增的RNA产物,其中所述温育步骤包括至少一种变性条件。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,977,153中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种方法,其涉及:由RNA分子合成第一链cDNA分子;将第一链cDNA分子环化;以及使用滚环复制来复制环化的第一链cDNA分子。另外或替代地,遗传生物标记物的检测可以包括一种扩增RNA序列的方法,所述方法包括:在促进由RNA分子合成第一链cDNA分子的条件下温育cDNA引物和包含RNA分子的RNA样品;在促进第一链cDNA分子的环化的条件下温育环化探针和第一链cDNA分子;以及在促进环化的第一链cDNA分子的滚环复制的条件下温育环化的第一链cDNA分子,从而扩增RNA序列。另外或替代地,遗传生物标记物的检测可以包括一种扩增RNA序列的方法,所述方法包括:在促进由RNA分子合成第一链cDNA分子的条件下温育cDNA引物和包含RNA分子的RNA样品,其中促进第一链cDNA分子的合成的条件包括在逆转录酶的存在下温育cDNA引物和RNA样品;在RNA酶H活性的存在下温育第一链cDNA分子;在碱性条件下温育第一链cDNA分子;中和第一链cDNA分子;纯化第一链cDNA分子;在促进第一链cDNA分子的环化的条件下温育环化探针和第一链cDNA分子,其中促进第一链cDNA分子的环化的条件包括在连接酶的存在下温育环化探针和第一链cDNA分子;在促进环化的第一链cDNA分子的滚环复制的条件下温育环化的第一链cDNA分子,从而扩增RNA序列,其中促进环化的第一cDNA分子的滚环复制的条件包括在DNA聚合酶的存在下温育环化的第一链cDNA分子。另外或替代地,遗传生物标记物的检测可以包括一种扩增RNA序列的方法,所述方法包括:在促进由RNA分子合成第一链cDNA分子的条件下温育cDNA引物和包含RNA分子的RNA样品;在促进第一链cDNA分子彼此连接以形成第一链cDNA多联体的条件下温育环化探针和第一链cDNA分子;以及在促进第一链cDNA多联体的链置换复制的条件下温育第一链cDNA多联体,从而扩增RNA序列。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,815,212中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括被提供用于检测配体对的第一成员与第二成员的结合的方法,其包括以下步骤:(a)在足以允许第一成员与第二成员结合的条件和时间下将一组带标签的第一成员与可能含有一个或多个第二成员的生物样品组合,其中所述标签与特定的第一成员相关,并且可通过非荧光光谱法或电位法检测;(b)将结合的第一成员和第二成员与未结合的成员分离;(c)从带标签的第一成员使标签裂解;以及(d)通过非荧光光谱法或电位法检测标签,并且由此检测第一成员与第二成员的结合。可以利用各种各样的第一成员和第二成员对,包括例如核酸分子(例如,DNA、RNA、核酸类似物诸如PNA或这些的任何组合)、蛋白质或多肽(例如,抗体或抗体片段(例如,单克隆抗体、多克隆抗体或结合配偶体,诸如CDR)、寡糖、激素、有机分子和其他底物(例如,异生物素,诸如葡萄糖醛酸酶--药物分子)或任何其他配体对。在一些实施方案中,第一成员和第二成员可以是相同类型的分子或不同类型。例如,代表性的第一成员第二成员配体对包括:核酸分子/核酸分子;抗体/核酸分子;抗体/激素;抗体/异生物素;和抗体/蛋白质。另外或替代地,遗传生物标记物的检测可以包括用于分析来自选择的生物样品的基因表达模式的方法,其包括以下步骤:(a)暴露来自生物样品的核酸;(b)在足以使一个或多个选择的带标签的核酸探针与暴露的核酸杂交的条件和时间下将所述核酸与所述探针组合,其中所述标签与特定核酸探针相关,并且可通过非荧光光谱法或电位法检测;(c)将杂交的探针与未杂交的探针分离;(d)从带标签的片段使标签裂解;以及(e)通过非荧光光谱法或电位法检测标签,并且由此确定生物样品的基因表达模式。在一个实施方案中,可以在暴露核酸的步骤之前用选择的分子刺激生物样品。“刺激剂”的代表性实例包括核酸分子、重组基因递送媒介物、有机分子、激素、蛋白质、炎性因子、细胞因子、药物、药物候选物、旁分泌和自分泌因子等。在另外的实施方案中,可以通过荧光法、质谱法、红外光谱法、紫外光谱法或恒电位安培法(例如,利用库仑或安培检测器)来检测一个或多个标签。合适的光谱技术的代表性实例包括飞行时间质谱法、四极质谱法、磁式扇形质谱法和电式扇形质谱法。此类技术的具体实施方案包括离子阱质谱法、电喷雾电离质谱法、离子喷雾质谱法、液体电离质谱法、大气压电离质谱法、电子电离质谱法、快速原子轰击电离质谱法、MALDI质谱法、光电离飞行时间质谱法、激光微滴质谱法、MALDI-TOF质谱法、APCI质谱法、纳米喷雾质谱法、雾化喷雾电离质谱法、化学电离质谱法、共振电离质谱法、二次电离质谱法和热喷雾质谱法。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,361,940中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括增加PCR中核酸杂交和核酸引发的特异性的组合物和方法。在一些实施方案中,所述组合物包含核酸和盐,所述盐包含阴离子和阳离子,所述阴离子选自卤代乙酸盐、丙酸盐和卤代丙酸盐,所述阳离子选自包含1-36个碳原子的伯铵、仲铵和叔铵和包含4-48个碳原子的季铵。在一些实施方案中,所述组合物是非流动的,并且包含6-100个核苷酸的寡核苷酸和盐,所述盐包含阴离子和阳离子,所述阴离子选自乙酸盐、卤代乙酸盐、丙酸盐和卤代丙酸盐,所述阳离子选自包含1-36个碳原子的伯铵、仲铵和叔铵和包含4-48个碳原子的季铵。在一些实施方案中,所述组合物不含有机溶剂,并且包含6-100个核苷酸的寡核苷酸和盐,所述盐包含阴离子和阳离子,所述阴离子选自乙酸盐、卤代乙酸盐、丙酸盐和卤代丙酸盐,所述阳离子选自包含1-36个碳原子的伯铵、仲铵和叔铵和包含4-48个碳原子的季铵。在一些实施方案中,所述组合物包含核酸和盐,所述核酸固定在固体支撑物上,所述盐包含阴离子和阳离子,所述阴离子选自乙酸盐、卤代乙酸盐、丙酸盐和卤代丙酸盐,所述阳离子选自包含1-36个碳的伯铵、仲铵和叔铵和包含4-48个碳的季铵。另外或替代地,遗传生物标记物的检测可以包括一种盐,其选自下组:(a)式HN(CH3)2Ra的阳离子的乙酸盐,其中Ra为C4-C7烃基;(b)式HN(CH3)2Rb的阳离子的卤代乙酸盐,其中Rb为C7-C12烃基;(c)式H2N(C5-C7环烷基)Rc的阳离子的乙酸盐和卤代乙酸盐,其中Rc为C1-C12烃基;以及(d)N取代的哌啶的乙酸盐和卤代乙酸盐,其中哌啶的氮被C1-C12烃基取代。另外或替代地,遗传生物标记物的检测可以包括一种在溶液中的寡核苷酸,其中所述寡核苷酸由包括多个片段的成分形成,每个片段通过结构(1)示意性地示出
Figure GDA0002675196410004951
其中,
Figure GDA0002675196410004961
代表如野生型DNA中存在的至少三个核苷酸的序列,其中“B”代表在每个位置处独立选择的碱基;-代表一系列被称为“特异性间隔子”的共价化学键,其分隔并连接两个碱基B3和B5;特异性间隔子具有空间和化学特性,使得(a)它不阻止结构(1)的片段与如结构(2)示意性所示具有互补碱基序列的寡核苷酸片段之间的杂交,
Figure GDA0002675196410004962
并且(b)它不能与结构(2)的杂交的互补碱基序列中与之相反定位的碱基进行氢键合。另外或替代地,遗传生物标记物的检测可以包括一种阵列,其包括以阵列格式固定到固体支撑物的多个寡核苷酸,所述多个寡核苷酸中的每个寡核苷酸由包括多个片段的组分形成,每个片段通过结构(1)示意性地示出
Figure GDA0002675196410004963
其中,
Figure GDA0002675196410004964
代表如野生型DNA中存在的至少三个核苷酸的序列,其中“B”代表在每个位置处独立选择的碱基;-代表一系列被称为“特异性间隔子”的共价化学键,其分隔并连接两个碱基B3和B5;特异性间隔子具有空间和化学特性,使得(a)它不阻止结构(1)的片段与如结构(2)示意性所示具有互补碱基序列的寡核苷酸片段之间的杂交,
Figure GDA0002675196410004971
并且(b)它不能与结构(2)的杂交的互补碱基序列中与之相反定位的碱基进行氢键合。另外或替代地,遗传生物标记物的检测可以包括一种区分其中探针和靶完全互补以及其中探针和靶具有一个或多个碱基错配的互补核酸靶和核酸探针的杂交的方法,其包括:(a)在包含hybotrope的溶液中将核酸靶与核酸探针混合;(b)在分辨性温度下杂交;以及(c)检测与靶杂交的探针,从而确定核酸探针和靶是完全互补的还是错配的。在优选实施方案中,核酸探针用放射性分子、荧光分子、质谱标签或酶标记。在优选实施方案中,核酸探针和/或靶核酸是6至40个碱基。优选地,hybotrope是铵盐。具体优选的铵盐hybotrope包括但不限于双(2-甲氧基乙基)胺乙酸盐、1-乙基哌啶乙酸盐、1-乙基哌啶三氯乙酸盐、1-乙基哌啶三氟乙酸盐、1-甲基咪唑乙酸盐、1-甲基哌啶乙酸盐、1-甲基哌啶三氯乙酸盐、1-甲基吡咯烷乙酸盐、1-甲基吡咯烷三氯乙盐、1-甲基吡咯烷三氟乙酸盐、2-甲氧基乙胺乙酸盐、N,N-二甲基环己胺乙酸盐、N,N-二甲基环己胺三氟乙酸盐、N,N-二甲基环己胺、N,N-二甲基庚胺乙酸盐、N,N-二甲基庚胺乙酸盐、N,N-二甲基己胺乙酸盐、N,N-二甲基己胺乙酸盐、N,N-二甲基异丙胺乙酸盐、N-乙基丁胺乙酸盐、N-乙基丁胺三氟乙酸盐、N,N-二甲基氨基丁烷三氯乙酸盐、N,N-二甲基异丙胺三氯乙酸盐、三乙醇胺乙酸盐、三乙胺乙酸盐、三乙胺三氯乙酸盐、三丙胺乙酸盐和四乙铵乙酸盐。其他合适的hybotrope包括LiTCA、RbTCA、GuSCN、NaSCN、NaClO4、KI、TMATCA、TEATCA、TMATBA、TMTCA、TMTBA、TBATCA和TBATBA。优选地,hybotrope以约0.005M至约6M的摩尔浓度存在。优选地,探针核酸是DNA或RNA,并且靶核酸是DNA或RNA。优选地,靶核酸固定到固体底物。优选地,所述方法还包括聚合酶链反应。另外或替代地,遗传生物标记物的检测可以包括一种区分其中探针和靶完全互补以及其中探针和靶具有一个或多个碱基错配的互补核酸靶和核酸探针的杂交的方法,其包括:(a)将核酸靶与含有至少一个脱碱基或脱氧水粉蕈素取代的核酸探针混合;(b)在分辨性温度下杂交;以及(c)检测结合靶的探针,从而确定核酸探针和靶是完全互补的还是错配的。另外或替代地,遗传生物标记物的检测可以包括一种增加核酸合成程序中的分辨度的方法,其包括:(a)在包含hybotrope和聚合酶的溶液中将单链核酸靶与寡核苷酸引物混合;(b)在分辨性温度下将引物与靶退火;以及(c)合成与靶互补的链以形成双链体。另外或替代地,遗传生物标记物的检测可以包括一种从野生型序列中区分核酸分子中的单个碱基变化的方法,其包括:(a)在包含胺基盐和聚合酶的溶液中将单链核酸靶与寡核苷酸引物混合,其中所述寡核苷酸引物具有与野生型序列互补的3’最末端碱基或单碱基变化;(b)在分辨性温度下将引物与靶退火;(c)延伸引物,其中当引物的3’最末端碱基与靶互补时,合成与靶互补的链;以及(d)检测引物的延伸。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,248,521中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括从模板扩增核酸分子的方法,其包括:(a)将固体底物上的单链核酸模板与包含与模板杂交的寡核苷酸引物和DNA聚合酶的溶液混合,其中混合在底物上的离散区域中发生,并且其中溶液保持在离散区域中;(b)合成与模板互补的链以形成双链体;(c)使双链体变性;以及(d)合成与模板互补的链,由此扩增核酸分子;其中混合、合成和变性在露点处进行。固体底物可以是硅晶片或载玻片。模板可以共价连接到固体底物或沉积在底物的表面上。模板可以在混合之前均匀地施加到整个阵列,或者单个地施加到底物上的每个离散区域。当单个地施加时,优选使用弹簧探针进行施加。在最优选的实施方案中,使用一种设备来控制露点。另外或替代地,遗传生物标记物的检测可以包括提供一种进行单核苷酸延伸测定的方法,其包括:(a)将固体底物上的寡核苷酸与包含与所述寡核苷酸杂交的单链核酸分子、单个核苷酸和DNA聚合酶的溶液混合,其中混合在底物的离散区域中发生,并且其中溶液保持在离散区域中;以及(b)检测寡核苷酸的延伸产物;其中仅当单个核苷酸与邻近杂交的寡核苷酸的核苷酸互补时才延伸寡核苷酸,其中混合在露点处进行。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0155705中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于从生物样品中分离细胞外核酸的方法,其包括:(a)由样品制备包含以下的结合混合物:i)细胞外核酸;ii)具有阴离子交换表面的粒子;iii)至少一种非离子型洗涤剂,其为聚氧化亚烷基脂肪醇醚;iv)任选地至少一种盐,其中结合混合物具有使细胞外核酸结合到粒子的pH;(b)将具有结合的细胞外核酸的粒子与剩余的结合混合物分离;(c)任选地洗涤结合的细胞外核酸;以及(d)任选地洗脱结合的细胞外核酸。在一些实施方案中,通过以下制备结合混合物:通过使粒子与包含至少一种聚氧化亚烷基脂肪醇醚并且任选地包含盐和/或缓冲剂的裂解和/或结合组合物接触来形成悬浮液;使悬浮液与包含细胞外核酸的样品接触;以及任选地在样品与悬浮液接触之前、同时或之后添加蛋白水解酶。另外或替代地,遗传生物标记物的检测可以包括一种用于进行所述方法的试剂盒,其包括:(a)裂解和/或结合组合物,其包含:i)至少一种非离子型洗涤剂,其为聚氧化亚烷基脂肪醇醚;ii)任选地至少一种盐;iii)至少一种缓冲剂;其中所述组合物具有酸性pH;(b)具有阴离子交换表面的粒子;(c)任选地蛋白水解酶;(d)任选地一种或多种洗涤溶液;以及(e)任选地一种或多种洗脱溶液。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0148716中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括产生环状双链DNA(dsDNA)或测序文库的方法,其中所述方法包括在DNA连接酶和单链DNA结合蛋白或双链DNA结合蛋白的存在下循环dsDNA或连接第一dsDNA和第二dsDNA。在一些实施方案中,产生测序文库的方法在连接之前还包括以下步骤:(i)提供DNA片段;(ii)通过多核苷酸激酶和具有聚合酶和核酸外切酶活性的酶对DNA片段进行末端修复;以及(iii)任选地通过脱氧核苷酰转移酶将末端腺嘌呤添加到末端修复的DNA片段的末端。在一些实施方案中,所述方法还包括对连接的片段进行纯化和大小选择以用于测序的后续步骤。在一些实施方案中,衔接子连接的片段在测序之前进行扩增。另外或替代地,遗传生物标记物的检测可以包括一种试剂盒,其包括:(i)DNA连接酶;以及(ii)单链DNA(ssDNA)结合蛋白或双链DNA(dsDNA)结合蛋白。在一些实施方案中,所述试剂盒包括:(i)多核苷酸激酶和具有聚合酶和核酸外切酶活性的酶;(ii)任选地脱氧核苷酰转移酶;(iii)DNA连接酶;(iv)单链或双链DNA结合蛋白;以及(v)任选地反应缓冲剂。在优选实施方案中,任何试剂盒均包括连接酶、单链DNA(ssDNA)结合蛋白或双链DNA(dsDNA)结合蛋白以及任选地反应缓冲剂的混合物。在优选实施方案中,具有聚合酶和核酸外切酶活性的酶是DNA聚合酶。在以上引用的方法或试剂盒中,多核苷酸激酶是T4多核苷酸激酶(PNK),具有聚合酶和核酸外切酶活性的酶是T4 DNA聚合酶,并且/或者脱氧核苷酰转移酶是Taq聚合酶或Klenow Fragment exo-。在一些实施方案中,连接方法是指其中第一dsDNA和第二dsDNA均包含两个ssDNA末端,由此第一dsDNA的每个ssDNA末端与第二dsDNA的每个互补ss末端连接以提供连接的环状dsDNA。在一些实施方案中,第一DNA或第二DNA能够赋予在感受态细胞内进行自动复制的能力。在以上引用的方法或试剂盒中,DNA结合蛋白是病毒、细菌、古细菌或真核的单链DNA结合蛋白或双链DNA结合蛋白。在一些实施方案中,任何以上方法或试剂盒中的DNA连接酶是T3 DNA连接酶或T4 DNA连接酶。在其他实施方案中,连接酶是T7 DNA连接酶或
Figure GDA0002675196410005011
在以上方法的一些实施方案中,第一dsDNA和第二dsDNA的中每一个具有一个或两个单链DNA(ssDNA)末端。这个/这些ssDNA末端的长度小于20个核苷酸(nt)。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0002738中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于扩增核酸样品中的靶核酸的方法和在此类方法中可用的试剂盒。在一些实施方案中,用于扩增核酸样品中的靶核酸的方法包括:(a)使用靶核酸作为模板延伸多个条形码引物(BC引物)中的每一个以获得延伸产物,其中(i)每个条形码引物从5′至3′包含第一通用引物序列(US1)、分子标签序列(MT)和第一靶特异性序列(TS1),(ii)多个条形码引物包含至少20个不同的条形码引物,并且(iii)在多个条形码引物(BC引物)中,第一通用引物序列(US1)是相同的,但第一靶特异性序列(TS1)是不同的;(b)将步骤(a)中未延伸的多个条形码引物与延伸产物分离;以及(c)在多个限制性扩增引物(LA引物)的存在下扩增步骤(b)的延伸产物以获得多个第一扩增产物,其中(i)每个限制性扩增引物从5′至3′包含第二通用引物序列(US2)和第二靶特异性序列(TS2),并且(ii)在多个限制性扩增引物中,第二通用引物序列(US2)是相同的,但第二靶特异性序列(TS2)是不同的。另外或替代地,遗传生物标记物的检测可以包括一种试剂盒,其包括:(1)多个条形码引物(BC引物),其中(i)每个条形码引物从5′至3′包含第一通用引物序列(US1)、分子标签序列(MT)和第一靶特异性序列(TS1),(ii)多个条形码引物包含至少20个不同的条形码引物,并且(iii)在多个条形码引物中,第一通用引物序列(US1)是相同的,分子标签序列(MT)是不同的,并且第一靶特异性序列(TS1)是不同的;以及(2)多个限制性扩增引物(LA引物),其中(i)每个限制性扩增引物从5′至3′包含第二通用引物序列(US2)和第二靶特异性序列(TS2),并且(ii)在多个限制性扩增引物中,第二通用引物序列(US2)是相同的,但第二靶特异性序列(TS2)是不同的。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2016/0374330中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括提供一种适于稳定含细胞的生物样品中包含的细胞外核酸群体的方法,其包括使含细胞的样品与至少一种作为稳定剂的聚(氧乙烯)聚合物或与作为稳定剂的单乙二醇接触。另外或替代地,遗传生物标记物的检测可以包括提供一种用于从含细胞的生物样品中分离细胞外核酸的方法,其中所述方法包括:a)根据以上定义的方法稳定含细胞的生物样品;以及b)从稳定的样品中分离细胞外核酸。另外或替代地,遗传生物标记物的检测可以包括提供一种适于稳定含细胞的生物样品的组合物,其包含:i)作为稳定剂的聚(氧乙烯)聚合物或ii)作为稳定剂的单乙二醇和一种或多种,优选地两种或更多种其他添加剂,所述添加剂选自由以下组成的组:一种或多种伯酰胺、仲酰胺或叔酰胺;半胱氨酸蛋白酶抑制剂;抗凝剂和/或螯合剂。优选地,所述组合物包含作为稳定剂的聚(氧乙烯)聚合物,所述聚(氧乙烯)聚合物优选地是具有至少1500的分子量的高分子量聚(氧乙烯)聚合物,并且还包含一种或多种,优选地两种或更多种其他添加剂,所述添加剂选自由以下组成的组:至少一种其他聚(氧乙烯)聚合物,其具有低于优选地是高分子量聚(氧乙烯)聚合物的第一聚(氧乙烯)聚合物的分子量至少100、优选地至少200、至少300或至少400的分子量,其中所述其他聚(氧乙烯)聚合物优选地是具有1000或更小的分子量的低分子量聚(氧乙烯)聚合物;一种或多种伯酰胺、仲酰胺或叔酰胺;半胱氨酸蛋白酶抑制剂;抗凝剂和/或螯合剂。另外或替代地,遗传生物标记物的检测可以包括提供一种用于收集含细胞的生物样品的收集装置,其中所述收集装置包括:i)作为稳定剂的聚(氧乙烯)聚合物或ii)作为稳定剂的单乙二醇和一种或多种其他添加剂,所述添加剂选自由以下组成的组:一种或多种伯酰胺、仲酰胺或叔酰胺;半胱氨酸蛋白酶抑制剂;抗凝剂和/或螯合剂。优选地,根据第五方面的收集装置包括作为稳定剂的聚(氧乙烯)聚合物,所述聚(氧乙烯)聚合物优选地是具有至少1500的分子量的高分子量聚(氧乙烯)聚合物,并且还包含一种或多种,优选地两种或更多种其他添加剂,所述添加剂选自由以下组成的组:至少一种其他聚(氧乙烯)聚合物,其具有低于优选地是高分子量聚(氧乙烯)聚合物的第一聚(氧乙烯)聚合物的分子量至少100、优选地至少200、至少300或至少400的分子量,其中所述其他聚(氧乙烯)聚合物优选地是具有1000或更小的分子量的低分子量聚(氧乙烯)聚合物;一种或多种伯酰胺、仲酰胺或叔酰胺;半胱氨酸蛋白酶抑制剂;抗凝剂和/或螯合剂。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2016/0048564中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于建立变体观察的社区数据库的方法,其包括:接收从多个不同用户生成的样品得出的人变体数据集,其中所述用户同意与其他用户共享汇集的变体观察;将接收的人变体数据集存储在基因组信息的知识库中;搜索知识库,以鉴定满足池的包含标准的多个变体观察;将每个鉴定的变体观察添加到池中;以及从池中计算一个或多个匿名等位基因统计信息,其中接收、存储、搜索、添加或计算中的至少一个通过一个或多个计算机进行。另外或替代地,遗传生物标记物的检测可以包括一种用于确定临床试验的候选者的方法,其包括:从用户接收包括遗传靶向标准的临床试验入选标准;搜索从与临床试验入选标准匹配的患者的多个独立实体接收的患者测试信息的知识库;以及向用户提供符合临床试验入选标准的同意患者的搜索结果;其中接收、搜索或提供中的至少一个通过一个或多个计算机进行。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2016/0017320中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于减少测序中的错误并且因此提高突变检测和转录组谱分析的准确性的方法,其包括在扩增之前使用半随机条形码对测序片段加标签以减少偏差和测序错误的方法。另外或替代地,遗传生物标记物的检测可以包括包含半随机条形码序列的寡核苷酸,其包括测序衔接子、逆转录引物和PCR引物。术语“半随机条形码序列”、“半随机条形码”或“半随机条形码”是指半随机核苷酸序列的群体,每个序列由(X聚体)n组成,其中X聚体为3-聚体(即,3-核苷酸寡核苷酸,也称为“三聚体”)、4-聚体(即,4-核苷酸寡核苷酸,也称为“四聚体”))、5-聚体(即,5-核苷酸寡核苷酸,也称为“五聚体”)或6-聚体(即,6-核苷酸寡核苷酸,也称为“六聚体”),并且n为2至10的整数。群体中的每个核苷酸序列被称为“半随机条形码序列”、“半随机条形码”或“半随机序列”。在某些实施方案中,半随机序列由(X聚体)n组成,其中X聚体为3-聚体,并且n为2、3、4、5、6、7、8、9或10,优选为4、5、6、7、8或9。在某些实施方案中,X聚体为4-聚体,并且n为2、3、4、5、6、7、8或9,优选为2、3、4、5、6或7。在某些实施方案中,X聚体为5-聚体,并且n为2、3、4、5、6、7或8,优选为2、3、4、5或6。在某些实施方案中,X聚体为6-聚体,并且n为2、3、4、5、6或7,优选为2、3、4或5。可以从具有定义的序列的X聚体的混合物合成半随机条形码序列。例如,在某些实施方案中,半随机条形码由(X聚体)n组成,其中X聚体为3-聚体,并且n为7。换言之,半随机条形码是由7个三聚体组成的21bp寡核苷酸的群体。可以通过7个连续步骤来合成此类半随机条形码,在每个步骤期间,可以掺入来自定义的三聚体混合物的随机三聚体。用于合成半随机条形码的定义的X聚体混合物可以具有2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个,或至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个不同的X聚体。由定义的X聚体混合物合成的不同半随机条形码序列的数量可以为至少约100、200、300、400、500、1,000、2,000、3,000、4,000、5,000、10,000、50,000、100,000、50,000、100,000、500,000或1,000,000。优选地,每个X聚体(例如,三聚体、四聚体、五聚体和六聚体)具有至少2个与定义的X聚体混合物中的另一个X聚体不同的碱基,使得在测序读长中每个X聚体嵌段内的任何单碱基变体可以被鉴定为错误,而不是不同的条形码。在某些实施方案中,每个X聚体(例如,四聚体、五聚体和六聚体)具有至少3个与定义的X聚体混合物中的另一个X聚体不同的碱基,使得在测序读长中每个X聚体嵌段内的任何单碱基或2碱基变体可以被鉴定为错误,而不是不同的条形码。在某些实施方案中,每个X聚体(例如,五聚体和六聚体)具有至少4个与定义的X聚体混合物中的另一个X聚体不同的碱基,使得在测序读长中每个X聚体嵌段内的任何1碱基、2碱基或3碱基变体可以被鉴定为错误,而不是不同的条形码。另外或替代地,遗传生物标记物的检测可以包括多个单链(ss)寡核苷酸,其中每个寡核苷酸在从5′至3′方向上包含第一序列和第二序列;(a)第一序列是由(X聚体)n组成的半随机序列,其中X聚体是3聚体、4聚体、5聚体或6聚体,并且n是2至8的整数,并且(b)第二序列(i)长度为至少10个核苷酸,(ii)与靶序列完全或基本上互补,并且(iii)在多个寡核苷酸中是相同的。另外或替代地,遗传生物标记物的检测可以包括多个双链(ds)测序衔接子,其中每个测序衔接子包含:(a)开头的寡核苷酸(“第一寡核苷酸”),和(b)第二ss寡核苷酸,其在从3′至5′的方向上包含(i)与测序衔接子的第一寡核苷酸的第一序列完全互补的序列(“序列A”),和(ii)靶序列(“序列B”),并且其中第一寡核苷酸与第二ss寡核苷酸退火。另外或替代地,遗传生物标记物的检测可以包括多组双链(ds)测序衔接子,其中(A)每组包括多个单链(ss)测序衔接子,其中每组中的每个测序衔接子包含:(a)开头的多个ss寡核苷酸的寡核苷酸(“第一寡核苷酸”),和(b)第二ss寡核苷酸,其包含:(i)与序列衔接子第一寡核苷酸的第一序列完全互补的序列(“序列A”),和(ii)位于序列A的5′处的靶序列(“序列B”),和(iii)位于序列B的3′处并且与第一寡核苷酸的第三序列完全互补的序列(“序列C”),并且其中第一寡核苷酸与第二寡核苷酸退火;并且(B)其中不同组中的多个ds测序衔接子彼此相同,除了第一寡核苷酸的第三序列中和第二寡核苷酸的序列C中以外。另外或替代地,遗传生物标记物的检测可以包括一种用于制备测序文库的方法,其包括(1)将包含半随机条形码序列(即,第一寡核苷酸的第一序列)的多个ds测序衔接子连接到样品的dsDNA分子或片段。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0275267中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括提供一种用于从初始含RNA的组合物制备靶RNA耗尽的组合物的方法,其包括:a)使所述初始含RNA的组合物与一组或多组探针分子接触,其中一组探针分子具有以下特征:i)所述组包含两个或更多个长度为100nt或更短的不同探针分子;ii)所述组中包含的探针分子与靶RNA中存在的靶区域互补;iii)当与所述靶区域杂交时,所述两个或更多个不同的探针分子在形成的双链杂交体中彼此邻近定位;并且在靶RNA与探针分子之间生成双链杂交体;b)通过使用结合双链杂交体的结合剂捕获双链杂交体,从而形成杂交体/结合剂复合物;c)从组合物中分离杂交体/结合剂复合物,从而提供靶RNA耗尽的组合物。另外或替代地,遗传生物标记物的检测可以包括专门设计的探针分子组,其与不想要的靶RNA,例如像不同rRNA种类杂交并因此对其进行标记以进行消耗。每组探针分子靶向靶RNA中的特定区域,也称为靶区域,并且包含与所述靶区域杂交的两个或更多个不同的短探针分子。当与它们的靶区域杂交时,一组短探针分子在形成的双链杂交体中彼此邻近定位并且因此紧密邻近定位。形成的双链杂交体跨越靶区域并因此覆盖靶区域。然后,抗杂交体结合剂结合所形成的包含一组短探针分子的双链杂交体,从而形成杂交体/结合剂复合物。所述复合物可以容易地与剩余的组合物分离,从而去除不想要的靶RNA,并且因此提供靶RNA耗尽的组合物。另外或替代地,遗传生物标记物的检测可以包括一种用于对样品中包含的所关注的的RNA分子进行测序的方法,其包括:a)优选地通过从样品中分离全部RNA来获得含RNA的组合物;b)使用根据第一方面的方法,从含RNA的组合物中消耗不想要的靶RNA,所述靶RNA优选是全部RNA,从而提供靶RNA耗尽的组合物;c)任选地去除未结合的探针分子;d)对靶RNA耗尽的组合物中包含的RNA分子进行测序。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0225775中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于进行聚合酶链反应(PCR)的方法,其包括:a)在对单个反应混合物中的一个或多个不同靶核酸具有特异性的一个或多个不同引物对的存在下,通过PCR扩增一个或多个不同靶核酸,其中一个或多个不同引物对的每个引物均含有一个或多个可裂解碱基,并且其中在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少4个核苷酸。在某些实施方案中,在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少5个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少6个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少7个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少8个核苷酸。步骤a)可以包括在对单个反应混合物中的单个靶核酸具有特异性的引物对的存在下扩增单个靶核酸。替代地,步骤a)可以包括扩增对单个反应混合物中的多个不同靶核酸具有特异性的多个不同引物对。在某些实施方案中,在一个或多个不同引物对的所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少4个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少5个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少6个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少7个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少8个核苷酸。优选地,可裂解碱基是尿嘧啶。替代地,可裂解碱基是肌苷、氧化的嘧啶、氧化的嘌呤、5-羟基尿嘧啶、5-羟基甲基尿嘧啶或5-甲酰基尿嘧啶。一个或多个不同引物对可以包含至少100个不同的引物对。在一些实施方案中,所述方法还可以包括一个或多个:b)使步骤a)的一个或多个扩增产物中的一个或多个可裂解碱基裂解,以在一个或多个扩增产物中产生单链DNA突出;c)消化步骤b)中获得的单链DNA突出,以生成一个或多个修剪的扩增产物;d)将衔接子连接到一个或多个修剪的扩增产物以产生一个或多个衔接子连接的修剪的扩增产物;以及e)对步骤d)的一个或多个衔接子连接的修剪的扩增产物进行测序。另外或替代地,遗传生物标记物的检测可以包括一个引物对组,其包括:对一个或多个不同靶核酸具有特异性的一个或多个不同引物对,其中一个或多个不同引物对的每个引物均含有一个或多个可裂解碱基,并且其中在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少4个核苷酸。在某些实施方案中,在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少5个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少6个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少7个核苷酸。在某些其他实施方案中,在一个或多个不同引物对的基本上所有引物中,一个或多个可裂解碱基中的每一个与包含所述一个或多个可裂解碱基的引物的3′末端相距至少8个核苷酸。另外或替代地,遗传生物标记物的检测可以包括一种PCR反应混合物,其包含:引物对组、DNA聚合酶、dNTP和PCR反应缓冲剂。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0197787中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括提供一种用于从测序文库富集靶序列以提供靶富集的测序文库的方法,其中所述测序文库适于大规模平行测序并且包含多个双链核酸分子,其中所述方法包括:a)提供核蛋白丝,其包含(i)单链入侵探针,其中所述入侵探针具有与双链靶序列的一条链基本上互补的区域,(ii)重组酶;b)在入侵探针与靶序列的互补部分之间形成复合物,其中复合物形成是由重组酶介导的;c)将复合物与剩余的测序文库分离,从而富集靶序列。另外或替代地,遗传生物标记物的检测可以包括提供一种用于对所关注的靶区域进行测序的方法,其包括:a)提供适于大规模平行测序并且包含多个双链核酸分子的测序文库,其中双链核酸分子的一部分包含在测序文库中,靶序列包含位于所关注的靶区域中的序列;b)根据以上方法富集对应于所关注的靶区域的靶序列,从而提供靶富集的测序文库;c)对富集的靶序列进行平行测序。另外或替代地,遗传生物标记物的检测可以包括测序方法用于外显子组测序、外显子测序、靶向基因组重测序、基因组套定向的靶向基因组重测序、转录组测序和/或分子诊断的用途。另外或替代地,遗传生物标记物的检测可以包括一种用于进行根据第一方面的方法的试剂盒,其包括:a)用于产生适于大规模平行测序的测序文库的衔接子;b)任选地一种或多种用于将衔接子偶联到核酸片段的连接试剂;c)重组酶,优选地RecA样重组酶;d)重组酶的不可水解辅助因子,优选地腺苷5′-(γ-硫代)三磷酸酯;e)多个不同的入侵探针,其中入侵探针在与所关注的靶区域的互补区域方面不同;f)多个不同的稳定探针,其至少部分地与多个入侵探针互补;以及g)适于捕获在入侵探针与靶序列之间形成的突触复合物的固体支撑物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0093756中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括在解旋酶依赖性反应中扩增靶核酸的方法。另外或替代地,遗传生物标记物的检测可以包括在解旋酶依赖性反应中扩增和检测靶核酸的方法以及用于辅助检测的修饰的检测标记。在一些实施方案中,用于在解旋酶依赖性反应中扩增靶核酸的方法,所述方法包括:(a)提供待扩增的靶核酸;其中所述靶核酸是双链的,并且在步骤(b)之前通过在50mM NaOH的存在下在65℃下加热10分钟来变性;(b)添加用于与步骤(a)的靶核酸杂交的寡核苷酸引物;(c)通过DNA聚合酶合成与模板互补的寡核苷酸引物的延伸产物,以形成双链体;(d)使步骤(c)的双链体与用于解开双链体的解旋酶制剂接触,使得解旋酶制剂包含解旋酶和单链结合蛋白(SSB),除非解旋酶制剂包含热稳定的解旋酶,其中单链结合蛋白是任选的;以及(e)重复步骤(b)(d)以在解旋酶依赖性反应中指数地和选择性地扩增靶核酸。另外或替代地,遗传生物标记物的检测可以包括一种在解旋酶依赖性反应中扩增靶核酸的方法,其中将靶核酸经受涉及RNA探针和RNA-DNA杂交捕获抗体的“预先”步骤。此方法包括:(a)提供待扩增的靶核酸;其中所述靶核酸是单链DNA,并且其中将互补的RNA探针添加到所述单链DNA中以结合所述DNA,以形成靶核酸RNA-DNA杂交体;并且其中将识别结合到磁性珠粒的RNA-DNA杂交体的杂交捕获抗体添加到步骤(b)中待使用的RNA-DNA杂交体;(b)添加用于与步骤(a)的靶核酸RNA-DNA杂交体杂交的寡核苷酸引物;(c)通过DNA聚合酶合成与模板互补的寡核苷酸引物的延伸产物,以形成双链体;(d)使步骤(c)的双链体与用于解开双链体的解旋酶制剂接触,使得解旋酶制剂包含解旋酶和单链结合蛋白(SSB),除非解旋酶制剂包含热稳定的解旋酶,其中单链结合蛋白是任选的;以及(e)重复步骤(b)-(d)以在解旋酶依赖性反应中指数地和选择性地扩增靶核酸。另外或替代地,遗传生物标记物的检测可以包括一种修饰的TaqMan探针(和使用此探针的方法)。所述探针在与3′或5′末端处具有与5′或3′末端互补的短尾,并且其中TaqMan探针与靶核酸互补,此短尾除外,并且其中短尾序列形成茎环结构。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0011416中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于确定一个或多个靶多核苷酸的存在的方法,所述方法包括:对包含核酸样品和一组对每个靶多核苷酸具有特异性的寡核苷酸引物的反应混合物进行包括链分离、引物退火和引物延伸的循环的PCR扩增方案;其中每组寡核苷酸引物包含至少一个截短的双结构域正向引物的第一子集和至少一个反向引物的第二子集;其中一组的每个截短的双结构域引物包含与所述组中其他截短的双结构域引物上的5′尾部区域不同的5′尾部区域和与包含靶的双链核酸的一条链上的序列互补的3′核心区域;其中对于每个截短的双结构域引物,3′核心在第一退火温度下与其互补靶位点序列基本上退火,并且5′尾部区域和3′核心区域包含的序列在第二退火温度下与其补体基本上退火,第二退火温度高于第一退火温度,使得在第二退火温度下,截短的双结构域引物的3′核心与也不具有截短的双结构域引物的5′尾部序列的补体的模板分子基本上不能退火;其中对于引物组的每个截短的双结构域引物:5′尾部序列与靶序列没有任何同源性;并且相对于截短的双结构域引物组的任何其他5′尾部序列,所述5′尾部序列具有6个或更少的连续同源碱基;其中PCR扩增方案包括第一阶段和第二阶段,所述第一阶段包括在第一退火温度下进行第一组循环的退火;并且第二阶段包括在第二退火温度下进行第二组循环的退火;以及检测每个靶多核苷酸的扩增产物,其中所述检测指示靶多核苷酸的存在。在一些实施方案中,反向引物包含双结构域引物。在一些实施方案中,反向引物包含截短的双结构域引物。在一些实施方案中,反向引物包含扩增引物。在一些实施方案中,所述组的引物包含至少一个双结构域正向引物;其中一组的每个双结构域引物包含与所述组中的其他双结构域引物的5′尾部区域不同的5′尾部区域,与包含所述靶的双链核酸的一条链上的序列互补的3′核心区域,以及与出现在所述靶位点处的变体核苷酸之一互补的末端核苷酸;其中对于每个双结构域引物,3′核心在第一退火温度下与其互补靶位点序列基本上退火,并且5′尾部区域和3′核心区域包含的序列在第二退火温度下与其补体基本上退火,第二退火温度高于第一退火温度,使得在所述第二退火温度下,所述双结构域引物的所述3′核心与也不具有双结构域引物的5′尾部序列的补体的模板分子基本上不能退火;并且其中对于引物组的每个截短的双结构域引物:5′尾部序列与靶序列没有任何同源性;并且相对于双结构域或截短的双结构域引物组的任何其他5′尾部序列,所述5′尾部序列具有6个或更少的连续同源碱基。另外或替代地,遗传生物标记物的检测可以包括一种用于确定一个或多个靶多核苷酸的存在的组合物,其包含:至少一组对每个靶多核苷酸具有特异性的寡核苷酸引物;其中每组寡核苷酸引物包含至少一个截短的双结构域正向引物的第一子集和至少一个反向引物的第二子集;其中一组的每个截短的双结构域引物包含与所述组中其他截短的双结构域引物上的5′尾部区域不同的5′尾部区域和与包含靶的双链核酸的一条链上的序列互补的3′核心区域;其中对于每个截短的双结构域引物,3′核心在第一退火温度下与其互补靶位点序列基本上退火,并且5′尾部区域和3′核心区域包含的序列在第二退火温度下与其补体基本上退火,第二退火温度高于第一退火温度,使得在第二退火温度下,截短的双结构域引物的3′核心与也不具有引物的5′尾部序列的补体的模板分子基本上不能退火;其中对于截短的双结构域引物组的每个成员:5′尾部序列与靶序列没有任何同源性;并且相对于截短的双结构域引物组的其他5′尾部序列,所述5′尾部序列具有6个或更少的连续同源碱基。在一些实施方案中,所述组合物还可以包含核酸样品。另外或替代地,遗传生物标记物的检测可以包括一种用于确定一个或多个靶多核苷酸的存在的方法,所述方法包括:对包含核酸样品和一组对每个靶多核苷酸具有特异性的寡核苷酸引物的反应混合物进行包括链分离、引物退火和引物延伸的循环的PCR扩增方案;其中每组寡核苷酸引物包含至少一个截短的双结构域正向引物的第一子集和至少一个反向引物的第二子集;其中一组的每个截短的双结构域引物包含与所述组中其他截短的双结构域引物上的5′尾部区域不同的5′尾部区域和与包含靶的双链核酸的一条链上的序列互补的3′核心区域;其中对于每个截短的双结构域引物,3′核心在第一退火温度下与其互补靶位点序列基本上退火,并且5′尾部区域和3′核心区域包含的序列在第二退火温度下与其补体基本上退火,第二退火温度高于第一退火温度,使得在第二退火温度下,截短的双结构域引物的3′核心与也不具有截短的双结构域引物的5′尾部序列的补体的模板分子基本上不能退火;其中对于引物组的每个截短的双结构域引物:5′尾部序列与靶序列没有任何同源性;并且相对于截短的双结构域引物组的任何其他5′尾部序列,5′尾部序列具有6个或更少的连续同源碱基;其中PCR扩增方案包括第一阶段和第二阶段,所述第一阶段包括在第一退火温度下进行第一组循环的退火;并且第二阶段包括在第二退火温度下进行第二组循环的退火;以及检测每个靶多核苷酸的扩增产物,其中所述检测指示靶多核苷酸的存在。另外或替代地,遗传生物标记物的检测可以包括一种用于确定一个或多个靶多核苷酸的存在的组合物,其包含:至少一组对每个靶多核苷酸具有特异性的寡核苷酸引物;其中每组寡核苷酸引物包含至少一个截短的双结构域正向引物的第一子集和至少一个反向引物的第二子集;其中一组的每个截短的双结构域引物包含与所述组中其他截短的双结构域引物上的5′尾部区域不同的5′尾部区域和与包含靶的双链核酸的一条链上的序列互补的3′核心区域;其中对于每个截短的双结构域引物,3′核心在第一退火温度下与其互补靶位点序列基本上退火,并且5′尾部区域和3′核心区域包含的序列在第二退火温度下与其补体基本上退火,第二退火温度高于第一退火温度,使得在第二退火温度下,截短的双结构域引物的3′核心与也不具有引物的5′尾部序列的补体的模板分子基本上不能退火;其中对于截短的双结构域引物组的每个成员:5′尾部序列与靶序列没有任何同源性;并且相对于截短的双结构域引物组的其他5′尾部序列,所述5′尾部序列具有6个或更少的连续同源碱基。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2010/0113758中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于纯化来自样品的生物分子的方法,其包括以下步骤:a)将具有结合基质的反应容器布置在离心机中,在此步骤之前或之后在反应容器中制备含有生物分子的样品的溶液或悬浮液,或将其引入到反应容器中;以及b)包括至少一个多级离心步骤,所述多级离心步骤包括在第一加速度值下进行的至少第一离心步骤和在高于第一加速度值的第二加速度值下进行的至少第二离心步骤;其中c)步骤b)可以是结合步骤、洗涤步骤和/或洗脱步骤。优选地,多级步骤b)是结合步骤,其中通过离心将生物分子结合到结合基质。特别优选地,设想生物分子是选自含有以下的组的物质:核酸、氨基酸、寡肽、多肽、单糖、寡糖、多糖、脂肪、脂肪酸和/或脂质。在一些实施方案中,结合基质包含硅酸盐底物,并且此外在离心之前将含有生物分子的样品与至少一种离液盐混合。所述实施方案特别适于核酸。优选地,在此实施方案中设想以下步骤:a)将具有包含硅酸盐底物的结合基质的柱状反应容器布置在离心机中,其中在此步骤之前或之后在反应容器中制备含核酸的样品的溶液或悬浮液和至少一种离液盐,或将其引入到反应容器中;b)包括在第一加速度值下进行的第一离心步骤;c)包括在高于第一加速度值的第二加速度值下进行的第二离心步骤;d)任选地在步骤c)与步骤d)之间或在步骤d)之后包括另外的离心步骤;e)任选地包括一个或多个洗涤步骤;以及f)用洗脱液洗脱结合到硅酸盐底物的核酸。在此实施方案中,多步离心步骤是结合步骤,其中核酸结合到硅酸盐基质。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2009/0298187中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于确定样品中靶核酸的存在的方法。所述方法包括:a)在杂交条件下使一个或多个多核苷酸探针与样品接触,所述杂交条件足以使一个或多个多核苷酸探针与样品中的靶核酸杂交,以形成双链核酸杂交体,其中一个或多个多核苷酸探针不与靶核酸的变体杂交;以及b)检测双链核酸杂交体,其中检测包括使双链核酸杂交体与对双链核酸杂交体具有免疫特异性的第一抗杂交体抗体接触,由此双链核酸杂交体的检测确定样品中的靶核酸。在一些实施方案中,核酸的杂交和双链核酸杂交体的检测是同时进行的。在一些实施方案中,在使双链核酸杂交体与对双链核酸杂交体具有免疫特异性的第一抗杂交体抗体接触之后,添加第二抗杂交体抗体以检测双链核酸杂交体,由此通过这些第二抗杂交体抗体进行的双链核酸杂交体的检测确定样品中靶核酸的存在。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,686,157中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于灵敏检测特定核酸序列的量和位置的方法和组合物。在一些实施方案中,所述方法利用了被称为棒棒糖低聚物的支链低聚物,其具有尾部部分、右臂部分和左臂部分。这三个组件在共同的接合点处连接,从而形成三尾结构。两个臂各自以与靶序列中的邻近序列互补的序列终止。当寡聚物与靶序列杂交时,这允许右臂和左臂连接在一起,从而在拓扑上将寡聚物连接到靶序列。然后可以在靶序列的位置处检测尾部部分。通过使用寡聚物的尾部来引发DNA环的滚环复制,将长串联重复序列DNA与靶序列缔和。滚环复制不干扰臂与靶序列的缔合,从而维持串联重复序列DNA与靶序列的紧密缔合。另外或替代地,遗传生物标记物的检测可以包括一种扩增核酸序列的方法,所述方法包括:(a)将一个或多个不同的棒棒糖寡聚物与一个或多个各自包含一个或多个靶序列的靶样品混合,并且在促进寡聚物与靶序列之间杂交的条件下温育,其中所述棒棒糖寡聚物各自包含具有尾部部分的支链寡聚物,其中所述尾部部分包含滚环复制引物,其中所述滚环复制引物包含与扩增靶环的引物补体部分互补的互补部分;(b)在步骤(a)之前、同时或之后,将一个或多个扩增靶环与寡聚物混合,并且在促进扩增靶环与寡聚物的滚环复制引物部分之间的杂交的条件下温育;以及(c)将DNA聚合酶与寡聚物和扩增靶环混合,并且在促进扩增靶环的复制的条件下温育,其中扩增靶环的复制导致串联序列DNA的形成。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,090,935中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于从样品中分离核酸的方法,所述方法包括:煮沸所述样品;冷却煮沸的样品;使冷却样品的液相中的核酸直接结合到包含磁性粒子的固体支撑物;以及将具有结合的核酸的固体支撑物与所述液相的剩余部分分离。另外或替代地,遗传生物标记物的检测可以包括一种用于从固定或老化的样品中分离核酸的方法,所述方法包括:煮沸固定或老化的样品;冷却煮沸的样品;使冷却的样品中的核酸直接结合到具有高表面积的包含磁性粒子的固体支撑物;以及将具有结合的核酸的固体支撑物与冷却样品的剩余部分分离。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/032808中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种RNA测序的方法,由此所述方法包括:(i)提供RNA;(ii)通过使用逆转录酶、第一组寡核苷酸引物和步骤(i)的RNA将RNA经受逆转录来生成(a)一个或多个单链第一DNA链(cDNA),其与RNA互补;以及(iii)通过使用DNA聚合酶、第二组寡核苷酸引物和(ii)的单链cDNA生成第二DNA链,其中a)第一组寡核苷酸引物在其5’末端核苷酸处包含共价偶联部分,其阻断生成的第一DNA链的5’末端处的连接;或者b)第二组寡核苷酸引物在其5’末端核苷酸处包含共价偶联部分,其阻断生成的第二DNA链的5’末端处的连接。在一些实施方案中,所述方法还包括以下后续步骤:(iv)任选地使用多核苷酸激酶和具有聚合酶和核酸外切酶活性的酶对双链DNA链进行末端修复,以获得末端修复的DNA链;(v)任选地使用脱氧核苷酰转移酶将末端腺嘌呤添加到DNA链的3’末端;以及(vi)将任选地包含末端胸腺嘧啶的衔接子连接到任选地包含3′末端腺嘌呤的DNA链。所述方法还可以包括对生成的DNA进行序列分析。在一些实施方案中,所述方法包括:(i)提供RNA;(ii)通过使用逆转录酶、第一组寡核苷酸引物和步骤(i)的RNA将RNA经受逆转录来生成(a)一个或多个单链第一DNA链(cDNA),其与RNA互补;(iii)通过使用DNA聚合酶、第二组寡核苷酸引物和(ii)的单链cDNA生成第二DNA链;(iv)将衔接子连接到步骤(iii)的双链DNA;以及(v)对生成的DNA进行测序,其中a)第一组寡核苷酸引物在其5’末端核苷酸处包含共价偶联部分,其阻断生成的第一DNA链的5’末端处的连接;或者b)第二组寡核苷酸引物在其5’末端核苷酸处包含共价偶联部分,其阻断生成的第二DNA链的5’末端处的连接。通过生成第二DNA链,生成了双链DNA。在上述方法的一些实施方案中,在步骤(iv)之前,所述方法包括以下步骤:(iii)(a)使用多核苷酸激酶和具有聚合酶和核酸外切酶活性的酶对双链DNA链进行末端修复,以获得末端修复的DNA链。在一些实施方案中,步骤(iii)(a)之后是步骤(iii)(b),其包括通过使用脱氧核苷酰转移酶将末端腺嘌呤添加到DNA链的3’末端,其中衔接子包含3’末端胸腺嘧啶,其在步骤(iv)中连接到包含3’末端腺嘌呤的DNA链。在一些实施方案中,与阻断部分和/或未修饰的寡核苷酸引物共价偶联的寡核苷酸引物是随机寡核苷酸引物。在一些实施方案中,所述方法包括提取和任选地富集所关注的RNA的初始步骤。在一些实施方案中,将提取的RNA片段化为19-510bp的平均大小。在以上方法的一些实施方案中,分子可以附接到固体支撑物以用于配对末端测序。在一些实施方案中,“阻断连接的部分”或“阻断部分”是指较大分子的特定部分,其多于一个原子,在本文中是修饰的寡核苷酸的部分,其与修饰的引物寡核苷酸的5’核苷酸共价偶联。所述部分优选地在所述部分所位于的位点处,优选地在寡核苷酸的5’末端的5’末端核苷酸处阻断任何连接。在以上方法的一些实施方案中,包含阻断部分的寡核苷酸引物的特征在于:(i)寡核苷酸在5’末端核苷酸处包含非游离的5’磷酸酯,其中任选地在5’末端核苷酸处的5′OH基团或5’磷酸酯基团与阻断连接的部分共价偶联;(ii)5’末端核苷酸的碱基不是胸腺嘧啶、腺嘌呤、胞嘧啶、鸟嘌呤和尿嘧啶中的任一种;(iii)5’末端核苷酸的脱氧核糖的一个或两个2’氢被另一个原子或阻断部分替代;并且/或者(iv)寡核苷酸包含在空间构象中具有戊糖的5’末端核苷酸,所述空间构象不是RNA或DNA中的核糖或脱氧核糖的空间构象。在以上方法的一些实施方案中,包含阻断连接的共价偶联部分的寡核苷酸引物在与赋予连接-阻断特性的部分共价偶联之前,在5’末端核苷酸处包含5′OH或游离的5’磷酸酯基团。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2016/193490中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括提供一种基于聚(环氧烷)聚合物的大小选择性DNA分离方法,其用于从含DNA的样品中分离具有高于某个临界值的大小的DNA分子,包括:(a)制备包含含DNA的样品、至少一种聚(环氧烷)聚合物和至少一种二价阳离子的结合混合物,其中所述结合混合物具有在8至10范围内的pH,并且将沉淀的DNA分子结合到具有未修饰的含硅表面的固相,从而提供具有结合的DNA分子的固相,所述DNA分子具有高于临界值的大小,其中在所使用的结合条件下,具有小于临界值的大小的DNA分子基本上不结合到固相;(b)将结合的DNA分子与剩余的样品分离;任选地洗涤结合的DNA分子;以及任选地从固相中洗脱结合的DNA分子。在一些实施方案中,具有高于所需临界值的大小的DNA分子以高产率有效地结合到固相,而具有低于所述临界值的大小的DNA分子在多数情况下未结合,并且因此在步骤(a)中未被回收。可以通过改变结合剂混合物中的聚(环氧烷)聚合物的浓度来调节临界值,如从现有技术中已知的,并且也通过实施例证明。即使使用具有未修饰的含硅表面的固相,如指定的二价阳离子和碱性pH值的存在也能确保具有高于临界值的大小的DNA分子的有效结合。所述方法特别适于从衔接子连接样品中分离作为靶DNA分子的衔接子连接的DNA分子,以及去除衔接子单体和衔接子-衔接子连接产物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,811,759中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于产生针对疾病状态或状况的签名ncRNA谱的方法,所述方法包括:a.确定来自第一来源的第一ncRNA谱,所述第一来源的特征在于没有所述疾病状态或状况;b.确定来自第二来源的第二ncRNA谱,所述第二来源的特征在于对所述疾病状态或状况呈阳性,所述第一ncRNA谱和第二ncRNA谱根据用于确定RNA样品中多个靶ncRNA分子的谱的方法获得,所述方法包括以下步骤:i.提供来自受试者的所述RNA样品,所述样品含有所述多个靶ncRNA;ii.在一定条件下使所述样品与对所述待检测的靶ncRNA中的每一个具有特异性的第一寡核苷酸接触,所述条件适于在所述第一寡核苷酸与所述靶ncRNA之间形成复合物,所述第一寡核苷酸中的每一个包含第一信号发生器以生成第一可检测信号,并且所述第一寡核苷酸中的每一个具有基本上相同的用于结合所述靶ncRNA中的每一个的第一Tm;iii.在一定条件下使所述样品与能够结合所述待检测的靶ncRNA中的每一个的第二寡核苷酸接触,所述条件适于在所述第二寡核苷酸与所述靶ncRNA之间形成复合物,所述第二寡核苷酸包含第二信号发生器以生成第二可检测信号,并且所述第二寡核苷酸中的每一个具有基本上相同的用于结合所述靶ncRNA中的每一个的第二Tm;iv.通过测量第一可检测信号和第二可检测信号来确定所述样品中所述多个靶ncRNA的存在;以及v.基于所检测的靶ncRNA生成样品的谱;c.比较所述第一ncRNA谱和第二ncRNA谱,并且鉴定在所述第二ncRNA谱中发生改变的那些ncRNA分子,以产生针对所述疾病状态或状况的签名ncRNA谱。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2005/0244847中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于扩增环状核酸模板的方法,其包括使模板与包含热稳定聚合酶、个体核苷酸以及与模板内的共同区域互补的正向引物和反向引物的反应混合物接触,其中共同区域的长度优选为约80至150个碱基对。在一个实施方案中,引物的5’末端与模板的相距约10至50个碱基对,还更优选地相距0至25个碱基对的相对链杂交。在一些实施方案中,当引物与模板杂交时,正向引物的5’末端通常接近反向引物的5’末端,而远离反向引物的3’末端。在特别优选的实施方案中,共同区域是染色体外核酸内的保守区域,例如复制起点。反应混合物还可以包含具有弱有机碱和弱有机酸的反应缓冲剂。另外或替代地,遗传生物标记物的检测可以包括用于进行染色体外DNA的体外扩增的试剂,其包括支持扩增和后续连接反应的溶液以及支持组合的扩增和连接反应的溶液,即,其同时为聚合酶和连接酶活性提供适当的环境。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/137826中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于富集模板核酸的方法和用于产生测序文库的方法。在一些实施方案中,用于富集模板核酸或用于产生测序文库的方法包括:a)将模板核酸与结合到固体表面并初始包含至少两个功能序列元件的寡核苷酸杂交;b)延伸与模板核酸杂交的表面结合的寡核苷酸以形成双链;c)任选地修饰步骤b)中生成的双链核酸;d)进行在步骤a)的模板核酸杂交中未使用的表面结合的寡核苷酸的3’截短;以及e)任选地修饰步骤d)中生成的单链表面结合的寡核苷酸。在一些实施方案中,还包括以下额外步骤:f)将另外的模板核酸与表面结合的寡核苷酸杂交,或者使用表面结合的寡核苷酸内的功能序列元件以用于下游应用。在一些实施方案中,下游应用是在固体表面上的扩增核酸,从固体表面解偶联,通过使用寡核苷酸内的RNA聚合酶启动子进行体外转录,通过使用引物结合位点或分子条形码区域标记固定的核酸以用于寡核苷酸内的鉴定、测序或其组合。在一些实施方案中,功能序列元件中的至少一个是杂交位点或优选地可用于下游应用的序列。在另一个实施方案中,功能序列元件是连续的或重叠的。在某些实施方案中,功能序列元件通过预定的裂解位点分离或通过保护性寡核苷酸与表面结合的寡核苷酸的杂交而生成。在一些实施方案中,步骤a)至c)用来自不同样品的模板核酸重复至少一次。在其他实施方案中,步骤a)至e)用来自相同样品或不同样品的模板核酸重复至少一次,任选地其中一次或多次重复是平行进行的。在一些实施方案中,表面结合的寡核苷酸的密度在500-500000个寡核苷酸/μηι2,更优选在750-200000个寡核苷酸/μηι2,最优选在1000-100000个寡核苷酸/μηη2之间。在其他实施方案中,表面结合的寡核苷酸包含2至20个功能序列元件,更优选2至10个,最优选2至5个。在某些实施方案中,表面结合的寡核苷酸的长度在4-200nt,优选10-200nt,更优选6-180nt,更优选8-160nt,更优选10-140nt,最优选20-100nt的范围内。在一些实施方案中,表面结合的寡核苷酸的长度是10nt,优选20nt。在一些实施方案中,表面结合的寡核苷酸内相同位置的所有功能序列元件均具有唯一序列或包含2-100000,优选2-50000,更优选2-25000,更优选2-10000,更优选2-5000,更优选2-2500,最优选2-1000个不同的序列。在某些实施方案中,通过酶或化学方法实现3’截短。在一些实施方案中,通过引入条形码序列、添加测序衔接子、在末端处添加荧光团、掺入修饰的碱基或其他修饰来修饰结合到表面的双链核酸。在其他实施方案中,通过添加生物素、标记部分、阻断部分或其他修饰来修饰结合到表面的单链寡核苷酸。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/013598中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于进行单端双链体DNA测序的方法、衔接子和试剂盒。在一些实施方案中,用于进行DNA测序的方法包括:(a)在多个双链靶核酸和第一组基本上互补的双链衔接子的存在下进行连接反应以生成连接产物,其中第一组的每个衔接子包含第一链和第二链,第一链从5’至3’包含长度为10个或更多个核苷酸的5’区、分子标签序列和任选的3’区,第二链从3’至5’包含具有与第一链的5’区的10个核苷酸或更长部分完全互补的序列的3’区、第一链的分子标签序列的完全互补序列和任选的5’区,第一链与第二链之间的至少一个错配位于第一链的3’区中(如果3’区存在的话),和/或位于第一链的5’区的10个核苷酸或更长部分的3’处的5’区中,并且第一组的不同衔接子包含在其第一链中的不同的分子标签序列以及在其第二链中不同分子标签序列的对应完全互补序列,但在其他方面彼此相同;(b)使用步骤(a)的连接产物作为模板进行扩增反应以生成扩增产物,其中扩增产物包含一个或多个在基本上互补的双链衔接子的第一链和第二链中不形成互补碱基对的位置;以及(c)使用步骤(b)的扩增产物或其进一步的扩增产物作为模板进行测序反应,以获得包含一个或多个在双链衔接子的第一链和第二链中不形成互补碱基对的位置的序列读长。另外或替代地,遗传生物标记物的检测可以包括一组基本上互补的双链衔接子,其包括至少16个不同的衔接子,其中所述组的每个衔接子包含第一链和第二链,第一链从5’至3’包含5’区、分子标签序列和任选的3’区,第二链从3’至5’包含具有与第一链的5’区的10个核苷酸或更长部分完全互补的序列的3′区、第一链的分子标签序列的完全互补序列和任选的5’区,第一链与第二链之间的至少一个错配位于第一链的3’区中(如果3’区存在的话)和/或位于第一链的5’区的10个核苷酸或更长部分的3’处的5’区中,并且不同的衔接子包含在其第一链中的不同的分子标签序列以及在其第二链中不同分子标签序列的对应完全互补序列,但在其他方面彼此相同。另外或替代地,遗传生物标记物的检测可以包括一种试剂盒,其包括:(1)一组基本上互补的双链衔接子,和(2)连接酶。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/165289中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于多重置换扩增(MDA)的引物、引物对、试剂盒和方法。在一些实施方案中,用于通过多重置换扩增来扩增核酸的方法包括:进行一个或多个单独的多重置换扩增反应,其中每个反应在以下物质的存在下进行:(1)引物组,其中所述引物组的每个引物在其5’末端处包含自互补序列并且在其3’末端处包含随机序列或半随机序列,并且其中每个引物组中的自互补序列是相同的,但与另一引物组中的自互补序列是不同的;(2)具有链置换活性的DNA聚合酶;以及(3)靶核酸。在某些实施方案中,一个或多个引物组中的自互补序列的长度各自为6至20个核苷酸。在某些实施方案中,一个或多个引物组中的随机序列或半随机序列的长度为4至20个核苷酸。优选地,引物对3′-5’核酸外切酶校对活性具有抗性。在某些实施方案中,具有链置换活性的DNA聚合酶是Phi29聚合酶。在某些实施方案中,进行至少2个单独的多重置换扩增反应。在某些实施方案中,用于一个或多个单独的多重置换扩增反应中的靶核酸是来自一个或多个不同的单细胞诸如人细胞的基因组DNA。在某些实施方案中,多重置换扩增在约20℃至约40℃的温度下进行,诸如在上述范围内的两个温度之间或在等温条件下循环。在进行多个单独的多重置换扩增反应的某些实施方案中,所述方法还包括:将从多个多重置换扩增反应扩增的核酸汇集在一起;使用汇集的扩增核酸产生测序文库;以及对汇集的扩增的核酸进行测序。另外或替代地,遗传生物标记物的检测可以包括一个引物组,其中所述引物组中的每个引物在其5’末端处包含自互补序列,并且在其3’末端处包含随机序列或半随机序列,并且其中引物的自互补序列彼此相同。另外或替代地,遗传生物标记物的检测可以包括多个引物组,其中每个引物在其5’末端处包含自互补序列,并且在其3’末端处包含随机序列或半随机序列,其中每个引物组中引物的自互补序列是相同的,但与另一引物组中引物的自互补序列是不同的。在某些实施方案中,所述多个引物组包括至少3个不同的引物组。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/085321中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种用于产生适于稳定生物样品的细胞外核酸群体的灭菌组合物的方法,所述方法包括:a)提供一种组合物,其包含:i.至少一种半胱氨酸蛋白酶抑制剂,和ii.至少一种选自硫醇(优选地N-乙酰基-半胱氨酸或谷胱甘肽)、水溶性维生素和维生素E或其衍生物的化合物;以及b)对组合物进行辐射以灭菌。另外或替代地,遗传生物标记物的检测可以包括一种用于稳定含细胞的生物样品中包含的细胞外核酸群体的方法,其包括:a)获得i)适于稳定生物样品的细胞外核酸群体的灭菌组合物,或ii)灭菌形式的以上组合物;以及b)使含细胞的生物样品与灭菌组合物接触以稳定化。另外或替代地,遗传生物标记物的检测可以包括一种用于从稳定的含细胞的生物样品中分离细胞外核酸的方法,其包括:a)根据所述方法稳定含细胞的生物样品;以及b)分离细胞外核酸。另外或替代地,遗传生物标记物的检测可以包括一种用于处理和/或分析细胞外核酸的方法,其包括:a)根据所述方法从稳定的含细胞的生物样品中分离细胞外核酸;以及b)处理和/或分析分离的细胞外核酸。另外或替代地,遗传生物标记物的检测可以包括一种用于产生可灭菌组合物的方法,其中呈灭菌形式的组合物适于稳定生物样品的细胞外核酸群体,所述方法包括:a)制备一种组合物,其包含:i.至少一种半胱氨酸蛋白酶抑制剂,和ii.至少一种选自硫醇(优选地N-乙酰基-半胱氨酸或谷胱甘肽)、水溶性维生素和维生素E或其衍生物的化合物;以及任选地b)对组合物进行灭菌。另外或替代地,遗传生物标记物的检测可以包括一种可灭菌组合物,其中呈灭菌形式的组合物适于稳定生物样品的细胞外核酸群体,其中所述组合物是方法的步骤a)中提供的组合物。它包含:i.至少一种半胱氨酸蛋白酶抑制剂,和ii.至少一种选自硫醇(优选地N-乙酰基-半胱氨酸或谷胱甘肽)、水溶性维生素和维生素E或其衍生物的化合物。根据第六方面的可灭菌组合物,其可以是如在方法的步骤a)中提供的组合物,在实施方案中可以被灭菌以提供灭菌组合物。另外或替代地,遗传生物标记物的检测可以包括一种样品收集装置,诸如容器,优选地样品收集管,其包含以上的可灭菌组合物。另外或替代地,遗传生物标记物的检测可以包括至少一种化合物用于在通过辐射灭菌期间保护适于稳定生物样品或其组分的细胞外核酸群体的组合物的用途,所述化合物选自由以下组成的组:硫醇(优选地N-乙酰基-半胱氨酸或谷胱甘肽)、水溶性维生素和维生素E或其衍生物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2016/170147中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括生成dsDNA的方法,其中所述方法包括在DNA连接酶和调节dsDNA的解链温度的剂的存在下连接第一dsDNA和第二dsDNA,二者均任选地具有一个或两个单链末端。另外或替代地,遗传生物标记物的检测可以包括一种用于连接第一dsDNA和第二dsDNA的方法,其中第一dsDNA和第二dsDNA两者均包含两个ssDNA区域,由此第一dsDNA的每个ssDNA区域末端与第二dsDNA的每个互补ss区末端在调节dsDNA的解链温度的剂的存在下连接以提供连接的环状dsDNA。在一些实施方案中,第一DNA或第二DNA能够赋予在感受态细胞内进行自动复制的能力。另外或替代地,遗传生物标记物的检测可以包括一种用于产生测序文库的方法,其中所述方法包括以下步骤:(i)提供DNA片段;(ii)通过多核苷酸激酶和具有聚合酶和核酸外切酶活性的酶对DNA片段进行末端修复,以获得平端的5’磷酸化DNA片段;(iii)任选地通过脱氧核苷酰转移酶将末端腺嘌呤添加到末端修复的DNA片段的末端;以及(iv)将任选地具有末端腺嘌呤的DNA片段与测序衔接子连接,其中优选地如果所述片段具有末端腺嘌呤,则所述衔接子具有末端胸苷。在一些实施方案中,所述方法还包括步骤(v),其中对步骤(iv)的连接片段进行纯化和选择大小以进行测序。在一些实施方案中,所述方法还包括步骤(vi),其中对衔接子连接的片段进行扩增,并且在测序之前任选地对扩增产物进行纯化。在另一个实施方案中,对步骤(v)或(vi)的片段进行测序。另外或替代地,遗传生物标记物的检测可以包括一种试剂盒,其包括:(i)DNA连接酶;和(ii)调节dsDNA的解链温度的剂。在另一个实施方案中,调节dsDNA的解链温度的剂选自以下中的任一种:四甲基氯化铵(TMAC)、哌嗪氯化物、四甲基哌嗪氯化物、四乙基氯化铵(TEAC)、三甲胺N-氧化物(TMANO)、2-甲基-4-羧基-5-羟基-3,4,5,6-四氢嘧啶THP(A)、2-甲基-4-羧基-3,4,5,6-四氢嘧啶THP(B)、非离子型洗涤剂,诸如NP-40和
Figure GDA0002675196410005261
X-100及其混合物。在优选实施方案中,调节dsDNA的解链温度的剂选自以下中的任一种:四甲基氯化铵(TMAC)、哌嗪氯化物、四甲基哌嗪氯化物、四乙基氯化铵(TEAC)、三甲胺N-氧化物(TMANO)、2-甲基-4-羧基-5-羟基-3,4,5,6-四氢嘧啶THP(A)、2-甲基-4-羧基-3,4,5,6-四氢嘧啶THP(B)、非离子型洗涤剂及其混合物。在一些实施方案中,调节dsDNA的解链温度的剂在连接缓冲剂中。在一些实施方案中,连接酶和调节dsDNA的解链温度的剂在单独的容器中。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2016/135300中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于特异性抑制涉及NGS文库构建方案的DNA制备中的酶的方法和试剂盒。另外或替代地,遗传生物标记物的检测可以包括一种产生测序文库的方法,其中所述方法包括以下步骤:(i)提供DNA片段;(ii)通过多核苷酸激酶和具有聚合酶和核酸外切酶活性的酶对DNA片段进行末端修复,以获得平端的5’磷酸化DNA片段;(iii)任选地通过脱氧核苷酰转移酶将末端腺嘌呤添加到末端修复的DNA片段的末端;以及(iv)通过DNA连接酶将任选地具有末端腺嘌呤碱基的DNA片段与测序衔接子连接;由此在步骤(ii)和/或任选的步骤(iii)完成之后,通过添加(a)一种或多种特异性抑制剂来使在此/这些步骤中使用的一种或多种酶失活。以上方法的抑制剂均未表现出抑制一个或多个后续步骤的酶活性。在一些实施方案中,包括通过特异性抑制剂进行的酶失活的以上方法的步骤不包括所述一种或多种酶的热失活。在一些实施方案中,包括通过特异性抑制剂进行的酶失活的以上方法的步骤不包括从所述一种或多种酶的后续纯化步骤。在一些替代性的实施方案中,包括添加一种或多种特异性抑制剂的以上方法的步骤包括所述一种或多种酶的上游热失活,但不包括从所述一种或多种酶的纯化步骤。在一些实施方案中,以上方法还可以包括步骤(v),其中对步骤(iv)的连接片段进行纯化和选择大小以进行测序。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2001/023618中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种包含寡核苷酸和退火促进化合物(APC)的组合物。所述组合物可以例如用于降低涉及寡核苷酸的杂交反应的特异性。所述寡核苷酸可以任选地固定在固体表面上,其中合适的固体表面包括尼龙尖端、尼龙珠粒和尼龙膜。在优选实施方案中,APC是氨基醇,其中氨基醇包含至少一个胺基和至少一个羟基。所述组合物还可以包含酸和/或缓冲剂,使得氨基醇可以全部或部分地作为氨基醇的盐存在于组合物中。所述组合物优选是水性的,并且具有4与10之间的pH。示例性的氨基醇APC是4-羟基哌啶、1-甲基-3-哌啶甲醇、4,4′-三亚甲基双(1-哌啶乙醇)、3-哌啶甲醇、1-乙基-4-羟基-哌啶、2-哌啶乙醇、3-羟基-1-甲基哌啶、1-乙基-3-羟基-哌啶、4-羟基-1-甲基哌啶、1-甲基-2-哌啶甲醇、2-哌啶-甲醇、2,2,6,6-四甲基-4-哌啶醇、1,4-双(2-羟乙基)哌嗪和1-(2-羟乙基)哌嗪。另外或替代地,遗传生物标记物的检测可以包括一种降低两个寡核苷酸之间的杂交反应的特异性的方法。所述方法包括将退火促进化合物(APC)添加到两个寡核苷酸之间的杂交反应中。另外或替代地,遗传生物标记物的检测可以包括一种降低两个寡核苷酸之间的杂交反应的特异性的方法。所述方法包括在适于形成寡核苷酸双链体的条件下混合第一寡核苷酸、第二寡核苷酸和退火促进化合物(APC)。另外或替代地,遗传生物标记物的检测可以包括一种鉴定靶寡核苷酸的方法。所述方法包括:(a)混合具有与靶寡核苷酸互补的序列的第一寡核苷酸、具有与靶寡核苷酸的补体互补的序列的第二寡核苷酸、退火促进化合物(APC)、聚合酶、与聚合酶活性相容的缓冲剂和靶寡核苷酸;(b)将(a)的混合物加热至高于第一寡核苷酸和第二寡核苷酸及其相应的互补序列的解链温度的温度;(c)将(b)的混合物的温度降低至低于解链温度,从而允许第一寡核苷酸、第二寡核苷酸与靶寡核苷酸之间的杂交;(d)将(c)的混合物的温度升高至与聚合酶活性相容的温度;以及(e)检测聚合产物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,792,403中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于为来自受试者例如人受试者例如癌症患者的组织或样品例如肿瘤或肿瘤样品中的变体(例如,突变)生成表征模型(包括,例如变体类型和/或接合性)的系统。所述系统包括:至少一个处理器,其操作性地连接到存储器,所述至少一个处理器在执行时被配置来:a)获取:i)序列覆盖输入(SCI),对于多个选择的亚基因组区间(例如,外显子)中的每一个,其包括选择的亚基因组区间处的序列覆盖值(包括,例如归一化的序列覆盖值);ii)SNP等位基因频率输入(SAFI),对于多个选择的生殖系SNP中的每一个,其包括组织或样品例如肿瘤样品中的等位基因频率的值;iii)变体等位基因频率输入(VAFI),其包括组织或样品例如肿瘤样品中所述变体例如突变的等位基因频率;b)获取作为SCI和SAFI的函数的针对以下确定的值:对于多个基因组片段中的每一个,基因组片段总拷贝数(C);对于多个基因组片段中的每一个,基因组片段次要等位基因拷贝数(M);和样品纯度(p);以及c)计算以下中的一个或两个:i)变体类型例如突变类型的值,例如,g,其指示变体是体细胞的、生殖系的、亚克隆体细胞的或不可区分的,其中至少一个处理器在执行时被配置来作为VAFI、p、C和M的函数计算变体类型例如突变类型的值;ii)作为C和M的函数的组织或样品例如肿瘤样品中变体例如突变的接合性(例如,纯合、杂合和缺失)的指示。在一个实施方案中,所述系统被配置成使得可以在无需分析来自受试者的非肿瘤组织的情况下进行分析。在一个实施方案中,所述系统被配置来针对肿瘤样品、选择的亚基因组区间和选择的生殖系SNP中的至少一个,确定对于分析值不能确定变体类型,例如突变类型。在一个实施方案中,至少一个处理器在执行时获取作为亚基因组区间的读长数量和对照(例如,过程匹配对照)的读长数量的函数(例如,比率的对数)而计算的SCI。在一个实施方案中,至少一个处理器在执行时被配置来作为亚基因组区间的读长数量和对照(例如,过程匹配对照)的读长数量的函数(例如,比率的对数)计算SCI。在一个实施方案中,至少一个处理器在执行时被配置来验证已经选择或分析了最小数量的亚基因组区间。在一个实施方案中,至少一个处理器在执行时被配置来验证已经选择或分析了最小数量的多个生殖系SNP。在一个实施方案中,生殖系SNP的最小数量包括至少10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、4,000、5000、6000、7000、8000、9000、10,000或15,000个生殖系SNP。在一个实施方案中,SAFI至少部分基于肿瘤样品中的次要等位基因频率。在一个实施方案中,至少一个处理器在执行时被配置来至少部分基于肿瘤样品中的次要等位基因频率来计算或获取SAFI。在一个实施方案中,SAFI至少部分基于替代性等位基因频率(例如,人基因组参考数据库中除标准等位基因以外的等位基因频率)。在一个实施方案中,至少一个处理器在执行时被配置来至少部分基于替代性等位基因频率(例如,人基因组参考数据库中除标准等位基因以外的等位基因频率)来计算或获取SAFI。在一个实施方案中,至少一个处理器在执行时被配置来访问通过将全基因组拷贝数模型拟合到SCI和SAFI而计算的C、M和p的值。在一个实施方案中,至少一个处理器在执行时被配置来计算C、M和p。在一个实施方案中,至少一个处理器在执行时生成全基因组拷贝数模型与SCI和SAFI之间的最佳拟合以计算C、M和p。在一个实施方案中,C、M和p的值适合SCI和SAFI的多个全基因组拷贝数模型输入。在一个实施方案中,至少一个处理器在执行时被配置来生成用户界面。在一个实施方案中,用户界面被配置来接受以下中的任一个或多个作为输入:序列覆盖输入(SCI),对于多个选择的亚基因组区间(例如,外显子)中的每一个,其包括选择的亚基因组区间处的序列覆盖值(包括,例如归一化的序列覆盖值);SNP等位基因频率输入(SAFI),对于多个选择的生殖系SNP中的每一个,其包括肿瘤样品中的等位基因频率的值;变体等位基因频率输入(VAFI),其包括肿瘤样品中所述变体例如突变的等位基因频率;对于多个基因组片段中的每一个,基因组片段总拷贝数(C);对于多个基因组片段的每一个,基因组片段次要等位基因拷贝数(M);和样品纯度(p)。在一个实施方案中,响应于例如SCI、SAFI、VAFI、C、M或p中的一个或多个(例如,2、3、4、5或全部)的用户界面输入,所述系统生成表征模型,例如,变体的表征模型。另外或替代地,遗传生物标记物的检测可以包括一种表征来自受试者例如人例如癌症患者的组织或样品例如肿瘤或肿瘤样品中的变体例如突变的方法,其包括:a)获取:i)序列覆盖输入(SCI),对于多个选择的亚基因组区间(例如,外显子)中的每一个,其包括选择的亚基因组区间处的归一化的序列覆盖值;ii)SNP等位基因频率输入(SAFI),对于多个选择的生殖系SNP中的每一个,其包括组织或样品例如肿瘤样品中的等位基因频率的值;iii)变体等位基因频率输入(VAFI),其包括组织或样品例如肿瘤样品中所述变体例如突变的等位基因频率;b)获取作为SCI和SAFI的函数的针对以下的值:对于多个基因组片段中的每一个,C,其中C是基因组片段总拷贝数;对于多个基因组片段中的每一个,M,其中M是基因组片段次要等位基因拷贝数;和p,其中p是样品纯度;以及c)获取以下中的一个或两个:i)变体类型例如突变类型的值,例如,g,其指示变体例如突变是体细胞的、亚克隆体细胞的变体、生殖系的或不可区分的,并且是VAFI、p、C和M的函数;ii)作为C和M的函数的肿瘤或样品例如肿瘤样品中变体例如突变的接合性的指示。在一个实施方案中,可以在无需分析来自受试者的非肿瘤组织的情况下进行分析。在一个实施方案中,在不分析来自受试者的非肿瘤组织的情况下进行分析,例如,不对来自同一受试者的非肿瘤组织进行测序。在一个实施方案中,SCI包括作为例如来自样品的亚基因组区间的读长数量和对照(例如,过程匹配对照)的读长数量的函数(例如,比率的对数)的值。在一个实施方案中,SCI包括至少10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000或10,000个亚基因子区间(例如,外显子)的值,例如log r值。在一个实施方案中,SCI包括至少100个亚基因组区间(例如,外显子)的值,例如log r值。在一个实施方案中,SCI包括1,000至10,000、2,000至9,000、3,000至8,000、3,000至7,000、3,000至6,000或4,000至5,000个亚基因组区间(例如,外显子)的值,例如log r值。在一个实施方案中,SCI包括来自至少10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000或4,000个基因的亚基因组区间(例如,外显子)的值,例如log r值。在一个实施方案中,针对与GC含量的相关性校正SCI中包括的至少一个、多个或基本上所有的值。在一个实施方案中,来自样品的亚基因组区间(例如,外显子)具有至少10、20、30、40、50、100、150、200、250、300、350、400、450、500、600、700、800、900或1,000个读长。在一个实施方案中,多个,例如至少10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000或10,000个亚基因组区间(例如,外显子)具有预定数量的读长。在一个实施方案中,读长的预定数量为至少10、20、30、40、50、100、150、200、250、300、350、400、450、500、600、700、800、900或1,000。在一个实施方案中,多个生殖系SNP包括至少10、25、50、100、150、200、250、300、350、400、450、500、1,000、2,000、3,000、4,000、5000、6000、7000、8000、9000、10,000或15,000个生殖系SNP。在一个实施方案中,多个生殖系SNP包含至少100个生殖系SNP。在一个实施方案中,多个生殖系SNP包括500至5,000、1,000至4,000或2,000至3,000个生殖系SNP。在一个实施方案中,等位基因频率是次要等位基因频率。在一个实施方案中,等位基因频率是替代性等位基因,例如,人基因组参考数据库中除标准等位基因以外的等位基因。在一个实施方案中,所述方法包括表征肿瘤样品中的多个变体,例如突变体。在一些实施方案中,所述方法包括表征至少2、3、4、5、6、7、8、9、10、25、50、100、150、200、250、300、350、400、450或500个变体,例如突变体。在一个实施方案中,所述方法包括表征至少2、3、4、5、6、7、8、9、10、25、50、100、150、200、250、300、350、400、450或500个不同基因中的变体,例如突变体。在一个实施方案中,所述方法包括获取至少2、3、4、5、6、7、8、9、10、25、50、100、150、200、250、300、350、400、450或500个变体例如突变体的VAFI。在一个实施方案中,所述方法包括对至少2、3、4、5、6、7、8、9、10、25、50、100、150、200、250、300、350、400、450或500个变体例如突变体进行步骤a)、b)和c)中的一个、两个或全部。在一个实施方案中,C、M和p的值通过、已经通过或可以通过将全基因组拷贝数模型拟合到SCI和SAFI中的一个或两个来获得。在一个实施方案中,C、M和p的值适合SCI和SAFI的多个全基因组拷贝数模型输入。在一个实施方案中,基因组片段包括多个亚基因组区间,例如外显子,例如已经被分配SCI值的亚基因组区间。在一个实施方案中,基因组片段包括至少10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、400或500个亚基因组区间,例如外显子。在一个实施方案中,基因组片段包括10至1,000、20至900、30至700、40至600、50至500、60至400、70至300、80至200、80至150或80至120、90至110或约100个亚基因组区间,例如外显子。在一个实施方案中,基因组片段包括100与10,000、100与5,000、100与4,000、100与3,000、100与2,000或100与1,000之间个亚基因组区间,例如外显子。在一个实施方案中,基因组片段包括10至1,000、20至900、30至700、40至600、50至500、60至400、70至300、80至200、80至150或80至120、90至110或约100个已经被分配SAFI值的基因组SNP。在一个实施方案中,基因组片段包括100与10,000、100与5,000、100与4,000、100与3,000、100与2,000或100与1,000之间个已经被分配SAFI值的基因组SNP。在一个实施方案中,多个基因组片段中的每一个的特征在于具有以下中的一个或两个:归一化的序列覆盖的测量值,例如log r,其相差不超过预选择的量,例如,基因组片段的边界内的亚基因组区间(例如,外显子)的log2 r的值相差不超过参考值,或基本上恒定;和生殖系SNP的SNP等位基因频率,其相差不超过预选择的量,例如基因组片段的边界内的亚基因组区间(例如,外显子)的生殖系SNP等位基因频率的值相差不超过参考值,或基本上恒定。在一个实施方案中,基因组片段中含有的或组合形成基因组片段的亚基因组区间(例如,外显子)的数量是基因组片段的数量的至少2、5、10、15、20、50或100倍。在一个实施方案中,亚基因组区间(例如,外显子)的数量是基因组片段的数量的至少3、4、5、6、7、8、9、10、11、12、13、14或15倍。在一个实施方案中,提供了基因组片段的边界。在一个实施方案中,所述方法包括将亚基因组区间(例如,外显子)的序列组装到遗传片段中。在一个实施方案中,所述方法包括使用一种方法来组装亚基因组区间的序列,例如,方法包括圆形二元分割(CBS)、基于HMM的方法、基于小波的方法或沿染色体成簇的方法。在一个实施方案中,使全基因组拷贝数模型拟合到SCI包括使用以下等式:
Figure GDA0002675196410005331
其中ψ是肿瘤倍性。在一个实施方案中,ψ=(∑iliCi)/∑ili,设li为基因组片段的长度。在一个实施方案中,使全基因组拷贝数模型拟合到SAFI包括使用以下等式:
Figure GDA0002675196410005332
其中AF是等位基因频率。在一个实施方案中,拟合包括使用吉布斯采样(Gibbssampling)。在一个实施方案中,拟合包括使用例如马尔可夫链蒙特卡罗(MCMC)算法,例如ASCAT(肿瘤的等位基因特异性拷贝数分析)、OncoSNP或PICNIC(预测癌症中的整体拷贝数)。在一个实施方案中,拟合包括使用Metropolis-Hastings MCMC。在一个实施方案中,拟合包括使用非贝叶斯方法,例如频率论方法,例如使用最小二乘拟合。在一个实施方案中,通过确定VAFI、p、C和M的值对体细胞/生殖细胞状态的模型的拟合来确定g。在一个实施方案中,所述方法包括获取所述变体例如突变的杂合性的指示。在一个实施方案中,样品纯度(p)是整体纯度,例如,对于所有基因组片段而言都是相同的。在一个实施方案中,通过以下方式获取g的值:
Figure GDA0002675196410005341
其中AF是等位基因频率。在一个实施方案中,接近0,例如与0没有显著差异的g值指示所述变体是体细胞变体。在一个实施方案中,为0或接近0,例如在距0的预定距离内的g值,例如小于0.4的g值指示所述变体是体细胞变体。在一个实施方案中,接近1,例如与1没有显著差异的g值指示所述变体是生殖系变体。在一个实施方案中,为1或接近1,例如在距1的预定距离内的g值,例如大于0.6的g值指示所述变体是生殖系变体。在一个实施方案中,小于1但大于0的g值,例如,如果它比1小预定量并且比0大预定量,例如,如果g在0.4与0.6之间,则指示不可区分的结果。在一个实施方案中,显著小于0的g值指示亚克隆体细胞变体。在一个实施方案中,通过以下方式获取g的值:
Figure GDA0002675196410005342
其中AF是等位基因频率,并且M′=C-M(例如,当M是非次要等位基因频率时),例如,如果g=1,则变体是生殖系多态性,并且如果g=0,则变体是体细胞突变。
在一个实施方案中,例如当样品纯度低于约40%,例如在约10%与30%之间,例如在约10%与20%之间,或在约20%与30%之间时,则确定体细胞/生殖系状态。在一个实施方案中,当:等于0不等于C的M值指示不存在变体,例如突变,例如在肿瘤中不存在;
等于C的非零M值指示变体例如突变的纯合性,例如杂合性缺失(LOH);等于0等于C的M值指示变体例如突变的纯合缺失,例如在肿瘤中不存在;并且不等于C的非零M值指示变体例如突变的杂合性。在一个实施方案中,所述方法包括获取所述变体例如突变的接合性的指示。在一个实施方案中,如果M=C≠0,则将突变状态确定为纯合的(例如,LOH)。在一个实施方案中,如果M=C=0,则将突变状态确定为纯合缺失。在一个实施方案中,如果0<M<C,则将突变状态确定为杂合的。在一个实施方案中,如果M=0并且C≠0,则突变在肿瘤中不存在。在一个实施方案中,例如当样品纯度大于约80%,例如在约90%与100%之间,例如在约90%与95%之间,或在约95%与100%之间时,则确定接合性。在一个实施方案中,对照是来自处肿瘤样品所来源的受试者以外的受试者的整倍体(例如,二倍体)组织的样品,或来自一个或多个(例如,至少2、3、4或5个)除肿瘤样品所来源的受试者以外的受试者的混合整倍体(例如,二倍体)组织的样品。在一个实施方案中,所述方法包括例如通过下一代测序(NGS)对每个选择的亚基因组区间和每个选择的生殖系SNP进行测序。在一个实施方案中,归一化之前的序列覆盖是测序深度的至少约10×、20×、30×、50×、100×、250×、500×、750×或1000×。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/0218113中描述的各种方法中的任一种,所述公布特此以引用的方式并入。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2017/0356053中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括使用样品核酸与诱饵组的杂交来评估样品中的所关注的区域,例如评估所关注的区域的克隆谱。另外或替代地,遗传生物标记物的检测可以包括一种评估或提供受试者中受试者区间,例如亚基因组区间或表达的亚基因组区间(或包含其的细胞)的克隆谱的方法,其包括:(a)获取包含多个成员的核酸文库,所述多个成员中的每个成员包含来自受试者的核酸,例如多个肿瘤成员来自实体瘤或恶性血液病(或癌前病变)样品;(b)使文库与诱饵组接触以提供多个选择的成员,其中的每个成员包括受试者区间或其一部分(有时在本文中称为文库捕捉物);任选地(c)扩增多个选择的成员中的每个成员,例如以提供受试者区间的扩增序列;(d)获取受试者区间的一个或多个发生事件的序列;从而提供或评估受试者区间的克隆谱。在一个实施方案中,所述方法包括评估亚基因组区间和表达的亚基因组区间的克隆谱。在一个实施方案中,所述方法包括将受试者区间处的第一等位基因或签名(例如,第一V片段)的序列与比较值,例如预选值,例如作为第二等位基因或签名(例如,第二V片段)的序列的函数的值进行比较。在一个实施方案中,所述方法还包括:(e)获取:(i)受试者区间处的序列、签名或等位基因的分布、表达(亚基因组签名的转录拷贝的发生或水平)、丰度或身份,例如序列、签名或等位基因的相对丰度,或受试者区间处多个序列、签名或等位基因中的每一个的相对丰度的值;或(ii)可变性值,例如由体细胞超突变引起的序列可变性,例如通过接合点处的插入/缺失的形成由VD、DJ或VJ接合点引起的序列可变性,或者签名或受试者区间内的CDR,例如重链CDR3序列可变性,例如,其中可变性值是在受试者或样品中针对受试者区间存在的不同变体的数量的函数。在一个实施方案中,所述方法包括提供第一受试者区间处的序列、等位基因或签名,例如V片段或VDJ或VJ重排的克隆谱;和i)受试者的表型,例如疾病状态;或ii)第二受试者区间处的基因型。在一个实施方案中,步骤(d):(i)包括获取受试者区间的多个发生事件中的每一个的序列,例如,获取包含V片段的受试者区间的第一发生事件和包含V片段的区间的第二发生事件的序列,其中第一发生事件和第二发生事件的差别在于VD、DJ或VJ接合点处的多样性;或(ii)包括获取第一受试者区间和不同的第二受试者区间的序列,例如其中第一受试者区间包含来自第一基因的序列,并且第二受试者区间包含来自第二基因的序列。在一个实施方案中,步骤(d)包括获取受试者区间的多个发生事件中的每一个的序列,所述多个发生事件例如包含VDJ序列的受试者区间的多个发生事件,例如,包含VDJ序列的受试者区间的多个发生事件,所述VDJ序列包含特定的V片段、特定的D片段和特定的J片段。在一个实施方案中,所述方法包括获取e(i)的值。在一个实施方案中,e(i)的值包括相对于比较值(例如预选值,例如作为第二序列、签名或等位基因(例如,第二V片段)的丰度的函数的值),受试者区间中序列、签名或等位基因(例如,第一V片段)的丰度的值。在一个实施方案中,(e)(i)的值包括相对于比较值(例如预选值,例如作为缺乏事件的序列,例如受试者区间中的非突变或非重排序列的丰度的函数的值),受试者区间中的事件,例如序列、等位基因或签名,例如突变或重排的丰度的值。在一个实施方案中,(e)(i)的值包括受试者区间处X个唯一(即,彼此不同)序列、签名或等位基因中的每一个的相对丰度的值。另外或替代地,遗传生物标记物的检测可以包括一种评估受试者的整个臂或较大重排,例如,占例如染色体臂的至少5%、10%、20%、30%、40%、50%、60%、70%、80%或90%或全部的重排,例如易位、重复、插入或缺失的发生的方法,其包括:(a)获取包含多个成员的核酸文库,所述多个成员中的每个成员包含来自受试者的核酸;(b)例如在溶液杂交的条件下使文库与诱饵组接触,以提供多个选择的成员,其中的每个成员包括受试者区间或其一部分(有时在本文中称为文库捕捉物);(c)例如通过不依赖于与成员中的靶/受试者核酸的序列特异性相互作用的方法来扩增多个成员中的每个成员,例如通过用不结合成员中的靶/受试者核酸的引物来扩增多个成员中的每个成员;以及(d)获取多个受试者区间的序列,其中所述多个受试者区间设置在染色体上,以便允许确定整个臂或较大重排。另外或替代地,遗传生物标记物的检测可以包括一种评估受试者的方法,其包括:(a)获取包含多个成员的核酸文库,所述多个成员中的每个成员包含来自受试者的核酸,例如多个肿瘤成员来自血液癌症样品;(b)例如在溶液杂交的条件下使文库与诱饵组接触,以提供多个选择的成员,其中的每个成员包括受试者区间或其一部分(有时在本文中称为文库捕捉物);(c)例如通过不依赖于与成员中的靶/受试者核酸的序列特异性相互作用的方法来扩增多个选择的成员中的每个成员,例如通过用不结合成员中的靶/受试者核酸的引物来扩增多个选择的成员中的每个成员;(d)获取亚基因组区间和表达的亚基因组区间的序列;从而评估受试者,其中:(i)所述方法包括使文库与提供亚基因组区间和表达的亚基因组区间两者的诱饵组接触;(ii)所述方法包括使文库与提供亚基因组区间的第一诱饵组和提供表达的亚基因组区间的第二诱饵组接触;(iii)其中所述文库包含基因组DNA并且与提供亚基因组区间的诱饵组接触,并且所述方法还包括包含cDNA的第二文库,其与所述诱饵组接触以提供表达的亚基因组区间;(iv)其中所述文库包含基因组DNA并且与提供亚基因组区间的诱饵组接触,并且所述方法还包括包含cDNA的第二文库,其与第二诱饵组接触以提供表达的亚基因组区间;或(v)所述方法包括在第一反应混合物中进行步骤(a)、(b)和(c)中的一个以提供第一受试者区间,例如亚基因组区间,并且在第二反应混合物上进行以提供第二受试者区间,例如表达的亚基因组区间,例如,其对应于亚基因组区间。另外或替代地,遗传生物标记物的检测可以包括一种分析样品的方法,所述样品是例如来自恶性血液病(或癌前病变),例如恶性血液病(或癌前病变)的肿瘤样品。所述方法包括:(a)从样品中获取一个或多个包含多个成员的文库,例如,从肿瘤样品中获取多个肿瘤成员;(b)任选地,例如通过使一个或多个文库与诱饵组(或多个诱饵组)接触以提供选择的成员(有时在本文中称为文库捕捉物),来针对预选序列富集一个或多个文库;(c)例如通过包括测序的方法,例如用下一代测序方法,从成员,例如来自文库或文库捕捉物的肿瘤成员中获取受试者区间,例如亚基因组区间或表达的亚基因组区间的读长;(d)通过比对方法对所述读长进行比对;以及(e)根据所述读长为预选的核苷酸位置分配核苷酸值(例如,识别突变,例如使用贝叶斯方法),从而分析所述肿瘤样品,任选地其中:来自X个唯一受试者区间(例如,亚基因组区间、表达的亚基因组区间或两者)中的每一个的读长用唯一比对方法进行比对,其中唯一受试者区间(例如,亚基因组区间或表达的亚基因组区间)意指与其他X-1个受试者区间(例如,亚基因组区间、表达的亚基因组区间或两者)不同,并且其中唯一比对方法意指与其他X-1个比对方法不同,并且X至少为2。另外或替代地,遗传生物标记物的检测可以包括一种分析样品的方法,所述样品是例如来自恶性血液病(或癌前病变),例如恶性血液病(或癌前病变)的肿瘤样品。所述方法包括:(a)从样品中获取一个或多个包含多个成员的文库,例如,从样品,例如肿瘤样品中获取多个肿瘤成员;(b)任选地,例如通过使一个或多个文库与诱饵组(或多个诱饵组)接触以提供选择的成员(例如,文库捕捉物),来针对预选序列富集所述文库;(c)例如通过包括测序的方法,例如用下一代测序方法,从成员,例如来自所述文库或文库捕捉物的肿瘤成员中获取受试者区间(例如,亚基因组区间或表达的亚基因组区间)的读长;(d)通过比对方法对所述读长进行比对;以及(e)根据所述读长为预选的核苷酸位置分配核苷酸值(例如,识别突变,例如使用贝叶斯方法或识别方法),从而分析所述肿瘤样品,任选地其中通过唯一识别方法为X个唯一受试者区间(亚基因组区间、表达的亚基因组区间或两者)中的每一个中的核苷酸位置分配核苷酸值,其中唯一受试者区间(例如,亚基因组区间或表达的亚基因组区间)意指与其他X-1个受试者区间(例如,亚基因组区间、表达的亚基因组区间或两者)不同,并且其中唯一识别方法意指与其他X-1个识别方法不同,并且X至少为2。识别方法可以不同,并且因此可以是唯一的,例如通过依赖于不同的贝叶斯先验值。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0324519中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于基于例如从靶向测序获得的样品的测序读长进行更准确的变体识别的方法、系统和设备。例如,一旦接收序列读长并与参考序列进行比对,就可以对在一个位置处具有变体的序列读长进行计数。可以将在样品的一个位置处测量的特定变体的第一变体频率与在其他位置处和/或从其他样品中测量的特定变体的一个或多个第二变体频率进行比较。第二变体频率可以对应于测序运行的测序误差的期望值。在一些实施方案中,可以基于一个或多个样品中靶区域中的多个位置处的变体计数和总读长计数来计算指示在一个位置处变体是真阳性的置信水平的概率值。然后可以将所述概率值与阈值水平进行比较,以确定检测到的变量是否为真阳性。在其他实施方案中,测试样品与参考样品中相同位置处的变体计数和总读长计数之间的差值(例如,假定在所述位置处仅具有测序错误)可以用于确定在测试样品中变体是否为真阳性。根据一个实施方案,一种方法可以检测测试样品的靶区域中的罕见变体的真阳性。对于每个样品,可以使用变体计数和总读长计数来计算参考序列上存在参考等位基因的位置处相同变体类别的变体的变体频率。相同类别的变体的变体频率分布可以用于确定在测试样品中具有确定的变体频率的位置处的变体的概率值。基于概率值,将测试样品中所述位置处的变体分类为真阳性(突变)或假阳性。在其他实施方案中,一种方法可以通过使用与一个或多个参考样品的比较来检测测试样品的靶区域中的罕见变体的真阳性。可以根据比对的序列读长确定测试样品中特定位置处的特定变体的变体计数和野生型计数,并且与一个或多个参考样品中特定位置处的特定变体的变体计数和野生型计数进行比较,以确定概率值。基于概率值,将测试样品中特定位置处的特定变体分类为真阳性或假阳性。在一个实施方案中,提供了一种检测第一样品中靶区域中的低频率变体的计算机实现的方法。在一些实施方案中,所述方法包括(在计算机系统处):接收从对来自一个或多个样品的DNA片段进行测序获得的多个序列读长,所述一个或多个样品包括第一样品,其中所述测序包括靶向DNA片段中的靶区域;将多个序列读长比对参考序列的靶区域进行比对;基于与参考序列的第一位置处的参考等位基因不同的第一样品的序列读长,鉴定在靶区域的第一位置处具有第一等位基因的第一候选变体;基于与参考序列的第一位置比对的第一样品的序列读长,确定第一位置处第一等位基因的第一变体频率;将第一候选变体鉴定为对应于选自多个变体类别的第一变体类别,所述多个变体类别中的每个变体类别对应于不同类型的变体;鉴定参考序列的靶区域中具有参考等位基因的一组第二位置,其中一个或多个样品中至少50%的其他位置对第一等位基因表现出假阳性,并且其中所述组的第二位置包括第一位置;在所述组的第二位置中的每一个处并且对于一个或多个样品中的每一个:基于与参考序列的第二位置比对的样品的序列读长确定第一等位基因的第二变体频率,所述第二变体频率形成统计分布;将第一变体频率与统计分布的统计值进行比较,以确定第一变化频率相对于统计分布的统计值的概率值;以及将概率值与阈值进行比较,作为确定第一候选变体在第一样品中对于第一等位基因是否为真阳性的一部分,所述阈值区分第一等位基因的假阳性和真阳性。在某些实施方案中,参考序列对应于从正常细胞确定的共有序列。在一些实施方案中,一个或多个样品来源于无细胞DNA片段。在一些实施方案中,一个或多个样品来源于生物样品的RNA。在一些实施方案中,在单个测序运行中对多个样品进行测序。在其他实施方案中,统计分布的统计值包括平均值。在其他实施方案中,概率值是z得分、改进的z得分、累积概率、Phred质量得分或改进的Phred质量得分。在其他实施方案中,统计分布是第二变体频率的对数变换的统计分布。在其他实施方案中,基于从一个或多个测序运行获得的训练数据,使用支持向量机分类器来确定阈值。在其他实施方案中,阈值是变体频率的函数。在另一个实施方案中,提供了一种检测第一样品中靶区域中的第一位置处具有第一等位基因的变体的计算机实现的方法。在一些实施方案中,所述方法(在计算机系统处):接收从对来自至少两个样品的DNA片段进行测序获得的多个序列读长,所述至少两个样品包括第一样品,其中所述测序包括靶向DNA片段中的靶区域;将多个序列读长与参考序列的靶区域进行比对;基于与参考序列的第一位置处的参考等位基因不同的第一位置处的每个样品的比对序列读长,鉴定至少两个样品中的每个样品中的第一位置处是否存在第一等位基因;对于至少两个样品中的每个样品,确定第一位置处的第一等位基因的变体计数和第一位置处的参考等位基因的野生型计数;从至少两个样品中选择至少一个样品作为参考样品;将第一样品的第一位置处的第一等位基因的第一变体计数和第一位置处的参考等位基因的第一野生型计数与参考样品的第一位置处的第一等位基因的第二变体计数和第一位置处的参考等位基因的第二野生型计数进行比较,以确定第一样品的在第一位置处具有第一等位基因的变体的概率值;以及将概率值与阈值进行比较,作为确定第一样品中第一位置处的第一等位基因对于第一等位基因是否为真阳性的一部分,所述阈值区分第一位置处的第一等位基因的假阳性和真阳性。在某些实施方案中,参考样品包括对于除第一样品以外的至少两个样品中的第一位置处的第一等位基因具有最低变体频率的两个样品。在一些实施方案中,使用卡方累积分布函数确定概率值。在一些实施方案中,使用Pearson比例测试确定概率值。在一些实施方案中,概率值是z得分、改进的z得分、p值、卡方值、累积概率值和质量得分中的一个或多个。在一些实施方案中,使用查找表确定质量得分。在一些实施方案中,基于从一个或多个测序运行获得的训练数据,使用支持向量机分类器来确定阈值。在一些实施方案中,阈值是变体频率的函数。在另一个实施方案中,提供一种计算机产品,其包括存储多个指令的非暂时性计算机可读介质,所述多个指令在被执行时控制计算机系统检测第一样品的靶区域中的真实变体。在一些实施方案中,所述指令包括:接收从对来自一个或多个样品的DNA片段进行测序获得的多个序列读长,所述一个或多个样品包括第一样品,其中所述测序包括靶向DNA片段中的靶区域;将多个序列读长与参考序列的靶区域进行比对;鉴定参考序列的靶区域中具有变体类别中的变体的参考等位基因的一组序列位置,其中一个或多个样品中至少50%的序列位置对于序列读长中的变体类别的变体表现出假阳性,并且其中所述组的序列位置包括第一位置;在所述组的序列位置中的每个位置处并且对于一个或多个样品中的每个样品:确定每个样品的每个位置处的读长计数;基于与参考序列的相同位置处的参考等位基因不同的每个样品的序列读长,鉴定对于变体类别中的变体具有变体等位基因的候选变体,每个样品中的每个位置处的候选变体的总数为每个样品的每个位置中的变体计数;基于读长计数和变体计数,确定变体类别中的变体的变体频率,每个样品中的每个位置的变体频率形成统计分布,其中第一样品的所述组的序列位置中第一位置处的变体频率是第一变体频率;将第一变体频率与统计分布的值进行比较,以确定第一变体频率相对于统计分布的值的概率值;以及将概率值与阈值进行比较,作为确定第一样品中的候选变体是否为真阳性的一部分,所述阈值区分变体类别的变体的假阳性和真阳性。在某些实施方案中,统计分布是对于每个样品在每个位置处变体频率的对数变换的统计分布。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,340,830中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种分析肿瘤样品的方法。所述方法包括:(a)从样品,例如肿瘤样品中获取包含多个靶成员,例如肿瘤成员的文库;(b)任选地,使文库与诱饵组(或多个诱饵组)接触以提供选择的成员(有时在本文中称为“文库捕捉物”);(c)例如通过测序,例如用下一代测序方法,从所述文库或文库捕捉物中获取来自肿瘤成员的亚基因组区间的读长;(d)对所述读长进行比对;以及(e)根据所述读长为预选的核苷酸位置,例如多个亚基因组区间中的每一个(例如,多个基因中的每一个)中的预选核苷酸位置分配核苷酸值(例如,识别突变,例如使用贝叶斯方法),从而分析所述样品,其中:(i)对于步骤(b)、(c)、(d)或(e)中的一个或组合,在唯一组的条件下分析X个核苷酸位置中的每一个(其中唯一意指与其他X-1组的条件不同,并且其中X至少为2、5、10、20、30、40、50、100、200、300或500)。例如,第一组条件用于例如在第一亚基因组区间或基因中的第一核苷酸位置,并且第二组条件,例如第二组条件用于例如在第二亚基因组区间或基因中的第二核苷酸位置;(ii)对于X个核苷酸位置中的每一个,响应于可能发生在核苷酸位置处的预选改变(例如,突变)的特征,在唯一组条件下分析核苷酸位置(其中唯一意指不同于其他条件X-1组条件,其中X至少为2、5、10、20、30、40、50、100、200、300或500)。例如,响应于特征,例如可能在第一亚基因组区间中的核苷酸位置处发生的预选改变(例如,突变)的特征,在第一组条件下分析核苷酸位置,并且响应于特征,例如可能在第二亚基因组区间中的核苷酸位置处发生的预选改变(例如,突变)的特征,在第二组条件下分析核苷酸位置;(iii)其中在允许对至少2、5、10、20、50或100个亚基因组区间(例如,基因)中的核苷酸位置的95%、98%或99%敏感性或特异性的条件下,对样品(例如,保存的肿瘤样品)进行所述方法;或者(iv)其中所述方法包括以下中一个或多个或全部:a)对第一亚基因组区间进行测序,以提供约500×或更高的测序深度,例如,对来自样品的不超过5%的细胞中存在的突变进行测序;b)对第二亚基因组区间进行测序,以提供约200×或更高,例如约200×-约500×的测序深度,例如对来自样品的不超过10%的细胞中存在的突变进行测序;c)对第三亚基因组区间进行测序,以提供约10-100×的测序深度,例如,对选自以下的一个或多个亚基因组区间(例如,外显子)进行测序:a)药物基因组学(PGx)单核苷酸多态性(SNP),其可以解释患者代谢不同药物的能力,或b)可以用于唯一鉴定(例如,指纹)患者的基因组SNP;d)对第四亚基因组区间进行测序,以提供约5-50×的测序深度,例如以检测结构性断点,诸如基因组易位或插入/缺失。例如,内含子断点的检测需要5-50×的序列对跨越深度,以确保高检测可靠性。此类诱饵组可以用于检测例如易于易位/插入/缺失的癌症基因;或e)对第五亚基因组区间进行测序,以提供约0.1-300×的测序深度,例如以检测拷贝数变化。在一个实施方案中,测序深度的范围是约0.1-10×测序深度,以检测拷贝数变化。在其他实施方案中,测序深度的范围是约100-300×,以检测用于评估基因组DNA的拷贝数获得/丢失或杂合性丢失(LOH)的基因组SNP/基因座。另外或替代地,遗传生物标记物的检测可以包括一种分析样品,例如肿瘤样品的方法。所述方法包括:(a)从样品中获取包含多个成员的文库,例如,从肿瘤样品中获取多个肿瘤成员;(b)任选地,例如通过使文库与诱饵组(或多个诱饵组)接触以提供选择的成员(有时在本文中称为文库捕捉物),来针对预选序列富集文库;(c)例如通过包括测序的方法,例如用下一代测序方法,从成员,例如来自所述文库或文库捕捉物的肿瘤成员中获取亚基因组区间的读长;(d)通过比对方法对所述读长进行比对;以及(e)根据所述读长为预选的核苷酸位置分配核苷酸值(例如,识别突变,例如使用贝叶斯方法),从而分析所述肿瘤样品,其中来自X个唯一亚基因组区间中的每一个的读长用唯一比对方法进行比对,其中唯一亚基因组区间意指与其他X-1个亚基因组区间不同,并且其中唯一比对方法意指与其他X-1个比对方法不同,并且X至少为2。在一个实施方案中,存在步骤(b)。在一个实施方案中,不存在步骤(b)。在一个实施方案中,X至少为3、4、5、10、15、20、30、50、100、500或1,000。在一个实施方案中,一种方法(例如,以上列举的方法的元素(d))包括选择或使用用于分析(例如,比对)读长的比对方法,其中所述比对方法根据以下中的一种或多种或全部而变化,响应于以下中的一种或多种或全部而选择,或针对以下中的一种或多种或全部而优化:(i)肿瘤类型,例如所述样品中的肿瘤类型;(ii)所测序的所述亚基因组区间所位于的基因或基因类型,例如特征在于预选或变体或变体类型(例如,突变)或者预选频率的突变的基因或基因类型;(iii)所分析的位点(例如,核苷酸位置);(iv)所评估的亚基因组区间内的变体类型,例如取代;(v)样品类型,例如FFPE样品;以及(vi)所评估的所述亚基因组区间中或附近的序列,例如,所述亚基因组区间的未对齐的预期倾向,例如,所述亚基因组区间中或附近的重复序列的存在。另外或替代地,遗传生物标记物的检测可以包括一种分析样品,例如肿瘤样品的方法。所述方法包括:(a)从样品中获取包含多个成员的文库,例如,从样品,例如肿瘤样品中获取多个肿瘤成员;(b)任选地,例如通过使文库与诱饵组(或多个诱饵组)接触以提供选择的成员(例如,文库捕捉物),来针对预选序列富集文库;(c)例如通过包括测序的方法,例如用下一代测序方法,从成员,例如来自所述文库或文库捕捉物的肿瘤成员中获取亚基因组区间的读长;(d)通过比对方法对所述读长进行比对;以及(e)根据所述读长为预选的核苷酸位置分配核苷酸值(例如,识别突变,例如使用贝叶斯方法或识别方法),从而分析所述肿瘤样品,其中通过唯一识别方法为X个唯一亚基因组区间中的每一个中的核苷酸位置分配核苷酸值,其中唯一亚基因组区间意指与其他X-1个亚基因组区间不同,并且其中唯一识别方法意指与其他X-1个识别方法不同,并且X至少为2。识别方法可以不同,并且因此可以是唯一的,例如通过依赖于不同的贝叶斯先验值。在一个实施方案中,存在步骤(b)。在一个实施方案中,不存在步骤(b)。另外或替代地,遗传生物标记物的检测可以包括一种分析样品,例如肿瘤样品的方法。所述方法包括:(a)从样品中获取包含多个成员(例如,靶成员)的文库,例如,从肿瘤样品中获取多个肿瘤成员;(b)使文库与诱饵组接触以提供选择的成员(例如,文库捕捉物);(c)例如通过包括测序的方法,例如用下一代测序方法,从成员,例如来自所述文库或文库捕捉物的肿瘤成员中获取亚基因组区间的读长;(d)通过比对方法对所述读长进行比对;以及(e)根据所述读长为预选的核苷酸位置分配核苷酸值(例如,识别突变,例如使用贝叶斯方法或一种方法),从而分析所述肿瘤样品,其中所述方法包括使文库与多个,例如至少两个、三个、四个或五个诱饵或诱饵组接触,其中所述多个中的每个诱饵或诱饵组具有唯一(与所述多个中的其他诱饵组相反)预选效率以用于选择。例如,每个唯一诱饵或诱饵组均提供唯一测序深度。在一个实施方案中,所述多个诱饵组中的第一诱饵组的选择效率与所述多个诱饵组中的第二诱饵组的效率相差至少2倍。在一个实施方案中,第一诱饵组和第二诱饵组提供相差至少2倍的测序深度。在一个实施方案中,所述方法包括使一个或多个的以下诱饵组与文库接触:a)一个诱饵组,其选择足够的包括亚基因组区间的成员以提供约500×或更高的测序深度,例如以对来自样品的不超过5%的细胞中存在的突变进行测序;b)一个诱饵组,其选择足够的包括亚基因组区间的成员以提供约200×或更高,例如约200×-约500×的测序深度,例如以对来自样品的不超过10%的细胞中存在的突变进行测序;c)一个诱饵组,其选择足够的包括亚基因组区间的成员以提供约10-100×的测序深度,例如以对选自以下的一个或多个亚基因组区间(例如,外显子)进行测序:a)药物基因组学(PGx)单核苷酸多态性(SNP),其可以解释患者代谢不同药物的能力,或b)可以用于唯一鉴定(例如,指纹)患者的基因组SNP;d)一个诱饵组,其选择足够的包括亚基因组区间的成员以提供约5-50×的测序深度,例如以检测结构性断点,诸如基因组易位或插入/缺失。例如,内含子断点的检测需要5-50×的序列对跨越深度,以确保高检测可靠性。此类诱饵组可以用于检测例如易于易位/插入/缺失的癌症基因;或e)一个诱饵组,其选择足够的包括亚基因组区间的成员以提供约0.1-300×的测序深度,例如以检测拷贝数变化。在一个实施方案中,测序深度的范围是约0.1-10×测序深度,以检测拷贝数变化。在其他实施方案中,测序深度的范围是约100-300×,以检测用于评估基因组DNA的拷贝数获得/丢失或杂合性丢失(LOH)的基因组SNP/基因座。此类诱饵组可以用于检测例如易于扩增/缺失的癌症基因。另外或替代地,遗传生物标记物的检测可以包括一种样品,例如肿瘤样品。所述方法包括:(a)从样品中获取包含多个成员的文库,例如,从肿瘤样品中获取多个肿瘤成员;(b)任选地,例如通过使文库与诱饵组(或多个诱饵组)接触以提供选择的成员(例如,文库捕捉物),来针对预选序列富集文库;(c)例如通过包括测序的方法,例如用下一代测序方法,从成员,例如来自所述文库或文库捕捉物的肿瘤成员中获取亚基因组区间的读长;(d)通过比对方法对所述读长进行比对;以及(e)根据所述读长为预选的核苷酸位置分配核苷酸值(例如,识别突变,例如使用贝叶斯方法或一种方法),从而分析所述肿瘤样品,其中所述方法包括测例如通过下一代测序方法对来自样品的至少五、六、七、八、九、十、十五、二十、二十五、三十个或更多个基因或基因产物的亚基因组区间进行测序,其中所述基因或基因产物选自:ABL1、AKT1、AKT2、AKT3、ALK、APC、AR、BRAF、CCND1、CDK4、CDKN2A、CEBPA、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FLT3、HRAS、JAK2、KIT、KRAS、MAP2K1、MAP2K2、MET、MLL、MYC、NF1、NOTCH1、NPM1、NRAS、NTRK3、PDGFRA、PIK3CA、PIK3CG、PIK3R1、PTCH1、PTCH2、PTEN、RB1、RET、SMO、STK11、SUFU或TP53。在一个实施方案中,存在步骤(b)。在一个实施方案中,不存在步骤(b)。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/151524中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括评估样品中的突变负荷的方法,其通过以下进行:提供来自样品的一组亚基因组区间的序列;以及确定突变负荷的值,其中所述值是所述组的亚基因组区间中的改变的数量的函数。在某些实施方案中,所述组的亚基因组区间来自预定组的基因,例如,不包括整个基因组或外显子组的预定组的基因。在某些实施方案中,所述组的亚基因组区间一组编码亚基因组区间。在其他实施方案中,所述组的亚基因组区间含有编码亚基因组区间和非编码亚基因组区间。在某些实施方案中,突变负荷的值是所述组的亚基因组区间中的改变(例如,体细胞改变)的数量的函数。在某些实施方案中,改变的数量不包括功能改变、生殖系改变或两者。在一些实施方案中,样品是肿瘤样品或来源于肿瘤的样品。另外或替代地,遗传生物标记物的检测可以包括以下方法,其包括例如以下中的一个或多个:从样品中获取包含多个肿瘤成员的文库;使文库与诱饵组接触以通过杂交提供选择的肿瘤成员,从而提供文库捕捉物;从文库捕捉物中获取包含来自肿瘤成员的改变的亚基因组区间的读长;通过比对方法对读长进行比对;根据读长为预选的核苷酸位置分配核苷酸值;以及从一组分配的核苷酸位置中选择一组亚基因组区间,其中所述组的亚基因组区间来自预定组的基因。另外或替代地,遗传生物标记物的检测可以包括一种评估样品,例如肿瘤样品(例如,从肿瘤中获取的样品)中的突变负荷的方法,所述方法包括:a)提供序列,例如来自样品的一组亚基因组区间(例如,编码亚基因组区间)的核苷酸序列,其中所述组的亚基因组区间来自预定组的基因;以及b)确定突变负荷的值,其中所述值是所述组的亚基因组区间中的改变(例如,一个或多个改变),例如体细胞改变(例如,一个或多个体细胞改变)的数量的函数。在某些实施方案中,改变的数量不包括亚基因组区间中的功能改变。在其他实施方案中,改变的数量不包括亚基因组区间中的生殖系改变。在某些实施方案中,改变的数量不包括亚基因组区间中的功能改变和亚基因组区间中的生殖系改变。在某些实施方案中,所述组的亚基因组区间包括编码亚基因组区间。在其他实施方案中,所述组的亚基因组区间包括非编码亚基因组区间。在某些实施方案中,所述组的亚基因组区间包括编码亚基因组区间。在其他实施方案中,所述组的亚基因组区间包括一个或多个编码亚基因组区间和一个或多个非编码亚基因组区间。在某些实施方案中,所述组的亚基因组区间中约5%或更多、约10%或更多、约20%或更多、约30%或更多、约40%或更多、约50%或更多、约60%或更多、约70%或更多、约80%或更多、约90%或更多或约95%或更多的亚基因组区间是编码亚基因组区间。在其他实施方案中,所述组的亚基因组区间中约90%或更少、约80%或更少、约70%或更少、约60%或更少、约50%或更少、约40%或更少、约30%或更少、约20%或更少、约10%或更少或约5%或更少的亚基因组区间是非编码亚基因组区间。在其他实施方案中,所述组的亚基因组区间不包括整个基因组或整个外显子组。在其他实施方案中,所述组的编码亚基因组区间不包括整个外显子组。在某些实施方案中,突变负荷表达为百分数,例如在来自参考群体的样品中的突变负荷。在某些实施方案中,参考群体包括患有与受试者相同类型的癌症的患者。在其他实施方案中,参考群体包括正在接受或已经接受与受试者相同类型的疗法的患者。另外或替代地,遗传生物标记物的检测可以包括一种评估样品例如肿瘤样品或来源于肿瘤的样品中的突变负荷的方法。所述方法包括:(i)从样品中获取包含多个肿瘤成员的文库;(ii)使文库与诱饵组接触以提供选择的肿瘤成员,其中所述诱饵组与肿瘤成员杂交,从而提供文库捕捉物;(iii)例如通过下一代测序方法从所述文库捕捉物中获取包含来自肿瘤成员的改变(例如,体细胞改变)的亚型基因组区间的读长;(iv)通过比对方法对所述读长进行比对;(v)根据所述读长为预选的核苷酸位置分配核苷酸值;(vi)从一组分配的核苷酸位置中选择一组亚基因组区间(例如,编码亚基因组区间),其中所述组的亚基因组区间来自预定组的基因;以及(vii)确定突变负荷的值,其中所述值是所述组的亚基因组区间中的改变(例如,一个或多个改变),例如体细胞改变(例如,一个或多个体细胞改变)的数量的函数。在某些实施方案中,改变(例如,体细胞改变)的数量不包括亚基因组区间中的功能改变。在其他实施方案中,改变的数量不包括亚基因组区间中的生殖系改变。在某些实施方案中,改变(例如,体细胞改变)的数量不包括亚基因组区间中的功能改变和亚基因组区间中的生殖系改变。在某些实施方案中,预定组的基因包括多个基因,其以突变体形式与对细胞分裂、生长或存活的作用相关联,或与癌症相关联。在某些实施方案中,所述方法还包括从样品中获取包含多个肿瘤成员的文库。在某些实施方案中,所述方法还包括使文库与诱饵组接触以提供选择的肿瘤成员,其中所述诱饵组与来自文库的肿瘤成员杂交,从而提供文库捕捉物。在某些实施方案中,所述方法还包括从文库或文库捕捉物中获取包含来自肿瘤成员的改变(例如,体细胞改变)的亚基因组区间的读长,从而获取亚基因组区间的读长,例如通过下一代测序方法。在某些实施方案中,所述方法还包括通过比对方法对亚基因组区间的读长进行比对。在某些实施方案中,所述方法还包括例如通过突变识别方法根据亚基因组区间的读长为预选的核苷酸位置分配核苷酸值。在某些实施方案中,所述方法还包括以下中的的一个、两个、三个、四个或全部:(a)从样品中获取包含多个肿瘤成员的文库;(b)使文库与诱饵组接触以提供选择的肿瘤成员,其中所述诱饵组与肿瘤成员杂交,从而提供文库捕捉物;(c)例如通过下一代测序方法从所述文库捕捉物中获取包含来自肿瘤成员的改变(例如,体细胞改变)的亚型基因组区间的读长;(d)通过比对方法对所述读长进行比对;或(e)例如通过突变识别方法根据所述读长为预选的核苷酸位置分配核苷酸值。在某些实施方案中,通过包括使用SGZ算法的方法或系统排除生殖系改变。在某些实施方案中,所述方法还包括表征肿瘤样品中的变体,例如改变,其通过以下进行:a)获取:i)序列覆盖输入(SCI),对于多个选择的亚基因组区间中的每一个,其包括选择的亚基因组区间处的归一化的序列覆盖值,其中SCI是亚基因组区间的读长的数量和过程匹配对照的读长的数量的函数;ii)SNP等位基因频率输入(SAFI),对于多个选择的生殖系SNP中的每一个,其包括肿瘤样品中的等位基因频率的值,其中SAFI至少部分基于肿瘤样品中的次要或替代性等位基因频率;和iii)变体等位基因频率输入(VAFI),其包括肿瘤样品中所述变体的等位基因频率;b)获取作为SCI和SAFI的函数的针对以下的值:i)对于多个基因组片段中的每一个,基因组片段总拷贝数(C);ii)对于多个基因组片段中的每一个,基因组片段次要等位基因拷贝数(M);和iii)样品纯度(p),其中C、M和p的值通过将全基因组拷贝数模型拟合到SCI和SAFI来获得;以及c)获取:突变类型的值g,其指示变体是体细胞的、亚克隆体细胞的变体、生殖系的或不可区分的,并且是VAFI、p、C和M的函数。SGZ算法在国际申请公布号WO 2014/183078和美国申请公布号2014/0336996中描述,所述申请的内容以引用的方式整体并入。另外或替代地,遗传生物标记物的检测可以包括一种用于评估样品(例如,肿瘤样品或来源于肿瘤的样品)中的突变负荷的系统。所述系统包括操作地性连接到存储器的至少一个处理器,所述至少一个处理器在执行时被配置来:a)获取序列,例如来自样品的一组亚基因组区间(例如,编码亚基因组区间)的核苷酸序列,其中所述组的编码亚基因组区间来自预定组的基因;以及b)确定突变负荷的值,其中所述值是所述组的亚基因组区间中的改变(例如,体细胞改变)的数量的函数。另外或替代地,遗传生物标记物的检测可以包括一种分析样品,例如来自恶性血液病(或癌前病变)的肿瘤样品的方法。所述方法包括:(a)从样品中获取一个或多个包含多个成员的文库,例如,从肿瘤样品中获取多个肿瘤成员;(b)任选地,例如通过使一个或多个文库与诱饵组(或多个诱饵组)接触以提供选择的成员(有时在本文中称为文库捕捉物),来针对预选序列富集一个或多个文库;(c)例如通过包括测序的方法,例如用下一代测序方法,从成员,例如来自文库或文库捕捉物的肿瘤成员中获取受试者区间,例如亚基因组区间或表达的亚基因组区间的读长;(d)通过比对方法对所述读长进行比对;以及(e)根据所述读长为预选的核苷酸位置分配核苷酸值(例如,识别突变,例如使用贝叶斯方法),从而分析所述肿瘤样品,任选地其中:来自X个唯一受试者区间(例如,亚基因组区间、表达的亚基因组区间或两者)中的每一个的读长用唯一比对方法进行比对,其中唯一受试者区间(例如,亚基因组区间或表达的亚基因组区间)意指与其他X-1个受试者区间(例如,亚基因组区间、表达的亚基因组区间或两者)不同,并且其中唯一比对方法意指与其他X-1个比对方法不同,并且X至少为2。在一个实施方案中,一种方法(例如,以上列举的方法的元素(d))包括选择或使用用于分析(例如,比对)读长的比对方法,其中所述比对方法根据以下中的一种或多种或全部而变化,响应于以下中的一种或多种或全部而选择,或针对以下中的一种或多种或全部而优化:(i)肿瘤类型,例如所述样品中的肿瘤类型;(ii)所测序的所述受试者区间(例如,亚基因组区间或表达的亚基因组区间)所位于的基因或基因类型,例如特征在于预选或变体或变体类型(例如,突变)或者预选频率的突变的基因或基因类型;(iii)所分析的位点(例如,核苷酸位置);(iv)所评估的受试者区间(例如,亚基因组区间或表达的亚基因组区间)内的变体类型,例如取代;(v)样品类型,例如FFPE样品、血液样品或骨髓抽吸物样品;以及(vi)所评估的所述亚基因组区间中或附近的序列,例如,所述受试者区间(例如,亚基因组区间或表达的亚基因组区间)的未对齐的预期倾向,例如,所述受试者区间(例如,亚基因组区间或表达的亚基因组区间)中或附近的重复序列的存在。在一些实施方案中,所述方法可以包括使用适当调节的比对方法,其包括:选择用于与读长进行比对的重排参考序列,其中所述重排参考序列被预选为与预选的重排进行比对(在实施方案中,参考序列与基因组重排不同);将读长与所述预选的重排参考序列进行比较,例如比对。在实施方案中,使用其他方法来对麻烦的读长进行比较。当优化相对大量的不同亚基因组区间的读长比对时,这些方法是特别有效的。通过举例的方式,一种分析肿瘤样品的方法可以包括:在第一组参数(例如,第一映射算法或使用第一参考序列)下进行读长的比较,例如比对比较,并且确定所述读长是否满足第一预定比对标准(例如,读长可以与所述第一参考序列进行比对,例如,具有少于预选数量的错配);如果所述读长不满足第一预定比对标准,则在第二组参数下进行第二比对比较(例如,第二映射算法或使用第二参考序列);以及任选地,确定所述读长是否满足所述第二预定标准(例如,所述读长可以与所述第二参考序列进行比对,具有少于预选数量的错配),其中所述第二组参数包括使用一组参数,例如,与所述第一组参数相比,所述第二参考序列更可能导致与预选变体(例如重排,例如插入,缺失或易位)的读长的比对。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2013/0266938中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括检测生物样品中靶核酸序列的存在或不存在的方法。在一些实施方案中,所述方法包括:a.使包含锚定子核酸结构域和报告子核酸结构域的可检测地加标记的探针与样品接触;以及b.检测探针与靶核酸的结合的存在或不存在,其中锚定子结构域和报告子结构域通过非核苷接头连接,并且锚定子结构域和报告子结构域在靶核酸不存在的情况下均不形成茎环;并且其中(i)探针不能通过聚合酶延伸;(ii)接头连接到锚定子结构域的3′末端的2个核苷酸内的锚定子结构域,并且接头连接到报告子结构域的5′末端的2个核苷酸内的报告子结构域,其中锚定子结构域不连接到可检测标记;并且/或者(iii)锚定子结构域和报告子结构域各自包含与靶核酸的相同链互补的至少6个核苷酸的连续序列。在一些实施方案中,探针不能通过聚合酶延伸。在一些实施方案中,接头连接到锚定子结构域的3′末端的2个核苷酸内的锚定子结构域,并且接头连接到报告子结构域的5′末端的2个核苷酸内的报告子结构域,其中锚定子结构域不连接到可检测标记。在一些实施方案中,锚定子结构域和报告子结构域各自包含与靶核酸的一条链互补的至少10个核苷酸的连续序列。在一些实施方案中,检测步骤包括测量在报告子结构域与靶核酸之间形成的复合物的解链温度。在一些实施方案中,报告子结构域的长度在4至20个核苷酸之间。在一些实施方案中,报告子结构域的长度在6至12个核苷酸之间。另外或替代地,遗传生物标记物的检测可以包括用于检测靶序列的存在或不存在的反应混合物。在一些实施方案中,所述反应混合物包含:a.包含锚定子结合区和报告子结合区的靶核酸,以及b.包含锚定子核酸结构域和报告子核酸结构域的可检测地加标记的探针,其中锚定子结构域和报告子结构域通过非核苷接头连接,并且锚定子结构域和报告子结构域在靶核酸不存在的情况下均不形成茎环,并且其中(i)探针不能通过聚合酶延伸;(ii)接头连接到锚定子结构域的3′末端的2个核苷酸内的锚定子结构域,并且接头连接到报告子结构域的5′末端的2个核苷酸内的报告子结构域,其中锚定子结构域不连接到可检测标记;并且/或者(iii)锚定子结构域和报告子结构域各自包含与靶核酸的相同链互补的至少6个核苷酸的连续序列。在一些实施方案中,所述反应混合物还包含三磷酸核苷、DNA聚合酶和/或寡核苷酸引物。在一些实施方案中,探针不可通过聚合酶延伸。另外或替代地,遗传生物标记物的检测可以包括一种可检测地加标记的探针,其包含锚定子核酸结构域和报告子核酸结构域,其中:锚定子结构域和报告子结构域通过非核苷接头连接;锚定子结构域和报告子结构域在靶核酸不存在的情况下均不形成茎环;并且其中:(i)探针不能通过聚合酶延伸;并且/或者(ii)接头连接到锚定子结构域的3′末端的2个核苷酸内的锚定子结构域,并且接头连接到报告子结构域的5′末端的2个核苷酸内的报告子结构域,其中锚定子结构域不连接到可检测标记。在一些实施方案中,探针不可通过聚合酶延伸。在一些实施方案中,接头连接到锚定子结构域的3′末端的2个核苷酸内的锚定子结构域,并且接头连接到报告子结构域的5′末端的2个核苷酸内的报告子结构域,其中锚定子结构域不连接到可检测标记。在一些实施方案中,报告子结构域的长度在4至20个核苷酸之间。在一些实施方案中,报告子结构域的长度在6至12个核苷酸之间。在一些实施方案中,锚定子结构域在6-40个核苷酸之间。在一些实施方案中,标记是荧光标记。在一些实施方案中,探针包含至少一个非天然核苷酸,其中与替代非天然核苷酸的对应天然核苷酸相比,非天然核苷酸增加了报告子结构域的解链温度。在一些实施方案中,所述接头是聚乙二醇。在一些实施方案中,所述接头是六乙二醇。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2012/0225428中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一组包含DNA和LNA核苷酸的探针。在一些实施方案中,在探针的5′末端处,确定核碱基,而在3′末端处,存在一个或多个(例如,两个或三个)随机核苷酸(也称为“摆动”位置)。一个实施方案由短核酸链组成,其可以通用地用于检测各种靶序列。短核酸序列也是等位基因特异性的,并且使得能够检测特异性突变,例如单核苷酸多态性(SNP)。一些实施方案包括一种包含第一探针和第二探针的组合物。根据此类实施方案,第一探针具有与3′末端相对的5′末端和至少八个核苷酸,所述至少八个核苷酸包含至少一个DNA核苷酸和至少五个锁定核酸核苷酸以及第一分辨位置;并且第二探针,其具有与3′末端相对的5′末端,并且核苷酸数量与第一探针相同。第二探针的核苷酸包括与第一探针相同数量的DNA核苷酸和锁定核酸核苷酸,并且第二分辨位置位于对应于第一探针中的第一分辨位置的位置。另外,根据此类实施方案,第一探针和第二探针的核苷酸包含腺嘌呤核碱基、胞嘧啶核碱基、鸟嘌呤核碱基、胸腺嘧啶核碱基、尿嘧啶核碱基和甲基胞嘧啶核碱基中的一个,并且第一探针和第二探针在第一分辨位置和第二分辨位置处包含不同的核碱基。然而,根据此类实施方案,第一探针和第二探针在探针的所有其他核苷酸位置处包含相同的核碱基。其他实施方案包括一种包含第一组探针和第二组探针的组合物。第一组和第二组的每个探针均具有与3′末端相对的5′末端和八个核苷酸。第一组的每个探针的核苷酸具有至少一个DNA核苷酸、至少五个锁定核酸核苷酸和第一分辨位置,至少一个锁定核酸核苷酸是随机锁定核酸核苷酸,而第二组探针的每个探针具有与第一组中的探针对应数量的DNA核苷酸、锁定核酸核苷酸和随机锁定核酸核苷酸,并且第二组的每个探针具有位于与第一组中的探针的第一分辨位置相同的核苷酸位置处的第二分辨位置。另外,根据一些此类实施方案,第一组和第二组的所有探针具有相同的核碱基序列,除了(i)随机锁定核酸核苷酸处的核碱基;和(ii)在第一分辨位置和第二分辨位置处的核碱基。另外,第二分辨位置的核碱基与第一分辨位置的核碱基在相同核苷酸位置处不同,并且第二组的每个探针的至少一个随机锁定核酸核苷酸包含位于与第一组的探针的至少一个随机锁定核酸核苷酸相同的核苷酸位置处的相同核碱基。根据此类实施方案,随机锁定核酸核苷酸的核碱基选自腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶中的一种,并且由一个或多个随机锁定核酸核碱基位置处的核碱基变异产生的任何可能的核碱基序列由第一组探针和第二组探针两者中的至少一个探针表示。另外或替代地,遗传生物标记物的检测可以包括提供一种确定包含遗传物质的样品中所关注的基因座处的基因型的方法。所述方法包括以下步骤:使遗传物质与第一探针和第二探针接触;以及检测第一探针或第二探针与遗传物质的结合,从而确定基因座处的基因型。根据此类实施方案,第一探针和第二探针各自具有与3′末端相对的5′末端和包含至少一个DNA核苷酸和至少五个锁定核酸核苷酸的八个核苷酸。第一探针的核苷酸包含第一分辨位置,并且第二探针的核苷酸在第二探针的与第一探针中的第一分辨位置相同的核苷酸位置处包含第二分辨位置。另外,第一分辨位置包含与第二分辨位置不同的核碱基,其中第一探针和第二探针的其他核苷酸处的核碱基是相同的。另外或替代地,遗传生物标记物的检测可以包括一种包含第一组探针和第二组探针的组合物,每个探针具有由一至三个DNA核苷酸和五至七个LNA(锁定核酸)核苷酸构成的八个核苷酸。根据此类实施方案,第一组探针和第二组探针的所有探针具有相同的核苷酸序列,除了(i)一个、两个或三个LNA随机位置处的碱基;和(ii)分辨位置处的碱基,其中所述一个、两个或三个LNA随机位置和所述分辨位置位于第一组和第二组的所有探针中的相同的位置处。此外,根据此类实施方案,在每个LNA随机位置处,碱基独立地选自腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶,并且由一个、两个或三个LNA随机位置处的一个或多个碱基变异产生的任何可能的序列由每组探针中的至少一个探针表示。另外,根据此类实施方案,分辨位置处的碱基在每组探针内是相同的,但是在第一组探针与第二组探针之间是不同的。另外或替代地,遗传生物标记物的检测可以包括一种至少两组探针的文库。根据此类实施方案,文库包含多组探针,每个探针具有八个核苷酸,其具有通用结构5′-D-L-L-L-L-L-X-X-3′或5′-D-L-L-L-L-X-X-X-3′(其中D是DNA核苷酸;每个L是LNA核苷酸;每个X是LNA随机核苷酸)。另外,在一组探针内,所有探针均具有相同的核苷酸序列,除了两个和/或三个LNA随机核苷酸(每个位置的LNA随机核苷酸碱基独立地选自腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶)。另外,根据此类实施方案,由两个位置处的一个或多个碱基变异产生的任何可能的序列由每组探针中的一个探针表示,并且在DNA核苷酸D或LNA核苷酸L的序列中,一组探针与另一组探针不同。另外或替代地,遗传生物标记物的检测可以包括一种确定从受试者获得的样品中所关注的基因座处的基因型的方法。所述方法包括以下步骤:使包含遗传物质的样品与以上组合物实施方案的任何组合物接触;以及检测第一组探针或第二组探针的探针与遗传物质的结合,从而确定基因型处的基因型。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2010/0248991中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种包含至少两个序列特异性扩增引物的固体支撑物,其中至少一个引物通过诱导型可裂解接头结合到所述支撑物。优选地,所述可裂解接头是光可裂解接头。在第一主要实施方案中,所述固体支撑物是珠粒。这种珠粒由选自由以下组成的组的材料构成:硅、二氧化钛、氧化铝、氧化镧、玻璃、硅酸盐、聚苯乙烯、纤维素、琼脂糖和聚酰胺。珠粒是一种纯材料或由两种或更多种材料构成,而所述两种或更多种材料以有序方式混合或组装,例如在核壳粒子中。珠粒的表面以可以附接寡核苷酸的方式进行官能化。另外或替代地,遗传生物标记物的检测可以包括一种如上公开的珠粒的文库。优选地,通过可裂解接头结合到珠粒的多个引物的每个成员携带不同的可检测标记或多个标记的唯一混合物。在一些实施方案中,固体支撑物是包括多个孔的微量滴定板或微微量滴定板(PTP),其特征在于多个包括具有至少两个序列特异性扩增引物的表面的所述孔,其中至少一个引物用可裂解接头结合到所述支撑物。另外或替代地,遗传生物标记物的检测可以包括一种用于制备固体支撑物和优选地包含至少两个序列特异性引物的珠粒的方法,所述珠粒的特征还在于所述引物中的至少一个是可裂解的,所述方法包括以下步骤:提供携带至少一个或多个官能团的固体支撑物;以及使所述一个或多个官能团与反应性基团或两个序列特异性引物的基团反应,其中可裂解的反应性部分存在于将所述固体支撑物与其官能团或其官能团之一连接的间隔子中的一个内,或者所述可裂解部分存在于将所述序列特异性引物之一与其反应性基团连接的间隔子中的一个内。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括以下步骤:提供包含两个各自携带不同的保护基团的官能团的固体支撑物;使第一官能团脱保护并使所述基团与第一引物的反应性基团反应;以及使第二官能团脱保护并使所述珠粒的所述基团与第二引物的反应性基团反应。所述两个官能团通过两个单独的接头连接到珠粒,但是在特定实施方案中,所述两个官能团通过两个臂接头连接到珠粒。在一些实施方案中,所述方法包括以下步骤:提供携带正好一个官能团的固体支撑物;使所述官能团脱保护,并使所述基团与第一序列特异性引物和第二序列特异性引物的混合物反应,所述第一引物和第二引物包含相同的反应性基团,其特征在于所述引物中的至少一个通过可裂解部分连接到其反应性基团。在一些实施方案中,所述方法包括以下步骤:提供携带正好一个官能团的珠粒;以及使所述官能团脱保护并使所述基团与代表通过可裂解部分连接的第一扩增引物和第二扩增引物的寡核苷酸反应。在一些实施方案中,所述方法包括以下步骤:提供携带被两个不同的正交保护基团保护的被保护OH基团的珠粒;使所述正交保护基团中的一个裂解掉并且在珠粒上合成第一引物;以及使所述正交保护基团中的第二个裂解掉并且在珠粒上合成第二引物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2009/0105081中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于捕获和富集靶核酸并分析富集的靶核酸的方法和系统。另外或替代地,遗传生物标记物的检测可以包括以基于溶液的形式富集靶序列。在一些实施方案中,基于溶液的捕获方法包括探针衍生的扩增子,其中所述用于扩增的探针被固定到固体支撑物。固体支撑物包含支撑物固定的核酸探针,以从例如基因组样品中捕获特定核酸序列(例如,靶核酸)。探针扩增提供在溶液中与靶序列杂交的探针扩增子。在探针扩增子与靶序列杂交之后,样品中存在的靶核酸序列通过捕获(例如,通过接头化学物,诸如生物素、地高辛等)和洗涤探针并从捕获的探针中洗脱杂交的靶核酸来富集(图1)。可以使用例如非特异性连接介导的PCR(LM-PCR)进一步扩增一个或多个靶核酸序列,从而产生与原始靶样品相比具有降低的复杂性的PCR产物的扩增池。在一些实施方案中,探针与靶核酸之间的杂交在优选严格的条件下进行,所述严格条件足以支持基于溶液的探针扩增子之间的杂交,其中所述探针包含靶核酸样品的接头化学物和互补区以提供探针/靶杂交复合物。随后通过接头化学物捕获复合物,并在足以去除非特异性结合的核酸的条件下洗涤,并且从捕获的探针/靶复合物中洗脱杂交的靶核酸序列。另外或替代地,遗传生物标记物的检测可以包括分离多个核酸分子和降低多个核酸分子的遗传复杂性的方法,所述方法包括以下步骤:在杂交条件下将所述群体的片段化的、变性的核酸分子暴露于多个不同的结合在固体支撑物上的寡核苷酸探针,以捕获与所述探针特异性杂交的核酸分子,或者在杂交条件下将所述群体的片段化的、变性的核酸分子暴露于多个不同的寡核苷酸探针,然后将杂交分子的复合物结合到固体支撑物以捕获与所述探针特异性杂交的核酸分子,其中在两种情况下,所述片段化的、变性的核酸分子具有约100至约1000个核苷酸残基、优选约250至约800个核苷酸残基并且最优选约400至约600个核苷酸残基的平均大小;将未结合的和非特异性杂交的核酸与捕获的分子分离;洗脱捕获的分子;以及任选地用洗脱的捕获的分子重复上述过程至少一个另外的循环。另外或替代地,遗传生物标记物的检测可以包括一种用于基因组样品中的靶核酸序列,诸如外显子或变体,优选地SNP位点的富集方法。这可以通过合成对基因组区域具有特异性以捕获复杂基因组样品中所含的互补靶核酸序列的基因组探针来实现。在一些实施方案中,所述方法还包括具体地通过进行通过合成反应进行的测序来确定捕获和洗脱的靶分子的核酸序列。另外或替代地,遗传生物标记物的检测可以包括一种用于检测相对于参考基因组,具体地相对于包含片段化的、变性的基因组核酸分子的参考基因组的编码区变异的方法,如前所述的方法还包括:具体地通过进行通过合成反应进行的测序来确定捕获和洗脱的靶分子的核酸序列;以及将确定的序列与数据库中的序列,具体地与参考基因组中多态性的数据库中的序列进行比较以鉴定相对于参考基因组的变体。在实施方案中,使用任何数量的公认的方法(例如,点样、光刻、原位合成等)将核酸(预选的)捕获探针固定到固体支撑物(例如,载玻片、芯片、珠粒等)上。在优选实施方案中,探针通过在底物上的无掩模阵列合成进行原位合成,并且随后通过例如PCR扩增,从而产生在溶液中的探针衍生的扩增子。在一些实施方案中,所合成的探针序列包含用于在探针的3′和5′末端中的一个或两个处(例如,在末端处或附近)扩增的引物结合位点。在一些实施方案中,探针上的引物结合位点的序列在3′和5′端或探针上是相同的,而在其他实施方案中,引物结合位点的序列在3′端是不同的,然后序列在5′端是不同的。在一些实施方案中,用于探针扩增的扩增引物还包含限制性核酸内切酶位点,例如MlyI位点,用于容易地从最终捕获的靶中去除引物序列,其中引物中的一个(例如,正向引物或反向引物)还包含接头化学物,诸如结合部分或序列(例如,生物素、地高辛、HIS标签等),并且沉积到具有固定的探针以及指数PCR扩增(例如,用于靶的指数扩增的PCR程序,如本领域技术人员已知的)所需的试剂的支撑物上。进行PCR,从而产生探针捕获序列的扩增子,使得一条链包含接头化学物,诸如结合部分或序列。将含有扩增子的溶液转移到容器(例如,管、96孔板的孔等)中,并且在一些实施方案中,从反应组分中纯化。优选地使用不对称PCR在探针衍生的扩增子上进行另一轮扩增,其中与未加标记的引物相比,接头化学物标记的引物是丰富的,以优选合成单链结合部分/序列加标记的扩增子。从反应组分中纯化扩增子并转移到容器中,添加变性的核酸样品,并且允许杂交发生。杂交后,捕获加标记的扩增子/靶核酸复合物。例如,当生物素是结合部分时,链霉亲和素(SA)涂覆的底物,例如SA涂覆的珠粒(例如,顺磁性珠粒/粒子)用于捕获生物素标记的扩增子/靶复合物。洗涤SA结合的复合物,并且从复合物中洗脱杂交的靶核酸并用于下游应用,诸如测序应用。另外或替代地,遗传生物标记物的检测可以包括用于分离多个核酸序列和降低多个核酸序列的复杂性的方法,其包括:提供固体支撑物,其中所述固体支撑物包含可与靶核酸序列杂交的杂交探针,并且提供包含靶核酸序列的片段化的核酸样品;扩增杂交探针,其中扩增产物包含结合部分,并且其中扩增产物在溶液中;在一定条件下将核酸样品与溶液中的扩增产物杂交,使得允许发生扩增产物与靶核酸序列之间的杂交;通过所述结合部分从非特异性杂交的核酸分离杂交的靶核酸序列/扩增产物复合物;以及由此分离从复合物中洗脱杂交的靶核酸序列并降低多个核酸序列的复杂性。在一些实施方案中,固体支撑物是微阵列玻片。在一些实施方案中,靶核酸样品是片段化的基因组DNA,在片段的一端或两端处具有或不具有衔接子分子。在一些实施方案中,杂交探针包含限制性核酸内切酶位点,例如MlyI位点。在一些实施方案中,探针扩增包括指数聚合酶链反应,并且还可以包括不对称非指数扩增。在一些实施方案中,结合部分是生物素,并且捕获底物,诸如珠粒,例如顺磁性粒子,用链霉亲和素涂覆,以用于从非特异性杂交的靶核酸分离靶核酸/扩增产物复合物。在一些实施方案中,在洗脱结合的靶核酸之前,洗涤捕获的靶核酸/扩增产物复合物。在一些实施方案中,对洗脱的靶核酸进行测序。另外或替代地,遗传生物标记物的检测可以包括用于分离多个核酸序列和降低多个核酸序列的复杂性的方法,其包括:提供固体支撑物,其中所述固体支撑物包含可与靶核酸序列杂交的杂交探针,并且提供包含靶核酸序列的片段化的核酸样品;扩增杂交探针,其中扩增产物包含结合部分,并且其中扩增产物在溶液中;在一定条件下将核酸样品与溶液中的扩增产物杂交,使得允许发生扩增产物与靶核酸序列之间的杂交;通过所述结合部分将杂交的靶核酸序列/扩增产物复合物与非特异性杂交的核酸分离;由此分离从复合物中洗脱杂交的靶核酸序列并降低多个核酸序列的复杂性;以及对洗脱的靶核酸序列进行测序。在一些实施方案中,固体支撑物是微阵列玻片。在一些实施方案中,靶核酸样品是片段化的基因组DNA,在片段的一端或两端处具有或不具有衔接子分子。在一些实施方案中,杂交探针包含限制性核酸内切酶位点,例如MlyI位点。在一些实施方案中,探针扩增包括指数聚合酶链反应,并且还可以包括不对称非指数扩增。在一些实施方案中,结合部分是生物素,并且捕获底物,诸如珠粒,例如顺磁性粒子,用链霉亲和素涂覆,以用于从非特异性杂交的靶核酸分离靶核酸/扩增产物复合物。在一些实施方案中,在洗脱结合的靶核酸之前,洗涤捕获的靶核酸/扩增产物复合物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2018/077847中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种从包含多个靶分子的样品制备靶核酸分子的文库的方法,对于基本上每个靶分子,所述方法包括:将单个衔接子连接到靶分子,从而形成环状分子,其中衔接子包含两个条形码、位于两个条形码之间的两个引物结合位点和至少一个修饰的核苷酸,其中与结合位点退火的引物彼此背对,所述至少一个修饰的核苷酸通过位于两个引物结合位点之间的核酸聚合酶实现链合成终止;将与衔接子互补的正向引物与靶分子的一条链退火;将正向引物延伸到修饰的核苷酸,从而产生第一链;将与衔接子互补的反向引物与第一链退火;延伸第一引物,从而产生第二链和包含第一链和第二链的双链分子,其中两个条形码侧接靶序列。在一些实施方案中,正向引物和反向引物中的至少一个包含与衔接子不互补并且包含另外的引物结合位点的5′-瓣状序列(5′-fiap sequence)。然后,所述方法还包括以下步骤:将另外的引物与和正向引物中的瓣状序列互补的序列退火;以及延伸另外的引物,从而产生包含两个另外的引物位点和侧接靶序列的两个条形码的双链分子。在一些实施方案中,靶分子和衔接子是单链的。在其他实施方案中,靶分子和衔接子是双链的,并且环状分子是至少部分变性的引物以使引物退火。在一些实施方案中,条形码是4-20个碱基长的核苷酸序列。通过核酸聚合酶实现链合成终止的修饰的核苷酸可以选自脱碱基核苷酸、具有蛋白质侧基的核苷酸、合成核苷酸AraC(阿糖胞苷)或脱氧尿嘧啶、异鸟嘌呤、5-甲基异胞嘧啶、乙二醇间隔子、具有大体积类似物的核苷酸,诸如荧光团或非天然碱基对(UBP)“d5SICS-dNaM”核酸类似物。连接可以选自突出连接、T-A连接、平端连接和拓扑异构酶催化的连接。在一些实施方案中,衔接子在一端具有光可裂解接头。在这些实施方案中,接头连接在一端上并暴露于UV光以能够在另一端上连接。在一些实施方案中,另外的引物是测序引物。另外或替代地,遗传生物标记物的检测可以包括一种靶核酸分子的文库,其中每个分子是包含靶序列和连接靶序列的末端的衔接子的环状分子,所述衔接子包含:两个条形码;位于两个条形码之间的两个引物结合位点,其中与结合位点退火的引物彼此背对;至少一个修饰的核苷酸,其通过位于两个引物结合位点之间的核酸聚合酶实现链合成终止。在一些实施方案中,条形码是4-20个碱基长的核苷酸序列。通过核酸聚合酶实现链合成终止的修饰的核苷酸可以选自脱碱基核苷酸、具有蛋白质侧基的核苷酸、合成核苷酸AraC(阿糖胞苷)或脱氧尿嘧啶、异鸟嘌呤、5-甲基异胞嘧啶、乙二醇间隔子、具有大体积类似物的核苷酸,诸如荧光团或非天然碱基对(UBP)“d5SICS-dNaM”核酸类似物。另外或替代地,遗传生物标记物的检测可以包括一种对包含多个靶分子的样品中的靶核酸进行测序的方法,所述方法包括:通过将单个双链衔接子连接到基本上每个双链靶分子,从而形成双链环状分子来从样品产生靶核酸分子的文库,其中衔接子包含两个条形码、位于两个条形码之间的两个引物结合位点和至少一个修饰的核苷酸,其中与结合位点退火的引物彼此背对,所述至少一个修饰的核苷酸通过位于两个引物结合位点之间的核酸聚合酶实现链合成终止;使双链环状靶分子的至少一部分变性;将与衔接子互补的正向引物与靶分子的一条链退火;将正向引物延伸到修饰的核苷酸,从而产生第一链;将与衔接子互补的反向引物与第一链退火;延伸第一引物,从而产生第二链和包含第一链和第二链的双链分子,其中两个条形码侧接靶序列;扩增双链分子;以及对双链分子的扩增产物进行测序。在一些实施方案中,正向引物和反向引物中的至少一个包含与衔接子不互补并且包含另外的引物结合位点的5′-瓣状序列。在一些实施方案中,所述方法还包括:在延伸第一引物之后,将另外的引物与和正向引物中的瓣状序列互补的序列退火;以及延伸另外的引物,从而产生包含两个另外的引物位点和侧接靶序列的两个条形码的双链分子。在一些实施方案中,可以用另外的引物进行扩增或测序。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/123316中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括靶向测序工作流,其中提供包含足够数量的基因组材料的输入样品,使得在测序之前需要最少或不需要扩增过程。在一些实施方案中,输入样品来源于完整肿瘤或淋巴结。在一些实施方案中,输入样品通过从患者或哺乳动物受试者获得的完整肿瘤样品(全部或部分)和/或一个或多个淋巴结的均质化获得。在一些实施方案中,输入样品来源于足够数量的血液,包括全血或其任何级分。在一些实施方案中,输入样品来源于癌性组织。在一些实施方案中,输入样品来源于癌前组织。在一些实施方案中,靶向测序工作流在测序之前包括一个或多个扩增步骤(例如,捕获前扩增步骤,捕获后扩增步骤),其中测序之前的每个扩增步骤包括0至3个扩增循环,并且其中测序之前的扩增循环的总数不超过4。在其他实施方案中,靶向测序工作流在测序之前包括一个或多个扩增步骤(例如,捕获前扩增步骤,捕获后扩增步骤),其中测序之前的每个扩增步骤包括0至2个扩增循环,并且其中测序之前的扩增循环的总数不超过3。在又其他实施方案中,靶向测序工作流在测序之前包括一个扩增步骤(例如,捕获前扩增步骤或捕获后扩增步骤),其中测序之前的单个扩增步骤包括0至3个扩增循环。在另外的实施方案中,靶向测序工作流在测序之前包括一个扩增步骤,其中测序之前的单个扩增步骤包括1至3个循环。在又另外的实施方案中,靶向测序工作流在测序之前包括一个扩增步骤,其中测序之前的单个扩增步骤包括1个循环。在再另外的实施方案中,靶向测序工作流在测序之前包括一个扩增步骤,其中测序之前的单个扩增步骤包括2个循环。在一些实施方案中,捕获前扩增步骤或捕获后但在测序之前的扩增步骤中的一个或两个都利用LM-PCR。另外或替代地,遗传生物标记物的检测可以包括一种对样品内的基因组材料进行测序的方法,其包括:对肿瘤样品和/或淋巴结样品均质化以提供均质化的样品;从均质化的样品中分离至少0.5微克的基因组材料;将所述至少0.5微克的分离的基因组材料准备用于测序;以及对准备的基因组材料进行测序。在一些实施方案中,所述方法在测序之前不包括任何扩增步骤。在一些实施方案中,所述方法包括至少一个捕获前或捕获后扩增步骤,其中在至少一个捕获前或捕获后扩增步骤期间进行的扩增循环的总数为至多4个循环。在一些实施方案中,扩增循环的总数为3。在一些实施方案中,扩增循环的总数为2。在一些实施方案中,将所述至少0.5微克的分离的基因组材料准备用于测序包括将所述至少0.5微克的分离的基因组材料与捕获探针杂交并且捕获杂交的基因组材料。在一些实施方案中,捕获的基因组材料的量的范围是约90ng至约900ng。在一些实施方案中,对捕获的基因组材料进行1或2个扩增循环。在一些实施方案中,均质化的样品包括细胞的代表性采样。在一些实施方案中,从均质化的样品中分离至少1微克的基因组材料。在一些实施方案中,从均质化的样品中分离至少5微克的基因组材料。在一些实施方案中,从均质化的样品中分离至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种对样品内的DNA进行测序的方法,其包括从血液样品中分离至少0.5微克的DNA;将所述至少0.5微克的分离的DNA准备用于测序,以及对准备的DNA进行测序。在一些实施方案中,所述方法在测序之前包括0个扩增步骤。在一些实施方案中,将所述至少0.5微克的分离的DNA准备用于测序包括将所述至少0.5微克的分离的基因组材料与捕获探针杂交并且捕获杂交的基因组材料。在一些实施方案中,捕获的基因组材料的量的范围是约90ng至约900ng。在一些实施方案中,对捕获的基因组材料进行1或2个扩增循环。在一些实施方案中,从血液样品中分离至少1微克的DNA。另外或替代地,遗传生物标记物的检测可以包括一种靶向代表性测序的方法,其包括:(i)对肿瘤的至少一部分、一个或多个完整或部分淋巴结或其任何组合均质化以提供均质化的样品;(ii)从均质化的样品中提取基因组材料;(iii)将提取的基因组材料捕获到珠粒上;以及(iv)对捕获的基因组材料进行测序;其中靶向代表性测序包括在对捕获的基因组材料进行测序之前进行至多4个扩增循环。在一些实施方案中,可以在捕获提取的基因组材料之前或在捕获提取的基因组材料之后或其任何组合进行至多3个扩增循环。在一些实施方案中,不进行捕获前扩增循环。在一些实施方案中,捕获的基因组材料的量的范围是约90ng至约900ng。在一些实施方案中,在捕获提取的基因组材料之后但在测序之前进行1至3个扩增循环。在一些实施方案中,从均质化的样品中提取至少0.5微克的基因组材料。在一些实施方案中,与在需要多于4个扩增循环的测序方法中所用的输入材料的量相比,从均质化的样品中获得至少100倍之多的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种对样品内的DNA进行测序的方法,其包括:提供至少0.5微克的输入基因组材料,所述至少0.5微克的基因组材料来源于肿瘤样品、淋巴结样品或血液样品;从所述输入基因组样品中分离DNA;将分离的DNA准备用于测序;以及对准备的DNA进行测序,其中所述方法不包括任何扩增步骤。在一些实施方案中,所述至少0.5微克的输入基因组材料来源于多个组织学和/或活检标本。在一些实施方案中,所述至少0.5微克的输入基因组材料来源于均质化的肿瘤样品。在一些实施方案中,所述至少0.5微克的输入基因组材料来源于均质化的淋巴结样品。在一些实施方案中,所述至少0.5微克的输入基因组材料是其所来源于的肿瘤样品、淋巴结样品或血液样品的代表性采样。在一些实施方案中,使用下一代测序方法进行测序。在一些实施方案中,使用合成测序方法进行测序。另外或替代地,遗传生物标记物的检测可以包括一种减少测序期间的PCR引入的突变的方法,其包括从包含足够量的基因组材料的样品中分离DNA;将分离的DNA准备用于测序;以及对准备的DNA进行测序,其中所述方法在测序之前包括至多3个扩增循环。在一些实施方案中,所述方法在测序之前包括1或2个扩增循环。在一些实施方案中,足够量的输入基因组材料是使得不使用捕获前扩增循环的量。在一些实施方案中,所述样品来源于被怀疑患有癌症的患者。在一些实施方案中,所述样品来源于被诊断患有癌症的患者。在一些实施方案中,所述样品来源于具有发展癌症的风险的患者。在一些实施方案中,所述样品来源于健康组织样品。在一些实施方案中,从所述样品中分离0.5微克的DNA。在一些实施方案中,从所述样品中分离至少1微克的基因组材料。在一些实施方案中,从所述样品中分离至少5微克的基因组材料。在一些实施方案中,从所述样品中分离至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种其中减少PCR引入的突变的测序方法,所述测序方法包括捕获至少0.05微克的基因组材料,以及在测序之前进行0至2个扩增循环。在一些实施方案中,进行0个扩增循环。在其他实施方案中,进行1个扩增循环。在又其他实施方案中,进行2个扩增循环。另外或替代地,遗传生物标记物的检测可以包括一种其中减少基因组含量的比例表示中PCR引入的偏差的序列捕获方法,所述测序方法包括提供包含至少0.5微克基因组材料的输入样品,并且其中所述序列捕获方法包括在测序之前进行0与2个之间的扩增循环。在一些实施方案中,进行0个扩增循环。在其他实施方案中,进行1个扩增循环。在又其他实施方案中,进行2个扩增循环。在一些实施方案中,输入样品包含至少1微克的基因组材料。在一些实施方案中,输入样品包含至少5微克的基因组材料。在一些实施方案中,输入样品包含至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种其中消除PCR引入的突变的序列捕获方法,所述序列捕获方法包括制备包含至少0.5微克基因组材料的输入样品。在一些实施方案中,输入样品包含至少1微克的基因组材料。在一些实施方案中,输入样品包含至少5微克的基因组材料。在一些实施方案中,输入样品包含至少10微克的基因组材料。另一方面是一种消除在测序之前去除PCR重复读长的步骤的序列捕获方法,所述序列捕获方法包括提供包含至少0.5微克基因组材料的输入样品。在一些实施方案中,输入样品包含至少1微克的基因组材料。在一些实施方案中,输入样品包含至少5微克的基因组材料。在一些实施方案中,输入样品包含至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种其中实际上消除PCR引入的突变的测序方法,所述测序方法包括捕获至少0.05微克的基因组材料。在一些实施方案中,在捕获基因组材料之后提供约0.05微克的基因组材料。在一些实施方案中,在测序之前进行1或2个捕获后扩增循环。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/132276中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括以下方法,其中:使用自动解剖工具从样品中切除预测对第一治疗剂没有反应的肿瘤样品的区域,使用NGS在切除的区域中检测与预测性生物标记物相关的突变,并且针对通过NGS鉴定的一个或多个预测性生物标记物对额外的肿瘤样品进行染色。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:获得肿瘤的第一样品,其中针对第一治疗剂的第一预测性生物标记物对第一样品进行组织化学染色;使用自动解剖工具从第一样品中切除一个或多个区域,其中切除的区域具有第一预测性生物标记物的染色图案,指示所述区域不太可能对第一治疗剂产生反应;用下一代测序仪检测来源于第一样品的一个或多个切除区域的核酸样品中预测对一种或多种额外的治疗剂具有反应的一个或多个一个或多个突变;针对与样品中鉴定的一个或多个突变相关的一个或多个额外的预测性生物标记物对肿瘤的一个或多个额外样品进行染色,所述一个或多个额外的预测性生物标记物预测对一种或多种额外的治疗剂的反应。另外或替代地,遗传生物标记物的检测可以包括一种系统,其包括:(a)来源于从肿瘤的第一样品切除的一个或多个区域的核酸样品,其中针对第一预测性生物标记物对肿瘤的第一样品进行染色,另外其中从所述部分中切除的一个或多个区域具有第一预测性生物标记物的染色图案,指示肿瘤的至少一部分不太可能对第一治疗剂产生反应;(b)下一代测序仪,其适于鉴定与一个或多个其他预测性生物标记物相关的突变的存在或不存在;(c)包括数据库的实验室信息系统(LIS),所述数据库含有:cC1)通过下一代测序对核酸样品进行的突变分析,其中所述突变至少指示核酸样品中突变的存在或不存在,所述突变与一种或多种额外的治疗剂的一个或多个额外的预测性生物标记物相关;和(c2)用于指导自动载玻片染色器使用通过突变分析鉴定的一个或多个额外的预测性生物标记物对肿瘤的第二样品进行染色的指令。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号10,023,917中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括高分辨率解链(HRM)测定,作为诊断关于RAS/RAF/MAPK和PI3K/PTEN/AKT途径的最常见基因(KRAS、BRAF、PIK3CA、AKT1)的热点区中的突变的预筛选诊断方法。另外或替代地,遗传生物标记物的检测可以包括扩增引物对,其可用于对于预测对癌症治疗剂的反应性重要的基因的HRM分析。另外或替代地,遗传生物标记物的检测可以包括以下扩增引物对,用于扩增和分析KRAS、外显子2和3、BRAF、外显子15、PIK3CA、外显子7、9和20以及AKT1、外显子2。另外或替代地,遗传生物标记物的检测可以包括一种包含至少一个如上所述的扩增引物对的组合物或反应混合物。所述组合物可以用于在核酸扩增反应期间核酸的PCR扩增,并且还用于PCR扩增和实时监测。根据一些实施方案,混合物至少包含:如上所述的扩增引物对;热稳定的DNA聚合酶;三磷酸脱氧核苷的混合物,通常为dA、dG、dC和dT或者dA、dG、dC和dU;和缓冲剂。在一些其他实施方案中,当适于一个或多个特定核酸靶序列的实时扩增和检测时,这种组合物额外包含核酸检测实体,诸如荧光杂交探针或荧光双链DNA结合染料。在一些实施方案中,这种DNA双链染料是可以用于进行HRM曲线分析的染料。在一些实施方案中,扩增引物对被设计来根据分子生物学领域中已知的标准方法扩增所关注的特定序列。在一些实施方案中,当与待分析的样品接触时,这种PCR反应混合物额外包含推定含有所关注的特定序列的至少部分纯化的DNA或其他核酸。另外,在一些此类实施方案中,所包括的所有试剂的浓度通常是本领域技术人员已知的,并且可以根据标准方案针对特定的适应性进行优化。在一些此类实施方案中,荧光双链DNA结合染料的浓度在大约0.1至10.0μg/ml之间。在一些实施方案中,提供一种试剂盒。试剂盒的一些说明性实施方案包括至少一个扩增引物对。试剂盒的一些实施方案还可以包括以下额外成分中的一种、若干种或全部:热稳定的DNA聚合酶;三磷酸脱氧核苷,通常为dA、dG、dC和dT或者dA、dG、dC和dU;和缓冲剂;以及荧光双链DNA结合染料,其可以适用于HRM。另外或替代地,遗传生物标记物的检测可以包括一种用于确定对癌症疾病的靶向治疗的反应的增加可能性的方法,其包括以下步骤:a)从患者样品中分离基因组DNA;b)通过PCR用特定的扩增引物对扩增所述DNA的至少一个片段;c)通过高分辨率解链分析(HRM)确定所述扩增的片段是否具有野生型序列或是否包含突变;d)将突变的存在或不存在与所述靶向治疗成功的增加可能性相关。在一些实施方案中,通过杂交分析或通过测序鉴定突变。例如,患者样品可以是福尔马林固定的石蜡包埋的(FFPE)组织。在一些此类情况下,可以进行HRM分析而没有任何DNA添加。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,873,908中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于富集样品中的低丰度等位基因(例如,突变体DNA)的方法,其允许随后检测此类等位基因。另外或替代地,遗传生物标记物的检测可以包括一种富集来自样品的核酸混合物中的靶核酸的变体的方法,所述靶核酸以两个变体序列的形式存在,其中所述变体在单核苷酸位置处不同,所述方法包括:提供包含靶核酸的样品,其中待富集的变体在大量过量的另一个变体中以低丰度存在于样品中;提供相对于靶核酸摩尔过量的浓度的与靶核酸的一条链互补的寡核苷酸,其中所述寡核苷酸附接有亲和标记,并且在单核苷酸位置处与待富集的变体完全匹配,并且在单核苷酸位置处与另一个变体具有错配;提供适于寡核苷酸与靶核酸杂交以生成由寡核苷酸和靶核酸的任一变体的一条链组成的双链体多核苷酸的条件;使双链体多核苷酸与错配嵌入化合物接触,所述错配嵌入化合物仅优先结合含有错配的双链体多核苷酸,其中所述化合物还能够用光催化错配位点处双链体多核苷酸的一条链的裂解;将双链体多核苷酸暴露于光,从而产生裂解的和未裂解的双链体多核苷酸;将裂解的和未裂解的双链体多核苷酸施加到识别并结合寡核苷酸上的亲和标记的亲和基质;提供仅使裂解的双链体多核苷酸变性并从亲和基质中去除变性的单链的条件;以及在使未裂解的多核苷酸双链体变性的条件下提供缓冲剂;以及收集含有靶核酸的富集变体的一条链的缓冲剂。在一个实施方案中,错配嵌入化合物是Rh(bpy)2(chrysi)3+或Rh(bpy)2(phzi)3+或它们各自的类似物。另外或替代地,遗传生物标记物的检测可以包括扩增和检测靶核酸的富集变体的另一个步骤。另外或替代地,遗传生物标记物的检测可以包括一种用于检测来自样品的核酸混合物中的靶核酸的突变体等位基因的方法,其中所述突变体等位基因在单核苷酸位置处与野生型等位基因不同,并且在大量过量的野生型等位基因中以低丰度存在于样品中,所述方法包括:富集样品中的突变体等位基因,其中所述富集通过提供相对于靶核酸摩尔过量的浓度的与靶核酸的一条链互补的寡核苷酸进行,其中所述寡核苷酸附接有亲和标记,并且在单核苷酸位置处与突变体等位基因完全匹配,并且在单核苷酸位置处与野生型等位基因具有错配;提供适于寡核苷酸与靶核酸杂交以生成由寡核苷酸和突变体等位基因或野生型等位基因的一条链组成的双链体多核苷酸的条件;使双链体多核苷酸与错配嵌入化合物接触,所述错配嵌入化合物仅优先结合含有错配的双链体多核苷酸,其中所述化合物还能够用光催化错配位点处双链体多核苷酸的一条链的裂解;将双链体多核苷酸暴露于光,从而产生裂解的和未裂解的双链体多核苷酸;将裂解的和未裂解的双链体多核苷酸施加到识别并结合寡核苷酸上的亲和标记的亲和基质;提供仅使裂解的双链体多核苷酸变性并从亲和基质中去除野生型等位基因的变性单链的条件;在使未裂解的多核苷酸双链体变性的条件下提供缓冲剂;以及收集含有靶核酸的富集的突变体等位基因的一条链的缓冲剂;扩增富集的突变体等位基因;以及检测富集的扩增突变体等位基因的产物或由富集的扩增突变体等位基因生成的信号。在一个实施方案中,错配嵌入化合物是Rh(bpy)2(chrysi)3+或Rh(bpy)2(phzi)3+或它们各自的类似物。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,399,794中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种检测测试样品中靶核酸的存在或不存在的方法,其包括:将来自训练样品集的数据输入到学习统计分类器系统中,其中靶核酸和对照核酸的量是已知的;使用学习统计分类器系统,计算通用线性分类器的多个权重;使用通过学习统计分类器系统计算的多个权重构建通用线性分类器;在允许聚合酶链反应(PCR)的条件下,使测试样品与含有通过PCR扩增靶核酸和对照核酸所需的试剂的反应混合物接触;测量靶核酸和对照核酸的至少一个扩增依赖性参数以获得测试数据集;将通用线性分类器应用于测试数据集以将测试样品分类为含有或不含靶核酸,从而检测测试样品中靶核酸的存在或不存在。在此实施方案的变型中,学习统计分类器系统选自SVM、LDA和QDA。在此实施方案的另外的变型中,扩增依赖性参数是在每个扩增循环期间检测到的荧光。在此实施方案的另外的变型中,数据是阈循环(Ct)值。在此实施方案的另外的变型中,通用线性分类器是分段线性分类器。在此实施方案的另外的变型中,将由对对照核酸的扩增依赖性参数施加的约束所确定的分段函数输入到分段线性分类器中。在此实施方案的另外的变型中,靶核酸是人序列的核酸变体。另外或替代地,遗传生物标记物的检测可以包括一种检测测试样品中靶核酸的存在或不存在的方法,其包括:将来自训练样品集的数据输入到学习统计分类器系统中,其中靶核酸和对照核酸的量是已知的;使用学习统计分类器系统,计算通用线性分类器的多个权重;使用通过学习统计分类器系统计算的多个权重构建通用线性分类器;将样品经受聚合酶链反应(PCR);测量靶核酸和对照核酸的至少一个扩增依赖性参数以获得测试数据集;将通用线性分类器应用于测试数据集;将测试样品分类为含有或不含靶核酸,从而检测测试样品中靶核酸的存在或不存在。在此实施方案的变型中,学习统计分类器系统选自SVM、LDA和QDA。在此实施方案的另外的变型中,扩增依赖性参数是在每个扩增循环期间检测到的荧光。在此实施方案的另外的变型中,数据是阈循环(Ct)值。在此实施方案的另外的变型中,通用线性分类器是分段线性分类器。在此实施方案的另外的变型中,将由对对照核酸的扩增依赖性参数施加的约束所确定的分段函数输入到分段线性分类器中。在此实施方案的另外的变型中,靶核酸是人序列的核酸变体。另外或替代地,遗传生物标记物的检测可以包括一种确定测试样品中是否存在靶核酸的方法,其包括:将其中靶核酸和对照核酸的量已知的训练样品集经受聚合酶链反应(PCR),并且测量靶核酸和对照核酸的至少一个扩增依赖性参数以获得训练数据集;将数据输入到学习统计分类器系统中;使用学习统计分类器系统,计算通用线性分类器的多个权重;使用通过学习统计分类器系统确定的多个权重构建通用线性分类器;将测试样品经受PCR,并且测量靶核酸和对照核酸的至少一个扩增依赖性参数以获得测试数据集;将通用线性分类器应用于测试数据集;将测试样品分类为含有或不含靶核酸。在此实施方案的变型中,学习统计分类器系统选自SVM、LDA和QDA。在此实施方案的另外的变型中,扩增依赖性参数是在每个扩增循环期间检测到的荧光。在此实施方案的另外的变型中,数据是阈循环(Ct)值。在此实施方案的另外的变型中,通用线性分类器是分段线性分类器。在此实施方案的另外的变型中,将由对对照核酸的扩增依赖性参数施加的约束所确定的分段函数输入到分段线性分类器中。在此实施方案的另外的变型中,靶核酸是人序列的核酸变体。另外或替代地,遗传生物标记物的检测可以包括一种确定测试样品中是否存在靶核酸的方法,其包括:将其中靶核酸和对照核酸的量已知的训练样品集经受聚合酶链反应(PCR),并且测量靶核酸和对照核酸的至少一个扩增依赖性参数以获得训练数据集;将数据输入到学习统计分类器系统中;使用学习统计分类器系统,计算通用线性分类器的多个权重;使用通过学习统计分类器系统确定的多个权重构建通用线性分类器;将测试样品经受PCR,并且测量靶核酸和对照核酸的至少一个扩增依赖性参数以获得测试数据集;将通用线性分类器应用于所获得的测试数据集;将测试样品分类为含有或不含靶核酸。在此实施方案的变型中,学习统计分类器系统选自SVM、LDA和QDA。在此实施方案的另外的变型中,扩增依赖性参数是在每个扩增循环期间检测到的荧光。在此实施方案的另外的变型中,数据是阈循环(Ct)值。在此实施方案的另外的变型中,通用线性分类器是分段线性分类器。在此实施方案的另外的变型中,将由对对照核酸的扩增依赖性参数施加的约束所确定的分段函数输入到分段线性分类器中。在此实施方案的另外的变型中,靶核酸是人序列的核酸变体。另外或替代地,遗传生物标记物的检测可以包括一种计算机可读介质,其包括用于控制一个或多个处理器来对测试样品是否含有靶核酸进行分类的代码,所述代码包括以下指令:将学习统计分类器系统应用于靶核酸和对照核酸的量已知的训练数据集,以便构建式I的通用线性分类器;将通用线性分类器应用于包含来自测试样品的数据的测试数据集,以产生将测试样品分类为含有或不含靶核酸的统计得出的决策。在此实施方案的变型中,学习统计分类器系统选自SVM、LDA和QDA。在此实施方案的另外的变型中,数据集中的数据是阈循环(Ct)值。在此实施方案的另外的变型中,通用线性分类器是分段线性分类器。在此实施方案的另外的变型中,靶核酸是人序列的核酸变体。另外或替代地,遗传生物标记物的检测可以包括一种用于检测测试样品中的靶核酸的系统,其包括:数据采集模块,所述数据采集模块被配置来从训练样品集和一个或多个测试样品产生数据集,所述数据集指示靶核酸和对照核酸的存在和数量;数据处理单元,所述数据处理单元被配置来通过以下处理通过采集模块获取的数据:将学习统计分类器系统应用于训练数据集,以便构建式I的通用线性分类器,并且然后将式I的通用线性分类器应用于包含来自测试样品的数据的测试数据集,以产生将测试样品分类为含有或不含靶核酸的统计得出的决策;显示模块,所述显示模块被配置来显示通过数据处理单元产生的数据。在此实施方案的变型中,学习统计分类器系统选自SVM、LDA和QDA。在此实施方案的另外的变型中,通用线性分类器是分段线性分类器。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,382,581中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种靶序列的变体的等位基因特异性扩增的方法,所述靶以若干变体序列的形式存在,所述方法包括:(a)将第一寡核苷酸和第二寡核苷酸与靶序列的至少一个变体杂交;其中第一寡核苷酸与靶序列的一个或多个变体至少部分互补,并且第二寡核苷酸与靶序列的一个或多个变体至少部分互补,并且具有仅与靶序列的一个变体互补的至少一个选择性核苷酸;其中所述第二寡核苷酸包含具有在环外氨基处共价修饰的碱基的核苷酸和具有以下结构的修饰的磷酸酯:
Figure GDA0002675196410005751
其中A和B代表核苷酸链,D是OH或CH3,并且Acc是电子受体或被残基R取代的电子受体,其中R是有机取代基,其中Acc选自由以下组成的组:CN;SO2-R′,其中R′包含至少一个氨基取代的烷基;任选取代的芳基或任选取代的杂环;以及在邻位或对位具有至少一个烷基化N原子的六元N+杂环,所述杂环选自由以下组成的组:吡啶鎓、嘧啶鎓和喹啉鎓;(b)提供适合通过核酸聚合酶进行寡核苷酸延伸的条件;(c)通过所述核酸聚合酶延伸所述第一寡核苷酸和所述第二寡核苷酸,其中当所述寡核苷酸与靶序列的与所述至少一个选择性核苷酸互补的变体杂交时,所述核酸聚合酶能够有效地延伸所述第二寡核苷酸,并且当所述第二寡核苷酸与靶序列的与所述至少一个选择性核苷酸不互补的变体杂交时,效率明显降低。另外或替代地,遗传生物标记物的检测可以包括一种检测靶序列的变体的方法,所述靶以若干变体序列的形式存在,所述方法包括:(a)将第一寡核苷酸和第二寡核苷酸与靶序列的至少一个变体杂交;其中第一寡核苷酸与靶序列的一个或多个变体至少部分互补,并且第二寡核苷酸与靶序列的一个或多个变体至少部分互补,并且具有仅与靶序列的一个变体互补的至少一个选择性核苷酸;其中所述第二寡核苷酸包含具有在环外氨基处共价修饰的碱基的核苷酸和具有以下结构的修饰的磷酸酯:
Figure GDA0002675196410005761
在本文中A和B代表核苷酸链,D是OH或CH3,并且Acc是电子受体或被残基R取代的电子受体,其中R是有机取代基,其中Acc选自由以下组成的组:CN;SO2-R′,其中R′包含至少一个氨基取代的烷基;任选取代的芳基或任选取代的杂环;以及在邻位或对位具有至少一个烷基化N原子的六元N+杂环,所述杂环选自由以下组成的组:吡啶鎓、嘧啶鎓和喹啉鎓;(b)提供适合通过核酸聚合酶进行寡核苷酸延伸的条件;(c)通过所述核酸聚合酶延伸所述第一寡核苷酸和所述第二寡核苷酸,其中当所述寡核苷酸与靶序列的与所述至少一个选择性核苷酸互补的变体杂交时,所述核酸聚合酶能够有效地延伸所述第二寡核苷酸,并且当所述第二寡核苷酸与靶序列的与所述至少一个选择性核苷酸不互补的变体杂交时,效率明显降低;(d)检测所述寡核苷酸延伸的产物,其中所述延伸表示所述靶序列的所述第二寡核苷酸与其具有互补的选择性核苷酸的变体的存在。另外或替代地,遗传生物标记物的检测可以包括一种用于进行靶序列的等位基因特异性扩增的寡核苷酸,所述靶以若干变体序列的形式存在,所述寡核苷酸包含:(a)与所述靶序列的一个或多个变体的一部分至少部分互补的序列;(b)仅与靶序列的一个变体互补的至少一个选择性核苷酸;(c)具有在环外氨基处共价修饰的碱基的核苷酸;(d)具有以下结构的修饰的磷酸酯:
Figure GDA0002675196410005771
其中A和B代表核苷酸链,D是OH或CH3,并且Acc是电子受体或被残基R取代的电子受体,其中R是有机取代基,其中Acc选自由以下组成的组:CN;SO2-R′,其中R′包含至少一个氨基取代的烷基;任选取代的芳基或任选取代的杂环;以及在邻位或对位具有至少一个烷基化N原子的六元N+杂环,所述杂环选自由以下组成的组:吡啶鎓、嘧啶鎓和喹啉鎓。另外或替代地,遗传生物标记物的检测可以包括一种用于靶序列的等位基因特异性扩增的反应混合物,所述靶以若干变体序列的形式存在,所述混合物包含:(a)第一寡核苷酸,其与靶序列的一个或多个变体至少部分互补;和(b)第二寡核苷酸,其与靶序列的一个或多个变体至少部分互补,并且具有仅与靶序列的一个变体互补的至少一个选择性核苷酸;其中所述第二寡核苷酸包含具有在环外氨基处共价修饰的碱基的核苷酸和具有以下结构的修饰的磷酸酯:
Figure GDA0002675196410005772
其中A和B代表核苷酸链,D是OH或CH3,并且Acc是电子受体或被残基R取代的电子受体,其中R是有机取代基,其中Acc选自由以下组成的组:CN;SO2-R′,其中R′包含至少一个氨基取代的烷基;任选取代的芳基或任选取代的杂环;以及在邻位或对位具有至少一个烷基化N原子的六元N+杂环,所述杂环选自由以下组成的组:吡啶鎓、嘧啶鎓和喹啉鎓;(c)核酸聚合酶;(d)三磷酸核苷;以及(e)适于通过核酸聚合酶延伸核酸的缓冲剂。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,279,146中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于富集样品中的低丰度等位基因(例如,突变体DNA)的方法和组合物,其允许随后检测此类等位基因。另外或替代地,遗传生物标记物的检测可以包括一种富集来自样品的核酸混合物中的靶核酸序列的变体的方法,所述靶核酸以两个变体序列的形式存在,其中所述变体在单核苷酸位置处不同,所述方法包括:提供包含靶核酸序列的样品,其中待富集的变体在大量过量的另一个变体中以低丰度存在于样品中;提供与靶核酸序列的一条链互补的寡核苷酸,其中所述寡核苷酸在单核苷酸位置处与待富集的变体具有错配,并且在单核苷酸位置处与另一个变体完全匹配;提供适于寡核苷酸与靶核酸杂交以生成由寡核苷酸和靶核酸序列的任一变体的一条链组成的双链体多核苷酸的条件;使双链体多核苷酸与附接有亲和标记的错配嵌入化合物接触以生成反应混合物,其中所述错配嵌入化合物能够结合含有错配的双链体多核苷酸,并且不能够结合不含错配的双链体多核苷酸;将反应混合物经受识别并结合错配嵌入化合物上的亲和标记的亲和基质;洗涤反应混合物并且将亲和基质与未结合到亲和基质的所有材料分离;以及提供从亲和基质中洗脱核酸的缓冲剂;以及收集含有靶核酸序列的富集变体的洗脱的缓冲剂。另外或替代地,遗传生物标记物的检测可以包括一种用于检测来自样品的核酸混合物中的靶核酸序列的突变体等位基因的方法,其中所述突变体等位基因在单核苷酸位置处与野生型等位基因不同,并且在大量过量的野生型等位基因中以低丰度存在于样品中,所述方法包括:富集样品中的突变体等位基因,其中所述富集通过提供与靶核酸序列的一条链互补的寡核苷酸进行,其中所述寡核苷酸在单核苷酸位置处与突变体等位基因具有错配,并且在单核苷酸位置处与野生型等位基因完全匹配;提供适于寡核苷酸与靶核酸杂交以生成由寡核苷酸和突变体等位基因或野生型等位基因的一条链组成的双链体多核苷酸的条件;使双链体多核苷酸与附接有亲和标记的错配嵌入化合物接触以生成反应混合物,其中所述错配嵌入化合物能够结合含有错配的双链体多核苷酸,并且不能够结合不含错配的双链体多核苷酸;将反应混合物经受识别并结合错配嵌入化合物上的亲和标记的亲和基质;洗涤反应混合物并且将亲和基质与未结合到亲和基质的所有材料分离;以及提供从亲和基质中洗脱核酸的缓冲剂,并且收集含有富集的突变体等位基因的洗脱的缓冲剂;扩增富集的突变体等位基因;以及检测富集的扩增突变体等位基因的产物或由富集的扩增突变体等位基因生成的信号。另外或替代地,遗传生物标记物的检测可以包括一种富集来自样品的核酸混合物中的靶核酸序列的变体的方法,所述靶核酸以两个变体序列的形式存在,其中所述变体在单核苷酸位置处不同,所述方法包括:提供包含靶核酸序列的样品,其中待富集的变体在大量过量的其另一个变体中以低丰度存在于样品中;加热样品,使得核酸的混合物变性;提供适于使靶核酸再退火的条件,其中双链体多核苷酸可以在一个变体序列的一条链与另一个变体序列的一条链之间形成,以在变体不同的单核苷酸位置处生成错配;使双链体多核苷酸与附接有亲和标记的错配嵌入化合物接触以生成反应混合物,其中所述错配嵌入化合物能够结合含有错配的双链体多核苷酸,并且不能够结合不含错配的双链体多核苷酸;将反应混合物经受识别并结合错配嵌入化合物上的亲和标记的亲和基质;洗涤反应混合物并且将亲和基质与未结合到亲和基质的所有材料分离;以及提供从亲和基质中洗脱核酸的缓冲剂;以及收集含有靶核酸序列的富集变体的洗脱的缓冲剂。另外或替代地,遗传生物标记物的检测可以包括一种用于检测来自样品的核酸混合物中的靶核酸序列的突变体等位基因的方法,其中所述突变体等位基因在单核苷酸位置处与野生型等位基因不同,并且在大量过量的野生型等位基因中以低丰度存在于样品中,所述方法包括:富集样品中的突变体等位基因,其中所述富集通过以下进行:加热样品,使得核酸的混合物变性;提供适于使靶核酸再退火的条件,其中双链体多核苷酸可以在一个突变体等位基因的一条链与野生型等位基因的一条链之间形成,以在等位基因不同的单核苷酸位置处生成错配;使双链体多核苷酸与附接有亲和标记的错配嵌入化合物接触以生成反应混合物,其中所述错配嵌入化合物能够结合含有错配的双链体多核苷酸,并且不能够结合不含错配的双链体多核苷酸;将反应混合物经受识别并结合错配嵌入化合物上的亲和标记的亲和基质;洗涤反应混合物并且将亲和基质与未结合到亲和基质的所有材料分离;以及提供从亲和基质中洗脱核酸的缓冲剂,并且收集含有靶核酸序列的富集变体的洗脱的缓冲剂;扩增富集的突变体等位基因;以及检测富集的扩增突变体等位基因的产物或由富集的扩增突变体等位基因生成的信号。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号9,238,832中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种靶序列的变体的等位基因特异性扩增的方法,所述靶以若干变体序列的形式存在,所述方法包括:(a)将第一寡核苷酸和第二寡核苷酸与靶序列的至少一个变体杂交;其中第一寡核苷酸与靶序列的一个或多个变体至少部分互补,并且第二寡核苷酸与靶序列的一个或多个变体至少部分互补,并且具有仅与靶序列的一个变体互补的至少一个内部选择性核苷酸;(b)用核酸聚合酶延伸第二寡核苷酸,其中当所述选择性核苷酸与靶形成碱基对时,所述聚合酶能够优先延伸所述第二寡核苷酸,并且当所述选择性核苷酸不与靶形成碱基对时,所述延伸明显更少。另外或替代地,遗传生物标记物的检测可以包括一种检测靶序列的变体的方法,所述靶以若干变体序列的形式存在,所述方法包括:(a)将第一寡核苷酸和第二寡核苷酸与靶序列的至少一个变体杂交;其中所述第一寡核苷酸与靶序列的一个或多个变体至少部分互补,并且所述第二寡核苷酸与靶序列的一个或多个变体至少部分互补,并且具有仅与靶序列的一个变体互补的至少一个内部选择性核苷酸;(b)用核酸聚合酶延伸第二寡核苷酸;其中当所述选择性核苷酸与靶形成碱基对时,所述聚合酶能够优先延伸所述第二寡核苷酸,并且当所述选择性核苷酸不与靶形成碱基对时,所述延伸明显更少;以及(c)检测所述寡核苷酸延伸的产物,其中所述延伸表示靶序列的第二寡核苷酸与其具有互补的选择性核苷酸的变体的存在。另外或替代地,遗传生物标记物的检测可以包括一种用于进行靶序列的等位基因特异性扩增的寡核苷酸,所述靶以若干变体序列的形式存在,所述寡核苷酸包含:(a)与所述靶序列的一个或多个变体的一部分至少部分互补的序列;(b)仅与靶序列的一个变体互补的至少一个选择性核苷酸。另外或替代地,遗传生物标记物的检测可以包括一种用于靶序列的等位基因特异性扩增的反应混合物,所述靶以若干变体序列的形式存在,所述混合物包含:(a)第一寡核苷酸,其与靶序列的一个或多个变体至少部分互补;和(b)第二寡核苷酸,其与靶序列的一个或多个变体至少部分互补,但是具有仅与靶序列的一个变体互补的至少一个内部选择性核苷酸。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2016/0092630中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括对从靶向测序获得的测序读长的准确和快速的映射。例如,一旦选择了靶区域,就可以鉴定与靶区域足够相似的基因组的替代区域。如果测序读长与靶区域比替代区域更相似,则可以将读长确定为与靶区域对齐。然后可以分析与靶区域对齐的读长以确定在靶区域中是否存在突变。因此,可以将测序读长与靶区域和对应的替代区域而不是与整个基因组进行比较,从而提供计算效率。另外或替代地,遗传生物标记物的检测可以包括一种检测生物体的样品基因组的靶区域中的变体的方法。接收多个序列读长。序列读读长从对获自生物体的样品中的基因组片段进行测序获得,其中测序包括靶向来自靶区域的基因组片段。鉴定一个或多个具有来自参考基因组的靶区域的相应的第一数量的变异的替代区域。每个相应的第一数量大于一且小于第一阈值数量。计算机系统进行多个序列读长与参考基因组的靶区域的比对,以鉴定与参考基因组的靶区域对齐的具有小于第二阈值数量的变异的一组序列读长。可以从所述组中去除与替代区域中的一个对齐的具有小于第三阈值数量的第二数量的变异的序列读长。分析所述组的剩余序列读长,以确定样品基因组的靶区域中的变体。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,977,108中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于快速和可靠地检测和区分包含重复核苷酸序列的核酸的突变体形式和非突变体形式的方法。例如,在某些实施方案中,所述方法用于评估患者的微卫星不稳定性,作为诊断或预后应用的一部分。在许多实施方案中,使用单个探针核酸检测给定重复核苷酸序列的各种多态性。另外或替代地,遗传生物标记物的检测可以包括一种检测靶核酸的突变体形式的方法。所述方法包括提供至少一个靶核酸和/或靶核酸的扩增子。靶核酸包括至少一个重复核苷酸序列。所述方法还包括使至少一种探针核酸结合(例如,杂交等)靶核酸和/或靶核酸的扩增子。探针核酸包含至少第一核苷酸序列,其与重复核苷酸序列的非突变体形式的至少一部分至少基本上互补。另外,所述方法还包括检测探针核酸与靶核酸和/或靶核酸的扩增子的双峰解离。在一些实施方案中,检测的双峰解离包括解链峰的双峰分布。此外,检测的双峰解离通常与重复核苷酸序列的至少一种突变体形式相关。在一些实施方案中,检测的非双峰(例如,单峰等)解离与重复核苷酸序列的非突变体形式相关。通常,探针核酸、靶核酸和/或靶核酸的扩增子包含至少一个标记部分和/或至少一个淬灭剂部分或与其缔合。在这些实施方案中,检测步骤通常包括检测由标记部分产生的可检测信号。此外,通常在至少一种变化的条件(诸如变化的温度等)下,检测探针核酸与靶核酸和/或与靶核酸的扩增子的双峰解离。另外或替代地,遗传生物标记物的检测可以包括一种反应混合物。反应混合物包含至少一个靶核酸和/或靶核酸的扩增子。靶核酸包括至少一个重复核苷酸序列。反应混合物还包含至少一种探针核酸,所述探针核酸包含至少第一核苷酸序列,其与重复核苷酸序列的非突变体形式的至少一部分至少基本上互补。此外,探针核酸在至少一种变化的条件下与结合的靶核酸双峰解离,所述结合的靶核酸包含重复核苷酸序列的至少一种突变体形式。在某些实施方案中,反应混合物还包含各种其他组分。例如,反应混合物任选地包含至少一种盐(例如,NaCl、KCl等)。在一些实施方案中,反应混合物还包含至少一种缓冲剂。缓冲剂通常将反应混合物的pH维持在约5.5与约10.0之间。反应混合物还任选地包含至少一种辅助因子,诸如Mg2+(例如,MgSO4、MgCl2等)、Mn2+(例如,MnSO4、MnCl2等)等。另外或替代地,遗传生物标记物的检测可以包括一种探针核酸。探针核酸包含至少第一核苷酸序列,其与重复核苷酸序列的非突变体形式的至少一部分至少基本上互补。另外,探针核酸在至少一种变化的条件下与结合的靶核酸双峰解离,所述结合的靶核酸包含重复核苷酸序列的至少一种突变体形式。另外或替代地,遗传生物标记物的检测可以包括一种用于检测靶核酸的突变体形式的系统。所述系统包括至少一个探针核酸,所述探针核酸包含至少第一核苷酸序列,其与重复核苷酸序列的非突变体形式至少基本上互补。探针核酸在至少一种变化的条件下与结合的靶核酸双峰解离,所述结合的靶核酸包含重复核苷酸序列的至少一种突变体形式。通常,至少一个容器包含例如在溶液中的探针核酸。所述系统还包括至少一个检测器,在探针核酸结合靶核酸和/或靶核酸的扩增子并经受一种或多种变化的条件时,所述检测器检测探针核酸与靶核酸和/或靶核酸的扩增子的解离。在一些实施方案中,所述系统还包括至少一种热调节器,在探针核酸结合靶核酸和/或靶核酸的扩增子而影响变化的条件时,所述热调节器调节探针核酸所暴露的温度。在某些实施方案中,所述系统还包括至少一个至少可操作地连接到检测器的控制器,所述控制器将探针核酸与结合的靶核酸和/或结合的靶核酸的扩增子的所检测的双峰解离与靶核酸从其获得的受试者的至少一种遗传病和/或至少一种疾病状态的诊断相关。在一些实施方案中,靶核酸通常包含DNA或RNA,并且通常从至少一个受试者获得。靶核酸的突变体形式通常与包含靶核酸的突变体形式的受试者的至少一种遗传病(例如,脆性X综合征等)和/或至少一种疾病状态(例如,至少一种形式的癌症等)的诊断相关。此外,相对于重复核苷酸序列的非突变体形式,重复核苷酸序列的突变体形式通常包含至少一个缺失。在一些实施方案中,例如,重复核苷酸序列对应于微卫星标记物、单核苷酸重复序列等。在一些实施方案中,重复核苷酸序列包含至少一个单核苷酸重复序列(例如,An、Tn、Gn、Cn、Un等,其中n是大于1的整数)。例如,单核苷酸重复序列任选地包含BAT-25重复序列、BAT-26重复序列等。在某些实施方案中,所检测的单核苷酸重复序列的突变体形式包含22个或更少的腺嘌呤核苷酸。为了进一步说明,在某些实施方案中,靶核酸的重复核苷酸序列包含至少一个AT重复序列、至少一个GC重复序列、至少一个CGG重复序列、至少一个CGC重复序列、至少一个TAT重复序列、至少一个ATT重复序列和/或其至少一个互补重复序列。在一些实施方案中,例如,第一核苷酸序列长于重复核苷酸序列的非突变体形式。在这些实施方案中,第一核苷酸序列的延伸超过重复核苷酸序列的非突变体形式的长度的部分通常不与邻近重复核苷酸序列的靶核酸的核苷酸序列基本上互补。尽管不限于特定理论,但是在这些实施方案中,认为当在至少一种选择的条件下,探针核酸结合靶核酸的突变体形式或靶核酸的突变体形式的扩增子时,探针核酸的至少一个片段形成三螺旋。在某些实施方案中,探针核酸包含至少一个修饰的核苷酸。探针核酸、靶核酸和/或靶核酸的扩增子(例如,通过用于产生扩增子的引物核酸等)任选地包含至少一个标记部分和/或至少一个淬灭剂部分或与其缔和。为了说明,标记部分任选地包含以下中的一种或多种:例如,荧光染料、弱荧光标记、非荧光标记、比色标记、化学发光标记、生物发光标记、抗体、抗原、生物素、半抗原、酶等。为了进一步举例说明,荧光染料任选地选自由以下组成的组:例如Cy3、Cy3.5、Cy5、Cy5.5、JOE、VIC、TET、HEX、FAM、R6G、R110、TAMRA、ROX、SYBR-Green、EtBr等。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号7,745,125中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括涉及核酸聚合和扩增的方法。在某些实施方案中,例如,与焦磷酸解作用活化的聚合(PAP)相关的方法涉及焦磷酸解作用和聚合的串联偶联。这些方法可以用于例如SNP分析和罕见体细胞突变检测以及许多其他应用。在一些实施方案中,所述方法增强了寡核苷酸介导的合成反应的一般特异性。例如,类似于其他“热启动”方法(例如,可逆的、化学修饰的酶、适体或抗体介导的“热启动”),减少或消除了“零循环延伸”(PCR前)。与这些其他方法不同,引物活化在每一个新的寡核苷酸介导的合成步骤处实现。这改善了反应的整体特异性,最大程度地减少了不想要的副产物的产生。因此,改善了低拷贝序列甚至单拷贝序列的检测。另外,通过减少或消除不希望的和不需要的非特异性合成产物,例如在PCR情况下的引物二聚体的产生,还改善了多重扩增(其中若干或许多不同的靶被扩增)扩增反应的性能。另外或替代地,遗传生物标记物的检测可以包括一种反应混合物,其包含至少一个包含2′-终止子核苷酸(例如,在3′-末端处)的寡核苷酸(例如,引物核酸、探针核酸等)。在某些实施方案中,寡核苷酸包含下式:
Figure GDA0002675196410005851
其中Z为O或CH2;B为至少一个同素环、至少一个杂环、至少一个芳基或其组合;BG为封闭基团;R1为H、OH、亲水基团或疏水基团;X为核苷酸或核苷酸类似物;n为大于0的整数;并且,表示单键或双键。任选地,寡核苷酸包含至少一个标记。在某些实施方案中,寡核苷酸中的至少一个核苷酸位置对应于靶核酸中的多态性核苷酸位置。在一些这些实施方案中,例如,2′-终止子核苷酸对应于靶核酸中的多态性核苷酸位置。根据使用反应混合物的特定应用,反应混合物通常包括额外的试剂。在一些实施方案中,例如,额外的试剂选自例如包含核苷酸去除活性(例如,焦磷酸解活性和/或核酸酶活性)的第一生物催化剂、包含核苷酸掺入活性的第二生物催化剂、至少包含与所述寡核苷酸至少部分互补的子序列的靶核酸、扩增子、引物核酸、探针核酸(例如,杂交探针、5′-核酸酶探针、发夹探针等)、额外的核苷酸(例如,可延伸核苷酸、终止子核苷酸、核糖核苷三磷酸、脱氧核糖核苷三磷酸等)、额外的寡核苷酸(例如,引物核酸、探针核酸等)、可溶性发光修饰剂、助溶剂、嵌入剂、临床标本、样品、缓冲液、盐、金属离子、焦磷酸盐、甘油、二甲基亚砜、poly rA等。在一些实施方案中,靶核酸、扩增子、引物核酸、探针核酸、额外的核苷酸和/或额外的寡核苷酸包含至少一个标记。在某些实施方案中,缓冲液包含浓度为至少90mM(例如,约95mM、约100mM、约105mM等)的N-[三(羟甲基)甲基]甘氨酸。在一些实施方案中,第一生物催化剂包含核苷酸掺入活性(即,除了核苷酸去除活性之外)。第一和/或第二生物催化剂的核苷酸掺入活性通常包含聚合酶活性和/或连接酶活性。任选地,第一和/或第二生物催化剂包含核酸酶活性。为了进一步说明,第一和/或第二生物催化剂任选地包含选自例如聚合酶、末端转移酶、逆转录酶、多核苷酸磷酸化酶、连接酶、AP核酸内切酶和端粒酶的酶。在某些实施方案中,第一和/或第二生物催化剂包含CS5DNA聚合酶,其在选自由以下组成的组的氨基酸位置上包括一个或多个突变:G46、L329、Q601、D640、I669、S671和E678。在一些这些实施方案中,例如,突变包含G46E突变、L329A突变、Q601R突变、D640G突变、I669F突变、S671F突变和/或E678G突变。在一些实施方案中,例如,2′-终止子核苷酸包含2′-单磷酸-3′-羟基核苷。另外或替代地,遗传生物标记物的检测可以包括一种从寡核苷酸中去除核苷酸的方法。所述方法包括将至少一个靶核酸与以下各项一起温育:至少包含核苷酸去除活性(例如,焦磷酸解活性和/或核酸酶活性)的第一生物催化剂,和至少一个包含2′-终止子核苷酸(例如在3′-末端)的寡核苷酸(例如,引物核酸、探针核酸等),所述寡核苷酸与靶核酸的至少第一子序列至少部分互补,其中温育条件使得第一生物催化剂从寡核苷酸中去除至少2′-终止子核苷酸,以产生经去除的2′-终止子核苷酸和经缩短的寡核苷酸,从而从寡核苷酸中去除核苷酸。在一些实施方案中,所述方法包括将靶核酸与第一生物催化剂、寡核苷酸和焦磷酸盐一起温育,所述焦磷酸盐被添加到经去除的2′-终止子核苷酸。在一些示例性实施方案中,靶核酸包含至少一个多态性核苷酸位置,并且所述方法包括对从寡核苷酸中去除2′-终止子核苷酸进行检测,所述去除与包含对应于所述多态性核苷酸位置的至少一个核苷酸位置的寡核苷酸相关。在这些实施方案中,2′-终止子核苷酸通常对应于多态性核苷酸位置。在某些实施方案中,寡核苷酸包含至少一个标记,并且所述方法包括检测从标记发出的可检测信号。在一些这些实施方案中,标记包含供体部分和/或受体部分,并且可检测信号包含发光,并且所述方法包括将靶核酸与第一生物催化剂、寡核苷酸和至少一种可溶性发光修饰剂一起温育以及检测来自供体部分和/或受体部分的发光。任选地,2′-终止子核苷酸包含供体部分和/或受体部分。在一些实施方案中,第一生物催化剂包含核苷酸掺入活性(即,除了核苷酸去除活性之外),并且所述方法包括将靶核酸与第一生物催化剂、经缩短的寡核苷酸和至少一个额外的核苷酸一起温育,其中温育条件使得第一生物催化剂在经缩短的寡核苷酸的末端掺入额外的核苷酸以产生经延伸的寡核苷酸。任选地,所述方法包括将靶核酸与至少包含核苷酸掺入活性的第二生物催化剂、经缩短的寡核苷酸和至少一个额外的核苷酸一起温育,其中温育条件使得第二生物催化剂在经缩短的寡核苷酸的末端掺入额外的核苷酸以产生经延伸的寡核苷酸。为了进行说明,核苷酸掺入活性通常包括聚合酶活性和/或连接酶活性。第一和/或第二生物催化剂通常包含选自例如聚合酶、末端转移酶、逆转录酶、多核苷酸磷酸化酶、连接酶、AP核酸内切酶、端粒酶等的酶。在某些实施方案中,第一和/或第二生物催化剂包含CS5DNA聚合酶,其在选自例如G46、L329、Q601、D640、1669、S671和E678的氨基酸位置上包含一个或多个突变。在一些这些实施方案中,突变包括G46E突变、L329A突变、Q601R突变、D640G突变、I669F突变、S671F突变和/或E678G突变。在一些实施方案中,当寡核苷酸和靶核酸杂交形成杂交的核酸时,寡核苷酸的一个或多个核苷酸延伸超过靶核酸的末端。在一些实施方案中,至少一种额外的寡核苷酸包含所述额外的核苷酸。所述额外的核苷酸包含可延伸核苷酸和/或终止子核苷酸。在某些实施方案中,额外的核苷酸包含至少一个标记,并且所述方法包括检测从标记发出的可检测信号。例如,标记任选地包含供体部分和/或受体部分,并且可检测信号包含发光,并且所述方法包括将靶核酸与至少一种可溶性发光修饰剂一起孵育以及检测来自标记的发光。另外或替代地,遗传生物标记物的检测可以包括将靶核酸与至少一种包含至少一个标记的探针核酸一起温育,所述探针核酸与靶核酸的至少第二子序列至少部分互补,以及检测从探针核酸或其片段的标记发出的可检测信号。在一些实施方案中,可检测信号包含发光,并且所述方法还包括将靶核酸与至少一种可溶性发光修饰剂一起孵育以及检测来自标记的发光。例如,探针核酸任选地包含5′-核酸酶探针,并且第一和/或第二生物催化剂在5′至3′方向上延伸经缩短的寡核苷酸,并包含5′至3′核酸外切酶活性。任选地,探针核酸包含杂交探针和/或发夹探针。在某些实施方案中,靶核酸包含至少一个多态性核苷酸位置,并且所述方法包括检测经缩短的寡核苷酸的延伸,所述延伸与包含对应于所述多态性核苷酸位置的至少一个核苷酸位置的经延伸的寡核苷酸相关。在一些这些实施方案中,2′-终止子核苷酸对应于多态性核苷酸位置。另外或替代地,遗传生物标记物的检测可以包括一种系统,所述系统包括(a)至少一个容器或支持物,所述容器或支持物包含有包含2′-终止子核苷酸的寡核苷酸。所述系统还包括以下中的至少一者:(b)至少一个热调节器,其被配置来与容器或支撑物热连通以调节容器中或支撑物上的温度;(c)至少一个向和/或从容器或支撑物传递流体的流体传递部件;以及(d)至少一个检测器,其被配置来检测在容器中或支撑物上产生的可检测信号。在一些实施方案中,所述系统包括至少一个控制器,其可操作地连接到:热调节器,以实现对容器中或支撑物上的温度的调节;流体传递部件,以实现向和/或从容器或支撑物的流体的传递;和/或检测器,以实现对在容器中或支撑物上产生的可检测信号的检测。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2018/0135103中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括基于数字聚合酶链反应(dPCR)结合用于双重功能的参考样品的方法。首先,将其添加到作为外标运行的dPCR中。其次,将相同的参考样品用作内标,优选是通过将其添加到原始样品中。它以与所关注核酸(目标核酸)相同的方式贯穿整个样品制备过程。内部参考物和外部参考物均使用dPCR进行定量。内部参考物定量与外部参考物定量之比给出dPCR之前样品制备的产率。知道了这个产率,就可以计算出原始样品中的初始目标浓度。与dPCR一起使用的参考物使得对dPCR所用的标准品有全面的了解,并有助于防止由于移液和稀释误差而引起的误算。即使使用了不精确的标准品,dPCR的绝对准确性也得到进一步提高,并且可以重新校准标准品以作为奖励。另外或替代地,遗传生物标记物的检测可以包括一种用于确定未处理的样品中所关注核酸的量或浓度的方法,所述方法包括以下步骤:a)提供怀疑含有所关注核酸的未处理的样品和已知含有参考核酸的参考样品,所述参考核酸与所关注核酸不同;b)将未处理的样品与限定量的参考样品合并,从而获得合并的样品;c)处理合并的样品,从而获得适合于数字聚合酶链反应(dPCR)的处理后的样品;d)用处理后的样品进行dPCR,从而确定处理后的样品中所关注核酸的量或浓度和参考核酸的量或浓度;e)用限定量的参考样品进行dPCR,从而确定限定量的参考样品中参考核酸的量或浓度;
f)将步骤d)中确定的参考核酸的量或浓度与步骤e)中确定的参考核酸的量或浓度进行比较,从而确定步骤c)中核酸的产率;以及
g)基于步骤d)中确定的处理后样品中所关注核酸的量或浓度和步骤f)中确定的产率,确定未处理样品中的所关注核酸的量或浓度。另外或替代地,遗传生物标记物的检测可以包括一种用于确定未处理的样品中所关注核酸的量或浓度的方法,所述方法包括以下步骤:a)提供怀疑含有所关注核酸的未处理的样品;
b)提供已知含有参考核酸的参考样品,所述参考核酸与所关注核酸不同;c)处理参考样品,从而获得适合于dPCR的处理后的参考样品;d)用处理后的参考样品进行dPCR,从而确定处理后的参考样品中参考核酸的量或浓度;e)用限定量的未处理参考样品进行dPCR,从而确定限定量的未处理参考样品中参照核酸的量或浓度;f)将步骤d)中确定的参考核酸的量或浓度与步骤e)中确定的参考核酸的量或浓度进行比较,从而确定步骤c)中核酸的产率;g)处理未处理的样品,从而获得适合于dPCR的处理后的样品,其中处理步骤c)和g)相同;h)用处理后的样品进行dPCR,从而确定所关注核酸的量或浓度;以及i)基于步骤i)中确定的处理后的样品中所关注核酸的量或浓度和步骤f)中确定的产率来确定未处理的样品中所关注核酸的量或浓度。在一些实施方案中,(i)将参考样品中参考核酸的量或浓度与参考值进行比较,从而控制参考样品;(ii)参考样品中参考核酸的量或浓度是未知的或未预先确定的;和/或(iii)步骤e)中参考样品的量或浓度与步骤b)中的相同。此外,参考核酸具有以下特征中的一个或多个:(i)是选自由DNA、cDNA、RNA及其混合物组成的组的核酸;(ii)具有与所关注核酸相同的引物结合位点;(iii)具有不同于所关注核酸的引物结合位点;(iv)核酸的长度与所关注核酸的长度相差最多50%、最多25%、最多10%或最多5%;(v)具有与所关注核酸存在至少50%、至少60%、至少70%或至少80%同一性的序列;(vi)G和C的含量与所关注核酸的含量相差最多50%、最多25%、最多10%或最多5%;以及(vii)包含不是所关注核酸的一部分并且用于检测参考核酸的部分。另外,所关注核酸具有以下特征中的一个或多个:(i)是选自由DNA、cDNA、RNA及其混合物组成的组的核酸;(ii)包含不是参考核酸的一部分并且用于检测所关注核酸的部分;以及(iii)指示微生物、细胞、病毒、细菌、真菌、哺乳动物物种、遗传状况或疾病。进一步,未处理的样品具有以下特征中的一个或多个:(i)获自细胞培养物、怀疑被污染的来源或受试者,特别是其中受试者选自由人、动物和植物组成的组,尤其是人;以及(ii)选自由体液、血液、血浆、血清、尿液、胆汁、脑脊髓液、拭子、临床标本、器官样品和组织样品组成的组。处理步骤可以包括以下过程中的一个或多个:稀释、裂解、离心、萃取、沉淀、过滤和纯化。在一些实施方案中,dPCR通过以下中的一种或多种来表征:(i)在液体、凝胶、乳液、液滴、小型化腔室的微阵列、微流体装置的腔室、微孔板中、芯片上、毛细管中、核酸结合表面上或珠粒上,尤其是在微阵列中或芯片上进行;(ii)在至少100个反应区域,特别是至少1,000个反应区域,尤其是至少5,000个反应区域中相同地进行;以及(iii)在至少10,000个反应区域,特别是至少50,000个反应区域,尤其是至少100,000个反应区域中相同地进行。更具体地,步骤d)和e)在相同的dPCR运行中和/或在相同的dPCR装置上进行。在另一个实施方案中,dPCR包括单独或与淬灭剂组合使用一种或多种荧光探针来检测所关注核酸和/或参考核酸。在一个具体实施方案中,荧光探针包含荧光素、若丹明或花青。在此实施方案中,确定步骤包括检测荧光信号。在一些实施方案中,使用外部对照。在一个具体实施方案中,所述方法用于诊断疾病、病原体、罕见遗传序列、罕见突变、拷贝数变化或相对基因表达的存在或不存在。任选地,所述方法用于监测疾病进展、治疗反应及其组合。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2014/0128270中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种通过微阵列分析来询问具有有义链和反义链的靶核酸的序列的方法,所述微阵列分析包括序列确定计算,所述序列确定计算包括从所述计算中省略来自有义链和反义链之一的对于靶核酸序列中一个或多个核苷酸位置的信号。在此实施方案的变型中,省略来自有义链和反义链之一的在核苷酸位置处的信号包括以下步骤:使用多个微阵列,对于有义链和反义链中的每一者使用一个或多个探针组测量所述核苷酸位置处的杂交信号;对于每个探针组,通过比较每个探针组内的杂交信号来确定碱基分辨能力;对于每个核苷酸位置,使用来自每个探针组的计算出的分辨能力分别计算有义链和反义链的分辨能力;对于每个核苷酸位置,比较有义链和反义链之间计算出的分辨能力;省略来自碱基分辨能力较低的链的信号。在此实施方案的变型中,使用式1测量碱基分辨。在此实施方案的另外变型中,将有义链和反义链的分辨能力计算为在所述链中所述碱基位置处探针组的分辨能力的百分数。在此实施方案的其他变型中,使用式3比较有义链和反义链之间的分辨能力:
Figure GDA0002675196410005921
另外或替代地,遗传生物标记物的检测可以包括一种使用微阵列分析来检测测试样品中具有有义链和反义链的靶核酸的存在或不存在的方法,所述微阵列分析包括序列确定或突变检测计算,所述序列确定或突变检测计算包括从所述计算中省略来自有义链和反义链之一的对于靶核酸序列中一个或多个核苷酸位置的信号。在此实施方案的变型中,省略来自有义链和反义链之一的在核苷酸位置处的信号包括以下步骤:使用多个微阵列,对于有义链和反义链中的每一者使用一个或多个探针组测量所述核苷酸位置处的杂交信号;对于每个探针组,通过比较每个探针组内的杂交信号来确定碱基分辨;对于每个核苷酸位置,使用来自每个探针组的分辨能力分别计算有义链和反义链的分辨能力;对于每个核苷酸位置,比较有义链和反义链之间的分辨能力;省略来自碱基分辨能力较低的链的信号。在此实施方案的变型中,使用式1测量碱基分辨。在此实施方案的另外变型中,将有义链和反义链的分辨能力计算为使用多个微阵列测量的在所述链中所述碱基位置处探针组的分辨能力的百分数。另外或替代地,遗传生物标记物的检测可以包括一种计算机可读介质,所述计算机可读介质包括用于控制一个或多个处理器以使用微阵列分析来检测测试样品中具有有义链和反义链的靶核酸的存在或不存在的代码,所述微阵列分析包括序列确定或突变检测计算,所述序列确定或突变检测计算包括从所述计算中省略来自有义链和反义链之一的对于靶核酸序列中一个或多个核苷酸位置的信号。在此实施方案的变型中,所述计算机可读介质包括控制以下步骤的代码:使用多个微阵列,对于有义链和反义链中的每一者使用一个或多个探针组测量所述核苷酸位置处的杂交信号;对于每个探针组,通过比较每个探针组内的杂交信号来确定碱基分辨能力;对于每个核苷酸位置,使用来自每个探针组的分辨能力分别计算有义链和反义链的分辨能力;对于每个核苷酸位置,比较有义链和反义链之间的分辨能力;省略来自碱基分辨能力较低的链的信号。另外或替代地,遗传生物标记物的检测可以包括一种用于检测测试样品中的靶核酸的系统,所述系统包括:数据获取模块,其被配置来从微阵列获取杂交数据;数据处理单元,其被配置来通过以下步骤,通过省略来自有义链和反义链之一的在靶序列中一个或多个核苷酸位置处的信号来处理数据以确定靶核苷酸序列:使用多个微阵列,对于有义链和反义链中的每一者使用一个或多个探针组测量所述核苷酸位置处的杂交信号;对于每个探针组,通过比较每个探针组内的杂交信号来确定碱基分辨能力;对于每个核苷酸位置,使用来自每个探针组的分辨能力分别计算有义链和反义链的分辨能力;对于每个核苷酸位置,比较有义链和反义链之间的分辨能力;省略来自碱基分辨能力较低的链的信号;以及显示模块,其被配置来显示由数据处理单元产生的数据。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2002/0160404中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种扩增来自样品中的核酸片段的方法,其包括两个或三个热循环扩增反应,其中在第一扩增反应中使用完全随机的引物,并且在第二扩增反应中使用特异性的引物,所述方法的特征在于,为了扩增DNA,使用至少两种DNA聚合酶的混合物,其中至少一种具有3′-5′核酸外切酶活性。扩增反应可以包含约20至60个热循环。第一扩增反应优选包含至少40个热循环,最优选至少50个热循环。第二扩增反应优选包含至少30个热循环,最优选至少40个热循环。每个热循环包含变性阶段、退火阶段和至少一个伸长阶段。变性成单链优选在90℃至96℃之间的温度下进行。使引物与靶核酸杂交的退火阶段优选在30℃至50℃之间的温度下进行。最优选地,退火阶段在35℃至45℃之间的温度下进行。在第一扩增反应期间,退火阶段最优选在约37℃下进行。伸长阶段在50℃至75℃之间的温度下进行。在一个优选的实施方案中,第一扩增反应的伸长阶段在50℃至60℃之间的温度下进行。尤其优选的是约55℃的温度。有利的是,在第一扩增反应期间的大部分循环中,使用两个或更多个伸长步骤进行伸长,其中一次伸长在较低的温度下进行,然后在较高的温度下继续进行伸长。使用这种方法,在第一扩增反应期间产生了特别长扩增子的群体。在此实施方案中,第一扩增反应优选在约55℃下进行,并且第二扩增反应在约65℃至72℃下进行。约68℃的温度是最佳的。第一扩增反应中使用的引物是完全随机的,即,使用单链寡核苷酸的群体,其中每个位置上的每个核苷酸都可以包含四个核苷酸组分A、T、G或C中的一个。这些引物优选长10-20个核苷酸。最优选地,引物长约15个核苷酸。第二扩增反应中使用的特异性引物的特征在于,它们具有与至少10个核苷酸的范围内的靶核酸或其互补序列的序列相同的序列。根据与第二扩增反应中使用的引物相同的标准,选择在潜在的第三扩增反应中用于进行“巢式PCR”的特异性引物。所使用的与靶核酸或其补体相同的引物的序列必须是在第二扩增反应中扩增的序列的组分。DNA聚合酶的混合物优选含有不具有3′-5′核酸外切酶活性的热稳定DNA聚合酶,诸如Taq DNA聚合酶,和具有3′-5′核酸外切酶活性的另一热稳定DNA聚合酶,诸如从Pyrokokkus woesii(Boehringer Mannheim产品编号1644947)获得的Pwo DNA聚合酶。没有3′-5′核酸外切酶活性的其他DNA聚合酶也可以用作聚合酶混合物的组分。另外或替代地,遗传生物标记物的检测可以包括一种用于DNA扩增的方法。为了确保检测某些序列的敏感性,使用酶促蛋白酶消化以获得样品DNA来对待分析的材料进行细胞分析是有利的。例如,可以使用蛋白酶K。另外或替代地,遗传生物标记物的检测可以包括一种首先从待分析的物理材料中分离出RNA的方法。物理材料的样品可以包含一个细胞、少于10个细胞或少于100个细胞。为了获得RNA,可优选使用含有异硫氰酸胍的缓冲液进行化学裂解。然后使用逆转录酶反应产生对应的cDNA。然后将此cDNA用作引物延伸预扩增的起始材料。cDNA优选地通过poly-A RNA的逆转录获得。在引物延伸预扩增PCR中使用聚合酶混合物导致DNA检测惊人的高敏感性,这是使用现有技术中已知的方法无法实现的。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增核酸片段的方法,所述方法包括两个或三个热循环扩增反应。在第一扩增反应中使用完全随机的引物,并且在第二扩增反应中使用特异性的引物。此外,样品中含有的核酸数量对应于不超过100个细胞的当量。在一些实施方案中,扩增产物形成的可能性大于90%。在一些实施方案中,由不超过5-10个细胞的当量形成扩增产物的可能性大于90%。在一个具体的实施方案中,由一个细胞的当量形成扩增产物的可能性大于50%。所述方法适用于扩增长度在100至1000个碱基对之间的核酸片段。所述方法特别适合用于扩增长度在150至550个碱基对之间的核酸片段。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,658,572中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括具有高密度寡肽特征的微阵列,从而允许检测跨生物体蛋白质组的蛋白质相互作用。一个实施方案是包含至少50,000个寡肽特征/cm2的微阵列。另一个实施方案是具有寡肽特征的微阵列,所述寡肽特征代表选自病毒或生物体的靶标的蛋白质组的至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少99%或100%。另外或替代地,遗传生物标记物的检测可以包括包含至少50,000个寡肽特征/cm2的微阵列,其中所述特征代表靶蛋白质组的约90%至100%,所述靶标选自病毒和生物体,并且其中所述特征的至少一部分包含具有末端2-(2-硝基-4-苯甲酰基-苯基)-丙氧羰基(苯甲酰基-NPPOC)保护的酪氨酸残基的寡肽。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号8,822,158中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种用于处理多个所关注核酸分子的方法,所述方法包括以下步骤:(a)提供多个珠粒,其特征在于每个珠粒包含至少一对序列特异性扩增引物,进一步的特征在于,所述引物中的至少一个通过光可裂解的接头结合到珠粒,(b)从样品中捕获所关注核酸分子,(c)克隆分离所述多个珠粒,(d)光裂解所述至少一个引物,(e)克隆扩增所述核酸从而产生多种扩增产物,以及(f)分析所述扩增产物。在第一主要实施方案中,步骤c)包括乳液的产生,其中每个珠粒被包封在单个胶束中。优选地,步骤f)包括将所述多个珠粒分布到微量滴定板或微微量滴定板的空腔中并检测所述扩增产物。在第一特定实施方案中,步骤f)还包括所述扩增产物的测序反应。优选地,所述测序反应是通过合成反应的测序,例如焦磷酸测序反应。在多个核酸分子是相同类型核酸的变体的情况下,这种方法可以用于定量突变分析。在多个分子对应于多个不同的细胞RNA或其对应的cDNA的情况下,这种方法可用于监测基因表达。在第二特定实施方案中,监测例如通过PCR进行的所述扩增产物的产生。优选地,通过特异性双链DNA结合荧光实体,序列特异性杂交探针检测所述扩增产物:此外,可以通过使所述扩增产物经受热梯度来分析所述扩增产物。在第二主要实施方案中,步骤c)包括将所述多个珠粒分布到微量滴定板或微微量滴定板的空腔中。优选地,通过实时PCR同时进行步骤e)和f)。PCR之后,可以进行解链曲线分析。在一些实施方案中,通过可裂解的接头结合到珠粒的至少一个引物携带有可检测的标签。优选地,所述可检测标签选自由质量标签、颜色标签、e标签和可由抗体检测的半抗原组成的组。高度优选的是荧光标记,优选地只要所述加标记的引物没有被伸长,就将荧光标记淬灭。替代地,可裂解的引物携带有可检测的标签。在这种情况下,使用加标记的引物或加标记的dNTP检测所述扩增产物。例如,可检测标签可以是半抗原,诸如生物素(Biotin)或地高辛(Digoxygenin)。在一个特定的实施方案中,通过可裂解的接头结合到珠粒的多个引物的每个成员携带有不同的可检测标记。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利申请公布号2015/0024948中描述的各种方法中的任一种,所述专利申请特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括用于富集和分析核酸序列的系统和方法。另外或替代地,遗传生物标记物的检测可以包括通过在捕获平台上表示一个融合配偶体基因并允许随后对嵌合核酸(诸如在基因组的不同DNA区域上携带信息的核酸链)进行测序来富集一种格式的靶序列。另外或替代地,遗传生物标记物的检测可以包括提供一种用于检测基因组中平衡的染色体畸变的方法。方法包括以下步骤:(a)在杂交条件下,将所述基因组的片段化的变性的核酸分子暴露于位于固体支撑物的多个不同位点上的多个不同的寡核苷酸探针,以捕获与所述探针特异性杂交的核酸分子,其中所述片段化的变性的核酸分子具有约100至约1000个核苷酸残基的平均大小,优选约250至约800个核苷酸残基,最优选约400至约600个核苷酸残基,特别是约500个核苷酸残基,其中所述寡核苷酸探针的平均大小为约20至约100个核苷酸,优选约40至约85个核苷酸,更优选约45至约75个核苷酸,特别是约55至约65个核苷酸残基或约60个核苷酸残基,(b)将未结合的和非特异性杂交的核酸与捕获的分子分离;(c)从固体支撑物上洗脱捕获的分子,(d)任选地用所洗脱的捕获的分子重复步骤(a)至(c)至少一个另外的循环,(e)确定捕获的分子的核酸序列,特别是通过合成反应进行测序,(f)将所确定的序列与参考基因组的数据库中的序列进行比较,(g)在所确定的序列中鉴定与参考基因组的序列仅部分匹配或不匹配的序列,(h)检测至少一种平衡的染色体畸变。另外或替代地,遗传生物标记物的检测可以包括提供预选的、固定的核酸探针,其用于通过使样品与固体支撑物上的探针杂交来从例如基因组样品中捕获靶核酸序列。根据一些实施方案,可以洗涤所捕获的靶核酸并将其从探针上洗脱。在一些情况下,所洗脱的基因组序列可能比未经过所述方法的样品更适合详细的遗传分析。另外或替代地,遗传生物标记物的检测可以包括基于溶液的捕获方法,其包括探针衍生的扩增子,其中所述用于扩增的探针固定到固体支撑物上。固体支撑物包含支撑物固定的核酸探针,以从基因组样品中捕获特定的核酸序列。探针扩增提供在溶液中与靶序列杂交的探针扩增子。在探针扩增子与靶序列杂交之后,通过捕获和洗涤探针并从捕获的探针上洗脱杂交的靶核酸来富集样品中存在的靶核酸序列。可以使用例如非特异性连接介导PCR(LM-PCR)进一步扩增靶核酸序列,从而产生与原始靶样品相比复杂性降低的PCR产物的扩增池,所述扩增池通过如上所述的测序进行进一步分析。另外或替代地,遗传生物标记物的检测可以包括提供一种用于检测生物体的基因组中平衡的染色体畸变的方法。所述方法包括将基因组的片段化的变性的核酸分子暴露于结合到固体支撑物的不同位置的多个寡核苷酸探针的步骤。核酸分子的平均大小为约100至约1000个核苷酸残基,并且寡核苷酸探针的平均大小为约20至约100个核苷酸残基。所述方法还包括以下步骤:将结合到寡核苷酸探针中的一个或多个的核酸分子与未结合到寡核苷酸探针中的一个或多个的核酸分子分离,然后将结合到寡核苷酸探针中的一个或多个的核酸分子从固体支撑物上洗脱。此后,对在洗脱步骤中洗脱的核酸分子进行测序,从而获得核酸分子的确定的序列。所述方法还包括以下步骤:将确定的序列与包含参考基因组序列的数据库进行比较,并在确定的序列中鉴定与参考基因组的序列仅部分匹配或不匹配的序列,从而检测至少一种平衡的染色体畸变。在一些实施方案中,寡核苷酸探针包括用于结合到固体支撑物的接头。在各种实施方案中,接头可以包括化学接头。在一些实施方案中,所述方法可还包括以下步骤:在暴露步骤之前将至少一个衔接子分子与核酸分子的至少一个末端连接,并且用至少一个包含与衔接子分子特异性杂交的序列的引物对结合到寡核苷酸探针中的一个或多个的核酸分子进行扩增,由此在洗脱步骤之后进行扩增步骤。此外,根据一些实施方案,固体支撑物是核酸微阵列或珠粒群体。在一些实施方案中,检测基因组中平衡的染色体畸变的方法。所述方法包括以下步骤:提供固体支撑物,所述固体支撑物包含结合到固体支撑物的不同位置的多个不同寡核苷酸探针,其中寡核苷酸探针的平均大小为约20至约100个核苷酸,并且提供多个片段化的且变性的核酸分子,所述核酸分子的平均大小为约100至约1000个核苷酸残基。所述方法还包括以下步骤:扩增寡核苷酸探针,从而产生包含结合部分并保持在溶液中的扩增产物。此后,所述方法包括以下步骤:在特定的杂交条件下使靶核酸分子与溶液中的扩增产物杂交,从而产生多个杂交复合物,并且将杂交复合物与未与扩增产物杂交的核酸分子分离。接下来,根据所述方法,将杂交的靶核酸分子与包含杂交复合物的扩增产物分离并测序,由此获得核酸分子的确定的序列。根据所述方法,将所确定的序列与包含参考基因组的数据库进行比较,并且在所确定的序列中确定与参考基因组的序列仅部分匹配或不匹配的序列,以便检测至少一种平衡的染色体畸变。在一些实施方案中,结合部分为生物素部分。根据一些实施方案,不使用具有高度重复序列的寡核苷酸探针。此外,在一些实施方案中,所鉴定的平衡的染色体畸变可以包括易位或倒位。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括美国专利号6,514,736中描述的各种方法中的任一种,所述专利特此以引用的方式整体并入。例如,遗传生物标记物的检测可以包括一种使用引物和热稳定酶扩增存在于核酸或其混合物中的一个或多个特定核酸序列的方法。一种引物在与另一种引物杂交时的延伸产物成为用于产生所需特定核酸序列的模板,反之亦然,并且尽可能多地重复所述过程以产生所需量的序列。所述方法提高了扩增反应的特异性,导致扩增的核酸非常明显的信号。另外,所述方法消除了在每个扩增循环后将试剂从一个容器转移到另一个容器的需要。不需要这种转移,是因为热稳定酶将承受使核酸链变性所需的高温,因此不需要替换。另外,温度循环可以是自动化的,以进一步减少实现扩增反应所需的人力和步骤。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增核酸或核酸混合物中包含的至少一个特定核酸序列的方法,其中如果所述核酸是双链的,则其由两个长度相等或不相等的分离的互补链组成,所述方法包括:(a)使每个核酸链与四种不同的三磷酸核苷和针对每个不同的所扩增的特定序列的一个寡核苷酸引物接触,其中选择每个引物与每个特定序列的不同链基本上互补,使得由一个引物合成的延伸产物在与其补体分离时,可以用作合成另一引物的延伸产物的模板,所述接触的温度为促进每个引物与其互补核酸链杂交的温度;(b)在步骤(a)同时或在其之后,使每个核酸链与能够使三磷酸核苷组合以形成与每个核酸的每条链互补的引物延伸产物的热稳定酶接触;(c)将步骤(b)的混合物在有效温度下保持有效时间以活化所述酶,并针对每个不同的所扩增的序列合成与每个核酸链模板互补的每个引物的延伸产物,但又不要太高(温度)而将每个延伸产物与其互补链模板分离;(d)将步骤(c)的混合物在有效温度下加热有效时间,以将引物延伸产物与合成它们的模板分离,以产生单链分子,但又不要太高(温度)而使酶不可逆地变性;(e)将步骤(d)的混合物在有效温度下冷却有效时间,以促进每个引物与步骤(d)中产生的每个单链分子的杂交;以及(f)将步骤(e)的混合物在有效温度下保持有效时间,以促进酶的活性,并对于每个不同的所扩增的序列合成与步骤(d)中产生的每个核酸链模板互补的每个引物的延伸产物,但又不要太高(温度)而使每个延伸产物与其互补链模板分离,其中步骤(e)和(f)同时或依次进行。可以重复步骤(d)、(e)和(f),直到获得所需水平的序列扩增。优选的热稳定酶是从水生栖热菌(Thermus aquaticus)提取的聚合酶(Taq聚合酶)。最优选地,如果所述酶是Taq聚合酶,则在步骤(a)中,使核酸链与包含约1.5-2mM镁盐、150-200μM每个核苷酸和1μM每个引物的缓冲液接触,步骤(a)、(e)和(f)在约45-58℃下进行,并且步骤(d)在约90-100℃下进行。在一个优选的实施方案中,核酸是双链的,并且步骤(a)通过以下步骤完成:(i)在四种不同的三磷酸核苷和每个不同的所扩增的特定序列的一个寡核苷酸引物的存在下将每个核酸在有效温度下加热有效时间,以使每个核酸变性,其中选择每个引物与每个特定序列的不同链基本上互补,使得从一个引物合成的延伸产物在与其补体分离时,可以用作合成另一引物的延伸产物的模板;以及(ii)将变性的核酸冷却至促进每个引物与其互补核酸链杂交的温度。另外或替代地,遗传生物标记物的检测可以包括一种用于检测含有核酸或核酸混合物的样品中至少一个特定核酸序列的存在或不存在,或区分所述样品中两个不同序列的方法,其中怀疑样品含有所述一个或多个序列,并且其中如果核酸是双链的,则它们各自由两个长度相等或不相等的分离的互补链组成,所述方法包括上述的步骤(a)至(f),从而导致特定核酸序列(如果存在)的大量扩增;(g)对于每个所检测的序列,在步骤(f)的产物中加入加标记的寡核苷酸探针,所述加标记的寡核苷酸探针能够与所述序列或其突变杂交;以及(h)确定所述杂交是否已经发生。另外或替代地,遗传生物标记物的检测可以包括一种用于检测样品中包含的一种或多个核酸中序列的至少一个核苷酸变异的存在或不存在的方法,其中如果核酸是双链的,则其由长度相等或不相等的两条分离的互补链组成,所述方法包括上述的步骤(a)-(f),其中将步骤(d)、(e)和(f)重复足够的次数,以导致含有所述序列的核酸(如果存在)的可检测扩增;(g)将步骤(f)的产物固定到膜上;(h)仅在探针的序列与扩增序列的区域互补的情况下,用能够与扩增的核酸序列杂交的加标记的序列特异性寡核苷酸探针在杂交条件下处理所述膜;以及(i)检测探针是否已经与核酸样品中的扩增序列杂交。如果样品包含细胞,则优选在步骤(a)之前将它们加热以使其中的核酸暴露于试剂。此步骤避免了在添加试剂之前提取核酸。在此方法的变型中,对引物和/或三磷酸核苷加标记,使得所得的扩增序列是加标记的。加标记的引物和/或三磷酸核苷可以最初存在于反应混合物中或在随后的循环中添加。将序列特异性寡核苷酸(未标记)固定到膜上,并在杂交条件下用加标记的扩增产物处理,使得仅当膜结合序列存在于扩增产物中时才发生杂交。另外或替代地,遗传生物标记物的检测可以包括一种用于将核酸或核酸混合物中包含的一个或多个特定核酸序列克隆到克隆载体中的方法,所述核酸在双链时由两个分离的互补链组成并且所述核酸在克隆前先大量扩增,所述方法包括上述的步骤(a)-(f),其中将步骤(d)、(e)和(f)重复足够的次数,以导致含有所述序列的核酸的可检测扩增;(g)向步骤(f)的产物中加入针对每个限制性位点的限制性酶,以在限制性消化中获得裂解的产物;以及(h)将含有待克隆的特定序列的步骤(g)的裂解产物连接到一个或多个含有启动子和可选择标记物的克隆载体中。另外或替代地,遗传生物标记物的检测可以包括一种用于将核酸或核酸混合物中包含的一个或多个特定核酸序列克隆到克隆载体中的方法,所述核酸在双链时由两个长度相等或不相等的分离的互补链组成并且所述核酸在克隆前先大量扩增,所述方法包括上述的步骤(a)-(f),其中将步骤(d)、(e)和(f)重复足够的次数,以导致含有所述序列的核酸的有效扩增用于平端连接到一个或多个克隆载体中;以及(g)在连接酶的存在下,将从步骤(f)获得的待克隆的经扩增的特定序列连接到所述克隆载体中的一个或多个中,所述经扩增的序列和载体以实现连接的足够的量存在。另外或替代地,遗传生物标记物的检测可以包括一种可用于扩增核酸或核酸混合物中包含的至少一个特定核酸序列的物质组合物,所述物质组合物包含四种不同的三磷酸核苷和针对每个不同的所扩增的特定序列的一个寡核苷酸引物,其中选择每个引物与每个特定序列的不同链基本上互补,使得从一个引物合成的延伸产物在与其补体分离时,可以用作合成另一引物的延伸产物的模板。另外或替代地,遗传生物标记物的检测可以包括一个或个核酸的样品,所述样品包含核酸中含有的特定核酸序列的多条链。样品可以包含约10-100条链、约100-1000条链或超过约1000条链。另外或替代地,遗传生物标记物的检测可以包括一种来自核酸或核酸混合物的经扩增的核酸序列,所述经扩增的核酸序列包含通过上述扩增方法产生的序列的多个拷贝。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/181134中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括用于鉴定各种类型的癌症的驱动基因、突变和/或途径的技术。例如,所鉴定的驱动基因可以用于通过鉴定在所鉴定的驱动基因上发生的突变进行诊断,或者通过靶向所鉴定的驱动基因进行治疗。在一些实施方案中,可以通过确定基因特异性背景突变率来鉴定驱动基因。在一些实施方案中,可以通过优化从单基因和跨基因建模估计的参数来确定基因特异性背景突变率的统计模型。在一个实施方案中,可以通过使用负二项回归和贝叶斯推理递归地优化基因特异性平均值和基因特异性分散来统计地确定基因特异性背景突变。跨样品具有比预期背景突变显著更多的突变的基因、突变和/或途径可以被鉴定为候选驱动基因、突变和/或途径。另外或替代地,遗传生物标记物的检测可以包括一种方法,其包括:对于来自患有相同类型癌症的不同受试者的多个样品中的每个样品,接收在样品中测量的DNA中的一组一个或多个突变,所述DNA包含多个基因;对于多个样品中的每个样品,基于在样品中测量的总突变数量确定样品突变率;对于多个突变情况中的每个突变情况,基于针对所述突变情况的在所述组的突变中鉴定的第一突变数量确定情况突变率,其中突变情况对应于取代或缺失的类型;对于所述多个基因中的每个基因,针对所述多个样品中的每个样品确定在所述样品中的基因中测量的第二沉默突变数量;使用基因中的沉默突变的情况突变率之和来确定预期沉默突变率,其中沉默突变不引起对所述基因的翻译蛋白的氨基酸序列的改变;基于基因的预期沉默突变率和多个样品的样品突变率,确定基因在多个样品中的基因特异性背景突变率的概率分布,其中确定基因的基因特异性背景突变率的概率分布包括:优化基因的基因特异性背景突变率的概率分布的一个或多个参数,以增加概率分布对第二沉默突变数量的拟合;使用基因中非沉默突变的子集的情况突变率之和来确定预期非沉默突变率;使用预期非沉默突变率和基因的基因特异性背景突变率的概率分布,确定具有至少一个非沉默突变的样品的预期数量;以及将预期数量与具有至少一个非沉默突变的样品的测量数量进行比较,以获得测量数量的似然值;以及鉴定具有高于阈值的似然值的一组基因作为候选驱动基因。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/201315中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括一种自动核酸扩增方法,其可以包括以下步骤:(a)提供至少两个液滴,其中每个液滴包含与靶核酸退火的引物;(b)平行扩增每个所述液滴中的靶核酸;(c)定量至少一个液滴中的扩增的靶核酸;以及(d)在已经获得所需量的靶核酸之后,回收至少一个液滴以用于进一步分析或处理所述至少一个液滴。另外或替代地,遗传生物标记物的检测可以包括一种自动核酸扩增方法,其可以包括以下步骤:(a)提供至少两个液滴,其中每个液滴包含靶核酸;(b)平行扩增每个所述液滴中的靶核酸;(c)定量至少一个液滴中的扩增的靶核酸;以及(d)在已经获得所需量的靶核酸之后,回收至少一个液滴以用于进一步分析或处理所述至少一个液滴。在一个实施方案中,可以在基于电润湿的装置上提供所述液滴。另外或替代地,遗传生物标记物的检测可以包括一种自动核酸扩增方法,其包括以下步骤:(a)提供基于电润湿的装置;(b)在所述基于电润湿的装置上提供至少两个液滴,其中每个液滴包含与靶核酸退火的引物;(c)平行扩增每个所述液滴中的靶核酸;(d)定量至少一个液滴中的扩增的靶核酸;以及(e)在已经获得所需量的靶核酸之后,回收至少一个液滴以用于进一步分析或处理所述至少一个液滴。另外或替代地,遗传生物标记物的检测可以包括一种自动核酸扩增方法,其包括以下步骤:(a)提供基于电润湿的装置;(b)在所述基于电润湿的装置上提供至少两个液滴,其中每个液滴包含靶核酸;(c)平行扩增每个所述液滴中的靶核酸;(d)定量至少一个液滴中的扩增的靶核酸;以及(e)在已经获得所需量的靶核酸之后,回收至少一个液滴以用于进一步分析或处理所述至少一个液滴。在一些实施方案中,所述液滴可以各自包含不同的靶核酸。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中所述液滴各自可以包含相同的靶核酸。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中所述液滴可以包含含有相同靶核酸和不同靶核酸的液滴的混合物。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中基于电润湿的装置可以包括平行电极阵列的双平面构造,以实现电润湿介导的液滴操纵。一些实施方案涉及一种方法,其中基于电润湿的装置可以包括实现电润湿介导的液滴操纵的电极的平面构造。一些实施方案涉及一种方法,其中基于电润湿的装置可以包括正方形电极,任选地其中所述电极为约5mm乘5mm。一些实施方案涉及一种方法,其中基于电润湿的装置可以包括电极,其中所述电极为正方形、三角形、矩形、圆形、梯形和/或不规则形状。一些实施方案涉及一种方法,其中基于电润湿的装置可以包括电极,其中所述电极可以包括范围从约100μιηι乘100μηι至约10cm乘10cm的电极尺寸。一些实施方案涉及一种方法,其中基于电润湿的装置可以包括相互交叉的电极。一些实施方案涉及一种方法,其中基于电润湿的装置可以包括电极,其中所述电极可以包括铟锡氧化物(″ITO″)、透明导电氧化物(″TCO″)、导电聚合物、碳纳米管(″CNT″)、石墨烯、纳米线网和/或超薄金属膜,例如ITO。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中检测区可以检测电化学和/或荧光信号。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中所述检测区可以检测液滴的电容。另一个实施方案涉及一种方法,其中所述检测区可以是固定位置。另一个实施方案涉及一种方法,其中所述检测区可以包括基于电润湿的装置内的任何位置。另一个实施方案通常涉及一种方法,其中扩增方法可以包括热启动PCR。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中所述扩增可以包括等温扩增。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中所述扩增可以包括热循环。所述热循环可以包括范围是约50℃至约98℃,例如约50℃、约60℃、约65℃、约72℃、约95℃或约98℃的温度。所述热循环可以包括范围是约1秒至约5分钟,例如约1秒、约5秒、约10秒、约20秒、约30秒、约45秒、约1分钟和/或约5分钟的时间。此外,所述热循环可以包括三个热循环步骤,并且所述三个热循环步骤可以在一分钟或更短的时间内完成。在一些实施方案中,每个液滴还可以包含检测剂。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中每个液滴可以含有相同的检测剂。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中每个液滴可以含有不同的检测剂。另一个实施方案通常涉及一种方法,其中液滴可以包括加标记的液滴子集,其中子集内的每个液滴含有用于检测靶核酸的剂;以及未标记的液滴子集,其中子集内的每个液滴不含所述用于检测靶核酸的剂。另一个实施方案通常包括一种方法,含有检测剂的子集内的每个液滴可以包含不同的检测剂。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中含有检测剂的子集内的每个液滴可以包含相同的检测剂。在一些实施方案中,核酸聚合酶可以是修饰的天然存在的A型聚合酶。另一个实施方案通常涉及一种方法,其中所述修饰的A型聚合酶可以选自亚栖热菌属、栖热袍菌属或嗜热菌热微菌属的任何物种。另一个实施方案通常涉及一种方法,其中聚合酶可以从水生栖热菌(Taq)、嗜热栖热菌(Thermus thermophilus)、嗜热栖热菌(Thermus caldophilus)或丝状栖热菌中的任一种分离。另一个实施方案通常涵盖一种方法,其中修饰的A型聚合酶可以从嗜热脂肪芽孢杆菌、嗜热链球菌、嗜热网球菌或大肠杆菌中分离。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中修饰的A型聚合酶可以是突变体7a-E507K聚合酶。另一个实施方案通常涉及一种方法,其中热稳定的聚合酶可以用于实现靶核酸的扩增。另一个实施方案通常涉及一种方法,其中热稳定的聚合酶可以选自以下:海栖热袍菌、水生栖热菌、嗜热栖热菌、黄栖热菌、丝状栖热菌、栖热菌种属17.栖热菌种Z05、嗜热栖热菌、热坚芽孢杆菌、那不勒斯栖热袍菌(Thermotoga neopolitana)和非洲栖热腔菌(Thermosipho africanus)。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中修饰的聚合酶可以用于实现靶核酸的扩增,例如其中所述修饰的聚合酶可以选自以下:G46E E678G CS5 DNA聚合酶、G46E L329A E678G CS5 DNA聚合酶、G46E L329A D640GS671F CS5 DNA聚合酶、G46E L329A D640G S671F E678G CS5 DNA聚合酶、G46E E678G CS6DNA聚合酶、Z05 DNA聚合酶、ΔZ05聚合酶、AZ05-Gold聚合酶、AZ05R聚合酶、E615G Taq DNA聚合酶、E678G TMA-25聚合酶和E678G TMA-30聚合酶。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中检测剂的检测可以在扩增循环结束时发生。在一些实施方案中,所述方法可以检测单核苷酸多态性。另一个实施方案通常涉及一种方法,其中所述方法可以用于扩增子的产生。在一些实施方案中,所述方法可以用于解链曲线分析。在一些实施方案中,所述方法可以用于靶核酸富集。在一些实施方案中,所述方法可以用于引物延伸靶标富集(″PETE″)。在一些实施方案中,所述方法可以用于文库扩增。在一些实施方案中,所述方法可以用于在文库制备期间定量衔接子连接的靶核酸分子的数量。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中衔接子连接的靶核酸分子的数量的所述定量可以在(a)衔接子连接之后进行,以确定转化为衔接子连接的分子的输入材料的量(转化率)和/或用于文库扩增的模板的数量;(b)在文库扩增之后进行,以确定是否已产生足够量的每个文库和/或确保为靶捕获或簇扩增而汇集的索引文库的相同表示;和/或(c)在簇扩增之前进行,以确认将个体文库或样品池稀释至NGS流通池上样的最佳浓度。另外,衔接子连接的靶核酸分子的数量的所述定量可以在连接后清理步骤之后(在文库扩增之前)进行。在一些实施方案中,在回收至少一个液滴之后,对所述至少一个液滴的所述进一步分析或处理可以包括核酸测序反应、下一代测序反应、全基因组鸟枪测序、全外显子组或靶向测序、扩增子测序、配对测序、RIP-seq/CLIP-seq、ChlP-seq、RNA-seq、转录组分析和/或甲基-seq。另外或替代地,遗传生物标记物的检测可以包括一种其中液滴可以被填充液包围的方法,例如其中所述填充液可以是油。在一些实施方案中,所述油可以包含透明油。在一些实施方案中,所述油可以包含液体聚合的硅氧烷、硅油矿物油和/或石蜡油。另一个实施方案通常涉及其中液滴可以被气体包围的方法,例如其中所述气体可以是空气。又一个实施方案通常涉及一种方法,其中所述方法可以用于避免过度扩增偏差。另一个实施方案通常涉及一种方法,其中所述方法可以用于产生突变群体的代表性样品。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中所述方法可以用于确定产生所需浓度的靶核酸所必需的扩增循环的数量。另外或替代地,遗传生物标记物的检测可以包括一种方法,其中所述方法可以通过与基于电润湿的装置进行通信的计算机来控制。一些实施方案通常涉及一种方法,其中所述方法包括主混合物。在一些实施方案中,所述主混合物可以包含聚合酶、一个或多个dNTP、MgCl2和/或一个或多个寡核苷酸引物。在一些实施方案中,所述主混合物可以包含一个或多个dNTP,其浓度包括约1mM至约100mM,例如约1mM、约10mM或约100mM;MgCl2,其浓度包括约1mM至约100mM,例如约1mM、约10mM或约100mM;和/或一个或多个寡核苷酸引物,其浓度包括约1nM至约1mM,例如约1nM、约1μM或约1mM。另外或替代地,遗传生物标记物的检测可以包括一种用于扩增靶核酸的装置,其中所述装置可以(a)包括平行电极阵列的双平面构造,以实现电润湿介导的液滴操纵;(b)包括至少一个加热元件或与至少一个加热元件接触;并且(c)包括至少一个检测区或与至少一个检测区接触。在一个实施方案中,所述加热元件可以包括感应加热元件。另一个方面通常涉及一种用于扩增靶核酸的装置,其中所述装置可以(a)包括电极的平面构造,以实现电润湿介导的液滴操纵;(b)包括至少一个加热元件或与至少一个加热元件接触;并且(c)包括至少一个检测区或与至少一个检测区接触。在一个实施方案中,所述加热元件可以包括感应加热元件。在一些实施方案中,所述电极可以具有正方形,任选地为约5mm乘5mm。在一些实施方案中,所述电极可以具有正方形、三角形、矩形、圆形、梯形和/或不规则形状。在一些实施方案中,所述电极可以包括范围从约100μιτι乘100μιτι至约10cm乘10cm的电极尺寸。在一些实施方案中,所述电极可以相互交叉。在一些实施方案中,所述电极可以包括铟锡氧化物(″ITO″)、透明导电氧化物(″TCO″)、导电聚合物、碳纳米管(″CNT″)、石墨烯、纳米线网和/或超薄金属膜,例如ITO。在一些实施方案中,所述装置可以包括体积范围为约1皮升至约5mL,例如约
Figure GDA0002675196410006081
的液滴。在一些实施方案中,所述装置可以包括在顶板与底板之间的约0.5mm的间隙。在一些实施方案中,所述装置可以包括多个入口/出口端口。在一些实施方案中,所述装置可以包括1至约400个入口/出口端口,用于装载和去除相同样品或不同样品,并且/或者所述装置还包括1至约100个入口/出口端口,用于引入和去除一种或多种填充液。在一些实施方案中,所述装置可以包括入口/出口端口,其中相邻端口之间的间隔在约5mm至约500mm的范围内。在另一个实施方案中,所述加热元件可以包括接触加热器。另一方面涉及一种实施方案,其中所述扩增包括热循环。所述热循环可以包括三个热循环步骤,并且所述三个热循环步骤可以在一分钟或更短的时间内完成。在另一个实施方案中,所述扩增可以包括等温扩增。在另一个实施方案中,所述扩增可以包括热启动PCR。在又一个实施方案中,检测区可以检测电化学信号和/或荧光信号。另一个实施方案涉及一种可以检测液滴的电容的检测区。在另一个实施方案中,所述检测区可以是固定位置。在另一个实施方案中,所述检测区可以包括基于电润湿的装置内的任何位置。在另一个实施方案中,靶核酸可以在至少三个液滴内提供在装置上。在另一个实施方案中,所述液滴可以各自包含相同的靶核酸。在又一个实施方案中,所述液滴可以包含含有相同靶核酸和不同靶核酸的液滴的混合物。在另一个实施方案中,每个液滴还可以包含检测剂。在另一个实施方案中,每个液滴可以含有相同的检测剂。在另一个实施方案中,每个液滴可以含有不同的检测剂。另外,在另一个实施方案中,液滴可以包含各自含有用于检测靶核酸的剂的加标记液滴子集,以及各自不含所述用于检测靶核酸的剂的未标记液滴子集。在另一个实施方案中,含有检测剂的子集内的每个液滴可以包含不同的检测剂。在另一个实施方案中,含有检测剂的子集内的每个液滴可以包含相同的检测剂。在另一个实施方案中,液滴的每个子集可以包含1个或多个、2个或更多个、10个或更多个、100个或更多个、1,000个或更多个或者10,000个或更多个的液滴。在一些实施方案中,所述装置可以检测单核苷酸多态性。在又一个实施方案中,所述装置可以实现扩增子的产生。在另一个实施方案中,所述装置可以实现解链曲线分析。在又一个实施方案中,所述装置可以实现靶核酸富集。在又一个实施方案中,所述装置可以实现PETE。在另一个实施方案中,所述装置可以实现文库扩增。在另一个实施方案中,所述装置可以在文库制备期间定量衔接子连接的靶核酸分子的数量。例如,所述定量可以发生在(a)衔接子连接之后进行,以确定转化为衔接子连接的分子的输入材料的量(转化率)和/或用于文库扩增的模板的数量;(b)在文库扩增之后进行,以确定是否已产生足够量的每个文库和/或确保为靶捕获或簇扩增而汇集的索引文库的相同表示;和/或(c)在簇扩增之前进行,以确认将个体文库或样品池稀释至NGS流通池上样的最佳浓度。另外,所述定量可以在连接后清理步骤之后(在文库扩增之前)进行。在又一个实施方案中,在已经获得所需量的靶核酸之后,可以在所述液滴的进一步分析或处理之前从所述装置回收至少一个液滴。例如,对所述至少一个液滴的所述进一步分析或处理可以包括核酸测序反应、下一代测序反应、全基因组鸟枪测序、全外显子组或靶向测序、扩增子测序、配对测序、RIP-seq/CLIP-seq、ChlP-seq、RNA-seq、转录组分析和/或甲基-seq。另外或替代地,遗传生物标记物的检测可以包括一种用于靶核酸的自动扩增的系统,其可以包括:(a)基于电润湿的装置;(a)至少一个加热元件,其包括基于电润湿的装置或与其接触;(a)至少一个检测区,其包括基于电润湿的装置或与其接触。在一个实施方案中,所述加热元件可以包括感应加热元件。在另一个实施方案中,所述加热元件可以包括接触加热器。另一方面涉及一种实施方案,其中所述扩增包括热循环。所述热循环可以包括三个热循环步骤,并且所述三个热循环步骤可以在一分钟或更短的时间内完成。在另一个实施方案中,所述扩增可以包括等温扩增。在另一个实施方案中,所述扩增可以包括热启动PCR。在又一个实施方案中,检测区可以检测电化学信号和/或荧光信号。另一个实施方案涉及一种可以检测液滴的电容的检测区。在另一个实施方案中,所述检测区可以是固定位置。在另一个实施方案中,所述检测区域可以包括系统内的任何位置。在另一个实施方案中,靶核酸可以在至少三个液滴内提供在系统上。在另一个实施方案中,所述液滴可以各自包含相同的靶核酸。在又一个实施方案中,所述液滴可以包含含有相同靶核酸和不同靶核酸的液滴的混合物。在另一个实施方案中,每个液滴还可以包含检测剂。在另一个实施方案中,每个液滴可以含有相同的检测剂。在另一个实施方案中,每个液滴可以含有不同的检测剂。另外,在另一个实施方案中,液滴可以包含各自含有用于检测靶核酸的剂的加标记液滴子集,以及各自不含所述用于检测靶核酸的剂的未标记液滴子集。在另一个实施方案中,含有检测剂的子集内的每个液滴可以包含不同的检测剂。在另一个实施方案中,含有检测剂的子集内的每个液滴可以包含相同的检测剂。在另一个实施方案中,液滴的每个子集可以包含1个或多个、2个或更多个、10个或更多个、100个或更多个、1,000个或更多个或者10,000个或更多个的液滴。另外或替代地,遗传生物标记物的检测可以包括一种自动扩增方法,其可以包括:(a)提供基于电润湿的装置,其具有平行电极阵列的双平面构造,以实现电润湿介导的液滴操纵,并且另外其中,所述装置含有至少一个感应加热元件及至少一检测区;(b)在所述装置上提供包含靶核酸的液滴,其中所述液滴包括含有用于靶核酸检测的剂的液滴子集和不含用于靶核酸检测的剂的液滴子集;(c)平行扩增每个所述液滴中的靶核酸;(d)通过检测所述剂来定量所述含有所述剂的液滴子集中的扩增的靶核酸;以及(e)在所述含有剂的液滴子集中已经获得所需量的所述靶核酸之后,从所述不含剂的液滴子集中回收至少一个液滴用于进一步分析或处理。
在一些实施方案中,遗传生物标记物(例如,一个或多个遗传生物标记物)的检测可以包括P.C.T.公布号WO 2017/123316中描述的各种方法中的任一种,所述公布特此以引用的方式并入。例如,遗传生物标记物的检测可以包括靶向测序工作流,其中提供包含足够数量的基因组材料的输入样品,使得在测序之前需要最少或不需要扩增过程。在一些实施方案中,输入样品来源于完整肿瘤或淋巴结。在一些实施方案中,输入样品通过从患者或哺乳动物受试者获得的完整肿瘤样品(全部或部分)和/或一个或多个淋巴结的均质化获得。在一些实施方案中,输入样品来源于足够数量的血液,包括全血或其任何级分。在一些实施方案中,输入样品来源于癌性组织。在一些实施方案中,输入样品来源于癌前组织。在一些实施方案中,靶向测序工作流在测序之前包括一个或多个扩增步骤(例如,捕获前扩增步骤,捕获后扩增步骤),其中测序之前的每个扩增步骤包括0至3个扩增循环,并且其中测序之前的扩增循环的总数不超过4。在其他实施方案中,靶向测序工作流在测序之前包括一个或多个扩增步骤(例如,捕获前扩增步骤,捕获后扩增步骤),其中测序之前的每个扩增步骤包括0至2个扩增循环,并且其中测序之前的扩增循环的总数不超过3。在又其他实施方案中,靶向测序工作流在测序之前包括一个扩增步骤(例如,捕获前扩增步骤或捕获后扩增步骤),其中测序之前的单个扩增步骤包括0至3个扩增循环。在另外的实施方案中,靶向测序工作流在测序之前包括一个扩增步骤,其中测序之前的单个扩增步骤包括1至3个循环。在又另外的实施方案中,靶向测序工作流在测序之前包括一个扩增步骤,其中测序之前的单个扩增步骤包括1个循环。在再另外的实施方案中,靶向测序工作流在测序之前包括一个扩增步骤,其中测序之前的单个扩增步骤包括2个循环。在一些实施方案中,捕获前扩增步骤或捕获后但在测序之前的扩增步骤中的一个或两个都利用LM-PCR。另外或替代地,遗传生物标记物的检测可以包括一种对样品内的基因组材料进行测序的方法,其包括:对肿瘤样品和/或淋巴结样品均质化以提供均质化的样品;从均质化的样品中分离至少0.5微克的基因组材料;将所述至少0.5微克的分离的基因组材料准备用于测序;以及对准备的基因组材料进行测序。在一些实施方案中,所述方法在测序之前不包括任何扩增步骤。在一些实施方案中,所述方法包括至少一个捕获前或捕获后扩增步骤,其中在至少一个捕获前或捕获后扩增步骤期间进行的扩增循环的总数为至多4个循环。在一些实施方案中,扩增循环的总数为3。在一些实施方案中,扩增循环的总数为2。在一些实施方案中,将所述至少0.5微克的分离的基因组材料准备用于测序包括将所述至少0.5微克的分离的基因组材料与捕获探针杂交并且捕获杂交的基因组材料。在一些实施方案中,捕获的基因组材料的量的范围是约90ng至约900ng。在一些实施方案中,对捕获的基因组材料进行1或2个扩增循环。在一些实施方案中,均质化的样品包括细胞的代表性采样。在一些实施方案中,从均质化的样品中分离至少1微克的基因组材料。在一些实施方案中,从均质化的样品中分离至少5微克的基因组材料。在一些实施方案中,从均质化的样品中分离至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种对样品内的DNA进行测序的方法,其包括从血液样品中分离至少0.5微克的DNA;将所述至少0.5微克的分离的DNA准备用于测序,以及对准备的DNA进行测序。在一些实施方案中,所述方法在测序之前包括0个扩增步骤。在一些实施方案中,将所述至少0.5微克的分离的DNA准备用于测序包括将所述至少0.5微克的分离的基因组材料与捕获探针杂交并且捕获杂交的基因组材料。在一些实施方案中,捕获的基因组材料的量的范围是约90ng至约900ng。在一些实施方案中,对捕获的基因组材料进行1或2个扩增循环。在一些实施方案中,从血液样品中分离至少1微克的DNA。另外或替代地,遗传生物标记物的检测可以包括一种靶向代表性测序的方法,其包括:(i)对肿瘤的至少一部分、一个或多个完整或部分淋巴结或其任何组合均质化以提供均质化的样品;(ii)从均质化的样品中提取基因组材料;(iii)将提取的基因组材料捕获到珠粒上;以及(iv)对捕获的基因组材料进行测序;其中靶向代表性测序包括在对捕获的基因组材料进行测序之前进行至多4个扩增循环。在一些实施方案中,可以在捕获提取的基因组材料之前或在捕获提取的基因组材料之后或其任何组合进行至多3个扩增循环。在一些实施方案中,不进行捕获前扩增循环。在一些实施方案中,捕获的基因组材料的量的范围是约90ng至约900ng。在一些实施方案中,在捕获提取的基因组材料之后但在测序之前进行1至3个扩增循环。在一些实施方案中,从均质化的样品中提取至少0.5微克的基因组材料。在一些实施方案中,与在需要多于4个扩增循环的测序方法中所用的输入材料的量相比,从均质化的样品中获得至少100倍之多的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种对样品内的DNA进行测序的方法,其包括:提供至少0.5微克的输入基因组材料,所述至少0.5微克的基因组材料来源于肿瘤样品、淋巴结样品或血液样品;从所述输入基因组样品中分离DNA;将分离的DNA准备用于测序;以及对准备的DNA进行测序,其中所述方法不包括任何扩增步骤。在一些实施方案中,所述至少0.5微克的输入基因组材料来源于多个组织学和/或活检标本。在一些实施方案中,所述至少0.5微克的输入基因组材料来源于均质化的肿瘤样品。在一些实施方案中,所述至少0.5微克的输入基因组材料来源于均质化的淋巴结样品。在一些实施方案中,所述至少0.5微克的输入基因组材料是其所来源于的肿瘤样品、淋巴结样品或血液样品的代表性采样。在一些实施方案中,使用下一代测序方法进行测序。在一些实施方案中,使用合成测序方法进行测序。另外或替代地,遗传生物标记物的检测可以包括一种减少测序期间的PCR引入的突变的方法,其包括从包含足够量的基因组材料的样品中分离DNA;将分离的DNA准备用于测序;以及对准备的DNA进行测序,其中所述方法在测序之前包括至多3个扩增循环。在一些实施方案中,所述方法在测序之前包括1或2个扩增循环。在一些实施方案中,足够量的输入基因组材料是使得不使用捕获前扩增循环的量。在一些实施方案中,所述样品来源于被怀疑患有癌症的患者。在一些实施方案中,所述样品来源于被诊断患有癌症的患者。在一些实施方案中,所述样品来源于具有发展癌症的风险的患者。在一些实施方案中,所述样品来源于健康组织样品。在一些实施方案中,从所述样品中分离0.5微克的DNA。在一些实施方案中,从所述样品中分离至少1微克的基因组材料。在一些实施方案中,从所述样品中分离至少5微克的基因组材料。在一些实施方案中,从所述样品中分离至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种其中减少PCR引入的突变的测序方法,所述测序方法包括捕获至少0.05微克的基因组材料,以及在测序之前进行0至2个扩增循环。在一些实施方案中,进行0个扩增循环。在其他实施方案中,进行1个扩增循环。在又其他实施方案中,进行2个扩增循环。另外或替代地,遗传生物标记物的检测可以包括一种其中减少基因组含量的比例表示中PCR引入的偏差的序列捕获方法,所述测序方法包括提供包含至少0.5微克基因组材料的输入样品,并且其中所述序列捕获方法包括在测序之前进行0与2个之间的扩增循环。在一些实施方案中,进行0个扩增循环。在其他实施方案中,进行1个扩增循环。在又其他实施方案中,进行2个扩增循环。在一些实施方案中,输入样品包含至少1微克的基因组材料。在一些实施方案中,输入样品包含至少5微克的基因组材料。在一些实施方案中,输入样品包含至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种其中消除PCR引入的突变的序列捕获方法,所述序列捕获方法包括制备包含至少0.5微克基因组材料的输入样品。在一些实施方案中,输入样品包含至少1微克的基因组材料。在一些实施方案中,输入样品包含至少5微克的基因组材料。在一些实施方案中,输入样品包含至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种消除在测序之前去除PCR重复读长的步骤的序列捕获方法,所述序列捕获方法包括提供包含至少0.5微克基因组材料的输入样品。在一些实施方案中,输入样品包含至少1微克的基因组材料。在一些实施方案中,输入样品包含至少5微克的基因组材料。在一些实施方案中,输入样品包含至少10微克的基因组材料。另外或替代地,遗传生物标记物的检测可以包括一种其中实际上消除PCR引入的突变的测序方法,所述测序方法包括捕获至少0.05微克的基因组材料。在一些实施方案中,在捕获基因组材料之后提供约0.05微克的基因组材料。在一些实施方案中,在测序之前进行1或2个捕获后扩增循环。
可以使用本文所述的各种技术中的任一种检测的遗传生物标记物的实例包括但不限于ABCA7、ABL1、ABL2、ACVR1B、ACVR2A、AJUBA、AKT1、AKT2、ALB、ALDOB、ALK、AMBRA1、AMER1、AMOT、ANKRD46、APC、AR、ARHGAP35、ARHGEF12、ARID1A、ARID1B、ARID2、ARID4B、ARL15、ARMCX1、ASXL1、ASXL2、ATAD2、ATF1、ATG14、ATG5、ATM、ATRX、ATXN2、AXIN1、B2M、BAP1、BCL11A、BCL11B、BCL2、BCL3、BCL6、BCL9、BCLAF1、BCOR、BCR、BIRC6、BIRC8、BLM、BLVRA、BMPR1A、BRAF、BRCA1、BRCA2、BRD7、BRE、BRWD3、BTBD7、BTRC、C11orf70、C12orf57、C2CD5、C3orf62、C8orf34、CAMKV、CAPG、CARD11、CARS、CASP8、CBFA2T3、CBFB、CBLC、CBX4、CCAR1、CCDC117、CCDC88A、CCM2、CCNC、CCND1、CCND2、CCND3、CCR3、CD1D、CD79B、CDC73、CDCP1、CDH1、CDH11、CDK12、CDK4、CDK6、CDKN1A、CDKN1B、CDKN2A、CDX2、CEBPA、CELF1、CENPB、CEP128、CHD2、CHD4、CHD8、CHEK2、CHRDL1、CHUK、CIC、CLEC4C、CMTR2、CNN2、CNOT1、CNOT4、COL11A1、COPS4、COX7B2、CREB1、CREBBP、CSDE1、CSMD3、CTCF、CTDNEP1、CTNNB1、CUL1、CUL2、CYB5B、CYLD、DACH1、DCHS1、DCUN1D1、DDB2、DDIT3、DDX3X、DDX5、DDX6、DEK、DHX15、DHX16、DICER1、DIRC2、DIS3、DIXDC1、DKK2、DNAJB5、DNER、DNM1L、DNMT3A、EED、EGFR、EIF1AX、EIF2AK3、EIF2S2、EIF4A1、EIF4A2、ELF3、ELK4、EMG1、EMR3、EP300、EPB41L4A、EPHA2、EPS8、ERBB2、ERBB3、ERRFI1、ETV4、ETV6、EVI1、EWSR1、EXO5、EXT1、EXT2、EZH2、F5、FANCM、FAT1、FBN2、FBXW7、FCER1G、FEV、FGF2、FGFR1、FGFR1OP、FGFR2、FGFR3、FH、FLT3、FN1、FOXA1、FOXP1、FUBP1、FUS、GALNTL5、GATA3、GGCT、GIGYF2、GK2、GLIPR2、GNAS、GNPTAB、GNRHR、GOLGA5、GOLM1、GOPC、GOT2、GPC3、GPS2、GPX7、GRK1、GSE1、GZMA、HDAC1、HERC1、HERC4、HGF、HIST1H2BO、HLA-A、HLA-B、HMCN1、HMGA1、HMGA2、HNRNPA1、HRAS、HSP90AB1、ID3、IDH1、IDH2、IFNGR2、IFT88、IKZF2、IL2、INO80C、INPP4A、INPPL1、IRF4、IWS1、JAK1、JAK2、JUN、KANSL1、KAT8、KATNAL1、KBTBD7、KCNMB4、KDM5C、KDM6A、KEAP1、KIAA1467、KIT、KLF4、KMT2A、KMT2B、KMT2C、KMT2D、KMT2E、KRAS、KRT15、LAMTOR1、LARP4B、LCK、LMO2、LPAR2、LYN、MAF、MAFB、MAML2、MAP2K1、MAP2K2、MAP2K4、MAP3K1、MAP4K3、MAPK1、MAX、MB21D2、MBD1、MBD6、MBNL1、MBNL3、MDM2、MDM4、MED12、MED23、MEN1、MET、MGA、MITF、MKLN1、MLH1、MLL、MLLT4、MOAP1、MORC4、MPL、MS4A1、MSH2、MSI1、MTOR、MYB、MYC、MYCL1、MYCN、MYD88、MYL6、MYO1B、MYO6、NAA15、NAA25、NAP1L2、NAP1L4、NCOA2、NCOA4、NCOR1、NEK9、NF1、NF2、NFE2L2、NFE2L3、NFKB2、NIPBL、NIT1、NKX3-1、NME4、NOTCH1、NOTCH2、NPM1、NR4A3、NRAS、NSD1、NTRK1、NUP214、NUP98、PALB2、PAX8、PBRM1、PCBP1、PCOLCE2、PDGFB、PHF6、PIK3CA、PIK3CB、PIK3R1、PIM1、PLAG1、PML、POLA2、POT1、PPARD、PPARG、PPM1D、PPP2R1A、PPP6C、PRKACA、PRKCI、PRPF40A、PSIP1、PTEN、PTH2、PTMS、PTN、PTPN11、RAB18、RAC1、RAF1、RANBP3L、RAPGEF6、RASA1、RB1、RBBP6、RBM10、RBM26、RC3H2、REL、RERE、RET、RFC4、RHEB、RHOA、RIMS2、RIT1、RNF111、RNF43、ROS1、RPL11、RPL5、RQCD1、RRAS2、RUNX1、RXRA、SARM1、SCAF11、SDHB、SDHD、SEC22A、SENP3、SENP8、SETD1B、SETD2、SF3A3、SF3B1、SFPQ、SIN3A、SKAP2、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SMARCC2、SMO、SNCB、SOCS1、SOS1、SOX4、SOX9、SP3、SPEN、SPOP、SPSB2、SS18、STAG2、STK11、STK31、SUFU、SUFU、SUZ12、SYK、TAF1A、TARDBP、TAS2R30、TBL1XR1、TBX3、TCF12、TCF3、TCF7L2、TCL1A、TET2、TEX11、TFDP2、TFG、TGFBR2、THRAP3、TLX1、TM9SF1、TMCO2、TMED10、TMEM107、TMEM30A、TMPO、TNFAIP3、TNFRSF9、TNRC6B、TP53、TP53BP1、TPR、TRAF3、TRIM8、TRIP12、TSC1、TSC2、TTK、TTR、TUBA3C、U2AF1、UBE2D3、UBR5、UNC13C、UNKL、UPP1、USO1、USP28、USP6、USP9X、VHL、VN1R2、VPS33B、WAC、WDR33、WDR47、WRN、WT1、WWP1、XPO1、YOD1、ZC3H13、ZDHHC4、ZFHX3、ZFP36L1、ZFP36L2、ZGRF1、ZMYM3、ZMYM4、ZNF234、ZNF268、ZNF292、ZNF318、ZNF345、ZNF600、ZNF750和/或ZNF800。
如本文所用,“TP53”是指基因和/或由所述基因编码的蛋白,其是参与细胞增殖调节的肿瘤抑制蛋白p53。TP53基因在预防癌症形成中起关键作用。TP53基因编码结合DNA并调节基因表达以防止基因组突变的蛋白质。人TP53序列是本领域已知的(例如,GenBank登录号NM_001276761、NM_000546、NM_001126112、NM_001126113,和NM_001126114)。本领域普通技术人员可以鉴定额外的TP53序列及其变体。
如本文所用,“PIK3CA”是指基因和/或由所述基因编码的蛋白质,其是磷酸肌醇-3激酶(PI3K)的催化亚基,同工型α,还被称为p110α。已经发现PIK3CA是致癌的,并且已经与多种癌症有关。人PIK3CA序列是本领域已知的(例如,GenBank登录号NM_006218)。本领域普通技术人员可以鉴定额外的PIK3CA序列及其变体。
如本文所用,术语“FGFR3”是指基因和/或由所述基因编码的蛋白质,其是成纤维细胞生长因子受体3(FGFR3),属于由四个不同的基因编码的结构相关的酪氨酸激酶受体(FGFR 1-4)的家族。蛋白质的细胞外部分与成纤维细胞生长因子相互作用,使下游信号级联启动,这最终影响细胞的有丝分裂和分化。人FGFR3序列是本领域已知的(例如,GenBank登录号NM_000142、NM_001163213、NM_022965、NM_001354809和NM_001354810)。本领域普通技术人员可以鉴定额外的FGFR3序列及其变体。
如本文所用,术语“KRAS”是指被称为K-ras或Ki-ras的基因和/或由所述基因编码的蛋白质,其是原癌基因,对应于首先在Kirsten大鼠肉瘤病毒中鉴定的癌基因,并且基因产物首先作为p21 GTP酶被发现。人KRAS序列是本领域已知的(例如,GenBank登录号NM_004985和NM_033360)。本领域普通技术人员可以鉴定额外的KRAS序列及其变体。
如本文所用,术语“ErbB2”是指基因和/或由所述基因编码的蛋白质,其还被称为v-erb-b2禽类红细胞白血病病毒癌基因同源物2、c-erbB2/neu、her2/neu或Her2。ErbB2是酪氨酸激酶的表皮生长因子受体家族的成员。它在包括乳腺癌和卵巢癌在内的若干癌症中扩增和/或过表达。人ErbB2序列是本领域已知的(例如,GenBank登录号NM_001005862、NM_001289936、NM_001289937、NM_001289938和NM_004448)。本领域普通技术人员可以鉴定额外的ErbB2序列及其变体。
如本文所用,“CDKN2A”是指基因和/或由所述基因编码的蛋白质,其被称为细胞周期蛋白依赖性激酶抑制剂2A,通过调节细胞周期来充当肿瘤抑制剂。人CDKN2A序列是本领域已知的(例如,GenBank登录号NM_000077、NM_001195132、NM_058195、NM_058196和NM_058197)。本领域普通技术人员可以鉴定额外的CDKN2A序列及其变体。
如本文所用,术语“MLL”是指基因和/或由所述基因编码的蛋白质,其为淋巴样或混合谱系白血病2。MLL是主要的哺乳动物组蛋白H3赖氨酸4(H3K4)单甲基转移酶。MLL蛋白与谱系确定转录因子共定位在转录增强子上,并且对于细胞分化和胚胎发育是关键的。MLL在调节细胞命运转变、代谢和肿瘤抑制中也起关键作用。MLL中的突变与歌舞伎综合症(Kabuki Syndrome)、先天性心脏病和各种形式的癌症相关联。人MLL序列是本领域已知的(例如,GenBank登录号NM_003482)。本领域普通技术人员可以鉴定额外的MLL序列及其变体。
如本文所用,术语“HRAS”是指基因和/或由所述基因编码的蛋白质,其是harvey大鼠肉瘤病毒癌基因同源物,是活化MAP激酶途径的小G蛋白。HRAS响应于生长因子刺激参与调节细胞分裂。HRAS已被证明是原癌基因。突变后,原癌基因有可能致使正常细胞发生癌变。人HRAS序列是本领域已知的(例如,GenBank登录号NM_001130442、NM_005343、NM_176795和NM_001318054)。本领域普通技术人员可以鉴定额外的HRAS序列及其变体。
如本文所用,术语“MET”是指基因和/或由所述基因编码的蛋白质。MET基因编码c-Met,其还被称为酪氨酸蛋白激酶Met或肝细胞生长因子受体(HGFR)。MET是对胚胎发育、器官发生和伤口愈合而言重要的单次酪氨酸激酶受体。肝细胞生长因子/分散因子(HGF/SF)及其剪接同工型(NK1,NK2)是MET受体的唯一已知配体。MET通常由上皮来源的细胞表达,而HGF/SF的表达仅限于间充质来源的细胞。当HGF/SF结合其同源受体MET时,它通过尚未完全了解的机制导致其活化而诱导其二聚化。人MET序列是本领域已知的(例如,GenBank登录号NM_000245、NM_001127500、NM_001324401和NM_001324402)。本领域普通技术人员可以鉴定额外的MET序列及其变体。
如本文所用,术语“VHL”是指基因和/或由所述基因编码的蛋白质。VHL基因是VonHippel Lindau肿瘤抑制基因。VHL基因的生殖系突变是Von Hippel-Lindau综合征的家族遗传的基础,所述Von Hippel-Lindau综合征是一种显性遗传的遗传性癌症综合征,易患眼、脑、脊髓、肾脏、胰腺和肾上腺的各种恶性和良性肿瘤。人VHL序列是本领域已知的(例如,GenBank登录号NM_000551、NM_198156和NM_001354723)。本领域普通技术人员可以鉴定额外的VHL序列及其变体。
遗传突变评分
本公开提供了至少部分基于一个或多个遗传生物标记物的存在以高敏感性和特异性鉴定受试者中癌症的存在的方法。本文提供了确定受试者是否患有癌症和/或受试者患有癌症的可能性的各种方法。在一些实施方案中,这些方法涉及各种类型的统计技术和方法,其包括例如评分方法、回归分析、聚类分析、主成分分析、最近邻分类器分析(例如,k最近邻算法)、线性判别分析、神经网络和支持向量机等。
在一些实施方案中,可以使用一个或多个遗传生物标记物来产生得分。得分可以指示受试者患有癌症或不患有癌症的可能性。在一些实施方案中,可能性通过将一个或多个遗传生物标记物中每个突变的突变等位基因频率与突变等位基因频率的参考分布进行比较来产生。如本文所述,可以通过一组引物扩增包含一个或多个生物标记物的基因组片段。所述组的引物可以具有一对或多对引物,其扩增一个或多个非重叠基因组片段。同一组引物可以用于在一个或多个孔(例如,等于或大于1、2、3、4、5、6、7、8、9、10、11、12、20或30个孔)中扩增从受试者收集的模板DNA,因此扩增过程可以为在多个孔中可检测的突变体(例如,罕见突变)提供重复信号。在一些实施方案中,可以在测序之前对PCR产物进行一轮或多轮额外扩增。在一些实施方案中,然后可以例如基于作为分子条形码掺入的唯一标识符序列(UID)将来自共同模板分子的读长分组。在一些实施方案中,通过要求每个UID家族中例如大于80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的读长中存在突变,可以减少在样品制备或测序步骤期间引入的人为突变。在一些实施方案中,通过要求具有相同UID和样品索引的读长在位于同一图块上时至少相隔1000、2000、3000、4000、5000、6000、7000、8000或9000个像素来消除光学复制引起的冗佘读长。
在一些实施方案中,考虑满足以下两个标准中的一个或两个的突变:(i)存在于癌症体细胞突变目录(COSMIC)数据库中,或(ii)预测在肿瘤抑制基因中失活(无义突变、框外插入或缺失、典型剪接位点突变)。在一些实施方案中,排除同义突变(外显子末端的那些除外)和内含子突变(剪接位点的那些除外)。这些所选的突变称为超突变体。因此,在一些实施方案中,超突变体包括例如在癌症体细胞突变目录(COSMIC)数据库中存在的突变、预测在肿瘤抑制基因中失活的突变(无义突变、框外插入或缺失、典型剪接位点突变)、非同义突变、可影响剪接的突变和/或可影响表达的突变等。
因此,如本文所用,术语样品(例如,孔、测试样品)中的“突变体等位基因频率”或“MAF”是指样品中具有这种突变的UID的比例。MAF反映每个样品(例如,每个孔)中的突变体分数,并代表所关注样品中突变体等位基因频率的独立采样。在一些实施方案中,可以通过样品(例如,从受试者收集的样品)的所有孔中存在的突变体的总数除以UID的总数来计算样品(而不是孔)中突变的MAF。
在一些实施方案中,执行MAF归一化。在一些实施方案中,在至少一个孔中不具有至少一个超突变体的所有突变被排除在分析之外。例如,突变体等位基因频率(MAF)可以反映所述样品中每个孔中超突变体的总数与所述样品中同一孔中UID的总数之间的比率。在一些实施方案中,将MAF首先基于在包括训练组中的正常血浆的一组正常对照中观察到的每个突变的MAF进行归一化。在一些实施方案中,排除具有<100个UID的突变。归一化可以通过标准归一化(即减去平均值并除以标准偏差)或将MAF乘以预定比率来执行。在一些实施方案中,归一化通过首先计算在正常对照中发现的每个突变i=1、...、n的平均MAF(ave_i)来执行。使用这些平均值产生的分布的第25个百分位数作为参考值(ave_ref),可以将每个MAF乘以比率ave_ref/ave_i进行归一化。例如,如果在一组对照中观察到的突变的平均MAF比ave_ref高10倍,则所述突变的每个MAF可以乘以1/10。
样品的遗传生物标记物状态的分类可通过以下方法从例如统计学测试获得:将所选的遗传生物标记物中一个或多个突变的MAF与一组对照样品中突变的突变等位基因频率的参考分布进行比较,通过将所选的遗传生物标记物中一个或多个突变的突变等位基因频率与对照样品中突变等位基因频率的第一参考分布和从患有癌症的受试者收集的样品中突变等位基因频率的第二参考分布进行比较,或通过将所选的遗传生物标记物中一个或多个突变的突变等位基因频率与对照样品中突变的最大突变等位基因频率进行比较。
突变的对照参考分布和最大突变等位基因频率可以从对照样品中确定。在一些实施方案中,所述对照样品组具有至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200个或更多个对照受试者。在一些实施方案中,对照受试者是健康受试者,或至少不患有癌症,或不怀疑患有癌症。可以对从这些对照受试者收集的对照样品进行扩增和测序。可以确定一个或多个所选的遗传生物标记物中的突变。因此,可以确定一个受试者中特定突变的MAF,并且可以从对照受试者组中确定对照样品中MAF的分布。类似地,也可以在对照样品中确定突变的最大突变等位基因频率。
在一些实施方案中,可以将所选的遗传生物标记物中一个或多个突变的MAF与参考分布进行比较,从而获得指示受试者患有癌症的可能性或概率的得分。在一些实施方案中,如果得分(例如,可能性或概率)等于或大于参考阈值,则可以确定受试者可能患有癌症,否则,可以确定受试者不太可能患有癌症。在一些实施方案中,比较可以提供指示受试者没有癌症的可能性或概率的得分。在一些实施方案中,如果得分(例如,可能性或概率)等于或小于参考阈值,由此可以确定受试者可能患有癌症,否则,可以确定受试者不太可能患有癌症。
在一些实施方案中,将MAF首先基于在一组正常对照中针对每个突变观察到的MAF进行归一化。在此突变特异性归一化之后,将每个孔中每个突变的MAF与由包括所有突变在内的正常对照构建的MAF的参考分布进行比较,并由此分布计算p值。在一些实施方案中,在给定样品中检测到的所有突变中最低的p值被认为是“最高突变”。样品的ctDNA状态的分类基于此最高突变的p值是低于还是高于给定阈值。阈值可以基于在独立的正常对照组中观察到的所需特异性来选择。
在一些实施方案中,Stouffer Z得分用于将来自两个或更多个独立测试的假设测试结果(例如,来自2、3、4、5、6、7、8、9、10、11或12个孔的测试结果)组合起来。例如,两个或更多个突变的MAF结果可以组合成单个测试。在一些实施方案中,当Stouffer Z得分大于参考阈值时,样品被评分为阳性。在一些实施方案中,如果Stouffer Z得分与对照中前几个(例如,2、3、4、5、6、7、8、9或10个)最高Stouffer Z得分的平均值的比率大于参考阈值,则样品被评分为阳性。
在一些实施方案中,将所选的遗传生物标记物中一个或多个突变的MAF与对照样品中突变的最大突变等位基因频率进行比较。如果一个或多个突变(例如,等于或至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200个)的MAF大于对照样品中突变的最大突变等位基因频率,则可以确定受试者患有癌症。在一些实施方案中,可以从比较中获得得分。在一些实施方案中,得分是MAF大于对照样品中突变的最大突变等位基因频率的突变的总数。如果得分大于参考阈值,则可以确定受试者可能患有癌症。在一些实施方案中,计算所选的遗传生物标记物中一个或多个突变的平均MAF。
在一些实施方案中,可以将所选的遗传生物标记物中一个或多个突变的MAF与对照样品中突变等位基因频率的第一参考分布和从患有癌症的受试者收集的样品中突变等位基因频率的第二参考分布进行比较。在一些实施方案中,通过将所关注样品的突变频率分别与训练组中的正常样品和癌症样品的突变频率的分布进行比较来获得得分。
在一些实施方案中,每个突变的UID范围分为10个区间(例如,<1,000、1,000-2,000、...、8,000-9,000、>9,000)。根据UID的数量,可以将每个孔中每个突变的MAF与由对应的UID范围内的样品构建的MAF的两个参考分布进行比较:1)由训练组中所有正常对照样品构建的分布;2)由训练组中癌症患者的样品构建的分布。在一些实施方案中,癌症训练组仅包括那些在样品(例如,血浆)和对应的原发性肿瘤(其在肿瘤中的MAF>5%)中存在相同突变的那些。可以获得对应的p值,pN和pC。正常样品和癌症样品二者的参考分布可以在每一轮和每个10倍交叉验证的迭代(即每次迭代中90%的样品用于训练,而10%的样品用于测试)中独立于训练组来构建。
对于每个突变,可以获得Ω得分。然后可以计算这两个p值的对数比pC/pN。在一些实施方案中,可以消除重复孔中的这些对数比的最小值和最大值,使得结果对离群值不那么敏感。在一些实施方案中,使用“对数似然比”。与对数似然比相比,p值的对数比可以提供一些额外的优点,因为相对较低数量的可用数据点不能对MAF分布的密度(尤其是pC)进行可靠的估计。因此,在一些实施方案中,然后根据下式确定“Ω”得分:
Figure GDA0002675196410006251
其中wi是孔i中UID的数量除以包括在分析中的孔中所述突变的UID的总数。在一些实施方案中,包括在分析中的孔的总数为1、2、3、4、5、6、7、8、9、10、11、12、20、30个或更多个。在一些实施方案中,可以将具有最大对数比和最小对数比的孔从分析中排除。在一些实施方案中,被包括用于分析的孔的总数是1,因此,反而可以通过下式获得Ω得分:
Figure GDA0002675196410006252
可以对p值的对数比进行加权,使得包含更多模板分子的那些孔对最终统计(Ω得分)的影响更大。进行这种加权的基本原理是,孔中模板分子的数量越大,结果的置信度就越高。
在一些实施方案中,可以确定每个突变的Ω得分。在一些实施方案中,选择Ω得分大于参考得分(例如1、2、3、4、5、6、7、8、9或10)的突变。Ω得分大于参考得分的突变的总数反映受试者的突变负担。在一些实施方案中,如果Ω得分大于参考得分的突变的总数大于参考阈值,则确定受试者可能患有癌症;否则,可以确定受试者不太可能患有癌症。
在一些实施方案中,具有最大Ω得分的突变被认为是“最高突变”。最高突变的Ω得分可用于确定受试者是否可能患有癌症。例如,可以将最高突变的Ω得分与参考阈值进行比较,或者以各种方法(例如,回归分析)将其与一些其他信息(例如,蛋白质生物标记物)组合,以确定受试者患有癌症的可能性。在一些实施方案中,如果最高突变的Ω得分大于参考阈值,则确定受试者可能患有癌症;否则,可以确定受试者不太可能患有癌症。在一些实施方案中,Ω得分用于回归分析(例如,逻辑回归)。
检测蛋白质生物标记物
在一些实施方案中,可以在从受试者(例如,人受试者)分离或获得的各种生物样品中的任一种中检测蛋白质生物标记物的存在,所述各种生物样品包括但不限于血液、血浆、血清、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。当获得正常健康人受试者不高于其但患有癌症的人受试者高于其的阈值时,可以检测本领域已知的任何蛋白质生物标记物。
如本文所述,可以使用任何适当的方法来检测一个或多个蛋白质生物标记物的水平。在一些实施方案中,将一个或多个蛋白质生物标记物的水平与预定阈值进行比较。在一些实施方案中,预定阈值是一般阈值或全局阈值。在其他情况下,预定阈值是与特定蛋白质生物标记物相关的阈值。在一些实施方案中,将一个或多个蛋白质生物标记物的水平与参考蛋白质生物标记物的绝对量进行比较。在一些实施方案中,一个或多个蛋白质生物标记物的水平是相对于参考蛋白质生物标记物的量的。在一些实施方案中,一个或多个蛋白质生物标记物的水平是升高水平。在一些实施方案中,一个或多个蛋白质生物标记物的水平高于预定阈值。在其他情况下,一个或多个蛋白质生物标记物的水平在预定阈值范围内。在一些实施方案中,一个或多个蛋白质生物标记物的水平为或接近预定阈值。在一些实施方案中,一个或多个蛋白质生物标记物的水平低于预定阈值。在一些实施方案中,来自生物样品的一个或多个蛋白质生物标记物的水平低于特定阈值。在一些实施方案中,来自生物样品的一个或多个蛋白质生物标记物的水平与预定阈值相比被降低。
在一些实施方案中,本文提供的用于选择受试者进行进一步诊断测试和/或增加监测的方法包括检测生物样品中的蛋白质生物标记物以及将生物样品中的蛋白质生物标记物的量与参考样品中的参考水平进行比较。在一些实施方案中,用于选择受试者进行进一步诊断测试和/或增加监测的方法包括检测生物样品中的蛋白质生物标记物以及将生物样品中的蛋白质生物标记物的量与参考水平进行比较,其中所述参考水平是从多个参考样品导出的复合数。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少5%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少10%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少15%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少20%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少25%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少30%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少40%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少50%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少60%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少70%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少80%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少90%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少100%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少200%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少300%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少400%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少500%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少600%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少700%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少800%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少900%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高至少1000%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约5%至约1000%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约10%至约1000%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约15%至约1000%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约20%至约1000%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约25%至约1000%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约30%至约1000%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约10%至约100%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约15%至约100%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约20%至约100%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约25%至约100%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平高约30%至约100%。
在一些实施方案中,蛋白质生物标记物比参考水平低至少5%。在一些实施方案中,蛋白质生物标记物比参考水平低至少10%。在一些实施方案中,蛋白质生物标记物比参考水平低至少15%。在一些实施方案中,蛋白质生物标记物比参考水平低至少20%。在一些实施方案中,蛋白质生物标记物比参考水平低至少25%。在一些实施方案中,蛋白质生物标记物比参考水平低至少30%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低至少40%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低至少50%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低至少60%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低至少70%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低至少80%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低至少90%。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低约5%至约100%之间。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低约10%至约100%之间。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低约15%至约100%之间。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低约20%至约100%之间。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低约25%至约100%之间。在一些实施方案中,生物样品中的蛋白质生物标记物比参考水平低约30%至约100%之间。
在一些实施方案中,蛋白质生物标记物是细胞因子生物标记物。在一些实施方案中,蛋白质生物标记物是趋化因子生物标记物。在一些实施方案中,蛋白质生物标记物是生长因子生物标记物。在一些实施方案中,蛋白质生物标记物与炎症相关联。在一些实施方案中,蛋白质生物标记物与癌症相关联。在一些实施方案中,蛋白质生物标记物与特定类型的癌症相关联。可以如本文所述鉴定和/或治疗任何适当的癌症。在一些实施方案中,所述癌症是常见癌症。在一些实施方案中,所述癌症是没有基于血液的测试可用的癌症。在一些实施方案中,所述癌症是没有用于早期检测的测试可用的癌症。在一些实施方案中,所述癌症是I期癌症。在一些实施方案中,所述癌症是II期癌症。在一些实施方案中,所述癌症是III期癌症。在一些实施方案中,所述癌症是IV期癌症。在一些实施方案中,所述癌症是手术可切除的癌症。在一些实施方案中,所述癌症是手术不可切除的癌症。如本文所述鉴定(例如,至少部分基于一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平和/或非整倍性的存在)的癌症的实例包括但不限于肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌和前列腺癌。
在一些实施方案中,可以独立地检测一个或多个蛋白质生物标记物的水平(例如,通过单重肽工具)。检测蛋白质水平的方法的实例包括但不限于光谱方法(例如,高效液相色谱(HPLC)和液相色谱-质谱(LC/MS))、抗体依赖性方法(例如,酶联免疫吸附测定(ELISA)、蛋白质免疫沉淀、免疫电泳、蛋白质印迹和蛋白质免疫染色)和适体依赖性方法。在一些实施方案中,可以如实施例中所述检测一个或多个蛋白质生物标记物的水平。
许多单重肽工具,诸如但不限于ELISA或蛋白质印迹,可以依次或同时用于分析多个肽生物标记物。多重肽工具可以包括组合单重肽工具或单重肽工具的元件。另外或替代地,可以通过诸如“芯片”、微阵列或免疫测定系统的多重肽工具来检测一个或多个肽生物标记物的水平。在一个非限制性实例中,可以通过点在微阵列上的多个捕获抗体来探测多个分析物,并通过辣根过氧化物酶(HRP)-缀合的抗体/化学发光系统对其进行分析。在这种方法中,每个点捕获特定的靶蛋白,并且第二靶标特异性检测抗体用于定量。除膜抗体阵列之外,载玻片也可用于定量抗体阵列。多重ELISA的商业实施方案包括但不限于可购自Quansys Biosciences的Q-Plex、可购自R&D Systems的MosaicTM、可购自AushonBiosystems的
Figure GDA0002675196410006306
可购自Meso Scale Discovery的MULTI-ARRAY、可购自WhatmanSchleicher&Schuell BioScience的FAST Quant、可购自Beckman Coulter的A2和可购自RayBiotech的
Figure GDA0002675196410006305
另外或替代地,多重测定可以利用珠子或粒子同时检测一个或多个蛋白质生物标记物。在一个非限制性实例中,用不同波长的染料浸渍聚苯乙烯或顺磁性珠子,用于同时检测多个靶抗体,其中每种染料或染料组合对应于不同的靶抗体。夹心测定用于测量蛋白质水平。此技术的商业实施方案利用
Figure GDA0002675196410006304
Figure GDA0002675196410006302
科技平台,例如,可购自Bio-Rad的
Figure GDA0002675196410006303
多重免疫测定系统、可购自eBioscience的FlowCytomix、可购自ThermoFisher Scientific的ProcartalPlex免疫测定系统、可购自Invitrogen获得的
Figure GDA0002675196410006301
多重测定。
在一些实施方案中,测定包括检测生物样品(例如,本文所述的任何生物样品,诸如但不限于血液或血浆)中的阈值化蛋白质生物标记物,而不检测遗传生物标记物(例如,循环肿瘤DNA(ctDNA)中的突变)和/或非整倍性和/或额外类别的生物标记物。在一些实施方案中,测定包括检测生物样品(例如,本文所述的任何生物样品,诸如但不限于血液或血浆)中的阈值化蛋白质生物标记物,以及检测遗传生物标记物(例如,循环肿瘤DNA(ctDNA)中的突变)和/或非整倍性和/或额外类别的生物标记物。例如,测定可以包括检测生物样品中的CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)中的一个或多个(例如,每一个)。在一些实施方案中,测定可以包括以本文公开的任一阈值水平检测生物样品中的CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)中的一个或多个(例如,每一个)。作为另一个实例,测定可以包括检测生物样品中的CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3中的一个或多个(例如,每一个)。在一些实施方案中,测定可以包括以本文公开的任一阈值水平检测生物样品中的CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3中的一个或多个(例如,每一个)。作为另一个实例,测定可以包括检测生物样品中的CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3中的一个或多个(例如,每一个)。在一些实施方案中,测定可以包括以本文公开的任一阈值水平检测生物样品中的CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3中的一个或多个(例如,每一个)。作为另一个实例,测定可以包括检测生物样品中的KRAS(例如,密码子12和61)、TP53、CDKN2A和/或SMAD4中的一个或多个(例如,每一个)。在一些实施方案中,测定可以包括以本文公开的任一阈值水平检测生物样品中的KRAS(例如,密码子12和61)、TP53、CDKN2A和/或SMAD4中的一个或多个(例如,每一个)。在一些实施方案中,一旦执行了包括检测生物样品中的阈值化蛋白质生物标记物的测定,就执行随后的测试或监测(例如,本文公开的各种进一步诊断测试或增加监测技术中的任一种)。在一些实施方案中,一旦执行了包括检测生物样品中的阈值化蛋白质生物标记物的测定,就可以执行第二测定,其包括检测无细胞DNA中存在的一个或多个遗传生物标记物(例如,ctDNA,例如,本文所述的无细胞DNA或ctDNA中存在的各个遗传改变中的任一个)的存在、一个或多个蛋白质生物标记物的存在(例如,本文所述的各个蛋白质生物标记物中的任一个)、非整倍性的存在和/或一个或多个额外类别的生物标记物的存在。
可以使用本文所述的各种技术中的任一种检测的蛋白质生物标记物的实例包括但不限于肌动蛋白γ(ACTG1)、AFP、α-2-HS乙二醇蛋白、血管生成素-2、载脂蛋白1、AXL、CA125、CA15-3、碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、连环蛋白、窖蛋白-1、CD44、B类成员1(HSP90AB1)、补体c3a、细胞周期蛋白D、CYFRA 21-1、防御素α6、DKK1、EAFP、内皮糖蛋白、真核翻译延伸因子1γ(EEF1G)、铁蛋白、FGF2、卵泡抑素、半乳凝素-3、G-CSF、GDF15、葡萄糖调节蛋白-8、3-磷酸甘油醛脱氢酶(GAPDH)、HE4、热休克蛋白90kDaα(胞质)、重多肽1(FTH1)、肝细胞生长因子(HGF)、IL-6、IL-8、激肽释放酶6、核纤层蛋白A/C丝蛋白、大亚基、瘦素、轻多肽(FTL)、LRG-1、间皮素、中期因子、MMP、肌肉(PKM2)、髓过氧化物酶、NSE、OPG、骨桥蛋白(OPN)、P0(RPLP0)、PAR、催乳素、丙酮酸激酶、核糖体蛋白、核糖体蛋白L3(RPL3)、核糖体蛋白大亚基P0(RPLP0)、S100 P、sEGFR、血清C肽、sFas、SHBG、sHER2/sEGFR2/sErbB2、sPECAM-1、TGFa、硫氧还蛋白样蛋白-2、血小板反应蛋白-2、TIMP-1、TIMP-2、转铁蛋白、翻译延伸因子(EEF1A1)、Txl-2(硫氧还蛋白样蛋白-2)、玻连蛋白、α防御素-1、α防御素-2、α防御素-3和/或α-1抗胰蛋白酶。实施例2示出了在各种癌症类型中检测到的示例性蛋白质生物标记物。
检测非整倍性
非整倍性是细胞中异常数量的染色体的存在。非整倍性通常起源于染色体在两个细胞之间未正确分离时的细胞分裂的过程中。非整倍性作为有丝分裂检查点减弱的结果出现,因为这些检查点往往会阻止或延迟细胞分裂,直到细胞的所有组分都准备好进入下一阶段。如果检查点被减弱,则细胞可能无法注意到染色体对未在有丝分裂板上排列。在这种情况下,大多数染色体会正常分离(以每个细胞中有一个染色单体结束),而其他染色体则根本无法分离。这将生成缺少拷贝的子细胞和带有额外拷贝的子细胞。在许多癌症中一致地观察到非整倍性。
非整倍性可以通过核型分析来检测,核型分析是一个将细胞样品固定并染色以创建典型的明暗染色体条带模式并对染色体图片进行分析的过程。用于检测非整倍性的其他非限制性技术包括例如荧光原位杂交(FISH)、短串联重复序列的定量PCR、定量荧光PCR(QF-PCR)、定量PCR剂量分析、单核苷酸多态性的定量质谱、比较基因组杂交(CGH)、微阵列、Sanger测序和大规模平行测序方法等。
本公开提供了检测非整倍性的方法。例如,本公开提供了用于评估测序数据以鉴定哺乳动物患有与一种或多种染色体异常相关联的疾病(例如,癌症)的方法和材料。可以使用样品内非整倍性检测(WALDO)方法处理测序数据以鉴定显著的单个染色体臂获得或丢失以及染色体臂上的等位基因失衡。WALDO结合支持向量机(SVM)来分辨非整倍体和整倍体样品。可以使用非整倍体样品(例如,合成非整倍体样品)和整倍体样品(例如,外周白细胞(WBC))来训练SVM。如果SVM判别得分超过给定阈值,则可以将样品评分为阳性(非整倍体)。在一些实施方案中,单个引物对用于在整个基因组中扩增约38,000个长散布核苷酸元件(LINE)的基因座。然后执行大规模平行测序。在一些实施方案中,所述引物之一包括UID作为分子条形码,其可以用于减少与PCR和测序相关联的错误率。
WALDO概述
在整倍体样品中,每个500-kb基因组区间内的LINE读长的数量应与某些其他基因组区域中的读长的数量一起追踪。一起追踪的基因组区间之所以如此,是因为它们中的扩增子在相似程度上扩增。这里,这些一起追踪的基因组区域称为“簇”。簇可以来自整倍体样品的测序数据。在测试样品中,确定每个预先限定的簇中每个基因组区间中的读长的数量是否在同一样品的其他簇的预期范围内。如果基因组区间内的读长超出了统计预期范围,并且同一染色体臂上存在许多此类超出者,则所述染色体臂被分类为非整倍性
简而言之,虽然每个LINE的读长的数量并非在整个基因组中随机分布,但每个簇内的经缩放读长的分布大致是正态的。正态分布的一个方便属性是多个正态分布的和也是正态分布。通过将染色体臂上表示的所有簇的平均值和方差求和,即可简单地计算每个染色体臂上的总读长的理论平均值和方差。
WALDO采用若干种方法使其可应用于分析临床样品中PCR生成的扩增子。这些方法中的一个是控制由于数据对初始模板大小的强烈依赖性而引起的扩增偏差。另一个是使用支持向量机(SVM)来使得能够检测含有低赘生性部分的样品中的非整倍性。
如图36所示,单个引物对用于扩增LINE。然后将测试样品与具有相似大小的基因组DNA的若干个整倍体样品匹配。基因组被分成多个区间,并且每个区间具有相似的大小(例如100、200、300、400、500、600、700、800、900Kb或1Mb、2Mb、3Mb、4Mb或5Mb)。在整倍体样品中在这些基因组区间内的读长被分组成簇。簇中所有的基因组区间具有相似的读长深度。将测试样品中每个基因组区间的读长放入预先限定的簇中。统计测试,例如基于SVM的算法,用于确定在样品为整倍体的情况下,每个染色体臂上所有基因组区间的总读长是否按预期进行分布。统计测试基于观察到的读长在测试样品的簇中的分布,而不是与整倍体样品中的读长的比较。LINE中已知常见多态性的位点处的生殖系序列变体提供了关于臂水平的等位基因失衡的信息,这些信息也可以用于评估个别染色体臂的非整倍性。这些相同的多态性可以用于确定任意两个样品是否来源于同一个体。当有来自同一个体的匹配的正常样品可用时,本文所述的方法可以检测LINE中单碱基取代以及插入和缺失的数量和性质。
Fast-SeqS
对于每个评估的DNA样品,FAST-SeqS可用于使用单个引物对扩增约38,000个扩增子(Kinde I,Papadopoulos N,Kinzler KW,&Vogelstein B(2012)FAST-SeqS:a simpleand efficient method for the detection of aneuploidy by massively parallelsequencing.PloS ONE 7(7):e41162)。可以执行大规模平行测序。在一些实施方案中,在引物的5′末端的简并碱基被用作分子条形码以唯一地标记每个DNA模板分子。因此,每个DNA模板分子将仅被计数一次。在一些实施方案中,可以对每个唯一的读长进行测序1与20之间的次数(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次)
样品比对和基因组区间分组
比对程序(例如,Bowtie2)可用于将读长与人参考基因组组装(例如,GRC37)比对。可以鉴定与参考基因组的精确匹配。这些精确匹配允许包含常见的多态性。根据实验和随机变化,映射到任何整倍体样品的每个基因组区域的读长的数量预期可变化。在一些实施方案中,为了使这种可变性最小化,鉴定了多个整倍体样品中在所有染色体上具有相似读长深度的基因组区间的簇。当不存在非整倍性时,此步骤可以估计样品中读长深度的预期可变性。在一些实施方案中,基因组区间具有100、200、300、400、500、600、700、800、900Kb或1Mb、2Mb、3Mb、4Mb或5Mb的大小。在一些实施方案中,基因组区间具有500kb的大小。
基因组区间的聚类可以如下执行。将每个测试样品与具有相似扩增子大小的整倍体样品匹配。这是很重要的,因为较小的扩增子可以在由扩增前具有小尺寸的DNA生成的扩增子中过量表达。整倍体样品可以来源于正常个体的WBC或血浆DNA,统称为“整倍体参考组”。整倍体样品可以包括至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200个样品。在一些实施方案中,整倍体样品不包括多于5、6、7、8、9或10个样品。
对于每个测试样品p,与p的欧几里德距离最小的样品定义为
Figure GDA0002675196410006361
其中,pn和qn是样品p和q中大小为n的扩增子的分数,并且和为两个样品中所有扩增子大小的和。在一些实施方案中,在计算整倍体参考组中的样品与测试样品之间的欧几里得距离之前,排除以下扩增子:(i)使用最大似然估计,按整倍体样品之间的方差对扩增子进行排序,并排除前1%。(ii)去除在一个样品中具有<10个读长,但在其他样品的任一个中具有>50个读长的任何扩增子。在每个样品中,通过减去平均值并除以每个样品中读长的标准偏差来缩放基因组区间。
然后将经缩放基因组区间在所选的正常样品上聚类。首先,将每个基因组区间i分配给主要簇Ci。接下来,将所有样品中基因组区间i中的读长与其余常染色体上出现的所有其他基因组区间i′中的样品中的读长平均数量进行比较。如果基因组区间i′中的读长平均数量与基因组区间i中的读长数量没有显著不同,则将它添加到簇Ci。对于每个基因组区间重复此过程,得到多个簇(例如,多于1000、2000、3000、4000或5000个簇)。每个区间i都属于其主要簇,但是同一区间也可以属于一些其他簇。在一些实施方案中,存在约4300个簇。
在一些实施方案中,经缩放读长不是随机分布的。在一些实施方案中,每个簇中基因组区间内的经缩放读长的分布遵循近似正态分布。
鉴定测试样品中的染色体臂获得或丢失
本文所述的方法可以仅使用几个整倍体样品(例如,约2、3、4、5、6、7、8、9或10个样品)来定义具有相似扩增特性的基因组区间的簇。非整倍性的统计测试是基于测试样品内的读长分布的,并且独立于任何整倍体样品中的读长分布。在一些实施方案中,使用最大似然来估计每个簇中的基因组区间的平均值μ和方差δ2。在一些实施方案中,可以通过从簇中迭代地去除测试样品内的离群基因组区间来改进这些估计值的可靠性。在一些实施方案中,包含少于10个基因组区间的簇不包括在分析中。在一些实施方案中,对于每个簇,将满足标准
Figure GDA0002675196410006371
的任何基因组区间从所有簇中去除。接下来,通过最大似然重新估计每个簇的μ和方差δ2参数。重复两个步骤,直到没有离群基因组区间保留。估计臂上所有基因组区间的总读长的统计显著性。由于正态分布的随机变量之和也是正态分布的随机变量,因此计算很简单。对于每个染色体臂,可以计算出
Figure GDA0002675196410006372
其中Ri是经缩放读长,并且i是臂上的簇的数量。Z得分可以使用分位函数生成
Figure GDA0002675196410006373
阳性Z得分>α代表获得,而阴性Z得分<-α代表丢失。α值是所选的显著性阈值。
臂水平等位基因失衡
来自1000个基因组的常见多态性(包括例如24,720个单核苷酸和1,500个插入/缺失,MAF>1%)可以用作候选杂合位点。对于正常样品中的每一个,都可以肯定地将多态性位点称为杂合的和二倍体。可以将多态性定义为具有变体等位基因频率(VAF)(0.4<VAF<0.6)的那些,其中VAF=#非参考读长/总读长。可以在这些位点将VAF建模为取自正态分布的随机变量,其中μ=0.5;并且方差δ2可以通过作为读长深度的函数的最大似然来估计。
为了确定测试样品中染色体臂上的等位基因是否失衡,鉴定存在两个等位基因且两个等位基因上的读长之和>25的多态性位点的子集。
具有正态分布的观察到的VAF,使用观察到的读长深度的预期方差,产生一个双侧P值。染色体臂上的所有p值都可以进行Z转换,并与加权Stouffer法组合,其中在每个位点观察到的读长深度用作其权重。用于此计算的式是
Figure GDA0002675196410006381
其中wi是变体i的UID深度,Zi是变体i的Z得分,并且k是在染色体臂上观察到的变体的数量。如果所得的Z得分大于所选的统计显著性阈值α(例如,通过单侧检验),则将染色体臂评分为具有等位基因失衡。
合成非整倍体样品的产生
可以通过将若干个染色体臂的读长添加到这些正常DNA样品的读长中(或从其中减去)来创建合成非整倍体样品。将来自1、5、10、15、20或25个随机选择的染色体臂的读长添加到每个样品中或从每个样品中减去。加法和减法被设计来表示范围在0.5%至10%的赘生性细胞部分,并得到精确地含有900万个读长的合成样品。来自每个染色体臂的读长可以均匀地被添加或减去。这些其中仅添加或减去了来自单个染色体臂的读长的合成产生的样品可用于估计WALDO的性能。
全基因组非整倍性检测
本公开提供了全基因组非整倍性检测。在一些实施方案中,可以训练两类支持向量机(SVM)以分辨整倍体样品和合成样品。训练组可以含有白细胞(WBC)样品和具有非整倍性的样品(例如,所有合成样品)。
SVM训练可以通过各种统计软件来完成(例如,在R中,使用径向基核和缺省参数)。
来自实验样品的数据的读长的数量可以广泛地变化,尤其是当样品来源于DNA量有限的来源(诸如血浆)时。在一些实施方案中,如果不考虑读长深度,则具有低读长的样品可以人为地产生高SVM得分。因此,可以通过将SVM得分的变化建模为正常样品中读长深度的函数来控制读长深度。每个深度的平均比率r作为增加的读长深度的函数而单调地降低。读长深度与SVM得分之间的关系可以使用以下方程来建模。因此,原始SVM得分可以使用下式通过除以比率r来进行校正:
Figure GDA0002675196410006391
为了将样品评分为非整倍体,确定样品中的任何单个染色体臂是否以统计学上显著的方式丢失或获得。单个染色体臂的统计学上显著的获得被定义为其Z得分高于在正常样品中观察到的最大Z得分的一个染色体臂(例如,高1σ、2σ、3σ、4σ或5σ)。类似地,单个染色体臂的统计学上显著的丢失被定义为其Z得分低于在正常样品中观察到的最小Z得分的一个染色体臂(例如,低1σ、2σ、3σ、4σ或5σ)。基于SNP的等位基因失衡可以针对其Z得分高于在正常样品中观察到的最大Z得分的染色体臂(例如,高1σ、2σ、3σ、4σ或5σ)来定义。仅对在以这种方式定义时没有单个染色体臂获得或丢失的样品进行SVM分析。此过程的基本原理在于,SVM被设计来鉴定具有大量染色体臂获得或丢失但赘生性细胞部分相对较低的样品。在一些实施方案中,SVM不被设计来检测具有>10%的赘生性细胞部分的样品中的非整倍性,所述样品可以通过评估其Z得分并与正常样品比较而容易地鉴定。
体细胞序列突变和微卫星不稳定性(MSI)
本公开还提供了检测体细胞序列突变和微卫星不稳定性的方法。当可获得匹配的正常样品时,可以基于LINE扩增子序列和比对来检测体细胞单碱基取代(SBS)、插入和缺失(插入/缺失)突变。在一些实施方案中,使用了用于减少错误的分子条形码方法。在一些实施方案中,SBS突变可以通过直接将来自测试样品的扩增子与来自匹配的正常样品的扩增子进行比较来鉴定,并且不需要与参考基因组的任何比对。
可以以类似的方式识别插入/缺失。将来自测试样品和匹配的正常样品中的扩增子与参考基因组(GRc37)进行比对。在一些实施方案中,体细胞插入/缺失可以是由于相同的插入或缺失而与任何正常读长不同的来自测试样品的至少十个读长。
可以通过计算>3个核苷酸的单核苷酸束(tract)中体细胞插入/缺失的数量来确定测试样品中的微卫星不稳定性。单束中的体细胞插入/缺失在正常样品中可能很罕见。因此,计数的零分布可以建模为Poisson(λ=1),其中λ是正常样品中单束中体细胞插入/缺失的平均数量。如果体细胞插入/缺失的数量在统计上显著,则确定样品携带MSI。为了评估使用此过程将正常样品评分为MSI的频率,可以将正常样品中的总读长随机分成两个相等的分区。第一分区可用作参考样品,而第二分区可用作测试样品。
本文件提供了用于鉴定样品中的一个或多个染色体异常(例如,非整倍性)的方法和材料。例如,可以评估哺乳动物(例如,从哺乳动物获得的样品)中一个或多个染色体异常的存在或不存在。在一些情况下,本文件提供了使用基于扩增子的测序数据来鉴定哺乳动物患有与一个或多个染色体异常相关联的疾病(例如,癌症)的方法和材料。例如,本文所述的方法和材料可以应用于从哺乳动物获得的样品,以鉴定哺乳动物具有一个或多个染色体异常。例如,本文所述的方法和材料可以应用于从哺乳动物获得的样品,以鉴定哺乳动物患有与一个或多个染色体异常相关联的疾病(例如,癌症)。本文件还提供了用于鉴定和/或治疗与一个或多个染色体异常(例如,如本文所述鉴定的一个或多个染色体异常)相关联的疾病或病症的方法和材料。在一些情况下,可以鉴定在从哺乳动物获得的样品中获得的DNA(例如,基因组DNA)中的一个或多个染色体异常。例如,产前哺乳动物(例如,产前人类)可以至少部分基于一个或多个染色体异常的存在被鉴定为患有疾病或病症,并且任选地可以用一种或多种疾病或病症的治疗进行治疗。例如,可以用一种或多种癌症治疗来治疗至少部分基于一个或多个染色体异常的存在而被鉴定为患有癌症的哺乳动物。
可以如本文所述评估和/或治疗任何适当的哺乳动物。哺乳动物可以是产前哺乳动物(例如,产前人类)。哺乳动物可以是怀疑患有与一个或多个染色体异常相关联的疾病(例如,癌症)的哺乳动物。在一些情况下,可以评估人或其他灵长类动物(例如,猴子)中如本文所述的一个或多个染色体异常的存在。在一些情况下,可以评估狗、猫、马、牛、猪、绵羊、小鼠和大鼠中如本文所述的一个或多个染色体异常的存在。例如,可以评估人中如本文所述的一个或多个染色体异常的存在,并且任选地可以用本文所述的一种或多种癌症治疗对其进行治疗。
可以如本文所述评估来自哺乳动物的任何适当的样品(例如,评估一个或多个染色体异常的存在)。样品可以包括基因组DNA。在一些情况下,样品可以包括无细胞循环DNA(例如,无细胞的循环胎儿DNA)。在一些情况下,样品可以包括循环肿瘤DNA(ctDNA)。可以含有DNA的样品的实例包括但不限于血液(例如,全血、血清或血浆)、羊膜、组织、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水、巴氏涂片、脑脊髓液、宫颈内膜、子宫内膜和输卵管样品。例如,样品可以是血浆样品。例如,样品可以是尿液样品。例如,样品可以是唾液样品。例如,样品可以是囊液样品。例如,样品可以是痰液样品。在一些情况下,样品可以包括赘生性细胞部分(例如,低赘生性细胞部分)。在其中样品包括低赘生性细胞部分的情况下,赘生性细胞部分可以为整个样品的细胞含量的约0.01%至约10%(例如,约0.05%至约10%、约0.5%至约10%、约1%至约10%、约3%至约10%、约5%至约10%,约7%至约10%、约0.01%至约8%、约0.01%至约5%、约0.01%至约2%、约0.01%至约1%、约0.01%至约0.5%、约0.05%至约8%、约0.1%至约4%、或约0.5%至约1%)。例如,包括低赘生性细胞部分的样品可以是约1%赘生性细胞。例如,包括低赘生性细胞部分的样品可以是约0.5%赘生性细胞。
在一些情况下,可以对样品进行处理以从样品中分离和/或纯化DNA。在一些情况下,DNA分离和/或纯化可以包括细胞裂解(例如,使用去污剂和/或表面活性剂)。在一些情况下,DNA分离和/或纯化可以包括去除蛋白质(例如,使用蛋白酶)。在一些情况下,DNA分离和/或纯化可以包括去除RNA(例如,使用RNA酶)。
用于鉴定一个或多个染色体异常的方法和材料可以包括评估基因组(例如,哺乳动物的基因组)中一个或多个染色体异常(例如,非整倍性)的存在或不存在。哺乳动物基因组中一个或多个染色体异常的存在或不存在可以例如通过对在从哺乳动物获得样品中获得的多个扩增子进行测序以获得测序读长并将所述测序读长分组成基因组区间来确定。在一些情况下,可以将基因组区间的读长计数与同一样品内其他基因组区间的读长计数进行比较。在将基因组区间的读长计数与同一样品内其他基因组区间的读长计数进行比较的一些情况下,不测定第二(例如,对照或参考)样品。例如,当使用本文所述的方法和材料来鉴定数量障碍(例如,非整倍性)和/或结构异常时,可以将基因组区间与同一样品内其他基因组区间的读长计数进行比较。在一些情况下,可以将基因组区间的读长计数与另一个样品中的基因组区间的读长计数进行比较。例如,当使用本文所述的方法和材料来鉴定遗传相关性、多态性(例如,体细胞突变)和/或微卫星不稳定性时,可以将基因组区间与参考样品中的基因组区间的读长计数进行比较。参考样品可以是合成样品。参考样品可以来自数据库。在使用本文所述的方法和材料来鉴定遗传相关性的一些情况下,参考样品可以是法医样品。在使用本文所述的方法和材料来鉴定遗传相关性的一些情况下,可以从可疑关系获得参考样品。在使用本文所述的方法和材料来鉴定异常(例如,非整倍性)、一个或多个多态性(例如,体细胞突变)和/或微卫星不稳定性的一些情况下,参考样品可以是从同一癌症患者获得的正常样品(例如,来自没有携带癌细胞的癌症患者的样品)或来自另一个来源(例如,没有癌症的患者)的正常样品。
在一些情况下,本文所述的方法和材料可用于检测哺乳动物基因组中的非整倍性。例如,可以对在从哺乳动物获得的样品中获得的多个扩增子进行测序,可以将测序读长分组成基因组区间的簇,可以计算每个基因组区间中测序读长的分布的和,可以计算染色体臂的Z得分,并且可以鉴定哺乳动物基因组中非整倍性的存在或不存在。可以对每个基因组区间中测序读长的分布求和。例如,可以使用方程
Figure GDA0002675196410006431
计算每个基因组区间中测序读长的分布的和,其中Ri是测序读长的数量,I是染色体臂上簇的数量,N是具有参数μi和σi 2的高斯分布,μi是每个基因组区间中测序读长的平均数量,并且σi 2是每个基因组区间中测序读长的方差。可以使用任何适当的技术来计算染色体臂的Z得分。例如,可以使用分位函数1-CDF
Figure GDA0002675196410006432
来计算染色体臂的Z得分。当Z得分在预定的显著性阈值之外时,可以在哺乳动物的基因组中鉴定哺乳动物基因组中非整倍性的存在,并且当Z得分在预定的显著性阈值之内时,可以在哺乳动物的基因组中鉴定哺乳动物的基因组中非整倍性的不存在。预定阈值可以对应于测试的置信度和假阳性的可接受数量。例如,显著性阈值可以是±1.96、±3或±5。
在一些情况下,本文所述的方法和材料可用于检测哺乳动物基因组中的一个或多个多态性。例如,可以对在从第一哺乳动物(例如,测试哺乳动物或怀疑携带一个或多个多态性的哺乳动物)获得的样品中获得的多个扩增子进行测序,可以对在从第二哺乳动物(例如,参考哺乳动物)获得的样品中获得的多个扩增子进行测序,可以将从第一哺乳动物获得的样品的变体测序读长分组成基因组区间的簇,可以将从第二哺乳动物获得的样品的参考测序读长分组成基因组区间的簇,可以选择在两个等位基因上变体测序读长和参考测序读长的和大于约3(例如,大于约4、大于约5、大于约6、大于约7、大于约8、大于约9、大于约10、大于约12、大于约15、大于约18、大于约20、大于约22、大于约25或大于约30)的染色体臂,可以确定所选的染色体臂的等位基因频率(VAF),并且可以鉴定所选的染色体臂上一个或多个多态性的存在或不存在。可以使用任何适当的技术来确定所选的染色体臂的VAF。例如,所选的染色体臂的VAF可以是变体测序读长的数量/测序读长的总数。当VAF在约0.2与约0.8之间(例如,约0.3与约0.8之间、约0.4与约0.8之间、约0.5与约0.8之间、约0.6与约0.8之间、约0.2与约0.7之间、约0.2与约0.6之间、约0.2与约0.5之间、约0.2与约0.4之间)时,可以在哺乳动物的基因组中鉴定哺乳动物基因组中一个或多个多态性的存在,并且当VAF在预定的显著性阈值之内时,可以在哺乳动物的基因组中鉴定哺乳动物的基因组中一个或多个多态性的不存在。作为一个非限制性实例,当VAF在约0.4与0.6之间时,可以在哺乳动物的基因组中鉴定哺乳动物的基因组中一个或多个多态性的存在。
如本文所述用于鉴定一个或多个染色体异常的方法和材料可以包括使用基于扩增子的测序读长。例如,可以对多个扩增子(例如,在从哺乳动物获得的样品中获得的扩增子)进行测序。在一些情况下,可以对每个扩增子进行测序约1与约20之间(例如,约1与约15之间、约1与约12之间、约1与约10之间、约1与约8之间、约1与约5之间、约5与约20之间、约7与约20之间、约10与约20之间、约13与约20之间、约3与约18之间、约5与约16之间、或约8至约12之间)的次数。在一些情况下,基于扩增子的测序读长可以包括连续测序读长。在一些情况下,扩增子可以包括长散布核苷酸元件(LINE)。在一些情况下,基于扩增子的测序读长可以包括约100,000至约2,500万(例如,约100,000至约2,000万、约100,000至约1,500万、约100,000至约1,200万、约100,000至约1,000万、约100,000至约500万、约100,000至约100万、约100,000至约750,000、约100,000至约500,000、约100,000至约250,000、约250,000至约2,500万、约500,000至约2,500万、约750,000至约2,500万、约100万至约2,500万、约500万至约2,500万、约1,000万至约2,500万、约1,500万至约2,500万、约200,000至约2,000万、约250,000至约1,500万、约500,000至约1,000万、约750,000至约500万、或约100万至约200万)个测序读长。在一些情况下,对扩增子测序的方法包括但不限于快速非整倍性筛选测试测序系统(FAST-SeqS)。例如,对多个扩增子测序可以包括向每个模板分子(例如,向每个扩增子)分配唯一标识符(UID),扩增每个带唯一标签的模板分子以创建UID家族,以及对扩增产物进行冗佘测序。例如,对多个扩增子测序可以包括使用方程
Figure GDA0002675196410006451
计算所述所选的染色体臂上的变体的Z得分,其中wi是在变体i的UID深度,Zi是变体i的Z得分,并且k是在染色体臂上观察到的变体的数量。在一些情况下,对扩增子测序的方法可以如实施例6中所述。在一些情况下,对扩增子测序的方法可以如其他地方所述(参见例如,US 2015/0051085;和Kinde等人2012 PloS ONE 7:e41162)。
在一些情况下,用于鉴定如本文所述的一个或多个染色体异常(例如,非整倍性)的方法和材料可以包括多个扩增子的扩增。例如,多个扩增子的扩增可以使用单个引物对来执行。扩增多个扩增子的方法包括但不限于聚合酶链反应(PCR)测定。
多个扩增子可以包括任何适当数量的扩增子。在一些情况下,多个扩增子可包括约10,000至约1,000,000(例如,约15,000至约1,000,000、约25,000至约1,000,000、约35,000至约1,000,000、约50,000至约1,000,000、约75,000至约1,000,000、约100,000至约1,000,000、约125,000至约1,000,000、约160,000至约1,000,000、约180,000至约1,000,000、约200,000至约1,000,000、约300,000至约1,000,000、约500,000至约1,000,000、约750,000至约1,000,000、约10,000至约800,000、约10,000至约500,000、约10,000至约250,000、约10,000至约150,000、约10,000至约100,000、约10,000至约75,000、约10,000至约50,000、约10,000至约40,000、约10,000至约30,000、或约10,000至约20,000)个扩增子。作为一个非限制性实例,多个扩增子可以包括约38,000个扩增子。多个扩增子中的扩增子可以是任何合适的长度。在一些情况下,扩增子可包括约50至约140(例如,约60至约140、约76至约140、约90至约140、约100至约140、约130至约140、约50至约130、约50至约120、约50至约110、约50至约100、约50至约90、约50至约80、约60至约130、约70至约125、约80至约120、或约90至约100)个核苷酸。作为一个非限制性实例,扩增子可以包括约100个核苷酸。
用于鉴定如本文所述的一个或多个染色体异常的方法和材料可以包括将测序读长(例如,来自多个扩增子)分组成基因组区间的簇(例如,唯一的簇)。基因组区间可以被包括在一个或多个簇中。在一些情况下,基因组区间可以属于约100至约252(例如,约125至约252、约150至约252、约175至约252、约200至约252、约225至约252、约100至约250、约100至约225、约100至约200、约100至约175、约100至约150、约125至约225、约150至约200、或约160至约180)个簇。作为一个非限制性实例,基因组区间可以属于约176个簇。每个簇可以包括任何适当数量的基因组区间。在一些情况下,每个簇可以包括相同数量的基因组区间。在一些情况下,簇可以包括不同数量的基因组簇。作为一个非限制性实例,每个簇可以包括约200个基因组区间。
基因组区间的簇可以包括任何适当数量的基因组区间。在一些情况下,基因组区间的簇可以包括约4000至约4500(例如,约4100至约4500、约4200至约4500、约4300至约4500、约4400至约4500、约4000至约4400、约4000至约4300、约4000至约4200、约4000至约4100、约4100至约4400、或约4200至约4300)个基因组区间。作为一个非限制性实例,基因组区间的簇可以包括约4361个基因组区间。基因组区间可以是任何适当的长度。例如,基因组区间可以是如本文所述进行测序的扩增子的长度。例如,基因组区间可以是染色体臂的长度。在一些情况下,基因组区间可以包括约100至约125,000,000(例如,约250至约125,000,000、约500至约125,000,000、约750至约125,000,000、约1,000至约125,000,000、约1,500至约125,000,000、约2,000至约125,000,000、约5,000至约125,000,000、约7,500至约125,000,000、约10,000至约125,000,000、约25,000至约125,000,000、约50,000至约125,000,000、约100,000至约125,000,000、约250,000至约125,000,000、约500,000至约125,000,000、约100至约1,000,000、约100至约750,000、约100至约500,000、约100至约250,000、约100至约100,000、约100至约50,000、约100至约25,000、约100至约10,000、约100至约5,000、约100至约2,500、约100至约1,000、约100至约750、约100至约500、约100至约250、约500至约1,000,000、约5000至约900,000、约50,000至约800,000、或约100,000至约750,000)个核苷酸。作为一个非限制性实例,基因组区间可以包括约500,000个核苷酸。可以使用任何适当的方法来形成基因组区间的簇。例如,可以将相似大小的扩增子聚类。在一些情况下,可以如实施例6中所述形成基因组区间的簇。
本文所述的方法和材料也可以采用监督式机器学习。在一些情况下,监督式机器学习可以检测一个或多个染色体臂中的微小变化。例如,监督式机器学习可以检测在与染色体异常相关联的疾病或病症(诸如癌症)中经常存在的变化,诸如染色体臂获得或丢失。在一些情况下,监督式机器学习可用于根据非整倍性状态对样品进行分类。例如,可以采用监督式机器学习进行全基因组非整倍性识别。在一些情况下,支持向量机模型可以包括获得SVM得分。可以使用任何适当的技术获得SVM得分。在一些情况下,可以如其他地方所述获得SVM得分(参见例如,Cortes 1995 Machine learning 20:273-297;以及Meyer等人2015R package version:1.6-3)。在较低的读长深度下,样品通常将具有较高的原始SVM得分。因此,在一些情况下,可以使用方程
Figure GDA0002675196410006471
基于样品的读长深度来校正原始SVM概率,其中r是特定读长深度下的SVM得分/给定足够的读长深度的特定样品的最小SVM得分的比率。A和B可以如实施例6中所述来确定。例如,A=-7.076*10^-7,x=给定样品的唯一模板分子的数量,并且B=-1.946*10^-1。
本文所述的方法和材料可用于鉴定任何适当的染色体异常。染色体异常的实例包括但不限于数量障碍、结构异常、等位基因失衡和微卫星不稳定性。染色体异常可以包括数量障碍。例如,染色体异常可以包括非整倍性(例如,染色体的异常数量)。在一些情况下,非整倍性可以包括整个染色体。在一些情况下,非整倍性可以包括染色体的一部分(例如,染色体臂获得或染色体臂丢失)。非整倍性的实例包括但不限于单体性、三体性、四体性和五体性。染色体异常可以包括结构异常。结构异常的实例包括但不限于缺失、重复、易位(例如,相互易位和罗伯逊易位)、倒位、插入、环和等臂染色体。染色体异常可以发生在任何染色体对上(例如,1号染色体、2号染色体、3号染色体、4号染色体号、5号染色体、6号染色体、7号染色体、8号染色体、9号染色体、10号染色体、11号染色体、12号染色体、13号染色体、14号染色体、15号染色体、16号染色体、17号染色体、18号染色体、19号染色体、20号染色体、21号染色体、22号染色体和/或性染色体之一(例如,X染色体或Y染色体)。例如,非整倍性可以出现在但不限于13号染色体(例如,三体性13)、16号染色体(例如,三体性16)、18号染色体(例如,三体性18)、21号染色体(例如,三体性21)和/或性染色体(例如,单体性X染色体;三体性性染色体,诸如XXX、XXY和XYY;性染色体,诸如XXXX和XXYY;五体性性染色体,诸如XXXXX、XXXXY和XYYYY)中。例如,结构异常可以出现在但不限于4号染色体(例如,4号染色体的短臂的部分缺失)、11号染色体(例如,末端11q缺失)、13号染色体(例如,13号染色体的罗伯逊易位)、14号染色体(例如,14号染色体的罗伯逊易位)、15号染色体(例如,15号染色体的罗伯逊易位)、17号染色体(例如,编码外周髓磷脂蛋白22的基因的重复)、21号染色体(例如,21号染色体的罗伯逊易位)和22号染色体(例如,22号染色体的罗伯逊易位)中。
本文所述的方法和材料可用于鉴定和/或治疗与一个或多个染色体异常相关联的疾病(例如,如本文所述鉴定的一个或多个染色体异常,诸如但不限于非整倍性)。在一些情况下,可以评估从哺乳动物获得的DNA样品(例如,基因组DNA样品)中一个或多个染色体异常的存在或不存在。例如,产前哺乳动物(例如,产前人类)可以至少部分基于一个或多个染色体异常的存在被鉴定为患有疾病,可以用一种或多种癌症治疗进行治疗。作为另一个实例,可以用一种或多种癌症治疗来治疗至少部分基于一个或多个染色体异常的存在而被鉴定为患有癌症的哺乳动物。
在一些情况下,被鉴定为患有与如本文所述的一个或多个染色体异常相关联的疾病的哺乳动物(例如,至少部分基于一个或多个染色体异常(诸如但不限于非整倍性)的存在)可以使用任何适当的方法确定疾病诊断。可用于确认一个或多个染色体异常的存在的方法的实例包括但不限于核型分析、荧光原位杂交(FISH)、短串联重复序列的定量PCR、定量荧光PCR(QF-PCR)、定量PCR剂量分析、SNP的定量质谱、比较基因组杂交(CGH)、全基因组测序和外显子组测序。
一旦被鉴定为患有与如本文所述的一个或多个染色体异常相关联的疾病(例如,至少部分基于一个或多个染色体异常(诸如但不限于非整倍性)的存在),哺乳动物可以相应地进行治疗。例如,当哺乳动物被鉴定为患有与如本文所述的一个或多个染色体异常相关联的癌症时,所述哺乳动物可以用一种或多种癌症治疗进行治疗。一种或多种癌症治疗可以包括任何适当的癌症治疗。癌症治疗可以包括手术。癌症治疗可以包括放疗。癌症治疗可以包括药物疗法的施用,诸如化疗、激素疗法、靶向疗法和/或细胞毒性疗法。癌症治疗的实例包括但不限于铂化合物(诸如顺铂或卡铂)、紫杉烷(诸如紫杉醇或多西他赛)、白蛋白结合型紫杉醇(nab-紫杉醇)、六甲密胺、卡培他滨、环磷酰胺、依托泊苷(vp-16)、吉西他滨、异环磷酰胺、伊立替康(cpt-11)、脂质体阿霉素、美法仑、培美曲塞、托泊替康、长春瑞滨、促黄体素释放激素(LHRH)激动剂(诸如戈舍瑞林和亮丙瑞林)、抗雌激素疗法(诸如它莫西芬)、芳香酶抑制剂(诸如来曲唑、阿那曲唑和依西美坦)、血管生成抑制剂(诸如贝伐珠单抗)、聚(ADP)-核糖聚合酶(PARP)抑制剂(诸如奥拉帕尼、鲁卡帕尼和尼拉帕尼)、外照射放疗、近距离放疗、放射性磷及其任何组合。
可以如本文所述鉴定和/或治疗与如本文所述的一个或多个染色体异常相关联的任何适当的疾病(例如,至少部分基于一个或多个染色体异常(诸如但不限于非整倍性)的存在)。可能与一个或多个染色体异常相关联的疾病和病状的实例包括但不限于肺癌(例如,小细胞肺癌或非小细胞肺癌)、乳头状甲状腺癌、髓样甲状腺癌、分化型甲状腺癌、复发性甲状腺癌、难治性分化型甲状腺癌、肺腺癌、细支气管肺细胞癌、多发性内分泌瘤病2A或2B型(分别为MEN2A或MEN2B)、嗜铬细胞瘤、甲状旁腺增生、乳腺癌、结直肠癌(例如,转移性结直肠癌)、乳头状肾细胞癌、胃肠粘膜神经节瘤病、炎性肌纤维母细胞瘤、或宫颈癌、急性淋巴细胞白血病(ALL)、急性髓系白血病(AML)、青少年癌症、肾上腺癌、肾上腺皮质癌、肛门癌、阑尾癌、星形细胞瘤、非典型畸胎样/横纹肌样肿瘤、基底细胞癌、胆管癌、膀胱癌、骨癌、脑干神经胶质瘤、脑瘤、乳腺癌、支气管肿瘤、伯基特淋巴瘤、类癌肿瘤、未知原发性癌、心脏肿瘤、宫颈癌、儿童期癌症、脊索瘤、慢性淋巴细胞白血病(CLL)、慢性骨髓性白血病(CML)、慢性骨髓增生性赘生物、结肠癌、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、胆管癌、原位导管癌、胚胎肿瘤、子宫内膜癌、室管膜瘤、食道癌、嗅神经母细胞瘤、尤因肉瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、眼癌、输卵管癌、骨纤维组织细胞瘤、胆囊癌、胃癌(gastric cancer)、胃肠道类癌肿瘤、胃肠道间质肿瘤(GIST)、生殖细胞肿瘤、妊娠滋养细胞疾病、神经胶质瘤、毛细胞肿瘤、毛细胞白血病、头颈部癌、心脏癌症、肝细胞癌、组织细胞增生症、霍奇金淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞瘤、胰腺神经内分泌肿瘤、卡波济肉瘤、肾癌、朗格汉斯细胞组织细胞增生症、喉癌(laryngeal cancer)、白血病、嘴唇和口腔癌、肝癌、肺癌、淋巴瘤、巨球蛋白血症、骨恶性纤维组织细胞瘤、骨癌、黑色素瘤、默克尔细胞癌、间皮瘤、转移性鳞状上皮颈癌、中线道癌、口腔癌(mouth cancer)、多发性内分泌赘生综合征、多发性骨髓瘤、蕈样肉芽肿、骨髓增生异常综合症、骨髓增生异常/骨髓增生性赘生物、骨髓性白血病、髓样白血病、多发性骨髓瘤、骨髓增生性赘生物、鼻腔和鼻旁窦癌、鼻咽癌、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口癌(oral cancer)、口腔癌(oralcavity cancer)、唇癌、口咽癌、骨肉瘤、卵巢癌、胰腺癌、肝胆道癌、上尿路癌、乳头状瘤、副神经节瘤、鼻旁窦和鼻腔癌、甲状旁腺癌、阴茎癌、咽癌、嗜铬细胞瘤、垂体癌、浆细胞瘤、胸膜肺母细胞瘤、妊娠和乳腺癌、原发性中枢神经系统淋巴瘤、原发性腹膜癌、前列腺癌、直肠癌、肾细胞癌、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌、肉瘤、塞扎里综合征、皮肤癌、小细胞肺癌、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状颈癌、胃癌(stomach cancer)、T细胞淋巴瘤、睾丸癌、喉癌(throat cancer)、胸腺瘤和胸腺癌、甲状腺癌、肾盂和输尿管的移行细胞癌、未知的原发性癌、尿道癌、子宫癌、子宫肉瘤、阴道癌、外阴癌、沃尔登斯特罗姆巨球蛋白血症、威尔姆斯肿瘤、1p36缺失综合征、1q21.1缺失综合征、2q37缺失综合征、Wolf-Hirschhorn综合征、猫叫综合症(Ci du chat)、5q缺失综合征、Williams综合征、单体性8p、单体性8q、Alfi′s综合征、Kleefstra综合征、单体性10p、单体性10q、Jacobsen综合征、Patau综合征、Angelman综合征、Prader-Willi综合征、Miller-Dieker综合征、Smith-Magenis综合征、Edwards综合征、Down综合征、DiGeorge综合征、Phelan-McDermid综合征、22q11.2远端缺失综合征、猫眼综合征、XYY综合征、Triple X综合征、Klinefelter综合征、Wolf-Hirschhorn综合征、Jacobsen综合征、Charcot-Marie-Tooth疾病1A型和Lynch综合征。
在一些实施方案中,本文提供的方法可以用于检测从受试者获得的样品(例如,宫颈样品、子宫内膜样品或尿液样品)中的非整倍性(例如,单体性或三体性)。可以在已知与癌症(例如,子宫内膜癌或卵巢癌)相关联的基因组的任何区域中检测非整倍性。在一些实施方案中,可以在臂4p、7q、8q和/或9q中检测非整倍性。这些臂中的每一个都携带致癌基因和抑癌基因,这些基因已被证明在许多癌症(包括子宫内膜癌或卵巢癌)中均发生拷贝数改变。在一些实施方案中,可以在臂5q、8q和/或9p中检测非整倍性。这些臂中的每一个都携带致癌基因和抑癌基因,这些基因已被证明在许多癌症(包括膀胱癌)中均发生拷贝数改变。用于非整倍性检测的其他适当的区域,这些非整倍性区域与受试者中癌症的存在相关联,是本领域普通技术人员已知的。
在一些实施方案中,可以通过扩增散布核苷酸元件来检测非整倍性。例如,可以通过扩增长散布核苷酸元件(LINE)来检测非整倍性。另外或替代地,可以通过扩增短散布核苷酸元件(SINE)来检测非整倍性。在一些实施方案中,可以使用以下技术来检测非整倍性,在所述技术中,使用单个PCR共扩增长散布核苷酸元件-1(L1反转录转座子,也称为LINE)的亚家族的多个(例如,约38,000个)成员。像其他人重复序列一样,L1反转录转座子通过反转录转座分散在整个基因组中,并且存在于全部39个非近端着丝粒常染色体臂上。在一些实施方案中,可以通过专利合作条约申请公开号WO2013148496中公开的各种方法中的任一种来检测非整倍性,所述申请的内容以引用的方式整体并入本文。本领域普通技术人员将知道用于检测非整倍性的其他合适方法。在一些实施方案中,使用巴氏刷收集用于检测非整倍性的样品。在一些实施方案中,使用陶氏刷收集用于检测非整倍性的样品。
在一些实施方案中,本文提供的检测非整倍性的方法可以与检测一个或多个选自由以下组成的组的基因中一个或多个遗传生物标记物(例如,突变)的存在的方法:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF,和ctDNA中存在的遗传生物标记物(例如,突变)的检测,或两者组合(例如,以确定卵巢癌或子宫内膜癌的存在)。在一些实施方案中,本文提供的检测非整倍性的方法可以与检测一个或多个选自由以下组成的组的基因中一个或多个遗传生物标记物(例如,突变)的存在的方法:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和PPP2R1A,和ctDNA中存在的遗传生物标记物(例如,突变)的检测,或两者组合(例如,以确定子宫内膜癌的存在)。在一些实施方案中,本文提供的检测非整倍性的方法可以与检测TP53中一个或多个遗传生物标记物(例如,突变)的存在的方法,和ctDNA中存在的遗传生物标记物(例如,突变)的检测,或两者组合(例如,以确定卵巢癌的存在)。在一些实施方案中,将非整倍性的检测与本文所述的任一基因中的一个或多个遗传生物标记物(例如,突变)的检测,ctDNA中存在的遗传生物标记物(例如,突变)的检测,或两者组合,可以增加检测卵巢癌或子宫内膜癌的特异性和/或敏感性。在一些实施方案中,使用巴氏刷收集样品。在一些实施方案中,使用陶氏刷收集样品。
癌症
在一些实施方案中,本文提供的方法可用于检测受试者中癌症的存在(例如,癌细胞的存在)。在一些实施方案中,本文提供的方法可用于检测早期癌症的存在。在一些实施方案中,本文提供的用于以高敏感性和特异性鉴定受试者中癌症的存在的方法在确定受试者已经患有癌症之前、在确定受试者携带癌细胞之前和/或在受试者表现出与癌症相关联的症状之前执行。在一些实施方案中,本文提供的方法可用于检测遗传生物标记物、蛋白质生物标记物和/或非整倍性的存在,所述遗传生物标记物、蛋白质生物标记物和/或非整倍性指示受试者患有癌症(例如,携带癌细胞)。
可以通过本文所述的各种方法中的任一种检测的癌症类型包括但不限于急性淋巴细胞白血病(ALL)、急性髓系白血病(AML)、肾上腺癌、肾上腺皮质癌、AIDS相关癌症、AIDS相关淋巴瘤、肌萎缩性侧索硬化或ALS、肛门癌、阑尾癌、儿童小脑或脑星形细胞瘤、非典型畸胎样/横纹肌样肿瘤、基底细胞癌、胆管癌、肝外胆管癌(见胆管细胞癌)、膀胱癌、骨癌、骨肿瘤、骨肉瘤/恶性纤维组织细胞瘤、脑癌、脑干神经胶质瘤、脑瘤、脑瘤、小脑星形细胞瘤、脑瘤、脑星形细胞瘤/恶性神经胶质瘤、脑瘤、室管膜瘤、脑瘤、髓母细胞瘤、脑瘤、幕上原始神经外胚层肿瘤、脑瘤、视觉通路和下丘脑神经胶质瘤、脑干神经胶质瘤、乳腺癌、支气管腺瘤/类癌、支气管肿瘤、细支气管肺细胞癌、伯基特淋巴瘤、青少年癌症、类癌肿瘤、儿童类癌肿瘤、胃肠道类癌肿瘤、未知原发性癌、心脏肿瘤、原发性中枢神经系统淋巴瘤、儿童小脑星形细胞瘤、儿童脑星形细胞瘤/恶性神经胶质瘤、宫颈癌、儿童癌症、软骨肉瘤、脊索瘤、慢性淋巴细胞白血病(CLL)、慢性骨髓性白血病(CML)、慢性骨髓增生性疾病、慢性骨髓增生性赘生物、结肠癌、结直肠癌、结直肠癌(例如,转移性结直肠癌)、颅咽管瘤、皮肤T细胞淋巴瘤、促纤维增生性小圆形细胞瘤、分化型甲状腺癌、原位导管癌、胚胎肿瘤、子宫内膜癌、室管膜瘤、上皮样血管内皮瘤(EHE)、食道癌、嗅神经母细胞瘤、尤因家族肿瘤中的尤因肉瘤、颅外生殖细胞肿瘤、儿童颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、肝外胆管癌、眼癌、眼癌、眼内黑色素瘤、眼癌、视网膜母细胞瘤、输卵管癌、骨纤维组织细胞瘤、胆囊癌、胃肠粘膜神经节瘤病、胃癌、胃癌、胃类癌、胃肠道类癌肿瘤、胃肠道间质肿瘤(GIST)、生殖细胞肿瘤、颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、或卵巢生殖细胞肿瘤、妊娠滋养细胞疾病、妊娠滋养细胞肿瘤、神经胶质瘤、脑干神经胶质瘤、神经胶质瘤、儿童脑星形细胞瘤、神经胶质瘤、儿童视觉通路和下丘脑、毛细胞白血病、毛细胞肿瘤、头颈部癌、心脏病、肝细胞(肝)癌、组织细胞增生症、霍奇金淋巴瘤、下咽癌、儿童下丘脑和视觉通路神经胶质瘤、炎性肌纤维母细胞瘤、眼内黑色素瘤、眼内黑色素瘤、胰岛细胞癌(内分泌胰腺)、胰岛细胞瘤、卡波济肉瘤、肾癌(肾细胞癌)、朗格汉斯细胞组织细胞增生症、喉癌(laryngeal cancer)、急性淋巴母细胞白血病(也称为急性淋巴细胞白血病)、急性髓系白血病(也称为急性骨髓性白血病)、慢性淋巴细胞白血病(也称为慢性淋巴细胞白血病)、白血病、慢性骨髓性白血病(也称为慢性髓系白血病)、毛细胞白血病、嘴唇和口腔癌、脂肪肉瘤、肝癌(例如,原发性)、肺腺癌、肺癌、肺癌(例如,小细胞肺癌或非小细胞肺癌)、淋巴瘤、AIDS相关淋巴瘤、伯基特淋巴瘤、皮肤T细胞淋巴瘤、霍奇金淋巴瘤、原发性中枢神经系统淋巴瘤、非霍奇金淋巴瘤(除霍奇金淋巴瘤外,旧分类的所有淋巴瘤)、巨球蛋白血症、男性乳腺癌、骨恶性纤维组织细胞瘤、骨恶性纤维组织细胞瘤/骨肉瘤、髓样甲状腺癌、儿童髓母细胞瘤、黑色素瘤、眼内(眼)黑色素瘤、眼内(眼)黑色素瘤、默克尔细胞癌、默克尔细瘤、间皮瘤、成人恶性间皮瘤、儿童间皮瘤、转移性鳞状上皮颈癌、原发性隐匿性转移性鳞状上皮颈癌、中线道癌、口腔癌(mouthcancer)、儿童多发性内分泌赘生综合征、多发性内分泌赘生综合征、多发性内分泌瘤病2A或2B型(分别为MEN2A或MEN2B)、多发性骨髓瘤、多发性骨髓瘤/浆细胞瘤、蕈样肉芽肿、骨髓增生异常综合征、骨髓增生异常/骨髓增生性疾病、骨髓增生异常/骨髓增生性赘生物、骨髓性白血病、慢性骨髓性白血病、髓样白血病、成人急性髓样白血病、儿童急性髓样白血病、多发性骨髓瘤(骨髓癌)、慢性骨髓增生性疾病、骨髓增生性赘生物、粘液瘤、鼻腔和鼻旁窦癌、鼻咽癌、鼻咽癌、神经母细胞瘤、少突胶质细胞瘤、口癌、口腔癌(oral cavity cancer)、口咽癌、骨癌、骨肉瘤、骨肉瘤/骨恶性纤维组织细胞瘤、卵巢癌、卵巢上皮癌(表面上皮间质瘤)、卵巢生殖细胞肿瘤、卵巢低恶性潜力肿瘤、胰腺癌、胰岛细胞胰腺癌、胰腺神经内分泌肿瘤、乳头状肾细胞癌、乳头状甲状腺癌、乳头状瘤病、副神经节瘤、鼻旁窦和鼻腔癌、甲状旁腺癌、甲状旁腺增生、阴茎癌、咽癌、嗜铬细胞瘤、分叶状乳腺肿瘤、松果体星形细胞瘤、松果体生殖细胞瘤、儿童松果体母细胞瘤和幕上原始神经外胚层肿瘤、垂体腺瘤、垂体癌、浆细胞瘤/多发性骨髓瘤、浆细胞瘤、胸膜肺母细胞瘤、妊娠和乳腺癌、原发性中枢神经系统淋巴瘤、原发性腹膜癌、前列腺癌、直肠癌、复发性甲状腺癌、难治性分化型甲状腺癌、肾细胞癌、肾细胞癌(肾癌)、肾盂和输尿管移行细胞癌、视网膜母细胞瘤、横纹肌肉瘤、儿童横纹肌肉瘤、唾液腺癌、肉瘤、尤因家族肿瘤肉瘤、卡波济肉瘤、Sezary综合征、皮肤癌、皮肤癌(黑色素瘤)、皮肤癌(非黑色素瘤)、皮癌、默克尔细胞、小肠癌、软组织肉瘤、鳞状细胞癌、鳞状细胞癌-见皮肤癌(非黑素瘤)、鳞状颈癌、隐匿性原发性鳞状颈癌、转移性胃癌、幕上原始神经外胚层肿瘤、儿童T细胞淋巴瘤、T细胞淋巴瘤、皮肤、睾丸癌、喉癌(throat cancer)、胸腺瘤和胸腺癌、儿童胸腺瘤、甲状腺癌、儿童甲状腺癌、肾盂和输尿管的移行细胞癌、妊娠滋养细胞肿瘤、未知原发性癌、儿童未知原发部位癌症、成人未知原发部位癌、输尿管和肾盂移行细胞癌、尿道癌、子宫癌、子宫内膜子宫癌、子宫肉瘤、阴道癌、儿童视觉通路和下丘脑神经胶质瘤、外阴癌、沃尔登斯特罗姆巨球蛋白血症和威尔姆斯肿瘤(肾癌)。
在一些实施方案中,本文所述的方法用于检测单个类型的癌症的存在。在一些实施方案中,本文所述的方法能够检测两种或更多种(例如,2、3、4、5、6、7、8种或更多种)类型的癌症。例如,本文所述的方法可以用于检测肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌或乳腺癌的存在。作为另一个实例,本文所述的方法能够检测肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌和乳腺癌中的每一种的存在(例如,本文所述的方法能够检测受试者中这些类型的癌症中的每一种的存在,尽管受试者中可能仅存在一种类型的癌症)。在一些实施方案中,本文所述的各种方法可以用于检测选自由以下组成的组的癌症:胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌和乳腺癌及其组合。作为另一个实例,本文所述的方法可以用于检测宫颈癌、子宫内膜癌、卵巢癌或输卵管癌的存在。作为另一个实例,本文所述的方法能够检测宫颈癌、子宫内膜癌、卵巢癌和输卵管癌中的每一种的存在(例如,本文所述的方法能够检测受试者中这些类型的癌症中的每一种的存在,尽管受试者中可能仅存在一种类型的癌症)。作为另一个实例,本文所述的方法可用于检测膀胱癌或上尿路尿路上皮癌(UTUC)的存在。作为另一个实例,本文所述的方法能够检测膀胱癌和上尿路尿路上皮癌(UTUC)中的每一种的存在(例如,本文所述的方法能够检测受试者中这些类型的癌症中的每一种的存在,尽管受试者中可能仅存在一种类型的癌症)。
进一步诊断测试
在诊断或鉴定受试者中疾病(例如,癌症)的存在的一些实施方案中(例如,使用本文所述的各种方法中的任一种),受试者还被鉴定为进行进一步诊断测试的候选者。本文提供了用于选择进行进一步诊断测试的受试者的方法。在一些实施方案中,用于选择受试者进行进一步诊断测试的方法包括:在从受试者分离的生物样品中检测一个或多个遗传生物标记物的存在;在从受试者分离的生物样品中检测一个或多个蛋白质生物标记物的存在;和/或在从受试者分离的生物样品中检测非整倍性的存在,以及在鉴定出一个或多个遗传生物标记物、一个或多个蛋白质生物标记物或非整倍性的存在时,选择受试者进行进一步诊断测试。在一些实施方案中,用于选择受试者进行进一步诊断测试的方法还包括检测一个或多个其他类别的生物标记物的一个或多个成员的存在。在一些实施方案中,在确定受试者已经罹患癌症之前(例如,当不知道受试者携带癌细胞时)执行检测步骤。
在一些实施方案中,从受试者分离生物样品。可以根据本文所述的各种方法中的任一种使用包含一个或多个遗传生物标记物、蛋白质生物标记物和/或非整倍性的任何合适的生物样品。例如,生物样品可以包括血液、血浆、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。从受试者分离生物样品的方法是本领域普通技术人员已知的。
在一些实施方案中,可以选择受试者进行进一步诊断测试。在一些实施方案中,本文提供的方法可以用于在常规技术能够诊断患有早期癌症的受试者的时间段之前的时间段选择所述受试者进行进一步诊断测试。例如,当受试者通过常规方法未被诊断为患有癌症时和/或当不知道受试者携带癌症时,可以使用本文提供的用于选择受试者进行进一步诊断测试的方法。在一些实施方案中,与未被选择进行进一步诊断测试的受试者相比,可以增加的频率向被选择进行进一步诊断测试的受试者施用诊断测试(例如,本文所述的任何诊断测试)。例如,可以每天两次、每天一次、每两周一次、每周一次、每两月一次、每月一次、每季度一次、每半年一次、每年一次或其中的任何频率向被选择进行进一步诊断测试的受试者施用诊断测试。在一些实施方案中,与未被选择进行进一步诊断测试的受试者相比,可以向被选择进行进一步诊断测试的受试者施用一次或多次额外的诊断测试。例如,可以向被选择进行进一步诊断测试的受试者施用两次诊断测试或更多,而仅向未被选择进行进一步诊断测试的受试者施用单次诊断测试(或不进行诊断测试)。在一些实施方案中,诊断测试方法可以确定与最初检测到的癌症相同类型的癌症的存在。另外或替代地,诊断测试方法可以确定与最初检测到的癌症不同类型的癌症的存在。
在一些实施方案中,诊断测试方法是扫描。在一些实施方案中,扫描是骨扫描、计算机断层成像(CT)、CT血管造影(CTA)、钡餐造影(钡吞咽)、钡灌肠、镓扫描、磁共振成像(MRI)、乳房摄影术、单克隆抗体扫描(例如,用于前列腺癌的
Figure GDA0002675196410006581
扫描、用于卵巢癌的
Figure GDA0002675196410006582
扫描和用于结肠癌的
Figure GDA0002675196410006583
)、多门收集(MUGA)扫描、PET扫描、PET/CT扫描、甲状腺扫描、超声(例如,乳房超声、支气管内超声、内镜超声、经阴道超声)、X射线、DEXA扫描。
在一些实施方案中,诊断测试方法是身体检查,诸如但不限于肛门镜检查、活检、支气管镜检查(例如,自发荧光支气管镜检查、白光支气管镜检查、导航支气管镜检查)、数字乳腺断层合成、数字直肠检查、内镜检查(包括但不限于胶囊内镜检查、虚拟内镜检查、关节镜检查、支气管镜检查、结肠镜检查、阴道镜检查、膀胱镜检查、食道镜检查、胃镜检查、腹腔镜检查、喉镜检查、神经内窥镜检查、直肠镜检查、乙状结肠镜检查、皮肤癌检查、胸腔镜检查、内镜逆行胰胆管造影(ERCP)、食管胃十二指肠镜检查、盆腔检查)。
在一些实施方案中,诊断测试方法是活检(例如,骨髓穿刺、组织活检)。在一些实施方案中,通过细针穿刺或通过手术切除来进行活检。在一些实施方案中,诊断测试方法还包括获得生物样品(例如,组织样品、尿液样品、血液样品、检查拭子、唾液样品、粘膜样品(例如,痰液、支气管分泌物)、乳头抽吸液、分泌物或排泄物)。在一些实施方案中,诊断测试方法包括确定外泌体蛋白(例如,外泌体表面蛋白(例如,CD24、CD147、PCA-3))(Soung等人(2017)Cancers9(1):pii:E8)。在一些实施方案中,诊断测试方法是oncotype
Figure GDA0002675196410006591
测试(Baehner(2016)Ecancermedicalscience 10:675)。
在一些实施方案中,诊断测试方法是测试,诸如但不限于,甲胎蛋白血液测试、骨髓测试、粪便潜血测试、人乳头瘤病毒测试、低剂量螺旋计算机断层扫描、腰椎穿刺、前列腺特异性抗原(PSA)测试、巴氏涂片或肿瘤标记物测试。
在一些实施方案中,诊断测试方法包括确定已知蛋白质生物标记物(例如,CA-125或前列腺特异性抗原(PSA))的水平。例如,在受试者的血液中可以发现大量的CA-125,所述受试者患有卵巢癌、子宫内膜癌、输卵管癌、胰腺癌、胃癌、食道癌、结肠癌、肝癌、乳腺癌或肺癌。如本文所用,术语“生物标记物”是指“在血液、其他体液或组织中发现的指示正常或异常过程或者病状或疾病的生物分子”,例如如美国国家癌症研究所所定义的。(参见例如,URL www.cancer.gov/publications/dictionaries/cancer-terms?CdrID=45618)。生物标记物可以包括遗传生物标记物,诸如但不限于核酸(例如,DNA分子、RNA分子(例如,微小RNA、长非编码RNA(lncRNA)或其他非编码RNA)。术语“生物标记物”可以包括蛋白质生物标记物,诸如但不限于肽、蛋白质或其片段。
在一些实施方案中,生物标记物是FLT3、NPM1、CEBPA、PRAM1、ALK、BRAF、KRAS、EGFR、Kit、NRAS、JAK2、KRAS、HPV病毒、ERBB2、BCR-ABL、BRCA1、BRCA2、CEA、AFP和/或LDH。参见例如,Easton等人(1995)Am.J.Hum.Genet.56:265-271,Hall等人(1990)Science 250:1684-1689,Lin等人(2008)Ann.Intern.Med.149:192-199,Allegra等人(2009)(2009)J.Clin.Oncol.27:2091-2096,Paik等人(2004)N.Engl.J.Med.351:2817-2826,Bang等人(2010)Lancet 376:687-697,Piccart-Gebhart等人(2005)N.Engl.J.Med.353:1659-1672,Romond等人(2005)N.Engl.J.Med.353:1673-1684,Locker等人(2006)J.Clin.Oncol.24:5313-5327,Giligan等人(2010)J.Clin.Oncol.28:3388-3404,Harris等人(2007)J.Clin.Oncol.25:5287-5312;Henry和Hayes(2012)Mol.Oncol.6:140-146。在一些实施方案中,生物标记物是用于检测受试者中的乳腺癌的生物标记物,诸如但不限于MUC-1、CEA、p53、尿激酶纤溶酶原激活物、BRCA1、BRCA2和/或HER2(Gam(2012)World J.Exp.Med.2(5):86-91)。在一些实施方案中,生物标记物是用于检测受试者中的肺癌的生物标记物,诸如但不限于KRAS、EGFR、ALK、MET和/或ROS1(Mao(2002)Oncogene 21:6960-6969;Korpanty等人(2014)Front Oncol.4:204)。在一些实施方案中,生物标记物是用于检测受试者中的卵巢癌的生物标记物,诸如但不限于HPV、CA-125、HE4、CEA、VCAM-1、KLK6/7、GST1、PRSS8、FOLR1、ALDH1(Nolen和Lokshin(2012)Future Oncol.8(1):55-71;Sarojini等人(2012)J.Oncol.2012:709049)。在一些实施方案中,生物标记物是用于检测受试者的结直肠癌的生物标记物,诸如但不限于MLH1、MSH2、MSH6、PMS2、KRAS和BRAF(Gonzalez-Pons和Cruz-Correa(2015)Biomed.Res.Int.2015:149014;Alvarez-Chaver等人(2014)WorldJ.Gastroenterol.20(14):3804-3824)。在一些实施方案中,诊断测试方法确定核酸(例如,微小RNA(Sethi等人(2011)J.Carcinog.Mutag.S1-005)、RNA、SNP(Hosein等人(2013)Lab.Invest doi:10.1038/labinvest.2013.54;Falzoi等人(2010)Pharmacogenomics 11:559-571)、甲基化状态(Castelo-Branco等人(2013)Lancet Oncol 14:534-542)、热点癌症突变(Yousem等人(2013)Chest 143:1679-1684))的存在和/或表达水平。检测样品中的核酸的方法的非限制性实例包括:PCR、RT-PCR、测序(例如,下一代测序方法、深度测序)、DNA微阵列、微小RNA微阵列、SNP微阵列、荧光原位杂交(FISH)、限制性片段长度多态性(RFLP)、凝胶电泳、RNA印迹分析、蛋白质印迹分析、生色原位杂交(CISH)、染色质免疫沉淀(ChIP)、SNP基因分型和DNA甲基化测定。参见例如,Meldrum等人(2011)Clin.Biochem.Rev.32(4):177-195;Sidranksy(1997)Science 278(5340):1054-9。
在一些实施方案中,诊断测试方法包括确定样品中蛋白质生物标记物的存在(例如,血浆生物标记物(Mirus等人(2015)Clin.Cancer Res.21(7):1764-1771))。确定蛋白质生物标记物的存在的方法的非限制性实例包括:蛋白质印迹分析、免疫组织化学(IHC)、免疫荧光、质谱(MS)(例如,基质辅助激光解吸/电离(MALDI)-MS、表面增强激光解吸/电离飞行时间(SELDI-TOF)-MS)、酶联免疫吸附测定(ELISA)、流式细胞术、邻近度测定(例如,VeraTag邻近度测定(Shi等人(2009)Diagnostic molecular pathology:the Americanjournal of surgical pathology,part B:18:11-21,Huang等人(2010)AM.J.Clin.Pathol.134:303-11))、蛋白质微阵列(例如,抗体微阵列(Ingvarsson等人(2008)Proteomics 8:2211-9,Woodbury等人(2002)J.Proteome Res.1:233-237)、基于IHC的微阵列(Stromberg等人(2007)Proteomics 7:2142-50)、微阵列ELISA(Schroder等人(2010)Mol.Cell.Proteomics 9:1271-80)。在一些实施方案中,确定蛋白质生物标记物的存在的方法是功能性测定。在一些实施方案中,功能性测定是激酶测定(Ghosh等人(2010)Biosensors&Bioelectronics 26:424-31,Mizutani等人(2010)Clin.Cancer Res.16:3964-75,Lee等人(2012)Biomed.Microdevices 14:247-57)、蛋白酶测定(Lowe等人(2012)ACS nano.6:851-7,Fujiwara等人(2006)Breast cancer 13:272-8,Darragh等人(2010)Cancer Res 70:1505-12)。参见例如,Powers和Palecek(2015)J.Heathc Eng.3(4):503-534,用于诊断癌症患者的蛋白质分析测定的综述。
在一些实施方案中,诊断测试方法包括在生物样品中检测非整倍性的存在(例如,检测生物样品是否含有染色体数量异常的细胞)。检测非整倍性存在的方法的非限制性实例包括核型分析、数字核型分析、荧光原位杂交(FISH)、短串联重复序列的定量PCR、定量荧光PCR(QF-PCR)、定量PCR剂量分析、单核苷酸多态性的定量质谱和比较基因组杂交(CGH)。
在一些实施方案中,还可以选择已经被选择进行进一步诊断测试的受试者进行增加监测。一旦已经鉴定出癌细胞的存在(例如,通过本文所述的各种方法中的任何一种),使受试者同时经历增加监测(例如,评估受试者中肿瘤或癌症的进展和/或评估额外的癌细胞突变的发展)和进一步诊断测试(例如,确定携带癌细胞的肿瘤的大小和/或确切位置)可能是有益的。
在一些实施方案中,还可以选择被选择进行进一步诊断测试的受试者进行治疗性干预。可以施用本文所述的或本领域已知的任何治疗性干预。例如,如果确认了癌细胞的存在,则可以向已经被选择进行进一步诊断测试的受试者施用进一步诊断测试,并且可以施用治疗性干预。另外或替代地,可以向已经被选择进行进一步诊断测试的受试者施用治疗性干预,并且可以随着治疗性干预的进行进一步监测。在一些实施方案中,在已向已经被选择进行进一步诊断测试的受试者施用治疗性干预之后,额外的测试将揭示一个或多个额外的遗传生物标记物的存在、一个或多个额外的蛋白质生物标记物的存在和/或非整倍性的存在。在一些实施方案中,一个或多个额外的遗传生物标记物的存在、一个或多个额外的蛋白质生物标记物的存在和/或非整倍性的存在将提供施用不同治疗性干预的原因(例如,在治疗性干预期间,癌细胞中可能会产生耐药性突变,所述携带耐药性突变的癌细胞对原始治疗性干预具有耐药性)。
增加监测
本文还提供了用于选择受试者进行增加监测的方法。在一些实施方案中,用于选择受试者进行增加监测的方法包括:在从受试者分离的生物样品中检测一个或多个遗传生物标记物的存在;在从受试者分离的生物样品中检测一个或多个蛋白质生物标记物的存在;和/或在从受试者分离的生物样品中检测非整倍性的存在,以及在鉴定出一个或多个遗传生物标记物、一个或多个蛋白质生物标记物或非整倍性的存在时,选择受试者进行增加监测。在一些实施方案中,用于选择受试者进行增加监测的方法还包括检测一个或多个其他类别的生物标记物的一个或多个成员的存在。在一些实施方案中,当不知道受试者携带癌细胞时(例如,当不知道受试者携带癌细胞时)执行检测步骤。
在一些实施方案中,从受试者分离生物样品。可以根据本文公开的各种方法中的任一种使用包含一个或多个遗传生物标记物、蛋白质生物标记物和/或非整倍性的任何合适的生物样品。例如,生物样品可以包括血液、血浆、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。从受试者分离生物样品的方法是本领域普通技术人员已知的。
在一些实施方案中,一旦已经确定受试者患有癌症,就可以选择所述受试者进行增加监测或额外监测。在一些实施方案中,本文提供的方法可以用于在常规技术能够诊断患有早期癌症的受试者的时间段之前的时间段选择所述受试者进行增加监测。例如,当受试者通过常规方法未被诊断为患有癌症时和/或当不知道受试者携带癌症时,可以使用本文提供的用于选择受试者进行增加监测的方法。在一些实施方案中,与未被选择进行增加监测的受试者相比,可以增加的频率向被选择进行增加监测的受试者施用诊断测试(例如,本文公开的任何诊断测试)。例如,可以每天两次、每天一次、每两周一次、每周一次、每两月一次、每月一次、每季度一次、每半年一次、每年一次或其中的任何频率向被选择进行增加监测的受试者施用诊断测试。在一些实施方案中,与未被选择进行增加监测的受试者相比,可以向被选择进行增加监测的受试者施用一次或多次额外的诊断测试。例如,可以向被选择进行增加监测的受试者施用两次诊断测试,而仅向未被选择进行增加监测的受试者施用单次诊断测试(或不进行诊断测试)。
在一些实施方案中,还可以选择已经被选择进行增加监测的受试者进行进一步诊断测试。一旦已经鉴定出癌细胞的存在(例如,通过本文所述的各种方法中的任何一种),使受试者同时经历增加监测(例如,评估受试者中肿瘤或癌症的进展和/或评估额外的癌细胞突变的发展)和进一步诊断测试(例如,确定携带癌细胞的肿瘤的大小和/或确切位置)可能是有益的。
在一些实施方案中,还可以选择被选择进行增加监测的受试者进行治疗性干预。可以施用本文所述的或本领域已知的任何治疗性干预。例如,如果在整个增加监测时间段内维持癌细胞的存在,则可以进一步监测已经被选择进行增加监测的受试者,并且可以施用治疗性干预。另外或替代地,可以向已经选择进行增加监测的受试者施用治疗性干预,并且随着治疗性干预的进行进一步监测。在一些实施方案中,在已经向已经被选择进行增加监测的受试者施用治疗性干预之后,增加监测将揭示一个或多个额外的遗传生物标记物的存在、一个或多个额外的蛋白质生物标记物的存在和/或非整倍性的存在。在一些实施方案中,一个或多个额外的遗传生物标记物的存在、一个或多个额外的蛋白质生物标记物的存在和/或非整倍性的存在将提供施用不同治疗性干预的原因(例如,在治疗性干预期间,癌细胞中可能会产生耐药性突变,所述携带耐药性突变的癌细胞对原始治疗性干预具有耐药性)。
治疗性干预
在一些实施方案中,一旦已确定受试者患有癌症(例如,宫颈癌、子宫内膜、卵巢或输卵管癌)或怀疑患有癌症,则可以向受试者施用治疗性干预或选择受试者进行治疗性干预。在一些实施方案中,其中在受试者中检测到癌症(例如,宫颈癌、子宫内膜癌、卵巢癌或输卵管癌)的存在,向所述受试者施用特异性靶向所述受试者的癌症(例如,存在于宫颈癌、子宫内膜癌、卵巢癌或输卵管癌中的遗传修饰)的治疗性干预。例如,当确定受试者患有卵巢癌时,可以施用适用于卵巢癌的治疗性干预。作为另一个实例,当确定受试者患有子宫内膜癌时,可以施用适用于子宫内膜癌的治疗性干预。在一些实施方案中,治疗性干预是化疗,例如,本文所述的任何基于铂的化疗剂(例如,顺铂、卡铂)或紫杉烷(例如,紫杉醇
Figure GDA0002675196410006641
或多西他赛
Figure GDA0002675196410006642
在一些实施方案中,化疗剂是白蛋白结合型紫杉醇
Figure GDA0002675196410006651
六甲密胺
Figure GDA0002675196410006652
卡培他滨
Figure GDA0002675196410006653
环磷酰胺
Figure GDA0002675196410006654
依托泊苷(VP-16)、吉西他滨
Figure GDA0002675196410006655
异环磷酰胺
Figure GDA0002675196410006656
伊立替康(CPT-11,
Figure GDA0002675196410006657
)、脂质体阿霉素
Figure GDA0002675196410006658
美法仑、培美曲塞
Figure GDA0002675196410006659
托泊替康或长春瑞滨
Figure GDA00026751964100066510
在一些实施方案中,治疗性干预是化疗剂的组合(例如,紫杉醇、异环磷酰胺和顺铂;长春碱、异环磷酰胺和顺铂;依托泊苷、异环磷酰胺和顺铂)。在一些实施方案中,治疗性干预是表观遗传疗法(参见例如,Smith等人(2017)Gynecol.Oncol.Rep.20:81-86)。在一些实施方案中,表观遗传疗法是DNA甲基转移酶(DNMT)抑制剂(例如,5-氮杂胞苷(5-AZA)、地西他滨(5-氮杂-2′-脱氧胞苷)(Fu等人(2011)Cancer 117(8):1661-1669;Falchook等人(2013)Investig.New Drugs 31(5):1192-1200;Matei等人(2012)CancerRes.72(9):2197-2205)。在一些实施方案中,DNMT1抑制剂是NY-ESO-1(Odunsi等人(2014)Cancer Immunol.Res.2(1):37-49)。在一些实施方案中,表观遗传疗法是组蛋白脱乙酰基酶(HDAC)抑制剂。在一些实施方案中,HDAC抑制剂是伏立诺他(Modesitt(2008)109(2):182-186)或贝利司他(Mackay等人(2010)Eur.J.Cancer 46(9):1573-1579)。在一些实施方案中,将HDAC抑制剂与化疗剂(例如卡铂(paraplatin)、顺铂、紫杉醇或多西他赛(taxotere))组合给予(Mendivil(2013)Int.J.Gynecol.Cancer 23(3):533-539;Dizon(2012)Gynecol.Oncol.125(2):367-371;Dizon(2012)Int J.Gynecol.Cancer 23(3):533-539)。在一些实施方案中,治疗性干预是抗血管生成剂(例如贝伐珠单抗)。在一些实施方案中,治疗性干预是聚(ADP-核糖)聚合酶(PARP)-1和/或PARP-2抑制剂。在一些实施方案中,PARP-1和PARP-2抑制剂是尼拉帕尼(zejula)(Scott(2017)Drugs doiL10.1007/s40265-017-0752)。在一些实施方案中,PARP抑制剂是奥拉帕尼(lynparza)或鲁卡帕尼(rubraca)。在一些实施方案中,治疗性干预是激素(例如,促黄体素释放激素(LHRH)激动剂)。在一些实施方案中,LHRH激动剂是戈舍瑞林
Figure GDA00026751964100066511
或亮丙瑞林
Figure GDA00026751964100066512
在一些实施方案中,治疗性干预是抗雌激素化合物(例如他莫昔芬)。在一些实施方案中,治疗性干预是芳香酶抑制剂(例如来曲唑
Figure GDA0002675196410006661
阿那曲唑
Figure GDA0002675196410006662
或依西美坦
Figure GDA0002675196410006663
在一些实施方案中,治疗性干预是手术(例如,肿瘤块的减积、子宫切除术、双侧输卵管-卵巢切除术、网膜切除术)。术语“减积”是指手术去除几乎整个肿瘤(“最佳减积”)。在一些实施方案中,减积可包括去除膀胱、脾、胆囊、胃、肝和/或胰腺的一部分。在一些实施方案中,在手术后(例如肿瘤块的减积、子宫切除术、双侧输卵管-卵巢切除术、网膜切除术)进一步向受试者施用辅助化疗。在一些实施方案中,辅助化疗是腹内(腹膜内)施用的。在一些实施方案中,治疗性干预是预防性手术(例如子宫切除术)。在一些实施方案中,执行穿刺术以去除腹水。
在一些实施方案中,一旦已根据本文提供的各种方法中的任一种确定受试者患有癌症(例如,膀胱癌或UTUC),则可以向受试者施用治疗性干预或选择受试者进行治疗性干预。例如,当确定受试者患有膀胱癌时,可以施用适用于膀胱癌的治疗性干预。适用于膀胱癌的此类治疗性干预包括但不限于经尿道膀胱切除术(TURB)、膀胱内BCG(卡介苗)、膀胱内化疗、辅助化疗、新辅助化疗、膀胱切除术或膀胱前列腺切除术、放疗、免疫疗法、免疫检查点抑制剂或以上的任何组合。作为另一个实例,当确定受试者患有UTUC时,可以施用适用于UTUC的治疗性干预。适用于UTUC的此类治疗性干预包括但不限于经尿道切除术、膀胱内BCG(卡介苗)、膀胱内化疗、辅助化疗、新辅助化疗、输尿管切除术或肾输尿管切除术、放疗、免疫疗法、免疫检查点抑制剂或以上的任何组合。
在一些实施方案中,检测到的癌症是低级别肿瘤(例如,低恶性潜力的赘生物(PUNLMP)或非浸润性低级别乳头状尿路上皮癌)。在一些实施方案中,一旦已确定受试者患有低级别肿瘤,则可以向受试者施用治疗性干预或选择受试者进行包括经尿道的膀胱切除术(TURB)在内的治疗性干预。
在一些实施方案中,其中在受试者中检测到结直肠癌的存在,向所述受试者施用特异性靶向所述受试者的结直肠癌(例如,存在于结直肠癌中的遗传修饰)的治疗性干预。在一些实施方案中,向受试者施用抗EGFR单克隆抗体(例如,西妥昔单抗或帕尼单抗)(Cunningham等人(2004)N.Engl.J.Med.351(4):337-345)。在一些实施方案中,治疗性干预是抗血管生成剂。在一些实施方案中,抗血管生成剂是贝伐珠单抗(Avastin)(Hurwitz等人(2004)N.Engl.J.Med.350:2335-2342)。在一些实施方案中,抗血管生成剂是VEGF抑制剂(例如,阿柏西普(Tang等人(2008)J.Clin.Oncol 26(May 20 suppl;abstr 4027);瓦他拉尼(PTK/ZK222584;Hecht等人(2005)ASCO Annual Meeting ProceedingsJ.Clin.Oncol.23:16S(abstr.LBA3));舒尼替尼(Saltz等人(2007)J.Clin.Oncol.25:4793-4799);AZD2171(Rosen等人(2007)J.Clin.Oncol.25:2369-76);AMG 706(Drevis等人(2007)25:3045-2054))。在一些实施方案中,贝伐珠单抗与化疗治疗一起施用(参见例如,Hurwitz等人(2004)N.Engl.J.Med.350:2335-2342;Gruenberger等人(2008)J.Clin.Oncol.26:1830-1835)。可以在患有结直肠癌的受试者中使用的化疗治疗的非限制性实例包括:5-FU、亚叶酸、奥沙利铂(Eloxatin)、卡培他滨、塞来昔布(celecoxib)和舒林酸(sulindac)。在一些实施方案中,使用化疗剂的组合,例如,FOLFOX(5-FU、亚叶酸和奥沙利铂)、FOLFIRI(亚叶酸、5-FU和伊立替康(Camptosar)、CapeOx(卡培他滨(Xeloda)和奥沙利铂)。在一些实施方案中,治疗性干预是雷帕霉素(mTOR)抑制剂的哺乳动物靶标(例如,雷帕霉素类似物(Kesmodel等人(2007)Gastrointestinal Cancers Symposium(abstr234));RAD-001(Tabernero等人(2008)J.Clin.Oncol.26:1603-1610)。在一些实施方案中,治疗性干预是蛋白激酶C拮抗剂(例如,恩扎妥林(enzastaurin)(Camidge等人(2008)Anticancer Drugs 19:77-84,Resta等人(2008)J.Clin.Oncol.26(May 20 suppl)(abstr3529))。在一些实施方案中,治疗性干预是非受体酪氨酸激酶Src的抑制剂(例如AZ0530(Tabernero等人(2007)J.Clin.Oncol.25:18S(abstr 3520)))。在一些实施方案中,治疗性干预是纺锤体驱动蛋白(KSP)的抑制剂(例如,伊斯平斯(ispinesib)(SB-715992)(Chu等人(2004)J.Clin.Oncol.22:14S(abstr 2078),Burris等人(2004)J.Clin.Oncol.22:128(abstr 2004)))。
在一些实施方案中,其中在受试者中检测到肺癌的存在,向所述受试者施用特异性靶向所述受试者的肺癌(例如,存在于肺癌中的遗传修饰)的治疗性干预。在一些实施方案中,治疗性干预是化疗,例如,本文所述的任何基于铂的化疗剂(例如,顺铂、卡铂)或紫杉烷(例如,紫杉醇
Figure GDA0002675196410006681
或多西他赛
Figure GDA0002675196410006682
在一些实施方案中,化疗剂是白蛋白结合型紫杉醇
Figure GDA0002675196410006683
六甲密胺
Figure GDA0002675196410006684
卡培他滨
Figure GDA0002675196410006685
环磷酰胺
Figure GDA0002675196410006686
依托泊苷(VP-16)、吉西他滨
Figure GDA0002675196410006687
异环磷酰胺
Figure GDA0002675196410006688
伊立替康(CPT-11,
Figure GDA0002675196410006689
)、脂质体阿霉素
Figure GDA00026751964100066810
美法仑、培美曲塞
Figure GDA00026751964100066811
托泊替康或长春瑞滨
Figure GDA00026751964100066812
在一些实施方案中,治疗性干预是化疗剂的组合(例如,紫杉醇、异环磷酰胺和顺铂;长春碱、异环磷酰胺和顺铂;依托泊苷、异环磷酰胺和顺铂)。在一些实施方案中,治疗性干预是表观遗传疗法(参见例如,Smith等人(2017)Gynecol.Oncol.Rep.20:81-86)。在一些实施方案中,表观遗传疗法是DNA甲基转移酶(DNMT)抑制剂(例如,5-氮杂胞苷(5-AZA)、地西他滨(5-氮杂-2′-脱氧胞苷)(Fu等人(2011)Cancer 117(8):1661-1669;Falchook等人(2013)Investig.New Drugs 31(5):1192-1200;Matei等人(2012)Cancer Res.72(9):2197-2205)。在一些实施方案中,DNMT1抑制剂是NY-ESO-1(Odunsi等人(2014)Cancer Immunol.Res.2(1):37-49)。在一些实施方案中,表观遗传疗法是组蛋白脱乙酰基酶(HDAC)抑制剂。在一些实施方案中,HDAC抑制剂是伏立诺他(Modesitt(2008)109(2):182-186)或贝利司他(Mackay等人(2010)Eur.J.Cancer 46(9):1573-1579)。在一些实施方案中,将HDAC抑制剂与化疗剂(例如卡铂(paraplatin)、顺铂、紫杉醇或多西他赛(taxotere))组合给予(Mendivil(2013)Int.J.Gynecol.Cancer 23(3):533-539;Dizon(2012)Gynecol.Oncol.125(2):367-371;Dizon(2012)IntJ.Gynecol.Cancer 23(3):533-539)。在一些实施方案中,治疗性干预是抗血管生成剂(例如贝伐珠单抗)。在一些实施方案中,治疗性干预是聚(ADP-核糖)聚合酶(PARP)-1和/或PARP-2抑制剂。在一些实施方案中,PARP-1和PARP-2抑制剂是尼拉帕尼(zejula)(Scott(2017)Drugs doiL10.1007/s40265-017-0752)。在一些实施方案中,PARP抑制剂是奥拉帕尼(lynparza)或鲁卡帕尼(rubraca)。在一些实施方案中,治疗性干预是激素(例如,促黄体素释放激素(LHRH)激动剂)。在一些实施方案中,LHRH激动剂是戈舍瑞林
Figure GDA0002675196410006691
或亮丙瑞林
Figure GDA0002675196410006692
在一些实施方案中,治疗性干预是抗雌激素化合物(例如他莫昔芬)。在一些实施方案中,治疗性干预是芳香酶抑制剂(例如来曲唑
Figure GDA0002675196410006693
阿那曲唑
Figure GDA0002675196410006694
或依西美坦
Figure GDA0002675196410006695
在一些实施方案中,治疗性干预是手术(例如,肿瘤块的减积、子宫切除术、双侧输卵管-卵巢切除术、网膜切除术)。术语“减积”是指手术去除几乎整个肿瘤(“最佳减积”)。在一些实施方案中,减积可包括去除膀胱、脾、胆囊、胃、肝和/或胰腺的一部分。在一些实施方案中,在手术后(例如肿瘤块的减积、子宫切除术、双侧输卵管-卵巢切除术、网膜切除术)进一步向受试者施用辅助化疗。在一些实施方案中,辅助化疗是腹内(腹膜内)施用的。在一些实施方案中,治疗性干预是预防性手术(例如子宫切除术)。在一些实施方案中,执行穿刺术以去除腹水。
在一些实施方案中,其中在受试者中检测到乳腺癌的存在,向所述受试者施用特异性靶向所述受试者的乳腺癌(例如,存在于乳腺癌中的遗传修饰)的治疗性干预。在一些实施方案中,靶向药物疗法是HER2抑制剂(例如曲妥珠单抗(Herceptin)、帕妥珠单抗(perjeta);曲妥珠单抗-美坦新偶联物(ado-trastuzumab emtansine)(T-DM1;Kadcyla);拉帕替尼(Tykerb)、来那替尼)。参见例如,Baselga等人(2012)N Engl J Med 366:109-119;Konecny等人(2006)Cancer Res 66:1630-1639,Xia等人(2007)Cancer Res.67:1170-1175;Gomez等人(2008)J Clin Oncol 26:2999-30005;Wong等人(2009)Clin.CancerRes.15:2552-2558;Agus等人(2002)Cancer Cell 2:127-137;Lewis Philips等人(2008)Cancer Res 68:9280-9290。在一些实施方案中,靶向药物疗法是细胞周期蛋白依赖性激酶抑制剂(例如CDK4/6抑制剂(例如,帕博西尼(palbociclib)
Figure GDA0002675196410006701
瑞博西尼(ribociclin)
Figure GDA0002675196410006702
玻玛西尼(abemaciclib))(Turner等人(2015)N Engl J Med373:209-219;Finn等人(2016)N Eng J Med 375:1925-1936;Ehab和Elbaz(2016)BreastCancer 8:83-91;Xu等人(2017)J Hematol.Oncol.10(1):97;Corona等人(2017)Cri RevOncol Hematol 112:208-214;Barroso-Sousa等人(2016)Breast Care 11(3):167-173))。在一些实施方案中,靶向药物疗法是PARP抑制剂(例如,奥拉帕尼(AZD2281)、维利帕尼(veliparib)(ABT-888)、尼拉帕尼(MK-4827)、他拉唑帕尼(talazoparib)(BMN-673)、鲁卡帕尼(AG-14699)、CEP-9722)。参见例如Audeh等人(2010)Lancet 376:245-251;Fong等人(2009)N Engl J Med 361:123-134;Livrahi和Garber(2015)BMC Medicine 13:188;Kaufamn等人(2015)J Clin.Oncol.33:244-250;Gelmon等人(2011)Lancet Oncol.12:852-61;Isakoff等人(2011)Cancer Res 71:P3-16-05;Sandhu等人(2013)Lancet Oncol 14:882-92;Tutt等人(2010)Lancet 376:235-44;Somlo等人(2013)J.Clin.Oncol.31:1024;Shen等人(2013)CLin.Cancer Res.19(18):5003-15;Awada等人(2016)Anticancer Drugs27(4):342-8。在一些实施方案中,靶向药物疗法是mTOR抑制剂(例如,依维莫司(afinitor))。参见例如,Gong等人(2017)Oncotarget doi:10.18632/oncotarget.16336;Louseberg等人(2017)Breast Cancer 10:239-252;Hare和Harvey(2017)Am J Cancer Res7(3):383-404。在一些实施方案中,靶向药物疗法是热休克蛋白90抑制剂(例如,坦螺旋霉素(tanespimycin))(Modi等人(2008)J.Clin Oncol.26:s1027;Miller等人(2007)J.Clin.Oncol.25:s1115;Schulz等人(2012)J Exp Med 209(2):275-89)。在一些实施方案中,靶向药物疗法还包括骨改性药物(例如,双膦酸盐或狄诺塞麦(Xgeva))。参见例如,Ethier等人(2017)Curr Oncol Rep 19(3):15;Abdel-Rahman(2016)Expert RevAnticancer Ther 16(8):885-91。在一些实施方案中,治疗性干预是激素(例如,促黄体素释放激素(LHRH)激动剂)。在一些实施方案中,LHRH激动剂是戈舍瑞林
Figure GDA0002675196410006703
或亮丙瑞林
Figure GDA0002675196410006704
在一些实施方案中,治疗性干预是抗雌激素化合物(例如,他莫昔芬、氟维司群(faslodex))。在一些实施方案中,治疗性干预是芳香酶抑制剂(例如来曲唑
Figure GDA0002675196410006711
阿那曲唑
Figure GDA0002675196410006712
或依西美坦
Figure GDA0002675196410006713
在一些实施方案中,治疗性干预是手术(例如,乳房切除术、单侧乳房切除术、双侧乳房切除术、全乳房切除术、改良的根治性乳房切除术、前哨淋巴结活检、腋窝淋巴结清扫术、保乳手术)。手术去除的程度将取决于乳腺癌的分期和总体预后。在一些实施方案中,治疗性干预是放疗。在一些实施方案中,放疗是部分乳房照射或强度调制放疗。在一些实施方案中,治疗性干预是化疗(例如,卡培他滨(xeloda)、卡铂(paraplatin)、顺铂(platinol)、环磷酰胺(neosar)、多西他赛(docefrez,taxotere)、阿霉素(Adriamycin)、聚乙二醇化脂质体阿霉素(doxil)、表柔比星(ellence)、氟尿嘧啶(5-FU,adrucil)、吉西他滨(gemzar)、甲氨蝶呤、紫杉醇(taxol)、蛋白结合型紫杉醇(abraxane)、长春瑞滨(navelbine)、艾瑞布林(halaven)或伊沙匹隆(ixempra))。在一些实施方案中,治疗性干预是至少两种化疗剂的组合(例如,阿霉素和环磷酰胺(AC);表柔比星和环磷酰胺(EC);环磷酰胺、阿霉素和5-FU(CAF);环磷酰胺、表柔比星和5-FU(CEF);环磷酰胺、甲氨蝶呤和5-FU(CMF);表柔比星和环磷酰胺(EC);多西他赛、阿霉素和环磷酰胺(TAC);多西他赛和环磷酰胺(TC)。
在一些实施方案中,在检测到或鉴定出癌症之后向受试者施用治疗性干预。可以施用本文公开的或本领域已知的任何治疗性干预。示例性治疗性干预包括但不限于激酶抑制剂、免疫检查点抑制剂(例如PD-1、PD-L1和/或CTLA-4免疫检查点抑制剂)、化疗剂、过继性T细胞疗法(例如,嵌合抗原受体和/或具有野生型或修饰的T细胞受体的T细胞)、抗体、双特异性抗体或其片段(例如,BiTE)、化疗、辅助化疗、新辅助化疗、细胞毒性疗法、激素疗法、免疫疗法、单克隆抗体、放疗、信号转导抑制剂、手术(例如,手术切除)、靶向疗法诸如施用激酶抑制剂(例如,靶向诸如易位或突变的特定遗传病变的激酶抑制剂)或其任何组合。此类治疗性干预可以单独或组合施用。在本文所述的任一方法的一些实施方案中,在已经检测到癌细胞之后,向受试者依次或同时施用一种或多种治疗性干预。在一些实施方案中,可以在受试者患有早期癌症的时间施用治疗性干预,并且其中与在稍后的时间向受试者施用治疗性干预相比,所述治疗性干预更有效。在一些实施方案中,治疗性干预可以降低癌症的严重性、减轻癌症的症状和/或减少受试者体内存在的癌细胞的数量。
在一些实施方案中,治疗性干预可以包括免疫检查点抑制剂。免疫检查点抑制剂的非限制性实例包括纳武单抗(Opdivo)、派姆单抗(Keytruda)、阿特朱单抗(tecentriq)、阿利库单抗(bavencio)、度伐鲁单抗(imfinzi)、伊匹单抗(yervoy)。参见例如,Pardoll(2012)Nat.Rev Cancer 12:252-264;Sun等人(2017)Eur Rev Med Pharmacol Sci 21(6):1198-1205;Hamanishi等人(2015)J.Clin.Oncol.33(34):4015-22;Brahmer等人(2012)NEngl J Med 366(26):2455-65;Ricciuti等人(2017)J.Thorac Oncol.12(5):e51-e55;Ellis等人(2017)Clin Lung Cancer pii:S1525-7304(17)30043-8;Zou和Awad(2017)AnnOncol 28(4):685-687;Sorscher(2017)N Engl J Med 376(10:996-7;Hui等人(2017)AnnOncol 28(4):874-881;Vansteenkiste等人(2017)Expert Opin Biol Ther 17(6):781-789;Hellmann等人(2017)Lancet Oncol.18(1):31-41;Chen(2017)J.Chin Med Assoc 80(1):7-14。
在一些实施方案中,治疗性干预是过继性T细胞疗法(例如,嵌合抗原受体和/或具有野生型或修饰的T细胞受体的T细胞)。参见例如,Rosenberg和Restifo(2015)Science348(6230):62-68;Chang和Chen(2017)Trends Mol Med 23(5):430-450;Yee和Lizee(2016)Cancer J.23(2):144-148;Chen等人(2016)Oncoimmunology 6(2):e1273302;US2016/0194404;US 2014/0050788;US 2014/0271635;US 9,233,125;它们以引用的方式整体并入本文。
在一些实施方案中,治疗性干预是化疗剂。化疗剂的非限制性实例包括:安吖啶、阿扎胞苷、阿扎硫嘌呤(axathioprine)、贝伐珠单抗(或其抗原结合片段)、博莱霉素、白消安、卡铂、卡培他滨、苯丁酸氮芥、顺铂、环磷酰胺、阿糖胞苷、达卡巴嗪、柔红霉素、多西他赛、去氧氟尿苷、阿霉素、表柔比星、盐酸厄洛替尼、依托泊苷、氟达拉滨(fiudarabine)、氟尿苷、氟达拉滨(fludarabine)、氟尿嘧啶、吉西他滨、羟基脲、伊达比星、异环磷酰胺、伊立替康、洛莫司汀、氮芥、美法仑、巯嘌呤、甲氨蝶呤、丝裂霉素、米托蒽醌、奥沙利铂、紫杉醇、培美曲塞、甲基苄肼、全反式视黄酸、链佐星、他氟泊苷(tafluposide)、替莫唑胺、替尼泊苷、硫鸟嘌呤(tioguanine)、托泊替康、乌拉莫司汀(uramustine)、伐柔比星、长春碱、长春新碱、长春地辛、长春瑞滨及其组合。另外的抗癌疗法的实例是本领域中已知的;参见例如,美国临床肿瘤学会(ASCO)、欧洲医学肿瘤学会(ESMO)或美国国立综合癌症网络(NCCN)的疗法指南。
在一些实施方案中,当受试者被鉴定为在NRAS中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在NRAS中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在NRAS中具有遗传生物标记物的受试者施用的治疗性干预是RAS靶向治疗剂、受体酪氨酸激酶抑制剂、Ras-Raf-MEK-ERK途径抑制剂、PI3K-Akt-mTOR途径抑制剂和法呢基转移酶抑制剂中的一种或多种。在一些实施方案中,Ras-Raf-MEK-ERK途径抑制剂是BRAF抑制剂、MEK抑制剂和ERK抑制剂中的一种或多种。在一些实施方案中,BRAF抑制剂是维罗非尼
Figure GDA0002675196410006731
达拉非尼
Figure GDA0002675196410006732
和康奈非尼(BRAFTOVITM)、BMS-908662(XL281)、索拉非尼、LGX818、PLX3603、RAF265、RO5185426、GSK2118436、ARQ 736、GDC-0879、PLX-4720、AZ304、PLX-8394、HM95573、RO5126766和LXH254中的一种或多种。在一些实施方案中,MEK抑制剂是曲美替尼(
Figure GDA0002675196410006733
GSK1120212)、考比替尼
Figure GDA0002675196410006741
比美替尼(
Figure GDA0002675196410006743
MEK162)、司美替尼(AZD6244)、PD0325901、MSC1936369B、SHR7390、TAK-733、RO5126766、CS3006、WX-554、PD98059、CI1040(PD184352)和寄端霉素中的一种或多种。在一些实施方案中,ERK抑制剂是FRI-20(ON-01060)、VTX-11e、25-OH-D3-3-BE(B3CD,溴乙酰氧基骨化二醇)、FR-180204、AEZ-131(AEZS-131)、AEZS-136、AZ-13767370、BL-EI-001、LY-3214996、LTT-462、KO-947、KO-947、MK-8353(SCH900353)、SCH772984、优舒替尼(BVD-523)、CC-90003、GDC-0994(RG-7482)、ASN007、FR148083、5-7-奥索恩诺、5-碘代杀结核菌素、GDC0994和ONC201中的一种或多种。在一些实施方案中,PI3K-Akt-mTOR途径抑制剂是PI3K抑制剂、AKT抑制剂和mTOR抑制剂中的一种或多种。在一些实施方案中,PI3K抑制剂是布帕尼西(BKM120)、阿培利司(BYL719)、WX-037、考泮利司(ALIQOPATM,BAY80-6946)、达托里昔布(NVP-BEZ235,BEZ-235)、他塞利西(GDC-0032,RG7604)、索诺利塞(PX-866)、CUDC-907、PQR309、ZSTK474、SF1126、AZD8835、GDC-0077、ASN003、皮克立西(GDC-0941)、皮拉里昔布(XL147,SAR245408)、吉达利塞(PF-05212384,PKI-587)、色雷利塞(TAK-117,MLN1117,INK1117)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、AMG 511、CH5132799、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)、PKI-402、渥曼青霉素、LY294002、PI-103、利戈舍替、XL-765、LY2023414、SAR260301、KIN-193(AZD-6428)、GS-9820、AMG319和GSK2636771中的一种或多种。在一些实施方案中,AKT抑制剂是米替福新
Figure GDA0002675196410006742
渥曼青霉素、NL-71-101、H-89、GSK690693、CCT128930、AZD5363、帕他色替(GDC-0068,RG7440)、A-674563、A-443654、AT7867、AT13148、优普色替、阿弗色替、DC120、2-[4-(2-氨基丙-2-基)苯基]-3-苯基喹喔啉、MK-2206、依地福新、米替福新、哌立福新、芥酸磷酸胆碱、erufosine、SR13668、OSU-A9、PH-316、PHT-427、PIT-1、DM-PIT-1、曲西立滨(磷酸曲西立滨一水合物)、API-1、N-(4-(5-(3-乙酰胺基苯基)-2-(2-氨基吡啶-3-基)-3H-咪唑并[4,5-b]吡啶-3-基)苄基)-3-氟苯甲酰胺、ARQ092、BAY 1125976、3-氧代-甘遂酸、乳醌霉素、boc-Phe-乙烯基酮、哌立福新(D-21266)、TCN、TCN-P、GSK2141795和ONC201中的一种或多种。在一些实施方案中,mTOR抑制剂是MLN0128、AZD-2014、CC-223、AZD2014、CC-115、依维莫司(RAD001)、替西罗莫司(CCI-779)、地磷莫司(AP-23573)和西罗莫司(雷帕霉素)中的一种或多种。在一些实施方案中,法呢基转移酶抑制剂是洛那法尼、替吡法尼、BMS-214662、L778123、L744832和FTI-277中的一种或多种。在一些实施方案中,向在NRAS中具有遗传生物标记物的受试者施用的治疗性干预是MEK抑制剂和PI3K抑制剂。在一些实施方案中,向在NRAS中具有遗传生物标记物的受试者施用的治疗性干预是MEK抑制剂和ERK抑制剂。对于治疗在NRAS中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在NRAS中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在NRAS中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在CTNNB1中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在CTNNB1中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在CTNNB1中具有遗传生物标记物的受试者施用的治疗性干预是β-连环蛋白抑制剂、WNT/β-连环蛋白信号传导抑制剂和纺锤体组装检查点激酶TTK(MPS1)抑制剂中的一种或多种。在一些实施方案中,β-连环蛋白抑制剂是PRI-724、CWP232291、PNU74654、2,4-二氨基喹唑啉、PKF115-584、PKF118-744、PKF118-310、PFK222-815、CGP 049090、ZTM000990、BC21、维生素D、视黄酸、阿司匹林、舒林酸(
Figure GDA0002675196410006761
Aflodac)、2,4二氨基-喹唑啉衍生物、3-{[(4-甲基苯基)磺酰基]氨基}苯甲酸甲酯(MSAB)、AV65、iCRT3、iCRT5和iCRT14。在一些实施方案中,WNT/β-连环蛋白信号传导抑制剂是PRI-724、CWP232291、PNU74654、2,4二氨基-喹唑啉、PKF115-584、PKF118-744、PKF118-310、PFK222-815、CGP 049090、ZTM000990、BC21、维生素D、视黄酸、阿司匹林、舒林酸(
Figure GDA0002675196410006762
Aflodac)、2,4二氨基-喹唑啉衍生物、3-{[(4-甲基苯基)磺酰基]氨基}苯甲酸甲酯(MSAB)、AV65、iCRT3、iCRT5、iCRT14、SM04554、LGK 974、XAV939、姜黄素(例如,
Figure GDA0002675196410006763
)、槲皮素、表没食子儿茶素没食子酸酯(EGCC)、白藜芦醇、DIF、染料木黄酮、塞来昔布
Figure GDA0002675196410006764
CWP232291、NSC668036、FJ9、BML-286(3289-8625)、IWP、IWP-1、IWP-2、JW55、G007-LK、吡维铵、foxy-5、Wnt-5a、艾非纳西肽(OMP-54F28)、凡地吐单抗(OMP-18R5)、OTSA 101、OTSA101-DTPA-90Y、SM04690、SM04755、nutlin-3a、XAV939、IWR1、JW74、冈田酸、互变霉素、SB239063、SB203580、二磷酸腺苷(羟甲基)吡咯烷二醇(ADP-HPD)、2-[4-(4-氟苯基)哌嗪-1-基]-6-甲基嘧啶-4(3H)-酮、PJ34、氯硝柳胺(NICLOCIDETM)、cambinol、舒林酸(
Figure GDA0002675196410006765
Aflodac)、J01-017a、NSC668036、菲律宾菌素、IC261、PF670462、博舒替尼
Figure GDA0002675196410006766
PHA665752、伊马替尼
Figure GDA0002675196410006767
ICG-001、依他尼酸、依他尼酸衍生物、皮克立西(GDC-0941)、Rp-8-Br-cAMP、SDX-308、WNT974、CGX1321、ETC-1922159、AD-REIC/Dkk3、WIKI4和windorphen中的一种或多种。在一些实施方案中,纺锤体组装检查点激酶TTK(MPS1)抑制剂是NTRC 0066-0、CFI-402257、(5,6-二氢)嘧啶并[4,5-e]吲哚嗪和BOS172722中的一种或多种。对于治疗在CTNNB1中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在CTNNB1中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在CTNNB1中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在PIK3CA中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在PIK3CA中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在PIK3CA中具有遗传生物标记物的受试者施用的治疗性干预是PI3K-α抑制剂、panPI3K抑制剂以及PI3K和mTOR双重抑制剂中的一种或多种。在一些实施方案中,PI3Kα抑制剂是他塞利西(GDC-0032、RG7604)、GDC-0077、色雷利塞(TAK-117、MLN1117、INK 1117)、阿培利司(BYL719)和CH5132799。在一些实施方案中,panPI3K抑制剂是布帕尼西(BKM120)、考泮利司(ALIQOPATM、BAY80-6946)、索诺利塞(PX-866)、ZSTK474、皮克立西(GDC-0941)、皮拉里昔布(XL147、SAR245408)、AMG 511、PKI-402、渥曼青霉素、LY294002和WX-037。在一些实施方案中,PI3K和mTOR双重抑制剂是达托里昔布(NVP-BEZ235,BEZ-235)、PQR309、SF1126、吉达利塞(PF-05212384,PKI-587)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)和PI-103。在一些实施方案中,向在PIK3CA中具有遗传生物标记物的受试者施用的治疗性干预是布帕尼西(BKM120)、阿培利司(BYL719)、WX-037、考泮利司(ALIQOPATM,BAY80-6946)、达托里昔布(NVP-BEZ235,BEZ-235)、他塞利西(GDC-0032,RG7604)、索诺利塞(PX-866)、CUDC-907、PQR309、ZSTK474、SF1126、AZD8835、GDC-0077、ASN003、皮克立西(GDC-0941)、皮拉里昔布(XL147,SAR245408)、吉达利塞(PF-05212384,PKI-587)、色雷利塞(TAK-117,MLN1117,INK 1117)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、AMG 511、CH5132799、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)、PKI-402、渥曼青霉素、LY294002、PI-103、利戈舍替、XL-765、LY2023414、SAR260301、KIN-193(AZD-6428)、GS-9820、AMG319和GSK2636771中的一种或多种。对于治疗在PIK3CA中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在PIK3CA中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在PIK3CA中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在FBXW7中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在FBXW7中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在FBXW7中具有遗传生物标记物的受试者施用的治疗性干预是mTOR抑制剂和MCL-1抑制剂中的一种或多种。在一些实施方案中,mTOR抑制剂是MLN0128、AZD-2014、CC-223、AZD2014、CC-115、依维莫司(RAD001)、替西罗莫司(CCI-779)、地磷莫司(AP-23573)和西罗莫司(雷帕霉素)中的一种或多种。在一些实施方案中,MCL-1抑制剂是S63845、AZD5991、AMG 176、483-LM和MIK665。对于治疗在FBXW7中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在FBXW7中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在FBXW7中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在APC中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在APC中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在APC中具有遗传生物标记物的受试者施用的治疗性干预是TASIN-1(截短的APC选择性抑制剂)和WWNT/β-连环蛋白信号传导抑制剂中的一种或多种。在一些实施方案中,WNT/β-连环蛋白信号传导抑制剂是PRI-724、CWP232291、PNU74654、2,4二氨基-喹唑啉、PKF115-584、PKF118-744、PKF118-310、PFK222-815、CGP 049090、ZTM000990、BC21、维生素D、视黄酸、阿司匹林、舒林酸(
Figure GDA0002675196410006791
Aflodac)、2,4二氨基-喹唑啉衍生物、3-{[(4-甲基苯基)磺酰基]氨基}苯甲酸甲酯(MSAB)、AV65、iCRT3、iCRT5、iCRT14、PRI-724、CWP232291、PNU74654、2,4二氨基-喹唑啉、PKF115-584、PKF118-744、PKF118-310、PFK222-815、CGP 049090、ZTM000990、BC21、维生素D、视黄酸、阿司匹林、舒林酸(
Figure GDA0002675196410006792
Aflodac)、2,4二氨基-喹唑啉衍生物、3-{[(4-甲基苯基)磺酰基]氨基}苯甲酸甲酯(MSAB)、AV65、iCRT3、iCRT5、iCRT14、SM04554、LGK 974、XAV939、姜黄素(例如,
Figure GDA0002675196410006801
)、槲皮素、表没食子儿茶素没食子酸酯(EGCC)、白藜芦醇、DIF、染料木黄酮、塞来昔布
Figure GDA0002675196410006802
CWP232291、NSC668036、FJ9、BML-286(3289-8625)、IWP、IWP-1、IWP-2、JW55、G007-LK、吡维铵、foxy-5、Wnt-5a、艾非纳西肽(OMP-54F28)、凡地吐单抗(OMP-18R5)、OTSA 101、OTSA101-DTPA-90Y、SM04690、SM04755、nutlin-3a、XAV939、IWR1、JW74、冈田酸、互变霉素、SB239063、SB203580、二磷酸腺苷(羟甲基)吡咯烷二醇(ADP-HPD)、2-[4-(4-氟苯基)哌嗪-1-基]-6-甲基嘧啶-4(3H)-酮、PJ34、氯硝柳胺(NICLOCIDETM)、cambinol、舒林酸(
Figure GDA0002675196410006803
Aflodac)、J01-017a、NSC668036、菲律宾菌素、IC261、PF670462、博舒替尼
Figure GDA0002675196410006804
PHA665752、伊马替尼
Figure GDA0002675196410006805
ICG-001、依他尼酸、依他尼酸衍生物、皮克立西(GDC-0941)、Rp-8-Br-cAMP、SDX-308、WNT974、CGX1321、ETC-1922159、AD-REIC/Dkk3、WIKI4和windorphen中的一种或多种。对于治疗在APC中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在APC中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在APC中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在EGFR中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在EGFR中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在EGFR中具有遗传生物标记物的受试者施用的治疗性干预是EGFR选择性抑制剂、panHER抑制剂和抗EGFR抗体中的一种或多种。在一些实施方案中,EGFR抑制剂是共价抑制剂。在一些实施方案中,EGFR抑制剂是非共价抑制剂。在一些实施方案中,向在EGFR中具有遗传生物标记物的受试者施用的治疗性干预是奥希替尼(AZD9291、迈瑞替尼(merelectinib)、TAGRISSOTM)、厄洛替尼
Figure GDA0002675196410006811
吉非替尼
Figure GDA0002675196410006812
西妥昔单抗
Figure GDA0002675196410006813
奈西妥木单抗(necitumumab)(PORTRAZZATM,IMC-11F8)、来那替尼(HKI-272,
Figure GDA0002675196410006814
)、拉帕替尼
Figure GDA0002675196410006815
帕尼单抗(ABX-EGF,
Figure GDA0002675196410006816
)、凡德他尼
Figure GDA0002675196410006817
诺司替尼(rociletinib)(CO-1686)、奥姆替尼(olmutinib)(OLITATM,HM61713,BI-1482694)、naquotinib(ASP8273)、nazartinib(EGF816,NVS-816)、PF-06747775、艾克替尼(BPI-2009H)、阿法替尼(BIBW 2992,
Figure GDA0002675196410006818
)、达可替尼(PF-00299804,PF-804,PF-299,PF-299804)、艾维替尼(avitinib)(AC0010)、AC0010MA EAI045、马妥珠单抗(EMD-7200)、尼妥珠单抗(h-R3,
Figure GDA0002675196410006819
)、zalutumab、MDX447、depatuxizumab(人源化mAb806,ABT-806)、depatuxizumab mafodotin(ABT-414)、ABT-806、mAb 806、卡奈替尼(CI-1033)、紫草醌、紫草醌衍生物(例如,脱氧紫草醌、异丁酰紫草醌、乙酰紫草醌、β,β-二甲基丙烯酰紫草醌和乙酰阿卡宁)、波齐替尼(poziotinib)(NOV120101,HM781-36B)、AV-412、依鲁替尼、WZ4002、布格替尼(AP26113,
Figure GDA00026751964100068110
)、培利替尼(EKB-569)、他罗替尼(tarloxotinib)(TH-4000,PR610)、BPI-15086、Hemay022、ZN-e4、tesevatinib(KD019,XL647)、YH25448、依吡替尼(epitinib)(HMPL-813)、CK-101、MM-151、AZD3759、ZD6474、PF-06459988、varlintinib(ASLAN001,ARRY-334543)、AP32788、HLX07、D-0316、AEE788、HS-10296、艾维替尼、GW572016、吡咯替尼(pyrotinib)(SHR1258)、SCT200、CPGJ602、Sym004、MAb-425、莫妥昔单抗(Modotuximab)(TAB-H49)、氟妥昔单抗(futuximab)(992DS)、扎鲁妥木单抗(zalutumumab)、KL-140、RO5083945、IMGN289、JNJ-61186372、LY3164530、Sym013、AMG 595、EGFRBi武装的自体T细胞和EGFR CAR-T疗法中的一种或多种。对于治疗在EGFR中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在EGFR中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在EGFR中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在BRAF中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在BRAF中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在BRAF中具有遗传生物标记物的受试者施用的治疗性干预是维罗非尼
Figure GDA0002675196410006821
达拉非尼
Figure GDA0002675196410006822
和康奈非尼(BRAFTOVITM)、BMS-908662(XL281)、索拉非尼、LGX818、PLX3603、RAF265、RO5185426、GSK2118436、ARQ 736、GDC-0879、PLX-4720、AZ304、PLX-8394、HM95573、RO5126766和LXH254中的一种或多种。在一些实施方案中,向在BRAF中具有遗传生物标记物的受试者施用的治疗性干预是BRAF抑制剂和MEK抑制剂。在一些实施方案中,BRAF抑制剂是维罗非尼
Figure GDA0002675196410006823
达拉非尼
Figure GDA0002675196410006824
和康奈非尼(BRAFTOVITM)、BMS-908662(XL281)、索拉非尼、LGX818、PLX3603、RAF265、RO5185426、GSK2118436、ARQ 736、GDC-0879、PLX-4720、AZ304、PLX-8394、HM95573、RO5126766或LXH254,并且MEK抑制剂是曲美替尼(
Figure GDA0002675196410006831
GSK1120212)、考比替尼
Figure GDA0002675196410006832
比美替尼(
Figure GDA0002675196410006833
MEK162)、司美替尼(AZD6244)、PD0325901、MSC1936369B、SHR7390、TAK-733、RO5126766、CS3006、WX-554、PD98059、CI1040(PD184352)或寄端霉素。在一些实施方案中,向在BRAF中具有遗传生物标记物的受试者施用的治疗性干预是BRAF抑制剂和ERK抑制剂。在一些实施方案中,BRAF抑制剂是维罗非尼
Figure GDA0002675196410006834
达拉非尼
Figure GDA0002675196410006835
和康奈非尼(BRAFTOVITM)、BMS-908662(XL281)、索拉非尼、LGX818、PLX3603、RAF265、RO5185426、GSK2118436、ARQ 736、GDC-0879、PLX-4720、AZ304、PLX-8394、HM95573、RO5126766或LXH254,并且ERK抑制剂是FRI-20(ON-01060)、VTX-11e、25-OH-D3-3-BE(B3CD,溴乙酰氧基骨化二醇)、FR-180204、AEZ-131(AEZS-131)、AEZS-136、AZ-13767370、BL-EI-001、LY-3214996、LTT-462、KO-947、KO-947、MK-8353(SCH900353)、SCH772984、优舒替尼(BVD-523)、CC-90003、GDC-0994(RG-7482)、ASN007、FR148083、5-7-奥索恩诺、5-碘代杀结核菌素、GDC0994或ONC201。对于治疗在BRAF中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在BRAF中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在BRAF中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在CDNK2A中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在CDNK2A中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在CDNK2A中具有遗传生物标记物的受试者施用的治疗性干预是CDK4/6抑制剂。在一些实施方案中,CDK4/6抑制剂是帕博西尼、瑞博西尼和玻玛西尼中的一种或多种。对于治疗在CDNK2A中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在CDNK2A中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在CDNK2A中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在CDKN2中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在CDKN2中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在CDKN2中具有遗传生物标记物的受试者施用的治疗性干预是CDK4/6抑制剂。在一些实施方案中,CDK4/6抑制剂是帕博西尼、瑞博西尼和玻玛西尼中的一种或多种。对于治疗在CDKN2中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在CDKN2中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在CDKN2中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在PTEN中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在PTEN中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在PTEN中具有遗传生物标记物的受试者施用的治疗性干预是PI3K/AKT/mTOR信号途径抑制剂和PARP抑制剂中的一种或多种。在一些实施方案中,PI3K-Akt-mTOR途径抑制剂是PI3K抑制剂、AKT抑制剂和mTOR抑制剂中的一种或多种。在一些实施方案中,PI3K抑制剂是布帕尼西(BKM120)、阿培利司(BYL719)、WX-037、考泮利司(ALIQOPATM,BAY80-6946)、达托里昔布(NVP-BEZ235,BEZ-235)、他塞利西(GDC-0032,RG7604)、索诺利塞(PX-866)、CUDC-907、PQR309、ZSTK474、SF1126、AZD8835、GDC-0077、ASN003、皮克立西(GDC-0941)、皮拉里昔布(XL147,SAR245408)、吉达利塞(PF-05212384,PKI-587)、色雷利塞(TAK-117,MLN1117,INK 1117)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、AMG 511、CH5132799、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)、PKI-402、渥曼青霉素、LY294002、PI-103、利戈舍替、XL-765、LY2023414、SAR260301、KIN-193(AZD-6428)、GS-9820、AMG319和GSK2636771中的一种或多种。在一些实施方案中,AKT抑制剂是米替福新
Figure GDA0002675196410006851
渥曼青霉素、NL-71-101、H-89、GSK690693、CCT128930、AZD5363、帕他色替(GDC-0068,RG7440)、A-674563、A-443654、AT7867、AT13148、优普色替、阿弗色替、DC120、2-[4-(2-氨基丙-2-基)苯基]-3-苯基喹喔啉、MK-2206、依地福新、米替福新、哌立福新、芥酸磷酸胆碱、erufosine、SR13668、OSU-A9、PH-316、PHT-427、PIT-1、DM-PIT-1、曲西立滨(磷酸曲西立滨一水合物)、API-1、N-(4-(5-(3-乙酰胺基苯基)-2-(2-氨基吡啶-3-基)-3H-咪唑并[4,5-b]吡啶-3-基)苄基)-3-氟苯甲酰胺、ARQ092、BAY 1125976、3-氧代-甘遂酸、乳醌霉素、boc-Phe-乙烯基酮、哌立福新(D-21266)、TCN、TCN-P、GSK2141795和ONC201中的一种或多种。在一些实施方案中,mTOR抑制剂是MLN0128、AZD-2014、CC-223、AZD2014、CC-115、依维莫司(RAD001)、替西罗莫司(CCI-779)、地磷莫司(AP-23573)和西罗莫司(雷帕霉素)中的一种或多种。在一些实施方案中,法呢基转移酶抑制剂是洛那法尼、替吡法尼、BMS-214662、L778123、L744832和FTI-277中的一种或多种。在一些实施方案中,PARP抑制剂是奥拉帕尼、维利帕尼、依尼帕尼(iniparib)、鲁卡帕尼、CEP-9722、E7016或E7449中的一种或多种。对于治疗在PTEN中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在PTEN中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在PTEN中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在FGFR2中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在FGFR2中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在FGFR2中具有遗传生物标记物的受试者施用的治疗性干预是抗FGFR2抗体、FGFR2选择性抑制剂和pan-FGFR抑制剂中的一种或多种。在一些实施方案中,治疗性干预是共价FGFR2抑制剂(例如,PRN1371、BLU9931、FIIN-4、H3B-6527和FIIN-2)。在一些实施方案中,治疗性干预是非共价FGFR2抑制剂(例如,AZD4547、BGJ398、Debio-1347、多韦替尼(dovitinib)、JNJ-42756493和LY2874455)。在一些实施方案中,抗FGFR2抗体是GP369、BAY1187982或FPA144(贝马妥珠单抗(bemarituzumab))。在一些实施方案中,治疗性干预是PRN1371、BLU9931、FIIN-4、H3B-6527、NVP-BGJ398、ARQ087、TAS-120、JNJ-42756493、CH5183284/Debio1347、INCB054828、GP369、BAY1187982或FPA144(贝马妥珠单抗)、NVP-BGJ398、JNJ-42756493(厄达替尼(erdafitinib))、罗加替尼(rogaratinib)(BAY1163877)、FIIN-2、JNJ-42756493、LY2874455、乐伐替尼(E7080)、帕纳替尼(AP24534)、瑞格拉非尼(BAY 73-4506)、多韦替尼(TKI258)、德立替尼(lucitanib)(E3810)、西地尼布(AZD2171)、intedanib(BIBF 1120)、布立尼布(BMS-540215)、ASP5878、AZD4547、BGJ398(英菲替尼(infigratinib))、E7090、HMPL-453、尼达尼布(
Figure GDA0002675196410006871
BIBF 1120)、MAX-40279、XL999、奥兰替尼(SU6668)、帕唑帕尼
Figure GDA0002675196410006872
安洛替尼(anlotinib)、AL3818中的一种或多种。对于治疗在FGFR2中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在FGFR2中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在FGFR2中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在HRAS中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在HRAS中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在HRAS中具有遗传生物标记物的受试者施用的治疗性干预是RAS靶向治疗剂、受体酪氨酸激酶抑制剂、Ras-Raf-MEK-ERK途径抑制剂、PI3K-Akt-mTOR途径抑制剂和法呢基转移酶抑制剂中的一种或多种。在一些实施方案中,Ras-Raf-MEK-ERK途径抑制剂是BRAF抑制剂、MEK抑制剂和ERK抑制剂中的一种或多种。在一些实施方案中,BRAF抑制剂是维罗非尼
Figure GDA0002675196410006881
达拉非尼
Figure GDA0002675196410006882
和康奈非尼(BRAFTOVITM)、BMS-908662(XL281)、索拉非尼、LGX818、PLX3603、RAF265、RO5185426、GSK2118436、ARQ 736、GDC-0879、PLX-4720、AZ304、PLX-8394、HM95573、RO5126766和LXH254中的一种或多种。在一些实施方案中,MEK抑制剂是曲美替尼(
Figure GDA0002675196410006883
GSK1120212)、考比替尼
Figure GDA0002675196410006884
比美替尼(
Figure GDA0002675196410006885
MEK162)、司美替尼(selumetinib)(AZD6244)、PD0325901、MSC1936369B、SHR7390、TAK-733、RO5126766、CS3006、WX-554、PD98059、CI1040(PD184352)和寄端霉素中的一种或多种。在一些实施方案中,ERK抑制剂是FRI-20(ON-01060)、VTX-11e、25-OH-D3-3-BE(B3CD,溴乙酰氧基骨化二醇)、FR-180204、AEZ-131(AEZS-131)、AEZS-136、AZ-13767370、BL-EI-001、LY-3214996、LTT-462、KO-947、KO-947、MK-8353(SCH900353)、SCH772984、优舒替尼(BVD-523)、CC-90003、GDC-0994(RG-7482)、ASN007、FR148083、5-7-奥索恩诺、5-碘代杀结核菌素、GDC0994和ONC201中的一种或多种。在一些实施方案中,PI3K-Akt-mTOR途径抑制剂是PI3K抑制剂、AKT抑制剂和mTOR抑制剂中的一种或多种。在一些实施方案中,PI3K抑制剂是布帕尼西(BKM120)、阿培利司(BYL719)、WX-037、考泮利司(ALIQOPATM,BAY80-6946)、达托里昔布(NVP-BEZ235,BEZ-235)、他塞利西(GDC-0032,RG7604)、索诺利塞(PX-866)、CUDC-907、PQR309、ZSTK474、SF1126、AZD8835、GDC-0077、ASN003、皮克立西(GDC-0941)、皮拉里昔布(XL147,SAR245408)、吉达利塞(PF-05212384,PKI-587)、色雷利塞(TAK-117,MLN1117,INK1117)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、AMG 511、CH5132799、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)、PKI-402、渥曼青霉素、LY294002、PI-103、利戈舍替、XL-765、LY2023414、SAR260301、KIN-193(AZD-6428)、GS-9820、AMG319和GSK2636771中的一种或多种。在一些实施方案中,AKT抑制剂是米替福新
Figure GDA0002675196410006891
渥曼青霉素、NL-71-101、H-89、GSK690693、CCT128930、AZD5363、帕他色替(GDC-0068,RG7440)、A-674563、A-443654、AT7867、AT13148、优普色替、阿弗色替、DC120、2-[4-(2-氨基丙-2-基)苯基]-3-苯基喹喔啉、MK-2206、依地福新、米替福新、哌立福新、芥酸磷酸胆碱、erufosine、SR13668、OSU-A9、PH-316、PHT-427、PIT-1、DM-PIT-1、曲西立滨(磷酸曲西立滨一水合物)、API-1、N-(4-(5-(3-乙酰胺基苯基)-2-(2-氨基吡啶-3-基)-3H-咪唑并[4,5-b]吡啶-3-基)苄基)-3-氟苯甲酰胺、ARQ092、BAY 1125976、3-氧代-甘遂酸、乳醌霉素、boc-Phe-乙烯基酮、哌立福新(D-21266)、TCN、TCN-P、GSK2141795和ONC201中的一种或多种。在一些实施方案中,mTOR抑制剂是MLN0128、AZD-2014、CC-223、AZD2014、CC-115、依维莫司(RAD001)、替西罗莫司(CCI-779)、地磷莫司(AP-23573)和西罗莫司(雷帕霉素)中的一种或多种。在一些实施方案中,法呢基转移酶抑制剂是洛那法尼、替吡法尼、BMS-214662、L778123、L744832和FTI-277中的一种或多种。在一些实施方案中,向在HRAS中具有遗传生物标记物的受试者施用的治疗性干预是MEK抑制剂和PI3K抑制剂。在一些实施方案中,向在HRAS中具有遗传生物标记物的受试者施用的治疗性干预是MEK抑制剂和ERK抑制剂。对于治疗在HRAS中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在HRAS中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在HRAS中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在KRAS中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在KRAS中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在KRAS中具有遗传生物标记物的受试者施用的治疗性干预是RAS靶向治疗剂、受体酪氨酸激酶抑制剂、Ras-Raf-MEK-ERK途径抑制剂、PI3K-Akt-mTOR途径抑制剂和法呢基转移酶抑制剂中的一种或多种。在一些实施方案中,靶向RAS的治疗剂是SML-10-70-4和AA12中的一种或多种。在一些实施方案中,Ras-Raf-MEK-ERK途径抑制剂是BRAF抑制剂、MEK抑制剂和ERK抑制剂中的一种或多种。在一些实施方案中,BRAF抑制剂是维罗非尼
Figure GDA0002675196410006901
达拉非尼
Figure GDA0002675196410006902
和康奈非尼(BRAFTOVITM)、BMS-908662(XL281)、索拉非尼、LGX818、PLX3603、RAF265、RO5185426、GSK2118436、ARQ 736、GDC-0879、PLX-4720、AZ304、PLX-8394、HM95573、RO5126766和LXH254中的一种或多种。在一些实施方案中,MEK抑制剂是曲美替尼(
Figure GDA0002675196410006903
GSK1120212)、考比替尼
Figure GDA0002675196410006904
比美替尼(
Figure GDA0002675196410006905
MEK162)、司美替尼(AZD6244)、PD0325901、MSC1936369B、SHR7390、TAK-733、RO5126766、CS3006、WX-554、PD98059、CI1040(PD184352)和寄端霉素中的一种或多种。在一些实施方案中,ERK抑制剂是FRI-20(ON-01060)、VTX-11e、25-OH-D3-3-BE(B3CD,溴乙酰氧基骨化二醇)、FR-180204、AEZ-131(AEZS-131)、AEZS-136、AZ-13767370、BL-EI-001、LY-3214996、LTT-462、KO-947、KO-947、MK-8353(SCH900353)、SCH772984、优舒替尼(BVD-523)、CC-90003、GDC-0994(RG-7482)、ASN007、FR148083、5-7-奥索恩诺、5-碘代杀结核菌素、GDC0994和ONC201中的一种或多种。在一些实施方案中,PI3K-Akt-mTOR途径抑制剂是PI3K抑制剂、AKT抑制剂和mTOR抑制剂中的一种或多种。在一些实施方案中,PI3K抑制剂是布帕尼西(BKM120)、阿培利司(BYL719)、WX-037、考泮利司(ALIQOPATM,BAY80-6946)、达托里昔布(NVP-BEZ235,BEZ-235)、他塞利西(GDC-0032,RG7604)、索诺利塞(PX-866)、CUDC-907、PQR309、ZSTK474、SF1126、AZD8835、GDC-0077、ASN003、皮克立西(GDC-0941)、皮拉里昔布(XL147,SAR245408)、吉达利塞(PF-05212384,PKI-587)、色雷利塞(TAK-117,MLN1117,INK1117)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、AMG 511、CH5132799、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)、PKI-402、渥曼青霉素、LY294002、PI-103、利戈舍替、XL-765、LY2023414、SAR260301、KIN-193(AZD-6428)、GS-9820、AMG319和GSK2636771中的一种或多种。在一些实施方案中,AKT抑制剂是米替福新
Figure GDA0002675196410006911
渥曼青霉素、NL-71-101、H-89、GSK690693、CCT128930、AZD5363、帕他色替(GDC-0068,RG7440)、A-674563、A-443654、AT7867、AT13148、优普色替、阿弗色替、DC120、2-[4-(2-氨基丙-2-基)苯基]-3-苯基喹喔啉、MK-2206、依地福新、米替福新、哌立福新、芥酸磷酸胆碱、erufosine、SR13668、OSU-A9、PH-316、PHT-427、PIT-1、DM-PIT-1、曲西立滨(磷酸曲西立滨一水合物)、API-1、N-(4-(5-(3-乙酰胺基苯基)-2-(2-氨基吡啶-3-基)-3H-咪唑并[4,5-b]吡啶-3-基)苄基)-3-氟苯甲酰胺、ARQ092、BAY 1125976、3-氧代-甘遂酸、乳醌霉素、boc-Phe-乙烯基酮、哌立福新(D-21266)、TCN、TCN-P、GSK2141795和ONC201中的一种或多种。在一些实施方案中,mTOR抑制剂是MLN0128、AZD-2014、CC-223、AZD2014、CC-115、依维莫司(RAD001)、替西罗莫司(CCI-779)、地磷莫司(AP-23573)和西罗莫司(雷帕霉素)中的一种或多种。在一些实施方案中,法呢基转移酶抑制剂是洛那法尼、替吡法尼、BMS-214662、L778123、L744832和FTI-277中的一种或多种。在一些实施方案中,向在KRAS中具有遗传生物标记物的受试者施用的治疗性干预是MEK抑制剂和PI3K抑制剂。在一些实施方案中,向在KRAS中具有遗传生物标记物的受试者施用的治疗性干预是MEK抑制剂和ERK抑制剂。对于治疗在KRAS中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在KRAS中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在KRAS中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在AKT1中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在AKT1中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在AKT1中具有遗传生物标记物的受试者施用的治疗性干预是米替福新
Figure GDA0002675196410006921
渥曼青霉素、NL-71-101、H-89、GSK690693、CCT128930、AZD5363、帕他色替(GDC-0068,RG7440)、A-674563、A-443654、AT7867、AT13148、优普色替、阿弗色替、DC120、2-[4-(2-氨基丙-2-基)苯基]-3-苯基喹喔啉、MK-2206、依地福新、米替福新、哌立福新、芥酸磷酸胆碱、erufosine、SR13668、OSU-A9、PH-316、PHT-427、PIT-1、DM-PIT-1、曲西立滨(磷酸曲西立滨一水合物)、API-1、N-(4-(5-(3-乙酰胺基苯基)-2-(2-氨基吡啶-3-基)-3H-咪唑并[4,5-b]吡啶-3-基)苄基)-3-氟苯甲酰胺、ARQ092、BAY 1125976、3-氧代-甘遂酸、乳醌霉素、boc-Phe-乙烯基酮、哌立福新(D-21266)、TCN、TCN-P、GSK2141795和ONC201中的一种或多种。对于治疗在AKT1中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在AKT1中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在AKT1中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在TP53中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在TP53中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在TP53中具有遗传生物标记物的受试者施用的治疗性干预是p53重激活和诱导大量凋亡-1(PRIMA-1)、APR-246(PRIMA-1MET)、2-磺酰基嘧啶诸如PK11007、吡唑诸如PK7088、锌金属伴侣-1(ZMC1;NSC319726/ZMC 1)、胺苯硫脲(例如COTI-2)、CP-31398、STIMA-1(诱导大量凋亡的SH基团靶向化合物)、MIRA-1(NSC19630)及其类似物MIRA-2和MIRA-3、RITA(NSC652287)、黑毛霉素(CTM)、PK7088、斑点酸(NSC87511)、p53R3、SCH529074、WR-1065、Hsp90抑制剂(例如17-AAG、格尔德霉素、ganetespib、AUY922、IPI-504)、HDAC抑制剂(例如伏立诺他/SAHA、罗米地辛/缩酚酸肽、HBI-8000)、砷化合物、藤黄酸、spautin-1、YK-3-237、NSC59984、双硫仑(DSF)、庆大霉素、G418和阿米卡霉素(amikamicin)、重激活转录活性(RETRA)、PD0166285、MDM2的抑制剂(例如RG7112(RO5045337)、RO5503781、MI-773(SAR405838)、DS-3032b、AM-8553、AMG232、MI-219、MI-713、MI-888、TDP521252、NSC279287、PXN822、SAH-8(订书肽)、ATSP-7041、螺旋低聚物(spiroligomer)、PK083、PK5174、PK5196、PK7088、nutlin 3a、RG7388、Ro-2443、斑点酸和NSC319726)以及MDM4的抑制剂中的一种或多种。对于治疗在TP53中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在TP53中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在TP53中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在PPP2R1A中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在PPP2R1A中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在PPP2R1A中具有遗传生物标记物的受试者施用的治疗性干预是PP2A的活化剂诸如SET抑制剂(例如,FTY-720、神经酰胺和OP449)中的一种或多种。对于治疗在PPP2R1A中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在PPP2R1A中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在PPP2R1A中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在GNAS中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在GNAS中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在GNAS中具有遗传生物标记物的受试者施用的治疗性干预是Ras-Raf-MEK-ERK途径抑制剂和WNT/β-连环蛋白信号传导抑制剂中的一种或多种。在一些实施方案中,Ras-Raf-MEK-ERK途径抑制剂是BRAF抑制剂、MEK抑制剂和ERK抑制剂中的一种或多种。在一些实施方案中,BRAF抑制剂是维罗非尼
Figure GDA0002675196410006951
达拉非尼
Figure GDA0002675196410006952
和康奈非尼(BRAFTOVITM)、BMS-908662(XL281)、索拉非尼、LGX818、PLX3603、RAF265、RO5185426、GSK2118436、ARQ 736、GDC-0879、PLX-4720、AZ304、PLX-8394、HM95573、RO5126766和LXH254中的一种或多种。在一些实施方案中,MEK抑制剂是曲美替尼(
Figure GDA0002675196410006953
GSK1120212)、考比替尼
Figure GDA0002675196410006954
比美替尼(
Figure GDA0002675196410006955
MEK162)、司美替尼(AZD6244)、PD0325901、MSC1936369B、SHR7390、TAK-733、RO5126766、CS3006、WX-554、PD98059、CI1040(PD184352)和寄端霉素中的一种或多种。在一些实施方案中,ERK抑制剂是FRI-20(ON-01060)、VTX-11e、25-OH-D3-3-BE(B3CD,溴乙酰氧基骨化二醇)、FR-180204、AEZ-131(AEZS-131)、AEZS-136、AZ-13767370、BL-EI-001、LY-3214996、LTT-462、KO-947、KO-947、MK-8353(SCH900353)、SCH772984、优舒替尼(BVD-523)、CC-90003、GDC-0994(RG-7482)、ASN007、FR148083、5-7-奥索恩诺、5-碘代杀结核菌素、GDC0994和ONC201中的一种或多种。在一些实施方案中,WNT/β-连环蛋白信号传导抑制剂是PRI-724、CWP232291、PNU74654、2,4二氨基-喹唑啉、PKF115-584、PKF118-744、PKF118-310、PFK222-815、CGP 049090、ZTM000990、BC21、维生素D、视黄酸、阿司匹林、舒林酸(
Figure GDA0002675196410006961
Aflodac)、2,4二氨基-喹唑啉衍生物、3-{[(4-甲基苯基)磺酰基]氨基}苯甲酸甲酯(MSAB)、AV65、iCRT3、iCRT5、iCRT14、PRI-724、CWP232291、PNU74654、2,4二氨基-喹唑啉、PKF115-584、PKF118-744、PKF118-310、PFK222-815、CGP 049090、ZTM000990、BC21、维生素D、视黄酸、阿司匹林、舒林酸(
Figure GDA0002675196410006967
Aflodac)、2,4二氨基-喹唑啉衍生物、3-{[(4-甲基苯基)磺酰基]氨基}苯甲酸甲酯(MSAB)、AV65、iCRT3、iCRT5、iCRT14、SM04554、LGK 974、XAV939、姜黄素(例如,
Figure GDA0002675196410006962
)、槲皮素、表没食子儿茶素没食子酸酯(EGCC)、白藜芦醇、DIF、染料木黄酮、塞来昔布
Figure GDA0002675196410006963
CWP232291、NSC668036、FJ9、BML-286(3289-8625)、IWP、IWP-1、IWP-2、JW55、G007-LK、吡维铵、foxy-5、Wnt-5a、艾非纳西肽(OMP-54F28)、凡地吐单抗(OMP-18R5)、OTSA 101、OTSA101-DTPA-90Y、SM04690、SM04755、nutlin-3a、XAV939、IWR1、JW74、冈田酸、互变霉素、SB239063、SB203580、二磷酸腺苷(羟甲基)吡咯烷二醇(ADP-HPD)、2-[4-(4-氟苯基)哌嗪-1-基]-6-甲基嘧啶-4(3H)-酮、PJ34、氯硝柳胺(NICLOCIDETM)、cambinol、舒林酸(
Figure GDA0002675196410006964
Aflodac)、J01-017a、NSC668036、菲律宾菌素、IC261、PF670462、博舒替尼
Figure GDA0002675196410006965
PHA665752、伊马替尼
Figure GDA0002675196410006966
ICG-001、依他尼酸、依他尼酸衍生物、皮克立西(GDC-0941)、Rp-8-Br-cAMP、SDX-308、WNT974、CGX1321、ETC-1922159、AD-REIC/Dkk3、WIKI4和windorphen中的一种或多种。对于治疗在GNAS中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在GNAS中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在GNAS中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在SMAD4中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在SMAD4中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在SMAD4中具有遗传生物标记物的受试者施用的治疗性干预是PI3K抑制剂、抗血管生成疗法和基于5-FU的化疗中的一种或多种。在一些实施方案中,PI3K抑制剂是布帕尼西(BKM120)、阿培利司(BYL719)、WX-037、考泮利司(ALIQOPATM,BAY80-6946)、达托里昔布(NVP-BEZ235,BEZ-235)、他塞利西(GDC-0032,RG7604)、索诺利塞(PX-866)、CUDC-907、PQR309、ZSTK474、SF1126、AZD8835、GDC-0077、ASN003、皮克立西(GDC-0941)、皮拉里昔布(XL147,SAR245408)、吉达利塞(PF-05212384,PKI-587)、色雷利塞(TAK-117,MLN1117,INK 1117)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、AMG 511、CH5132799、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)、PKI-402、渥曼青霉素、LY294002、PI-103、利戈舍替、XL-765、LY2023414、SAR260301、KIN-193(AZD-6428)、GS-9820、AMG319和GSK2636771中的一种或多种。在一些实施方案中,抗血管生成疗法是VEGFR1、VEGFR、VEGFR2、VEGFA、CDH5、EDNRA、ANGPT2、CD34和ANGPT中的一种或多种的抑制剂。在一些实施方案中,抗血管生成疗法是瓦他拉尼(PTK787/ZK222584)、TKI-538、舒尼替尼(SU11248,
Figure GDA0002675196410006981
)、帕唑帕尼
Figure GDA0002675196410006982
贝伐珠单抗
Figure GDA0002675196410006983
沙利度胺、来那度胺
Figure GDA0002675196410006984
兰尼单抗、EYE001和阿昔替尼(AG013736,
Figure GDA0002675196410006985
)中的一种或多种。对于治疗在SMAD4中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在SMAD4中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在SMAD4中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在POLE中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在POLE中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在POLE中具有遗传生物标记物的受试者施用的治疗性干预是免疫疗法和免疫检查点抑制剂中的一种或多种。对于治疗在POLE中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在POLE中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在POLE中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在RNF43中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在RNF43中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在RNF43中具有遗传生物标记物的受试者施用的治疗性干预是自体RNF43肽脉冲树突状细胞(DC)、RNF43肽脉冲DC、全身性低剂量白介素2和PORCN抑制剂中的一种或多种。在一些实施方案中,PORCN抑制剂是RXC0004、ETC-1922159、ETC-159、IWP-2、LGK974和WNT-C59中的一种或多种。对于治疗在RNF43中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在RNF43中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在RNF43中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在MAPK1中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在MAPK1中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在MAPK1中具有遗传生物标记物的受试者施用的治疗性干预是ERK抑制剂、MEK抑制剂、ERBB受体抑制剂(例如,EGFR抑制剂或HER2抑制剂)或PI3K-Akt-mTOR途径抑制剂中的一种或多种。在一些实施方案中,ERK抑制剂是FRI-20(ON-01060)、VTX-11e、25-OH-D3-3-BE(B3CD,溴乙酰氧基骨化二醇)、FR-180204、AEZ-131(AEZS-131)、AEZS-136、AZ-13767370、BL-EI-001、LY-3214996、LTT-462、KO-947、KO-947、MK-8353(SCH900353)、SCH772984、优舒替尼(BVD-523)、CC-90003、GDC-0994(RG-7482)、ASN007、FR148083、5-7-奥索恩诺、5-碘代杀结核菌素、GDC0994、ONC201中的一种或多种。在一些实施方案中,MEK抑制剂是曲美替尼(
Figure GDA0002675196410007001
GSK1120212)、考比替尼
Figure GDA0002675196410007002
比美替尼(
Figure GDA0002675196410007003
MEK162)、司美替尼(AZD6244)、PD0325901、MSC1936369B、SHR7390、TAK-733、RO5126766、CS3006、WX-554、PD98059、CI1040(PD184352)和寄端霉素中的一种或多种。在一些实施方案中,PI3K-Akt-mTOR途径抑制剂是PI3K抑制剂、AKT抑制剂和mTOR抑制剂中的一种或多种。在一些实施方案中,PI3K抑制剂是布帕尼西(BKM120)、阿培利司(BYL719)、WX-037、考泮利司(ALIQOPATM,BAY80-6946)、达托里昔布(NVP-BEZ235,BEZ-235)、他塞利西(GDC-0032,RG7604)、索诺利塞(PX-866)、CUDC-907、PQR309、ZSTK474、SF1126、AZD8835、GDC-0077、ASN003、皮克立西(GDC-0941)、皮拉里昔布(XL147,SAR245408)、吉达利塞(PF-05212384,PKI-587)、色雷利塞(TAK-117,MLN1117,INK 1117)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、AMG 511、CH5132799、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)、PKI-402、渥曼青霉素、LY294002、PI-103、利戈舍替、XL-765、LY2023414、SAR260301、KIN-193(AZD-6428)、GS-9820、AMG319和GSK2636771中的一种或多种。在一些实施方案中,AKT抑制剂是米替福新
Figure GDA0002675196410007004
渥曼青霉素、NL-71-101、H-89、GSK690693、CCT128930、AZD5363、帕他色替(GDC-0068,RG7440)、A-674563、A-443654、AT7867、AT13148、优普色替、阿弗色替、DC120、2-[4-(2-氨基丙-2-基)苯基]-3-苯基喹喔啉、MK-2206、依地福新、米替福新、哌立福新、芥酸磷酸胆碱、erufosine、SR13668、OSU-A9、PH-316、PHT-427、PIT-1、DM-PIT-1、曲西立滨(磷酸曲西立滨一水合物)、API-1、N-(4-(5-(3-乙酰胺基苯基)-2-(2-氨基吡啶-3-基)-3H-咪唑并[4,5-b]吡啶-3-基)苄基)-3-氟苯甲酰胺、ARQ092、BAY 1125976、3-氧代-甘遂酸、乳醌霉素、boc-Phe-乙烯基酮、哌立福新(D-21266)、TCN、TCN-P、GSK2141795和ONC201中的一种或多种。在一些实施方案中,mTOR抑制剂是MLN0128、AZD-2014、CC-223、AZD2014、CC-115、依维莫司(RAD001)、替西罗莫司(CCI-779)、地磷莫司(AP-23573)和西罗莫司(雷帕霉素)中的一种或多种。在一些实施方案中,HER2抑制剂是AZD8931、AST1306、AEE788、CP724714、CUDC101、TAK285、达可替尼、培利替尼、AC480、曲妥珠单抗
Figure GDA0002675196410007011
帕妥珠单抗
Figure GDA0002675196410007012
曲妥珠单抗-dkst(OGIVRI)、DXL-702、E-75、PX-104.1、ZW25、CP-724714、妥卡替尼(irbinitinib)(ARRY-380,ONT-380)、TAS0728、拉帕替尼
Figure GDA0002675196410007013
AST-1306、AEE-788、perlitinib(EKB-569)、阿法替尼(BIBW 2992,
Figure GDA0002675196410007014
)、来那替尼(HKI-272,
Figure GDA0002675196410007015
)、PKI-166、D-69491、HKI-357、AP32788、GW572016、卡奈替尼(CI-1033)、AC-480(BMS-599626)、达可替尼(PF299804,PF299)、RB-200h、ARRY-334543(ARRY-543,ASLAN001)、波齐替尼(NOV120101)、CUDC-101、大黄素、IDM-1、曲妥珠单抗-美坦新偶联物
Figure GDA0002675196410007016
Zemab、DS-8201a、T-DM1、抗HER2 CAR-T疗法、HER2-肽-Vakzine和HER2Bi-武装的活化T细胞中的一种或多种。在一些实施方案中,EGFR抑制剂是奥希替尼(AZD9291、迈瑞替尼、TAGRISSOTM)、厄洛替尼
Figure GDA0002675196410007017
吉非替尼
Figure GDA0002675196410007018
西妥昔单抗
Figure GDA0002675196410007019
奈西妥木单抗(PORTRAZZATM,IMC-11F8)、来那替尼(HKI-272,
Figure GDA00026751964100070110
)、拉帕替尼
Figure GDA00026751964100070111
帕尼单抗(ABX-EGF,
Figure GDA00026751964100070112
)、凡德他尼
Figure GDA00026751964100070113
诺司替尼(CO-1686)、奥姆替尼(OLITATM,HM61713,BI-1482694)、naquotinib(ASP8273)、nazartinib(EGF816,NVS-816)、PF-06747775、艾克替尼(BPI-2009H)、阿法替尼(BIBW 2992,
Figure GDA0002675196410007021
)、达可替尼(PF-00299804,PF-804,PF-299,PF-299804)、艾维替尼(AC0010)、AC0010MA EAI045、马妥珠单抗(EMD-7200)、尼妥珠单抗(h-R3,
Figure GDA0002675196410007022
)、zalutumab、MDX447、depatuxizumab(人源化mAb 806,ABT-806)、depatuxizumab mafodotin(ABT-414)、ABT-806、mAb 806、卡奈替尼(CI-1033)、紫草醌、紫草醌衍生物(例如,脱氧紫草醌、异丁酰紫草醌、乙酰紫草醌、β,β-二甲基丙烯酰紫草醌和乙酰阿卡宁)、波齐替尼(NOV120101,HM781-36B)、AV-412、依鲁替尼、WZ4002、布格替尼(AP26113,
Figure GDA0002675196410007023
)、培利替尼(EKB-569)、他罗替尼(TH-4000,PR610)、BPI-15086、Hemay022、ZN-e4、tesevatinib(KD019,XL647)、YH25448、依吡替尼(HMPL-813)、CK-101、MM-151、AZD3759、ZD6474、PF-06459988、varlintinib(ASLAN001,ARRY-334543)、AP32788、HLX07、D-0316、AEE788、HS-10296、艾维替尼、GW572016、吡咯替尼(SHR1258)、SCT200、CPGJ602、Sym004、MAb-425、莫妥昔单抗(TAB-H49)、氟妥昔单抗(992DS)、扎鲁妥木单抗、KL-140、RO5083945、IMGN289、JNJ-61186372、LY3164530、Sym013、AMG595、EGFRBi武装的自体T细胞和EGFR CAR-T疗法。对于治疗在MAPKl中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在MAPK1中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在MAPK1中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在PI3KR1中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在PI3KR1中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在PI3KR1中具有遗传生物标记物的受试者施用的治疗性干预是panPI3K抑制剂、PI3K和mTOR双重抑制剂以及Ras-Raf-MEK-ERK途径抑制剂中的一种或多种。在一些实施方案中,panPI3K抑制剂是布帕尼西(BKM120)、考泮利司(ALIQOPATM、BAY80-6946)、索诺利塞(PX-866)、ZSTK474、皮克立西(GDC-0941)、皮拉里昔布(XL147、SAR245408)、AMG 511、PKI-402、渥曼青霉素、LY294002和WX-037。在一些实施方案中,PI3K和mTOR双重抑制剂是达托里昔布(NVP-BEZ235,BEZ-235)、PQR309、SF1126、吉达利塞(PF-05212384,PKI-587)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)和PI-103。在一些实施方案中,向在PIK3CA中具有遗传生物标记物的受试者施用的治疗性干预是布帕尼西(BKM120)、阿培利司(BYL719)、WX-037、考泮利司(ALIQOPATM,BAY80-6946)、达托里昔布(NVP-BEZ235,BEZ-235)、他塞利西(GDC-0032,RG7604)、索诺利塞(PX-866)、CUDC-907、PQR309、ZSTK474、SF1126、AZD8835、GDC-0077、ASN003、皮克立西(GDC-0941)、皮拉里昔布(XL147,SAR245408)、吉达利塞(PF-05212384,PKI-587)、色雷利塞(TAK-117,MLN1117,INK 1117)、BGT-226(NVP-BGT226)、PF-04691502、阿哌利塞(GDC-0980)、奥米利塞(GSK2126458,GSK458)、沃塔里昔布(XL756,SAR245409)、AMG 511、CH5132799、GSK1059615、GDC-0084(RG7666)、VS-5584(SB2343)、PKI-402、渥曼青霉素、LY294002、PI-103、利戈舍替、XL-765、LY2023414、SAR260301、KIN-193(AZD-6428)、GS-9820、AMG319和GSK2636771中的一种或多种。在一些实施方案中,Ras-Raf-MEK-ERK途径抑制剂是BRAF抑制剂、MEK抑制剂和ERK抑制剂中的一种或多种。在一些实施方案中,BRAF抑制剂是维罗非尼
Figure GDA0002675196410007044
达拉非尼
Figure GDA0002675196410007041
和康奈非尼(BRAFTOVITM)、BMS-908662(XL281)、索拉非尼、LGX818、PLX3603、RAF265、RO5185426、GSK2118436、ARQ 736、GDC-0879、PLX-4720、AZ304、PLX-8394、HM95573、RO5126766和LXH254中的一种或多种。在一些实施方案中,MEK抑制剂是曲美替尼(
Figure GDA0002675196410007042
GSK1120212)、考比替尼
Figure GDA0002675196410007045
比美替尼(
Figure GDA0002675196410007043
MEK162)、司美替尼(AZD6244)、PD0325901、MSC1936369B、SHR7390、TAK-733、RO5126766、CS3006、WX-554、PD98059、CI1040(PD184352)和寄端霉素中的一种或多种。在一些实施方案中,ERK抑制剂是FRI-20(ON-01060)、VTX-11e、25-OH-D3-3-BE(B3CD,溴乙酰氧基骨化二醇)、FR-180204、AEZ-131(AEZS-131)、AEZS-136、AZ-13767370、BL-EI-001、LY-3214996、LTT-462、KO-947、KO-947、MK-8353(SCH900353)、SCH772984、优舒替尼(BVD-523)、CC-90003、GDC-0994(RG-7482)、ASN007、FR148083、5-7-奥索恩诺、5-碘代杀结核菌素、GDC0994和ONC201中的一种或多种。对于治疗在PI3KR1中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在PI3KR1中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在PI3KR1中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在FGFR3中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在FGFR3中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在FGFR3中具有遗传生物标记物的受试者施用的治疗性干预是抗FGFR3抗体、FGFR3选择性抑制剂和pan-FGFR抑制剂中的一种或多种。在一些实施方案中,治疗性干预是共价FGFR抑制剂(例如,PRN1371、BLU9931、FIIN-4、H3B-6527和FIIN-2)。在一些实施方案中,治疗性干预是非共价FGFR抑制剂(例如,AZD4547、BGJ398、Debio-1347、多韦替尼、JNJ-42756493和LY2874455)。在一些实施方案中,抗FGFR3抗体是MFGR1877S或B-701。在一些实施方案中,治疗性干预是MFGR1877S、B-701、FP-1039(GSK230)、NVP-BGJ398、JNJ-42756493(厄达替尼)、罗加替尼(BAY1163877)、FIIN-2、JNJ-42756493、LY2874455、乐伐替尼(E7080)、帕纳替尼(AP24534)、瑞格拉非尼(BAY 73-4506)、多韦替尼(TKI258)、德立替尼(E3810)、西地尼布(AZD2171)、intedanib(BIBF 1120)、布立尼布(BMS-540215)、ASP5878、AZD4547、BGJ398(英菲替尼)、Debio-1347、多韦替尼、E7090、HMPL-453、尼达尼布(
Figure GDA0002675196410007051
BIBF 1120)、MAX-40279、XL999、奥兰替尼(SU6668)、帕唑帕尼
Figure GDA0002675196410007052
安洛替尼和AL3818中的一种或多种。对于治疗在FGFR3中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在FGFR3中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在FGFR3中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在ERBB2中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在ERBB2中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在ERBB2中具有遗传生物标记物的受试者施用的治疗性干预是抗ERBB2抗体、选择性ERBB2抑制剂和pan-ERBB抑制剂中的一种或多种。在一些实施方案中,治疗性干预是共价ERBB2抑制剂。在一些实施方案中,治疗性干预是非共价ERBB2抑制剂。在一些实施方案中,向在ERBB2中具有遗传生物标记物的受试者施用的治疗性干预是AZD8931、AST1306、AEE788、CP724714、CUDC101、TAK285、达可替尼、培利替尼、AC480、曲妥珠单抗
Figure GDA0002675196410007061
帕妥珠单抗
Figure GDA0002675196410007062
曲妥珠单抗-dkst(OGIVRI)、DXL-702、E-75、PX-104.1、ZW25、CP-724714、妥卡替尼(ARRY-380,ONT-380)、TAS0728、拉帕替尼
Figure GDA0002675196410007063
Figure GDA0002675196410007064
AST-1306、AEE-788、perlitinib(EKB-569)、阿法替尼(BIBW 2992,
Figure GDA0002675196410007065
)、来那替尼(HKI-272,
Figure GDA0002675196410007066
)、PKI-166、D-69491、HKI-357、AP32788、GW572016、卡奈替尼(CI-1033)、AC-480(BMS-599626)、达可替尼(PF299804,PF299)、RB-200h、ARRY-334543(ARRY-543,ASLAN001)、波齐替尼(NOV120101)、CUDC-101、大黄素、IDM-1、曲妥珠单抗-美坦新偶联物
Figure GDA0002675196410007067
Zemab、DS-8201a、T-DM1、抗HER2CAR-T疗法、HER2-肽-Vakzine和HER2Bi-武装的活化T细胞中的一种或多种。对于治疗在ERBB2中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在ERBB2中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在ERBB2中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在MLL中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在MLL中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在MLL中具有遗传生物标记物的受试者施用的治疗性干预是胞嘧啶阿拉伯糖苷、全反式视黄酸(ATRA)、HDAC抑制剂(例如丙戊酸和HBI-8000)、DNA甲基转移酶抑制剂(例如地西他滨)、LSD1抑制剂(例如ORY1001(RG6016)、ORY1001(RG6016)、GSK2879552、GSK2879552、INCB059872、IMG7289和CC90011)、menin 1抑制剂(例如MI1、MI2、MI3、Mi2-2(MI-2-2)、MI463、MI503、MIV-6R)、DOLT1(组蛋白-赖氨酸KMT)抑制剂(例如EPZ004777、EPZ-5676、SGC0946、CN-SAH、SYC-522、SAH和SYC-534)和WDR5-MLL拮抗剂(例如MM-101、MM-102、MM-103、MM-401、WDR5-0101、WDR5-0102、WDR5-0103和OICR-9429)中的一种或多种。对于治疗在MLL中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在MLL中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在MLL中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在MET中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在MET中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在MET中具有遗传生物标记物的受试者施用的治疗性干预是MET抑制剂、HGF拮抗剂、抗HGF抗体(例如,利妥木单抗(rilotumumab)(AMG102)、芬克拉妥珠单抗(ficlatuzumab)(AV-299)和TAK701、YYB101)和多重激酶抑制剂(例如,替凡替尼(tivantinib)(ARQ 197)、格瓦替尼(golvatinib)(E7050)、卡博替尼(XL 184,BMS-907351)、福雷替尼(foretinib)(GSK1363089)、克唑替尼(PF-02341066)、MK-2461、BPI-9016M、BPI-9016M、TQ-B3139、MGCD265和MK-8033)。在一些实施方案中,MET抑制剂是卡马替尼(capmatinib)(INC280,INCB28060)、奥纳妥珠单抗(onartuzumab)(MetMAb)、萨沃利替尼(Savolitinib)、特泊替尼(tepotinib)(MSC2156119J,EMD1214063)、CE-35562、AMG-337、AMG-458、福雷替尼、PHA-665725、MK-2461、PF-04217903和SU11274、SU11274和PHA-665752、SAIT301、HS-10241、ARGX-111、MSC2156119J、谷美替尼(glumetinib)(SCC244)、EMD 1204831、AZD6094(萨沃利替尼,沃利替尼(volitinib),HMPL-504)、PLB1001、ABT-700、AMG 208、INCB028060、AL2846和PF-04217903中的一种或多种。在一些实施方案中,向在MET中具有遗传生物标记物的受试者施用的治疗性干预是卡马替尼(INC280,INCB28060)、奥纳妥珠单抗(MetMAb)、萨沃利替尼、特泊替尼(MSC2156119J,EMD1214063)、CE-35562、AMG-337、AMG-458、福雷替尼、PHA-665725、MK-2461、PF-04217903和SU11274、SU11274和PHA-665752、SAIT301、HS-10241、ARGX-111、MSC2156119J、谷美替尼(SCC244)、EMD 1204831、AZD6094(萨沃利替尼,沃利替尼,HMPL-504)、PLB1001、ABT-700、AMG 208、INCB028060、AL2846、PF-04217903、利妥木单抗(AMG102)、芬克拉妥珠单抗(AV-299)和TAK701、YYB101、替凡替尼(ARQ 197)、格瓦替尼(E7050)、卡博替尼(XL 184,BMS-907351)、福雷替尼(GSK1363089)、克唑替尼(PF-02341066)、MK-2461、BPI-9016M、BPI-9016M、TQ-B3139、MGCD265、MK-8033、ABBV-399、HTI-1066和JNJ-61186372中的一种或多种。对于治疗在MET中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在MET中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在MET中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在VHL中具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在VHL中具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在VHL中具有遗传生物标记物的受试者施用的治疗性干预是抗血管生成疗法(例如,VEGFR1、VEGFR、VEGFR2、VEGFA、CDH5、EDNRA、ANGPT2、CD34和ANGPT中的一种或多种的抑制剂)、瓦他拉尼(PTK787/ZK222584)、TKI-538、舒尼替尼(SU11248,
Figure GDA0002675196410007091
)、帕唑帕尼
Figure GDA0002675196410007092
贝伐珠单抗
Figure GDA0002675196410007093
沙利度胺、来那度胺
Figure GDA0002675196410007094
兰尼单抗、EYE001、阿昔替尼(AG013736,
Figure GDA0002675196410007095
)、c-KIT抑制剂(例如多韦替尼(TKI258))、HDAC抑制剂(例如伏立诺他和HBI-8000)、HIF-2α抑制剂(例如PT2385和PT2977)、Hsp90抑制剂(例如17烯丙基氨基-17-去甲氧基格尔德霉素、AUY922和IPI-504)以及生长因子和受体抑制剂(例如E10030)中的一种或多种。对于治疗在VHL中具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在VHL中具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在VHL中具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当受试者被鉴定为在TERT中(例如,在TRET启动子中)具有遗传生物标记物(例如,突变)时,向受试者施用治疗性干预。在一些实施方案中,将被鉴定为在TERT中(例如,在TRET启动子中)具有遗传生物标记物(例如,突变)的受试者鉴定为患有癌症(例如,基于所述遗传生物标记物的存在,单独地或与其他遗传生物标记物的存在和/或其他类别生物标记物的一个或多个成员的存在和/或本文所述的非整倍性的存在组合)。在一些实施方案中,向在TERT中(例如,在TERT启动子中)具有遗传生物标记物的受试者施用的治疗性干预是艾瑞布林、hTERT mRNA转染的树突状细胞疫苗(例如,AST-VAC1(hTERT-DC、GRNVAC1))、INO-1400、INO-1401、GX301、用hTERT、存活蛋白和肿瘤细胞衍生的mRNA转染的树突状细胞以及三氧化二砷中的一种或多种。对于治疗在TERT中(例如,在TERT启动子中)具有遗传生物标记物的受试者有效的其他治疗性干预是本领域中已知的。在一些实施方案中,向在TERT中(例如,在TERT启动子中)具有遗传生物标记物的受试者施用的治疗性干预在治疗受试者的癌症方面是有效的。例如,在施用对治疗在TERT中(例如,在TERT启动子中)具有遗传生物标记物的受试者有效的治疗性干预之后,可以减少受试者中的癌细胞的数量,可以减小受试者中的一种或多种肿瘤的大小,可以降低转移的速率或程度,可以完全或部分减轻与疾病或病症或病状相关联的症状,可以使疾病的状态稳定化(即,不恶化),并且/或者与未接受治疗时的预期存活相比,可以延长存活。
在一些实施方案中,当鉴定出受试者具有发展疾病的风险(例如,增加的风险)时(例如,使用本文所述的各种方法中的任一种),向受试者施用治疗性干预。在一些实施方案中,将被鉴定为具有发展疾病的风险(例如,增加的风险)的受试者(例如,使用本文所述的各种方法中的任一种)鉴定为具有发展癌症的风险(例如,如本文所述的基于一个或多个遗传生物标记物的存在、一个或多个蛋白质生物标记物的存在、一个或多个其他生物标记物的存在和/或非整倍性的存在)。在一些实施方案中,向被鉴定为具有发展癌症的风险的受试者施用的治疗性干预是化学预防。化学预防的非限制性实例包括非甾族抗炎剂(例如,阿司匹林、托芬那酸、吲哚美辛、塞来昔布、舒林酸硫化物、双氯芬酸、吲哚美辛、布洛芬、氟比洛芬、吡罗昔康、二氟尼柳、依托度酸、酮洛芬、萘普生、奥沙普嗪、水杨酰水杨酸和托美汀)、选择性雌激素受体调节剂(例如他莫昔芬(
Figure GDA0002675196410007111
SOLTAMOXTM)和雷洛昔芬
Figure GDA0002675196410007112
)、滴注BCG、伐柔比星、非那雄胺、度他雄胺、姜黄素、二去甲氧基姜黄素、二甲双胍、芳香酶抑制剂(例如依西美坦)、白藜芦醇、露那辛、维生素A、异硫氰酸盐、绿茶、木犀草素、染料木黄酮、番茄红素、苦瓜、醉茄素A、没药甾酮、硒化物、二硒化物、藏红花酸、胡椒碱、他汀类(3-羟基-3-甲基戊二酰辅酶A还原酶抑制剂)、类胡萝卜素、维生素A、类维生素A、叶酸、维生素C、维生素D、维生素E、钙、类黄酮和抗癌疫苗。在一些实施方案中,向被鉴定为具有发展乳腺癌的风险的受试者施用他莫昔芬和/或雷洛昔芬。在一些实施方案中,向被鉴定为具有发展膀胱癌的风险的受试者施用滴注BCG和/或伐柔比星。在一些实施方案中,向被鉴定为具有发展前列腺癌的风险的受试者施用非那雄胺和/或度他雄胺。在一些实施方案中,向被鉴定为具有发展结直肠赘生物形成的风险的受试者施用塞来昔布。
在一些实施方案中,治疗性干预可以导致受试者中癌症缓解的早期发作。在一些实施方案中,治疗性干预可以导致受试者中癌症缓解时间的增加。在一些实施方案中,治疗性干预可以导致受试者存活时间的增加。在一些实施方案中,治疗性干预可以导致受试者中实体原发性肿瘤的大小减小。在一些实施方案中,治疗性干预可以导致受试者中实体原发性肿瘤的体积减小。在一些实施方案中,治疗性干预可以导致受试者中转移瘤的大小减小。在一些实施方案中,治疗性干预可以导致受试者中转移瘤的体积减小。在一些实施方案中,治疗性干预可以导致受试者中的肿瘤负担减少。
在一些实施方案中,治疗性干预可以导致受试者的预后改善。在一些实施方案中,治疗性干预可以导致受试者中发展转移瘤的风险降低。在一些实施方案中,治疗性干预可以导致受试者中发展额外转移瘤的风险降低。在一些实施方案中,治疗性干预可以导致受试者中的癌细胞迁移减少。在一些实施方案中,治疗性干预可以导致受试者中的癌细胞侵袭减少。在一些实施方案中,治疗性干预可以导致受试者住院时间的减少。在一些实施方案中,治疗性干预可以导致受试者中肿瘤内癌症干细胞的存在减少。
在一些实施方案中,治疗性干预可以导致受试者中肿瘤微环境内免疫细胞浸润的增加。在一些实施方案中,治疗性干预可以导致受试者中肿瘤的肿瘤微环境内的免疫细胞组成改变。在一些实施方案中,治疗性干预可以导致将先前的免疫抑制性肿瘤微环境调节为免疫原性、炎性肿瘤微环境。在一些实施方案中,治疗性干预可以导致受试者中免疫抑制性肿瘤微环境的逆转。
在一些实施方案中,治疗性干预可以阻止受试者中的肿瘤进展。在一些实施方案中,治疗性干预可以延迟受试者中的肿瘤进展。在一些实施方案中,治疗性干预可以抑制受试者中的肿瘤进展。在一些实施方案中,治疗性干预可以抑制受试者中肿瘤的免疫检查点途径。在一些实施方案中,治疗性干预可以免疫调节受试者中肿瘤的肿瘤微环境。在一些实施方案中,治疗性干预可以免疫调节受试者中肿瘤的肿瘤宏观环境。
在一些实施方案中,治疗性干预可以减少受试者中存在的癌细胞的数量。例如,治疗性干预可以使受试者中存在的癌细胞数量减少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或更多。在一些实施方案中,治疗性干预可以减少受试者中存在的癌细胞的数量,使得没有癌细胞可被观察到。在一些实施方案中,治疗性干预可以减少受试者中存在的可观察到的肿瘤。
在一些实施方案中,可以在数天至数周范围的时间段内一次或多次向受试者施用一种或多种治疗性干预(例如,本文公开的化疗或其他适当的治疗性干预的任一种)。在一些实施方案中,可以将一种或多种治疗性干预配制成用于向患有癌症的受试者施用的药学上可接受的组合物。例如,可以将治疗有效量的治疗性干预(例如,化疗剂或免疫治疗剂)与一种或多种药学上可接受的载体(添加剂)和/或稀释剂一起配制。可以配制用于以固体或液体形式施用的药物组合物,所述形式包括但不限于无菌溶液、悬浮液、缓释制剂、片剂、胶囊剂、丸剂、散剂和颗粒剂。
可用于本文所述的药物组合物的药学上可接受的载体、填充剂和媒介物包括但不限于:离子交换剂、氧化铝、硬脂酸铝、卵磷脂、血清蛋白(诸如人血清白蛋白)、缓冲物质(诸如磷酸盐)、甘油、山梨酸、山梨酸钾、饱和植物脂肪酸的偏甘油酯混合物、水、盐或电解质(诸如硫酸鱼精蛋白、磷酸氢二钠、磷酸氢钾、氯化钠、锌盐)、胶态二氧化硅、三硅酸镁、聚乙烯吡咯烷酮、纤维素基物质、聚乙二醇、羧甲基纤维素钠、聚丙烯酸酯、蜡、聚乙烯-聚氧丙烯嵌段聚合物、聚乙二醇以及羊毛脂。
可以设计用于口服或肠胃外(包括皮下、肌内、静脉内和皮内)施用的含有一种或多种治疗性干预的药物组合物。当口服施用时,药物组合物可以呈丸剂、片剂或胶囊剂的形式。适用于肠胃外施用的组合物包括水性和非水性无菌注射溶液,其可以含有抗氧化剂、缓冲剂、抑菌剂以及使制剂与预期接受者的血液等渗的溶质。制剂可以存在于单剂量或多剂量容器中,例如密封的安瓿和小瓶中,并且可以储存于冷冻干燥(冻干)的条件下,仅需在使用前即刻添加无菌液体载体(例如水)以供注射。临时注射溶液和悬浮液可由无菌散剂、颗粒剂和片剂制备。
在一些实施方案中,包括一种或多种治疗性干预的药学上可接受的组合物可以局部或全身施用。例如,本文提供的组合物可以通过注射到肿瘤内局部施用。在一些实施方案中,本文提供的组合物可以全身、口服或通过注射向受试者(例如人)施用。
有效剂量可以根据癌症的严重性、施用途径、受试者的年龄和总体健康状况、赋形剂的使用、与其他治疗性治疗(诸如使用其他药剂)的共同使用和主治医师的判断而变化。
含有一种或多种治疗性干预的组合物的有效量可以是减少受试者体内存在的癌细胞数量而不对受试者产生显著毒性的任何量。如果特定受试者不能对特定量有反应,则治疗性干预的量可以增加例如两倍。接受这种更高的量之后,可以同时监测受试者对治疗的反应性和毒性症状,并据此进行调整。有效量可以保持恒定,或者可以根据受试者对治疗的反应调整为按比例增减或可变剂量。多种因素可以影响用于特定应用的实际有效量。例如,施用频率、治疗持续时间、多种治疗剂的使用、施用途径以及病状(例如,癌症)的严重性可能需要增加或减少所施用的实际有效量。
一种或多种治疗性干预的施用频率可以是减少受试者体内存在的癌细胞数量而不对受试者产生显著毒性的任何量。例如,一种或多种治疗性干预的施用频率可以是每周约两次至约三次至每月约两次至约三次。在治疗持续时间期间,一种或多种治疗性干预的施用频率可以保持恒定或可以变化。用含有一种或多种治疗性干预的组合物的治疗过程可以包括休息期。例如,含有一种或多种治疗性干预的组合物可以在两周的时间内每天施用,接着是两周的休息期,并且这种方案可以重复多次。与有效量一样,多种因素可以影响用于特定应用的实际施用频率。例如,有效量、治疗持续时间、多种治疗剂的使用、施用途径以及病状(例如,癌症)的严重性可能需要增加或减少施用频率。
施用含有一种或多种治疗性干预的组合物的有效持续时间可以是减少受试者体内存在的癌细胞数量而不对受试者产生显著毒性的任何持续时间。在一些实施方案中,有效持续时间可以从几天至几周变化。总体来讲,减少受试者体内存在的癌细胞数量的有效持续时间可以在约一周至约四周的持续时间的范围内。多种因素可以影响用于特定治疗的实际有效持续时间。例如,有效持续时间可以随施用频率、有效量、多种治疗剂的使用、施用途径和所治疗病状的严重性而变化。
示例性实施方案
在一些实施方案中,本文提供了检测生物标记物的方法,所述方法包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在。在检测生物标记物的方法的一些实施方案中,所述方法还包括在从受试者获得的样品中检测非整倍性的存在。在检测生物标记物的方法的一些实施方案中,第一类别的生物标记物包括遗传生物标记物。在检测生物标记物的方法的一些实施方案中,第一类别的生物标记物的成员与癌症的存在相关联。在检测生物标记物的方法的一些实施方案中,第二类别的生物标记物包括蛋白质生物标记物。在检测生物标记物的方法的一些实施方案中,第二类别的生物标记物的成员与癌症的存在相关联。
在一些实施方案中,本文提供了检测生物标记物的方法,所述方法包括:在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在;在从受试者获得的样品中检测非整倍性的存在。在检测生物标记物的方法的一些实施方案中,所述方法还包括在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在。在检测生物标记物的方法的一些实施方案中,第一类别的生物标记物包括遗传生物标记物。在检测生物标记物的方法的一些实施方案中,第一类别的生物标记物包括蛋白质生物标记物。在检测生物标记物的方法的一些实施方案中,第一类别的生物标记物的成员与癌症的存在相关联。在检测生物标记物的方法的一些实施方案中,其中第一类别的生物标记物包括蛋白质生物标记物,第二类别的生物标记物包括遗传生物标记物。在检测生物标记物的方法的一些实施方案中,其中第一类别的生物标记物包括蛋白质生物标记物,第二类别的生物标记物的成员与癌症的存在相关联。
在一些实施方案中,本文提供了鉴定受试者患有癌症的方法,所述方法包括:在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在;在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在;以及当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到第二类别的生物标记物的一个或多个成员的存在或两者时,鉴定受试者患有癌症。在鉴定受试者患有癌症的方法的一些实施方案中,所述方法还包括在从受试者获得的样品中检测非整倍性的存在;其中当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到第二类别的生物标记物的一个或多个成员的存在、在样品中检测到非整倍性的存在或其组合时,鉴定受试者患有癌症。在鉴定受试者患有癌症的方法的一些实施方案中,第一类别的生物标记物包括遗传生物标记物。在鉴定受试者患有癌症的方法的一些实施方案中,第一类别的生物标记物的成员与癌症的存在相关联。在鉴定受试者患有癌症的方法的一些实施方案中,第二类别的生物标记物包括蛋白质生物标记物。在鉴定受试者患有癌症的方法的一些实施方案中,第二类别的生物标记物的成员与癌症的存在相关联。
在一些实施方案中,本文提供了鉴定受试者患有癌症的方法,所述方法包括:在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在;在从受试者获得的样品中检测非整倍性的存在;以及当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到非整倍性的存在或两者时,鉴定受试者患有癌症。在鉴定受试者患有癌症的方法的一些实施方案中,所述方法还包括在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在;其中当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到第二类别的生物标记物的一个或多个成员的存在、在样品中检测到非整倍性的存在或其组合时,鉴定受试者患有癌症。在鉴定受试者患有癌症的方法的一些实施方案中,第一类别的生物标记物包括遗传生物标记物。在鉴定受试者患有癌症的方法的一些实施方案中,第一类别的生物标记物包括蛋白质生物标记物。在鉴定受试者患有癌症的方法的一些实施方案中,第一类别的生物标记物的成员与癌症的存在相关联。在鉴定受试者患有癌症的方法的一些实施方案中,其中第一类别的生物标记物包括蛋白质生物标记物,第二类别的生物标记物包括遗传生物标记物。在鉴定受试者患有癌症的方法的一些实施方案中,其中第一类别的生物标记物包括蛋白质生物标记物,第二类别的生物标记物的成员与癌症的存在相关联。
在包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在的鉴定受试者患有癌症的方法的一些实施方案中,与包括仅检测单个类别的生物标记物的一个或多个成员的存在的方法相比,检测癌症的存在的敏感性增加。在包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在的鉴定受试者患有癌症的方法的一些实施方案中,与包括仅检测单个类别的生物标记物的一个或多个成员的存在的方法相比,检测癌症的存在的特异性增加。在包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测非整倍性的存在的鉴定受试者患有癌症的方法的一些实施方案中,与包括仅检测所述类别的生物标记物的一个或多个成员或仅检测非整倍性的存在的方法相比,检测癌症的存在的敏感性增加。在包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测非整倍性的存在的鉴定受试者患有癌症的方法的一些实施方案中,与包括仅检测所述类别的生物标记物的一个或多个成员或仅检测非整倍性的存在的方法相比,检测癌症的存在的特异性增加。
在一些实施方案中,本文提供了治疗被鉴定为患有癌症的受试者的方法,所述方法包括:在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在;在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在;当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到第二类别的生物标记物的一个或多个成员的存在或两者时,鉴定受试者患有癌症;以及向受试者施用治疗性干预。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,所述方法还包括在从受试者获得的样品中检测非整倍性的存在;其中当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到第二类别的生物标记物的一个或多个成员的存在、在样品中检测到非整倍性的存在或其组合时,鉴定受试者患有癌症。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,第一类别的生物标记物包括遗传生物标记物。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,第一类别的生物标记物的成员与癌症的存在相关联。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,第二类别的生物标记物包括蛋白质生物标记物。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,第二类别的生物标记物的成员与癌症的存在相关联。
在一些实施方案中,本文提供了治疗被鉴定为患有癌症的受试者的方法,所述方法包括:在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在;在从受试者获得的样品中检测非整倍性的存在;当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到非整倍性的存在或两者时,鉴定受试者患有癌症;以及向受试者施用治疗性干预。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,所述方法还包括在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在;其中当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到第二类别的生物标记物的一个或多个成员的存在、在样品中检测到非整倍性的存在或其组合时,鉴定受试者患有癌症。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,第一类别的生物标记物包括遗传生物标记物。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,第一类别的生物标记物包括蛋白质生物标记物。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,第一类别的生物标记物的成员与癌症的存在相关联。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,其中第一类别的生物标记物包括蛋白质生物标记物,第二类别的生物标记物包括遗传生物标记物。在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,其中第一类别的生物标记物包括蛋白质生物标记物,第二类别的生物标记物的成员与癌症的存在相关联。
在包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在的治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,与包括仅检测单个类别的生物标记物的一个或多个成员的存在的方法相比,检测癌症的存在的敏感性增加。在包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测第二类别的生物标记物的一个或多个成员的存在的治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,与包括仅检测单个类别的生物标记物的一个或多个成员的存在的方法相比,检测癌症的存在的特异性增加。在包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测非整倍性的存在的治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,与包括仅检测所述类别的生物标记物的一个或多个成员或仅检测非整倍性的存在的方法相比,检测癌症的存在的敏感性增加。在包括在从受试者获得的样品中检测第一类别的生物标记物的一个或多个成员的存在和在从受试者获得的样品中检测非整倍性的存在的治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,与包括仅检测所述类别的生物标记物的一个或多个成员或仅检测非整倍性的存在的方法相比,检测癌症的存在的特异性增加。
在治疗被鉴定为患有癌症的受试者的方法的一些实施方案中,可以向受试者施用本文所述的各种治疗性干预中的任一种(例如,手术、化疗、激素疗法、靶向疗法、放疗及其组合)。
在一些实施方案中,本文提供了鉴定受试者患有癌症的方法,所述方法包括:在从所述受试者获得的血液样品中检测循环DNA中一个或多个遗传生物标记物的存在;在从受试者获得的血液样品中检测一个或多个肽生物标记物的升高水平的存在;以及当在所述血液样品中的循环DNA中检测到一个或多个遗传生物标记物的存在时,当在所述血液样品中检测到一个或多个肽生物标记物的升高水平时,或两者时,鉴定受试者患有癌症。在一些实施方案中,本文提供了治疗患有癌症的受试者的方法,所述方法包括:在从所述受试者获得的血液样品中检测循环DNA中一个或多个遗传生物标记物的存在;在从受试者获得的血液样品中检测一个或多个肽生物标记物的升高水平的存在;以及当在所述血液样品中的循环DNA中检测到一个或多个遗传生物标记物的存在时,当在所述血液样品中检测到一个或多个肽生物标记物的升高水平时,或两者时,向所述受试者施用一种或多种治疗性干预(例如,手术、化疗、激素疗法、靶向疗法、放疗中的一种或多种)。在一些实施方案中,本文提供了鉴定受试者中癌症的位置的方法,所述方法包括:在从所述受试者获得的血液样品中检测循环DNA中一个或多个遗传生物标记物的存在;在从受试者获得的血液样品中检测一个或多个肽生物标记物的升高水平的存在;以及当在所述血液样品中的循环DNA中检测到一个或多个遗传生物标记物的存在时,当在所述血液样品中检测到一个或多个肽生物标记物的升高水平时,或两者时,鉴定受试者中癌症的位置。
在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中(例如,基于从所述受试者获得的血液样品中的循环DNA中一个或多个遗传生物标记物的存在和/或从受试者获得的血液样品中一个或多个肽生物标记物的升高水平的存在),受试者是人。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,所述血液样品是血浆样品。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,癌症是I期癌症。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,一个或多个遗传生物标记物包括一个或多个基因中的一个或多个修饰。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,一个或多个修饰包括失活修饰,并且其中所述一个或多个基因包括肿瘤抑制基因。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,一个或多个修饰包括独立地选自单碱基取代、插入、或缺失、易位、融合、断裂、重复或扩增的修饰。
在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中(例如,基于从所述受试者获得的血液样品中的循环DNA中一个或多个遗传生物标记物的存在和/或从受试者获得的血液样品中一个或多个肽生物标记物的升高水平的存在),癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,其中癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌,并且其中一个或多个遗传生物标记物是基因,一个或多个基因是以下中的一个或多个:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,其中一个或多个基因是以下中的一个或多个:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS,一个或多个蛋白质生物标记物是CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1或髓过氧化物酶(MPO)。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,其中一个或多个基因是以下中的一个或多个:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS,一个或多个蛋白质生物标记物是CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF或CA15-3。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,其中一个或多个基因是以下中的一个或多个:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS,一个或多个蛋白质生物标记物是CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1或CA15-3。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,其中一个或多个基因是以下中的一个或多个:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS,一个或多个修饰独立地选自表3中列出的修饰。
在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中(例如,基于从所述受试者获得的血液样品中的循环DNA中一个或多个遗传生物标记物的存在和/或从受试者获得的血液样品中一个或多个肽生物标记物的升高水平的存在),癌症是胰腺癌。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,其中癌症是胰腺癌,并且其中一个或多个遗传生物标记物是基因,一个或多个基因是KRAS、TP53、CDKN2A或SMAD4中的一个或多个。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,其中一个或多个基因是以下中的一个或多个:KRAS、TP53、CDKN2A或SMAD4,一个或多个蛋白质生物标记物是CA19-9、CEA、HGF或OPN中的一个或多个。
在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中(例如,基于从所述受试者获得的血液样品中的循环DNA中一个或多个遗传生物标记物的存在和/或从受试者获得的血液样品中一个或多个肽生物标记物的升高水平的存在),使用包括以下的方法执行检测一个或多个遗传生物标记物的存在的步骤:基于PCR的多重测定、使用基于PCR的单重测定、数字PCR测定、微滴数字PCR(ddPCR)测定、微阵列测定、下一代测序测定、Sanger测序测定、定量PCR测定或连接测定。在一些实施方案中,基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。
在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中(例如,基于从所述受试者获得的血液样品中的循环DNA中一个或多个遗传生物标记物的存在和/或从受试者获得的血液样品中一个或多个肽生物标记物的升高水平的存在),使用多重免疫测定系统执行一个或多个蛋白质生物标记物的升高水平的步骤。
在鉴定受试者患有癌症的一些实施方案中,所述方法还包括鉴定癌症的位置。在鉴定受试者患有癌症的一些实施方案中,所述方法还包括向受试者施用一种或多种治疗性干预。在一些实施方案中,一种或多种治疗性干预是以下中的一种或多种:手术、化疗、激素疗法、靶向疗法或放疗。
在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中(例如,基于从所述受试者获得的血液样品中的循环DNA中一个或多个遗传生物标记物的存在和/或从受试者获得的血液样品中一个或多个肽生物标记物的升高水平的存在),所述方法还包括:a)针对两个或更多个遗传生物标记物,确定血液样品中的突变等位基因频率;b)通过将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中突变等位基因频率的第一参考分布和从患有癌症的受试者收集的样品中突变等位基因频率的第二参考分布进行比较,获得指示受试者患有癌症的可能性的得分;以及c)当所述得分高于所述得分的参考值时,鉴定受试者患有癌症。在一些实施方案中,获得得分包括针对所选的遗传生物标记物中的每个突变,计算第一参考分布中的突变等位基因频率的概率与第二参考分布中的突变等位基因频率的概率的比率。在一些实施方案中,通过针对所选的遗传生物标记物中的每个突变,计算第一参考分布中的突变等位基因频率的概率与第二参考分布中的突变等位基因频率的概率的对数比的加权平均值来确定得分。在一些实施方案中,使用包括以下的测定在两个或更多个测试样品中执行检测一个或多个遗传生物标记物的存在:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在一些实施方案中,得分通过下式计算:
Figure GDA0002675196410007241
其中wi是测试样品i中唯一标识符序列(UID)的数量除以所有测试样品中此突变的UID的总数,piN是第一参考分布中突变等位基因频率的概率,并且piC是第二参考分布中突变等位基因频率的概率。
在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中(例如,基于从所述受试者获得的血液样品中的循环DNA中一个或多个遗传生物标记物的存在和/或从受试者获得的血液样品中一个或多个肽生物标记物的升高水平的存在),与以下相比鉴定受试者患有癌症的敏感性增加:1)当仅在从受试者获得的样品中检测单个类别的生物标记物的一个或多个成员的存在时获得的敏感性。在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中,与以下相比鉴定受试者患有癌症的特异性增加:1)当仅在从受试者获得的样品中检测单个类别的生物标记物的一个或多个成员的存在时获得的特异性。
在鉴定受试者患有癌症、治疗患有癌症的受试者或鉴定受试者中癌症的位置的一些实施方案中(例如,基于从所述受试者获得的血液样品中的循环DNA中一个或多个遗传生物标记物的存在和/或从受试者获得的血液样品中一个或多个肽生物标记物的升高水平的存在),所述方法还包括:在从受试者获得的样品中检测非整倍性的存在,其中当在样品中检测到第一类别的生物标记物的一个或多个成员的存在、在样品中检测到第二类别的生物标记物的一个或多个成员的存在、在样品中检测到非整倍性的存在或其组合时,鉴定受试者患有癌症。
在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对一个或多个以下基因中的每个突变,确定从患者收集的样品中的突变等位基因频率:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS;b)通过将所选的基因中每个突变的突变等位基因频率与对照样品中突变等位基因频率的第一参考分布和从患有癌症的受试者收集的样品中突变等位基因频率的第二参考分布进行比较,获得指示受试者患有癌症的可能性的得分;以及c)当所述得分高于所述得分的参考值时,鉴定受试者患有癌症。在一些实施方案中,此类方法还包括测量一种或多种以下蛋白质的浓度:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1或髓过氧化物酶(MPO),以及确定至少一种蛋白质的浓度高于参考值。在一些实施方案中,此类方法还包括测量一种或多种以下蛋白质的浓度:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF或CA15-3,以及确定至少一种蛋白质的浓度高于参考值。在一些实施方案中,此类方法还包括测量一种或多种以下蛋白质的浓度:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1或CA15-3,以及确定至少一种蛋白质的浓度高于参考值。在一些实施方案中,获得得分包括针对所选基因中的每个突变,计算第一参考分布中的突变等位基因频率的概率与第二参考分布中的突变等位基因频率的概率的比率。在一些实施方案中,通过针对所选基因中的每个突变,计算第一参考分布中的突变等位基因频率的概率与第二参考分布中的突变等位基因频率的概率的对数比的加权平均值来确定得分。在一些实施方案中,使用一种方法在两个或更多个测试样品中测定样品,所述方法包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在一些实施方案中,得分通过下式计算:
Figure GDA0002675196410007261
其中wi是测试样品i中唯一标识符序列(UID)的数量除以所有测试样品中此突变的UID的总数,piN是第一参考分布中突变等位基因频率的概率,并且piC是第二参考分布中突变等位基因频率的概率。在一些实施方案中,血液样品是血浆样品。在一些实施方案中,所述癌症是I期癌症。在一些实施方案中,癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在一些实施方案中,所述至少一个突变包括失活修饰,并且其中所述至少一个突变在肿瘤抑制基因中。在一些实施方案中,至少一个突变包括为单碱基取代、插入或缺失的突变。在一些实施方案中,至少一个突变是表3中列出的突变。在一些实施方案中,使用多重免疫测定系统执行检测一种或多种蛋白质的水平的步骤。在一些实施方案中,所述方法还包括鉴定癌症的位置。在一些实施方案中,所述方法还包括向哺乳动物施用一种或多种治疗性干预。在一些实施方案中,一种或多种治疗性干预是以下中的一种或多种:手术、化疗、激素疗法、靶向疗法或放疗。
在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对一个或多个以下基因中的每个突变,确定从患者收集的样品中的突变等位基因频率:KRAS、TP53、CDKN2A或SMAD4;b)通过将所选的基因中每个突变的突变等位基因频率与对照样品中突变等位基因频率的第一参考分布和从患有癌症的受试者收集的样品中突变等位基因频率的第二参考分布进行比较,获得指示受试者患有癌症的可能性的得分;以及c)当所述得分高于所述得分的参考值时,鉴定受试者患有癌症。在一些实施方案中,此类方法还包括测量一种或多种以下蛋白质的浓度:CA19-9、CEA、HGF或OPN,以及确定至少一种蛋白质的浓度高于参考值。在一些实施方案中,获得得分包括针对所选基因中的每个突变,计算第一参考分布中的突变等位基因频率的概率与第二参考分布中的突变等位基因频率的概率的比率。在一些实施方案中,通过针对所选基因中的每个突变,计算第一参考分布中的突变等位基因频率的概率与第二参考分布中的突变等位基因频率的概率的对数比的加权平均值来确定得分。在一些实施方案中,使用一种方法在两个或更多个测试样品中测定样品,所述方法包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在一些实施方案中,得分通过下式计算:
Figure GDA0002675196410007271
其中wi是测试样品i中唯一标识符序列(UID)的数量除以所有测试样品中此突变的UID的总数,piN是第一参考分布中突变等位基因频率的概率,并且piC是第二参考分布中突变等位基因频率的概率。在一些实施方案中,血液样品是血浆样品。在一些实施方案中,所述癌症是I期癌症。在一些实施方案中,癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在一些实施方案中,所述至少一个突变包括失活修饰,并且其中所述至少一个突变在肿瘤抑制基因中。在一些实施方案中,至少一个突变包括为单碱基取代、插入或缺失的突变。在一些实施方案中,使用多重免疫测定系统执行检测一种或多种蛋白质的水平的步骤。在一些实施方案中,所述方法还包括鉴定癌症的位置。在一些实施方案中,所述方法还包括向哺乳动物施用一种或多种治疗性干预。在一些实施方案中,一种或多种治疗性干预是以下中的一种或多种:手术、化疗、激素疗法、靶向疗法或放疗。
在一些实施方案中,本文提供了用于为患者生成报告的系统,所述系统包括:至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;和ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症。
在一些实施方案中,本文提供了用于为患者生成报告的系统,所述系统包括:至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3或4个)以下基因:KRAS、TP53、CDKN2A和/或SMAD4;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;和ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症。
在一些实施方案中,本文提供了用于生成报告以针对患者鉴定癌症治疗的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。
在一些实施方案中,本文提供了用于生成报告以针对患者鉴定癌症治疗的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3或4个)以下基因:KRAS、TP53、CDKN2A和/或SMAD4;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。
在一些实施方案中,本文提供了用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。
在一些实施方案中,本文提供了用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3或4个)以下基因:KRAS、TP53、CDKN2A和/或SMAD4;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。
在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,计算得分包括针对所选基因中的每个突变,计算第一参考分布中的突变等位基因频率的概率与第二参考分布中的突变等位基因频率的概率的比率。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,通过针对所选基因中的每个突变,计算第一参考分布中的突变等位基因频率的概率与第二参考分布中的突变等位基因频率的概率的对数比的加权平均值来计算得分。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述计算机数据库包括测试样品数据,所述测试样品数据包括为样品中存在的多个模板分子中的每一个分配唯一标识符(UID)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,得分通过下式计算:
Figure GDA0002675196410007331
其中wi是测试样品i中唯一标识符序列(UID)的数量除以所有测试样品中此突变的UID的总数,piN是第一参考分布中突变等位基因频率的概率,并且piC是第二参考分布中突变等位基因频率的概率。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,被配置来测定一组基因的装置包括一种装置,其采用基于PCR的多重测定、使用基于PCR的单重测定、数字PCR测定、微滴数字PCR(ddPCR)测定、微阵列测定、下一代测序测定、Sanger测序测定、定量PCR测定或连接测定。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7或8个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7、8、9、10或11个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7、8或9个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因的装置:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,所述系统还包括被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7或8个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因的装置:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,所述系统还包括被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7、8、9、10或11个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因的装置:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,所述系统还包括被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7、8或9个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和/或CA15-3。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3或4个):CA19-9、CEA、HGF和/或OPN。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3或4个)以下基因的装置:KRAS、TP53、CDKN2A和/或SMAD4,所述系统还包括被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3或4个):CA19-9、CEA、HGF和/或OPN。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,与用于为患者生成报告的常规系统相比,所述系统在鉴定患者患有癌症方面的敏感性得到改善。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,与用于为患者生成报告的常规系统相比,所述系统在鉴定患者患有癌症方面的特异性得到改善。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,从远离至少一个计算机数据库的位置将突变等位基因频率值的第一和第二参考分布输入系统中。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,通过互联网连接将突变等位基因频率值的第一和第二参考分布输入系统中。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述报告呈电子格式或纸质格式。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述癌症是本文所述的各种癌症类型中的任一种(参见,例如标题为“癌症”的部分)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因的装置:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及至少一个被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7或8个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或髓过氧化物酶(MPO),所述癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因的装置:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及至少一个被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7、8、9、10或11个):CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和/或CA15-3,所述癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因的装置:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及至少一个被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3、4、5、6、7、8或9个):CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或CA15-3,所述癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3或4个)以下基因的装置:KRAS、TP53、CDKN2A和/或SMAD4,以及至少一个被配置来检测生物样品中一个或多个蛋白质生物标记物的水平的装置(例如,包括多重免疫测定系统的装置),其中所述蛋白质生物标记物是以下中的一个或多个(例如1、2、3或4个):CA19-9、CEA、HGF和/或OPN,所述癌症是胰腺癌。在用于为患者生成报告的系统或用于生成报告以针对患者鉴定癌症治疗的系统的一些实施方案中,患者被鉴定为增加监测、进一步诊断测试或两者(例如,本文所述的各种增加监测或进一步诊断方法中的任一种)的候选者。
在一些实施方案中,本文提供了鉴定受试者患有癌症的方法,所述方法包括:在从所述受试者获得的第一样品中检测一个或多个遗传生物标记物的存在;在从所述受试者获得的第二样品中检测非整倍性的存在;以及当在第一样品中检测到一个或多个遗传生物标记物的存在,当在第二样品中检测到非整倍性的存在时,或两者时,鉴定受试者患有癌症。在一些实施方案中,本文提供了治疗患有癌症的受试者的方法,所述方法包括:在从所述受试者获得的第一样品中检测一个或多个遗传生物标记物的存在;在从所述受试者获得的第二样品中检测非整倍性的存在;以及当在第一样品中检测到一个或多个遗传生物标记物的存在,当在第二样品中检测到非整倍性的存在时,或两者时,向所述受试者施用一种或多种治疗性干预。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),检测一个或多个遗传生物标记物的存在的步骤包括以下方法,所述方法包括基于PCR的多重测定、使用基于PCR的单重测定、数字PCR测定、微滴数字PCR(ddPCR)测定、微阵列测定、下一代测序测定、Sanger测序测定、定量PCR测定或连接测定。在一些实施方案中,检测一个或多个遗传生物标记物的存在的步骤包括一种使用错误减少技术增加大规模平行测序仪器的敏感性的方法,所述技术包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),检测非整倍性的存在的步骤包括:扩增整个第二样品的基因组中的长散布核苷酸元件(LINE),从而获得多个扩增子;对多个扩增子进行测序以获得测序读长;将测序读长放入预先限定的基因组区间的簇中;以及当预先限定的簇内基因组区域的测序读长的数量与预先限定的簇内基因组区域的测序读长的预期数量显著不同时,确定第二样品中非整倍性的存在。在一些实施方案中,通过基于两个或更多个整倍体样品的测序读长的读长深度对基因组区间进行分组来创建预先限定的基因组区间的簇。在一些实施方案中,确定预先限定的簇内基因组区域的测序读长的数量与预先限定的簇内基因组区域的测序读长的预期数量显著不同包括:计算预先限定的簇中所有基因组区间的测序读长的分布,其中通过对来源于第二样品的扩增子进行测序来获得预先限定的簇中所有基因组区间的序列读长;以及确定基因组区域的测序读长的数量在所述分布的显著性阈值之外。在一些实施方案中,确定预先限定的簇内基因组区域的测序读长的数量与预先限定的簇内基因组区域的测序读长的预期数量显著不同包括:使用方程
Figure GDA0002675196410007401
计算每个基因组区间中测序读长的分布的和,其中Ri是测序读长的数量,I是染色体臂上簇的数量,N是具有参数μi和σi 2的高斯分布,其中μi是每个基因组区间中测序读长的平均数量,并且其中σi 2是每个基因组区间中测序读长的方差;使用分位函数
Figure GDA0002675196410007402
计算染色体臂的Z得分;以及当Z得分在显著性阈值之外时,鉴定哺乳动物的组织中非整倍性的存在。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),检测非整倍性的存在的步骤包括:对从第二样品获得的多个扩增子进行测序以获得多个多态性位点的变体测序读长;选择在两个等位基因上具有大于约3的变体测序读长和参考测序读长的染色体臂;确定所选的染色体臂中每个多态性位点的变体等位基因频率(VAF),其中所述VAF是变体测序读长的数量/测序读长的总数;以及如果一个或多个多态性位点的VAF在正态分布的显著性阈值之外,则确定所选的染色体臂上非整倍性的存在,其中预期VAF为0.5。在一些实施方案中,测序的步骤包括:a.为多个扩增子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的扩增子以产生UID家族;以及c.对扩增产物进行冗佘测序。在一些实施方案中,鉴定所选的染色体臂上非整倍性的存在的步骤包括:使用方程
Figure GDA0002675196410007403
计算所述所选的染色体臂上的一个或多个多态性位点的Z得分,其中wi是在变体i的UID深度,Zi是变体i的VAF的Z得分,并且k是在染色体臂上观察到的变体的数量。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),所述方法还包括对第一样品、第二样品或两者执行细胞学检查;以及当在第一样品中检测到一个或多个遗传生物标记物的存在时,当在第二样品中检测到非整倍性的存在时,阳性细胞学检查指示受试者患有癌症时,或其组合时,鉴定受试者患有癌症。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),癌症是膀胱癌或上尿路尿路上皮癌;一个或多个遗传生物标记物是以下中的一个或多个:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL;所述方法还包括检测TERT启动子中至少一个遗传生物标记物(例如,突变)的存在;以及TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL中的一个或多个中一个或多个遗传生物标记物的存在,TERT启动子中至少一个遗传生物标记物(例如,突变)的存在,或非整倍性的存在,指示受试者患有膀胱癌。在一些实施方案中,TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL中的一个或多个中一个或多个遗传生物标记物的存在,TERT启动子中至少一个遗传生物标记物(例如,突变)的存在,和非整倍性的存在,指示受试者患有膀胱癌。在一些实施方案中,一个或多个遗传生物标记物是TP53、FGFR3或两者。在一些实施方案中,检测非整倍性的存在的步骤包括在染色体臂5p、8q和9p中的一个或多个上检测非整倍性的存在。在一些实施方案中,一个或多个遗传生物标记物、TERT启动子中的一个或多个遗传生物标记物(例如,突变)或两者存在于样品中0.03%或更少的尿液细胞中。在一些实施方案中,使用基于PCR的多重测定、Sanger测序测定或下一代测序测定来执行检测TERT启动子中至少一个遗传生物标记物(例如,突变)的存在的步骤。在一些实施方案中,通过使用错误减少技术增加大规模平行测序仪器的敏感性来执行检测TERT启动子中至少一个遗传生物标记物(例如,突变)的存在的步骤,所述技术包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),所述方法包括检测膀胱癌,并且还包括施用经尿道膀胱切除术(TURB)、膀胱内BCG(卡介苗)、膀胱内化疗、辅助化疗、新辅助化疗、膀胱切除术或膀胱前列腺切除术、放疗、免疫疗法、免疫检查点抑制剂或以上的任何组合。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),所述方法包括检测上尿路尿路上皮癌,并且还包括施用经尿道切除术、膀胱内BCG(卡介苗)、膀胱内化疗、辅助化疗、新辅助化疗、输尿管切除术或肾输尿管切除术、放疗、免疫疗法、免疫检查点抑制剂或以上的任何组合。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),癌症是卵巢癌或子宫内膜癌;一个或多个遗传生物标记物是NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A中的一个或多个;并且NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A中的一个或多个中一个或多个突变的存在,非整倍性的存在或两者,指示受试者患有卵巢癌或子宫内膜癌。在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),癌症是子宫内膜癌;一个或多个遗传生物标记物是PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43或PPP2R1A中的一个或多个;并且PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43或PPP2R1A中的一个或多个中一个或多个突变的存在,非整倍性的存在或两者,指示受试者患有子宫内膜癌。在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),癌症是高级别浆液性癌;一个或多个遗传生物标记物在TP53中;并且TP53中一个或多个遗传生物标记物的存在,非整倍性的存在或两者,指示受试者患有高级别浆液性癌。在一些实施方案中,检测非整倍性的存在的步骤包括在染色体臂4p、7q、8q和9q中的一个或多个上检测非整倍性的存在。在一些实施方案中,通过宫内采样收集第一样品、第二样品或两者。在一些实施方案中,用陶氏刷收集第一样品、第二样品或两者。在一些实施方案中,所述方法还包括在从受试者获得的循环肿瘤DNA(ctDNA)样品中检测一个或多个以下基因中至少一个遗传生物标记物的存在:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN或TP53。在一些实施方案中,所述方法还包括向受试者施用疗法,其中所述疗法包括手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法、免疫检查点抑制剂及其组合。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),遗传生物标记物是基因中的突变。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),第一样品和第二样品是相同的。在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),第一样品和第二样品是不同的。在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),第一样品是血液样品。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),所述方法还包括:a)针对两个或更多个遗传生物标记物,确定样品中的突变等位基因频率;b)通过将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的突变等位基因频率的参考分布进行比较,获得指示受试者患有癌症的可能性的得分;以及c)当所述得分高于所述得分的参考值时,鉴定受试者患有癌症。在一些实施方案中,所述方法还包括从两个或更多个遗传生物标记物中选择一个具有最高得分的遗传生物标记物,所述最高得分指示所述受试者患有癌症的概率;以及将所选的遗传生物标记物的得分与参考值进行比较。在一些实施方案中,所述得分是Stouffer Z得分。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),所述方法还包括:a)针对两个或更多个遗传生物标记物,确定样品中的突变等位基因频率;以及b)将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的每个突变的最大突变等位基因频率进行比较。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),与以下相比鉴定受试者患有癌症的敏感性增加:1)当仅在从受试者获得的样品中检测一个或多个遗传生物标记物的存在时获得的敏感性,或2)当仅在从受试者获得的样品中检测非整倍性的存在时获得的敏感性。在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),与以下相比鉴定受试者患有癌症的特异性增加:1)当仅在从受试者获得的样品中检测一个或多个遗传生物标记物的存在时获得的特异性,或2)当仅在从受试者获得的样品中检测非整倍性的存在时获得的特异性。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),所述方法还包括在从受试者获得的样品中检测一个或多个蛋白质生物标记物的存在,其中所述样品是第一样品、第二样品或第三样品。在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),受试者是人。在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),癌症是I期癌症。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),一个或多个遗传生物标记物包括一个或多个基因中的一个或多个修饰。在一些实施方案中,一个或多个修饰包括失活修饰,并且其中所述一个或多个基因包括肿瘤抑制基因。在一些实施方案中,一个或多个修饰包括独立地选自单碱基取代、插入、或缺失、易位、融合、断裂、重复或扩增的修饰。
在鉴定受试者患有癌症或治疗患有癌症的受试者的一些实施方案中(例如,基于从所述受试者获得的第一样品中一个或多个遗传生物标记物的存在和/或从所述受试者获得的第二样品中非整倍性的存在),
在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对一个或多个以下基因中的每个突变,确定从患者收集的样品中的突变等位基因频率:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A;b)通过将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的突变等位基因频率的参考分布进行比较,获得指示受试者患有癌症的可能性的得分;以及c)当所述得分高于所述得分的参考值时,鉴定受试者患有癌症。在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对一个或多个以下基因中的每个突变,确定从患者收集的样品中的突变等位基因频率:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43或PPP2R1A;b)通过将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的突变等位基因频率的参考分布进行比较,获得指示受试者患有癌症的可能性的得分;以及c)当所述得分高于所述得分的参考值时,鉴定受试者患有癌症。在一些实施方案中,所述方法还包括从两个或更多个遗传生物标记物中选择一个具有最高得分的遗传生物标记物,所述最高得分指示所述受试者患有癌症的概率;以及将所选的遗传生物标记物的得分与参考值进行比较。在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对一个或多个所述遗传生物标记物,确定样品中的突变等位基因频率;b)通过将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的突变等位基因频率的参考分布进行比较,获得指示受试者未患癌症的概率的得分;以及c)当所述得分低于得分的参考值时,将受试者鉴定为未患癌症。在一些实施方案中,所述方法还包括选择一个具有最低得分的遗传生物标记物,所述最低得分指示所述受试者未患癌症的概率;以及将所选的遗传生物标记物的得分与参考值进行比较。在一些实施方案中,所述得分是Stouffer Z得分。在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对两个或更多个所述遗传生物标记物,确定血液样品中的突变等位基因频率;以及b)将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的每个突变的最大突变等位基因频率进行比较。在一些实施方案中,本文提供了鉴定患者患有前一段落中所述的癌症的方法,使用一种方法在两个或更多个测试样品中测定样品,所述方法包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在鉴定患者患有癌症的一些实施方案中,所述方法还包括在样品中检测非整倍性的存在(例如,在染色体臂4p、7q、8q和9q中的一个或多个上检测非整倍性的存在)。在鉴定患者患有癌症的一些实施方案中,所述方法还包括在从受试者获得的循环肿瘤DNA(ctDNA)样品中检测一个或多个以下基因中至少一个遗传生物标记物的存在:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN或TP53。在一些实施方案中,所述癌症是I期癌症。在一些实施方案中,所述癌症是宫颈癌、子宫内膜癌、卵巢癌或输卵管癌。在一些实施方案中,所述至少一个突变包括失活修饰,并且其中所述至少一个突变在肿瘤抑制基因中。在一些实施方案中,所述修饰独立地选自单碱基取代、插入、缺失、易位、融合、断裂、重复或扩增。在一些实施方案中,所述方法还包括向受试者施用一种或多种治疗性干预(例如,以下中的一种或多种:手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法、免疫检查点抑制剂或其组合)。
在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对一个或多个以下基因中的每个突变,确定从患者收集的样品中的突变等位基因频率:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL;b)通过将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的突变等位基因频率的参考分布进行比较,获得指示受试者患有癌症的可能性的得分;以及c)当所述得分高于所述得分的参考值时,鉴定受试者患有癌症。在一些实施方案中,所述方法还包括从两个或更多个遗传生物标记物中选择一个具有最高得分的遗传生物标记物,所述最高得分指示所述受试者患有癌症的概率;以及将所选的遗传生物标记物的得分与参考值进行比较。在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对一个或多个所述遗传生物标记物,确定样品中的突变等位基因频率;b)通过将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的突变等位基因频率的参考分布进行比较,获得指示受试者未患癌症的概率的得分;以及c)当所述得分低于得分的参考值时,将受试者鉴定为未患癌症。在一些实施方案中,所述方法还包括选择一个具有最低得分的遗传生物标记物,所述最低得分指示所述受试者未患癌症的概率;以及将所选的遗传生物标记物的得分与参考值进行比较。在一些实施方案中,所述得分是Stouffer Z得分。在一些实施方案中,本文提供了鉴定患者患有癌症的方法,其包括:a)针对两个或更多个所述遗传生物标记物,确定血液样品中的突变等位基因频率;以及b)将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的每个突变的最大突变等位基因频率进行比较。在一些实施方案中,本文提供了鉴定患者患有前一段落中所述的癌症的方法,使用一种方法在两个或更多个测试样品中测定样品,所述方法包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在一些实施方案中,所述方法还包括在样品中检测TERT启动子中至少一个遗传生物标记物(例如,突变)的存在。在鉴定患者患有癌症的一些实施方案中,所述方法还包括在样品中检测非整倍性的存在(例如,在染色体臂5q、8q和9p中的一个或多个上检测非整倍性的存在)。在鉴定患者患有癌症的一些实施方案中,所述方法还包括在从受试者获得的循环肿瘤DNA(ctDNA)样品中检测一个或多个以下基因中至少一个遗传生物标记物的存在:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN或TP53。在一些实施方案中,所述癌症是I期癌症。在一些实施方案中,所述癌症是膀胱癌或上尿路尿路上皮癌(UTUC)。在一些实施方案中,所述至少一个突变包括失活修饰,并且其中所述至少一个突变在肿瘤抑制基因中。在一些实施方案中,所述修饰独立地选自单碱基取代、插入、缺失、易位、融合、断裂、重复或扩增。在一些实施方案中,所述方法还包括向受试者施用一种或多种治疗性干预(例如,以下中的一种或多种:手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法、免疫检查点抑制剂或其组合)。
在一些实施方案中,本文提供了用于为患者生成报告的系统,所述系统包括:至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9或10个)以下基因:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;和ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症。在用于为患者生成报告的系统的一些实施方案中,所述系统还包括至少一个被配置来检测TERT启动子中至少一个遗传生物标记物(例如,至少一个突变)的存在的装置。
在一些实施方案中,本文提供了用于为患者生成报告的系统,所述系统包括:至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;和ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症。在一些实施方案中,本文提供了用于为患者生成报告的系统,所述系统包括:至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11或12个)以下基因:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;和ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症。在一些实施方案中,本文提供了用于为患者生成报告的系统,所述系统包括:至少一个装置,其被配置来测定从患者收集的生物样品中的TP53基因以确定TP53的突变等位基因频率;b)至少一个计算机数据库,其包括:i)TP53在对照样品中的突变等位基因频率的第一参考分布;和ii)TP53在从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入TP53在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症。
在一些实施方案中,本文提供了用于生成报告以针对患者鉴定癌症治疗的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9或10个)以下基因:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii5将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。在用于生成报告以针对患者鉴定癌症治疗的系统的一些实施方案中,所述系统还包括至少一个被配置来检测TERT启动子中至少一个遗传生物标记物(例如,至少一个突变)的存在的装置。
在一些实施方案中,本文提供了用于生成报告以针对患者鉴定癌症治疗的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。在一些实施方案中,本文提供了用于生成报告以针对患者鉴定癌症治疗的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11或12个)以下基因:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。在一些实施方案中,本文提供了用于生成报告以针对患者鉴定癌症治疗的系统,所述系统包括:a)至少一个装置,其被配置来测定从患者收集的生物样品中的TP53基因以确定TP53的突变等位基因频率;b)至少一个计算机数据库,其包括:i)TP53在对照样品中的突变等位基因频率的第一参考分布;ii)TP53在从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与TP53的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入TP53在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。
在一些实施方案中,本文提供了用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因在从患者收集的样品中,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9或10个)以下基因:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。在用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括至少一个被配置来检测TERT启动子中至少一个遗传生物标记物(例如,至少一个突变)的存在的装置。
在一些实施方案中,本文提供了用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变在从患者收集的样品中的突变等位基因频率,其中所述组的基因在从患者收集的样品中,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。在一些实施方案中,本文提供了用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统,所述系统包括:a)至少一个装置,其被配置来测定生物样品中的一组基因以确定所述组的基因中每个突变的突变等位基因频率,其中所述组的基因包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11或12个)以下基因:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A;b)至少一个计算机数据库,其包括:i)对于所述组的基因中的每个突变,对照样品中的突变等位基因频率的第一参考分布;ii)对于所述组的基因中的每个突变,从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与所述组的基因的至少一个成员的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入所述组的基因中每个突变在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。在一些实施方案中,本文提供了用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统,所述系统包括:a)至少一个装置,其被配置来测定从患者收集的生物样品中的TP53基因以确定TP53的突变等位基因频率;b)至少一个计算机数据库,其包括:i)TP53在对照样品中的突变等位基因频率的第一参考分布;ii)TP53在从患有癌症的患者收集的样品中的突变等位基因频率的第二参考分布;和iii)具有与TP53的生物状态有关的功效的癌症治疗的列表;c)一种计算机可读程序代码,其包括执行以下的指令:i)输入TP53在生物样品中的突变等位基因频率;ii)将所述突变等位基因频率与第一参考分布进行比较;iii)将所述突变等位基因频率与第二参考分布进行比较;和iv)计算指示患者患有癌症的可能性的得分;d)一种计算机可读程序代码,其包括生成报告的指令,如果所述得分高于参考值,则所述报告指示患者患有癌症;或者如果所述得分不高于参考值,则所述报告指示患者未患癌症;以及e)一种计算机可读程序代码,其包括以下指令:当在步骤(d)中患者被鉴定为患有癌症时,针对所述患者鉴定来自(b)(iii)中的癌症治疗列表的至少一种癌症治疗,其中所计算的得分提供所鉴定的癌症治疗在患者中有效的指示。
在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括一种计算机可读程序代码,其包括执行以下的指令:i)针对两个或更多个遗传生物标记物,确定样品中的突变等位基因频率;ii)通过将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的突变等位基因频率的参考分布进行比较,获得指示受试者患有癌症的可能性的得分;以及ii)当所述得分高于所述得分的参考值时,鉴定受试者患有癌症。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括一种计算机可读程序代码,其包括执行以下指令的指令:i)从两个或更多个遗传生物标记物中选择一个具有最高得分的遗传生物标记物,所述最高得分指示所述受试者患有癌症的概率;以及ii)将所选的遗传生物标记物的得分与参考值进行比较。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述得分是Stouffer Z得分。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括一种计算机可读程序代码,其包括执行以下指令的指令:i)针对两个或更多个遗传生物标记物,确定样品中的突变等位基因频率;以及ii)将所选的遗传生物标记物中每个突变的突变等位基因频率与对照样品中每个突变的每个突变的最大突变等位基因频率进行比较。
在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,被配置来测定一组基因的装置包括一种装置,其采用基于PCR的多重测定、使用基于PCR的单重测定、数字PCR测定、微滴数字PCR(ddPCR)测定、微阵列测定、下一代测序测定、Sanger测序测定、定量PCR测定或连接测定。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,基于PCR的多重测序测定包括:a.为样品中存在的多个模板分子中的每一个分配唯一标识符(UID);b.扩增每个带唯一标签的模板分子以产生UID家族;以及c.对扩增产物进行冗佘测序。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统还包括被配置来检测生物样品中非整倍性的存在的装置。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因的装置:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,所述系统还包括被配置来检测生物样品中非整倍性的存在的装置(例如,包括多重免疫测定系统的装置)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括:1)至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、16或16个)以下基因的装置:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS,以及2)至少一个被配置来检测TERT启动子中遗传生物标记物(例如,至少一个突变)的存在的装置,所述系统还包括被配置来检测生物样品中非整倍性的存在的装置(例如,包括多重免疫测定系统的装置)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因的装置:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,所述系统还包括被配置来检测生物样品中非整倍性的存在的装置(例如,包括多重免疫测定系统的装置)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11或12个)以下基因的装置:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A,所述系统还包括被配置来检测生物样品中非整倍性的存在的装置(例如,包括多重免疫测定系统的装置)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定TP53的装置,所述系统还包括被配置来检测生物样品中非整倍性的存在的装置(例如,包括多重免疫测定系统的装置)。可以在与癌症相关联的一个或多个染色体或染色体臂上检测非整倍性的存在。在一些实施方案中,在染色体臂5q、8q和/或9p中的一个或多个上检测非整倍性的存在。在一些实施方案中,在染色体臂4p、7q、8q和/或9q中的一个或多个上检测非整倍性的存在
在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,与用于为患者生成报告的常规系统相比,所述系统在鉴定患者患有癌症方面的敏感性得到改善。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,与用于为患者生成报告的常规系统相比,所述系统在鉴定患者患有癌症方面的特异性得到改善。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,从远离至少一个计算机数据库的位置将突变等位基因频率值的第一和第二参考分布输入系统中。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,通过互联网连接将突变等位基因频率值的第一和第二参考分布输入系统中。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述报告呈电子格式或纸质格式。
在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述癌症是本文所述的各种癌症类型中的任一种(参见,例如标题为“癌症”的部分)。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)以下基因的装置:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和/或VHL,以及至少一个被配置来检测生物样品中非整倍性的存在的装置,所述癌症是膀胱癌或上尿路尿路上皮癌。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个)以下基因的装置:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和/或CDKN2A,以及至少一个被配置来检测生物样品中非整倍性的存在的装置,所述癌症是宫颈癌、子宫内膜癌、卵巢癌或输卵管癌。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定一个或多个(例如,1、2、3、4、5、6、7、8、9、10、11或12个)以下基因的装置:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和/或PPP2R1A,以及至少一个被配置来检测生物样品中非整倍性的存在的装置,所述癌症是子宫内膜癌。在用于为患者生成报告的系统、用于生成报告以针对患者鉴定癌症治疗的系统或用于为患者生成报告以将患者鉴定为增加监测、进一步诊断测试或两者的候选者的系统的一些实施方案中,所述系统包括至少一个被配置来测定TP53的装置以及至少一个被配置来检测生物样品中非整倍性的存在的装置,所述癌症是高级别浆液性癌。在用于为患者生成报告的系统或用于生成报告以针对患者鉴定癌症治疗的系统的一些实施方案中,患者被鉴定为增加监测、进一步诊断测试或两者(例如,本文所述的各种增加监测或进一步诊断方法中的任一种)的候选者。
当前批准用于早期癌症检测的许多测试本质上都是程序性的,并且包括结肠镜检查、乳腺摄影和宫颈细胞学分析。迄今为止,用基于突变的液体活检评估的绝大多数癌症患者均患有晚期疾病。液体活检的另一个问题是基础起源器官的鉴定。因为相同的基因突变驱动多种肿瘤类型,所以基于此类改变的液体活检通常不能鉴定原发性肿瘤的位置,从而产生阳性血液测试。本文描述了一种非侵入性组合血液测试(例如,组合了DNA标记物和蛋白质标记物的测试),用于多种常见癌症的早期检测和定位。
本文件提供了用于评估和/或治疗患有癌症或怀疑患有癌症的哺乳动物(例如,人)的方法和材料。在一些实施方案中,本文件提供了用于将哺乳动物鉴定为患有癌症的方法和材料。例如,可以评估从哺乳动物获得的样品(例如,血液样品),以至少部分地基于一个或多个生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个生物标记物(例如,肽生物标记物)的升高水平来确定所述哺乳动物是否患有癌症。在一些实施方案中,本文件提供了用于鉴定哺乳动物中癌症的位置(例如,解剖部位)的方法和材料。例如,可以评估从哺乳动物获得的样品(例如,血液样品),以至少部分地基于一个或多个生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个生物标记物(例如,肽生物标记物)的升高水平来确定哺乳动物中癌症的位置。在一些实施方案中,本文件提供了用于鉴定哺乳动物患有癌症并施用一种或多种药理学干预以治疗所述哺乳动物的方法和材料。例如,可以评估从哺乳动物获得的样品(例如,血液样品),以至少部分地基于样品中一个或多个第一生物标记物(例如,遗传生物标记物)的存在或不存在和/或一个或多个第二生物标记物(例如,肽生物标记物)的升高水平来确定所述哺乳动物是否患有癌症,以及向所述哺乳动物施用一种或多种癌症治疗。
如本文所证明的,仅对2,001bp的基因组DNA的分析可以在82%的八种常见癌症类型中检测到至少一个突变。设计了一种评估10种循环蛋白质的水平以及循环无细胞DNA中的这2,001bp的突变的测试(CancerSEEK)。将这种测试应用于1,005名患有肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌或乳腺癌的患者。CancerSEEK测试中,70%的八种癌症类型的中值为阳性,而不到1%的812名正常个体被评分为阳性。对于五种癌症类型(肝癌、卵巢癌、食道癌、胃癌和胰腺癌)的检测,敏感性范围为69%至98%,因此对于平均风险个体没有可用的筛选测试。此外,84%的在CancerSEEK测定中评分为阳性的患者的中值中,癌症的来源可能局限于少数解剖部位。
能够使用具有非常高特异性的血液测试(例如,通过组合DNA标记物和蛋白质标记物)可以允许临床医生在早期检测出癌症,从而得到具有较少的不必要的随访程序、较少的焦虑和/或减少的癌症死亡人数的早期治疗。
总体来讲,本文件的一个方面的特征在于一种用于鉴定哺乳动物患有癌症的方法。所述方法包括以下或基本上由以下组成:在从哺乳动物获得的血液样品中检测循环DNA中一个或多个遗传生物标记物的存在;在从哺乳动物获得的血液样品中检测一个或多个肽生物标记物的升高水平的存在;以及当在所述血液样品中的循环DNA中检测到一个或多个遗传生物标记物的存在时,当在所述血液样品中检测到一个或多个肽生物标记物的升高水平时,或两者时,鉴定哺乳动物患有癌症。所述哺乳动物可以是人。所述血液样品可以是血浆样品。所述癌症可以是I期癌症。所述癌症可以是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。一个或多个遗传生物标记物可以包括一个或多个基因中的一个或多个修饰。一个或多个修饰可以包括失活修饰,并且一个或多个基因可以包括肿瘤抑制基因。一个或多个修饰可以独立地选自单碱基取代、插入和缺失。一个或多个基因可以包括NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS。一个或多个修饰可以独立地选自表5中列出的修饰。可以使用基于PCR的多重测序测定来执行检测一个或多个遗传生物标记物的存在的步骤。基于PCR的多重测序测定可以包括为每个模板分子分配唯一标识符(UID);扩增每个带唯一标签的模板分子以产生UID家族;以及对扩增产物进行冗佘测序。一个或多个肽生物标记物可以包括催乳素、OPN、IL-6、CEA、CA125、HGF、髓过氧化物酶、CA19-9、中期因子和/或TIMP-1。可以使用多重免疫测定系统执行检测一个或多个肽生物标记物的水平的步骤。所述方法还可以包括鉴定所述癌症的位置。所述方法还可以包括向哺乳动物施用一种或多种癌症治疗。一种或多种癌症治疗可以包括手术、化疗、激素疗法、靶向疗法、放疗及其组合。
另一方面,本文件的特征在于一种用于治疗患有癌症的哺乳动物的方法。所述方法包括以下或基本上由以下组成:在从哺乳动物获得的血液样品中检测循环DNA中一个或多个遗传生物标记物的存在;在从哺乳动物获得的血液样品中检测一个或多个肽生物标记物的升高水平的存在;以及当在所述血液样品中的循环DNA中检测到一个或多个遗传生物标记物的存在时,当在所述血液样品中检测到一个或多个肽生物标记物的升高水平时,或两者时,向所述哺乳动物施用一种或多种癌症治疗。一种或多种癌症治疗可以包括手术、化疗、激素疗法、靶向疗法、放疗及其组合。所述哺乳动物可以是人。所述血液样品可以是血浆样品。所述癌症可以是I期癌症。所述癌症可以是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。一个或多个遗传生物标记物可以包括一个或多个基因中的一个或多个修饰。一个或多个修饰可以包括失活修饰,并且一个或多个基因可以包括肿瘤抑制基因。一个或多个修饰可以独立地选自单碱基取代、插入和缺失。一个或多个基因可以包括NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS。一个或多个修饰可以独立地选自表5中列出的修饰。可以使用基于PCR的多重测序测定来执行检测一个或多个遗传生物标记物的存在的步骤。基于PCR的多重测序测定可以包括为每个模板分子分配唯一标识符(UID);扩增每个带唯一标签的模板分子以产生UID家族;以及对扩增产物进行冗佘测序。一个或多个肽生物标记物可以包括催乳素、OPN、IL-6、CEA、CA125、HGF、髓过氧化物酶、CA19-9、中期因子和/或TIMP-1。可以使用多重免疫测定系统执行检测一个或多个肽生物标记物的水平的步骤。
另一方面,本文件的特征在于一种用于鉴定哺乳动物中癌症的位置的方法。所述方法包括以下或基本上由以下组成:在从哺乳动物获得的血液样品中检测循环DNA中一个或多个遗传生物标记物的存在;在从哺乳动物获得的血液样品中检测一个或多个肽生物标记物的升高水平的存在;以及当在所述血液样品中的循环DNA中检测到一个或多个遗传生物标记物的存在时,当在所述血液样品中检测到一个或多个肽生物标记物的升高水平时,或两者时,鉴定哺乳动物中癌症的位置。所述哺乳动物可以是人。所述血液样品可以是血浆样品。所述癌症可以是I期癌症。所述癌症可以是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。一个或多个遗传生物标记物可以包括一个或多个基因中的一个或多个修饰。一个或多个修饰可以包括失活修饰,并且一个或多个基因可以包括肿瘤抑制基因。一个或多个修饰可以独立地选自单碱基取代、插入和缺失。一个或多个基因可以包括NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS。一个或多个修饰可以独立地选自表5中列出的修饰。可以使用基于PCR的多重测序测定来执行检测一个或多个遗传生物标记物的存在的步骤。基于PCR的多重测序测定可以包括为每个模板分子分配唯一标识符(UID);扩增每个带唯一标签的模板分子以产生UID家族;以及对扩增产物进行冗佘测序。一个或多个肽生物标记物可以包括催乳素、OPN、IL-6、CEA、CA125、HGF、髓过氧化物酶、CA19-9、中期因子和/或TIMP-1。可以使用多重免疫测定系统执行检测一个或多个肽生物标记物的水平的步骤。
本文提供了用于鉴定人受试者中癌症的存在的方法,所述方法包括:在从所述人受试者分离的第一生物样品中检测来源于选自由以下组成的组的基因的无细胞DNA中一个或多个遗传改变的存在:AKT1、APC、BRAF、CDKN2、CTNNB1、FBXW7、FGFR2、GNAS、HRAS、KRAS、PPP2R1A、TP53、PTEN、PIK3CA、EGFR和NRAS及其组合;在从人受试者分离的第二生物样品中检测一个或多个蛋白质生物标记物的水平,其中所述蛋白质生物标记物选自由以下组成的组:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3及其组合;将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平进行比较;以及当检测到无细胞DNA中一个或多个遗传改变的存在,一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平,或两者时,鉴定人受试者中癌症的存在。在一些实施方案中,第一生物样品包括血液、血浆、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。在一些实施方案中,第一生物样品、第二生物样品或两者包括血浆。在一些实施方案中,第一生物样品和第二生物样品是相同的。
在鉴定人受试者中癌症的存在的一些实施方案中,在第一生物样品中检测无细胞DNA中一个或多个遗传改变的存在的步骤包括扩增包含密码子及其周围的剪接位点在内的扩增子,其中密码子选自由以下组成的组:AKT1的密码子16-18;APC的密码子1304-1311或1450-1459;BRAF的密码子591-602;CDKN2A的密码子51-58或76-88;CTNNB1的密码子31-39或38-47;EGFR的密码子856-868;FBXW7的密码子361-371、464-473、473-483或498-507;FGFR2的密码子250-256;GNAS的密码子199-208;HRAS的密码子7-19;KRAS的密码子7-14、57-65或143-148;NRAS的密码子3-15或54-63;PIK3CA的密码子80-90、343-348、541-551或1038-1050;PPP2R1A的密码子175-187;PTEN的密码子90-98、125-132、133-146、145-154;TP53的密码子10-22、25-32、33-40、40-52、52-64、82-94、97-110、112-125、123-125、126-132、132-142、150-163、167-177、175-186、187-195、195-206、207-219、219-224、226-237、232-245、248-261、261-268、272-283、279-290、298-307、307-314、323-331、333-344、344-355、367-375或374-386及其组合。在一些实施方案中,在第一生物样品中检测无细胞DNA中一个或多个遗传改变的存在的步骤包括对包含密码子及其周围的剪接位点在内的基因区域进行测序,其中密码子选自由以下组成的组:AKT1的密码子16-18;APC的密码子1304-1311或1450-1459;BRAF的密码子591-602;CDKN2A的密码子51-58或76-88;CTNNB1的密码子31-39或38-47;EGFR的密码子856-868;FBXW7的密码子361-371、464-473、473-483或498-507;FGFR2的密码子250-256;GNAS的密码子199-208;HRAS的密码子7-19;KRAS的密码子7-14、57-65或143-148;NRAS的密码子3-15或54-63;PIK3CA的密码子80-90、343-348、541-551或1038-1050;PPP2R1A的密码子175-187;PTEN的密码子90-98、125-132、133-146、145-154;TP53的密,码子10-22、25-32、33-40、40-52、52-64、82-94、97-110、112-125、123-125、126-132、132-142、150-163、167-177、175-186、187-195、195-206、207-219、219-224、226-237、232-245、248-261、261-268、272-283、279-290、298-307、307-314、323-331、333-344、344-355、367-375或374-386及其组合。在一些实施方案中,在第一生物样品中检测无细胞DNA中一个或多个遗传改变的存在的步骤包括对包含密码子及其周围的剪接位点在内的基因区域进行测序,所述密码子来自以下中的每一个:AKT1的密码子16-18;APC的密码子1304-1311和1450-1459;BRAF的密码子591-602;CDKN2A的密码子51-58和76-88;CTNNB1的密码子31-39和38-47;EGFR的密码子856-868;FBXW7的密码子361-371、464-473、473-483和498-507;FGFR2的密码子250-256;GNAS的密码子199-208;HRAS的密码子7-19;KRAS的密码子7-14、57-65和143-148;NRAS的密码子3-15和54-63;PIK3CA的密码子80-90、343-348、541-551和1038-1050;PPP2R1A的密码子175-187;PTEN的密码子90-98、125-132、133-146、145-154;TP53的密码子10-22、25-32、33-40、40-52、52-64、82-94、97-110、112-125、123-125、126-132、132-142、150-163、167-177、175-186、187-195、195-206、207-219、219-224、226-237、232-245、248-261、261-268、272-283、279-290、298-307、307-314、323-331、333-344、344-355、367-375和374-386及其组合。
在鉴定人受试者中癌症的存在的一些实施方案中,一个或多个蛋白质生物标记物包括CA19-9。在一些实施方案中,CA19-9蛋白质生物标记物的参考水平是92U/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括CEA。在一些实施方案中,CEA蛋白质生物标记物的参考水平是7.5ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括HGF。在一些实施方案中,HGF蛋白质生物标记物的参考水平是0.89ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括OPN。在一些实施方案中,OPN蛋白质生物标记物的参考水平是158ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括CA125。在一些实施方案中,CA125蛋白质生物标记物的参考水平是577U/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括AFP。在一些实施方案中,AFP蛋白质生物标记物的参考水平是21ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括催乳素。在一些实施方案中,催乳素蛋白质生物标记物的参考水平是145ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括TIMP-1。在一些实施方案中,TIMP-1蛋白质生物标记物的参考水平是177ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括卵泡抑素。在一些实施方案中,卵泡抑素蛋白生物标记物的参考水平是2ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括包括G-CSF。在一些实施方案中,G-CSF蛋白质生物标记物的参考水平是800pg/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括CA15-3。在一些实施方案中,CA15-3蛋白质生物标记物的参考水平是98U/mL。
在鉴定人受试者中癌症的存在的一些实施方案中,当以下情况下时鉴定人受试者中癌症的存在:(i)检测到衍生的无细胞DNA中一个或多个遗传改变的存在,以及(ii)一个或多个蛋白质生物标记物的检测水平高于所述一个或多个蛋白质生物标记物的参考水平。
在鉴定人受试者中癌症的存在的一些实施方案中,通过扩增无细胞DNA以形成扩增子家族在第一生物样品中检测无细胞DNA中一个或多个遗传改变的存在,其中家族的每个成员均来源于无细胞DNA中的单个模板分子,其中家族的每个成员用共同的寡核苷酸条形码标记,并且其中每个家族用不同的寡核苷酸条形码标记。在一些实施方案中,通过用共同包含多个寡核苷酸条形码的引物群体扩增的步骤,将寡核苷酸条形码引入到模板分子中。在一些实施方案中,寡核苷酸条形码对于模板分子是内源的,并且包含DNA合成引发位点的衔接子连接至模板分子的与寡核苷酸条形码相邻的末端。
在鉴定人受试者中癌症的存在的一些实施方案中,当鉴定出癌症的存在时,向所述受试者施用治疗性干预。在一些实施方案中,治疗性干预选自由以下组成的组:过继性T细胞疗法、放疗、手术、化疗剂的施用、免疫检查点抑制剂的施用、靶向疗法的施用、激酶抑制剂的施用、信号转导抑制剂的施用、双特异性抗体的施用、单克隆抗体的施用及其组合。在一些实施方案中,其中与在稍后的时间向人受试者施用治疗性干预相比,所述治疗性干预更有效。
在鉴定人受试者中癌症的存在的一些实施方案中,在诊断人受试者患有癌症之前的时间检测人受试者中癌症的存在。在一些实施方案中,在人受试者表现出与癌症相关联的症状之前的时间检测人受试者中癌症的存在。
在鉴定人受试者中癌症的存在的一些实施方案中,人受试者是经受器官或身体区域的放射扫描以鉴定癌症的位置的人。在一些实施方案中,人受试者是经受全身放射扫描以鉴定癌症的位置的人。在一些实施方案中,扫描是正电子发射断层成像-计算机断层成像(PET-CT)扫描。
在一些实施方案中,癌症选自由以下组成的组:胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌和乳腺癌及其组合。
本文还提供了用于鉴定人受试者中癌症的存在的方法,所述方法包括:在从人受试者分离的第一生物样品中检测一个或多个蛋白质生物标记物的水平,其中一个或多个蛋白质生物标记物选自由以下组成的组:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3及其组合;将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平进行比较;以及当一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平时,鉴定人受试者中癌症的存在。
本文提供了用于鉴定人受试者中胰腺癌的存在的方法,所述方法包括:在从所述人受试者分离的第一生物样品中检测来源于选自由以下组成的组的基因的无细胞DNA中一个或多个遗传改变的存在:KRAS、TP53、CDKN2A、SMAD4及其组合;在从人受试者分离的第二生物样品中检测一个或多个蛋白质生物标记物的水平,其中一个或多个蛋白质生物标记物选自由以下组成的组:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)及其组合;将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平进行比较;以及当检测到无细胞DNA中一个或多个遗传改变的存在,一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平,或两者时,鉴定人受试者中胰腺癌的存在。在一些实施方案中,第一生物样品包括血液、血浆、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。在一些实施方案中,第一生物样品、第二生物样品或两者包括血浆。在一些实施方案中,第一生物样品和第二生物样品是相同的。
在鉴定人受试者中胰腺癌的存在的方法的一些实施方案中,一个或多个遗传改变出现在KRAS基因的密码子12或61中。在一些实施方案中,一个或多个蛋白质生物标记物包括CA19-9。在一些实施方案中,CA19-9蛋白质生物标记物的参考水平是100U/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括CEA。在一些实施方案中,CEA蛋白质生物标记物的参考水平是7.5ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括HGF。在一些实施方案中,HGF蛋白质生物标记物的参考水平是0.92ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括OPN。在一些实施方案中,OPN蛋白质生物标记物的参考水平是158ng/mL。在一些实施方案中,检测一个或多个蛋白质生物标记物的水平包括检测CA19-9、CEA、HGF和OPN中的每一个的水平;并且将将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平进行比较包括将CA19-9、CEA、HGF和OPN中的每一个的检测水平与CA19-9、CEA、HGF和OPN中的每一个的参考水平进行比较。
在用于鉴定人受试者中胰腺癌的存在的方法的一些实施方案中,当以下情况下时鉴定人受试者中胰腺癌的存在:(i)检测到来源于KRAS基因的无细胞DNA中一个或多个遗传改变的存在,以及(ii)一个或多个蛋白质生物标记物的检测水平高于所述一个或多个蛋白质生物标记物的参考水平。在用于鉴定人受试者中胰腺癌的存在的方法的一些实施方案中,通过扩增无细胞DNA以形成扩增子家族来检测一个或多个遗传改变,其中家族的每个成员均来源于无细胞DNA中的单个模板分子,其中家族的每个成员用共同的寡核苷酸条形码标记,并且其中每个家族用不同的寡核苷酸条形码标记。在一些实施方案中,通过用共同包含多个寡核苷酸条形码的引物群体扩增的步骤,将寡核苷酸条形码引入到模板分子中。在一些实施方案中,寡核苷酸条形码对于模板分子是内源的,并且包含DNA合成引发位点的衔接子连接至模板分子的与寡核苷酸条形码相邻的末端。
在一些实施方案中,当鉴定出胰腺癌的存在时,向人受试者施用治疗性干预。在一些实施方案中,治疗性干预选自由以下组成的组:过继性T细胞疗法、放疗、手术、化疗剂的施用、免疫检查点抑制剂的施用、靶向疗法的施用、激酶抑制剂的施用、信号转导抑制剂的施用、双特异性抗体的施用、单克隆抗体的施用及其组合。在一些实施方案中,在人受试者患有早期胰腺癌的时间施用治疗性干预,并且其中与在稍后的时间向人受试者施用治疗性干预相比,所述治疗性干预更有效。
在一些实施方案中,在诊断人受试者患有胰腺癌之前的时间检测人受试者中胰腺癌的存在。在一些实施方案中,在人受试者表现出与胰腺癌相关联的症状之前的时间检测人受试者中胰腺癌的存在。
本文还提供了用于鉴定人受试者中胰腺癌的存在的方法,所述方法包括:在从人受试者分离的第一生物样品中检测一个或多个蛋白质生物标记物的水平,其中一个或多个蛋白质生物标记物选自由以下组成的组:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)及其组合;将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平进行比较;以及当一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平时,鉴定人受试者中胰腺癌的存在。
本文提供了用于鉴定人受试者中癌症的存在的方法,所述方法包括:在从所述受试者分离的第一生物样品中检测来源于选自由以下组成组的基因的无细胞DNA中一个或多个遗传改变的存在:AKT1、APC、BRAF、CDKN2、CTNNB1、FBXW7、FGFR2、GNAS、HRAS、KRAS、PPP2R1A、TP53、PTEN、PIK3CA、EGFR和NRAS及其组合;在从所述受试者中分离的第二生物样品中检测来源于选自由以下组成的组基因的DNA中一个或多个遗传改变的不存在:AKT1、APC、BRAF、CDKN2、CTNNB1、FBXW7、FGFR2、GNAS、HRAS、KRAS、PPP2R1A、TP53、PTEN、PIK3CA、EGFR和NRAS及其组合,其中第二生物样品是从受试者的白细胞中分离的;当在第二样品中未检测到在第一样品中检测到的一个或多个基因改变时,鉴定受试者中癌症的存在。在一些实施方案中,第一生物样品、第二生物样品或两者包括血液、血浆、尿液、脑脊液、唾液、痰液、支气管肺泡灌洗液、胆汁、淋巴液、囊液、粪便、腹水及其组合。在一些实施方案中,第一生物样品、第二生物样品或两者包括血浆。在一些实施方案中,第一生物样品和第二生物样品是相同的。在鉴定人受试者中癌症的存在的一些实施方案中,所述方法还包括检测从受试者分离的第三生物样品中检测一个或多个蛋白质生物标记物的水平,其中所述蛋白质生物标记物选自由以下组成的组:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)、骨桥蛋白(OPN)、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3及其组合;将一个或多个蛋白质生物标记物的检测水平与一个或多个蛋白质生物标记物的参考水平进行比较;当在第一样品中检测到无细胞DNA中一个或多个遗传改变的存在,在来自第二样品的DNA中检测到一个或多个遗传改变的不存在,以及一个或多个蛋白质生物标记物的检测水平高于一个或多个蛋白质生物标记物的参考水平时,鉴定受试者中癌症的存在。在一些实施方案中,第三生物样品与第一生物样品相同。
在鉴定人受试者中癌症的存在的一些实施方案中,在第一生物样品中检测无细胞DNA中一个或多个遗传改变的存在的步骤,在第二生物样品中检测DNA中一个或多个遗传改变的存在的步骤,或两者,包括扩增包含密码子及其周围的剪接位点在内的扩增子,其中密码子选自由以下组成的组:AKT1的密码子16-18;APC的密码子1304-1311或1450-1459;BRAF的密码子591-602;CDKN2A的密码子51-58或76-88;CTNNB1的密码子31-39或38-47;EGFR的密码子856-868;FBXW7的密码子361-371、464-473、473-483或498-507;FGFR2的密码子250-256;GNAS的密码子199-208;HRAS的密码子7-19;KRAS的密码子7-14、57-65或143-148;NRAS的密码子3-15或54-63;PIK3CA的密码子80-90、343-348、541-551或1038-1050;PPP2R1A的密码子175-187;和PTEN的密码子90-98、125-132、133-146、145-154;和TP53的密码子10-22、25-32、33-40、40-52、52-64、82-94、97-110、112-125、123-125、126-132、132-142、150-163、167-177、175-186、187-195、195-206、207-219、219-224、226-237、232-245、248-261、261-268、272-283、279-290、298-307、307-314、323-331、333-344、344-355、367-375或374-386。在一些实施方案中,在第一生物样品中检测无细胞DNA中一个或多个遗传改变的存在的步骤,在第二生物样品中检测DNA中一个或多个遗传改变的存在的步骤,或两者,包括对包含密码子及其周围的剪接位点在内的基因区域进行测序,其中密码子选自由以下组成的组:AKT1的密码子16-18;APC的密码子1304-1311或1450-1459;BRAF的密码子591-602;CDKN2A的密码子51-58或76-88;CTNNB1的密码子31-39或38-47;EGFR的密码子856-868;FBXW7的密码子361-371、464-473、473-483或498-507;FGFR2的密码子250-256;GNAS的密码子199-208;HRAS的密码子7-19;KRAS的密码子7-14、57-65或143-148;NRAS的密码子3-15或54-63;PIK3CA的密码子80-90、343-348、541-551或1038-1050;PPP2R1A的密码子175-187;和PTEN的密码子90-98、125-132、133-146、145-154;和TP53的密码子10-22、25-32、33-40、40-52、52-64、82-94、97-110、112-125、123-125、126-132、132-142、150-163、167-177、175-186、187-195、195-206、207-219、219-224、226-237、232-245、248-261、261-268、272-283、279-290、298-307、307-314、323-331、333-344、344-355、367-375或374-386。在一些实施方案中,在第一生物样品中检测无细胞DNA中一个或多个遗传改变的存在的步骤,在第二生物样品中检测DNA中一个或多个遗传改变的存在的步骤,或两者,包括对包含密码子及其周围的剪接位点在内的基因区域进行测序,所述密码子来自以下中的每一个:AKT1的密码子16-18;APC的密码子1304-1311和1450-1459;BRAF的密码子591-602;CDKN2A的密码子51-58和76-88;CTNNB1的密码子31-39和38-47;EGFR的密码子856-868;FBXW7的密码子361-371、464-473、473-483和498-507;FGFR2的密码子250-256;GNAS的密码子199-208;HRAS的密码子7-19;KRAS的密码子7-14、57-65和143-148;NRAS的密码子3-15和54-63;PIK3CA的密码子80-90、343-348、541-551和1038-1050;PPP2R1A的密码子175-187;和PTEN的密码子90-98、125-132、133-146、145-154;和TP53的密码子10-22、25-32、33-40、40-52、52-64、82-94、97-110、112-125、123-125、126-132、132-142、150-163、167-177、175-186、187-195、195-206、207-219、219-224、226-237、232-245、248-261、261-268、272-283、279-290、298-307、307-314、323-331、333-344、344-355、367-375和374-386。
在鉴定人受试者中癌症的存在的一些实施方案中,一个或多个蛋白质生物标记物包括CA19-9。在一些实施方案中,CA19-9蛋白质生物标记物的参考水平是92U/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括CEA。在一些实施方案中,CEA蛋白质生物标记物的参考水平是7.5ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括HGF。在一些实施方案中,HGF蛋白质生物标记物的参考水平是0.89ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括OPN。在一些实施方案中,OPN蛋白质生物标记物的参考水平是158ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括CA125。在一些实施方案中,CA125蛋白质生物标记物的参考水平是577U/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括AFP。在一些实施方案中,AFP蛋白质生物标记物的参考水平是21ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括催乳素。在一些实施方案中,催乳素蛋白质生物标记物的参考水平是145ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括TIMP-1。在一些实施方案中,TIMP-1蛋白质生物标记物的参考水平是177ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括卵泡抑素。在一些实施方案中,卵泡抑素蛋白质生物标记物的参考水平是2ng/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括G-CSF。在一些实施方案中,G-CSF蛋白质生物标记物的参考水平是800pg/mL。在一些实施方案中,一个或多个蛋白质生物标记物包括CA15-3。在一些实施方案中,CA15-3蛋白质生物标记物的参考水平是98U/mL。
在鉴定人受试者中癌症的存在的一些实施方案中,通过扩增无细胞DNA以形成扩增子家族在第一生物样品中检测无细胞DNA中一个或多个遗传改变的存在,在第二样品中检测DNA中一个或多个遗传改变的不存在,或两者,其中家族的每个成员均来源于无细胞DNA中的单个模板分子,其中家族的每个成员用共同的寡核苷酸条形码标记,并且其中每个家族用不同的寡核苷酸条形码标记。在一些实施方案中,通过用共同包含多个寡核苷酸条形码的引物群体扩增的步骤,将寡核苷酸条形码引入到模板分子中。在一些实施方案中,寡核苷酸条形码对于模板分子是内源的,并且包含DNA合成引发位点的衔接子连接至模板分子的与寡核苷酸条形码相邻的末端。
在一些实施方案中,当鉴定出癌症的存在时,向受试者施用治疗性干预。在一些实施方案中,治疗性干预选自由以下组成的组:过继性T细胞疗法、放疗、手术、化疗剂的施用、免疫检查点抑制剂的施用、靶向疗法的施用、激酶抑制剂的施用、信号转导抑制剂的施用、双特异性抗体的施用、单克隆抗体的施用及其组合。在一些实施方案中,在受试者患有早期癌症的时间施用治疗性干预,并且其中与在稍后的时间向受试者施用治疗性干预相比,所述治疗性干预更有效。
在鉴定人受试者中癌症的存在的一些实施方案中,在诊断受试者患有癌症之前的时间检测受试者中癌症的存在。在一些实施方案中,在受试者表现出与癌症相关联的症状之前的时间检测受试者中癌症的存在。
在鉴定人受试者中癌症的存在的一些实施方案中,人受试者是经受器官或身体区域的放射扫描以鉴定癌症的位置的人。在一些实施方案中,人受试者是经受全身放射扫描以鉴定癌症的位置的人。在一些实施方案中,扫描是正电子发射断层成像-计算机断层成像(PET-CT)扫描。
在鉴定人受试者中癌症的存在的一些实施方案中,癌症选自由以下组成的组:胰腺癌、结肠癌、食道癌、胃癌、卵巢癌、肝癌、肺癌和乳腺癌及其组合。
如本文更详细描述的,已经表明来自采样流体(例如,包含从子宫颈管采样的细胞的流体)的DNA可以用于测定(例如,基于PCR的多重测试)中,以同时评估子宫内膜癌或卵巢癌中常见的遗传改变(图19)。另外,如本文更详细描述的且不限于此,鉴定了两种增加敏感性的方式。首先,对宫内采样(使用“陶氏刷”)进行测试,所述方法使样品收集更接近肿瘤的解剖部位。其次,最近的一项研究表明,测试来自同一个体的唾液和血浆两者中的突变增加了检测头颈部肿瘤的敏感性(Wang等人,Detection of somatic mutations and HPV inthe saliva and plasma of patients with head and neck squamous cellcarcinomas.Sci Transl Med 7,293ra104(2015)).基于此先例,表明测试血浆和巴氏测试流体两者中的突变可以增加对癌症(例如,卵巢癌)的敏感性。
在一些方面,本文提供了基于从流体(例如,在常规Papanicolaou(巴氏)测试期间获得的流体)中回收的DNA的遗传分析来检测子宫内膜癌和卵巢癌的方法。在一些实施方案中,这种称为PapSEEK的新测试结合了18个基因中的一个或多个中的突变的测定和/或非整倍性的测定。在一些实施方案中,本文提供的检测妇科癌症的方法在癌症更可能被治愈的阶段使用。在一些实施方案中,PapSEEK可以与血浆样品中存在的核酸中一个或多个基因中的突变的测定组合。
在一些实施方案中,本文提供了用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法,其包括:在从受试者获得的样品中检测一个或多个选自由以下组成的组的基因中一个或多个突变的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A,在样品中检测非整倍性的存在,或两者,其中NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A中一个或多个突变的存在,非整倍体的存在,或两者,指示受试者患有卵巢癌或子宫内膜癌。在一些实施方案中,检测NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF、CDKN2A中一个或多个突变的存在的步骤使用基于PCR的多重测定、使用基于PCR的单重测定、数字PCR测定、微滴数字PCR(ddPCR)测定、微阵列测定、下一代测序测定、Sanger测序测定、定量PCR测定或连接测定来执行。在一些实施方案中,检测NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF、CDKN2A中一个或多个突变的存在的步骤通过使用错误减少技术增加大规模平行测序仪器的敏感性来执行,所述技术允许检测100至1,000,000个野生型模板中的1个突变体模板范围内的罕见突变体等位基因。例如,可以通过使用错误减少技术增加大规模平行测序仪器的敏感性来进行检测一个或多个突变的步骤,其包括:a)为每个模板分子在分子上分配唯一标识符(UID),b)扩增每个带唯一标签的模板分子以产生UID家族,以及c)对扩增产物进行冗余测序。在一些实施方案中,本文提供的方法还包括对样品进行细胞学检查,其中NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A中一个或多个突变的存在,非整倍性的存在和/或阳性细胞学检查,指示受试者患有卵巢癌或子宫内膜癌。在一些实施方案中,检测样品中非整倍性的存在的步骤包括在染色体臂4p、7q、8q和9q中的一个或多个上检测一个或多个改变的存在。在一些实施方案中,检测样品中非整倍性的存在的步骤包括扩增散布的核苷酸元件。在一些实施方案中,本文提供的方法还包括在包含循环肿瘤DNA(ctDNA)的第二样品中检测一个或多个选自由以下组成的组的基因中至少一个突变的存在:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN和TP53。在一些实施方案中,第二样品包括血浆。在一些实施方案中,通过宫内采样来收集样品。在一些实施方案中,使用陶氏刷收集样品。在一些实施方案中,方法还包括向受试者施用疗法(例如,辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法、免疫检查点抑制剂及其组合)。
在一些实施方案中,本文提供了用于鉴定受试者中子宫内膜癌的存在的方法,其包括:在从受试者获得的样品中检测一个或多个选自由以下组成的组的基因中一个或多个突变的存在:PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和PPP2R1A,在样品中检测非整倍性的存在,或两者,其中PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和PPP2R1A中一个或多个突变的存在,非整倍性的存在,或两者,指示受试者患有子宫内膜癌。在一些实施方案中,检测PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和PPP2R1A中一个或多个突变的存在的步骤使用基于PCR的多重测定、使用基于PCR的单重测定、数字PCR测定、微滴数字PCR(ddPCR)测定、微阵列测定、下一代测序测定、Sanger测序测定、定量PCR测定或连接测定来执行。在一些实施方案中,检测PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和PPP2R1A中一个或多个突变的存在的步骤通过使用错误减少技术增加大规模平行测序仪器的敏感性来执行,所述技术允许检测100至1,000,000个野生型模板中的1个突变体模板范围内的罕见突变体等位基因。例如,可以通过使用错误减少技术增加大规模平行测序仪器的敏感性来进行检测一个或多个突变的步骤,其包括:a)为每个模板分子在分子上分配唯一标识符(UID),b)扩增每个带唯一标签的模板分子以产生UID家族,以及c)对扩增产物进行冗余测序。在一些实施方案中,本文提供的方法还包括对样品进行细胞学检查,其中PTEN、TP53、PIK3CA、PIK3R1、CTNNB1、KRAS、FGFR2、POLE、APC、FBXW7、RNF43和PPP2R1A中一个或多个突变的存在,非整倍性的存在和/或阳性细胞学检查,指示受试者患有子宫内膜癌。在一些实施方案中,检测样品中非整倍性的存在的步骤包括在染色体臂4p、7q、8q和9q中的一个或多个上检测一个或多个改变的存在。在一些实施方案中,检测样品中非整倍性的存在的步骤包括扩增散布的核苷酸元件。在一些实施方案中,本文提供的方法还包括在包含循环肿瘤DNA(ctDNA)的第二样品中检测一个或多个选自由以下组成的组的基因中至少一个突变的存在:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN和TP53。在一些实施方案中,第二样品包括血浆。在一些实施方案中,通过宫内采样来收集样品。在一些实施方案中,使用陶氏刷收集样品。在一些实施方案中,方法还包括向受试者施用疗法(例如,辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法、免疫检查点抑制剂及其组合)。
在一些实施方案中,本文提供了检测受试者中的卵巢癌的方法,其包括在从受试者获得的样品中检测TP53中一个或多个突变的存在,在样品中检测非整倍性的存在,或两者,其中TP53中一个或多个突变的存在,非整倍性的存在,或两者,指示受试者患有卵巢癌。在一些实施方案中,检测TP53中一个或多个突变的存在的步骤使用基于PCR的多重测定、使用基于PCR的单重测定、数字PCR测定、微滴数字PCR(ddPCR)测定、微阵列测定、下一代测序测定、Sanger测序测定、定量PCR测定或连接测定来执行。在一些实施方案中,检测TP53中一个或多个突变的存在的步骤通过使用错误减少技术增加大规模平行测序仪器的敏感性来执行,所述技术允许检测100至1,000,000个野生型模板中的1个突变体模板范围内的罕见突变体等位基因。例如,可以通过使用错误减少技术增加大规模平行测序仪器的敏感性来进行检测一个或多个突变的步骤,其包括:a)为每个模板分子在分子上分配唯一标识符(UID),b)扩增每个带唯一标签的模板分子以产生UID家族,以及c)对扩增产物进行冗余测序。在一些实施方案中,本文提供的方法还包括对样品进行细胞学检查,其中TP53中一个或多个突变的存在,非整倍性的存在和/或阳性细胞学检查,指示受试者患有卵巢癌。在一些实施方案中,检测样品中非整倍性的存在的步骤包括在染色体臂4p、7q、8q和9q中的一个或多个上检测一个或多个改变的存在。在一些实施方案中,检测样品中非整倍性的存在的步骤包括扩增散布的核苷酸元件。在一些实施方案中,本文提供的方法还包括在包含循环肿瘤DNA(ctDNA)的第二样品中检测一个或多个选自由以下组成的组的基因中至少一个突变的存在:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN和TP53。在一些实施方案中,第二样品包括血浆。在一些实施方案中,通过宫内采样来收集样品。在一些实施方案中,使用陶氏刷收集样品。在一些实施方案中,方法还包括向受试者施用疗法(例如,辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法、免疫检查点抑制剂及其组合)。
本文提供了检测受试者中的膀胱癌或上尿路尿路上皮癌的方法,其包括:在从受试者获得的尿液样品中检测一个或多个选自由以下组成的组的基因中一个或多个突变的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL,在样品中检测TERT启动子中至少一个突变的存在,以及在样品中检测非整倍性的存在,其中由以下组成的组中一个或多个突变的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL,TERT启动子中至少一个突变的存在,或非整倍性的存在,指示受试者患有膀胱癌。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,一个或多个基因是TP53、FGFR3或两者。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL中的一个或多个突变,TERT启动子中的一个或多个突变,或两者,存在于样品中0.03%或更少的尿液细胞中。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,使用基于PCR的多重测定、Sanger测序测定、下一代测序测定、定量PCR测定、微滴数字PCR(ddPCR)测定或微阵列技术来执行。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,使用Sanger测序测定来执行。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,使用下一代测序测定来执行。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,检测样品中非整倍性的存在的步骤包括在染色体臂5q、8q和9p中的一个或多个上检测一个或多个改变的存在。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,检测非整倍性的存在的步骤包括扩增长散布核苷酸元件(LINE)。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,通过使用错误减少技术增加大规模平行测序仪器的敏感性来执行,所述技术允许检测5,000至1,000,000个野生型模板中的1个突变体模板范围内的罕见突变体等位基因。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,通过使用错误减少技术增加大规模平行测序仪器的敏感性来执行,所述技术包括:a)为每个模板分子分配唯一标识符(UID),b)扩增每个带唯一标签的模板分子以产生UID家族,以及c)对扩增产物进行冗余测序。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,所述方法还包括对样品执行细胞学检查,其中TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在,TERT启动子中至少一个突变的存在,非整倍性的存在,或阳性细胞学检查,指示受试者患有膀胱癌。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,所述方法还包括施用经尿道膀胱切除术(TURB)、膀胱内BCG(卡介苗)、膀胱内化疗、辅助化疗、新辅助化疗、膀胱切除术或膀胱前列腺切除术、放疗、免疫疗法、免疫检查点抑制剂或其任何组合。
在检测受试者中的上尿路尿路上皮癌的方法的一些实施方案中,所述方法还包括施用经尿道切除术、膀胱内BCG(卡介苗)、膀胱内化疗、辅助化疗、新辅助化疗、输尿管切除术或肾输尿管切除术、放疗、免疫疗法、免疫检查点抑制剂或其任何组合。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,癌症是低级别肿瘤。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中癌症是低级别肿瘤,所述低级别肿瘤是低恶性潜力的乳头状尿路上皮赘生物(PUNLMP)或非浸润性低级别乳头状尿路上皮癌。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中癌症是低级别肿瘤,所述方法还包括施用经尿道膀胱切除术(TURB)。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,所述方法包括在从受试者获得的尿液样品中检测TP53、FGFR3或两者中一个或多个突变的存在。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL中的一个或多个突变,TERT启动子中的一个或多个突变,或两者,存在于样品中0.03%或更少的尿液细胞中。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,使用基于PCR的多重测定来执行。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,使用Sanger测序测定来执行。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,使用下一代测序测定来执行。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,检测样品中非整倍性的存在的步骤包括在染色体臂5q、8q和9p中的一个或多个上检测一个或多个改变的存在。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,检测非整倍性的存在的步骤包括扩增长散布核苷酸元件(LINE)。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,通过使用错误减少技术增加大规模平行测序仪器的敏感性来执行,所述技术允许检测5,000至1,000,000个野生型模板中的1个突变体模板范围内的罕见突变体等位基因。在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在的步骤,检测TERT启动子中至少一个突变的存在的步骤,或两者,通过使用错误减少技术增加大规模平行测序仪器的敏感性来执行,所述技术包括:a)为每个模板分子分配唯一标识符(UID),b)扩增每个带唯一标签的模板分子以产生UID家族,以及c)对扩增产物进行冗余测序。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,所述方法还包括对样品进行细胞学检查,其中TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET、VHL中一个或多个突变的存在,TERT启动子中至少一个突变的存在,非整倍性的存在,或阳性细胞学检查,指示受试者患有膀胱癌。
在检测受试者中的膀胱癌或上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,所述方法还包括施用经尿道膀胱切除术(TURB)、膀胱内BCG(卡介苗)、膀胱内化疗、辅助化疗、新辅助化疗、膀胱切除术或膀胱前列腺切除术、放疗、免疫疗法、免疫检查点抑制剂或以上的任何组合。
在检测受试者中的上尿路尿路上皮癌的方法的一些实施方案中,其中受试者先前已经经历过膀胱癌或上尿路尿路上皮癌的治疗,所述方法还包括施用经尿道切除术、膀胱内BCG(卡介苗)、膀胱内化疗、辅助化疗、新辅助化疗、输尿管切除术或肾输尿管切除术、放疗、免疫疗法、免疫检查点抑制剂或其任何组合。
本文件提供了用于鉴定一个或多个染色体异常(例如,非整倍性)的方法和材料。在一些情况下,本文件提供了使用基于扩增子的测序数据来鉴定哺乳动物患有与一个或多个染色体异常相关联的疾病或病症的方法和材料。例如,本文所述的方法和材料可以应用于从哺乳动物获得的样品,以鉴定哺乳动物具有一个或多个染色体异常。例如,本文所述的方法和材料可以应用于从哺乳动物获得的样品,以鉴定哺乳动物患有与一个或多个染色体异常相关联的疾病或病症。例如,可以至少部分地基于一个或多个非整倍性的存在鉴定产前哺乳动物患有疾病或病症。本文件还提供了用于鉴定和/或治疗与一个或多个染色体异常相关联的疾病的方法和材料。在一些情况下,可以鉴定在从哺乳动物获得的样品中获得的DNA中的一个或多个染色体异常。例如,可以用一种或多种癌症治疗来治疗至少部分基于一个或多个染色体异常的存在而被鉴定为患有癌症的哺乳动物。
如本文所证明的,一种新的方法(称为用于样品内非整倍性检测的WALDO,可用来评估从扩增子获得的测序数据,以鉴定一个或多个染色体异常(例如,非整倍性)的存在。例如,WALDO可以采用监督式机器学习来检测癌症中经常存在的多个染色体臂中的微小变化。如本文所述,WALDO用于搜索来自癌症患者或正常个体的1,677个肿瘤以及1,522个血液的液体活检中的染色体臂获得和丢失。在95%的癌症活检和22%的液体活检中检测到了非整倍性。使用扩增的散布核苷酸元件(LINE)内的单核苷酸多态性(SNP),WALDO同时评估了等位基因失衡、微卫星不稳定性和样品鉴定。WALDO可用于仅包含几纳克(ng)DNA且赘生物含量低至1%的样品。
具有使用基于扩增子的测序读长来检测一个或多个染色体异常能力,为以相对较低的成本实现高覆盖深度以及改进的敏感性,提供了一个独特且未实现的机会。此外,使用基于扩增子的测序读长的能力允许从含有有限量的DNA的样品中检测一个或多个染色体异常(例如,非整倍性)。这种方法可以用于多种应用中,包括但不限于诊断(例如,产前诊断和/或癌症诊断)和法医科学。
总体来讲,本文件的一个方面的特征在于一种用于检测哺乳动物基因组中的非整倍性的方法。所述方法包括以下或由以下组成:对在从哺乳动物获得样品中获得的多个扩增子进行测序以获得测序读长;将所述测序读长分组成基因组区间的簇;使用方程
Figure GDA0002675196410007871
计算每个基因组区间中测序读长的分布的和,其中Ri是测序读长的数量,I是染色体臂上簇的数量,N是具有参数μi和σi 2的高斯分布,其中μi是每个基因组区间中测序读长的平均数量,并且其中σi 2是每个基因组区间中测序读长的方差;使用分位函数
Figure GDA0002675196410007881
计算染色体臂的Z得分;以及当Z得分在显著性阈值之外时,鉴定哺乳动物的基因组中非整倍性的存在。多个扩增子可以包括约10,000个扩增子至约1,000,000个扩增子(例如,多个扩增子可包含约38,000个扩增子)。基因组区间可以包括约100个核苷酸至约125,000,000个核苷酸(例如,基因组区间可以包括约500,000个核苷酸)。所述哺乳动物可以是人。样品可以是液体活检。液体活检可以是血液、尿液、唾液、囊液、痰液、组织、粪便、巴氏涂片或脑脊液。液体活检可以是血液样品(例如,血浆样品)。血液样品可以包括无细胞的胎儿DNA。样品可以包括赘生性细胞部分。样品中的赘生性细胞部分可以占整个样品的小于约1%(例如,小于约0.5%)。扩增子可以包括唯一长散布核苷酸元件(LINE)。测序步骤还可以包括扩增来自从哺乳动物获得的样品的DNA以获得扩增子。可以使用单个引物对进行扩增。扩增子可以包括约100至约140个碱基对。每个扩增子可以测序1至20次。所述方法可以包括约100,000至约25百万个测序读长。每个簇可以包括约200个基因组区间。所述方法还可以包括监督式机器学习。监督式机器学习可以采用支持向量机模型。
另一方面,本文件的特征在于一种用于检测哺乳动物基因组中一个或多个多态性的方法。所述方法包括以下或基本上由以下组成:对从来自哺乳动物的样品中获得的多个扩增子进行测序以获得变体测序读长;对从来自哺乳动物的参考样品中获得的多个扩增子进行测序以获得参考测序读长;将变体测序读长和参考测序读长分组成基因组区间的簇;选择在两个等位基因上变体测序读长和参考测序读长的和大于约3的染色体臂;确定所选的染色体臂的变体等位基因频率(VAF),其中所述VAF是变体测序读长的数量/测序读长的总数量;以及如果VAF在约0.2与约0.8之间,则鉴定在所述所选的哺乳动物染色体臂上一个或多个多态性的存在。测序步骤可以包括为每个扩增子分配唯一标识符(UID),扩增每个带唯一标签的扩增子以产生UID家族,以及对扩增产物进行冗余测序。测序步骤还可以包括使用方程
Figure GDA0002675196410007882
计算所述所选的染色体臂上的变体的Z得分,其中wi是在变体i的UID深度,Zi是变体i的Z得分,并且k是在染色体臂上观察到的变体的数量。一个或多个多态性可以包括单碱基取代、插入、缺失、插入/缺失和/或其组合。多个扩增子可以包括约10,000个扩增子至约1,000,000个扩增子(例如,多个扩增子可包含约38,000个扩增子)。基因组区间可以包括约100个核苷酸至约125,000,000个核苷酸(例如,基因组区间可以包括约500,000个核苷酸)。所述哺乳动物可以是人。样品可以是液体活检。液体活检可以是血液、尿液、唾液、囊液、痰液、组织、粪便、巴氏涂片或脑脊液。液体活检可以是血液样品(例如,血浆样品)。血液样品可以包括无细胞的胎儿DNA。样品可以包括赘生性细胞部分。样品中的赘生性细胞部分可以占整个样品的小于约1%(例如,小于约0.5%)。扩增子可以包括唯一长散布核苷酸元件(LINE)。测序步骤还可以包括扩增来自从哺乳动物获得的样品的DNA以获得扩增子。可以使用单个引物对进行扩增。扩增子可以包括约100至约140个碱基对。每个扩增子可以测序1至20次。所述方法可以包括约100,000至约25百万个测序读长。每个簇可以包括约200个基因组区间。所述方法还可以包括监督式机器学习。监督式机器学习可以采用支持向量机模型。
其他实施方案
应理解,虽然本发明已经结合其详细描述加以描述,但前述描述意图说明而非限制本发明的范围,本发明的范围由随附权利要求书的范围限定。其他方面、优势和修改在以下权利要求书的范围内。
实施例
实施例1:使用多分析物液体活检来检测和定位手术可切除的癌症
当前批准用于早期癌症检测的许多测试本质上都是程序性的,并且包括结肠镜检查、乳腺摄影和宫颈细胞学分析。迄今为止,用基于突变的液体活检评估的绝大多数癌症患者均患有晚期疾病。液体活检的另一个问题是基础起源器官的鉴定。因为相同的基因突变驱动多种肿瘤类型,所以基于此类改变的液体活检通常不能鉴定原发性肿瘤的位置,从而产生阳性血液测试。
本实施例描述了一种新的血液测试,称为CancerSEEK,其解决了上述难题。所述测试利用遗传改变和蛋白质生物标记物的组合测定,并且不仅能够鉴定相对早期癌症的存在而且还能够查明这些癌症的起源器官(图1)。
CancerSEEK是针对大多数癌症的广泛适用的非侵入性测试。此处研究的八种癌症类型占2017年美国估计癌症死亡人数的360,000(60%),并且它们的早期检测可能会减少这些疾病的死亡人数。在本公开之时,CancerSEEK的成本低于500美元,与其他单个癌症的筛选测试(诸如结肠镜检查)相当或比之更低,而此测试可以检测至少八种不同的癌症类型。
材料和方法
血浆、白细胞和肿瘤DNA样品
所述研究在每个机构得到人类研究机构审查委员会的批准,并在获得知情同意后获得样品。研究中包括在参与机构经历手术切除的I至III期癌症患者。在所有患者进行任何治疗之前(即,在接受新辅助疗法的患者进行新辅助疗法之前)并且在手术之前,从患者收集血液。如果在手术当天抽取样品,则应注意确保在施用麻醉之前收集血液,因为麻醉会增加循环生物标记物的水平(Cohen等人,2017 Proc Natl Acad Sci USA 114:10202-10207)。记录一般人口统计学、手术病理学和AJCC分期(第7版)。‘健康’队列由从812名中值年龄为55岁(IQR四分位范围为28至65岁)且没有癌症史的个体获得的外周血样品组成。癌症和健康对照样品以相同的方式进行处理。先前已经使用不同的方法评估了来自1,005名癌症患者中的46名和812个正常样品中的181个的血浆样品(Cohen等人,2017 Proc NatlAcad Sci USA 114:10202-10207)(表2)。
按照制造商的说明,使用QIASymphony循环DNA试剂盒(目录号1091063)从平均7.5mL血浆中纯化DNA。还按照制造商的说明,使用QIAsymphony DP DNA Midi试剂盒(目录号937255)纯化来自外周WBC的DNA。将肿瘤组织根据标准组织病理学程序进行福尔马林固定及石蜡包埋(FFPE),并且还使用QIAsymphony DP DNA Midi试剂盒(目录号937255)进行纯化。
突变检测和分析
扩增血浆中的DNA,设计了61个引物对(见下文),以扩增含有16个基因的所关注区域的66至80bp片段。
将61个引物对分成两个不重叠的组,每个组含有28个或33个引物对。这两个引物组中的每一个都用于在6个独立的25μl反应中扩增DNA,如其他地方所述(参见例如,Wang等人,2016 Elife 5),不同之处在于使用15个循环进行初始扩增。用AMPure XP珠子(BeckmanCoulter,PA,USA)来纯化PCR产物,并且然后在第二轮PCR中扩增1%的纯化PCR产物,如其他地方所述(参见例如,Wang等人,2016 Elife 5),但使用21个循环。然后将第二轮扩增的PCR产物用AMPure进行纯化,并在Illumina MiSeq或HiSeq 4000仪器上进行测序。
使用以SQL和C#编写的自定义脚本,将读长的模板特定部分与参考序列进行匹配。然后基于作为分子条形码掺入的唯一标识符序列(UID)将来自共同模板分子的读长进行分组,如其他地方所述(参见例如,Kinde等人,2011 Proc Natl Acad Sci USA 108:9530-9535)。通过要求每个UID家族中>90%的读长中存在突变,来减少在样品制备或测序步骤中引入的人为突变。通过要求具有相同UID和样品索引的读长在位于同一图块上时至少相隔5,000个像素来消除光学复制引起的冗余读长。考虑满足以下两个标准之一的突变:(i)存在于COSMIC数据库中(Forbes等人,2017 Nucleic Acids Res 45:D777-D783),或(ii)预测在肿瘤抑制基因中失活(无义突变、框外插入或缺失、典型剪接位点突变)。排除同义突变(外显子末端的那些除外)和内含子突变(剪接位点的那些除外)。
血浆蛋白质的评估
使用Bioplex 200平台(Biorad,Hercules CA)确定血浆样品中多种靶蛋白的浓度。按照制造商的方案执行基于Luminex珠子的免疫测定(Millipore,Bilerica NY),并使用5个参数对数曲线拟合(使用Bioplex Manager 6.0)以及供应商提供的标准和质量控制来确定浓度。HCCBP1MAG-58K组套用于检测FGF2、骨桥蛋白、sFas、IL-8/CXCL8、催乳素、HE4、HGF、AFP、CA125、IL6、CA15-3、TGFa、CYFRA21-1、CEA、CA19-9和瘦素。HANG2MAG-12K组套用于检测PAR、sPECAM-1、TSP-2、sEGFR、AXL和sHER2/sEGFR2/sErbB2。HCMBMAG-22K组套用于检测DKK1、GDF15、骨保护素(OPG)和神经元特异性烯醇化酶(NSE)。HCCBP4MAG-58K组套用于检测激肽释放酶-6、CD44、中期因子和间皮素。HAGP1MAG-12K组套用于检测卵泡抑素、G-CSF、血管生成素2和内皮糖蛋白。HCCBP3MAG-58K组套用于检测SHBG、半乳凝素和髓过氧化物酶。HTMP1MAG-54K组套用于检测TIMP-1和TIMP-2。LRG-1和玻连蛋白未包括在本研究中,因为它们无法通过单个免疫测定平台进行可重复评估。
用于分类ctDNA状态的算法
样品的ctDNA状态的分类是由统计测试获得的,所述统计测试将所关注样品的归一化突变频率分别与训练组中正常样品和癌症样品的归一化突变频率的分布进行比较。具体地,首先基于观察到的一组正常对照中每个突变的MAF,将定义为超突变体数量与UID数量之间的比率的突变体等位基因频率(MAF)进行归一化。在此突变特异性归一化之后,将每个孔中每个突变的MAF与MAF的两个参考分布进行比较:1)由训练组加上一组来自无关的健康个体的188个WBC中的正常对照血浆建立的分布,2)由训练组中的癌症样品建立的分布,其仅包括血浆中发现的突变,这些突变也以MAF>5%存在于对应的原发性肿瘤中。由此获得对应的p值pN和pCο对于每个突变,计算这两个p值的对数比,并消除六个孔中的这些对数比的最小值和最大值,使得结果对离群值不那么敏感。然后根据下式确定“Ω”得分:
Figure GDA0002675196410007931
其中wi是孔i中UID占四个孔中存在的所述突变的UID的总数量的比例。当血浆样品中鉴定出的突变具有Ω>1并且未在患者的原发性肿瘤中鉴定出时,只要有白细胞(23%的癌症患者),就评估来自同一患者的WBC的DNA。用相同的61扩增子组套测试WBC DNA,以确保血浆突变不是不确定潜力的克隆性造血的结果(Jaiswal等人,2014 N Engl J Med 371:2488-2498)。只要在血浆中发现Ω>1的突变,就对来自正常个体的WBC进行相同的评估。在分析中排除了在WBC和血浆中鉴定出的任何突变。排除的要求是血浆中的最大MAF与WBC中的最大MAF之比小于100。
然后将每名患者或正常对照中Ω得分最大的突变视为“最高突变”,并列于表3中。此得分用于逻辑回归以及通过优化步骤选择的以下10种蛋白质的浓度:催乳素、OPN、IL6、CEA、CA125、HGF、髓过氧化物酶、CA19-9、中期因子和TIMP-1。保守起见,对逻辑回归所使用的特征应用非线性变换。具体地,如果所关注样品中的蛋白质浓度比针对在训练组中的正常样品中的相同蛋白质发现的浓度的第95个百分位数更低,则将蛋白质浓度设定为等于零;否则,使用所述浓度的对数。对于Ω得分,使用相同的对数阈值变换,但其中恒定阈值等于1。然后使用R glmnet软件包(版本2.10-13)执行逻辑回归,其中λ参数设定为零,如其他地方所述(参见例如,Friedman等人,2010 Journal of Statistical Software 33:74862)。每个特征的重要性通过将其系数(见下文)乘以正常样品与癌症样品之间的特征平均值之差来评估。执行了十轮10倍交叉验证。表2中列出了针对812名正常个体和1,005名癌症患者中的每一个的10倍交叉验证(CV)的平均轮次中获得的分类识别。
逻辑回归模型系数和重要性得分。
特征 逻辑回归系数 重要性得分
Ω得分 1.77E+00 7.55E+00
CA-125 4.15E-02 1.37E+00
CEA 2.33E-04 1.17E+00
CA19-9 1.20E-02 5.18E-01
催乳素 3.51E-05 4.76E-01
HGF 2.45E-03 3.03E-01
OPN 1.45E-05 1.72E-01
髓过氧化物酶 5.40E-03 9.31E-02
TIMP-1 7.34E-06 7.05E-02
为了预测癌症类型,使用了相同的11个特征(突变得分和10种蛋白质的水平)加上患者性别以及本研究中评估的其他29种蛋白质。仅对通过逻辑回归正确分类为癌症的癌症样品执行癌症类型预测。如在randomForest软件包(版本4.6-12)中实施的随机森林(参见例如,Liaw等人,2001 R news 2:18-22)用于这种预测。执行十轮10倍CV,并且出于一致性,在每一轮和每一倍中,随机森林使用逻辑回归所使用的相同分区。表6列出了在10倍CV的平均轮次(表3中报告癌症状态的相同轮次)中获得的分类识别。
为了确定血浆中鉴定出的突变与原发性肿瘤中鉴定出的突变之间的一致性(表5),仅考虑可以在血浆中以高置信度鉴定出突变的155个病例(Ω得分>3,表3),并且其中原发性肿瘤含有突变体等位基因分数>5%的任何突变(表1)。这种方法使我们能够避免对赘生物含量低的肿瘤进行评分。
样品鉴定
为了证实血浆、WBC和原发性肿瘤DNA样品均来源于同一患者,可以利用可用于从整个基因组扩增约38,000个唯一长散布核苷酸元件(LINE)的引物,如其他地方所述(参见例如,Kinde等人,2012 PloS one 7:e41162)。这些约38,000个LINE含有26,220个常见多态性,其可以确定或驳斥血浆、白细胞和肿瘤样品之间的样品同一性。鉴定每个多态性位置处的基因型,并计算所关注样品之间的一致性百分比。一致性被定义为在两个样品中相同的匹配的多态性位点的数量除以在两个样品中具有足够覆盖的基因型的总数量。如果一致性>0.99,并且至少5,000个扩增子具有足够覆盖,则将两个样品视为匹配。
统计分析
按需要将连续变量报告为平均值和标准偏差或中值和范围,而将分类变量报告为整数和百分比。使用二项分布计算敏感性的置信区间(CI)。使用R stats软件包(版本3.3.1)通过单侧二项检验来计算P值。
结果
为了鉴定可用于在远处转移发生之前的阶段检测许多实体瘤的蛋白质和基因标记物的组套,正在设计一种基于PCR的测定,其可以同时评估通常在多种癌症类型中突变的驱动基因的多个区域。这种设计面临四个挑战。首先,测试必须查询足够数量的碱基,才能检测出大量癌症。其次,每个被查询的碱基必须被测序数千次,才能检测出以低流行率存在的突变。第三,查询的碱基越多,鉴定出人为突变的可能性就越大,从而降低信噪比。并且第四,可以在筛选环境中实施的测试必须具有成本效益并且是高通量的,从而限制必须执行的测序的数量。为了应对这些对比鲜明的挑战,鉴定了最小数量的短扩增子,这将允许在所评估的八种肿瘤类型中的每一种中检测至少一个驱动基因。使用公开可用的测序数据来确定所需的扩增子数量与检测的敏感性之间存在分数幂律关系,其中平台期在约60个扩增子处(图2)。将扩增子的数量提高到阈值水平以上,基本上不会检测到更多的癌症,但会增加假阳性结果的概率。这种不断下降的边际效用限定了扩增子的最佳数量。
基于这些数据,设计了一种61扩增子组套,其中每个扩增子查询16个基因之一中的平均33bp(参见材料和方法)。如图2所示,理论上,此组套将检测癌症体细胞突变目录(COSMIC)数据集中41%(肝脏)至95%(胰腺)的癌症(Forbes等人,2017 Nucleic AcidsRes 45:D777-D783)。实际上,所述组套的表现要好得多,在我们的研究中,其检测所评估的805例癌症中的82%中的至少一个突变、47%中的两个突变以及8%中的两个以上的突变(图2、图3中的远点,以及表1)。检测到的肿瘤分数比COSMIC数据集预测的更大,因为基于PCR的测序测定比常规的全基因组测序对突变检测更敏感。基于这种对原发性肿瘤组织DNA的分析,循环肿瘤DNA(ctDNA)的预测最大检测能力因肿瘤类型而变化,在肝癌的60%至卵巢癌的100%范围内(图2)。
借助这种小但可靠的扩增子面板,开发了两种方法,其可以检测预期存在于血浆中的罕见突变。首先,使用多重PCR用DNA条形码直接并唯一地标记每个原始模板分子。这种设计使大规模平行测序固有的错误最小化,并有效使用了血浆中存在的少量的无细胞DNA。另外,将从血浆中回收的DNA的总量分成多个等分试样,并对每个重复执行独立测定。这减少了每个孔中DNA分子的数量;然而,它增加了每个孔中每个突变体分子的分数,从而使其更易于测定。因为检测的敏感性通常受每个重复中突变体等位基因的分数的限制,因此这种分区策略可以增加信噪比,并可以鉴定以比立即评估所有血浆DNA的情况下可能的流行率都低的流行率存在的突变。
CancerSEEK的第二组成部分是基于蛋白质生物标记物的。检索文献以发现在上述八种癌症类型中的至少一种中可能对早期检测和癌症诊断有用的蛋白质,其中敏感性>10%并且特异性>99%。在对来自没有癌症的个体和来自癌症患者的血浆样品进行的初步研究中,鉴定并评估了41个潜在的蛋白质生物标记物。这些蛋白质中的39个可以通过单个免疫测定平台进行可重复评估,并且然后将这些用于测定所有血浆样品。在这39个蛋白质中,有10个被证明可用于分辨癌症患者和健康对照,并且在下文列出。
分析的以及包括在示例性CancerSEEK测试中的蛋白质生物标记物。
Figure GDA0002675196410007971
Figure GDA0002675196410007981
本研究包括1,005名患有I至III期卵巢癌、肝癌、食道癌、胰腺癌、胃癌、结直肠癌、肺癌或乳腺癌的患者。在收集血液样品之前,没有患者接受新辅助化疗。在研究进入时,没有人发生明显的远处转移,并且所有患者均经历了以治愈为目的的手术切除。诊断时的中值年龄为64岁(范围为22岁至93岁)。所以选择这八种癌症类型,是因为它们很常见,并且因为在常见的临床使用中没有针对它们的早期检测的基于血液的测试。患者的组织病理学和临床特征总结在表2中。
表现时的最常见的分期是美国癌症联合委员会(AJCC)II期,占患者的49%,并且其余患者携带I期(20%)或III期(31%)疾病。下文总结了八种肿瘤类型中每一种的每个分期的样品数量。共有812名中值年龄为55岁(范围为17岁至88岁)且没有已知的癌症、高级别发育异常、自身免疫性疾病或慢性肾脏疾病病史的患者作为健康对照组。
在本研究中按肿瘤类型和分期进行评估的癌症患者。
Figure GDA0002675196410007982
Figure GDA0002675196410007991
CancerSEEK评估了10个蛋白质的水平和2,001个基因组位置中的突变;每个基因组位置都可以若干种方式发生突变(单碱基取代、插入或缺失)。所测定的基因中突变的存在或这些蛋白质中任一种的水平升高会将患者分类为阳性。采用严格的统计方法来确保测试的准确性。使用对数比来评估突变,并将它们并入逻辑回归算法中,所述算法考虑了突变数据和蛋白质生物标记物水平两者以对CancerSEEK测试结果进行评分。通过10倍交叉验证的十次迭代来确定平均敏感性和特异性。图4A示出了在一次代表性迭代中的整个癌症患者和对照队列的接受者操作特征(ROC)曲线。
在所评估的八种癌症中,CancerSEEK的中值敏感性为70%(p<10-96单侧二项检验),并且范围为肝癌的98%至乳腺癌的33%(图4C)。在此敏感性下,特异性>99%,即,只有6个无已知癌症的个体被评分为阳性。
对算法最重要的测试特征是ctDNA突变的存在,随后是催乳素、OPN、IL-6、CEA、CA125、HGF、髓过氧化物酶、CA19-9、中期因子和TIMP-1蛋白质水平的升高。CancerSEEK中使用的ctDNA和蛋白质特征中的每一个的瀑布图示出了它们在患有或没有癌症的个体中的分布(图4)。下文提供了在CancerSEEK中使用的ctDNA和蛋白质特征的重要性排名,并且图5示出了展示患有或没有癌症的个体的聚类的主成分分析。表3和表4提供了完整的数据集,其包括所研究的所有蛋白质的水平和血浆样品中鉴定的突变。从图6可以明显看出,此处使用方法的概率性而非确定性将样品识别为阳性;每个组套代表当从分析中排除一个特定特征时CancerSEEK的敏感性。
筛选测试能够有利地在早期检测癌症。对于最常见的所评估的分期(II期),CancerSEEK的中值敏感性为73%,与III期癌症相似(78%),并且对于I期癌症而言更低(43%)(图4B)。早期癌症(I期)的敏感性在肝癌中最高(100%),并且在食道癌中最低(20%)。
液体活检的基础是血浆中的突变体DNA模板来源于死亡癌细胞,并且因此可用作赘生物形成的精确特异性标记物。为了测试这种预期,评估了155名患者的肿瘤组织,在这些患者中,可以检测到统计学显著水平的ctDNA并且可以获得原发性肿瘤。在这155例病例中的138例(90%)中,血浆中的突变与同一个体的原发性肿瘤中发现的突变相同(表5)。血浆与原发性肿瘤之间的这种一致性在所有8种癌症类型中都很明显,并且范围为卵巢癌和胰腺癌的100%至胃癌的82%。
常规液体活检的主要限制在于它们无法确定测试阳性患者的癌症类型,从而给临床随访带来挑战。除了增加检测的敏感性之外,蛋白质生物标记物和ctDNA的组合还有助于通过阳性CancerSEEK测试来鉴定可能存在的癌症类型。监督式机器学习被用来预测CancerSEEK测试阳性患者的潜在癌症类型。输入算法考虑了患者的性别以及蛋白质和ctDNA生物标记物数据。此类预测的主要目标之一是在阳性CancerSEEK测试之后确定最适当的用于癌症诊断或监测的随访测试。食道癌和胃癌患者被分组在一起,因为对可能受这两种癌症影响的个体的最佳随访是内镜检查。
一种算法被用来研究617名在CancerSEEK测试中评分为阳性的患者。在没有关于患者的任何临床信息的情况下,癌症的来源被定位在这些患者的83%的中值中的两个解剖部位(图8,表6;p<10-77单侧二项检验)。此外,阳性测试的来源被定为在这些患者63%的中值中的单个器官(图8,表6;p<10-47单侧二项检验)。预测的准确性随肿瘤类型而变化,并且对结直肠癌最好,而对肺癌最低,如下所示(另参见图8)。
来自癌症类型定位结果的最高预测的混淆矩阵。
Figure GDA0002675196410008011
本文所述的结果证明,基于基因和蛋白质的血液检测可用于检测八种主要癌症类型的主要部分(中值为70%)。在大多数评分为阳性的样品中,可以简单地由测试结果来预测潜在的癌症类型,而无需对患者的病史或疾病状况的任何事先了解。CancerSEEK的特异性很高,其中在812名没有已知癌症的个体中,评分为阳性的不到1%。
实施例2:具有更增加的敏感性和高特异性的液体活检癌症筛选测试的组合方法
在许多癌症中,肿瘤的分期与预后之间有着很强的相关性(参见例如,Ansari等人,2017 Br J Surg 104(5):600-607)。诊断时具有远处转移的极少数患有肺癌、结肠癌、食道癌或胃癌的患者存活超过五年(参见例如,Howlader等人,2016 SEER CancerStatistics Review,1975-2013,National Cancer Institute.Bethesda,MD)。因此,很明显,癌症的早期检测是减少由这些疾病导致的死亡的一个关键。
循环中的生物标记物提供原理上检测早期癌症的最佳方法之一。从历史上看,用于监测癌症的生物标记物的类型是蛋白质(参见例如,Liotta等人,2003 Clin AdvHematol Oncol 1(8):460-462)。最近,已经研究了突变体DNA作为生物标记物,因为从死亡细胞释放的DNA可以逃离到体液,诸如尿液、粪便和血浆中(参见例如,Haber等人,2014Cancer Discov 4(6):650-661;Dawson等人,2013 N Engl J Med 368(13):1199-1209;Bettegowda等人,2014 Science translational medicine 6(224):224ra224;Kinde等人,2013 Science translational medicine 5(167):167ra164;Wang等人,2015Science translational medicine 7(293):293ra104;Wang等人,2015 Proc Natl AcadSci USA 112(31):9704-9709;Wang等人,2016 Elife 5;Springer等人,2015Gastroenterology 149(6):1501-1510;Forshew等人,2012 Science translationalmedicine 4(136):136ra168;Vogelstein等人,1999 Proc Natl Acad Sci USA 96(16):9236-9241;以及Dressman等人,2003 Proc Natl Acad Sci USA 100(15):8817-8822)。这种方法(通常被称为“液体活检”)的基本概念是癌细胞,与正常的自我更新细胞一样,频繁周转。然而,对循环肿瘤DNA(ctDNA)的研究表明,虽然ctDNA在>85%的患有许多癌症类型的晚期形式患者中升高,但患有早期癌症的患者中有相当少的一部分在血浆中具有可检测水平的ctDNA(Bettegowda等人,2014 Science translational medicine 6(224):224ra224;以及Wang等人,2015 Science translational medicine 7(293):293ra104)。
本实施例描述了使用癌症筛查测试的组合方法,其在保持高特异性的条件下增加对可切除或可以其他方式治疗的癌症的检测的敏感性。例如,在本实施例中描述的测定将对ctDNA中突变的检测和对血浆中阈值蛋白质标记物的检测组合起来。
材料和方法
血浆、白细胞和肿瘤DNA样品
使用QIASymphony循环DNA试剂盒(Qiagen,目录号1091063)从血浆中纯化DNA。使用含有唯一标识符(UID)和扩增子特异性序列的定制引物(表38)来扩增血浆DNA,并在Illumina MiSeq或HiSeq仪器上对所得产物进行测序。在Bioplex 200平台(Biorad,Hercules CA)上使用基于Luminex珠子的免疫测定来确定蛋白质生物标记物的血浆浓度。如果样品含有KRAS突变,或者如果CA19-9、CEA、HGF或OPN的浓度分别大于100U/mL、7.5ng/mL、0.92ng/mL或158ng/mL,则血浆样品被评分为阳性。所有样品均在每个机构的人类研究机构审查委员会批准并知情同意之后获得。
样品均在每个机构的人类研究机构审查委员会批准并知情同意之后获得。在手术前已收集外周血,未接受新辅助疗法,并且于2011年4月与2016年5月之间已在参与机构经历了手术切除的IA、IB、IIA或IIB期(认为可切除)的患者被包括在研究中。记录一般人口统计学、手术病理学和AJCC分期(第7版)。‘健康’队列由从185名平均年龄为64岁且没有癌症史的个体获得的外周血样品组成。胰腺癌和健康对照样品以相同的方式进行收集并处理。
按照制造商的说明,使用QIASymphony循环DNA试剂盒(目录号1091063)从3.75mL血浆中纯化DNA。将肿瘤组织根据标准组织病理学程序进行福尔马林固定及石蜡包埋(FFPE),并在显微镜下进行宏观解剖以确保赘生性细胞结构>30%。按照制造商的说明,使用QIAsymphony DP DNA Midi试剂盒(目录号937255)纯化DNA。使用SYBR Green I(Thermo目录号S7585)通过荧光评估DNA浓度。
突变检测和分析
为了从血浆中扩增DNA,设计了引物对以扩增含有来自KRAS和TP53基因的所关注区域的66至80bp片段(表11和表12)。这些引物用于在六个独立的25μl反应中扩增DNA,如其他地方所述(参见例如,Wang等人,2015 Proc Natl Acad Sci USA 112(31):9704-9709)。将反应用AMPure XP床(Beckman Coulter,PA,USA)纯化,并在50μl的Buffer EB(Qiagen)中洗脱。然后,在第二轮PCR中扩增一部分(5μl)纯化的PCR产物,如其他地方所述(参见例如,Wang等人,2015 Proc Natl Acad Sci USA 112(31):9704-9709)。将PCR产物用AMPure进行纯化,并在Illumina MiSeq或HiSeq 4000仪器上进行测序。
使用以SQL和C#编写的自定义脚本,将读长的模板特定部分与参考序列进行匹配。然后基于作为分子条形码掺入的唯一标识符序列(UID)将来自共同模板分子的读长进行分组(参见例如,Allen等人,2017 Ann Surg 265(1):185-191)。通过要求每个UID家族中>90%的读长中存在突变,来减少在样品制备或测序步骤中引入的人为突变。
血浆蛋白质的评估
使用Bioplex 200平台(Biorad,Hercules CA)确定血浆样品中多种靶蛋白的浓度。按照制造商的方案执行基于Luminex珠子的免疫测定,并使用5个参数对数曲线拟合(使用Bioplex Manager 6.0)以及供应商提供的标准和质量控制来确定浓度。将血浆样品稀释6倍,用于测定CA19-9、CEA、HGF、OPN和催乳素,并且将血浆样品稀释5倍,用于测定中期因子。如果CA19-9、CEA、HGF或OPN的浓度分别大于100U/mL、7.5ng/mL、0.92ng/mL或158ng/mL,则血浆样品被评分为阳性。这些针对CA19-9、CEA、HGF、OPN、催乳素和中期因子的免疫测定的动态范围分别为2.74-2,000U/mL、78.19-57,000pg/mL、27.43-20,000pg/mL、548.7-400,000pg/mL、137.17-100,000pg/mL和13.72-10,000pg/mL。
用于分类ctDNA状态的算法
样品的ctDNA状态的分类是由统计测试获得的,所述统计测试将所关注样品的归一化突变频率分别与正常对照的分布进行比较。具体地,首先基于观察到的一组正常对照中每个突变的MAF,将定义为超突变体数量与UID数量之间的比率的MAF进行归一化。在此突变特异性归一化之后,将每个孔中每个突变的MAF与由包括所有突变在内的正常对照构建的MAF的参考分布进行比较,并由此分布计算p值。在给定样品中检测到的所有突变中最低的p值被认为是“最高突变”。样品的ctDNA状态的分类基于此最高突变的p值是低于还是高于给定阈值。基于在独立的正常对照组中观察到的所需特异性来选择阈值。因此,除这些对照之外,没有对任何其他样品进执行训练;具体地,正文中所述的182名健康对照和221名胰腺癌患者均未包括在用于训练算法的对照中。
统计分析
按需要将连续变量报告为平均值和标准偏差或中值和范围,而将分类变量报告为整数和百分比。使用二项分布计算敏感性的置信区间(CI)。使用Kaplan-Meier方法估计存活曲线,并通过对数秩检验来研究曲线之间的差异。对在单变量分析中统计学显著的变量进行多变量Cox比例风险回归模型。
报告了多变量模型中包括的变量的风险比(HR)和95%置信区间(CI)。P值<0.05视为统计学上显著的。
结果
PDAC患者和假定健康对照的特征
本研究中评估了221名患有手术可切除的胰腺癌的患者。这些患者的组织病理学和临床特征总结在表7中。共有182名年龄相似且没有已知的癌症、自身免疫性疾病或慢性肾脏疾病病史的患者作为健康对照组。
20%的患者没有通常与胰腺癌相关联的症状。表现时的原发性肿瘤的大小范围为0.6cm至13cm,其中中值大小为3.0cm。表现时的最常见的分期是美国癌症联合委员会(AJCC)IIB期,占患者的77%,并且其余患者携带IA期(5%)、IB期(8%)或IIA期(10%)(表7)。患者存活与分期有关,如图12中以图形方式所描绘的并且如先前临床研究所预期的那样(参见例如,Allen等人,2017 Ann Surg 265(1):185-191)。
鉴定血浆样品中的肿瘤特异性KRAS突变的基于PCR的测定
设计了一种基于PCR的测定,其可以同时评估PDAC中最常突变的KRAS基因的两个密码子(密码子12和61)以及周围的密码子。所述测定采用了称为安全测序系统(Safe-SeqS)的敏感技术(参见例如,Kinde等人,2011 Proc Natl Acad Sci USA 108(23):9530-9535)。Safe-SeqS包括了唯一标记每个模板分子的分子条形码,从而极大地将大规模平行测序中常规出现的错误最小化。这种方法可以在多达10,000个正常模板中鉴定出一个突变体模板。使用这种技术,鉴定了221例(30%:95%CI 24%-36%)胰腺癌病例中的66例的血浆中的KRAS突变(见下文和表8)。突变中的62个(94%)和4个(6%)分别位于密码子12和61处,其中最常观察到的是G>T颠换(表8)。在I期患者中发现突变的频率高于I期患者(见下文,表8和图9A)。另外,虽然突变体等位基因频率与肿瘤大小无关(表8和图11A),但是在较大的肿瘤中发现突变的频率高于较小的肿瘤(见下文,表8和图9B)。
Figure GDA0002675196410008071
Figure GDA0002675196410008081
血浆中突变体模板的数量可以由每个血浆样品中的突变体等位基因分数和DNA的浓度来计算(表8)。这个数量通常非常低,其中15名(23%)具有可检测KRAS突变的患者在每ml血浆中具有<2个突变体模板。每mL血浆中突变体模板的平均数量为9.4(表8)。这些结果强调,极敏感的技术可用于检测早期胰腺癌患者中的突变。仅在假定健康队列中的221个个体的一个中观察到了KRAS突变,这是一名69岁的没有已知的癌症的男性。
液体活检概念的基础是循环中鉴定出的突变体DNA模板来源于癌症。因此,重要的是确定在这些患者血浆样品中鉴定出的KRAS突变是否也存在于其原发性癌中。获得了来自66名在其血浆中具有可检测的KRAS突变的患者的50名的原发性癌。在所有50例病例中,血浆中发现的突变与原发性癌中发现的突变相同,从而提供了另一种特异性的正交测量。
血浆中CA19-9和KRAS突变的同时评估
试图确定与单独的KRAS ctDNA测试相比,KRAS ctDNA测试与CA19-9(PDAC生物标记物)的组合是否会导致改进的敏感性。最近的研究已表明,在诊断前两年胰腺癌患者中的CA19-9水平可以升高(参见例如,O′Brien等人,2015 Clin Cancer Res 21(3):622-631)。然而,在非恶性条件下也已观察到CA19-9升高,并且由于种系遗传变异,5%的人口无法生产CA19-9抗原,从而限制了其处于筛选目的的使用(参见例如,Lennon等人,2010Diagnostic and Therapeutic Response Markers.Pancreatic Cancer,(Springer NewYork,New York,NY),第675-701页)。但是,有理由认为,如果将结果评分为阳性的阈值足够高,CA19-9可能被证明可用作筛选生物标记物。根据先前的数据选择100U/mL的阈值,所述数据是在没有胰胆管疾病临床病史的健康个体中未发现此水平(参见,Kim等人,2004 JGastroenterol Hepatol 19(2):182-186)。
使用此预定的高阈值,在221名(49%:95%CI 43%-56%)患有胰腺癌的患者的109名中以及在182名健康对照中检测CA19-9,从而以此方式证实其特异性(表8和表9)。如所预期的那样,具有可检测的CA19-9水平的患者数量随分期和肿瘤大小而增加(图9和表8)。当前研究中解决的一个问题是,这两个生物标记物(KRAS突变和阳性CA19-9得分)是否是疾病存在的独立指标。如图10的维恩图所示,发现重叠仅是部分重叠。尽管42名患者(19%)在其血浆中具有升高的CA19-9水平以及可检测的KRAS突变,但91名另外的患者具有KRAS中的突变或升高的CA19-9,但不是两者均有(图10)。因此,这些分析的组合敏感性为60%(95%CI 53%-67%),高于任一单独的敏感性(图9)。这样,本实施例证明,可以在不大幅增加假阳性率的情况下将两种测定组合起来,因为每种测定在所用的阈值处都是极其特异性的。
通过包含其他蛋白质生物标记物来增加敏感性
受上述结果的鼓励,试图通过将ctDNA KRAS突变和CA19-9与其他蛋白质生物标记物组合来进一步增加敏感性(表10)。在一项对独立于此处研究的那些样品的少量胰腺癌样品的先导研究中,评估了已发现在癌症中升高的其他蛋白质的潜在效用,其包括甲胎蛋白(AFP)、CA15-3、瘦素、IL-6、癌胚抗原(CEA)、CA-125、白介素8(IL-8)、sFas、催乳素、骨桥蛋白(OPN)、碱性成纤维细胞生长因子(FGF2)、肝细胞生长因子(HGF)、细胞角蛋白-19片段(CYFRA 21-1)、人附睾蛋白4(HE4)、转化生长因子α(TGF-α)、生长/分化因子15(GDF15)、dickkopf相关蛋白1(DKK1)、神经元特异性烯醇化酶(NSE)、骨保护素(OPG)、TIMP金属肽酶抑制剂1(TIMP-1)、TIMP金属肽酶抑制剂2(TIMP-2)、间皮素、中期因子、激肽释放酶-6、CD44、AXL受体酪氨酸激酶、可溶性人表皮生长因子受体2(sHER2)、可溶性表皮生长因子受体(sEGFR)、可溶性尿激酶型纤溶酶原激活物受体(suPAR)和可溶性血小板内皮细胞粘附分子(sPECAM-1)。在这29个蛋白质生物标记物中,选择五个即CEA(参见例如,Nazli等人,2000Hepatogastroenterology 47(36):1750-1752)、HGF(参见例如,Di Renzo等人,1995Cancer Res 55(5):1129-1138)、中期因子(参见例如,Ikematsu等人,2000 Br J Cancer83(6):701-706)、OPN(参见例如,Koopmann等人,2004 Cancer Epidemiol BiomarkersPrev 13(3):487-491)和催乳素(参见例如,Levina等人,2009 Cancer Res 69(12):5226-5233)用于进一步分析。
在来自221名胰腺癌患者队列的血浆中评估这五个标记物的水平时,观察到催乳素和中期因子的血浆浓度与手术部位之间存在关联(P<0.01,χ2检验,自由度=5),这表明血液收集条件可能会升高这两个标记物的水平。CA19-9、CEA、HGF或OPN水平与收集位点之间没有显著的相关性,KRAS ctDNA突变的存在与收集位点之间也没有相关性(P>0.01,χ2检验,自由度=5)。进一步研究时,注意到在施用麻醉之后但在手术切除之前收集的样品中,催乳素和中期因子的水平显著升高(图14)。催乳素的结果与先前研究一致,后者表明麻醉剂升高这种蛋白质的水平(参见例如,Thorpe等人,2007 PLoS One 2(12):e1281)。为了确保麻醉不会影响上述其他蛋白质生物标记物的水平,在施用麻醉之前和之后立即在29名新患者中收集了成对的血浆样品。发现通过麻醉升高的蛋白质仅是催乳素和中期因子(图15),与上述收集部位与蛋白质水平之间的相关性完全一致。因此,催乳素和中期因子被排除在进一步分析之外。
与CA19-9不同,不存在将CEA、HGF或OPN用作胰腺癌标记物的预定阈值。因此,在来自健康对照的一组独立的273个血浆样品中确定了适当的阈值。保守起见,针对每种蛋白质选择比在273个正常血浆样品的任一个中所观察到的最大值高10%的阈值。值得注意的是,当将这些阈值应用于182个血浆样品的独立测试组时,所有三种蛋白质标记物均保持100%的特异性(表9)。当每种标记物单独使用时,这三种标记物各自的敏感性均小于使用KRAS突变或CA19-9获得的敏感性,但其水平对分期和大小的依赖性比KRAS突变或CA19-9更小(图13和表8)。与KRAS突变和CA19-9测定组合,此五元生物标记物组套(“组合测定”)检测到221个可切除癌症中的141个(64%:95%CI 57%-70%)(表7,图9A,图10和表8)。
通过组合测定可检测到的一些患者特别值得注意。45名(20%)患者没有典型地与胰腺癌相关联的症状(表8)。组合测定鉴定出这些个体中的27名(60%),其中19名(70%)没有复发迹象,其中中值随访时间为12个月(范围为3-16个月)(表8)。在患有AJCC识别的最早期(IA和IB期)疾病的29名患者中,12名(41%)使用组合测定可检测到(图9A),其中7名(58%)在研究终止时没有复发迹象,其中中值随访时间为19个月(范围为2-25个月)。
本研究的另一个值得注意但令人震惊的结果是,存活较差的患者更可能具有阳性测试。在所研究的全部221名胰腺癌患者中,122名(56%)患者在研究终止时还活着,其中中值随访时间为13个月(7-21月)。发现组合测定提供的预后价值独立于常规临床和组织病理学特征。具体地,多变量分析表明,总体存活的独立预测因子是组合测定状态(HR=1.76,95%CI,1.10-2.84,p=0.018)、不断增加的年龄(HR=1.04,95%CI 1.02-1.06,p=0.001)、分化程度(低分化,HR=1.72,95%CI 1.11-2.66,p=0.015)、淋巴管浸润(存在,HR=1.81,95%CI 1.06-3.09,p=0.028)、结节病(存在,HR=2.35,95%CI 1.20-4.61,p=0.013)和边缘状态(HR=1.59,95%CI 1.01-2.55,p=0.050)(表7,图16)。
多重测定中的TP53
尽管几乎所有胰腺癌都在KRAS内携带突变,但很大一部分(约75%)也含有TP53中的突变(参见例如,Jones等人,2008 Science 321(5897):1801-1806;Biankin等人,2012Nature 491(7424):399-405;以及Waddell等人,2015 Nature 518(7540):495-501)。此外,TP53是癌症中最常见的突变基因(参见例如,Vogelstein等人,2013 Science 339(6127):1546-1558),从而使其成为涉及其他肿瘤类型的未来研究中用于ctDNA检测的有吸引力的靶标。为了确定血浆中TP53的突变体等位基因频率是否与KRAS的突变体等位基因频率相关,以及为了确定血浆中的突变体TP53测定是否可能增加突变体KRAS测定的敏感性,评估了152个匹配的肿瘤和血浆样品可用的癌。首先检索在PDAC的全基因组研究中鉴定的“热点”之一处的突变(参见例如,Jones等人,2008 Science 321(5897):1801-1806)。在这些位置之一中,共64个(42%)癌包含TP53突变。然后使用与上文针对KRAS所述的相似但使用对特定TP53突变具有特异性的引物的基于Safe-SeqS的测定,来确定是否可以在这64名患者的血浆中鉴定出这些相同的突变。
在64个血浆样品的13个(20%)中鉴定出了TP53突变(见下文)。有两个有趣的观察结果。首先,含有可检测的TP53突变的13个血浆样品的12个也含有可检测的KRAS突变。因此,TP53突变测定并未大幅增加胰腺癌检测的敏感性,正如上述KRAS突变的高流行率所预期的那样。第二,在血浆中含有可检测量的两种突变的12名患者的血浆中,TP53与KRAS突变的突变体等位基因频率之间存在很强的相关性(图3,皮尔逊r=0.885)。这为ctDNA测定的可靠性及其定量性质提供了又一验证。
在PDAC患者中检测到的示例性TP53突变的列表
Figure GDA0002675196410008131
Figure GDA0002675196410008141
在PDAC患者中检测到的示例性CDKN2A突变的列表
Figure GDA0002675196410008142
实施例3:ctDNA和蛋白质生物标记物的敏感性和特异性
材料和方法
A阶段
健康队列:招募了一万名无症状的女性。参与者的年龄范围为65至75岁,因为此年龄范围捕获了具有作为检测靶标的八种类型的癌症的最大风险的患者。进行卵巢切除术、患有非黑色素瘤皮肤癌以外的任何类型的已知癌症的女性被排除在本研究之外。在研究开始时从每个参与者获得血浆。在测试阳性的参与者中,以及在测试阴性的参与者的随机样品中,在第一次测试后的3个月再抽取一个血浆样品。当两个测试对同一突变均呈阳性时,执行全身PET/CT扫描。如果PET/CT检查呈阳性,则由主治医师认为适当的情况下对患者进行管理。此管理包括年度随访ctDNA测试。通过电子问卷,必要时与电话访谈组合,针对所有个体获得患者的年度随访,无论其测试呈阳性还是阴性。
管理队列:从澳大利亚、新西兰和新加坡的至少10个地点招募200名患有III期结肠癌的患者和50名患有可切除胰腺癌的患者。测试肿瘤样品以鉴定可用于后续ctDNA测试的突变。在手术前对所有患者收集血浆样品(包括随机接受常规护理的那些患者)。在手术前ctDNA测试呈阳性的患者中,在第3、6和12个月收集额外的血浆样品。在ctDNA阴性的患者或随机接受常规护理的那些患者中,不再执行进一步ctDNA分析。患者随机分成1∶1接受ctDNA告知的管理(与标准护理或常规护理相比,治疗增加或降级[无视ctDNA测试结果])。
B阶段
健康队列:招募了四万多名无症状的女性。纳入和排除标准与A阶段相同。除了随访更长和患者数量更大之外,A阶段与B阶段之间存在至少其他两个区别。首先,通过了特异性阈值(>99.5%)的蛋白质生物标记物被包括在A阶段样品中。对这些蛋白质生物标记物中的一个或多个的测试呈阳性的患者与具有阳性ctDNA结果的患者进行相同的管理。其次,添加了“对照”健康队列。这些代表了从同一群体中招募的个体,但没有从这些个体中采取任何血液样品来评估疾病或指导管理。这些对照用于评估筛选测试检测疾病的能力,然后通常基于健康个体的症状或标准医疗护理对其进行检测。还对所筛选队列与对照队列的分期和存活进行了比较。
管理队列:招募了1000多名患有III期结肠癌的患者(共1200名患者)和210多名患有可切除胰腺癌的患者(共250名患者),但现在是在30个地点,而不是10个地点。与A阶段相似,在手术中收集了所有新患者的肿瘤样品,并鉴定了突变,以便可以在随后的ctDNA测试中使用。另外,包括在A阶段中通过特异性阈值(>99.5%)的结直肠癌或胰腺癌的蛋白质生物标记物。对这些蛋白质生物标记物的测试呈阳性的患者与具有阳性ctDNA结果的患者进行相同的管理。在手术前ctDNA测试呈阳性的患者中,在手术前以及第3、6和12个月收集血浆样品。患者随机分成1∶1接受ctDNA告知的管理(与标准护理或常规护理相比,治疗增加或降级[无视ctDNA结果])。
评估
健康队列中使用的基于Safe-SeqS的ctDNA测试包括了61个扩增子,它们代表了癌症驱动基因的最常见的突变区域。据估计,待靶向的八种癌症类型中约70%在这些扩增子覆盖的区域的至少一个中具有突变。在这些扩增子的至少一个中具有突变的血浆级分小于70%,因为并非所有癌症都产生ctDNA(参见,Bettegowda等人,Sci Transl Med.2014 Feb19;6(224):224ra24.doi:10.1126/scitranslmed.3007094.)。
对于管理队列,首先使用靶向测序测定来鉴定从手术或活检中获得的FFPE癌症中的至少一个突变。这种基于Safe-SeqS的测试采用了128个扩增子,并且我们已将其用于检测401个结直肠癌中的395个和200个胰腺癌中的200个中的至少一个致病性驱动基因突变。然后,使用一个检测每个个体患者的肿瘤中的突变的特异性扩增子,在指定的时间点评估所述患者的血浆,换句话说,是一种完全个性化的测定。
除了对循环肿瘤DNA(ctDNA)的测试之外,使用Luminex平台针对来自健康队列的血浆样品的子集评估了约25个蛋白质生物标记物。对这些蛋白质的测定已经建立。如果将阳性阈值设定为高水平,它们将提供额外的信息,这些信息可以与ctDNA测试结果组合,以改进敏感性而又不影响特异性。在A阶段中表现出>99.5%特异性的标记物已包括在本研究的B阶段中。
实施例4:使用组合方法癌症筛选测试检测妇科恶性肿瘤
妇科恶性肿瘤(例如宫颈癌、卵巢癌和子宫内膜癌)的诊断通常包括Papanicolaou(巴氏)测试、经阴道超声(TVUS)和/或CA-25生物标记物的检测。然而,不建议对一般群体使用当前的诊断方法进行筛选,因为它会导致“重大危害,包括在没有癌症的女性中的重大外科干预”(参见例如,Moyer,2012 Annals of internal medicine 157:900-904)。因此,迫切需要新的诊断方法。
本实施例描述了一种新的血液测试,称为PapSEEK,其解决了上述难题。在此测试中,来自采样流体(例如,包含从子宫颈管采样的细胞的流体)的DNA可以用于测定(例如,基于PCR的多重测试)中,以同时评估子宫内膜癌或卵巢癌中常见的遗传改变(图19)。总体而言,本文描述的研究包括来自1658个个体的1915个样品,其中包括656名患有子宫内膜癌或卵巢癌的患者以及1002名健康对照。表13提供了癌症患者的年龄、种族、组织病理学诊断、分期和其他临床信息。来自这些患者的测试的样品列在表14中。
材料和方法
患者样品
本研究的所有样品均根据约翰霍普金斯医学院(Baltimore,MD)、麦吉尔大学(Montreal,QC,Canada)、哥德堡大学(Gothenburg,Sweden)、BioreclamationIVT(Chestertown,MD)、纪念斯隆凯特琳癌症研究中心(New York City,NY)和丹麦科学伦理委员会(Copenhagen,Denmark)的机构审查委员会批准的方案获得。表13列出了每位癌症患者的人口统计学、临床和病理分期数据。用于巴氏刷分析的714名没有癌症的女性的平均年龄为34岁(范围:17至67岁)。用于陶氏刷分析的125名没有癌症的女性的平均年龄为29岁(范围:18至74岁)。所有组织病理学均由职业认证的病理学家进行了复查。从肿瘤、巴氏涂片液和血浆中提取DNA,如其他地方所述(参见例如,Kinde等人,2011 Proc Natl Acad Sci USA108:9530-9535;以及Bettegowda等人,2014 Sci Transl Med 6:224ra224)。对于宫内采样,将陶氏刷IUMC子宫内膜采样器(Cook Medical Inc.,Bloomington,IN)轻轻插入子宫底水平。然后将外部护套拉回,并将刷子顺时针旋转360度,并且然后逆时针旋转360度。然后,再次推动外部护套并取出装置。将样品放入Thin-Prep缓冲液中,根据制造商的说明,使用AllPrep DNA试剂盒(Qiagen,Germany)从其中纯化DNA。对来自所有样品的纯化的DNA进行定量,如其他地方所述(参见例如,Rago等人,2007 Cancer research 67:9364-9370)。
健康对照包括巴氏涂片细胞学检查结果正常且无妇科肿瘤病史的患者。有输卵管结扎史的卵巢癌患者被排除在本研究之外。
体细胞突变检测和分析
将来自巴氏涂片液、陶氏刷样品或原发性肿瘤的DNA在由139个引物对组成的三个多重PCR反应中进行扩增,这些引物对被设计来扩增110至142bp片段,如其他地方所述(参见例如,Wang等人,2016 Elife 5)。这些片段含有以下18个基因的所关注区域:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、KRAS、MAPK1、NRAS、PIK3CA、PIK3R1、POLE、PPP2R1A、PTEN、RNF43和TP53。对于每个样品,执行三个多重反应,每个反应均含有不重叠的扩增子,如其他地方所述(参见例如,Wang等人,2016 Elife 5)。每个样品在两个重复的孔中进行评估。来自血浆的DNA在由61个引物对组成的两个多重PCR反应中进行扩增,这些引物对被设计来扩增67至81bp的片段。每个样品在六个重复的孔中进行评估。这些片段含有以下基因的所关注区域:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN和TP53。
Safe-SeqS,一种用于检测低频率突变的错误减少技术(参见例如,Kinde等人,2011 Proc Natl Acad Sci USA 108:9530-9535),用于所有测序分析。每对中的一个引物包括一个唯一标识符序列(UID),其由具有相等的机会成为A、C、T或G的14个简并碱基组成。根据质量得分选择高质量的序列读长,所述质量得分由测序仪器生成,以指示碱基被错误识别的概率。然后,基于掺入作为分子条形码的UID将来自共同模板分子的读长进行分组。通过要求每个UID家族中>90%的读长中存在突变(即被评分为“超突变体”),来减少在样品制备或测序步骤中引入的人为突变(参见例如,Kinde等人,2011 Proc Natl Acad SciUSA 108:9530-9535)。
测序数据的统计分析
使用基于突变体等位基因分数(MAF)的方法分析所有的巴氏刷和陶氏刷样品。考虑满足以下两个标准之一的突变:(i)存在于COSMIC数据库中(参见例如,Forbes等人,2017Nucleic Acids Res 45:D777-D783),或(ii)预测在肿瘤抑制基因中失活(无义突变、框外插入或缺失、典型剪接位点突变)。排除同义突变(外显子末端的那些除外)(参见例如,Jung等人,2015 Nat Genet 47:1242-1248)和内含子突变(剪接位点的那些除外)。首先基于对照组中相同突变的MAF的分布对所关注样品中的MAF进行归一化。在此突变特异性归一化之后,通过将每个孔中每个突变的MAF与由包括所有突变在内的正常对照构建的MAF的参考分布进行比较,来获得p值。然后由通过其UID数量加权的两个孔的p值计算Stouffer Z得分。
对于以下三个标准中的任一个,当样品中的任一突变的值高于对应的阈值时,样品被评为阳性:1)其MAF与对照中针对所述突变观察到的对应的最大MAF之差,2)其Stouffer Z得分与对照中的相同突变的最高六个非零Stouffer Z得分的平均值之比,或3)在对照组中未发现所述突变时仅其Stouffer Z得分。
敏感性和特异性从10倍交叉验证获得。在每一轮中,来自714名没有癌症的女性中的90%的巴氏刷样品用作对照。在这十轮中的每一轮中,对来自没有癌症的女性的剩余10%的巴氏刷样品进行评分以获得特异性。所有其他样品在10轮中的每一轮中被评分一次,共计十次,并且如果它们在超过一半的时间(即,5轮或更多轮)被评分为阳性,则被认为它们是阳性的。表15中列出了评分为阳性的样品中的突变。
使用经验贝叶斯方法进行血浆样品的分析。首先使用最大似然估计基于一组对照中的MAF拟合β分布。然后对应地调整所有突变的MAF。通过与对照中的调整后的MAF的分布进行比较,计算出每个孔中每个突变的p值。每个突变的总p值是所有6个孔的p值的乘积。敏感性和特异性从10倍交叉验证获得。在每一轮中,与上述巴氏刷样品一样,来自192名健康个体的正常血浆样品用作对照。如果样品在5轮或更多轮中是阳性的,则认为所述样品是阳性的。表17中列出了评分为阳性的样品中的突变。
假设将具有实际敏感性和特异性的二项分布设定为对应的成功概率,来计算敏感性和特异性的置信区间。
非整倍性检测和分析
对于每个样品,单个引物对用于在整个基因组中扩增约38,000个长散布核苷酸元件(LINE)的基因座(参见例如,Kinde等人,2012 PLoS One 7:e41162)。在Illumina仪器上执行大规模平行测序。引物之一包括如上所述的UID作为分子条形码,以减少与PCR和测序相关联的错误率。然后使用样品内非整倍性检测(WALDO)软件处理测序数据以鉴定显著的单个染色体臂获得或丢失以及39个染色体臂上的等位基因失衡(参见例如,实施例6)。WALDO结合支持向量机(SVM)来分辨非整倍体和整倍体样品。使用3150个具有低赘生物含量的合成非整倍体样品和677个整倍体外周白细胞(WBC)样品来训练SVM。如果SVM判别得分超过给定阈值,或者如果观察到染色体臂7q和8q的显著获得,则将样品评分为阳性(非整倍体)。这些染色体臂在子宫内膜癌和卵巢癌两者中经常获得(参见例如,Cancer GenomeAtlas Research,2013 Nature 497:67-73;以及Cancer Genome Atlas Research,2011Nature 474:609-615)。
结果
对来自子宫内膜癌或卵巢癌患者的巴氏刷样品中体细胞突变的评估
从赘生性细胞脱落的DNA的量预期将是巴氏刷样品中的总DNA的一小部分,其中大多数DNA来源于正常细胞。因此,使用一种敏感的基于PCR的错误减少技术,称为安全测序系统(Safe-SeqS),来鉴定这些样品中的突变(参见方法和材料)。简而言之,设计引物来扩增139个区域,覆盖18个所关注基因内的9,392个不同的核苷酸位置(表39)。然后对每个样品执行三个多重PCR反应,每个反应均含有不重叠的扩增子。
将这种测定应用于382名患有子宫内膜癌的女性、245名患有卵巢癌的女性和714名没有癌症的女性的巴氏刷样品。发现81%的子宫内膜癌患者具有可检测的突变,包括78%的早期(I和II期)疾病患者和89%的晚期(III和IV期;表S2)疾病患者。最常见的突变基因是PTEN(64%)、TP53(41%)、PIK3CA(31%)、PIK3R1(29%)、CTNNB1(21%)、KRAS(18%)、FGFR2(11%)、POLE(9%)、APC(9%)、FBXW7(8%)、RNF43(7%)和PPP2R1A(5%)。中值突变体等位基因分数(MAF)为4.0%(95%置信区间(CI):3.5%至4.5%)(表15)。
在245名卵巢癌患者中,有29%在其巴氏刷样品中携带可检测突变。这些包括28%的早期疾病患者和30%的晚期疾病患者(表14)。最常见的突变基因是TP53(74%)。中值MAF为0.54%(95%CI:0.4%至0.87%)(表15)。还将这种测定应用于714名没有癌症的女性,并且发现1.3%具有可检测突变,产生的特异性为98.7%(95%CI:97.6%至99.4%)(图20)。
肿瘤组织可分别从83%和84%的捐献巴氏刷样品的子宫内膜癌和卵巢癌患者获得。使用应用于巴氏刷样品的相同多重测定,分别在98%和82%的子宫内膜和卵巢癌组织中鉴定出了驱动基因突变(表16)。在其原发性肿瘤中鉴定出驱动突变的子宫内膜癌和卵巢癌患者中,分别85%和29%在其巴氏刷样品具有突变。相反,在患有子宫内膜癌或卵巢癌的患者的阳性巴氏刷样品中,93%含有至少一个与在其原发性肿瘤中观察到的相同的驱动基因突变。在原发性肿瘤中也发现突变的巴氏刷样品的比例在子宫内膜癌患者(97%)中高于卵巢癌患者(73%)。
巴氏刷样品中非整倍性的评估
除了体细胞突变之外,在大多数子宫内膜癌和卵巢癌中发现了非整倍性(参见例如,Cancer Genome Atlas Research,2013 Nature 497:67-73;Cancer Genome AtlasResearch,2011 Nature 474:609-615;以及Vogelstein等人,2013 Science 339:1546-1558)。为了评估非整倍性,使用基于PCR的方法用单个引物对来扩增约38,000个长散布核苷酸元件(LINE)的基因座。LINE通过反转录转座分散在整个基因组中,并且存在于全部39个非近端着丝粒常染色体臂上。测序之后,对数据进行处理以鉴定单个染色体臂上的获得或丢失。
在38%(n=382)的子宫内膜癌患者的巴氏刷样品中检测到非整倍性,分别包括34%和51%的早期和晚期疾病患者(表14)。在11%(n=245)的卵巢癌患者的巴氏刷样品中也检测到非整倍性,分别包括15%和9.3%的早期和晚期疾病患者(表14)。在子宫内膜癌和卵巢癌中,最常见的改变的臂是4p、7q、8q和9q。相比之下,当将非整倍性测定应用于714名没有癌症的女性的巴氏刷样品时,只有一名女性呈阳性(图20)。
即使样品在所评估的18个基因之一中不包含遗传改变,它仍可能是非整倍体并且可以通过本文提供的方法检测到。通过鉴定6名在其巴氏刷样品或原发性肿瘤中没有突变但其巴氏刷样品表现出非整倍性的患者(3名患有子宫内膜癌,并且3名患有卵巢癌),支持了这一推测。包括上述突变加上非整倍性的测定的组合测试称为“PapSEEK”。如果样品携带突变或染色体臂数量异常,则PapSEEK将其评分为阳性。来自患有子宫内膜癌的女性的巴氏刷样品中,81%为PapSEEK阳性,包括78%的早期疾病患者和92%的晚期疾病患者(图21和图22)。来自患有卵巢癌的女性的巴氏刷样品中,33%为PapSEEK阳性,包括34%的早期疾病患者和33%的晚期疾病患者(图21和图22)。来自714名没有癌症的女性的巴氏刷样品中,1.4%为PapSEEK阳性,产生的特异性为98.6%(95%CI:97.4%至99.3%)(图20)。
对卵巢癌或子宫内膜癌患者的陶氏刷样品的评估
对子宫内腔(而不是子宫颈管)的更直接的微创采样可能会增加这种用于检测妇科癌症的方法的敏感性。为了探索这种可能性,使用陶氏刷收集子宫内样品,陶氏刷是一种柔软、狭窄的刷子,被可伸缩的外部护套覆盖,可以直接采样整个子宫内膜腔,而不会损伤子宫肌层或受到宫颈管的污染。它已获得美国食品药品管理局(FDA)的批准,用于子宫内膜采样,并且无需麻醉即可用于门诊。有利于潜在的筛选测试,患者可以很好地耐受。
将PapSEEK应用于从123名子宫内膜癌患者、51名卵巢癌患者和125名没有癌症的女性收集的陶氏刷样品。在来自子宫内膜癌患者的陶氏刷样品中,93%含有通过PapSEEK检测到的遗传改变,分别包括90%和98%的早期和晚期疾病患者(图22)。陶氏刷样品中最常见的突变,基因是PTEN(63%)、TP53(42%)、PIK3CA(36%)、PIK3R1(20%)、KRAS(17%)、CTNNB1(15%)、FGFR2(15%)、RNF43(11%)、PPP2R1A(7%)、POLE(7%)和FBXW7(6%),与在巴氏刷样品中观察到的相似。中值MAF为24.7%(95%CI:21.3%至26.9%),远高于在巴氏刷样品中所观察到的,其中中值MAF为4.0%(95%CI:3.5%至4.5%;表S4)。
通过PapSEEK可检测到的遗传改变在45%(95%CI:31%至60%)的来自51名患有卵巢癌的女性的陶氏刷样品中被发现,分别包括47%和44%的早期和晚期疾病患者(图22)。最常见的突变基因是TP53(86%),与关于巴氏刷样品的数据一致。中值MAF为0.88%(95%CI:0.61%至2.8%),高于巴氏刷样品(中值0.54%;95%CI:0.4%至0.87%;表15)。
将PapSEEK应用于来自125名没有癌症的女性的陶氏刷样品。这些女性中,没有一个(0%)的突变测试为阳性,产生的特异性为100%(95%CI:97%至100%;图20)。
陶氏刷和巴氏刷样品可从145名患者(103名患有子宫内膜癌并且42名患有卵巢癌)中的同一女性获得。在子宫内膜癌中,PapSEEK在91%的陶氏刷样品和81%的巴氏刷样品中呈阳性(p=0.02,mid-P McNemar检验)。类似地,对于具有阳性PapSEEK测试的卵巢癌患者的比例,陶氏刷(45%)高于巴氏刷(17%;p=0.002,mid-P McNemar检验;表13)。
肿瘤组织可分别从90%和88%的捐赠陶氏刷样品的子宫内膜癌和卵巢癌患者获得。PapSEEK分别在97%和80%的子宫内膜癌和卵巢癌组织中鉴定出了驱动基因突变(表16)。在其原发性肿瘤中鉴定出驱动突变的子宫内膜癌和卵巢癌患者中,分别93%和42%在其陶氏刷样品具有可检测突变。相反,在患有子宫内膜癌或卵巢癌的患者的阳性陶氏刷样品中,91%含有至少一个与在其原发性肿瘤中观察到的相同的驱动基因突变。在原发性肿瘤中也发现突变的陶氏刷样品的比例在子宫内膜癌患者(97%)中高于卵巢癌患者(53%)。
对卵巢癌患者中的ctDNA的评估
由于解剖或其他因素无法通过巴氏刷或陶氏刷采样获得的卵巢癌可以通过在血浆中的循环肿瘤DNA(ctDNA)进行检测。这在83名同时捐赠了巴氏刷和血浆样品的卵巢癌患者中进行了测试。由于降解的ctDNA的大小较小,因此设计了引物来扩增67至81bp的短DNA片段,覆盖16个所关注基因中的1,931个不同的核苷酸位置。为了证明此测定的特异性,将其应用于来自192个健康个体的血浆样品中;没有一个(0%)测试为阳性,产生的特异性为100%(95%CI:98%至100%)。
发现43%(95%CI:33%至55%)的来自83名卵巢癌患者的血浆中具有可检测的ctDNA。测定值列在表17中。如所预期的那样,晚期肿瘤患者血浆中ctDNA的敏感性高于早期肿瘤患者(56%相对于35%;图23)。对于早期疾病,血浆中的中值MAF为0.85%,这低于巴氏涂片中的中值MAF(5.7%)。血浆中鉴定出的突变中的至少一个可在88%的对应的原发性肿瘤中鉴定出。
在来自这一83名患者的相同队列的巴氏刷样品中,通过PapSEEK测试,40%为阳性。在其巴氏刷样品中评分为阳性的个体与在其血浆样品中评分为阳性的个体仅部分重叠(图21)。结果,63%(95%CI:51%至73%)的患者在两种测试的至少一种中为阳性。测试阳性的患者分别包括54%的早期疾病患者和75%的晚期疾病患者(表13,图23)。
讨论
如本文所述,设计基于PCR的多重测试(PapSEEK)并将其应用于检测巴氏刷或陶氏刷样品中的遗传改变。这些样品在常规的寻医就诊期间微创并方便地获得。使用PapSEEK可以检测出大多数子宫内膜癌:陶氏刷为93%并且巴氏刷为81%。使用PapSEEK还可以检测出很大一部分卵巢癌:陶氏刷为45%并且巴氏刷为33%。PapSEEK的特异性很高,分别只有0%和1.4%的没有癌症的女性在使用陶氏刷和巴氏刷样品被测试为阳性(图24)。还证明血浆中ctDNA的测定可以与对巴氏刷样品的PapSEEK一起使用,从而将检测卵巢癌的敏感性增加到63%。
值得注意的是,检测早期卵巢癌的敏感性与晚期疾病一样高(陶氏刷为47%相对于44%;巴氏刷为34%相对于33%)。不希望受理论的束缚,对此意外但诱人的发现至少有两种可能的解释。首先,已经表明一些卵巢癌来源于输卵管,当肿瘤细胞脱落到子宫腔中时,这可能有助于使用PapSEEK进行早期检测。第二,在晚期肿瘤中,输卵管经常被疾病弄乱和闭塞,并且因此不太可能用作肿瘤细胞进入子宫或子宫颈管的导管。在这种情况下,血浆中的ctDNA分析加上巴氏刷或陶氏刷采样可能特别有益。
本文测试的样品的子集由高级别早期癌症组成。当前可用的诊断模态对这些病变的敏感性很低(参见例如,Fishman等人,2005 Am J Obstet Gynecol 192:1214-1221;Sharma等人,2012 Ultrasound Obstet Gynecol 40:338-344;以及Hamilton等人,2006British journal of cancer 94:642-646)。尽管高级别亚型仅占发生的子宫内膜癌的约10%,但是它们占疾病死亡人数的40%以上(参见例如,Moore等人,2011 Clin ObstetGynecol 54:278-291)。由于这些高级别癌症通常是由萎缩性子宫内膜的背景引起的,并且可以在成像可见异常之前转移,因此经阴道超声在筛选和早期诊断中的作用有限。因此,令人鼓舞的是,PapSEEK在巴氏刷和陶氏刷样品中分别检测出了85%(n=34)和89%(n=9)局限于子宫内膜的高级别子宫内膜癌。在卵巢癌的情况下,所测试的队列仅包括少量的早期高级别病例,这与这些癌症通常仅在晚期被诊断出的不幸事实一致。然而,值得注意的是,发现在组合的巴氏和血浆样品测试中36%(n=11)为阳性,并且在陶氏刷样品中80%(n=5)为阳性。
本文所述的研究是回顾性的。被检查的样品均来源于已知癌症患者,即使很大一部分来自具有早期病变的患者。在筛选情况下,癌症将有利地处于早期阶段,并且预期检测的敏感性接近本研究中观察到的早期癌症的敏感性。此外,在前瞻性研究中通常比在本回顾性研究中更好地匹配对照组和病例的年龄范围。一些在其巴氏刷或陶氏刷样品中具有可检测突变的卵巢癌患者在其原发性肿瘤中没有相同的突变。对于子宫内膜癌来说这不是问题,其中刷样品中的至少一个突变几乎总是(97%)在对应的原发性肿瘤中发现。但是这种现象在卵巢癌患者中观察到,特别是陶氏刷。可在巴氏刷中鉴定的至少一个突变可以在73%的对应的原发性卵巢肿瘤中鉴定出,而仅53%的陶氏刷样品,情况如此。
不希望受理论的束缚,对来自同一患者的刷样品中的突变与卵巢癌之间的不一致性的一种可能解释是,所述测定检测到了体内不存在的代表技术人为误差的突变。然而,考虑到测定的特异性在来自没有癌症的女性的陶氏刷和巴氏刷样品中分别为100%和99%,认为这不太可能。另一个可能的解释是肿瘤异质性。仅对所分析的肿瘤的一小部分进行了采样和测序,并且在巴氏涂片或子宫内样品中发现的额外的突变可能代表肿瘤其他部分的突变。也有可能一些突变来自病理学家并未注意到的小型同期内膜癌或早期、恶变前的子宫内膜病变。很大一部分患有卵巢癌的女性患有同期子宫内膜癌,其中危险因素包括Lynch综合征、多囊卵巢综合征、停经期前症候、肥胖、无效生育和雌激素替代疗法(参见例如,AlHilli等人,2012 Gynecologic oncology 125:109-113;Walsh等人,2005 Obstetrics andgynecology 106:693-699;Zaino等人,2001 Gynecologic oncology 83:355-362;以及Song等人,2014 Int J Gynecol Cancer 24:520-527)。
尽管肿瘤异质性或多个同期肿瘤是通常用于解释液体活检研究中的不一致性的可行解释,但不希望受理论的束缚,非恶性细胞的克隆扩增可能会在本研究中发挥作用。在子宫灌洗、骨髓、皮肤和其他组织中已经描述了被认为不是赘生性的克隆增殖(参见例如,Steensma等人,2015 Blood 126:9-16;Coombs等人,2017 Cell Stem Cell 21(3):374-382;Young等人,2016 Nat Commun 7:12484;Krimmel等人,2016 Proc Natl Acad Sci USA113:6005-6010;以及Nair等人,2016 PLoS Med 13:e1002206)。引起子宫内膜异位的子宫内膜细胞的克隆增殖特别令人关注,子宫内膜异位症是一种影响数百万女性的有时会使人虚弱的病状。最近表明,这些可以发生在整个腹部并来源于子宫内膜的病变,是可以由在子宫内膜癌中检测到的相同突变来驱动的克隆增殖(参见例如,Anglesio等人,2017 N EnglJ Med 376:1835-1848)。不希望受理论的束缚,促成卵巢癌或由卵巢癌引起的激素和生理变化可能会刺激或选择子宫内膜内层的此类克隆增殖。一方面,这种可能性与作为所有液体活检概念基础的精湛特异性背道而驰。另一方面,如果在患有妇科恶性肿瘤的女性中几乎全部发现大量的克隆增殖,则它实际上可以提高卵巢癌检测的敏感性,而不会减少特异性。通过本文提供的方法可检测到占子宫内膜内层中总细胞的>0.03%的克隆增殖。
实施例5:使用组合方法癌症筛选测试检测泌尿系统恶性肿瘤
根据美国癌症协会,2017年仅在美国估计就有79,030例膀胱癌(BC)新病例和18,540例死亡(参见例如,Siegel等人,2017 CA Cancer J Clin 67:7-30),其中许多BC患者在进展之前经历了多次复发,为转移前的早期检测和治疗提供了充足的准备时间(参见例如,Netto,2013 Adv Anat Pathol 20:175-203)。用经尿道活检(TURB)进行的尿液细胞学检查和膀胱镜检查是当前用于膀胱癌诊断和随访的黄金标准。尽管尿液细胞学检查具有检测高级别赘生物的价值,但它无法检测到绝大多数低级别肿瘤(参见例如,Netto等人,2016Urol Clin North Am 43:63-76;Lotan等人,2003 Urology 61:109-18;以及Zhang等人,2016 Cancer Cytopathol 124:552-564)。这一事实,加上反复进行膀胱镜检查和TURB程序的高成本和侵入性,已导致了许多开发新颖的非侵入性策略的尝试,包括基于尿液或血清的遗传和蛋白质测定,用于筛选和监视(参见例如,Kawauchi等人,2009 Hum Pathol 40:1783-1789;Kruger等人,2003 Int J Oncol 23:41-48;Skacel等人,2003 J Urol 169:2101-2105;Sarosdy等人,2006 J Urol 176:44-47;Moonen等人,2007 Eur Urol 51:1275-80;Fradet等人,1997 Can J Urol 4:400-405;Yafi等人,2015 Urol Oncol 33:66.e25-66.e31;Serizawa等人,2010 Int J Cancer 129(1):78-87;Kinde等人,2013 Cancer Res73:7162-7167;Hurst等人,2014 Eur Urol 65:367-369;Wang等人,2014 Oncotarget 5:12428-12439;Ralla等人,2014 Crit Rev Clin Lab Sci 51:200-231;Ellinger等人,2015Expert Rev Mol Diagn 15:505-516;Bansal等人,2014 Clin Chim Acta 436:97-103;Goodison等人,2012 PLoS One 7:e47469;以及Allory等人,2014 Eur Urol 65:360-366)。当前可用的美国食品药品管理局(FDA)批准的测定包括ImmunoCyt测试(Scimedx Corp)、核基质蛋白22(NMP22)免疫测定测试(Matritech)和多靶标FISH(UroVysion)(参见例如,Kawauchi等人,2009 Hum Pathol 40:1783-1789;Kruger等人,2003 Int J Oncol 23:41-48;Skacel等人,2003 J Urol 169:2101-2105;Sarosdy等人,2006 J Urol 176:44-47;Moonen等人,2007 Eur Urol 51:1275-80;Fradet等人,1997 Can J Urol 4:400-405;以及Yafi等人,2015 Urol Oncol33:66.e25-66.e31)。已报道,这些测试中的一些的敏感性在62%与69%之间,并且特异性在79%至89%之间;然而,由于测定性能不一致、成本或所需的技术专长,尚未将此类测定整合到常规临床实践中。而且,由于尿液细胞学检查对于复发的检测相对不敏感,因此在美国此类患者中,膀胱镜检查尽可能每三个月执行一次,并且这些患者的管理成本总计高于任何其他类型的癌症的管理成本,并且每年的总计达30亿美元(参见例如,Netto等人,2010 Pathology 42:384-394)。
而且,在西方国家,这些上尿路尿路上皮癌(UTUC)的年发病率为每100,000人1-2例,但是在暴露于马兜铃酸(AA)的群体中发生率要高得多(Chen等人,2012 Proc NatlAcad Sci USA,109(21):8241-8246;以及Grollman等人,2013 Environ Mol Mutagen,54(1):1-7;以及Lai等人,2010 J Natl Cancer Inst,102(3):179-186)。肾输尿管切除术可以治愈早期检测到的UTUC患者(Li等人,2008 Eur Urol.54(5):1127-34)。然而,直到明显的临床症状(通常是血尿)发作之前,这些癌症大多数都是沉默的,并且因此,大多数患者只能在晚期被诊断出(Roupret等人,2015 Eur Urol.68(5):868-79)。当前用于检测早期UTUC的诊断测试不可用。
用于非侵入性检测癌症(例如,早期癌症,诸如BC或UTUC)的广泛适用的方法可能在医学和经济上都很重要。
本实施例描述了一种新的血液测试,称为UroSEE,其解决了上述难题。在此测试中,来自尿液样品的DNA可以用于测定(例如,基于PCR的多重测试)中,以同时评估BC或UTUC中常见的遗传改变。在图25中提供了在膀胱癌研究使用的方法的示意图,并且在图31中提供了在UTUC研究中使用的方法的示意图。
材料和方法
患者和样品
前瞻性地在四个参与机构中从患者收集尿液样品,所述参与机构包括约翰霍普金斯医院(Baltimore,MD,USA);A.C.Camargo癌症中心(Sao Paulo,Brazil);大阪大学医院(Osaka,Japan);和Hacettepe大学医院(Ankara,Turkey)。本研究得到约翰霍普金斯医院和所有其他参与机构的机构审查委员会的批准。获得了正确的材料转让协议。具有膀胱癌以外的已知恶性肿瘤病史的患者被排除在本研究之外。本研究包括两个队列的患者。
早期检测队列包括570名因血尿或下尿路症状而被转诊至上述医院之一的泌尿科门诊的患者(表18)。第二队列(322名患者)代表之前被明确诊断为膀胱癌(BC)且正在监视疾病复发的患者(监视队列)。这些患者的原发性肿瘤在通过多重或单重分析评估的11个基因中的至少一个中携带突变。对于分别在早期检测队列或监视队列中没有发生肿瘤或复发肿瘤迹象的病例,需要从尿液收集之日起最小12个月的随访。在患者访视期间在执行任何程序(诸如膀胱镜检查)之前,收集尿液样品。本研究中分析了总计892个尿液样品,其中包括两种类型的样品。第一样品是使用标准的BD SurePathTM基于液体的细胞学检查方案(ecton Dickinson and Company;Franklin Lakes,NJ,USA)处理之后的残留尿液细胞。为了满足标准护理,将残留的
Figure GDA0002675196410008311
流体在提交用于DNA纯化之前保持冷藏6-8周,以满足对同一样品进行重复细胞学检查处理的任何可能要求。第二样品类型由生物储备的新鲜尿液样品组成,其中将15-25mL排空的尿液样品在离心(500g,10分钟)之前在4℃下保存多达60分钟,而沉淀物在DNA纯化之前在负80℃下保存。还获得了平均年龄为26岁的188名健康个体的尿液,并将其与生物储备的新鲜尿液样品进行相同的处理。
在892例病例的413例中,收集来自经尿道切除术(TURB)或膀胱切除术的福尔马林固定及石蜡包埋(FFPE)的肿瘤组织样品。当来自同一患者的若干个不同肿瘤可用时(由于复发),在早期检测队列使用i尿液样品捐献之后获得的最早的肿瘤组织。在监视队列中,使用322名患者的146名中的尿液样品捐赠之前的肿瘤。在其他176个监视病例中,使用尿液样品捐赠之后获得的最早的组织。泌尿生殖系统病理学家检查了所有组织切片,以确认确诊并为所述病例选择具有尽可能高的肿瘤细胞性的代表性肿瘤区域。将对应的FFPE块用无菌16号针进行取芯。每个肿瘤获得1-3个芯,并放置在1.5mL无菌管中用于DNA纯化,如其他地方所述(参见例如,Kinde等人,2013 Caneer Res 73:7162-7167)。检查电子病历以获得所有患者的病史和随访数据。
所研究的UTUC队列
计划于2012-2016年在台湾大学医院进行根治性单侧肾输尿管切除术的连续的UTUC患者被要求参加研究。所有患者均使用同意书提供知情同意书,并且研究设计由台湾大学和石溪大学的机构审查委员会审查并批准。在通过同一性测试排除了4名具有肉眼血尿的患者和1名肿瘤尿液DNA不匹配的患者之后,总计56名UTUC患者入选了本研究。来自美国的平均年龄40岁(范围为19岁至60岁)的健康个体捐赠的188个尿液样品的尿液细胞DNA被用于评估UroSEEK测试的特异性。来自美国的94名正常个体的白细胞(WBC)NA被用于评估PCR测定的技术特异性。
生物样品-UTUC队列
手术前一天从患者获得尿液样品。将尿液细胞通过在室温下以581g离心10分钟进行分离,在相同的离心条件下在盐水中洗涤三次,并且冷冻保存,直到使用Qiagen试剂盒#937255(Germantown,MD)分离出DNA。DNA通过标准苯酚-氯仿提取程序从新鲜冷冻的上尿路肿瘤和肾皮质的切除样品中进行纯化,如其他地方所述(参见例如,Chen等人,2012 ProcNatl Acad Sci USA,109(21):8241-8246;以及Jelakovic等人,2012 Kidney Int.81(6):559-67)。分析每名患者的一个上尿路肿瘤;对于在多个部位具有肿瘤的病例,应尽可能优先选择肾盂肿瘤。由泌尿科病理学家对福尔马林固定及石蜡包埋的肿瘤样品进行分期和分级,并通过组织病理学确认每个入选受试者中一个或多个上尿路上皮癌的存在。通过每个受试者的病例审查获得相关的临床和人口统计学数据。通过MDRD方程式来计算eGFR(参见例如,Levey等人,2006 Ann Intern Med.145(4):247-54)并将其用于确定CKD分期(参见例如,Levey等人,2005 Kidney Int.67(6):2089-100)。
DNA加合物分析
通过使用线性四极离子阱质谱仪(LTQ Velos Pro,Thermo Fisher Scientific,San Jose,C)的超高效液相色谱-电喷雾电离/多级质谱(UPLC-ESI/MSn)来定量在来自UTUC患者的正常肾皮质的2μg的DNA中AL-DNA加合物(7-(脱氧腺苷-N6-基)马兜铃内酰胺I;dA-AL-I)的水平,如其他地方所述(参见例如,Yun等人,2012 Chem Res Toxicol.2012 25(5):1119-31)。
突变分析
使用三种单独的测定来检索尿液细胞DNA中的异常。首先,使用多重PCR来检测通常在泌尿系统恶性肿瘤中突变的十个基因CDKN2A、ERBB2、FGFR3、HRAS、KRAS、MET、MLL、PIK3CA、TP53和VHL的区域中的突变(参见例如,Netto,2011 Nat Rev Urol 9:41-51;Mo等人,2007 J Clin Invest 117:314-325;Sarkis等人,1993 J Natl Cancer Inst 85:53-59;Lin等人,2010 Urol Oncol 28:597-602;Sarkis等人,1994 J Urol 152:388-392;Sarkis等人,1995 J Clin Oncol 13:1384-1390;Wu,2005 Nat Rev Cancer 5:713-725;以及Cancer Genome Atlas Research Network,2014 Nature 507:315-322)。用于此多重PCR的引物对被分为总计三个多重反应,每个反应含有不重叠的扩增子(见下文)。这些引物用于在25μl反应中扩增DNA,如其他地方所述(参见例如,Kinde等人,2011 Proc Natl AcadSci USA 108:9530-9535),不同之处在于使用15个循环进行初始扩增。第二,评估TERT启动子区域。使用单个扩增引物来扩增含有已知在BC中携带突变的TERT启动子的区域的73bp片段(参见例如,Kinde等人,2013 Cancer Res 73:7162-7167)。用于扩增它的条件与上述多重反应中使用的条件相同,不同之处在于使用Phusion GC缓冲液(Thermo-Fisher)代替HF缓冲液,并使用20个循环进行初始扩增。TERT启动子区域不能被包括在多重PCR中,因为前者的GC含量很高。用AMPure XP珠子(Beckman Coulter,PA,USA)来纯化PCR产物,并且然后在第二轮PCR中扩增0.25%的纯化PCR产物(多重)或0.0125%的PCR产物(TERT单重),如其他地方所述(参见例如,Wang等人,2016 Elife 5:10.7554/eLife.15175)。然后将第二轮扩增的PCR产物用AMPure进行纯化,并在Illumina仪器上进行测序。对于鉴定出的每个突变,通过将具有突变的唯一鉴定的读长的数量除以唯一鉴定的读长的总数量来确定突变体等位基因频率(MAF)(参见例如,Kinde等人,2011 Proc Natl Acad Sci USA 108:9530-9535)。对于TERT启动子和多重测定两者,在两个独立的PCR中评估每个DNA样品,并且只有在两个PCR均显示相同的突变时,样品才被评分为阳性。表19、表20、表22和表23中列出的突变体等位基因频率和UID数量是指两个独立测定的平均值。
为了评估推定突变的统计显著性,评估了来自188名无关正常个体的白细胞的DNA。只有在来自癌症患者的样品中观察到的变体的MAF比在正常WBC中观察到的高得多时,才将所述变体评分为突变。具体地,样品的ctDNA状态的分类基于应用于每个突变的两个补充标准:1)所关注样品中的平均MAF与在一组对照中针对同一突变观察到的对应的最大MAF之间的差;和2)通过将所关注样品中的MAF与正常对照的分布进行比较而获得的StoufferZ得分。为了计算Z得分,首先基于在所有对照中观察到的MAF的突变特异性分布对所关注样品中的MAF进行归一化。在此突变特异性归一化之后,通过将每个孔中每个突变的MAF与由包括所有突变在内的正常对照构建的MAF的参考分布进行比较,来获得p值。然后由通过其UID数量加权的两个孔的p值计算Stouffer Z得分。如果样品的突变的所述差或Stouffer Z得分高于由正常WBC确定的阈值,则将所述样品分类为阳性。差参数的阈值由在任何正常WBC中观察到的最高MAF了来限定。选择Stouffer Z得分的阈值以允许在所研究的188个正常尿液样品中出现一个假阳性。
非整倍性分析。
使用Fast-SeqS评估非整倍性,Fast-SeqS使用单个引物对来扩增散布在整个基因组中的约38,000个基因座(参见例如,Kinde等人,2012 PLoS One 7:e41162)。在大规模平行测序之后,使用定制的统计学习方法确定所述测定覆盖的39个染色体臂中每个臂的获得或丢失。使用支持向量机(SVM)来分辨非整倍体和整倍体样品。使用3150个低赘生性细胞部分的合成非整倍体样品和677个整倍体外周白细胞(WBC)样品来训练SVM。当全基因组非整倍性得分>0.7并且存在至少一个染色体臂的获得或丢失时,样品被评分为阳性。
同一性检查。
使用上述用于多重PCR的扩增条件,执行包含26个引物的多重反应,从而检测10号和20号染色体上的31个常见SNP。膀胱癌队列中用于此同一性评估的引物在图34(表42)中列出,并且UTUC队列在图33(表41)中列出。
统计分析
使用MedCalc统计软件(medcalc.org/calc/diagnostic_test.php)计算尿液细胞学检查、UroSEEK及其三个成分的性能特征。
结果
早期检测队列特征。
图26提供了指示本研究中评估的患者数量和主要结果的流程图。
总计570名患者被包括在早期检测队列中,每名患者都分析了一个尿液样品。90%的患者患有血尿,3%患有下尿路症状(LUTS),并且9%具有表明他们具有BC的风险的其他迹象。参与者的中值年龄为58岁(范围为5至89岁)(表18)。70%的患者是男性。在18个月(范围为0到40个月)的中值随访期之后,有175名(31%)患者发展了BC。对于每名发展了BC的患者,选择另外两名表现出相似症状但在随访期内未发展BC的患者。然后,根据设计,此队列中发展BC的病例的比例要高于在标准临床实践中会发展BC的具有类似表现的患者的比例(5%)。下文总结了570名患者发展的肿瘤的特征。
Figure GDA0002675196410008371
Figure GDA0002675196410008381
膀胱癌队列的遗传分析。
对在来源于BC的尿液细胞可能发现的遗传异常执行三个单独的测试(图26)。首先,评估了已表明在尿路上皮肿瘤中频繁改变的十个基因的选定区域中的突变(表19)。出于此目的,设计了一组特定的引物,其可以允许检测少至0.03%的尿液细胞中的突变。检测此类低突变体分数的能力是由于在每个引物中并入了分子条形码,从而极大减少了与大规模平行测序相关联的人为误差。其次,评估了TERT启动子突变。使用单重PCR进行此分析,这是因为TERT启动子的异常高的GC含量使得它无法被包括在多重PCR设计中。第三,使用一种技术评估了非整倍性的程度,在所述技术中,使用单个PCR共扩增长散布核苷酸元件-1(L1反转录转座子,也称为LINE)的亚家族的约38,000个成员。像其他人重复序列一样,L1反转录转座子通过反转录转座分散在整个基因组中,并且存在于全部39个非近端着丝粒常染色体臂上。
多重测定在来自在本研究过程中发展了BC的个体的175个尿液细胞样品的68%中检测到了突变(95%CI 61%至75%)(表19)。在10个靶基因中的8个中检测到总计246个突变(图27A和表19)。具有可检测突变的尿液细胞中的平均突变体等位基因频率是18%,并且范围是0.17%至99%。最常改变的基因是TP53(总突变的45%)和FGFR3(总突变的20%;图27A)。在所使用的阈值下,在研究过程中未发展BC的395名早期检测队列中的患者中,1.7%在10个基因的任一个中均具有可检测的突变。在相同的阈值下,来自健康个体的188个尿液细胞样品在所测定的10个基因的任一个中均没有任何突变(100%特异性,95%CI 98%至100%)。
在来自在研究间隔期间发展了癌症的患者的175个尿液细胞样品中,在57%中检测到了TERT启动子中的突变(95%CI 49%至64%;表20)。尿液细胞中的平均TERT突变体等位基因频率是14%,并且范围是0.18%至78%。在3个位置检测到了突变:98%的突变位于hg1295228(79%)和hg1295250(19%),它们分别位于转录起始位点上游66和88bp。先前已证明这些位置参与TERT的适当转录调控。具体地,突变体等位基因募集了GABPA/B1转录因子,从而产生活性染色质的H3K4me2/3标记,并且逆转正常细胞中存在的表观遗传沉默。在研究过程中未发展BC的395名此队列中的患者中,4%在TERT启动子中具有可检测的突变。来自健康个体的188个尿液样品中只有一个携带TERT启动子突变。
在来自在研究过程中发展了BC的患者的175个尿液细胞样品中,在46%(95%CI39%至54%)中检测到了非整倍性(表20和表21)。最常变化的臂是5q、8q和9p。这三个臂全部都携带众所周知的致癌基因和抑癌基因,这些基因已被证明在许多癌症(包括BC)中均发生拷贝数改变。来自在研究过程中未发展BC的395名患者的尿液细胞样品中,1.5%表现出非整倍性。用相同的技术评估时,来自健康个体的188个尿液样品没有一个表现出非整倍性。
与原发性肿瘤的比较
来自入选此队列的患者的102名的肿瘤样品可用于比较,并使用与用于研究尿液细胞样品相同的三种测定进行研究(表20)。在这102个癌症的91个(89%)中,所研究的11个基因中的至少一个突变发生了突变(在10基因组套中或在TERT启动子中)。而且,在来自这102名患者的尿液样品中鉴定出的突变中的至少一个也在对应的BC的83%中被鉴定出来(表19和表20)。BC的分析也阐明了“假阴性”的基础,即来自发展了BC的患者的尿液样品中,21%在所测试的11个基因均没有可检测突变的原因。原因可能是对应的BC在这11个基因中均未携带突变,也可能是携带突变,但尿液样品中的赘生性细胞部分不够高以致于无法用所使用的测定检测到。62%的原发性肿瘤中的11个基因中的至少一个中的至少一个突变从具有假阴性的突变尿液测试的患者中鉴定出来(表22和表23)。结果表明,在29个假阴性突变测试中,38%是由于肿瘤中不存在所查询的突变的事实,而假阴性的其他62%是由于尿液中癌细胞数量不足。
UroSEEK:组合的生物标记物。
如上所述,当单独使用时,十基因多重测定、TERT单重测定和非整倍性测定分别产生了68%、57%和46%的敏感性(表19、表20和表21)。没有TERT启动子突变的45个样品可以通过其他十个基因的一个中的突变来检测(图28A和表19)。相反,在多重测定中没有可检测突变的35个样品可以借助于TERT启动子突变来检测(图28A和表20)。在11个基因中没有任何可检测突变的十个尿液细胞样品可以通过非整倍性测定来检测(图28A和表21)。因此,当三种测定一起使用时(称为“UroSEEK”的测试),并且任一测定的阳性结果足以将样品评分为阳性,敏感性上升至83%(95%CI 76%至88%)。来自健康个体的188个样品中,仅一个通过UroSEEK被评分为阳性(特异性为99.5%,CI 97%至100%)。在研究过程中未发展BC的395名此队列中的患者中,26名(6.5%)通过UroSEEK测试被评分为阳性(特异性为93%,CI91%至96%)。平均而言,UroSEEK阳性先于BC诊断2.3个月,而在8例病例中则超过一年(图29A和表18)。
UroSEEK加细胞学检查
由于细胞学检查和UroSEEK测试都是非侵入性的,并且可以对同一尿液样品执行,因此评估了它们的组合性能。早期检测队列中有347名细胞学检查可用的患者(表18)。在此队列的40名发展了经活检证实的癌症的患者中,17名通过细胞学检查为阳性(43%敏感性)。299名未发展癌症的患者中,没有一名通过细胞学检查为阳性(100%特异性)。其尿液通过细胞学检查为阳性的17名癌症患者中,100%的UroSEEK为阳性;并且其尿液通过细胞学检查为阴性的23名癌症患者中,95%的UroSEEK呈阳性。因此,组合的UroSEEK和细胞学检查提供了95%(95%CI 83%至99%)的敏感性,比UroSEEK增加12%,并且比细胞学检查增加52%。在研究过程中未发展BC的299名早期检测队列中的患者中,20名(6.6%)通过UroSEEK或细胞学检查为阳性,这使得UroSEEK和细胞学检查的组合的特异性为93%(95%CI 90%至96%)。
监视队列特征
监视策略与用于早期检测的策略不同。手术切除BC进行治疗和诊断的患者通常都具有可用的肿瘤组织,并且在大多数此类肿瘤中,可以鉴定出突变。例如,在研究过程中发现,在95.2%的所评估的BC中,存在11个所查询基因的至少一个中的突变。选择进行监视研究的所有患者均具有经活检证实的BC,并在手术后0-5年收集了尿液样品。总计评估了322名患者,其捐献了尿液并且其BC含有所分析的11个基因的至少一个中的突变。确定了在手术切除BC之后相对较短的时间内采取的单个尿液样品是否可以揭示这322名患者中的残留疾病,如通过以后的复发所证明的那样。在10.7个月(范围为0到51个月)的中值随访期之后,322名患者个187名(58%)发展了临床上明显的BC。这些患者的组织病理学类型和肿瘤分期在下文中总结,并详列于表24。参与者的中值年龄为62岁(范围为20至93岁)。如从BC的人口统计学所预期的,患者中的75%是男性。
Figure GDA0002675196410008431
Figure GDA0002675196410008441
监视队列的遗传分析
尿液细胞中的多重测定在来自在研究间隔期间发展了复发性BC的患者的尿液细胞样品的49%中检测到了突变(95%CI 45%至60%;表24和表25)。具有可检测突变的尿液细胞中的平均突变体等位基因频率是16%,并且范围是0.08%至93%。最常改变的基因是FGFR3(134个突变的43%)和TP53(134个突变的30%;图27B)。在研究过程中未发展复发性BC的135位患者中,7%在其尿液细胞样品具有可检测突变(这些被认为是假阳性;参见讨论)。阳性多重测定测试与复发性BC的诊断之间的平均间隔为7个月(范围为0至51个月)。
在来自在研究间隔期间发展了复发性BC的患者的尿液细胞样品中,在51%中检测到了TERT启动子中的突变(95%CI 44%至58%;表26)。具有可检测突变的尿液细胞中的平均TERT突变体等位基因频率是6%,并且范围是0.23%至43%。在早期检测队列的尿液细胞中观察到的相同三个位置检测到了突变。在研究过程中未发展复发性BC的135名患者中,10%(95%CI 83%至94%)在其尿液样品中具有可检测TERT启动子突变(假阳性)。阳性TERT测试与复发性BC的诊断之间的平均间隔为7个月(范围为0至40个月)。
在来自在研究过程中发展了复发性BC的患者的尿液细胞样品中,在30%(95%CI24%至37%)中检测到了非整倍性(表27)。与早期检测队列一样,最常变化的臂是8p、8q和9p。在研究过程中未发展复发性BC的135名患者中,2%在其尿液细胞样品的至少一个中表现出非整倍性。
组合的标记物-监视队列
如上所述,当单独使用时,十基因多重测定、TERT单重测定和非整倍性测定分别产生了49%、51%和30%的敏感性(表25、表26和表27)。没有TERT启动子突变的32个样品可以通过其他十个基因的一个中的突变来检测(图28B和表25)。相反,在多重测定中没有可检测突变的41个样品可以借助于TERT启动子突变来检测。没有任何可检测突变的三个尿液细胞样品可以通过非整倍性测定来检测。因此,UroSEEK的敏感性为66%(95%CI 59%至73%)。在研究过程中未发展BC的135名此队列中的患者中,14%通过UroSEEK测试被评分为阳性,产生的特异性为86%(95%CI 77%至91%)。平均而言,UroSEEK阳性先于BC诊断7个月,而在47例病例中则超过一年(图29B和表24)。
监视队列中有196名细胞学检查可用的患者(表24)。在此队列的120名发展了复发性BC的患者中,30名(25%)通过细胞学检查为阳性。相反,在肿瘤未复发的患者中未观察到阳性细胞学检查结果。其尿液通过细胞学检查为阳性的复发性BC患者中,90%的UroSEEK为阳性;并且其尿液通过细胞学检查为阴性的90名复发性BC患者中,61%的UroSEEK呈阳性。因此,组合的UroSEEK和细胞学检查提供了71%的敏感性(95%CI 61.84%至78.77)(图28D和表22)。在研究过程中未发展复发性BC并且其中细胞学检查可用的76名患者中,18%通过细胞学检查或UroSEEK被评分为阳性,从而提供82%的特异性(95%CI 71%至90%)。
早期检测队列和监视队列两者中的低级别与高级别尿路上皮赘生物
UroSEEK优于细胞学检查的优势在低级别肿瘤(低恶性潜力的乳头状尿路上皮赘生物和非浸润性低级别乳头状尿路上皮癌)中特别明显。本研究中评估了其中细胞学检查可用的总计49个低级别肿瘤(6个来自早期检测队列,而43个来自监视队列)。细胞学检查没有检测出这些低级别肿瘤中的任一个(0%敏感性;95%CI 0.0%至6.7%)。相比之下,UroSEEK检测到了67%(95%CI 51%至81%)的低级别肿瘤(两个队列中相同的比率为67%;图30)。类似地,本研究中评估了其中细胞学检查可用的总计102个高级别肿瘤(原位尿路上皮癌、非浸润性高级别乳头状尿路上皮癌或浸润性高级别尿路上皮癌)(34个来自早期检测队列,而68个来自监视队列)。细胞学检查在这些患者的45%中为阳性(在早期检测队列和监视队列中分别为50%和41%),而UroSEEK在他们的80%中为阳性(在早期检测队列和监视队列中分别为100%和71%;见下文)。
Figure GDA0002675196410008481
UTUC队列特征
年龄范围在39-85岁的32位女性和24位男性参与了本研究(见下文;个体数据在表28中)。这种性别分布,在其中男性占大多数的西方国家的UTUC患者中非典型(Shariat等,2011 World J Urol.29(4):481-6),与先前对已知暴露于AA的台湾个体的流行病学研究一致(参见例如,Chen等人,2012 Proc Natl Acad Sci USA,109(21):8241-8246)。据报告,此队列的18%使用了烟草,全部是男性。基于估计的肾小球滤过率(eGFR)值,在45%的受试者中肾功能未受损(慢性肾病(CKD)0-2期),而轻度至中度肾病(CKD 3期)或危重症(CKD 4-5期)分别占队列的43%和12%。
Figure GDA0002675196410008501
Figure GDA0002675196410008511
在大多数情况下,肿瘤局限于上尿路的单个部位(38%肾盂;39%输尿管),而同时影响肾盂和输尿管的多灶性肿瘤发生在23%的患者中。同期膀胱癌(在肾输尿管切除术之前3个月内被诊断)在38%的患者存在。从组织学上看,89%的肿瘤被分类为高级别,其中大多数归类为肌肉浸润性的(T2-T4,66%)。
突变分析-UTUC队列
对在来源于UTUC的尿液细胞可能发现的遗传异常执行三个单独的测试((图32、表29、表30、表31和图33))。首先,评估了在泌尿系统肿瘤中频繁改变的十个基因(CDKN2A、ERBB2、FGFR3、HRAS、KRAS、MET、MLL、PIK3CA、TP53和VHL)的选定外显子区域中的突变(Sfakianos等人,2015)。出于此目的,设计了一组特定的多重引物,其可以允许检测少至0.03%的尿液细胞中的突变(表40)。检测此类低突变体分数的能力是由于在每个引物中并入了分子条形码,从而极大减少了与大规模平行测序相关联的人为误差。其次,基于之前在UTUC经常发现TERT启动子突变的证据,评估了TERT启动子突变。使用单重PCR进行此分析,这是因为TERT启动子的异常高的GC含量使得它无法被包括在多重PCR设计中。第三,使用一种技术评估了非整倍性的程度,在所述技术中,使用单个PCR共扩增长散布核苷酸元件-1(L1反转录转座子)的亚家族的约38,000个成员。像其他人重复序列一样,L1反转录转座子通过反转录转座分散在整个基因组中,并且存在于全部39个非近端着丝粒常染色体臂上。
多重测定在来自UTUC患者的56个尿液细胞样品的36个中检测到了突变(64%,95%CI 51%至76%)(表29)。在10个靶基因中的9个中检测到总计57个突变(图34)。尿液细胞中的中值突变体等位基因频率(MAF)是5.6%,并且范围是0.3%至80%。最常改变的基因是TP53(57个突变的58%)和FGFR3(57个突变的16%)(表18)。来自健康个体的188个尿液细胞样品在所测定的10个基因的任一个中均没有可检测突变(100%特异性,CI 97.5%至100%)。
在来自UTUC患者的56个尿液细胞样品中,在16个中检测到了TERT启动子中的突变(29%,95%CI 18%至42%)(表30)。尿液细胞中的中值TERTMAF是2.22%,并且范围是0.59%至46.3%。在来自健康个体的188个尿液样品中,一个携带突变(TERT g.1295250C>T,其中MAF为0.39%)。在UTUC尿液细胞样品中,在三个位置检测到了突变:94%的突变位于hg1295228(67%)和hg1295250(28%),它们分别位于转录起始位点上游69和91bp。先前已证明这些位置参与TERT的适当转录调控。具体地,突变体等位基因募集了GABPA/B1转录因子,从而产生活性染色质的H3K4me2/3标记,并且逆转正常细胞中存在的表观遗传沉默。
UTUC队列中的马兜铃酸暴露
马兜铃酸的活化代谢物与嘌呤碱基中的环外氨基基团共价结合,优先选择dA,导致特征性的A>T颠换。为了确定队列中的个体是否已暴露于AA,使用质谱对肾皮质DNA加合物进行定量。除56名患者中的2名以外,其他全部具有可检测的马兜铃内酰胺(AL)-DNA加合物,其水平范围为每108个核苷酸0.4至68dA-AL加合物。此外,在尿液细胞中发现的TP53(18/32 A>T)和HRAS(2/2 A>T)的突变谱中高度呈现了与AA相关联的A>T签名突变(表30)。
UTUC队列中的非整倍性分析
来自UTUC患者的56个尿液细胞样品中,在22个中检测到了非整倍性(39%,95%CI28%至52%,表31和图33),但在来自健康个体的188个尿液细胞样品中均未检测到非整倍性。最常变化的臂是1q、7q、8q、17p和18q。这些臂中的一些携带众所周知的肿瘤致癌基因或抑制基因,这些基因已被证明在许多癌症中发生拷贝数改变(Vogelstein等人,2013)。
与原发性肿瘤的比较-UTUC队列
来自入选本研究的全部56名患者的肿瘤样品可用于比较,并使用与用于分析尿液细胞样品相同的三种测定进行研究。这种比较达到了两个目的。首先,它可以确定在尿液细胞中鉴定出的突变是否来源于同一患者的可用肿瘤标本。总计存在39例其中在尿液细胞中可鉴定出突变的UTUC病例。在这39例病例中的35例(90%)中,尿液样品中鉴定出的至少一个突变(表29和表30)也在对应的肿瘤DNA样品中鉴定出来(表32和表33)。当考虑到在尿液细胞中鉴定出的所有80个突变时,63个(79%)在对应的肿瘤样品中鉴定出来(表32和表33)。在这三种测定中的任一种中,尿液与肿瘤样品之间的差异可以通过以下事实来解释:尽管在临床上通常可见多于一个解剖学上不同的肿瘤,但每个患者只有一个肿瘤可以进入。另外,DNA仅从每个肿瘤的一片组织中提取,而肿瘤内异质性可能是造成某些差异的原因。
肿瘤数据有助于确定为什么来自UTUC患者的56个尿液细胞样品中,17个不含有可检测突变。原因可能是原发性肿瘤不携带基因组套中存在的突变,或者原发性肿瘤中确实含有这种突变,但是尿液样品中的赘生性细胞部分不够高以至于无法检测到。通过对原发性肿瘤样品的评估,发现在没有可检测到突变的17个尿液样品中,4个(24%)来自其肿瘤不包含所查询的突变中的任一个的患者(表32)。结论是,突变测试失败的主要原因是尿液中癌细胞的数量不足,并且这占17个失败中的13个(76%)。
存在22例在尿液细胞样品中观察到非整倍性的病例。总体而言,在尿液细胞中观察到的染色体获得或丢失中,96%也在原发性肿瘤中观察到(图35中的实例)。相反,存在34例在尿液细胞样品中未观察到非整倍性的病例。用相同测定对56个肿瘤的评估表明,除3个肿瘤以外,其他全部都是非整倍体,突变也是如此,非整倍性测试失败的主要原因是尿液细胞中的赘生性DNA的量不足。
组合的生物标记物-UTUC队列
存在两个可以限制基于遗传的生物标记物的敏感性的因素。首先,如果样品含有来自足够数量的待通过测定检测的赘生性细胞的DNA,则所述样品只能被评分为阳性。其次,赘生性细胞来源的肿瘤必须携带所查询的遗传改变。组合测定可以通过评估更多的遗传改变来增加敏感性,并且因此更有可能检测到肿瘤中存在的至少一个遗传改变。但是,临床样品中的突变通常以较低的等位基因频率存在(表29和表30),从而需要高覆盖每个被查询的碱基。以10,000x的覆盖率执行完整的外显子组测序将是非常昂贵的。在本研究中,仔细评估了11个基因(包括TERT)的选定区域,并分析了39个染色体臂的拷贝数。即使肿瘤在所评估的11个基因之一中不包含遗传改变,它仍可能仍然是非整倍体并且可以通过尿液细胞测定进行非整倍体检测。非整倍性检测的敏感性低于突变测定的敏感性。模拟表明,可靠的非整倍性检测需要包含最小1%的赘生性细胞的DNA,而通过本研究中使用的突变测定可以检测到少至0.03%的DNA模板中存在的突变。然而,具有相对高的赘生性细胞部分但在11个所查询的基因中不包含可检测突变的尿液细胞样品仍可借助于其非整倍性而被检测到,因为如上所述,此处研究的53/56个UTUC是非整倍体。另外,所查询的11个基因中的一些突变,诸如大的插入或缺失或复杂的变化,可能无法通过基于突变的测定检测到,但是具有这种不可检测的突变的样品在非整倍性测试中仍可以评分为阳性。
为了确定这些理论论据是否在实践中有所作为,使用组合方法(统称为UroSEEK)对生物标记物的性能进行了评估。如上所述,当单独使用时,十基因多重测定、TERT单重测定和非整倍性测定分别产生了64%、29%和39%的敏感性。没有TERT启动子突变的23个样品对于其他十个基因的一个中的突变的测试为阳性(图32中的维恩图)。相反,使用多重测定未检测到突变的3个样品对于TERT启动子突变评分为阳性(图32)。并且,3个没有任何可检测突变的尿液细胞样品对于非整倍性为阳性(图32)。因此,当三种测定一起使用时,并且任一测定的阳性结果足以将样品评分为阳性,敏感性上升至75%(95%CI 62.2%至84.6%)。来自健康个体的188个样品中,仅一个在UroSEEK测试中评分为阳性(特异性为99.5%,CI 97.5至100%)。
为了确定通过组合测定提供增加的敏感性的基础,评估了3名其尿液细胞样品表现出非整倍性但未携带可检测突变的患者的原发性肿瘤的数据。发现这3个肿瘤在11个所查询的基因中不包含任何突变,这解释了为什么当这些相同的测定应用于尿液细胞DNA时为阴性。如上所述,这三个肿瘤是非整倍体,因此提供了检测尿液细胞样品中这些拷贝数变化的机会。
与临床特征的相关性
癌症生物标记物应有利地能够在早期检测到肿瘤,从而能够在广泛转移之前通过手术移除病变。UroSEEK对早期和晚期肿瘤均敏感。它在19名Ta或T1期肿瘤患者中的15名(79%)以及37名T2-T4期肿瘤患者中的27名(73%)中评分为阳性。十年癌症特异性存活率表明,预期91%的T1期恶性肿瘤的UTUC患者可以通过手术治愈,而2、3或4期肿瘤患者分别只有78%、34%和0%的可以通过手术治愈。
UroSEEK的敏感性不依赖于肿瘤分期之外的各种临床参数,包括性别、CKD分期、肿瘤级别、肿瘤位置和发展UTUC的风险因素,这表明所述测定适用于评估多种患者群体。此外,在此队列中,UroSEEK比尿液细胞学检查敏感得多。有42例病例可进行细胞学检查,其中只有4例(9.5%)在细胞学上被诊断为癌。即使通过细胞学检查被评分为“疑似恶性肿瘤”的样品被认为是阳性的,敏感性也仅为26%(包括4个被评分为阳性和7个被评分为疑似)。UroSEEK检测了所有4例通过细胞学检查被评分为阳性的病例,7例被评分为疑似恶性肿瘤的病例中的5例,以及31个通过细胞学检查被评分为不确定或阴性的样品中的22个。
实施例6:通过扩增长散布核苷酸元件(LINE)对癌症患者中的非整倍性的检测
本实施例描述了一种用于基于扩增子的非整倍性检测的新方法。这种方法称为用于样品内非整倍性检测的WALDO,采用监督式机器学习,以检测癌症中经常存在的多个染色体臂中的微小变化。在本文中表明,与先前的方法相比,WALDO可以应用于以改进的敏感性和相当的特异性来鉴定染色体臂获得或丢失。此外,可以结合机器学习以进行全基因组非整倍性识别,其中根据样品的非整倍性状态对样品进行分类。本实施例报告了数千个样品的WALDO结果,这些样品包括十个不同肿瘤类型的组织以及癌症患者血浆的液体活检。当两个样品可用于比较时,WALDO可用于评估遗传相关性或查找LINE内的体细胞突变。因此,这种方法可用于提供体细胞突变负荷的估算,评估致癌物签名并检测微卫星不稳定性(图1)。
材料和方法
样品
本研究中评估了总计1,678个肿瘤。
Figure GDA0002675196410008571
Figure GDA0002675196410008581
附录中列出了每个组织病理学亚型的癌症数量。将肿瘤进行福尔马林固定及石蜡包埋(FFPE)。在所有情况下,都使用QIAsymphony(目录号937255)来纯化DNA。从176名健康个体的血液中纯化外周白细胞(WBC)。从566名健康个体和982名癌症患者中纯化血浆。分别使用Qiagen试剂盒编号(目录号1091063)和(目录号937255)从WBC和血浆中纯化DNA。本研究中使用的大多数血浆样品已经针对十二种常见突变基因中的一个的突变进行了独立评估。这些血浆样品中的突变体等位基因分数被用作其赘生性细胞含量的估计值。在参加本研究的所有个体均在其收治医院的机构审查委员会批准后提供了书面知情同意书。
Fast-SeqS
对于每个评估的DNA样品,FAST-SeqS用于通过单个引物对扩增约38,000个扩增子(Kinde等人,2012 PloS ONE 7:e41162)。在Illumina仪器(HiSeq 2500、HiSeq 4000或MiSeq)上执行大规模平行测序。在扩增过程中,引物5′端的简并碱基被用作分子条形码,以唯一地标记每个DNA模板分子,如其他地方所述(参见,例如Kinde等人,2011 Proceedingsof the National Academy of Sciences 108:9530-9535)。这确保了每个DNA模板分子仅被计数一次。在本文的所有情况下,术语“读长”是指唯一鉴定的读长。根据实验,每个读长被测序1与20次之间。对于每个WBC和肿瘤DNA样品,使用100,000至2500万个读长进行分析。对于每个血浆DNA样品,使用100,000至1500万个读长。正常DNA的复制样品包括在每个测序实验中,并用于评估随机和实验变异性。
样品比对和基因组区间分组
Bowtie2用于将读长与人类参考基因组组装GRC37比对。鉴定出与参考基因组的37,669个精确匹配(除性染色体外为33,844个)。这些精确匹配允许包含常见的多态性。多态性包括24,720个单核苷酸多态性(SNP)和1,500个插入和缺失(插入/缺失)多态性,其中在1000个基因组数据库中,较小的等位基因频率>1%(Consortium 2012 Nature 491:56-65)。
根据实验和随机变化,映射到任何整倍体样品的每个基因组区域的读长的数量预期可变化。为了使这种可变性最小化,鉴定了多个整倍体样品中在所有染色体上具有相似读长深度的500-kb基因组区间的簇。当不存在非整倍性时,此步骤允许估计样品中读长深度的预期可变性。测试了小于和大于500kb的基因组区间,并且发现500kb在下文描述的测定中以合理的计算费用产生了合理的性能。
500-kb基因组区间的聚类如下执行。将每个测试样品与具有相似扩增子大小的整倍体样品匹配。这样做是因为较小的扩增子将会在由扩增前具有小尺寸的DNA生成的扩增子中过量表达。FastSeqS产生的扩增子的大小范围在100到140bp之间(Kinde等人,2012PloS ONE 7:e41162)。血浆DNA的大小为140至180bp(Diehl等人,2005)Proceedings ofthe National Academy of Sciences of the United States of America 102:16368-16373;Chan等人,2004 Clinical chemistry 50:88-92;Jahr等人,2001 Cancer research61:1659-1665;以及Giacona等人,1998 Pancreas 17:89-97),因此,例如,与WBC DNA相比,最大的LINE扩增子在血浆DNA中将会大幅度降低表达。发现7个整倍体样品足以与任何测试样品进行比较;使用7个以上的整倍体样品基本上不会增加性能。这7个整倍体样品来源于正常个体的677个WBC或566个血浆DNA的集合,统称为“整倍体参考组”。对于每个测试样品p,选择与p的欧几里德距离最小的7个正常样品,定义为
Figure GDA0002675196410008601
其中,pn和qn是样品p和q中大小为n的扩增子的分数,并且总和是两个样品中所有扩增子大小的和。在计算整倍体参考组中的样品与测试样品之间的欧几里得距离之前,排除以下扩增子:(i)使用最大似然估计,按7个整倍体样品之间的方差对扩增子进行排序,并排除前1%。(ii)去除在一个样品中具有<10个读长,但在其他6个样品的任一个中具有>50个读长的任何扩增子。在每个样品中,通过减去平均值并除以每个样品中读长的标准偏差来缩放500-kb基因组区间。
然后按以下方式经缩放的500-kb基因组区间在7个所选的正常样品上聚类。首先,将每个500-kb基因组区间i分配给主要簇Ci。接下来,将所有样品中基因组区间i中的读长与其余21个常染色体上出现的所有其他基因组区间i′中的7个样品中的读长平均数量进行比较。在检索相似性期间,对不显著的结果(配对t检验p>0.05,f检验p>0.05)进行测试。如果基因组区间i’中的读长的平均数量与基因组区间i中的读长数量没有显著不同,则将它添加到簇Ci。对4361个基因组区间中的每一个重复此过程,得到4361个簇。每个区间i属于其主要簇,但相同区间也属于平均176个其他簇(190个代表性样品中100至252个簇的范围)。唯一簇的数量少于4361,因为一些簇由相同的500-kb基因组区间组成。在190个代表性样品中,唯一簇的数量通常为4310至4330。簇包含平均大约200个500-kb的基因组区间(参见图45)。经缩放读长不是随机分布的(参见图46A)。然而,每个簇中约200个基因组区间内的经缩放读长的分布遵循近似正态分布(图46B-C中的实例)。
鉴定测试样品中的染色体臂获得或丢失
WALDO使用如上所述7个整倍体样品,仅用于限定具有相似的扩增特性的基因组区间的簇。在WALDO中对于非整倍性的统计测试是基于测试样品内的读长分布的,并且独立于任何整倍体样品中的读长分布。对于测试样品,使用最大似然来估计由7个整倍体样品限定的4,361个簇的每个簇中的基因组区间的平均值μ和方差σ2,所述基因组区间基于扩增子长度进行选择以与其匹配。通过从簇中迭代地去除测试样品内的离群基因组区间来改进这些估计值的可靠性。包含少于10个基因组区间的簇不包括在分析中。对于每个簇,将符合标准min(2*CDF(μ,σi 2),2*(1-CDF(μ,σi 2))<0.01的任何500-kb基因组区间从所有簇中去除。接下来,通过最大似然重新估计每个簇的μ和方差σ2参数。重复两个步骤,直到没有离群基因组区间保留。然后估计臂上所有500-kb基因组区间的总读长的统计显著性。由于正态分布的随机变量之和也是正态分布的随机变量,因此计算很简单(参见图47)。对于每个染色体臂,计算
Figure GDA0002675196410008611
其中Ri是经缩放读长,并且I是臂上的簇的数量。Z得分是使用分位数函数
Figure GDA0002675196410008612
产生的。阳性Z得分>α代表获得,并且阴性Z得分<-α代表丢失,其中α是所选的显著性阈值。
臂水平等位基因失衡
来自1000个基因组的常见多态性(24,720个单核苷酸和1,500个插入/缺失,MAF>1%)被用作候选杂合位点。对于677个正常样品中的每一个,鉴定了可以肯定地称为杂合的和二倍体的多态性位点。多态性被定义为具有变体等位基因频率(VAF)(0.4<VAF<0.6)的那些,其中VAF=#非参考读长/总读长。在这些位点将VAF建模为取自正态分布的随机变量,其中μ=0.5;方差σ2可以通过作为读长深度的函数的最大似然来估计(图48)。为了确定测试样品中染色体臂上的等位基因是否失衡,鉴定存在两个等位基因且两个等位基因上的读长之和>25的多态性位点的子集。然后将观察到的VAF与正态分布进行比较,使用观察到的读长深度的预期方差,产生一个双侧P值。染色体臂上的所有p值都进行Z转换,并与加权Stouffer法组合,其中在每个位点观察到的读长深度用作其权重。用于此计算的式是
Figure GDA0002675196410008621
其中wi是在变体i的UID深度,Zi是变体i的Z得分,并且k是在染色体臂上观察到的变体的数量。如果所得的Z得分大于所选的统计显著性阈值α(单侧检验),则将染色体臂评分为具有等位基因失衡。
合成非整倍体样品的产生
选择来自63个假定为整倍体的样品的数据,每个样品至少含有900万个读数,并且每个样品均来源于正常WBC的DNA。通过将若干个染色体臂的读长添加到这些正常DNA样品的读长中(或从其中减去)来创建合成非整倍体样品。将来自1、5、10、15、20或25个随机选择的染色体臂的读长添加到每个样品中或从每个样品中减去。加法和减法被设计来代表范围在0.5%至10%的赘生性细胞部分,并得到精确地含有900万个读长的合成样品。均匀地添加或减去来自每个染色体臂的读长。例如,当对丢失的五个染色体臂进行建模时,每个染色体臂丢失的程度相同,因此我们没有将肿瘤异质性包括在模型中。此外,没有创建含有两个或更多个相同额外染色体臂的合成样品,诸如含有3p染色体的4个拷贝的合成细胞。这种简化的方法并未全面涵盖所有生物学上可能的非整倍性事件。但是,限制改变的臂的可能组合,使得样品的生成在计算上容易处理,并且所得的支持向量机在实践中运行良好。
其中仅添加或减去了单个染色体臂的读长的合成生成的样品使我们能够仅在所关注的单个染色体臂获得或丢失时估计WALDO的性能。其中5-25个染色体臂改变的合成组允许在来源于癌症的典型样品中评估WALDO的性能。如图37所示,大多数癌症具有多个染色体的获得或丢失。用于生成合成样品的算法在图49和图50中示出为伪代码。
全基因组非整倍性检测
训练了两类支持向量机(SVM;Cortes 1995 Machine learning 20:273-297),以分辨整倍体样品和其中添加或减去了5至25个染色体臂的读长的合成样品。训练组含有677个WBC阴性样品(假定为整倍体WBC,含有300万至1500万个读数)和3150个阳性样品,均为如上所述的合成样品。通过R中的e1071软件包使用径向基核和缺省参数来进行SVM训练(Meyer等人,2015 R package version:1.6-3)。每个样品具有39个Z得分特征,代表染色体臂获得或丢失。对677个合成样品进行随机采样,使得阴性和阳性类别的大小相当,并将其重复十次。每个待分类的样品均由所有10个SVM进行评分,并对10个得分取平均值以产生最终得分。
来自实验样品的数据的读长数量可以广泛地变化,尤其是当样品来源于DNA量有限的来源(诸如血浆)时。如果不考虑读长深度,则具有低读长的样品可以人为地产生高SVM得分。因此,通过将SVM得分的变化建模为正常样品中读长深度的函数来控制读长深度。具体地,对63个WBC整倍体样品中的每一个进行随机降采样,以产生读长深度范围为100,000至900万的较低读长整倍体样品的10个重复。使用10个SVM对所有降采样的整倍体样品进行评分,并对得分取平均值。对于在每个读长深度下的降采样的整倍体样品,此过程产生了630个SVM得分。通过在每个读长深度下找到具有最小SVM得分的样品并将相同深度的所有得分除以所述最小SVM得分,将所有得分转换为比率。每个深度的平均比率r作为增加的读长深度的函数而单调地降低(图51)。读长深度与SVM得分之间的关系使用以下方程建模(A=-7.076*10^-7和B=-1.946*10^-1)。原始SVM得分使用下式
Figure GDA0002675196410008631
通过除以比率r来进行校正。
为了将样品评分为非整倍体,首先确定样品中的任何单个染色体臂是否以统计学上显著的方式丢失或获得。单个染色体臂的统计学上显著的获得被定义为其Z得分>4σ高于在677个正常WBC样品中观察到的最大Z得分的一个染色体臂。类似地,单个染色体臂的统计学上显著的丢失被定义为其Z得分<-4σ低于在677个正常WBC样品中观察到的最小Z得分的一个染色体臂。对于其Z得分>4σ高于在677个正常WBC样品中观察到的最大Z得分的染色体臂,定义基于SNP的等位基因失衡。仅对在以这种方式定义时没有单个染色体臂获得或丢失的样品进行SVM分析。此过程的基本原理在于,SVM被设计来鉴定具有大量染色体臂获得或丢失但赘生性细胞部分相对较低的样品。SVM不被设计来检测具有>10%的赘生性细胞部分的样品中的非整倍性,所述样品可以通过评估其Z得分并与本段第一部分中描述的677个正常样本比较而容易地鉴定。
体细胞序列突变和微卫星不稳定性(MSI)
当可获得匹配的正常样品时,试图基于LINE扩增子序列和比对来检测体细胞单碱基取代(SBS)、插入和缺失(插入/缺失)突变。在此类情况下,使用了用于减少错误的分子条形码方法。对于SBS,仅考虑具有至少200个读长和50个唯一分子条形码的扩增子。对于插入/缺失,考虑在测序仪器上的至少两个簇中观察到的读长。SBS突变通过直接将来自测试样品的扩增子与来自匹配的正常样品的扩增子进行比较来鉴定,并且不需要与参考基因组的任何比对。排除在匹配的正常样品中读长少于50个的扩增子。体细胞SBS被定义为其中来自测试样品的至少5个读长与任何正常读长的区别在于正好一个核苷酸取代的一个突变。
以类似的方式识别插入/缺失。首先用Bowtie2将来自测试样品和匹配的正常样品中的扩增子与参考基因组(GRc37)进行比对(Langmead 2012 Nature Methods 9:357-359)。体细胞插入/缺失被定义为其中来自测试样品的至少10个读长由于相同的插入或缺失而与任何正常读长不同的一个突变。
通过计算>3个核苷酸的单核苷酸束中体细胞插入/缺失的数量来确定测试样品中的微卫星不稳定性。在所研究的LINE扩增子中存在17,488个这些单核苷酸束。预期单束中的体细胞插入/缺失在正常样品中可能很罕见。因此,计数的零分布可以建模为Poisson(λ=1),其中λ是正常样品中单束中体细胞插入/缺失的平均数量。如果体细胞插入/缺失的数量在统计上显著,则样品被识别为携带MSI。为了评估使用此过程将正常样品记为MSI的频率,将正常样品中的总读数随机分为两个相等的分区。第一分区用作参考样品,而第二分区用作测试样品。
样品匹配
为了将一个样品与另一个样品进行比较,首先用Bowtie2将扩增子与参考基因组GRC37进行比对。1000个基因组常见多态性被用于鉴定每个样品中26,220个位点的基因型。每个多态位点被称为“0”(纯合子参考,>0.95的与参考等位基因匹配的读长,最少10个读长)、“1”(杂合子,0.05-0.95的与参考或替代等位基因匹配的UID,每个等位基因的最少10个读长)或“2”(纯合子替代,>0.95的与替代等位基因匹配的UID,最少10个读长)。一致性被定义为在两个样品中相同的匹配的多态性位点(即,均为“0”、均为“1”或均为“2”)的数量除以在两个样品中具有足够覆盖的基因型的总数量。如果一致性>0.98,并且至少15,000个扩增子具有足够覆盖,则将两个样品视为匹配。
TCGA体细胞拷贝数改变
从Firehose下载了最新的癌症基因组图谱水平4体细胞拷贝数改变文件(Aggregate_AnalysisFeatures.Level_4.2016 012800.0.0),所述文件来自AffymetrixSNP6阵列的GISTIC分析(Beroukhim等人,2007 Proceedings of the National Academyof Sciences 104:20007-20012)。选择与我们的原发性肿瘤样品的队列匹配的9个TCGA肿瘤类型(乳腺浸润性癌(BRCA)、结肠腺癌(COAD)、结肠或直肠腺癌(COADREAD)、食道癌(ESCA)、头颈部鳞状细胞癌(HNSC)、肝细胞癌(LIHC)、卵巢浆液性囊腺癌(OV)、胰腺癌(PAAD)、胃腺癌(STAD)和子宫体子宫内膜癌(UCEC))。总计6276个样品可用(乳腺浸润性癌(BRCA):1081个,结肠腺癌、结肠或直肠腺癌(COAD;COADREAD):2755个,食道癌(ESCA):185个,头颈部鳞状细胞癌(HNSC):523个,肝细胞癌(LIHC):371个,卵巢浆液性囊腺癌(OV):580个,胰腺癌(PAAD):185,胃腺癌(STAD):442个,子宫体子宫内膜癌(UCEC):540个)。数据由GISTIC log2比率组成,代表每个染色体臂的获得或丢失(Mermel等人,2011 Genomebiology 12:R41)。比率>0.2或<0.2被认为是获得或丢失(Laddha等人,2014 Molecularcancer research 12:485-490)。
与检测单个染色体臂改变的现有技术的比较
计算了映射到677个WBC样品的每一个中的每个染色体臂的读长的比例及其平均值和标准偏差(Kinde等人,2011 Proceedings of the National Academy of Sciences108:9530-9535)。每个臂的得分计算如下:zi,chrN=(chrNichrN)/σchrN,其中chrNi代表所述染色体臂的归一化读长计数,并且μchrN和σchrN代表归一化读长计数的平均值和标准偏差。
结果
WALDO的统计原则
与用于评估拷贝数变化的最常规方法不同,WALDO不将测试样品中每个染色体臂的归一化读长计数与其他样品中的每个染色体臂的读长比例进行比较。此类常规比较会经受批次效应以及与难以控制的变量相关联的其他人为误差。为了评估全基因组测序数据,通过比较4361个基因组区间(每个含有500-kb的序列)内LINE的读长计数来检测非整倍性。仅将样品内的500-kb基因组区间内的读长计数与同一样品内其他基因组区间的读长计数进行比较-因此在WALDO中指定为“样品内”。
在整倍体样品中,每个500-kb基因组区间内的LINE读长的数量应与某些其他基因组区域中的读长的数量一起追踪。一起追踪的基因组区间之所以如此,是因为它们中的扩增子在相似程度上扩增。这里,此类一起追踪的基因组区域称为“簇”。可以鉴定来自整倍体样品的测序数据的簇。在测试样品中,确定每个预先限定的簇中每个基因组区间中的读长的数量是否在同一样品的其他簇的预期范围内。如果基因组区间内的读长超出了统计预期范围,并且同一染色体臂上存在许多此类超出者,则所述染色体臂被分类为非整倍体。在材料和方法中描述了这种测试的统计基础。简而言之,虽然每个LINE的读长的数量并非在整个基因组中随机分布,但每个簇内的经缩放读长的分布大致是正态的。正态分布的一个方便属性是多个正态分布的和也是正态分布。因此,通过将染色体臂上表示的所有簇的平均值和方差求和,可以简单地计算每个染色体臂上的总读长的理论平均值和方差。
WALDO还采用若干种其他创新使其可应用于分析临床样品中PCR生成的扩增子。这些创新中的一个是控制由于数据对初始模板大小的强烈依赖性而引起的扩增偏差。另一个是使用支持向量机(SVM)来使得能够检测含有低赘生性部分的样品中的非整倍性。WALDO的概念基础和统计基础在本文的“材料和方法”部分中详述。
对原发性肿瘤样品中染色体臂获得或丢失的评估
WALDO首先用于研究来自10个癌症类型的1,677个原发性肿瘤样品中的染色体臂获得或丢失。WALDO的输出中的一个是常染色体上的39个非近端着丝粒臂的每一个的z得分。表35中提供了本研究中评估的原发性肿瘤样品中的每一个中的这些染色体臂中的每一个的z得分。将这些结果与癌症基因组图谱(TCGA)在相同肿瘤类型的独立样品上获得的结果进行了比较(Zack等人,2013 Nature genetics 45:1134-1140;以及Beroukhim等人,2007 Proceedings of the National Academy of Sciences 104:20007-20012)。在我们的数据和TCGA中,鉴定了在每个染色体臂中具有获得或丢失的肿瘤样品的分数,一起考虑了所有肿瘤类型并且独立考虑了每种肿瘤类型。如图37的上半部分所示,示出了每个染色体臂在通过WALDO评分为获得或通过TCGA算法(GISTIC)评分为获得的所有癌症类型中的样品分数,并且具有丢失的样品分数在下半部分中示出。在本研究中评分的臂水平获得与TCGA中的臂水平获得之间的相关性在图39A中示出(R2=0=45),而臂水平丢失在图39B中示出(R2=0.39)。考虑到样品来自完全不同的患者,在两个数据集中获得和丢失的特定染色体臂非常相似。具有最多获得的染色体臂是1q、3q、7p、7q、8q和20q,并且在这些臂上观察到的丢失相对较少。具有最多丢失的是染色体臂是4p、4q、8p和18q,并且在这些臂上观察到的获得相对较少。具有最少获得或丢失的臂是10p、16p、19p和19q。
在具有足够数量的癌症可用于比较的那些情况下,对于许多特定肿瘤类型观察到高度相关性(参见下文和图40)。
Figure GDA0002675196410008681
胰腺癌和肝癌之间的相关性最高(分别为R2=0.70和R2=0.64)。此分析的一个有趣结果是,在大多数癌症病例中,大量染色体臂是非整倍体。每个癌症丢失或获得的染色体臂的中值数为14,其中四分位范围为5至22。这种大量用于下文描述的支持向量机的开发。
还评估了32个结肠良性肿瘤(结直肠腺瘤)。发现其中的25个表现出染色体的获得或丢失。每个良性肿瘤丢失或获得的染色体臂的中值数为4,其中四分位范围为1到9.75。尚未通过TCGA研究良性肿瘤,因此无法进行比较。然而,与结直肠癌的比较表明,良性肿瘤的染色体臂变化比在癌症中观察到的少得多。另外,腺瘤中改变的染色体臂与癌症中改变的染色体臂重叠,并且保留了变化的方向性(获得相对于丢失)。
WALDO还允许基于SNP和伴随测序的LINE来确定等位基因失衡。除通过500kb基因组区间中的读长数量所提供的量度之外,这提供了一个完全独立的染色体臂变化的量度。注意,等位基因失衡的测量值代表参考等位基因的读长数量相对于变异等位基因的读长数量的比率。无论是含有参考等位基因的染色体臂获得还是含有变异等位基因的臂丢失,此比率都将相同。然而,不希望受理论的束缚,预期在同一肿瘤中表现出等位基因失衡的染色体与表现出获得或丢失的染色体之间存在强烈的关系。发现63%的具有等位基因失衡的染色体臂在同一染色体臂上也具有显著的获得或丢失。本文描述了LINE内的SNP的其他用途。
接下来,比较了WALDO识别单个染色体臂获得或丢失的敏感性和特异性(参见材料和方法)。两种方法均应用于来自677个正常外周血白细胞(WBC)样品的LINE扩增子测序数据,其中每个WBC样品独立扩增并测序至9.5M读长的平均深度。此实验数据被24,570个具有单个染色体改变的合成样品增强(参见材料和方法)。敏感性计算为:正确鉴定的改变的臂的总数量除以合成样品中改变的臂的总数量。特异性计算为:1减去未正确识别的臂的总数量除以来自正常WBC样品的实验数据中正常臂的总数量。对于WALDO和先前方法,考虑了三个显著性阈值(±1.96、±3.0、±5.0)和三个赘生性细胞部分(1%、5%、10%)。对于所有阈值和赘生性细胞部分,WALDO具有更高的特异性和敏感性(见下文和表34)。
Figure GDA0002675196410008691
Figure GDA0002675196410008701
为了进一步评估WALDO检测单个染色体异常的能力,还对三体性21患者的DNA进行了评估。将来自三体性个体的DNA以2ng正常DNA和约0.2ng三体性21 DNA的比率进行物理混合。产生混合物以在无创产前检测中复制典型的胎儿分数(大约10%)。使用LINE扩增子中的多态性,估计样品的三体性掺和率(范围为7.7%至10.4%)。使用2.5的z阈值,发现少至2M的读长可以在通常观察到的胎儿分数下检测三体性21(敏感性95%)。然后在各种读长深度下对16个正常WBC进行采样。在使用相同阈值的2M读长下,特异性为100%。图41中总结了在三体性21样品的其他读长深度和其他掺和物下的敏感性和特异性。
具有低赘生性细胞DNA部分的样品中的非整倍性检测
非整倍性检测在癌症中的许多潜在应用涉及在来自正常细胞的大DNA池中鉴定相对较小部分的DNA。一种值得注意的应用是液体活检,即评估体液(诸如尿液、唾液、囊肿液或痰液)中癌症的迹象。鉴于非整倍性是几乎所有类型的癌症的一般特征(参见图37),因此检测非整倍性可用于此目的。
为了将WALDO用于液体活检,使用了一种两阶段方法。如上所述,第一阶段采用检索单一染色体臂获得或丢失或者等位基因失衡。用合成DNA进行的模拟表明,当赘生物细胞贡献的DNA部分是总DNA的>5%时,这种方法可以以敏感性>90%且特异性>99%检测单一染色体臂获得或丢失。为了检测具有较低的赘生性细胞DNA部分的样品中的非整倍性,利用了每个肿瘤的染色体臂获得或丢失的中值数量很高的事实(Kinde等人,2012 PloS ONE7:e41162)。因此,考虑了各种方法来区分具有多个染色体异常的含有低赘生性DNA部分的样品与整倍体样品。这些方法包括计数显著性臂的数量,组合最显著的臂的得分,以及对基于平方窗口(squared window)的Z得分求和。基于合成样品,发现使用支持向量机获得了最佳方法(在所测试的许多机器学习算法中)。支持向量机训练被设计来普遍适用于任何癌症类型,而不是基于特定癌症类型典型的获得或丢失模式。通过合成样品,支持向量机可以以99%的特异性检测78%的赘生性细胞部分为1%的样品中的非整倍性(如通过交叉验证所确定的)。因此,将这种基于支持向量机的算法合并到WALDO中,用于评估具有低赘生性组成的临床样品(见图38)。
然后使用WALDO试图评估961名癌症患者和566名健康个体的血浆样品中的非整倍性(参见材料和方法)。评估了8个不同类型的癌症(参见表36)。每个癌症样品的赘生性细胞部分被认为是由深度测序数据确定的突变体等位基因分数。将样品分为赘生性细胞部分>1%的样品(122个样品)、赘生性细胞部分在0.5%与1%之间的样品(96个样品)和赘生性细胞部分<0.5%的样品(738个样品)。敏感性被定义为被评分为非整倍体的癌症患者样品的比例,而特异性被定义为1减去被评分为非整倍体的健康患者样品的分数。这三个范围的赘生性部分的接受者操作特征曲线(ROC)在图38中示出。在严格的特异性(99%)下,在42%的赘生性细胞部分>1%的样品中鉴定出了非整倍性(参见图38A)。如预期的那样,敏感性随着赘生性细胞部分的降低而降低(参见图38B、38C)。在99%的特异性下,WALDO在24%的赘生性细胞部分为0.5%至1%的样品中和19%的赘生性细胞部分为0%至0.5%的样品中检测到了非整倍性。患者的特定癌症类型与阳性非整倍性识别不是高度相关的。然而,所评估的模板分子的数量确实与敏感性相关。
在具有较高赘生性细胞含量的血浆样品中,可以确定哪些染色体臂获得或丢失。在具有配对的原发性肿瘤的558个血浆样品中,188个样品具有显著的染色体臂获得或丢失,而54%具有一致的原发性中的获得或丢失。在低赘生性含量的样品中,单一的臂中没有一个在统计学显著的水平上获得或丢失,但是WALDO的支持向量机组件大概能够挑选出多个染色体臂中的微小偏差,使得将它们与整倍体样品区分开。
样品匹配
具有短串联重复序列的DNA分型是一种已经建立的法医技术,现已常规使用。还开发了精心筹备的SNP组套以确保样品同一性,诸如在同一患者的肿瘤与正常标本之间(Kidd等人,2006 Forensic science international 164:20-32;以及Pengelly等人,2013Genome medicine 5:89)。在FAST-SeqS中扩增的LINE含有26,220个常见多态性,包括在1000个基因组中检测到>1%的变体(Consortium 2012 Nature 491:56-65)。理论上,这些多态性提供了一种强大的方法来分型进行非整倍性评估的DNA样品,而无需任何额外的工作或成本。为了确定这种识别在实践中是否可行,设计了在任何两个样品之间的一致性的量度(请参见材料和方法)。然后,将这种用于测量一致性的方法用于176个正常WBC样品的重复样品彼此之间,每个样品使用约5个重复样品,总计676个WBC样品。WALDO的输入是676个样品,但未指定样品名称,因此总计456,976(676x676)个可能的匹配。WALDO正确地匹配了所有具有高一致性(>99.9%)的重复样品,没有任何错误匹配。接下来,对970个血浆样品和1,684个肿瘤样品执行此方案。558个血浆样品应与对应的原发性肿瘤样品匹配,并且不应观察到其他匹配。这产生了7,038,409((970+1,683)x(970+1,683))个可能的匹配。几乎所有2653个样品均如预期进行匹配,即仅与自身或对应的原发性肿瘤匹配,其中一致性>99.8%。然而,发现了2个血浆样品与预期的原发性肿瘤不匹配,并且发现了12个血浆样品与据称来源于不同供体的其他血浆样品匹配。在所有这些“不匹配的情况”中,FastSeqS数据指示高一致性(>99.8%)。因此,错配很可能是样品标签错误的结果,并说明了使用WALDO进行样品同一性检查的效用。
突变负荷、致癌特征、微卫星不稳定性
当可以从同一患者获得两个样品(正常样品和癌症样品)时,能够可想象地辨别一个样品中有LINE突变,而另一样品中没有。对于此应用,可以使用分子条形码来减少测序错误(参见例如,Kinde等人,2011 Proceedings of the National Academy of Sciences108:9530-9535),如通过WALDO的实验和生物信息学组件所实现的一样(参见材料和方法)。
为了确定体细胞突变检测是否可行,评估了来自同一患者的10个上尿路尿路上皮癌(UTUC)和正常组织。这些样品先前已通过外显子测序进行了分析(Hoang等人,2013Science translational medicine 5:197ra102-197ra102)。对于每个肿瘤样品,计数体细胞突变的数量以及单碱基取代(SBS)的谱(A->T、A->C等)。发现LINE中的SBS数量与这些肿瘤的外显子组中的SBS数量高度相关(R2=0.98,p<2.6*10-8)。LINE中的突变谱与外显子序列中的突变谱类似地相关(R2=0.95,p<1.8*10-6)。值得注意的是,这些肿瘤中的6个来自暴露于马兜铃酸的患者,并且在这6个肿瘤中此诱变剂的致癌签名(A->T、T->A)都占多数(参见图42、图43和图44)。
由WALDO评估的LINE携带17488个>3个核苷酸的单核苷酸束。由于单核苷酸束对错配修复中的缺陷特别敏感,因此确定了WALDO是否可用于评估错配修复缺陷。出于此目的,评估了17488个LINE单核苷酸束中插入/缺失的数量。发现六种错配修复缺陷的结直肠癌中插入/缺失的数量平均为35,并且范围为10至67。这些患者的正常组织仅携带0或1个插入/缺失,并且癌症与正常组织之间的差异高度显著(p<7.2*10-4)。
实施例7:通过瓶颈测序对罕见突变进行的全基因组定量
核和线粒体基因组中随机体细胞突变随着时间的推移的积累是癌变、神经退行性变和衰老的基本理论的基础(参见例如,Stratton等人,2009 Nature 458:719-724;Kennedy等人,2012 Mech Ageing Dev 133:118-126;以及Vijg等人,2014 Currentopinion in genetics&development 26:141-149)。因此,对人体中随着年龄的增长的这些罕见的突变的直接观察可能会增强我们对人类疾病的了解。目前,不存在简单的高通量方法可以以全基因组范围水平直接并系统地定量正常的未患病的人体组织中的体细胞突变负荷。下一代DNA测序(NGS)技术解决了这个问题,但是它们的测序错误率限制了对罕见突变的检测(参见例如,Albertini等人,1990 Annu Rev Genet 24:305-326;以及Cole等人,1994 Mutat Res 304:33-105)。
本实施例描述一种瓶颈测序系统(BotSeqS)技术,其被设计来以一种完全无偏的方式在任何在分子上带条形码的文库中精确地检测罕见点突变。BotSeqS,一种下一代测序方法,其可同时定量整个线粒体和核基因组中罕见的体细胞点突变。BotSeqS在即将进行文库扩增之前将分子条形码技术与简单的稀释步骤组合。在本实施例中,BotSeqS用于示出罕见突变的年龄和组织依赖性的积累,并证明正常组织中的体细胞突变负担可能会变化几个数量级,这取决于生物和环境因素。本实施例还示出了正常组织中线粒体与核基因组的突变模式之间的主要差异。最后,正常组织的突变谱彼此不相同,但与它们中产生的癌症的突变谱相似。这种技术可以洞悉正常组织中遗传改变的数量和性质,并可以用于解决关于患病组织的基因组的各种基本问题。
材料和方法
人组织样品
从五种不同来源获取本研究的正常的未患病的组织(表43)。对于COL229至COL237和SIN230,在其机构审查委员会的批准下从约翰霍普金斯医院的知情患者获得结肠或十二指肠。对于COL373至COL375和BRA01至BRA09,NIH NeuroBioBank(neurobiobank.nih.gov)请求进行速冻的死后结肠和大脑的研究,所述请求由马里兰大学大脑和组织库(Baltimore,Maryland)和迈阿密大学大脑捐赠库(Miami,Florida)批准并实现。对于KID034至KID038,从Windber研究所(Windber,Pennsylvania)购买速冻的死后肾皮质块(200mg)。COL238和COL239如其他地方所报道(参见例如,Parsons等人,1995 Science 268:738-740;Hamilton等人,1995 The New England journal of medicine 332:839-847;以及De Vos等人,2004 American journal of human genetics 74:954-964)。SA_117、SA_118、SA_119、AA_105、AA_124和AA_126如其他地方所报道(参见例如,Hoang等人,2013Science translational medicine 5:197ra102)。结肠和大脑样品大小的初始基本原理是在每个年龄组中获取至少三个个体,以便了解每个年龄组的体细胞突变模式的平均趋势。基于人体的生长和维持来选择结肠和大脑的年龄组:<10岁的早期身体发育,约20-40岁的完全成年的青年身体,以及>90岁的维持的老年身体。对于结肠,来自幼儿年龄组的1个组织(SIN230)之后被确定是十二指肠,仅剩下2个代表幼儿年龄组的肠上皮的个体。对于正常的肾脏,获取肾脏的标准是吸烟者和暴露于马兜铃酸的样品的肾脏的年龄匹配的且不吸烟的对照组。所有正常的肾脏对照都是白种人,并且因此不太可能来源于高风险的AA暴露群体(例如,亚洲)。从相同的肾脏组织来源,三个等份的速冻的死后正常肾脏可从五个月大的个体获得作为技术重复样品,并且可用于进一步测试未暴露于致癌物的正常肾脏的年龄趋势。
Illumina Y衔接子连接的分子的制备
使用BioRuptor(Diagenode)将55μL TE缓冲液中的基因组DNA(34ng至1μg)以高强度进行片段化,在3℃下使用7个循环,开启15s和关闭90s。随机片段化之后,根据标准的低DNA输入Illumina方案并选择350bp插入片段大小,使用TruSeq DNA PCR-Free试剂盒(Illumina)将Illumina Y衔接子连接至DNA片段。这导致总体积为20uL的衔接子连接的分子。
Y-衔接子连接的分子的稀释
在96孔PCR板中执行五次十倍系列稀释,以在18μL稀释缓冲液(含有1ng/μLpBlueScript的TE)中的2μL衔接子连接的分子(PCR之前)开始。通过用多通道移液管轻轻移液来混合样品。然后使用多通道移液管将每个样品2μL转移到18μL新鲜稀释缓冲液中。重复混合和转移,进行总计五次系列稀释。仅使用每个稀释液2μL(总体积的1/10)作为每个PCR的模板。103倍的稀释如下完成:(i)在总计20μL的衔接子连接的分子中使用2μL(10倍稀释);(ii)将2μL衔接子连接的分子与稀释缓冲液在20μL的总体积中混合(10倍稀释);(iii)在PCR反应中在总计20μL体积中使用2μL稀释的衔接子连接的分子(10倍稀释,参见下文)。这五个系列稀释导致了103、104、105、106和107最终稀释因子。
稀释的Y衔接子连接的分子的PCR扩增
设计了定制的HPLC纯化的PCR引物(IDT),TS-PCR Oligo1(5’-AATGATACGGCGACCACCGAG*A;SEQ ID NO:808)和TS-PCR Oligo2(5’-CAAGCAGAAGACGGCATACGA*G;SEQ ID NO:809),在3′末端带有一个硫代磷酸酯键(*)。使用0.5μM TS-PCR Oligo1、0.5μM TS-PCR Oligo2、Q52X HotStart高保真预混液(NEB)(终浓度为1X)和2μL稀释的衔接子连接的分子作为模板在50μL的总体积执行PCR。PCR在ThermoHyBaid PCR Express HBPX热循环仪中执行。使用以下PCR程序:1)98℃持续30s,2)98℃持续10s、69℃持续30s、72℃持续30s进行18个循环,以及3)72摄氏度持续2分钟。按照制造商的方案,使用AMPure XP(Agilent)以1.0X的珠子与样品比来纯化PCR反应。
MiSeq运行和分析
在Illumina MiSeq仪器上评估了扩增的BotSeqS测序文库的子集(每个文库约5M个簇通过过滤器)以凭经验推导出最佳稀释度。当按HiSeq仪器的1/2泳道缩放时,“最佳稀释度”被确定为每个分子产生5到10个PCR复制品(在快速运行模式下,每个文库约70M个簇通过过滤器)。例如,对于将500ng gDNA输入到TruSeq PCR-free文库制备物中(选择350bp插入片段大小),将来自104、105、106倍稀释度的扩增文库以2x50bp的深度在MiSeq上进行测序。在一个MiSeq泳道中将3个不同的条形码良好的样品(其也是在分子上带条形码的)多重化,以测试每个样品的三个稀释度。.bam输出文件已上传到Galaxy,并且使用缺省参数执行Picard的估计文库复杂度工具(Galaxy工具版本1.56.0)。最佳稀释度表明每个家族的分布范围为1至4个成员,其中单例占总计数的约60%-80%。总体来讲,在将500ng gDNA输入到TruSeq PCR-free文库制备物中的情况下,在随后的用于BotSeqS的HiSeq运行中,105倍稀释度产生每个家族约10个成员。根据我们的测序数据,我们估计鉴定结肠组织中一个罕见突变所需的高质量簇的平均数量(1)对于正常儿童为30M,(2)对于正常青年为12M,并且(3)对于正常老年为5.8M。
全基因组测序
由本研究中的34个个体产生了32个全基因组测序(WGS)文库。在没有WGS的其余两个个体中,COL238和COL239,执行Sanger测序以排除BotSeqS数据中的克隆变体。在用于制备BotSeqS文库的最终20μL的衔接子连接的分子中(稀释之前),将10μL用于根据TruSeqPCR方案使用TruSeq PCR引物混合物(Illumina)和TruSeq PCR预混液(Illumina)来扩增文库,用于全基因组测序。根据制造商的说明,使用AMPure XP(Agilent)以1.0X的珠子与样品比来纯化PCR反应。文库是在Illumina HiSeq上以>30x的覆盖率测序2x100bp的PE。
加标(Spike-in)敏感性实验
由正常脾脏样品PEN93和PEN95的DNA制备两种DNA混合物。可从这两个样品获得全基因组序列数据(参见例如,Jiao等人,2011 Science 331:1199-1203),并且可以在PEN93中鉴定出PEN95中不存在的SNP。两种混合物都含有相同量的PEN95 DNA,但低加标混合物仅包含高加标混合物中所含的PEN93 DNA的10%。首先使用正常的BotSeqS管道分析来自这些样品的BotSeqS文库,以最小化克隆和种系突变。实际上,在两个文库中仅检测到总计2个突变;这2个突变可能代表了PEN95样品中的罕见突变,并且表明突变频率为约8x10-7个突变/bp。接下来,通过BotSeqS管道处理数据,而没有滤除dbSNP(构造130和142)中存在的突变。在低加标混合物中鉴定出7个PEN93特异性SNP,并且在高加标混合物中鉴定出89个PEN93特异性SNP。在对测序碱基的数量进行归一化后,低加标样品的“突变频率”(PEN93特异性SNP的数量/bp)为2.71x10-6,并且高加标样品为2.01x10-5。考虑到低加标样品中鉴定出的突变数量相对较少,低加标与高加标之间的差异为7.4倍,在10倍稀释度的预期范围内。
BotSeqS特异性的表征
作为特异性的一种量度,我们像往常一样鉴定了罕见突变,不同的是我们使用了仅存在于一条链而不是两条链中的突变。具体地,在≥90%的Watson家族成员中存在突变,而在≥90%的Crick家族成员中存在参考序列,或者反之亦然,但满足我们的作为“罕见”的其他标准。然后创建错误的Watson和Crick配对,其中Watson链与Crick链具有重叠但不同的坐标,并且反之亦然,以确定它们是否碰巧含有相同的突变。BotSeqS的工作原理是在瓶颈稀释步骤中产生的整个基因组覆盖率较低,并且无法在核DNA进行此分析。相反,使用mtDNA,因为每个细胞都有多个mtDNA拷贝。BotSeqS对mtDNA的覆盖率远高于核DNA,并有助于鉴定重叠分子。以这种方式处理了30个BotSeqS对照文库,并且总计146个mtDNA突变被鉴定仅在一条链中存在。使用此数据集,然后在每个样品中见多重叠的分子并鉴定出27个实例。27个错误的Watson和Crick对中没有一个共享相同的人为突变。
非随机剪切可能会产生另一种类型的人为误差,这错误地表明一个家族的Watson和Crick链实际上来源于两个巧合地具有相同基因组坐标的不同分子。为了测试此类认为误差,Watson和Crick家族对被鉴定为在Watson链中含有变体并且在Crick链中含有参考序列,或者反之亦然,但这一次包括杂合种系变体,而不仅仅是罕见变体,并且是在核DNA中,而不是在mtDNA中。核DNA中的杂合变体比mtDNA中多得多,因为mtDNA仅来源于卵母细胞。来源于不同模板分子-即非随机剪切的Watson链与Crick链的错配的结果可能会引起所关注的不一致性。替代地,不一致性可能是由于早期PCR循环期间两条链的一个中的扩增错误。使用我们的WGS数据,我们首先鉴定了在用于对照BotSeqS文库的30个DNA样品中观察到的8,535,891个核杂合变体(每个文库中值为268,180个变体,范围为121,851至529,922,其中许多文库中存在相同的常见变体)。从8,535,891个核杂合变体中,我们鉴定了其中两条链都可以评估的总计3,960,818个家族(每个文库中值为123,134个家族,范围为65,832至222,135)。其中,3,960,807个家族在两条链中的变体位置具有一致的序列;仅11个杂合变体不一致(即,在≥90%的Watson家族成员中存在变体,而在≥90%的Crick家族成员中存在参考序列,或者反之亦然)。因此,种系杂合变体不一致率为每bp 2.78x10-6个(3,960,818个中的11个)。这个比率与高保真DNA聚合酶的已知错误率兼容,并且可以很容易地代表在第一个PCR循环期间两条链的一条中发生的扩增错误,因此代表对剪切人为误差的高估。此外,重要的是要注意,BotSeqS通过要求在两条链上均观察到突变消除了此类扩增错误。因为BotSeqS要求在两条链上均观察到突变,所以实际的假阳性率可以估计为~(1/3)(2.78x10-6)(2.78x10-6)=2.58x10-12
BotSeqS变化和分子表的生成
使用与GRCh37/hg19人参考基因组匹配的ELANDv2通过Illumina二级分析软件包(CASAVA 1.8)执行序列比对和变体识别。仅当高质量读长满足以下所有标准时,才会被选择进行进一步分析:(i)通过纯净度过滤器,(ii)映射在适当的配对中的读长,(iii)与参考序列≤5个错配,并且(iv)在每个读长的前5个碱基和后5个碱基内与参考序列的完美同一性。基于相同的双端测序内源条形码,将测序读长分为多个家族。将家族成员进一步细分为两个可能的测序方向,以确定Watson和Crick来源的家族成员的数量。Watson和Crick家族具有相同的基因组座标,其中每个末端以相对的读长进行测序。将一个家族内相同变化的质量得分计算为家庭成员之间的平均值。每个BotSeqS文库的输出是两个带注释的变化和模板分子的表(即,家族)。
对高质量变化和分子的选择
在Microsoft SQL Server Management Studio中编写自定义算法,以查询每个BotSeqS文库的变化和分子表。表44-表48详述了选择标准。总体来讲,选择基于单碱基对取代的质量、克隆性和可映射性。例如,已知所有短读长比对和变体识别器所面对的主要错误来源之一是当变体映射到基因组中的重复区域(包括低复杂度区域和拷贝数变体)时出现的人为误差(参见例如,Li等人,2014 Bioinformatics 30:2843-2851)。BotSeqS管道通过滤除重复DNA和结构变体的基因组噪声(在表48中详述),消除了下游步骤中的这种普遍错误。插入/缺失被排除在外,因为它们容易产生比对人为误差,并且频率比自发点突变低约10倍。高质量的单碱基取代被定义为在Watson和Crick链中平均质量得分(在家族内)≥Q30,且读长均≥2,且突变分数≥90%的那些。如果变体位置存在于来自所述样品的WGS数据中或在>1个模板分子(即,多于一个UID的两条链)中观察到,则认为变体是克隆的。dbSNP130或dbSNP142中存在的任何位置也被排除在外。注意到,dbSNP过滤使重复测序或映射人为误差和高度可变区域极大地最小化。例如,均聚物束(≥8bp)是在突变列表大量存在的突变热点。观察到几乎所有都用dbSNP142滤除。最后,将携带>1个突变的家族排除为可能的映射人为误差。
突变频率的计算
通过将罕见突变的总数除以所测序的总bp来确定每个BotSeqS文库的突变频率(参见表51)。所测序的总bp由家族数量x2x每个家族的读长长度来定义。文库的平均长度为约500bp,使得100bp的双端测序读长不太可能重叠。仅考虑与在每个读长的前5bp和最后5bp中与参考序列具有完美同一性的模板。通过排除第6和第7个循环来进一步修剪读长,以确保质量。因此,实际读长长度为88个碱基(100-7-5=88)。对于从其中生成技术复制品BotSeqS文库的样品,技术复制品的平均突变频率被认为是样品的突变频率。
体细胞突变的验证
来自核和mtDNA基因组的所有罕见突变均通过目视检查测序读长。对于罕见的核突变,对代表组(876个突变中的514个)执行Sanger测序。其中,514个中的514个(100%)被证实通过Sanger测序是不可见的(排除了不具有匹配的WGS的COL238和COL239样品)。这证明这些突变既不存在于种系中也不以高度克隆的方式存在。表50中说明了Sanger测序时证实不存在的突变。
与癌症基因组的比较
代表来自19个TCGA肿瘤类型的核体细胞突变的19个MAF文件从synapse.org/#!Synapse:syn1729383下载(参见例如,Kandoth等人,2013 Nature 502:333-339)。从TCGA数据中,仅考虑单碱基取代,并且排除了超突变肿瘤的体细胞突变。来结直肠和肾脏肿瘤的线粒体DNA体细胞突变来源于Ju等人(2014 eLife 3)的补充文件2。
统计学
对于研究设计,由于方差最初是未知的,因此未执行先前的功效分析或随机化。本研究的目标是发现队列之间的主要的生物学意义的差异。为了发现主要差异,样品大小可以很小。然而,即使样品大小很小,也没有发现违反检验假设的情况,包括违反方差齐性的情况。使用GraphPad Prism 5.0f执行T检验和ANOVA分析。Fisher的精确测试使用R版本3.2.2来执行。主成分分析在R中执行。所有分析的样品均记录在手稿中。
结果
BotSeqS的潜在原则
BotSeqS的主要特征是在PCR扩增之前稀释任何类型的测序文库。这种稀释会产生瓶颈,并允许以最少的测序量对双链模板分子进行高效随机的采样。罕见突变,正常将会被常规文库中的大量野生型序列掩盖,它们在瓶颈文库中对应的基因组位置占据更多的信号。稀释还增加了将对DNA分子的“Watson”和“Crick”链进行冗余测序的可能性,是对于BotSeqS的高准确性和实施BotSeqS所需的相对较少的测序量至关重要的特征。在两条链上存在相同的罕见突变可大幅减少人为误差并增加特异性(参见例如,Schmitt等人,2012PNAS USA 109:14508-14513)。最后,稀释的随机性允许从一个文库评估来自核和线粒体基因组两者的DNA分子。
BotSeqS文库的生成
使用标准的Illumina TruSeq PCR-Free试剂盒从34个个体的正常组织中生成44个BotSeqS文库(表43)。这包括9个个体,其中1到2个技术重复。此外,我们的12个队列中,10个具有多于一个的生物重复,每个重复含有2至6个个体。
BotSeqS文库的制备以基因组DNA的随机剪切开始(图52)。这使基因组片段化为可变大小的DNA分子,每个拥有唯一的末端坐标,称为内源条形码(参见例如,Kinde等人,2011PNAS USA 108:9530-9535)。在将标准测序衔接子与DNA分子连接后,将文库稀释以减少群体中分子的数量。为了鉴定正确的稀释因子,在MiSeq仪器上评估了十倍稀释系列(图53)。稀释之后,文库的PCR扩增产生每个DNA分子的多个拷贝(重复)。内源条形码使测序读长分组成唯一标识符的家族,也称为UID(参见例如,Kinde等人,2011 PNAS USA 108:9530-9535);每个家族代表单链模板的PCR来源的子代,并且家族的每个成员代表Illumina仪器上单个簇的序列。在下文中,我们将Watson链视为来源于测序仪器的第一读长(Illumina衔接子P5)的序列,而将Crick链视为来源于所述家族的每个成员的第二读长(Illumina衔接子P7)的序列(图52)。为了被视为潜在的突变,BotSeqS要求在≥90%的Watson和≥90%的Crick家族成员中观察到相同的序列变化,并且每个家族由至少两个成员组成。使用Illumina HiSeq 2500仪器在快速运行模式下分析BotSeqS文库,其中双端测序读长各自具有100个碱基。每个文库的中值为7千万(70M)个簇通过标准Illumina质量过滤器(范围为每个文库37至188M个簇;表43)。
BotSeqS数据处理管道
BotSeqS管道的目标是准确鉴定罕见的体细胞点突变,并计算样品中这些突变的频率。为了出于此目的处理数据,将原始测序数据输入到Illumina的二级分析软件包(CASAVA 1.8)中,其中ELANDv2映射到GRCh37/hg19人参考基因组。BotSeqS管道首先选择高质量读长进行分析(参见材料和方法)。然后,将每个BotSeqS文库的数据组织成两个表:(i)列出与参考序列的所有差异的“变化”表,以及(ii)列出所有家族的唯一分子表。重要的是,每个表都含有链信息;每个BotSeqS文库中几乎一半(中值45%,范围为8%至62%)的唯一分子具有数据集中呈现的Watson和Crick链,从而确保后续突变分析的特异性。此外,大多数BotSeqS文库(44个中的37个)的家族成员的中值数量在5与20个之间(图56),这进一步证明所述文库经历了成功的瓶颈效应。
为了鉴定罕见的体细胞突变,有必要从BotSeqS数据中消除种系变体和克隆变体(我们将克隆变体定义为多于一个模板分子的两条链中存在的那些克隆变体)。在本研究中,我们对34个个体中的32个执行了相同的DNA样品或相同的文库(已针对BotSeqS进行了稀释)的全基因组测序(WGS)(表43)。对于其余两个个体(COL238和COL239),执行Sanger测序来消除克隆变体,这证明WGS对于BotSeqS不是必需的。发现绝大多数(中值92%,范围为88%-94%)变体是种系的,可以从匹配的WGS数据集中轻松鉴定出。除了克隆性之外,我们还通过仅考虑良好映射的位置以及通过使用其他过滤器来消除潜在的人为误差(表44-表48以及材料与方法)。确实有必要要求两条链上都存在突变,因为在没有此过滤器的情况下,存在大量的G>T颠换(图57),其已知代表NGS文库制备物中的人为误差(参见例如,Costello等人,2013 Nucleic acids research 41:e67)。通过将一个个体的正常DNA(PEN93)以两种不同的比率混合到另一个个体的正常DNA(PEN95)中,进一步执行“加标”验证实验。使用BotSeqS,可以检测两个样品中的PEN93特异性SNP,其中低加标与高加标之间的频率差异为7.4倍,在预期的10倍差异的预期误差内(参见材料和方法)。
从44个BotSeqS文库中,分别在mtDNA和核DNA中鉴定出总计666个和876个罕见的体细胞点突变(表49和表50)。所有罕见突变均通过目视检查,并对一个子集进行Sanger测序,以证实所述突变在所评估样品中不是种系的或高度流行的(参见材料和方法)。如先前研究所预期的,mtDNA的点突变频率(1.40±1.29x10-5个突变/bp,平均值±标准偏差)显著高于25个对照个体中的核DNA的点突变频率(5.23±3.47x10-7)(双尾t检验,P<0.0001;表51)。BotSeqS的特异性通过不一致的种系杂合识别进一步确定,以估计假阳性率为2.58x10-12(参见材料和方法)。
突变频率随DNA修复能力和致癌物暴露而变化
首先要问的是,BotSeqS是否可以检测到错配修复缺陷个体的正常组织中升高水平的突变。在错配修复机制中具有双等位基因失活种系突变的个体在正常组织和肿瘤组织中均示出较高水平的突变(参见例如,Parsons等,1995 Science 268:738-740;以及Shlien等人,2015 Nature genetics 47:257-262)。因此,从在减数分裂后分离2(PMS2)基因中具有双等位基因种系失活突变的个体的正常结肠上皮(COL238和COL239)中检测了DNA。使用BotSeqS,发现这两个同胞中核DNA的平均突变频率(6.63±3.47x10-5个突变/bp;年龄16和18岁)显著高于具有熟练的错配修复的相似年龄的个体中的平均突变频率(5.13±1.73x10-7对于COL235、COL236、COL237、COL374;平均年龄24岁)(双尾t检验,P<0.05,图53a)。这种核突变频率的129倍的增加与PMS2+/+和PMS2-/-队列之间的核突变谱的显著差异相关联(Fisher精确检验,P=0.04,图53b)。
还测试了BotSeqS是否可以鉴定暴露于环境致癌物的个体的正常组织中的大量突变。先前执行了上尿路尿路上皮癌的全基因组测序,代表与暴露于马兜铃酸(AA)或吸烟相关联的癌症类型(参见例如,Hoang等人,2013 Science translational medicine 5:197ra102)。烟草烟雾中的诱变剂以及AA在正常肾皮质中被代谢形成DNA加合物(参见例如,Hoang等人,2013 Science translational medicine 5:197ra102;以及Randerath等人,1989 Journal of the National Cancer Institute 81:341-347)。将来自已知未暴露于烟草烟雾或AA的个体(KID034、KID035、KID036、KID037;平均年龄64岁)的4个年龄匹配的正常肾皮质与3个重度吸烟者(SA_117、SA_118、SA_119;平均年龄65岁)以及3个已暴露于AA的个体(AA_105、AA_124、AA_126;平均年龄79岁)的正常肾皮质进行比较。吸烟者和AA暴露的肾脏中的核点突变频率分别显著比未暴露的对照高27倍和36倍(采用Bonferroni多重比较后检验的单因素方差分析,对于AA,P<0.0001,并且对于吸烟,P<0.001)(图53a)。核基因组中这种突变数量的增加与显著改变的核突变谱相关联(采用Bonferroni多重比较校正的Fisher精确检验,对于AA,P=2.58x10-8,并且对于吸烟,P=1.51x10-15)(图53b)。有趣的是,尽管未暴露组与暴露组的核基因组存在明显差异,但它们之间的mtDNA点突变频率和谱没有显著差异(图53a、b)。
随着年龄增长积累的罕见突变
许多证据表明,人体随着年龄的增长积累随机突变。BotSeqS被设计来直接测量诸如此类的差异,并且我们测试了3个正常人体组织的DNA中的罕见点突变频率是否取决于年龄。来自11个个体的正常结肠上皮示出随着年龄的增长显著增加的突变频率,在91年中在mtDNA中平均增加30倍,并且在核DNA中平均增加6.1倍(参见下文和图54;采用Bonferroni多重比较后检验的单因素方差分析,两者的P<0.001)。类似地,在正常肾皮质中,突变频率在64年中在mtDNA中平均增加19倍,并且在核DNA中平均增加6.5倍。在90年中,大脑额叶皮质中的突变频率也随着年龄的增长显著增加,虽然更缓慢,但在90年中在mtDNA中增加7.3倍,并且在核DNA中增加5.7倍(采用Bonferroni多重比较后检验的单因素方差分析,对于mtDNA,P<0.001,并且对于核,P<0.05)。
正常人体组织中罕见突变频率的总结
Figure GDA0002675196410008861
nd,未确定
在数据集中,可以直接比较三个不同年龄组(儿童<10岁;青年在20与40岁之间;并且老年≥90岁)中大脑与结肠组织中的点突变频率。有趣的是,在儿童中,结肠中的核突变频率与大脑中的核突变频率没有显著差异(结肠中为1.81±0.45x10-7,而大脑中为1.06±0.27x10-7,采用Bonferroni多重比较后检验的两因素方差分析,P>0.05)。但是,在青年中,结肠中的突变频率显著高于大脑中的突变频率(结肠中为5.51±1.62x10-7,而大脑中为2.16±1.11x10-7,采用Bonferroni多重比较后检验的两因素方差分析,P<0.05),以及在老年中也是如此(结肠中为1.10±0.15x10-6,而大脑中为6.29±2.31x10-7,采用Bonferroni多重比较后检验的两因素方差分析,P<0.01)(图58)。在相对年轻的个体(儿童或青年)中,在结肠的mtDNA突变频率与大脑的mtDNA突变频率之间没有发现显著差异。然而,在老年个体中,结肠中的mtDNA突变频率显著高于的大脑的mtDNA突变频率(结肠中为3.65±1.03x10-5,而大脑中为1.31±0.18x10-5,采用Bonferroni多重比较后检验的两因素方差分析,P<0.0001)(图58)。
mtDNA中的突变模式与核DNA中的突变模式有很大不同
检查每个所研究的正常组织中的罕见点突变的谱。如根据先前研究所预期的,mtDNA中的突变以具有重链偏置的转换为主(结肠中97%,肾中89%,并且大脑中91%)12(图54和表49)。在所有三个组织中,mtDNA中的转换与颠换之比(平均15.3)与核DNA(平均1.1)相比明显不同。
为了进一步评估两个基因组之间突变频率的差异,我们计算了每个个体的mtDNA与核突变频率之间的比率(表51)。mtDNA中的点突变频率平均比正常组织中的核基因组高24.5倍(对照队列,图59)。在具有暴露史或DNA修复缺陷的患者中,所述比率显著更小,因为与对照队列相比,此类个体的核(而非线粒体)DNA突变数量伴随地更大(采用Bonferroni多重比较后检验的单因素方差分析,P<0.05)(图59)。
突变谱是组织特异性的
尽管mtDNA中罕见突变占主导,但仍然存在组织特异性的mtDNA差异,这可以从图3的饼图中看出。例如,与正常肾脏组织(分别为36%和53%)相比,在正常结肠(分别为54%和42%)和大脑(分别为51%和40%)中线粒体C:G至T:A转换更为主导,其次是A:T至G:C转换。所有三个组织的核DNA中的突变谱都更加多样化。例如,C:G至T:A转换在正常结肠中占主导(结肠中为44%,而肾脏中为22%并且大脑中为29%),而正常肾脏和大脑携带更大比例分数的A:T至G:C转换(肾脏中为25%并且大脑中为19%,而结肠中为15%)以及AA:T至C:G转换(肾脏中为12%并且大脑中为16%,而结肠中为5%)。此外,与结肠(6%)和大脑(6%)相比,肾脏(16%)中的A:T至T:A转换更为频繁。每个基因组内突变谱的成对比较表明,肾脏与结肠的取代模式之间存在显著差异(采用Bonferroni多重比较校正的Fisher精确检验,mtDNA中P=0.0029,并且核DNA中P=0.0312)。
将正常肾脏和结肠组织中发现的罕见突变的谱与来源于这些器官的细胞的癌症中的克隆DNA突变进行比较,后者的数据公开可用(参见例如,Ju等人,2014 eLife 3;以及Kandoth等人,2013 Nature 502:333-339)。将大脑额叶皮质从本分析中排除,因为尚不清楚应使用什么肿瘤类型进行比较。为了检索正常和肿瘤突变谱之间的相似性和差异,对来源于正常肾皮质、正常结肠上皮、透明细胞肾癌和结直肠癌的数据的核和mtDNA谱执行主成分分析。发现正常结肠和肾脏组织中罕见突变的谱与对应的癌症类型的谱非常相似(图60)。
实施例8:安全测序系统
遗传突变是生命和死亡的许多方面的基础,分别包括例如进化和疾病(参见例如,Luria等人,1943 Genetics 28:491-511;Roach等人,2010 Science 328:636-639;Durbin等人,2010 Nature 467:1061-1073;Shibata,2011 Carcinogenesis 32:123-128;McMahon等人,2007 N Engl J Med 356:2614-2621;Eastman等人,1998 J Infect Dis 177:557-564;Chiu等人,2008 Proc Natl Acad Sci USA 105:20458-20463;以及Fan等人,2008Proc Natl Acad Sci USA 105:16266-16271)。检测此类突变,特别是在其成为群体主导之前的阶段,可能将会对优化诊断和/或疗法至关重要。例如,在全部由体细胞突变驱动的赘生性疾病中,罕见突变体检测的应用是多种多样的;它们可用于帮助鉴定手术边缘或淋巴结中的残留疾病,可用于在血浆中进行评估时追踪治疗过程,并且可能还可用于在粪便、痰液、血浆和其他体液中进行评估时鉴定患有早期手术可治愈疾病的患者(参见例如,Hoque等人,2003 Cancer Res 63:5723-5726;Thunnissen等人,2003 J Clin Pathol 56:805-810;以及Diehl等人,2008 Gastroenterology 135:489-498)。
本实施例描述了“Safe-SeqS”(安全测序系统),以实现序列数据的非常高的准确性和敏感性水平。Safe-SeqS可用于评估聚合酶的保真度、体外合成的核酸合成的准确性以及正常细胞的核或线粒体核酸中突变的流行率。Safe-SeqS也可用于检测和/或定量镶嵌和体细胞突变。还参见以引用的方式整体并入本文的WO 2012/142213。
材料和方法
内源UID
使用Qiagen试剂盒制备人胰腺或培养的淋巴样干细胞的基因组DNA。胰腺DNA用于捕获实验,而淋巴样干细胞用于反向PCR实验。通过吸光度和qPCR来定量DNA。通过声学剪切(Covaris)将DNA片段化为约200bp的平均大小,然后根据标准Illumina方案对其进行末端修复、加A尾并连接至Y形衔接子。每个模板分子的末端提供对应于其染色体位置的内源UID。用衔接子内的引物序列进行PCR介导的文库扩增之后,用对应于6个癌症基因的含有2,594nt的过滤器来捕获DNA。捕获之后,执行18个PCR循环以确保足够量的模板,用于在Illumina GA IIx仪器上进行测序。
对于反向PCR实验(图65),我们将定制的衔接子(IDT,表57)代替标准的Y型Illumina衔接子连接到剪切的细胞DNA。这些衔接子保留了与通用测序引物互补的区域,但缺少与Illumina GA IIx流通池杂交所需的移植序列。将连接的DNA稀释到96孔中,并用唯一正向引物(其在5′末端含有12个索引序列中的一个)加上标准反向引物扩增每列8孔中的DNA(表57)。使用Phusion HotStart I(NEB)在50uL反应中执行扩增,所述反应中含有1XPhusion HF缓冲液、0.5mM dNTP、各自0.5uM的正向和反向引物(均为5′-磷酸化的)和1UPhusion聚合酶。使用以下循环条件:98℃30s,一个循环;和98℃10s,65℃30s,16个循环;和72℃30s。合并所有96个反应,并且然后使用Qiagen MinElute PCR纯化试剂盒(目录号28004)和QIAquick凝胶提取试剂盒(目录号28704)进行纯化。为了制备反向PCR必需的环形模板,将DNA稀释至约1ng/uL,并在室温下在600uL反应中与T4 DNA连接酶(Enzymatics)连接30分钟,所述反应含有1X T4 DNA连接缓冲液和18,000U T4 DNA连接酶。使用QiagenMinElute试剂盒纯化连接反应。使用Phusion Hot Start I对分布在12个50uL反应中的90ng环状模板执行反向PCR,每个反应含有1X Phusion HF缓冲液、0.25mM dNTP、各自0.5uM的KRAS正向和反向引物(表57)和1U Phusion聚合酶。KRAS特异性引物均含有用于与Illumina GA IIx流通池杂交的移植序列(表57)。使用以下循环条件:98℃2分钟,一个循环;和98℃10秒,61℃15秒,37个循环;和72℃10秒。最终纯化使用NucleoSpin Extract II试剂盒(Macherey-Nagel)来执行,并在20uL NE缓冲液中洗脱。所得的DNA片段含有由三个序列组成的UID:两个内源序列,表示原始剪切片段的两个末端;加上在索引扩增过程中引入的外源序列。由于使用了12个外源序列,这使得不同UID的数量与没有外源UID时获得的数量相比增加了12倍。此数量通过使用大量不同的引物可以容易地增加。外源UID
使用Qiagen试剂盒来制备来自正常人结肠粘膜或血液淋巴细胞的基因组DNA。结肠黏膜的DNA用于CTNNB1和线粒体DNA的实验,而淋巴细胞DNA用于CTNNB1和聚合酶保真度的实验。DNA通过使用引物的数字PCR、qPCR(线粒体DNA)或通过吸光度(寡核苷酸)来定量,所述引物扩增人细胞的单拷贝基因(聚合酶保真度和CTNNB1分析)。使用两个循环的扩增子特异性PCR,每个模板分子的每条链用12或14个碱基的UID来编码,如正文和图63中所述。扩增子特异性引物均在其5′末端含有通用标签序列,用于随后的扩增步骤。UID构成12或14个随机核苷酸序列,附加到正向扩增子特异性引物的5′末端(表57)。这些引物可分别产生16.8和268百万个不同的UID。重要的是,不同UID的数量大大超过了原始模板分子的数量,以使两个不同的原始模板获得相同UID的概率最小化。UID分配PCR循环包括45uL反应中的Phusion Hot Start II(NEB),所述反应含有1x Phusion HF缓冲液、0.25mM dNTP、各自0.5uM的正向(含有12-14个核苷酸)和反向引物以及2U Phusion聚合酶。为了使最终模板浓度保持<1.5ng/uL,使用了多个孔来创建一些文库。采用以下循环条件:98℃30秒,一个孵育(以活化Phusion Hot Start II);和98℃10秒,61℃120秒,2个循环;和72℃10秒。为了确保完全去除第一轮引物,将每个孔用60U单链DNA特异性核酸酶(核酸外切酶I;Enzymatics)在37℃下消化1小时。在98℃下进行5分钟的热灭活之后,将与引入的通用标签互补的引物(表57)添加到到各自0.5uM的终浓度。这些引物含有两个末端硫代磷酸酯,以使其对任何残留的核酸外切酶I活性具有抗性。它们还含有与Illumina GA IIx流通池杂交必需的5′移植序列。最后,它们在移植序列与通用标签序列之间含有索引序列。此索引序列使来自多个不同个体的PCR产物能够在测序仪的同一流通池隔室中同时进行分析。使用以下循环条件进行随后的25个PCR循环:98℃,10秒,和72℃15秒。没有执行中间纯化步骤,试图减少模板分子的损失。
在第二轮扩增之后,将孔合并,并且使用Qiagen QIAquick PCR纯化试剂盒(目录号28104)进行纯化并在50uL EB缓冲液(Qiagen)中洗脱。在琼脂糖(mtDNA文库)或聚丙烯酰胺(所有其他文库)凝胶电泳之后纯化预期大小的片段。对于琼脂糖凝胶纯化,将8个6-uL等分试样装载到2%大小选择凝胶(Size Select Gel,Invitrogen)的孔中,并按照制造商的说明将预期大小的条带收集到EB Buffer中。为了聚丙烯酰胺凝胶纯化,将10个5-uL等分试样装载到10%TBE聚丙烯酰胺凝胶(Invitrogen)的孔中。将含有所关注片段的凝胶切片切下、压碎并洗脱,如其他地方所述(参见例如,Durbin等人,2010 Nature 467:1061-1073)。
Phusion聚合酶保真度分析
首先使用上述PCR条件执行BMX(RefSeq登录号NM_203281.2)基因内的人类基因组DNA片段的扩增。稀释模板,使得在96孔PCR板的每10孔中存在平均一个模板分子。然后在1XPhusion HF缓冲液、0.25mM dNTP、各自0.5uM的正向和反向引物(表57)和2U Phusion聚合酶中执行50uL PCR反应。循环条件为:98℃30秒,一个循环;和98℃10秒,61℃120秒,19个循环;和72℃10秒。通过使用60U核酸外切酶I在37℃下消化1小时,接着在98℃下热灭活5分钟,来去除引物。无论是核酸外切酶I消化之前还是之后,都未执行PCR产物的纯化。然后将每个孔的全部内容物用作上述外源UID策略的模板。
测序
按照制造商的说明使用Illumina GA IIx仪器对上述所有文库进行测序。每个实验所用读长的总长度在36至73个碱基之间变化。使用Eland管道(Illumina)执行碱基识别和序列比对。仅将符合以下标准的高质量读长用于后续分析:(i)前25个碱基通过了标准Illumina纯净度过滤器;(ii)读长中的每个碱基的质量得分均≥20;和(iii)与预期序列的错配≤3。对于外源UID文库,我们另外要求UID的质量得分≥30。在使用标准Illumina方案制备的内源UID文库中的读长末端发现了相对较高的错误频率,假定是在剪切或末端修复过程中引入的,因此这些标签的前三个碱基和最后三个碱基均被排除在分析之外。
Safe-SeqS分析
高质量读长基于其内源或外源UID分组成UID家族。仅考虑具有两个或更多个成员的UID家庭。此类UID家族包括绝大多数(≥99%)的测序读长。为了确保在常规分析和Safe-SeqS分析中使用相同的数据,仅含有一个成员的UID家族也被排除在常规分析之外。此外,当将常规分析与使用外源UID的Safe-SeqS进行比较时,如果在至少一个UID家族的至少两个成员(即两个突变)中鉴定出相同的变体,则仅在常规测序分析中将碱基鉴定为“突变体”。为了与使用内源UID的Safe-SeqS进行比较,我们需要两个UID家族的每一个的至少两个成员(即四个突变),以在常规分析中将一个位置鉴定为“突变”。使用内源或外源UID,将超突变体定义为其中≥95%的成员共享相同突变的UID家族。因此,具有<20成员的UID家族必须在突变体位置100%相同,而具有更多成员的UID家族允许5%的组合复制和测序错误率。为了使用Safe-SeqS确定聚合酶保真度并将结果与Phusion聚合酶保真度的先前分析进行比较,有必要认识到先前的分析仅能检测到PCR产物两条链中都存在的突变(参见例如,Shibata,2011 Carcinogenesis 32:123-128)。这将等同于使用Safe-SeqS分析由一个较少的循环生成的PCR产物,并且在表53A中进行了适当的校正。除非另外指明,否则正文和表中列出的所有值均表示平均值和标准偏差。
结果
内源UID
UID,有时称为条形码或索引,可以以多种方式分配给核酸片段。这些包括通过PCR或连接引入外源序列。甚至更简单地,随机剪切的基因组DNA固有地含有由每个剪切片段的两个末端的序列组成的UID(图62和图65)。这些片段的双端测序产生了可以如上所述进行分析的UID家族。为了在Safe-SeqS中采用此类内源UID,使用了两种单独的方法:一种被设计来同时评估多个基因,而另一种被设计来深入评估单个基因片段(分别参见图62和图65)。
为了评估多个基因,将标准Illumina测序衔接子连接到剪切的DNA片段的末端以产生标准测序文库,然后在固相上捕获所关注基因。在本实验中,使用了由约15,000个正常细胞的DNA制成的文库,并靶向来自6个基因的2,594bp用于捕获。在排除已知的单核苷酸多态性之后,还鉴定出25,563个表观突变,对应于2.4x10-4±突变/bp(表52)。根据先前对人细胞突变率的分析,这些明显的突变中至少90%可能代表在模板和文库制备过程中引入的突变或碱基识别错误。请注意,此处确定的错误率(2.4x10-4个突变/bp)大大低于使用Illumina仪器进行的实验中通常报告的错误率,因为我们使用了非常严格的标准进行碱基识别。
通过对相同数据的Safe-SeqS分析,确定在本实验中评估了69,505个原始模板分子(即,鉴定了69,505个UID家族,其中每个家族平均40个成员,表52)。通过常规分析鉴定出的所有多态性变体也通过Safe-SeqS鉴定出来。然而,在这些家族中仅观察到8个超突变体,对应于3.5x10-6个突变/bp。因此,Safe-SeqS使假定的测序错误降低了至少70倍。
Safe-SeqS分析还可以确定模板的哪条链发生了突变,因此用于识别突变的额外标准可能要求所述突变仅出现在原始双链模板的一条或两条链中。大规模平行测序能够在两个连续读长中从模板的两个末端获得序列信息。(这种类型的测序实验被称为在Illumina平台上运行的“成对末端”,但是可以在其他测序平台上进行类似的实验,在这些实验中,它们可能被称为其他名称。)可以通过观察到的序列方向和从两个末端获得序列信息时它们出现的顺序来区分双链模板的两条链。例如,当按顺序读长对模板的每个末端进行测序时,UID链对可以由以下两组序列组成:1)有义方向的序列,其以第一读长中2号染色体的位置100开始,接着是反义方向的序列,其以第二读长中2号染色体的位置400开始;2)反义方向的序列,其以第一读长中2号染色体的位置400开始,接着是有义方向的序列,其以第二读长中2号染色体的位置100开始。在上述捕获实验中,所关注区域中的69,505个UID中的42,222个(代表21,111个原始双链分子)代表UID链对。这42,222个UID涵盖了所关注区域中的1,417,838个碱基。当允许仅在UID链对中出现突变时(无论是在一条链还是在两条链中),观察到两个超突变体,产生的突变率为1.4x10-6个超突变体/bp。当要求仅在UID链对的一条链中出现突变时,仅观察到一个超突变体,产生的突变率为7.1x10-7个超突变体/bp。当要求在UID链对的两条链中都出现突变时,仅观察到一个超突变体,产生的突变率为7.1x10-7个超突变体/bp。因此,要求仅在模板的一条或两条链中出现突变可以进一步增加Safe-SeqS的特异性。
在对单个所关注区域进行深度测序时,采用内源UID的策略还可以用于减少假阳性突变。在这种情况下,将如上所述由约1,750个正常细胞制备的文库用作采用与所关注基因互补的引物的反向PCR的模板,因此PCR产物可直接用于测序(图65)。通过常规分析,观察到平均2.3x10-4个突变/bp,与捕获实验中观察到的相似(表52)。鉴于本实验仅评估了来自正常细胞的1057个独立分子,如通过Safe-SeqS分析所确定的,使用常规分析观察到的所有突变都可能代表假阳性(表52)。通过对相同数据的Safe-SeqS分析,在任何位置都未鉴定出超突变体。
外源UID
尽管上述结果表明,Safe-SeqS可以增加大规模平行测序的可靠性,但是可以使用内源UID检查的不同分子的数量有限。对于剪切至平均大小为150bp(范围为125-175)的片段,36个碱基双端测序可评估最大约7,200个含有特定突变的不同分子(2个读长x2个方向x36个碱基/读长x片段的任一末端上的50个碱基变化)。实际上,由于剪切过程不是完全随机的,因此实际的UID数量更小。
为了更有效地利用原始模板,开发了一种Safe-SeqS策略,其采用了最小数量的酶促步骤。这种策略还允许使用降解的或受损的DNA,诸如在临床标本中或在用于检查胞嘧啶甲基化的亚硫酸氢盐处理之后发现的DNA。如图63所示,这种策略采用了两组PCR引物。第一组由标准亚磷酰胺前体合成,并含有在3′末端的与所关注基因互补的序列,以及正向和反向引物两者的5′末端处的不同尾巴。不同的尾巴允许下一步骤中的通用扩增。最后,在正向引物的尾巴与序列特异性核苷酸之间存在12至14个随机核苷酸的区段。随机核苷酸形成UID。将UID分配给片段的等同方法(本研究中未使用)将采用在微阵列上合成的10,000个正向引物和10,000个反向引物。这20,000个引物中的每一个在其3′末端都具有基因特异性引物,并且在其5′末端具有10,000个特定的、预定的、不重叠的UID序列中的一个,从而允许108(即,[104]2)个可能的UID组合。无论哪种情况,都用引物和高保真聚合酶执行两个PCR循环,从而由每个原始模板分子的两条链中的每一条产生带唯一标记的双链DNA片段(图63)。通过用单链特异性核酸外切酶消化来去除残留的未使用的UID分配引物,无需进一步纯化,并且添加两个新的引物。替代地或除了这种消化之外,可以使用选择性保留较大片段的硅胶柱,或者可以在选择性保留较大片段以消除较小的非特异性扩增人为误差的条件下使用固相可逆固定化(SPRI)珠子。这种纯化可能有助于减少后续步骤中引物二聚体的积累。与在UID分配循环中引入的尾巴互补的新的引物,在其5′末端含有移植序列,从而允许在Illumina仪器上进行固相扩增,并在其3′末端含有硫代磷酸酯残基,以使其对任何剩余的核酸外切酶均具有抗性。在25个额外的PCR循环之后,将产物装载到Illumina仪器上。如下所示,这种策略使我们能够评估大多数输入片段,并用于若干个说明性实验。
DNA聚合酶保真度分析
DNA聚合酶的错误率的测量对于其表征至关重要,并且决定了可以使用这些酶的情况。测量了Phusion聚合酶的错误率,因为这种聚合酶具有任何可商购获得的酶的最低报道错误频率中的一个,并且因此对基于体外的方法提出了特别的挑战。首先通过19轮PCR扩增单个人DNA模板分子,其包含任意选择的人基因的片段。来自这些扩增的PCR产物整体用作Safe-SeqS的模板,如图63所示。在7个独立的这种类型的实验中,通过测序鉴定出的UID家族的数量为624,678±421,274个,者与每轮PCR的扩增效率92±9.6%一致。
生产商报告,通过克隆质粒载体中编码β-半乳糖苷酶的PCR产物并将其转化到细菌中来估计的Phusion聚合酶的错误率为4.4x10-7个错误/bp/PCR循环。即使使用非常严格的碱基识别,对Illumina测序数据的常规分析仍显示出9.1x10-6个错误/bp/PCR循环的表观错误率,比报道的Phusion聚合酶错误率高出一个数量级(表53A)。相反,对相同数据的Safe-SeqS显示出4.5x10-7个错误/bp/PCR循环的错误率,几乎与在生物测定中针对Phusion聚合酶测量的错误率相同(表53A)。这些错误中的绝大多数(>99%)是单碱基取代(表54A),与先前由其他原核DNA聚合酶产生的突变谱上的数据一致(Tindall等人1988Biochemistry 27:6008-6013;de Boer等人,1988 Genetics 118:181-191;Eckert等人,1990 Nucleic Acids Res 18:3739-3744)。
Safe-SeqS还可以确定不同突变事件的总数量,并估算发生突变的PCR循环。在这些实验中,在含有单个模板分子的孔中执行了19个PCR循环。如果在循环19中发生聚合酶错误,则仅会产生一个超突变体(来自含有突变的链)。如果错误发生在循环18中,则应该有两个超突变体(来源于循环19中产生的突变链),依此类推。因此,发生错误的循环与含有所述错误的超突变体的数量有关。来自7个独立实验的数据表明,观察到的总聚合酶错误的相对一致的数量(2.2±1.1x10-6个不同的突变/bp),与模拟中观察的预期数量(1.5±0.21x10-6个不同的突变/bp)具有良好的一致性。数据还表明实验之间发生聚合酶错误的时间高度可变(表55)。使用相同的下一代测序数据的常规分析很难得出这种信息,部分是因为上述的异常高的表观突变率。
寡核苷酸组成分析
在由亚磷酰胺前体合成寡核苷酸过程中的少量错误对于大多数应用(诸如常规PCR或克隆)是可以容忍的。然而,对于必须将许多寡核苷酸连接在一起的合成生物学,此类错误是成功的主要障碍。已经设计了使基因构建过程更有效的巧妙策略(参见例如,Kosuri等人,2010 Nat Biotechnol 28:1295-129;以及Matzas等人,2010 Nat Biotechnol 28:1291-1294),但是所有这此类策略都将从寡核苷酸自身的更准确合成中受益。确定合成的寡核苷酸中错误的数量是困难的,因为含有错误的寡核苷酸的比例可能低于常规的下一代测序分析的敏感性。
为了确定是否可以将Safe-SeqS用于这种测定,使用标准的亚磷酰胺化学方法合成含有31个碱基的寡核苷酸,所述寡核苷酸被设计来与上述聚合酶保真度实验中分析的寡核苷酸相同。在合成寡核苷酸中,所述31个碱基被与可用于Safe-SeqS的UID分配步骤的引物互补的序列包围(图63)。通过对约300,000个寡核苷酸执行Safe-SeqS,发现存在8.9±0.28x10-4个超突变体/bp,并且这些错误在整个寡核苷酸中发生(图66A)。寡核苷酸含有大量的插入和缺失错误,分别占总超突变体的8.2±0.63%和8.2±0.63%。重要的是,对同一批次的寡核苷酸执行的此实验的7个独立重复中,错误的位置和性质均是高度可重复的(图66A)。错误的这种性质和分布与由Phusion聚合酶产生的错误(图66B和表56)几乎没有共同点,后者在重复实验之间以预期的随机模式分布。用亚磷酰胺合成的寡核苷酸中错误的数量比由Phusion聚合酶合成的等同产物高约60倍。这些数据完全表明其合成过程中,前者的大多数错误在其合成过程中产生,而不是在SeqS过程中。
Safe-SeqS是否在原始模板中保留了突变序列:正常序列的比率?为了解决此问题,合成了两种具有除了nt 15(50∶50 C/G而不是T)之外相同的序列的31个碱基的寡核苷酸,并将它们以3.3%和0.33%的标称突变体/正常分数进行混合。通过寡核苷酸混合物的Safe-SeqS分析,发现所述比率分别为2.8%和0.27%。因此,Safe-SeqS中使用的UID分配和扩增程序不会很大地改变变体序列的比例,并且由此在所述比例未知时提供可靠估计。当在独立的Safe-SeqS实验中进行分析时,变体分数的可重复性也支持了这一点(图66A)。
正常人细胞的DNA序列分析
然后使用外源UID策略(图63)来确定在来自3个无关个体的约100,000个正常人细胞的CTNNB1基因的小区域中罕见突变的流行率。通过与在Safe-SeqS实验中获得的UID家族的数量进行比较(表53B),计算出大多数(78±9.8%)输入片段被转化为UID家族。每个UID家族平均有68个成员,可以容易地实现Safe-SeqS所需的冗余(图67)。对Illumina测序数据的常规分析表明,每个样品分析的约560Mb的序列中平均有118,488±11,357个突变,对应的表观突变流行率为2.1±0.16x10-4个突变/bp(表53B)。在Safe-SeqS分析中仅观察到平均99±78个超突变体。绝大多数(>99%)超突变体是单碱基取代,并且计算出的突变率是9.0±3.1x10-6个突变/bp(表54B)。因此,Safe-SeqS将基因组DNA中的表观突变频率降低了至少24倍(图64)。
增加Safe-SeqS的特异性的一种可能策略是在多个孔中执行文库扩增(以及可能的UID分配循环)。这可以使用标准PCR板在少至2个或多达384个孔中完成,或者在使用微流体装置时(数千至数百万个)可按比例扩大到更多的孔。当以这种方式执行时,可以将索引序列引入模板中,所述模板对于模板在其中扩增的孔是唯一的。因此,罕见突变应产生两个超突变体(即每条链中的一个),两者都具有相同的孔索引序列。当使用外源UID对上述的且稀释到10个孔(每个孔产生的模板均用不同的索引序列扩增)中的CTNNB1模板执行Safe-SeqS时,突变率进一步从9.0±3.1x10-6降低到3.7±1.2x10-6个超突变体/bp。因此,分析多个隔室中的模板(以基于扩增模板的隔室产生差异编码的模板的方式)可以是增加Safe-SeqS的特异性的另一种策略。
来自线粒体DNA的DNA序列分析
将相同的策略应用于来自7个无关个体的每一个的约1,000个细胞中线粒体DNA的短片段。对用Safe-SeqS产生的Illumina测序文库的常规分析(图63)表明,每个样品分析的约150Mb的序列中平均有30,599±12,970个突变,对应的表观突变流行率为2.1±0.94x10-4个突变/bp(表53C)。在Safe-SeqS分析中仅观察到135±61个超突变体。与CTNNB1基因一样,绝大多数突变是单碱基取代,尽管偶尔也观察到单碱基缺失(表54C)。在分析的mtDNA片段中,计算的突变率是1.4±0.68x10-5个突变/bp(表53C)。因此,Safe-SeqS将基因组DNA中的表观突变频率降低了至少15倍。
实施例9:遗传和蛋白质生物标记物的检测与非整倍性的检测组合
测试了来自许多患者的样品中遗传生物标记物(NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和/或GNAS)和蛋白质生物标记物(CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和/或MPO)的存在。还使用本文所述的WALDO方法测试了相同样品中非整倍性的存在。结果在表59中示出可以看出,遗传和蛋白质生物标记物测试可以补充非整倍性测试(例如,一些患者的遗传和蛋白质生物标记物测试为阴性,而非整倍性为阳性,并且反之亦然),使得使用这两种测试可以更准确并完全地检测出癌症的存在。
一旦通过遗传和蛋白质生物标记物测试、非整倍性测试或两者将受试者鉴定为患有癌症,所述受试者就可以经历进一步诊断测试和/或增加监测(例如,本文所述的各种进一步诊断测试和/或增加监测方法中的任一种)和/或被施用治疗性干预(例如,本文所述的各种治疗性干预中的任一种)。
参考文献
本文引用以下某些参考文献。以下参考文献各自的内容以引用的方式整体并入本文。
·AlHilli et al.,Incidence and factors associated with synchronousovarian and endometrial cancer:a population-based case-controlstudy.Gynecologic oncology 125,109-113(2012).
·Allen PJ,et al.(2017)Multi-institutional Validation Study of theAmerican Joint Commission on Cancer(8th Edition)Changes for T and N Stagingin Patients With Pancreatic Adenocarcinoma.Ann Surg 265(1):185-191.
·Allory Y,Beukers W,Sagrera A,Flandez M,Marques M,Marquez M,van derKeur KA,Dyrskjot L,Lurkin I,Vermeij M,Carrato A,Lloreta J,Lorente JA,Carrillo-de Santa Pau E,Masius RG,Kogevinas M,Steyerberg EW,van Tilborg AA,Abas C,Orntoft TF,Zuiverloon TC,Malats N,Zwarthoff EC,Real FX(2014)Telomerasereverse transcriptase promoter mutations in bladder cancer:high frequencyacross stages,detection in urine,and lack of association with outcome.EurUrol 65:360-366.
·Andre T,et al.(2009)Improved overall survival with oxaliplatin,fluorouracil,and leucovorin as adjuvant treatment in stage II or III coloncancer in the MOSAIC trial,J Clin Oncol 27(19):3109-3116.
·Anglesio et al.,Cancer-Associated Mutations in Endometriosiswithout Cancer.N Engl J Med 376,1835-1848(2017).
·Ansari D,et al.(2017)Relationship between tumour size and outcomein pancreatic ductal adenocarcinoma Br J Surg 104(5):600-607.
·Arnold et al.,G.A.Stevens,M.Ezzati,J Ferlay,J.J.Miranda,I.Romieu,R.Dikshit,D.Forman,I Soerjomataram,Global burden of cancer attributable tohigh body-mass index in 2012:a population-based study.The Lancet.Oncology 16,36-46(2015).
·Bahuva R,Walsh RM,Kapural L,&Stevens T(2013)Morphologicabnormalities are poorly predictive of visceral pain in chronicpancreatitis.Pancreas 42(1):6-10.
·Bansal N,Gupta A,Sankhwar SN,Mahdi AA(2014)Low-and high-gradebladder cancer appraisal via serum-based proteomics approach.Clin Chim Acta436:97-103.
·Barkan GA,Wojcik EM,Nayar R,Savic-Prince S,Quek ML,Kurtycz DF,Rosenthal DL(2016)The Paris System for Reporting Urinary Cytology:The Questto Develop a Standardized Terminology.Adv Anat Pathol 23:193-201.
·Bettegowda C,et al.(2014)Detection of circulating tumor DNA inearly-and late-stage human malignancies.Science translational medicine 6(224):224ra224.
·Biankin AV,et al.(2012)Pancreatic cancer genomes reveal aberrationsin axon guidance pathway genes Nature 491(7424):399-405.
·Bozic I,et al.(2013)Evolutionary dynamics of cancer in response totargeted combination therapy.Elife 2:e00747.
·Buys et al.,Effect of screening on ovarian cancer mortality:theProstate,Lung,Colorectal and Ovarian(PLCO)Cancer Screening RandomizedControlled Trial.JAMA 305,2295-2303(2011).
·Cancer Genome Atlas Research Network(2014)Comprehensive molecularcharacterization of urothelial bladder carcinoma.Nature 507:315-322.
·Capello M,et al.(2017)Sequential Validation of Blood-Based ProteinBiomarker Candidates for Early-Stage Pancreatic Cancer.J Natl Cancer Inst 109(4).
·Chai H,Brown RE(2009)Field effect in cancer-an update.Ann Clin LabSci 39:331-337
·Chari ST,et al.(2005)Probability of pancreatic cancer followingdiabetes:a population-based study.Gastroenterology 129(2):504-511.
·Cheng L,Montironi R,Lopez-Beltran A(2017)TERT Promoter MutationsOccur Frequently in Urothelial Papilloma and Papillary Urothelial Neoplasm ofLow Malignant Potential.Eur Urol 71:497-498.
·Cheung et al.,High frequency of PIK3R1 and PIK3R2 mutations inendometrial cancer elucidates a novel mechanism for regulation of PTENprotein stability.Cancer Discov I,170-185(2011).
·Clarke-Pearson DL(2009)Clinical practice.Screening for ovariancancer.N Engl J Med 361(2):170-177.
·Coombs et al.,Therapy-Related Clonal Hematopoiesis in Patients withNon-hematologic Cancers Is Common and Associated with Adverse ClinicalOutcomes Cell Stem Cell,(2017).
·Cowan ML,Springer S,Nguyen D,Taheri D,Guner G,Mendoza Rodriguez MA,Wang Y,Kinde I,Del Carmen Rodriguez Pena M,VandenBussche CJ,Olson MT,Cunha I,Fujita K,Ertoy D,Kinzler K,Bivalacqua T,Papadopoulos N,Vogelstein B,Netto GJ(2016)Detection of TERT promoter mutations in primary adenocarcinoma of theurinary bladder Hum Pathol 53:8-13.
·Davis R,Jones JS,Barocas DA,Castle EP,Lang EK,Leveillee RJ,MessingEM,Miller SD,Peterson AC,Turk TM,Weitzel W,American Urological Association(2012)Diagnosis,evaluation and follow-up of asymptomatic microhematuria(AMH)in adults:AUA guideline.J Urol 188:2473-2481.
·Dawson SJ,et al.(2013)Analysis of circulating tumor DNA to monitormetastatic breast cancer.N Engl J Med 368(13):1199-1209.
·Di Renzo MF,et al.(1995)Overexpression and amplification of themet/HGF receptor gene during the progression of colorectal cancer.Clin CancerRes 1(2):147-154.
·Di Renzo MF,Poulsom R,Olivero M,Comoglio PM,&Lemoine NR(1995)Expression of the Met/hepatocyte growth factor receptor in human pancreaticcancer.Cancer Res 55(5):1129-1138.
·Dimashkieh H,Wolff DJ,Smith TM,Houser PM,Nietert PJ,Yang J(2013)Evaluation of urovysion and cytology for bladder cancer detection:a study of1835 paired urine samples with clinical and histologic correlation.CancerCytopathol 121:591-597.
·Dong T,Liu CC,Petricoin EF,&Tang LL(2014)Combining markers with andwithout the limit of detection Stat Med 33(8):1307-1320.
·Dressman D,Yan H,Traverso G,Kinzler KW,&Vogelstein B(2003)Transforming single DNA molecules into fluorescent magnetic particles fordetection and enumeration of genetic variations.Proc Natl Acad Sci USA 100(15):8817-8822.
·Dy GK,et al.(2009)Long-term survivors of metastatic colorectalcancer treated with systemic chemotherapy alone:a North Central CancerTreatment Group review of 3811 patients,N0144 Clin Colorectal Cancer 8(2):88-93.
·Eckert et al.,Genomics of Ovarian Cancer Progression RevealsDiverse Metastatic Trajectories Including Intraepithelial Metastasis to theFallopian Tube.Cancer Discov 6,1342-1351(2016).
·Egawa S,et al.(2004)Clinicopathological aspects of small pancreaticcancer.Pancreas 28(3):235-240.
·Ellinger J,Muller SC,Dietrich D(2015)Epigenetic biomarkers in theblood of patients with urological malignancies.Expert Rev Mol Diagn 15:505-516.
·El-Tanani MK,et al.(2006)The regulation and role of osteopontin inmalignant transformation and cancer Cytokine Growth Factor Rev 17(6):463-474.
·Erickson et al.,Detection of somatic TP53 mutations in tampons ofpatients with high-grade serous ovarian cancer.Obstetrics and gynecology 124,881-885(2014).
·Fishman et al.,The role of ultrasound evaluation in the detectionof early-stage epithelial ovarian cancer.Am J Obstet Gynecol 192,1214-1221;discussion 1221-1212(2005).
·Forbes et al.,COSMIC:somatic cancer genetics at high-resolutionNucleic Acids Res 45,D777-D783(2017).
·Forshew T,et al.(2012)Noninvasive identification and monitoring ofcancer mutations by tarseted deep sequencing of plasma DNA.Sciencetranslational medicine 4(136):136ra168.
·Fradet Y,Lockhard C(1997)Performance characteristics of a newmonoclonal antibody test for bladder cancer:ImmunoCyt trade mark.Can J Urol4:400-405.
·Frokjaer JB,Olesen SS,&Drewes AM(2013)Fibrosis,atrophy,and ductalpathology in chronic pancreatitis are associated with pancreatic function butindependent of symptoms.Pancreas 42(7):1182-1187.
·Geldenhuys,Murray,Sensitivity and specificity of the Pap smear forglandular lesions of the cervix and endometrium.Acta cytologica 51,47-50(2007).
·Genovese G,et al.(2014)Clonal hematopoiesis and blood-cancer riskinferred from blood DNA sequence.N Engl J Med 371(26):2477-2487.
·Gerlinger et al.,Intratumor heterogeneity and branched evolutionrevealed by multiregion sequencing.N Engl J Mead 366,883-892(2012).
·Gilbert et al.,Assessment of symptomatic women for early diagnosisof ovarian cancer:results from the prospective DOvE pilot project.TheLancet.Oncology 13,285-291(2012).
·Goodison S,Chang M,Dai Y,Urquidi V,Rosser CJ(2012)A multi-analyteassay for the non-invasive detection of bladder cancer PLoS One 7:e47469.
·Gopalakrishna A,Fantony JJ,Longo TA,Owusu R,Foo WC,Dash R,DentonBT,Inman BA(2017)Anticipatory Positive Urine Tests for Bladder Cancer.AnnSurg Oncol 24:1747-1753.
·Haber DA&Velculescu VE(2014)Blood-based analyses of cancer:circulating tumor cells and circulating tumor DNA Cancer Discov 4(6):650-661.
·Hajdinjak T(2008)UroVysion FISH test for detecting urothelialcancers:meta-analysis of diagnostic accuracy and comparison with urinarycytology testing.Urol Oncol 26:646-651.
·Hamilton et al.,Uterine papillary serous and clear cell carcinomaspredict for poorer survival compared to grade 3 endometrioid corpus cancersBritish journal of cancer 94,642-646(2006).
·Herbst RS,Heymach JV,&Lippman SM(2008)Lung cancer.N Engl J Med 359(13):1367-1380.
·Horn S,Fig1 A,Rachakonda PS,Fischer C,Sucker A,Gast A,Kadel S,MollI,Nagore E,Hemminki K,Schadendorf D,Kumar R(2013)TERT promoter mutations infamilial and sporadic melanoma.Science 339:959-961.
·Howlader et al.,SEER Cancer Statistics Review,1975-2014,NationalCancer Institute.(2017).
·Howlader N,et al.(2016)SEER Cancer Statistics Review,1975-2013,National Cancer Institute.Bethesda,MD,http://scer.cancer.gov/csr/1975_2013/,based on November 2015 SEER data submission,posted to the SEER web site,April2016.
·Huang AC,et al.(2017)T-cell invigoration to tumour burden ratioassociated with anti-PD-1 response.Nature 545(7652):60-65.
·Huang FW,Hodis E,Xu MJ,Kryukov GV,Chin L,Garraway LA(2013)Highlyrecurrent TERT promoter mutations in human melanoma.Science 339:957-959.
·Hurst CD,Platt FM,Knowles MA(2014)Comprehensive mutation analysisof the TERT promoter in bladder cancer and detection of mutations in voidedurine Eur Urol 65:367-369.
·Ikematsu S,et al.(2000)Serum midkine levels are increased inpatients with various types of carcinomas Br J Cancer 83(6):701-706.
·International Agency for Research on Cancer.(2016)WHOClassification of Turnours of the Urinary System and Male Genital Organs.WordHealth Organization;4 edition
·Ishikawa O,et al.(1999)Minute carcinoma of the pancreas measuring1cm or less in diameter--collective review of Japanese casereports.Hepatogastroenterology 46(25):8-15.
·Jacobs et al.,Ovarian cancer screening and mortality in the UKCollaborative Trial of Ovarian Cancer Screening(UKCTOCS):a randomisedcontrolled trial.Lancet 387,945-956(2016).
·Jacobs et al.,Sensitivity of transvaginal ultrasound screening forendometrial cancer in postmenopausal women:a case-control study within theUKCTOCS cohort The Lancet.Oncology 12,38-48(2011).
·Jaiswal S,et al.(2014)Age-related clonal hematopoiesis associatedwith adverse outcomes.N Engl J Med 371(26):2488-2498.
·Jones S,et al.(2008)Core signaling pathways in human pancreaticcancers revealed by global genomic analyses.Science 321(5897):1801-1806.
·Jung et al.,Intron retention is a widespread mechanism of tumor-suppressor inactivation.Nat Genet 47,1242-1248(2015).
·Jung KW,et al.(2007)Clinicopathological aspects of 542 cases ofpancreatic cancer:a special emphasis on small pancreatic cancer.J Korean MedSci 22 Suppl:S79-85.
·K.N.Moore,A.N.Fader,Uterine papillary serous carcinoma Clin ObstetGynecol 54,278-291(2011).
·Kalinich M,et al.(2017)An RNA-based signature enables highspecificity detection of circulating tumor cells in hepatocellularcarcinoma.Proc Natl Acad Sci USA 114(5):1123-1128.
·Kandoth et al.,Integrated genomic characterization of endometrialcarcinoma.Nature 497,67-73(2013).
·Karst et al.,Modeling high-grade serous ovarian carcinogenesis fromthe fallopian tube.Proc Natl Acad Sci USA 108,7547-7552(2011).
·Kawauchi S,Sakai H,Ikemoto K,Eguchi S,Nakao M,Takihara H,Shimabukuro T,Furuya T,Oga A,Matsuyama H,Takahashi M,Sasaki K(2009)9p21 Indexas Estimated by Dual-Color Fluorescence in Situ Hybridization is Useful toPredict Urothelial Carcinoma Recurrence in Bladder Washing Cytology.HumPathol 40:1783-1789.
·Khadra MH,Pickard RS,Charlton M,Powell PH,Neal DE(2000)Aprospective analysis of 1,930 patients with hematuria to evaluate currentdiagnostic practice J Urol 163:524-527.
·Killela PJ,Reitman ZJ,Jiao Y,Bettegowda C,Agrawal N,Diaz LA,Jr,Friedman AH,Friedman H,Gallia GL,Giovanella BC,Grollman AP,He TC,He Y,HrubanRH,Jallo GI,Mandahl N,Meeker AK,Mertens F,Netto GJ,Rasheed BA,Riggins GJ,Rosenquist TA,Schiffman M,Shih I,Theodorescu D,Torbenson MS,Velculescu VE,Wang TL,Wentzensen N,Wood LD,Zhang M,McLendon RE,Bigner DD,Kinzler KW,Vogelstein B,Papadopoulos N,Yan H(2013)TERT promoter mutations occurfrequently in gliomas and a subset of tumors derived from cells with lowrates of self-renewal Proc Natl Acad Sci USA 110:6021-6026.
·Kim JE,et al.(2004)Clinical usefulness of carbohydrate antigen 19-9as a screening test for pancreatic cancer in an asymptomatic population.JGastroenterol Hepatol 19(2):182-186.
·Kinde et al.,FAST-SeqS:a simple and efficient method for thedetection of aneuploidy by massively parallel sequencing.PLoS One 7,e41162(2012).
·Kinde I,et al.(2013)Evaluation of DNA from the Papanicolaou test todetect ovarian and endometrial cancers.Science translational medicine 5(167):167ra164.
·Kinde I,Munari E,Faraj SF,Hruban RH,Schoenberg M,Bivalacqua T,AllafM,Springer S,Wang Y,Diaz LA,Jr,Kinzler KW,Vogelstein B,Papadopoulos N,Netto GJ(2013)TERT promoter mutations occur early in urothelial neoplasia andare biomarkers of early disease and disease recurrence in urine Cancer Res73:7162-7167.
·Kinde I,Wu J,Papadopoulos N,Kinzler KW,&Vogelstein B(2011)Detectionand quantification of rare mutations with massively parallel sequencing.ProcNatl Acad Sci USA 108(23):9530-9535.
·Kobayashi et al.,A randomized study of screening for ovariancancer:a multicenter study in Japan.Int J Gynecol Cancer 18,414-420(2008).
·Koopmann J,et al.(2004)Evaluation of osteoponfin as biomarker forpancreatic adenocarcinoma.Cancer Epidemiol Biomarkers Prev 13(3):487-491.
·Krimmel et al.,Ultra-deep sequencing detects ovarian cancer cellsin peritoneal fluid and reveals somatic TP53 mutations in noncanceroustissues.Proc Natl Acad Sci USA 113,6005-6010(2016).
·Kruger S,Mess F,Bohle A,Feller AC(2003)Numerical aberrations ofchromosome 17 and the 9p21 locus are independent predictors of tumorrecurrence in non-invasive transitional cell carcinoma of the urinarybladder.Int J Oncol 23:41-48.
·Kurman,Shih Ie,Molecular pathogenesis and extraovarian origin ofepithelial ovarian cancer--shifting the paradigm.Human pathology 42,918-931(2011).
·Kurman,Shih Ie,The Dualistic Model of Ovarian Carcinogenesis:Revisited,Revised,and Expanded.Am J Pathol 186,733-747(2016).
·Kurman,Shih Ic,The origin and pathogenesis of epithelial ovariancancer:a proposed unifying theory.The American journal of surgical pathology34,433-443(2010).
·Le Calvez-Kelm F,et al.(2016)KRAS mutations in blood circulatingcell-free DNA:a pancreatic cancer case-control.Oncotarget 7(48):78827-78840.
·Lee et al.,A candidate precursor to serous carcinoma thatoriginates in the distal fallopian tube.The Journal of pathology 211,26-35(2007).
·Lennon AM&Goggins M(2010)Diagnostic and Therapeutic ResponseMarkers.Pancreatic Cancer,(Sprinser New York,New York,NY),pp 675-701.
·Lennon AM,et al.(2014)The Early Detection of Pancreatic Cancer:WhatWill It Take to Diagnose and Treat Curable Pancreatic Neoplasia?Cancer Res 74(13):3381-3389.
·Levina VV,et al.(2009)Biological significance of prolactin ingynecologic cancers.Cancer Res 69(12):5226-5233.
·Lin HH,Ke HL,Huang SP,Wu WJ,Chen YK,Chang LL(2010)Increasesensitivity in detecting superficial,low grade bladder cancer by combinationanalysis of hypermethylation of E-cadherin,p16,p14,RASSF1A genes inurine.Urol Oncol 28:597-602.
·Liotta LA&Petricoin EF,3rd(2003)The promise of proteomics.Clin AdvHematol Oncol 1(8):460-462.
·Locker GY,et al.(2006)ASCO 2006 update of recommendations for theuse of tumor markers in gastrointestinal cancer.J Clin Oncol 24(33):5313-5327.
·Lotan Y,Roehrbom CG(2003)Sensitivity and specificity of commonlyavailable bladder tumor markers versus cytology results of a comprehensiveliterature review and meta-analyses.Urology 61:109-18;discussion 118.
·Meden,Fattahi-Meibodi,CA 125 in benign gynecological conditions.LntJ Biol Markers 13,231-237(1998).
·Menon et al.,Risk Algorithm Using Serial Biomarker MeasurementsDoubles the Number of Screen-Detected Cancers Compared With a Single-Threshold Rule in the United Kingdom Collaborative Trial of Ovarian CancerScreening J Clin Oncol 33,2062-2071(2015).
·Mishriki SF,Nabi G,Cohen NP(2008)Diagnosis of urologic malignanciesin patients with asymptomatic dipstick hematuria:prospective study with 13years′follow-up.Urology 71:13-16.
·Mo L,Zheng X,Huang HY,Shapiro E,Lepor H,Cordon-Cardo C,Sun TT,Wu XR(2007)Hyperactivation of Ha-ras oncogene,but not Lnk4a/Arf deficiency,triggers bladder tumorigenesis.J Clin Invest 117:314-325.
·Moertel CG,et al.(1995)Fluorouracil plus levamisole as effectiveadjuvant therapy after resection of stage III colon carcinoma:a finalreport.Ann Intern Med 122(5):321-326.
·Moonen PM,Merkx GF,Peelen P,Karthaus HF,Smeets DF,Witjes JA(2007).UroVysion compared with cytology and quantitative cytology in thesurveillance of non-muscle-invasive bladder cancer.Eur Urol 51:1275-80;discussion 1280
·Moore et al.,The use of multiple novel tumor biomarkers for thedetection of ovarian carcinoma in patients with a pelvic mass.Gynecologiconcology 108,402-408(2008).
·Moyer,Screening for ovarian cancer:U.S.Preventive Services TaskForce reaffirmation recommendation statement.Annals of internal medicine 157,900-904(2012).
·N.Cancer Genome Atlas Research,Integrated genomic analyses ofovarian carcinoma.Nature 474,609-615(2011).
·Nair et al.,Genomic Analysis of Uterine Lavage Fluid Detects EarlyEndometrial Cancers and Reveals a Prevalent Landscape of Driver Mutations inWomen without Histopathologic Evidence of Cancer:A Prospective Cross-Sectional Study PLoS Med 13,e1002206(2016).
·Nazli O,Bozdag AD,Tansug T,Kir R,&Kaymak E(2000)The diagnosticimportance of CEA and CA 19-9 for the early diagnosis of pancreatic carcinoma.Hepatogastroenterology 47(36):1750-1752.
·Netto GJ(2011)Molecular biomarkers in urothelial carcinoma of thebladder are we there yet?.Nat Rev Urol 9:41-51.
·Netto GJ(2013)Clinical applications of recent molecular advances inurologic malignancies:no longer chasing a″mirage″?.Adv Anat Pathol 20:175-203.
·Netto GJ,Epstein JI(2010)Theranostic and prognostic biomarkers:genomic applications in urological malignancies Pathology 42:384-394.
·Netto GJ,Tafe LJ(2016)Emerging Bladder Cancer Biomarkers andTargets of Therapy.Urol Clin North Am 43:63-76.
·Ng et al.,Significance of endometrial cells in the detection ofendometrial carcinoma and its precursors.Acta cytologica 18,356-361(1974).
·Nguyen D,Taheri D,Springer S,Cowan M,Guner G,Mendoza Rodriguez MA,Wang Y,Kinde I,VandenBussche C J,Olson MT,Ricardo BF,Cunha I,Fujita K,ErtoyD,Kinzler KW,Bivalacqua TJ,Papadopoulos N,Vogelstein B,Netto GJ(2016)Highprevalence of TERT promoter mutations in micropapillary urothelialcarcinoma.Virchows Arch 469:427-434.
·O’Brien DP,et al.(2015)Serum CA19-9 is significantly upregulated upto 2 years before diagnosis with pancreatic cancer:implications for earlydisease detection.Clin Cancer Res 21(3):622-631.
·Rago et al.,Serial assessment of human tumor burdens in mice by theanalysis of circulating DNA Cancer research 67,9364-9370(2007).
·Rahib L,et al.(2014)Projecting cancer incidence and deaths to 2030:the unexpected burden of thyroid,liver,and pancreas cancers in the UnitedStates.Cancer Res 74(11):2913-2921.
·Ralla B,Stephan C,Meller S,Dietrich D,Kristiansen G,Jun8 K(2014)Nucleic acid-based biomarkers in body fluids of patients with urologicmalignancies.Crit Rev Clin Lab Sci 51:200-231.
·Rodriguez Pena MDC,Tregnago AC,Eich ML,Springer S,Wang Y,Taheri D,Ertoy D,Fujita K,Bezerra SM,Cunha IW,Raspollini MR,Yu L,Bivalacqua TJ,Papadopoulos N,Kinzler KW,Vogelstein B,Netto GJ(2017)Spectrum of geneticmutations in de novo PUNLMP of the urinary bladder.Virchows Arch.
·Ryan DP,Hong TS,&Bardeesy N(2014)Pancreatic adenocarcinoma.N Engl JMed 371(22):2140-2141.
·Sarkis AS,Bajorin DF,Reuter VE,Herr HW,Netto G,Zhang ZF,Schultz PK,Cordon-Cardo C,Scher HI(1995)Prognostic value of p53 nuclear overexpressionin patients with invasive bladder cancer treated with neoadjuvant MVAC J ClinOncol 13:1384-1390.
·Sarkis AS,Dalbagni G,Cordon-Cardo C,Melamed J,Zhang ZF,Sheinfeld J,Fair WR,Herr HW,Reuter VE(1994)Association of P53 nuclear overexpression andtumor progression in carcinoma in situ of the bladder.J Urol 152:388-392.
·Sarkis AS,Dalbagni G,Cordon-Cardo C,Zhang ZF,Sheinfeld J,Fair WR,Herr HW,Reuter VE(1993)Nuclear overexpression of p53 protein in transitionalcell bladder carcinoma:a marker for disease progression.J Natl Cancer Inst85:53-59.
·Sarosdy MF,Kahn PR,Ziffer MD,Love WR,Barkin J,Abara EO,Jansz K,Bridge JA,Johansson SL,Persons DL,Gibson JS(2006)Use of a multitargetfluorescence in situ hybridization assay to diagnose bladder cancer inpatients with hematuria.J Urol 176:44-47.
·Schnatz et al.,Clinical significance of atypical glandular cells oncervical cytology.Obstetrics and gynecology 107,701-708(2006).
·Scott GA,Laughlin TS,Rothberg PG(2014)Mutations of the TERTpromoter are common in basal cell carcinoma and squamous cell carcinoma.ModPathol 27:516-523.
·Semrad TJ,Fahrni AR,Gong IY,&Khatri VP(2015)IntegratingChemotherapy into the Management of Oligometastatic Colorectal Cancer:Evidence-Based Approach Using Clinical Trial Findings.Ann Surg Oncol 22 Suppl3:S855-862.
·Serizawa RR,Ralfkiaer U,Steven K,Lam GW,Schmiedel S,Schuz J,HansenAB,Horn T,Guldberg P(2010)Integrated genetic and epigenetic analysis ofbladder cancer reveals an additive diagnostic value of FGFR3 mutations andhypermethylation events.Int J Cancer.
·Sharma et al.,Risk of epithelial ovarian cancer in asymptomaticwomen with ultrasound-detected ovarian masses:a prospective cohort studywithin the UK collaborative trial of ovarian cancer screening(UKCTOCS).Ultrasound Obstet Gynecol 40,338-344(2012).
·Siegel RL,Miller KD,Jemal A(2017)Cancer Statistics,2017.CA Cancer JClin 67:7-30
·Siravegna et al.,Integratin8 liquid biopsies into the management ofcancer.Nat Rev Clin Oncol 14,531-548(2017).
·Skacel M,Fahmy M,Brainard JA,Pettay JD,Biscotti CV,Liou LS,ProcopGW,Jones JS,Ulchaker J,Zippe CD,Tubbs RR(2003)Multitarget fluorescence insitu hybridization assay detects transitional cell carcinoma in the majorityof patients with bladder cancer and atypical or negative urine cytology.JUrol 169:2101-2105.
·Song et al.,Prognostic factors in women with synchronousendometrial and ovarian cancers Int J Gynecol Cancer 24,520-527(2014).
·Springer S,et al.(2015)A Combination of Molecular Markers andClinical Features Improve the Classification of PancreaticCysts.Gastroenterology 149(6):1501-1510.
·Steensma et al.,Clonal hematopoiesis of indeterminate potential andits distinction from myelodysplastic syndromes.Blood 126,9-16(2015).
·Stern JL,Theodorescu D,Vogelstein B,Papadopoulos N,Cech TR(2015)Mutation of the TERT promoter,switch to active chromatin,and monoallelic TERTexpression in multiple cancers.Genes Dev 29:2219-2224.
·Takahashi T,Habuchi T,Kakehi Y,Mitsumori K,Akao T,Terachi T,YoshidaO(1998)Clonal and chronological genetic analysis of multifocal cancers of thebladder and upper urinary tract.Cancer Res 58:5835-5841.
·Tao,Direct intrauterine sampling:the IUMC EndometrialSampler.Diagnostic cytopathology 17,153-159(19o7).
·Thomas DS,et al.(2015)Evaluation of serum CEA,CYFRA21-1 and CA125for the early detection of colorectal cancer using longitudinal preclinicalsamples.Br J Cancer 113(2):268-274.
·Thorpe JD,et al.(2007)Effects of blood collection conditions onovarian cancer serum markers.PLoS One 2(12):e1281.
·Tsuchiya R,et al.(1986)Collective review of small carcinomas of thepancreas.Ann Surg 203(1):77-81.
·Uhlen M,et al.(2015)Proteomics.Tissue-based map of the humanproteome.Science 347(6220):1260419.
·Vogelstein B&Kinzler KW(1999)Digital PCR.Proc Natl Acad Sci USA 96(16):9236-9241.
·Vogelstein B,Papadopoulos N,Velculescu VE,Zhou S,Diaz LA,Jr,KinzlerKW(2013)Cancer genome landscapes.Science 339:1546-1558.
·Waddell N,et al.(2015)Whole genomes redefine the mutationallandscape of pancreatic cancer.Nature 518(7540):495-501.
·Walsh et al.,Coexisting ovarian malignancy in young women withendometrial cancer.Obstetrics and gynecology 106,693-699(2005).
·Wang K,Liu T,Ge N,Liu L,Yuan X,Liu J,Kong F,Wang C,Ren H,Yan K,HuS,Xu Z,Bjorkholm M,Fan Y,Zhao S,Liu C,Xu D(2014)TERT promoter mutations areassociated with distant metastases in upper tract urothelial carcinomas andserve as urinary biomarkers detected by a sensitive castPCR Oncotarget 5:12428-12439.
·Wang Y,et al.(2015)Detection of somatic mutations and HPV in thesaliva and plasmaof patients with head and neck squamous cellcarcinomas.Science translational medicine 7(293):293ra104.
·Wang Y,et al.(2015)Detection of tumor-derived DNA in cerebrospinalfluid of patients with primary tumors of the brain and spinal cord.Proc NatlAcad Sci USA 112(31):9704-9709.
·Wang Y,et al.(2016)Diagnostic potential of tumor DNA from ovariancyst fluid.Elife 5.
·Wein AJ,Kavoussi LR,Novick AC,Partin AW,Peters CA(2012)Campbell-Walsh Urology.Saunders,Philadelphia.
·Wilcox CM,et al.(2015)Chronic pancreatitis pain pattern andseverity are independent of abdominal imaging findings.Clin GastroenterolHepatol 13(3):552-560;quiz e528-559.
·Wu et al.,Endometrial brush biopsy(Tao brush).Histologigc diagnosisof 200 cases with complementary cytology:an accurate sampling technique forthe detection or endometrial abnormalities.American journal of clinicalpathology 114,412-418(2000).
·Wu XR(2005)Urothelial tumorigenesis:a tale of divergentpathways.Nat Rev Cancer 5:713-725.
·Xie M,et al.(2014)Age-related mutations associated with clonalhematopoietic expansion and malignancies.Nat Mee 20(12):1472-1478.
·Yafi FA,Brimo F,Steinberg J,Aprikian AG,Tanguay S,Kassouf W(2015)Prospective analysis of sensitivity and specificity of urinary cytology andother urinary biomarkers for bladder cancer.Urol Oncol 33:66.e25-66.e31.
·Young et al.,Clonal haematopoiesis harbouring AML-associatedmutations is ubiquitous in healthy adults.Nat Commun 7,12484(2016).
·Zaino et al.,Simultaneously detected endometrial and ovariancarcinomas--a prospective clinicopathologic study of 74 cases:a gynecologiconcology group study.Gynecologic oncology 83,355-362(2001).
·Zhai et al.,High-grade serous carcinomas arise in the mouse oviductvia defects linked to the human disease.The Journal of pathology 243,16-25(2017).
·Zhang ML,Rosenthal DL,VandenBussche CJ(2016)The cytomorphologicalfeatures of low-grade urothelial neoplasms vary by specimen type CancerCytopathol 124:552-564
·Zhao et al.,Histologic follow-up results in 662 patients with Paptest findings of atypical glandular cells:results from a large academicwomens hospital laboratory employing sensitive screening methods Gynecologiconcology 114,383-389(2009).
·Zhou W,et al.(1998)Identifying markers for pancreatic cancer bygene expression analysis,Cancer Epidemiol Biomarkers Prev 7(2):109-112.
Figure GDA0002675196410009101
Figure GDA0002675196410009111
Figure GDA0002675196410009121
Figure GDA0002675196410009131
Figure GDA0002675196410009141
Figure GDA0002675196410009151
Figure GDA0002675196410009161
Figure GDA0002675196410009171
Figure GDA0002675196410009181
Figure GDA0002675196410009191
Figure GDA0002675196410009201
Figure GDA0002675196410009211
Figure GDA0002675196410009221
Figure GDA0002675196410009231
Figure GDA0002675196410009241
Figure GDA0002675196410009251
Figure GDA0002675196410009261
Figure GDA0002675196410009271
Figure GDA0002675196410009281
Figure GDA0002675196410009291
Figure GDA0002675196410009301
Figure GDA0002675196410009311
Figure GDA0002675196410009321
Figure GDA0002675196410009331
Figure GDA0002675196410009341
Figure GDA0002675196410009351
Figure GDA0002675196410009361
Figure GDA0002675196410009371
Figure GDA0002675196410009381
Figure GDA0002675196410009391
Figure GDA0002675196410009401
Figure GDA0002675196410009411
Figure GDA0002675196410009421
Figure GDA0002675196410009431
Figure GDA0002675196410009441
Figure GDA0002675196410009451
Figure GDA0002675196410009461
Figure GDA0002675196410009471
Figure GDA0002675196410009481
Figure GDA0002675196410009491
Figure GDA0002675196410009501
Figure GDA0002675196410009511
Figure GDA0002675196410009521
Figure GDA0002675196410009531
Figure GDA0002675196410009541
Figure GDA0002675196410009551
Figure GDA0002675196410009561
Figure GDA0002675196410009571
Figure GDA0002675196410009581
Figure GDA0002675196410009591
Figure GDA0002675196410009601
Figure GDA0002675196410009611
Figure GDA0002675196410009621
Figure GDA0002675196410009631
Figure GDA0002675196410009641
Figure GDA0002675196410009651
Figure GDA0002675196410009661
Figure GDA0002675196410009671
Figure GDA0002675196410009681
Figure GDA0002675196410009691
Figure GDA0002675196410009701
Figure GDA0002675196410009711
Figure GDA0002675196410009721
Figure GDA0002675196410009731
Figure GDA0002675196410009741
Figure GDA0002675196410009751
Figure GDA0002675196410009761
Figure GDA0002675196410009771
Figure GDA0002675196410009781
Figure GDA0002675196410009791
Figure GDA0002675196410009801
Figure GDA0002675196410009811
Figure GDA0002675196410009821
Figure GDA0002675196410009831
Figure GDA0002675196410009841
Figure GDA0002675196410009851
Figure GDA0002675196410009861
Figure GDA0002675196410009871
Figure GDA0002675196410009881
Figure GDA0002675196410009891
Figure GDA0002675196410009901
Figure GDA0002675196410009911
Figure GDA0002675196410009921
Figure GDA0002675196410009931
Figure GDA0002675196410009941
Figure GDA0002675196410009951
Figure GDA0002675196410009961
Figure GDA0002675196410009971
Figure GDA0002675196410009981
Figure GDA0002675196410009991
Figure GDA0002675196410010001
Figure GDA0002675196410010011
Figure GDA0002675196410010021
Figure GDA0002675196410010031
Figure GDA0002675196410010041
Figure GDA0002675196410010051
Figure GDA0002675196410010061
Figure GDA0002675196410010071
Figure GDA0002675196410010081
Figure GDA0002675196410010091
Figure GDA0002675196410010101
Figure GDA0002675196410010111
Figure GDA0002675196410010121
Figure GDA0002675196410010131
Figure GDA0002675196410010141
Figure GDA0002675196410010151
Figure GDA0002675196410010161
Figure GDA0002675196410010171
Figure GDA0002675196410010181
Figure GDA0002675196410010191
Figure GDA0002675196410010201
Figure GDA0002675196410010211
Figure GDA0002675196410010221
Figure GDA0002675196410010231
Figure GDA0002675196410010241
Figure GDA0002675196410010251
Figure GDA0002675196410010261
Figure GDA0002675196410010271
Figure GDA0002675196410010281
Figure GDA0002675196410010291
Figure GDA0002675196410010301
Figure GDA0002675196410010311
Figure GDA0002675196410010321
Figure GDA0002675196410010331
Figure GDA0002675196410010341
Figure GDA0002675196410010351
Figure GDA0002675196410010361
Figure GDA0002675196410010371
Figure GDA0002675196410010381
Figure GDA0002675196410010391
Figure GDA0002675196410010401
Figure GDA0002675196410010411
Figure GDA0002675196410010421
Figure GDA0002675196410010431
Figure GDA0002675196410010441
Figure GDA0002675196410010451
Figure GDA0002675196410010461
Figure GDA0002675196410010471
Figure GDA0002675196410010481
Figure GDA0002675196410010491
Figure GDA0002675196410010501
Figure GDA0002675196410010511
Figure GDA0002675196410010521
Figure GDA0002675196410010531
Figure GDA0002675196410010541
Figure GDA0002675196410010551
Figure GDA0002675196410010561
Figure GDA0002675196410010571
Figure GDA0002675196410010581
Figure GDA0002675196410010591
Figure GDA0002675196410010601
Figure GDA0002675196410010611
Figure GDA0002675196410010621
Figure GDA0002675196410010631
Figure GDA0002675196410010641
Figure GDA0002675196410010651
Figure GDA0002675196410010661
Figure GDA0002675196410010671
Figure GDA0002675196410010681
Figure GDA0002675196410010691
Figure GDA0002675196410010701
Figure GDA0002675196410010711
Figure GDA0002675196410010721
Figure GDA0002675196410010731
Figure GDA0002675196410010741
Figure GDA0002675196410010751
Figure GDA0002675196410010761
Figure GDA0002675196410010771
Figure GDA0002675196410010781
Figure GDA0002675196410010791
Figure GDA0002675196410010801
Figure GDA0002675196410010811
Figure GDA0002675196410010821
Figure GDA0002675196410010831
Figure GDA0002675196410010841
Figure GDA0002675196410010851
Figure GDA0002675196410010861
Figure GDA0002675196410010871
Figure GDA0002675196410010881
Figure GDA0002675196410010891
Figure GDA0002675196410010901
Figure GDA0002675196410010911
Figure GDA0002675196410010921
Figure GDA0002675196410010931
Figure GDA0002675196410010941
Figure GDA0002675196410010951
Figure GDA0002675196410010961
Figure GDA0002675196410010971
Figure GDA0002675196410010981
Figure GDA0002675196410010991
Figure GDA0002675196410011001
Figure GDA0002675196410011011
Figure GDA0002675196410011021
Figure GDA0002675196410011031
Figure GDA0002675196410011041
Figure GDA0002675196410011051
Figure GDA0002675196410011061
Figure GDA0002675196410011071
Figure GDA0002675196410011081
Figure GDA0002675196410011091
Figure GDA0002675196410011101
Figure GDA0002675196410011111
Figure GDA0002675196410011121
Figure GDA0002675196410011131
Figure GDA0002675196410011141
Figure GDA0002675196410011151
Figure GDA0002675196410011161
Figure GDA0002675196410011171
Figure GDA0002675196410011181
Figure GDA0002675196410011191
Figure GDA0002675196410011201
Figure GDA0002675196410011211
Figure GDA0002675196410011221
Figure GDA0002675196410011231
Figure GDA0002675196410011241
Figure GDA0002675196410011251
Figure GDA0002675196410011261
Figure GDA0002675196410011271
Figure GDA0002675196410011281
Figure GDA0002675196410011291
Figure GDA0002675196410011301
Figure GDA0002675196410011311
Figure GDA0002675196410011321
Figure GDA0002675196410011331
Figure GDA0002675196410011341
Figure GDA0002675196410011351
Figure GDA0002675196410011361
Figure GDA0002675196410011371
Figure GDA0002675196410011381
Figure GDA0002675196410011391
Figure GDA0002675196410011401
Figure GDA0002675196410011411
Figure GDA0002675196410011421
Figure GDA0002675196410011431
Figure GDA0002675196410011441
Figure GDA0002675196410011451
Figure GDA0002675196410011461
Figure GDA0002675196410011471
Figure GDA0002675196410011481
Figure GDA0002675196410011491
Figure GDA0002675196410011501
Figure GDA0002675196410011511
Figure GDA0002675196410011521
Figure GDA0002675196410011531
Figure GDA0002675196410011541
Figure GDA0002675196410011551
Figure GDA0002675196410011561
Figure GDA0002675196410011571
Figure GDA0002675196410011581
Figure GDA0002675196410011591
Figure GDA0002675196410011601
Figure GDA0002675196410011611
Figure GDA0002675196410011621
Figure GDA0002675196410011631
Figure GDA0002675196410011641
Figure GDA0002675196410011651
Figure GDA0002675196410011661
Figure GDA0002675196410011671
Figure GDA0002675196410011681
Figure GDA0002675196410011691
Figure GDA0002675196410011701
Figure GDA0002675196410011711
Figure GDA0002675196410011721
Figure GDA0002675196410011731
Figure GDA0002675196410011741
Figure GDA0002675196410011751
Figure GDA0002675196410011761
Figure GDA0002675196410011771
Figure GDA0002675196410011781
Figure GDA0002675196410011791
Figure GDA0002675196410011801
Figure GDA0002675196410011811
Figure GDA0002675196410011821
Figure GDA0002675196410011831
Figure GDA0002675196410011841
Figure GDA0002675196410011851
Figure GDA0002675196410011861
Figure GDA0002675196410011871
Figure GDA0002675196410011881
Figure GDA0002675196410011891
Figure GDA0002675196410011901
Figure GDA0002675196410011911
Figure GDA0002675196410011921
Figure GDA0002675196410011931
Figure GDA0002675196410011941
Figure GDA0002675196410011951
Figure GDA0002675196410011961
Figure GDA0002675196410011971
Figure GDA0002675196410011981
Figure GDA0002675196410011991
Figure GDA0002675196410012001
Figure GDA0002675196410012011
Figure GDA0002675196410012021
Figure GDA0002675196410012031
Figure GDA0002675196410012041
Figure GDA0002675196410012051
Figure GDA0002675196410012061
Figure GDA0002675196410012071
Figure GDA0002675196410012081
Figure GDA0002675196410012091
Figure GDA0002675196410012101
Figure GDA0002675196410012111
Figure GDA0002675196410012121
Figure GDA0002675196410012131
Figure GDA0002675196410012141
Figure GDA0002675196410012151
Figure GDA0002675196410012161
Figure GDA0002675196410012171
Figure GDA0002675196410012181
Figure GDA0002675196410012191
Figure GDA0002675196410012201
Figure GDA0002675196410012211
Figure GDA0002675196410012221
Figure GDA0002675196410012231
Figure GDA0002675196410012241
Figure GDA0002675196410012251
Figure GDA0002675196410012271
Figure GDA0002675196410012281
Figure GDA0002675196410012291
Figure GDA0002675196410012301
Figure GDA0002675196410012311
Figure GDA0002675196410012321
Figure GDA0002675196410012331
Figure GDA0002675196410012341
Figure GDA0002675196410012351
Figure GDA0002675196410012361
Figure GDA0002675196410012371
Figure GDA0002675196410012381
Figure GDA0002675196410012391
Figure GDA0002675196410012401
Figure GDA0002675196410012411
Figure GDA0002675196410012421
Figure GDA0002675196410012431
Figure GDA0002675196410012441
Figure GDA0002675196410012451
Figure GDA0002675196410012461
Figure GDA0002675196410012471
Figure GDA0002675196410012481
Figure GDA0002675196410012491
Figure GDA0002675196410012501
Figure GDA0002675196410012511
Figure GDA0002675196410012521
Figure GDA0002675196410012531
Figure GDA0002675196410012541
Figure GDA0002675196410012551
Figure GDA0002675196410012561
Figure GDA0002675196410012571
Figure GDA0002675196410012581
Figure GDA0002675196410012591
Figure GDA0002675196410012601
Figure GDA0002675196410012611
Figure GDA0002675196410012621
Figure GDA0002675196410012631
Figure GDA0002675196410012641
Figure GDA0002675196410012651
Figure GDA0002675196410012661
Figure GDA0002675196410012671
Figure GDA0002675196410012681
Figure GDA0002675196410012691
Figure GDA0002675196410012701
Figure GDA0002675196410012711
Figure GDA0002675196410012721
Figure GDA0002675196410012731
Figure GDA0002675196410012741
Figure GDA0002675196410012751
Figure GDA0002675196410012761
Figure GDA0002675196410012771
Figure GDA0002675196410012781
Figure GDA0002675196410012791
Figure GDA0002675196410012801
Figure GDA0002675196410012811
Figure GDA0002675196410012821
Figure GDA0002675196410012831
Figure GDA0002675196410012841
Figure GDA0002675196410012851
Figure GDA0002675196410012861
Figure GDA0002675196410012871
Figure GDA0002675196410012881
Figure GDA0002675196410012891
Figure GDA0002675196410012901
Figure GDA0002675196410012911
Figure GDA0002675196410012921
Figure GDA0002675196410012931
Figure GDA0002675196410012941
Figure GDA0002675196410012951
Figure GDA0002675196410012961
Figure GDA0002675196410012971
Figure GDA0002675196410012981
Figure GDA0002675196410012991
Figure GDA0002675196410013001
Figure GDA0002675196410013011
Figure GDA0002675196410013021
Figure GDA0002675196410013031
Figure GDA0002675196410013041
Figure GDA0002675196410013051
Figure GDA0002675196410013061
Figure GDA0002675196410013071
Figure GDA0002675196410013081
Figure GDA0002675196410013091
Figure GDA0002675196410013101
Figure GDA0002675196410013111
Figure GDA0002675196410013121
Figure GDA0002675196410013131
Figure GDA0002675196410013141
Figure GDA0002675196410013151
Figure GDA0002675196410013161
Figure GDA0002675196410013171
Figure GDA0002675196410013181
Figure GDA0002675196410013191
Figure GDA0002675196410013201
Figure GDA0002675196410013211
Figure GDA0002675196410013221
Figure GDA0002675196410013231
Figure GDA0002675196410013241
Figure GDA0002675196410013251
Figure GDA0002675196410013261
Figure GDA0002675196410013271
Figure GDA0002675196410013281
Figure GDA0002675196410013291
Figure GDA0002675196410013301
Figure GDA0002675196410013311
Figure GDA0002675196410013321
Figure GDA0002675196410013331
Figure GDA0002675196410013341
Figure GDA0002675196410013351
Figure GDA0002675196410013361
Figure GDA0002675196410013371
Figure GDA0002675196410013381
Figure GDA0002675196410013391
Figure GDA0002675196410013401
Figure GDA0002675196410013411
Figure GDA0002675196410013421
Figure GDA0002675196410013431
Figure GDA0002675196410013441
Figure GDA0002675196410013451
Figure GDA0002675196410013461
Figure GDA0002675196410013471
Figure GDA0002675196410013481
Figure GDA0002675196410013491
Figure GDA0002675196410013501
Figure GDA0002675196410013511
Figure GDA0002675196410013521
Figure GDA0002675196410013531
Figure GDA0002675196410013541
Figure GDA0002675196410013551
Figure GDA0002675196410013561
Figure GDA0002675196410013571
Figure GDA0002675196410013581
Figure GDA0002675196410013591
Figure GDA0002675196410013601
Figure GDA0002675196410013611
Figure GDA0002675196410013621
Figure GDA0002675196410013631
Figure GDA0002675196410013641
Figure GDA0002675196410013651
Figure GDA0002675196410013661
Figure GDA0002675196410013671
Figure GDA0002675196410013681
Figure GDA0002675196410013691
Figure GDA0002675196410013701
Figure GDA0002675196410013711
Figure GDA0002675196410013721
Figure GDA0002675196410013731
Figure GDA0002675196410013741
Figure GDA0002675196410013751
Figure GDA0002675196410013761
Figure GDA0002675196410013771
Figure GDA0002675196410013781
Figure GDA0002675196410013791
Figure GDA0002675196410013801
Figure GDA0002675196410013811
Figure GDA0002675196410013821
Figure GDA0002675196410013831
Figure GDA0002675196410013841
Figure GDA0002675196410013851
Figure GDA0002675196410013861
Figure GDA0002675196410013871
Figure GDA0002675196410013881
Figure GDA0002675196410013891
Figure GDA0002675196410013901
Figure GDA0002675196410013911
Figure GDA0002675196410013921
Figure GDA0002675196410013931
Figure GDA0002675196410013941
Figure GDA0002675196410013951
Figure GDA0002675196410013961
Figure GDA0002675196410013971
Figure GDA0002675196410013981
Figure GDA0002675196410013991
Figure GDA0002675196410014001
Figure GDA0002675196410014011
Figure GDA0002675196410014021
Figure GDA0002675196410014031
Figure GDA0002675196410014041
Figure GDA0002675196410014051
Figure GDA0002675196410014061
Figure GDA0002675196410014071
Figure GDA0002675196410014081
Figure GDA0002675196410014091
Figure GDA0002675196410014101
Figure GDA0002675196410014111
Figure GDA0002675196410014121
Figure GDA0002675196410014131
Figure GDA0002675196410014141
Figure GDA0002675196410014151
Figure GDA0002675196410014161
Figure GDA0002675196410014171
Figure GDA0002675196410014181
Figure GDA0002675196410014191
Figure GDA0002675196410014201
Figure GDA0002675196410014211
Figure GDA0002675196410014221
Figure GDA0002675196410014231
Figure GDA0002675196410014241
Figure GDA0002675196410014251
Figure GDA0002675196410014261
Figure GDA0002675196410014271
Figure GDA0002675196410014281
Figure GDA0002675196410014291
Figure GDA0002675196410014301
Figure GDA0002675196410014311
Figure GDA0002675196410014321
Figure GDA0002675196410014331
Figure GDA0002675196410014341
Figure GDA0002675196410014351
Figure GDA0002675196410014361
Figure GDA0002675196410014371
Figure GDA0002675196410014381
Figure GDA0002675196410014391
Figure GDA0002675196410014401
Figure GDA0002675196410014411
Figure GDA0002675196410014421
Figure GDA0002675196410014431
Figure GDA0002675196410014441
Figure GDA0002675196410014451
Figure GDA0002675196410014461
Figure GDA0002675196410014471
Figure GDA0002675196410014481
Figure GDA0002675196410014491
Figure GDA0002675196410014501
Figure GDA0002675196410014511
Figure GDA0002675196410014521
Figure GDA0002675196410014531
Figure GDA0002675196410014541
Figure GDA0002675196410014551
Figure GDA0002675196410014561
Figure GDA0002675196410014571
Figure GDA0002675196410014581
Figure GDA0002675196410014591
Figure GDA0002675196410014601
Figure GDA0002675196410014611
Figure GDA0002675196410014621
Figure GDA0002675196410014631
Figure GDA0002675196410014641
Figure GDA0002675196410014651
Figure GDA0002675196410014661
Figure GDA0002675196410014671
Figure GDA0002675196410014681
Figure GDA0002675196410014691
Figure GDA0002675196410014701
Figure GDA0002675196410014711
Figure GDA0002675196410014721
Figure GDA0002675196410014731
Figure GDA0002675196410014741
Figure GDA0002675196410014751
Figure GDA0002675196410014761
Figure GDA0002675196410014771
Figure GDA0002675196410014781
Figure GDA0002675196410014791
Figure GDA0002675196410014801
Figure GDA0002675196410014811
Figure GDA0002675196410014821
Figure GDA0002675196410014831
Figure GDA0002675196410014841
Figure GDA0002675196410014851
Figure GDA0002675196410014861
Figure GDA0002675196410014871
Figure GDA0002675196410014881
Figure GDA0002675196410014891
Figure GDA0002675196410014901
Figure GDA0002675196410014911
Figure GDA0002675196410014921
Figure GDA0002675196410014931
Figure GDA0002675196410014941
Figure GDA0002675196410014951
Figure GDA0002675196410014961
Figure GDA0002675196410014971
Figure GDA0002675196410014981
Figure GDA0002675196410014991
Figure GDA0002675196410015001
Figure GDA0002675196410015011
Figure GDA0002675196410015021
Figure GDA0002675196410015031
Figure GDA0002675196410015041
Figure GDA0002675196410015051
Figure GDA0002675196410015061
Figure GDA0002675196410015071
Figure GDA0002675196410015081
Figure GDA0002675196410015091
Figure GDA0002675196410015101
Figure GDA0002675196410015111
Figure GDA0002675196410015121
Figure GDA0002675196410015131
Figure GDA0002675196410015141
Figure GDA0002675196410015151
Figure GDA0002675196410015161
Figure GDA0002675196410015171
Figure GDA0002675196410015181
Figure GDA0002675196410015191
Figure GDA0002675196410015201
Figure GDA0002675196410015211
Figure GDA0002675196410015221
Figure GDA0002675196410015231
Figure GDA0002675196410015241
Figure GDA0002675196410015251
Figure GDA0002675196410015261
Figure GDA0002675196410015271
Figure GDA0002675196410015281
Figure GDA0002675196410015291
Figure GDA0002675196410015301
Figure GDA0002675196410015311
Figure GDA0002675196410015321
Figure GDA0002675196410015331
Figure GDA0002675196410015341
Figure GDA0002675196410015351
Figure GDA0002675196410015361
Figure GDA0002675196410015371
Figure GDA0002675196410015381
Figure GDA0002675196410015391
Figure GDA0002675196410015401
Figure GDA0002675196410015411
Figure GDA0002675196410015421
Figure GDA0002675196410015431
Figure GDA0002675196410015441
Figure GDA0002675196410015451
Figure GDA0002675196410015461
Figure GDA0002675196410015471
Figure GDA0002675196410015481
Figure GDA0002675196410015491
Figure GDA0002675196410015501
Figure GDA0002675196410015511
Figure GDA0002675196410015521
Figure GDA0002675196410015531
Figure GDA0002675196410015541
Figure GDA0002675196410015551
Figure GDA0002675196410015561
Figure GDA0002675196410015571
Figure GDA0002675196410015581
Figure GDA0002675196410015591
Figure GDA0002675196410015601
Figure GDA0002675196410015611
Figure GDA0002675196410015621
Figure GDA0002675196410015631
Figure GDA0002675196410015641
Figure GDA0002675196410015651
Figure GDA0002675196410015661
Figure GDA0002675196410015671
Figure GDA0002675196410015681
Figure GDA0002675196410015691
Figure GDA0002675196410015701
Figure GDA0002675196410015711
Figure GDA0002675196410015721
Figure GDA0002675196410015731
Figure GDA0002675196410015741
Figure GDA0002675196410015751
Figure GDA0002675196410015761
Figure GDA0002675196410015771
Figure GDA0002675196410015781
Figure GDA0002675196410015791
Figure GDA0002675196410015801
Figure GDA0002675196410015811
Figure GDA0002675196410015821
Figure GDA0002675196410015831
Figure GDA0002675196410015841
Figure GDA0002675196410015851
Figure GDA0002675196410015861
Figure GDA0002675196410015871
Figure GDA0002675196410015881
Figure GDA0002675196410015891
Figure GDA0002675196410015901
Figure GDA0002675196410015911
Figure GDA0002675196410015921
Figure GDA0002675196410015931
Figure GDA0002675196410015941
Figure GDA0002675196410015951
Figure GDA0002675196410015961
Figure GDA0002675196410015971
Figure GDA0002675196410015981
Figure GDA0002675196410015991
Figure GDA0002675196410016001
Figure GDA0002675196410016011
Figure GDA0002675196410016021
Figure GDA0002675196410016031
Figure GDA0002675196410016041
Figure GDA0002675196410016051
Figure GDA0002675196410016061
Figure GDA0002675196410016071
Figure GDA0002675196410016081
Figure GDA0002675196410016091
Figure GDA0002675196410016101
Figure GDA0002675196410016111
Figure GDA0002675196410016121
Figure GDA0002675196410016131
Figure GDA0002675196410016141
Figure GDA0002675196410016151
Figure GDA0002675196410016161
Figure GDA0002675196410016171
Figure GDA0002675196410016181
Figure GDA0002675196410016191
Figure GDA0002675196410016201
Figure GDA0002675196410016211
Figure GDA0002675196410016221
Figure GDA0002675196410016231
Figure GDA0002675196410016241
Figure GDA0002675196410016251
Figure GDA0002675196410016261
Figure GDA0002675196410016271
Figure GDA0002675196410016281
Figure GDA0002675196410016291
Figure GDA0002675196410016301
Figure GDA0002675196410016311
Figure GDA0002675196410016321
Figure GDA0002675196410016331
Figure GDA0002675196410016341
Figure GDA0002675196410016351
Figure GDA0002675196410016361
Figure GDA0002675196410016371
Figure GDA0002675196410016381
Figure GDA0002675196410016391
Figure GDA0002675196410016401
Figure GDA0002675196410016411
Figure GDA0002675196410016421
Figure GDA0002675196410016431
Figure GDA0002675196410016441
Figure GDA0002675196410016451
Figure GDA0002675196410016461
Figure GDA0002675196410016471
Figure GDA0002675196410016481
Figure GDA0002675196410016491
Figure GDA0002675196410016501
Figure GDA0002675196410016511
Figure GDA0002675196410016521
Figure GDA0002675196410016531
Figure GDA0002675196410016541
Figure GDA0002675196410016551
Figure GDA0002675196410016561
Figure GDA0002675196410016571
Figure GDA0002675196410016581
Figure GDA0002675196410016591
Figure GDA0002675196410016601
Figure GDA0002675196410016611
Figure GDA0002675196410016621
Figure GDA0002675196410016631
Figure GDA0002675196410016641
Figure GDA0002675196410016651
Figure GDA0002675196410016661
Figure GDA0002675196410016671
Figure GDA0002675196410016681
Figure GDA0002675196410016691
Figure GDA0002675196410016701
Figure GDA0002675196410016711
Figure GDA0002675196410016721
Figure GDA0002675196410016731
Figure GDA0002675196410016741
Figure GDA0002675196410016751
Figure GDA0002675196410016761
Figure GDA0002675196410016771
Figure GDA0002675196410016781
Figure GDA0002675196410016791
Figure GDA0002675196410016801
Figure GDA0002675196410016811
Figure GDA0002675196410016821
Figure GDA0002675196410016831
Figure GDA0002675196410016841
Figure GDA0002675196410016851
Figure GDA0002675196410016861
Figure GDA0002675196410016871
Figure GDA0002675196410016881
Figure GDA0002675196410016891
Figure GDA0002675196410016901
Figure GDA0002675196410016911
Figure GDA0002675196410016921
Figure GDA0002675196410016931
Figure GDA0002675196410016941
Figure GDA0002675196410016951
Figure GDA0002675196410016961
Figure GDA0002675196410016971
Figure GDA0002675196410016981
Figure GDA0002675196410016991
Figure GDA0002675196410017001
Figure GDA0002675196410017011
Figure GDA0002675196410017021
Figure GDA0002675196410017031
Figure GDA0002675196410017041
Figure GDA0002675196410017051
Figure GDA0002675196410017071
Figure GDA0002675196410017081
Figure GDA0002675196410017091
Figure GDA0002675196410017101
Figure GDA0002675196410017111
Figure GDA0002675196410017121
Figure GDA0002675196410017131
Figure GDA0002675196410017141
Figure GDA0002675196410017151
Figure GDA0002675196410017161
Figure GDA0002675196410017171
Figure GDA0002675196410017181
Figure GDA0002675196410017191
Figure GDA0002675196410017201
Figure GDA0002675196410017211
Figure GDA0002675196410017221
Figure GDA0002675196410017231
Figure GDA0002675196410017241
Figure GDA0002675196410017251
Figure GDA0002675196410017261
Figure GDA0002675196410017271
Figure GDA0002675196410017281
Figure GDA0002675196410017291
Figure GDA0002675196410017301
Figure GDA0002675196410017311
Figure GDA0002675196410017321
Figure GDA0002675196410017331
Figure GDA0002675196410017341
Figure GDA0002675196410017351
Figure GDA0002675196410017361
Figure GDA0002675196410017371
Figure GDA0002675196410017381
Figure GDA0002675196410017391
Figure GDA0002675196410017401
Figure GDA0002675196410017411
Figure GDA0002675196410017421
Figure GDA0002675196410017431
Figure GDA0002675196410017441
Figure GDA0002675196410017451
Figure GDA0002675196410017461
Figure GDA0002675196410017471
Figure GDA0002675196410017481
Figure GDA0002675196410017491
Figure GDA0002675196410017501
Figure GDA0002675196410017511
Figure GDA0002675196410017521
Figure GDA0002675196410017531
Figure GDA0002675196410017541
Figure GDA0002675196410017551
Figure GDA0002675196410017561
Figure GDA0002675196410017571
Figure GDA0002675196410017581
Figure GDA0002675196410017591
Figure GDA0002675196410017601
Figure GDA0002675196410017611
Figure GDA0002675196410017621
Figure GDA0002675196410017631
Figure GDA0002675196410017641
Figure GDA0002675196410017651
Figure GDA0002675196410017661
Figure GDA0002675196410017671
Figure GDA0002675196410017681
Figure GDA0002675196410017691
Figure GDA0002675196410017701
Figure GDA0002675196410017711
Figure GDA0002675196410017721
Figure GDA0002675196410017731
Figure GDA0002675196410017741
Figure GDA0002675196410017751
Figure GDA0002675196410017761
Figure GDA0002675196410017771
Figure GDA0002675196410017781
Figure GDA0002675196410017791
Figure GDA0002675196410017801
Figure GDA0002675196410017811
Figure GDA0002675196410017821
Figure GDA0002675196410017831
Figure GDA0002675196410017841
Figure GDA0002675196410017851
Figure GDA0002675196410017861
Figure GDA0002675196410017871
Figure GDA0002675196410017881
Figure GDA0002675196410017891
Figure GDA0002675196410017901
Figure GDA0002675196410017911
Figure GDA0002675196410017921
Figure GDA0002675196410017931
Figure GDA0002675196410017941
Figure GDA0002675196410017951
Figure GDA0002675196410017961
Figure GDA0002675196410017971
Figure GDA0002675196410017981
Figure GDA0002675196410017991
Figure GDA0002675196410018001
Figure GDA0002675196410018011
Figure GDA0002675196410018021
Figure GDA0002675196410018031
Figure GDA0002675196410018041
Figure GDA0002675196410018051
Figure GDA0002675196410018061
Figure GDA0002675196410018071
Figure GDA0002675196410018081
Figure GDA0002675196410018091
Figure GDA0002675196410018101
Figure GDA0002675196410018111
Figure GDA0002675196410018121
Figure GDA0002675196410018131
Figure GDA0002675196410018141
Figure GDA0002675196410018151
Figure GDA0002675196410018161
Figure GDA0002675196410018171
Figure GDA0002675196410018181
Figure GDA0002675196410018191
Figure GDA0002675196410018201
Figure GDA0002675196410018211
Figure GDA0002675196410018221
Figure GDA0002675196410018231
Figure GDA0002675196410018241
Figure GDA0002675196410018251
Figure GDA0002675196410018261
Figure GDA0002675196410018271
Figure GDA0002675196410018281
Figure GDA0002675196410018291
Figure GDA0002675196410018301
Figure GDA0002675196410018311
Figure GDA0002675196410018321
Figure GDA0002675196410018331
Figure GDA0002675196410018341
Figure GDA0002675196410018351
Figure GDA0002675196410018361
Figure GDA0002675196410018371
Figure GDA0002675196410018381
Figure GDA0002675196410018391
Figure GDA0002675196410018401
Figure GDA0002675196410018411
Figure GDA0002675196410018421
Figure GDA0002675196410018431
Figure GDA0002675196410018441
Figure GDA0002675196410018451
Figure GDA0002675196410018461
Figure GDA0002675196410018471
Figure GDA0002675196410018481
Figure GDA0002675196410018491
Figure GDA0002675196410018501
Figure GDA0002675196410018511
Figure GDA0002675196410018521
Figure GDA0002675196410018531
Figure GDA0002675196410018541
Figure GDA0002675196410018551
Figure GDA0002675196410018561
Figure GDA0002675196410018571
Figure GDA0002675196410018581
Figure GDA0002675196410018591
Figure GDA0002675196410018601
Figure GDA0002675196410018611
Figure GDA0002675196410018621
Figure GDA0002675196410018631
Figure GDA0002675196410018641
Figure GDA0002675196410018651
Figure GDA0002675196410018661
Figure GDA0002675196410018671
Figure GDA0002675196410018681
Figure GDA0002675196410018691
Figure GDA0002675196410018701
Figure GDA0002675196410018711
Figure GDA0002675196410018721
Figure GDA0002675196410018731
Figure GDA0002675196410018741
Figure GDA0002675196410018751
Figure GDA0002675196410018761
Figure GDA0002675196410018771
Figure GDA0002675196410018781
Figure GDA0002675196410018791
Figure GDA0002675196410018801
Figure GDA0002675196410018811
Figure GDA0002675196410018821
Figure GDA0002675196410018831
Figure GDA0002675196410018841
Figure GDA0002675196410018851
Figure GDA0002675196410018861
Figure GDA0002675196410018871
Figure GDA0002675196410018881
Figure GDA0002675196410018891
Figure GDA0002675196410018901
Figure GDA0002675196410018911
Figure GDA0002675196410018921
Figure GDA0002675196410018931
Figure GDA0002675196410018941
Figure GDA0002675196410018951
Figure GDA0002675196410018961
Figure GDA0002675196410018971
Figure GDA0002675196410018981
Figure GDA0002675196410018991
Figure GDA0002675196410019001
Figure GDA0002675196410019011
Figure GDA0002675196410019021
Figure GDA0002675196410019031
Figure GDA0002675196410019041
Figure GDA0002675196410019051
Figure GDA0002675196410019061
Figure GDA0002675196410019071
Figure GDA0002675196410019081
Figure GDA0002675196410019091
Figure GDA0002675196410019101
Figure GDA0002675196410019111
Figure GDA0002675196410019121
Figure GDA0002675196410019131
Figure GDA0002675196410019141
Figure GDA0002675196410019151
Figure GDA0002675196410019161
Figure GDA0002675196410019171
Figure GDA0002675196410019181
Figure GDA0002675196410019191
Figure GDA0002675196410019201
Figure GDA0002675196410019211
Figure GDA0002675196410019221
Figure GDA0002675196410019231
Figure GDA0002675196410019241
Figure GDA0002675196410019251
Figure GDA0002675196410019261
Figure GDA0002675196410019271
Figure GDA0002675196410019281
Figure GDA0002675196410019291
Figure GDA0002675196410019301
Figure GDA0002675196410019311
Figure GDA0002675196410019321
Figure GDA0002675196410019331
Figure GDA0002675196410019341
Figure GDA0002675196410019351
Figure GDA0002675196410019361
Figure GDA0002675196410019371
Figure GDA0002675196410019381
Figure GDA0002675196410019391
Figure GDA0002675196410019401
Figure GDA0002675196410019411
Figure GDA0002675196410019421
Figure GDA0002675196410019431
Figure GDA0002675196410019441
Figure GDA0002675196410019451
Figure GDA0002675196410019461
Figure GDA0002675196410019471
Figure GDA0002675196410019481
Figure GDA0002675196410019491
Figure GDA0002675196410019501
Figure GDA0002675196410019511
Figure GDA0002675196410019521
Figure GDA0002675196410019531
Figure GDA0002675196410019541
Figure GDA0002675196410019551
Figure GDA0002675196410019561
Figure GDA0002675196410019571
Figure GDA0002675196410019581
Figure GDA0002675196410019591
Figure GDA0002675196410019601
Figure GDA0002675196410019611
Figure GDA0002675196410019621
Figure GDA0002675196410019631
Figure GDA0002675196410019641
Figure GDA0002675196410019651
Figure GDA0002675196410019661
Figure GDA0002675196410019671
Figure GDA0002675196410019681
Figure GDA0002675196410019691
Figure GDA0002675196410019701
Figure GDA0002675196410019711
Figure GDA0002675196410019721
Figure GDA0002675196410019731
Figure GDA0002675196410019741
Figure GDA0002675196410019751
Figure GDA0002675196410019761
Figure GDA0002675196410019771
Figure GDA0002675196410019781
Figure GDA0002675196410019791
Figure GDA0002675196410019801
Figure GDA0002675196410019811
Figure GDA0002675196410019821
Figure GDA0002675196410019831
Figure GDA0002675196410019841
Figure GDA0002675196410019851
Figure GDA0002675196410019861
Figure GDA0002675196410019871
Figure GDA0002675196410019881
Figure GDA0002675196410019891
Figure GDA0002675196410019901
Figure GDA0002675196410019911
Figure GDA0002675196410019921
Figure GDA0002675196410019931
Figure GDA0002675196410019941
Figure GDA0002675196410019951
Figure GDA0002675196410019961
Figure GDA0002675196410019971
Figure GDA0002675196410019981
Figure GDA0002675196410019991
Figure GDA0002675196410020001
Figure GDA0002675196410020011
Figure GDA0002675196410020021
Figure GDA0002675196410020031
Figure GDA0002675196410020041
Figure GDA0002675196410020051
Figure GDA0002675196410020061
Figure GDA0002675196410020071
Figure GDA0002675196410020081
Figure GDA0002675196410020091
Figure GDA0002675196410020101
Figure GDA0002675196410020111
Figure GDA0002675196410020121
Figure GDA0002675196410020131
Figure GDA0002675196410020141
Figure GDA0002675196410020151
Figure GDA0002675196410020161
Figure GDA0002675196410020171
Figure GDA0002675196410020181
Figure GDA0002675196410020191
Figure GDA0002675196410020201
Figure GDA0002675196410020211
Figure GDA0002675196410020221
Figure GDA0002675196410020231
Figure GDA0002675196410020241
Figure GDA0002675196410020251
Figure GDA0002675196410020261
Figure GDA0002675196410020271
Figure GDA0002675196410020281
Figure GDA0002675196410020291
Figure GDA0002675196410020301
Figure GDA0002675196410020311
Figure GDA0002675196410020321
Figure GDA0002675196410020331
Figure GDA0002675196410020341
Figure GDA0002675196410020351
Figure GDA0002675196410020361
Figure GDA0002675196410020371
Figure GDA0002675196410020381
Figure GDA0002675196410020391
Figure GDA0002675196410020401
Figure GDA0002675196410020411
Figure GDA0002675196410020421
Figure GDA0002675196410020431
Figure GDA0002675196410020441
Figure GDA0002675196410020451
Figure GDA0002675196410020461
Figure GDA0002675196410020471
Figure GDA0002675196410020481
Figure GDA0002675196410020491
Figure GDA0002675196410020501
Figure GDA0002675196410020511
Figure GDA0002675196410020521
Figure GDA0002675196410020531
Figure GDA0002675196410020541
Figure GDA0002675196410020551
Figure GDA0002675196410020561
Figure GDA0002675196410020571
Figure GDA0002675196410020581
Figure GDA0002675196410020591
Figure GDA0002675196410020601
Figure GDA0002675196410020611
Figure GDA0002675196410020621
Figure GDA0002675196410020631
Figure GDA0002675196410020641
Figure GDA0002675196410020651
Figure GDA0002675196410020661
Figure GDA0002675196410020671
Figure GDA0002675196410020681
Figure GDA0002675196410020691
Figure GDA0002675196410020701
Figure GDA0002675196410020711
Figure GDA0002675196410020721
Figure GDA0002675196410020731
Figure GDA0002675196410020741
Figure GDA0002675196410020751
Figure GDA0002675196410020761
Figure GDA0002675196410020771
Figure GDA0002675196410020781
Figure GDA0002675196410020791
Figure GDA0002675196410020801
Figure GDA0002675196410020811
Figure GDA0002675196410020821
Figure GDA0002675196410020831
Figure GDA0002675196410020841
Figure GDA0002675196410020851
Figure GDA0002675196410020861
Figure GDA0002675196410020871
Figure GDA0002675196410020881
Figure GDA0002675196410020891
Figure GDA0002675196410020901
Figure GDA0002675196410020911
Figure GDA0002675196410020921
Figure GDA0002675196410020931
Figure GDA0002675196410020941
Figure GDA0002675196410020951
Figure GDA0002675196410020961
Figure GDA0002675196410020971
Figure GDA0002675196410020981
Figure GDA0002675196410020991
Figure GDA0002675196410021001
Figure GDA0002675196410021011
Figure GDA0002675196410021021
Figure GDA0002675196410021031
Figure GDA0002675196410021041
Figure GDA0002675196410021051
Figure GDA0002675196410021061
Figure GDA0002675196410021071
Figure GDA0002675196410021081
Figure GDA0002675196410021091
Figure GDA0002675196410021101
Figure GDA0002675196410021111
Figure GDA0002675196410021121
Figure GDA0002675196410021131
Figure GDA0002675196410021141
Figure GDA0002675196410021151
Figure GDA0002675196410021161
Figure GDA0002675196410021171
Figure GDA0002675196410021181
Figure GDA0002675196410021191
Figure GDA0002675196410021201
Figure GDA0002675196410021211
Figure GDA0002675196410021221
Figure GDA0002675196410021231
Figure GDA0002675196410021241
Figure GDA0002675196410021251
Figure GDA0002675196410021261
Figure GDA0002675196410021271
Figure GDA0002675196410021281
Figure GDA0002675196410021291
Figure GDA0002675196410021301
Figure GDA0002675196410021311
Figure GDA0002675196410021321
Figure GDA0002675196410021331
Figure GDA0002675196410021341
Figure GDA0002675196410021351
Figure GDA0002675196410021361
Figure GDA0002675196410021371
Figure GDA0002675196410021381
Figure GDA0002675196410021391
Figure GDA0002675196410021401
Figure GDA0002675196410021411
Figure GDA0002675196410021421
Figure GDA0002675196410021431
Figure GDA0002675196410021441
Figure GDA0002675196410021451
Figure GDA0002675196410021461
Figure GDA0002675196410021471
Figure GDA0002675196410021481
Figure GDA0002675196410021491
Figure GDA0002675196410021501
Figure GDA0002675196410021511
Figure GDA0002675196410021521
Figure GDA0002675196410021531
Figure GDA0002675196410021541
Figure GDA0002675196410021551
Figure GDA0002675196410021561
Figure GDA0002675196410021571
Figure GDA0002675196410021581
Figure GDA0002675196410021591
Figure GDA0002675196410021601
Figure GDA0002675196410021611
Figure GDA0002675196410021621
Figure GDA0002675196410021631
Figure GDA0002675196410021641
Figure GDA0002675196410021651
Figure GDA0002675196410021661
Figure GDA0002675196410021671
Figure GDA0002675196410021681
Figure GDA0002675196410021691
Figure GDA0002675196410021701
Figure GDA0002675196410021711
Figure GDA0002675196410021721
Figure GDA0002675196410021731
Figure GDA0002675196410021741
Figure GDA0002675196410021751
Figure GDA0002675196410021761
Figure GDA0002675196410021771
Figure GDA0002675196410021781
Figure GDA0002675196410021791
Figure GDA0002675196410021801
Figure GDA0002675196410021811
Figure GDA0002675196410021821
Figure GDA0002675196410021831
Figure GDA0002675196410021841
Figure GDA0002675196410021851
Figure GDA0002675196410021861
Figure GDA0002675196410021871
Figure GDA0002675196410021881
Figure GDA0002675196410021891
Figure GDA0002675196410021901
Figure GDA0002675196410021911
Figure GDA0002675196410021921
Figure GDA0002675196410021931
Figure GDA0002675196410021941
Figure GDA0002675196410021951
Figure GDA0002675196410021961
Figure GDA0002675196410021971
Figure GDA0002675196410021981
Figure GDA0002675196410021991
Figure GDA0002675196410022001
Figure GDA0002675196410022011
Figure GDA0002675196410022021
Figure GDA0002675196410022031
Figure GDA0002675196410022041
Figure GDA0002675196410022051
Figure GDA0002675196410022061
Figure GDA0002675196410022071
Figure GDA0002675196410022081
Figure GDA0002675196410022091
Figure GDA0002675196410022101
Figure GDA0002675196410022111
Figure GDA0002675196410022121
Figure GDA0002675196410022131
Figure GDA0002675196410022141
Figure GDA0002675196410022151
Figure GDA0002675196410022161
Figure GDA0002675196410022171
Figure GDA0002675196410022181
Figure GDA0002675196410022191
Figure GDA0002675196410022201
Figure GDA0002675196410022211
Figure GDA0002675196410022221
Figure GDA0002675196410022231
Figure GDA0002675196410022241
Figure GDA0002675196410022251
Figure GDA0002675196410022261
Figure GDA0002675196410022271
Figure GDA0002675196410022281
Figure GDA0002675196410022291
Figure GDA0002675196410022301
Figure GDA0002675196410022311
Figure GDA0002675196410022321
Figure GDA0002675196410022331
Figure GDA0002675196410022341
Figure GDA0002675196410022351
Figure GDA0002675196410022361
Figure GDA0002675196410022371
Figure GDA0002675196410022381
Figure GDA0002675196410022391
Figure GDA0002675196410022401
Figure GDA0002675196410022411
Figure GDA0002675196410022421
Figure GDA0002675196410022431
Figure GDA0002675196410022441
Figure GDA0002675196410022451
Figure GDA0002675196410022461
Figure GDA0002675196410022471
Figure GDA0002675196410022481
Figure GDA0002675196410022491
Figure GDA0002675196410022501
Figure GDA0002675196410022511
Figure GDA0002675196410022521
Figure GDA0002675196410022531
Figure GDA0002675196410022541
Figure GDA0002675196410022551
Figure GDA0002675196410022561
Figure GDA0002675196410022571
Figure GDA0002675196410022581
Figure GDA0002675196410022591
Figure GDA0002675196410022601
Figure GDA0002675196410022611
Figure GDA0002675196410022621
Figure GDA0002675196410022631
Figure GDA0002675196410022641
Figure GDA0002675196410022651
Figure GDA0002675196410022661
Figure GDA0002675196410022671
Figure GDA0002675196410022681
Figure GDA0002675196410022691
Figure GDA0002675196410022701
Figure GDA0002675196410022711
Figure GDA0002675196410022721
Figure GDA0002675196410022731
Figure GDA0002675196410022741
Figure GDA0002675196410022751
Figure GDA0002675196410022761
Figure GDA0002675196410022771
Figure GDA0002675196410022781
Figure GDA0002675196410022791
Figure GDA0002675196410022801
Figure GDA0002675196410022811
Figure GDA0002675196410022821
Figure GDA0002675196410022831
Figure GDA0002675196410022841
Figure GDA0002675196410022851
Figure GDA0002675196410022861
Figure GDA0002675196410022871
Figure GDA0002675196410022881
Figure GDA0002675196410022891
Figure GDA0002675196410022901
Figure GDA0002675196410022911
Figure GDA0002675196410022921
Figure GDA0002675196410022931
Figure GDA0002675196410022941
Figure GDA0002675196410022951
Figure GDA0002675196410022961
Figure GDA0002675196410022971
Figure GDA0002675196410022981
Figure GDA0002675196410022991
Figure GDA0002675196410023001
Figure GDA0002675196410023011
Figure GDA0002675196410023021
Figure GDA0002675196410023031
Figure GDA0002675196410023041
Figure GDA0002675196410023051
Figure GDA0002675196410023061
Figure GDA0002675196410023071
Figure GDA0002675196410023081
Figure GDA0002675196410023091
Figure GDA0002675196410023101
Figure GDA0002675196410023111
Figure GDA0002675196410023121
Figure GDA0002675196410023131
Figure GDA0002675196410023141
Figure GDA0002675196410023151
Figure GDA0002675196410023161
Figure GDA0002675196410023171
Figure GDA0002675196410023181
Figure GDA0002675196410023191
Figure GDA0002675196410023201
Figure GDA0002675196410023211
Figure GDA0002675196410023221
Figure GDA0002675196410023231
Figure GDA0002675196410023241
Figure GDA0002675196410023251
Figure GDA0002675196410023261
Figure GDA0002675196410023271
Figure GDA0002675196410023281
Figure GDA0002675196410023291
Figure GDA0002675196410023301
Figure GDA0002675196410023311
Figure GDA0002675196410023321
Figure GDA0002675196410023331
Figure GDA0002675196410023341
Figure GDA0002675196410023351
Figure GDA0002675196410023361
Figure GDA0002675196410023371
Figure GDA0002675196410023381
Figure GDA0002675196410023391
Figure GDA0002675196410023401
Figure GDA0002675196410023411
Figure GDA0002675196410023421
Figure GDA0002675196410023431
Figure GDA0002675196410023441
Figure GDA0002675196410023451
Figure GDA0002675196410023461
Figure GDA0002675196410023471
Figure GDA0002675196410023481
Figure GDA0002675196410023491
Figure GDA0002675196410023501
Figure GDA0002675196410023511
Figure GDA0002675196410023521
Figure GDA0002675196410023531
Figure GDA0002675196410023541
Figure GDA0002675196410023551
Figure GDA0002675196410023561
Figure GDA0002675196410023571
Figure GDA0002675196410023581
Figure GDA0002675196410023591
Figure GDA0002675196410023601
Figure GDA0002675196410023611
Figure GDA0002675196410023621
Figure GDA0002675196410023631
Figure GDA0002675196410023641
Figure GDA0002675196410023651
Figure GDA0002675196410023661
Figure GDA0002675196410023671
Figure GDA0002675196410023681
Figure GDA0002675196410023691
Figure GDA0002675196410023701
Figure GDA0002675196410023711
Figure GDA0002675196410023721
Figure GDA0002675196410023731
Figure GDA0002675196410023741
Figure GDA0002675196410023751
Figure GDA0002675196410023761
Figure GDA0002675196410023771
Figure GDA0002675196410023781
Figure GDA0002675196410023791
Figure GDA0002675196410023801
Figure GDA0002675196410023811
Figure GDA0002675196410023821
Figure GDA0002675196410023831
Figure GDA0002675196410023841
Figure GDA0002675196410023851
Figure GDA0002675196410023861
Figure GDA0002675196410023871
Figure GDA0002675196410023881
Figure GDA0002675196410023891
Figure GDA0002675196410023901
Figure GDA0002675196410023911
Figure GDA0002675196410023921
Figure GDA0002675196410023931
Figure GDA0002675196410023941
Figure GDA0002675196410023951
Figure GDA0002675196410023961
Figure GDA0002675196410023971
Figure GDA0002675196410023981
Figure GDA0002675196410023991
Figure GDA0002675196410024001
Figure GDA0002675196410024011
Figure GDA0002675196410024021
Figure GDA0002675196410024031
Figure GDA0002675196410024041
Figure GDA0002675196410024051
Figure GDA0002675196410024061
Figure GDA0002675196410024071
Figure GDA0002675196410024081
Figure GDA0002675196410024091
Figure GDA0002675196410024101
Figure GDA0002675196410024111
Figure GDA0002675196410024121
Figure GDA0002675196410024131
Figure GDA0002675196410024141
Figure GDA0002675196410024151
Figure GDA0002675196410024161
Figure GDA0002675196410024171
Figure GDA0002675196410024181
Figure GDA0002675196410024191
Figure GDA0002675196410024201
Figure GDA0002675196410024211
Figure GDA0002675196410024221
Figure GDA0002675196410024231
Figure GDA0002675196410024241
Figure GDA0002675196410024251
Figure GDA0002675196410024261
Figure GDA0002675196410024271
Figure GDA0002675196410024281
Figure GDA0002675196410024291
Figure GDA0002675196410024301
Figure GDA0002675196410024311
Figure GDA0002675196410024321
Figure GDA0002675196410024331
Figure GDA0002675196410024341
Figure GDA0002675196410024351
Figure GDA0002675196410024361
Figure GDA0002675196410024371
Figure GDA0002675196410024381
Figure GDA0002675196410024391
Figure GDA0002675196410024401
Figure GDA0002675196410024411
Figure GDA0002675196410024421
Figure GDA0002675196410024431
Figure GDA0002675196410024441
Figure GDA0002675196410024451
Figure GDA0002675196410024461
Figure GDA0002675196410024471
Figure GDA0002675196410024481
Figure GDA0002675196410024491
Figure GDA0002675196410024501
Figure GDA0002675196410024511
Figure GDA0002675196410024521
Figure GDA0002675196410024531
Figure GDA0002675196410024541
Figure GDA0002675196410024551
Figure GDA0002675196410024561
Figure GDA0002675196410024571
Figure GDA0002675196410024581
Figure GDA0002675196410024591
Figure GDA0002675196410024601
Figure GDA0002675196410024611
Figure GDA0002675196410024621
Figure GDA0002675196410024631
Figure GDA0002675196410024641
Figure GDA0002675196410024651
Figure GDA0002675196410024661
Figure GDA0002675196410024671
Figure GDA0002675196410024681
Figure GDA0002675196410024691
Figure GDA0002675196410024701
Figure GDA0002675196410024711
Figure GDA0002675196410024721
Figure GDA0002675196410024731
Figure GDA0002675196410024741
Figure GDA0002675196410024751
Figure GDA0002675196410024761
Figure GDA0002675196410024771
Figure GDA0002675196410024781
Figure GDA0002675196410024791
Figure GDA0002675196410024801
Figure GDA0002675196410024811
Figure GDA0002675196410024821
Figure GDA0002675196410024831
Figure GDA0002675196410024841
Figure GDA0002675196410024851
Figure GDA0002675196410024861
Figure GDA0002675196410024871
Figure GDA0002675196410024881
Figure GDA0002675196410024891
Figure GDA0002675196410024901
Figure GDA0002675196410024911
Figure GDA0002675196410024921
Figure GDA0002675196410024931
Figure GDA0002675196410024941
Figure GDA0002675196410024951
Figure GDA0002675196410024961
Figure GDA0002675196410024971
Figure GDA0002675196410024981
Figure GDA0002675196410024991
Figure GDA0002675196410025001
Figure GDA0002675196410025011
Figure GDA0002675196410025021
Figure GDA0002675196410025031
Figure GDA0002675196410025041
Figure GDA0002675196410025051
Figure GDA0002675196410025061
Figure GDA0002675196410025071
Figure GDA0002675196410025081
Figure GDA0002675196410025091
Figure GDA0002675196410025101
Figure GDA0002675196410025111
Figure GDA0002675196410025121
Figure GDA0002675196410025131
Figure GDA0002675196410025141
Figure GDA0002675196410025151
Figure GDA0002675196410025161
Figure GDA0002675196410025171
Figure GDA0002675196410025181
Figure GDA0002675196410025191
Figure GDA0002675196410025201
Figure GDA0002675196410025211
Figure GDA0002675196410025221
Figure GDA0002675196410025231
Figure GDA0002675196410025241
Figure GDA0002675196410025251
Figure GDA0002675196410025261
Figure GDA0002675196410025271
Figure GDA0002675196410025281
Figure GDA0002675196410025291
Figure GDA0002675196410025301
Figure GDA0002675196410025311
Figure GDA0002675196410025321
Figure GDA0002675196410025331
Figure GDA0002675196410025341
Figure GDA0002675196410025351
Figure GDA0002675196410025361
Figure GDA0002675196410025371
Figure GDA0002675196410025381
Figure GDA0002675196410025391
Figure GDA0002675196410025401
Figure GDA0002675196410025411
Figure GDA0002675196410025421
Figure GDA0002675196410025431
Figure GDA0002675196410025441
Figure GDA0002675196410025451
Figure GDA0002675196410025461
Figure GDA0002675196410025471
Figure GDA0002675196410025481
Figure GDA0002675196410025491
Figure GDA0002675196410025501
Figure GDA0002675196410025511
Figure GDA0002675196410025521
Figure GDA0002675196410025531
Figure GDA0002675196410025541
Figure GDA0002675196410025551
Figure GDA0002675196410025561
Figure GDA0002675196410025571
Figure GDA0002675196410025581
Figure GDA0002675196410025591
Figure GDA0002675196410025601
Figure GDA0002675196410025611
Figure GDA0002675196410025621
Figure GDA0002675196410025631
Figure GDA0002675196410025641
Figure GDA0002675196410025651
Figure GDA0002675196410025661
Figure GDA0002675196410025671
Figure GDA0002675196410025681
Figure GDA0002675196410025691
Figure GDA0002675196410025711
Figure GDA0002675196410025721
Figure GDA0002675196410025731
Figure GDA0002675196410025741
Figure GDA0002675196410025751
Figure GDA0002675196410025761
Figure GDA0002675196410025771
Figure GDA0002675196410025781
Figure GDA0002675196410025791
Figure GDA0002675196410025801
Figure GDA0002675196410025811
Figure GDA0002675196410025821
Figure GDA0002675196410025831
Figure GDA0002675196410025841
Figure GDA0002675196410025851
Figure GDA0002675196410025861
Figure GDA0002675196410025871
Figure GDA0002675196410025881
Figure GDA0002675196410025891
Figure GDA0002675196410025901
Figure GDA0002675196410025911
Figure GDA0002675196410025921
Figure GDA0002675196410025931
Figure GDA0002675196410025941
Figure GDA0002675196410025951
Figure GDA0002675196410025961
Figure GDA0002675196410025971
Figure GDA0002675196410025981
Figure GDA0002675196410025991
Figure GDA0002675196410026001
Figure GDA0002675196410026011
Figure GDA0002675196410026021
Figure GDA0002675196410026031
Figure GDA0002675196410026041
Figure GDA0002675196410026051
Figure GDA0002675196410026061
Figure GDA0002675196410026071
Figure GDA0002675196410026081
Figure GDA0002675196410026091
Figure GDA0002675196410026101
Figure GDA0002675196410026111
Figure GDA0002675196410026121
Figure GDA0002675196410026131
Figure GDA0002675196410026141
Figure GDA0002675196410026151
Figure GDA0002675196410026161
Figure GDA0002675196410026171
Figure GDA0002675196410026181
Figure GDA0002675196410026191
Figure GDA0002675196410026201
Figure GDA0002675196410026211
Figure GDA0002675196410026221
Figure GDA0002675196410026231
Figure GDA0002675196410026241
Figure GDA0002675196410026251
Figure GDA0002675196410026261
Figure GDA0002675196410026271
Figure GDA0002675196410026281
Figure GDA0002675196410026291
Figure GDA0002675196410026301
Figure GDA0002675196410026311
Figure GDA0002675196410026321
Figure GDA0002675196410026331
Figure GDA0002675196410026341
Figure GDA0002675196410026351
Figure GDA0002675196410026361
Figure GDA0002675196410026371
Figure GDA0002675196410026381
Figure GDA0002675196410026391
Figure GDA0002675196410026401
Figure GDA0002675196410026411
Figure GDA0002675196410026421
Figure GDA0002675196410026431
Figure GDA0002675196410026441
Figure GDA0002675196410026451
Figure GDA0002675196410026461
Figure GDA0002675196410026471
Figure GDA0002675196410026481
Figure GDA0002675196410026491
Figure GDA0002675196410026501
Figure GDA0002675196410026511
Figure GDA0002675196410026521
Figure GDA0002675196410026531
Figure GDA0002675196410026541
Figure GDA0002675196410026551
Figure GDA0002675196410026561
Figure GDA0002675196410026571
Figure GDA0002675196410026581
Figure GDA0002675196410026591
Figure GDA0002675196410026601
Figure GDA0002675196410026611
Figure GDA0002675196410026621
Figure GDA0002675196410026631
Figure GDA0002675196410026641
Figure GDA0002675196410026651
Figure GDA0002675196410026661
Figure GDA0002675196410026671
Figure GDA0002675196410026681
Figure GDA0002675196410026691
Figure GDA0002675196410026701
Figure GDA0002675196410026711
Figure GDA0002675196410026721
Figure GDA0002675196410026731
Figure GDA0002675196410026741
Figure GDA0002675196410026751
Figure GDA0002675196410026761
Figure GDA0002675196410026771
Figure GDA0002675196410026781
Figure GDA0002675196410026791
Figure GDA0002675196410026801
Figure GDA0002675196410026811
Figure GDA0002675196410026821
Figure GDA0002675196410026831
Figure GDA0002675196410026841
Figure GDA0002675196410026851
Figure GDA0002675196410026861
Figure GDA0002675196410026871
Figure GDA0002675196410026881
Figure GDA0002675196410026891
Figure GDA0002675196410026901
Figure GDA0002675196410026911
Figure GDA0002675196410026921
Figure GDA0002675196410026931
Figure GDA0002675196410026941
Figure GDA0002675196410026951
Figure GDA0002675196410026961
Figure GDA0002675196410026971
Figure GDA0002675196410026981
Figure GDA0002675196410026991
Figure GDA0002675196410027001
Figure GDA0002675196410027011
Figure GDA0002675196410027021
Figure GDA0002675196410027031
Figure GDA0002675196410027041
Figure GDA0002675196410027051
Figure GDA0002675196410027061
Figure GDA0002675196410027071
Figure GDA0002675196410027081
Figure GDA0002675196410027091
Figure GDA0002675196410027101
Figure GDA0002675196410027111
Figure GDA0002675196410027121
Figure GDA0002675196410027131
Figure GDA0002675196410027141
Figure GDA0002675196410027151
Figure GDA0002675196410027161
Figure GDA0002675196410027171
Figure GDA0002675196410027181
Figure GDA0002675196410027191
Figure GDA0002675196410027201
Figure GDA0002675196410027211
Figure GDA0002675196410027221
Figure GDA0002675196410027241
Figure GDA0002675196410027251
Figure GDA0002675196410027261
Figure GDA0002675196410027271
Figure GDA0002675196410027281
Figure GDA0002675196410027291
Figure GDA0002675196410027301
Figure GDA0002675196410027311
Figure GDA0002675196410027321
Figure GDA0002675196410027331
Figure GDA0002675196410027341
Figure GDA0002675196410027351
Figure GDA0002675196410027361
Figure GDA0002675196410027371
Figure GDA0002675196410027381
Figure GDA0002675196410027391
Figure GDA0002675196410027401
Figure GDA0002675196410027411
Figure GDA0002675196410027421
Figure GDA0002675196410027431
Figure GDA0002675196410027441
Figure GDA0002675196410027451
Figure GDA0002675196410027461
Figure GDA0002675196410027471
Figure GDA0002675196410027481
Figure GDA0002675196410027491
Figure GDA0002675196410027501
Figure GDA0002675196410027511
Figure GDA0002675196410027521
Figure GDA0002675196410027531
Figure GDA0002675196410027541
Figure GDA0002675196410027551
Figure GDA0002675196410027561
Figure GDA0002675196410027571
Figure GDA0002675196410027581
Figure GDA0002675196410027591
Figure GDA0002675196410027601
Figure GDA0002675196410027611
Figure GDA0002675196410027621
Figure GDA0002675196410027631
Figure GDA0002675196410027641
Figure GDA0002675196410027651
Figure GDA0002675196410027661
Figure GDA0002675196410027671
Figure GDA0002675196410027681
Figure GDA0002675196410027691
Figure GDA0002675196410027701
Figure GDA0002675196410027711
Figure GDA0002675196410027721
Figure GDA0002675196410027731
Figure GDA0002675196410027741
Figure GDA0002675196410027751
Figure GDA0002675196410027761
Figure GDA0002675196410027771
Figure GDA0002675196410027781
Figure GDA0002675196410027791
Figure GDA0002675196410027801
Figure GDA0002675196410027811
Figure GDA0002675196410027821
Figure GDA0002675196410027831
Figure GDA0002675196410027841
Figure GDA0002675196410027851
Figure GDA0002675196410027861
Figure GDA0002675196410027871
Figure GDA0002675196410027881
Figure GDA0002675196410027891
Figure GDA0002675196410027901
Figure GDA0002675196410027911
Figure GDA0002675196410027921
Figure GDA0002675196410027931
Figure GDA0002675196410027941
Figure GDA0002675196410027951
Figure GDA0002675196410027961
Figure GDA0002675196410027971
Figure GDA0002675196410027981
Figure GDA0002675196410027991
Figure GDA0002675196410028001
Figure GDA0002675196410028011
Figure GDA0002675196410028021
Figure GDA0002675196410028031
Figure GDA0002675196410028041
Figure GDA0002675196410028051
Figure GDA0002675196410028061
Figure GDA0002675196410028071
Figure GDA0002675196410028081
Figure GDA0002675196410028091
Figure GDA0002675196410028101
Figure GDA0002675196410028111
Figure GDA0002675196410028121
Figure GDA0002675196410028131
Figure GDA0002675196410028141
Figure GDA0002675196410028151
Figure GDA0002675196410028161
Figure GDA0002675196410028171
Figure GDA0002675196410028181
Figure GDA0002675196410028191
Figure GDA0002675196410028201
Figure GDA0002675196410028211
Figure GDA0002675196410028221
Figure GDA0002675196410028231
Figure GDA0002675196410028241
Figure GDA0002675196410028251
Figure GDA0002675196410028261
Figure GDA0002675196410028271
Figure GDA0002675196410028281
Figure GDA0002675196410028291
Figure GDA0002675196410028301
Figure GDA0002675196410028311
Figure GDA0002675196410028321
Figure GDA0002675196410028331
Figure GDA0002675196410028341
Figure GDA0002675196410028351
Figure GDA0002675196410028361
Figure GDA0002675196410028371
Figure GDA0002675196410028381
Figure GDA0002675196410028391
Figure GDA0002675196410028401
Figure GDA0002675196410028411
Figure GDA0002675196410028421
Figure GDA0002675196410028431
Figure GDA0002675196410028441
Figure GDA0002675196410028451
Figure GDA0002675196410028461
Figure GDA0002675196410028481
Figure GDA0002675196410028491
Figure GDA0002675196410028501
Figure GDA0002675196410028511
Figure GDA0002675196410028521
Figure GDA0002675196410028531
Figure GDA0002675196410028541
Figure GDA0002675196410028551
Figure GDA0002675196410028561
Figure GDA0002675196410028571
Figure GDA0002675196410028581
Figure GDA0002675196410028591
Figure GDA0002675196410028601
Figure GDA0002675196410028611
Figure GDA0002675196410028621
Figure GDA0002675196410028631
Figure GDA0002675196410028641
Figure GDA0002675196410028651
Figure GDA0002675196410028661
Figure GDA0002675196410028671
Figure GDA0002675196410028681
Figure GDA0002675196410028691
Figure GDA0002675196410028701
Figure GDA0002675196410028711
Figure GDA0002675196410028721
Figure GDA0002675196410028731
Figure GDA0002675196410028741
Figure GDA0002675196410028751
Figure GDA0002675196410028761
Figure GDA0002675196410028771
Figure GDA0002675196410028781
Figure GDA0002675196410028791
Figure GDA0002675196410028801
Figure GDA0002675196410028811
Figure GDA0002675196410028821
Figure GDA0002675196410028831
Figure GDA0002675196410028841
Figure GDA0002675196410028851
Figure GDA0002675196410028861
Figure GDA0002675196410028871
Figure GDA0002675196410028881
Figure GDA0002675196410028891
Figure GDA0002675196410028901
Figure GDA0002675196410028911
Figure GDA0002675196410028921
Figure GDA0002675196410028931
Figure GDA0002675196410028941
Figure GDA0002675196410028951
Figure GDA0002675196410028961
Figure GDA0002675196410028971
Figure GDA0002675196410028981
Figure GDA0002675196410028991
Figure GDA0002675196410029001
Figure GDA0002675196410029011
Figure GDA0002675196410029021
Figure GDA0002675196410029031
Figure GDA0002675196410029041
Figure GDA0002675196410029051
Figure GDA0002675196410029061
Figure GDA0002675196410029071
Figure GDA0002675196410029081
Figure GDA0002675196410029091
Figure GDA0002675196410029101
Figure GDA0002675196410029111
Figure GDA0002675196410029121
Figure GDA0002675196410029131
Figure GDA0002675196410029141
Figure GDA0002675196410029151
Figure GDA0002675196410029161
Figure GDA0002675196410029171
Figure GDA0002675196410029181
Figure GDA0002675196410029191
Figure GDA0002675196410029201
Figure GDA0002675196410029211
Figure GDA0002675196410029221
Figure GDA0002675196410029231
Figure GDA0002675196410029241
Figure GDA0002675196410029251
Figure GDA0002675196410029261
Figure GDA0002675196410029271
Figure GDA0002675196410029281
Figure GDA0002675196410029291
Figure GDA0002675196410029301
Figure GDA0002675196410029311
Figure GDA0002675196410029321
Figure GDA0002675196410029331
Figure GDA0002675196410029341
Figure GDA0002675196410029351
Figure GDA0002675196410029361
Figure GDA0002675196410029371
Figure GDA0002675196410029381
Figure GDA0002675196410029391
Figure GDA0002675196410029401
Figure GDA0002675196410029411
Figure GDA0002675196410029421
Figure GDA0002675196410029431
Figure GDA0002675196410029441
Figure GDA0002675196410029451
Figure GDA0002675196410029461
Figure GDA0002675196410029471
Figure GDA0002675196410029481
Figure GDA0002675196410029491
Figure GDA0002675196410029501
Figure GDA0002675196410029511
Figure GDA0002675196410029521
Figure GDA0002675196410029531
Figure GDA0002675196410029541
Figure GDA0002675196410029551
Figure GDA0002675196410029561
Figure GDA0002675196410029571
Figure GDA0002675196410029581
Figure GDA0002675196410029591
Figure GDA0002675196410029601
Figure GDA0002675196410029611
Figure GDA0002675196410029621
Figure GDA0002675196410029631
Figure GDA0002675196410029641
Figure GDA0002675196410029651
Figure GDA0002675196410029661
Figure GDA0002675196410029671
Figure GDA0002675196410029681
Figure GDA0002675196410029691
Figure GDA0002675196410029701
Figure GDA0002675196410029711
Figure GDA0002675196410029721
Figure GDA0002675196410029731
Figure GDA0002675196410029741
Figure GDA0002675196410029751
Figure GDA0002675196410029761
Figure GDA0002675196410029771
Figure GDA0002675196410029781
Figure GDA0002675196410029791
Figure GDA0002675196410029801
Figure GDA0002675196410029811
Figure GDA0002675196410029821
Figure GDA0002675196410029831
Figure GDA0002675196410029841
Figure GDA0002675196410029851
Figure GDA0002675196410029861
Figure GDA0002675196410029871
Figure GDA0002675196410029881
Figure GDA0002675196410029891
Figure GDA0002675196410029901
Figure GDA0002675196410029911
Figure GDA0002675196410029921
Figure GDA0002675196410029931
Figure GDA0002675196410029941
Figure GDA0002675196410029951
Figure GDA0002675196410029961
Figure GDA0002675196410029971
Figure GDA0002675196410029981
Figure GDA0002675196410029991
Figure GDA0002675196410030001
Figure GDA0002675196410030011
Figure GDA0002675196410030021
Figure GDA0002675196410030031
Figure GDA0002675196410030041
Figure GDA0002675196410030051
Figure GDA0002675196410030061
Figure GDA0002675196410030071
Figure GDA0002675196410030081
Figure GDA0002675196410030091
Figure GDA0002675196410030101
Figure GDA0002675196410030111
Figure GDA0002675196410030121
Figure GDA0002675196410030131
Figure GDA0002675196410030141
Figure GDA0002675196410030151
Figure GDA0002675196410030161
Figure GDA0002675196410030171
Figure GDA0002675196410030181
Figure GDA0002675196410030191
Figure GDA0002675196410030201
Figure GDA0002675196410030211
Figure GDA0002675196410030221
Figure GDA0002675196410030231
Figure GDA0002675196410030241
Figure GDA0002675196410030251
Figure GDA0002675196410030261
Figure GDA0002675196410030271
Figure GDA0002675196410030281
Figure GDA0002675196410030291
Figure GDA0002675196410030301
Figure GDA0002675196410030311
Figure GDA0002675196410030321
Figure GDA0002675196410030331
Figure GDA0002675196410030341
Figure GDA0002675196410030351
Figure GDA0002675196410030361
Figure GDA0002675196410030371
Figure GDA0002675196410030381
Figure GDA0002675196410030391
Figure GDA0002675196410030401
Figure GDA0002675196410030411
Figure GDA0002675196410030421
Figure GDA0002675196410030431
Figure GDA0002675196410030441
Figure GDA0002675196410030451
Figure GDA0002675196410030461
Figure GDA0002675196410030471
Figure GDA0002675196410030481
Figure GDA0002675196410030491
Figure GDA0002675196410030501
Figure GDA0002675196410030511
Figure GDA0002675196410030521
Figure GDA0002675196410030531
Figure GDA0002675196410030541
Figure GDA0002675196410030551
Figure GDA0002675196410030561
Figure GDA0002675196410030571
Figure GDA0002675196410030581
Figure GDA0002675196410030591
Figure GDA0002675196410030601
Figure GDA0002675196410030611
Figure GDA0002675196410030621
Figure GDA0002675196410030631
Figure GDA0002675196410030641
Figure GDA0002675196410030651
Figure GDA0002675196410030661
Figure GDA0002675196410030671
Figure GDA0002675196410030681
Figure GDA0002675196410030691
Figure GDA0002675196410030701
Figure GDA0002675196410030711
Figure GDA0002675196410030721
Figure GDA0002675196410030731
Figure GDA0002675196410030741
Figure GDA0002675196410030751
Figure GDA0002675196410030761
Figure GDA0002675196410030771
Figure GDA0002675196410030781
Figure GDA0002675196410030791
Figure GDA0002675196410030801
Figure GDA0002675196410030811
Figure GDA0002675196410030821
Figure GDA0002675196410030831
Figure GDA0002675196410030841
Figure GDA0002675196410030851
Figure GDA0002675196410030861
Figure GDA0002675196410030871
Figure GDA0002675196410030881
Figure GDA0002675196410030891
Figure GDA0002675196410030901
Figure GDA0002675196410030911
Figure GDA0002675196410030921
Figure GDA0002675196410030931
Figure GDA0002675196410030941
Figure GDA0002675196410030951
Figure GDA0002675196410030961
Figure GDA0002675196410030971
Figure GDA0002675196410030981
Figure GDA0002675196410030991
Figure GDA0002675196410031001
Figure GDA0002675196410031011
Figure GDA0002675196410031021
Figure GDA0002675196410031031
Figure GDA0002675196410031041
Figure GDA0002675196410031051
Figure GDA0002675196410031061
Figure GDA0002675196410031071
Figure GDA0002675196410031081
Figure GDA0002675196410031091
Figure GDA0002675196410031101
Figure GDA0002675196410031111
Figure GDA0002675196410031121
Figure GDA0002675196410031131
Figure GDA0002675196410031141
Figure GDA0002675196410031151
Figure GDA0002675196410031161
Figure GDA0002675196410031171
Figure GDA0002675196410031181
Figure GDA0002675196410031191
Figure GDA0002675196410031201
Figure GDA0002675196410031211
Figure GDA0002675196410031221
Figure GDA0002675196410031231
Figure GDA0002675196410031241
Figure GDA0002675196410031251
Figure GDA0002675196410031261
Figure GDA0002675196410031271
Figure GDA0002675196410031281
Figure GDA0002675196410031291
Figure GDA0002675196410031301
Figure GDA0002675196410031311
Figure GDA0002675196410031321
Figure GDA0002675196410031331
Figure GDA0002675196410031341
Figure GDA0002675196410031351
Figure GDA0002675196410031361
Figure GDA0002675196410031371
Figure GDA0002675196410031381
Figure GDA0002675196410031391
Figure GDA0002675196410031401
Figure GDA0002675196410031411
Figure GDA0002675196410031421
Figure GDA0002675196410031431
Figure GDA0002675196410031441
Figure GDA0002675196410031451
Figure GDA0002675196410031461
Figure GDA0002675196410031471
Figure GDA0002675196410031481
Figure IDA0002444979580000011
Figure IDA0002444979580000021
Figure IDA0002444979580000031
Figure IDA0002444979580000041
Figure IDA0002444979580000051
Figure IDA0002444979580000061
Figure IDA0002444979580000071
Figure IDA0002444979580000081
Figure IDA0002444979580000091
Figure IDA0002444979580000101
Figure IDA0002444979580000111
Figure IDA0002444979580000121
Figure IDA0002444979580000131
Figure IDA0002444979580000141
Figure IDA0002444979580000151
Figure IDA0002444979580000161
Figure IDA0002444979580000171
Figure IDA0002444979580000181
Figure IDA0002444979580000191
Figure IDA0002444979580000201
Figure IDA0002444979580000211
Figure IDA0002444979580000221
Figure IDA0002444979580000231
Figure IDA0002444979580000241
Figure IDA0002444979580000251
Figure IDA0002444979580000261
Figure IDA0002444979580000271
Figure IDA0002444979580000281
Figure IDA0002444979580000291
Figure IDA0002444979580000301
Figure IDA0002444979580000311
Figure IDA0002444979580000321
Figure IDA0002444979580000331
Figure IDA0002444979580000341
Figure IDA0002444979580000351
Figure IDA0002444979580000361
Figure IDA0002444979580000371
Figure IDA0002444979580000381
Figure IDA0002444979580000391
Figure IDA0002444979580000401
Figure IDA0002444979580000411
Figure IDA0002444979580000421
Figure IDA0002444979580000431
Figure IDA0002444979580000441
Figure IDA0002444979580000451
Figure IDA0002444979580000461
Figure IDA0002444979580000471
Figure IDA0002444979580000481
Figure IDA0002444979580000491
Figure IDA0002444979580000501
Figure IDA0002444979580000511
Figure IDA0002444979580000521
Figure IDA0002444979580000531
Figure IDA0002444979580000541
Figure IDA0002444979580000551
Figure IDA0002444979580000561
Figure IDA0002444979580000571
Figure IDA0002444979580000581
Figure IDA0002444979580000591
Figure IDA0002444979580000601
Figure IDA0002444979580000611
Figure IDA0002444979580000621
Figure IDA0002444979580000631
Figure IDA0002444979580000641
Figure IDA0002444979580000651
Figure IDA0002444979580000661
Figure IDA0002444979580000671
Figure IDA0002444979580000681
Figure IDA0002444979580000691
Figure IDA0002444979580000701
Figure IDA0002444979580000711
Figure IDA0002444979580000721
Figure IDA0002444979580000731
Figure IDA0002444979580000741
Figure IDA0002444979580000751
Figure IDA0002444979580000761
Figure IDA0002444979580000771
Figure IDA0002444979580000781
Figure IDA0002444979580000791
Figure IDA0002444979580000801
Figure IDA0002444979580000811
Figure IDA0002444979580000821
Figure IDA0002444979580000831
Figure IDA0002444979580000841
Figure IDA0002444979580000851
Figure IDA0002444979580000861
Figure IDA0002444979580000871
Figure IDA0002444979580000881
Figure IDA0002444979580000891
Figure IDA0002444979580000901
Figure IDA0002444979580000911
Figure IDA0002444979580000921
Figure IDA0002444979580000931
Figure IDA0002444979580000941
Figure IDA0002444979580000951
Figure IDA0002444979580000961
Figure IDA0002444979580000971
Figure IDA0002444979580000981
Figure IDA0002444979580000991
Figure IDA0002444979580001001
Figure IDA0002444979580001011
Figure IDA0002444979580001021
Figure IDA0002444979580001031
Figure IDA0002444979580001041
Figure IDA0002444979580001051
Figure IDA0002444979580001061
Figure IDA0002444979580001071
Figure IDA0002444979580001081
Figure IDA0002444979580001091
Figure IDA0002444979580001101
Figure IDA0002444979580001111
Figure IDA0002444979580001121
Figure IDA0002444979580001131
Figure IDA0002444979580001141
Figure IDA0002444979580001151
Figure IDA0002444979580001161
Figure IDA0002444979580001171
Figure IDA0002444979580001181
Figure IDA0002444979580001191
Figure IDA0002444979580001201
Figure IDA0002444979580001211
Figure IDA0002444979580001221
Figure IDA0002444979580001231
Figure IDA0002444979580001241
Figure IDA0002444979580001251
Figure IDA0002444979580001261
Figure IDA0002444979580001271
Figure IDA0002444979580001281
Figure IDA0002444979580001291
Figure IDA0002444979580001301
Figure IDA0002444979580001311
Figure IDA0002444979580001321
Figure IDA0002444979580001331
Figure IDA0002444979580001341
Figure IDA0002444979580001351
Figure IDA0002444979580001361
Figure IDA0002444979580001371
Figure IDA0002444979580001381
Figure IDA0002444979580001391
Figure IDA0002444979580001401
Figure IDA0002444979580001411
Figure IDA0002444979580001421
Figure IDA0002444979580001431
Figure IDA0002444979580001441
Figure IDA0002444979580001451
Figure IDA0002444979580001461
Figure IDA0002444979580001471
Figure IDA0002444979580001481
Figure IDA0002444979580001491
Figure IDA0002444979580001501
Figure IDA0002444979580001511
Figure IDA0002444979580001521
Figure IDA0002444979580001531
Figure IDA0002444979580001541
Figure IDA0002444979580001551
Figure IDA0002444979580001561
Figure IDA0002444979580001571
Figure IDA0002444979580001581
Figure IDA0002444979580001591
Figure IDA0002444979580001601
Figure IDA0002444979580001611
Figure IDA0002444979580001621
Figure IDA0002444979580001631
Figure IDA0002444979580001641
Figure IDA0002444979580001651
Figure IDA0002444979580001661
Figure IDA0002444979580001671
Figure IDA0002444979580001681
Figure IDA0002444979580001691
Figure IDA0002444979580001701
Figure IDA0002444979580001711
Figure IDA0002444979580001721
Figure IDA0002444979580001731
Figure IDA0002444979580001741
Figure IDA0002444979580001751
Figure IDA0002444979580001761
Figure IDA0002444979580001771
Figure IDA0002444979580001781
Figure IDA0002444979580001791
Figure IDA0002444979580001801
Figure IDA0002444979580001811
Figure IDA0002444979580001821
Figure IDA0002444979580001831
Figure IDA0002444979580001841
Figure IDA0002444979580001851
Figure IDA0002444979580001861
Figure IDA0002444979580001871
Figure IDA0002444979580001881
Figure IDA0002444979580001891
Figure IDA0002444979580001901
Figure IDA0002444979580001911

Claims (52)

1.一种用于鉴定受试者中胰腺癌的存在的方法,其包括:
在从所述受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:KRAS、TP53、CDKN2A或SMAD4;
在从所述受试者获得的第二生物样品中检测一个或多个以下蛋白质生物标记物的水平:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)或骨桥蛋白(OPN);
将所述一个或多个蛋白质生物标记物的所述检测水平与所述蛋白质生物标记物的一个或多个参考水平进行比较;以及
当检测到一个或多个遗传生物标记物的存在,所述一个或多个蛋白质生物标记物的所述检测水平高于所述一个或多个蛋白质生物标记物的所述参考水平或两者时,鉴定所述受试者中胰腺癌的存在。
2.如权利要求1所述的方法,其中所述第一生物样品、所述第二生物样品或两者包括血浆。
3.如权利要求1所述的方法,其中所述第一生物样品和所述第二生物样品是相同的。
4.如权利要求1所述的方法,其中检测以下各者中一个或多个遗传生物标记物的存在:KRAS、TP53、CDKN2A和SMAD4。
5.如权利要求1所述的方法,其中检测以下各者的水平:碳水化合物抗原19-9(CA19-9)、癌胚抗原(CEA)、肝细胞生长因子(HGF)和骨桥蛋白(OPN)。
6.如权利要求1所述的方法,其中使用基于PCR的多重测序测定检测KRAS、TP53、CDKN2A或SMAD4中的一个或多个中一个或多个遗传生物标记物的存在,所述基于PCR的多重测序测定包括:
a.为所述样品中存在的多个模板分子中的每一个分配唯一标识符(UID);
b.扩增每个带唯一标签的模板分子以产生UID家族;以及
c.对所述扩增产物进行冗余测序。
7.如权利要求1所述的方法,其中在不知道所述受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测一个或多个蛋白质生物标记物的水平或两者。
8.如权利要求1所述的方法,其中向所述受试者施用以下治疗性干预中的一种或多种:手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法或免疫检查点抑制剂。
9.一种用于鉴定受试者中癌症的存在的方法,其包括:
在从所述受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS;
在从所述受试者获得的第二生物样品中检测一个或多个以下蛋白质生物标记物的水平:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1或MPO;
将所述一个或多个蛋白质生物标记物的所述检测水平与所述蛋白质生物标记物的一个或多个参考水平进行比较;以及
当检测到一个或多个遗传生物标记物的存在,所述一个或多个蛋白质生物标记物的所述检测水平高于所述一个或多个蛋白质生物标记物的所述参考水平或两者时,鉴定所述受试者中癌症的存在。
10.如权利要求9所述的方法,其中所述第一生物样品、所述第二生物样品或两者包括血浆。
11.如权利要求9所述的方法,其中所述第一生物样品和所述第二生物样品是相同的。
12.如权利要求9所述的方法,其中检测以下各者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS。
13.如权利要求9所述的方法,其中检测以下各者的水平:CA19-9、CEA、HGF、OPN、CA125、催乳素、TIMP-1和MPO。
14.如权利要求9所述的方法,其中使用基于PCR的多重测序测定检测NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS中的一个或多个中一个或多个遗传生物标记物的存在,所述基于PCR的多重测序测定包括:
a.为所述样品中存在的多个模板分子中的每一个分配唯一标识符(UID);
b.扩增每个带唯一标签的模板分子以产生UID家族;以及
c.对所述扩增产物进行冗余测序。
15.如权利要求9所述的方法,其中所述癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。
16.如权利要求9所述的方法,其中在不知道所述受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测一个或多个蛋白质生物标记物的水平或两者。
17.如权利要求9所述的方法,其中向所述受试者施用以下治疗性干预中的一种或多种:手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法或免疫检查点抑制剂。
18.一种用于鉴定受试者中癌症的存在的方法,其包括:
在从所述受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS;
在从所述受试者获得的第二生物样品中检测一个或多个以下蛋白质生物标记物的水平:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF或CA15-3;
将所述一个或多个蛋白质生物标记物的所述检测水平与所述蛋白质生物标记物的一个或多个参考水平进行比较;以及
当检测到一个或多个遗传生物标记物的存在,所述一个或多个蛋白质生物标记物的所述检测水平高于所述一个或多个蛋白质生物标记物的所述参考水平或两者时,鉴定所述受试者中癌症的存在。
19.如权利要求18所述的方法,其中所述第一生物样品、所述第二生物样品或两者包括血浆。
20.如权利要求18所述的方法,其中所述第一生物样品和所述第二生物样品是相同的。
21.如权利要求18所述的方法,其中检测以下各者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS。
22.如权利要求18所述的方法,其中检测以下各者的水平:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1、卵泡抑素、G-CSF和CA15-3。
23.如权利要求18所述的方法,其中使用基于PCR的多重测序测定检测NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS中的一个或多个中一个或多个遗传生物标记物的存在,所述基于PCR的多重测序测定包括:
a.为所述样品中存在的多个模板分子中的每一个分配唯一标识符(UID);
b.扩增每个带唯一标签的模板分子以产生UID家族;以及
c.对所述扩增产物进行冗余测序。
24.如权利要求18所述的方法,其中所述癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。
25.如权利要求18所述的方法,其中在不知道所述受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测一个或多个蛋白质生物标记物的水平或两者。
26.如权利要求18所述的方法,其中向所述受试者施用以下治疗性干预中的一种或多种:手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法或免疫检查点抑制剂。
27.一种用于鉴定受试者中癌症的存在的方法,其包括:
在从所述受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS;
在从所述受试者获得的第二生物样品中检测一个或多个以下蛋白质生物标记物的水平:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1或CA15-3;
将所述一个或多个蛋白质生物标记物的所述检测水平与所述蛋白质生物标记物的一个或多个参考水平进行比较;以及
当检测到一个或多个遗传生物标记物的存在,所述一个或多个蛋白质生物标记物的所述检测水平高于所述一个或多个蛋白质生物标记物的所述参考水平或两者时,鉴定所述受试者中癌症的存在。
28.如权利要求27所述的方法,其中所述第一生物样品、所述第二生物样品或两者包括血浆。
29.如权利要求27所述的方法,其中所述第一生物样品和所述第二生物样品是相同的。
30.如权利要求27所述的方法,其中检测以下各者中一个或多个遗传生物标记物的存在:NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A和GNAS。
31.如权利要求27所述的方法,其中检测以下各者的水平:CA19-9、CEA、HGF、OPN、CA125、AFP、催乳素、TIMP-1和CA15-3。
32.如权利要求27所述的方法,其中使用基于PCR的多重测序测定检测NRAS、CTNNB1、PIK3CA、FBXW7、APC、EGFR、BRAF、CDKN2A、PTEN、FGFR2、HRAS、KRAS、AKT1、TP53、PPP2R1A或GNAS中的一个或多个中一个或多个遗传生物标记物的存在,所述基于PCR的多重测序测定包括:
a.为所述样品中存在的多个模板分子中的每一个分配唯一标识符(UID);
b.扩增每个带唯一标签的模板分子以产生UID家族;以及
c.对所述扩增产物进行冗余测序。
33.如权利要求27所述的方法,其中所述癌症是肝癌、卵巢癌、食道癌、胃癌、胰腺癌、结直肠癌、肺癌、乳腺癌或前列腺癌。
34.如权利要求27所述的方法,其中在不知道所述受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测一个或多个蛋白质生物标记物的水平或两者。
35.如权利要求27所述的方法,其中向所述受试者施用以下治疗性干预中的一种或多种:手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法或免疫检查点抑制剂。
36.一种用于鉴定受试者中膀胱癌或上尿路尿路上皮癌的方法,其包括:
在从所述受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL;
在从所述受试者获得的第二生物样品中检测TERT启动子中至少一个突变的存在;以及
在从所述受试者获得的第三生物样品中检测非整倍性的存在;以及
当检测到一个或多个遗传生物标记物的存在,所述TERT启动子中所述至少一个突变的存在,检测到整倍性的存在,或其组合时,鉴定所述受试者中膀胱癌或上尿路尿路上皮癌的存在。
37.如权利要求36所述的方法,其中:
所述第一生物样品和所述第二生物样品是相同的;
所述第一生物样品和所述第三生物样品是相同的;
所述第二生物样品和所述第三生物样品是相同的;或者
所述第一生物样品、所述第二生物样品和所述第三生物样品是相同的。
38.如权利要求37所述的方法,其中所述第一生物样品、所述第二生物样品或所述第三生物样品是尿液样品。
39.如权利要求36所述的方法,其中在染色体臂5q、8q或9p中的一个或多个上检测非整倍性的存在。
40.如权利要求36所述的方法,其中检测以下各者中一个或多个遗传生物标记物的存在:TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET和VHL。
41.如权利要求36所述的方法,其中使用基于PCR的多重测序测定检测TP53、PIK3CA、FGFR3、KRAS、ERBB2、CDKN2A、MLL、HRAS、MET或VHL中的一个或多个中一个或多个遗传生物标记物的存在,所述基于PCR的多重测序测定包括:
a.为所述样品中存在的多个模板分子中的每一个分配唯一标识符(UID);
b.扩增每个带唯一标签的模板分子以产生UID家族;以及
c.对所述扩增产物进行冗余测序。
42.如权利要求36所述的方法,其中在不知道所述受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在、检测所述TERT启动子中所述至少一个突变的存在或检测非整倍性的存在。
43.如权利要求36所述的方法,其中向所述受试者施用以下治疗性干预中的一种或多种:手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法或免疫检查点抑制剂。
44.一种用于鉴定受试者中卵巢癌或子宫内膜癌的存在的方法,其包括:
在从所述受试者获得的第一生物样品中检测一个或多个以下基因中一个或多个遗传生物标记物的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A;
在从所述受试者获得的第二生物样品中检测非整倍性的存在;以及
当检测到一个或多个遗传生物标记物的存在,检测到非整倍性的存在或两者时,鉴定所述受试者中卵巢癌或子宫内膜癌的存在。
45.如权利要求44所述的方法,其中所述第一生物样品和所述第二生物样品是相同的。
46.如权利要求45所述的方法,其中所述第一生物样品或所述第二生物样品是宫颈样品或子宫内膜样品。
47.如权利要求44所述的方法,其中在染色体臂4p、7q、8q或9q中的一个或多个上检测非整倍性的存在。
48.如权利要求44所述的方法,其中检测以下各者中一个或多个遗传生物标记物的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF和CDKN2A。
49.如权利要求44所述的方法,其中使用基于PCR的多重测序测定检测以下一个或多个中一个或多个遗传生物标记物的存在:NRAS、PTEN、FGFR2、KRAS、POLE、AKT1、TP53、RNF43、PPP2R1A、MAPK1、CTNNB1、PIK3CA、FBXW7、PIK3R1、APC、EGFR、BRAF或CDKN2A,所述基于PCR的多重测序测定包括:
a.为所述样品中存在的多个模板分子中的每一个分配唯一标识符(UID);
b.扩增每个带唯一标签的模板分子以产生UID家族;以及
c.对所述扩增产物进行冗余测序。
50.如权利要求44所述的方法,其还包括在从所述受试者获得的循环肿瘤DNA(ctDNA)样品中检测一个或多个以下基因中至少一个遗传生物标记物的存在:AKT1、APC、BRAF、CDKN2A、CTNNB1、EGFR、FBXW7、FGFR2、GNAS、HRAS、KRAS、NRAS、PIK3CA、PPP2R1A、PTEN或TP53。
51.如权利要求44所述的方法,其中在不知道所述受试者携带癌细胞的情况下,执行检测一个或多个遗传生物标记物的存在或检测非整倍性的存在。
52.如权利要求44所述的方法,其中向所述受试者施用以下治疗性干预中的一种或多种:手术、辅助化疗、新辅助化疗、放疗、免疫疗法、靶向疗法或免疫检查点抑制剂。
CN201880066039.XA 2017-08-07 2018-08-07 用于评估和治疗癌症的方法和材料 Pending CN111868260A (zh)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US201762542144P 2017-08-07 2017-08-07
US201762542167P 2017-08-07 2017-08-07
US201762542164P 2017-08-07 2017-08-07
US62/542,167 2017-08-07
US62/542,164 2017-08-07
US62/542,144 2017-08-07
US201762594245P 2017-12-04 2017-12-04
US62/594,245 2017-12-04
US201862618232P 2018-01-17 2018-01-17
US62/618,232 2018-01-17
US201862628759P 2018-02-09 2018-02-09
US62/628,759 2018-02-09
US201862629870P 2018-02-13 2018-02-13
US62/629,870 2018-02-13
PCT/US2018/045669 WO2019067092A1 (en) 2017-08-07 2018-08-07 METHODS AND SUBSTANCES FOR THE EVALUATION AND TREATMENT OF CANCER

Publications (1)

Publication Number Publication Date
CN111868260A true CN111868260A (zh) 2020-10-30

Family

ID=63678664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880066039.XA Pending CN111868260A (zh) 2017-08-07 2018-08-07 用于评估和治疗癌症的方法和材料

Country Status (13)

Country Link
US (2) US20200377956A1 (zh)
EP (2) EP3665308A1 (zh)
JP (2) JP7232476B2 (zh)
KR (1) KR20200115450A (zh)
CN (1) CN111868260A (zh)
AU (1) AU2018342007A1 (zh)
BR (1) BR112020002555A2 (zh)
CA (1) CA3072195A1 (zh)
CL (1) CL2020000343A1 (zh)
IL (1) IL272470A (zh)
MX (1) MX2020001575A (zh)
SG (1) SG11202001010UA (zh)
WO (2) WO2019067092A1 (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112011611A (zh) * 2020-05-25 2020-12-01 桂林医学院附属医院 circRNA在诊治胃癌中的应用
CN112597702A (zh) * 2020-12-21 2021-04-02 电子科技大学 基于径向基函数的气动建模生成式对抗网络模型训练方法
CN113065454A (zh) * 2021-03-30 2021-07-02 青岛海信智慧生活科技股份有限公司 一种高空抛物目标识别比较的方法及装置
CN113130009A (zh) * 2021-04-19 2021-07-16 林燕 调节eif4a3表达以调控肝癌细胞凋亡、迁移和侵袭能力的应用
CN113436677A (zh) * 2021-08-13 2021-09-24 北京大学 测试受试者患有肝癌可能性的系统及方法
CN113584145A (zh) * 2021-06-09 2021-11-02 广东省妇幼保健院 检测pgrmc1含量的试剂在制备诊断和预测多囊卵巢综合征的试剂盒中的应用
CN113804901A (zh) * 2020-06-15 2021-12-17 南京市口腔医院 用于口腔鳞癌早期无创诊断的血清脂质标志物及其应用
CN113889191A (zh) * 2021-09-16 2022-01-04 深圳百人科技有限公司 一种基于cpe和cpd实现高效个体识别位点筛选的贪心算法
CN114067315A (zh) * 2021-10-23 2022-02-18 广州市艾贝泰生物科技有限公司 细胞计数方法、装置、计算机设备和存储介质
CN114093512A (zh) * 2021-10-21 2022-02-25 杭州电子科技大学 一种基于多模态数据和深度学习模型的生存预测方法
CN114107502A (zh) * 2021-11-29 2022-03-01 四川大学华西医院 一种上尿路上皮癌诊断标志物及其应用
CN114324641A (zh) * 2021-12-22 2022-04-12 山东英盛生物技术有限公司 一种冠心病代谢标志物及在诊断、预后方面的应用
CN114317539A (zh) * 2022-01-12 2022-04-12 上海卡序生物医药科技有限公司 hsa_circ_0001137环状RNA及其在癌症诊断、治疗中的应用
CN114512183A (zh) * 2022-01-27 2022-05-17 北京吉因加医学检验实验室有限公司 一种预测met基因扩增或多倍体的方法及装置
CN114533201A (zh) * 2022-01-05 2022-05-27 华中科技大学同济医学院附属协和医院 一种新型的体外波碎血凝块辅助设备
CN116570599A (zh) * 2023-07-04 2023-08-11 四川大学华西医院 Vs6766联合lxh254的应用及药物组合物
CN116987789A (zh) * 2023-06-30 2023-11-03 上海仁东医学检验所有限公司 Utuc分子分型、单样本分类器及其构建方法
CN117004729A (zh) * 2023-08-18 2023-11-07 上海爱谱蒂康生物科技有限公司 生物标志物及其在预测和/或诊断utuc进展时间中的应用
CN117110596A (zh) * 2023-09-06 2023-11-24 方舟生物安全科技(广州)有限公司 一种用于富集cfDNA的修饰玻片、方法及其应用
CN117238488A (zh) * 2023-11-16 2023-12-15 四川省肿瘤医院 一种基于图像分析的直肠癌放疗反应分析方法及系统
CN117238419A (zh) * 2023-11-13 2023-12-15 宝鸡拓普达钛业有限公司 优化钛合金热扩散连接的钛材材料抗性提高方法及系统
CN117292211A (zh) * 2023-11-27 2023-12-26 潍坊市海洋发展研究院 水质标注图像发送方法、装置、电子设备和计算机可读介质

Families Citing this family (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
EP2854057B1 (en) 2010-05-18 2018-03-07 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
ES2625288T3 (es) 2011-04-15 2017-07-19 The Johns Hopkins University Sistema de secuenciación segura
ES2886507T3 (es) 2012-10-29 2021-12-20 Univ Johns Hopkins Prueba de Papanicolaou para cánceres de ovario y de endometrio
CN113774132A (zh) 2014-04-21 2021-12-10 纳特拉公司 检测染色体片段中的突变和倍性
GB2536650A (en) 2015-03-24 2016-09-28 Augmedics Ltd Method and system for combining video-based and optic-based augmented reality in a near eye display
WO2016183106A1 (en) 2015-05-11 2016-11-17 Natera, Inc. Methods and compositions for determining ploidy
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
EP3634449A4 (en) 2017-05-08 2021-03-17 Gritstone Oncology, Inc. ALPHAVIRAL NEOANTIGENIC VECTORS
AU2018282865A1 (en) 2017-06-13 2019-12-19 Bostongene Corporation Systems and methods for generating, visualizing and classifying molecular functional profiles
AU2018342007A1 (en) * 2017-08-07 2020-02-27 Board Of Regents, The University Of Texas Systems Methods and materials for assessing and treating cancer
WO2019195769A1 (en) * 2018-04-06 2019-10-10 The Brigham And Women's Hospital, Inc. Methods of diagnosing and treating aggressive cutaneous t-cell lymphomas
US11681953B2 (en) * 2018-04-13 2023-06-20 Freenome Holdings, Inc. Machine learning implementation for multi-analyte assay development and testing
EP3787543A4 (en) 2018-05-02 2022-01-19 Augmedics Ltd. REGISTRATION OF A REFERENCE MARK FOR AN AUGMENTED REALITY SYSTEM
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
BR112021007293A2 (pt) * 2018-10-17 2021-07-27 Quest Diagnostics Investments Llc sistema de seleção de sequenciamento genômico
US11766296B2 (en) 2018-11-26 2023-09-26 Augmedics Ltd. Tracking system for image-guided surgery
JP2022521791A (ja) * 2019-02-26 2022-04-12 テンパス ラブズ,インコーポレイテッド 病原体検出のための配列決定データを使用するためのシステムおよび方法
EP3938534A4 (en) * 2019-03-13 2023-03-29 Grail, LLC SYSTEMS AND METHODS FOR ENRICHMENT OF CANCER DERIVED FRAGMENTS USING FRAGMENT SIZE
CN114026253A (zh) * 2019-04-22 2022-02-08 奥比特基因组学公司 用于微卫星分析的方法和系统
CA3136204A1 (en) * 2019-05-13 2020-11-19 Grail, Inc. Model-based featurization and classification
US20230061121A1 (en) * 2019-05-15 2023-03-02 The Regents Of The University Of California Methods concerning ongoing treatment for cancer
EP3969616A2 (en) * 2019-05-17 2022-03-23 The Johns Hopkins University Rapid aneuploidy detection
SG11202113187WA (en) 2019-05-30 2021-12-30 Gritstone Bio Inc Modified adenoviruses
US11396679B2 (en) 2019-05-31 2022-07-26 Universal Diagnostics, S.L. Detection of colorectal cancer
SG11202112932QA (en) * 2019-05-31 2021-12-30 Qed Therapeutics Inc Methods of treating urinary system cancers
US11036610B2 (en) 2019-05-31 2021-06-15 Apple Inc. Logging techniques for third party application data
US11667954B2 (en) 2019-07-01 2023-06-06 Mission Bio, Inc. Method and apparatus to normalize quantitative readouts in single-cell experiments
EP4004237A1 (en) * 2019-07-22 2022-06-01 F. Hoffmann-La Roche AG Systems and methods for cell of origin determination from variant calling data
US11980506B2 (en) 2019-07-29 2024-05-14 Augmedics Ltd. Fiducial marker
US11651275B2 (en) * 2019-08-19 2023-05-16 International Business Machines Corporation Tree-based associative data augmentation
CN110541028A (zh) * 2019-08-27 2019-12-06 深圳市宝安区妇幼保健院 一种检测fus基因突变和tardbp基因突变的方法
EP4021581A4 (en) * 2019-08-30 2023-08-30 Foundation Medicine, Inc. KMT2A-MAML2 FUSION MOLECULES AND USES THEREOF
CN114450420A (zh) 2019-08-30 2022-05-06 生命技术公司 用于肿瘤学精确测定的组合物和方法
US20220411780A1 (en) * 2019-09-13 2022-12-29 University Health Network Detection of circulating tumor dna using double stranded hybrid capture
US11817214B1 (en) * 2019-09-23 2023-11-14 FOXO Labs Inc. Machine learning model trained to determine a biochemical state and/or medical condition using DNA epigenetic data
US20210102199A1 (en) * 2019-10-08 2021-04-08 Illumina, Inc. Fragment size characterization of cell-free dna mutations from clonal hematopoiesis
WO2021070039A2 (en) * 2019-10-09 2021-04-15 Immunitybio, Inc. Detecting homologous recombination deficiencies (hrd) in clinical samples
AU2020366233A1 (en) * 2019-10-16 2022-05-26 Icahn School Of Medicine At Mount Sinai Systems and methods for detecting a disease condition
WO2021077094A1 (en) * 2019-10-18 2021-04-22 The Regents Of The University Of California Discovering, validating, and personalizing transposable element cancer vaccines
EP4055059A4 (en) * 2019-11-06 2024-01-10 Ohio State Innovation Foundation TARGETING CIRCULAR PCMTD1 IN LEUKEMIA WITH P53 MUTATIONS AND/OR BCR/ABL FUSIONS
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
WO2021097252A1 (en) * 2019-11-13 2021-05-20 Bradley Bernstein Methylation assays and uses thereof
CN115298326A (zh) * 2019-11-25 2022-11-04 约翰·霍普金斯大学 用于癌症分析的方法和组合物
US11726032B2 (en) * 2019-12-13 2023-08-15 Alcon Inc. System and method of determining issues with optical components
EP4077711A4 (en) * 2019-12-16 2024-01-03 Ohio State Innovation Foundation NEXT GENERATION SEQUENCING DIAGNOSTIC PLATFORM AND ASSOCIATED METHODS
US11382712B2 (en) 2019-12-22 2022-07-12 Augmedics Ltd. Mirroring in image guided surgery
CN111241743B (zh) * 2020-01-02 2023-06-23 中国辐射防护研究院 一种基于贝叶斯方法的放射性物品运输容器评价方法
EP4087940A4 (en) * 2020-01-10 2024-04-10 Gritstone Bio Inc CELLULAR DNA MONITORING
US11978531B2 (en) 2020-01-10 2024-05-07 The Joan and Irwin Jacobs Technion-Cornell Institute Method for monitoring and management of cell lines using periodic low-coverage DNA sequencing data
CN111312393B (zh) * 2020-01-14 2022-02-22 之江实验室 一种结合主动学习的时序深度生存分析系统
CN111135307B (zh) * 2020-02-05 2023-05-30 中山大学附属第八医院(深圳福田) 一种基于car-t细胞的药物传递系统的制备方法及应用
CN111190013B (zh) * 2020-02-27 2020-09-08 郑州大学第一附属医院 一组食管癌检测标志物及其在制备食管癌筛查试剂盒中的应用
CN111206101B (zh) * 2020-03-12 2023-01-17 上海市东方医院(同济大学附属东方医院) circRRM2B基因作为新靶点在筛选维罗非尼耐药的黑色素瘤治疗药物中的应用
TW202144008A (zh) * 2020-03-23 2021-12-01 加拿大商融合製藥公司 標靶fgfr3之放射免疫結合物及其用途
US20210310075A1 (en) * 2020-03-30 2021-10-07 Grail, Inc. Cancer Classification with Synthetic Training Samples
WO2021215986A1 (en) 2020-04-21 2021-10-28 Sjoeblom Tobias Cancer biomarkers
US20210353249A1 (en) * 2020-05-12 2021-11-18 Acoustiic Inc. Detection and treatment of tumors using ultrasound
JP2023525880A (ja) * 2020-05-15 2023-06-19 インテグレイテッド ディーエヌエー テクノロジーズ, インコーポレイテッド ライゲーションカップルドpcrの方法
US11620547B2 (en) 2020-05-19 2023-04-04 Oracle International Corporation Estimating number of distinct values in a data set using machine learning
CN111508563B (zh) * 2020-05-22 2023-04-18 四川大学华西医院 一种长非编码rna的癌症相关可变剪接数据库系统
CN111534600B (zh) * 2020-06-18 2023-07-21 广州达健生物科技有限公司 食管癌基因甲基化检测引物探针组合及其试剂盒与应用
WO2022006596A1 (en) * 2020-06-30 2022-01-06 Northwestern University A single patient classifier for t1 high grade bladder cancer
US11530453B2 (en) * 2020-06-30 2022-12-20 Universal Diagnostics, S.L. Systems and methods for detection of multiple cancer types
WO2022016187A1 (en) * 2020-07-14 2022-01-20 Northwestern University Virofind: a novel platform for detection and discovery of the entire virogenome in clinical samples
EP4192496A2 (en) 2020-08-06 2023-06-14 Gritstone bio, Inc. Multiepitope vaccine cassettes
WO2022051296A1 (en) * 2020-09-01 2022-03-10 Ultima Genomics, Inc. Methods and systems for reducing particle aggregation
EP4210711A1 (en) * 2020-09-14 2023-07-19 The Johns Hopkins University Methods and compositions for prognosing glioblastoma or breast cancer
CN112116956B (zh) * 2020-09-29 2024-04-19 深圳裕策生物科技有限公司 一种基于二代测序的肿瘤单样本tmb检测方法及装置
US20240002956A1 (en) * 2020-11-18 2024-01-04 University Of Connecticut SENSITIVE QUANTITATIVE DETECTION OF SARS-CoV-2 USING DIGITAL WARM-START CRISPR ASSAY
WO2022109295A1 (en) * 2020-11-19 2022-05-27 Carnegie Mellon University System and method for detecting and classifying abnormal cells
TW202221549A (zh) * 2020-11-26 2022-06-01 中強光電股份有限公司 優化光譜儀的輸出結果的方法及使用該方法的電子裝置
IL303411A (en) * 2020-12-03 2023-08-01 Shattuck Labs Inc Cancer treatment methods using chimeric proteins based on TIGIT and LIGHT
EP4260341A1 (en) * 2020-12-14 2023-10-18 The Johns Hopkins University Signal
WO2022132964A1 (en) * 2020-12-15 2022-06-23 Caris Mpi, Inc. Treatment response signatures
CA3202255A1 (en) * 2020-12-21 2022-06-30 Hayley WARSINSKE Markers for the early detection of colon cell proliferative disorders
WO2022152784A1 (en) 2021-01-15 2022-07-21 Healthbiocare Gmbh Methods for determining cancer
CN112574997B (zh) * 2021-01-17 2023-07-21 楷拓生物科技(苏州)有限公司 一种fbxw7环状rna的改构体及其在肿瘤药物和新冠疫苗中的应用
WO2022155587A2 (en) * 2021-01-18 2022-07-21 Washington University METHODS FOR DETECTING utDNA
WO2022165069A1 (en) * 2021-01-29 2022-08-04 Foundation Medicine, Inc. Methods and systems for characterizing and treating combined hepatocellular cholangiocarcinoma
US11537594B2 (en) * 2021-02-05 2022-12-27 Oracle International Corporation Approximate estimation of number of distinct keys in a multiset using a sample
EP4288090A1 (en) * 2021-02-05 2023-12-13 The Regents Of The University Of California Methods and biomarkers in cancer
EP4291902A2 (en) * 2021-02-10 2023-12-20 Foundation Medicine, Inc. Biomarkers for cancer treatment
CA3208715A1 (en) * 2021-02-19 2022-08-25 Shelly Marie Sorrells Longitudinal molecular diagnostics detect somatic reversion mutations
US20220277808A1 (en) * 2021-02-19 2022-09-01 Twist Bioscience Corporation Libraries for identification of genomic variants
JP2024509851A (ja) * 2021-03-05 2024-03-05 マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチ 子宮頸癌の検出
WO2022212956A1 (en) * 2021-04-02 2022-10-06 Board Of Regents, The University Of Texas System Nextgen chemometrics using proximity ligation assay (pla)
CN113249484B (zh) * 2021-06-23 2023-01-03 复旦大学附属金山医院(上海市金山区核化伤害应急救治中心、上海市金山区眼病防治所) 一组基因的突变数量作为前列腺癌生物标志物的检测应用
CA3224437A1 (en) * 2021-07-02 2023-01-05 Enzo Biochem, Inc. Method for detecting and quantifying dna methylation in a selected locus or region of dna
US11896445B2 (en) 2021-07-07 2024-02-13 Augmedics Ltd. Iliac pin and adapter
US11520834B1 (en) 2021-07-28 2022-12-06 Oracle International Corporation Chaining bloom filters to estimate the number of keys with low frequencies in a dataset
EP4381103A2 (en) * 2021-08-06 2024-06-12 INSERM (Institut National de la Santé et de la Recherche Médicale) New method to diagnose inflammatory diseases
KR20240049812A (ko) * 2021-08-13 2024-04-17 이노비오 파마수티컬즈, 인크. 뇌암을 치료하기 위한 조합 요법
CN113718031B (zh) * 2021-08-17 2022-05-20 浙江大学医学院附属妇产科医院 一种卵巢癌早期诊断组合物的建立
KR20240053637A (ko) * 2021-09-08 2024-04-24 제이에스알 라이프 사이언시스, 엘엘씨 개선된 암 진단 및 치료법 선택을 위한 차세대 시퀀싱 및 인공 지능-기반 접근법
WO2023039579A1 (en) 2021-09-13 2023-03-16 PrognomIQ, Inc. Enhanced detection and quantitation of biomolecules
WO2023044148A1 (en) * 2021-09-20 2023-03-23 Washington University Thoracic duct as a sample collection reservoir
WO2023049741A1 (en) * 2021-09-21 2023-03-30 The Regents Of The University Of Michigan Metabolite biomarkers for differential diagnosis of pancreatic cysts
KR102421469B1 (ko) * 2021-10-06 2022-07-18 (주)이노베이션바이오 암 진단용 바이오마커 및 이의 용도
US20230184678A1 (en) * 2021-12-14 2023-06-15 Quantum-Si Incorporated Methods for loading and data acquisition
LT7032B (lt) 2021-12-30 2023-10-10 Lietuvos sveikatos mokslų universitetas Būdas nustatyti su skrandžio vėžiu siejamas mutacijas kraujyje naudojant genų panelę
CN114480660A (zh) * 2022-04-02 2022-05-13 普瑞基准科技(北京)有限公司 一种用于检测泛癌种的基因Panel、探针及应用
CN114574465B (zh) * 2022-05-09 2022-08-05 上海众启生物科技有限公司 一种聚合酶突变体及其应用
WO2023220156A1 (en) * 2022-05-10 2023-11-16 H. Lee Moffitt Cancer Center And Research Institute, Inc. Novel use of ctdna to identify locally advanced and metastatic upper tract urothelial carcinoma
WO2023225560A1 (en) 2022-05-17 2023-11-23 Guardant Health, Inc. Methods for identifying druggable targets and treating cancer
WO2023225515A1 (en) * 2022-05-17 2023-11-23 Life Technologies Corporation Compositions and methods for oncology assays
WO2023230212A1 (en) * 2022-05-25 2023-11-30 The General Hospital Corporation Combination treatment for adenocarcinoma
WO2023235614A1 (en) * 2022-06-02 2023-12-07 Clearnote Health, Inc. Predicting and determining efficacy of a lung cancer therapy in a patient
WO2023239866A1 (en) * 2022-06-10 2023-12-14 The Johns Hopkins University Methods for identifying cns cancer in a subject
WO2024009946A1 (ja) * 2022-07-08 2024-01-11 国立大学法人東海国立大学機構 卵巣癌に対するparp阻害剤の有効性を検査する方法
CN115132271B (zh) * 2022-09-01 2023-07-04 北京中仪康卫医疗器械有限公司 一种基于批次内校正的cnv检测方法
WO2024059516A1 (en) * 2022-09-12 2024-03-21 Jumpcode Genomics, Inc. Methods for generating cdna library from rna
WO2024062425A1 (en) * 2022-09-22 2024-03-28 Waters Technologies Corporation Quantification consistency for samples analysis and samples classification
KR20240041396A (ko) * 2022-09-22 2024-04-01 차의과학대학교 산학협력단 파클리탁셀에 대하여 내성을 갖는 난소암의 진단을 위한 분석방법
CN115359881B (zh) * 2022-10-19 2023-04-07 成都理工大学 一种基于深度学习的鼻咽癌肿瘤自动勾画方法
WO2024097876A1 (en) * 2022-11-02 2024-05-10 Board Of Regents, The University Of Texas System Methods relating to optimizing therapy selection for acute myeloid leukemia
WO2024107923A1 (en) * 2022-11-17 2024-05-23 Board Of Regents, The University Of Texas System Methods for the detection and treatment of lung cancer
CN116500280B (zh) * 2023-06-26 2023-09-12 中国医学科学院北京协和医院 一组诊断颈动脉体瘤的标志物及其应用
CN116590421A (zh) * 2023-07-12 2023-08-15 首都医科大学附属北京朝阳医院 融合基因相关F-circP3F原位表达检测试剂盒

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010141955A2 (en) * 2009-06-05 2010-12-09 Myriad Genetics, Inc. Methods of detecting cancer
WO2013113816A1 (en) * 2012-01-31 2013-08-08 Speiser Paul Non-invasive cancer diagnosis

Family Cites Families (203)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040166A (en) 1985-03-28 2000-03-21 Roche Molecular Systems, Inc. Kits for amplifying and detecting nucleic acid sequences, including a probe
GB9323305D0 (en) 1993-11-11 1994-01-05 Medinnova Sf Isoaltion of nucleic acid
US6027890A (en) 1996-01-23 2000-02-22 Rapigene, Inc. Methods and compositions for enhancing sensitivity in the analysis of biological-based assays
US6361940B1 (en) 1996-09-24 2002-03-26 Qiagen Genomics, Inc. Compositions and methods for enhancing hybridization and priming specificity
NZ501917A (en) 1997-07-22 2001-10-26 Qiagen Genomics Inc Method and apparatus for enzymatic reactions performed on nucleic acid arrays conducted at dew point
DE19813317A1 (de) 1998-03-26 1999-09-30 Roche Diagnostics Gmbh Verbessertes Verfahren zur Primer Extension Präamplifikations-PCR
US6576420B1 (en) 1998-06-23 2003-06-10 Regents Of The University Of California Method for early diagnosis of, and determination of prognosis in, cancer
EP1090293B2 (en) 1998-06-24 2019-01-23 Illumina, Inc. Decoding of array sensors with microspheres
US7612020B2 (en) 1998-12-28 2009-11-03 Illumina, Inc. Composite arrays utilizing microspheres with a hybridization chamber
US7683035B1 (en) 1999-02-23 2010-03-23 Qiagen, Gmbh Method of stabilizing and/or isolating nucleic acids
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US6544732B1 (en) 1999-05-20 2003-04-08 Illumina, Inc. Encoding and decoding of array sensors utilizing nanocrystals
AU7569600A (en) 1999-05-20 2000-12-28 Illumina, Inc. Combinatorial decoding of random nucleic acid arrays
EP1212599A2 (en) 1999-08-30 2002-06-12 Illumina, Inc. Methods for improving signal detection from an array
AU7733200A (en) 1999-09-30 2001-04-30 Qiagen Genomics, Inc. Compositions and methods for reducing oligonucleotide hybridization and priming specificity
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US6770441B2 (en) 2000-02-10 2004-08-03 Illumina, Inc. Array compositions and methods of making same
US7601497B2 (en) 2000-06-15 2009-10-13 Qiagen Gaithersburg, Inc. Detection of nucleic acids by target-specific hybrid capture method
DE10031236A1 (de) 2000-06-27 2002-01-10 Qiagen Gmbh Verwendung von Carbonsäuren und anderen Additiven in Kombination mit kationischen Verbindungen zur Stabilisierung von Nukleinsäuren in biologischen Materialien
DE60130763T2 (de) 2000-06-30 2008-07-17 Qiagen Gmbh Signalamplifikation mit "lollipop"-hydridisierungsproben
CA2419058A1 (en) 2000-08-09 2002-02-14 Illumina, Inc. Automated information processing in randomly ordered arrays
WO2002016649A2 (en) 2000-08-25 2002-02-28 Illumina, Inc. Probes and decoder oligonucleotides
AU2002326290A1 (en) 2001-03-01 2002-12-16 Illumina, Inc. Methods for improving signal detection from an array
AU2003215240A1 (en) 2002-02-14 2003-09-04 Illumina, Inc. Automated information processing in randomly ordered arrays
US20040259105A1 (en) 2002-10-03 2004-12-23 Jian-Bing Fan Multiplex nucleic acid analysis using archived or fixed samples
US9487823B2 (en) 2002-12-20 2016-11-08 Qiagen Gmbh Nucleic acid amplification
US6977153B2 (en) 2002-12-31 2005-12-20 Qiagen Gmbh Rolling circle amplification of RNA
US8043834B2 (en) 2003-03-31 2011-10-25 Qiagen Gmbh Universal reagents for rolling circle amplification and methods of use
US8150626B2 (en) 2003-05-15 2012-04-03 Illumina, Inc. Methods and compositions for diagnosing lung cancer with specific DNA methylation patterns
JP2007525963A (ja) 2003-06-20 2007-09-13 イルミナ インコーポレイテッド 全ゲノム増幅および遺伝型決定のための方法および組成物
JP2007512020A (ja) 2003-11-26 2007-05-17 エッペンドルフ アクチェンゲゼルシャフト 染色体外核酸のインビトロ増幅のための方法及び組成物
US7736850B2 (en) 2003-12-02 2010-06-15 Institute Pasteur Strain of SARS-associated coronavirus and applications thereof
US7776531B1 (en) 2004-03-25 2010-08-17 Illumina, Inc. Compositions and methods for stabilizing surface bound probes
NZ551019A (en) 2004-04-20 2009-08-28 Genaco Biomedical Products Inc Method for detecting ncRNA
CA2567627C (en) 2004-05-20 2014-09-30 Quest Diagnostics Investments Incorporated Single label comparative hybridization
US7745125B2 (en) 2004-06-28 2010-06-29 Roche Molecular Systems, Inc. 2′-terminator related pyrophosphorolysis activated polymerization
WO2006026738A2 (en) 2004-08-31 2006-03-09 Qiagen North American Holdings, Inc. Methods and compositions for rna amplification and detection using an rna-dependent rna-polymerase
WO2006058031A2 (en) 2004-11-23 2006-06-01 Quest Diagnostics Incorporated Microarray quality control
US20060127918A1 (en) 2004-12-14 2006-06-15 Quest Diagnostics Investments Incorporated Nucleic acid arrays
WO2006081353A2 (en) 2005-01-27 2006-08-03 Quest Diagnostics Investments Incorporated Rapid comparative genome hybridization
EP1712639B1 (en) 2005-04-06 2008-08-27 Maurice Stroun Method for the diagnosis of cancer by detecting circulating DNA and RNA
NZ587665A (en) 2005-04-18 2011-11-25 Mitomics Inc Mitochondrial mutations and rearrangements as a diagnostic tool for the detection of sun exposure, prostate cancer and other cancers
US20060292576A1 (en) 2005-06-23 2006-12-28 Quest Diagnostics Investments Incorporated Non-in situ hybridization method for detecting chromosomal abnormalities
US7977108B2 (en) 2005-07-25 2011-07-12 Roche Molecular Systems, Inc. Method for detecting a mutation in a repetitive nucleic acid sequence
JP2009506759A (ja) 2005-09-01 2009-02-19 コーベット ライフ サイエンス ピーティーワイ リミテッド 核酸の増幅、定量化、及び同定の方法。
US8076074B2 (en) 2005-11-29 2011-12-13 Quest Diagnostics Investments Incorporated Balanced translocation in comparative hybridization
US8768629B2 (en) 2009-02-11 2014-07-01 Caris Mpi, Inc. Molecular profiling of tumors
US8568979B2 (en) 2006-10-10 2013-10-29 Illumina, Inc. Compositions and methods for representational selection of nucleic acids from complex mixtures using hybridization
DE102006050037A1 (de) 2006-10-24 2008-04-30 Robert Bosch Gmbh Ultraschallwandler
US7899626B2 (en) 2007-01-10 2011-03-01 Illumina, Inc. System and method of measuring methylation of nucleic acids
DE102007016707A1 (de) 2007-04-04 2008-10-09 Qiagen Gmbh Verfahren zur Aufreinigung von Biomolekülen
US8999634B2 (en) 2007-04-27 2015-04-07 Quest Diagnostics Investments Incorporated Nucleic acid detection combining amplification with fragmentation
DE102007025277A1 (de) 2007-05-31 2008-12-04 Qiagen Gmbh Verfahren zur Stabilisierung einer biologischen Probe
US7507539B2 (en) 2007-07-30 2009-03-24 Quest Diagnostics Investments Incorporated Substractive single label comparative hybridization
WO2009135212A2 (en) 2008-05-02 2009-11-05 Epicentre Technologies Corporation Selective 5' ligation tagging of rna
US8871687B2 (en) 2007-09-28 2014-10-28 Quest Diagnostics Investments Incorporated Nucleic acid sequencing by single-base primer extension
EP2053132A1 (en) 2007-10-23 2009-04-29 Roche Diagnostics GmbH Enrichment and sequence analysis of geomic regions
US8093063B2 (en) 2007-11-29 2012-01-10 Quest Diagnostics Investments Incorporated Assay for detecting genetic abnormalities in genomic nucleic acids
AU2009238247B2 (en) 2008-04-17 2014-12-11 Qiagen Gaithersburg, Inc. Compositions, methods, and kits using synthetic probes for determining the presence of a target nucleic acid
US9410956B1 (en) 2008-08-01 2016-08-09 University Of South Florida Micro-RNA profiling in ovarian cancer
WO2010028098A2 (en) * 2008-09-03 2010-03-11 The Johns Hopkins University Pathways underlying pancreatic tumorigenesis and an hereditary pancreatic cancer gene
AU2009320213B2 (en) 2008-10-27 2016-06-16 Qiagen Gaithersburg Inc. Fast results hybrid capture assay and system
EP2350314B1 (en) 2008-10-30 2015-06-03 QIAGEN Gaithersburg, Inc. Individually synthesized g-deficient primers to be used in whole genome amplification
US8399221B2 (en) 2008-11-04 2013-03-19 Sabiosciences Corporation Methods for detection and quantitation of small RNAs
CN102439169B (zh) 2008-11-13 2014-11-19 复旦大学 用于结肠直肠癌的微rna表达谱分析的组合物和方法
EP2193831A1 (de) 2008-12-05 2010-06-09 Qiagen GmbH Parallel-Extraktion von unterschiedlichen Biomolekülen aus Formalin-fixiertem Gewebe
WO2010088273A1 (en) 2009-01-27 2010-08-05 Qiagen Gaithersburg Thermophilic helicase dependent amplification technology with endpoint homogenous fluorescent detection
US9347092B2 (en) 2009-02-25 2016-05-24 Roche Molecular System, Inc. Solid support for high-throughput nucleic acid analysis
JP5457222B2 (ja) 2009-02-25 2014-04-02 エフ.ホフマン−ラ ロシュ アーゲー 小型化ハイスループット核酸分析
WO2010099230A2 (en) 2009-02-25 2010-09-02 Illumina, Inc. Separation of pyrophosphate release and pyrophosphate detection
EP3495498B1 (en) 2009-03-30 2021-10-27 Illumina, Inc. Gene expression analysis in single cells
JP5738278B2 (ja) 2009-05-01 2015-06-24 キアジェン ゲイサーズバーグ インコーポレイテッド 試料中のrnaスプライシング形態を検出するための非標的増幅法
WO2010138460A1 (en) 2009-05-26 2010-12-02 Quest Diagnostics Investments Incorporated Methods for detecting gene dysregulations
US8409802B2 (en) 2009-08-14 2013-04-02 Roche Molecular Systems, Inc. Format of probes to detect nucleic acid differences
WO2011050981A2 (en) 2009-10-30 2011-05-05 Roche Diagnostics Gmbh Method for detecting balanced chromosomal aberrations in a genome
EP2510126B1 (en) 2009-12-07 2017-08-09 Illumina, Inc. Multi-sample indexing for multiplex genotyping
US9238832B2 (en) 2009-12-11 2016-01-19 Roche Molecular Systems, Inc. Allele-specific amplification of nucleic acids
AU2010366273A1 (en) 2009-12-14 2012-10-11 North Carolina State University Mean DNA copy number of chromosomal regions is of prognostic significance in cancer
AU2011210734B2 (en) 2010-01-29 2017-02-09 Qiagen Gaithersburg, Inc. Methods and compositions for sequence-specific purification and multiplex analysis of nucleic acids
WO2011123246A2 (en) 2010-04-01 2011-10-06 Illumina, Inc. Solid-phase clonal amplification and related methods
WO2011143583A1 (en) 2010-05-13 2011-11-17 Illumina, Inc. Binding assays for markers
CA2799200A1 (en) 2010-05-19 2011-11-24 Qiagen Gaithersburg, Inc. Methods and compositions for sequence-specific purification and multiplex analysis of nucleic acids
WO2012034130A2 (en) 2010-09-10 2012-03-15 Qiagen Methods and compositions for nucleic acid detection
US8483969B2 (en) 2010-09-17 2013-07-09 Illuminia, Inc. Variation analysis for multiple templates on a solid support
WO2012047899A2 (en) 2010-10-04 2012-04-12 The Johns Hopkins University Novel dna hypermethylation diagnostic biomarkers for colorectal cancer
US9499629B2 (en) 2010-12-09 2016-11-22 The Trustees Of The University Of Pennsylvania Use of chimeric antigen receptor-modified T-cells to treat cancer
ES2791716T3 (es) 2010-12-14 2020-11-05 Univ Maryland Células T que expresan al receptor de antígeno quimérico antietiqueta universal y métodos para el tratamiento del cáncer
WO2012092336A2 (en) 2010-12-28 2012-07-05 Caris Mpi, Inc. Molecular profiling for cancer
KR20140024270A (ko) 2010-12-30 2014-02-28 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
WO2012095378A1 (en) 2011-01-11 2012-07-19 Roche Diagnostics Gmbh High resolution melting analysis as a prescreening tool
WO2012108864A1 (en) 2011-02-08 2012-08-16 Illumina, Inc. Selective enrichment of nucleic acids
US8728732B2 (en) 2011-03-01 2014-05-20 The Johns Hopkins University Global DNA hypomethylation and biomarkers for clinical indications in cancer
EP2495336B8 (en) 2011-03-04 2014-07-23 Roche Diagnostics GmbH A new type of universal probes for the detection of genomic variants
US8658572B2 (en) 2011-03-18 2014-02-25 Roche Nimblegen, Inc. Whole proteome tiling microarrays
ES2625288T3 (es) 2011-04-15 2017-07-19 The Johns Hopkins University Sistema de secuenciación segura
AU2012267888A1 (en) 2011-06-07 2014-01-30 Caris Mpi, Inc. Molecular profiling for cancer
EP3290528B1 (en) 2011-09-23 2019-08-14 Illumina, Inc. Methods and compositions for nucleic acid sequencing
US9410206B2 (en) 2011-11-30 2016-08-09 John Wayne Cancer Institute Long noncoding RNA (lncRNA) as a biomarker and therapeutic marker in cancer
CA2865163A1 (en) 2012-02-23 2013-08-29 Qiagen Mansfield, Inc. Multimodal pcr target detection
ES2945311T3 (es) 2012-03-26 2023-06-30 Univ Johns Hopkins Detección rápida de aneuploidía
EP2653558B1 (en) 2012-04-18 2015-10-07 Roche Diagniostics GmbH A method of detecting nucleic acid targets using a statistical classifier
EP4071253A1 (en) 2012-07-26 2022-10-12 Illumina, Inc. Compositions and methods for the amplification of nucleic acids
US20150197787A1 (en) 2012-08-02 2015-07-16 Qiagen Gmbh Recombinase mediated targeted dna enrichment for next generation sequencing
US8904664B2 (en) 2012-08-15 2014-12-09 Mimedx Group, Inc. Dehydration device and methods for drying biological materials
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP2898090B1 (en) 2012-09-18 2017-11-08 Qiagen GmbH Method and kit for preparing a target rna depleted sample
US20140128270A1 (en) 2012-11-08 2014-05-08 Roche Molecular Systems, Inc. Method of improving microarray performance by strand elimination
US9218450B2 (en) 2012-11-29 2015-12-22 Roche Molecular Systems, Inc. Accurate and fast mapping of reads to genome
AU2013355260B2 (en) 2012-12-04 2019-07-25 Caris Mpi, Inc. Molecular profiling for cancer
US9382581B2 (en) 2012-12-13 2016-07-05 Roche Molecular Systems, Inc. Primers with modified phosphate and base in allele-specific PCR
US9279146B2 (en) 2012-12-21 2016-03-08 Roche Molecular Systems, Inc. Compounds and methods for the enrichment of mutated nucleic acid from a mixture
UY35468A (es) 2013-03-16 2014-10-31 Novartis Ag Tratamiento de cáncer utilizando un receptor quimérico de antígeno anti-cd19
US9792403B2 (en) 2013-05-10 2017-10-17 Foundation Medicine, Inc. Analysis of genetic variants
US9873908B2 (en) 2013-11-27 2018-01-23 Roche Molecular Systems, Inc. Methods for the enrichment of mutated nucleic acid from a mixture
EP3083994B1 (en) 2013-12-20 2021-08-18 Illumina, Inc. Preserving genomic connectivity information in fragmented genomic dna samples
US9944924B2 (en) 2014-01-16 2018-04-17 Illumina, Inc. Polynucleotide modification on solid support
WO2015116868A2 (en) 2014-01-29 2015-08-06 Caris Mpi, Inc. Molecular profiling of immune modulators
US9670530B2 (en) 2014-01-30 2017-06-06 Illumina, Inc. Haplotype resolved genome sequencing
WO2015120177A1 (en) 2014-02-07 2015-08-13 Qiagen Sciences Llc Pcr primers
EP3119197A1 (en) 2014-03-18 2017-01-25 Qiagen GmbH Stabilization and isolation of extracellular nucleic acids
CA2943636C (en) 2014-03-25 2020-06-09 Quest Diagnostics Investments Incorporated Detection of gene fusions by intragenic differential expression (ide) using average cycle thresholds
JP6618929B2 (ja) 2014-05-12 2019-12-11 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft ウルトラディープシークエンシングにおける希少バリアントコール
SG11201609692SA (en) 2014-06-03 2016-12-29 Illumina Inc Compositions, systems, and methods for detecting events using tethers anchored to or adjacent to nanopores
GB201410646D0 (en) 2014-06-14 2014-07-30 Illumina Cambridge Ltd Methods of increasing sequencing accuracy
US10017759B2 (en) 2014-06-26 2018-07-10 Illumina, Inc. Library preparation of tagged nucleic acid
WO2015198074A1 (en) 2014-06-27 2015-12-30 Illumina Cambridge Limited Methods, applications and systems for processing and presenting gene sequencing information
US10658073B2 (en) 2014-08-15 2020-05-19 QIAGEN Redwood City, Inc. Methods and systems for interpretation and reporting of sequence-based genetic tests using pooled allele statistics
EP3169799B1 (en) 2014-07-15 2019-09-04 Qiagen Sciences, LLC Semi-random barcodes for nucleic acid analysis
EP3191606B1 (en) 2014-09-12 2020-05-27 Illumina, Inc. Methods for detecting the presence of polymer subunits using chemiluminescence
EP3212808B1 (en) * 2014-10-30 2022-03-02 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
DK3218511T3 (da) 2014-11-11 2020-07-20 Illumina Cambridge Ltd Fremgangsmåder og arrays til frembringelse og sekventering af monoklonale klynger af nukleinsyre
JP6905934B2 (ja) 2014-12-05 2021-07-21 ファウンデーション・メディシン・インコーポレイテッド 腫瘍試料の多重遺伝子分析
EP3882356A1 (en) 2014-12-15 2021-09-22 Illumina, Inc. Compositions and methods for single molecular placement on a substrate
US10792299B2 (en) 2014-12-26 2020-10-06 Nitto Denko Corporation Methods and compositions for treating malignant tumors associated with kras mutation
AU2015374259B2 (en) 2014-12-31 2020-08-13 Guardant Health, Inc. Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results
EP3247804B1 (en) 2015-01-23 2020-08-05 Qiagen Sciences, LLC High multiplex pcr with molecular barcoding
RU2761432C2 (ru) 2015-02-10 2021-12-08 Иллюмина, Инк. Способ и композиция для анализа клеточных компонентов
WO2016135300A1 (en) 2015-02-26 2016-09-01 Qiagen Gmbh Efficiency improving methods for gene library generation
EP3265079A4 (en) * 2015-03-03 2019-01-02 Caris MPI, Inc. Molecular profiling for cancer
EP3274475A4 (en) 2015-03-26 2018-12-05 Quest Diagnostics Investments Incorporated Alignment and variant sequencing analysis pipeline
US9828672B2 (en) 2015-03-26 2017-11-28 Lam Research Corporation Minimizing radical recombination using ALD silicon oxide surface coating with intermittent restoration plasma
WO2016156529A1 (en) 2015-03-31 2016-10-06 Qiagen Gmbh Efficiency improving ligation methods
WO2016170147A1 (en) 2015-04-22 2016-10-27 Qiagen Gmbh Efficiency improving ligation methods
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
CA3234222A1 (en) 2015-05-01 2016-11-10 Guardant Health, Inc. Diagnostic methods
CA2986685C (en) 2015-05-27 2024-05-28 Quest Diagnostics Investments Incorporated Compositions and methods for screening solid tumors
CA2986074A1 (en) 2015-06-03 2016-12-08 Illumina, Inc. Compositions, systems, and methods for sequencing polynucleotides using tethers anchored to polymerases adjacent to nanopores
ES2906751T3 (es) 2015-06-05 2022-04-20 Qiagen Gmbh Método para separar el DNA por tamaño
EP3307886B1 (en) 2015-06-10 2021-03-24 Qiagen GmbH Method for isolating extracellular nucleic acids using anion exchange particles
CA2991045A1 (en) 2015-06-29 2017-01-05 Caris Science, Inc. Therapeutic oligonucleotides binding c1q
WO2017006108A1 (en) 2015-07-06 2017-01-12 Illumina Cambridge Limited Sample preparation for nucleic acid amplification
US10640823B2 (en) 2015-07-08 2020-05-05 Quest Diagnostics Investments Incorporated Detecting genetic copy number variation
EP3325667B1 (en) 2015-07-21 2020-11-11 Guardant Health, Inc. Locked nucleic acids for capturing fusion genes
US10913975B2 (en) 2015-07-27 2021-02-09 Illumina, Inc. Spatial mapping of nucleic acid sequence information
EP3341478B1 (en) 2015-08-24 2019-11-06 Qiagen GmbH Method for generating a rna-sequencing library
US11302416B2 (en) 2015-09-02 2022-04-12 Guardant Health Machine learning for somatic single nucleotide variant detection in cell-free tumor nucleic acid sequencing applications
US20170058332A1 (en) 2015-09-02 2017-03-02 Guardant Health, Inc. Identification of somatic mutations versus germline variants for cell-free dna variant calling applications
US20180268937A1 (en) 2015-09-24 2018-09-20 Caris Science, Inc. Method, apparatus, and computer program product for analyzing biological data
US10577643B2 (en) 2015-10-07 2020-03-03 Illumina, Inc. Off-target capture reduction in sequencing techniques
WO2017062970A1 (en) 2015-10-10 2017-04-13 Guardant Health, Inc. Methods and applications of gene fusion detection in cell-free dna analysis
US11203777B2 (en) 2015-11-20 2021-12-21 Qiagen Gmbh Method of preparing sterilized compositions for stabilization of extracellular nucleic acids
CN108603228B (zh) 2015-12-17 2023-09-01 夸登特健康公司 通过分析无细胞dna确定肿瘤基因拷贝数的方法
BR112018014349A2 (pt) 2016-01-15 2019-02-12 Hoffmann La Roche métodos para sequenciar material genômico, para sequenciar dna em uma amostra, para reduzir mutações introduzidas por pcr e para tratar câncer, e métodos de sequenciamento de dna em uma amostra e sequenciamento representacional direcionado
CN108603229A (zh) 2016-01-22 2018-09-28 格瑞尔公司 用于高保真测序的方法和系统
WO2017132276A1 (en) 2016-01-26 2017-08-03 Ventana Medical Systems, Inc. Predictive diagnostic workflow for tumors usnig automated dissection, next generation sequencing, and automated slide stainers
US20190300946A1 (en) 2016-01-29 2019-10-03 The Johns Hopkins University Bottleneck sequencing
CA3013366A1 (en) 2016-02-02 2017-08-10 Guardant Health, Inc. Cancer evolution detection and diagnostic
CN109196359B (zh) 2016-02-29 2022-04-12 基础医疗股份有限公司 用于评估肿瘤突变负荷的方法和系统
US20190085406A1 (en) 2016-04-14 2019-03-21 Guardant Health, Inc. Methods for early detection of cancer
US20210222248A1 (en) 2016-04-15 2021-07-22 Roche Sequencing Solutions, Inc. Detecting cancer driver genes and pathways
US20170316149A1 (en) 2016-04-28 2017-11-02 Quest Diagnostics Investments Inc. Classification of genetic variants
EP3455372B1 (en) 2016-05-11 2019-10-30 Illumina, Inc. Polynucleotide enrichment and amplification using argonaute systems
EP3458597B1 (en) 2016-05-18 2022-09-07 Roche Diagnostics GmbH Quantitative real time pcr amplification using an electrowetting-based device
WO2017205686A1 (en) 2016-05-25 2017-11-30 Caris Science, Inc. Oligonucleotide probes and uses thereof
CN109415727A (zh) 2016-06-13 2019-03-01 格里尔公司 富集突变的无细胞核酸以供癌症检测的方法
US10144962B2 (en) 2016-06-30 2018-12-04 Grail, Inc. Differential tagging of RNA for preparation of a cell-free DNA/RNA sequencing library
BR112019000296A2 (pt) 2016-07-06 2019-04-16 Guardant Health, Inc. métodos para a determinação de perfil de fragmentome de ácidos nucleicos livres de célula
EP4180539A1 (en) 2016-07-12 2023-05-17 Qiagen Sciences, LLC Single end duplex dna sequencing
KR20230003255A (ko) 2016-07-22 2023-01-05 오레곤 헬스 앤드 사이언스 유니버시티 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
KR20220098812A (ko) 2016-09-22 2022-07-12 일루미나, 인코포레이티드 체세포 복제수 변이 검출
EP3299471B1 (en) 2016-09-23 2019-10-23 Roche Diagniostics GmbH Methods for determining the amount of a nucleic acid of interest in an unprocessed sample
US10487358B2 (en) 2016-09-23 2019-11-26 Grail, Inc. Methods of preparing and analyzing cell-free nucleic acid sequencing libraries
AU2017336562A1 (en) 2016-09-27 2019-04-18 Caris Science, Inc. Oligonucleotide probes and uses thereof
EP3792922A1 (en) 2016-09-30 2021-03-17 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
US10810213B2 (en) 2016-10-03 2020-10-20 Illumina, Inc. Phenotype/disease specific gene ranking using curated, gene library and network based data structures
KR20230044335A (ko) 2016-10-07 2023-04-03 일루미나, 인코포레이티드 뉴클레오타이드 서열분석 데이터의 이차 분석을 위한 시스템 및 방법
AU2017347790B2 (en) 2016-10-24 2024-06-13 Grail, Inc. Methods and systems for tumor detection
WO2018081604A1 (en) 2016-10-28 2018-05-03 Grail, Inc. Methods for single-stranded nucleic acid library preparation
CN109844137B (zh) 2016-10-31 2022-04-26 豪夫迈·罗氏有限公司 用于鉴定嵌合产物的条形码化环状文库构建
CA3040930A1 (en) 2016-11-07 2018-05-11 Grail, Inc. Methods of identifying somatic mutational signatures for early cancer detection
KR102638152B1 (ko) 2016-11-16 2024-02-16 일루미나, 인코포레이티드 서열 변이체 호출을 위한 검증 방법 및 시스템
WO2018111872A1 (en) 2016-12-12 2018-06-21 Grail, Inc. Methods for tagging and amplifying rna template molecules for preparing sequencing libraries
CA3046007A1 (en) 2016-12-22 2018-06-28 Guardant Health, Inc. Methods and systems for analyzing nucleic acid molecules
US20180225413A1 (en) 2016-12-22 2018-08-09 Grail, Inc. Base Coverage Normalization and Use Thereof in Detecting Copy Number Variation
EP3559255A1 (en) 2016-12-23 2019-10-30 Grail, Inc. Methods for high efficiency library preparation using double-stranded adapters
CA3048859A1 (en) 2016-12-28 2018-07-05 Quest Diagnostics Investments Llc Compositions and methods for detecting circulating tumor dna
US20200090784A1 (en) 2017-01-17 2020-03-19 Illumina, Inc. Oncogenic splice variant determination
CA3050247A1 (en) 2017-01-18 2018-07-26 Illumina, Inc. Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
MY197535A (en) 2017-01-25 2023-06-21 Univ Hong Kong Chinese Diagnostic applications using nucleic acid fragments
CA3063364A1 (en) 2017-01-26 2018-08-02 Qiagen Gmbh Method for enriching template nucleic acids
WO2018204657A1 (en) * 2017-05-04 2018-11-08 The Johns Hopkins University Detection of cancer
WO2018218113A1 (en) 2017-05-26 2018-11-29 Novelis Inc. Fluid temperature control system and method for decoating kiln
AU2018342007A1 (en) * 2017-08-07 2020-02-27 Board Of Regents, The University Of Texas Systems Methods and materials for assessing and treating cancer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010141955A2 (en) * 2009-06-05 2010-12-09 Myriad Genetics, Inc. Methods of detecting cancer
WO2013113816A1 (en) * 2012-01-31 2013-08-08 Speiser Paul Non-invasive cancer diagnosis

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FLORENCE LE CALVEZ-KELM等: "KRAS mutations in blood circulating cell-free DNA: a pancreatic cancer case-control study", 《ONCOTARGET》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112011611B (zh) * 2020-05-25 2021-04-23 桂林医学院附属医院 circRNA在诊治胃癌中的应用
CN112011611A (zh) * 2020-05-25 2020-12-01 桂林医学院附属医院 circRNA在诊治胃癌中的应用
CN113804901A (zh) * 2020-06-15 2021-12-17 南京市口腔医院 用于口腔鳞癌早期无创诊断的血清脂质标志物及其应用
CN112597702B (zh) * 2020-12-21 2022-07-19 电子科技大学 基于径向基函数的气动建模生成式对抗网络模型训练方法
CN112597702A (zh) * 2020-12-21 2021-04-02 电子科技大学 基于径向基函数的气动建模生成式对抗网络模型训练方法
CN113065454A (zh) * 2021-03-30 2021-07-02 青岛海信智慧生活科技股份有限公司 一种高空抛物目标识别比较的方法及装置
CN113130009A (zh) * 2021-04-19 2021-07-16 林燕 调节eif4a3表达以调控肝癌细胞凋亡、迁移和侵袭能力的应用
CN113584145A (zh) * 2021-06-09 2021-11-02 广东省妇幼保健院 检测pgrmc1含量的试剂在制备诊断和预测多囊卵巢综合征的试剂盒中的应用
CN113436677A (zh) * 2021-08-13 2021-09-24 北京大学 测试受试者患有肝癌可能性的系统及方法
CN113889191A (zh) * 2021-09-16 2022-01-04 深圳百人科技有限公司 一种基于cpe和cpd实现高效个体识别位点筛选的贪心算法
CN114093512B (zh) * 2021-10-21 2023-04-18 杭州电子科技大学 一种基于多模态数据和深度学习模型的生存预测方法
CN114093512A (zh) * 2021-10-21 2022-02-25 杭州电子科技大学 一种基于多模态数据和深度学习模型的生存预测方法
CN114067315A (zh) * 2021-10-23 2022-02-18 广州市艾贝泰生物科技有限公司 细胞计数方法、装置、计算机设备和存储介质
CN114067315B (zh) * 2021-10-23 2022-11-29 广州市艾贝泰生物科技有限公司 细胞计数方法、装置、计算机设备和存储介质
CN114107502A (zh) * 2021-11-29 2022-03-01 四川大学华西医院 一种上尿路上皮癌诊断标志物及其应用
CN114324641A (zh) * 2021-12-22 2022-04-12 山东英盛生物技术有限公司 一种冠心病代谢标志物及在诊断、预后方面的应用
CN114533201A (zh) * 2022-01-05 2022-05-27 华中科技大学同济医学院附属协和医院 一种新型的体外波碎血凝块辅助设备
CN114317539A (zh) * 2022-01-12 2022-04-12 上海卡序生物医药科技有限公司 hsa_circ_0001137环状RNA及其在癌症诊断、治疗中的应用
CN114317539B (zh) * 2022-01-12 2023-05-23 上海卡序生物医药科技有限公司 hsa_circ_0001137环状RNA及其在癌症诊断、治疗中的应用
CN114512183A (zh) * 2022-01-27 2022-05-17 北京吉因加医学检验实验室有限公司 一种预测met基因扩增或多倍体的方法及装置
CN116987789A (zh) * 2023-06-30 2023-11-03 上海仁东医学检验所有限公司 Utuc分子分型、单样本分类器及其构建方法
CN116570599A (zh) * 2023-07-04 2023-08-11 四川大学华西医院 Vs6766联合lxh254的应用及药物组合物
CN116570599B (zh) * 2023-07-04 2023-10-20 四川大学华西医院 Vs6766联合ly3009120的应用及药物组合物
CN117004729A (zh) * 2023-08-18 2023-11-07 上海爱谱蒂康生物科技有限公司 生物标志物及其在预测和/或诊断utuc进展时间中的应用
CN117004729B (zh) * 2023-08-18 2024-03-15 上海爱谱蒂康生物科技有限公司 生物标志物及其在预测和/或诊断utuc进展时间中的应用
CN117110596A (zh) * 2023-09-06 2023-11-24 方舟生物安全科技(广州)有限公司 一种用于富集cfDNA的修饰玻片、方法及其应用
CN117110596B (zh) * 2023-09-06 2024-01-26 方舟生物安全科技(广州)有限公司 一种用于富集cfDNA的修饰玻片、方法及其应用
CN117238419A (zh) * 2023-11-13 2023-12-15 宝鸡拓普达钛业有限公司 优化钛合金热扩散连接的钛材材料抗性提高方法及系统
CN117238419B (zh) * 2023-11-13 2024-02-06 宝鸡拓普达钛业有限公司 优化钛合金热扩散连接的钛材材料抗性提高方法及系统
CN117238488A (zh) * 2023-11-16 2023-12-15 四川省肿瘤医院 一种基于图像分析的直肠癌放疗反应分析方法及系统
CN117238488B (zh) * 2023-11-16 2024-01-30 四川省肿瘤医院 一种基于图像分析的直肠癌放疗反应分析方法及系统
CN117292211A (zh) * 2023-11-27 2023-12-26 潍坊市海洋发展研究院 水质标注图像发送方法、装置、电子设备和计算机可读介质
CN117292211B (zh) * 2023-11-27 2024-02-27 潍坊市海洋发展研究院 水质标注图像发送方法、装置、电子设备和计算机可读介质

Also Published As

Publication number Publication date
JP2020530290A (ja) 2020-10-22
JP7232476B2 (ja) 2023-03-08
US20190256924A1 (en) 2019-08-22
CA3072195A1 (en) 2019-04-04
WO2020150656A1 (en) 2020-07-23
IL272470A (en) 2020-03-31
JP2023075090A (ja) 2023-05-30
SG11202001010UA (en) 2020-03-30
EP3665308A1 (en) 2020-06-17
MX2020001575A (es) 2020-11-18
US20200377956A1 (en) 2020-12-03
CL2020000343A1 (es) 2021-03-19
WO2019067092A1 (en) 2019-04-04
BR112020002555A2 (pt) 2020-08-11
KR20200115450A (ko) 2020-10-07
EP3837385A1 (en) 2021-06-23
AU2018342007A1 (en) 2020-02-27

Similar Documents

Publication Publication Date Title
JP7232476B2 (ja) がんを評価及び治療するための方法及び物質
US11560558B2 (en) Methods of capturing cell-free methylated DNA and uses of same
US20230323474A1 (en) Compositions and methods for isolating cell-free dna
Beltran et al. Divergent clonal evolution of castration-resistant neuroendocrine prostate cancer
JP2021520816A (ja) 循環腫瘍dnaの個別化された検出を用いる癌検出およびモニタリングの方法
US11795492B2 (en) Methods of nucleic acid sample preparation
EP2986736B1 (en) Gene fusions and gene variants associated with cancer
Karnes et al. Targeted next‐generation sequencing using fine‐needle aspirates from adenocarcinomas of the lung
JP2022519159A (ja) 循環細胞の分析方法
EP3512965B1 (en) Methods of nucleic acid sample preparation for analysis of cell-free dna
EP2836606A1 (en) Novel markers for detecting microsatellite instability in cancer and determining synthetic lethality with inhibition of the dna base excision repair pathway
CN112567081A (zh) 评价基因组改变的组合物和方法
JP2022530920A (ja) 核酸配列の変異、発現、スプライスバリアント、転座、コピー数、またはメチル化変化を特定及び定量するためのマーカー
CN117597456A (zh) 用于确定肿瘤生长的速度的方法
Samman et al. A novel genomic signature reclassifies an oral cancer subtype
Nassar et al. Epigenomic charting and functional annotation of risk loci in renal cell carcinoma
WO2022147420A1 (en) Detection of epigenetic status using sequence-specific degradation
Yizhak et al. A comprehensive analysis of RNA sequences reveals macroscopic somatic clonal expansion across normal tissues
RU2811503C2 (ru) Способы выявления и мониторинга рака путем персонализированного выявления циркулирующей опухолевой днк
EP4179111B1 (en) Methods of detecting genomic rearrangements using cell free nucleic acids
McGregor A Tale of Two Validations: Molecular Diagnostic Assays for the Detection of Clinically Significant Alterations
JP2023524681A (ja) 分配された核酸を使用した配列決定のための方法
KYON CLINICAL APPLICATION OF CANCER EXOME SEQUENCING

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40038488

Country of ref document: HK