CN115244188A - 用于鉴定和定量核酸序列突变、表达、剪接变体、易位、拷贝数或甲基化变化的标记物 - Google Patents

用于鉴定和定量核酸序列突变、表达、剪接变体、易位、拷贝数或甲基化变化的标记物 Download PDF

Info

Publication number
CN115244188A
CN115244188A CN202080048135.9A CN202080048135A CN115244188A CN 115244188 A CN115244188 A CN 115244188A CN 202080048135 A CN202080048135 A CN 202080048135A CN 115244188 A CN115244188 A CN 115244188A
Authority
CN
China
Prior art keywords
chain reaction
polymerase chain
nucleic acid
sequence
primer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080048135.9A
Other languages
English (en)
Inventor
F·巴拉尼
M·D·巴科洛德
J·黄
A·H·米尔扎
P·B·菲恩伯格
S·F·贾迪纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cornell University
Original Assignee
Cornell University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cornell University filed Critical Cornell University
Publication of CN115244188A publication Critical patent/CN115244188A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及用于鉴定和/或定量低丰度、核苷酸碱基突变、插入、缺失、易位、剪接变体、miRNA变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失、内含子插入或基因组水平上的其他重排和/或甲基化核苷酸碱基的方法。

Description

用于鉴定和定量核酸序列突变、表达、剪接变体、易位、拷贝数 或甲基化变化的标记物
本申请要求2019年5月3日提交的美国临时申请序列号62/843,032的权益,所述临时申请以引用的方式整体并入本文。
本发明是在由美国国家卫生研究院授予的授权号P41 EB020594的政府支持下完成。美国政府拥有本发明的某些权利。
技术领域
本申请涉及使用亚硫酸氢盐处理、核酸酶、连接和聚合酶反应与遗留预防的组合鉴定和定量核酸序列、突变、表达、剪接变体、易位、拷贝数和/或甲基化变化的方法和标记物。
背景技术
癌症是发达国家中死亡的主要原因,并且是发展中国家中死亡的第二主要原因。癌症每年在美国杀死58万名患者,在欧洲杀死130万名患者,且在中国杀死280万名患者(Siegel等,“Cancer Statistics,2016,”CA Cancer J.Clin.66(1):7-30(2016))。癌症现在是全球最大的死亡原因,2012年估计有820万人死于癌症(Torre等,“Global CancerStatistics,2012,”CA Cancer J.Clin.65(2):87-108(2015))。预测在接下来的二十年内全世界的癌症病例将上升75%,并且达到接近2500万例。女性死于浸润性癌症的终生风险是19%,而男性死于浸润性癌症的终生风险是23%。由于美国癌症护理的年度总成本超过4000亿美元,因此没有其他医疗问题如此迫切需要智能解决方案。
在美国,在男性中,新的癌症病例主要有前列腺癌(21%)、肺癌(14%)、结肠直肠癌(8%)、膀胱癌(7%)、黑素瘤(6%)、非霍奇金淋巴瘤(5%)、肾癌(5%)、头颈癌(4%)、白血病(4%)以及肝癌和胆癌(3%)。在女性中,大多数新诊断的癌症是乳腺癌(29%)、肺癌(13%)、结肠直肠癌(8%)、子宫体癌(7%)、甲状腺癌(6%)、非霍奇金淋巴瘤(4%)、黑素瘤(3%)、白血病(3%)、胰腺癌(3%)和肾癌(3%)。癌症死亡的主要原因对于男性和女性分别是肺癌(27%)、前列腺癌(8%)、结肠直肠癌(8%)与肺癌(26%)、乳腺癌(14%)、结肠直肠癌(8%)。这些癌症由不同的生物过程驱动,并且尽管在一些癌症的治疗中存在令人兴奋的进展,诸如出现靶向治疗剂和免疫疗法,但大多数癌症在晚期才被发现,在这种情况下存活较差。由于缺乏可靠且廉价的早期检测测试,许多癌症类型在晚期才被诊断,在这种情况下一些癌症的存活率下降到10%以下。目前的筛查技术由于患者依从性低、费用高以及灵敏度和特异性率低而失败(Das等,“Predictive and Prognostic Biomarkers inColorectal Cancer:A Systematic Review of Recent Advances and Challenges,”Biomedicine&Pharmacotherapy 87:8-19(2016))。例如,结肠镜检查的高成本、不适性和侵入性是患者对CRC筛查的依从性的重大障碍(Beydoun等,“Predictors of ColorectalCancer Screening Behaviors Among Average-risk Older Adults in the UnitedStates,”Cancer Causes&Control:CCC 19(4):339-359(2008))。同样,患者对于处理粪便的厌恶限制了FOBT/FIT的成功,并且消除了作为低依从性的补救措施的基于粪便的测试。相反,当前的提议通过开发具有被广泛采用的潜力的血液测试来解决这些问题。增加患者对CRC测试的依从性将导致更早的检测,并最终增加患者存活率。
最后,迫切需要开发将检测早期癌症的非侵入性、高灵敏度、高特异性和成本有效的测试。癌症研究中两项相对近期的发展充当这些任务的指导原则。首先,使用现代基因组工具(诸如全基因组测序、转录和甲基化谱分析)。公众对由这些研究产生的大量数据库的可访问性加速了与癌症进展相关的分子标记物(诸如启动子甲基化、突变、拷贝数或者mRNA、微小RNA、非编码RNA(ncRNA)和长非编码RNA(lncRNA)的表达水平)的更广泛列表的发现。其次是发现核酸会由癌细胞释放到患者的血流中。癌细胞可能经历凋亡(触发的细胞死亡),这将无细胞DNA(cfDNA)释放到患者血液中(Salvi等,“Cell-free DNA as aDiagnostic Marker for Cancer:Current Insights,”OncoTargets and Therapy 9:6549-6559(2016))。来自癌症患者的血清中的cfDNA的水平从难以察觉地小变化到高,但与癌症分期无关(Perlin等,“Serum DNA Levels in Patients With Malignant Disease,”American Journal of Clinical Pathology 58(5):601-602(1972);Leon等,“Free DNAin the Serum of Cancer Patients and the Effect of Therapy,”Cancer Res.37(3):646-650(1977))。此外,由癌细胞释放到血液中的外泌体(30nm至100nm范围内的脂质囊泡)可以含有相同的RNA分子,所述RNA分子充当肿瘤的转录标签(signature)。外泌体或肿瘤相关囊泡、屏蔽mRNA、lncRNA、ncRNA和甚至来自外源核酸酶的突变肿瘤DNA以及因此标记物处在受保护状态中。其他受保护状态包括但不限于在循环肿瘤细胞(CTC)内、在其他含非细胞膜囊泡或颗粒内、在核小体内或在Argonaute或其他蛋白质复合物内的DNA、RNA和蛋白质。特别地,cfDNA含有与实体瘤相同的分子畸变,诸如突变、高/低甲基化、拷贝数变化或染色体重排(Ignatiadis等,“Circulating Tumor Cells and Circulating Tumor DNA forPrecision Medicine:Dream or Reality?”Ann.Oncol.25(12):2304-2313(2014))。
在来自患有各种实体瘤的患者的血浆中已经检测到肿瘤特异性CpG甲基化(PrattVM,“Are We Ready for a Blood-Based Test to Detect Colon Cancer?”ClinicalChemistry 60(9):1141-1142(2014);Warton等,“Methylation of Cell-freeCirculating DNA in the Diagnosis of Cancer,”Frontiers in MolecularBiosciences 2:13(2015)),通过包括未甲基化胞嘧啶的亚硫酸氢盐转化、甲基化敏感性酶或5-甲基胞嘧啶的免疫沉淀的各种技术进行检测(Jorda等,“Methods for DNAmethylation analysis and applications in colon cancer,”Mutat.Res.693(1-2):84-93(2010))。甲基化标签对特定癌症类型具有更好的特异性,这可能是因为甲基化模式是高度组织特异性的(Issa JP,“DNA Methylation as a Therapeutic Target in Cancer,”Clin.Cancer Res.13(6):1634-1637(2007))。用于CRC检测的研究最彻底的基于血液的甲基化标记物位于SEPT9基因的启动子区域中(Church等,“Prospective Evaluation ofMethylated SEPT9 in Plasma for Detection of Asymptomatic Colorectal Cancer,”Gut63(2):317-325(2014);Lofton-Day等,“DNA Methylation Biomarkers for Blood-Based Colorectal Cancer Screening,”Clinical Chemistry54(2):414-423(2008);Potter等,“Validation of a Real-time PCR-based Qualitative Assay for theDetection of Methylated SEPT9 DNA in Human Plasma,”Clinical Chemistry 60(9):1183-1191(2014);Ravegnini等,“Simultaneous Analysis of SEPT9 PromoterMethylation Status,Micronuclei Frequency,and Folate-Related GenePolymorphisms:The Potential for a Novel Blood-Based Colorectal CancerBiomarker,”International Journal of Molecular Sciences 16(12):28486-28497(2015);Toth等,“Detection of Methylated SEPT9 in Plasma is a ReliableScreening Method for Both Left-and Right-sided Colon Cancers,”PloS One 7(9):e46000(2002);Toth等,“Detection of Methylated Septin 9in Tissue and Plasma ofColorectal Patients with Neoplasia and the Relationship to the Amount ofCirculating Cell-Free DNA,”PloS One9(12):e115415(2014);Warren等,“Septin9Methylated DNA is aSensitive and Specific Blood Test for Colorectal Cancer,”BMC Medicine9:133(2011)),并且用于CRC诊断的其他潜在标记物包括在以下基因的启动子区域上的CpG位点:THBD(Lange等,“Genome-scale Discovery of DNA-methylationBiomarkers for Blood-Based Detection of Colorectal Cancer,”PloS One 7(11):e50266(2012))、C9orf50(Lange等,“Genome-scale Discovery of DNA-methylationBiomarkers for Blood-Based Detection of Colorectal Cancer,”PloS One 7(11):e50266(2012))、ZNF154(Margolin等,“Robust Detection of DNA Hypermethylation ofZNF154 as a Pan-Cancer Locus with in Silico Modeling for Blood-BasedDiagnostic Development,”The Journal of Molecular Diagnostics 18(2):283-298(2016))以及AGBL4、FLI1和TWIST1(Lin等,“Clinical Relevance of Plasma DNAMethylation in Colorectal Cancer Patients Identified by Using a Genome-WideHigh-Resolution Array,”Ann.Surg.Oncol.22增刊3:S1419-1427(2015))。在乳腺癌中,在患者的cfDNA中已经检测到在肿瘤抑制基因(包括ATM、BRCA1、RASSF1、APC和RARβ)的启动子区域的甲基化(Tang等,“Blood-based DNA Methylation as Biomarker for BreastCancer:a Systematic Review,”Clinical Epigenetics 8:115(2016))。使用甲基化标记物的警告是亚硫酸氢盐转化倾向于破坏DNA,并因此降低可以检测到的总体信号。甲基化检测技术也可能由于未甲基化胞嘧啶的不完全转化而导致假阳性信号。如本文所述,已经进行了公共数据库的广泛生物信息学分析以鉴定适合在血浆中检测癌症的CRC特异性和组织特异性甲基化标记物。甲基化标记物检测测定使得能够实现具有单分子检测能力的更高水平的多路复用,预测其允许在广谱癌症中的更高的灵敏度和特异性。
开发可靠的诊断和筛查测试的挑战在于区分从肿瘤发出的指示疾病(例如,早期癌症)的那些标记物与从正常组织发出的相同标记物的存在(这将导致假阳性信号)。还需要平衡所检查的标记物的数量和测试的成本与测定的特异性和灵敏度。癌症基因组图谱联盟(TCGA)对数千种肿瘤进行的综合分子谱分析(mRNA、甲基化、拷贝数、miRNA、突变)已经揭示结肠直肠肿瘤与来自乳腺癌、前列腺癌或其他上皮癌的那些彼此不同(TCGA“Comprehensive Molecular Characterization of Human Colon and Rectal CancerNature 487:330-337(2014))。此外,它们共有的少数标记物也存在于多种癌症类型中,这阻碍了精确定位起源组织的能力。BRAF突变经常发生在黑素瘤(42%)和甲状腺癌(41%)中,而KRAS也在胰腺癌(55%)和肺癌(16%)中高度突变(Forbes等,“COSMIC:Exploringthe World's Knowledge of Somatic Mutations in Human Cancer,”Nucleic AcidsRes.43(数据库专辑):D805-811(2015))。通常,在晚期原发性癌症和转移中发现CRC突变标记物如KRAS和BRAF的那些(Spindler等,“Circulating free DNA as Biomarker andSource for Mutation Detection in Metastatic Colorectal Cancer,”PloS One 10(4):e0108247(2015);Gonzalez-Cao等,“BRAF Mutation Analysis in Circulating FreeTumor DNA of Melanoma Patients Treated with BRAF Inhibitors,”Melanoma Res.25(6):486-495(2015);Sakai等,“Extended RAS and BRAF Mutation Analysis UsingNext-Generation Sequencing,”PloS One 10(5):e0121891(2015))。对于早期癌症检测,核酸测定将主要充当筛查工具,需要二级诊断随访(例如,结肠直肠癌的结肠镜检查)的可用性。
使生物学问题更为复杂的是需要可靠地定量来自非常少量的初始细胞(即,来自CTC),或者当癌症信号来自血液中的无细胞DNA(cfDNA)并且被源自正常细胞或在样品加工期间从正常血细胞中无意地释放的过量核酸稀释时的突变、CpG甲基化或DNA或RNA拷贝数(Mateo等,“The Promise of Circulating Tumor Cell Analysis in CancerManagement,”Genome Biol.15:448(2014);Haque等,“Challenges in Using ctDNA toAchieve Early Detection of Cancer,”BioRxiv.237578(2017))。
一些癌症IVD公司已经开发了可商购获得的甲基化检测测试。上述SEPT9甲基化是Epi proColon测试的基础,所述Epi proColon测试是根据表观基因组学(Epigenomics)的CRC检测测定(Lofton-Day等,“DNA Methylation Biomarkers for Blood-basedColorectal Cancer Screening,”Clinical Chemistry 54(2):414-423(2008))。虽然对于较小样品组的初始结果显示是有希望的,但是使用1,544份血浆样品的大规模研究对于I-III期CRC显示64%的灵敏度,和78%-82%的特异性,实际上使1,000名个体中的180至220名接受不必要的结肠镜检查(Potter等,“Validation of a Real-time PCR-basedQualitative Assay for the Detection of Methylated SEPT9 DNA in Human Plasma,”Clinical Chemistry 60(9):1183-1191(2014))。临床基因组学目前正在开发的基于BCAT1和IKZF1基因的甲基化的基于血液的CRC检测测试(Pedersen等,“Evaluation of an Assayfor Methylated BCAT1 and IKZF1in Pasma for Detection of ColorectalNeoplasia,”BMC Cancer 15:654(2015)]。对于这种双标记物测试使用2,105份血浆样品的大规模研究显示66%的总灵敏度,其中对于I期CRC的灵敏度为38%,并且显示94%的惊人特异性(Young等,“A Cross-sectional Study Comparing aBlood Test for MethylatedBCAT1 and IKZF1 Tumor-derived DNA with CEA for Detection of RecurrentColorectal Cancer,”Cancer Medicine5(10):2763-2772(2016))。Exact Sciences和合作者已经稍微改进了CRC粪便测试的灵敏度(Bosch等,“Analytical Sensitivity andStability of DNA Methylation Testing in Stool Samples for Colorectal CancerDetection,”Cell Oncol.(Dordr)35(4):309-315(2012);Hong等,“DNA MethylationBiomarkers of Stool and Blood for Early Detection of Colon Cancer,”Genet.Test.Mol.Biomarkers 17(5):401-406(2013);Imperiale等,“Multitarget StoolDNA Testing for Colorectal-Cancer Screening,”N.Engl.J.Med.370(14):1287-1297(2014);Xiao等,“Validation of Methylation-Sensitive High-Resolution Melting(MS-HRM)for the Detection of Stool DNA Methylation in Colorectal Neoplasms,”Clin.Chim.Acta 431:154-163(2014);Yang等,“Diagnostic Value of Stool DNATesting for Multiple Markers of Colorectal Cancer and Advanced Adenoma:aMeta-Analysis,”Can.J.Gastroenterol.27(8):467-475(2013)),这通过添加K-ras突变以及BMP3和NDRG4甲基化标记物实现(Lidgard等,“Clinical Performance of an AutomatedStool DNA Assay for Detection of Colorectal Neoplasia,”Clin.Gastroenterol.Hepatol.11(10):1313-1318(2013))。对12,500份粪便样品的大规模研究声称93%的灵敏度,然而特异性仍然仅为85%,本质上使1,000名个体中的150名接受不必要的结肠镜检查。尽管在处理粪便时存在物流问题,但Exact Sciences最近销售了他们的第一百万份测试(millionth test)。Cologuard的网站公布测试结果为假阳性和假阴性两者,并且如果患者有痔疮、处于月经期或便血,则不应使用这种测试。Cologuard的网站还警告这种测试不供患有溃疡性结肠炎(UC)、克罗恩氏病(CD)、炎性肠病(IBD)或具有癌症家族史的患者使用。换句话说,Exact Sciences排除了那些将最受益于准确CRC检测测试的患者。最近,先进医学实验室(驻扎在Irvine,CA,与各种中国学术机构有联系)证明了探询单个CpG位点(cg10673833)的甲基化状态对于基于血液检测结肠直肠癌的潜力(Luo等,“Circulating Tumor DNA Methylation Profiles Enable Early Diagnosis,PrognosisPrediction,and Screening for Colorectal Cancer,”Science TranslationalMedicine12:(524)(2020))。
连续的诊断需要将需要连续的诊断测试。
目前大多数分子诊断学在癌症方面的努力集中于:(i)预后和预测基因组学,例如鉴定癌症易感性基因如BrCA1、BrCA2中的遗传突变(Ford等,Am.J.Hum.Genet.62:676-689(1998)),(ii)个体化治疗,例如EGFR基因中的突变指导个性化医疗(Sequist和Lynch,Ann.Rev.Med,59:429-442(2008)),和(iii)复发监测,例如检测在对药物治疗产生耐药性的患者中新出现的KRAS突变(Hiley等,Genome Biol.15:453(2014);Amado等,J.Clin.Oncol.26:1626-1634(2008))。然而,这漏失了癌症分子诊断连续性中的重要机会:(i)更频繁地筛查具有家族史的那些人,(ii)对于早期疾病的检测进行筛查,和(iii)监测治疗功效。为了解决这三个未满足的需要,本文提出了一种用于基于血液的检测的新度量,称为“癌症标记物载量”,类似于病毒载量。
DNA测序提供区分与疾病相关的所有核酸变化的最终能力。然而,这种方法仍然需要多重前期样品和模板制备,并且因此,DNA测序并不总是成本有效的。DNA微阵列可以提供关于多序列变体的大量信息,诸如SNP或不同的RNA表达水平,并且在成本上比测序低;然而,它们不太适合获得高度定量的结果,也不太适合检测低丰度突变。在谱系的另一端是TaqManTM反应,其提供已知基因的实时定量,但不太适合区分多序列变体或低丰度突变。
NGS需要大量前期样品制备以抛光末端和附加接头,并且当前0.7%的误差率太高以致于不能在10,000倍过量的野生型分子中鉴定出2-3个具有突变序列的分子。已经开发出“深度测序”方案,通过向单个片段的两条链附加独特的分子标识符来克服这种缺陷。这些方法被称为:Tam-Seq&CAPP-Seq(Roche)、Circle-Seq(Guardant Health)、Safe-SeqS(Personal Genome Diagnostics)、ThruPlex(Rubicon Geno mics)、NEBNext(New EnglandBiolabs)、QIAseq(Qiagen)、Oncom ine(ThermoFisher)、Duplex Barcoding(Schmitt)、SMRT(Pacific Bi osciences)、SiMSen-Seq(Stahlberg)和smMIP(Shendure)。然而,这些方法对于每条突变链需要30至100倍的深度以验证每个突变并与其他类型的测序误差区分。来自MSKCC的最近工作证明,需要60,000倍覆盖来准确地鉴定来自转移性癌症患者的血浆中的突变(91%灵敏度,508-基因小组,60,000x)。使挑战更为复杂的是来自NEB的最近的一篇论文对罕见变体和体细胞突变的最广泛使用的数据库的质量提出了质疑(Chen等,“DNADamage is a Pervasive Cause of Sequencing Errors,Directly Confounding VariantIdentification,”Sci ence 355(6326):752-756(2017))。
关键是将每个未满足的诊断需要与适当的诊断测试匹配,所述诊断测试组合了以低成本实现高灵敏度(即,低假阴性)和高特异性(即,低假阳性)两者的不同目标。例如,对来自肿瘤活检的EGFR外显子进行直接测序以确定对于非小细胞肺癌(NSCLC)的治疗比对于已经将其药物反应编目分类的超过180种已知突变设计TaqManTM探针明显更准确且成本有效(Jia等,Genome Res.23:1434-1445(2013))。用于检测点突变的最灵敏技术,诸如“BEAMing”(Dressman等,Proc.Natl.Acad.Sci.USA 100:8817-8822(2003)),依赖于要寻找哪些突变的先验知识,并且因此最适合监测疾病复发,而不是早期检测。同样,为了监测在用格列卫(Gleevec)治疗CML患者时Bcr-Abl易位的血液水平(Jabbour等,Cancer 112:2112-2118(2008)),简单的定量逆转录PCR测定远优于对1ml血液中的整个基因组DNA进行测序(900万个细胞x3GB=2700万Gb的原始数据)。
对从NSCLC患者分离的每2.1Gb的无细胞DNA(cfDNA)进行测序用于对125kb的靶向DNA提供10,000倍覆盖(Kandoth等,Nature502:333-339(2013))。这种方法正确地鉴定匹配肿瘤中存在的突变,尽管仅覆盖了50%的1期肿瘤。这种方法有希望用于NSCLC,其中样品平均具有5至20个突变/Mb,然而靶向NGS对于其他癌症如乳腺癌和卵巢癌将不是成本有效的,这些癌症平均具有少于1至2个突变/Mb。目前高度准确的靶向深度测序所需的前期连接、扩增和/或捕获步骤仍然比多路复用的PCR-TaqManTM或PCR-LDR测定更复杂。
以30,000倍覆盖对58种癌症相关基因的cfDNA进行深度测序能够以适度高的灵敏度检测1期或2期癌症,但分别漏检了29%的CRC、41%的乳腺癌、41%的肺癌和32%的卵巢癌(Phallen等,“Direct Detection of Early-stage Cancers Using Circulating TumorDNA,”Science Translational Medicine 9(403)(2017))。一种替代策略依赖于61个区段中平均30个碱基的靶向测序,以探询16种基因中的“热点”突变,包括TP53、KRAS、APC、PIK3CA、PTEN,漏检了更早期的癌症(Cohen等,“Detection and Localization ofSurgically Resectable Cancers with a Multi-analyte Blood Test,”Science(2018)。为了扩展突变测序的灵敏度,Hopkins团队最近将NGS与血清蛋白标记物(诸如CA-125、CA19-9、CEA、HGF、髓过氧化物酶、OPN、催乳素、TIMP-1)的定量和五种癌症类型(卵巢癌、肝癌、胃癌、胰腺癌和食管癌)的改进的检测组合,灵敏度范围为69%至98%(Cohen等,“Detection and Localization of Surgically Resectable Cancers with a Multi-analyte Blood Test,”Science(2018)。使用这些蛋白标记物的一个警告是,先前用年龄匹配的对照(n=22,000)进行的大规模研究未显示出临床效用(Jacobs等,“PrevalenceScreening for Ovarian Cancer in Postmenopausal Women by CA 125Measurement andUltrasonography,”BMJ306(6884):1030-1034(1993))。因此,在2018年JAMA报告中,“USPSTF建议对于无症状女性进行卵巢癌的[CA-125]筛查。这种建议适用于尚不知道具有高危遗传性癌症综合征的无症状女性”(USPSTF等,“Screening for Ovarian Cancer:USPreventive Services Task Force Recommendation Statement”JAMA 319(6):588-594(2018))。使用这些蛋白标记物的另一警告是它们反映组织损伤并且可能也出现在患有炎性疾病如关节炎的患者中(Kaiser,“'Liquid Biopsy for Cancer Promises EarlyDetection,”Science 359(6373):259(2018))。在美国,随着肥胖流行病和老龄化人口的增长,来自蛋白标记物的假阳性风险随着肥胖和年龄驱动的炎症而增加。
最近,NGS测序公司(Grail,Guardant Health,Natera,Freenome)已经大举扩展他们的靶向测序小组,现在还包括全基因组测序(WGS)和全基因组亚硫酸氢盐测序(Bis-WGS)。来自Grail的最近结果,发表在ASCO 2018上的摘要(Klein等,“Development of aComprehensive Cell-free DNA(cfDNA)Assay for Early Detection of Multiple TumorTypes:The Circulating Cell-free Genome Atlas(CCGA)Study,”2018年ASCO年会,Chicago,Il;摘要12021#134))揭示,虽然检测“早期”CRC的灵敏度声称为63%,但这仅基于27份样品,其中大部分是III期。即使富含突变的肺癌给出50%的灵敏度,同样大多数样品处于III期。当大多数样品是I期和II期如前列腺癌时,对于“早期癌症”检测的灵敏度降至<5%。当试图检测乳腺癌的最常见形式(HR+/HER2)时,灵敏度降至<13%。更糟的是,通过筛查诊断的那些乳腺癌给出<11%的灵敏度。简短地讲,NGS方法由于一贯地漏检30%至80%的早期癌症(即,I期和II期)而失败。在2019年ASCO会议中最初报道(Liu等,“Simultaneous Multi-cancer Detection and Tissue of Origin(TOO)LocalizationUsing Targeted Bisulfite Sequencing Plasma Cell-free DNA(cfDNA),”2019年ASCO突破性报告))并且随后在2020年发表(Liu等,“Sensitive and Specific Multi-cancerDetection and Localization Using Methylation Signatures in Cell-free DNA,”Annals of Oncology;出版中(2020))的研究中,GRAIL表明他们的多癌症早期检测测试展现76%的总检测率(12种致死癌症类型)(99.3%特异性)。对这组癌症的组合分析显示所有阶段的稳健检测,在I期(n=62)、II期(n=62)、III期(n=102)和IV期(n=130)的检测率分别为39%(27-52%)、69%(56-80%)、83%(75-90%)和92%(86-96%)。在另一会议中,GRAIL和合作者(Oxnard等,“Simultaneous Multi-cancer Detection and Tissue ofOrigin(TOO)Localization Using Targeted Bisulfite Sequencing of Plasma Cell-free DNA(cfDNA),”ESMO Congress(2019))报道了他们分析3,583份血液样品中的无细胞DNA(曾经局限于细胞但在细胞死亡后进入血流的DNA)的结果,所述血液样品包括1,530份来自诊断患有癌症的患者的样品和2,053份来自未患癌症的人的样品。患者样品包含超过20种类型的癌症,包括激素受体阴性乳腺癌、结肠直肠癌、食管癌、胆囊癌、胃癌、头颈癌、肺癌、淋巴样白血病、多发性骨髓瘤、卵巢癌和胰腺癌。总特异性为99.4%,意味着仅0.6%的结果不正确地指示存在癌症。用于检测预先指定的高死亡率癌症的测定的灵敏度(来自这些患者的测试为癌症阳性的血液样品的百分比)是76%。在这组内,对于I期癌症患者的灵敏度为32%;对于II期癌症患者的灵敏度为76%;对于III期癌症患者的灵敏度为85%;且对于IV期癌症患者的灵敏度为93%。对所有癌症类型的灵敏度为55%,在分期检测方面有类似的增加。对于97%的返回起源组织结果的样品,这种测试在89%的病例中正确地鉴定出起源器官或组织。然而,另一项2019年研究(由GRAIL及其合作者报道)质疑了上述报道的真实性(Razavi等,“High-intensity Sequencing Reveals the Sources of PlasmaCirculating Cell-free DNA Variants,”Nat Med 25(12):1928-1937(2019))。通过2Mb,508-基因小组测序(60,000x深度),作者证明在非癌症对照和癌症患者两者中的绝大多数无细胞DNA突变具有符合克隆造血的特征,所述克隆造血是白细胞进行性地累积体细胞变化而未必产生血液学病况或恶性肿瘤的过程。实际上,突变出现在93.6%的来自未患癌症的个体的白细胞中和99.1%的来自患癌症的个体的白细胞中。在最近举行的会议中,GRAIL及其合作者报道他们的基于血液的测试可以检测多种GI癌症,对I期的灵敏度为50%以下且对1-III期的灵敏度为73%以下(Wolpin等,“Performance of aBlood-based Test forthe Detection of Multiple Cancer Types,”在Gastrointestinal Cancers Symposium2020(2020)中)。至于Freenome,最近的ASCO报告指明,他们的平台(通过全基因组测序、亚硫酸氢盐测序和蛋白质定量方法进行的血浆分析)对于结肠直肠腺癌检测能够对于早期(n=17)达到92%的平均灵敏度,并且对于晚期(n=11)达到84%的平均灵敏度,特异性为90%。在所有CRC病理亚型上,Freenome测试实现90%的特异性并且对于早期(n=19)和晚期(n=12)分别实现80%和83%的灵敏度。与刚辞去Freenome的CSO的Imran Haque(在其中他具有7000万美元的预算并且30名科学家对817名CRC和匹配对照患者的血浆进行了测序)的私人讨论证实Freenome(以及GRAIL)正对这个数据叫牌,并且他们中没有一个具有实现成本有效的真正早期癌症检测的有利方法(Wan等,“Machine Learning EnablesDetection of Early-stage Colorectal Cancer by Whole-genome Sequencing ofPlasma Cell-free DNA,”BioRxiv 478065(2018))。
考虑到肿瘤异质性、肿瘤簇和每种单独标记物在3%至10%范围内的生物学/技术假阳性的超过600份结肠直肠癌样品的综合数据分析显示,结肠直肠癌的最佳早期检测筛查将需要24种测试标记物中的至少5至6种阳性标记物(Bacolod等,Cancer Res.69:723-727(2009);Tsafrir等,Cancer Res.66:2129-2137(2006);Weinstein等,Nat.Genet.45:1113-1120(2013);Navin N.E.Genome Biol.15:452(2014);Hiley等,Genome Biol 15:453(2014));Esserman等Lancet Oncol15:e234-242(2014))。此外,标记物分布偏向于不同的肿瘤分化枝,例如,一些肿瘤是高度甲基化的,而其他肿瘤几乎不是甲基化的,并且难以与邻近组织的年龄相关的甲基化区分。因此,需要使用3-5组突变、甲基化、miRNA、ncRNA、lncRNA、mRNA、拷贝变异、替代剪接或易位标记物的组合的多维方法以获得所有不同肿瘤分化枝的充分覆盖。类似于基于测序或对cfDNA的随机片段进行连接检测的非侵入性产前三体性筛查(Benn等,Ultrasound Obstet.Gynecol.42(1):15-33(2013);Chiu等,Proc.Natl.Acad.Sci.U S A 105:20458-20463(2008);Juneau等,Fetal Diagn.Ther.36(4)(2014)),在癌症筛查中评分的实际标记物不如准确定量血浆中的那些阳性标记物。
如上文所指出,癌症特异性RNA标记物(包括微小RNA、lncRNA和mRNA)也可以存在于血液中,没有任何区室(Souza等,“Circulating mRNAs and miRNAs as CandidateMarkers for the Diagnosis and Prognosis of Prostate Cancer,”PloS One 12(9):e0184094(2017)),或包含在外泌体(Nedaeinia等,“Circulating Exosomes and ExosomalmicroRNAs as Biomarkers in Gastrointestinal Cancer,”Cancer Gene Ther 24(2):48-56(2017);Lai等,“A microRNA Signature in Circulating Exosomes is Superiorto Exosomal Glypican-1Levels for Diagnosing Pancreatic Cancer,”Cancer Lett39:86-93(2017))或循环肿瘤细胞(“CTC”)中,并且已经被标记为早期癌症的潜在指示物。关于在早期癌症检测中使用血浆来源的核酸标记物,包括相对于来源于周围细胞的那些标记物,在血液中极小量的这些标记物,存在挑战。实际上,这些限制使得这些“早期”检测测定似乎更可能检测晚期原发性和转移性癌症(Pantel“Blood-Based Analysis ofCirculating Cell-Free DNA and Tumor Cells for Early Cancer Detection,”PLoSMed13(12):e1002205(2016))。
癌症诊断测试开发的技术挑战。
旨在发现非常罕见或低丰度突变序列的诊断测试面临潜在的假阳性信号,所述假阳性信号源自:(i)复制野生型靶过程中的聚合酶误差,(ii)DNA测序误差,(iii)野生型靶上的错误连接,(iii)与靶无关的PCR产物,和(iv)源自先前阳性样品的PCR产物的遗留污染。在筛查癌症时阳性测试结果的深刻临床意义要求这一测试使用所有可能的手段来实质上消除假阳性。
核酸检测的概念的核心是选择性扩增或纯化所需的癌症特异性标记物,使其远离来自正常细胞的相同或密切类似的标记物。这些方法包括:(i)多个引物结合区域用于正交扩增和检测,(ii)亲和选择CTC或外泌体,和(iii)空间稀释样品。
先前已经证明了使用4个引物结合区域以确保灵敏度和特异性的PCR-LDR的成功。使用PCR引物对或甚至串联PCR引物对,然后使用正交巢式LDR引物对使所需区域扩增以进行检测。使用PCR-LDR的一个优点是能够进行多个片段的成比例PCR扩增以富集低拷贝靶,然后使用定量LDR以直接鉴定癌症特异性突变。Biofire/bioMerieux已经开发了一种称为“膜阵列”的类似技术;其中将初始多路复用的PCR反应产物重新分布到单个孔中,然后用SYBR Green Dye检测进行巢式实时PCR。
已经证明了使用抗体或适体捕获对CTC进行亲和纯化(Adams等,J.Am.Chem.Soc.130:8633-8641(2008);Dharmasiri等,Electrophoresis 30:3289-3300(2009);Soper等Biosens.Bioelectron.21:1932-1942(2006))。外泌体的肽亲和捕获已在文献中报道。从血液中富集这些肿瘤特异性级分使得能够进行拷贝数定量,以及简化筛查和验证测定。
后一种方法,即空间上稀释样品,被用于数字PCR以及其被称为BEAMing的近亲(Vogelstein和Kinzler,Proc.Natl.Acad.Sci.U S A.96(16):9236-41(1999);Dressman等,Proc.Natl.Acad.Sci.USA100:8817-8822(2003))。当样品在1,000至10,000倍过量的野生型DNA中包含非常少的含有已知突变的靶分子时,数字PCR的合理性是克服酶促辨别的限制。通过将输入DNA稀释到20,000个或更多个液滴或珠粒中以使每个液滴分布少于一个靶分子,DNA可以经由PCR扩增,然后经由探针杂交或TaqManTM反应检测,实质上给出0/1数字分数。目前,所述方法对于在血浆中发现点突变是最灵敏的,但是其需要预先知道要评分的突变,以及每个突变的单独数字稀释,这将耗尽整个样品,而仅对少量突变评分(Alcaide等,“A Novel Multiplex Droplet Digital PCR Assay to Identify and Quantify KRASMutations in Clinical Specimens,”J.Mol.Diagn.21:28-33(2019);Guibert等,“LiquidBiopsy of Fine-Needle Aspiration Supernatant for Lung Cancer Genotyping,”LungCancer 1768:193-207(2018);Yoshida等,“Highly Sensitive Detection of ALKResistance Mutations in Plasma Using Droplet Digital PCR,”BMC Cancer 18:1136(2018))。
当开发多路复用的测定时,在以下方面存在复杂的平衡:进行PCR或其他扩增技术的足够初步循环以产生每个突变体或甲基化区域的足够拷贝,使得当稀释用于单路qPCR、多路复用qPCR、单路液滴PCR或多路复用液滴PCR时,如果是真阳性,则存在获得信号的足够拷贝;和进行太多的PCR循环,使得一些标记物过度扩增而其他标记物被抑制,或者相对定量丢失。
本申请旨在克服本领域中的这些和其他缺陷。
发明内容
本申请的第一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。然后提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。还提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列。将所述样品、所述一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行一个或多个包括变性处理、杂交处理和延伸处理的聚合酶延伸反应循环的条件,由此形成包含与所述靶核苷酸序列互补的核苷酸序列的一级延伸产物。将包含所述一级延伸产物的一种或多种聚合酶延伸反应混合物、所述一级寡核苷酸引物组的一种或多种第二一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物。所述方法还包括使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述靶核苷酸序列或其补体的一种或多种第一聚合酶链式反应产物。然后提供一个或多个寡核苷酸探针组。每个探针组包含(a)具有5'引物特异性部分和3'靶序列特异性部分的第一寡核苷酸探针,和(b)具有5'靶序列特异性部分和3'引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于二级延伸产物的互补靶核苷酸序列上。将所述一种或多种第一聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组共混,以形成一种或多种连接反应混合物。使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与互补序列杂交时连接在一起,以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、靶特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述一种或多种第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、能够消化不含修饰的核苷酸的核酸分子的一种或多种核酸酶和一种或多种第一一级寡核苷酸引物。所述一种或多种第一一级寡核苷酸引物包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列。将所述样品、所述一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含保护延伸产物但不保护靶DNA免受核酸酶消化的一种或多种修饰的核苷酸的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述靶核苷酸序列的补体的一级延伸产物。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有第一5'引物特异性部分和与由所述第一一级寡核苷酸引物形成的一级延伸产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有第二5'引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个二级寡核苷酸引物组、所述一种或多种核酸酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一5'引物特异性部分、靶特异性核苷酸序列或其补体和所述第二5'引物特异性部分的补体的一种或多种第一聚合酶链式反应产物。提供一个或多个三级寡核苷酸引物组。每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述一种或多种第一聚合酶链式反应产物的第一5'引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述一种或多种第一聚合酶链式反应产物的3'引物特异性部分互补的核苷酸序列。将所述一种或多种第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物,并且使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述一种或多种第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶和能够消化存在的不含修饰的核苷酸的核酸分子的一种或多种核酸酶。所述方法还包括提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列。将所述样品、所述一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含保护延伸产物但不保护靶DNA免受核酸酶消化的一种或多种修饰的核苷酸的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述靶核苷酸序列的补体的一级延伸产物。所述方法还包括共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种第二一级寡核苷酸引物、所述一种或多种核酸酶、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物。使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述靶核苷酸序列或其补体的第一聚合酶链式反应产物。然后提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将所述第一聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基,和在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理。然后提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。所述方法还包括提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列。将所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物。将包含所述一级延伸产物的一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物。使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个寡核苷酸引物组。每个探针组包含(a)第一寡核苷酸探针,其具有5'引物特异性部分和3'亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分,和(b)第二寡核苷酸探针,其具有5'亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和3'引物特异性部分,并且其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于第一聚合酶链式反应产物的互补核苷酸序列上。将所述第一聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组共混,以形成一种或多种连接反应混合物。使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与互补序列杂交时连接在一起,以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物,并且使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理。提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶,并且提供一种或多种第一一级寡核苷酸引物。每种第一一级寡核苷酸引物包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列。将所述亚硫酸氢盐处理的样品、所述一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,以形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5'引物特异性部分和与由所述第一一级寡核苷酸引物形成的聚合酶延伸反应产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有5'引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一二级寡核苷酸引物的5'引物特异性部分、亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和所述第二二级寡核苷酸引物的5'引物特异性部分的补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个三级寡核苷酸引物组。每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物的5'引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的3'引物特异性部分互补的核苷酸序列。将所述第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述二级聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理。提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶,并且提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列。将所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物。使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物。将包含所述一级延伸产物的一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物。使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由所述第一一级寡核苷酸引物形成的第一聚合酶链式反应产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有包含与由所述第一二级寡核苷酸引物形成的第一聚合酶链式反应产物的一部分互补的核苷酸序列的3'部分。将所述第一聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基,和在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理。提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。还提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其具有5'引物特异性部分和包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列的3'部分,和(b)第二一级寡核苷酸引物,其具有5'引物特异性部分和包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物。使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物。将包含所述一级延伸产物的一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物。所述方法还包括使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物。提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的5'引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的3'引物特异性部分互补的核苷酸序列。将所述一级聚合酶链式反应产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
本申请的另一方面涉及一种用于鉴定样品中的含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的方法,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。所述方法包括提供含有一个或多个亲本核糖核酸分子的样品,所述亲本核糖核酸分子含有在序列上潜在地与其他亲本核糖核酸分子不同的靶核糖核酸分子,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触。然后提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核糖核酸分子中邻近所述靶核糖核苷酸序列的RNA序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的cDNA延伸产物的一部分互补的核苷酸序列。将所述接触的样品、所述一个或多个一级寡核苷酸引物组、包含dUTP的脱氧核苷酸混合物、逆转录酶和DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生所述靶核糖核酸的互补脱氧核糖核酸(cDNA)分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种不同的逆转录/聚合酶产物。所述方法还包括提供一个或多个寡核苷酸探针组。每个探针组包含(a)具有5'引物特异性部分和3'靶序列特异性部分的第一寡核苷酸探针,和(b)具有5'靶序列特异性部分和3'引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于对应于靶核糖核酸分子序列的逆转录酶/聚合酶产物的互补部分上。使所述逆转录酶/聚合酶产物与连接酶和所述一个或多个寡核苷酸探针组接触以形成一种或多种连接反应混合物,并且使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一探针和第二探针在与其补体杂交时连接在一起以在连接酶反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、靶特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列、所述一个或多个二级寡核苷酸引物组与所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第一聚合酶链式反应产物。所述方法还包括检测和区分所述第一聚合酶链式反应产物,由此鉴定含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的存在,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。
本申请的另一方面涉及一种用于鉴定样品中的含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的方法,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。所述方法包括提供含有一个或多个亲本核糖核酸分子的样品,所述亲本核糖核酸分子含有在序列上潜在地与其他亲本核糖核酸分子不同的靶核糖核酸分子,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触。所述方法还包括提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核糖核酸分子中邻近所述靶核苷酸序列的RNA序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的cDNA延伸产物的一部分互补的核苷酸序列。将所述接触的样品、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物、逆转录酶和DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物,并且使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生靶RNA的互补脱氧核糖核酸(cDNA)分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种不同的逆转录/一级聚合酶链式反应产物。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由第一一级寡核苷酸引物形成的逆转录/一级聚合酶链式反应产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有包含与由第一二级寡核苷酸引物形成的逆转录/一级聚合酶链式反应产物的一部分互补的核苷酸序列的3'部分。将所述逆转录/一级聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第一聚合酶链式反应产物。所述方法还包括检测和区分所述第一聚合酶链式反应产物,由此鉴定含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的存在,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。
本申请的另一方面涉及一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。所述方法包括提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触,并且将所述接触的样品与连接酶和一个或多个第一寡核苷酸初步探针共混,以形成一种或多种第一连接反应混合物,所述第一寡核苷酸初步探针包含5'磷酸、5'茎-环部分、在环区域内的内部引物特异性部分、阻断基团和与靶miRNA分子序列的3'部分互补的3'核苷酸序列。所述方法还包括在所述一种或多种第一连接反应混合物中,将所述一个或多个靶miRNA分子在其3'端与所述一个或多个第一寡核苷酸初步探针的5'磷酸连接,以产生附加到所述一个或多个第一寡核苷酸初步探针的包含所述靶miRNA分子序列(如果存在于所述样品中)的嵌合核酸分子。然后提供一个或多个一级寡核苷酸引物组。每个引物组包含(a)第一一级寡核苷酸引物,其包含与所述第一寡核苷酸初步探针的内部引物特异性部分互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含5'引物特异性部分和3'部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同。将包含嵌合核酸分子的所述一种或多种第一连接反应混合物、所述一个或多个一级寡核苷酸引物组、能够消化所述样品中的含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合消化存在于所述逆转录/聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子的条件,适合产生所述嵌合核酸分子的互补脱氧核糖核酸(cDNA)分子且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述5’引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列和所述内部引物特异性部分的补体的一种或多种不同的一级逆转录/聚合酶链式反应产物及其补体。所述方法还包括提供一个或多个寡核苷酸引物组。每个探针组包含(a)具有5'引物特异性部分和3'靶序列特异性部分的第一寡核苷酸探针,和(b)具有5'靶序列特异性部分、与一级延伸产物互补的部分和3'引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于对应于所述靶miRNA分子序列或其补体的一级逆转录/聚合酶链式反应产物的互补部分上。使所述一级逆转录/聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组接触以形成一种或多种第二连接反应混合物,并且使所述一种或多种第二连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与其补体杂交时连接在一起以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、靶特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列和所述一个或多个二级寡核苷酸引物组与所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物。所述方法还包括检测和区分所述一个或多个反应中的二级聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
本申请的另一方面涉及一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。所述方法包括提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触,并且将所述接触的样品与连接酶和一个或多个第一寡核苷酸探针共混,以形成一种或多种连接反应混合物,所述第一寡核苷酸探针包含5'磷酸、5'茎-环部分、在环区域内的内部引物特异性部分、阻断基团和与靶miRNA分子序列的3'部分互补的3'核苷酸序列。所述方法还包括在所述一种或多种连接反应混合物中,将所述一个或多个靶miRNA分子在其3'端与所述一个或多个第一寡核苷酸探针的5'磷酸连接,以产生附加到所述一个或多个第一寡核苷酸探针的包含所述靶miRNA分子序列(如果存在于所述样品中)的嵌合核酸分子。然后提供一个或多个一级寡核苷酸引物组。每个引物组包含(a)第一一级寡核苷酸引物,其包含与所述第一寡核苷酸探针的内部引物特异性部分互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含5'引物特异性部分和3'部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同。将包含嵌合核酸分子的所述一种或多种连接反应混合物、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生所述嵌合核酸分子的互补脱氧核糖核酸(cDNA)分子且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述5’引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列和所述内部引物特异性部分的补体的一种或多种不同的一级逆转录/聚合酶链式反应产物及其补体。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5'引物特异性部分和与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有5'引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将所述一级逆转录/聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一二级寡核苷酸引物的5'引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列和另一5'引物特异性部分第二二级寡核苷酸引物的补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个三级寡核苷酸引物组。每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的5'引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的3'引物特异性部分互补的核苷酸序列。将所述第一聚合酶链式反应过程产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物,并且使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述第二聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
本申请的另一方面涉及一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。所述方法包括提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触。将所述接触的样品与ATP和Poly(A)聚合酶共混以形成Poly(A)聚合酶反应混合物,并且使所述Poly(A)聚合酶反应混合物经历适合将均聚物A附加到潜在地存在于所述样品中的所述一个或多个靶miRNA分子的3'端的条件。所述方法还包括提供一个或多个一级寡核苷酸引物组。每个引物组包含(a)第一一级寡核苷酸引物,其包含5'引物特异性部分、内部poly dT部分和包含与所述靶miRNA的3'端互补的1至10个碱基的3'部分,其中所述第一一级寡核苷酸引物与其他组中的其他第一一级寡核苷酸引物可以相同或者可以不同,和(b)第二一级寡核苷酸引物,其包含5'引物特异性部分和3'部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同。将所述Poly(A)聚合酶反应混合物、所述一个或多个一级寡核苷酸引物组、能够消化所述样品中的含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合消化存在于所述逆转录/聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子的条件,然后经历适合产生具有3’polyA尾的靶miRNA序列的互补脱氧核糖核酸(cDNA)分子的条件且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环,由此形成包含所述第二一级寡核苷酸引物的5'引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列、polydA区域和所述第一一级寡核苷酸引物的5'引物特异性部分的补体的一种或多种不同的逆转录/聚合酶链式反应产物及其补体。所述方法还包括提供一个或多个寡核苷酸探针组。每个探针组包含(a)具有5'引物特异性部分和3'靶序列特异性部分的第一寡核苷酸探针,和(b)具有5'靶序列特异性部分、与一种或多种逆转录/聚合酶链式反应产物互补的部分和3'引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交到对应于所述靶miRNA分子序列或其补体的所述一种或多种逆转录/聚合酶链式反应产物的互补部分上。使所述一种或多种逆转录/聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组接触以形成一种或多种连接反应混合物,并且使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与其补体杂交时连接在一起以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、靶特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列和所述一个或多个二级寡核苷酸引物组与所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物。所述方法还包括检测和区分所述二级聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
本申请的另一方面涉及一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。所述方法包括提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触。将所述接触的样品与ATP和Poly(A)聚合酶共混以形成Poly(A)聚合酶反应混合物,并且使所述Poly(A)聚合酶反应混合物经历适合将均聚物A附加到潜在地存在于所述样品中的所述一个或多个靶miRNA分子的3'端的条件。所述方法还包括提供一个或多个一级寡核苷酸引物组。每个引物组包含(a)第一一级寡核苷酸引物,其包含5'引物特异性部分、内部poly dT部分和包含与所述靶miRNA的3'端互补的1至10个碱基的3'部分,其中所述第一一级寡核苷酸引物与其他组中的其他第一一级寡核苷酸引物可以相同或者可以不同,和(b)第二一级寡核苷酸引物,其包含5'引物特异性部分和3'部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同。将潜在地包含靶miRNA序列的Poly(A)聚合酶反应混合物与3’polyA尾、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生具有3’polyA尾的靶miRNA序列的互补脱氧核糖核酸(cDNA)分子的条件且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环,由此形成包含所述第二一级寡核苷酸引物的5'引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列、poly dA区域和所述第一一级寡核苷酸引物的5'引物特异性部分的补体的一种或多种不同的逆转录/聚合酶链式反应产物及其补体。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5'引物特异性部分和与由所述第一一级寡核苷酸引物形成的逆转录/聚合酶链式反应产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有5'引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的逆转录/聚合酶链式反应产物的一部分互补的核苷酸序列的3'部分。将所述逆转录/聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含5'引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列和另一5'引物特异性部分的补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个三级寡核苷酸引物组。每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的5'引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的3'引物特异性部分互补的核苷酸序列。将所述第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一个或多个反应中的第二聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
本申请的另一方面涉及一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后细胞或组织的疾病状态的方法。所述多种标记物在包含6-12种标记物、12-24种标记物、24-36种标记物、36-48种标记物、48-72种标记物、72-96种标记物或>96种标记物的组中。给定组中的每种标记物通过具有以下标准中的任何一个或多个来选择:在>50%的来自被诊断为具有所述疾病状态的个体的疾病细胞或组织的生物样品中存在或高于截止水平;在>95%的来自没有所述疾病状态的个体的正常细胞或组织的生物样品中不存在或低于截止水平,在>50%的来自被诊断为具有所述疾病状态的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,在>95%的来自没有所述疾病状态的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;在来自被诊断为具有所述疾病状态的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。组中至少50%的标记物各自包含一个或多个甲基化残基,和/或组中至少50%的标记物在来自至少50%的被诊断为具有所述疾病状态的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。所述方法包括获得生物样品。所述生物样品包括源自细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,并且所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组。将样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理。在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤。所述方法还包括进行一种或多种测定以检测和区分多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含6-12种标记物的标记物组中最少2种或3种标记物存在或高于截止水平;或在包含12-24种标记物的标记物组中最少3、4或5种标记物存在或高于截止水平;或在包含24-36种标记物的标记物组中最少3、4、5或6种标记物存在或高于截止水平;或在包含36-48种标记物的标记物组中最少4、5、6、7或8种标记物存在或高于截止水平;或在包含48-72种标记物的标记物组中最少6、7、8、9、10、11或12种标记物存在或高于截止水平,或在包含72-96种标记物的标记物组中最少7、8、9、10、11、12或13种标记物存在或高于截止水平,或在包含96-“n”种标记物(当“n”>168种标记物时)的标记物组中最少8、9、10、11、12、13或“n”/12种标记物存在或高于截止水平,则个体被诊断或预后为具有疾病状态。
本申请的另一方面涉及一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后实体组织癌的疾病状态的方法,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌。所述多种标记物在包含总共48-72种癌症标记物、总共72-96种癌症标记物或≥总共96种癌症标记物的组中,其中在给定组中平均大于四分之一的这样的标记物覆盖所测试的上述主要癌症中的每一种。对于给定实体组织癌的给定组中的每种标记物通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:在>50%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平,在>50%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。组中至少50%的标记物各自包含一个或多个甲基化残基,和/或组中至少50%的标记物在来自至少50%的被诊断为患有给定实体组织癌的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。所述方法包括获得生物样品,所述生物样品包括源自细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组。将样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理。在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的给定实体组织癌特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤。所述方法还包括进行一种或多种测定以检测和区分所述多种癌症特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含总共48-72种癌症标记物的标记物组中最少4种标记物存在或高于截止水平;或在包含总共72-96种癌症标记物的标记物组中最少5种标记物存在或高于截止水平;或在包含总共96至“n”种癌症标记物(当“n”>总共96种癌症标记物时)的标记物组中最少6种或“n”/18种标记物存在或高于截止水平,则个体被诊断或预后为实体组织癌。
本申请的另一方面涉及一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后以下组中的实体组织癌的疾病状态和鉴定所述实体组织癌的一种或多种最可能的具体起源组织的方法:组1(结肠直肠腺癌、胃腺癌、食管癌);组2(乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤);组3(肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌);组4(前列腺腺癌、浸润性尿路上皮膀胱癌);和/或组5(肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌),其中所述多种标记物在包含36-48种组特异性癌症标记物、48-64种组特异性癌症标记物或≥64种组特异性癌症标记物的组中,其中在给定组中平均大于三分之一的这样的标记物覆盖所述组内的测试的前述癌症中的每一种。对于给定实体组织癌的给定组中的每种标记物通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:在>50%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平,在>50%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。组中至少50%的标记物各自包含一个或多个甲基化残基,和/或组中至少50%的标记物在来自至少50%的被诊断为患有给定实体组织癌的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。所述方法包括获得生物样品。所述生物样品包括源自细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组。将样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理。在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的给定实体组织癌特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤。所述方法还包括进行一种或多种测定以检测和区分所述多种癌症特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含36-48种组特异性癌症标记物的标记物组中最少4种标记物存在或高于截止水平;或在包含48-64种组特异性癌症标记物的标记物组中最少5种标记物存在或高于截止水平;或在包含总共64至“n”种癌症标记物(当“n”>64种组特异性癌症标记物时)的标记物组中最少6种或“n”/12种标记物存在或高于截止水平,则个体被诊断或预后为实体组织癌。
本申请描述了使用核酸酶、连接酶和聚合酶反应来检测靶核酸分子中的突变、表达、剪接变体、易位、拷贝数和/或甲基化变化的多种方法。本申请解决了遗留预防的问题,并且允许空间多路复用以提供相对定量,类似于数字PCR。这种技术可以用于癌症的非侵入性早期检测、癌症的非侵入性预后以及自血浆或血清样品监测癌症复发。
本申请提供核酸甲基化、miRNA、lncRNA、ncRNA、mRNA外显子以及癌症相关蛋白标记物的全面路线图,所述癌症相关蛋白标记物对实体组织癌和匹配的正常组织具有特异性。本申请教导了选择所需数量的标记物和标记物类型用于泛肿瘤学和具体癌症(即结肠直肠癌)以指导医师改进患者治疗的领域。提供关于引物设计和优化的引物序列的细节,以使得能够快速验证这些针对泛肿瘤学和具体癌症两者的测试。设计两步工序以建立宽网络来最初鉴定携带早期癌症的大多数个体,然后是更严格的第二步骤以改进特异性并将患者缩减到最可能携带隐藏癌症的那些个体,然后将其送去成像并进行随访。这种2步方法的优点是其不仅鉴定了潜在的起源组织,而且被设计成提供最高的阳性预测值(PPV)。因此,当罕见癌症的结果恢复为推定阳性(即早期卵巢癌)时,医师可以将其注意力聚焦在为最有需要的那些患者提供成像和随访,同时测试使产生不必要的焦虑和不想要的侵入性工序的假阳性最少化。
本申请提供使用qPCR读数或dPCR读数使用适于自动化并在容易商购获得的仪器上工作的方案检测癌症标记物(突变、表达、剪接变体、易位、拷贝数和/或甲基化变化)的稳健方法。所述方法提供集成和便于实验室设置、允许成本降低、可扩展性以及适合CLIA兼容自动设置中的医疗和实验室流程的优点。世界范围内挽救生命的益处将具有不可计算的价值。
附图说明
图1A至图1B示出基于对患者血液样品的分析的早期检测结肠直肠癌测试的条件逻辑树。图1A示出使用24种标记物在平均灵敏度为50%下的一步结肠直肠癌测定。图1B示出两步结肠直肠癌测定,在第一步骤中使用24种标记物,平均灵敏度为50%,并且在第二步骤中使用48种标记物。图1C至图1D示出基于对患者血液样品的分析的早期检测泛肿瘤学泛肿瘤学癌症测试的两步测定的条件逻辑树。图1C示出两步泛肿瘤学测定,在第一步骤中使用96种组特异性标记物,平均灵敏度为50%,然后在第二步骤中使用1或2组64种类型特异性标记物,各自的平均灵敏度为50%。图1D示出两步泛肿瘤学测定,在第一步骤中使用96种组特异性标记物,平均灵敏度为66%,然后在第二步骤中使用1或2组64种类型特异性标记物,各自的平均灵敏度为66%。
图2示出exPCR-LDR-qPCR遗留预防反应,其中用TaqmanTM检测以鉴定或相对定量一种或多种靶和/或低水平突变。
图3示出exPCR-LDR-qPCR遗留预防反应,其中用UniTaq检测以鉴定或相对定量一种或多种靶和/或低水平突变。
图4示出exPCR-qPCR遗留预防反应,其中用TaqmanTM检测以鉴定或相对定量一种或多种靶和/或低水平突变。
图5示出exPCR-qPCR遗留预防反应,其中用UniTaq检测以鉴定或相对定量一种或多种靶和/或低水平突变。
图6示出exPCR-qPCR遗留预防反应的变异,其中用TaqmanTM检测以鉴定或相对定量一种或多种靶和/或低水平突变。
图7示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量一种或多种靶和/或低水平突变。
图8示出exPCR-qPCR遗留预防反应的变异,其中用UniTaq检测以鉴定或相对定量一种或多种靶和/或低水平突变。
图9示出exPCR-LDR-qPCR遗留预防反应,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图10示出exPCR-LDR-qPCR遗留预防反应的变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图11示出exPCR-qPCR遗留预防反应,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图12示出exPCR-qPCR遗留预防反应的变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图13示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图14示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图15示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图16示出exPCR-LDR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图17示出exPCR-LDR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图18示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图19示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图20示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图21示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图22示出exPCR-qPCR遗留预防反应的另一变异,其中用TaqmanTM检测以鉴定或相对定量低水平甲基化。
图23示出RT-PCR-LDR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数mRNA水平的易位事件。
图24示出RT-PCR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数mRNA水平的易位事件。
图25示出RT-PCR-PCR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数mRNA水平的易位事件。
图26示出RT-PCR-LDR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数RNA拷贝数。
图27示出RT-PCR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数RNA拷贝数。
图28示出RT-PCR-PCR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数RNA拷贝数。
图29示出连接-RT-PCR-LDR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数miRNA。
图30示出连接-RT-PCR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数miRNA。
图31示出RT-PCR-LDR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数miRNA。
图32示出RT-PCR-qPCR遗留预防反应,其中用TaqmanTM检测以检测和计数miRNA。
图33A至图33B示出对于24-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为50%(图33A),并且平均单独标记物假阳性率为2%至5%(图33B)。
图34A至图34B示出对于36-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为50%(图34A),并且平均单独标记物假阳性率为2%至5%(图34B)。
图35A至图35B示出对于48-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为50%(图35A),并且平均单独标记物假阳性率为2%至5%(图35B)。
图36A至图36B示出对于96-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为50%(图36A),并且平均单独标记物假阳性率为2%至5%(图36B)。
图37A至图37B示出48-标记物测定的ROC曲线,其中平均单独标记物灵敏度为50%,以及计算的AUC,此时血液中每种标记物的平均分子数在150至600个分子范围内。对于图37A和图37B,计算分别基于2%和3%的平均单独标记物假阳性率。
图38A至图38B示出48-标记物测定的ROC曲线,其中平均单独标记物灵敏度为50%,以及计算的AUC,此时血液中每种标记物的平均分子数在150至600个分子范围内。对于图38A和图38B,计算分别基于4%和5%的平均单独标记物假阳性率。
图39A至图39B提供通过分析TCGA微小RNA数据集得到的基于血液的结肠癌特异性微小RNA标记物的列表,所述标记物可以存在于血液中的外泌体或其他受保护状态中。
图40A至图40X提供基于血液的结肠癌特异性ncRNA和lncRNA标记物的列表,所述标记物可以存在于血液中的外泌体或其他受保护状态中。
图41A至图41C提供候选的基于血液的结肠癌特异性外显子转录物的列表,所述外显子转录物可以在血液中的外泌体或其他受保护状态中富集。
图42A至图42J提供癌症蛋白标记物的列表,所述癌症蛋白标记物通过源自结肠直肠肿瘤的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
图43提供可以由结肠直肠肿瘤分泌到血液中的蛋白标记物的列表。
图44A至图44Y提供作为结肠直肠癌和结肠组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定结肠直肠癌的存在。
图45A至图45P提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为结肠直肠癌和结肠组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定结肠直肠癌的存在。
图46A至图46B示出对于24-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为50%,并且平均单独标记物假阳性率为2%至5%;包括一种具有90%灵敏度(图46A)和10%假阳性率(图46B)的标记物。
图47A至图47B示出对于24-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为50%,并且平均单独标记物假阳性率为2%至5%;包括两种具有90%灵敏度(图47A)和10%假阳性率(图47B)的标记物。
图48A至图48B示出对于48-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为50%,并且平均单独标记物假阳性率为2%至5%;包括一种具有90%灵敏度(图48A)和10%假阳性率(图48B)的标记物。
图49A至图49B示出对于48-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为50%,并且平均单独标记物假阳性率为2%至5%;包括两种具有90%灵敏度(图49A)和10%假阳性率(图49B)的标记物。
图50A至图50B示出对于24-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为66%(图50A),并且平均单独标记物假阳性率为2%至5%(图50B)。
图51A至图51B示出对于36-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为66%(图51A),并且平均单独标记物假阳性率为2%至5%(图51B)。
图52A至图52B示出对于48-标记物测定计算的总灵敏度和特异性的结果,其中平均单独标记物灵敏度为66%(图52A),并且平均单独标记物假阳性率为2%至5%(图52B)。
图53提供基于血液的、实体瘤特异性ncRNA和lncRNA标记物的列表,所述标记物可以存在于血液中的外泌体或其他受保护状态中。
图54A至图54F提供候选的基于血液的实体瘤特异性外显子转录物的列表,所述外显子转录物可以在血液中的外泌体或其他受保护状态中富集。
图55A至图55H提供癌症蛋白标记物的列表,所述癌症蛋白标记物通过源自实体瘤的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
图56A至图56S提供作为实体瘤和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图57A至图57J提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为实体瘤和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图58提供癌症蛋白标记物的列表,所述癌症蛋白标记物通过源自结肠腺癌、直肠腺癌、胃腺癌或食管癌的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
图59A至图59S提供作为结肠腺癌、直肠腺癌、胃腺癌或食管癌和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图60A至图60J提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为结肠腺癌、直肠腺癌、胃腺癌或食管癌和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图61A至图61C提供一级CpG位点的列表,所述一级CpG位点是乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌或子宫癌肉瘤和组织特异性标记物,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图62A至图62B提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌或子宫癌肉瘤和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图63提供作为肺腺癌、肺鳞状细胞癌或头颈鳞状细胞癌和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图64提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为肺腺癌、肺鳞状细胞癌或头颈鳞状细胞癌和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图65提供作为前列腺腺癌或浸润性尿路上皮膀胱癌和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图66提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为前列腺腺癌或浸润性尿路上皮膀胱癌和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图67提供基于血液的肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌特异性ncRNA和lncRNA标记物的列表,所述标记物可以存在于血液中的外泌体或其他受保护状态中。
图68A至图68E提供候选的基于血液的肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌特异性外显子转录物的列表,所述外显子转录物可以在血液中的外泌体或其他受保护状态中富集。
图69A至图69B提供癌症蛋白标记物的列表,所述癌症蛋白标记物通过源自肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
图70A至图70E提供作为肝脏肝细胞癌、胰管腺癌或胆囊腺癌和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图71A至图71C提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为肝脏肝细胞癌、胰管腺癌或胆囊腺癌和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在另一种受保护状态中(诸如在CTC内)的DNA鉴定实体瘤癌症的存在。
图72示出在像素亚硫酸氢盐-PCR-LDR-qPCR实验中获得的实时PCR扩增图,以计数在过量未甲基化DNA(Roche DNA)存在下的甲基化DNA的单分子。
图73示出在通过亚硫酸氢盐-PCR-LDR-qPCR使用HT29细胞系DNA多路复用检测10种CRC甲基化标记物中获得的实时PCR扩增图,在10,000个正常如未甲基化DNA(Roche DNA)分子中,每种标记物平均20个分子。
图74示出在通过亚硫酸氢盐-exPCR-LDR-qPCR使用HT29细胞系DNA多路复用检测7种CRC甲基化标记物中获得的实时PCR扩增图,在3,000个正常如未甲基化DNA(Roche DNA)分子中,每种标记物平均30个分子。
图75A至图75B示出在通过亚硫酸氢盐-exPCR-LDR-qPCR使用从CRC血浆(图75A)和正常血浆(图75B)分离的cfDNA多路复用检测7种CRC甲基化标记物中获得的实时PCR扩增图。
图76A至图76B示出在通过亚硫酸氢盐-exPCR-LDR-qPCR使用从CRC血浆(图76A)和正常血浆(图76B)分离的cfDNA多路复用检测7种CRC甲基化标记物中获得的实时PCR扩增图。
图77A至图77B示出在通过亚硫酸氢盐-exPCR-LDR-qPCR使用从CRC血浆(图77A)和正常血浆(图77B)分离的cfDNA多路复用检测7种CRC甲基化标记物中获得的实时PCR扩增图。
图78A至图78B示出在通过亚硫酸氢盐-exPCR-LDR-qPCR使用HT29细胞系DNA多路复用检测20种CRC甲基化标记物中获得的实时PCR扩增图,在7,500基因组当量的正常如未甲基化DNA(Roche DNA)中1,500基因组当量的HT29细胞系DNA(图78A),相比之下7,500基因组当量的正常如未甲基化DNA(图78B)。
图79A至图79B示出在通过亚硫酸氢盐-exPCR-LDR-qPCR使用具有尾部的反向引物使用HT29细胞系DNA多路复用检测20种CRC甲基化标记物中获得的实时PCR扩增图,在7,500基因组当量的正常如未甲基化DNA(Roche DNA)中200基因组当量的HT29细胞系DNA(图79A),相比之下7,500基因组当量的正常如未甲基化DNA(图79B)。
图80A至图80B示出在通过亚硫酸氢盐-exPCR-LDR-qPCR使用没有尾部的HT29细胞系DNA使用HT29细胞系DNA多路复用检测20种CRC甲基化标记物中获得的实时PCR扩增图,在7,500基因组当量的正常如未甲基化DNA(Roche DNA)中200基因组当量的HT29细胞系DNA(图80A),相比之下7,500基因组当量的正常如未甲基化DNA(图80B)。
具体实施方式
使用“癌症标记物载量”早期检测癌症的通用设计
最具成本有效性的早期癌症检测测试可以组合初始多路复用的偶联扩增和连接测定以确定“癌症载量”。对于癌症检测,这对于所有癌症(泛肿瘤学)将实现>95%的灵敏度,特异性>97%。
图1中示出用于癌症肿瘤载量测定的几个流程图。在其最简单的形式中,所述测定将是一步测定以鉴定患有早期结肠直肠癌(CRC)的个体。将血液样品分级分离成血浆和需要的其他组分,测定一组24种标记物,平均灵敏度为50%,并记录结果(图1A)。例如,对突变、甲基化、miRNA、mRNA、替代剪接和/或易位评分的初始多路复用的PCR/LDR筛查测定鉴定具有阳性结果的那些样品。医师不关心哪些具体标记物是阳性的,而是给出简单的指示。告知0-2种标记物是阳性的那些患者不必担心,回家,你未患癌症。指示24种标记物中有≥5种是阳性的那些患者进行结肠镜检查。指导具有中等数量的阳性标记物(3-4种)的那些患者在3-6个月内回来进行复测。因此,所述测试基于总体癌症标记物载量,而不依赖于测试阳性的具体标记物。
在所述测试的高级型式中,将进行两步测定以鉴定患者是否患有结肠直肠癌。两步测试的基本原理是最初建立宽网络以最大化在鉴定患有潜在癌症的大多数个体中的灵敏度,然后仅对阳性样品(其含有真阳性和假阳性两者)进行第二步骤以最大化特异性,消除几乎所有的假阳性,并且追踪到最可能患有癌症的那些个体。在第一步骤中,将血液样品分级分离成血浆和需要的其他组分,然后进行测定以探询平均灵敏度为50%的初始24种标记物的组(图1B)。第一步骤测定可以采用多路复用的PCR/LDR或数字PCR筛查来对突变、甲基化、miRNA、mRNA、替代剪接和/或易位事件进行评分。如在一步测定中,推测0-2种标记物是阳性的患者未患癌症。另一方面,≥3种标记物是阳性的患者将经历第二步骤,其中测定48种(新)标记物并如下评分:认为0-3种阳性标记物是无癌症的;建议4-5种阳性标记物在3-6个月内回来进行复测;指导≥6种阳性标记物进行结肠镜检查。
在所述测试的泛肿瘤学型式中,在第一步骤中,测定将筛选96种标记物,其中平均≥36种这样的标记物将对于大多数主要癌症展现出50%的平均灵敏度(参见图1C)。这些癌症将集群到某些组,其包括:组1(结肠直肠癌、胃癌、食管癌);组2(乳腺癌、子宫内膜癌、卵巢癌、宫颈癌、子宫癌);组3(肺癌、头颈癌);组4(前列腺癌、膀胱癌)和组5(肝癌、胰腺癌、胆囊癌)。推测0-4种标记物是阳性的患者是无癌症的,而≥5种标记物是阳性的患者将经历第二步骤。然后在第二步骤中测定推定为阳性的样品,测试1或2组,每组使用64种标记物,其中平均≥36种这样的标记物将对所述组内的每种具体类型的癌症展现出50%的平均灵敏度,包括使用组织特异性标记物来验证初始结果和鉴定起源组织。结果如下评分:认为0-3种阳性标记物是无癌症的;建议4种阳性标记物在3-6个月内回来进行复测;指示≥5种阳性标记物去进行匹配最可能是起源组织的癌症类型的成像。对于更高的灵敏度,第一步骤中的初始96种标记物和第二步骤中的组特异性标记物两者都将具有66%的平均灵敏度(图1D)。然后,医师可以指示进行靶向测序以进一步指导对于患者的治疗决策。
本申请涉及一种通用诊断方法,其寻求将数字聚合酶链式反应(PCR)或定量聚合酶链式反应(qPCR)的最佳特征与亚硫酸氢盐转化、连接检测反应(LDR)和多种疾病标记物如癌症标记物的定量检测组合。
多路复用、避免假阳性和遗留预防
存在区分由所需疾病特异性核酸差异产生的真实信号与由样品中存在的正常核酸产生的假信号以及在不存在疾病特异性核酸差异(即体细胞突变)的情况下产生的假信号的技术挑战。
下面介绍对这些挑战的多种解决方案,但是它们共有一些共同的主题。
第一个主题是多路复用。当引物浓度相对高,为50nM至500nM时,PCR效果最好,限制了多路复用。此外,添加的PCR引物对越多,扩增不正确产物或产生引物二聚体的机会呈指数增加。相反,对于LDR探针,使用4nM至20nM数量级的低浓度,并且探针二聚体受到对于靶上邻近杂交以允许连接事件的需要的限制。使用低浓度的基因特异性PCR引物或含有通用引物序列“尾”的LDR探针允许随后添加更高浓度的通用引物以实现初始PCR或LDR产物的成比例扩增。避免或最小化错误PCR扩增子或引物二聚体的另一种方法是使用含有少量额外碱基和阻断基团的PCR引物,其仅在与靶杂交时通过核酸酶裂解而释放以形成游离3'OH,例如核糖核苷酸碱基作为阻断基团且RNA酶H2作为裂解核酸酶。
第二个主题是由于低输入靶核酸引起的信号波动。通常,靶核酸来源于少量细胞,作为CTC捕获或来源于经历凋亡并在血清中释放其作为小片段(140-160bp)的DNA的肿瘤细胞。在这样的条件下,优选进行一定水平的成比例扩增,以避免完全漏失信号或报告由于当将少量起始分子分布到单个孔中时的波动而导致的不准确拷贝数(用于实时或液滴PCR定量)。只要这些初始扩增保持在合理水平(大约12至20次循环),就使管打开和分布扩增子用于后续检测/定量(使用实时或液滴PCR)期间的遗留污染的风险最小化。其他方案使用甚至更少量的有限扩增(大约8至12次循环)。
第三个主题是与靶无关的信号,也称为“无模板对照”(NTC)。这是由在不存在正确靶的情况下发生的聚合酶或连接酶反应引起的。通过明智的引物设计可以使这种信号中的一些最小化。对于连接反应,可以使用聚合酶的5’→3’核酸酶活性以释放下游连接引物的5'磷酸(仅在与靶杂交时),因此其适合连接。使用LDR区分低水平突变的存在的进一步特异性可以通过以下实现:(i)使用上游突变特异性LDR探针,其在自3'OH碱基的第2位或第3位含有错配,(ii)对于野生型序列使用LNA或PNA探针,其将减少突变特异性LDR探针与野生型序列的杂交,(iii)对于野生型序列使用LDR探针,其(任选地)连接但不经历额外扩增,和(iv)使用上游LDR探针,其含有少量额外碱基和阻断基团,其仅在与互补靶杂交时通过核酸酶裂解释放以形成游离3'OH(例如,RNA酶H2和核糖核苷酸碱基)。使用PCR改进区分低水平突变的存在的特异性的类似方法可以通过以下实现:(i)使用突变特异性PCR引物,其在自3'OH碱基的第2位或第3位含有错配,(ii)对于野生型序列使用LNA或PNA探针,其将减少突变特异性PCR引物与野生型序列的杂交,(iii)对于野生型序列使用PCR引物,其阻断而不经历额外扩增,和(iv)使用上游PCR引物,其含有少量额外碱基和阻断基团,其仅在与互补靶杂交时通过核酸酶裂解释放以形成游离3'OH(例如,RNA酶H2和核糖核苷酸碱基)。
第四个主题是由于反应中未使用的引物而抑制(减少)扩增或不正确(错误)扩增。消除这种未使用的引物的一种方法是将基因组或靶或扩增的靶DNA捕获在固体支持体上,允许连接探针杂交和连接,然后去除未杂交的探针或产物。替代解决方案包括预扩增,然后是随后巢式LDR和/或PCR步骤,使得在所述过程中存在第二级选择。
第五个主题是遗留预防。通过在通用PCR扩增步骤期间并入标准尿嘧啶,以及通过在扩增前检查工序中使用UDG(和任选的AP核酸内切酶),可以消除遗留信号。如下文更详细描述的,并入遗留预防是本申请的方法的核心。初始PCR扩增使用尿嘧啶的并入进行。LDR反应用缺少尿嘧啶的LDR探针进行。因此,当LDR产物经历实时PCR定量时,添加UDG破坏了初始PCR产物,但不破坏LDR产物。此外,由于LDR是线性过程,并且标签引物使用人类基因组中不存在的序列,LDR产物意外遗留回到原始PCR将不会引起与模板无关的扩增。提供甲基化靶的遗留预防的额外方案包括使用限制性核酸内切酶以在PCTR扩增之前破坏未甲基化DNA,或使用甲基特异性DNA结合蛋白或抗体捕获和富集甲基化DNA。
第六个主题是在多路复用反应中实现许多突变特异性或甲基化特异性靶的均匀扩增。如上文已经描述的,一种方法是进行有限的初始PCR扩增(8至12,或12至20次循环)。然而,有时不同的产物以不同的速率扩增,特别是在使用突变或甲基化特异性引物时,或在使用阻断性LNA或PNA探针或其他手段抑制野生型DNA的扩增时。这是因为常规PCR反应具有同时起作用的正向引物和反向引物两者。尽管可以使用正向甲基化特异性引物作为实例优先扩增(即,在亚硫酸氢盐处理之后),但是反向引物将扩增甲基化DNA和未甲基化DNA两者(再次,在亚硫酸氢盐处理之后),因此将放大正向引物扩增的初始速率的差异。此外,并且当使用突变特异性正向引物时,这也成立,使用非选择反向引物意味着初始扩增产物仍然含有大量的野生型DNA序列,这可能导致随后扩增步骤中的不期望的假阳性。一种方法是使用仅扩增一条靶DNA链的引物进行初始单侧线性扩增。当扩增亚硫酸氢盐处理的DNA时,这是特别有用的,其中这两条所得链不再彼此互补。所述主题的一种重要变异在线性扩增步骤之后破坏初始靶DNA。这可以通过并入一个或多个修饰的核苷酸如α-硫代-dNTP来实现,所述修饰的核苷酸保护初始延伸产物(但不保护原始cfDNA或基因组DNA)免受核酸外切酶I消化。当使用亚硫酸氢盐转化的DNA时,在用常规dNTP(即,无dUTP)进行初始单侧线性扩增(即,聚合酶延伸反应)之后,可以使用UDG破坏原始亚硫酸氢盐转化的DNA。
鉴定癌症标记物的方法
本申请的第一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。然后提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。还提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列。将所述样品、所述一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行一个或多个包括变性处理、杂交处理和延伸处理的聚合酶延伸反应循环的条件,由此形成包含与所述靶核苷酸序列互补的核苷酸序列的一级延伸产物。将包含所述一级延伸产物的一种或多种聚合酶延伸反应混合物、所述一级寡核苷酸引物组的一种或多种第二一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物。所述方法还包括使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述靶核苷酸序列或其补体的一种或多种第一聚合酶链式反应产物。然后提供一个或多个寡核苷酸探针组。每个探针组包含(a)具有5'引物特异性部分和3'靶序列特异性部分的第一寡核苷酸探针,和(b)具有5'靶序列特异性部分和3'引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于二级延伸产物的互补靶核苷酸序列上。将所述一种或多种第一聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组共混,以形成一种或多种连接反应混合物。使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与互补序列杂交时连接在一起,以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、靶特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述一种或多种第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
图2和图3示出本申请的此方面的各种实施方案,缩写为exPCR-LDR-qPCR遗留预防反应以检测低水平突变(exPCR是使用基因座的一条链的引物进行单侧延伸,然后进行PCR的缩写-在初始延伸中使用相同的引物,或对于PCR步骤使用额外引物)。分离基因组或cfDNA(图2,步骤A),且将分离的DNA样品用UDG处理以消化可能存在于样品中的含dU的核酸分子(图2,步骤B)。合适的酶包括但不限于大肠杆菌尿嘧啶DNA糖基化酶(UDG)、南极不耐热UDG或人单链选择性单官能尿嘧啶-DNA糖基化酶(hSMUG1)。使用基因座特异性上游引物、包含野生型序列的阻断性LNA或PNA探针和包含dUTP的脱氧核苷酸混合物选择性延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在突变上游且适合聚合酶延伸的少量碱基(图2或图3,步骤B;参见例如Dobosy等,“RNase H-Dependent PCR(rhPCR):Improved Specificity andSingle Nucleotide Polymorphism Detection Using Blocked Cleavable Primers,”BMCBiotechnology 11(80):1011(2011),其以引用的方式整体并入本文)。与上游PCR引物部分重叠的包含野生型序列的阻断性LNA或PNA探针将相对于上游引物优先竞争结合野生型序列,但对突变DNA的影响却没有那么大,因此在每轮引物延伸期间抑制野生型DNA的延伸。在初始延伸步骤之前,将样品任选地等分到12、24、36、48或96个孔中。随后,添加基因座特异性下游引物,然后进行有限(8至20次循环)或完全(20-40次循环)PCR。任选地,下游引物含有相同的8-11碱基尾以预防引物二聚体。此外,通过将杂交温度升高到高于正向引物的杂交温度,但等于或低于反向引物的杂交温度,这样的尾部为PCR循环结束时的不对称PCR提供选择,所述反向引物在8-11个碱基处更长,将具有更高的Tm值。这产生更多的底部链产物,其是随后LDR步骤的合适底物。在一个替代实施方案中,初始延伸产物并入一个或多个修饰的核苷酸如α-硫代-dNTP,其保护初始延伸产物(但不保护原始cfDNA或基因组DNA)免受核酸外切酶I消化。在核酸外切酶I消化之后,添加下游基因座特异性引物(任选地含有相同的8-11碱基尾),再次然后进行有限(8至20次循环)或完全(20-40次循环)PCR。扩增产物含有dU,如图2或图3,步骤D中显示,这允许随后用UDG或类似的酶处理以预防遗留。
如图2步骤E中显示,靶特异性寡核苷酸探针与扩增产物杂交,并且当与其互补序列杂交时,连接酶(实心圆)将这两种寡核苷酸共价封接在一起。在此实施方案中,具有对检测目标突变具有特异性的序列的上游寡核苷酸探针还含有5'引物特异性部分(Ai),以便于随后检测连接产物。再次,包含野生型序列的阻断性LNA或PNA探针的存在抑制与野生型靶序列的连接,如果在PCR扩增步骤期间在突变序列富集之后存在所述野生型靶序列的话。具有突变序列和野生型序列两者的共同序列的下游寡核苷酸探针含有3'引物特异性部分(Ci'),所述部分与具有对检测突变具有特异性的序列的上游探针的5'引物特异性部分(Ai)一起容许随后仅扩增和检测突变连接产物。如图2的步骤E中所示,通过在上游连接探针中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层特异性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基,产生能连接的3'OH基团(图2,步骤D)。
如图2,步骤F中显示,靶特异性寡核苷酸探针与扩增产物杂交,并且当与其互补序列杂交时,连接酶(实心圆)将这两种寡核苷酸共价封接在一起。上游寡核苷酸探针含有5'引物特异性部分(Ai)且下游寡核苷酸探针含有容许连接产物随后扩增的3'引物特异性部分(Ci')。在连接后,将连接产物等分到含有一个或多个标签特异性引物对的单独的孔、微孔或液滴中,每对包含匹配的引物Ai和Ci,用UDG或类似酶处理以去除含dU的扩增产物或污染物,PCR扩增,并检测。如图2步骤G和H中显示,可以使用传统的TaqManTM检测测定进行连接产物的检测(参见Whitcombe等的美国专利号6,270,967和Anderson等的美国专利号7,601,821,其以引用的方式整体并入本文)。对于使用TaqManTM的检测,跨越连接接合部的寡核苷酸探针与适合在连接产物的引物特异性部分上杂交的引物联合使用,用于扩增和检测。TaqManTM探针在一端(F1)含有荧光报告基团,且在另一端含有猝灭分子(Q),它们在完整探针中彼此足够接近,猝灭分子猝灭报告基团的荧光。在扩增期间,TaqManTM探针和上游引物与连接产物的其互补区域杂交。聚合酶的5’→3’核酸酶活性延伸杂交的引物并释放TaqManTM探针的荧光基团以产生可检测信号(图2,步骤H)。在一个优选的实施方案中,Taqman探针含有第二猝灭基团(ZEN),距离荧光报告基团约9个碱基,并且设计探针使得ZEN基团位于突变碱基处或邻近突变碱基。在扩增反应期间使用dUTP产生含dU的产物,随后可以使用UDC将其破坏以预防遗留。
如图3步骤D中显示,靶特异性寡核苷酸探针与扩增产物杂交,并且当与其互补序列杂交时,连接酶(实心圆)将这两种寡核苷酸共价封接在一起。在此实施方案中,具有对检测目标突变具有特异性的序列的上游寡核苷酸探针还含有5'引物特异性部分(Ai),以便于随后检测连接产物。再次,包含野生型序列的阻断性LNA或PNA探针的存在抑制与野生型靶序列的连接,如果在PCR扩增步骤期间在突变序列富集之后存在所述野生型靶序列的话。具有突变序列和野生型序列两者的共同序列的下游寡核苷酸探针含有3'引物特异性部分(Bi-Ci’),所述部分与具有对检测突变具有特异性的序列的上游探针的5'引物特异性部分(Ai)一起容许随后仅扩增和检测突变连接产物。如图3的步骤D中所示,通过在上游连接探针中包含3'可裂解的阻断基团(Blk3’,例如C3间隔区)和RNA碱基(r),可以将另一层特异性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基,产生能连接的3'OH基团(图3,步骤D)。
在此实施方案中,连接探针被设计成含有UniTaq引物和标签序列以便于检测。UniTaq系统在Spier的美国专利申请公开号2011/0212846中全面描述,所述专利申请公开以引用的方式整体并入本文。UniTaq系统涉及使用三个独特的“标签”序列,其中所述独特的标签序列中的至少一个(Ai)存在于第一寡核苷酸探针中,并且第二独特的标签部分(Bi')和第三独特的标签部分(Ci')在第二寡核苷酸探针序列中,如图3,步骤D和步骤E中显示。在连接探针组中的寡核苷酸探针后,所得连接产物将含有Ai序列-靶特异性序列-Bi'序列-Ci'序列。UniTaq方法的本质是连接探针组的两个寡核苷酸探针都需要是正确的,以便获得阳性信号,这允许高度多路复用的核酸检测。例如,并且如本文所述,这通过需要两部分(即,两种标签)彼此杂交来实现。
在检测连接产物之前,将样品用UDG处理以破坏原始靶扩增子,允许仅检测真正的连接产物。在连接后,将连接产物等分到含有一个或多个标签特异性引物对的单独的孔、微孔或液滴中。对于检测步骤,含有Ai(第一引物特异性部分)、Bi'(UniTaq检测部分)和Ci'(第二引物特异性部分)的连接产物使用具有与Ai相同的核苷酸序列的第一寡核苷酸引物和与Ci'互补的第二寡核苷酸引物(即Ci)引发两条链。第一寡核苷酸引物还包括UniTaq检测探针(Bi),所述UniTaq检测探针(Bi)在一端具有可检测标记F1且在另一端具有猝灭分子(Q)(F1-Bi-Q-Ai)。任选地,定位在猝灭剂近端的是聚合酶-阻断单元,例如HEG、THF、Sp-18、ZEN或本领域中已知的足以停止聚合酶延伸的任何其他阻断剂。在另一个实施方案中,ZEN猝灭基团也定位在距离荧光报告基团约9个碱基之处,以确保更完全的猝灭。PCR扩增导致双链产物的形成,如图3,步骤G)中显示。在此实施例中,聚合酶阻断单元防止聚合酶拷贝第一通用引物的5'部分(Bi),使得产物的底部链在变成单链的时不能形成发夹。这种发夹的形成将导致茎的3'端退火至扩增子,使得所述3'端的聚合酶延伸将终止PCR反应。
双链PCR产物变性,并且当随后降低温度时,产物的上部链形成发夹,所述发夹具有在第一寡核苷酸引物的5'部分(Bi)和在链的相对端的部分Bi'之间的茎(图3,步骤H)。而且,在所述步骤期间,第二寡核苷酸引物退火至发夹型产物的5'-引物特异性部分(Ci')。在步骤H中第二通用引物延伸后,聚合酶的5'核酸酶活性从扩增子的5'端裂解可检测标记D1或猝灭分子,由此增加标记和猝灭剂之间的距离并容许检测标记。
本申请方法中使用的连接反应是本领域中众所周知的。适合将探针组的寡核苷酸探针连接在一起的连接酶(任选地在第一寡核苷酸探针上的3'核糖和阻断基团或在第二寡核苷酸探针上的5'瓣裂解后)包括但不限于水生栖热菌连接酶、大肠杆菌连接酶、T4 DNA连接酶、T4 RNA连接酶、Taq连接酶、9N连接酶和火球菌属连接酶或本领域中已知的任何其他热稳定连接酶。根据本申请,本申请的核酸酶-连接方法可以通过采用寡核苷酸连接测定(OLA)反应(参见Landegren等,"A Ligase-Mediated Gene Detection Technique,"Science 241:1077-80(1988);Landegren等,"DNA Diagnostics--Molecular Techni quesand Automation,"Science 242:229-37(1988);和Landegren等的美国专利号4,988,617,其以引用的方式整体并入本文)、利用一组互补寡核苷酸探针的连接检测反应(LDR)(参见例如Barany等的WO90/17239,其以引用的方式整体并入本文)或利用两组互补寡核苷酸探针的连接链式反应(LCR)(参见例如Barany等的WO 90/17239,其以引用的方式整体并入本文)进行。
探针组的寡核苷酸探针可以是核糖核苷酸、脱氧核苷酸、修饰的核糖核苷酸、修饰的脱氧核糖核苷酸、肽核苷酸类似物、修饰的肽核苷酸类似物、修饰的磷酸-糖-骨架寡核苷酸、核苷酸类似物及其混合物的形式。
连接酶检测反应中的杂交步骤,优选热杂交处理,基于连接接合部处的有区别的核苷酸来辨别核苷酸序列。靶核苷酸序列之间的差异可以是例如单个核酸碱基差异、核酸缺失、核酸插入或重排。也可以检测涉及多于一个碱基的这样的序列差异。优选地,寡核苷酸探针组具有大致上相同的长度,使得它们在大致上类似的杂交条件下与靶核苷酸序列杂交。
连接酶辨别可以通过采用各种探针设计特征进一步增强。例如,可以将有意的错配或核苷酸类似物(例如,肌苷、硝基吲哚或硝基吡咯)并入距离3’接合端的第2个碱基或第3个碱基处的第一寡核苷酸探针,如果其在3'端完全匹配,则轻微破坏3'端杂交的稳定性,但如果其在3'端错配,则显著破坏3'端杂交的稳定性。当突变探针与野生型靶杂交时,所述设计减少了不适当的错误连接。或者,可以将被RNA酶裂解的RNA碱基并入寡核苷酸探针中,以确保模板依赖性产物形成。例如,Dobosy等,“RNase H-Dependent PCR(rhPCR):ImprovedSpecificity and Single Nucleotide Polymorphism Detection Using BlockedCleavable Primers,”BMC Biotechnology 11(80):1011(2011),其以引用的方式整体并入本文,描述了使用靠近具有3'-阻断端的寡核苷酸探针的3'端的RNA-碱基,并用RNA酶H2切割,产生PCR-可延伸且可连接的3'-OH。所述方法可以用于产生能连接的3'OH(对于标准DNA连接酶)或5'-P,或两者,在后一种情况下,条件是利用可以连接5'-RNA碱基的连接酶。
其他可能的修饰包括脱碱基位点,例如内部脱碱基呋喃或氧代-G。这些异常“碱基”被具体酶去除以产生能连接的3'-OH或5'P位点。在连接寡核苷酸退火至靶核酸之后,核酸内切酶IV,Tth EndoIV(NEB)将去除脱碱基残基,但不能从单链DNA上去除。类似地,可以使用氧代-G与Fpg或肌苷/尿嘧啶与EndoV或胸腺嘧啶二醇与EndoVIII。
连接辨别还可以通过使用Barany等的WO2013/123220或Anderson等的美国专利申请公开号2006/0234252中描述的偶联核酸酶-连接酶反应来增强,所述参考文献以引用的方式整体并入本文。在此实施方案中,第一寡核苷酸探针带有能连接的3'OH基团,而第二寡核苷酸探针带有不能连接的5'端(即,没有5'磷酸的寡核苷酸探针)。设计探针组的寡核苷酸探针使得第一寡核苷酸探针的最3'端碱基被与靶核酸分子互补的第二寡核苷酸探针的直接侧接的最5'端碱基重叠。重叠的核苷酸被称为“瓣”。当第二寡核苷酸探针的重叠瓣核苷酸与靶核酸分子序列互补,并且与第一寡核苷酸探针的终止3'核苷酸序列相同时,第二寡核苷酸探针的瓣核苷酸上游紧邻的磷酸二酯键被具有瓣核酸内切酶(FEN)或5'核酸酶活性的酶辨别性地裂解。所述具体FEN活性在第二寡核苷酸探针上生成新的能连接的5'磷酸端,其精确地定位在第一寡核苷酸探针的相邻3'OH旁边,以允许这两个探针发生连接。根据此实施方案,瓣核酸内切酶或适合在连接前裂解第二寡核苷酸探针的5'瓣的5'核酸酶包括但不限于具有5'核酸酶活性的聚合酶,诸如大肠杆菌DNA聚合酶和来自Taq和嗜热栖热菌的聚合酶,以及T4 RNA酶H和TaqExo。在另一个实施方案中,探针组的第二探针具有3'引物特异性部分、靶特异性部分和5'核苷酸序列,其中所述5'核苷酸序列与所述3'引物特异性部分的至少一部分互补,并且其中当所述第二探针不与靶核苷酸序列杂交时,所述5'核苷酸序列与所述3'引物特异性部分的其互补部分杂交以形成发夹型第二寡核苷酸探针。
对于插入或缺失,在第一寡核苷酸探针中在距离接合部的第2位置或第3位置并入匹配的碱基或核苷酸类似物(例如,-氨基-dA或5-丙炔基-dC)改进稳定性,并且可以改进这样的移码突变与野生型序列的辨别。对于插入,在第二寡核苷酸探针的所需易切割的磷酸酯键下游使用一个或多个硫代磷酸酯修饰的核苷酸将防止当探针与野生型DNA杂交时被5'核酸酶不适当地裂解,并因此减少野生型靶上的假阳性连接。同样,对于缺失,在第二寡核苷酸探针的所需易切割的磷酸酯键上游使用一个或多个硫代磷酸酯修饰的核苷酸将防止当探针与野生型DNA杂交时被5'核酸酶不适当地裂解,并因此减少野生型靶上的假阳性连接。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、能够消化不含修饰的核苷酸的核酸分子的一种或多种核酸酶和一种或多种第一一级寡核苷酸引物。所述一种或多种第一一级寡核苷酸引物包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列。将所述样品、所述一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含保护延伸产物但不保护靶DNA免受核酸酶消化的一种或多种修饰的核苷酸的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述靶核苷酸序列的补体的一级延伸产物。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有第一5'引物特异性部分和与由所述第一一级寡核苷酸引物形成的一级延伸产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有第二5'引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个二级寡核苷酸引物组、所述一种或多种核酸酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一5'引物特异性部分、靶特异性核苷酸序列或其补体和所述第二5'引物特异性部分的补体的一种或多种第一聚合酶链式反应产物。提供一个或多个三级寡核苷酸引物组。每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述一种或多种第一聚合酶链式反应产物的第一5'引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述一种或多种第一聚合酶链式反应产物的3'引物特异性部分互补的核苷酸序列。将所述一种或多种第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物,并且使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述一种或多种第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
图4至图8示出本申请的此方面的各种实施方案。
图4示出检测低水平突变的示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA(图4,步骤A),且将分离的DNA样品用UDG处理以消化可能存在于样品中的含dU的核酸分子(图4,步骤A)。然后使样品经历线性扩增反应,例如,一个或多个聚合酶延伸反应,以产生含突变的目标区域的互补拷贝。使用基因座特异性上游引物、包含野生型序列的阻断性LNA或PNA探针和包含一个或多个修饰的核苷酸的脱氧核苷酸混合物选择性延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在突变上游且适合聚合酶延伸的少量碱基(图4,步骤B)。与上游PCR引物部分重叠的包含野生型序列的阻断性LNA或PNA探针将相对于上游引物优先竞争结合野生型序列,但对突变DNA的影响却没有那么大,因此在每轮引物延伸期间抑制野生型DNA的延伸。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。
初始延伸产物并入一个或多个修饰的核苷酸如α-硫代-dNTP,其保护初始延伸产物(但不保护原始cfDNA或基因组DNA)免受核酸外切酶I消化(图4,步骤C)。在存在阻断性LNA或PNA探针的情况下仅使用上游基因座特异性引物,在每个延伸循环中富集含突变产物的延伸。核酸外切酶消化破坏原始基因组或cfDNA样品中存在的野生型DNA,因此富集的延伸产物不会因原始野生型DNA的随后延伸或扩增而被稀释(参见下文步骤D)。
如图4步骤D中显示,添加突变特异性和基因座特异性寡核苷酸引物,然后进行有限循环巢式PCR以扩增含突变的序列(如果存在于样品中)。在此实施方案中,具有对检测目标突变具有特异性的序列的上游突变特异性引物还含有5'引物特异性部分(Ai),以便于随后检测巢式PCR产物。再次,包含野生型序列的阻断性LNA或PNA探针的存在抑制野生型靶序列的延伸,如果在初始延伸步骤期间在突变序列富集之后存在所述野生型靶序列的话。具有突变序列和野生型序列两者的共同序列的反向基因座特异性引物含有5'引物特异性部分(Ci),所述部分与具有对检测突变具有特异性的序列的上游探针的5'引物特异性部分(Ai)一起容许随后仅扩增和检测突变PCR产物。如图4的步骤D中所示,通过在突变特异性和基因座特异性引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层特异性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基,产生能聚合酶延伸的3'OH基团(图4,步骤D)。在初始引物延伸(步骤B)中,释放的3'OH碱基是突变位置上游的少量碱基,因此如果被裂解,则将延伸野生型序列和突变序列两者(尽管阻断性LNA或PNA将限制与野生型序列杂交的引物的裂解)。相反,在巢式PCR(步骤D)中,引物的突变特异性碱基在3'OH碱基处,使得野生型序列上的延伸将不太可能,因为所述碱基是错配的。突变体聚合酶延伸的特异性超过野生型序列聚合酶延伸的特异性可以通过以下进一步改进:(i)使用突变特异性PCR引物,其在距离3'OH碱基的第2位置或第3位置含有错配,(ii)对于野生型序列使用LNA或PNA探针,其将减少突变特异性PCR引物与野生型序列的杂交,(iii)对于野生型序列使用PCR引物,所述野生型序列被阻断而不经历额外扩增,和(iv)避免在引物和野生型序列之间在3'OH碱基处的G:T或T:G错配。
如图4步骤E中显示,巢式PCR产物包含5'引物特异性部分(Ai)靶特异性序列和容许巢式PCR产物随后扩增的3'引物特异性部分(Ci')。在有限循环PCR后,将PCR产物等分到含有一个或多个标签特异性引物对的单独的孔、微孔或液滴中,每对包含匹配的引物Ai和Ci,用UDG或类似酶处理以去除含dU的扩增产物或污染物,PCR扩增,并检测。如图4步骤F和G中显示,可以使用传统的TaqManTM检测测定进行连接产物的检测(参见Whitcombe等的美国专利号6,270,967和Anderson等的美国专利号7,601,821,其以引用的方式整体并入本文)。对于使用TaqManTM的检测,跨越突变特异性区域的寡核苷酸探针与适合在巢式PCR产物的引物特异性部分上杂交的引物联合使用,用于扩增和检测。TaqManTM探针在一端(F1)含有荧光报告基团,且在另一端含有猝灭分子(Q),它们在完整探针中彼此足够接近,猝灭分子猝灭报告基团的荧光。在扩增期间,TaqManTM探针和上游引物与巢式PCR产物的其互补区域杂交。聚合酶的5’→3’核酸酶活性延伸杂交的引物并释放TaqManTM探针的荧光基团以产生可检测信号(图4,步骤G)。在一个优选的实施方案中,TaqManTM探针含有第二猝灭基团(ZEN),距离荧光报告基团约9个碱基,并且设计探针使得ZEN基团位于突变碱基处或邻近突变碱基。在扩增反应期间使用dUTP产生含dU的产物,随后可以使用UDC将其破坏以预防遗留。
图5示出检测低水平突变的另一exPCR-qPCR遗留预防反应。分离基因组或cfDNA(图5,步骤A),且将分离的DNA样品用UDG处理以消化可能存在于样品中的含dU的核酸分子(图5,步骤A)。然后使样品经历线性扩增反应,例如,一个或多个聚合酶延伸反应,以产生含突变的目标区域的互补拷贝。使用基因座特异性上游引物、包含野生型序列的阻断性LNA或PNA探针和包含一个或多个修饰的核苷酸的脱氧核苷酸混合物选择性延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在突变上游且适合聚合酶延伸的少量碱基(图5,步骤B)。与上游PCR引物部分重叠的包含野生型序列的阻断性LNA或PNA探针将相对于上游引物优先竞争结合野生型序列,但对突变DNA的影响却没有那么大,因此在每轮引物延伸期间抑制野生型DNA的延伸。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。
初始延伸产物并入一个或多个修饰的核苷酸如α-硫代-dNTP,其保护初始延伸产物(但不保护原始cfDNA或基因组DNA)免受核酸外切酶I消化(图5,步骤C)。在存在阻断性LNA或PNA探针的情况下仅使用上游基因座特异性引物,在每个延伸循环中富集含突变产物的延伸。核酸外切酶消化破坏原始基因组或cfDNA样品中存在的野生型DNA,因此富集的延伸产物不会因原始野生型DNA的随后延伸或扩增而被稀释(参见下文步骤D)。
如图5步骤D中显示,添加突变特异性和基因座特异性寡核苷酸引物,然后进行有限循环巢式PCR以扩增含突变的序列(如果存在于样品中)。在此实施方案中,具有对检测目标突变具有特异性的序列的上游突变特异性引物还含有5'引物特异性部分(Ai),以便于随后检测巢式PCR产物。再次,包含野生型序列的阻断性LNA或PNA探针的存在抑制野生型靶序列的延伸,如果在初始延伸步骤期间在突变序列富集之后存在所述野生型靶序列的话。具有突变序列和野生型序列两者的共同序列的反向基因座特异性引物含有3'引物特异性部分(Bi-Ci),所述部分与具有对检测突变具有特异性的序列的上游探针的5'引物特异性部分(Ai)一起容许随后仅扩增和检测突变PCR产物。如所述图的步骤D中所示,通过在突变特异性和基因座特异性引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层特异性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基,产生能聚合酶延伸的3'OH基团(图5,步骤D)。在初始引物延伸(步骤B)中,释放的3'OH碱基是突变位置上游的少量碱基,因此如果被裂解,则将延伸野生型序列和突变序列两者(尽管阻断性LNA或PNA将限制与野生型序列杂交的引物的裂解)。相反,在巢式PCR(步骤D)中,引物的突变特异性碱基在3'OH碱基处,使得野生型序列上的延伸将不太可能,因为所述碱基是错配的。突变体聚合酶延伸的特异性超过野生型序列聚合酶延伸的特异性可以通过以下进一步改进:(i)使用突变特异性PCR引物,其在距离3'OH碱基的第2位置或第3位置含有错配,(ii)对于野生型序列使用LNA或PNA探针,其将减少突变特异性PCR引物与野生型序列的杂交,(iii)对于野生型序列使用PCR引物,所述野生型序列被阻断而不经历额外扩增,和(iv)避免在引物和野生型序列之间在3'OH碱基处的G:T或T:G错配。
如图5步骤E中显示,巢式PCR产物包含5'引物特异性部分(Ai)靶特异性序列和容许巢式PCR产物随后扩增的3'引物特异性部分(Bi’-Ci’)。在有限循环PCR后,将PCR产物等分到含有一个或多个标签特异性引物对的单独的孔、微孔或液滴中,每对包含匹配的引物F1-Bi-Q-Ai和Ci,用UDG或类似酶处理以去除含dU的扩增产物或污染物,PCR扩增(图5,步骤F),并检测。PCR扩增导致形成双链产物,如图5,步骤G中显示。在此实施例中,聚合酶阻断单元防止聚合酶拷贝第一通用引物的5'部分(Bi),使得产物的底部链在变成单链的时不能形成发夹。这种发夹的形成将导致茎的3'端退火至扩增子,使得所述3'端的聚合酶延伸将终止PCR反应。
双链PCR产物变性,并且当随后降低温度时,产物的上部链形成发夹,所述发夹具有在第一寡核苷酸引物的5'部分(Bi)和在链的相对端的部分Bi'之间的茎(图5,步骤H)。而且,在所述步骤期间,第二寡核苷酸引物退火至发夹型产物的5'-引物特异性部分(Ci')。在步骤H中第二通用引物延伸后,聚合酶的5'核酸酶活性从扩增子的5'端裂解可检测标记D1或猝灭分子,由此增加标记和猝灭剂之间的距离并容许检测标记。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶和能够消化存在的不含修饰的核苷酸的核酸分子的一种或多种核酸酶。所述方法还包括提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列。将所述样品、所述一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含保护延伸产物但不保护靶DNA免受核酸酶消化的一种或多种修饰的核苷酸的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述靶核苷酸序列的补体的一级延伸产物。所述方法还包括共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种第二一级寡核苷酸引物、所述一种或多种核酸酶、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物。使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述靶核苷酸序列或其补体的第一聚合酶链式反应产物。然后提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将所述第一聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
图6、图7和图8示出本申请的此方面的各种实施方案。
图6示出检测低水平突变的另一示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA(图6,步骤A),且将分离的DNA样品用UDG处理以消化可能存在于样品中的含dU的核酸分子(图6,步骤A)。然后使样品经历线性扩增反应,例如,一个或多个聚合酶延伸反应,以产生含突变的目标区域的互补拷贝。使用基因座特异性上游引物、包含野生型序列的阻断性LNA或PNA探针和包含一个或多个修饰的核苷酸的脱氧核苷酸混合物选择性延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在突变上游且适合聚合酶延伸的少量碱基(图6,步骤B)。与上游PCR引物部分重叠的包含野生型序列的阻断性LNA或PNA探针将相对于上游引物优先竞争结合野生型序列,但对突变DNA的影响却没有那么大,因此在每轮引物延伸期间抑制野生型DNA的延伸。初始延伸产物并入一个或多个修饰的核苷酸如α-硫代-dNTP,其保护初始延伸产物(但不保护原始cfDNA或基因组DNA)免受核酸外切酶I消化(图6,步骤B)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。
随后,添加基因座特异性下游引物,然后进行有限循环PCR(8至12次循环,图6,步骤C)。在所述优选的实施方案中,基因座特异性下游引物位于基因座特异性上游引物下游大约20至40个碱基处。任选地,下游引物含有相同的8-11碱基尾以预防引物二聚体。
在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、突变特异性和基因座特异性引物的单独的孔、微孔或液滴中,以扩增含突变的序列(如果存在于样品中)(图6,步骤D)。再次,包含野生型序列的阻断性LNA或PNA探针的存在抑制野生型靶序列的延伸,如果在初始延伸扩增步骤期间在突变序列富集之后存在所述野生型靶序列的话(图6,步骤B和C)。如所述图6的步骤D中所示,通过在突变特异性和基因座特异性引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层特异性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基,产生能聚合酶延伸的3'OH基团(图6,步骤D)。在初始引物延伸(步骤B)中,释放的3'OH是突变位置上游的少量碱基,因此如果被裂解,则将延伸野生型序列和突变序列两者(尽管阻断性LNA或PNA将限制与野生型序列杂交的引物的裂解)。相反,在巢式PCR(步骤D)中,引物的突变特异性碱基在3'OH处,使得野生型序列上的延伸将不太可能,因为所述碱基是错配的。突变体聚合酶延伸的特异性超过野生型序列聚合酶延伸的特异性可以通过以下进一步改进:(i)使用突变特异性PCR引物,其在距离3'OH碱基的第2位置或第3位置含有错配,(ii)对于野生型序列使用LNA或PNA探针,其将减少突变特异性PCR引物与野生型序列的杂交,(iii)对于野生型序列使用PCR引物,所述野生型序列被阻断而不经历额外扩增,和(iv)避免在引物和野生型序列之间在3'OH碱基处的G:T或T:G错配。TaqManTM探针跨越突变区域,并且在一端含有荧光报告基团(F1),且在另一端含有猝灭分子(Q),它们在完整探针中彼此足够接近,猝灭分子猝灭报告基团的荧光。在扩增期间,TaqManTM探针和上游引物与初始PCR产物的其互补区域杂交。聚合酶的5’→3’核酸酶活性延伸杂交的引物并释放TaqManTM探针的荧光基团以产生可检测信号(图6,步骤E)。在一个优选的实施方案中,TaqmanTM探针含有第二猝灭基团(ZEN),距离荧光报告基团约9个碱基,并且设计探针使得ZEN基团位于突变碱基处或邻近突变碱基。在扩增反应期间使用dUTP产生含dU的产物,随后可以使用UDC将其破坏以预防遗留。
图7和图8示出检测低水平突变的额外的示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA(图7和图8,步骤A),且将分离的DNA样品用UDG处理以消化可能存在于样品中的含dU的核酸分子(图7,步骤A)。使用基因座特异性上游引物、包含野生型序列的阻断性LNA或PNA探针和包含一个或多个修饰的核苷酸的脱氧核苷酸混合物选择性延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在突变上游且适合聚合酶延伸的少量碱基(图7和图8,步骤B)。与上游PCR引物部分重叠的包含野生型序列的阻断性LNA或PNA探针将相对于上游引物优先竞争结合野生型序列,但对突变DNA的影响却没有那么大,因此在每轮引物延伸期间抑制野生型DNA的延伸。初始延伸产物并入一个或多个修饰的核苷酸如α-硫代-dNTP,其保护初始延伸产物(但不保护原始cfDNA或基因组DNA)免受核酸外切酶I消化(图7和图8,步骤B)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,添加基因座特异性下游引物,然后进行有限循环PCR(8至12次循环,图7和图8,步骤B)。
对于图7中所示的协议,在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、包含5'引物特异性部分(Ai)的突变特异性引物、包含5'引物特异性部分(Ci)的基因座特异性引物和匹配引物Ai和Ci的单独的孔、微孔或液滴中。如果含突变的序列存在于样品中,则这些引物组合扩增所述含突变的序列(图7,步骤C)。再次,包含野生型序列的阻断性LNA或PNA探针的存在抑制野生型靶序列的延伸,如果在初始延伸扩增步骤期间在突变序列富集之后存在所述野生型靶序列的话(图7,步骤B)。如所述图的步骤C中所示,通过在突变特异性和基因座特异性引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层特异性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基,产生能聚合酶延伸的3'OH基团(图7,步骤C)。在初始引物延伸(步骤B)中,释放的3'OH是突变位置上游的少量碱基,因此如果被裂解,则将延伸野生型序列和突变序列两者(尽管阻断性LNA或PNA将限制与野生型序列杂交的引物的裂解)。相反,在组合的TaqmanTM-通用标签PCR扩增(步骤C至步骤F)中,上游引物的突变特异性碱基在3'OH处,使得野生型序列上的延伸将不太可能,因为所述碱基是错配的。在突变特异性和基因座特异性延伸以产生包含Ai标签序列、靶特异性序列和Ci'标签序列的产物(图7,步骤D)后,可以通过成对的匹配引物Ai和Ci以及跨越连接接合部的TaqManTM探针,如上文对于图4步骤F至步骤G所述(参见图7,步骤E和步骤F)或使用本领域中已知的其他合适手段检测产物。突变体聚合酶延伸的特异性超过野生型序列聚合酶延伸的特异性可以通过以下进一步改进:(i)使用突变特异性PCR引物,其在距离3'OH碱基的第2位置或第3位置含有错配,(ii)对于野生型序列使用LNA或PNA探针,其将减少突变特异性PCR引物与野生型序列的杂交,(iii)对于野生型序列使用PCR引物,所述野生型序列被阻断而不经历额外扩增,和(iv)避免在引物和野生型序列之间在3'OH碱基处的G:T或T:G错配。此外,较长的靶特异性引物的浓度显著低于TaqmanTM探针和标签特异性引物(Ai、Ci)的浓度,使得较长的突变特异性引物被耗尽,允许TaqManTM探针和标签特异性引物杂交并能够实现靶依赖性检测。
对于图8中所示的协议,在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、包含5'引物特异性部分(Ai)的突变特异性引物、包含5'引物特异性部分(Bi-Ci)的基因座特异性引物和匹配UniTaq引物F1-Bi-Q-Ai和Ci的单独的孔、微孔或液滴中。如果含突变的序列存在于样品中,则这些引物组合扩增所述含突变的序列(图8,步骤C)。再次,包含野生型序列的阻断性LNA或PNA探针的存在抑制野生型靶序列的延伸,如果在初始延伸扩增步骤期间在突变序列富集之后存在所述野生型靶序列的话(图8,步骤B)。如所述图的步骤C中所示,通过在突变特异性和基因座特异性引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层特异性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基,产生能聚合酶延伸的3'OH基团(图8,步骤C)。在初始引物延伸(步骤B)中,释放的3'OH是突变位置上游的少量碱基,因此如果被裂解,则将延伸野生型序列和突变序列两者(尽管阻断性LNA或PNA将限制与野生型序列杂交的引物的裂解)。相反,在组合的TaqmanTM-UniTaq PCR扩增(步骤C至步骤G)中,上游引物的突变特异性碱基在3'OH处,使得野生型序列上的延伸将不太可能,因为所述碱基是错配的。在突变特异性和基因座特异性延伸以产生包含Ai标签序列、靶特异性序列和Bi’-Ci’标签序列的产物(图8,步骤D)后,可以通过成对的匹配UniTaq引物(即F1-Bi-Q-Ai和Ci),如上文对于图5步骤F至步骤H所述(参见图8,步骤E至步骤G)或使用本领域中已知的其他合适手段检测产物。突变体聚合酶延伸的特异性超过野生型序列聚合酶延伸的特异性可以通过以下进一步改进:(i)使用突变特异性PCR引物,其在距离3'OH碱基的第2位置或第3位置含有错配,(ii)对于野生型序列使用LNA或PNA探针,其将减少突变特异性PCR引物与野生型序列的杂交,(iii)对于野生型序列使用PCR引物,所述野生型序列被阻断而不经历额外扩增,和(iv)避免在引物和野生型序列之间在3'OH碱基处的G:T或T:G错配。此外,较长的靶特异性引物的浓度显著低于UniTaq引物(F1-Bi-Q-Ai、Ci)的浓度,使得较长的突变特异性引物被耗尽,允许UniTaq引物杂交并能够实现靶依赖性检测。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基,和在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理。然后提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。所述方法还包括提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列。将所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物。将包含所述一级延伸产物的一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物。使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个寡核苷酸引物组。每个探针组包含(a)第一寡核苷酸探针,其具有5'引物特异性部分和3'亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分,和(b)第二寡核苷酸探针,其具有5'亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和3'引物特异性部分,并且其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于第一聚合酶链式反应产物的互补核苷酸序列上。将所述第一聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组共混,以形成一种或多种连接反应混合物。使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与互补序列杂交时连接在一起,以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物,并且使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
图9和图10示出根据本申请的此方面检测低水平甲基化的exPCR-LDR-qPCR遗留预防反应。这些步骤与对于图2描述的那些步骤类似,具有两个关键的区别点。首先,在分离基因组或cfDNA之后,任选地在亚硫酸氢盐转化之前用DNA修复试剂盒处理(图9和图10,步骤A)。亚硫酸氢盐将未甲基化的胞嘧啶,而不是5-甲基胞嘧啶(5meC)或5-羟甲基胞嘧啶(5hmC)转化为尿嘧啶碱基,所述尿嘧啶碱基与A碱基配对。因此,在PCR扩增的单次循环之后,将未甲基化的Cm而不是5meC或5hmC转化为“T”碱基,从而允许将胞嘧啶的两种修饰形式与未修饰的胞嘧啶区分开。其次,使用基因座特异性下游引物(具有任选相同的8-11碱基尾)和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图9,步骤B)。添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,添加基因座特异性上游引物,然后使用包含dUTP的脱氧核苷酸混合物进行有限(8至20次循环)或完全(20-40次循环)PCR(图9,步骤C)。在靶特异性杂交后,RNA酶H去除RNA碱基以释放3'OH基团,其是亚硫酸氢盐转化的甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图9,步骤C)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针(其与上游PCR引物部分重叠)将相对于上游引物优先竞争结合亚硫酸氢盐转化的未甲基化序列,从而抑制每轮PCR期间亚硫酸氢盐转化的未甲基化序列DNA的扩增。任选地,下游引物含有相同的8-11碱基尾以预防引物二聚体。此外,通过将杂交温度升高到高于正向引物的杂交温度,但等于或低于反向引物的杂交温度,这样的尾部为PCR循环结束时的不对称PCR提供选择,所述反向引物在8-11个碱基处更长,将具有更高的Tm值。这产生更多的底部链产物,其是随后LDR步骤的合适底物。扩增产物含有dU,如图9,步骤D中显示,这允许随后用UDG或类似的酶处理以预防遗留。
或者,如图10中显示,使用基因座特异性上游引物、包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图10,步骤B)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针(其与上游PCR引物部分重叠)将相对于上游引物优先竞争结合亚硫酸氢盐转化的未甲基化序列,从而抑制每轮PCR期间亚硫酸氢盐转化的未甲基化序列DNA的扩增。添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,添加基因座特异性下游引物,然后使用包含dUTP的脱氧核苷酸混合物进行有限(8至20次循环)或完全(20-40次循环)PCR(图14,步骤C)。任选地,下游引物含有相同的8-11碱基尾以预防引物二聚体。
对于图9和图10,含有尾部(Ai、Ci')的甲基化特异性上游探针和基因座特异性下游探针使得能够在存在含亚硫酸氢盐转化的甲基化碱基的PCR产物的情况下形成连接产物。在连接后,可以使用成对的匹配引物Ai和Ci以及跨越连接接合部的TaqManTM探针,如上文对于图2所述(参见图9,步骤E至步骤H)或使用本领域中已知的其他合适手段检测连接产物。
或者,含有尾部(Ai、Bi’-Ci’)的甲基化特异性上游探针和基因座特异性下游探针使得能够在存在含亚硫酸氢盐转化的甲基化碱基的PCR产物的情况下形成连接产物。在连接后,如上文对于图3所述或使用本领域中已知的其他合适手段使用UniTaq特异性引物(即F1-Bi-Q-Ai、Ci)扩增且检测连接产物。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理。提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶,并且提供一种或多种第一一级寡核苷酸引物。每种第一一级寡核苷酸引物包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列。将所述亚硫酸氢盐处理的样品、所述一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物,并且使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,以形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5'引物特异性部分和与由所述第一一级寡核苷酸引物形成的聚合酶延伸反应产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有5'引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一二级寡核苷酸引物的5'引物特异性部分、亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和所述第二二级寡核苷酸引物的5'引物特异性部分的补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个三级寡核苷酸引物组。每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物的5'引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的3'引物特异性部分互补的核苷酸序列。将所述第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述二级聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
图11、图12、图18和图19示出本申请的此方面的各种实施方案。
图11示出检测低水平甲基化的示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA,并任选地在亚硫酸氢盐转化前用DNA修复试剂盒处理(图11,步骤A)。使用基因座特异性下游引物(具有任选相同的8-11碱基尾)和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图11,步骤B)。如果基因座特异性下游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。在延伸循环之后,添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。
或者,如图12中显示,使用基因座特异性上游引物、包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图12,步骤B)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针(其与上游PCR引物部分重叠)将相对于上游引物优先竞争结合亚硫酸氢盐转化的未甲基化序列,从而抑制每轮PCR期间亚硫酸氢盐转化的未甲基化序列DNA的扩增。添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。
如图11和图12步骤C中显示,添加亚硫酸氢盐转化的甲基化碱基特异性引物(包含5'引物特异性部分Ai)和亚硫酸氢盐转化的基因座特异性引物(包含5'引物特异性部分Ci),然后进行有限循环巢式PCR以扩增亚硫酸氢盐转化的含甲基化序列(如果存在于样品中)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针使得能够扩增原始甲基化的等位基因而不扩增原始未甲基化的等位基因。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越亚硫酸氢盐转化的甲基化靶区域的TaqManTM探针,如上文对于图4所述(参见图11和图12,步骤D至步骤F)或使用本领域中已知的其他合适手段检测产物。
或者,添加亚硫酸氢盐转化的甲基化碱基特异性引物(包含5'引物特异性部分Ai)和亚硫酸氢盐转化的基因座特异性引物(包含5'引物特异性部分Bi-Ci),然后进行有限循环巢式PCR以扩增亚硫酸氢盐转化的含甲基化序列(如果存在于样品中)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针使得能够扩增原始甲基化的等位基因而不扩增原始未甲基化的等位基因。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,如上文对于图5所述或使用本领域中已知的其他合适手段使用UniTaq特异性引物(即F1-Bi-Q-Ai、Ci)扩增且检测产物。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理。提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶,并且提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列。将所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物。使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物。将包含所述一级延伸产物的一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物。使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由所述第一一级寡核苷酸引物形成的第一聚合酶链式反应产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有包含与由所述第一二级寡核苷酸引物形成的第一聚合酶链式反应产物的一部分互补的核苷酸序列的3'部分。将所述第一聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
图13至图15、图20和图21示出本申请的此方面的各种实施方案。
图13示出检测低水平甲基化的另一示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA,并任选地在亚硫酸氢盐转化前用DNA修复试剂盒处理(图13,步骤A)。使用基因座特异性下游引物(具有任选相同的8-11碱基尾)和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图13,步骤B)。如果基因座特异性下游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。在延伸循环之后,添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,使用基因座特异性上游引物、包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针和不包含dUTP的脱氧核苷酸混合物,在有限循环PCR(8-20次循环)中选择性地扩增目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图13,步骤C)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针(其与上游PCR引物部分重叠)将相对于上游引物优先竞争结合亚硫酸氢盐转化的未甲基化序列,从而抑制每轮PCR期间亚硫酸氢盐转化的未甲基化序列DNA的扩增。
在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、亚硫酸氢盐转化的甲基化碱基特异性引物和亚硫酸氢盐转化的基因座特异性引物的单独的孔、微孔或液滴中,以扩增亚硫酸氢盐转化的含甲基化序列(如果存在于样品中)(图13,步骤D)。如上文对于图6所述(参见图13,步骤D至步骤E)或使用本领域中已知的其他合适手段扩增和检测亚硫酸氢盐转化的含甲基化产物。
图14和图15示出检测低水平甲基化的额外的示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA,并任选地在亚硫酸氢盐转化前用DNA修复试剂盒处理(图14和图15,步骤A)。使用基因座特异性下游引物(具有任选相同的8-11碱基尾)和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图14,步骤B)。如果基因座特异性下游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。在延伸循环之后,添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,使用基因座特异性上游引物、包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针和不包含dUTP的脱氧核苷酸混合物,在有限循环PCR(8-20次循环)中选择性地扩增目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图14,步骤C)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针(其与上游PCR引物部分重叠)将相对于上游引物优先竞争结合亚硫酸氢盐转化的未甲基化序列,从而抑制每轮PCR期间亚硫酸氢盐转化的未甲基化序列DNA的扩增。
或者,如图15中显示,使用基因座特异性上游引物、包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图15,步骤B)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针(其与上游PCR引物部分重叠)将相对于上游引物优先竞争结合亚硫酸氢盐转化的未甲基化序列,从而抑制每轮PCR期间亚硫酸氢盐转化的未甲基化序列DNA的扩增。添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。随后,添加基因座特异性下游引物,然后进行有限循环PCR(8至12次循环,图15,步骤C)。如果基因座特异性下游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。
对于图14和图15中所示的协议,在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、包含5'引物特异性部分(Ai)的亚硫酸氢盐转化的甲基化碱基特异性引物、包含5'引物特异性部分(Ci)的亚硫酸氢盐转化的基因座特异性引物和匹配引物Ai和Ci的单独的孔、微孔或液滴中。如果亚硫酸氢盐转化的含甲基化序列存在于样品中,则这些引物组合以扩增所述亚硫酸氢盐转化的含甲基化序列(图14和图15,步骤D)。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针使得能够扩增原始甲基化的等位基因而不扩增原始未甲基化的等位基因。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越亚硫酸氢盐转化的甲基化靶区域的TaqManTM探针,如上文对于图4所述(参见图14,步骤E至步骤G)或使用本领域中已知的其他合适手段检测产物。
或者,在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、包含5'引物特异性部分(Ai)的亚硫酸氢盐转化的甲基化碱基特异性引物、包含5'引物特异性部分(Ci)的亚硫酸氢盐转化的基因座特异性引物和匹配UniTaq引物F1-Bi-Q-Ai和Ci的单独的孔、微孔或液滴中。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针使得能够扩增原始甲基化的等位基因而不扩增原始未甲基化的等位基因。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,如上文对于图5所述或使用本领域中已知的其他合适手段使用UniTaq特异性引物(即F1-Bi-Q-Ai、Ci)扩增且检测产物。
图16和图17示出检测低水平甲基化的额外的示例性exPCR-LDR-qPCR遗留预防反应。分离基因组或cfDNA,然后如下处理:(i)用甲基敏感性限制性核酸内切酶如Bsh1236I(CG^CG)处理,以完全消化未甲基化的DNA并预防遗留,或(ii)捕获和富集甲基化DNA,(iii)然后用DNA修复试剂盒处理(图16和图17,步骤A)。对DNA进行亚硫酸氢盐处理,以将未甲基化的残基转化为尿嘧啶,由此使双链DNA不互补。使用基因座特异性下游引物(具有任选相同的8-11碱基尾)和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图16,步骤B)。如果基因座特异性下游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。在延伸循环之后,添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,使用基因座特异性上游引物和不包含dUTP的脱氧核苷酸混合物,在有限循环PCR(8-20次循环)中选择性地扩增目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图16,步骤C)。如果基因座特异性上游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。
或者,如图17中显示,使用亚硫酸氢盐转化的DNA的基因座特异性上游引物和不包含dUTP的脱氧核苷酸混合物选择性延伸目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图17,步骤B)。如果基因座特异性上游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。随后,添加基因座特异性下游引物,然后使用包含dUTP的脱氧核苷酸混合物进行有限(8至20次循环)或完全(20-40次循环)PCR(图17,步骤C)。任选地,下游引物含有相同的8-11碱基尾以预防引物二聚体。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。扩增产物含有dU,如图17,步骤D中显示,这允许随后用UDG或类似的酶处理以预防遗留。
对于图16,含有尾部(Ai、Ci')的甲基化特异性上游探针和基因座特异性下游探针使得能够在存在含亚硫酸氢盐转化的甲基化碱基的PCR产物的情况下形成连接产物。在连接后,可以使用成对的匹配引物Ai和Ci以及跨越连接接合部的TaqManTM探针,如上文对于图2所述(参见图16,步骤E至步骤H)或使用本领域中已知的其他合适手段检测连接产物。
或者,含有尾部(Ai、Bi’-Ci’)的甲基化特异性上游探针和基因座特异性下游探针使得能够在存在含亚硫酸氢盐转化的甲基化碱基的PCR产物的情况下形成连接产物。在连接后,如上文对于图3所述或使用本领域中已知的其他合适手段使用UniTaq特异性引物(即F1-Bi-Q-Ai、Ci)扩增且检测连接产物。
图18和图19示出检测低水平甲基化的额外的示例性exPCR-LDR-qPCR遗留预防反应。分离基因组或cfDNA,然后如下处理:(i)用甲基敏感性限制性核酸内切酶如Bsh1236I(CG^CG)处理,以完全消化未甲基化的DNA并预防遗留,或(ii)捕获和富集甲基化DNA,(iii)然后用DNA修复试剂盒处理(图18和图19,步骤A)。对DNA进行亚硫酸氢盐处理,以将未甲基化的残基转化为尿嘧啶,由此使双链DNA不互补。使用基因座特异性下游引物(具有任选相同的8-11碱基尾)和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图18,步骤B)。如果基因座特异性下游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。在延伸循环之后,添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。
或者,如图19中显示,使用亚硫酸氢盐转化的DNA的基因座特异性上游引物和不包含dUTP的脱氧核苷酸混合物选择性延伸目标区域。包含亚硫酸氢盐转化的未甲基化序列(或其补体)的阻断性LNA或PNA探针使得能够扩增原始甲基化的等位基因而不扩增原始未甲基化的等位基因。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图19,步骤B)。添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。
如图18,步骤C中显示,添加亚硫酸氢盐转化的甲基化碱基特异性引物(包含5'引物特异性部分Ai)和亚硫酸氢盐转化的基因座特异性引物(包含5'引物特异性部分Ci),然后进行有限循环巢式PCR以扩增亚硫酸氢盐转化的含甲基化序列(如果存在于样品中)。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越亚硫酸氢盐转化的甲基化靶区域的TaqManTM探针,如上文对于图4所述(参见图18,步骤D至步骤F)或使用本领域中已知的其他合适手段检测产物。
或者,添加亚硫酸氢盐转化的甲基化碱基特异性引物(包含5'引物特异性部分Ai)和亚硫酸氢盐转化的基因座特异性引物(包含5'引物特异性部分Bi-Ci),然后进行有限循环巢式PCR以扩增亚硫酸氢盐转化的含甲基化序列(如果存在于样品中)。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,如上文对于图5所述或使用本领域中已知的其他合适手段使用UniTaq特异性引物(即F1-Bi-Q-Ai、Ci)扩增且检测产物。
图20示出检测低水平甲基化的另一示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA,然后如下处理:(i)用甲基敏感性限制性核酸内切酶如Bsh1236I(CG^CG)处理,以完全消化未甲基化的DNA并预防遗留,或(ii)捕获和富集甲基化DNA,(iii)然后用DNA修复试剂盒处理(图20,步骤A)。对DNA进行亚硫酸氢盐处理,以将未甲基化的残基转化为尿嘧啶,由此使双链DNA不互补。使用基因座特异性下游引物(具有任选相同的8-11碱基尾)和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图20,步骤B)。如果基因座特异性下游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。在延伸循环之后,添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,使用基因座特异性上游引物和不包含dUTP的脱氧核苷酸混合物,在有限循环PCR(8-20次循环)中选择性地扩增目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图20,步骤C)。如果基因座特异性上游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。
在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、亚硫酸氢盐转化的甲基化碱基特异性引物和亚硫酸氢盐转化的基因座特异性引物的单独的孔、微孔或液滴中,以扩增亚硫酸氢盐转化的含甲基化序列(如果存在于样品中)(图20,步骤D)。如上文对于图6所述(参见图20,步骤D至步骤E)或使用本领域中已知的其他合适手段扩增且检测亚硫酸氢盐转化的含甲基化产物。
图21示出检测低水平甲基化的额外的示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA,然后如下处理:(i)用甲基敏感性限制性核酸内切酶如Bsh1236I(CG^CG)处理,以完全消化未甲基化的DNA并预防遗留,或(ii)捕获和富集甲基化DNA,(iii)然后用DNA修复试剂盒处理(图21,步骤A)。对DNA进行亚硫酸氢盐处理,以将未甲基化的残基转化为尿嘧啶,由此使双链DNA不互补。使用基因座特异性下游引物(具有任选相同的8-11碱基尾)和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图21,步骤B)。如果基因座特异性下游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。在延伸循环之后,添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地,在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,使用基因座特异性上游引物和不包含dUTP的脱氧核苷酸混合物,在有限循环PCR(8-20次循环)中选择性地扩增目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图21,步骤C)。如果基因座特异性上游引物覆盖一个或多个甲基化位点,则可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。
对于图21中所示的协议,在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、包含5'引物特异性部分(Ai)的亚硫酸氢盐转化的甲基化碱基特异性引物、包含5'引物特异性部分(Ci)的亚硫酸氢盐转化的基因座特异性引物和匹配引物Ai和Ci的单独的孔、微孔或液滴中。如果亚硫酸氢盐转化的含甲基化序列存在于样品中,则这些引物组合以扩增所述亚硫酸氢盐转化的含甲基化序列(图21,步骤D)。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越亚硫酸氢盐转化的甲基化靶区域的TaqManTM探针,如上文对于图4所述(参见图21,步骤E至步骤G)或使用本领域中已知的其他合适手段检测产物。
或者,在有限循环PCR后,将PCR产物等分到含有TaqmanTM探针、包含5'引物特异性部分(Ai)的亚硫酸氢盐转化的甲基化碱基特异性引物、包含5'引物特异性部分(Ci)的亚硫酸氢盐转化的基因座特异性引物和匹配UniTaq引物F1-Bi-Q-Ai和Ci的单独的孔、微孔或液滴中。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,如上文对于图5所述或使用本领域中已知的其他合适手段使用UniTaq特异性引物(即F1-Bi-Q-Ai、Ci)扩增且检测产物。
本申请的另一方面涉及一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。所述方法包括提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基,和在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理。提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。还提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其具有5'引物特异性部分和包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列的3'部分,和(b)第二一级寡核苷酸引物,其具有5'引物特异性部分和包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种聚合酶延伸反应混合物。使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物。将包含所述一级延伸产物的一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物。所述方法还包括使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物。提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的5'引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的3'引物特异性部分互补的核苷酸序列。将所述一级聚合酶链式反应产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
图22示出本申请的此方面的一个实施方案。
图22示出检测低水平甲基化的额外的示例性exPCR-qPCR遗留预防反应。分离基因组或cfDNA,然后如下处理:(i)用甲基敏感性限制性核酸内切酶如Bsh1236I(CG^CG)处理,以完全消化未甲基化的DNA并预防遗留,或(ii)捕获和富集甲基化DNA,(iii)然后用DNA修复试剂盒处理(图22,步骤A)。对DNA进行亚硫酸氢盐处理,以将未甲基化的残基转化为尿嘧啶,由此使双链DNA不互补。使用包含5'引物特异性部分(对于图22,Ci)的亚硫酸氢盐转化的基因座特异性下游引物和不包含dUTP的脱氧核苷酸混合物选择性地延伸目标区域。在此实施方案中,通过在下游引物中包含3'可裂解的阻断基团(Blk3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其适合聚合酶延伸(图22,步骤B)。在此实施方案中,基因座特异性下游引物覆盖一个或多个甲基化位点,且可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。在延伸循环之后,添加UDG,其破坏亚硫酸氢盐转化的DNA(但不破坏引物延伸产物)。任选地在初始延伸步骤之前将样品等分到12、24、36、48或96个孔中。随后,使用包含5'引物特异性部分(Ai)的亚硫酸氢盐转化的甲基化碱基特异性上游引物和不包含dUTP的脱氧核苷酸混合物,在有限循环PCR(8-20次循环)中选择性地扩增目标区域。在此实施方案中,通过在上游引物中包含3'可裂解的阻断基团(Blk 3’,例如C3间隔区)和RNA碱基(r),可以将另一层选择性并入所述方法中。在靶特异性杂交后,RNA酶H(星号)去除RNA碱基以释放3'OH基团,其是在亚硫酸氢盐转化的未甲基化靶碱基上游且适合聚合酶延伸的少量碱基(图22,步骤C)。因为甲基化碱基特异性上游引物覆盖一个或多个甲基化位点,所以可以通过使用其序列对应于亚硫酸氢盐转化的未甲基化序列的阻断引物来添加另一层特异性。
如图22步骤D中显示,有限循环PCR产物包含Ai标签序列、甲基化特异性序列和Ci'标签序列,并且将其分布到用于TaqmanTM反应的孔、微孔或液滴中。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越亚硫酸氢盐转化的甲基化靶区域的TaqManTM探针,如上文对于图4所述(参见图22,步骤D至步骤F)或使用本领域中已知的其他合适手段检测产物。
或者,有限循环PCR产物包含Ai标签序列、甲基化特异性序列和Bi'-Ci'标签序列,并且将其分布到用于TaqmanTM反应的孔、微孔或液滴中。在PCR后,如上文对于图5所述或使用本领域中已知的其他合适手段使用UniTaq特异性引物(即F1-Bi-Q-Ai、Ci)扩增且检测产物。
在一个实施方案中,所述方法还包括使样品与DNA修复酶接触以修复受损的DNA、DNA中的脱碱基位点、氧化碱基或切口。
在另一个实施方案中,所述方法还包括在所述共混以形成一种或多种聚合酶延伸反应混合物之前或与其同时,使所述样品与至少第一甲基化敏感性酶接触以形成限制性酶反应混合物,其中所述第一甲基化敏感性酶裂解所述样品中在至少一个甲基化敏感性酶识别序列内含有一个或多个未甲基化残基的核酸分子,并且由此所述检测包括检测含有靶核苷酸序列的一个或多个亲本核酸分子,其中所述亲本核酸分子原始含有一个或多个甲基化残基。
根据本发明的这个和所有方面,“甲基化敏感性酶”是核酸内切酶,当核酸分子中的其同源识别序列含有甲基化残基时,所述核酸内切酶不会裂解所述识别序列或裂解所述识别序列的效率降低(即,其对其识别序列内甲基化残基的存在敏感)。“甲基化敏感性酶识别序列”是甲基化敏感性酶的同源识别序列。在一些实施方案中,甲基化残基是序列CpG(即,5-甲基-CpG)内的5-甲基-C。适合在本发明的方法中使用的甲基化敏感性限制性核酸内切酶的非限制性列表包括而不限于AciI、HinP1I、Hpy99I、HpyCH4IV、BstUI、HpaII、HhaI或其任意组合。
在一个另外的实施方案中,所述方法还包括使所述样品与固定的甲基化核酸结合蛋白或抗体接触以选择性地结合和富集所述样品中的甲基化核酸。
在一个实施方案中,来自所述一个或多个一级或二级寡核苷酸引物组的引物包含如下部分,其在以碱基特异性方式与靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列杂交时没有或具有一个核苷酸序列错配,但是具有在来自所述一个或多个一级或二级寡核苷酸引物组的引物以碱基特异性方式与野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列中的对应核苷酸序列部分杂交时干扰聚合酶延伸的一个或多个额外核苷酸序列错配。
所述一级寡核苷酸引物组的一种或两种一级寡核苷酸引物和/或所述二级寡核苷酸引物组的一种或两种二级寡核苷酸引物可以具有包含可裂解的核苷酸或核苷酸类似物和阻断基团的3'部分,使得所述一种或多种引物的3'端不适合聚合酶延伸。所述方法的实施方案还包括在所述杂交处理期间裂解一种或两种寡核苷酸引物的所述可裂解的核苷酸或核苷酸类似物,由此在所述延伸处理之前释放一种或两种寡核苷酸引物上的游离3'OH端。在一个实施方案中,所述可裂解的核苷酸包含一个或多个RNA碱基。
在另一个实施方案中,来自所述一个或多个一级或二级寡核苷酸引物组的引物包含与靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列不同的序列,所述差异位于距离释放的游离3'OH端的两个或三个核苷酸碱基处。
在另一个实施方案中,所述方法还包括提供一种或多种阻断寡核苷酸引物,其在3'端包含一个或多个错配碱基或在3'端包含一种或多种核苷酸类似物和阻断基团,使得所述阻断寡核苷酸引物的3'端在以碱基特异性方式与野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列杂交时不适合聚合酶延伸,其中所述阻断寡核苷酸引物包含如下部分,其具有与所述阻断寡核苷酸引物所杂交的所述野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列中的核苷酸序列部分相同的核苷酸序列,但具有与靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列中的对应核苷酸序列部分的一个或多个核苷酸序列错配。在聚合酶延伸反应、聚合酶链式反应或连接反应之前,将所述一种或多种阻断寡核苷酸引物与所述样品或后续产物共混,由此在杂交期间,所述一种或多种阻断寡核苷酸引物优先以碱基特异性方式与野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列杂交,由此在以碱基特异性方式与野生型序列或亚硫酸氢盐转化的未甲基化序列或其补体序列杂交的引物或探针的反应期间干扰聚合酶延伸或连接。
在某些实施方案中,第一二级寡核苷酸引物具有5'引物特异性部分,且第二二级寡核苷酸引物具有5'引物特异性部分,所述一个或多个二级寡核苷酸引物组还包含第三二级寡核苷酸引物和(d)第四二级寡核苷酸引物,所述第三二级寡核苷酸引物包含与第一二级寡核苷酸引物的5'引物特异性部分相同的核苷酸序列,所述第四二级寡核苷酸引物包含与第二二级寡核苷酸引物的5'引物特异性部分相同的核苷酸序列。
本申请的另一方面涉及一种用于鉴定样品中的含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的方法,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。所述方法包括提供含有一个或多个亲本核糖核酸分子的样品,所述亲本核糖核酸分子含有在序列上潜在地与其他亲本核糖核酸分子不同的靶核糖核酸分子,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触。然后提供一个或多个一级寡核苷酸引物组。每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核糖核酸分子中邻近所述靶核糖核苷酸序列的RNA序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的cDNA延伸产物的一部分互补的核苷酸序列。将所述接触的样品、所述一个或多个一级寡核苷酸引物组、包含dUTP的脱氧核苷酸混合物、逆转录酶和DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生所述靶核糖核酸的互补脱氧核糖核酸(cDNA)分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种不同的逆转录/聚合酶产物。所述方法还包括提供一个或多个寡核苷酸探针组。每个探针组包含(a)具有5'引物特异性部分和3'靶序列特异性部分的第一寡核苷酸探针,和(b)具有5'靶序列特异性部分和3'引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于对应于靶核糖核酸分子序列的逆转录酶/聚合酶产物的互补部分上。使所述逆转录酶/聚合酶产物与连接酶和所述一个或多个寡核苷酸探针组接触以形成一种或多种连接反应混合物,并且使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一探针和第二探针在与其补体杂交时连接在一起以在连接酶反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、靶特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列、所述一个或多个二级寡核苷酸引物组与所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第一聚合酶链式反应产物。所述方法还包括检测和区分所述第一聚合酶链式反应产物,由此鉴定含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的存在,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。
图23和图26示出本申请的此方面的实施方案。
图23示出检测mRNA水平的易位的示例性RT-PCR-LDR-qPCR遗留预防反应。这种融合mRNA可以从循环肿瘤细胞、外泌体或从其他血浆级分中分离。为了准确计数,在PCR之前等分到12、24、36或48个孔中。对于更高的拷贝数,平均分布在13个孔中,将最后一个孔平均稀释到13个额外的孔中,并且对剩余的孔重复进行。在此实施方案中,将mRNA分离(图23,步骤A),且用UDG处理以预防遗留(图23,步骤B)。在存在dUTP的情况下,使用3'转录物特异性引物和逆转录酶产生cDNA。合适的逆转录酶包括但不限于莫洛尼鼠白血病病毒(MoloneyMurine Leukemia Virus)逆转录酶(M-MLV RT,New England Biolabs)或Superscript II或III逆转录酶(Life Technologies)。将Taq聚合酶激活以进行有限循环PCR扩增(12-20)以保持不同扩增子的相对比率(图23,步骤B)。引物含有相同的8-11碱基尾以预防引物二聚体。PCR产物并入dUTP,允许预防遗留(图23,步骤C)。
如图23,步骤D中显示,含有适合随后PCR扩增的引物特异性部分(Ai、Ci')的外显子接合部特异性连接寡核苷酸探针以碱基特异性方式与其对应靶序列杂交。连接酶将这两种寡核苷酸共价封接在一起(图23,步骤D),并且将连接产物等分到单独的孔中以使用标签引物(Ai、Ci)和跨越连接接合部的TaqManTM探针(F1-Q)检测(图23,步骤E)。用UDG处理样品以预防遗留,这也破坏原始靶扩增子(图23,步骤E)。当在存在dUTP的情况下使用PCR时,仅真正的LDR产物将扩增。融合转录物的拷贝数基于来自原始分布为一个拷贝/孔的孔的信号来确定。原始PCR引物和LDR探针都不扩增LDR产物,提供额外的遗留预防。
本申请的另一方面涉及一种用于鉴定样品中的含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的方法,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。所述方法包括提供含有一个或多个亲本核糖核酸分子的样品,所述亲本核糖核酸分子含有在序列上潜在地与其他亲本核糖核酸分子不同的靶核糖核酸分子,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触。所述方法还包括提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核糖核酸分子中邻近所述靶核苷酸序列的RNA序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的cDNA延伸产物的一部分互补的核苷酸序列。将所述接触的样品、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物、逆转录酶和DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物,并且使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生靶RNA的互补脱氧核糖核酸(cDNA)分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种不同的逆转录/一级聚合酶链式反应产物。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由第一一级寡核苷酸引物形成的逆转录/一级聚合酶链式反应产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有包含与由第一二级寡核苷酸引物形成的逆转录/一级聚合酶链式反应产物的一部分互补的核苷酸序列的3'部分。将所述逆转录/一级聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第一聚合酶链式反应产物。所述方法还包括检测和区分所述第一聚合酶链式反应产物,由此鉴定含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的存在,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。
图24、图25、图27和图28示出本申请的此方面的各种实施方案。
图24和图25示出检测mRNA水平的易位的额外示例性RT-PCR-LDR-qPCR遗留预防反应。为了准确计数,在PCR之前等分到12、24、36或48个孔中。对于更高的拷贝数,平均分布在13个孔中,将最后一个孔平均稀释到13个额外的孔中,并且对剩余的孔重复进行。在此实施方案中,将mRNA分离(图24和图25,步骤A),且用UDG处理以预防遗留(图24和图25,步骤B)。使用3'转录物特异性引物和逆转录酶产生cDNA。将Taq聚合酶激活以进行有限循环PCR扩增(8-20)以保持不同扩增子的相对比率(图24和图25,步骤B)。引物含有相同的8-11碱基尾以预防引物二聚体,并且仅将其添加到具有预期的低拷贝稀释的孔中。
对于图24中所示的协议,在有限循环PCR后,将PCR产物等分到含有跨cDNA融合接合部的TaqmanTM探针、cDNA特异性引物的单独的孔、微孔或液滴中,以扩增接合部序列(如果存在于样品中)(图24,步骤C)。如上文对于图6所述(参见图24,步骤C至步骤D)或使用本领域中已知的其他合适手段扩增且检测融合cDNA产物。
对于图25中所示的协议,在有限循环PCR后,将PCR产物等分到含有跨cDNA融合接合部的TaqmanTM探针、包含5'引物特异性部分(Ai)的cDNA特异性(正向)引物、包含5'引物特异性部分(Ci)的cDNA特异性(反向)引物和匹配引物Ai和Ci的单独的孔、微孔或液滴中。如果融合cDNA序列存在于样品中,则这些引物组合以扩增所述融合cDNA序列(图25,步骤C)。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越融合cDNA区域的TaqManTM探针,如上文对于图4所述(参见图25,步骤D至步骤F)或使用本领域中已知的其他合适手段检测产物。
图26示出计数mRNA、ncRNA或lncRNA拷贝数的示例性RT-PCR-LDR-qPCR遗留预防反应。从全血细胞、外泌体、CTC或其他血浆级分中分离RNA。为了准确计数,在PCR之前等分到12、24、36或48个孔中。对于更高的拷贝数,平均分布在13个孔中,将最后一个孔平均稀释到13个额外的孔中,并且对剩余的孔重复进行。在此实施方案中,将mRNA分离(图26,步骤A),且用UDG处理以预防遗留(图26,步骤B)。在存在dUTP的情况下,使用3'转录物特异性引物和逆转录酶产生cDNA。将Taq聚合酶激活以进行有限循环PCR扩增(12-20)以保持不同扩增子的相对比率(图26,步骤B)。引物含有相同的8-11碱基尾以预防引物二聚体。PCR产物并入dUTP,允许预防遗留(图26,步骤C)。
如图26,步骤D中显示,含有适合随后PCR扩增的引物特异性部分(Ai、Ci')的外显子接合部特异性连接寡核苷酸探针以碱基特异性方式与其对应靶序列杂交。连接酶将这两种寡核苷酸共价封接在一起(图26,步骤D),并且将连接产物等分到单独的孔中以使用标签引物(Ai、Ci)和跨越连接接合部的TaqManTM探针(F1-Q)检测(图26,步骤E)。用UDG处理样品以预防遗留,这也破坏原始靶扩增子(图26,步骤E)。当在存在dUTP的情况下使用PCR时,仅真正的LDR产物将扩增。mRNA、ncRNA或lncRNA转录物的拷贝数基于来自原始分布为一个拷贝/孔的孔的信号来确定。原始PCR引物和LDR探针都不扩增LDR产物,提供额外的遗留预防。
图27示出计数mRNA、ncRNA或lncRNA拷贝数的示例性RT-PCR-LDR-qPCR遗留预防反应。从全血细胞、外泌体、CTC或其他血浆级分中分离RNA。为了准确计数,在PCR之前等分到12、24、36或48个孔中。对于更高的拷贝数,平均分布在13个孔中,将最后一个孔平均稀释到13个额外的孔中,并且对剩余的孔重复进行。在此实施方案中,将mRNA分离(图27,步骤A),且用UDG处理以预防遗留(图27,步骤B)。在存在dUTP的情况下,使用3'转录物特异性引物和逆转录酶产生cDNA。将Taq聚合酶激活以进行有限循环PCR扩增(8-20)以保持不同扩增子的相对比率(图27,步骤B)。引物含有相同的8-11碱基尾以预防引物二聚体。PCR产物并入dUTP,允许预防遗留(图27,步骤C)。
对于图27中所示的协议,在有限循环PCR后,将PCR产物等分到含有跨cDNA靶区域的TaqmanTM探针、cDNA特异性引物的单独的孔、微孔或液滴中,以扩增靶序列(如果存在于样品中)(图27,步骤C)。如上文对于图6所述(参见图27,步骤C至步骤D)或使用本领域中已知的其他合适手段扩增且检测cDNA靶产物。
对于图28中所示的协议,在有限循环PCR后,将PCR产物等分到含有跨cDNA靶区域的TaqmanTM探针、包含5'引物特异性部分(Ai)的cDNA特异性(正向)引物、包含5'引物特异性部分(Ci)的cDNA特异性(反向)引物和匹配引物Ai和Ci的单独的孔、微孔或液滴中。如果靶cDNA序列存在于样品中,则这些引物组合以扩增所述靶cDNA序列(图28,步骤C)。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越靶cDNA区域的TaqManTM探针,如上文对于图4所述(参见图28,步骤D至步骤F)或使用本领域中已知的其他合适手段检测产物。
或者,在有限循环PCR后,将PCR产物等分到含有跨cDNA靶区域的TaqmanTM探针、包含5'引物特异性部分(Ai)的cDNA特异性(正向)引物、包含5'引物特异性部分(Bi-Ci)的cDNA特异性(反向)引物和匹配引物F1-Bi-Q-Ai和Ci的单独的孔、微孔或液滴中(图中未显示)。如果靶cDNA序列存在于样品中,则这些引物组合以扩增所述靶cDNA序列。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物F1-Bi-Q-Ai和Ci以及跨越靶cDNA区域的TaqManTM探针,如上文对于图4所述或使用本领域中已知的其他合适手段检测产物。
本申请的另一方面涉及一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。所述方法包括提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触,并且将所述接触的样品与连接酶和一个或多个第一寡核苷酸初步探针共混,以形成一种或多种第一连接反应混合物,所述第一寡核苷酸初步探针包含5'磷酸、5'茎-环部分、在环区域内的内部引物特异性部分、阻断基团和与靶miRNA分子序列的3'部分互补的3'核苷酸序列。所述方法还包括在所述一种或多种第一连接反应混合物中,将所述一个或多个靶miRNA分子在其3'端与所述一个或多个第一寡核苷酸初步探针的5'磷酸连接,以产生附加到所述一个或多个第一寡核苷酸初步探针的包含所述靶miRNA分子序列(如果存在于所述样品中)的嵌合核酸分子。然后提供一个或多个一级寡核苷酸引物组。每个引物组包含(a)第一一级寡核苷酸引物,其包含与所述第一寡核苷酸初步探针的内部引物特异性部分互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含5'引物特异性部分和3'部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同。将包含嵌合核酸分子的所述一种或多种第一连接反应混合物、所述一个或多个一级寡核苷酸引物组、能够消化所述样品中的含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合消化存在于所述逆转录/聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子的条件,适合产生所述嵌合核酸分子的互补脱氧核糖核酸(cDNA)分子且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述5’引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列和所述内部引物特异性部分的补体的一种或多种不同的一级逆转录/聚合酶链式反应产物及其补体。所述方法还包括提供一个或多个寡核苷酸引物组。每个探针组包含(a)具有5'引物特异性部分和3'靶序列特异性部分的第一寡核苷酸探针,和(b)具有5'靶序列特异性部分、与一级延伸产物互补的部分和3'引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于对应于所述靶miRNA分子序列或其补体的一级逆转录/聚合酶链式反应产物的互补部分上。使所述一级逆转录/聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组接触以形成一种或多种第二连接反应混合物,并且使所述一种或多种第二连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与其补体杂交时连接在一起以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、靶特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列和所述一个或多个二级寡核苷酸引物组与所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物。所述方法还包括检测和区分所述一个或多个反应中的二级聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
图29示出本申请的此方面的一个实施方案。
图29示出定量miRNA的示例性连接-RT-PCR-LDR-qPCR遗留预防反应。为了准确计数,在PCR之前等分到12、24、36或48个孔中。对于更高的拷贝数,平均分布在13个孔中,将最后一个孔平均稀释到13个额外的孔中,并且对剩余的孔重复进行。所述方法包括从外泌体中分离miRNA且用UDG处理以预防遗留(图29,步骤B)。将具有与靶miRNA的3'端互补的部分且含有茎环、标签(Di')和阻断基团(实心圆)的寡核苷酸探针在其5'端与靶miRNA的3'端连接。连接产物包含miRNA、Di'标签、阻断基团和与miRNA的3'部分互补的序列(图29,步骤B)。逆转录酶如莫洛尼鼠白血病病毒逆转录酶(M-MLV RT,New England Biolabs)或Superscript II或III逆转录酶(Life Technologies)延伸引物(Di)以制备全长拷贝的靶,且将三个C碱基附加到延伸的靶序列的3'端(图29,步骤B)。具有3’rGrG+G(+G是LNA的符号)的标签寡核苷酸(Ei)与延伸的靶序列的这三个C碱基杂交,如图29,步骤B中显示。逆转录酶经历链转换并拷贝Ei标签序列。激活Taq聚合酶,且使用标签引物(Di、Ei)进行使用dUTP的有限循环PCR扩增(12-20),以保持不同扩增子的相对比率。PCR产物并入dU,允许预防遗留(图29,步骤C)。
如图29,步骤D中显示,含有适合随后PCR扩增的引物特异性部分(Ai、Ci’)的miRNA序列特异性连接探针以碱基特异性方式与其对应靶序列杂交。在连接后,可以使用成对的匹配引物Ai和Ci以及跨越连接接合部的TaqManTM探针,如上文对于图2所述(参见图29,步骤D至步骤F)或使用本领域中已知的其他合适手段检测连接产物。
本申请的另一方面涉及一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。所述方法包括提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触,并且将所述接触的样品与连接酶和一个或多个第一寡核苷酸探针共混,以形成一种或多种连接反应混合物,所述第一寡核苷酸探针包含5'磷酸、5'茎-环部分、在环区域内的内部引物特异性部分、阻断基团和与靶miRNA分子序列的3'部分互补的3'核苷酸序列。所述方法还包括在所述一种或多种连接反应混合物中,将所述一个或多个靶miRNA分子在其3'端与所述一个或多个第一寡核苷酸探针的5'磷酸连接,以产生附加到所述一个或多个第一寡核苷酸探针的包含所述靶miRNA分子序列(如果存在于所述样品中)的嵌合核酸分子。然后提供一个或多个一级寡核苷酸引物组。每个引物组包含(a)第一一级寡核苷酸引物,其包含与所述第一寡核苷酸探针的内部引物特异性部分互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含5'引物特异性部分和3'部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同。将包含嵌合核酸分子的所述一种或多种连接反应混合物、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生所述嵌合核酸分子的互补脱氧核糖核酸(cDNA)分子且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述5’引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列和所述内部引物特异性部分的补体的一种或多种不同的一级逆转录/聚合酶链式反应产物及其补体。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5'引物特异性部分和与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有5'引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3'部分。将所述一级逆转录/聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一二级寡核苷酸引物的5'引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列和另一5'引物特异性部分第二二级寡核苷酸引物的补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个三级寡核苷酸引物组。每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的5'引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的3'引物特异性部分互补的核苷酸序列。将所述第一聚合酶链式反应过程产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物,并且使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述第二聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
图30示出本申请的此方面的一个实施方案。
图30示出定量miRNA的示例性连接-RT-PCR-LDR-qPCR遗留预防反应。为了准确计数,在PCR之前等分到12、24、36或48个孔中。对于更高的拷贝数,平均分布在13个孔中,将最后一个孔平均稀释到13个额外的孔中,并且对剩余的孔重复进行。所述方法包括从外泌体中分离miRNA且用UDG处理以预防遗留(图30,步骤B)。将具有与靶miRNA的3'端互补的部分且含有茎环、标签(Di')和阻断基团(实心圆)的寡核苷酸探针在其5'端与靶miRNA的3'端连接。连接产物包含miRNA、Di'标签、阻断基团和与miRNA的3'部分互补的序列(图30,步骤B)。逆转录酶延伸引物(Di)以制备全长拷贝的靶,且将三个C碱基附加到延伸的靶序列的3'端(图30,步骤B)。具有3’rGrG+G的标签寡核苷酸(Ei)与延伸的靶序列的这三个C碱基杂交,如图30,步骤B中显示。逆转录酶经历链转换并拷贝Ei标签序列。激活Taq聚合酶,且使用标签引物(Di、Ei)进行有限循环PCR扩增(8-20),以保持不同扩增子的相对比率。
如图30,步骤C中显示,在有限循环PCR后,将PCR产物等分到含有跨miRNA靶区域的TaqmanTM探针、包含5'引物特异性部分(Ai)的miRNA特异性(正向)引物、包含5'引物特异性部分(Ci)的cDNA特异性(反向)引物和匹配引物Ai和Ci的单独的孔、微孔或液滴中。如果靶miRNA序列存在于样品中,则这些引物组合以扩增所述靶miRNA序列(图30,步骤C)。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越靶miRNA区域的TaqManTM探针,如上文对于图4所述(参见图30,步骤C至步骤F)或使用本领域中已知的其他合适手段检测产物。
在一个实施方案中,第二一级寡核苷酸引物的3'部分包含核糖-G和/或G核苷酸类似物,其中逆转录酶将两个或三个胞嘧啶核苷酸附加到靶miRNA的互补脱氧核糖核酸产物的3'端,使得能够与第二一级寡核苷酸引物的3'端瞬时杂交,使得逆转录酶能够经历链转换并延伸互补脱氧核糖核酸产物以包括第二一级寡核苷酸引物的5'引物特异性部分的互补序列,从而形成包含5'引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列部分、另外的部分和另一5'引物特异性部分的补体的一种或多种不同的第一聚合酶链式反应产物。
在另一个实施方案中,第二一级寡核苷酸引物的3'部分含有6至14个碱基,所述碱基包括从5'至3’的三个核糖-G或G碱基,然后是与靶miRNA序列的5'端相同的额外碱基,其中逆转录酶将两个或三个胞嘧啶残基附加到靶miRNA的初始互补脱氧核糖核酸延伸产物的3'端,并且其中在起始聚合酶链式反应的变性处理之后,调整条件以使得能够与第二一级寡核苷酸引物的3'端或与互补脱氧核糖核酸延伸产物的3'端瞬时杂交,从而允许第二一级寡核苷酸引物和互补脱氧核糖核酸延伸产物中的一者或两者延伸,以形成包含5'引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列部分、另外的部分和另一5'引物特异性部分的补体的一种或多种不同的一级逆转录/聚合酶链式反应产物。
在某些实施方案中,所述寡核苷酸探针组的第二寡核苷酸探针还包含unitaq检测部分,由此形成包含5'引物特异性部分、靶特异性部分、unitaq检测部分和3'引物特异性部分的连接的产物序列。根据此实施方案,提供一种或多种unitaq检测探针,其中每种unitaq检测探针与互补unitaq检测部分杂交,并且所述检测探针包含猝灭分子和与所述猝灭分子隔开的可检测标记。将所述一种或多种unitaq检测探针添加到第二聚合酶链式反应混合物中,并且在所述使第二聚合酶链式反应混合物经历适合一个或多个聚合酶链式反应循环的条件期间,使所述一种或多种unitaq检测探针与连接的产物序列或其补体上的互补unitaq检测部分杂交,其中在延伸处理期间,所述猝灭分子和所述可检测标记自所述一种或多种unitaq检测探针裂解,并且所述检测涉及裂解的可检测标记的检测。
在另一个实施方案中,一种一级寡核苷酸引物或一种二级寡核苷酸引物还包含unitaq检测部分,由此形成包含5'引物特异性部分、靶特异性部分、unitaq检测部分和另一5'引物特异性部分的补体的延伸产物序列及其补体。根据此实施方案,提供一种或多种unitaq检测探针,其中每种unitaq检测探针与互补unitaq检测部分杂交,并且所述检测探针包含猝灭分子和与所述猝灭分子隔开的可检测标记。将所述一种或多种unitaq检测探针添加到一种或多种第一聚合酶链式反应混合物或第二聚合酶链式反应混合物中,并且在聚合酶链式反应循环期间在第一聚合链式反应之后使所述一种或多种unitaq检测探针与连接的产物序列或其补体上的互补unitaq检测部分杂交,其中在延伸处理期间,所述猝灭分子和所述可检测标记自所述一种或多种unitaq检测探针裂解,并且所述检测涉及裂解的可检测标记的检测。
在另一个实施方案中,所述寡核苷酸探针组的一种或两种寡核苷酸探针包含如下部分,其在以碱基特异性方式与靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列杂交时没有或具有一个核苷酸序列错配,但是具有在所述寡核苷酸探针以碱基特异性方式与野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列中的对应核苷酸序列部分杂交时干扰连接的一个或多个额外核苷酸序列错配。
在一个实施方案中,所述寡核苷酸探针组的第一寡核苷酸探针的3'部分包含可裂解的核苷酸或核苷酸类似物和阻断基团,使得3'端不适合聚合酶延伸或连接。当第一寡核苷酸探针与一级延伸产物的互补靶核苷酸序列杂交时,所述探针的可裂解核苷酸或核苷酸类似物被裂解,由此在连接前释放第一寡核苷酸探针上的3’OH。
所述寡核苷酸探针组的一种或多种第一寡核苷酸探针可以包含与靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列不同的序列,所述差异位于距离释放的游离3'OH端的两个或三个核苷酸碱基处。
在一个另外的实施方案中,所述第二寡核苷酸探针在其5'端具有与第一寡核苷酸探针的3'端重叠的相同核苷酸,并且,在探针组的第一寡核苷酸探针和第二寡核苷酸探针在一级延伸产物的互补靶核苷酸序列上的相邻位置杂交形成接合部时,第二寡核苷酸探针的重叠的相同核苷酸在与第一寡核苷酸探针的接合部处形成瓣。此实施方案还包括用具有5'核酸酶活性的酶裂解第二寡核苷酸探针的重叠的相同核苷酸,由此在所述连接前释放第二寡核苷酸探针的5'端的磷酸。
在其他实施方案中,所述一个或多个寡核苷酸探针组还包含具有靶特异性部分的第三寡核苷酸探针,其中探针组的第二寡核苷酸探针和第三寡核苷酸探针被配置成在靶核苷酸序列上彼此相邻杂交,在其之间具有接合部,以允许第二寡核苷酸探针和第三寡核苷酸探针之间的连接以形成包含探针组的第一寡核苷酸探针、第二寡核苷酸探针和第三寡核苷酸探针的连接的产物序列。
在某些实施方案中,所述样品选自由以下组成的组:组织、细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物、无细胞循环核酸、无细胞循环肿瘤核酸、孕妇无细胞循环胎儿核酸、循环肿瘤细胞、肿瘤、肿瘤活组织切片和外泌体。
所述一种或多种靶核苷酸序列可以是低丰度核酸分子,所述低丰度核酸分子包含一个或多个核苷酸碱基突变、插入、缺失、易位、剪接变体、miRNA变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失、内含子插入或基因组水平上的其他重排和/或甲基化核苷酸碱基。
如本文所用,“低丰度核酸分子”是指以低至样品的1%至0.01%的水平存在的靶核酸分子。换句话说,具有一个或多个核苷酸碱基突变、插入、缺失、易位、剪接变体、miRNA变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失、内含子插入、基因组水平上的其他重排和/或甲基化核苷酸碱基的低丰度核酸分子可以与样品中的100至10,000倍过量的核酸分子(即,高丰度核酸分子)区分,所述高丰度核酸分子具有与低丰度核酸分子类似的核苷酸序列,但没有所述一个或多个核苷酸碱基突变、插入、缺失、易位、剪接变体、miRNA变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失、内含子插入、基因组水平上的其他重排和/或甲基化核苷酸碱基。
在本发明的一些实施方案中,一种或多种低丰度靶核苷酸序列的拷贝数相对于所述样品中具有与低丰度核酸分子类似的核苷酸序列的高丰度核酸分子的拷贝数定量。在本发明的其他实施方案中,相对于所述样品中的其他核苷酸序列定量所述一种或多种靶核苷酸序列。在本发明的其他实施方案中,定量一种或多种靶核苷酸序列的相对拷贝数。相对和绝对(即,拷贝数)定量的方法是本领域中众所周知的。
待检测的低丰度靶核酸分子可以存在于任何生物样品中,所述生物样品包括而不限于组织、细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物、无细胞循环核酸、无细胞循环肿瘤核酸、孕妇无细胞循环胎儿核酸、循环肿瘤细胞、肿瘤、肿瘤活组织切片和外泌体。
本发明的方法适合诊断或预后疾病状态和/或区分基因型或疾病易感性。
本申请的另一方面涉及一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。所述方法包括提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触。将所述接触的样品与ATP和Poly(A)聚合酶共混以形成Poly(A)聚合酶反应混合物,并且使所述Poly(A)聚合酶反应混合物经历适合将均聚物A附加到潜在地存在于所述样品中的所述一个或多个靶miRNA分子的3'端的条件。所述方法还包括提供一个或多个一级寡核苷酸引物组。每个引物组包含(a)第一一级寡核苷酸引物,其包含5'引物特异性部分、内部poly dT部分和包含与所述靶miRNA的3'端互补的1至10个碱基的3'部分,其中所述第一一级寡核苷酸引物与其他组中的其他第一一级寡核苷酸引物可以相同或者可以不同,和(b)第二一级寡核苷酸引物,其包含5'引物特异性部分和3'部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同。将所述Poly(A)聚合酶反应混合物、所述一个或多个一级寡核苷酸引物组、能够消化所述样品中的含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合消化存在于所述逆转录/聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子的条件,然后经历适合产生具有3’polyA尾的靶miRNA序列的互补脱氧核糖核酸(cDNA)分子的条件且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环,由此形成包含所述第二一级寡核苷酸引物的5'引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列、polydA区域和所述第一一级寡核苷酸引物的5'引物特异性部分的补体的一种或多种不同的逆转录/聚合酶链式反应产物及其补体。所述方法还包括提供一个或多个寡核苷酸探针组。每个探针组包含(a)具有5'引物特异性部分和3'靶序列特异性部分的第一寡核苷酸探针,和(b)具有5'靶序列特异性部分、与一种或多种逆转录/聚合酶链式反应产物互补的部分和3'引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交到对应于所述靶miRNA分子序列或其补体的所述一种或多种逆转录/聚合酶链式反应产物的互补部分上。使所述一种或多种逆转录/聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组接触以形成一种或多种连接反应混合物,并且使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与其补体杂交时连接在一起以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5'引物特异性部分、靶特异性部分和3'引物特异性部分。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列。将所述连接的产物序列和所述一个或多个二级寡核苷酸引物组与所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物。所述方法还包括检测和区分所述二级聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
图31示出本申请的此方面的一个实施方案。
图31示出定量miRNA的示例性RT-PCR-LDR-qPCR遗留预防反应。为了准确计数,在PCR之前等分到12、24、36或48个孔中。对于更高的拷贝数,平均分布在13个孔中,将最后一个孔平均稀释到13个额外的孔中,并且对剩余的孔重复进行。所述方法包括从外泌体中分离miRNA且用UDG处理以预防遗留(图31,步骤B)。Poly(A)尾miRNA与大肠杆菌Poly(A)聚合酶。逆转录酶延伸在5'端包含标签Di且在3'端包含T30VN序列的引物,以制备全长拷贝的靶,且将三个C碱基附加到延伸的靶序列的3'端(图31,步骤B)。具有3’rGrG+G的标签寡核苷酸(Ei)与延伸的靶序列的这三个C碱基杂交,如图31,步骤B中显示。逆转录酶经历链转换并拷贝Ei标签序列。激活Taq聚合酶,且使用标签引物(Di、Ei)进行使用dUTP的有限循环PCR扩增(12-20),以保持不同扩增子的相对比率。PCR产物并入dU,允许预防遗留(图31,步骤C)。
如图31,步骤D中显示,含有适合随后PCR扩增的引物特异性部分(Ai、Ci’)的miRNA序列特异性连接探针以碱基特异性方式与其对应靶序列杂交。在连接后,可以使用成对的匹配引物Ai和Ci以及跨越连接接合部的TaqManTM探针,如上文对于图2所述(参见图31,步骤D至步骤F)或使用本领域中已知的其他合适手段检测连接产物。
本申请的另一方面涉及一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。所述方法包括提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基,和提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶。使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触。将所述接触的样品与ATP和Poly(A)聚合酶共混以形成Poly(A)聚合酶反应混合物,并且使所述Poly(A)聚合酶反应混合物经历适合将均聚物A附加到潜在地存在于所述样品中的所述一个或多个靶miRNA分子的3'端的条件。所述方法还包括提供一个或多个一级寡核苷酸引物组。每个引物组包含(a)第一一级寡核苷酸引物,其包含5'引物特异性部分、内部poly dT部分和包含与所述靶miRNA的3'端互补的1至10个碱基的3'部分,其中所述第一一级寡核苷酸引物与其他组中的其他第一一级寡核苷酸引物可以相同或者可以不同,和(b)第二一级寡核苷酸引物,其包含5'引物特异性部分和3'部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同。将潜在地包含靶miRNA序列的Poly(A)聚合酶反应混合物与3’polyA尾、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶共混,以形成一种或多种逆转录/聚合酶链式反应混合物。使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生具有3’polyA尾的靶miRNA序列的互补脱氧核糖核酸(cDNA)分子的条件且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环,由此形成包含所述第二一级寡核苷酸引物的5'引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列、poly dA区域和所述第一一级寡核苷酸引物的5'引物特异性部分的补体的一种或多种不同的逆转录/聚合酶链式反应产物及其补体。所述方法还包括提供一个或多个二级寡核苷酸引物组。每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5'引物特异性部分和与由所述第一一级寡核苷酸引物形成的逆转录/聚合酶链式反应产物的一部分互补的3'部分,和(b)第二二级寡核苷酸引物,其具有5'引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的逆转录/聚合酶链式反应产物的一部分互补的核苷酸序列的3'部分。将所述逆转录/聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第一聚合酶链式反应混合物,并且使所述一种或多种第一聚合酶链式反应混合物经历适合包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含5'引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列和另一5'引物特异性部分的补体的第一聚合酶链式反应产物。所述方法还包括提供一个或多个三级寡核苷酸引物组。每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的5'引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的3'引物特异性部分互补的核苷酸序列。将所述第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶共混,以形成一种或多种第二聚合酶链式反应混合物。使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物。所述方法还包括检测和区分所述一个或多个反应中的第二聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
图32示出本申请的此方面的一个实施方案。
图32示出定量miRNA的示例性RT-PCR-qPCR遗留预防反应。为了准确计数,在PCR之前等分到12、24、36或48个孔中。对于更高的拷贝数,平均分布在13个孔中,将最后一个孔平均稀释到13个额外的孔中,并且对剩余的孔重复进行。所述方法包括从外泌体中分离miRNA且用UDG处理以预防遗留(图32,步骤B)。Poly(A)尾miRNA与大肠杆菌Poly(A)聚合酶。逆转录酶延伸在5'端包含标签Di且在3'端包含T30VN序列的引物,以制备全长拷贝的靶,且将三个C碱基附加到延伸的靶序列的3'端(图32,步骤B)。具有3’rGrG+G的标签寡核苷酸(Ei)与延伸的靶序列的这三个C碱基杂交,如图32,步骤B中显示。逆转录酶经历链转换并拷贝Ei标签序列。激活Taq聚合酶,且使用标签引物(Di、Ei)进行使用dUTP的有限循环PCR扩增(8-20),以保持不同扩增子的相对比率。
如图32,步骤C中显示,在有限循环PCR后,将PCR产物等分到含有跨miRNA靶区域的TaqmanTM探针、包含5'引物特异性部分(Ai)的miRNA特异性(正向)引物、包含5'引物特异性部分(Ci)的cDNA特异性(反向)引物和匹配引物Ai和Ci的单独的孔、微孔或液滴中。如果靶miRNA序列存在于样品中,则这些引物组合以扩增所述靶miRNA序列(图32,步骤C)。引物仅在与正确的靶结合时才用RNA酶H2解阻断。在PCR后,可以使用成对的匹配引物Ai和Ci以及跨越靶miRNA区域的TaqManTM探针,如上文对于图6所述(参见图32,步骤C至步骤F)或使用本领域中已知的其他合适手段检测产物。
本申请的另一方面涉及一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后细胞或组织的疾病状态的方法。所述多种标记物在包含6-12种标记物、12-24种标记物、24-36种标记物、36-48种标记物、48-72种标记物、72-96种标记物或>96种标记物的组中。给定组中的每种标记物通过具有以下标准中的任何一个或多个来选择:在>50%的来自被诊断为具有所述疾病状态的个体的疾病细胞或组织的生物样品中存在或高于截止水平;在>95%的来自没有所述疾病状态的个体的正常细胞或组织的生物样品中不存在或低于截止水平,在>50%的来自被诊断为具有所述疾病状态的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,在>95%的来自没有所述疾病状态的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;在来自被诊断为具有所述疾病状态的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。组中至少50%的标记物各自包含一个或多个甲基化残基,和/或组中至少50%的标记物在来自至少50%的被诊断为具有所述疾病状态的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。所述方法包括获得生物样品。所述生物样品包括源自细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,并且所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组。将样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理。在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤。所述方法还包括进行一种或多种测定以检测和区分多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含6-12种标记物的标记物组中最少2种或3种标记物存在或高于截止水平;或在包含12-24种标记物的标记物组中最少3、4或5种标记物存在或高于截止水平;或在包含24-36种标记物的标记物组中最少3、4、5或6种标记物存在或高于截止水平;或在包含36-48种标记物的标记物组中最少4、5、6、7或8种标记物存在或高于截止水平;或在包含48-72种标记物的标记物组中最少6、7、8、9、10、11或12种标记物存在或高于截止水平,或在包含72-96种标记物的标记物组中最少7、8、9、10、11、12或13种标记物存在或高于截止水平,或在包含96-“n”种标记物(当“n”>168种标记物时)的标记物组中最少8、9、10、11、12、13或“n”/12种标记物存在或高于截止水平,则个体被诊断或预后为具有疾病状态。
本申请的另一方面涉及一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后实体组织癌的疾病状态的方法,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌。所述多种标记物在包含总共48-72种癌症标记物、总共72-96种癌症标记物或≥总共96种癌症标记物的组中,其中在给定组中平均大于四分之一的这样的标记物覆盖所测试的上述主要癌症中的每一种。对于给定实体组织癌的给定组中的每种标记物通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:在>50%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平,在>50%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。组中至少50%的标记物各自包含一个或多个甲基化残基,和/或组中至少50%的标记物在来自至少50%的被诊断为患有给定实体组织癌的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。所述方法包括获得生物样品,所述生物样品包括源自细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组。将样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理。在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的给定实体组织癌特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤。所述方法还包括进行一种或多种测定以检测和区分所述多种癌症特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含总共48-72种癌症标记物的标记物组中最少4种标记物存在或高于截止水平;或在包含总共72-96种癌症标记物的标记物组中最少5种标记物存在或高于截止水平;或在包含总共96至“n”种癌症标记物(当“n”>总共96种癌症标记物时)的标记物组中最少6种或“n”/18种标记物存在或高于截止水平,则个体被诊断或预后为实体组织癌。
根据本申请的此方面,对于给定实体组织癌的给定组中的每种标记物可以通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:在>66%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平,在>66%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。
本申请的另一方面涉及一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后以下组中的实体组织癌的疾病状态和鉴定所述实体组织癌的一种或多种最可能的具体起源组织的方法:组1(结肠直肠腺癌、胃腺癌、食管癌);组2(乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤);组3(肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌);组4(前列腺腺癌、浸润性尿路上皮膀胱癌);和/或组5(肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌),其中所述多种标记物在包含36-48种组特异性癌症标记物、48-64种组特异性癌症标记物或≥64种组特异性癌症标记物的组中,其中在给定组中平均大于三分之一的这样的标记物覆盖所述组内的测试的前述癌症中的每一种。对于给定实体组织癌的给定组中的每种标记物通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:在>50%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平,在>50%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。组中至少50%的标记物各自包含一个或多个甲基化残基,和/或组中至少50%的标记物在来自至少50%的被诊断为患有给定实体组织癌的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。所述方法包括获得生物样品。所述生物样品包括源自细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组。将样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质。在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理。在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的给定实体组织癌特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤。所述方法还包括进行一种或多种测定以检测和区分所述多种癌症特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含36-48种组特异性癌症标记物的标记物组中最少4种标记物存在或高于截止水平;或在包含48-64种组特异性癌症标记物的标记物组中最少5种标记物存在或高于截止水平;或在包含总共64至“n”种癌症标记物(当“n”>64种组特异性癌症标记物时)的标记物组中最少6种或“n”/12种标记物存在或高于截止水平,则个体被诊断或预后为实体组织癌。
根据本申请的此方面,对于给定实体组织癌的给定组中的每种标记物可以通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:在>66%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平,在>66%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。
在一个实施方案中,所述至少两个富集步骤包括以下步骤中的两个或更多个:捕获或分离外泌体或细胞外囊泡或在其他受保护状态中的标记物;捕获或分离血小板级分;捕获或分离循环肿瘤细胞;捕获或分离含RNA复合物;捕获或分离cfDNA-核小体或差异性修饰的cfDNA-组蛋白复合物;捕获或分离蛋白质靶或蛋白质靶复合物;捕获或分离自身抗体;捕获或分离细胞因子;捕获或分离甲基化cfDNA;通过与溶液中、磁珠上或微阵列上的互补捕获探针杂交,捕获或分离标记物特异性DNA、cDNA、miRNA、lncRNA、ncRNA或mRNA或扩增的补体;使用DNA聚合酶、逆转录酶、DNA连接酶、RNA连接酶、DNA修复酶、RNA酶、RNA酶H2、核酸内切酶、限制性核酸内切酶、核酸外切酶、CRISPR、DNA糖基化酶或其组合,经由聚合酶延伸反应、聚合酶链式反应、亚硫酸氢盐甲基特异性聚合酶链式反应、逆转录反应、亚硫酸氢盐甲基特异性连接反应和/或连接反应,以线性或指数方式扩增miRNA标记物、非编码RNA标记物(lncRNA和ncRNA标记物)、mRNA标记物、外显子标记物、剪接变体标记物、易位标记物或拷贝数变异标记物;使用DNA聚合酶、逆转录酶、DNA连接酶、RNA连接酶、DNA修复酶、RNA酶、RNA酶H2、核酸内切酶、限制性核酸内切酶、核酸外切酶、CRISPR、DNA糖基化酶或其组合,经由聚合酶延伸反应、聚合酶链式反应、亚硫酸氢盐甲基特异性聚合酶链式反应、逆转录反应、亚硫酸氢盐甲基特异性连接反应和/或连接反应,以线性或指数方式选择性扩增含有突变标记物或亚硫酸氢盐转化的DNA甲基化标记物的一个或多个靶区域,同时抑制含有野生型序列或亚硫酸氢盐转化的未甲基化序列或其补体序列的靶区域的扩增;优先延伸、连接或扩增一种或多种引物或探针,所述引物或探针的3'-OH端已在酶和序列依赖性过程中释放;在靶特异性引物或探针以碱基特异性方式与野生型序列或亚硫酸氢盐转化的未甲基化序列或其补体序列杂交的所述反应期间干扰聚合酶延伸或连接的条件下,使用在3'端包含一个或多个错配碱基或在3'端包含一个或多个核苷酸类似物和阻断基团的一种或多种阻断寡核苷酸引物。
在某些实施方案中,检测和区分多种疾病特异性和/或细胞/组织特异性DNA、RNA或蛋白标记物的一种或多种测定包括以下测定中的一种或多种:定量实时PCR方法(qPCR);逆转录酶-聚合酶链式反应(RTPCR)方法;亚硫酸氢盐qPCR法;数字PCR法(dPCR);亚硫酸氢盐dPCR法;连接检测法、连接酶链式反应、限制性核酸内切酶裂解法;DNA或RNA核酸酶裂解法;微阵列杂交法;肽阵列结合法;抗体阵列法;质谱法;液相色谱-串联质谱(LC-MS/MS)法;毛细管或凝胶电泳法;化学发光法;荧光法;DNA测序法;亚硫酸氢盐转化-DNA测序法;RNA测序法;邻近连接法;邻近PCR法;包括固定抗体-靶复合物的方法;包括固定适体-靶复合物的方法;免疫测定法;包括Western印迹测定的方法;包括酶联免疫吸附测定(ELISA)的方法;包括高通量基于微阵列的酶联免疫吸附测定(ELISA)的方法;或包括高通量基于流式细胞术的酶联免疫吸附测定(ELISA)的方法。
在某些实施方案中,检测和区分多种疾病特异性和/或细胞/组织特异性DNA、RNA或蛋白标记物的一种或多种测定的一种或多种截止水平包括在比较来自疾病个体的样品相对于来自正常个体的样品的一种或多种标记物测定中的以下计算、比较或确定中的一种或多种:标记物ΔCt值>2;标记物ΔCt值>4;检测的标记物特异性信号的比率>1.5;检测的标记物特异性信号的比率>3;标记物浓度的比率>1.5;标记物浓度的比率>3;计数的标记物特异性信号相差>20%;计数的标记物特异性信号相差>50%;来自给定疾病样品的标记物特异性信号>85%、>90%、>95%、>96%、>97%或>98%的来自一组正常样品的相同标记物特异性信号;或来自给定疾病样品的标记物特异性信号与来自一组正常样品的相同标记物特异性信号相比具有>1.03、>1.28、>1.65、>1.75、>1.88或>2.05的z得分。
本申请的另一方面涉及一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后细胞或组织的疾病状态的两步法。所述方法包括获得生物样品,所述生物样品包括外泌体、肿瘤相关囊泡、在其他受保护状态内的标记物、源自细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组。对所述生物样品应用第一步骤,其中总灵敏度>80%且总特异性>90%或总Z得分>1.28,以鉴定更可能被诊断或预后为具有疾病状态的个体。然后对来自第一步骤中鉴定的那些个体的生物样品应用第二步骤,其中总特异性>95%或总Z得分>1.65,以诊断或预后具有疾病状态的个体。第一步骤和第二步骤使用本申请的方法进行。第一步骤使用标记物以覆盖许多癌症,其中目的是对早期癌症获得高灵敏度,其中血液中标记物分子的数量可能是有限的。随后第二步骤将对额外的标记物评分以验证初始结果是真阳性,以及鉴定可能的起源组织。第二步骤可以包括本文所述的方法,和/或额外的方法,诸如下一代测序。
荧光标记.考虑可以分别检测5种荧光信号F1、F2、F3、F4和F5的仪器。例如,在结肠癌的情况下,对于K-ras、p53、APC和BRAF,将发现最高频率突变。这四种基因中的突变可以用单一荧光信号:F1、F2、F3、F4检测。如果标度是1000FU,则将使用不同比率的标记的UniTaq引物和未标记的UniTaq引物添加引物,使得在这些基因的突变靶上LDR产物的扩增在平稳期产生约300FU。对于对照,将校准F5以对于1:1,000稀释的定量对照产生100FU的信号,并且对于野生型对照上突变探针的连接产生额外的300FU(将不产生背景信号或产生低背景信号)。
对于如下显示的结肠癌中通常突变的其他基因(或p53基因中甚至更低丰度的突变),可以使用以下编码系统:在相同UniTaq的5'端以等摩尔量的两种荧光信号,用未标记的引物滴定,使得两种荧光信号在平稳期为100FU。如果荧光信号是F1、F2、F3、F4,则其能够使用单一荧光信号检测4种基因中的突变,并使用荧光信号的组合检测6种基因中的突变:
基因1=F1(300FU) (p53,热点(Hot Spots))
基因2=F2(300FU) (KRAS)
基因3=F3(300FU) (APC)
基因4=F4(300FU) (BRAF)
基因5=F1(100FU),F2(100FU) (PIK3CA)
基因6=F1(100FU),F3(100FU) (FBXW7)
基因7=F1(100FU),F4(100FU) (SMAD4)
基因8=F2(100FU),F3(100FU) (p53,额外的)
基因9=F2(100FU),F4(100FU) (CTNNB1)
基因10=F3(100FU),F4(100FU) (NRAS)
假设存在第二突变,与顶部基因之一中的突变组合。因为顶部基因将总是产生更多的独立信号,这易于区分其是否与其他荧光信号重叠。例如,如果荧光信号是F1 100FU和F2 400FU,则其将对应于基因2和基因5中的突变。
如果存在来自较不常见突变的基因(基因5-基因10)的两个突变,则结果将表现为荧光信号,即F1 200FU、F2 100FU、F4 100FU的重叠或所有4种荧光信号。如果荧光信号的比率为2:1:1,则相当直接地计算出2个突变:在上述实例中,F1 200FU、F2 100FU、F4 100FU将对应于基因5和基因7中的突变。Kartalov组已经描述了用于多路复用不同颜色的类似方法(Rajagopal等,“Supercolor CodingMethods for Large-Scale Multiplexing ofBiochemical Assays,”Anal.Chem.85(16):7629-36(2013);美国专利申请公开号20140213471A1,其以引用的方式整体并入本文)。
最近,数字液滴PCR(ddPCR)已经用于提供临床样品中突变体或甲基化分子的数量的准确定量。通常,液滴中的扩增意味着至少单个靶分子存在于所述液滴中。因此,当使用超过初始靶数量的足够数量的液滴时,假设给定液滴仅具有单个靶分子。因此,常使用终点PCR来监测产物的数量。
考虑可以分别检测5种荧光信号F1、F2、F3、F4和F5的仪器。对于前四个通道,可以使用在结肠癌中常甲基化的一些基因的启动子区域中的甲基化,例如F1=VIM,F2=SEPT9,F3=CLIP4,和F4=GSG1L。最后一个通道F5将用作对照以确保给定的液滴含有适当的试剂等。再次,荧光信号的组合可以用于同时检测10个不同启动子区域的甲基化。
基因1=F1 (VIM)
基因2=F2 (SEPT9)
基因3=F3 (CLIP4
基因4=F4 (GSG1L)
基因5=F1+F2 (PP1R16B)
基因6=F1+F3 (KCNA3)
基因7=F1+F4 (GDF6)
基因8=F2+F3 (ZNF677)
基因9=F2+F4 (CCNA1)
基因10=F3+F4 (STK32B)
为了简单起见,考虑可以如何使用ddPCR来使用exPCR-ddPCR准确计数4个启动子区域的原始甲基化分子的数量(参见例如图4、图5、图6、图7、图8、图11、图12、图13、图14、图15、图18、图19、图20、图21和图22)。所述方法还使用PCR-LDR-qPCR或exPCR-LDR-qPCR起作用(参见图2、图3、图9、图10、图16和图17)。为了所述说明,考虑检测总共48个甲基化区域,单个ddPCR反应中4个启动子区域包含10,000个液滴或微孔(micro-pore)或微孔(micro-well)。对于VIM、SEPT9、CLIP4和GSG1L,分别考虑具有2、4、5和1个甲基化启动子区域分子的样品。假设用阻断引物进行的初始单侧引物延伸具有50%的效率,因此在20次循环之后,对于VIM、SEPT9、CLIP4和GSG1L,分别存在=20;40;50;和10种甲基化启动子区域延伸产物。而且,对于顶部链用阻断引物,再次,假设总体效率为50%,在10个PCR循环后,对于甲基化VIM、SEPT9、CLIP4和GSG1L,分别存在(1.5至第10次循环=57x初始延伸产物数)=1,140;2,280;2,850;和570个PCR产物拷贝。当随后将这样的产物稀释进行12个ddPCR反应时,平均来说,对于甲基化VIM、SEPT9、CLIP4和GSG1L,给定的室将分别包含95;190;237;和48个PCR产物拷贝。这是总共约570个分子,对于甲基化VIM、SEPT9、CLIP4和GSG1L的总PCR产物,将用引物扩增。如果ddPCR包含10,000个液滴或微孔,则平均来说,实际上仅1/20将包含PCR反应;给定液滴具有将彼此竞争资源的两种扩增子的机会将是约1/400,或约25个液滴将包含2种扩增子,其将仅是仅具有单扩增子的液滴总数的5%。由于存在2种不同扩增子的6种组合,平均来说,小于2%的液滴将含有两种扩增子。换句话说,包含2或3或4种颜色的少见液滴将不需要去卷积,它们可以简单地被忽略,因为与源自原始样品中的单个分子的约48个液滴相比,它们代表大约4-6个液滴。虽然从237个液滴中区分开190个液滴可能有点困难,即,用4或5个给定甲基化靶分子开始,但应当相对直接地区分95;190;和48个拷贝,对应于原始样品中的2、4和1个靶分子。
为了在单个ddPCR反应中同时区分和计数10种甲基化标记物,考虑检测总共50个甲基化区域,单个ddPCR反应中10个启动子区域包含10,000个液滴或微孔。对于VIM、SEPT9、CLIP4、GSG1L、PP1R16B、KCNA3、GDF6、ZNF677、CCNA1和STK32B,分别考虑具有2、4、5、1、0、1、3、2、0和1个甲基化启动子区域分子的样品。假设用阻断引物进行的初始单侧引物延伸具有50%的效率,因此在20次循环之后,对于VIM、SEPT9、CLIP4、GSG1L、PP1R16B、KCNA3、GDF6、ZNF677、CCNA1和STK32B,分别存在=20;40;50;10;0;10;30;20;0;和10种甲基化启动子区域延伸产物。而且,对于顶部链用阻断引物,再次,假设总体效率为50%,在6个PCR循环之后,对于甲基化VIM、SEPT9、CLIP4、GSG1L、PP1R16B、KCNA3、GDF6、ZNF677、CCNA1和STK32B,分别存在(1.5至第6次循环=11x初始延伸产物数)=220;440;550;110;0;110;330;220;0;和110个PCR产物拷贝。当随后将这样的产物稀释进行5个ddPCR反应时,平均来说,对于甲基化VIM、SEPT9、CLIP4、GSG1L、PP1R16B、KCNA3、GDF6、ZNF677、CCNA1和STK32B,给定的室将分别包含44;88;110;22;0;22;66;44;0;和22个PCR产物拷贝。这是总共约418个分子,对于甲基化VIM、SEPT9、CLIP4、GSG1L、PP1R16B、KCNA3、GDF6、ZNF677、CCNA1和STK32B的总PCR产物,将用引物扩增。如果ddPCR包含10,000个液滴或微孔,则平均来说,实际上仅1/25将包含PCR反应;给定液滴具有将彼此竞争资源的两种扩增子的机会将是约1/625,或约16个液滴将包含2种扩增子,其将仅是仅具有单扩增子的液滴总数的4%。由于存在2种不同扩增子的45种组合,平均来说,小于0.1%的液滴将含有给定的两种扩增子。换句话说,包含2或3或4种颜色的少见液滴将不需要去卷积,它们可以简单地被忽略,因为与源自原始样品中的单个分子的约22个液滴相比,它们代表大一个或两个液滴。虽然从110个液滴中区分开88个液滴可能有点困难,即,用4或5个给定甲基化靶分子开始,但应当相对直接地区分44;88;和22个拷贝,对应于原始样品中的2、4和1个靶分子。
上述方法也将用于准确地计数mRNA、miRNA、ncRNA或lncRNA靶分子。代替如图23至图32的步骤B中所述的等分样品,将样品直接用于随后的ddPCR计数。为了在单个ddPCR反应中同时区分和计数10种mRNA、ncRNA或lncRNA标记物,考虑在包含10,000个液滴或微孔的单个ddPCR反应中检测总共50个mRNA、ncRNA或lncRNA区域。再次,荧光信号的组合可以用于同时检测10种mRNA或lncRNA标记物。
基因1=F1 (mRNA1)
基因2=F2 (mRNA2)
基因3=F3 (mRNA3)
基因4=F4 (mRNA4)
基因5=F1+F2 (ncRNA5)
基因6=F1+F3 (ncRNA6)
基因7=F1+F4 (ncRNA7)
基因8=F2+F3 (ncRNA8)
基因9=F2+F4 (ncRNA9)
基因10=F3+F4 (ncRNA10)
使用图28中所示的基本上RT-PCR-PCR-qPCR实例,考虑分别具有2、4、15、1、0、10、3、20、0和1个mRNA1-4和ncRNA5-10分子的样品。六个RT-PCR循环将对于每种转录物产生64个cDNA拷贝,相当于分别产生128;256;960;64;0;640;192;1280;0;和64个mRNA1-4和ncRNA5-10拷贝。当随后将这样的产物稀释进行5个ddPCR反应时,平均来说,对于mRNA1-4和ncRNA5-10,给定的室将分别包含25;51;192;13;0;128;28;256;0;和13个PCR产物拷贝。这是总共约706个分子,对于甲基化mRNA1-4和ncRNA5-10的总PCR产物,将用引物扩增。如果ddPCR包含10,000个液滴或微孔,则平均起来,实际上仅1/14将包含PCR反应。在此实施例中的两种最常见的RNA:mRNA 3和ncRNA5平均将以1/52和1/39存在,因此给定液滴具有将彼此竞争资源的这两种扩增子的机会将是约1/2028,或约5个液滴将包含2种扩增子,在将产生13个拷贝的扩增后对于单个分子,其仍然较低。换句话说,包含2或3或4种颜色的少见液滴将不需要去卷积,它们可以简单地被忽略,因为与源自原始样品中的单个分子的至少13个液滴相比,它们代表1至5个液滴。如果一些RNA分子以较高的量存在,则仍然可以使用如前面所阐明的相同方法,用不同FU水平的不同颜色探针(即,对于具有单一颜色的产物为300FU;对于使用2种颜色的产物各自为100FU),使由给定液滴中的2种扩增子产生的多个信号去卷积。
本申请的另一方面涉及在分析血液样品内的标记物时区分处于最早期的癌症的能力。平均起来,身体包含约6升(6,000ml)的血液。10ml样品则将构成样品的1/600。虽然一些癌症(即,肺癌、黑素瘤)具有高突变载量,但其他癌症(即,乳腺癌、卵巢癌)具有很少的突变,并且处于最早期的癌症具有甚至更少的突变。相反,启动子区域中的甲基化变化(即,甲基化标记物)似乎是早期事件。出于以下计算的目的,假设如果标记物存在于样品中,则可以将其检测至单分子水平,而与用于鉴定标记物的技术无关。
在实际水平上,不同的癌症对于不同的突变标记物具有不同的频率。例如,对于结肠直肠癌和胰腺癌,基因K-ras的突变率分别是约30%和>90%。尽管发现p53在所有癌症中的约50%中突变,但通常,在晚期肿瘤中显现出这样的突变。作为基准,给定癌症在其最早期期间产生至少一个可检测突变。假设在任何给定时间,有200个突变分子在患者血浆中循环。给定总体积,如果采集10ml样品,则样品将含有至少1个突变分子的机会是约1/3。更准确的预测将基于泊松分布。如果有200个对象(即,突变的分子)分布到600个仓中(即,600个10ml等分试样,代表患者的总血量),泊松计算将指示:72%的孔将具有0个对象,23.7%的孔将具有1个对象,3.9%的孔将具有2个对象,0.4%的孔将具有3个对象,等等。换句话说,28.1%的等分试样将具有至少一个突变分子。如果测定能够检测每一个突变分子,则其灵敏度将是28.1%。同样,如果有300个对象(即,突变的分子)分布到600个仓中(即,600个10ml等分试样),则:61%的孔将具有0个对象,30.3%的孔将具有1个对象,7.6%的孔将具有2个对象,1.3%的孔将具有3个对象,等等。换句话说,39.4%的等分试样将具有至少一个突变分子。如果测定能够检测每一个突变分子,则其灵敏度为39.4%。同样,如果有400个对象(即,突变的分子)分布到600个仓中(即,600个10ml等分试样),则:51%的孔将具有0个对象,34.3%的孔将具有1个对象,11.5%的孔将具有2个对象,2.5%的孔将具有3个对象,等等。换句话说,49%的等分试样将具有至少一个突变分子。如果测定检测每一个突变分子,则其灵敏度将是49%。同样,如果有600个对象(即,突变的分子)分布到600个仓中(即,600个10ml等分试样),则泊松计算将是:36.8%的孔将具有0个对象,36.8%的孔将具有1个对象,18.3%的孔将具有2个对象,6.1%的孔将具有3个对象,等等。换句话说,63.2%的等分试样将具有至少一个突变分子。如果测定检测每一个突变分子,则其灵敏度将是63.2%。然而,在实际水平上,即使具有高达600个分子的可检测标记物载量,对于所述类型的肿瘤,测定仍将漏失的36.8%的早期癌症。最近的文献结果已经论证了什么构成“早期癌症”,一些组声称I期和II期癌症是早期癌症,而另一些组声称I期、II期和III期癌症是早期癌症,定义和类型两者都不同,但是通常当对形成突变进行评分时,报道在约20%至约70%范围的灵敏度结果,这转化为漏失30%至80%的早期癌症(Klein等,“Development of aComprehensive Cell-free DNA(cfDNA)Assay for Early Detection of Multiple TumorTypes:The Circulating Cell-free Genome Atlas(CCGA)Study,”Journal of ClinicalOncology36(15):12021-12021(2018);Liu等,“Breast Cancer Cell-free DNA(cfDNA)Profiles Reflect Underlying Tumor Biology:The Circulating Cell-free GenomeAtlas(CCGA)Study,”Journal of Clinical Oncology36(15):536-536(2018),其以引用的方式整体并入本文)。
基于即使检测单个突变也足以将患者称作阳性的假设来进行上述计算。鉴定来自患有转移性疾病的患者的血液中的突变的初始工作揭示不仅在患者中而且在年龄匹配的对照中平均5个突变(Razavi等,“Cell-free DNA(cfDNA)Mutations From ClonalHematopoiesis:Implications for Interpretation of Liquid Biopsy Tests,”Journalof Clinical Oncology 35(15):11526-11526(2017),其以引用的方式整体并入本文)。这种现象,称为克隆造血,由白细胞中突变的累积,然后经历克隆扩增引起。一旦解释了这类突变的存在(通过对来自相同个体的WBC DNA的等分试样进行测序),这些测试的准确性或特异性已被设定在98%。对于一些癌症如卵巢癌,其展现出低突变载量,估计60%的疾病在其早期阶段将被漏失。为了正确看待这些数字,美国在2018年有20,240个卵巢癌新病例。因此,应对约5500万女性(超过50岁)进行该疾病的测试。这种测试将鉴定8,096名患有卵巢癌的女性。然而,将存在约110万份假阳性。这一测试的阳性预测值将是约0.74%。换句话说,在136名测试为阳性的女性中,只有一位将实际上患有卵巢癌,其余将是假阳性。
对于本申请的多标记物测试,两种或更多种标记物需要被视为阳性,以将总体筛查结果视为阳性。通过增加所用的单种标记物的总数以及将总体筛查测试称作阳性所需的标记物的数量,可以改进检测早期癌症的灵敏度和特异性两者。总体早期癌症检测灵敏度是血液中每种标记物的平均数、标记物阳性的平均数、将样品称作阳性所需的标记物的最少数量和所评分的标记物的总数的函数。例如,如果测试使用12种平均在>50%的这种癌症类型的肿瘤中是甲基化的甲基化标记物,则对于给定样品平均约6种标记物将是甲基化的。如果血液中每种标记物平均有600个甲基化分子,则平均总共600x600=3,600个对象(即,甲基化分子)被分布到600个仓中(即,600个10ml等分试样)。作为基于泊松计算的近似计算,分布将是:0.2%的孔将具有0个对象,1.5%的孔将具有1个对象,4.5%的孔将具有2个对象,8.9%的孔将具有3个对象,13.3%的孔将具有4个对象,16.0%的孔将具有5个对象,16.0%的孔将具有6个对象,13.8%的孔将具有7个对象,10.3%的孔将具有8个对象,等等。假设至少两种标记物需要被称作阳性。在这种情况下,1.7%(=0.2%+1.5%)的具有0或1个对象(即,甲基化标记物)的等分试样将被称作阴性。因此,如果需要最少两种标记物以将样品称作阳性,则测定的灵敏度将是100%-1.7%=98.3%灵敏度。假设至少三种标记物需要被称作阳性。在这种情况下,具有0、1或2个对象(即,甲基化标记物)的等分试样将被称作阴性=0.2%+1.5%+4.5%=6.2%。因此,如果需要最少两种标记物以将样品称作阳性,则测定的灵敏度将是100%-6.2%=93.8%灵敏度。应当理解,一小部分的3种标记物为阳性的等分试样将含有2分子的一种标记物和1分子的第二标记物,因此不是含有最少三种不同的阳性标记物,然而,这与以上近似计算稍有偏差。
总体早期癌症检测特异性是阳性标记物的平均数、每一种标记物的假阳性率、将样品称作阳性所需的标记物的最少数量和所评分的标记物的总数的函数。为了估计总假阳性率,基于将不同颜色的袜子归入多个抽屉的概率来使用公式。考虑每种标记物的假阳性百分比=“%FP”;标记物的总数“m”,和将样品称作阳性所需的标记物的最少数量“n”。则用于计算总假阳性的公式将是:(%FP)n x[m!/(m-n)!n!]。假设每种标记物的假阳性百分比=“%FP”是4%;标记物的总数“m”是12,和将样品称作阳性所需的标记物的最少数量“n”是3。则上述用于总假阳性的公式将是(4%)3x[12!/9!3!]=(4%)3x[12x11x10/6]=1.4%。因此,总特异性将是[100%-1.4%]=98.6%。实际的个体假阳性率对于不同的标记物可能不同。此外,其可以取决于假阳性信号的来源。例如,如果年龄相关的甲基化归因于克隆造血,即由白细胞中甲基化的累积,然后经历克隆扩增引起。这种类型的假阳性可以通过同样对来自相同患者的白细胞中的甲基化变化进行评分来减轻。另一方面,如果假阳性信号的来源归因于由于组织炎症引起的DNA释放到血浆中,或例如由于体重增加引起的肌肉组织的分解,则减轻所述信号可能需要在身体休息时的不同时间或在炎症已经消退一个月后采集血液。
图33、图34、图35和图36分别示出对于24、36、48和96种标记物计算的总灵敏度和特异性的结果。这些曲线图基于平均单种标记物灵敏度为50%和平均单种标记物假阳性率为2%至5%的假设。灵敏度曲线提供作为血液中每种标记物的平均分子数的函数的总灵敏度,其中对于将样品称为阳性所需的标记物的每一最少数量给出单独的曲线。特异性曲线提供作为单独标记物假阳性率的函数的总特异性,再次对于将样品称为阳性所需的标记物的每一最小数量给出单独的曲线。对12、24、36、48、72和96种标记物的总灵敏度和特异性的计算数值分别提供在下表中。
表1
Figure GDA0003856873510001451
表2.
Figure GDA0003856873510001452
表3.
Figure GDA0003856873510001453
表4.
Figure GDA0003856873510001461
表5.
Figure GDA0003856873510001462
表6.
Figure GDA0003856873510001463
表7.
Figure GDA0003856873510001464
Figure GDA0003856873510001471
表8.
Figure GDA0003856873510001472
表9.
Figure GDA0003856873510001473
表10.
Figure GDA0003856873510001474
Figure GDA0003856873510001481
表11.
Figure GDA0003856873510001482
表12.
Figure GDA0003856873510001483
根据上表,接受者操作特征(ROC)曲线可以通过绘制灵敏度相对于1-特异性计算。由于这些是理论计算,因此对于2%、3%、4%和5%的不同水平的平均标记物假阳性率产生曲线。为了帮助图形可视化和计算AUC(曲线下面积),边缘分别设定为100%和0%。24种标记物的ROC曲线,3%和4%平均标记物假阳性;36种标记物的ROC曲线,3%和4%平均标记物假阳性;和48种标记物的ROC曲线,2%、3%、4%和5%平均标记物假阳性提供在下表13中并且48种标记物的ROC曲线分别示于图37和图38中。通常,AUC越接近1,则测试越精确,所述值>95%是所期望的,并且值>99%是极好的。对于早期癌症(I期和II期),使用血液中平均300个分子的基准,在24种标记物时,AUC值为95%,在36种标记物时,改进到99%,并且在48种标记物时,在98%至>99%范围内,这取决于平均标记物假阳性值。这些曲线图提供用于实现良好灵敏度和特异性的多标记物测定的能力的说明。
表13.
Figure GDA0003856873510001491
上述标记物在一步癌症测定中将如何起作用?为了说明开发早期癌症检测筛查的挑战,考虑在美国筛查10700万名超过50岁的成人的结肠直肠癌的挑战,其中每年诊断出约135,000个新病例。在此实施例中,如果对于早期癌症(I期和II期)在血液中平均有300个分子,并且采用单独标记物FP率为2%的最佳情况,然后如果存在3-标记物最少值,则对于24种标记物,总FP率为1.6%,特异性为98.4%(参见图33B)。在3种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),测试将漏失6.2%;即对于I期和II期癌症,总灵敏度将是93.8%(参见图33A),例如测试将正确地鉴定出93.8%的患病个体,其将是126,630名个体(出自135,000个新病例)。在98.4%的特异性下,对于10700万名筛查的个体,测试也将产生1.6%x107,000,000=1,712,000份假阳性。因此,阳性预测值将是126,630/(126,630+1,712,000)=约6.8%,换句话说,在测试为阳性的14名个体中仅有一名将实际上患有结肠直肠癌,其余将是假阳性。
然而,如果单独标记物FP率更现实,即4%,则将需要更多的标记物以实现高于98%的特异性,并且这将以灵敏度为代价。如果单独标记物FP率为4%,然后如果存在5-标记物最少值,则对于24种标记物,总FP率为0.4%,特异性为99.6%(参见图33B)。在5种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),测试将漏失28.5%;即对于I期和II期癌症,总灵敏度将是71.5%(参见图33A),例如测试将正确地鉴定出71.5%的患病个体,其将是90,540名个体(出自135,000个新病例)。在99.6%的特异性下,对于10700万名筛查的个体,测试也将产生0.4%x107,000,000=428,000份假阳性。因此,阳性预测值将是90,540/(90,540+428,000)=约17.5%,换句话说,在测试为阳性的5.7名个体中仅有一名将实际上患有结肠直肠癌,其余将是假阳性。17.5%的PPV是相当可观的,然而,其是以漏失28.5%的早期癌症为代价而实现的。
本申请的另一方面涉及一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后细胞或组织的疾病状态的两步法。所述方法包括获得生物样品,所述生物样品包括外泌体、肿瘤相关囊泡、在其他受保护状态内的标记物、源自细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组。对所述生物样品应用第一步骤,其中总灵敏度>80%且总特异性>85%或总Z得分>1.03,以鉴定更可能被诊断或预后为具有疾病状态的个体。对来自第一步骤中鉴定的那些个体的生物样品应用第二步骤,其中总特异性>95%或总Z得分>1.65,以诊断或预后具有疾病状态的个体。第一步骤和第二步骤使用本申请的方法进行。第一步骤使用标记物以覆盖许多癌症,其中目的是对早期癌症获得高灵敏度,其中血液中标记物分子的数量可能是有限的。随后第二步骤将对额外的标记物评分以验证初始结果是真阳性,以及鉴定可能的起源组织。第二步骤可以包括本文所述的方法,和/或额外的方法,诸如下一代测序。第一步骤使用标记物以覆盖许多癌症,其中目的是对早期癌症获得高灵敏度,其中血液中标记物分子的数量可能是有限的。随后第二步骤将对额外的标记物评分以验证初始结果是真阳性,以及鉴定可能的起源组织。第二步骤可以包括本文所述的方法,和/或额外的方法,诸如下一代测序。
为了说明可以如何设计这种两步癌症测试的一个实施方案,再次考虑鉴定患有早期结肠直肠癌的患者的挑战。在2017年,美国估计有95,520个新的结肠癌病例和39,910个诊断的直肠癌病例-总共约135,000个新病例。考虑使用24种标记物的初始测试。在此实施例中,如果对于早期癌症(I和II期)在血液中平均有300个分子,并且如果将覆盖至少一个突变,则通过下一代测序鉴定这种癌症的灵敏度将是39.4%(参见图33A)。如果单独标记物FP率为3%,然后如果存在3-标记物最少值,则对于24种标记物,总FP率为5.4%,特异性为94.6%(参见图33B)。在3种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),测试将漏失6.2%;即对于I期和II期癌症,总灵敏度将是93.8%(参见图33A)。注意,这些水平的灵敏度和特异性优于目前市场上的测试。然而,如果单独标记物FP率为5%,然后如果存在4-标记物最少值,则对于24种标记物,总FP率为6.6%,特异性为93.4%(参见图33B)。在4种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),测试将漏失15.1%;即对于I期和II期癌症,灵敏度将是84.9%(参见图33A)。这些曲线图示出大多数诊断测试的基本冲突-改进了测试的灵敏度(即假阴性较少),但是牺牲了测试特异性(即假阳性较多),或改进了测试的特异性(假阳性较少),又冒着损失测试灵敏度的风险(即假阴性较多)。
通过使用两步癌症测试,可以调整参数以改进灵敏度和特异性两者。例如,上述24种标记物测试,使用3种标记物,对于I期和II期癌症(血液中每种阳性标记物约300个分子),总灵敏度将是93.8%。在第一步骤(对GI癌症具有特异性的24种标记物)中被评为阳性(包括假阳性)的那些样品将在第二步骤中用扩展的48种标记物小组重新测试以提供结肠直肠癌的覆盖。如果单独标记物FP率为3%,然后如果存在5-标记物最少值,则对于48种标记物,总FP率为4.2%,特异性为95.8%(参见图35B)。在5种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),测试将漏失0.7%;即对于I期和2期癌症,灵敏度将是99.3%(参见图35A)。技术上,由于样品在第一步骤中已经被拣选,所以总灵敏度为93.8%x99.3%=93.1%。如果单独标记物FP率为3%,然后如果存在6-标记物最少值,则对于48种标记物,总FP率为1%,特异性为99.1%(参见图35B)。在6种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),测试将漏失1.9%;即对于I期和II期癌症,灵敏度将是98.1%(参见图35A)。由于样品在第一步骤中已经被拣选,所以总灵敏度为93.8%x98.1%=92.0%。如果单独标记物FP率为3%,然后如果存在7-标记物最少值,则对于48种标记物,总FP率为0.2%,特异性为99.8%(参见图35B)。在7种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),测试将漏失4.4%;即对于I期和II期癌症,灵敏度将是95.6%(参见图35A)。由于样品在第一步骤中已经被拣选,所以总灵敏度为93.8%x95.6%=89.7%。
回到结肠直肠癌的实例,特别是突变载量低的微卫星稳定肿瘤(MSS)的情况,对于当仅依赖NGS测序时的这些计算(假设在血液中有300个具有一个突变的分子),估计60%的早期结肠直肠癌将被漏失。再次,为了正确看待这些数字,预测美国在2018年有约135,000个新结肠直肠癌病例。在美国约10700万名个体超过50岁且应该接受结肠直肠癌测试。假设这些样品在血液中含有至少300个具有一个突变的分子,这一测试将发现54,000名男性和女性(出自135,000个新病例)患有结肠直肠癌。然而,由于测序的特异性为98%,将存在约210万份假阳性。这一测试的阳性预测值将是约2.6%,换句话说,在测试为阳性的39名个体中仅有一名将实际上患有结肠直肠癌,其余将是假阳性。相反,考虑上述两步甲基化标记物测试,其中第一步骤具有24种对GI癌症具有特异性的甲基化标记物,而第二步骤具有48种对结肠直肠癌具有特异性的甲基化标记物。在此实施例中,如上所述,计算是在预期血液中每种阳性标记物平均有300个甲基化分子的情况下进行的。假设单独标记物假阳性率为3%,并且第一步骤需要最少3种标记物为阳性,然后总特异性为94.6%,第一步骤将鉴定5,778,000名个体(出自美国总共107,000,000名超过50岁的成人),其将包括在93.8%灵敏度下约126,630名患有I期和II期结肠直肠癌的个体(出自总共135,000名个体)。然而,那5,778,000名推定为阳性的个体将在需要最少6种标记物为阳性的48种标记物的第二步骤中评价,然后两步测试将鉴定98.1%x93.8%=92.0%=124,200名患有结肠直肠癌的个体(出自135,000个新病例)。在99.1%的特异性下,第二测试也将产生5,778,000x0.9%=52,000份假阳性。这一测试的阳性预测值将是124,200/176,200=70.5%,换句话说,在3名测试为阳性的个体中有2名将实际上患有结肠直肠癌,这是格外成功的筛查,聚焦在将从随访结肠镜检查中最受益的那些患者。挽救生命的益处将具有不可计算的价值。
虽然前述讨论聚焦于甲基化标记物,其中平均灵敏度为50%,并且单独标记物假阳性在2%-5%范围内,但是存在许多其他具有不同灵敏度和特异性的癌症标记物。通常,蛋白标记物(PSA和PSMA除外)在检测早期癌症方面具有有限的临床效用,因为假阳性如此之高,导致非常低的阳性预测值。来自体液(即血浆、尿)的癌症标记物包括但不限于血浆微小RNA(miRNA);cfDNA中的突变或甲基化;具有表面癌症特异性蛋白标记物的外泌体,或内部miRNA、ncRNA、lncRNA、mRNA、DNA;针对癌抗原的循环细胞因子、循环蛋白或循环抗体;或全血中的核酸标记物(综述参见Nikolaou等,“Systematic Review of Blood DiagnosticMarkers in Colorectal Cancer,”Techniques in Coloproctology(2018),其以引用的方式整体并入本文)。已经报道了几种用于检测结肠直肠癌(或其他癌症)患者的血清或血浆中的癌症特异性miRNA的方法;这些miRNA包括但不限于:miR-1290;miR-21;miR-24;miR-320a;miR-423-5p;miR-29a;miR-125b;miR-17-3p;miR-92a;miR-19a;miR-19b;miR-15b;mir23a;miR-150;miR-223;miR-1229;miR-1246;miR-612;miR-1296;miR-933;miR-937;miR-1207;miR-31;miR-141;miR-224-3p;miR-576-5p;miR-885-5p;miR-200c;miR-203(Imaoka等,“Circulating MicroRNA-1290as a Novel Diagnostic and PrognosticBiomarker in Human Colorectal Cancer,”Ann.Oncol.27(10):1879-1886(2016);Zhang等,“Diagnostic and Prognostic Value of MicroRNA-21in Colorectal Cancer:anOriginal Study and Individual Participant Data Meta-Analysis,”CancerEpidemiol.Biomark.Prev.23(12):2783-2792(2016);Fang等,“Plasma Levels ofMicroRNA-24,MicroRNA-320a,andMicro-RNA-423-5p are Potential Biomarkers forColorectal Carcinoma,”J.Exp.Clin.Cancer Res.34:86(2015);Toiyama等,“MicroRNAsas Potential Liquid Biopsy Biomarkers in Colorectal Cancer:A SystematicReview,”Biochim.Biophys.Acta.pii:S0304-419X(18)30067-2(2018);Nagy等,“Comparison of Circulating miRNAs Expression Alterations in Matched Tissueand Plasma Samples During Colorectal Cancer Progression,”Pathol.Oncol.Res.doi:10.1007/s12253-017-0308-1(2017);Wang等,“NovelCirculating MicroRNAs Expression Profile in Colon Cancer:a Pilot Study,”Eur.J.Med.Res.22(1):51(2017);Getts等的美国专利号9,689,036;Duttagupta等的美国专利号9,708,643;Goel等的美国专利号9,868,992;Sozzi等的美国专利号9,926,603,其以引用的方式整体并入本文)。检测低丰度miRNA的额外方法描述于WO2016057832A2中,其以引用的方式整体并入本文,或使用本领域中已知的其他合适的手段。图39提供通过分析TCGA微小RNA数据集获得的基于血液的结肠癌特异性微小RNA标记物的列表,所述标记物可以存在于血液中的外泌体、肿瘤相关囊泡、Argonaute复合物或其他受保护状态中。
已经报道了用于检测结肠直肠癌(和其他癌症)患者的血清、血浆或外泌体中的癌症特异性ncRNA或lncRNA的几种方法;这些ncRNA包括但不限于:NEAT_v1;NEAT_v2;CCAT1;HOTAIR;CRNDE-h;H19;MALAT1;91H;GAS5(Wu等,“Nuclear-enriched Abundant Transcript1as a Diagnostic and Prognostic Biomarker in Colorectal Cancer,”Mol.Cancer14:191(2015);Zhao等,“Combined Identification of Long Non-Coding RNA CCAT1 andHOTAIR in Serum as an Effective Screening for Colorectal Carcinoma,”Int.J.Clin.Exp.Pathol.8(11):14131-40(2015);Liu等,“Exosomal Long Noncoding RNACRNDE-h as a Novel Serum-Based Biomarker for Diagnosis and Prognosis ofColorectal Cancer,”Oncotarget 7(51):85551-85563(2016);Slaby O,“Non-codingRNAs as Biomarkers for Colorectal Cancer Screening and Early Detection,”AdvExp Med Biol.937:153-70(2016);Gao等,“Exosomal lncRNA 91H is Associated WithPoor Development in Colorectal Cancer by Modifying HNRNPK Expression,”CancerCell Int.23;18:11(2018);Liu等,“Prognostic and Predictive Value of Long Non-Coding RNA GAS5 and MicroRNA-221in Colorectal Cancer and Their Effects onColorectal Cancer Cell Proliferation,Migration and Invasion,”CancerBiomark.22(2):283-299(2018);Hoon等的美国专利号9,410,206;Kalluri等的美国专利号9,921,223,其以引用的方式整体并入本文)。检测低丰度lncRNA、ncRNA、mRNA易位、剪接变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失和内含子插入的额外方法描述于WO2016057832A2中,其以引用的方式整体并入本文,或使用本领域中已知的其他合适手段。图40提供通过分析各种公开可得的AffymetrixExon ST CEL数据而获得的基于血液的结肠癌特异性ncRNA和lncRNA标记物的列表,将其与GENCODE注释进行比对以产生ncRNA和lncRNA转录体数据集。对这些数据集进行比较分析(各种癌症类型,连同正常组织和外周血)以产生ncRNA和lncRNA标记物列表(图40)。这类lncRNA和ncRNA可以在血液中的外泌体或其他受保护状态中富集。另外,图41提供可以在血液中的外泌体、肿瘤相关囊泡或其他受保护状态中富集的基于血液的结肠癌特异性外显子转录物的列表。
结肠直肠癌的最常见蛋白标记物基于检测来自粪便中血液的血红蛋白,并且被称为FOBT或FIT测试。这些测试的灵敏度和特异性(Sens.:Spec.)已经被报道为:OC-LightiFOB测试(也称为OC Light SFIT),由Polymedeco制造(78.6%-97.0%:88.0%-92.8%);QuickVue iFOB,由Quidel制造(91.9%:74.9%);Hemosure One-Step iFOB测试,由Hemosure,Inc.制造(54.5%:90.5%);InSure FIT,由ClinicalGenomics制造(75.0%:96.6%);Hemoccult-ICT,由Beckman Coulter制造(23.2%-81.8%:95.8%-96.9%);Cologuard-stool FIT-DNA,由Exact Sciences制造(92.3%;84.4%)。灵敏度和特异性的大范围和差异可以反映从早期癌症到晚期癌症的范围,以及方法学、收集的样品数量和临床研究规模的差异。FIT测试的截止值可以在10ug蛋白质/克粪便至300ug蛋白质/克粪便的范围内(参见Robertson等,“Recommendations on Fecal Immunochemical Testing toScreen for Colorectal Neoplasia:a Consensus Statement by the US Multi-SocietyTask Force on Colorectal Cancer,”Gastrointest.Endosc.85(1):2-21(2017),其以引用的方式整体并入本文)。
许多肿瘤相关抗原在患者体内引发免疫反应,并且这些抗原可以被鉴定为自身抗体,或间接地被鉴定为血清中增加的细胞因子。一些肿瘤抗原可以在血清内或在癌症相关外泌体或细胞外囊泡的表面上直接检测,而其他肿瘤抗原可以例如通过癌症相关外泌体或细胞外囊泡内mRNA的增加间接检测。这些癌症特异性蛋白标记物可以通过mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,并且这些标记物包括但不限于:RPH3AL;RPL36;SLP2;TP53;存活蛋白;ANAXA4;SEC61B;CCCAP;NYCO16;NMDAR;PLSCR1;HDAC5;MDM2;STOML2;SEC61-beta;IL8;TFF3;CA11-19;IGFBP2;DKK3;PKM2;DC-SIGN;DC-SIGNR;GDF-15;AREG;FasL;Flt3L;IMPDH2;MAGEA4;BAG4;IL6ST;VWF;EGFR;CD44;CEA;NSE;CA 19-9;CA 125;NMMT;PSA;胃泌素释放肽前体;DPPIV/分离酶(seprase)复合物;TFAP2A;E2F5;CLIC4;CLIC1;TPM1;TPM2;TPM3;TPM4;CTSD-30;PRDX-6;LRG1;TTR;CLU;KLKB1;C1R;KLK3;KLK2;HOXB13;GHRL2;FOXA1(Fan等,“Development of a MultiplexedTumor-Associated Autoantibody-Based Blood Test for the Detection ofColorectal Cancer,”Clin.Chim.Acta.475:157-163(2017);Xia等,“Prognostic Value,Clinicopathologic Features and Diagnostic Accuracy of Interleukin-8inColorectal Cancer:a Meta-Analysis,”PLoS One 10(4):e0123484(2015);Li等,“SerumTrefoil Factor 3as a Protein Biomarker for the Diagnosis of ColorectalCancer,”Technol.Cancer.Res.Treat.16(4):440-445(2017);Overholt等,“CA11-19:aTumor Marker for the Detection of Colorectal Cancer,”Gastrointest.Endosc.83(3):545-551(2016);Fung等,“Blood-based Protein Biomarker Panel for theDetection of Colorectal Cancer,”PLoS One 10(3):e0120425(2015);Jiang等,“TheClinical Significance of DC-SIGN and DC-SIGNR,Which are Novel MarkersExpressed in Human Colon Cancer,”PLoS One 9(12):e11474(2014);Chen等,“Development and Validation of a Panel of Five Proteins as Blood Biomarkersfor Early Detection of Colorectal Cancer,”Clin.Epidemiol.9:517-526(2017);Chen等,“Prospective Evaluation of64Serum Autoantibodies as Biomarkers for EarlyDetection of Colorectal Cancer in a True Screening Setting,”Oncotarget7(13):16420-32(2016);Rho等,“Protein and Glycomic Plasma Markers for Early Detectionof Adenoma and Colon Cancer,”Gut 67(3):473-484(2018);Wild等的美国专利号9,518,990;Chan等的美国专利号9,835,636;Man等的美国专利号9,885,718;Andy Koff等的美国专利号9,889,135;Speicher等的美国专利号9,903,870;Bajic等的美国专利号9,914,974;Choi等的美国专利号9,983,208;Scher等的美国专利号10,030,271,其以引用的方式整体并入本文)。检测低丰度mRNA易位、剪接变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失和内含子插入的额外方法描述于WO2016057832A2中,其以引用的方式整体并入本文,或使用本领域中已知的其他合适手段,图42提供通过源自结肠直肠肿瘤的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体鉴定的癌症蛋白标记物的列表,所述标记物可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或游离于血浆内鉴定。图43提供可以由结肠直肠肿瘤分泌到血液中的蛋白标记物。对各种TCGA数据集(肿瘤、正常)进行比较分析,然后进行额外的生物信息学过滤(Meinken等,“Computational Prediction of ProteinSubcellular Locations in Eukaryotes:an Experience Report,”ComputationalMolecular Biology 2(1):1-7(2012),其以引用的方式整体并入本文),其预测细胞分泌翻译的蛋白质的可能性。
结肠直肠癌中突变的分布可在公共COSMIC数据库中获得,其中20种最常见的改变基因如下:APC;TP53;KRAS;FAT4;LRP1B;PIK3CA;TGFBR2;ACVR2A;BRAF;ZFHX3;KMT2C;KMT2D;FBXW7;SMAD4;ARID1A;TRRAP;RNF43;FAT1;TCF7L2;PREX2(Forbes等,“COSMIC:Exploring the World's Knowledge of Somatic Mutations in Human Cancer,”NucleicAcids Res.43(数据库专辑):D805-811(2015),其以引用的方式整体并入本文)。然而,TCGACOADREAD突变数据集的分析表明,以下基因在结肠直肠癌原发性肿瘤中具有至少10%的突变率:APC、TP53、KRAS、TTN、SYNE1、PIK3CA、FAT4、MUC16、FBXW7、LRP1B、LRP2、DNAH5、DMD、ANK2、RYR2、FLG、HMCN1、FAT2、TCF7L2、CSMD3、USH2A、SDK1、CSMD1、COL6A3、DNAH2、SMAD4、PKHD1、FAM123B、ATM、ACVR2A、MDN1、DCHS2、ZFHX4、CUBN、CSMD2、FREM2、RYR1、TGFBR2、RYR3、SACS、DNAH10、ABCA12、BRAF、ODZ1、PCDH9、MACF1、AHNAK2。除了本文所述的方法之外,还存在几种用于富集和检测DNA或mRNA水平(例如,外泌体内的mRNA)的低丰度突变的方法,包括但不限于下一代测序、等位基因特异性PCR、ARMS、引物延伸PCR、使用阻断引物、全面COLD-PCR、快速COLD-PCR、ice-COLD-PCR、E-ice-COLD-PCR、TT-COLD-PCR等(Mauger等,“COLD-PCRTechnologies in the Area of Personalized Medicine:Methodology andApplications,”Mol.Diagn Ther.(3):269-283(2017);Sefrioui等,“Comparison of theQuantification of KRAS Mutations by Digital PCR and E-ice-COLD-PCR inCirculating-Cell-Free DNA From Metastatic Colorectal Cancer Patients,”Clin.Chim.Acta.465:1-4(2017);Platica的美国专利号9,062,350;Song等的美国专利号9,598,735,其以引用的方式整体并入本文)。检测低丰度突变的额外方法描述于WO2016057832A2中,其以引用的方式整体并入本文,或使用本领域中已知的其他合适的手段。
用于CRC检测的研究最彻底的基于血液的甲基化标记物位于SEPT9基因的启动子区域中(Church等,“Prospective Evaluation of Methylated SEPT9 in Plasma forDetection of Asymptomatic Colorectal Cancer,”Gut 63(2):317-325(2014);Lofton-Day等,“DNA Methylation Biomarkers for Blood-Based Colorectal CancerScreening,”Clinical Chemistry 54(2):414-423(2008);Potter等,“Validation of aReal-time PCR-based Qualitative Assay for the Detection of MethylatedSEPT9DNA in Human Plasma,”Clinical Chemistry 60(9):1183-1191(2014);Ravegnini等,“Simultaneous Analysis of SEPT9 Promoter Methylation Status,MicronucleiFrequency,and Folate-Related Gene Polymorphisms:The Potential for a NovelBlood-Based Colorectal Cancer Biomarker,”International Journal of MolecularSciences 16(12):28486-28497(2015);Toth等,“Detection of Methylated SEPT9 inPlasma is a Reliable Screening Method for Both Left-and Right-sided ColonCancers,”PloS One 7(9):e46000(2012);Toth等,“Detection of Methylated Septin9in Tissue and Plasma of Colorectal Patients With Neoplasia and theRelationship to the Amount of Circulating Cell-free DNA,”PloS One9(12):e115415(2014);Warren等,“Septin 9Methylated DNA is aSensitive and SpecificBlood Test for Colorectal Cancer,”BMC Medicine9:133(2011),其以引用的方式整体并入本文),且用于CRC诊断的其他潜在标记物包括在THBD、C9orf50、ZNF154、AGBL4、FLI1和TWIST1的启动子区域上的CpG位点(Lange等,“Genome-scale Discovery of DNA-methylation Biomarkers for Blood-based Detection of Colorectal Cancer,”PloSOne 7(11):e50266(2012);Margolin等,“Robust Detection of DNA Hypermethylationof ZNF154 as a Pan-Cancer Locus with in Silico Modeling for Blood-BasedDiagnostic Development,”The Journal of Molecular Diagnostics:JMD 18(2):283-298(2016);Lin等,“Clinical Relevance of Plasma DNA Methylation in ColorectalCancer Patients Identified by Using a Genome-Wide High-Resolution Array,”Ann.Surg.Oncol.22增刊3:S1419-1427(2015),其以引用的方式整体并入本文)。
SEPT9甲基化是Epi ProColon测试的基础,所述Epi proColon测试是根据表观基因组学的CRC检测测定(Lofton-Day等,“DNA Methylation Biomarkers for Blood-basedColorectal Cancer Screening,”Clinical Chemistry 54(2):414-423(2008),其以引用的方式整体并入本文)。虽然对于较小样品组的初始结果显示是有希望的,但是使用1,544份血浆样品的大规模研究对于I-III期CRC显示64%的灵敏度,和78%-82%的特异性,实际上使1,000名个体中的180至220名接受不必要的结肠镜检查(Potter等,“Validation of aReal-time PCR-base d Qualitative Assay for the Detection of Methylated SEPT9DNA in Human Plasma,”Clinical Chemistry 60(9):1183-1191(2014),其以引用的方式整体并入本文)。临床基因组学目前正在开发的基于BCA T1和IKZF1基因的甲基化的基于血液的CRC检测测试(Pedersen等,“Evaluation of an Assay for Methylated BCAT1 andIKZF1 in Plas ma for Detection of Colorectal Neoplasia,”BMC Cancer 15:654(2015),其以引用的方式整体并入本文)。对于这种双标记物测试使用2,105份血浆样品的大规模研究显示66%的总灵敏度,其中对于I期CRC的灵敏度为38%,并且显示94%的惊人特异性。Exact Sciences和合作者已经稍微改进了CRC粪便测试的灵敏度(Bosch等,“Analyt ical Sensitivity and Stability of DNA Methylation Testing in StoolSamples for Colorectal Cancer Detection,”Cell Oncol.(Dordr)35(4):309-315(2012);Hong等,“DNA Methylation Biomarkers of Stool and Blood for EarlyDetection of Colon Cancer,”Genet.Test.Mol.Biomarkers 17(5):401-406(2013);Imperiale等,“Multitarget Stool DNA Testing for Colorectal-Cancer Screening,”N.Engl.J.Med.370(14):1287-1297(2014);Xiao等,“Validation of Methylation-Sensitiv e High-resolution Melting(MS-HRM)for the Detection of Stool DNAMethylation in Colorectal Neoplasms,”Clin.Chim.Acta.431:154-163(2014);Yang等,“Diagnostic Value of Stool DNA Testing for Multiple Markers of ColorectalCancer and Advanced Adenoma:a Meta-Analysis,”Can.J.Gastroenterol.27(8):467-475(2013),其以引用的方式整体并入本文),这通过添加K-ras突变以及BMP3和ND RG4甲基化标记物实现(Lidgard等,“Clinical Performance of an Aut omated Stool DNA Assayfor Detection of Colorectal Neoplasia,”Clin.Gastroenterol.Hepatol.11(10):1313-1318(2013),其以引用的方式整体并入本文)。表观遗传变化不仅可以标记DNA(作为启动子Cp G位点的甲基化或羟基-甲基化),而且可以通过在与这些启动子结合的组蛋白上附加甲基或乙酰基来标记。这些不同的表观遗传标记可以在结肠直肠癌患者的循环核小体中检测(Rahier等,“Circulating Nucl eosomes as New Blood-based Biomarkers forDetection of Colorecta l Cancer,”Clin Epigenetics 9:53(2017),其以引用的方式整体并入本文)。基于血液的癌症特异性甲基化标记物的鉴定采用完整的TCG A Illumina450K甲基化数据集(由以下组成:原发性肿瘤,对于包括CRC的33种类型的癌症匹配的正常组织),以及来基因表达汇编(GE O)的额外甲基化数据集(原发肿瘤、正常组织、细胞系、外周血、免疫细胞)。为了鉴定CRC特异性甲基化标记物,使用这些数据集的比较统计学分析来鉴定具有以下特征的候选甲基化标记物:在CRC组织和细胞系中高度甲基化,在正常结肠中未甲基化,在外周血和免疫浸润中未甲基化,在大多数其他癌症类型中未甲基化。验证生物信息学方案,这些方法还鉴定了以前报道的在来自CRC患者的血浆中超甲基化的CpG位点(Church等,“Prospective Evaluation of Methylate d SEPT9 in Plasma forDetection of Asymptomatic Colorectal Canc er,”Gut 63(2):317-325(2014);Lofton-Day等,“DNA Methylation Biomarkers for Blood-based Colorectal CancerScreening,”Clinical Chemistry 54(2):414-423(2008);Toth等,“Detection ofMethylated SEPT9 in Plasma is a Reliable Screening Method for Both Left-an dRight-sided Colon Cancers,”PloS One 7(9):e46000(2012);Warre n等,“Septin9Methylated DNA is a Sensitive and Specific Blood Test for ColorectalCancer,”BMC Medicine 9:133(2011);Lange等,“Genome-scale Discovery of DNA-methylation Biomarkers for Blood-based Detection of Colorectal Cancer,”PloSOne 7(11):e50266(2012);Margolin等,“Robust Detection of DNA Hypermethylationof ZNF154 as a Pan-Cancer Locus with in Silico Modeling for Blood-BasedDiagnostic Development,”The Journal of Molecular Diagnost ics:JMD 18(2):283-298(2016);Lin等,“Clinical Relevance of Plas ma DNA Methylation in ColorectalCancer Patients Identified by U sing a Genome-Wide High-Resolution Array,”Ann.Surg.Oncol.22增刊3:S1419-1427(2015);Pedersen等,“Evaluation of an Assay for Methylated BCAT1 and IKZF1 in Plasma for Detection of Colore ctalNeoplasia,”BMC Cancer 15:654(2015),其以引用的方式整体并入本文)。为了确保这些甲基化位点对CRC是特异性的,并且不是年龄相关甲基化的结果(McClay等,“A Methylome-wide Study of Agi ng Using Massively Parallel Sequencing of the Methyl-CpG-enrichedGenomic Fraction From Blood in Over 700subjects,”Hum.Mol.Genet.23(5):1175-1185(2014),其以引用的方式整体并入本文),在甲基化水平和患者年龄之间计算泊松相关性。此外,这些位点的超甲基化与MSI状态没有显著相关,暗示已经鉴定了所有CRC亚型的标记物。总之,对于约10,000份组织样品,分析>40亿个数据点(数据点=每份样品的CpG甲基化百分比)以鉴定几百种CRC特异性标记物的初始列表。CpG标记物在许多类型的癌症中持续出现,并且被标记为潜在的泛肿瘤学标记物。检测低丰度5mC(或5hmC)的额外方法描述于WO2016057832A2中,其以引用的方式整体并入本文,或使用本领域中已知的其他合适的手段。图44提供作为结肠直肠癌和结肠组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、或在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定结肠直肠癌的存在。图45提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为结肠直肠癌和结肠组织特异性标记物的一级CpG位点,其可以用于自在血液内的cf DNA、或在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定结肠直肠癌的存在。
突变或甲基化状态可以给出清晰的分析截止值,即测定记录突变或CpG甲基化事件,并且假阳性是例如来自年龄相关的甲基化的生物学的结果。对于其他标记物,在患有癌症的个体的标记物水平和其匹配的正常对照之间可能存在更大的重叠,尤其是在试图鉴定处于最早期的癌症时。在这类情况下,截止值可以通过比正常值高2标准偏差的“Z得分”或者通过将假阳性率设定在任意水平,即当评价合适的一组年龄匹配的正常样品时为5%来定义。通常,年龄匹配的正常组应当足够大以将来自给定疾病样品的标记物特异性信号的截止值设定为>85%、>90%、>95%、>96%、>97%或>98%的来自正常样品组的相同标记物特异性信号。“Z得分”可以使用下式计算:Z=(X-μ)/σ;其中Z=Z得分,X=数据集中的每个值,μ=数据集中的所有值的平均值,且σ=样品的标准偏差。同样,当使用Z得分时,来自给定疾病样品的标记物特异性信号的截止值可设定为与来自正常样品组的相同标记物特异性信号相比>1.03、>1.28、>1.65、>1.75、>1.88或>2.05。在一些测定中,标记物水平(即血浆中几个基因启动子区域的DNA甲基化水平,或尿中的miRNA水平)是相对于qPCR反应中内部或外部添加的另一种标记物进行量化的,其中截止值被确定为测定中的ΔCt值(Fackler等,“Novel Methylated Biomarkers and aRobust Assay to DetectCirculating Tumor DNA in Metastatic Breast Cancer,”Cancer Res.74(8):2160-70(2014);Sukumar等的美国专利号9,416,404,其以引用的方式整体并入本文)。在确定的启动子区域的甲基化状态也可以使用数字亚硫酸氢盐基因组测序和数字MethyLight测定;使用亚硫酸氢盐转化和通过干扰转化的未甲基化序列的扩增的阻断引物而优先扩增转化的甲基化序列;或使用甲基敏感性限制性核酸内切酶消耗未甲基化DNA,然后进行PCR来确定(参见Laird等的美国专利号9,290,803;Frumkin等的美国专利号9,476,100;McEvoy等的美国专利号9,765,397;Tabori等的美国专利号9,896,732;Kottwitz等的美国专利号9,957,575,其以引用的方式整体并入本文)。
cfDNA的全基因组甲基化谱(称为甲基化组)可以使用下一代测序来确定,并且甲基化模式可以用于鉴定血浆中胎儿、肿瘤或其他组织DNA的存在(Sun等,“Plasma DNATissue Mapping by Genome-wide Methylation Sequencing for NoninvasivePrenatal,Cancer,and Transplantation Assessments,”Proc.Natl.Acad.Sci.U S A112(40):E5503-12(2015);Lehmann-Werman等,“Identification of Tissue-specific CellDeath Using Methylation Patterns of Circulating DNA,”Proc.Natl.Acad.Sci.U S A113(13):E1826-34(2016);Lo等的美国专利号9,732,390;Zhang等的美国专利号9,984,201,其以引用的方式整体并入本文)。
上述两步筛查测定灵敏度和特异性基于进行产生宽网以最大化灵敏度的初始筛查(用少量标记物),然后对初始推定为阳性的样品进行第二测试(用更多的标记物)计算,但第二测试不仅保持灵敏度,而且实现高特异性以获得可观的阳性预测值。虽然结肠直肠癌是更常见的癌症,而其他癌症较少见,因此实现良好的阳性预测值对于避免不必要的随访诊断工序是关键的。这些初始计算(在图33至图37中)聚焦于甲基化标记物,其中平均灵敏度为50%,并且单独标记物假阳性在2%-5%范围内,并且血液中的平均分子数设定为300个分子。作为这些初始计算的基准,突变标记物将给出40%的总灵敏度。为了探索组合甲基化标记物与可能在这两个值上都不同的其他标记物的影响,进行了额外的计算,重点是潜在地鉴定最早(即I期)癌症,其中血液中分子的平均数量可以低至150个分子。进行四种类型的计算:(A)平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中一种标记物(即蛋白标记物)的灵敏度为90%但假阳性为10%;(B)平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中一种标记物的灵敏度为80%但假阳性为15%;(C)平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中两种标记物各自的灵敏度为90%,但各自的假阳性为10%;和(D)平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中两种标记物各自的灵敏度为80%,但各自的假阳性为15%。
图47至图48示出使用条件(A)和(C)对于24种标记物计算的总灵敏度和特异性的结果。灵敏度曲线提供作为血液中每种标记物的平均分子数的函数的总灵敏度,其中对于将样品称为阳性所需的标记物的每一最少数量给出单独的曲线。特异性曲线提供作为单独标记物假阳性率的函数的总特异性,再次对于将样品称为阳性所需的标记物的每一最小数量给出单独的曲线。使用上述4种条件对于24种标记物计算的总灵敏度和特异性的数值提供在下表中。
表14.
Figure GDA0003856873510001651
表15.
Figure GDA0003856873510001661
表16.
Figure GDA0003856873510001662
表17.
Figure GDA0003856873510001663
表18.
Figure GDA0003856873510001664
Figure GDA0003856873510001671
表19.
Figure GDA0003856873510001672
表20.
Figure GDA0003856873510001673
表21.
Figure GDA0003856873510001674
在评价将蛋白质(或其他标记物)与甲基化标记物组合的优点(如果有的话)之前,对原始的24种标记物的组进行分析,其中平均单独标记物灵敏度为50%,并且假阳性率为2%-5%。在此实施例中,如果对于最早癌症(I期)在血液中平均有150个分子,并且如果将覆盖至少一个突变,则通过下一代测序鉴定这一癌症的灵敏度将是22.1%(参见图33A)。如果单独标记物FP率为3%,然后如果存在3-标记物最少值,则对于24种标记物,总FP率为5.4%,特异性为94.6%(参见图33B)。在3种标记物时,对于I期癌症(血液中每种阳性标记物约150个分子),测试将漏失42.3%;即对于I期癌症,总灵敏度将是57.7%(参见图33A)。然而,如果单独标记物FP率为5%,然后如果存在4-标记物最少值,则对于24种标记物,总FP率为6.6%,特异性为93.4%(参见图33B)。在4种标记物时,对于I期癌症(血液中每种阳性标记物约150个分子),测试将漏失64.7%;即对于I期癌症,灵敏度将是35.3%(参见图33A)。虽然特异性是合理的,限制了将需要在测定的第二步骤中再测试的样品的数量,但所述测定将漏失三分之二的最早癌症。
将上述数值与图46中的曲线图(即条件(A))进行比较,其中平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中一种标记物(即蛋白标记物)的灵敏度为90%但假阳性为10%。虽然使用24种标记物中仅3种为阳性的标记物提供88.2%的灵敏度,即使单独标记物的FP率为2%,特异性也将是91.9%,如果FP率为3%,则总特异性下降到81.8%。这是具有10%的高FP率的单一标记物的负面影响。使用24种标记物中4种为阳性的标记物提供68.9%的灵敏度,这仍然优于57.7%的原始数值,但是现在特异性改进到97.1%,其中单独标记物FP率为3%。
对于条件(B),平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中一种标记物的灵敏度为80%但假阳性为15%。在这些条件下,对于24种标记物中3种为阳性的标记物的特异性将是87.9%,因此将很可能不被使用。使用24种标记物中4种为阳性的标记物提供65.1%的灵敏度,这仍然优于57.7%的原始数值,但是现在特异性改进到95.7%,其中单独标记物FP率为3%。
存在具有更高灵敏度(以及更高FP率)的两种标记物,将会怎样?对于条件(C),平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中两种标记物各自的灵敏度为80%,但各自的假阳性为10%,参见图47中的曲线图。在这些条件下,对于24种标记物中3种为阳性的标记物的特异性将低于80%,因此将不被使用。使用24种标记物中4种为阳性的标记物提供71.9%的灵敏度,这仍然优于57.7%的原始数值,但是现在特异性为95.7%,其中单独标记物FP率为2%。如果单独标记物FP率升高到3%,则总特异性降到90.4%。
对于条件(D),平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中两种标记物各自的灵敏度为80%,但各自的假阳性为15%。在这些条件下,对于24种标记物中3种为阳性的标记物的特异性将低于80%,因此将不被使用。使用24种标记物中4种为阳性的标记物提供71.1%的灵敏度,这仍然优于57.7%的原始数值,但是现在特异性为90.4%,其中单独标记物FP率为2%。如果单独标记物FP率升高到3%,然后将需要5种标记物,并且同时总特异性将升高到97.4%,则灵敏度将降到46.1%,这比57.7%的原始数值更差。
因此,根据上述4种条件(A-D)的分析,条件(C)对于检测I期癌症提供总灵敏度的最佳改进(71.9%),同时对于初始24种标记物筛查仍然保持合理的总特异性(95.7%),现在应当包括两种具有更高灵敏度(90%)的标记物,但这些标记物中的每一种具有10%的更差FP率。
使用上述4种条件中的两种对于36种标记物计算的总灵敏度和特异性两者的数值提供在下表中:(A)平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中一种标记物(即蛋白标记物)的灵敏度为90%但假阳性为10%;和(C)平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中两种标记物各自的灵敏度为90%,但各自的假阳性为10%。灵敏度曲线提供作为血液中每种标记物的平均分子数的函数的总灵敏度,其中对于将样品称为阳性所需的标记物的每一最少数量给出单独的曲线。特异性曲线提供作为单独标记物假阳性率的函数的总特异性,再次对于将样品称为阳性所需的标记物的每一最小数量给出单独的曲线。使用上述两种条件对于36种标记物计算的总灵敏度和特异性的数值提供在下表中。
表22.
Figure GDA0003856873510001701
表23.
Figure GDA0003856873510001702
表24.
Figure GDA0003856873510001703
Figure GDA0003856873510001711
表25.
Figure GDA0003856873510001712
对于将蛋白质(或其他标记物)与甲基化标记物组合有哪些优点,对原始的36种标记物的组进行分析,其中平均单独标记物灵敏度为50%,并且假阳性率为2%-5%?在此实施例中,如果对于最早癌症(I期)在血液中平均有150个分子,并且如果将覆盖至少一个突变,则通过下一代测序鉴定这一癌症的灵敏度将是22.1%(参见图34A)。如果单独标记物FP率为2%,然后如果存在3-标记物最少值,则对于36种标记物,总FP率为5.7%,特异性为94.3%(参见图34B)。在3种标记物时,对于I期癌症(血液中每种阳性标记物约150个分子),测试将漏失17.4%;即对于I期癌症,总灵敏度将是82.6%(参见图34A)。然而,如果单独标记物FP率为3%,然后如果存在4-标记物最少值,则对于36种标记物,总FP率为4.8%,特异性为95.2%(参见图34B)。在4种标记物时,对于I期癌症(血液中每种阳性标记物约150个分子),测试将漏失34.1%;即对于I期癌症,灵敏度将是65.8%(参见图34A)。虽然特异性是合理的,限制了将需要在测定的第二步骤中再测试的样品的数量,但所述测定将漏失三分之一的最早癌症。
将上述数值与条件(A)的结果进行比较,其中平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中一种标记物(即蛋白标记物)的灵敏度为90%但假阳性为10%。使用36种标记物中仅4种为阳性的标记物提供89.2%的灵敏度,并且在单独标记物的FP率为2%时,特异性将是95.3%。如果FP率为3%,这将需要使用36种标记物中5种为阳性的标记物以提供73.9%的灵敏度,这仍然优于65.8%的原始数值,但是现在特异性改进到96.9%,其中单独标记物FP率为3%。
对于条件(C),平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中两种标记物各自的灵敏度为90%,但各自的假阳性为10%。在这些条件下,使用36种标记物中5种为阳性的标记物提供76.3%的灵敏度,这仍然优于65.8%的原始数值,但是现在特异性为97.0%,其中单独标记物FP率为2%。如果单独标记物FP率升高到3%,则总特异性降到89.8%。
因此,根据上述条件(A、C)的分析,条件(C)对于检测I期癌症提供总灵敏度的最佳改进(76.3%),同时对于初始36种标记物筛查仍然保持合理的总特异性(97.0%),现在应当包括两种具有更高灵敏度(90%)的标记物,但这些标记物中的每一种具有10%的更差FP率。
图49至图50示出使用上述2种条件对于48种标记物计算的总灵敏度和特异性的结果:(A)平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中一种标记物(即蛋白标记物)的灵敏度为90%但假阳性为10%;和(C)平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中两种标记物各自的灵敏度为90%,但各自的假阳性为10%。灵敏度曲线提供作为血液中每种标记物的平均分子数的函数的总灵敏度,其中对于将样品称为阳性所需的标记物的每一最少数量给出单独的曲线。特异性曲线提供作为单独标记物假阳性率的函数的总特异性,再次对于将样品称为阳性所需的标记物的每一最小数量给出单独的曲线。使用上述两种条件对于48种标记物计算的总灵敏度和特异性的数值提供在下表中。
表26.
Figure GDA0003856873510001731
表27.
Figure GDA0003856873510001732
表28.
Figure GDA0003856873510001733
表29.
Figure GDA0003856873510001741
对于将蛋白质(或其他标记物)与甲基化标记物组合有哪些优点,对原始的48种标记物的组进行分析,其中平均单独标记物灵敏度为50%,并且假阳性率为2%-5%?在此实施例中,如果对于最早癌症(I期)在血液中平均有150个分子,并且如果将覆盖至少一个突变,则通过下一代测序鉴定这一癌症的灵敏度将是22.1%(参见图35A)。如果单独标记物FP率为2%,然后如果存在4-标记物最少值,则对于48种标记物,总FP率为3.1%,特异性为96.9%(参见图35B)。在4种标记物时,对于I期癌症(血液中每种阳性标记物约150个分子),测试将漏失15.1%;即对于I期癌症,总灵敏度将是84.9%(参见图35A)。然而,如果单独标记物FP率为3%,然后如果存在5-标记物最少值,则对于48种标记物,总FP率为4.2%,特异性为95.8%(参见图35B)。在最少5种标记物时,对于I期癌症(血液中每种阳性标记物约150个分子),测试将漏失28.4%;即对于I期癌症,灵敏度将是71.6%(参见图35A)。虽然特异性是合理的,限制了将需要在测定的第二步骤中再测试的样品的数量,但所述测定将漏失四分之一多一点的最早癌症。
将上述数值与图48中的曲线图(即条件(A))进行比较,其中平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中一种标记物(即蛋白标记物)的灵敏度为90%但假阳性为10%。使用48种标记物中仅5种为阳性的标记物提供93.3%的灵敏度,并且在单独标记物的FP率为2%时,特异性将是97.3%。如果FP率为3%,这将需要使用48种标记物中6种为阳性的标记物以提供84.2%的灵敏度,这仍然优于71.6%的原始数值,但是现在特异性改进到97.0%,其中单独标记物FP率为3%。
对于条件(C),平均单独标记物的灵敏度为50%且假阳性为2%-5%,其中两种标记物各自的灵敏度为80%,但各自的假阳性为10%,参见图49中的曲线图。在这些条件下,使用48种标记物中5种为阳性的标记物提供90.9%的灵敏度,这仍然优于71.6%的原始数值,但是现在特异性为97.0%,其中单独标记物FP率为2%。如果FP率为3%,这将需要使用48种标记物中6种为阳性的标记物以提供81.0%的灵敏度,这仍然优于71.6%的原始数值,但是现在特异性变为95.5%,其中单独标记物FP率为3%。
根据以上图表,接受者操作特征(ROC)曲线可以通过绘制灵敏度相对于1-特异性计算。由于这些是理论计算,因此对于2%、3%、4%和5%的不同水平的平均标记物假阳性率产生曲线。对于以下的ROC曲线计算AUC(曲线下面积):24种标记物,其中平均单独标记物的灵敏度为50%,FP为2%-3%,且一种标记物的灵敏度为90%,FP为10%;24种标记物,其中平均单独标记物的灵敏度为50%,FP为2%-3%,且两种标记物的灵敏度为90%,FP为10%;36种标记物,其中平均单独标记物的灵敏度为50%,FP为2%-3%,且一种标记物的灵敏度为90%,FP为10%;36种标记物,其中平均单独标记物的灵敏度为50%,FP为2%-3%,且两种标记物的灵敏度为90%,FP为10%;48种标记物,其中平均单独标记物的灵敏度为50%,FP为2%-3%,且一种标记物的灵敏度为90%,FP为10%;以及48种标记物,其中平均单独标记物的灵敏度为50%,FP为2%-3%,且两种标记物的灵敏度为90%,FP为10%;并且提供在下表中。对于最早癌症(I期),使用血液中平均150个分子的基准,并且仅观察3%单独标记物FP率,对于24种标记物(平均单独标记物的灵敏度为50%),AUC值为77%,对于24种标记物(平均单独标记物的灵敏度为50%,并且一种标记物的灵敏度为90%,FP为10%),改进到91%,但是对于24种标记物(平均单独标记物的灵敏度为50%,并且两种标记物的灵敏度为90%,FP为10%),降低到83%;对于36种标记物(平均单独标记物的灵敏度为50%),AUC值为87%,对于36种标记物(平均单独标记物的灵敏度为50%,并且一种标记物的灵敏度为90%,FP为10%),改进到91%,但是对于36种标记物(平均单独标记物的灵敏度为50%,并且两种标记物的灵敏度为90%,FP为10%),降低到85%;并且对于48种标记物(平均单独标记物的灵敏度为50%),AUC值为89%,对于48种标记物(平均单独标记物的灵敏度为50%,并且一种标记物的灵敏度为90%,FP为10%),改进到91%,并且对于48种标记物(平均单独标记物的灵敏度为50%,并且两种标记物的灵敏度为90%,FP为10%),略微改进到92%。这些结果说明,对于多标记物测定,通过具有高于平均的灵敏度(即90%)的单一标记物,甚至以更高假阳性率(即10%)为代价,有助于对于最早癌症实现良好灵敏度和特异性。在测定的第一步骤中使标记物的数量从24种增加到36种以及增加到48种对灵敏度没有大益处,但是标记物的增加确实改进了特异性,这对于限制经历测试的第二步骤的样品的数量是重要的。
表30.
Figure GDA0003856873510001761
表31.
Figure GDA0003856873510001762
Figure GDA0003856873510001771
虽然上述计算基于增加一种或两种标记物的灵敏度,但是单独标记物的平均灵敏度从50%增加到66%,将会怎样呢?图51至图53分别示出对于24、36和48种标记物计算的总灵敏度和特异性的结果。这些曲线图基于平均单种标记物灵敏度为66%和平均单种标记物假阳性率为2%至5%的假设。灵敏度曲线提供作为血液中每种标记物的平均分子数的函数的总灵敏度,其中对于将样品称为阳性所需的标记物的每一最少数量给出单独的曲线。特异性曲线提供作为单独标记物假阳性率的函数的总特异性,再次对于将样品称为阳性所需的标记物的每一最小数量给出单独的曲线。对于24、36和48种标记物计算的总灵敏度和特异性的数值分别提供在下表中,其中平均单独标记物灵敏度为50%(如前所述)或66%。
表32.
Figure GDA0003856873510001772
表33.
Figure GDA0003856873510001773
Figure GDA0003856873510001781
表34.
Figure GDA0003856873510001782
表35.
Figure GDA0003856873510001783
表36.
Figure GDA0003856873510001784
Figure GDA0003856873510001791
表37.
Figure GDA0003856873510001792
表38.
Figure GDA0003856873510001793
表39.
Figure GDA0003856873510001794
Figure GDA0003856873510001801
表40.
Figure GDA0003856873510001802
上表和图51至图53以及图33至图35允许在平均单独标记物灵敏度从50%改进到66%时直接比较灵敏度的总体改进。在此实施例中,如果对于最早癌症(I期),在血液中平均有150个分子,并且如果将覆盖至少一个突变,则通过下一代测序鉴定这一癌症的灵敏度将是22.1%(参见上述图中的任一个)。对于24种标记物,在最少3种标记物为阳性和3%FP率的情况下,对于检测I期癌症,当平均单独标记物灵敏度从50%改进到66%时,总灵敏度从57.7%改进到76.2%(血液中每种阳性标记物有约150个分子,参见图33A和图51A,橙色线)。如果单独标记物FP率为3%,然后如果存在3-标记物最少值,则对于24种标记物,总FP率为5.4%,特异性为94.6%(参见图33B或图51B)。然而,如果单独标记物FP率为5%,然后如果存在4-标记物最少值,则对于24种标记物,总FP率为6.6%,特异性为93.4%(参见图33B)。在4种标记物时,对于I期癌症(血液中每种阳性标记物有约150个分子),当平均单独标记物灵敏度从50%改进到66%时,总灵敏度从35.3%改进到56.7%(参见图33A和图50A)。对于36种标记物,在最少3种标记物为阳性和2%FP率的情况下,对于检测I期癌症,当平均单独标记物灵敏度从50%改进到66%时,总灵敏度从82.6%改进到93.8%(血液中每种阳性标记物有约150个分子,参见图34A和图52A)。如果单独标记物FP率为2%,然后如果存在3-标记物最少值,则对于36种标记物,总FP率为5.7%,特异性为94.3%(参见图34B或图52B)。然而,如果单独标记物FP率为3%,然后测定需要4-标记物最少值,则对于36种标记物,总FP率为4.8%,特异性为95.2%(参见图34B)。在4种标记物时,对于I期癌症(血液中每种阳性标记物有约150个分子),当平均单独标记物灵敏度从50%改进到66%时,总灵敏度从65.8%改进到84.9%(参见图34A和图51A)。对于48种标记物,在最少4种标记物为阳性和2%FP率的情况下,对于检测I期癌症,当平均单独标记物灵敏度从50%改进到66%时,总灵敏度从84.9%改进到95.8%(血液中每种阳性标记物有约150个分子,参见图35A和图52A)。如果单独标记物FP率为2%,然后如果存在4-标记物最少值,则对于48种标记物,总FP率为3.1%,特异性为96.9%(参见图35B或图52B)。然而,如果单独标记物FP率为3%,然后测定需要5-标记物最少值,则对于48种标记物,总FP率为4.2%,特异性为95.8%(参见图35B)。在5种标记物时,对于I期癌症(血液中每种阳性标记物有约150个分子),当平均单独标记物灵敏度从50%改进到66%时,总灵敏度从71.6%改进到90.0%(参见图35A和图52A)。
根据以上图表,接受者操作特征(ROC)曲线可以通过绘制灵敏度相对于1-特异性计算。由于这些是理论计算,因此对于2%、3%、4%和5%的不同水平的平均标记物假阳性率产生曲线。对于以下的ROC曲线计算的AUC值提供在下表中:24种标记物,平均单独标记物的灵敏度为66%,FP为2%-3%;36种标记物,平均单独标记物的灵敏度为66%,FP为2%-3%;和48种标记,平均单独标记物的灵敏度为66%,FP为2%-3%。对于最早癌症(I期),使用血液中平均150个分子的基准,并且仅观察3%单独标记物FP率,对于24种标记物(平均单独标记物的灵敏度为50%),AUC值为77%,对于24种标记物(平均单独标记物的灵敏度为66%),改进到87%;对于36种标记物(平均单独标记物的灵敏度为50%),AUC值为87%,对于36种标记物(平均单独标记物的灵敏度为66%),改进到95%;并且对于48种标记物(平均单独标记物的灵敏度为50%),AUC值为89%,对于48种标记物(平均单独标记物的灵敏度为66%),改进到97%。这些结果说明,对于多标记物测定,当平均单独标记物灵敏度从50%改进到66%时,有助于对于最早癌症实现良好灵敏度和特异性。
表41.
Figure GDA0003856873510001821
使平均单独标记物灵敏度从50%灵敏度增加到66%灵敏度将如何改进一步癌症测定?综述:挑战是筛查美国10700万名超过50岁的成人的结肠直肠癌,其中每年诊断出约135,000个新病例。在此实施例中,如果对于早期癌症(I期和II期)在血液中平均有300个分子,并且采用单独标记物FP率为2%的最佳情况,然后如果存在3-标记物最少值,则对于24种标记物,总FP率为1.6%,特异性为98.4%(参见图33B或图50B)。在3种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),对于50%的平均标记物灵敏度,测试将漏失6.2%;即对于I期和II期癌症,总灵敏度将是93.8%(参见图33A),例如测试将正确地鉴定出93.8%的患病个体,其将是126,630名个体(出自135,000个新病例)。在98.4%的特异性下,对于10700万名筛查的个体,测试也将产生1.6%x107,000,000=1,712,000份假阳性。因此,阳性预测值将是126,630/(126,630+1,712,000)=约6.8%,换句话说,在测试为阳性的14名个体中仅有一名将实际上患有结肠直肠癌,其余将是假阳性。在3种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),对于66%的平均标记物灵敏度,测试将漏失1.4%;即对于I期和II期癌症,总灵敏度将是98.6%(参见图50A),例如测试将正确地鉴定出98.6%的患病个体,其将是133,110名个体(出自135,000个新病例)。在98.4%的特异性下,对于10700万名筛查的个体,测试也将产生1.6%x107,000,000=1,712,000份假阳性。因此,阳性预测值将是133,110/(133,110+1,712,000)=约7.2%,换句话说,在测试为阳性的14名个体中仅有一名将实际上患有结肠直肠癌,其余将是假阳性。因此,如果FP低,即2%,则从50%的平均标记物灵敏度变为66%的平均标记物灵敏度具有边际效益。
然而,如果单独标记物FP率更现实,即4%,则将需要更多的标记物以实现高于98%的特异性,并且这将以灵敏度为代价。如果单独标记物FP率为4%,然后如果存在5-标记物最少值,则对于24种标记物,总FP率为0.4%,特异性为99.6%(参见图33B)。在5种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),在50%的平均标记物灵敏度下,测试将漏失28.5%;即对于I期和II期癌症,总灵敏度将是71.5%(参见图33A),例如测试将正确地鉴定出71.5%的患病个体,其将是90,540名个体(出自135,000个新病例)。在99.6%的特异性下,对于10700万名筛查的个体,测试也将产生0.4%x107,000,000=428,000份假阳性。因此,阳性预测值将是90,540/(90,540+428,000)=约17.5%,换句话说,在测试为阳性的5.7名个体中有一名将实际上患有结肠直肠癌,其余将是假阳性。17.5%的PPV是相当可观的,然而,其是以漏失28.5%的早期癌症为代价而实现的。在3种标记物时,对于I期和II期癌症(血液中每种阳性标记物约300个分子),对于66%的平均标记物灵敏度,测试将漏失10.0%;即对于I期和II期癌症,总灵敏度将是90.0%(参见图50A),例如测试将正确地鉴定出90.0%的患病个体,其将是121,500名个体(出自135,000个新病例)。在99.6%的特异性下,对于10700万名筛查的个体,测试也将产生0.4%x107,000,000=428,000份假阳性。因此,阳性预测值将是121,500/(121,500+428,000)=约22.1%,换句话说,在测试为阳性的4.5名个体中有一名将实际上患有结肠直肠癌,其余将是假阳性。22.1%的PPV是优异的,并且此外,其将是以漏失仅10%的早期癌症为代价而实现的。因此,如果FP更现实,即4%,则从50%的平均标记物灵敏度变为66%的平均标记物灵敏度具有显著效益。
回到结肠直肠癌的实例,特别是突变载量低的微卫星稳定肿瘤(MSS)的情况,对于当仅依赖NGS测序时的这些计算(假设在血液中有150个具有一个突变的分子),估计78%的早期结肠直肠癌将被漏失。再次,为了正确看待这些数字,美国在2018年诊断出约135,000个新结肠直肠癌病例,其中约60%是晚期癌症(即III和IV期)。在美国约10700万名个体超过50岁且应该接受结肠直肠癌测试。虽然不能预测有多少个体患有隐匿的癌症(即I期),这些个体不顺从测试,但是为了所述计算的目的,假设平均晚期癌症是平均早期癌症的一倍,因此患有I期癌症的个体将是约40,500名个体。假设这些样品在血液中含有至少150个具有一个突变的分子,这一测试将发现8,910名患有结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。然而,由于测序的特异性为98%,将存在约210万份假阳性。这一测试的阳性预测值将是约0.4%,换句话说,在测试为阳性的236名个体中仅有一名将实际上患有I期结肠直肠癌,其余将是假阳性。相反,考虑上述两步甲基化标记物测试,其中第一步骤具有24种对GI癌症具有特异性的甲基化标记物,而第二步骤具有48种对结肠直肠癌具有特异性的甲基化标记物。在此实施例中,平均单独标记物灵敏度被设定为66%。在此实施例中,如上所述,计算是在预期血液中每种阳性标记物平均有150个甲基化分子的情况下进行的。假设单独标记物假阳性率为3%,并且第一步骤需要最少3种标记物为阳性,然后总特异性为94.6%,第一步骤将鉴定5,778,000名个体(出自美国总共107,000,000名超过50岁的成人),其将包括76.2%灵敏度或约30,861名患有I期结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。然而,那5,778,000名推定为阳性的个体将在需要最少5种标记物为阳性的48种标记物的第二步骤中评价,然后两步测试将鉴定76.2%x90.0%=68.6%=27,775名患有结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。在95.8%的特异性下,第二测试也将产生5,778,000x4.2%=242,676份假阳性。这一测试的阳性预测值将是27,775/270,451=10.3%,换句话说,在10名测试为阳性的个体中有1名将实际上患有I期结肠直肠癌,这是格外成功的筛查,聚焦在将从随访结肠镜检查中最受益的那些患者。由于超过90%的被鉴定为I期结肠癌的个体在刚刚手术后具有长期存活,挽救生命的益处将具有不可计算的价值。
如果两步测定中的初始测试使用36种标记物,则上述数值将如何改变?在此实施例中,如上所述,计算是在预期血液中每种阳性标记物平均有150个甲基化分子的情况下进行的。假设单独标记物假阳性率为3%,并且第一步骤需要最少4种标记物为阳性,然后总特异性为95.2%,第一步骤将鉴定5,136,000名个体(出自美国总共107,000,000名超过50岁的成人),其将包括84.9%灵敏度或约34,385名患有I期结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。然而,那5,136,000名推定为阳性的个体将在需要最少5种标记物为阳性的48种标记物的第二步骤中评价,然后两步测试将鉴定84.9%x90.0%=76.4%=30,946名患有结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。在95.8%的特异性下,第二测试也将产生5,136,000x4.2%=215,712份假阳性。这一测试的阳性预测值将是30,946/246,658=12.5%,换句话说,在测试为阳性的8名个体中有1名将实际上患有I期结肠直肠癌。实际上,还需要包括成功地鉴定2期和更晚期癌症。在扩展此实施例时,计算是在如下预期下进行的:I期CRC在血液中每种阳性标记物平均有150个甲基化分子,II期CRC每种阳性标记物平均有200个甲基化分子,并且更晚期(III和IV)每种阳性标记物至少平均有300个甲基化分子,以及更晚期。而且,为了与这样的想法一致,即当重复使用测试时,将检测到更多早期CRC和更少晚期CRC,则美国每年鉴定出估计40,500名患有I期癌症的个体、40,500名患有II期癌症的个体以及剩余54,000名患有晚期癌症的个体=总共135,000名患有结肠直肠癌的个体。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出95.8%,其中在第二步骤中将验证95.8%x98.0%=93.9%=38,023名患有II期癌症的个体。对于III和IV期癌症,在第一步骤中将鉴定出99.8%,其中将鉴定出99.8%x(100%)=53,892名患有晚期癌症的个体。这使得从135,000名结肠直肠癌个体中总共鉴定出30,946+38,023+53,892=122,861名个体。总之,这一测试的阳性预测值将是122,861/369,519=33.2%,换句话说,测试为阳性的3名个体中有1名将实际上患有结肠直肠癌,并且所述测试将鉴定68,969/81,000或85%的那些患有早期癌症的个体—这在检测早期癌症的诊断方法中将是空前的。
最终目标是开发高通量的可扩展测试以检测全世界出现的大多数癌症。实体瘤癌症已经被分组为以下亚类,如以下表42、表43和表44中对于两种性别、对于男性和对于女性所列。
表42
Figure GDA0003856873510001861
Figure GDA0003856873510001871
表43
Figure GDA0003856873510001872
Figure GDA0003856873510001881
表44
Figure GDA0003856873510001882
上述列表不包括液体癌症,也不包括一些较不常见的实体瘤。液体肿瘤的全世界发病率(数值以千计)包括非霍奇金淋巴瘤(225)、白血病(187)、多发性骨髓瘤(70)和霍奇金淋巴瘤(33)。这些将在本文没有讨论的单独测试中检测。此外,所述列表排除黑素瘤(287)和脑瘤(134)。对这些的测试将用如上对于结肠直肠癌所述优化的单独标记物组进行。另外,虽然上表中列出的一些癌症具有极端的医学重要性(例如,间皮瘤、甲状腺癌和三种不同亚类的肾癌),但它们的生物学完全不同,以致通常应该用单独的一组标记物,同样如上文对于结肠直肠癌所述进行优化。
因此,对于本申请,开发了泛肿瘤学测试,其将包括根据以下分组的以下主要癌症:组1(结肠直肠癌、胃癌和食管癌);组2(乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌);组3(肺癌和头颈癌);组4(前列腺癌和膀胱癌);和组5(肝癌、胰腺癌或胆囊癌)。注意,组3内的一些癌症可以作为痰样品进行测试,并且组4中的癌症可以作为尿样进行测试。
对TCGA甲基化数据库的仔细分析揭示在这5个单独组内的癌症之中甲基化模式的一般共性。此外,存在一些甲基化标记物,它们在几种癌症之中是常见的,而在正常白细胞中不存在。使用以下策略来设计多步泛肿瘤学测试。
第一步骤是鉴定覆盖上述组中的一个或多个中的多种癌症的标记物。所述标记物应充分多样化以覆盖所有5组中的癌症。例如,测定的第一步骤使用一组96种标记物,平均包括至少36种具有50%灵敏度的标记物,覆盖上述16种类型的实体瘤中的每一种(覆盖在5组中;参见图1E;对于66%灵敏度,参见图1C)。如果至少5种标记物是阳性的,则测定将移至第二步骤,所述第二步骤将用于验证初始结果并鉴定最可能的起源组织。在大多数情况下,超过5种标记物将是阳性的,并且然后这些甲基化标记物的分布模式将指导在第二步骤中测试哪些组的选择。测定的第二步骤将平均测试2组或更多组的组特异性标记物。例如,测定的第二步骤将使用2组或更多组的64种组特异性标记物,平均包括至少36种具有50%灵敏度的标记物,覆盖可能存在于所述组中的上述类型的实体瘤中的每一种(66%灵敏度,参见图1D)。通过对阳性的标记物评分并与测试组内每种癌症类型的预测阳性进行比较,医师可以鉴定最可能的起源组织,并随后将患者送至适当的成像。
TCGA数据库的精密评价揭示泛肿瘤学标记物满足用于一组96种标记物的标准,所述标记物平均包括至少36种具有50%灵敏度的标记物,覆盖上述16种类型的实体瘤中的每一种。这些泛肿瘤标记物包括但不限于癌症特异性微小RNA标记物、癌症特异性ncRNA和lncRNA标记物、癌症特异性外显子转录物、肿瘤相关抗原、癌症蛋白标记物、可以由实体瘤分泌到血液中的蛋白标记物、常见突变、作为实体瘤和组织特异性标记物的一级CpG位点、其中有作为实体瘤和组织特异性标记物的一级CpG位点的染色体区域或亚区域以及作为实体瘤和组织特异性标记物的一级和侧翼CpG位点。检测所述标记物的方法已在上文讨论,并且这些标记物列于下文和附图中。
通过分析TCGA微小RNA数据集获得的基于血液的实体瘤特异性微小RNA标记物包括但不限于以下标记物:(mir ID,基因ID):hsa-mir-21,MIR21;hsa-mir-182,MIR182;hsa-mir-454,MIR454;hsa-mir-96,MIR96;hsa-mir-183,MIR183;hsa-mir-549,MIR549;hsa-mir-301a,MIR301A;hsa-mir-548f-1,MIR548F1;hsa-mir-301b,MIR301B;hsa-mir-103-1,MIR1031;hsa-mir-18a,MIR18A;hsa-mir-147b,MIR147B;hsa-mir-4326,MIR4326;和hsa-mir-573,MIR573。这些标记物可以存在于血液中的外泌体、肿瘤相关囊泡、Argonaute复合物或其他受保护状态中。
图53提供通过分析各种公开可得的Affymetrix Exon ST CEL数据而获得的基于血液的实体瘤特异性ncRNA和lncRNA标记物的列表,将其与GENCODE注释进行比对以产生ncRNA和lncRNA转录体数据集。对这些数据集进行比较分析(各种癌症类型,连同正常组织和外周血)以产生ncRNA和lncRNA标记物列表。这类lncRNA和ncRNA可以在血液中的外泌体或其他受保护状态中富集。
另外,图54提供可以在血液中的外泌体、肿瘤相关囊泡或其他受保护状态中富集的基于血液的实体瘤特异性外显子转录物的列表。过表达的癌基因转录物或突变癌基因的转录物可以在外泌体中富集,因为它们可以驱动癌症的扩散。
图55提供癌症蛋白标记物的列表,所述癌症蛋白标记物通过源自实体瘤的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
可以由实体瘤分泌到血液中的蛋白标记物包括但不限于:(蛋白质名称,UniProtID);未表征的蛋白质C19orf48,Q6RUI8;蛋白质FAM72B,Q86X60;蛋白质FAM72D,Q6L9T8;羟酰谷胱甘肽水解酶样蛋白,Q6PII5;假定甲基转移酶NSUN5,Q96P11;含RNA假尿苷酸合酶结构域的蛋白1,Q9UJJ7;含胶原蛋白三螺旋重复蛋白1,Q96CG8;白细胞介素11,P20809;溶基质素2,P09238;基质金属蛋白酶9,P14780;Podocan样蛋白1,Q6PEZ8;假定肽YY-2,Q9NRI6;骨桥蛋白,P10451;巯基氧化酶2,Q6ZRP7;磷脂酰肌醇蛋白聚糖-2,Q8N158;巨噬细胞移动抑制因子,P14174;肽基-脯氨酰基顺反异构酶A,P62937;钙网蛋白,P27797。对各种TCGA数据集(肿瘤、正常)进行比较分析,然后进行额外的生物信息学过滤(Meinken等,“Computational Prediction of Protein Subcellular Locations in Eukaryotes:anExperience Report,”Computational Molecular Biology2(1):1-7(2012),其以引用的方式整体并入本文),其预测细胞分泌翻译的蛋白质的可能性。
实体瘤中突变的分布可在公共COSMIC数据库中获得,其中实体瘤中常见改变的基因如下所列:TP53(肿瘤蛋白p53)、TTN(肌联蛋白)、MUC16(粘蛋白16)和KRAS(Ki-ras2Kirsten大鼠肉瘤病毒癌基因同源物)。
对甲基化标记物的TCGA数据库的深度分析显示三种类别的集群,所述甲基化标记物在血液中不存在,但平均以50%的灵敏度存在于实体瘤类型中:(i)在结肠直肠癌和相关GI癌(胃癌和食管癌)中存在的标记物,(ii)在结肠直肠癌和相关GI癌(胃癌和食管癌)以及其他肿瘤中存在的标记物,和(iii)在结肠直肠癌中大部分不存在但在其他肿瘤中存在的标记物。其次,虽然对于一些肿瘤类型,可以容易地鉴定对于所述组如组2(乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌)独特的标记,但是对于其他肿瘤类型如肺癌或胰腺癌,难以鉴定对于所述癌症独特的甲基化标记物。因此,为了组装一组96种标记物,其满足至少36种具有50%灵敏度的标记物覆盖上述16种类型的实体瘤中的每一种的标准,前48种标记物由在组2肿瘤中强烈呈现的约12种标记物、在组3肿瘤中强烈呈现的约12种标记物、在组4肿瘤中强烈呈现的约12种标记物和在组5肿瘤中强烈呈现的约12种标记物组成。剩余的48种标记物由在组1和组2肿瘤中强烈呈现的约12种标记物、在组1和组3肿瘤中强烈呈现的约12种标记物、在组1和组4肿瘤中强烈呈现的约12种标记物和在组1和组5肿瘤中强烈呈现的约12种标记物。
图56提供作为实体瘤和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定实体瘤的存在。图57提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为实体瘤和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定实体瘤的存在。这些列表含有优选的一级CpG位点及其侧翼位点,以及低至无-CRC的替代标记物,和高至CRC的替代标记物,其中有或没有对其他癌症同样高的标记物。示例性优选和替代的甲基化标记物的引物组列于实验部分中的表46中。
实验部分中的表47提供96-标记物测定的模拟,平均灵敏度为50%,对于两种性别鉴定最可能的起源组织组。如上组装一组96种标记物,并评估TCGA和GEO数据库中每个癌症患者内阳性样品的百分比。所分析的每种癌症的患者总数为:组1(结肠直肠癌,CRC-PT=395;胃癌,ST-Pt=260;食管癌,ES-Pt=185);组2(乳腺癌,BR-Pt=668;子宫内膜癌,END-Pt=431;卵巢癌,OV-Pt=79;宫颈癌,CERV-Pt=307;子宫癌,UTCS-Pt=57);组3(肺腺癌,LUAD=450;肺鳞状细胞癌,LUSC=372;头颈癌,HNSC-Pt=528);组4(前列腺癌,PROS-Pt=192;膀胱癌,BLAD-Pt=412);和组5(肝癌,LIV-Pt=377;胰腺癌,PANC-Pt=184;和胆囊癌,BILE-Pt=36)。各列反映对每种标记物为阳性的患者的总百分比除以所用的标记物的总数,对于所有癌症的第一行,将是96种标记物。因此,平均起来,在选择的96种标记物中,平均灵敏度得分的数值是:组1(结肠直肠癌=44,胃癌=45,食管癌=40);组2(乳腺癌=38,子宫内膜癌=40,卵巢癌=22,宫颈癌=39,子宫癌=33);组3(肺腺癌=31,肺鳞状细胞癌=31,头颈癌=33);组4(前列腺癌=45,膀胱癌=36);和组5(肝癌=38,胰腺癌=27,胆囊癌=47)。这转化为在50%平均灵敏度下的以下标记物当量数(=96x得分/50);(结肠直肠癌=85标记物当量;胃癌=86标记物当量;食管癌=78标记物当量);组2(乳腺癌=74标记物当量;子宫内膜癌=76标记物当量;卵巢癌=42标记物当量;宫颈癌=75标记物当量;子宫癌=64标记物当量);组3(肺腺癌=60标记物当量;肺鳞状细胞癌=59标记物当量;头颈癌=64标记物当量);组4(前列腺癌=86标记物当量;膀胱癌=70标记物当量);和组5(肝癌=74标记物当量;胰腺癌=51标记物当量;胆囊癌=91标记物当量)。因此,癌症被很好地呈现,对于不同癌症类型,标记物当量范围为42至91,并且所有都远高于在50%平均灵敏度下的36种标记物的最小值。
上述数值转化为在66%平均灵敏度下的以下标记物当量数(=96x得分/66);(结肠直肠癌=65标记物当量;胃癌=65标记物当量;食管癌=59标记物当量);组2(乳腺癌=56标记物当量;子宫内膜癌=58标记物当量;卵巢癌=32标记物当量;宫颈癌=57标记物当量;子宫癌=48标记物当量);组3(肺腺癌=45标记物当量;肺鳞状细胞癌=45标记物当量;头颈癌=48标记物当量);组4(前列腺癌=65标记物当量;膀胱癌=53标记物当量);和组5(肝癌=56标记物当量;胰腺癌=39标记物当量;胆囊癌=69标记物当量)。因此,癌症被很好地呈现,对于不同癌症类型,标记物当量范围为32至69,并且除了对于卵巢癌的标记物当量为32之外,其他癌症类型高于在66%平均灵敏度下的36种标记物的最小值。
然后对于上述癌症类型中的每一种对上述标记物进行重新排序,从而首先列出最普遍的标记物。例如,对于CRC,在96种标记物中,54种标记物给出高于55的得分(即在395名患者中超过55%为阳性),并且9种标记物给出25至54的得分(即在395名患者中25%至54%为阳性)。对于总共30种标记物,将较高组的一半和较低组的三分之一分布到两种标记物测试组中,命名为“CRC1”和“CRC2”(表47,第2行和第3行)。如果在测定中检测到一半标记物具有阳性潜力,则这些标记物组将反映理想的结果。这没有考虑早期肿瘤在血浆中将有机会具有较低数量的标记物分子,因此,在所述模拟中,阳性标记物的实际数量将小于理想结果。记录每种癌症阳性的患者的百分比,然后除以用于所述癌症类型的标记物的总数。如所预期,当对于给定肿瘤类型选择标记物时,与未选择的96种标记物的得分44相比,那些标记物应当给出比平均值高的得分,即两组选择的30种标记物中的每一种对于CRC的得分为66。这些标记物形成表47中的对角线,并以粗体和浅灰色背景突出显示。
对于每一列,在相同范围内或高于对所述癌症类型为阳性的标记物的数量的标记物组也以浅灰色背景显示。例如,患有结肠直肠癌、胃癌或食管癌的患者将被评分为胃癌潜在阳性。这与对于这三种癌症重叠的标记物(即,它们都属于组1)一样有意义。在测定的步骤2中,它们可以在组1标记物上被区分,其中这些标记物更具癌症类型特异性,并且梳理出最可能的癌症类型。ST-Pt列的评价显示,对两种LUAD中的一种、BLAD和两种PANC的模拟也给出可以解释为胃癌的得分。因此,第一步骤并不总是能够准确指出在测定的第二步骤中应该测试哪些组。然而,大多数模糊性在组成员(即组2)内,并且这是有意义的,因为选择标记物以最大化选择哪些组将在第二步骤中进行测试的能力。
表48和表49(参见预言性实验部分)采用表47中的模拟中的前述结果,并将其乘以给定癌症类型对于那种性别的百分比发病率(分别参见表37和表38),并将结果调整至相同的数量级(乘以10)。所述概念是医师考虑对于低发病率癌症(诸如肺鳞状细胞癌)的较高得分,高发病率癌症(诸如CRC)的较低得分可能是更常见的起源组织。表48和表49显示在鉴定起源组织方面的模糊性水平在女性患者中比在男性患者中高,如由以灰色突出的不在对角线上的细胞数量所指示。在所有情况下,医师将需要并入所有数据如吸烟史,而不是仅并入分子数据,以在将患者送去确认成像之前确定最可能的起源组织。
表50、表51和表52(参见预言性实验部分)采用表47、表48和表49中的模拟中的前述结果,并通过采用(=具体癌症类型模拟的得分/对于所述类型所有癌症的得分-1)的百分比来确定与中性结果的百分比偏差。因此,这些表中的每一个的第一行应当是0%。同样,高于对角线上的百分比或在与对角线上的百分比相同的范围内的那些百分比以浅灰色突出显示。尽管这组标记物选择对于区分作为起源组织的食管癌或胆囊癌可能不太理想,但它们仍然能提供相当多的信息以指导医师哪些组应该在步骤2测定中测试。这种简单的评分可以通过使用AI方法基于使用前述96-标记物组用临床样品得到的结果的数据库来加强。
对于测定的第二步骤,将测试以下组中的一个、两个或更多个,每组具有一组64种标记物,平均包括至少36种具有50%灵敏度的标记物,覆盖以下组中的上述16种类型的实体瘤中的每一种:组1(结肠直肠癌、胃癌和食管癌);组2(乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌);组3(肺癌和头颈癌);组4(前列腺癌和膀胱癌);和组5(肝癌、胰腺癌或胆囊癌)。这些组特异性和癌症类型特异性标记物包括但不限于癌症特异性微小RNA标记物、癌症特异性ncRNA和lncRNA标记物、癌症特异性外显子转录物、肿瘤相关抗原、癌症蛋白标记物、可以由实体瘤分泌到血液中的蛋白标记物、常见突变、作为实体瘤和组织特异性标记物的一级CpG位点、其中有作为实体瘤和组织特异性标记物的一级CpG位点的染色体区域或亚区域以及作为实体瘤和组织特异性标记物的一级和侧翼CpG位点。检测所述标记物的方法已在上文讨论,并且这些标记物的列表对于以下各组以及在对应的图中描述。
组1(结肠直肠癌、胃癌和食管癌):可以用于区分组1与其他组的基于血液的结肠直肠癌、胃癌和食管癌特异性微小RNA标记物包括但不限于:(mir ID,基因ID):hsa-mir-624,MIR624。所述miRNA通过分析TCGA微小RNA数据集鉴定,并且可以存在于血液中的外泌体、肿瘤相关囊泡、Argonaute复合物或其他受保护状态中。
可以用于区分组1与其他组的基于血液的结肠直肠癌、胃癌和食管癌特异性ncRNA和lncRNA标记物包括但不限于:[基因ID,坐标(GRCh38)]:ENSEMBL ID:LINC01558,chr6:167784537-167796859,ENSG00000146521.8。所述ncRNA通过比较分析各种公开可得的Affymetrix Exon ST CEL数据来鉴定,将其与GENCODE注释进行比对以产生ncRNA和lncRNA转录体数据集。这类lncRNA和ncRNA可以在血液中的外泌体或其他受保护状态中富集。
另外,图58提供可以在血液中的外泌体、肿瘤相关囊泡或其他受保护状态中富集的基于血液的结肠直肠癌、胃癌和食管癌特异性外显子转录物的列表。
可以用于区分组1与其他组的结肠直肠癌、胃癌和食管癌蛋白编码标记物包括但不限于:(基因符号,染色体带,基因标题,UniProt ID):SELE,1q22-q25,选择素E,P16581;OTUD4,4q31.21,含OTU结构域4,Q01804;BPI,20q11.23,杀菌/通透性增强蛋白,P17213;ASB4,7q21-q22,含锚蛋白重复和SOCS盒4,Q9Y574;C6orf123,6q27,染色体6开放阅读框123,Q9Y6Z2;KPNA3,13q14.3,核转运蛋白α3(输入蛋白α4),O00505;NUP98、11p15、核孔蛋白98kDa、P52948,通过源自结肠直肠癌、胃癌和食管癌的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
可以由结肠直肠癌、胃癌和食管癌分泌到血液中并且可以用于区分1组与其他组的蛋白标记物包括但不限于:(蛋白质名称,UniProt ID);杀菌通透性增强蛋白(BPI)(CAP57),P1721。对各种TCGA数据集(肿瘤、正常)进行比较分析,然后进行额外的生物信息学过滤(Meinken等,“Computational Prediction of Protein Subcellular Locations inEukaryotes:an Experience Report,”Computational Molecular Biology2(1):1-7(2012),其以引用的方式整体并入本文),其预测细胞分泌翻译的蛋白质的可能性。
结肠直肠癌、胃癌和食管癌中突变的分布可在公共COSMIC数据库中获得,其中最常见的是:APC(WNT信号传导通路的APC调节因子)、ATM(ATM丝氨酸/苏氨酸激酶)、CSMD1(CUB和Sushi多结构域1)、DNAH11(动力蛋白丝轴重链11)、DST(肌张力异常蛋白(dystonin))、EP400(E1A结合蛋白p400)、FAT3(FAT非典型钙粘蛋白3)、FAT4(FAT非典型钙粘蛋白4)、FLG(丝聚蛋白)、GLI3(GLI家族锌指3)、KRAS(Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物)、LRP1B(LDL受体相关蛋白1B)、MUC16(粘蛋白16,细胞表面相关)、OBSCN(遮蔽蛋白,细胞骨架钙调蛋白和肌联蛋白相互作用RhoGEF)、PCLO(piccolo突触前细胞基质蛋白)、PIK3CA(磷脂酰肌醇-4,5-双磷酸3-激酶催化亚基α)、RYR2(兰尼碱受体2)、SYNE1(含血影蛋白重复的核包膜蛋白1)、TP53(肿瘤蛋白p53)、TTN(肌联蛋白)和UNC13C(unc-13同源物C)。
图59提供作为结肠直肠癌、胃癌和食管癌和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定结肠直肠癌、胃癌和食管癌的存在。图60提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为结肠直肠癌、胃癌或食管癌和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定结肠直肠癌、胃癌或食管癌的存在。这些列表含有优选的一级CpG位点及其侧翼位点,以及在CRC中高的替代标记物,和低至无-CRC但在胃癌和/或食管癌中高的替代标记物。示例性优选和替代的甲基化标记物的引物组列于实验部分中的表53中。选择64种平均灵敏度为50%的这些标记物对组1给出以下得分:(结肠直肠癌=48,胃癌=51,食管癌=43),其将转化为在50%平均灵敏度下的以下标记物当量数(=64x得分/50);(结肠直肠癌=62标记物当量;胃癌=65标记物当量;食管癌=55标记物当量)并且因此全部都远高于平均36-标记物当量最小值。在66%平均灵敏度下的标记物当量给出以下得分(=64x得分/66);(结肠直肠癌=47标记物当量;胃癌=50标记物当量;食管癌=42标记物当量)。因此,全部都远高于平均36-标记物当量最小值。
组2(乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌):可以用于区分组2与其他组的基于血液的乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌特异性微小RNA标记物包括但不限于:(mir ID,基因ID):hsa-mir-1265,MIR1265。所述标记物通过分析TCGA微小RNA数据集鉴定,其可以存在于血液中的外泌体、肿瘤相关囊泡、Argonaute复合物或其他受保护状态中。
可以用于区分组2与其他组的基于血液的乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌特异性外显子转录物包括但不限于:(mir ID,基因ID):hsa-mir-1265,MIR1265。所述标记物通过分析TCGA微小RNA数据集鉴定,其可以存在于血液中的外泌体、肿瘤相关囊泡、Argonaute复合物或其他受保护状态中。
可以用于区分组2与其他组的乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌蛋白标记物包括但不限于:(基因符号,染色体带,基因标题,UniProt ID):RSPO2,8q23.1,R-脊椎蛋白2,Q6UXX9;KLC4,6p21.1,驱动蛋白轻链4,Q9NSK0;GLRX,5q14,谷氧还蛋白(巯基转移酶),P35754。这些标记物可以通过源自乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
可以由乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌分泌到血液中,可以用于区分2组与其他组的蛋白标记物包括但不限于:(蛋白质名称,UniProt ID);R-脊椎蛋白2(顶板特异性脊椎蛋白2)(hRspo2),Q6UXX9。对各种TCGA数据集(肿瘤、正常)进行比较分析,然后进行额外的生物信息学过滤(Meinken等,2012,如上所述),其预测细胞分泌翻译的蛋白质的可能性。
乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌中突变的分布可在公共COSMIC数据库中获得,其中最常见的是:PIK3CA(磷脂酰肌醇-4,5-双磷酸3-激酶催化亚基α)和TTN(肌联蛋白)。
图61提供作为乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌的存在。图62提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌的存在。这些列表含有优选的一级CpG位点及其侧翼位点,以及可以用于区分乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌的替代标记物。示例性优选和替代的甲基化标记物的引物组列于实验部分中的表54中。选择64种平均灵敏度为50%的这些标记物对组2给出以下得分:(乳腺癌=36,子宫内膜癌=49,卵巢癌=32,宫颈癌=33,子宫癌=47),其将转化为在50%平均灵敏度下的以下标记物当量数(=64x得分/50);(乳腺癌=47标记物当量;子宫内膜癌=63标记物当量;卵巢癌=41标记物当量;宫颈癌=42标记物当量;子宫癌=61标记物当量)。因此,全部都远高于平均36-标记物当量最小值。在66%平均灵敏度下的标记物当量给出以下得分(=64x得分/66);(乳腺癌=35标记物当量;子宫内膜癌=48标记物当量;卵巢癌=31标记物当量;宫颈癌=32标记物当量;子宫癌=46标记物当量)。因此,三种标记物低于平均36-标记物当量最小值,而两种标记物高于平均36-标记物当量最小值。然而,这类得分可以通过选择不同标记物改进。
组3(肺腺癌、肺鳞状细胞癌和头颈癌):可以用于区分组3与其他组的基于血液的肺癌、头颈癌特异性微小RNA标记物包括但不限于:(mir ID,基因ID):hsa-mir-28,MIR28。所述标记物通过分析TCGA微小RNA数据集鉴定,并且可以存在于血液中的外泌体、肿瘤相关囊泡、Argonaute复合物或其他受保护状态中。
可以用于区分组3与其他组的基于血液的肺癌、头颈癌特异性外显子转录物包括但不限于:(外显子位置,基因);chr2:chr1:93307721-93309752:-,FAM69A;chr1:93312740-93312916:-,FAM69A;chr1:93316405-93316512:-,FAM69A;chr1:93341853-93342152:-,FAM69A;chr1:93426933-93427079:-,FAM69A;chr7:40221554-40221627:+,C7orf10;chr7:40234539-40234659:+,C7orf10;chr8:22265823-22266009:+,SLC39A14;chr8:22272293-22272415:+,SLC39A14;chr14:39509936-39510091:-,SEC23A;chr14:39511990-39512076:-,SEC23A,并且可以在血液中的外泌体、肿瘤相关囊泡或其他保护状态中富集。
可以用于区分组3与其他组的肺癌、头颈癌蛋白编码标记物包括但不限于:(基因符号,染色体带,基因标题,UniProt ID):STRN3,14q13-q21,纹状体,钙调蛋白结合蛋白3,Q13033;LRRC17,7q22.1,含富含亮氨酸重复17,Q8N6Y2;FAM69A,1p22,序列相似性家族69,成员A,Q5T7M9;ATF2,2q32,激活转录因子2,P15336;BHMT,5q14.1,甜菜碱--高半胱氨酸S-甲基转移酶,Q93088;ODZ3/TENM3,4q34.3-q35.1,tenenurin跨膜蛋白3,Q9P273;ZFHX4,8q21.11,锌指同源盒4,Q86UP3。这些标记物可以通过源自肺癌、头颈癌的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
可以由肺癌、头颈癌分泌到血液中,可以用于区分组3与其他组的蛋白标记物包括但不限于:(蛋白质名称,UniProt ID);含富含亮氨酸重复蛋白17(p37NB),Q8N6Y2。对各种TCGA数据集(肿瘤、正常)进行比较分析,然后进行额外的生物信息学过滤(Meinken等,“Computational Prediction of Protein Subcellular Locations in Eukaryotes:anExperience Report,”Computational Molecular Biology2(1):1-7(2012),其以引用的方式整体并入本文),其预测细胞分泌翻译的蛋白质的可能性。
肺癌、头颈癌中突变的分布可在公共COSMIC数据库中获得,其中常见的是:CSMD3(CUB和Sushi多结构域3)、DNAH5(动力蛋白丝轴重链5)、FAT1(FAT非典型钙粘蛋白1)、FLG(丝聚蛋白)、KRAS(Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物)、LRP1B(LDL受体相关蛋白1B)、MUC16(粘蛋白16,细胞表面相关)、PCLO(piccolo突触前细胞基质蛋白)、PKHD1L1(PKHD1样1)、RELN(络丝蛋白(reelin))、RYR2(兰尼碱受体2)、SI(蔗糖酶-异麦芽糖酶)、SYNE1(含血影蛋白重复的核包膜蛋白1)、TP53(肿瘤蛋白p53)、TTN(肌联蛋白)、USH2A(usherin)和XIRP2(含xin肌动蛋白结合重复2)。
图63提供作为肺癌、头颈癌和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定肺癌、头颈癌的存在。图64提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为肺癌、头颈癌和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定肺癌、头颈癌的存在。这些列表含有优选的一级CpG位点及其侧翼位点,所述位点可以用于区分肺癌、头颈癌。示例性甲基化标记物的引物组列于实验部分中的表55中。选择64种平均灵敏度为50%的这些标记物对组3给出以下得分:(肺腺癌=41,肺鳞状细胞癌=49,头颈癌=53),其将转化为在50%平均灵敏度下的以下标记物当量数(=64x得分/50);(肺腺癌=52标记物当量;肺鳞状细胞癌=62标记物当量;头颈癌=67标记物当量)。因此,全部都远高于平均36-标记物当量最小值。在66%平均灵敏度下的标记物当量给出以下得分(=64x得分/66);(肺腺癌=40标记物当量;肺鳞状细胞癌=47标记物当量;头颈癌=51标记物当量)。因此,全部都远高于平均36-标记物当量最小值。
组4(前列腺癌和膀胱癌):可以用于区分组4与其他组的基于血液的前列腺癌和膀胱癌特异性微小RNA标记物包括但不限于:(mir ID,基因ID):hsa-mir-491,MIR491;hsa-mir-1468,MIR1468。这些标记物通过分析TCGA微小RNA数据集鉴定,并且可以存在于血液或尿中的外泌体、肿瘤相关囊泡、Argonaute复合物或其他受保护状态中。
可以用于区分组4与其他组的基于血液或尿的前列腺癌和膀胱癌特异性ncRNA和lncRNA标记物包括但不限于:[基因ID,坐标(GRCh38),ENSEMBL ID]:AC007383.3,chr2:206084605-206086564,ENSG00000227946.1;LINC00324,chr17:8220642-8224043,ENSG00000178977.3。这些标记物通过比较分析各种公开可得的Affymetrix Exon ST CEL数据来鉴定,将其与GENCODE注释进行比对以产生ncRNA和lncRNA转录体数据集。这类lncRNA和ncRNA可以在血液或尿中的外泌体或其他受保护状态中富集。
可以用于区分组4与其他组的基于血液或尿的前列腺癌和膀胱癌特异性外显子转录物包括但不限于:(外显子位置,基因);chr21:45555942-45556055:+,C21orf33,并且可以在血液或尿中的外泌体、肿瘤相关囊泡或其他受保护状态中富集。
可以用于区分组4与其他组的前列腺癌和膀胱癌蛋白标记物包括但不限于:(基因符号,染色体带,基因标题,UniProt ID):PMM1,22q13,磷酸甘露糖变位酶1,Q92871。这种标记物可以通过源自肺癌、头颈癌的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离,或在尿中鉴定。
前列腺癌和膀胱癌中突变的分布可在公共COSMIC数据库中获得,其中最常见的是BAGE2(BAGE家族成员2)、DNM1P47(发动蛋白1假基因47)、FRG1BP(区域基因1家族成员B,假基因)、KRAS(Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物)、RP11-156P1.3、TTN(肌联蛋白)和TUBB8P7(微管蛋白β8VIII类假基因7)。
图65提供作为前列腺癌和膀胱癌特异性标记物的一级CpG位点的列表,其可以用于自在血液或尿内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定前列腺癌和膀胱癌的存在。图66提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为前列腺癌和膀胱癌特异性标记物的一级CpG位点,其可以用于自在血液或尿内的cfDNA、或在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定前列腺癌和膀胱癌的存在。这些列表含有优选的一级CpG位点及其侧翼位点,所述位点可以用于区分前列腺癌和膀胱癌。示例性甲基化标记物的引物组列于实验部分中的表56中。选择48种平均灵敏度为50%的这些标记物对组4给出以下得分:(前列腺癌=48,膀胱癌=22),其将转化为在50%平均灵敏度下的以下标记物当量数(=48x得分/50);(前列腺癌=46标记物当量;膀胱癌=21标记物当量)。因此,膀胱癌低于平均36-标记物当量最小值。同样,在66%平均灵敏度下的标记物当量给出以下得分(=48x得分/60);(前列腺癌=35标记物当量;膀胱癌=16标记物当量)。因此,膀胱癌远低于平均36-标记物当量最小值。然而,标记物的不同选择,例如通过从48种标记物增加到64种标记物并且包括对前列腺癌和膀胱癌两者都呈阳性的标记物,将矫正这种情况。所述标记物限于在正常前列腺、膀胱或肾组织中未甲基化的那些,以使来自尿样品的假阳性结果最少化。
组5(肝癌、胰腺癌和胆囊癌):可以用于区分组5与其他组的基于血液的肝癌、胰腺癌和胆囊癌特异性微小RNA标记物包括但不限于:(mir ID,基因ID):hsa-mir-132,MIR132。所述标记物通过分析TCGA微小RNA数据集鉴定,其可以存在于血液中的外泌体、肿瘤相关囊泡、Argonaute复合物或其他受保护状态中。
图67提供通过比较分析各种公开可得的Affymetrix Exon ST CEL数据而获得的基于血液的肝癌、胰腺癌和胆囊癌特异性ncRNA和lncRNA标记物的列表,将其与GENCODE注释进行比对以产生ncRNA和lncRNA转录体数据集。这类lncRNA和ncRNA可以在血液中的外泌体或其他受保护状态中富集。
另外,图68提供可以在血液中的外泌体、肿瘤相关囊泡或其他受保护状态中富集的基于血液的肝癌、胰腺癌和胆囊癌特异性外显子转录物的列表。
图69提供肝癌、胰腺癌和胆囊癌蛋白标记物的列表,所述癌症蛋白标记物通过源自肝癌、胰腺癌和胆囊癌的mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体来鉴定,其可以在血液中,在外泌体、其他受保护状态、肿瘤相关囊泡内,或在血浆内游离来鉴定。
可以由肝癌、胰腺癌和胆囊癌分泌到血液中,可以用于区分组5与其他组的蛋白标记物包括但不限于:(蛋白质名称,UniProt ID);凝溶胶蛋白(AGEL)(肌动蛋白解聚因子)(ADF)(Brevin),P06396;原神经调节蛋白2(Pro-neuregulin-2),O14511;CD59糖蛋白(1F5抗原)(20kDa同源限制性因子)(HRF-20)(HRF20)(MAC-抑制蛋白)(MAC-IP)(MEM43抗原)(膜攻击复合物抑制因子)(MACIF)(膜反应性裂解抑制因子)(MIRL)(保护素)(CD抗原CD59),P13987;发散蛋白激酶结构域2B(自闭症缺失相关蛋白1),Q9H7Y0。对各种TCGA数据集(肿瘤、正常)进行比较分析,然后进行额外的生物信息学过滤(Meinken等,“ComputationalPrediction of Protein Subcellular Locations in Eukaryotes:an ExperienceReport,”Computational Molecular Biology2(1):1-7(2012),其以引用的方式整体并入本文),其预测细胞分泌翻译的蛋白质的可能性。
肝癌、胰腺癌和胆囊癌中突变的分布可在公共COSMIC数据库中获得,其中最常见的是:KRAS(Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物)、MUC16(粘蛋白16,细胞表面相关)、MUC4(粘蛋白4,细胞表面相关)、TP53(肿瘤蛋白p53)和TTN(肌联蛋白)。
图70提供作为肝癌、胰腺癌和胆囊癌和组织特异性标记物的一级CpG位点的列表,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定肺癌、头颈癌的存在。图71提供染色体区域或亚区域的列表,在所述染色体区域或亚区域内存在作为肝癌、胰腺癌和胆囊癌和组织特异性标记物的一级CpG位点,其可以用于自在血液内的cfDNA、在外泌体内的DNA、或在其他受保护状态中(诸如在CTC内)的DNA鉴定肝癌、胰腺癌和胆囊癌的存在。这些列表含有优选的一级CpG位点及其侧翼位点,以及可以用于区分肝癌、胰腺癌和胆囊癌的替代标记物。示例性优选和替代的甲基化标记物的引物组列于实验部分中的表57中。选择64种平均灵敏度为50%的这些标记物对组5给出以下得分:(肝癌=57,胰腺癌=30,胆囊癌=60),其将转化为在50%平均灵敏度下的以下标记物当量数(=64x得分/50);(肝癌=73标记物当量;胰腺癌=38标记物当量;胆囊癌=77标记物当量)。因此,全部都高于平均36-标记物当量最小值。在66%平均灵敏度下的标记物当量给出以下得分(=64x得分/66);(肝癌=56标记物当量;胰腺癌=29标记物当量;胆囊癌=58标记物当量)。因此,肝癌和胆囊癌高于平均36-标记物当量最小值,而胰腺癌低于所述最小值。
考虑使用96种泛肿瘤学标记物检测早期结肠直肠癌的第一策略(图1C)。计算是在预期血液中每种阳性标记物平均有150个甲基化分子的情况下进行的。如上文所述,对于结肠直肠癌的实例,特别是突变载量低的微卫星稳定肿瘤(MSS)的情况,对于当仅依赖NGS测序时的这些计算(假设在血液中有150个具有一个突变的分子),估计78%的早期结肠直肠癌将被漏失。再次,为了正确看待这些数字,美国在2018年诊断出约135,000个新结肠直肠癌病例,其中约60%是晚期癌症(即III和IV期)。在美国约10700万名个体超过50岁且应该接受结肠直肠癌测试。虽然不能预测有多少个体患有隐匿的癌症(即I期),这些个体不顺从测试,但是为了所述计算的目的,假设平均晚期癌症是平均早期癌症的一倍,因此患有I期癌症的个体将是约40,500名个体。假设单独标记物假阳性率为3%,并且第一步骤使用96种标记物(对于CRC,48种标记物),平均灵敏度为50%,需要最少5种标记物为阳性,然后总特异性为95.8%,第一步骤将鉴定4,494,000名个体(出自美国总共107,000,000名超过50岁的成人),其将包括71.6%灵敏度或约28,998名患有I期结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。然而,那4,494,000名推定为阳性的个体将在使用64种标记物(对于CRC,48种标记物),平均灵敏度为50%,需要最少5种标记物为阳性的第二步骤中评价,然后两步测试将鉴定71.6%x71.6%=51.2%=20,762名患有结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。在95.8%的特异性下,第二测试也将产生4,494,000x4.2%=188,748份假阳性。这一测试的阳性预测值将是20,762/(188,748+20,762)=9.9%,换句话说,在测试为阳性的10名个体中有1名将实际上患有I期结肠直肠癌。实际上,还需要包括成功地鉴定2期和更晚期癌症。在扩展此实施例时,计算是在如下预期下进行的:I期CRC在血液中每种阳性标记物平均有150个甲基化分子,II期CRC每种阳性标记物平均有200个甲基化分子,并且更晚期(III和IV)每种阳性标记物至少平均有300个甲基化分子,以及更晚期。而且,为了与这样的想法一致,即当重复使用测试时,将检测到更多早期CRC和更少晚期CRC,则美国每年鉴定出估计40,500名患有I期癌症的个体、40,500名患有II期癌症的个体以及剩余54,000名患有晚期癌症的个体=总共135,000名患有结肠直肠癌的个体。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出90.1%,其中在第二步骤中将验证90.1%x90.1%=81.0%=32,877名患有II期癌症的个体。对于III和IV期癌症,在第一步骤中将鉴定出99.3%,其中将鉴定出99.3%x99.3%=98.6%=53,246名患有晚期癌症的个体。这使得从135,000名结肠直肠癌个体中总共鉴定出20,762+32,877+53,246=106,885名个体,总灵敏度为79%。总之,这一测试的阳性预测值将是106,885/(188,748+106,885)=36.1%,换句话说,测试为阳性的3名个体中有1名将实际上患有结肠直肠癌,并且与目前40%的比率相比,所述测试将鉴定53,639/81,000或66%的那些患有早期癌症的个体。
对于使用检测早期结肠直肠癌的这种策略(图1C),使用50%平均标记物灵敏度,预期I期CRC在血液中每种阳性标记物平均有200个甲基化分子,II期CRC每种阳性标记物平均有240个甲基化分子且更晚期(III和IV)每种阳性标记物至少平均有300个甲基化分子,这些结果将如何变化?
假设单独标记物假阳性率为3%,第一步骤使用96种标记物(对于CRC,48种标记物),平均灵敏度为50%,需要最少5种标记物为阳性,并且总特异性为95.8%,第一步骤将鉴定4,494,000名个体(出自美国总共107,000,000名超过50岁的成人)。这将包括90.1%的灵敏度或约36,490名患有I期结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。然而,在使用64种标记物(对于CRC,48种标记物),平均灵敏度为50%,需要最少5种标记物为阳性的第二步骤中,将评价那4,494,000名推测为阳性的个体。两步测试将鉴定90.1%x90.1%=81.2%=32,877名患有结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。在95.8%的特异性下,第二测试也将产生4,494,000x4.2%=188,748份假阳性。这一测试的阳性预测值将是32,877/(188,748+32,877)=14.8%。换句话说,6.7名测试为阳性的个体中有1名将实际上患有I期结肠直肠癌。实际上,还需要包括成功地鉴定2期和更晚期癌症。为了与这样的想法一致,即当重复使用测试时,将检测到更多早期CRC和更少晚期CRC,美国每年将鉴定出估计40,500名患有I期癌症的个体、40,500名患有II期癌症的个体和54,000名患有晚期癌症的个体(总共135,000名患有结肠直肠癌的个体)。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出90.1%,其中在第二步骤中将验证97.2%x97.2%=94.5%=38,263名患有II期癌症的个体。对于III和IV期癌症,在第一步骤中将鉴定出99.3%,其中将鉴定出99.3%x99.3%=98.6%=53,246名患有晚期癌症的个体。这使得从135,000名结肠直肠癌个体中总共鉴定出32,877+38,263+53,246=124,386名个体,总灵敏度为92.1%。总之,这一测试的阳性预测值将是124,386/(188,748+124,386)=39.7%。换句话说,测试为阳性的2.5名个体中有1名将实际上患有结肠直肠癌,并且与目前40%的比率相比,所述测试将鉴定71,104/81,000或87.7%的那些患有早期癌症的个体。
当使用检测早期卵巢癌的这种策略(图1C),预期血液中每种阳性标记物平均有150个甲基化分子时,这些结果将如何变化?当仅依赖NGS测序时(假设在血液中有150个具有一个突变的分子),估计78%的早期卵巢癌将被漏失。再次,为了正确看待这些数字,美国在2018年诊断出约22,000个新卵巢癌病例,其中约85%是晚期癌症(即III和IV期)。在美国约5400万名女性在50岁和79岁之间且应该接受卵巢癌测试。虽然不能预测有多少个体患有隐匿的癌症(即I期),但是为了所述计算的目的,假设各期是平均划分的。因此,患有I期卵巢癌的个体的数量将是约5,500名个体。假设单独标记物假阳性率为3%,第一步骤使用96种标记物(对于卵巢癌,36种标记物),平均灵敏度为50%,需要最少5种标记物为阳性,并且总特异性为99.1%,第一步骤将鉴定486,000名患有卵巢癌的个体(出自美国总共54,000,000名50-79岁的女性)。这将包括46.8%的灵敏度或约2,574名患有I期卵巢癌的个体(出自5,500名患有I期卵巢癌的个体)。然而,在使用64种标记物(对于卵巢癌,36种标记物),平均灵敏度为50%,需要最少5种标记物为阳性的第二步骤中,将评价那486,000名推测为阳性的个体。两步测试将鉴定46.8%x46.8%=21.9%=1,204名患有卵巢癌的个体(出自5,500名患有I期卵巢癌的个体)。在99.1%的特异性下,第二测试也将产生486,000x0.9%=4,374份假阳性。这一测试的阳性预测值将是1,204/(4,374+1,204)=21.6%。换句话说,4.6名测试为阳性的个体中有1名将实际上患有I期卵巢癌。实际上,还需要包括成功地鉴定2期和更晚期卵巢癌。在扩展此实施例时,计算是在如下预期下进行的:I期卵巢癌在血液中每种阳性标记物平均有150个甲基化分子,II期卵巢癌每种阳性标记物平均有200个甲基化分子,并且更晚期(III和IV)每种阳性标记物至少平均有300个甲基化分子。为了与这样的想法一致,即当重复使用测试时,将检测到更多癌症并且所有四期均为5,500名,则美国每年将鉴定出总共5,500x4=22,000名患有卵巢癌的个体。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出71.5%,其中在第二步骤中将验证71.5%x71.5%=51.1%=2,810名患有II期卵巢癌的个体。对于III和IV期卵巢癌,在第一步骤中将鉴定出94.5%,其中将鉴定出94.5%x94.5%=89.3%=9,823名患有晚期卵巢癌的个体。这使得从22,000名卵巢癌个体中总共鉴定出1,204+2,810+9,823=13,837名个体,总灵敏度为62.9%。总之,这一测试的阳性预测值将是13,837/(13,837+4,374)=76.0%。换句话说,测试为阳性的4名女性中有3名将实际上患有卵巢癌,并且与目前15%的比率相比,所述测试将鉴定4,014/11,000或36.5%的那些患有早期癌症的个体。
对于使用检测早期卵巢癌的这种策略(图1C),使用50%平均标记物灵敏度,预期I期卵巢癌在血液中每种阳性标记物平均有200个甲基化分子,II期卵巢癌每种阳性标记物平均有240个甲基化分子且更晚期(III和IV)每种阳性标记物至少平均有300个甲基化分子,这些结果将如何变化?
假设单独标记物假阳性率为3%,第一步骤使用96种标记物(对于卵巢癌,36种标记物),平均灵敏度为50%且需要最少5种标记物为阳性,总特异性为99.1%,第一步骤将鉴定486,000名患有卵巢癌的个体(出自美国总共54,000,000名50-79岁的女性)。这将包括71.5%的灵敏度、约3,932名患有I期卵巢癌的个体(出自5,500名患有I期卵巢癌的个体)。然而,在使用64种标记物(对于卵巢癌,36种标记物),平均灵敏度为50%,需要最少5种标记物为阳性的第二步骤中,将评价那486,000名推测为阳性的个体。两步测试将鉴定71.5%x71.5%=51.1%=2,810名患有卵巢癌的个体(出自5,500名患有I期卵巢癌的个体)。在99.1%的特异性下,第二测试也将产生486,000x0.9%=4,374份假阳性。这一测试的阳性预测值将是2,810/(4,374+2,810)=39.1%。换句话说,2.5名测试为阳性的个体中有1名将实际上患有I期卵巢癌。实际上,还需要包括成功地鉴定2期和更晚期卵巢癌。当重复使用测试时,假设所有四期都是5,500名,因此美国每年将鉴定出总共5,500x4=22,000名患有卵巢癌的个体。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出84.4%,其中在第二步骤中将验证84.4%x84.4%=71.2%=3,916名患有II期卵巢癌的个体。对于III和IV期卵巢癌,在第一步骤中将鉴定出94.5%,其中将鉴定出94.5%x94.5%=89.3%=9,823名患有晚期卵巢癌的个体。这使得从22,000名卵巢癌个体中总共鉴定出2,810+3,916+9,823=16,549名个体,总灵敏度为75.2%。总之,这一测试的阳性预测值将是16,549/(16,549+4,374)=79.0%。换句话说,5名测试为阳性的女性中有4名将实际上患有卵巢癌。与目前15%的比率相比,所述测试将鉴定6,006/11,000或54.6%的那些患有早期癌症的个体。
上述计算在将至少一组标记物限制到50%平均灵敏度的假设下进行。如果将平均灵敏度从50%改进到66%,结果将如何改进?
考虑使用96种泛肿瘤学标记物检测早期结肠直肠癌的策略(图1D)。计算是在预期血液中每种阳性标记物平均有150个甲基化分子的情况下进行的。如上文所述,假设平均晚期癌症是平均早期癌症的一倍,因此患有I期癌症的个体将是约40,500名个体。假设单独标记物假阳性率为3%,第一步骤使用96种标记物(对于CRC,48种标记物),平均灵敏度为66%,需要最少5种标记物为阳性,并且总特异性为95.8%,第一步骤将鉴定4,494,000名患有I期结肠直肠癌的个体(出自美国总共107,000,000名超过50岁的成人)。这将包括90.0%的灵敏度、约36,450名患有I期结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。然而,在使用64种标记物(对于CRC,48种标记物),平均灵敏度为66%且需要最少5种标记物为阳性的第二步骤中,将评价那4,494,000名推测为阳性的个体。两步测试将鉴定90.0%x90.0%=89.0%=32,805名患有结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。在95.8%的特异性下,第二测试也将产生4,494,000x4.2%=188,748份假阳性。这一测试的阳性预测值将是32,805/(188,748+32,805)=14.8%。换句话说,7名测试为阳性的个体中有1名将实际上患有I期结肠直肠癌。实际上,还需要包括成功地鉴定2期和更晚期癌症。在扩展此实施例时,计算是在如下预期下进行的:I期CRC在血液中每种阳性标记物平均有150个甲基化分子,II期CRC每种阳性标记物平均有200个甲基化分子,并且更晚期(III和IV)每种阳性标记物至少平均有300个甲基化分子。而且,为了与这样的想法一致,即当重复使用测试时,将检测到更多早期CRC和更少晚期CRC,将鉴定出估计40,500名患有I期癌症的个体,将鉴定出40,500名患有II期癌症的个体,并且将鉴定出剩余54,000名患有晚期癌症的个体。这等于美国每年鉴定出总共135,000名患有结肠直肠癌的个体。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出98.0%,其中在第二步骤中将验证98.0%x98.0%=96.0%=38,896名患有II期癌症的个体。对于III和IV期癌症,在第一步骤中将鉴定出99.6%,其中将鉴定出99.6%x99.6%=99.2%=53,568名患有晚期癌症的个体。这使得从135,000名结肠直肠癌个体中总共鉴定出32,805+38,896+53,568=125,269名个体,总灵敏度为92.7%。总之,这一测试的阳性预测值将是125,269/(188,748+125,269)=39.9%。换句话说,2.5名测试为阳性的个体中有1名将实际上患有结肠直肠癌。与目前40%的比率相比,所述测试将鉴定71,701/81,000或88%的那些患有早期癌症的个体。
对于使用检测早期结肠直肠癌的这种策略(图1D),使用66%平均标记物灵敏度,预期I期CRC在血液中每种阳性标记物平均有200个甲基化分子,II期CRC在血液中每种阳性标记物平均有240个甲基化分子且更晚期(III和IV)在血液中每种阳性标记物至少平均有300个甲基化分子,这些结果将如何变化?
假设单独标记物假阳性率为3%,第一步骤使用96种标记物(对于CRC,48种标记物),平均灵敏度为66%,且需要最少5种标记物为阳性,然后总特异性为95.8%,第一步骤将鉴定4,494,000名患有结肠直肠癌的个体(出自美国总共107,000,000名超过50岁的成人)。这将包括98.0%的灵敏度、约39,690名患有I期结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。然而,在使用64种标记物(对于CRC,48种标记物),平均灵敏度为66%,需要最少5种标记物为阳性的第二步骤中,将评价那4,494,000名推测为阳性的个体。两步测试将鉴定98.0%x98.0%=96.0%=38,896名患有结肠直肠癌的个体(出自40,500名患有I期癌症的个体)。在95.8%的特异性下,第二测试也将产生4,494,000x4.2%=188,748份假阳性。这一测试的阳性预测值将是38,896/(188,748+38,896)=17.81%。换句话说,6名测试为阳性的个体中有1名将实际上患有I期结肠直肠癌。实际上,还需要包括成功地鉴定2期和更晚期癌症。为了与这样的想法一致,即当重复使用测试时,将检测到更多早期CRC和更少晚期CRC,将鉴定出估计40,500名患有I期癌症的个体,将鉴定出40,500名患有II期癌症的个体并且将鉴定出剩余54,000名患有晚期癌症的个体(即,美国每年鉴定出总共135,000名患有结肠直肠癌的个体)。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出98.0%,其中在第二步骤中将验证99.6%x99.6%=99.2%=40,176名患有II期癌症的个体。对于III和IV期癌症,在第一步骤中将鉴定出99.9%,其中将鉴定出99.9%x99.9%=99.8%=53,568名患有晚期癌症的个体。这使得从135,000名结肠直肠癌个体中总共鉴定出38,896+40,176+53,892=132,964名个体,总灵敏度为98.5%。总之,这一测试的阳性预测值将是132,964/(188,748+132,964)=41.3%。换句话说,测试为阳性的2.5名个体中有1名将实际上患有结肠直肠癌,并且与目前40%的比率相比,所述测试将鉴定79,072/81,000或97.6%的那些患有早期癌症的个体。
对于使用检测早期卵巢癌的第一策略(图1D),预期血液中每种阳性标记物平均有150个甲基化分子,这些结果将如何变化?再次,假设各期是平均划分的,因此,患有I期卵巢癌的个体将是约5,500名个体。假设单独标记物假阳性率为3%,第一步骤使用96种标记物(对于卵巢癌,36种标记物),平均灵敏度为66%且需要最少5种标记物为阳性,然后总特异性为99.1%,第一步骤将鉴定486,000名个体(出自美国总共54,000,000名50-79岁的女性)。这将包括71.5%的灵敏度、约3,932名患有I期卵巢癌的个体(出自5,500名患有I期卵巢癌的个体)。然而,在使用64种标记物(对于卵巢癌,36种标记物),平均灵敏度为66%且需要最少5种标记物为阳性的第二步骤中,将评价那486,000名推测为阳性的个体。两步测试将鉴定71.5%x71.5%=51.1%=2,810名患有卵巢癌的个体(出自5,500名患有I期卵巢癌的个体)。在99.1%的特异性下,第二测试也将产生486,000x0.9%=4,374份假阳性。这一测试的阳性预测值将是2,810/(4,374+2,810)=39.1%。换句话说,2.5名测试为阳性的个体中有1名将实际上患有I期卵巢癌。实际上,还需要包括成功地鉴定2期和更晚期卵巢癌。在扩展此实施例时,计算是在如下预期下进行的:I期卵巢癌在血液中每种阳性标记物平均有150个甲基化分子,II期卵巢癌每种阳性标记物平均有200个甲基化分子,并且更晚期(III和IV)每种阳性标记物至少平均有300个甲基化分子。而且,假设所有四期都是5,500名,则美国每年将鉴定出总共5,500x4=22,000名患有卵巢癌的个体。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出90.0%,其中在第二步骤中将验证90.0%x90.0%=81.0%=4,485名患有II期卵巢癌的个体。对于III和IV期卵巢癌,在第一步骤中将鉴定出99.2%,其中将鉴定出99.2%x99.2%=98.4%=10,824名患有晚期卵巢癌的个体。这使得从22,000名卵巢癌个体中总共鉴定出2,810+4,485+10,824=18,119名个体,总灵敏度为82.4%。总之,这一测试的阳性预测值将是18,119/(18,119+4,374)=80.5%。换句话说,测试为阳性的5名女性中有4名将实际上患有卵巢癌,并且与目前15%的比率相比,所述测试将鉴定7,295/11,000或66.3%的那些患有早期癌症的个体。
对于使用检测早期卵巢癌的这种策略(图1D),使用66%平均标记物灵敏度,预期I期卵巢癌在血液中每种阳性标记物平均有200个甲基化分子,II期卵巢癌每种阳性标记物平均有240个甲基化分子且更晚期(III和IV)每种阳性标记物至少平均有300个甲基化分子,这些结果将如何变化?
假设单独标记物假阳性率为3%,第一步骤使用96种标记物(对于卵巢癌,36种标记物),平均灵敏度为66%且需要最少5种标记物为阳性,然后总特异性为99.1%,第一步骤将鉴定486,000名个体(出自美国总共54,000,000名50-79岁的女性)。这将包括90.0%的灵敏度、约4,950名患有I期卵巢癌的个体(出自5,500名患有I期卵巢癌的个体)。然而,在使用64种标记物(对于卵巢癌,36种标记物),平均灵敏度为66%,需要最少5种标记物为阳性的第二步骤中,将评价那486,000名推测为阳性的个体。两步测试将鉴定90.0%x90.0%=81.0%=4,895名患有卵巢癌的个体(出自5,500名患有I期卵巢癌的个体)。在99.1%的特异性下,第二测试也将产生486,000x0.9%=4,374份假阳性。这一测试的阳性预测值将是4,895/(4,374+4,895)=52.8%。换句话说,2名测试为阳性的个体中有1名将实际上患有I期卵巢癌。实际上,还需要包括成功地鉴定2期和更晚期卵巢癌。假设所有四期都是5,500名,则美国每年将鉴定出总共5,500x4=22,000名患有卵巢癌的个体。上述计算已经提供早期癌症的假阳性率。对于II期癌症,在第一步骤中将鉴定出96.2%,其中在第二步骤中将验证96.2%x96.2%=92.5%=5,087名患有II期卵巢癌的个体。对于III和IV期卵巢癌,在第一步骤中将鉴定出99.2%,其中将鉴定出99.2%x99.2%=98.4%=10,824名患有晚期卵巢癌的个体。这使得从22,000名卵巢癌个体中总共鉴定出4,895+5087+10,824=20,806名个体,总灵敏度为94.6%。总之,这一测试的阳性预测值将是20,806/(20,806+4,374)=87.4%。换句话说,测试为阳性的8名女性中有7名将实际上患有卵巢癌,并且与目前15%的比率相比,所述测试将鉴定9,982/11,000或90.1%的那些患有早期癌症的个体。
每种癌症的生物学是不同的,因此,与本文所述的理想计算相比,对于检测早期癌症、监测治疗和检测早期复发观察到的灵敏度和特异性可以更高或更低。
实施例
实施例:癌症相关甲基化标记物的多路复用PCR-LDR-qPCR检测
实施例1-5的一般方法
将HT-29结肠腺癌细胞接种在60cm2培养皿中在含有4.5g/l葡萄糖、补充有10%胎牛血清的McCoy's 5A培养基中,并保持在含有5%CO2的潮湿气氛中。细胞一旦达到80-90%融合度,则将其在磷酸盐缓冲盐水(x3)中洗涤,并通过离心(500xg)收集。使用DNeasyBlood&Tissue试剂盒(Qiagen;Valencia,Calif.)分离基因组DNA,并使用Quant-iT Picogreen测定(Life Technologies/Thermo-Fisher;Waltham,Mass.)测量其浓度。
从人血液(血沉棕黄层)中分离的高分子量(>50kb)基因组DNA(0.2mg/ml)(Roche人基因组DNA)购自Roche(Indianapolis,Ind.)。使用Quant-iT PicoGreen dsDNA测定试剂盒类似地测定其浓度。
无细胞DNA使用QIA amp循环核酸试剂盒根据制造商的说明书从5ml血浆样品(具有K2EDTA添加剂作为抗凝剂)中分离,并使用Quant-iT Pico Green测定(LifeTechnologies/ThermoFisher;Waltham,MA)定量。
在20μl含有1xCutSmart缓冲液(50mM乙酸钾、20mM Tris-乙酸、10mM乙酸镁、100μg/ml BSA,pH 7.9,25℃)的反应溶液中用10单位的限制性酶Bsh1236I消化0.5-1.0μg HT29细胞系基因组DNA。消化反应在37℃下进行1小时,然后在80℃下酶钝化20分钟。或者,可以使用Covaris超声发生器(Woburn,Massachusetts)通过非随机超声方法将基因组DNA片段化。剪切后,用Agilent Bioanalyzer系统评估所得DNA片段(长度在50kb至1kb碱基对范围内)的质量。然后是富集步骤,其中然后使用EpiMark
Figure GDA0003856873510002161
甲基化DNA富集试剂盒根据制造商的说明书(New England Biolabs;Ipswich,MA)通过甲基化特异性抗体捕获含甲基化CpG的DNA片段。
PCR引物、LDR探针和LNA或PNA阻断引物。用于一步或两步测定以检测结肠直肠癌的所有引物都列于下表45中。除了LNAl和LNA2购自Exiqon Inc.(Woburn,Mass.)且PNA购自PNA Bio(Thousand Oaks,Calif.)之外,所有引物都购自Integrated DNA TechnologiesInc.(IDT)(Coralville,Iowa)。经设计以在96-标记物测定的步骤1中使用,在50%平均灵敏度下,检测实体瘤的引物列于下表46中。经设计以在组1-64-标记物测定的步骤2中使用,在50%平均灵敏度下,以检测和鉴定结肠直肠癌、胃癌和食管癌的引物列于下表53中。经设计以在组2-48-64-标记物测定的步骤2中使用,在50%平均灵敏度下,以检测和鉴定乳腺癌、子宫内膜癌、卵巢癌、宫颈癌和子宫癌的引物列于下表54中。经设计以在组3-48-64-标记物测定的步骤2中使用,在50%平均灵敏度下,以检测和鉴定肺腺癌、肺鳞状细胞癌和头颈癌的引物列于下表55中。经设计以在组4-36-48-标记物测定的步骤2中使用,在50%平均灵敏度下,以检测和鉴定前列腺癌和膀胱癌的引物列于下表56中。经设计以在组5-48-64-标记物测定的步骤2中使用,在50%平均灵敏度下,以检测和鉴定肝癌、胰腺癌和胆囊癌的引物列于下表57中。
Figure GDA0003856873510002181
Figure GDA0003856873510002191
Figure GDA0003856873510002201
Figure GDA0003856873510002211
Figure GDA0003856873510002221
Figure GDA0003856873510002231
Figure GDA0003856873510002241
Figure GDA0003856873510002251
Figure GDA0003856873510002261
Figure GDA0003856873510002271
Figure GDA0003856873510002281
Figure GDA0003856873510002291
Figure GDA0003856873510002301
Figure GDA0003856873510002311
Figure GDA0003856873510002321
Figure GDA0003856873510002331
Figure GDA0003856873510002341
Figure GDA0003856873510002351
Figure GDA0003856873510002361
Figure GDA0003856873510002371
Figure GDA0003856873510002381
Figure GDA0003856873510002391
Figure GDA0003856873510002401
Figure GDA0003856873510002411
Figure GDA0003856873510002421
Figure GDA0003856873510002431
Figure GDA0003856873510002441
Figure GDA0003856873510002451
Figure GDA0003856873510002461
Figure GDA0003856873510002471
Figure GDA0003856873510002481
Figure GDA0003856873510002491
Figure GDA0003856873510002501
Figure GDA0003856873510002511
Figure GDA0003856873510002521
Figure GDA0003856873510002531
Figure GDA0003856873510002541
Figure GDA0003856873510002551
Figure GDA0003856873510002561
Figure GDA0003856873510002571
Figure GDA0003856873510002581
Figure GDA0003856873510002591
Figure GDA0003856873510002601
Figure GDA0003856873510002611
Figure GDA0003856873510002621
Figure GDA0003856873510002631
Figure GDA0003856873510002641
Figure GDA0003856873510002651
Figure GDA0003856873510002661
Figure GDA0003856873510002671
Figure GDA0003856873510002681
Figure GDA0003856873510002691
Figure GDA0003856873510002701
Figure GDA0003856873510002711
Figure GDA0003856873510002721
Figure GDA0003856873510002731
Figure GDA0003856873510002741
Figure GDA0003856873510002751
Figure GDA0003856873510002761
Figure GDA0003856873510002771
Figure GDA0003856873510002781
Figure GDA0003856873510002791
Figure GDA0003856873510002801
Figure GDA0003856873510002811
Figure GDA0003856873510002821
Figure GDA0003856873510002831
Figure GDA0003856873510002841
Figure GDA0003856873510002851
Figure GDA0003856873510002861
Figure GDA0003856873510002871
Figure GDA0003856873510002881
Figure GDA0003856873510002891
Figure GDA0003856873510002901
Figure GDA0003856873510002911
Figure GDA0003856873510002921
Figure GDA0003856873510002931
Figure GDA0003856873510002941
Figure GDA0003856873510002951
Figure GDA0003856873510002961
Figure GDA0003856873510002971
Figure GDA0003856873510002981
Figure GDA0003856873510002991
Figure GDA0003856873510003001
Figure GDA0003856873510003011
Figure GDA0003856873510003021
Figure GDA0003856873510003031
Figure GDA0003856873510003041
Figure GDA0003856873510003051
Figure GDA0003856873510003061
Figure GDA0003856873510003071
Figure GDA0003856873510003081
Figure GDA0003856873510003091
Figure GDA0003856873510003101
Figure GDA0003856873510003111
Figure GDA0003856873510003121
Figure GDA0003856873510003131
Figure GDA0003856873510003141
Figure GDA0003856873510003151
Figure GDA0003856873510003161
Figure GDA0003856873510003171
Figure GDA0003856873510003181
Figure GDA0003856873510003191
Figure GDA0003856873510003201
Figure GDA0003856873510003211
Figure GDA0003856873510003221
Figure GDA0003856873510003231
Figure GDA0003856873510003241
Figure GDA0003856873510003251
Figure GDA0003856873510003261
Figure GDA0003856873510003271
Figure GDA0003856873510003281
Figure GDA0003856873510003291
Figure GDA0003856873510003301
Figure GDA0003856873510003311
Figure GDA0003856873510003321
Figure GDA0003856873510003331
Figure GDA0003856873510003341
Figure GDA0003856873510003351
Figure GDA0003856873510003361
Figure GDA0003856873510003371
Figure GDA0003856873510003381
Figure GDA0003856873510003391
Figure GDA0003856873510003401
Figure GDA0003856873510003411
Figure GDA0003856873510003421
Figure GDA0003856873510003431
Figure GDA0003856873510003441
Figure GDA0003856873510003451
Figure GDA0003856873510003461
Figure GDA0003856873510003471
Figure GDA0003856873510003481
Figure GDA0003856873510003491
Figure GDA0003856873510003501
Figure GDA0003856873510003511
Figure GDA0003856873510003521
Figure GDA0003856873510003531
Figure GDA0003856873510003541
Figure GDA0003856873510003551
Figure GDA0003856873510003561
Figure GDA0003856873510003571
Figure GDA0003856873510003581
Figure GDA0003856873510003591
Figure GDA0003856873510003601
Figure GDA0003856873510003611
Figure GDA0003856873510003621
Figure GDA0003856873510003631
Figure GDA0003856873510003641
Figure GDA0003856873510003651
Figure GDA0003856873510003661
Figure GDA0003856873510003671
Figure GDA0003856873510003681
Figure GDA0003856873510003691
Figure GDA0003856873510003701
Figure GDA0003856873510003711
Figure GDA0003856873510003721
Figure GDA0003856873510003731
Figure GDA0003856873510003741
Figure GDA0003856873510003751
Figure GDA0003856873510003761
Figure GDA0003856873510003771
Figure GDA0003856873510003781
Figure GDA0003856873510003791
Figure GDA0003856873510003801
Figure GDA0003856873510003811
Figure GDA0003856873510003821
Figure GDA0003856873510003831
Figure GDA0003856873510003841
Figure GDA0003856873510003851
Figure GDA0003856873510003861
Figure GDA0003856873510003871
Figure GDA0003856873510003881
Figure GDA0003856873510003891
Figure GDA0003856873510003901
Figure GDA0003856873510003911
Figure GDA0003856873510003921
Figure GDA0003856873510003931
Figure GDA0003856873510003941
Figure GDA0003856873510003951
Figure GDA0003856873510003961
Figure GDA0003856873510003971
Figure GDA0003856873510003981
Figure GDA0003856873510003991
Figure GDA0003856873510004001
Figure GDA0003856873510004011
Figure GDA0003856873510004021
Figure GDA0003856873510004031
Figure GDA0003856873510004041
Figure GDA0003856873510004051
Figure GDA0003856873510004061
Figure GDA0003856873510004071
Figure GDA0003856873510004081
Figure GDA0003856873510004091
Figure GDA0003856873510004101
Figure GDA0003856873510004111
Figure GDA0003856873510004121
Figure GDA0003856873510004131
Figure GDA0003856873510004141
Figure GDA0003856873510004151
Figure GDA0003856873510004161
Figure GDA0003856873510004171
Figure GDA0003856873510004181
Figure GDA0003856873510004191
Figure GDA0003856873510004201
Figure GDA0003856873510004211
Figure GDA0003856873510004221
Figure GDA0003856873510004231
Figure GDA0003856873510004241
Figure GDA0003856873510004251
Figure GDA0003856873510004261
Figure GDA0003856873510004271
Figure GDA0003856873510004281
Figure GDA0003856873510004291
Figure GDA0003856873510004301
Figure GDA0003856873510004311
Figure GDA0003856873510004321
Figure GDA0003856873510004331
Figure GDA0003856873510004341
Figure GDA0003856873510004351
Figure GDA0003856873510004361
Figure GDA0003856873510004371
Figure GDA0003856873510004381
Figure GDA0003856873510004391
Figure GDA0003856873510004401
Figure GDA0003856873510004411
Figure GDA0003856873510004421
Figure GDA0003856873510004431
Figure GDA0003856873510004441
Figure GDA0003856873510004451
Figure GDA0003856873510004461
Figure GDA0003856873510004471
Figure GDA0003856873510004481
Figure GDA0003856873510004491
Figure GDA0003856873510004501
Figure GDA0003856873510004511
Figure GDA0003856873510004521
Figure GDA0003856873510004531
Figure GDA0003856873510004541
Figure GDA0003856873510004551
Figure GDA0003856873510004561
Figure GDA0003856873510004571
Figure GDA0003856873510004581
Figure GDA0003856873510004591
Figure GDA0003856873510004601
Figure GDA0003856873510004611
Figure GDA0003856873510004621
Figure GDA0003856873510004631
Figure GDA0003856873510004641
Figure GDA0003856873510004651
Figure GDA0003856873510004661
Figure GDA0003856873510004671
Figure GDA0003856873510004681
Figure GDA0003856873510004691
Figure GDA0003856873510004701
Figure GDA0003856873510004711
Figure GDA0003856873510004721
Figure GDA0003856873510004731
Figure GDA0003856873510004741
Figure GDA0003856873510004751
Figure GDA0003856873510004761
Figure GDA0003856873510004771
Figure GDA0003856873510004781
Figure GDA0003856873510004791
Figure GDA0003856873510004801
Figure GDA0003856873510004811
Figure GDA0003856873510004821
Figure GDA0003856873510004831
Figure GDA0003856873510004841
Figure GDA0003856873510004851
Figure GDA0003856873510004861
Figure GDA0003856873510004871
Figure GDA0003856873510004881
Figure GDA0003856873510004891
Figure GDA0003856873510004901
Figure GDA0003856873510004911
Figure GDA0003856873510004921
Figure GDA0003856873510004931
Figure GDA0003856873510004941
Figure GDA0003856873510004951
Figure GDA0003856873510004961
Figure GDA0003856873510004971
Figure GDA0003856873510004981
Figure GDA0003856873510004991
Figure GDA0003856873510005001
Figure GDA0003856873510005011
Figure GDA0003856873510005021
Figure GDA0003856873510005031
Figure GDA0003856873510005041
Figure GDA0003856873510005051
Figure GDA0003856873510005061
Figure GDA0003856873510005071
Figure GDA0003856873510005081
Figure GDA0003856873510005091
Figure GDA0003856873510005101
Figure GDA0003856873510005111
Figure GDA0003856873510005121
Figure GDA0003856873510005131
Figure GDA0003856873510005141
Figure GDA0003856873510005151
Figure GDA0003856873510005161
Figure GDA0003856873510005171
Figure GDA0003856873510005181
Figure GDA0003856873510005191
Figure GDA0003856873510005201
Figure GDA0003856873510005211
Figure GDA0003856873510005221
Figure GDA0003856873510005231
Figure GDA0003856873510005241
Figure GDA0003856873510005251
Figure GDA0003856873510005261
Figure GDA0003856873510005271
Figure GDA0003856873510005281
Figure GDA0003856873510005291
Figure GDA0003856873510005301
Figure GDA0003856873510005311
Figure GDA0003856873510005321
Figure GDA0003856873510005331
Figure GDA0003856873510005341
Figure GDA0003856873510005351
Figure GDA0003856873510005361
Figure GDA0003856873510005371
Figure GDA0003856873510005381
Figure GDA0003856873510005391
Figure GDA0003856873510005401
Figure GDA0003856873510005411
Figure GDA0003856873510005421
Figure GDA0003856873510005431
Figure GDA0003856873510005441
Figure GDA0003856873510005451
Figure GDA0003856873510005461
Figure GDA0003856873510005471
Figure GDA0003856873510005481
Figure GDA0003856873510005491
Figure GDA0003856873510005501
Figure GDA0003856873510005511
Figure GDA0003856873510005521
Figure GDA0003856873510005531
Figure GDA0003856873510005541
Figure GDA0003856873510005551
Figure GDA0003856873510005561
Figure GDA0003856873510005571
Figure GDA0003856873510005581
Figure GDA0003856873510005591
Figure GDA0003856873510005601
Figure GDA0003856873510005611
Figure GDA0003856873510005621
Figure GDA0003856873510005631
Figure GDA0003856873510005641
Figure GDA0003856873510005651
Figure GDA0003856873510005661
Figure GDA0003856873510005671
Figure GDA0003856873510005681
Figure GDA0003856873510005691
实施例1:使用exPCR-LDR-qPCR在单分子水平上检测HT29结肠直肠癌细胞系中的VIM启动子甲基化
在20μl含有1xCutSmart缓冲液(50mM乙酸钾、20mM Tris-乙酸、10mM乙酸镁、100μg/ml BSA,pH 7.9,25℃)的反应溶液中用10单位的限制性酶Bsh1236I消化500ng HT29细胞系基因组DNA。消化反应在37℃下进行1小时,然后在80℃下酶钝化20分钟。
然后使用得自Zymo Research Corporation(Irvine,CA)的EZ DNA Methylation-Lightning试剂盒使消化物亚硫酸氢盐转化。在所述反应中,将130μl Lightning转化试剂添加到20μl消化的基因组DNA中。将反应物在98℃下孵育8分钟,在54℃下孵育一小时,并且在4℃下停止。
将600μl M-结合缓冲液添加到Zymo-Spin TM柱中,并将所述柱插入收集管中。然后将来自先前步骤的消化的DNA(150μl)装载到柱中。盖帽,将柱颠倒几次以混合溶液,然后全速离心(>10,000xg)30秒。在弃去流过液之后,将100μl M-洗涤缓冲液添加柱中,然后进行另一轮全速离心30秒。然后弃去所得流过液。然后将200μl L-脱磺化缓冲液添加到柱中,并使柱在室温下静置15-20分钟。在孵育之后,将柱全速离心30秒。然后将200μl M-洗涤缓冲液添加到柱中,然后全速离心30秒。弃去流过液。重复此洗涤步骤一次。然后将柱插入1.5ml微离心管中,并将10μl M-洗脱缓冲液添加到柱基质中。最后,将柱全速离心30秒以洗脱DNA。
除了LNA1和LNA2购自Exiqon Inc.(Woburn,MA)且PNA购自PNA Bio(ThousandOaks,CA)之外,所有必要的引物(列于表42中)都购自Integrated DNA Technologies Inc.(IDT)(Coralville,IA)。
如下设置130μl体积的PCR反应:23.14μl无核酸酶的水(IDT),26μl不含镁的GotaqFlexi缓冲液5x(Promega,Madison,Wis.),10.4μl的25mM MgCl2(Promega,Madison,Wis.),2.6μl dNTP(各自10mM的dATP,dCTP,dGTP和dUTP)(Promega,Madison,Wi s.),3.25μl的2μMiCDx-2031-VIM-S3-FP正向引物,3.25μl的2μM iCDx-2032-VIM-S3-PR反向引物,16.25μl的2μM iCDx-VIM-S3-LNA2阻断引物,3.25μl的20mU/μl RNA酶H2(IDT),2.86μl与PlantinimTaq抗体(Invitrogen,Carlsbad,Calif.)混合的Klentaql聚合酶(DNA PolymeraseTechnology,St.Louis,Mo.)(所述混合物通过将0.3μl的50U/μl Klentaql聚合酶添加到3μl的5U/μl Platinu m Taq抗体中制备),和39μl的对应模板。39μl模板含有:(1)与9ng(2500GE)Roche hgDNA混合的0.070ng(20拷贝基因组当量GE)HT-29DNA。(2)与9ng(2500GE)Roche hgDNA混合的0.035ng(10GE)HT-29细胞系DNA。(3)9ng(2500GE)Roche DN A,(4)用于非模板对照(NTC)的无核酸酶的水。
将每种130μl PCR混合物分到12个管中,每个管10μl,然后PCR反应在Proflex PCR系统热循环仪(Applied Biosystems/ThermoFi sher;Waltham,Mass.)中用以下程序进行:在95℃下2分钟,循环35次(在94℃下10秒,在60℃下30秒,且在72℃下30秒),在99.5℃下10分钟,且最后保持在4℃下。
LDR步骤在10μl反应物中进行,所述反应物通过添加以下物质制备:5.82μl无核酸酶的水(IDT),1μl的10X AK16D连接酶反应缓冲液[1X缓冲液含有20mM Tris-HCl,pH 8.5(Bio-Rad,Hercules,CA)、5mM MgCl2(Sigma-Aldrich,St.Louis,MO)、50mM KCl(Sigma-Aldrich)、10mM DTT(Sigma-Aldrich)和20μg/ml BSA(Sigma-Aldrich),0.25μl的40mM DTT(Sigma-Aldrich),0.25μl的40mM NAD+(Sigma-Aldrich),0.25μl的20mU/μl RNA酶H2(IDT),0.2μl的500nM iCDx-2033-Vim-S3-Up探针,0.2μl的500nM iCDx-2034A-Vim-S3-Dn探针,0.028μl的8.8μM纯化AK16D连接酶,和2μl的PCR反应缓冲液。LDR反应在Proflex PCR系统热循环仪(Applied Biosystems)中用以下程序进行:循环20次(在94℃下10秒,且在60℃下4分钟),然后最后在4℃下无限保持。
qPCR步骤在10μl反应混合物中进行,所述反应混合物通过添加以下物质制备:1.5μl无核酸酶的水(IDT)、5μl得自Applied Bio systems(Life Technologies,GrandIsland,NY)的2X TaqMan
Figure GDA0003856873510005722
FastUniversal PCR Master Mix(由Amplitaq、UDG和dUTP组成)、1μl的2.5μM iCDx-2036-Vim-S3-RT-FP正向引物、1μl的2.5μM iCDx-2037-Vim-S3-RT-RP反向引物、0.5μl的5μM iCDx-2035-Vim-S3-RT-Pb TaqmanTM探针和1μl的LDR反应产物。qPCR反应在得自Applied Biosystems(Life Technologies,Grand Island,NY)的Vii A7实时热循环仪中使用用MicroAmpTM光学粘合膜密封的MicroAmp
Figure GDA0003856873510005723
Fast-96孔反应0.1ml板(Applied Biosystems)进行,具有以下设置:快速阻断,标准曲线作为实验类型,ROX作为被动参考,Ct作为定量方法(自动阈值,但需要时调整至0.05),TAMRA作为报告物,且NFQ-MGB作为猝灭剂。程序设置为:在50℃下2分钟,并且循环40次(在95℃下1秒且在60℃下20秒)。
像素实验结果示于图72中,而对于不同条件得到的Ct值列于表43中。在此实施例中使用来自表58的以下引物序列:SEQ ID NO:1-10。
表58.检测在Roche人基因组DNA的背景下HT-29DNA中的甲基化的像素实验的结果。在不同条件下的Ct值。
Figure GDA0003856873510005721
实施例2:通过PCR-LDR-qPCR对亚硫酸氢盐转化的HT29细胞系DNA多路复用检测10种CRC甲基化标记物
用在20μl含有1xCutSmart缓冲液(50mM乙酸钾、20mM Tris-乙酸、10mM乙酸镁、100μg/ml BSA,pH 7.9,25℃)的反应溶液中用12单位的限制性酶Bsh1236I消化500ng HT29细胞系基因组DNA开始实验。消化反应在37℃下进行1小时,然后在80℃下酶钝化20分钟。
对于亚硫酸氢盐转化反应,首先将130μl Lightning转化试剂(EZ DNAMethylation-Lightning试剂盒,得自Zymo Research Corporation;Irvine,CA)添加到20μl消化的基因组DNA中。然后在98℃下孵育8分钟,在54℃下孵育一小时,并且在4℃下停止。然后将600μl M-结合缓冲液添加到置于收集管内的Zymo-Spin TM柱中。然后将150μl消化的DNA反应混合物装载到Zymo-Spin IC柱(含有M-结合缓冲液)中,盖帽,并且通过将柱颠倒几次来混合溶液。在全速(>10,000xg)离心30秒之后,弃去流过液。将100μl M-洗涤缓冲液添加到柱中,然后进行另一轮离心(全速30秒)。在弃去流过液之后,将200μl L-脱磺酸基缓冲液添加柱中,使其在室温下静置15-20分钟,然后全速离心30秒。重新添加200μl M-洗涤缓冲液,然后全速离心30秒,并弃去流出液。重复此洗涤步骤循环一次。将柱置于1.5ml微离心管中,向其中添加10μl M-洗脱缓冲液,然后全速(30秒)离心以洗脱DNA。
在此特定实验中使用的大多数引物购自Integrated DNA Technologies Inc.(IDT;Coralville,IA)。引物LNA1和LNA2购自Exiqon Inc.(Woburn,MA),而引物PNA购自PNABio(Thousand Oaks,CA)。来自表45的以下引物序列用于使用HT29细胞系DNA作为模板对于10种基因进行的PCR-LDR-qPCR多路复用甲基化测定中:SEQ ID NO:1、2和6-75。
PCR反应。PCR反应通过混合以下物质进行(10μl体积):2μl不含镁的Gotaq Flexi缓冲液5x(Promega,Madison,Wis.),0.8μl的25mM MgCl2(Promega,Madison,Wis.),0.2μl的dNTP(具有dATP、dCTP、dGTP和dUTP;各自10mM)(Promega,Madison,Wis.),0.125μl的各自4μM的10种特异性正向引物和反向引物。0.625μl的4μM阻断剂(如果有的话),0.25μl的20mU/μl RNA酶H2(IDT)(在RNA酶H2稀释缓冲液中自2U/μl的IDT原始RNA酶H2稀释),0.22μl与Platinum Taq抗体(Invitrogen/Thermo Fisher,Waltham,Mass.)混合的Klentaql聚合酶(DNA Polymerase Technology,St.Louis,Mo.)(所述混合物通过将0.02μl的50U/μlKlentaql聚合酶添加到0.2μl的5U/μlPlatinum Taq抗体中制备),DNA模板:(1)10ng亚硫酸氢盐转化的HT29 DNA,(2)0.07ng亚硫酸氢盐转化的HT29 DNA和10ng亚硫酸氢盐转化的正常DNA,(3)10ng亚硫酸氢盐转化的正常DNA。PCR反应在ProFlex PCR系统热循环仪(AppliedBio-systems/ThermoFisher,Waltham,Mass.)中进行,并用以下程序进行:在94℃下2分钟,循环40次(在94℃下20秒,在60℃下40秒且在72℃下30秒),在99.5℃下10分钟以钝化KlanTaq聚合酶,并且最后保持在4℃下。
LDR步骤。LDR步骤在10μl反应物中进行,所述反应物通过添加以下物质制备:2.02μl无核酸酶的水(IDT),1μl的10X AK16D连接酶反应缓冲液[lX缓冲液含有20mM Tris-HCl,pH 8.5(Bio-Rad,Hercules,Calif.),5mM MgCl2(Sigma-Aldrich,St.Louis,Mo.),50mMKCl(Sigma-Aldrich,St.Louis,Mo.),10mM DTT(Sigma-Aldrich,St.Louis,Mo.)和20μg/mlBSA(Sigma-Aldrich,St.Louis,Mo.)],0.25μl的40mM DTT(Sigma-Aldrich,St.Louis,Mo.),0.2μl的50mM NAD+(Sigma-Aldrich,St.Louis,Mo.),0.25μl的20mU/μl RNA酶H2(IDT),0.2μl的500nM对应10种基因LDR上游探针,0.2μl的500nM对应10种基因LDR下游探针,0.284μl的0.88μM纯化的AK16D连接酶和2μl的来自先前步骤的PCR反应产物。LDR反应在ProFlex PCR系统热循环仪(Applied Biosystems/ThermoFisher;Waltham,Mass.)中使用以下程序进行:20次循环(在94℃下10秒,且在60℃下4分钟),然后保持在4℃下。
qPCR步骤。qPCR反应作为单路进行,其中每种反应混合物仅含有一组基因特异性引物和探针。10μl反应混合物通过混合以下物质制备:1.5μl无核酸酶的水(IDT),5μl得自Applied Biosystems(Applied Biosystems/ThermoFisher;Waltham,Mass.)的2x TaqMan
Figure GDA0003856873510005752
Fast Universal PCR Master Mix(Fast amplitaq、UDG和dUTP),1μl的2.5μM TaqManTM测定正向引物,1μl的2.5μM TaqmanTM反向引物,0.5μl的5μM TaqmanTM探针和1μl的LDR反应产物。qPC R反应在得自Applied Biosystems(Applied Biosystems/Thermo-Fishe r;Waltham,Mass.)的ViiA7实时热循环仪中使用用MicroAmpTM光学粘合膜密封的MicroAmp
Figure GDA0003856873510005753
Fast-96孔反应0.1ml板(Applied Biosyst ems/ThermoFisher;Waltham,Mass.)进行,具有以下设置:快速阻断,标准曲线作为实验类型,ROX作为被动参考,Ct作为定量方法(自动阈值,但需要时调整至0.05),TAMRA作为报告物,且NFQ-MGB作为猝灭剂。所用的具体程序如下:在50℃下2分钟,并且循环45次(在95℃下1秒,且在60℃下20秒)。结果示于图73中,并且Ct值示于表59中。
表59.实施例2中测定的基因的Ct值。
Figure GDA0003856873510005751
Figure GDA0003856873510005761
注:NTC:无模板对照
实施例3:使用ex-PCR-LDR-qPCR对亚硫酸氢盐转化的HT29细胞系DNA多路复用检测7种CRC甲基化标记物
在20μl反应体积中,将500ng HT29细胞系基因组DNA与12单位的限制性内切酶Bsh1236I在1xCutSmart缓冲液(50mM乙酸钾、20mM Tris-乙酸、10mM乙酸镁、100μg/ml BSA,pH7.9@25℃)中混合。此消化反应在37℃下进行1小时,然后在80℃下酶钝化20分钟。亚硫酸氢盐转化使用得自Applied Biosystem Corporation(Carlsbad,Calif.)的Cells-to-CpG亚硫酸氢盐转化试剂盒进行。对于此反应,将5μl变性试剂添加到45μl限制性消化的或甲基富集的基因组DNA中,并将混合物在50℃下孵育10分钟(以使DNA变性)。将100μl转化试剂添加到混合物中,然后在热循环仪中用以下循环条件孵育:在65℃下30分钟、在90℃下30秒、在65℃下30分钟、在90℃下30秒、在65℃下30分钟。然后将150μl亚硫酸氢盐转化的DNA混合物与600μl结合缓冲液在结合柱中混合。将柱以10,000rpm离心1分钟,然后弃去流过液。然后用600μl洗涤缓冲液洗涤所述柱。然后添加200μl脱磺酸基试剂,并且在室温下将柱孵育15分钟。在旋转之后,用400μl洗涤缓冲液再次洗涤柱。然后将50μl洗脱缓冲液添加到柱中以洗脱DNA。由于洗脱的亚硫酸氢盐转化的DNA大部分是单链DNA,所以使用Quant-iT OliGreen和Pico Green试剂盒(Life Technologies/ThermoFisher;Waltham,Mass.)对其进行定量。
必要的引物大部分购自Integrated DNA Technologies Inc.(IDT;Coralville,IA)。LNA1和LNA2引物购自Exiqon Inc.(Woburn,MA),而PNA引物购自PNA Bio(ThousandOaks,CA)。在实施例3中使用来自表45的以下引物序列:SEQ ID NO.:1、2、6-39、54-60和68-75。
线性扩增步骤。线性扩增步骤在25μl反应混合物中进行,所述反应混合物具有:5μl不含镁的Gotaq Flexi缓冲液5X(Promega,Madison,Wis.),2.5μl的25mM MgCl2(Promega,Madison,Wis.),0.5μl dNTP(dATP、dCTP、dGTP和dTTP,各自10mM)(Promega,Madison,Wis.),1.25μl 7路复用基因特异性单向引物(每种基因的引物的浓度为2μM),0.625μl的20mU/μl RNA酶H2(IDT)(在RNA酶H2稀释缓冲液中自IDT稀释),和0.55μl与Plantinim Taq抗体(Invitrogen/Thermo Fisher,Waltham,Mass.)混合的Klentaql聚合酶(DNAPolymerase Technology,St.Louis,Mo.)(所述混合物通过将0.02μl的50U/μl Klentaql聚合酶添加到0.2μl的5U/μl Platinum Taq抗体中制备),和14.5μl的对应亚硫酸氢盐转化的基因组DNA(出自50μl的亚硫酸氢盐转化之后洗脱的DNA)。DNA模板是:(1)10ng亚硫酸氢盐转化的HT29 DNA,(2)与10ng得自Roche的亚硫酸氢盐转化的正常DNA混合的0.1ng亚硫酸氢盐转化的HT29,(3)10ng得自Roche的亚硫酸氢盐转化的正常DNA。线性扩增反应在ProFlexPCR系统热循环仪(Applied Biosystems/ThermoFisher,Waltham,Mass.)中进行,并且用以下程序进行:在94℃下2分钟,循环40次(在94℃下20秒,在60℃下40秒且在72℃下30秒),最后保持在4℃下。在反应之后,在反应混合物中添加Platinum Taq抗体以抑制Klentaq DNA聚合酶。
PCR反应。将线性扩增产物等分成两部分(对于4种CpG标记物,4路复用,且对于3种CpG标记物,3路复用)。PCR步骤以20μl反应体积进行,反应物通过混合以下物质制备:2μl不含镁的5X GoTaq Flexi缓冲液(Promega,Madison,Wis.),1μl的25mM MgCl2(Promega,Madison,Wis.),0.4μl dNTP(dATP、dCTP、dGTP和dUTP,各自10mM)(Promega,Madison,Wis.),1μl的每种反链PCR引物(2μM浓度),0.4μl南极不耐热UDG(1u/μl)(New EnglandBiolab,Ipswich,MA),0.25μl的20mU/μl RNA酶H2(IDT),0.44μl与Plantinim Taq抗体(Invitrogen/Thermo Fisher,Waltham,Mass.)混合的Klentaql聚合酶(DNA PolymeraseTechnology,St.Louis,Mo.)(所述混合物通过将0.02μl的50U/μl Klentaql聚合酶添加到0.2μl的5U/μl Platinum Taq抗体中制备),和12μl的对应线性扩增产物。PCR反应在ProFlex PCR系统热循环仪(Applied Biosystems/ThermoFisher,Waltham,Mass.)中用以下程序进行:在37℃下10分钟,循环40次(在94℃下20秒,在60℃下40秒且在72℃下30秒),在99.5℃下10分钟,且最后保持在4℃下。
LDR步骤。LDR步骤以20μl反应体积通过混合以下物质进行:11.6μl无核酸酶的水(IDT),2μl 10X AK16D连接酶反应缓冲液[lX缓冲液含有20mM Tris-HCl pH 8.5(Bio-Rad,Hercules,Calif.),5mM MgCl2(Sigma-Aldrich,St.Louis,Mo.),50mM KCl(Sigma-Aldrich,St.Louis,Mo.),10mM DTT(Sigma-Aldrich,St.Louis,Mo.)和20μg/ml BSA(Sigma-Aldrich,St.Louis,Mo.),0.5μl的40mM DTT(Sigma-Aldrich,St.Louis,Mo.),0.4μl的50mM NAD+(Sigma-Aldrich,St.Louis,Mo.),0.5μl的20mu/μl RNA酶H2(IDT),0.4μl的500nM对应4路复用LDR上游探针,0.4μl的500nM对应4路复用LDR下游探针(对于其他LDR反应,3路复用),0.57μl的0.88μM纯化的AK16D连接酶和4μl的来自先前步骤的对应PCR反应产物。LDR反应在ProFlex PCR系统热循环仪(Applied Biosystems/ThermoFisher;Waltham,Mass.)中使用以下程序进行:循环20次(在94℃下10秒,且在60℃下4分钟),然后最后保持在4℃下。
qPCR步骤。单路qPCR反应(即每个反应管仅含有对独特CpG位点具有特异性的引物和探针)在10μl反应混合物中进行,所述反应混合物含有:3μl无核酸酶的水(IDT),5μl得自Applied Biosystems(Applied Biosystems/ThermoFisher;Waltham,Mass.)的2x TaqMan
Figure GDA0003856873510005781
Fast Universal PCR Master Mix(Fast Amplitaq、UDG和dUTP),0.5μl5μM的TaqManTM测定正向引物和5μM的TaqmanTM测定反向引物的混合物,0.5μl 5μM的TaqmanTM探针和1μl对应LDR反应产物。反应在得自Applied Biosystems(Applied Biosystems/ThermoFisher;Waltham,Mass.)的ViiA7实时热循环仪中使用用MicroAmpTM光学粘合膜密封的MicroAmp
Figure GDA0003856873510005792
Fast-96孔反应0.1ml板(Applied Biosystems/ThermoFisher;Waltham,Mass.)进行,具有以下设置:快速阻断,标准曲线作为实验类型,ROX作为被动参考,Ct作为定量方法(自动阈值,但需要时调整至0.05),TAMRA作为报告物,且NFQ-MGB作为猝灭剂。热循环仪的程序如下:在50℃下2分钟,并且循环45次(在95℃下1秒,且在60℃下20秒)。Ct曲线和值分别示于图74和Ct表60中。
表60.实施例3中7种基因的Ct值。
Figure GDA0003856873510005791
实施例4:使用ex-PCR-LDR-qPCR对肿瘤血浆中的亚硫酸氢盐转化的无细胞DNA多路复用检测7种CRC甲基化标记物
人血浆(具有K2-EDTA作为抗凝剂)样品自供应商购得。无细胞DNA使用QIA amp循环核酸试剂盒(Qiagen)根据制造商的说明书从单独血浆样品(5mL)中分离,并用Quant-iTPico Green Assay Life Technologies/Thermo-Fisher;Waltham,Mass.)定量。CpG甲基化的无细胞DNA片段通过含有甲基-CpG结合结构域的抗体富集。采用一系列的洗涤步骤、磁性捕获和在65℃下孵育,然后洗脱甲基化富集的无细胞DNA。
富集的甲基化无细胞DNA的亚硫酸氢盐转化使用得自Analytic JenaCorporation(Jena,Germany)的innuCONVERT亚硫酸氢盐体液试剂盒进行。转化反应通过添加50μl富集的无细胞DNA、70μl转化试剂、30μl转化缓冲液在150μl混合物中进行。将混合物在热混合器中在85℃下孵育45分钟,同时以800rpm的速度振荡。在孵育之后,将700μl结合缓冲液添加到反应混合物中,然后装载到旋转柱中,然后离心。然后将200μl洗涤溶液BS添加到柱中,然后离心。然后将700μl脱磺酸基缓冲液添加到柱中,并且在室温下孵育10分钟。然后使柱经历一系列的洗涤步骤:500μl洗涤溶液C,650μl洗涤溶液BS,650μl乙醇(两次)。然后将柱在60℃下孵育10分钟以去除残留的乙醇。最后用50μl洗脱缓冲液洗脱DNA。
用于上述实施例的引物与实施例3中使用的那些相同。线性扩增、PCR、LDR和qPCR步骤如实施例3中所述进行。使用所述协定测试三组无细胞DNA样品(一组由CRC患者/正常对组成)。使用从3名不同CRC患者和3名不同正常对照的血浆中分离的cfDNA得到的结果示于图75、图76和图77中。
实施例5:使用ex-PCR-LDR-qPCR对亚硫酸氢盐转化的HT29细胞系DNA多路复用检测20种CRCM标记物
用于所述特定实施例的模板也是自HT29提取且使用得自Covaris(Woburn,Massachusetts)的超声发生器通过非随机超声处理方法片段化的基因组DNA。在剪切之后,用Agilent Bioanalyzer系统评估DNA质量。DNA的长度在50bp至1kb范围内。洗脱缓冲液中的DNA使用Pico Green试剂盒(Life Technologies/Thermo-Fisher;Waltham,Mass.)定量。
含有甲基化CpG位点的DNA片段通过与含有甲基-CpG结合结构域的抗体结合而富集。在一系列的洗涤步骤,然后磁性捕获之后,通过在65℃下孵育,在小体积的水中洗脱富集的DNA样品。
亚硫酸氢盐转化然后使用得自ThermoFisher(Carlsbad,Calif.)的AppliedBiosystem部门的Cells-to-CpG亚硫酸氢盐转化试剂盒进行。将5μl变性试剂添加到45μl富含甲基的基因组DNA中,然后将混合物在50℃下孵育10分钟。然后添加100μl转化试剂,并且在热循环仪中用以下程序孵育:在65℃下30分钟、在90℃下30秒、在65℃下30分钟、在90℃下30秒、在65℃下30分钟。将150μl转化的DNA混合物与600μl结合缓冲液在结合柱中混合。将柱以10,000rpm离心1分钟,然后弃去流过液。用600μl洗涤缓冲液洗涤所述柱。将200μl脱磺酸基试剂添加到柱中,然后在室温下孵育15分钟。在旋转之后,用400μl洗涤缓冲液再次洗涤柱。然后将50μl洗脱缓冲液添加到柱中以洗脱结合的DNA。主要单链的亚硫酸氢盐转化的DNA用Quant-iT Oli Green试剂盒和Pico Green试剂盒两者(Life Technologies/ThermoFisher;Waltham,Mass.)定量。
在前述实施例中使用的所有引物都购自Integrated DNA Technologies Inc.(IDT;Coralville,IA)。在实施例5中使用来自表45的以下引物序列:SEQ ID NO.:76-235。
线性扩增步骤。以25μl的反应体积,线性扩增步骤通过混合以下物质进行:5μl 5xGoTaq Flexi缓冲液(无镁)(Promega,Madison,Wis.),2.5μl 25mM MgCl2(Promega,Madison,Wis.),0.5μl的10mM dNTP(dATP、dCTP、dGTP和dTTP)(Promega,Madison,Wis.),2.5μl20路复用基因特异性反向引物(每种引物的浓度为1μM),0.625μl的20mU/μl RNA酶H2(在RNA酶H2稀释缓冲液中自IDT稀释)(IDT),和0.55μl与Plantinim Taq抗体(Invitrogen/Thermo Fisher,Waltham,Mass.)混合的Klentaql聚合酶(DNA Polymerase Technology,St.Louis,Mo.)(所述混合物通过将0.02μl的50U/μl Klentaql聚合酶添加到0.2μl的5U/μlPlatinum Taq抗体中制备),和5.0μl的对应亚硫酸氢盐转化的基因组DNA(出自50μl的亚硫酸氢盐转化之后洗脱的DNA)。模板是:1)与66.0ng HT29结肠直肠细胞系基因组DNA混合的1.0μg正常人基因组DNA(购自Roche),或2)仅1.0μg正常人基因组DNA(正常对照)。将所述模板用限制性酶Bsh1236I消化,或富集在甲基化DNA中,亚硫酸氢盐转化,并且洗脱到50μl洗脱缓冲液中。在线性扩增反应中使用5μl洗脱缓冲液。反应在ProFlex PCR系统热循环仪(Applied Biosystems/ThermoFisher,Waltham,Mass.)中使用以下程序进行:在94℃下2分钟,循环40次(在94℃下20秒,在60℃下40秒且在72℃下30秒),并且最后保持在4℃下。在反应之后,在反应混合物中添加Platinum Taq抗体以抑制Klentaq DNA聚合酶。
PCR反应。将线性扩增产物等分为两部分。在第1部分中,添加第一10路复用(出自20路复用)基因特异性正向引物和其他试剂,在第2部分中,添加其他10路复用(出自20路复用)基因特异性正向引物和其他试剂。进行两个10路复用PCR反应。PCR步骤在20μl反应混合物中进行,所述反应混合物通过添加以下物质制备:2μl不含镁的GoTaq Flexi缓冲液5x(Promega,Madison,Wis.),1μl 25mM MgCl2(Promega,Madison,Wis.),0.4μl dNTP(具有dATP、dCTP、dGTP和dUTP;各自10mM)(Promega,Madison,Wis.),2μl各自0.5μM的10路复用(出自线性扩增步骤中的20路复用)基因特异性正向引物。0.4μl南极不耐热UDG(1u/μl)(New England Biolab,Ipswich,MA),0.25μl的20mU/μl RNA酶H2(IDT),0.44μl与Plantinim Taq抗体(Invitrogen/Thermo Fisher,Waltham,Mass.)混合的Klentaql聚合酶(DNA Polymerase Technology,St.Louis,Mo.)(所述混合物通过将0.02μl的50U/μlKlentaql聚合酶添加到0.2μl的5U/μl Platinum Taq抗体中制备),和10μl的对应线性扩增产物。PCR反应在ProFlex PCR系统热循环仪(Applied Biosystems/ThermoFisher;Waltham,Mass.)中且使用以下程序进行:在37℃下10分钟,循环40次(在94℃下20秒,在60℃下40秒且在72℃下30秒),在99.5℃下10分钟,且最后保持在4℃下。
LDR步骤。LDR步骤在20μl反应物中进行,所述反应物通过组合以下物质制备:5.82μl无核酸酶的水(IDT),2μl 10X AK16D连接酶反应缓冲液[lx缓冲液含有20mM Tris-HClpH 8.5(Bio-Rad,Hercules,Calif.),5mM MgCl2(Sigma-Aldrich,St.Louis,Mo.),50mMKCl(Sigma-Aldrich,St.Louis,Mo.),10mM DTT(Sigma-Aldrich,St.Louis,Mo.)和20μg/mlBSA(Sigma-Aldrich,St.Louis,Mo.),0.5μl的40mM DTT(Sigma-Aldrich,St.Louis,Mo.),0.25μl的40mM NAD+(Sigma-Aldrich,St.Louis,Mo.),0.5μl的20mU/μl RNA酶H2(IDT),0.4μl的各自500nM的对应10路复用LDR上游探针,0.4μl的各自500nM的对应10路复用LDR下游探针,0.57μl纯化的AK16D连接酶(0.88μM)和4μl来自先前步骤的PCR反应产物。LDR反应在ProFlex PCR系统热循环仪(Applied Biosystems/Thermo-Fisher;Waltham,MA)中使用以下程序进行:循环20次(在94℃下10秒,且在60℃下4分钟),然后最后保持在4℃下。
qPCR步骤。qPCR步骤以10μl反应体积通过组合以下物质进行:1.5μl无核酸酶的水(IDT),5μl得自Applied Biosystems(Appl ied Biosystems/ThermoFisher;Waltham,Mass.)的2x TaqMan
Figure GDA0003856873510005832
Fast Universal PCR Master Mix(Fast amplitaq、UDG和dUTP),1μl的2.5μM TaqManTM测定正向引物,1μl的2.5μM TaqmanTM反向引物,0.5μl的5μM TaqmanTM探针和1μl的LDR反应产物。qPCR反应在得自Applied Biosystems(Applied Biosystems/Thermo-Fisher;Waltham,Mass.)的ViiA7实时热循环仪中使用用MicroAmpTM光学粘合膜密封的MicroAmp
Figure GDA0003856873510005833
Fast-96孔反应0.1ml板(Applied Biosystem s/ThermoFisher;Waltham,Mass.)进行,具有以下设置:快速阻断,标准曲线作为实验类型,ROX作为被动参考,Ct作为定量方法(自动阈值,但需要时调整至0.05),TAMRA作为报告物,且NFQ-MGB作为猝灭剂。采用的程序是:在50℃下2分钟,并且循环45次(在95℃下1秒,且在60℃下20秒)。结果显示在图78和下表61中。
表61.实施例5中每种基因的Ct值。
Figure GDA0003856873510005831
Figure GDA0003856873510005841
实施例6:使用ex-PCR-LDR-qPCR对亚硫酸氢盐转化的HT29细胞系DNA多路复用检测20种CRCM标记物
一般方法:将HT-29结肠腺癌细胞接种在60cm2培养皿中在含有4.5g/l葡萄糖、补充有10%胎牛血清的McCoy's 5A培养基中,并保持在含有5%CO2的潮湿气氛中。细胞一旦达到80-90%融合度,则将其在磷酸盐缓冲盐水(x3)中洗涤,并通过离心(500xg)收集。使用得自QIAGEN的DNeasy Blood&Tissue试剂盒(Qiagen,Valencia,Calif.)分离基因组DNA,并使用Quant-iT Pico green ds DNA测定试剂盒(Thermo-Fisher,Waltham,MA.)测量其浓度。从正常人血液(血沉棕黄层)中分离的高分子量(>50kb)基因组DNA(0.2mg/ml)(Roche人基因组DNA)购自Roche(Indianapolis,Ind.)。使用Quant-iT PicoGreendsDNA测定试剂盒(Thermo-Fisher,Waltham,MA.)类似地测定其浓度。使用Covaris超声发生器E220(Covaris,Woburn,MA)通过非随机超声方法将1.0μg HT29细胞系基因组DNA或Roche正常DNA片段化。剪切后,用Agilent Bioanalyzer系统2100(Agilent,Santa Clara,CA)评估所得DNA片段(长度在50kb至1kb碱基对范围内)的质量。
甲基化DNA的富集:使用得自New England Biolabs的EpiMark
Figure GDA0003856873510005851
甲基化DNA富集试剂盒根据制造商的说明书(New England Biolabs,Ipswich,MA)通过甲基化特异性抗体捕获含甲基化CpG的DNA片段。含有甲基化CpG位点的DNA片段通过与含有甲基-CpG结合结构域的抗体结合而富集。在一系列的洗涤步骤,然后磁性捕获之后,通过在65℃下孵育,在小体积的水中洗脱富集的DNA样品。
DNA的亚硫酸氢盐转化:DNA中胞嘧啶碱基的亚硫酸氢盐转化然后使用得自ThermoFisher(ThermoFisher,Carlsbad,Calif.)的AppliedBiosystem部门的Cells-to-CpG亚硫酸氢盐转化试剂盒进行。将5μl变性试剂添加到45μl富含甲基的基因组DNA中,然后将混合物在50℃下孵育10分钟。在添加100μl转化试剂之后,将混合物在热循环仪中用以下程序孵育:在65℃下30分钟、在90℃下30秒、在65℃下30分钟、在90℃下30秒、在65℃下30分钟。将150μl转化的DNA混合物与600μl结合缓冲液在结合柱中混合。将柱以10,000rpm离心1分钟,然后弃去流过液。用600μl洗涤缓冲液洗涤所述柱。将200μl脱磺酸基试剂添加到柱中,然后在室温下孵育15分钟。在旋转之后,用400μl洗涤缓冲液再次洗涤柱。然后将50μl洗脱缓冲液添加到柱中以洗脱结合的DNA。主要单链的亚硫酸氢盐转化的DNA用Quant-iT OliGreen ss DNA试剂盒和Pico Green ds DNA试剂盒两者(ThermoFisher,Waltham,Mass.)定量。
PCR引物、LDR探针和LNA或PNA阻断引物:所用的所有引物都列于上表45中。所有引物均购自Integrated DNA Technologies Inc.(IDT)(Coralville,Iowa)。在前述实施例中使用的所有引物都购自Integrated DNA Technologies Inc.(IDT;Coralville,IA)。末端编号为02A的引物与末端具有02的引物具有相同的序列,但其没有短(10聚体)5'端尾部序列。
模板制备:模板“A”:将1ug超声处理和甲基化富集的Roche正常DNA与6.6ng超声处理的HT29 DNA在50μl中混合,10ng人基因组DNA等于3,000基因组当量(GE)。甲基化富集的收率为约50%,并且亚硫酸氢盐转化率为约50%。因此模板A含有在50μl中的75,000GE的Roche DNA和2,000GE的HT29 DNA。在线性扩增反应中使用5ul DNA模板A,其含有7,500GE的Roche DNA和200GE的HT29 DNA,模板“B”:将1μg超声处理和甲基化富集的Roche正常DNA亚硫酸氢盐转化,并且其具有在50μl中的75,000GE的Roche DNA。
在以下实验中,将使用5μl HT29 DNA,并且其含有1,000GE的HT29和7,500GE的Roche DNA。在线性扩增反应中使用5μl DNA模板B,其含有7,500GE的Roche正常DNA。
线性扩增步骤:对于条件A,以25μl的反应体积,线性扩增步骤通过混合以下物质进行:5μl 5x Gotaq Flexi缓冲液(无镁)(Promega,Madison,Wis.),3.5μl的25mM MgCl2(Promega,Madison,Wis.),0.5μl的10mM dNTP(dATP、dCTP、dGTP和dTTP)(Promega,Madison,Wis.),2.5μl第二组的具有10聚体短尾部的20路复用标记物特异性反向引物(每种引物的浓度为0.5μM,末端编号为02的引物具有短尾部,通用序列),0.5μl的吐温20(5%),0.9μl的20mU/μl RNA酶H2(在RNA酶H2稀释缓冲液中自IDT稀释)(IDT),和0.5μl与Plantinim Taq抗体(Invitrogen/Thermo Fisher,Waltham,Mass.)混合的Klentaql聚合酶(50U/μl)(DNA Polymerase Technology,St.Louis,Mo.)(Klentaql聚合酶与抗体的混合比为1:10,且Klentaql聚合酶的最后浓度为5U/ul),和5.0μl的对应亚硫酸氢盐转化的甲基化富集的基因组DNA(出自50μl的亚硫酸氢盐转化之后洗脱的DNA)。对于条件B,在其他25ul反应混合物中,除了2.5μl第二组没有尾部的20路复用标记物特异性反向引物(末端编号为02A的引物)之外,所有试剂都相同。模板是:1)5ul模板A,其含有200GE的HT29 DNA和7,500GE的Roche DNA。2)5ul模板B,其含有7,500GE的Roche DNA。反应在ProFlex PCR系统热循环仪(Applied Biosystems/ThermoFisher,Waltham,Mass.)中使用以下程序进行:在94℃下2分钟,循环40次(在94℃下20秒,在60℃下40秒且在72℃下30秒),并且最后保持在4℃下。在反应之后,在反应混合物中添加0.5μl的Platinum Taq抗体以抑制Klentaq DNA聚合酶。
PCR反应:将线性扩增产物平均分成两部分,进行两个10路复用反应。在第1部分中,添加第一10路复用(标记物编号21至编号30)标记物特异性正向引物和其他试剂,在第2部分中,添加第二10路复用(标记物编号31至编号40)标记物特异性正向引物和其他试剂。PCR步骤在20μl反应混合物中进行,所述反应混合物通过添加以下物质制备:2μl不含镁的Gotaq Flexi缓冲液5x(Promega,Madison,Wis.),1.4μl的25mM MgCl2(Promega,Madison,Wis.),0.4μl dNTP(具有dATP、dCTP、dGTP和dUTP;各自10mM)(Promega,Madison,Wis.),0.2μl吐温20(5%)、2μl的各自0.25μM的10路复用(第一10路复用和第二10路复用)标记物特异性正向引物。0.4μl南极不耐热UDG(1u/μl)(New England Biolab,Ipswich,MA),0.29μl的20mU/μlRNA酶H2(IDT),1.6μl与Plantinim Taq抗体(Invitrogen/Thermo Fisher,Waltham,Mass.)混合的Klentaql聚合酶(DNA Polymerase Technology,St.Louis,Mo.)(Klentaql聚合酶与抗体的混合比为1:10,且Klentaql聚合酶的最后浓度为5U/ul),10μl的对应线性扩增产物和1.7μl水。PCR反应在ProFlex PCR系统热循环仪(AppliedBiosystems/ThermoFisher;Waltham,Mass.)中且使用以下程序进行:在37℃下10分钟,循环50次(在94℃下10秒,在60℃下30秒,在72℃下20秒),在99.5℃下10分钟,并且最后保持在4℃下。
LDR步骤:LDR步骤在20μl反应混合物中进行,所述反应混合物通过组合以下物质制备:11.6μl无核酸酶的水(IDT),2μl 10XAK16D连接酶反应缓冲液[1x缓冲液含有20mMTris-HCl pH 8.5(Bio-Rad,Hercules,Calif.),5mM MgCl2(Sigma-Aldrich,St.Louis,Mo.),50mM KCl(Sigma-Aldrich,St.Louis,Mo.),10mM DTT(Sigma-Aldrich,St.Louis,Mo.)和20μg/ml BSA(Sigma-Aldrich,St.Louis,Mo.)],0.5μl的40mM DTT(Sigma-Aldrich,St.Louis,Mo.),0.4μl的50mM NAD+(Sigma-Aldrich,St.Louis,Mo.),0.5μl的20mU/μlRNA酶H2(IDT),0.4μl的各自500nM的对应10路复用LDR上游探针,0.4μl的各自500nM的对应10路复用LDR下游探针,0.57μl纯化的AK16D连接酶(0.88μM)和4μl来自先前步骤的PCR反应产物。LDR反应在ProFlex PCR系统热循环仪(Applied Biosystems/Thermo-Fisher;Waltham,MA)中使用以下程序进行:循环20次(在94℃下10秒,且在60℃下4分钟),然后最后保持在4℃下。
qPCR步骤:qPCR反应单路进行,qPCR步骤以10μl反应体积通过组合以下物质进行:3μl无核酸酶的水(IDT),5μl得自Applie d Biosystems(Applied Biosystems/ThermoFisher,Waltham,MA)的2x TaqMan
Figure GDA0003856873510005892
Fast Universal PCR Master Mix(Fastamplitaq、UDG和dUTP),0.5μl的5μM TaqManTM测定单标记物特异性正向引物和5μMTaqmanTM对应标记物特异性反向引物的混合物,0.5μl的5μM TaqmanTM单标记物特异性探针和1μl的LDR 10路复用反应产物。qPCR反应在得自Applied Biosystems(AppliedBiosystems/Ther mo-Fisher;Waltham,Mass.)的ViiA7实时热循环仪中使用用MicroA mpTM光学粘合膜密封的MicroAmp
Figure GDA0003856873510005893
Fast-96孔反应0.1ml板(Appli ed Biosystems/ThermoFisher;Waltham,Mass.)进行,具有以下设置:快速阻断,标准曲线作为实验类型,ROX作为被动参考,Ct作为定量方法(自动阈值,但需要时调整至0.05),TAMRA作为报告物,且NFQ-MGB作为猝灭剂。采用的程序是:在50℃下2分钟,并且循环45次(在95℃下1秒,且在60℃下20秒)。结果示于图79和图80以及下表62中。
表62.实施例6中每种基因的Ct值。
Figure GDA0003856873510005891
Figure GDA0003856873510005901
表62续.实施例6中每种基因的Ct值。
Figure GDA0003856873510005902
尽管本文中详细描绘并描述了优选的实施方案,但是相关领域的技术人员将显而易见的是,可以在不脱离本申请的精神的情况下进行各种修改、添加、取代等,因此,认为这些修改、添加、取代等在如权利要求限定的本申请的范围内。

Claims (85)

1.一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基,所述方法包括:
提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基;
提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列;
共混所述样品、所述一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种聚合酶延伸反应混合物;
使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含与所述靶核苷酸序列互补的核苷酸序列的一级延伸产物;
共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一级寡核苷酸引物组的一种或多种第二一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述靶核苷酸序列或其补体的一种或多种第一聚合酶链式反应产物;
提供一个或多个寡核苷酸探针组,每个探针组包含(a)具有5′引物特异性部分和3′靶序列特异性部分的第一寡核苷酸探针,和(b)具有5′靶序列特异性部分和3′引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于二级延伸产物的互补靶核苷酸序列上;
共混所述一种或多种第一聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组,以形成一种或多种连接反应混合物;
使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与其互补序列杂交时连接在一起,以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含5′引物特异性部分、靶特异性部分和3′引物特异性部分;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列;
共混所述连接的产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种第二聚合酶链式反应产物;和
检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述一种或多种第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
2.一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基,所述方法包括:
提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基;
提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
提供能够消化不含修饰的核苷酸的核酸分子的一种或多种核酸酶;
提供一种或多种第一一级寡核苷酸引物,其包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列;
共混所述样品、所述一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含保护延伸产物但不保护靶DNA免于核酸酶消化的一个或多个修饰的核苷酸的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种聚合酶延伸反应混合物;
使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述靶核苷酸序列的补体的一级延伸产物;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有第一5′引物特异性部分和与由所述第一一级寡核苷酸引物形成的一级延伸产物的一部分互补的3′部分,和(b)第二二级寡核苷酸引物,其具有第二5′引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3′部分;
共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个二级寡核苷酸引物组、所述一种或多种核酸酶、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一5′引物特异性部分、靶特异性核苷酸序列或其补体和所述第二5′引物特异性部分的补体的一种或多种第一聚合酶链式反应产物;
提供一个或多个三级寡核苷酸引物组,每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述一种或多种第一聚合酶链式反应产物的第一5′引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述一种或多种第一聚合酶链式反应产物的3′引物特异性部分互补的核苷酸序列;
共混所述一种或多种第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种第二聚合酶链式反应产物;和
检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述一种或多种第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
3.一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基,所述方法包括:
提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基;
提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
提供能够消化不含修饰的核苷酸的核酸分子的一种或多种核酸酶;
提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核酸分子中邻近所述靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列;
共混所述样品、所述一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含保护延伸产物但不保护靶DNA免于核酸酶消化的一个或多个修饰的核苷酸的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种聚合酶延伸反应混合物;
使所述一种或多种聚合酶延伸反应混合物经历适合消化存在于所述聚合酶延伸反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述靶核苷酸序列的补体的一级延伸产物;
共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种第二一级寡核苷酸引物、所述一种或多种核酸酶、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述靶核苷酸序列或其补体的第一聚合酶链式反应产物;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的3′部分,和(b)第二二级寡核苷酸引物,其具有包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3′部分;
共混所述第一聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物;和
检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个核苷酸、一个或多个拷贝数、一个或多个转录物序列和/或一个或多个甲基化残基。
4.一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基,所述方法包括:
提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基;
在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理;
提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列;
共混所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种聚合酶延伸反应混合物;
使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物;
共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物;
提供一个或多个寡核苷酸探针组,每个探针组包含(a)第一寡核苷酸探针,其具有5′引物特异性部分和3′亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分,和(b)第二寡核苷酸探针,其具有5′亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和3′引物特异性部分,并且其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于第一聚合酶链式反应产物的互补核苷酸序列上;
共混所述第一聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组,以形成一种或多种连接反应混合物;
使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与互补序列杂交时连接在一起,以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含所述5′引物特异性部分、所述亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和所述3′引物特异性部分;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列;
共混所述连接的产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物;和
检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
5.一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个多个甲基化残基,所述方法包括:
提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基;
在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理;
提供能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
提供一种或多种第一一级寡核苷酸引物,所述第一一级寡核苷酸引物包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列;
共混所述亚硫酸氢盐处理的样品、所述一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种聚合酶延伸反应混合物;
使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5′引物特异性部分和与由所述第一一级寡核苷酸引物形成的聚合酶延伸反应产物的一部分互补的3′部分,和(b)第二二级寡核苷酸引物,其具有5′引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3′部分;
共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个二级寡核苷酸引物组、能够消化含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种核酸酶、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的核酸分子但不消化包含修饰的核苷酸的一级延伸产物且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一二级寡核苷酸引物的5′引物特异性部分、所述亚硫酸氢盐处理的靶核苷酸序列特异性或补体序列特异性部分和所述第二二级寡核苷酸引物的5′引物特异性部分的补体的第一聚合酶链式反应产物;
提供一个或多个三级寡核苷酸引物组,每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物的5′引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的3′引物特异性部分互补的核苷酸序列;
共混所述第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物;和
检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述二级聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
6.一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基,所述方法包括:
提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基;
在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理;
提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列;
共混所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种聚合酶延伸反应混合物;
使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物;
共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由所述第一一级寡核苷酸引物形成的第一聚合酶链式反应产物的一部分互补的3′部分,和(b)第二二级寡核苷酸引物,其具有包含与由所述第一二级寡核苷酸引物形成的第一聚合酶链式反应产物的一部分互补的核苷酸序列的3′部分;
共混所述第一聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物;和
检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
7.一种用于鉴定样品中含有靶核苷酸序列的一个或多个亲本核酸分子的方法,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基,所述方法包括:
提供含有潜在地含有所述靶核苷酸序列的一个或多个亲本核酸分子的样品,所述靶核苷酸序列与其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基;
在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述样品中的核酸分子经历亚硫酸氢盐处理;
提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其具有5′引物特异性部分和包含与所述亚硫酸氢盐处理的亲本核酸分子中邻近含有所述一个或多个甲基化残基的亚硫酸氢盐处理的靶核苷酸序列的序列互补的核苷酸序列的3′部分,和(b)第二一级寡核苷酸引物,其具有5′引物特异性部分和包含与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3′部分;
共混所述亚硫酸氢盐处理的样品、所述一个或多个一级寡核苷酸引物组的一种或多种第一一级寡核苷酸引物、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种聚合酶延伸反应混合物;
使所述一种或多种聚合酶延伸反应混合物经历适合包括变性处理、杂交处理和延伸处理的一个或多个聚合酶延伸反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列的补体的一级延伸产物;
共混包含所述一级延伸产物的所述一种或多种聚合酶延伸反应混合物、所述一个或多个一级寡核苷酸引物组的一种或多种二级一级寡核苷酸引物、能够消化所述反应混合物中含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述亚硫酸氢盐处理的靶核苷酸序列或其补体的第一聚合酶链式反应产物;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的5′引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的3′引物特异性部分互补的核苷酸序列;
共混所述一级聚合酶链式反应产物序列、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物;和
检测和区分所述一种或多种第二聚合酶链式反应混合物中的所述第二聚合酶链式反应产物,以鉴定含有靶核苷酸序列的一个或多个亲本核酸分子的存在,所述靶核苷酸序列与所述样品中的其他亲本核酸分子中的核苷酸序列的差异在于一个或多个甲基化残基。
8.如权利要求1至7中任一项所述的方法,其还包括:
使所述样品与DNA修复酶接触以修复受损的DNA、DNA中的脱碱基位点、氧化碱基或切口。
9.如权利要求4至7中任一项所述的方法,其还包括:
在所述共混以形成一种或多种聚合酶延伸反应混合物之前或与其同时,使所述样品与至少第一甲基化敏感性酶接触以形成限制性酶反应混合物,其中所述第一甲基化敏感性酶裂解所述样品中在至少一个甲基化敏感性酶识别序列内含有一个或多个未甲基化残基的核酸分子,并且由此所述检测包括检测含有所述靶核苷酸序列的一个或多个亲本核酸分子,其中所述亲本核酸分子原始含有一个或多个甲基化残基。
10.如权利要求4至7中任一项所述的方法,其还包括:
使所述样品与固定的甲基化核酸结合蛋白或抗体接触以选择性地结合和富集所述样品中的甲基化核酸。
11.如权利要求1至7中任一项所述的方法,其中来自所述一个或多个一级或二级寡核苷酸引物组的引物包含如下部分,其在以碱基特异性方式与所述靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列杂交时没有或具有一个核苷酸序列错配,但是具有在来自所述一个或多个一级或二级寡核苷酸引物组的引物以碱基特异性方式与野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列中的对应核苷酸序列部分杂交时干扰聚合酶延伸的一个或多个额外核苷酸序列错配。
12.如权利要求1至7中任一项所述的方法,其中所述一级寡核苷酸引物组的一种或两种一级寡核苷酸引物和/或所述二级寡核苷酸引物组的一种或两种二级寡核苷酸引物具有包含可裂解的核苷酸或核苷酸类似物和阻断基团的3′部分,使得所述一种或多种引物的3′端不适合聚合酶延伸,所述方法还包括:
在所述杂交处理期间裂解一种或两种寡核苷酸引物的所述可裂解的核苷酸或核苷酸类似物,由此在所述延伸处理之前释放一种或两种寡核苷酸引物上的游离3′OH端。
13.如权利要求12所述的方法,其中来自所述一个或多个一级或二级寡核苷酸引物组的引物包含与所述靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列不同的序列,所述差异位于距离所述释放的游离3′OH端的两个或三个核苷酸碱基处。
14.如权利要求12所述的方法,其中所述可裂解的核苷酸包含一个或多个RNA碱基。
15.如权利要求1至7中任一项所述的方法,其还包括;
提供一种或多种阻断寡核苷酸引物,其在3′端包含一个或多个错配碱基或在3′端包含一种或多种核苷酸类似物和阻断基团,使得所述阻断寡核苷酸引物的3′端在以碱基特异性方式与野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列杂交时不适合聚合酶延伸,其中所述阻断寡核苷酸引物包含如下部分,其具有与所述阻断寡核苷酸引物所杂交的所述野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列中的核苷酸序列部分相同的核苷酸序列,但具有与所述靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列中的对应核苷酸序列部分的一个或多个核苷酸序列错配,和
在聚合酶延伸反应、聚合酶链式反应或连接反应之前,共混所述一种或多种阻断寡核苷酸引物与所述样品或后续产物,由此在杂交期间,所述一种或多种阻断寡核苷酸引物优先以碱基特异性方式与野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列杂交,由此在以碱基特异性方式与所述野生型序列或亚硫酸氢盐转化的未甲基化序列或其补体序列杂交的引物或探针的反应期间干扰聚合酶延伸或连接。
16.如权利要求3或6中任一项所述的方法,其中所述第一二级寡核苷酸引物具有5′引物特异性部分,且所述第二二级寡核苷酸引物具有5′引物特异性部分,所述一个或多个二级寡核苷酸引物组还包含第三二级寡核苷酸引物和(d)第四二级寡核苷酸引物,所述第三二级寡核苷酸引物包含与所述第一二级寡核苷酸引物的5′引物特异性部分相同的核苷酸序列,所述第四二级寡核苷酸引物包含与所述第二二级寡核苷酸引物的5′引物特异性部分相同的核苷酸序列。
17.一种用于鉴定样品中的含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的方法,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同,所述方法包括:
提供含有一个或多个亲本核糖核酸分子的样品,所述亲本核糖核酸分子含有在序列上潜在地与其他亲本核糖核酸分子不同的靶核糖核酸分子;
提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触;
提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核糖核酸分子中邻近所述靶核糖核苷酸序列的RNA序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的cDNA延伸产物的一部分互补的核苷酸序列;
共混所述接触的样品、所述一个或多个一级寡核苷酸引物组、包含dUTP的脱氧核苷酸混合物、逆转录酶和DNA聚合酶或具有逆转录酶活性的DNA聚合酶,以形成一种或多种逆转录/聚合酶链式反应混合物;
使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生所述靶核糖核酸的互补脱氧核糖核酸(cDNA)分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种不同的逆转录/聚合酶产物;
提供一个或多个寡核苷酸探针组,每个探针组包含(a)具有5′引物特异性部分和3′靶序列特异性部分的第一寡核苷酸探针,和(b)具有5′靶序列特异性部分和3′引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于对应于靶核糖核酸分子序列的逆转录酶/聚合酶产物的互补部分上;
使所述逆转录酶/聚合酶产物与连接酶和所述一个或多个寡核苷酸探针组接触,以形成一种或多种连接反应混合物;
使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一探针和第二探针在与其补体杂交时连接在一起,以在所述连接酶反应混合物中形成连接的产物序列,其中每个连接的产物序列包含所述5′引物特异性部分、所述靶特异性部分和所述3′引物特异性部分;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列;
共混所述连接的产物序列、所述一个或多个二级寡核苷酸引物组与能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第一聚合酶链式反应产物;和
检测和区分所述第一聚合酶链式反应产物,由此鉴定含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的存在,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。
18.一种用于鉴定样品中的含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的方法,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同,所述方法包括:
提供含有一个或多个亲本核糖核酸分子的样品,所述亲本核糖核酸分子含有在序列上潜在地与其他亲本核糖核酸分子不同的靶核糖核酸分子;
提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触;
提供一个或多个一级寡核苷酸引物组,每个一级寡核苷酸引物组包含(a)第一一级寡核苷酸引物,其包含与所述亲本核糖核酸分子中邻近所述靶核苷酸序列的RNA序列互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含与由所述第一一级寡核苷酸引物形成的cDNA延伸产物的一部分互补的核苷酸序列;
共混所述接触的样品、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物、逆转录酶和DNA聚合酶或具有逆转录酶活性的DNA聚合酶,以形成一种或多种逆转录/聚合酶链式反应混合物;
使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生所述靶RNA的互补脱氧核糖核酸(cDNA)分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成一种或多种不同的逆转录/一级聚合酶链式反应产物;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有与由所述第一一级寡核苷酸引物形成的逆转录/一级聚合酶链式反应产物的一部分互补的3′部分,和(b)第二二级寡核苷酸引物,其具有包含与由所述第一二级寡核苷酸引物形成的逆转录/一级聚合酶链式反应产物的一部分互补的核苷酸序列的3′部分;
共混所述逆转录/一级聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成第一聚合酶链式反应产物;和
检测和区分所述第一聚合酶链式反应产物,由此鉴定含有靶核糖核酸序列的一个或多个亲本核糖核酸分子的存在,所述靶核糖核酸序列由于替代剪接、替代转录物、替代起始位点、替代编码序列、替代非编码序列、外显子插入、外显子缺失、内含子插入、易位、突变或基因组水平上的其他重排而与所述样品中的其他亲本核糖核酸分子的核糖核酸序列不同。
19.一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基,所述方法包括:
提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基;
提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触;
共混所述接触的样品与连接酶和一个或多个第一寡核苷酸初步探针,以形成一种或多种第一连接反应混合物,所述第一寡核苷酸初步探针包含5′磷酸、5′茎-环部分、在环区域内的内部引物特异性部分、阻断基团和与靶miRNA分子序列的3′部分互补的3′核苷酸序列;
在所述一种或多种第一连接反应混合物中,将所述一个或多个靶miRNA分子在其3′端与所述一个或多个第一寡核苷酸初步探针的5′磷酸连接,以产生附加到所述一个或多个第一寡核苷酸初步探针的包含所述靶miRNA分子序列(如果存在于所述样品中)的嵌合核酸分子;
提供一个或多个一级寡核苷酸引物组,每个引物组包含(a)第一一级寡核苷酸引物,其包含与所述第一寡核苷酸初步探针的内部引物特异性部分互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含5′引物特异性部分和3′部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同;
共混包含嵌合核酸分子的所述一种或多种第一连接反应混合物、所述一个或多个一级寡核苷酸引物组、能够消化所述样品中的含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶,以形成一种或多种逆转录/聚合酶链式反应混合物;
使所述一种或多种逆转录/聚合酶链式反应混合物经历适合消化存在于所述逆转录/聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子的条件,适合产生所述嵌合核酸分子的互补脱氧核糖核酸(cDNA)分子且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述5’引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列和所述内部引物特异性部分的补体的一种或多种不同的一级逆转录/聚合酶链式反应产物及其补体;
提供一个或多个寡核苷酸探针组,每个探针组包含(a)具有5′引物特异性部分和3′靶序列特异性部分的第一寡核苷酸探针,和(b)具有5′靶序列特异性部分、与一级延伸产物互补的部分和3′引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交于对应于所述靶miRNA分子序列或其补体的一级逆转录/聚合酶链式反应产物的互补部分上;
使所述一级逆转录/聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组接触,以形成一种或多种第二连接反应混合物;
使所述一种或多种第二连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与其补体杂交时连接在一起,以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含所述5′引物特异性部分、所述靶特异性部分和所述3′引物特异性部分;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列;
共混所述连接的产物序列和所述一个或多个二级寡核苷酸引物组与能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物;和
检测和区分所述一个或多个反应中的二级聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
20.一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基,所述方法包括:
提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基;
提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触;
共混所述接触的样品与连接酶和一个或多个第一寡核苷酸探针,以形成一种或多种第一连接反应混合物,所述第一寡核苷酸探针包含5′磷酸、5′茎-环部分、在环区域内的内部引物特异性部分、阻断基团和与靶miRNA分子序列的3′部分互补的3′核苷酸序列;
在所述一种或多种连接反应混合物中,将所述一个或多个靶miRNA分子在其3′端与所述一个或多个第一寡核苷酸探针的5′磷酸连接,以产生附加到所述一个或多个第一寡核苷酸探针的包含所述靶miRNA分子序列(如果存在于所述样品中)的嵌合核酸分子;
提供一个或多个一级寡核苷酸引物组,每个引物组包含(a)第一一级寡核苷酸引物,其包含与所述第一寡核苷酸探针的内部引物特异性部分互补的核苷酸序列,和(b)第二一级寡核苷酸引物,其包含5′引物特异性部分和3′部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同;
共混包含嵌合核酸分子的所述一种或多种连接反应混合物、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶,以形成一种或多种逆转录/聚合酶链式反应混合物;
使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生所述嵌合核酸分子的互补脱氧核糖核酸(cDNA)分子且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成包含所述5’引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列和所述内部引物特异性部分的补体的一种或多种不同的一级逆转录/聚合酶链式反应产物及其补体;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5′引物特异性部分和与由所述第一一级寡核苷酸引物形成的延伸产物的一部分互补的3′部分,和(b)第二二级寡核苷酸引物,其具有5′引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的延伸产物的一部分互补的核苷酸序列的3′部分;
共混所述一级逆转录/聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含所述第一二级寡核苷酸引物的5′引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列和另一5′引物特异性部分第二二级寡核苷酸引物的补体的第一聚合酶链式反应产物;
提供一个或多个三级寡核苷酸引物组,每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的5′引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物或其补体的3′引物特异性部分互补的核苷酸序列;
共混所述第一聚合酶链式反应过程产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第二聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物;和
检测和区分所述第二聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
21.一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基,所述方法包括:
提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基;
提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触;
共混所述接触的样品与ATP和Poly(A)聚合酶以形成Poly(A)聚合酶反应混合物;
使所述Poly(A)聚合酶反应混合物经历适合将均聚物A附加到潜在地存在于所述样品中的所述一个或多个靶miRNA分子的3′端的条件;
提供一个或多个一级寡核苷酸引物组,每个引物组包含(a)第一一级寡核苷酸引物,其包含5′引物特异性部分、内部poly dT部分和包含与所述靶miRNA的3′端互补的1至10个碱基的3′部分,其中所述第一一级寡核苷酸引物与其他组中的其他第一一级寡核苷酸引物可以相同或者可以不同,和(b)第二一级寡核苷酸引物,其包含5′引物特异性部分和3′部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同;
共混所述Poly(A)聚合酶反应混合物、所述一个或多个一级寡核苷酸引物组、能够消化所述样品中的含脱氧尿嘧啶(dU)的核酸分子的所述一种或多种酶、包含dUTP的脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶,以形成一种或多种逆转录/聚合酶链式反应混合物;
使所述一种或多种逆转录/聚合酶链式反应混合物经历适合消化存在于所述逆转录/聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子的条件,然后经历适合产生具有3’polyA尾的靶miRNA序列的互补脱氧核糖核酸(cDNA)分子的条件且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环,由此形成包含所述第二一级寡核苷酸引物的5′引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列、poly dA区域和所述第一一级寡核苷酸引物的5′引物特异性部分的补体的一种或多种不同的逆转录/聚合酶链式反应产物及其补体;
提供一个或多个寡核苷酸探针组,每个探针组包含(a)具有5′引物特异性部分和3′靶序列特异性部分的第一寡核苷酸探针,和(b)具有5′靶序列特异性部分、与所述一种或多种逆转录/聚合酶链式反应产物互补的部分和3′引物特异性部分的第二寡核苷酸探针,其中探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针被配置成以碱基特异性方式杂交到对应于所述靶miRNA分子序列或其补体的所述一种或多种逆转录/聚合酶链式反应产物的互补部分上;
共混所述一种或多种逆转录/聚合酶链式反应产物与连接酶和所述一个或多个寡核苷酸探针组,以形成一种或多种连接反应混合物;
使所述一种或多种连接反应混合物经历一个或多个连接反应循环,由此所述一个或多个寡核苷酸探针组的第一寡核苷酸探针和第二寡核苷酸探针在与其补体杂交时连接在一起,以在所述连接反应混合物中形成连接的产物序列,其中每个连接的产物序列包含所述5′引物特异性部分、所述靶特异性部分和所述3′引物特异性部分;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其包含与所述连接的产物序列的5’引物特异性部分相同的核苷酸序列,和(b)第二二级寡核苷酸引物,其包含与所述连接的产物序列的3’引物特异性部分互补的核苷酸序列;
共混所述连接的产物序列和所述一个或多个二级寡核苷酸引物组与能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且适合进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成二级聚合酶链式反应产物;和
检测和区分所述二级聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
22.一种用于鉴定样品中的一个或多个靶微小核糖核酸(miRNA)分子的方法,所述靶微小核糖核酸(miRNA)分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基,所述方法包括:
提供含有一个或多个靶miRNA分子的样品,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的潜在差异在于一个或多个碱基;
提供能够消化存在于所述样品中的含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶;
使所述样品与能够消化潜在地存在于所述样品中的含dU的核酸分子的一种或多种酶接触;
共混所述接触的样品与ATP和Poly(A)聚合酶以形成Poly(A)聚合酶反应混合物;
使所述Poly(A)聚合酶反应混合物经历适合将均聚物A附加到潜在地存在于所述样品中的所述一个或多个靶miRNA分子的3′端的条件;
提供一个或多个一级寡核苷酸引物组,每个引物组包含(a)第一一级寡核苷酸引物,其包含5′引物特异性部分、内部poly dT部分和包含与所述靶miRNA的3′端互补的1至10个碱基的3′部分,其中所述第一一级寡核苷酸引物与其他组中的其他第一一级寡核苷酸引物可以相同或者可以不同,和(b)第二一级寡核苷酸引物,其包含5′引物特异性部分和3′部分,其中所述第二一级寡核苷酸引物与其他组中的其他第二一级寡核苷酸引物可以相同或者可以不同;
共混潜在地包含靶miRNA序列的Poly(A)聚合酶反应混合物与3’polyA尾、所述一个或多个一级寡核苷酸引物组、脱氧核苷酸混合物和逆转录酶以及DNA聚合酶或具有逆转录酶活性的DNA聚合酶,以形成一种或多种逆转录/聚合酶链式反应混合物;
使所述一种或多种逆转录/聚合酶链式反应混合物经历适合产生具有3’polyA尾的靶miRNA序列的互补脱氧核糖核酸(cDNA)分子的条件且经历包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环,由此形成包含所述第二一级寡核苷酸引物的5′引物特异性部分、对应于所述靶miRNA分子序列的核苷酸序列、poly dA区域和所述第一一级寡核苷酸引物的5′引物特异性部分的补体的一种或多种不同的逆转录/聚合酶链式反应产物及其补体;
提供一个或多个二级寡核苷酸引物组,每个二级寡核苷酸引物组包含(a)第一二级寡核苷酸引物,其具有5′引物特异性部分和与由所述第一一级寡核苷酸引物形成的逆转录/聚合酶链式反应产物的一部分互补的3′部分,和(b)第二二级寡核苷酸引物,其具有5′引物特异性部分和包含与由所述第一二级寡核苷酸引物形成的逆转录/聚合酶链式反应产物的一部分互补的核苷酸序列的3′部分;
共混所述逆转录/聚合酶链式反应产物、所述一个或多个二级寡核苷酸引物组、脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第一聚合酶链式反应混合物;
使所述一种或多种第一聚合酶链式反应混合物经历适合包括变性处理、杂交处理和延伸处理的两个或更多个聚合酶链式反应循环的条件,由此形成包含5′引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列和另一5′引物特异性部分的补体的第一聚合酶链式反应产物;
提供一个或多个三级寡核苷酸引物组,每个三级寡核苷酸引物组包含(a)第一三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的5′引物特异性部分相同的核苷酸序列,和(b)第二三级寡核苷酸引物,其包含与所述第一聚合酶链式反应产物序列的3′引物特异性部分互补的核苷酸序列;
共混所述第一聚合酶链式反应产物、所述一个或多个三级寡核苷酸引物组、所述能够消化含脱氧尿嘧啶(dU)的核酸分子的一种或多种酶、包含dUTP的脱氧核苷酸混合物和DNA聚合酶,以形成一种或多种第二聚合酶链式反应混合物;
使所述一种或多种第二聚合酶链式反应混合物经历适合消化存在于所述第一聚合酶链式反应混合物中的含脱氧尿嘧啶(dU)的核酸分子且进行包括变性处理、杂交处理和延伸处理的一个或多个聚合酶链式反应循环的条件,由此形成第二聚合酶链式反应产物;和
检测和区分所述一个或多个反应中的第二聚合酶链式反应产物,由此鉴定一个或多个靶miRNA分子,所述靶miRNA分子在序列上与所述样品中的其他miRNA分子的差异在于一个或多个碱基。
23.如权利要求19至22中任一项所述的方法,其中所述第二一级寡核苷酸引物的3′部分包含核糖-G和/或G核苷酸类似物,其中所述逆转录酶将两个或三个胞嘧啶核苷酸附加到所述靶miRNA的互补脱氧核糖核酸产物的3′端,使得能够与所述第二一级寡核苷酸引物的3′端瞬时杂交,使得所述逆转录酶能够经历链转换并延伸所述互补脱氧核糖核酸产物以包括所述第二一级寡核苷酸引物的5′引物特异性部分的互补序列,从而形成包含5′引物特异性部分、对应于所述靶miRNA分子序列或其补体的核苷酸序列部分、另外的部分和另一5′引物特异性部分的补体的一种或多种不同的第一聚合酶链式反应产物。
24.如权利要求19至22中任一项所述的方法,其中所述第二一级寡核苷酸引物的3′部分含有6至14个碱基,所述碱基包括从5′至3’的三个核糖-G或G碱基,然后是与所述靶miRNA序列的5′端相同的额外碱基,其中所述逆转录酶将两个或三个胞嘧啶残基附加到所述靶miRNA的初始互补脱氧核糖核酸延伸产物的3′端,并且其中在起始所述聚合酶链式反应的变性处理之后,调整条件以使得能够与所述第二一级寡核苷酸引物的3′端或与所述互补脱氧核糖核酸延伸产物的3′端瞬时杂交,从而允许所述第二一级寡核苷酸引物和所述互补脱氧核糖核酸延伸产物中的一者或两者延伸,以形成包含5′引物特异性部分、对应于靶miRNA分子序列或其补体的核苷酸序列部分、另外的部分和另一5′引物特异性部分的补体的一种或多种不同的一级逆转录/聚合酶链式反应产物。
25.如权利要求1、4或17中任一项所述的方法,其中所述寡核苷酸探针组的第二寡核苷酸探针还包含unitaq检测部分,由此形成包含所述5′引物特异性部分、所述靶特异性部分、所述unitaq检测部分和所述3′引物特异性部分的连接的产物序列,所述方法还包括:
提供一种或多种unitaq检测探针,其中每种unitaq检测探针与互补unitaq检测部分杂交,并且所述检测探针包含猝灭分子和与所述猝灭分子隔开的可检测标记;
将所述一种或多种unitaq检测探针添加到所述第二聚合酶链式反应混合物中;和
在所述使所述第二聚合酶链式反应混合物经历适合一个或多个聚合酶链式反应循环的条件期间,使所述一种或多种unitaq检测探针与所述连接的产物序列或其补体上的互补unitaq检测部分杂交,其中在所述延伸处理期间,所述猝灭分子和所述可检测标记自所述一种或多种unitaq检测探针裂解,并且所述检测涉及所述裂解的可检测标记的检测。
26.如权利要求2、3、5、6、7或18中任一项所述的方法,其中一种一级寡核苷酸引物或一种二级寡核苷酸引物还包含unitaq检测部分,由此形成包含所述5′引物特异性部分、所述靶特异性部分、所述unitaq检测部分和所述另一5′引物特异性部分的补体的延伸产物序列及其补体,所述方法还包括:
提供一种或多种unitaq检测探针,其中每种unitaq检测探针与互补unitaq检测部分杂交,并且所述检测探针包含猝灭分子和与所述猝灭分子隔开的可检测标记;
将所述一种或多种unitaq检测探针添加到所述一种或多种第一聚合酶链式反应混合物或第二聚合酶链式反应混合物中;和
在聚合酶链式反应循环期间在所述第一聚合链式反应之后使所述一种或多种unitaq检测探针与所述连接的产物序列或其补体上的互补unitaq检测部分杂交,其中在所述延伸处理期间,所述猝灭分子和所述可检测标记自所述一种或多种unitaq检测探针裂解,并且所述检测涉及所述裂解的可检测标记的检测。
27.如权利要求1、4、17、19或21中任一项所述的方法,其中所述寡核苷酸探针组的一种或两种寡核苷酸探针包含如下部分,其在以碱基特异性方式与所述靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列杂交时没有或具有一个核苷酸序列错配,但是具有在所述寡核苷酸探针以碱基特异性方式与所述野生型核酸序列或亚硫酸氢盐转化的未甲基化核酸序列或其补体序列中的对应核苷酸序列部分杂交时干扰连接的一个或多个额外核苷酸序列错配。
28.如权利要求1、4或17中任一项所述的方法,其中所述寡核苷酸探针组的第一寡核苷酸探针的3′部分包含可裂解的核苷酸或核苷酸类似物和阻断基团,使得所述3′端不适合聚合酶延伸或连接,所述方法还包括:
当所述第一寡核苷酸探针与所述一级延伸产物的互补靶核苷酸序列杂交时,裂解所述探针的可裂解核苷酸或核苷酸类似物,由此在所述连接前释放所述第一寡核苷酸探针上的3’OH。
29.如权利要求28所述的方法,其中所述寡核苷酸探针组的一种或多种第一寡核苷酸探针包含与所述靶核酸序列或亚硫酸氢盐转化的甲基化核酸序列或其补体序列不同的序列,所述差异位于距离所述释放的游离3′OH端的两个或三个核苷酸碱基处。
30.如权利要求1、4或17中任一项所述的方法,其中所述第二寡核苷酸探针在其5′端具有与所述第一寡核苷酸探针的3′端重叠的相同核苷酸,并且,在探针组的所述第一寡核苷酸探针和所述第二寡核苷酸探针在一级延伸产物的互补靶核苷酸序列上的相邻位置杂交形成接合部时,所述第二寡核苷酸探针的所述重叠的相同核苷酸在与所述第一寡核苷酸探针的所述接合部处形成瓣,所述方法还包括:
用具有5′核酸酶活性的酶裂解所述第二寡核苷酸探针的所述重叠的相同核苷酸,由此在所述连接前释放所述第二寡核苷酸探针的5′端的磷酸。
31.如权利要求1、4或17中任一项所述的方法,其中所述一个或多个寡核苷酸探针组还包含具有靶特异性部分的第三寡核苷酸探针,其中探针组的所述第二寡核苷酸探针和所述第三寡核苷酸探针被配置成在所述靶核苷酸序列上彼此相邻杂交,在其之间具有接合部,以允许所述第二寡核苷酸探针和所述第三寡核苷酸探针之间的连接以形成包含探针组的所述第一寡核苷酸探针、所述第二寡核苷酸探针和所述第三寡核苷酸探针的连接的产物序列。
32.如权利要求1至31中任一项所述的方法,其中所述样品选自由以下组成的组:组织、细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物、无细胞循环核酸、无细胞循环肿瘤核酸、孕妇无细胞循环胎儿核酸、循环肿瘤细胞、肿瘤、肿瘤活组织切片和外泌体。
33.如权利要求1至31中任一项所述的方法,其中所述一种或多种靶核苷酸序列是低丰度核酸分子,所述低丰度核酸分子包含一个或多个核苷酸碱基突变、插入、缺失、易位、剪接变体、miRNA变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失、内含子插入或基因组水平上的其他重排和/或甲基化核苷酸碱基。
34.如权利要求33所述的方法,其中具有一个或多个核苷酸碱基突变、插入、缺失、易位、剪接变体、miRNA变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失、内含子插入或基因组水平上的其他重排和/或甲基化核苷酸碱基的所述低丰度核酸分子自所述样品中的高丰度核酸分子鉴定和区分,所述高丰度核酸分子具有与所述低丰度核酸分子类似的核苷酸序列,但没有所述一个或多个核苷酸碱基突变、插入、缺失、易位、剪接变体、miRNA变体、替代转录物、替代起始位点、替代编码序列、替代非编码序列、替代剪接、外显子插入、外显子缺失、内含子插入或基因组水平上的其他重排和/或甲基化核苷酸碱基。
35.如权利要求34所述的方法,其中一种或多种低丰度靶核苷酸序列的拷贝数相对于所述样品中的所述高丰度核酸分子的拷贝数定量。
36.如权利要求1至31中任一项所述的方法,其中定量或计数所述一种或多种靶核苷酸序列。
37.如权利要求36所述的方法,其中所述一种或多种靶核苷酸序列相对于所述样品或经历相同后续步骤的其他样品中的其他核苷酸序列定量或计数。
38.如权利要求37所述的方法,其中定量或计数一种或多种靶核苷酸序列的相对拷贝数。
39.如权利要求1至31中任一项所述的方法,其还包括:
基于所述鉴定诊断或预后疾病状态。
40.如权利要求1至31中任一项所述的方法,其还包括:
基于所述鉴定区分基因型或疾病易感性。
41.一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后细胞或组织的疾病状态的方法,其中所述多种标记物在包含6-12种标记物、12-24种标记物、24-36种标记物、36-48种标记物、48-72种标记物、72-96种标记物或>96种标记物的组中,其中给定组中的每种标记物通过具有以下标准中的任何一个或多个来选择:
在>50%的来自被诊断为具有所述疾病状态的个体的疾病细胞或组织的生物样品中存在或高于截止水平;
在>95%的来自没有所述疾病状态的个体的正常细胞或组织的生物样品中不存在或低于截止水平;
在>50%的来自被诊断为具有所述疾病状态的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在>95%的来自没有所述疾病状态的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在来自被诊断为具有所述疾病状态的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
并且,其中组中至少50%的所述标记物各自包含一个或多个甲基化残基,和/或其中组中至少50%的所述标记物在来自至少50%的被诊断为具有所述疾病状态的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,所述方法包括:
获得包括源自所述细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质的生物样品,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组;
将所述样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质;
在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理;
在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤;和
进行一种或多种测定以检测和区分所述多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含6-12种标记物的标记物组中最少2种或3种标记物存在或高于截止水平;或在包含12-24种标记物的标记物组中最少3、4或5种标记物存在或高于截止水平;或在包含24-36种标记物的标记物组中最少3、4、5或6种标记物存在或高于截止水平;或在包含36-48种标记物的标记物组中最少4、5、6、7或8种标记物存在或高于截止水平;或在包含48-72种标记物的标记物组中最少6、7、8、9、10、11或12种标记物存在或高于截止水平,或在包含72-96种标记物的标记物组中最少7、8、9、10、11、12或13种标记物存在或高于截止水平,或在包含96-“n”种标记物(当“n”>168种标记物时)的标记物组中最少8、9、10、11、12、13或“n”/12种标记物存在或高于截止水平,则个体被诊断或预后为具有所述疾病状态。
42.一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后实体组织癌的疾病状态的方法,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中所述多种标记物在包含总共48-72种癌症标记物、总共72-96种癌症标记物或≥总共96种癌症标记物的组中,其中在给定组中平均大于四分之一的这样的标记物覆盖所测试的上述主要癌症中的每一种,其中对于给定实体组织癌的给定组中的每种标记物通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:
在>50%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;
在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平;
在>50%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
并且,其中组中至少50%的所述标记物各自包含一个或多个甲基化残基,和/或其中组中至少50%的所述标记物在来自至少50%的被诊断为患有给定实体组织癌的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,所述方法包括:
获得包括源自所述细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质的生物样品,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组;
将所述样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质;
在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理;
在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的给定实体组织癌特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤;和
进行一种或多种测定以检测和区分所述多种癌症特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含总共48-72种癌症标记物的标记物组中最少4种标记物存在或高于截止水平;或在包含总共72-96种癌症标记物的标记物组中最少5种标记物存在或高于截止水平;或在包含总共96至“n”种癌症标记物(当“n”>总共96种癌症标记物时)的标记物组中最少6种或“n”/18种标记物存在或高于截止水平,则个体被诊断或预后为所述实体组织癌。
43.如权利要求42所述的方法,其中对于给定实体组织癌的给定组中的每种标记物通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:
在>66%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;
在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平;
在>66%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。
44.一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后以下组中的实体组织癌的疾病状态和鉴定所述实体组织癌的一种或多种最可能的具体起源组织的方法:组1(结肠直肠腺癌、胃腺癌、食管癌);组2(乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤);组3(肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌);组4(前列腺腺癌、浸润性尿路上皮膀胱癌);和/或组5(肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌),其中所述多种标记物在包含36-48种组特异性癌症标记物、48-64种组特异性癌症标记物或≥64种组特异性癌症标记物的组中,其中在给定组中平均大于三分之一的这样的标记物覆盖所述组内的测试的前述癌症中的每一种,其中对于给定实体组织癌的给定组中的每种标记物通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:
在>50%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;
在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平;
在>50%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
并且,其中组中至少50%的所述标记物各自包含一个或多个甲基化残基,和/或其中组中至少50%的所述标记物在来自至少50%的被诊断为患有给定实体组织癌的个体的生物样品中存在,或高于截止水平,或以>1.65的z值存在,包含一个或多个甲基化残基,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分,所述方法包括:
获得所述生物样品,所述生物样品包括源自所述细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分组成的组;
将所述样品分级分离成一种或多种级分,其中至少一种级分包含外泌体、肿瘤相关囊泡、其他受保护状态或无细胞DNA、RNA和/或蛋白质;
在适合将未甲基化的胞嘧啶残基转化为尿嘧啶残基的条件下使所述一种或多种级分中的核酸分子经历亚硫酸氢盐处理;
在所述分级分离期间和/或通过进行核酸扩增步骤,对50%或更多的给定实体组织癌特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物进行至少两个富集步骤;和
进行一种或多种测定以检测和区分所述多种癌症特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物,由此鉴定其在所述样品中的存在或水平,其中如果在包含36-48种组特异性癌症标记物的标记物组中最少4种标记物存在或高于截止水平;或在包含48-64种组特异性癌症标记物的标记物组中最少5种标记物存在或高于截止水平;或在包含总共64至“n”种癌症标记物(当“n”>64种组特异性癌症标记物时)的标记物组中最少6种或“n”/12种标记物存在或高于截止水平,则个体被诊断或预后为实体组织癌。
45.如权利要求44所述的方法,其中对于给定实体组织癌的给定组中的每种标记物通过对于所述实体组织癌具有以下标准中的任何一个或多个来选择:
在>66%的来自被诊断为患有给定实体组织癌的个体的给定癌症组织的生物样品中存在或高于截止水平;
在>95%的来自没有所述给定实体组织癌的个体的正常组织的生物样品中不存在或低于截止水平;
在>66%的来自被诊断为患有给定实体组织癌的个体的生物样品中存在或高于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在>95%的来自没有所述给定实体组织癌的个体的生物样品中不存在或低于截止水平,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分;
在来自被诊断为患有给定实体组织癌的个体的生物样品中以>1.65的z值存在,所述生物样品包括细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物、身体排泄物或其级分。
46.如权利要求41至45中任一项所述的方法,其中所述至少两个富集步骤包括以下步骤中的两个或更多个:
捕获或分离外泌体或细胞外囊泡或在其他受保护状态中的标记物;捕获或分离血小板级分;捕获或分离循环肿瘤细胞;捕获或分离含RNA复合物;捕获或分离cfDNA-核小体或差异性修饰的cfDNA-组蛋白复合物;捕获或分离蛋白质靶或蛋白质靶复合物;捕获或分离自身抗体;捕获或分离细胞因子;捕获或分离甲基化cfDNA;通过与溶液中、磁珠上或微阵列上的互补捕获探针杂交,捕获或分离标记物特异性DNA、cDNA、miRNA、lncRNA、ncRNA或mRNA或扩增的补体;使用DNA聚合酶、逆转录酶、DNA连接酶、RNA连接酶、DNA修复酶、RNA酶、RNA酶H2、核酸内切酶、限制性核酸内切酶、核酸外切酶、CRISPR、DNA糖基化酶或其组合,经由聚合酶延伸反应、聚合酶链式反应、亚硫酸氢盐甲基特异性聚合酶链式反应、逆转录反应、亚硫酸氢盐甲基特异性连接反应和/或连接反应,以线性或指数方式扩增miRNA标记物、非编码RNA标记物(lncRNA和ncRNA标记物)、mRNA标记物、外显子标记物、剪接变体标记物、易位标记物或拷贝数变异标记物;使用DNA聚合酶、逆转录酶、DNA连接酶、RNA连接酶、DNA修复酶、RNA酶、RNA酶H2、核酸内切酶、限制性核酸内切酶、核酸外切酶、CRISPR、DNA糖基化酶或其组合,经由聚合酶延伸反应、聚合酶链式反应、亚硫酸氢盐甲基特异性聚合酶链式反应、逆转录反应、亚硫酸氢盐甲基特异性连接反应和/或连接反应,以线性或指数方式选择性扩增含有突变标记物或亚硫酸氢盐转化的DNA甲基化标记物的一个或多个靶区域,同时抑制含有野生型序列或亚硫酸氢盐转化的未甲基化序列或其补体序列的靶区域的扩增;优先延伸、连接或扩增一种或多种引物或探针,所述引物或探针的3′-OH端已在酶和序列依赖性过程中释放;在靶特异性引物或探针以碱基特异性方式与野生型序列或亚硫酸氢盐转化的未甲基化序列或其补体序列杂交的所述反应期间干扰聚合酶延伸或连接的条件下,使用在3′端包含一个或多个错配碱基或在3′端包含一个或多个核苷酸类似物和阻断基团的一种或多种阻断寡核苷酸引物。
47.如权利要求41至46中任一项所述的方法,其中检测和区分所述多种疾病特异性和/或细胞/组织特异性DNA、RNA或蛋白标记物的所述一种或多种测定包括以下测定中的一种或多种:
定量实时PCR方法(qPCR);逆转录酶-聚合酶链式反应(RTPCR)方法;亚硫酸氢盐qPCR法;数字PCR法(dPCR);亚硫酸氢盐dPCR法;连接检测法、连接酶链式反应、限制性核酸内切酶裂解法;DNA或RNA核酸酶裂解法;微阵列杂交法;肽阵列结合法;抗体阵列法;质谱法;液相色谱-串联质谱(LC-MS/MS)法;毛细管或凝胶电泳法;化学发光法;荧光法;DNA测序法;亚硫酸氢盐转化-DNA测序法;RNA测序法;邻近连接法;邻近PCR法;包括固定抗体-靶复合物的方法;包括固定适体-靶复合物的方法;免疫测定法;包括Western印迹测定的方法;包括酶联免疫吸附测定(ELISA)的方法;包括高通量基于微阵列的酶联免疫吸附测定(ELISA)的方法;或包括高通量基于流式细胞术的酶联免疫吸附测定(ELISA)的方法。
48.如权利要求41至47中任一项所述的方法,其中检测和区分所述多种疾病特异性和/或细胞/组织特异性DNA、RNA或蛋白标记物的所述一种或多种测定的一种或多种截止水平包括在比较来自疾病个体的样品相对于来自正常个体的样品的一种或多种标记物测定中的以下计算、比较或确定中的一种或多种:
标记物ΔCt值>2;标记物ΔCt值>4;检测的标记物特异性信号的比率>1.5;检测的标记物特异性信号的比率>3;标记物浓度的比率>1.5;标记物浓度的比率>3;计数的标记物特异性信号相差>20%;计数的标记物特异性信号相差>50%;来自给定疾病样品的标记物特异性信号>85%、>90%、>95%、>96%、>97%或>98%的来自一组正常样品的相同标记物特异性信号;或来自给定疾病样品的标记物特异性信号与来自一组正常样品的相同标记物特异性信号相比具有>1.03、>1.28、>1.65、>1.75、>1.88或>2.05的z得分。
49.一种基于鉴定个体的生物样品中多种疾病特异性和/或细胞/组织特异性DNA、RNA和/或蛋白标记物的存在或水平来诊断或预后细胞或组织的疾病状态的两步法,所述两步法包括:
获得生物样品,所述生物样品包括外泌体、肿瘤相关囊泡、在其他受保护状态内的标记物、源自潜在疾病状态的细胞或组织和源自一种或多种其他组织或细胞的无细胞DNA、RNA和/或蛋白质,其中所述生物样品选自由细胞、血清、血液、血浆、羊水、痰、尿、体液、身体分泌物和身体排泄物或其级分组成的组;
对所述生物样品应用第一步骤,其中总灵敏度>80%且总特异性>90%或总Z得分>1.28,以鉴定更可能被诊断或预后为具有所述疾病状态的个体;和
对来自所述第一步骤中鉴定的那些个体的生物样品应用第二步骤,其中总特异性>95%或总Z得分>1.65,以诊断或预后具有所述疾病状态的个体,其中所述应用所述第一步骤和/或所述应用所述第二步骤使用如权利要求41-44中任一项所述的方法进行。
50.如权利要求41至49中任一项所述的方法,其中所述疾病状态为实体组织癌,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中至少50%的所述标记物各自包含CpG序列的一个或多个甲基化胞嘧啶残基或CpG序列的一个或多个甲基化胞嘧啶残基的补体,所述CpG序列选自图56中的列表。
51.如权利要求41至49中任一项所述的方法,其中所述疾病状态为实体组织癌,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中至少50%的所述标记物各自包含选自图57中的列表的一个或多个染色体亚区域的一个或多个甲基化残基。
52.如权利要求41至49中任一项所述的方法,其中所述疾病状态为实体组织癌,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中所述一种或多种标记物包含一种或多种miRNA序列或选自图53中的列表的一种或多种lncRNA或ncRNA序列,所述miRNA序列选自由以下序列组成的组:(mirID,基因ID):hsa-mir-21,MIR21;hsa-mir-182,MIR182;hsa-mir-454,MIR454;hsa-mir-96,MIR96;hsa-mir-183,MIR183;hsa-mir-549,MIR549;hsa-mir-301a,MIR301A;hsa-mir-548f-1,MIR548F1;hsa-mir-301b,MIR301B;hsa-mir-103-1,MIR1031;hsa-mir-18a,MIR18A;hsa-mir-147b,MIR147B;hsa-mir-4326,MIR4326;和hsa-mir-573,MIR573。
53.如权利要求41至49中任一项所述的方法,其中所述疾病状态为实体组织癌,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中所述一种或多种标记物包含选自图54中的列表的一种或多种外显子RNA序列。
54.如权利要求41至49中任一项所述的方法,其中所述疾病状态为实体组织癌,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中所述一种或多种标记物包含选自图55中的列表或选自由以下各项组成的组的一种或多种mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体:(蛋白质名称,UniProtID):未表征的蛋白质C190rf48,Q6RUI8;蛋白质FAM72B,Q86X60;蛋白质FAM72D,Q6L9T8;羟酰谷胱甘肽水解酶样蛋白,Q6PII5;假定甲基转移酶NSUN5,Q96P11;含RNA假尿苷酸合酶结构域的蛋白1,Q9UJJ7;含胶原蛋白三螺旋重复蛋白1,Q96CG8;白细胞介素11,P20809;溶基质素2,P09238;基质金属蛋白酶9,P14780;Podocan样蛋白1,Q6PEZ8;假定肽YY-2,Q9NRI6;骨桥蛋白,P10451;巯基氧化酶2,Q6ZRP7;磷脂酰肌醇蛋白聚糖2,Q8N158;巨噬细胞移动抑制因子,P14174;肽基-脯氨酰基顺反异构酶A,P62937;和钙网蛋白,P27797。
55.如权利要求41至49中任一项所述的方法,其中所述疾病状态为实体组织癌,所述实体组织癌包括结肠直肠腺癌、胃腺癌、食管癌、乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌、子宫癌肉瘤、肺腺癌、肺鳞状细胞癌、头颈鳞状细胞癌、前列腺腺癌、浸润性尿路上皮膀胱癌、肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中所述一种或多种标记物包含选自由TP53(肿瘤蛋白p53)、TTN(肌联蛋白)、MUC16(粘蛋白16)和KRAS(Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物)组成的组的基因中的一个或多个突变、插入、缺失、拷贝数变化或表达变化。
56.如权利要求41至49中任一项所述的方法,其中所述疾病状态为结肠腺癌、直肠腺癌、胃腺癌或食管癌,其中组中至少50%的所述标记物各自包含CpG序列的一个或多个甲基化胞嘧啶残基或CpG序列的一个或多个甲基化胞嘧啶残基的补体,所述CpG序列选自图44中或图59中的列表。
57.如权利要求41至49中任一项所述的方法,其中所述疾病状态为结肠腺癌、直肠腺癌、胃腺癌或食管癌,其中组中至少50%的所述标记物各自包含选自图45中或图60中的列表的一个或多个染色体亚区域的一个或多个甲基化残基。
58.如权利要求41至49中任一项所述的方法,其中所述疾病状态为结肠腺癌、直肠腺癌、胃腺癌或食管癌,其中组中所述一种或多种标记物包含选自图39中的列表的一种或多种miRNA序列;hsa-MIR-624,MIR624;或选自图40中的列表或由以下序列组成的组的一种或多种lncRNA或ncRNA序列:[基因ID,坐标(GRCh38)]:ENS EMBL ID:LINC01558,chr6:167784537-167796859和ENSG00000146521.8。
59.如权利要求41至49中任一项所述的方法,其中所述疾病状态为结肠腺癌、直肠腺癌、胃腺癌或食管癌,其中组中所述一种或多种标记物包含选自图41中和图58中的列表的一种或多种外显子RNA序列。
60.如权利要求41至49中任一项所述的方法,其中所述疾病状态为结肠腺癌、直肠腺癌、胃腺癌或食管癌,其中组中所述一种或多种标记物包含选自图42、图43中的列表或选自由以下各项组成的组的一种或多种mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体:(基因符号,染色体带,基因标题,UniProtID):SELE,1q22-q25,选择素E,P16581;OTUD4,4q31.21,含OTU结构域4,Q01804;BPI,20q11.23,杀菌/通透性增强蛋白,P17213;ASB4,7q21-q22,含锚蛋白重复和SOCS盒4,Q9Y574;C6orf123,6q27,染色体6开放阅读框123,Q9Y6Z2;KPNA3,13q14.3,核转运蛋白α3(输入蛋白α4),O00505;和NUP98、11p15、核孔蛋白98kDa、P52948;或(蛋白质名称,UniProt ID)杀菌/通透性增强蛋白(BPI)(CAP 57),P17213。
61.如权利要求41至49中任一项所述的方法,其中所述疾病状态为结肠腺癌、直肠腺癌、胃腺癌或食管癌,其中组中所述一种或多种标记物包含选自由以下各项组成的组的基因中的一个或多个突变、插入、缺失、拷贝数变化或表达变化:APC(WNT信号传导通路的APC调节因子)、ATM(ATM丝氨酸/苏氨酸激酶)、CSMD1(CUB和Sushi多结构域1)、DNAH1l(动力蛋白丝轴重链11)、DST(肌张力异常蛋白)、EP400(E1A结合蛋白p400)、FAT3(FAT非典型钙粘蛋白3)、FAT4(FAT非典型钙粘蛋白4)、FLG(丝聚蛋白)、GLI3(GLI家族锌指3)、KRAS(Ki-ras2Kirsten大鼠肉瘤病毒癌基因同源物)、LRP1B(LDL受体相关蛋白1B)、MUC16(粘蛋白16,细胞表面相关)、OBSCN(遮蔽蛋白,细胞骨架钙调蛋白和肌联蛋白相互作用RhoGEF)、PCLO(piccolo突触前细胞基质蛋白)、PIK3CA(磷脂酰肌醇-4,5-双磷酸3-激酶催化亚基α)、RYR2(兰尼碱受体2)、SYNE1(含血影蛋白重复的核包膜蛋白1)、TP53(肿瘤蛋白p53)、TTN(肌联蛋白)和UNC13C(unc-13同源物C)。
62.如权利要求41至49中任一项所述的方法,其中所述疾病状态为乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌或子宫癌肉瘤,其中组中至少50%的所述标记物各自包含CpG序列的一个或多个甲基化胞嘧啶残基或CpG序列的一个或多个甲基化胞嘧啶残基的补体,所述CpG序列选自图61中的列表。
63.如权利要求41至49中任一项所述的方法,其中所述疾病状态为乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌或子宫癌肉瘤,其中组中至少50%的所述标记物各自包含选自图62中的列表的一个或多个染色体亚区域的一个或多个甲基化残基。
64.如权利要求41至49中任一项所述的方法,其中所述疾病状态为乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌或子宫癌肉瘤,其中组中所述一种或多种标记物包含选自由(mir ID,基因ID):hsa-mir-1265,MIRl265组成的组的一种或多种miRNA序列。
65.如权利要求41至49中任一项所述的方法,其中所述疾病状态为乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌或子宫癌肉瘤,其中组中所述一种或多种标记物包含选自由以下各项组成的组的一种或多种外显子RNA序列(外显子位置,基因):chr2:179209013-179209087:+,OSBPL6;chr2:179251788-179251866:+,OSBPL6;和chr2:179253736-179253880:+,OSBPL6。
66.如权利要求41至49中任一项所述的方法,其中所述疾病状态为乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌或子宫癌肉瘤,其中组中所述一种或多种标记物包含选自由以下各项组成的组的一种或多种mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体:(基因符号,染色体带,基因标题,UniProt ID):RSPO2,8q23.1,R-脊椎蛋白2,Q6UXX9;KLC4,6p21.1,驱动蛋白轻链4,Q9NSK0;和GLRX,5q14,谷氧还蛋白(巯基转移酶),P35754;或(蛋白质名称,UniProt ID)R-脊椎蛋白2(顶板特异性脊椎蛋白2)(hRspo2),Q6UXX9。
67.如权利要求41至49中任一项所述的方法,其中所述疾病状态为乳腺小叶和导管癌、子宫体子宫内膜癌、卵巢浆液性囊腺癌、宫颈鳞状细胞癌和腺癌或子宫癌肉瘤,其中组中所述一种或多种标记物包含选自由PIK3CA(磷脂酰肌醇-4,5-双磷酸3-激酶催化亚基α)和TTN(肌联蛋白)组成的组的基因中的一个或多个突变、插入、缺失、拷贝数变化或表达变化。
68.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肺腺癌、肺鳞状细胞癌或头颈鳞状细胞癌,其中组中至少50%的所述标记物各自包含CpG序列的一个或多个甲基化胞嘧啶残基或CpG序列的一个或多个甲基化胞嘧啶残基的补体,所述CpG序列选自图63中的列表。
69.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肺腺癌、肺鳞状细胞癌或头颈鳞状细胞癌,其中组中至少50%的所述标记物各自包含选自图64中的列表的一个或多个染色体亚区域的一个或多个甲基化残基。
70.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肺腺癌、肺鳞状细胞癌或头颈鳞状细胞癌,其中组中所述一种或多种标记物包含选自(mir ID,基因ID):hsa-mir-28,MIR28的一种或多种miRNA序列。
71.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肺腺癌、肺鳞状细胞癌或头颈鳞状细胞癌,其中组中所述一种或多种标记物包含选自由以下各项组成的组的一种或多种外显子RNA序列(外显子位置,基因):chr2:chr1:93307721-93309752:-,FAM69A;chr1:93312740-93312916:-,FAM69A;chr1:93316405-93316512:-,FAM69A;chr1:93341853-93342152:-,FAM69A;chr1:93426933-93427079:-,FAM69A;chr7:40221554-40221627:+,C7orf10;chr7:40234539-40234659:+,C7orf10;chr8:22265823-22266009:+,SLC39A14;chr8:22272293-22272415:+,SLC39A14;chr14:39509936-39510091:-,SEC23A;和chr14:39511990-39512076:-,SEC23A。
72.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肺腺癌、肺鳞状细胞癌或头颈鳞状细胞癌,其中组中所述一种或多种标记物包含选自由以下各项组成的组的一种或多种mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体:(基因符号,染色体带,基因标题,UniProtID):STRN3,14q13-q21,纹状体,钙调蛋白结合蛋白3,Q13033;LRRC17,7q22.1,含富含亮氨酸重复17,Q8N6Y2;FAM69A,1p22,序列相似性家族69,成员A,Q5T7M9;ATF2,2q32,激活转录因子2,P15336;BHMT,5q14.1,甜菜碱--高半胱氨酸S-甲基转移酶,Q93088;ODZ3/TENM3,4q34.3-q35.1,tenenurin跨膜蛋白3,Q9P273;和ZFHX4,8q21.11,锌指同源盒4,Q86UP3;或(蛋白质名称,UniProt ID):含富含亮氨酸重复蛋白17(p37NB),Q8N6Y2。
73.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肺腺癌、肺鳞状细胞癌或头颈鳞状细胞癌,其中组中所述一种或多种标记物包含选自由以下各项组成的组的基因中的一个或多个突变、插入、缺失、拷贝数变化或表达变化:CSMD3(CUB和Sushi多结构域3)、DNAH5(动力蛋白丝轴重链5)、FATl(FAT非典型钙粘蛋白1)、FLG(丝聚蛋白)、KRAS(Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物)、LRP1B(LDL受体相关蛋白1B)、MUC16(粘蛋白16,细胞表面相关)、PCLO(piccolo突触前细胞基质蛋白)、PKHD1L1(PKHD1样1)、RELN(络丝蛋白)、RYR2(兰尼碱受体2)、SI(蔗糖酶-异麦芽糖酶)、SYNE1(含血影蛋白重复的核包膜蛋白1)、TP53(肿瘤蛋白p53)、TTN(肌联蛋白)、USH2A(usherin)和XIRP2(含xin肌动蛋白结合重复2)。
74.如权利要求41至49中任一项所述的方法,其中所述疾病状态为前列腺腺癌或浸润性尿路上皮膀胱癌,其中组中至少50%的所述标记物各自包含CpG序列的一个或多个甲基化胞嘧啶残基或CpG序列的一个或多个甲基化胞嘧啶残基的补体,所述CpG序列选自图65中的列表。
75.如权利要求41至49中任一项所述的方法,其中所述疾病状态为前列腺腺癌或浸润性尿路上皮膀胱癌,其中组中至少50%的所述标记物各自包含选自图66中的列表的一个或多个染色体亚区域的一个或多个甲基化残基。
76.如权利要求41至49中任一项所述的方法,其中所述疾病状态为前列腺腺癌或浸润性尿路上皮膀胱癌,其中组中所述一种或多种标记物包含选自由(mir ID,基因ID):hsa-mir-491,MIR491;和hsa-mir-1468,MIR1468组成的组的一种或多种miRNA序列或选自由[基因ID,坐标(GRCh38),ENSEMBL ID]:AC007383.3,chr2:206084605-206086564,ENSG00000227946.1;和LINC00324,chr17:8220642-8224043,ENSG00000178977.3组成的组的一种或多种lncRNA或ncRNA序列。
77.如权利要求41至49中任一项所述的方法,其中所述疾病状态为前列腺腺癌或浸润性尿路上皮膀胱癌,其中组中所述一种或多种标记物包含选自(外显子位置,基因);chr21:45555942-45556055:+,C21orf33的一种或多种外显子RNA序列。
78.如权利要求41至49中任一项所述的方法,其中所述疾病状态为前列腺腺癌或浸润性尿路上皮膀胱癌,其中组中所述一种或多种标记物包含选自(基因符号,染色体带,基因标题,UniProtID):PMM1,22q13,磷酸甘露糖变位酶1,Q92871的一种或多种mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体。
79.如权利要求41至49中任一项所述的方法,其中所述疾病状态为前列腺腺癌或浸润性尿路上皮膀胱癌,其中组中所述一种或多种标记物包含选自由BAGE2(BAGE家族成员2)、DNM1P47(发动蛋白1假基因47)、FRG1BP(区域基因1家族成员B,假基因)、KRAS(Ki-ras2Kirsten大鼠肉瘤病毒癌基因同源物)、RP11-156P1.3、TTN(肌联蛋白)和TUBB8P7(微管蛋白β8 VIII类假基因7)组成的组的基因中的一个或多个突变、插入、缺失、拷贝数变化或表达变化。
80.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中至少50%的所述标记物各自包含CpG序列的一个或多个甲基化胞嘧啶残基或CpG序列的一个或多个甲基化胞嘧啶残基的补体,所述CpG序列选自图70中的列表。
81.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中至少50%的所述标记物各自包含选自图71中的列表的一个或多个染色体亚区域的一个或多个甲基化残基。
82.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中所述一种或多种标记物包含选自(mirID,基因ID):hsa-mir-132,MIR132的一种或多种miRNA序列或选自图67中的列表的一种或多种lncRNA或ncRNA序列。
83.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中所述一种或多种标记物包含选自图68中的列表的一种或多种外显子RNA序列。
84.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中所述一种或多种标记物包含选自图69中的列表或选自由以下各项组成的组的一种或多种mRNA序列、蛋白质表达水平、蛋白质产物浓度、细胞因子或蛋白质产物的自身抗体:(蛋白质名称,UniProtID);凝溶胶蛋白(AGEL)(肌动蛋白解聚因子)(ADF)(Brevin),P06396;原神经调节蛋白2,O14511;CD59糖蛋白(1F5抗原)(20kDa同源限制性因子)(HRF-20)(HRF20)(MAC-抑制蛋白)(MAC-IP)(MEM43抗原)(膜攻击复合物抑制因子)(MACIF)(膜反应性裂解抑制因子)(MIRL)(保护素)(CD抗原CD59),P13987;和发散蛋白激酶结构域2B(自闭症缺失相关蛋白1),Q9H7Y0。
85.如权利要求41至49中任一项所述的方法,其中所述疾病状态为肝脏肝细胞癌、胰腺导管腺癌或胆囊腺癌,其中组中所述一种或多种标记物包含选自由KRAS(Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物)、MUC16(粘蛋白16,细胞表面相关)、MUC4(粘蛋白4,细胞表面相关)、TP53(肿瘤蛋白p53)和TTN(肌联蛋白)组成的组的基因中的一个或多个突变、插入、缺失、拷贝数变化或表达变化。
CN202080048135.9A 2019-05-03 2020-05-01 用于鉴定和定量核酸序列突变、表达、剪接变体、易位、拷贝数或甲基化变化的标记物 Pending CN115244188A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962843032P 2019-05-03 2019-05-03
US62/843,032 2019-05-03
PCT/US2020/031044 WO2020227100A1 (en) 2019-05-03 2020-05-01 Markers for identifying and quantifying of nucleic acid sequence mutation, expression, splice variant, translocation, copy number, or methylation changes

Publications (1)

Publication Number Publication Date
CN115244188A true CN115244188A (zh) 2022-10-25

Family

ID=73050598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080048135.9A Pending CN115244188A (zh) 2019-05-03 2020-05-01 用于鉴定和定量核酸序列突变、表达、剪接变体、易位、拷贝数或甲基化变化的标记物

Country Status (10)

Country Link
US (1) US20220243263A1 (zh)
EP (1) EP3963095A4 (zh)
JP (1) JP2022530920A (zh)
CN (1) CN115244188A (zh)
AU (1) AU2020268885A1 (zh)
BR (1) BR112021022084A2 (zh)
CA (1) CA3135726A1 (zh)
IL (1) IL287804A (zh)
SG (1) SG11202112246UA (zh)
WO (1) WO2020227100A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230124636A (ko) * 2020-12-24 2023-08-25 라이프 테크놀로지스 코포레이션 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법
JP2024509851A (ja) * 2021-03-05 2024-03-05 マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチ 子宮頸癌の検出
WO2022246000A1 (en) * 2021-05-19 2022-11-24 City Of Hope Compositions and methods for determining dna methylation level in cancer
WO2023017001A1 (en) * 2021-08-09 2023-02-16 Epigenomics Ag Improved methods for detecting colorectal cancer
WO2024064369A1 (en) * 2022-09-23 2024-03-28 Flagship Pioneering Innovations Vi, Llc Methods for amplifying nucleic acids

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE342378T1 (de) * 1999-03-19 2006-11-15 Cornell Res Foundation Inc Verfahren das auf den gekoppelten reactionen der polymerase-kettenreaktion (pcr)-verdauung mit restriktionsenzymen und ligasenachweis basiert
JP2015508655A (ja) * 2012-02-14 2015-03-23 コーネル ユニバーシティー 組み合わせたヌクレアーゼ反応、連結反応、およびポリメラーゼ反応を用いて核酸配列、発現、またはコピー変化を相対的に定量するための方法
EP4335929A3 (en) * 2012-09-20 2024-05-29 The Chinese University of Hong Kong Non-invasive determination of methylome of tumor from plasma
US10155991B2 (en) * 2013-08-15 2018-12-18 Xueliang James Xia Biomarkers for use in colorectal cancer
EP4026914A1 (en) * 2014-10-08 2022-07-13 Cornell University Method for identification and relative quantification of nucleic acid methylation changes using combined nuclease, ligation, and polymerase reactions with carryover prevention
US10030272B2 (en) * 2015-02-27 2018-07-24 Mayo Foundation For Medical Education And Research Detecting gastrointestinal neoplasms
EP3274293A4 (en) * 2015-03-23 2018-08-22 The University of North Carolina at Chapel Hill Method for identification and enumeration of nucleic acid sequences, expression, splice variant, translocation, copy, or dna methylation changes using combined nuclease, ligase, polymerase, terminal transferase, and sequencing reactions
GB201511152D0 (en) * 2015-06-24 2015-08-05 Ucl Business Plc Method of diagnosing bladder cancer
WO2018087129A1 (en) * 2016-11-08 2018-05-17 Region Nordjylland, Aalborg University Hospital Colorectal cancer methylation markers
CA3076386A1 (en) * 2017-09-29 2019-04-04 Lukas Vrba Dna methylation biomarkers for cancer diagnosing

Also Published As

Publication number Publication date
CA3135726A1 (en) 2020-11-12
JP2022530920A (ja) 2022-07-04
WO2020227100A8 (en) 2022-01-13
EP3963095A1 (en) 2022-03-09
SG11202112246UA (en) 2021-12-30
IL287804A (en) 2022-01-01
AU2020268885A1 (en) 2021-12-02
US20220243263A1 (en) 2022-08-04
WO2020227100A1 (en) 2020-11-12
BR112021022084A2 (pt) 2022-02-08
EP3963095A4 (en) 2023-01-25

Similar Documents

Publication Publication Date Title
US20220356528A1 (en) Microrna assay for detection and management of pancreatic cancer precursors
US20220243263A1 (en) Markers for identifying and quantifying of nucleic acid sequence mutation, expression, splice variant, translocation, copy number, or methylation changes
Radpour et al. Hypermethylation of tumor suppressor genes involved in critical regulatory pathways for developing a blood-based test in breast cancer
Vlassov et al. Circulating nucleic acids as a potential source for cancer biomarkers
JP2023040174A (ja) 核酸の発現、スプライス変異体、転座、コピー数、またはメチル化変化を識別及び定量化するための方法
CN113661249A (zh) 用于分离无细胞dna的组合物和方法
KR20200105661A (ko) 유방암 검출방법
EP3524688B1 (en) Multiple detection method of methylated dna
US11396678B2 (en) Breast and ovarian cancer methylation markers and uses thereof
Cheung et al. The potential of circulating cell free RNA as a biomarker in cancer
Roberts et al. Identification of methods for use of formalin-fixed, paraffin-embedded tissue samples in RNA expression profiling
US11035849B2 (en) Predicting the occurrence of metastatic cancer using epigenomic biomarkers and non-invasive methodologies
EP3481954A1 (en) Lung cancer methylation markers and uses thereof
US20100273151A1 (en) Genome-wide analysis of palindrome formation and dna methylation
KR20210099044A (ko) 폐 신생물 검출에서 메틸화된 dna, rna, 및 단백질의 특성화
Usó et al. miRNA detection methods and clinical implications in lung cancer
CA3154354A1 (en) Detecting ovarian cancer
CN114945687A (zh) 对疑似具有肺瘤变的受试者中的甲基化dna、rna和蛋白质的表征
US20230287484A1 (en) Method and markers for identification and relative quantification of nucleic acid sequence, mutation, copy number, or methylation changes using combinations of nuclease, ligation, deamination, dna repair, and polymerase reactions with carryover prevention
US20220205050A1 (en) Method and markers for identifying and quantifying of nucleic acid sequence, mutation, copy number, or methylation changes
US9328379B2 (en) Hypermethylation biomarkers for detection of head and neck squamous cell cancer
Bacolod et al. Application of Multiplex Bisulfite PCR–Ligase Detection Reaction–Real-Time Quantitative PCR Assay in Interrogating Bioinformatically Identified, Blood-Based Methylation Markers for Colorectal Cancer
JPWO2020112869A5 (zh)
JPWO2020227100A5 (zh)
US20080213781A1 (en) Methods of detecting methylation patterns within a CpG island

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination