CN114945687A - 对疑似具有肺瘤变的受试者中的甲基化dna、rna和蛋白质的表征 - Google Patents

对疑似具有肺瘤变的受试者中的甲基化dna、rna和蛋白质的表征 Download PDF

Info

Publication number
CN114945687A
CN114945687A CN202080075372.4A CN202080075372A CN114945687A CN 114945687 A CN114945687 A CN 114945687A CN 202080075372 A CN202080075372 A CN 202080075372A CN 114945687 A CN114945687 A CN 114945687A
Authority
CN
China
Prior art keywords
dna
methylation
marker
rna
max
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080075372.4A
Other languages
English (en)
Inventor
S.莫里斯
D.马勒里
H.T.阿拉威
G.P.利德加德
M.贾库莫普洛斯
M.W.凯泽
D.A.阿尔奎斯特
W.R.泰勒
D.W.马奥尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mayo Foundation for Medical Education and Research
Exact Sciences Corp
Original Assignee
Mayo Foundation for Medical Education and Research
Exact Sciences Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mayo Foundation for Medical Education and Research, Exact Sciences Corp filed Critical Mayo Foundation for Medical Education and Research
Publication of CN114945687A publication Critical patent/CN114945687A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供了与检测瘤变有关,并且具体地说但不排他地与用于检测赘瘤诸如肺癌的方法、组合物和相关用途有关的技术。

Description

对疑似具有肺瘤变的受试者中的甲基化DNA、RNA和蛋白质的 表征
本申请要求2019年8月27日提交的美国临时申请序列号62/892,426的优先权,所述临时申请以引用的方式并入本文中。
发明领域
本文提供了与检测瘤变有关并且具体地但不排他地与用于检测赘瘤(诸如肺癌)的方法、组合物以及相关用途有关的技术。本发明的方面涉及用于通过测定患者血液的提取物来检测肺癌的系统和方法。具体地说,实施方案包括用于通过检测免疫细胞RNA表达或循环无细胞RNA水平来确定肺癌在不同阶段的进展的系统和方法。
发明背景
在美国肺癌仍为第一癌症杀手,并且迫切需要有效的筛查方法。仅肺癌每年就引起221,000例死亡。存在治疗方法,但常常直到疾病进展至危及治疗功效时才向患者施用。
癌症治疗中的主要挑战为在疾病过程中在早期对患者进行鉴定。根据当前的方法这是困难的,因为早期癌细胞群体或癌症前期细胞群体可能为无症状的并且可能定位于活组织切片检查难以到达的区域。因此,可用于鉴定疾病的所有阶段(包括可能无症状的早期阶段)的稳健的最低限度侵入性测定对癌症的治疗来说将具有重大益处。
发明内容
本文所公开的系统、装置、试剂盒、组合物和方法各自具有若干方面,其中的单一方面都不仅仅负责其所需特征。在不限制权利要求的范围的情况下,现将简单论述一些突出特征。还涵盖许多其他实施方案,包括具有更少、额外及/或不同组件、步骤、特征、物件、益处和优点的实施方案。组件、方面和步骤也可以不同方式排列和排序。在考虑此论述之后,并且特别是在阅读标题为“具体实施方式”的章节之后,将理解相较于其他已知装置和方法本文所公开的装置和方法的特征如何提供优点。
所述技术提供了对来自受试者的样品或样品组合进行表征的方法,所述方法包括针对多种不同类型的标记物分子对一个或多个样品进行分析。举例来说,在一些实施方案中,所述技术提供了一种方法,所述方法包括测量从受试者获得的样品的DNA中的至少一种甲基化标记基因的量,并且还包括测量从受试者获得的样品中的至少一种RNA标记物的量以及测定从受试者获得的样品中的至少一种蛋白质标记物的存在或不存在中的一者或多者。在一些实施方案中,分析来自受试者的单个样品的一种或多种甲基化标记DNA、一种或多种标记RNA以及一种或多种标记蛋白质。
DNA、RNA和/或蛋白质标记物的分析不限于使用任何特定技术。用于分析DNA和RNA的方法包括但不限于核酸检测测定,包括例如扩增和探针杂交。用于分析蛋白质的方法包括但不限于酶联免疫吸附测定(ELISA)检测、蛋白质免疫沉淀、蛋白质印迹、免疫染色等。
一个实施方案为一种表征来自受试者的样品(例如从受试者取样的血液)作为在受试者(例如人)中检测肺癌和/或确定肺癌风险的手段的方法。所述方法包括:提供人的血液样品;检测血液样品中靶基因S100钙结合蛋白A9(S100A9)、选择素L(SELL)、肽基精氨酸脱亚胺酶4(PADI4)、载脂蛋白B MRNA编辑酶催化亚单位3A(APOBE3CA)、S100钙结合蛋白A12(S100A12)、基质金属肽酶9(MMP9)、甲酰肽受体1(FPR1)、胸苷磷酸化酶(TYMP)和/或亚精胺/精胺N1-乙酰转移酶1(SAT1)的靶基因表达水平;检测血液样品中参考基因的参考基因表达水平;以及通过将检测到的靶基因表达水平与检测到的参考基因表达水平进行比较来确定存在或不存在肺瘤变,或确定人患肺癌的风险。
在一些实施方案中,所述技术提供了一种用于测量从受试者取样的血液中一种或多种基因表达产物的量的方法,所述方法包括:
a)从自受试者取样的血液中提取:
i)至少一种基因表达标记物,其中所述至少一种基因表达标记物为选自S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1的标记基因的表达产物;以及
ii)至少一种参考标记物;
b)测量在a)中提取的至少一种基因表达标记物的量和至少一种参考标记物的量;
c)将至少一种基因表达标记物的量的值计算为至少一种参考标记物的量的百分比,其中所述值指示从受试者取样的血液中的至少一种基因表达标记物的量。
在一些实施方案中,提取包括从选自全血、包含白细胞的血液制品和包含血浆的血液制品的样品中提取标记物。在某些实施方案中,至少一种基因表达标记物包括蛋白质或RNA,并且在某些优选实施方案中,从自受试者取样的血液中提取的RNA包括循环无细胞RNA。在一些实施方案中,从自受试者取样的血液中提取的RNA包括由免疫细胞表达的RNA。在上文所述的任何实施方案中,从自受试者取样的血液中提取的RNA可包括mRNA。
所述技术不限于测量单一基因表达标记物,并且所述技术涵盖多种基因表达标记物的测量,例如使得可如下文详细讨论以组合形式分析测量数据。在一些实施方案中,将所述技术应用于一组有限的标记物的测量,例如为了应用所述技术的便利或效率。举例来说,在上述任何实施方案中,至少一种基因表达标记物可优选地由2、3、4、5、6、7、8或9种基因表达标记物组成。
在上述任何实施方案中,至少一种参考标记物可包括由选自PLGLB2、GABARAP、NACA、EIF1、UBB、UBC、CD81、TMBIM6、MYL12B、HSP90B1、CLDN18、RAMP2、MFAP4、FABP4、MARCO、RGL1、ZBTB16、C10orf116、GRK5、AGER、SCGB1A1、HBB、TCF21、GMFG、HYAL1、TEK、GNG11、ADH1A、TGFBR3、INPP1、ADH1B、STK4、ACTB、HNRNPA1、CASC3和SKP1的基因表达的RNA或蛋白质。在某些优选实施方案中,至少一种参考标记物包括RNA。在某些实施方案中,参考标记物包括选自U1 snRNA和U6 snRNA的RNA。
在应用于上述任何实施方案时,所述技术涵盖其中测量至少一种基因表达标记物的量包括使用逆转录、聚合酶链反应、核酸测序、质谱、基于质量的分离和靶标捕获、定量焦磷酸测序、活瓣核酸内切酶测定、PCR-活瓣测定、酶联免疫吸附测定(ELISA)检测和蛋白质免疫沉淀中的一者或多者的实施方案。在某些实施方案中,测量包括多重扩增。
在一些实施方案中,还分析了DNA。本文提供了一种在组织或血浆上测定的甲基化标记物的集合,所述集合对所有类型的肺癌实现了极高的辨别力,同时在正常肺组织和良性结节中保持阴性。可将选自所述集合的标记物单独使用或以组的形式使用,例如用于表征血液或体液,用于肺癌筛查和辨别恶性与良性结节。在一些实施方案中,使用来自所述组的标记物来区分一种形式的肺癌与另一种形式的肺癌,例如用于区分存在肺腺癌或大细胞癌与存在肺小细胞癌,或用于检测混合病理癌。本文提供了用于筛查标记物的技术,所述标记物在从取自受试者的样品中被检测到时,提供高信噪比和低背景水平。
研究中通过将来自肺癌样品的甲基化标记物的甲基化状态与正常(非癌)样品中的对应标记物进行比较鉴定了具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释的甲基化标记物和/或标记物组(例如一个或多个染色体区)。
如本文所述,所述技术提供了对癌症具有高辩别力并且在一些实施方案中在各肺癌类型之间具有辩别力的许多甲基化标记物及其子集(例如2、3、4、5、6、7、8、9、10、11、12个或更多个标记物的集合)。
因此,上述任何实施方案的测量从受试者取样的血液中一种或多种基因表达产物的量的技术可还包括:
d)从自受试者取样的血液提取至少一种甲基化标记DNA和至少一种参考标记DNA;
e)测量至少一种甲基化标记DNA的量,其中所述至少一种甲基化标记DNA包含与以下中的至少一者相关的核苷酸序列:EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAXchr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329;
f)测量至少一种参考标记DNA的量;以及
g)将至少一种甲基化标记DNA的量的值计算为参考标记DNA的量的百分比,其中所述值指示从受试者取样的血液中的至少一种甲基化标记DNA的量。
所述技术不限于测量甲基化标记DNA,并且所述技术涵盖多种甲基化标记DNA的测量,例如使得可如下文详细讨论将不同甲基化标记DNA的测量数据彼此组合和/或与RNA和/或蛋白质基因表达标记物的测量数据组合进行分析。在一些实施方案中,将所述技术应用于一组有限的甲基化标记DNA的测量,例如为了应用所述技术的便利或效率。举例来说,在上述任何实施方案中,至少一种甲基化标记DNA可优选由2、3、4、5、6、7、8、9、10、11、12、13、14或15种甲基化标记DNA组成。在某些实施方案中,至少一种甲基化标记DNA包含与BARX1、FLJ45983、HOPX、ZNF781、FAM59B、HOXA9、SOBP和IFFO1中的至少一者相关的核苷酸序列。在上述任何实施方案中的某些实施方案中,所述至少一种基因表达标记物包括选自FPR1、PADI4和SELL的标记基因的表达产物。
在某些实施方案中,从自受试者取样的血液中提取的DNA包括循环无细胞DNA。在其他实施方案中,所述DNA包括细胞DNA。在上述任何实施方案中,用于计算至少一种甲基化标记DNA的量的值的至少一种参考标记DNA可优选选自B3GALT6 DNA和β-肌动蛋白DNA。
在上述用于测量甲基化标记DNA的任何实施方案中包括其中甲基化标记DNA用试剂处理的实施方案,所述试剂以对DNA的甲基化状态具特异性的方式选择性地修饰DNA。在一些实施方案中,所述试剂包括亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶,并且在某些优选实施方案中,亚硫酸氢盐试剂包括亚硫酸氢铵。
虽然不将所述技术限制于测量甲基化标记DNA的量的任何特定方法,但在一些实施方案中,测量至少一种甲基化标记DNA的量包括使用聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离和靶标捕获中的一者或多者,并且在某些优选实施方案中,测量包括多重扩增。在一些实施方案中,测量至少一种甲基化标记DNA的量包括使用选自由以下组成的组的一种或多种方法:甲基化特异性PCR、定量甲基化特异性PCR、甲基化特异性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序、活瓣核酸内切酶测定、PCR-活瓣测定和亚硫酸氢盐基因组测序PCR。
所述技术的实施方案提供了一种表征从受试者取样的血液的方法,所述方法包括:
i)处理从受试者取样的血液以产生提取的DNA和提取的RNA;
ii)测量提取的RNA中两种或更多种标记RNA的量,其中标记RNA选自S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1 RNA;
iii)测量提取的RNA中至少一种参考RNA的量,其中参考RNA选自CASC3A、SKP1和STK4;
iv)将两种或更多种标记RNA中的每一者的量的值计算为至少一种参考RNA的量的百分比,其中每种标记RNA的值指示从受试者取样的血液中的标记RNA的量;
v)用亚硫酸氢盐试剂处理提取的DNA以产生亚硫酸氢盐处理的DNA;
vi)测量亚硫酸氢盐处理的DNA中两种或更多种甲基化标记DNA的量,其中所述甲基化标记DNA选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329基因;
vii)测量亚硫酸氢盐处理的DNA中至少一种参考DNA的量,其中所述至少一种参考DNA选自B3GALT6 DNA和β-肌动蛋白DNA;以及
viii)将所述两种或更多种甲基化标记DNA中的每一者的量的值计算为在亚硫酸氢盐处理的DNA中测量的参考DNA的量的百分比,其中每种甲基化标记DNA的值指示从受试者取样的血液中的甲基化标记DNA的量。
上文所述的包括DNA和RNA分析的实施方案涵盖其中从在单个采血装置(包括但不限于单个采血管或采血袋)中收集的血液中分离DNA和RNA的实施方案。
上文所述的任何实施方案包括其中受试者患有或疑似患有肺赘瘤和/或其中所述技术包括基于使用上述测量方法计算的值来评估受试者患肺癌的风险的实施方案。举例来说,在一些实施方案中,从受试者取样的血液中至少一种基因表达标记物的量和/或至少一种甲基化标记DNA的量指示受试者的肺癌风险。
在一些实施方案中,用于测定标记物的甲基化状态的设计包括对要由测定技术考查的标记物靶区域中的单独CpG基因座处的背景甲基化进行分析。举例来说,在一些实施方案中,从自被诊断患有疾病(例如癌症)的受试者分离的样品中检验到大量标记DNA的单独拷贝(例如>10,000,优选>100,000个单独拷贝)从而确定甲基化频率,并且将这些数据与从无病受试者分离的样品的类似大量标记DNA单独拷贝进行比较。可将样品的标记DNA内单独CpG基因座处的疾病相关甲基化与背景甲基化的频率进行比较,使得可选择具有更高信噪比(例如更高可检测甲基化和/或降低的背景甲基化)的CpG基因座用于测定设计。参见例如美国专利号9,637,792和10,519,510,所述专利各自以全文引用的方式并入本文中。在一些实施方案中,通过测定同时考查一组高信噪比CpG基因座(例如标记物区域中的2、3、4、5个或更多个单独CpG基因座),使得对于要根据测定结果归类为“甲基化”或“未甲基化”的标记物来说,所有CpG基因座一定具有预定甲基化状态(例如所有一定为甲基化的或所有都不可能为甲基化的)。
在一些实施方案中,提供一种试剂盒,所述试剂盒包含用于测定的试剂或材料,所述分析选自测量至少一种基因表达标记物和/或至少一种甲基化标记DNA的量或其存在或不存在。至少一种基因表达标记物可为RNA标记物或蛋白质标记物。
举例来说,某些试剂盒实施方案提供了:
a)用于测量从受试者取样的血液中至少一种基因表达标记物的量的试剂的集合,其中所述至少一种基因表达标记物由选自以下的标记基因的表达产生:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1;
b)用于测量从受试者取样的血液中至少一种参考标记物的量的试剂的集合。
在一些实施方案中,试剂盒还包含用于从血液提取至少一种基因表达标记物和至少一种参考标记物的试剂的集合。在一些实施方案中,至少一种基因表达标记物包括RNA和蛋白质中的一者或多者,并且至少一种参考标记物包括RNA、DNA和蛋白质中的一者或多者。在某些实施方案中,试剂盒包含:
i)至少一种第一寡核苷酸,其中所述至少一种第一寡核苷酸的至少一部分特异性地与包含与选自以下的基因表达标记物相关的核苷酸序列的核酸链杂交:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1;
ii)至少一种第二寡核苷酸,其中所述至少一种第二寡核苷酸的至少一部分特异性地与参考标记物杂交,其中所述参考标记物为参考核酸。
在上述试剂盒的实施方案中,包含与基因表达标记物相关的核苷酸序列的核酸链选自RNA、cDNA或扩增的DNA。在某些实施方案中,参考核酸包括RNA或DNA,而在一些实施方案中,参考基因表达标记物优选包括从选自以下的基因表达的RNA或蛋白质:PLGLB2、GABARAP、NACA、EIF1、UBB、UBC、CD81、TMBIM6、MYL12B、HSP90B1、CLDN18、RAMP2、MFAP4、FABP4、MARCO、RGL1、ZBTB16、C10orf116、GRK5、AGER、SCGB1A1、HBB、TCF21、GMFG、HYAL1、TEK、GNG11、ADH1A、TGFBR3、INPP1、ADH1B、STK4、ACTB、HNRNPA1、CASC3和SKP1。
在上述任何实施方案中,所述技术的试剂盒可还包含:
c)用于测量从受试者取样的血液中至少一种甲基化标记DNA的量的试剂的集合,其中所述至少一种甲基化标记DNA包含与以下中的至少一者相关的核苷酸序列:EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329。
在一些实施方案中,用于测量至少一种甲基化标记DNA的量的试剂的集合包含:
i)至少一种第三寡核苷酸,其中所述至少一种第三寡核苷酸的至少一部分特异性地与包含与以下甲基化标记基因相关的核苷酸序列的核酸链杂交:EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329。
上述试剂盒的实施方案可还包含至少一种第四寡核苷酸,其中所述至少一种第四寡核苷酸的至少一部分特异性地与参考标记DNA、优选选自B3GALT6 DNA和β-肌动蛋白DNA的参考标记DNA杂交。在一些实施方案中,包含与甲基化标记基因相关的核苷酸序列的核酸链和参考标记DNA中的至少一者包含亚硫酸氢盐处理的DNA。
在一些实施方案中,如上所述的试剂盒还包含以对DNA的甲基化状态具特异性的方式选择性地修饰DNA的试剂。在某些实施方案中,以对DNA的甲基化状态具特异性的方式选择性修饰DNA的试剂包括亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶。在某些优选实施方案中,亚硫酸氢盐试剂包括亚硫酸氢铵。
以上提供的试剂盒的实施方案还涵盖其中至少一种第一、第二、第三和第四寡核苷酸中的一者或多者选自捕获寡核苷酸、核酸引物对、核酸探针和侵入性寡核苷酸的试剂盒,并且在某些实施方案中,捕获寡核苷酸例如共价或通过非共价连接(例如生物素-链霉亲和素结合或抗原-抗体结合)连接至固体载体。在优选实施方案中,固体载体为磁性珠粒。
上文所述技术的任何试剂盒的实施方案包括试剂盒,所述试剂盒包含:
i)第一引物对,所述第一引物对用于从选自以下的标记基因的表达的基因表达标记物产物产生第一扩增DNA:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1;
ii)第一探针,所述第一探针包含与所述第一扩增DNA的区域互补的序列;
iii)第二引物对,所述第二引物对用于产生第二扩增DNA;
iv)第二探针,所述第二探针包含与所述第二扩增DNA的区域互补的序列;
v)逆转录酶;以及
vi)热稳定DNA聚合酶。
在一些实施方案中,第二扩增DNA由甲基化标记基因或参考标记核酸产生。
在某些实施方案中,第一探针还包含具有第一活瓣序列的活瓣部分,所述第一活瓣序列基本上不与所述第一扩增DNA互补,并且在一些实施方案中,第二探针还包含具有第二活瓣序列的活瓣部分,所述第二活瓣序列基本上不与所述第二扩增DNA互补。所述技术的试剂盒可还包含以下中的一者或多者:
vii)包含与所述第一活瓣序列互补的序列的FRET盒;
viii)包含与所述第二活瓣序列互补的序列的FRET盒。
上文所述的任何试剂盒可还包含活瓣核酸内切酶。在某些优选实施方案中,活瓣核酸内切酶为FEN-1核酸内切酶,例如来自古菌有机体的热稳定FEN-1核酸内切酶。
所述技术的应用还提供了组合物。举例来说,在一些实施方案中,所述技术提供了一种组合物,所述组合物包含:
i)第一引物对,所述第一引物对用于从选自以下的基因的表达的基因表达标记物产物产生第一扩增DNA:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1;
ii)第一探针,所述第一探针包含与所述第一扩增DNA的区域互补的序列;
iii)第二引物对,所述第二引物对用于产生第二扩增DNA;
iv)第二探针,所述第二探针包含与所述第二扩增DNA的区域互补的序列;
v)逆转录酶;以及
vi)热稳定DNA聚合酶。
在一些实施方案中,组合物还包含从自受试者取样的血液提取的核酸,其中所述受试者优选患有或疑似患有肺赘瘤,或处于患肺癌的风险中。在组合物的一些实施方案中,核酸包括以下中的一者或多者:
-细胞RNA;
-循环无细胞RNA;
-细胞DNA;
-循环无细胞DNA。
在一些实施方案中,第二引物对从甲基化标记基因或参考标记核酸产生第二扩增DNA。在某些优选实施方案中,第二引物对从参考核酸产生第二扩增DNA,所述参考核酸选自:
-由选自以下的基因表达的RNA:PLGLB2、GABARAP、NACA、EIF1、UBB、UBC、CD81、TMBIM6、MYL12B、HSP90B1、CLDN18、RAMP2、MFAP4、FABP4、MARCO、RGL1、ZBTB16、C10orf116、GRK5、AGER、SCGB1A1、HBB、TCF21、GMFG、HYAL1、TEK、GNG11、ADH1A、TGFBR3、INPP1、ADH1B、STK4、ACTB、HNRNPA1、CASC3和SKP1;
-选自U1 snRNA和U6 snRNA的RNA;
-选自B3GALT6 DNA和β-肌动蛋白DNA的DNA。
在某些实施方案中,对第二引物对进行选择以从选自以下的甲基化标记基因产生第二扩增DNA:EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329。
熟练技工将认识到以上组合物不限于两个引物对,而是涵盖含有用于从多种不同基因表达标记物产生扩增DNA的许多不同引物对和/或用于从多种不同甲基化标记基因产生扩增DNA的许多不同引物对的组合物。组合物可还包含用于从多种不同参考标记核酸产生扩增DNA的许多不同引物对。
在上述组合物中,第一探针和/或第二探针包含含有荧光团的检测部分。在某些实施方案中,可用荧光团和淬灭部分对所述技术的探针进行标记,使得当探针完整时(例如当它尚未由5'核酸酶裂解时)荧光团的发光被淬灭。
在一些实施方案中,第一探针还包含具有第一活瓣序列的活瓣部分,所述第一活瓣序列基本上不与所述第一扩增DNA互补,和/或其中第二探针还包含具有第二活瓣序列的活瓣部分,所述第二活瓣序列基本上不与所述第二扩增DNA互补。在某些实施方案中,组合物还包含以下中的一者或多者:
vii)包含与第一活瓣序列互补的序列的FRET盒;
viii)包含与第二活瓣序列互补的序列的FRET盒。
上述任何组合物可还包含活瓣核酸内切酶,优选为FEN-1核酸内切酶,例如来自古菌有机体的热稳定FEN-1。
在某些实施方案中,上述组合物包含含有Mg++(例如MgCl2)的缓冲液。优选地,组合物包含与标准PCR缓冲液相比含有相对高Mg++和低KCl的PCR-活瓣测定缓冲液(例如6-10mM,优选7.5mM Mg++,以及0.0至0.8mM KCl)。
所述技术的实施方案还包括含有上文所述组合物中的任一者的反应混合物。
在一些实施方案中,试剂盒包含用于至少两种测定的试剂或材料,其中所述测定选自测量1)至少一种甲基化DNA标记物;2)至少一种RNA标记物;和/或3)至少一种蛋白质标记物的量或其存在或不存在。在优选实施方案中,至少一种甲基化DNA标记物选自由以下组成的组:BARX1、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ZNF671、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、ANKRD13B、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、HOXA9、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、ZNF781、PTGDR、GRIN2D、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、EMX1、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12a、BHLHE23、CAPN2、FGF14、FLJ34208、B3GALT6、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15、ZDHHC1、ZNF329、IFFO1和HOPX。在某些优选实施方案中,至少一种RNA表达标记物由选自由以下组成的组的基因表达:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1。在一些实施方案中,至少一种蛋白质包括抗原,例如癌症相关抗原,而在一些实施方案中,至少一种蛋白质包括抗体,例如针对癌症相关抗原的自身抗体。
在一些实施方案中,所述混合物中的寡核苷酸包含报告分子,并且在优选实施方案中,报告分子包含荧光团。在一些实施方案中,寡核苷酸包含活瓣序列。在一些实施方案中,混合物还包含以下中的一者或多者:FRET盒;FEN-1核酸内切酶和/或热稳定DNA聚合酶,优选为细菌DNA聚合酶。
定义
为了有助于理解本发明技术,许多术语和短语定义如下。具体实施方式中阐述了额外的定义。
在本说明书和权利要求书中,除非上下文另外明确指示,否则以下术语采用本文中明确关联的含义。如本文所用的短语“在一个实施方案中”不一定指同一实施方案,不过它可能指同一实施方案。此外,如本文所用的短语“在另一实施方案中”不一定指不同的实施方案,不过它可能指不同的实施方案。因此,如下文所述,在不背离本发明的范围或精神的情况下可容易地将本发明的各个实施方案组合。
此外,除非上下文另外明确指示,否则如本文所用,术语“或”为包括性的“或”运算符并且等效于术语“和/或”。除非上下文另外明确指示,否则术语“基于”不为排他性的并且允许基于未描述的额外因素。此外,在本说明书通篇中,“一个”、“一种”和“所述”的含义包括复数参考物。“在……中”的含义包括“在……中”和“在……上”。
如In re Herz,537 F.2d 549,551-52,190 USPQ 461,463(CCPA 1976)中所论述,如本申请在权利要求书中所用的过渡短语“实质上由……组成”将权利要求书的范围限于指定的材料或步骤“以及不实质性地影响所要求的发明的一种或多种基本和新颖特征的那些材料或步骤”。举例来说,“基本上由列举的要素组成的”组合物可含有一定水平的未列举的污染物,使得与纯组合物(即“由所列举的组分组成”的组合物)相比,虽然存在污染物,但污染物不改变所叙述组合物的功能。
除非另外特别陈述或使用时在上下文以其他方式理解,否则诸如“可”、“可以”、“会”或“可能”等条件性措辞通常旨在传达某些实施方案包括(而其他实施方案不包括)某些特征、要素和/或步骤。因此,此类条件性措辞通常不旨在暗示特征、要素和/或步骤以任何方式为一个或多个实施方案所需的,或一个或多个实施方案必定包括用于在使用者输入或提示或使用者未输入或提示的情况下判断这些特征、要素和/或步骤是否被包括或是否要在任何特定实施方案中被执行的逻辑。
除非另外特别陈述,否则诸如短语“X、Y和Z中的至少一者”等连接措辞与上下文一起以其他方式理解为总体上用于传达一个项、术语等可为X、Y或Z。因此,此类连接措辞通常不旨在暗示某些实施方案需要存在至少一个X、至少一个Y和至少一个Z。
本文所用的诸如术语“大致”、“约”、“总体上”和“基本上”等程度措辞表示一个值、量或特征接近于所陈述的值、量或特征,从而仍执行所需功能或实现所需结果。
如本文所用,“甲基化”是指在胞嘧啶的位置C5或N4、腺嘌呤的N6位置的胞嘧啶甲基化或其他类型的核酸甲基化。体外扩增的DNA通常为未甲基化的,因为典型体外DNA扩增方法不保留扩增模板的甲基化模式。然而,“未甲基化DNA”或“甲基化DNA”也可分别指原始模板未甲基化或甲基化的扩增DNA。
因此,如本文所用,“甲基化核苷酸”或“甲基化核苷酸碱基”是指核苷酸碱基上存在甲基部分,其中甲基部分不存在于识别的典型核苷酸碱基中。举例来说,胞嘧啶在其嘧啶环上不含甲基部分,但5-甲基胞嘧啶在其嘧啶环的位置5含有甲基部分。因此,胞嘧啶不为甲基化核苷酸,而5-甲基胞嘧啶为甲基化核苷酸。在另一实例中,胸腺嘧啶在其嘧啶环的位置5含有甲基部分;然而,出于本文的目的,当存在于DNA中时不将胸腺嘧啶视为甲基化核苷酸,因于胸腺嘧啶为DNA的典型核苷酸碱基。
如本文所用,“甲基化核酸分子”是指含有一个或多个甲基化核苷酸的核酸分子。
如本文所用,核酸分子的“甲基化状况”、“甲基化谱”和“甲基化状态”是指核酸分子中存在或不存在一个或多个甲基化核苷酸碱基。举例来说,含有甲基化胞嘧啶的核酸分子被视为甲基化的(例如核酸分子的甲基化状态为甲基化的)。不含任何甲基化核苷酸的核酸分子被视为未甲基化的。在一些实施方案中,如果核酸在特定基因座(例如特定单CpG二核苷酸的基因座)或特定基因座组合处未甲基化,那么可将核酸表征为“未甲基化的”,即使它在相同基因或分子中的其他基因座处为甲基化的。
特定核酸序列(例如如本文所述的基因标记物或DNA区域)的甲基化状态可指示序列中每个碱基的甲基化状态或可指示序列内的碱基的(例如一个或多个胞嘧啶的)子集的甲基化状态,或可在提供或不提供序列内发生甲基化的位置的精确信息的情况下指示关于序列内区域性甲基化密度的信息。如本文所用,术语“标记基因”和“标记物”可互换地用于指与疾患(例如癌症)相关的DNA、RNA或蛋白质(或其他样品组分),不管标记物区域是否在DNA的编码区中。标记物可包括例如调控区、侧翼区、基因间区等。类似地,提及样品的任何组分(例如蛋白质、RNA、碳水化合物、小分子等)时所用的术语“标记物”是指样品中可测定(例如测量或以其他方式表征)并且与受试者的疾患相关的组分,或来自受试者的样品的组分。术语“甲基化标记物”是指基因或DNA,其中基因或DNA的甲基化状态与疾患(例如癌症)相关。
核酸分子中核苷酸基因座的甲基化状态是指在核酸分子中的特定基因座处存在或不存在甲基化核苷酸。举例来说,当存在于核酸分子中第7个核苷酸处的核苷酸为5-甲基胞嘧啶时,在核酸分子中第7个核苷酸处的胞嘧啶的甲基化状态为甲基化的。类似地,当存在于核酸分子中第7个核苷酸处的核苷酸为胞嘧啶(而不是5-甲基胞嘧啶)时,在核酸分子中第7个核苷酸处的胞嘧啶的甲基化状态为未甲基化的。
甲基化状态可任选由“甲基化值”(例如表示甲基化频率、分数、比率、百分比等)表示或指示。可例如通过定量在用甲基化依赖性限制酶限制消化之后存在的完整核酸的量或通过比较亚硫酸氢盐反应之后的扩增谱或通过将亚硫酸氢盐处理的核酸与未处理的核酸的序列进行比较来产生甲基化值。因此,值(例如甲基化值)表示甲基化状态并且因此可用作在基因座的多个拷贝中的甲基化状态的定量指示。当需要将样品中的序列的甲基化状态与阈值或参考值进行比较时这特别有用。
如本文所用,“甲基化频率”或“甲基化百分比(%)”是指相对于分子或基因座未甲基化的情况的数目所述分子或基因座发生甲基化的情况的数目。
因此,甲基化状态描述核酸(例如基因组序列)的甲基化的状态。此外,甲基化状态是指与甲基化有关的特定基因组基因座处的核酸区段的特征。此类特征包括但不限于此DNA序列内任何胞嘧啶(C)残基是否为甲基化的、一个或多个甲基化C残基的位置、核酸的任何特定区域中甲基化C的频率或百分比以及甲基化中归因于例如等位基因来源差异的等位基因差异。术语“甲基化状况”、“甲基化谱”和“甲基化状态”还指生物样品中的核酸的任何特定区域中甲基化C或未甲基化C的相对浓度、绝对浓度或模式。举例来说,如果核酸序列内一个或多个胞嘧啶(C)残基为甲基化的,那么可将其称为“高甲基化的”或具有“增加的甲基化”,然而如果DNA序列内一个或多个胞嘧啶(C)残基未甲基化,那么可将其称为“低甲基化的”或具有“降低的甲基化”。同样地,如果与另一核酸序列(例如来自不同区域或来自不同个体等)相比,核酸序列内一个或多个胞嘧啶(C)残基为甲基化的,那么将所述序列视为与另一核酸序列相比高甲基化的或具有增加的甲基化。或者,如果与另一核酸序列(例如来自不同区域或来自不同个体等)相比,DNA序列内一个或多个胞嘧啶(C)残基未甲基化,那么将所述序列视为与另一核酸序列相比低甲基化的或具有降低的甲基化。另外,如本文所用的术语“甲基化模式”是指在核酸的一定区域内甲基化和未甲基化核苷酸的集合位点。当在区域中甲基化和未甲基化核苷酸的数目相同或类似但甲基化和未甲基化核苷酸的位置不同时,两种核酸可具有相同或类似的甲基化频率或甲基化百分比,但具有不同的甲基化模式。当序列的甲基化的程度(例如一者相对于另一者具有增加或降低的甲基化)、频率或模式不同时,将其说成“差异甲基化的”或具有“甲基化差异”或具有“不同甲基化状态”。术语“差异甲基化”是指癌症阳性样品中核酸甲基化的水平或模式与癌症阴性样品中核酸甲基化的水平或模式相比的差异。它还可指在手术后癌症复发的患者与未复发的患者之间的水平或模式的差异。差异甲基化和DNA甲基化的特定水平或模式为预后和预示性生物标记物,例如在已确定恰当截止或预示特征后。
可使用甲基化状态频率来描述个体群体或来自单个个体的样品。举例来说,甲基化状态频率为50%的核苷酸基因座在50%的情况下为甲基化的并且在50%的情况下为未甲基化的。可使用此类频率来例如描述在个体群体或核酸集合中核苷酸基因座或核酸区域甲基化的程度。因此,当核酸分子的第一群体或汇集物的甲基化不同于核酸分子的第二群体或汇集物的甲基化时,第一群体或汇集物的甲基化状态频率将不同于第二群体或汇集物的甲基化状态频率。还可使用此类频率来例如描述单个个体中核苷酸基因座或核酸区域甲基化的程度。举例来说,可使用此类频率来描述来自组织样品的一组细胞在核苷酸基因座或核酸区域处甲基化或未甲基化的程度。
如本文所用,“核苷酸基因座”是指核酸分子中核苷酸的位置。甲基化核苷酸的核苷酸基因座是指核酸分子中甲基化核苷酸的位置。
典型地,人DNA的甲基化发生在包括相邻鸟嘌呤和胞嘧啶且其中胞嘧啶定位于鸟嘌呤的5'的二核苷酸序列(也称为CpG二核苷酸序列)上。在人基因组中CpG二核苷酸内的大多数胞嘧啶为甲基化的,然而在富含特定CpG二核苷酸的基因组区域(称为CpG岛)中一些仍然未甲基化(参见例如Antequera等(1990)Cell 62:503-514)。
如本文所用,“CpG岛”是指相对于总基因组DNA含有增加数目的CpG二核苷酸的基因组DNA的富含G:C的区域。CpG岛的长度可为至少100、200个或更多个碱基对,其中所述区域的G:C含量为至少50%并且所观测到的CpG频率相较于预期频率的比率为0.6;在一些情况下,CpG岛的长度可为至少500个碱基对,其中所述区域的G:C含量为至少55%)并且所观测到的CpG频率相较于预期频率的比率为0.65。根据Gardiner-Garden等(1987)J.Mol.Biol.196:261-281中所提供的方法可计算相较于预期频率所观测到的CpG频率。举例来说,可根据式R=(A×B)/(C×D)计算相较于预期频率所观测到的CpG频率,其中R为所观测到的CpG频率相较于预期频率的比率,A为所分析的序列中的CpG二核苷酸的数目,B为所分析的序列中的核苷酸的总数目,C为所分析的序列中的C核苷酸的总数目,并且D为所分析的序列中的G核苷酸的总数目。典型地在CpG岛中(例如在启动子区)确定甲基化状态。不过应认识到,人基因组中的其他序列有DNA甲基化的倾向,诸如CpA和CpT(参见Ramsahoye(2000)Proc.Natl.Acad.Sci.USA 97:5237-5242;Salmon和Kaye(1970)Biochim.Biophys.Acta.204:340-351;Grafstrom(1985)Nucleic Acids Res.13:2827-2842;Nyce(1986)Nucleic Acids Res.14:4353-4367;Woodcock(1987)Biochem.Biophys.Res.Commun.145:888-894)。
如本文所用,“甲基化特异性试剂”是指随核酸分子的甲基化状态而变修饰核酸分子的核苷酸的试剂,或者甲基化特异性试剂是指可以反映核酸分子的甲基化状态的方式改变核苷酸序列的核酸分子的化合物或组合物或其他剂。用此类试剂处理核酸分子的方法可包括使核酸分子与试剂接触,结合额外的步骤(如果需要),以实现所需的核苷酸序列改变。可以将未甲基化的核苷酸(例如各未甲基化胞嘧啶)修饰为不同核苷酸的方式应用此类方法。举例来说,在一些实施方案中,此类试剂可将未甲基化的胞嘧啶核苷酸脱去氨基以产生脱氧尿嘧啶残基。示例性试剂为亚硫酸氢盐试剂。
术语“亚硫酸氢盐试剂”是指如本文所公开适合区分甲基化与未甲基化CpG二核苷酸序列的试剂,包括亚硫酸氢盐、重亚硫酸盐、酸式亚硫酸盐或它们的组合。所述处理的方法为本领域中已知的(例如PCT/EP2004/011715和WO 2013/116375,这些专利各自以全文引用的方式併入本文中)。在一些实施方案中,在存在变性溶剂(诸如但不限于正-亚烷基二醇或乙二醇二甲醚(DME))的情况下,或在存在二噁烷或二噁烷衍生物的情况下进行亚硫酸氢盐处理。在一些实施方案中,以1%与35%(v/v)之间的浓度使用变性溶剂。在一些实施方案中,在存在清除剂的情况下(诸如但不限于色满衍生物,例如6-羟基-2,5,7,8,-四甲基色满2-羧酸或三羟基苯甲酸以及它们的衍生物,例如没食子酸)进行亚硫酸氢盐反应(参见:PCT/EP2004/011715,所述专利以全文引用的方式并入本文中)。在某些优选实施方案中,亚硫酸氢盐反应包括例如如WO 2013/116375中所述用酸式亚硫酸铵处理。
由甲基化特异性试剂引起的核酸核苷酸序列的改变还可产生其中各甲基化核苷酸被修饰为不同核苷酸的核酸分子。
术语“甲基化测定”是指用于确定核酸序列内的一个或多个CpG二核苷酸序列的甲基化状态的任何测定。
如本文所用,给定标记物(或一起使用的标记物的集合)的“敏感度”是指报告DNA甲基化值超过区别赘生与非赘生样品的阈值的样品的百分比。在一些实施方案中,阳性定义为报告DNA甲基化值超过阈值(例如与疾病相关的范围)的组织学证实的瘤变,并且假阴性定义为报告DNA甲基化值低于阈值(例如不与疾病相关的范围)的组织学证实的瘤变。因此,敏感度的值反映从已知患病样品获得的给定标记物的DNA甲基化测量将在疾病相关测量范围内的可能性。如本文所定义,所计算的敏感度值的临床相关性表示对当应用于患有临床疾患的受试者时给定标记物将检测到存在所述疾患的可能性的评估。
如本文所用,给定标记物(或一起使用的标记物组)的“特异性”是指报告DNA甲基化值高于区分赘生与非赘生样品的阈值的非赘生样品的百分比。在一些实施方案中,阴性定义为报告DNA甲基化值低于阈值(例如不与疾病相关的范围)的组织学证实的非赘生样品,并且假阳性定义为报告DNA甲基化值超过阈值(例如与疾病相关的范围)的组织学证实的非赘生样品。因此,特异性的值反映从已知非赘生样品获得的给定标记物的DNA甲基化测量将在非疾病相关测量范围内的可能性。如本文所定义,所计算的特异性值的临床相关性表示对当应用于未患临床疾患的患者时给定标记物将检测到不存在所述疾患的可能性的评估。
如本文所用,“所选核苷酸”是指四种典型地存在于核酸分子中的核苷酸(对于DNA来说为C、G、T和A,并且对于RNA来说为C、G、U和A)中的一种核苷酸,并且可包括典型地存在的核苷酸的甲基化衍生物(例如当C为所选核苷酸时,甲基化与未甲基化C都包括在所选核苷酸的含义内),然而甲基化的所选核苷酸特定地指典型地甲基化的核苷酸,并且未甲基化的所选核苷酸特定地指典型地以未甲基化形式存在的核苷酸。
术语“甲基化特异性限制酶”是指根据识别位点的甲基化状态选择性地消化核酸的限制酶。在特定地如果识别位点未甲基化或半甲基化那么进行切割的限制酶(甲基化敏感性酶)的情况下,如果在一条或两条链上识别位点为甲基化的,那么将不进行(或将以显著降低的效率进行)切割。在特定地仅在识别位点发生甲基化时进行切割的限制酶(甲基化依赖性酶)的情况下,如果识别位点未甲基化,那么将不进行(或将以显著降低的效率进行)切割。优选为甲基化特异性限制酶,其识别序列含有CG二核苷酸(例如诸如CGCG或CCCGGG等识别序列)。对于一些实施方案来说,进一步优选的是如果在碳原子C5处此二核苷酸中的胞嘧啶发生甲基化那么不进行切割的限制酶。
术语“引物”是指以例如来自限制消化的核酸片段的形式天然存在或合成产生的寡核苷酸,所述寡核苷酸当置于诱导与核酸模板链互补的引物延伸产物的合成的条件下(例如在存在核苷酸和诱导剂(诸如DNA聚合酶)的情况下,并且在合适的温度和pH值下)时能够充当起始合成的点。为在扩增中获得最高效率,引物优选为单链的,但替代地可为双链的。如果为双链,那么在用于制备延伸产物之前,首先对引物进行处理以分离它的链。优选地,引物为寡脱氧核苷酸。通常,引物足够长以在存在诱导剂的情况下引发延伸产物的合成。引物的确切长度将取决于许多因素,包括温度、引物来源和方法的使用。
术语“探针”是指如纯化限制消化中天然存在或合成、重组或通过PCR扩增产生的寡核苷酸(例如核苷酸的序列),所述寡核苷酸能够与另一所关注寡核苷酸杂交。探针可为单链或双链的。探针可用于检测、鉴定和分离特定基因序列(例如“捕获探针”)。在一些实施方案中,预期可用任何“报告分子”对本发明中所用的任何探针进行标记,使得可在任何检测系统中检测,所述检测系统包括但不限于酶(例如ELISA,以及基于酶的组织化学测定)、荧光、放射性以及发光系统。本发明不旨在限于任何特定检测系统或标记。
如本文所用,术语“靶标”是指设法例如通过探针结合、扩增、分离、捕获等从其他核酸中分选出来的核酸。举例来说,当提到聚合酶链反应时使用时,“靶标”是指由用于聚合酶链反应的引物结合的核酸区域,而当用于未扩增靶标DNA的测定中时,例如在侵入性裂解测定的一些实施方案中,靶标包含探针与侵入性寡核苷酸(例如INVADER寡核苷酸)结合以形成侵入性裂解结构使得可检测到存在靶核酸的位点。“区段”定义为靶序列内的核酸区域。如关于双链核酸时所用,术语“靶标”不限于双链靶标的特定链,例如编码链,而是可用于指例如双链基因或参考DNA的一条或两条链。
如本文所用,如关于来自血液的核酸时所用的术语“无细胞”和“循环无细胞”可互换地使用并且指存在于血液中但不在血液中的细胞内的核酸,例如DNA和RNA物质。如本文所用的关于从血液提取的核酸的术语是指从受试者收集样品之前并且从血液样品提取核酸之前核酸的性质和位置。
如本文所用,术语“标记物”是指可用于例如基于标记物质的存在、不存在或状态(例如甲基化状态)来区别非正常细胞(例如癌细胞)与正常细胞(非癌细胞)的物质(例如核酸,或核酸区域,或蛋白质)。如本文所用,标记物的“正常”甲基化是指典型地存在于正常细胞中(例如非癌细胞中)的甲基化程度。
如本文所用的术语“赘瘤”是指任何新的和异常的组织生长,包括但不限于癌症。因此,赘瘤可为恶变前赘瘤或恶性赘瘤。
如本文所用,术语“赘瘤特异性标记物”是指可用于指示赘瘤存在的任何生物材料或元素。生物材料的实例包括但不限于核酸、多肽、碳水化合物、脂肪酸、细胞组分(例如细胞膜和线粒体)以及整个细胞。在一些情况下,标记物为特定核酸区域(例如基因、基因内区域、特定基因座等)。作为标记物的核酸的区域可被称为例如“标记基因”、“标记区域”、“标记序列”、“标记基因座”等。
术语“样品”以其最广泛的含义使用。在一种意义中,它可指动物细胞或组织或流体。在另一意义中,它是指从任何来源获得的试样或培养物,以及生物和环境样品。生物样品可从植物或动物(包括人)获得并且涵盖例如流体、固体、组织和气体。环境样品包括环境材料,诸如表面物质、土壤、水和工业样品。这些实例不应被视为限制适用于本发明的样品类型。如本文关于样品所用,术语从来源或受试者(例如从患者)收集的“样品”不限于单个物理试样,而是还涵盖在多个部分中收集的样品,例如可在两个、三个、四个或更多个不同采血管或其他采血装置(例如袋)或不同采血装置的组合中收集的血液的“样品”。
如本文所用,术语“患者”或“受试者”是指要经历由所述技术提供的各种测试的有机体。术语“受试者”包括动物,优选为哺乳动物,包括人。在一个优选实施方案中,受试者为灵长类动物。在甚至更优选的实施方案中,受试者为人。另外就诊断方法来说,优选受试者为脊椎动物受试者。优选脊椎动物为温血的;优选温血脊椎动物为哺乳动物。优选哺乳动物最优选为人。如本文所用,术语“受试者'包括人与动物受试者两者。因此,本文提供了兽医学治疗用途。因而,本发明技术提供了对诸如人等哺乳动物以及因濒危而有重大意义的那些哺乳动物,诸如西伯利亚虎;具有经济意义的动物,诸如养在农场供人消耗的动物;和/或对人具有社会意义的动物,诸如作为宠物而养或动物园中的动物的诊断。此类动物的实例包括但不限于:食肉动物,诸如猫和狗;猪,包括猪、阉猪以及野猪;反刍动物和/或有蹄类动物,诸如牛、公牛、绵羊、长颈鹿、鹿、山羊、野牛和骆驼;鳍足类动物;以及马。因此,还提供了包括但不限于家养猪、反刍动物、有蹄类动物、马(包括赛马)等牲畜的诊断和治疗。目前揭示的主题还包括一种用于诊断受试者的肺癌的系统。可提供例如呈商业试剂盒形式的系统,所述商业试剂盒可用于筛查用于已收集生物样品的受试者的肺癌风险或诊断其肺癌。根据本发明技术提供的示例性系统包括评估本文所述标记物的甲基化状态。
术语“扩增(amplifying/amplification)”在核酸背景下是指典型地以少量聚核苷酸(例如单个多核苷酸分子)为起始物质,产生聚核苷酸的多个拷贝或聚核苷酸的一部分,其中扩增产物或扩增子通常为可检测的。聚核苷酸的扩增涵盖多个化学和酶过程。在聚合酶链反应(PCR)或连接酶链反应(LCR;参见例如美国专利号5,494,810;以全文引用的方式并入本文中)期间从靶DNA分子或模板DNA分子的一个或几个拷贝产生多个DNA拷贝为扩增的形式。额外类型的扩增包括但不限于等位基因特异性PCR(参见例如美国专利号5,639,611;以全文引用的方式并入本文中)、组装PCR(参见例如美国专利号5,965,408;以全文引用的方式并入本文中)、解旋酶依赖性扩增(参见例如美国专利号7,662,594;以全文引用的方式并入本文中)、热起始PCR(参见例如美国专利号5,773,258和5,338,671;各自以全文引用的方式并入本文中)、序列间特异性PCR、反向PCR(参见例如Triglia等(1988)NucleicAcids Res.,16:8186;以全文引用的方式并入本文中)、连接介导的PCR(参见例如Guilfoyle,R.等,Nucleic Acids Research,25:1854-1858(1997);美国专利号5,508,169;所述参考文献各自以全文引用的方式并入本文中)、甲基化特异性PCR(参见例如Herman等,(1996)PNAS 93(13)9821-9826;以全文引用的方式并入本文中)、微引物PCR、多重连接依赖性探针扩增(参见例如Schouten等,(2002)Nucleic Acids Research 30(12):e57;以全文引用的方式并入本文中)、多重PCR(参见例如Chamberlain等,(1988)Nucleic AcidsResearch 16(23)11141-11156;Ballabio等,(1990)Human Genetics 84(6)571-573;Hayden等,(2008)BMC Genetics 9:80;所述参考文献各自以全文引用的方式并入本文中)、巢式PCR、重叠延伸PCR(参见例如Higuchi等,(1988)Nucleic Acids Research 16(15)7351-7367;以全文引用的方式并入本文中)、实时PCR(参见例如Higuchi等,(1992)Biotechnology 10:413-417;Higuchi等,(1993)Biotechnology 11:1026-1030;所述参考文献各自以全文引用的方式并入本文中)、逆转录PCR(参见例如Bustin,S.A.(2000)J.Molecular Endocrinology 25:169-193;以全文引用的方式并入本文中)、固相PCR、热非对称交错PCR和降落PCR(参见例如Don等,Nucleic Acids Research(1991)19(14)4008;Roux,K.(1994)Biotechniques 16(5)812-814;Hecker等,(1996)Biotechniques 20(3)478-485;所述参考文献各自以全文引用的方式并入本文中)。还可使用数字PCR实现聚核苷酸扩增(参见例如Kalinina等,Nucleic Acids Research.25;1999-2004,(1997);Vogelstein和Kinzler Proc Natl Acad Sci USA.96;9236-41,(1999);国际专利公布号WO05023091A2;美国专利申请公布号20070202525;所述参考文献各自以全文引用的方式并入本文中)。
术语“聚合酶链反应”(“PCR”)是指K.B.Mullis美国专利号4,683,195、4,683,202和4,965,188的方法,所述专利描述了一种用于在不进行克隆或纯化的情况下增加基因组或其他DNA或RNA的混合物中靶序列的区段的浓度的方法。此用于扩增靶序列的方法由以下组成:将大量过量的两种寡核苷酸引物引入含有所需靶序列的DNA混合物中,随后在存在DNA聚合酶的情况下进行精确顺序的热循环。两种引物与它们在双链靶序列中的相应链互补。为了实现扩增,使混合物变性,然后使引物退火至它们在靶分子内的互补序列。在退火之后,使用聚合酶延伸引物以便形成一对新的互补链。可将变性、引物退火和聚合酶延伸的步骤重复许多次(例如变性、退火和延伸构成一个“循环”;可存在许多个“循环”)以获得高浓度的所需靶序列的扩增区段。所需靶序列的扩增区段的长度由引物相对于彼此的相对位置决定,并且因此,此长度为可控制的参数。由于方法的重复方面,将所述方法称为“聚合酶链反应”(“PCR”)。因为所需靶序列扩增区段变为混合物中的主导序列(就浓度来说),所以它们被称为“PCR扩增的”并且为“PCR产物”或“扩增子”。本领域技术人员将理解术语“PCR”涵盖最初描述的使用例如实时PCR、巢式PCR、逆转录PCR(RT-PCR)、单一引物以及任意引物PCR等的方法的许多变化型式。
如本文所用,术语“核酸检测测定”是指确定所关注核酸的核苷酸组成的任何方法。核酸检测测定包括但不限于DNA测序法、探针杂交法、结构特异性裂解测定(例如INVADER测定(Hologic,Inc.),并且描述于例如美国专利号5,846,717、5,985,557、5,994,069、6,001,567、6,090,543和6,872,816;Lyamichev等,Nat.Biotech.,17:292(1999)、Hall等,PNAS,USA,97:8272(2000)以及美国专利号9,096,893,所述参考文献各自出于所有目的以全文引用的方式并入本文中);酶错配裂解法(例如Variagenics,美国专利号6,110,684、5,958,692、5,851,770,所述专利以全文引用的方式并入本文中);聚合酶链反应(PCR),上述;分支链杂交法(例如Chiron,美国专利号5,849,481、5,710,264、5,124,246以及5,624,802,所述专利以全文引用的方式并入本文中);滚环复制(例如美国专利号6,210,884、6,183,960以及6,235,502,所述专利以全文引用的方式并入本文中);NASBA(例如美国专利号5,409,818,所述专利以全文引用的方式并入本文中);分子信标技术(例如美国专利号6,150,097,所述专利以全文引用的方式并入本文中);E-传感器技术(Motorola,美国专利号6,248,229、6,221,583、6,013,170以及6,063,573,所述专利以全文引用的方式并入本文中);循环探针技术(例如美国专利号5,403,711、5,011,769以及5,660,988,所述专利以全文引用的方式并入本文中);Dade Behring信号放大法(例如美国专利号6,121,001、6,110,677、5,914,230、5,882,867以及5,792,614,所述专利以全文引用的方式并入本文中);连接酶链反应(例如Baranay Proc.Natl.Acad.Sci USA 88,189-93(1991));以及夹心杂交法(例如美国专利号5,288,609,所述专利以全文引用的方式并入本文中)。
在一些实施方案中,将靶核酸扩增(例如通过PCR)并且使用侵入性裂解测定同时检测扩增的核酸。美国专利号9,096,893中描述了将为进行检测测定(例如侵入性裂解测定)而配置的测定与扩增测定组合,所述专利出于所有目的以全文引用的方式并入本文中。例如美国专利号8,361,720;8,715,937;8,916,344;9,212,392以及美国专利申请号15/841,006中描述了额外扩增加上侵入性裂解检测配置,称为QuARTS法,所述专利各自出于所有目的以引用的方式并入本文中。如本文所用的术语“侵入性裂解结构”是指包含以下的裂解结构:i)靶核酸,ii)上游核酸(例如侵入性或“INVADER”寡核苷酸),以及iii)下游核酸(例如探针),其中上游和下游核酸退火至靶核酸的相邻区域,并且其中在上游核酸的3′部分与下游核酸与靶核酸之间形成的双链体之间形成重叠。在上游和下游核酸的一个或多个碱基相对于靶核酸碱基占据相同位置的情况下发生重叠,无论上游核酸的一个或多个重叠碱基是否与靶核酸互补,并且无论所述碱基为天然碱基还是非天然碱基。在一些实施方案中,上游核酸与下游双链体重叠的3′部分为非碱基化学部分,诸如芳族环结构,例如如例如美国专利号6,090,543中所公开,所述专利以全文引用的方式并入本文中。在一些实施方案中,核酸中的一者或多者可例如通过共价键(诸如核酸茎-环)或通过非核酸化学键(例如多碳链)彼此连接。如本文所用,术语“活瓣核酸内切酶测定”包括如上所述的“INVADER”侵入性裂解测定和QuARTS测定。
术语“探针寡核苷酸”或“活瓣寡核苷酸”当关于活瓣测定使用时是指在存在侵入性寡核苷酸的情况下与靶核酸相互作用以形成裂解结构的寡核苷酸。
术语“侵入性寡核苷酸”是指在靠近探针与靶核酸之间杂交的区域的位置杂交至靶核酸的寡核苷酸,其中侵入性寡核苷酸的3'端包含与探针与靶标之间杂交的区域重叠的部分(例如化学部分,或一个或多个核苷酸)。侵入性寡核苷酸的3'末端核苷酸可能与或可能不与靶标中的核苷酸碱基配对。在一些实施方案中,侵入性寡核苷酸在其3'端含有基本上与位于探针寡核苷酸退火至靶标链的部分的5'端的序列相同的序列。
如本文所用,术语“活瓣核酸内切酶”或“FEN”是指一类溶核酶,典型地为5'核酸酶,所述溶核酶充当具有双链体的DNA结构上的结构特异性核酸内切酶,所述双链体在一条链上含有单链5'短悬端或活瓣,这条链被核酸的另一条链取代(例如使得在单链与双链DNA之间的连接处存在重叠核苷酸)。FEN催化在单链与双链DNA连接处磷酸二酯键的水解裂解,从而释放短悬端或活瓣。Ceska和Savers(Trends Biochem.Sci.1998 23:331-336)以及Liu等(Annu.Rev.Biochem.200473:589-615;以全文引用的方式并入本文中)对活瓣核酸内切酶进行了综述。FEN可为单独酶、多亚单位酶,或可以另一酶或蛋白质复合物(例如DNA聚合酶)的活性的形式存在。
活瓣核酸内切酶可为热稳定的。举例来说,来自归档嗜热生物有机体的FEN-1活瓣核酸内切酶为典型热稳定的。如本文所用,术语“FEN-1”是指来自真核生物或古菌有机体的非聚合酶活瓣核酸内切酶。参见例如WO 02/070755和美国专利号US 7,122,364以及KaiserM.W.等(1999)J.Biol.Chem.,274:21387,所述参考文献全部出于所有目的以全文引用的方式并入本文中。
如本文所用,术语“裂解活瓣”是指为活瓣测定的裂解产物的单链寡核苷酸。
术语“盒”当关于活瓣裂解反应使用时是指被配置成响应于活瓣或探针寡核苷酸的裂解(例如在活瓣裂解测定中形成的初级或第一裂解结构中)产生可检测信号的寡核苷酸或寡核苷酸组合。在优选实施方案中,盒杂交至由活瓣寡核苷酸的裂解产生的非靶标裂解产物以形成第二重叠裂解结构,使得盒可然后由相同酶(例如FEN-1核酸内切酶)裂解。
在一些实施方案中,盒为包含发夹部分(即盒寡核苷酸的一个部分在反应条件下杂交至相同寡核苷酸的第二部分以形成双链体的区域)的单个寡核苷酸。在其他实施方案中,盒包含含有在反应条件下可形成双链体的互补部分的至少两个寡核苷酸。在优选实施方案中,盒包含标记,例如荧光团。在特别优选的实施方案中,盒包含产生FRET效应的标记部分。
如本文所用,术语“FRET”是指荧光共振能量传递,这是一种部分(例如荧光团)例如在自身之间转移能量或将能量从荧光团转移至非荧光团(例如淬灭剂分子)的过程。在一些情况下,FRET涉及经由短距离(例如约10nm或更短)偶极-偶极相互作用将能量转移至较低能量受体荧光团的激发供体荧光团。在其他情况下,FRET涉及来自供体的荧光能量损失以及受体荧光团中的荧光增加。在其他形式的FRET中,能量可从激发供体荧光团交换至非发荧光分子(例如“暗”淬灭分子,例如“BHQ”淬灭剂,Biosearch Technologies)。FRET为本领域技术人员已知的并且已有描述(参见例如Stryer等,1978,Ann.Rev.Biochem.,47:819;Selvin,1995,Methods Enzymol.,246:300;Orpana,2004Biomol Eng 21,45-50;Olivier,2005Mutant Res 573,103-110,所述参考文献各自以全文引用的方式并入本文中)。
在示例性活瓣检测测定中,侵入性寡核苷酸和活瓣寡核苷酸杂交至靶核酸,从而产生具有如上所述的重叠的第一复合物。活瓣寡核苷酸的5'端包括未配对的“活瓣”。第一复合物为活瓣核酸内切酶(例如FEN-1核酸内切酶)的底物,所述活瓣核酸内切酶裂解活瓣寡核苷酸以释放5'活瓣部分。在二级反应中,释放的5'活瓣产物充当FRET盒上的侵入性寡核苷酸从而再次形成由活瓣核酸内切酶识别的结构,使得FRET盒裂解。当荧光团与淬灭剂因FRET盒的裂解而分离时,产生超过背景荧光的可检测荧光信号。
如本文所用,术语“PCR-活瓣测定”是指将PCR靶标扩增与通过形成包含扩增的靶DNA的第一重叠裂解结构以及包含从第一重叠裂解结构裂解的5′活瓣以及标记的报告寡核苷酸(例如“FRET盒”或5′发夹FRET报告寡核苷酸)的第二重叠裂解结构来检测扩增的DNA组合的测定配置。在如本文所用的PCR-活瓣测定中,测定试剂包含一种混合物,所述混合物含有DNA聚合酶、FEN-1核酸内切酶、包含与靶核酸互补的部分的初级探针以及FRET盒或5′发夹FRET报告子,并且通过PCR扩增靶核酸并且同时检测扩增的核酸(即检测发生在靶标扩增过程期间)。PCR-活瓣测定包括美国专利号8,361,720;8,715,937;以及8,916,344中所描述的QuARTS测定;美国专利号10,648,025中描述的使用具有更长靶标特异性区域的探针寡核苷酸(长探针定量扩增信号,“LQAS”)的活瓣测定;以及美国专利号9,096,893的扩增测定(例如如所述专利的图1中所图示),所述专利各自以全文引用的方式并入本文中。
如本文所用,术语“PCR-活瓣测定试剂”是指在PCR-活瓣测定中用于检测靶序列的一种或多种试剂,所述试剂包含在含有DNA聚合酶、FEN-1核酸内切酶以及FRET盒或5′发夹FRET报告子的混合物中的在存在靶序列的情况下能够参与靶核酸的扩增以及活瓣裂解结构的形成的核酸分子。
如本文关于核酸扩增或信号放大的检测所用的术语“实时”是指检测或测量在反应在进行时(例如在孵育或热循环期间)反应中产物或信号的累积。此类检测或测量可连续地进行,或者它可在扩增反应进行期间的多个离散点进行,或者它可为组合。举例来说,在聚合酶链反应中,(例如荧光的)检测可在所有或部分热循环期间连续地进行,或者它可在一个或多个循环期间的一个或多个点瞬时地进行。在一些实施方案中,通过确定在多个循环中的每一者中或每个循环中在相同点(例如循环中的时间点,或循环中的温度步骤)的荧光水平来实现PCR或QuARTS反应的实时检测。扩增的实时检测还可称为“在扩增反应期间”检测。
如本文所用,术语“定量扩增数据集”是指在定量靶样品(例如靶DNA)的扩增期间所获得的数据。在定量PCR或QuARTS测定的情况下,定量扩增数据集为在扩增期间(例如在多个或所有热循环期间)所获得的荧光值的集合。用于定量扩增的数据不限于在反应中的任何特定点收集的数据,并且可在各循环中的离散点或在各循环中连续地测量荧光。
如本文关于在实时PCR和PCR+INVADER测定期间所收集的数据所用的缩写“Ct”和“Cp”是指使得信号(例如荧光信号)超过指示正信号的预定阈值的循环。已使用各种方法来计算用作信号相较于浓度的决定因素的阈值,并且所述值通常表示为“交叉阈值”(Ct)或“交叉点”(Cp)。Cp值或Ct值均可在本文呈现的方法的实施方案中使用,用于分析实时信号以确定测定物或样品中变体和/或非变体组分的百分比。
如本文所用,术语“试剂盒”是指用于递送材料的任何递送系统。在反应测定的情况下,此类递送系统包括允许将反应试剂(例如在适当容器中的寡核苷酸、酶等)和/或支持材料(例如缓冲液、用于进行分析的书面说明等)从一个位置储存、运输或递送至另一个位置的系统。举例来说,试剂盒包括含有相关反应试剂和/或支持材料的一个或多个外壳(例如盒子)。如本文所用,术语“片段化试剂盒”是指包含两个或更多个单独容器的递送系统,所述两个或更多个单独容器各自含有总试剂盒组分的子部分。可将容器一起或单独地递送至预期接受者。举例来说,第一容器可含有用于测定的酶,而第二容器含有寡核苷酸。
如本文所用的术语“系统”是指用于特定目的的物品的集合。在一些实施方案中,物品包括使用说明书,如例如物品上、纸上或可记录介质(例如DVD、CD、闪存驱动器等)上所提供的信息。在一些实施方案中,说明书将使用者引导至在线位置,例如网站。
如本文所用,术语“信息”是指事实或数据的任何集合。关于使用一种或多种计算机系统(包括但不限于互联网)储存或加工的信息,所述术语是指以任何模式(例如模拟、数字、光学等)储存的任何数据。如本文所用,术语“与受试者有关的信息”是指与受试者(例如人、植物或动物)有关的事实或数据。术语“基因组信息”是指与基因组有关的信息,包括但不限于核酸序列、基因、甲基化百分比、等位基因频率、RNA表达水平、蛋白质表达、与基因型相关的表型等。“等位基因频率信息”是指与等位基因频率有关的事实或数据,包括但不限于等位基因身份、等位基因的存在与受试者(例如人受试者)的特征之间的统计相关性、个体或群体中存在或不存在等位基因、等位基因存在于具有一种或多种特性的个体中的可能性百分比等。
附图说明
图1至图4提供了将简化代表性亚硫酸氢盐测序(RRBS)结果进行比较用于如实施例2中所述选择与肺癌相关的标记物的表格,各行显示所示标记物区域(通过染色体以及起始和终止位置加以标识)的平均值。针对各区域显示每种组织类型(正常(Norm)、腺癌(Ad)、大细胞癌(LC)、小细胞癌(SC)、鳞状细胞癌(SQ)以及未确定癌症(UND))的平均甲基化与来自正常受试者的血沉棕黄层样品(WBC或BC)的平均甲基化进行比较的比率,并且指示在各区域情况下鉴定的基因和转录物。
图1提供了将RRBS结果进行比较用于选择与肺腺癌相关的标记物的表格。
图2提供了将RRBS结果进行比较用于选择与肺大细胞癌相关的标记物的表格。
图3提供了将RRBS结果进行比较用于选择与肺小细胞癌相关的标记物的表格。
图4提供了将RRBS结果进行比较用于选择与肺鳞状细胞癌相关的标记物的表格。
图5提供了呈未转化形式和亚硫酸氢盐转化形式的测定靶区域以及检测寡核苷酸的核酸序列以及对应SEQ ID NO的表格。为方便起见,将靶核酸(具体地说为靶DNA,包括亚硫酸氢盐转化的DNA)显示为单链,但应了解,所述技术的实施方案涵盖所展示序列的互补链。举例来说,可对引物和活瓣寡核苷酸进行选择以杂交至如图所示的靶链,或杂交至与如图所示的靶链互补的链。
图6说明了一种分析血液样品以确定人的肺癌风险的方法的示例性工艺流程。
图7示出了通过RNA检测进行的专注于FPR1基因表达的实验的数据。图A为显示真阳性患癌率与假阳性患癌率的关系的训练数据集的线图。图B为显示真阳性患癌率与假阳性患癌率的关系的验证数据集的线图。图C为显示取自不吸烟者、正常吸烟者以及患有不同阶段的肺癌的患者的白血细胞中的FPR1 RNA表达水平并且指示正常吸烟者对烟草略微敏感的点图。
图8示出了专注于S100A12基因的实验的数据。图A为显示真阳性患癌率与假阳性患癌率的关系的训练数据集的线图。图B为显示真阳性患癌率与假阳性患癌率的关系的验证数据集的线图。图C为显示取自不吸烟者、正常吸烟者以及患有不同阶段的肺癌的患者的白血细胞中的S100A12 RNA表达水平的点图。
图9示出了专注于MMP9基因的实验的数据。图A为显示真阳性患癌率与假阳性患癌率的关系的训练数据集的线图。图B为显示真阳性患癌率与假阳性患癌率的关系从而显示与FPR1相比的改善的验证数据集的线图。图C为显示取自不吸烟者、正常吸烟者以及患有不同阶段的肺癌的患者的白血细胞中的MMP9 RNA表达水平的点图。
图10示出了专注于SAT1基因的实验的数据。图A为显示真阳性患癌率与假阳性患癌率的关系的训练数据集的线图。图B为显示真阳性患癌率与假阳性患癌率的关系的验证数据集的线图。图C为显示取自不吸烟者、正常吸烟者以及患有不同阶段的肺癌的患者的白血细胞中的SAT1 RNA表达水平的点图。
图11示出了使用FPR1作为靶基因并且STK4作为参考基因的实验的结果。图A为显示FPR1比率与FPR1每百万映射读段的每千碱基片段数标准化值(Fragments Per KilobaseMillion normalization,FPKM)之间的关系的点图。图B为显示与STK4相比FPR1的真阳性率与假阳性率的比率的线图。
图12示出了使用S100A12作为靶基因并且STK4作为参考基因的方法的示例性实施方案。图A为显示S100A12比率与S100A12FPKM之间的关系的点图。图B为显示与STK4相比S100A12的真阳性率与假阳性率的比率的线图。
图13示出了使用MMP9作为靶基因并且STK4作为参考基因的方法的示例性实施方案。图A为显示MMP9比率与MMP9 FPKM之间的关系的点图。图B为显示与STK4相比MMP9的真阳性率与假阳性率的比率的线图。
图14为显示将在不同阶段的肺癌中作为靶基因的S100A12与MMP9的RNA表达水平进行比较的数据的散点图。使用FPKM标准化并且数据包括训练与验证集两者的所有样品。
图15为显示将在癌症、良性与正常患者中作为靶基因的S100A12与SAT1的RNA表达水平进行比较的数据的散点图。使用FPKM标准化。短划线分隔线仅用于可视化的目的。
图16为显示将在癌症、良性和正常患者中作为靶基因的S100A12与TYMP的RNA表达水平进行比较的数据的散点图。使用STK4标准化。短划线分隔线仅用于可视化的目的。
具体实施方式
本文提供了与选择标记分析物有关的技术,以及表征来自受试者的样品或样品组合的方法,所述方法包括针对多种不同类型的标记分析物(例如标记物分子,诸如DNA、RNA和蛋白质)对所述一个或多个样品进行分析。举例来说,在一些实施方案中,所述技术提供了一种方法,所述方法包括从自受试者获得的样品测量DNA中具有特定甲基化状态(例如甲基化或未甲基化)的至少一种甲基化标记基因的量,并且还包括以下中的一者或多者:测量从受试者获得的样品中至少一种RNA标记物的量,以及测定从受试者获得的样品中至少一种蛋白质标记物的存在或不存在或量。在一些实施方案中,分析来自受试者的单个样品的一种或多种甲基化标记DNA、一种或多种标记RNA以及一种或多种标记蛋白质。
在各个实施方案的此具体实施方式中,出于解释的目的,阐述许多具体细节以提供对所公开实施方案的透彻理解。然而,本领域技术人员将了解可在存在或不存在这些具体细节的情况下实践所述各个实施方案。在其他情况下,以框图形式显示结构和装置。此外,本领域技术人员可容易地了解,呈现和执行方法的特定顺序为说明性的,并且预期顺序可改变并且仍在本文所公开的各个实施方案的精神和范围内。
本文提到的所有专利、申请、公布的申请和其他出版物以引用所参考的材料的方式并且以其全文并入本文中。如果术语或短语在本文中以与以引用的方式并入本文中的专利、申请、公布的申请和其他出版物中所列的定义相反或以其他方式不一致的方式使用,那么本文中的使用胜过以引用的方式并入本文中的定义。以下论述分为以下部分:
I.RNA标记物分析(包括定量RNA分析和定量蛋白质分析);以及
II.甲基化标记物分析
I.RNA标记物分析
A.定量RNA分析
实施方案涉及通过分析血液中的核酸表达,特别是循环无细胞核酸或免疫细胞核酸表达来确定处于癌症风险中的患者是否可能患有所述疾病的系统和方法。确定可能患有癌症的患者可能是对源于血液的试样进行,以测定RNA累积或表达水平,并且此类分析可通过表达微阵列、核酸测序、nCounter或实时PCR来进行。在一些实施方案中,将参考核酸的子集的表达水平与已知在患有癌症的患者中有所增加的靶核酸的子集的表达水平进行比较。可通过分析许多无病患者的血液并且选择在那些患者内以稳定水平表达的基因来找到参考核酸的子集。还可通过分析取自多个组织类型(例如结肠、肺、肾脏、肝脏等)的实体组织试样并且选择在患者的血液中以稳定水平表达的基因来找到参考核酸的子集。
图6的流程图中示出了一个实施方案。如图所示,方法100以起始状态105开始,然后移至状态110,其中血液样品是从人获得。可从疑似患有肺癌的人患者收集血液样品,或其中患者已知患有肺癌,但可能需要对癌症的类型或阶段的更彻底的分析。然后方法100移至状态115,其中将要分析的血液样品在室温下或在冰上在采血管中运送至实验室,这确保尽可能少的样品降解。在实验室中收到血液样品后,方法100移至状态120,其中如下文更详细论述从血液提取RNA。在提取RNA之后,方法100移至状态125,其中通过测量样品中特定RNA的水平来检测一种或多种靶基因以及任选一种或多种参考基因的基因表达水平。下文更详细地论述检测基因表达以及选择靶基因和参考基因的方法。在确定特定靶基因的基因表达水平后,方法100移至状态130,其中进行分析以基于患者中靶基因表达的测量水平来确定患者患肺癌或发展肺癌的风险。然后,方法100在结束状态135处终止。
在一些实施方案中,可通过对取自罹患癌症的个体的血液中或实体肿瘤试样中转录物累积或表达水平增加的基因进行分析来选择靶基因的子集。
在一些实施方案中,靶基因的子集包括取自罹患癌症的个体的血液中或实体肿瘤试样中转录物累积或表达水平降低的基因。
在一些实施方案中,参考基因的子集包括与癌症患者相比在正常个体中转录物累积或表达水平未改变的基因。在这些实施方案中,选择血液中或实体肿瘤试样中累积或表达水平增加的靶基因的子集与一种或多种参考基因的组合。
在一些实施方案中,所公开的技术的方面涉及以下发现:在罹患癌症的患者中,甲酰肽受体基因(FPR1)、S100A12、MMP9、SAT1和TYMP的RNA表达水平改变。举例来说,如下文所述发现在患有肺癌的患者中FPR1、S100A12、MMP9、SAT1和TYMP的RNA水平增加。此外,显示与其他参考基因(诸如STK4、ACTB和HNRNPA1)的RNA水平相比FPR1的RNA水平增加。
在一些实施方案中,在已知靶基因后,可通过分析来自多个试样的大量候选基因并且选择使得在癌症患者的基因表达中靶基因与参考基因之间的差异最大的那些候选基因来选择参考基因。在一些实施方案中,可通过考察许多基因的转录物累积或表达水平并且找到哪些基因具有最低变异性来选择参考基因。在一些实施方案中,不基于单独累积或表达水平,而是基于在癌症中相对累积或表达水平没有改变来选择参考基因。
在给定癌症类型内已知靶基因(和一些实施方案中的参考基因)后,可在取自癌症患者和要测定癌症的患者的血液中测量表达谱。因为血浆或白血细胞可在许多初级护理医师办公室内收集和制备而不会带来比标准抽血更大的风险,所以在一些实施方案中,靶基因与参考基因之间的相对RNA累积或表达水平可为有价值的癌症生物标志。另外,如果在一些实施方案中可对靶基因和参考基因可靠地进行测定,那么它们可具有优于当前癌症测定的许多优点。举例来说,在一些实施方案中,此方法可检测处于早期发展阶段的癌症、呈现较少症状的癌症、难以与良性情况区分开的癌症或在可能传统活组织切片检查测定可能不能到达的身体区域发展的癌症。
肿瘤中常常存在增加的RNA酶活性。此RNA酶活性可抑制肿瘤生长,并且可为免疫系统对癌症的反应的一部分。细胞毒性T细胞可经由IFN-γ导致癌细胞凋亡,并且此凋亡可引起RNA酶(诸如RNA酶L)的活化。细胞经由可能由因肿瘤生长引起的缺氧造成的坏死而死亡也可促进RNA酶的释放。已知肺癌患者的血浆具有增加的RNA酶活性(Marabella等,(1976)“Serum ribonuclease in patients with lung carcinoma,”Journal ofSurgical Oncology,8(6):501-505;Reddi等(1976)“Elevated serum ribonuclease inpatients with pancreatic cancer,”Proc.Nat’l.Acad.Sci.USA 73(7):2308-2310)。还已知肺细胞含有类似于在血浆中发现那些RNA酶的RNA酶(Neuwelt等,(1978)“PossibleSites of Origin of Human Plasma Ribonucleases as Evidenced by Isolation andPartial Characterization of Ribonucleases from Several Human Tissues,”CancerResearch 38:88-93)。
当血浆中存在更高水平的RNA酶时,任何游离的RNA都容易发生更快速的降解。因此,在血浆RNA制剂中可能因相关RNA酶而存在更少的可检测RNA。当所有RNA均可能以降低的水平存在时,在基因的正常变异性较低时仅有可能在高水平准确性情况下才检测到此差异。举例来说,如果基因表达的正常范围介于10与100个单位之间,那么可能难以准确地检测1个单位的降低。然而,如果基因的表达通常在10与11个单位之间,那么1个单位的降低为可容易检测的(例如低于10个单位的任何数目均将指示降低)。
在一些实施方案中,靶基因为FPR1。FPR1在肺部和癌症中发挥多种作用。FPR1在肺成纤维细胞中表达(VanCompernolle等(2003)J Immunol.171(4):2050-6)并且为肺部伤口修复所必需的(Shao(2011)Am J Respir Cell Mol Biol 44:264-269)。已知成纤维细胞在吸引对抗肿瘤的免疫细胞(Gemperle(2012)PLOSOne 7(11):1-7,e50195)与形成保护肿瘤的基质(Wang(2009)Clin Cancer Res 15(21)6630-6638)中均为重要的。FPR1还可增强肿瘤中其他致癌基因的活性(Huang(2007)Cancer Res 67(12):5906-5913)。没有证据表明它在肺癌中过表达,但已知FPR1受RNA稳定化的调控(Mandal(2007)J Immunol 178:2542-2548,Mandal(2005)J Immunol 175:6085-6091)。鉴于这些作用,FPR1RNA可能有意地由肿瘤细胞分泌以增强肿瘤生长(例如通过活化用于生长的伤口修复系统或生长保护性基质)或由免疫细胞分泌以增强免疫反应(例如吸引额外的免疫细胞)。
在一些实施方案中,靶基因为S100钙结合蛋白A12(S100A12),也称为钙粒蛋白C和EN-RAGE(细胞外新鉴定的RAGE结合蛋白),所述靶基因特定地与先天免疫功能有关。S100A12由吞噬细胞表达并且在组织发炎部位释放。在脑损伤后释放至细胞间隙中之后内源性DAMP变成促炎性的。晚期糖基化终产物受体(RAGE)为免疫球蛋白超家族的成员并且为随年龄增长而增加的晚期糖基化终产物(AGE)的特异性细胞表面反应位点。AGE与RAGE之间的相互作用与慢性炎症有关。在接合后,炎性和血管细胞中的RAGE相互作用使得MMP的表达增加。人s100A12 mRNA序列为公众以基因库登录号NM005621的形式可获得的。人S100A12氨基酸序列为公众以GenPept登录号NP05612的形式可获得的。
在一些实施方案中,靶基因包含骨髓相关蛋白(MRP),所述骨髓相关蛋白在嗜中性粒细胞迁移至炎性部位的过程中起作用。MRP蛋白为S100蛋白的亚家族,其中MRP家族的三个成员(即S100A8、S100A9和S100A12)已进一步表征,所述成员分别具有10.6、13.5和10.4kDa的分子量,并且在嗜中性粒细胞的胞质液中丰富地表达并且在单核细胞中以较低的水平表达。S100A8和S100A9还由活化的内皮细胞、某些上皮细胞、角质细胞和嗜中性粒细胞和单核细胞分化的HL-60和THP-1表达。MRP缺乏信号肽序列,因此它们不存在于颗粒中而是存在于胞质液中,在胞质液中它们占胞质蛋白质的高达40%。三种MRP以非共价键结的均二聚体的形式存在。此外,在存在钙的情况下,S100A8和S100A9缔合以形成称为S100A8/A9的非共价异二聚体;这些非共价异二聚体称为MRP-8/14复合物、钙卫蛋白、p23和囊性纤维化抗原。S100A8也称为MRP-8、L1抗原轻链和钙粒蛋白A,并且S100A9称为MRP-14、L1抗原重链、囊性纤维化抗原、钙粒蛋白B和BEE22。S100A12的其他名称为p6、CAAF1、CGRP、MRP-6、EN-RAGE和钙粒蛋白C。
S100蛋白的家族包括19个小(10至14kDa)酸性钙结合蛋白的成员。其特征为存在两个EF-手型钙结合基序,一者比另一者多具有两个氨基酸。这些细胞内蛋白质参与蛋白质磷酸化、酶活性、Ca2+稳态和中间丝聚合的调控。S100蛋白通常以均二聚体形式存在,但一些可形成异二聚体。还在细胞间隙中发现了超过一半的S100蛋白,在细胞间隙中它们通过特定受体发挥细胞因子样活性;一者最近被表征为晚期糖基化终产物受体(RAGE)。S100A8和S100A9属于称为骨髓相关蛋白(MRP)的S100蛋白家族的子集,因为其表达几乎完全限制于嗜中性粒细胞和单核细胞,所述骨髓相关蛋白为骨髓前体的产物。
血清中高浓度的MRP可存在于与循环嗜中性粒细胞的数目或其活性增加相关的病变中。在罹患各种感染和炎性病变(诸如囊性纤维化、结核病和青年类风湿性关节炎)的患者的血清中观测到升高的S100A8/A9水平(超过1μg/ml)。它们还在罹患类风湿性关节炎和痛风的患者的滑液和血浆中以非常高的水平表达。还已知高水平的MRP(多达13μg/ml)存在于慢性骨髓性白血病和慢性淋巴细胞性白血病患者的血浆中。这些蛋白质的存在甚至先于白血病细胞出现在复发患者的血液中。S100A8/A9的细胞外存在表明MRP可主动地或在细胞坏死期间释放。
MRP在胞质液中表达,暗示其经由替代途径分泌。在细胞外环境中释放后,MRP发挥促炎性功能。这些活性由若干其他S100蛋白共同拥有。举例来说,S100刺激促炎性细胞因子IL-6从神经元释放并且促进神经突延伸。S100L(S100A2)对嗜酸性粒细胞为趋化性的,而牛皮癣素(S100A7)对于嗜中性粒细胞和T淋巴细胞为趋化性的,而不对单核细胞为趋化性的。S100A8、S100A9和S100A8/A9对于嗜中性粒细胞为趋化性的,具有10-9至10-10M的最大活性。鼠S100A8也称为CP-10,已知对于鼠骨髓细胞为良好有效趋化因子,具有10-12M的活性。
此外,S100A12对于单核细胞和嗜中性粒细胞为趋化性的并且诱导从鼠巨噬细胞细胞系表达TNF-α和IL-1β。MRP还刺激血白球附着至内皮。S100A9通过活化β2整合素Mac-1刺激嗜中性粒细胞附着至纤维蛋白原。
最近证实S100A8、S100A12和S100A8/A9还刺激嗜中性粒细胞附着至纤维蛋白原。与S100A12一起孵育的内皮细胞具有增加的ICAM-1和VCAM-1表面表达,从而使得淋巴细胞附着至内皮细胞。此诱导在NF-κB活化后发生。MRP直接或通过与氧代谢产物反应来抑制氧化爆发。S100A9使由腹膜BCG刺激的巨噬细胞释放的H2O2的水平降低。可使用人和鼠S100A9而非S100A8观测此效应。与S100A9不同,S100A8可由OCl-阴离子高效氧化,从而使得形成共价键联的S100A8均二聚体并且失去其趋化活性(关于鼠S100A8所证实)。
或者,由于MRP为胞质蛋白质,所以它们可保护嗜中性粒细胞免受其自身氧化爆发的有害影响。还已知S100A9通过其感受伤害性效应参与炎性疼痛的控制。还在体内探索了MRP的功能。当腹膜间注射至小鼠中时,鼠S100A8在4小时内刺激嗜中性粒细胞和巨噬细胞的累积。S100A12的抑制使迟发型超敏反应鼠模型中的急性炎症和结肠炎中的慢性炎症减轻。所有MRP当在鼠气囊模型中注射时都诱导炎症反应。
在一些实施方案中,靶基因编码基质金属蛋白酶(MMP)家族的蛋白质,所述蛋白质参与正常生理过程(诸如胚胎发育、繁殖和组织重塑)中以及疾病过程(诸如关节炎和转移)中细胞外基质的分解。大多数MMP作为非活性前蛋白而被分泌,所述非活性前蛋白当由细胞外蛋白酶裂解时为活化的。由此基因编码的酶降解IV型和V型胶原蛋白。恒河猴中的研究表明酶参与IL-8诱导来自骨髓的造血祖细胞的活动,并且鼠研究表明在肿瘤相关组织重塑中的作用。
长达超过40年以来,癌症中都涉及MMP,特别是MMP9、2和3。除它们在ECM降解中的作用外,有越来越多的证据表明它们在血管生成、淋巴管生成和血管发生中的作用,这对癌细胞入侵和转移来说是关键的。举例来说,MMP9使在若干癌症(诸如结肠和胰腺癌)中结合至受体的螯合VEGF的生物利用率增加。MMP9还介导TGF-β的蛋白水解活化,TGF-β为HCC中的重要生长因子。基质金属蛋白酶(MMP)为促进癌细胞生长、迁移、入侵和转移的蛋白酶(Egeblad和Werb,2002)。MAN1A1的过表达使MMP9 mRNA表达水平增加,并且MAN1C1的过表达使MMP9 mRNA表达水平降低。归因于MMP能够降解所有种类的细胞外基质蛋白质,降低的MMP9表达意味着细胞迁移和入侵能力受到抑制。已知参与转移的基因包括MMP9和CTTN。MMP9为一组分泌的锌金属蛋白酶的成员,在哺乳动物中所述分泌的锌金属蛋白酶降解细胞外基质的胶原蛋白。MMP9的表达升高与许多不同癌症类型中的转移有关(Turner等2000;Osman等2002)。CTTN已显示为存在于11q13区域的致癌基因,11q13区域被认为在头部和颈部的鳞状细胞癌以及乳腺癌中经常为扩增的(Schuuring等1992;Schuuring等1998)。
在一些实施方案中,靶基因可为参与肿瘤发生的基因,包括BMP2和EGFR。BMP2为转化生长因子-β超家族的成员,所述成员控制许多细胞类型中的增殖、分化和其他功能。EGFR为许多不同类型的癌症(包括头部和颈部SCC)中最经常扩增和突变的基因中的一者(Santani等1991;Dassonville等1993;Grandis和Tweardy 1993)。其他经过鉴定的在转移过程中的作用尚未清楚确定的候选基因包括GTSE1、EEF1A1。GTSE1为一种微管定位蛋白。其表达为细胞周期调控的并且当过表达时可诱导G2/M-阶段累积(Monte等2000)。已证实GTSE1能够下调p53肿瘤抑制因子蛋白的水平和活性并且抑制其在DNA损害之后诱导凋亡的能力(Monte等2004)。EEF1A1基因编码参与氨酰-tRNA与80S核糖体的结合的延伸因子-1的α亚单位。肿瘤发生的情况下是否涉及此基因尚不清楚。
在一些实施方案中,靶基因为SAT1。由SAT1基因编码的蛋白质属于乙酰转移酶家族,并且为聚胺代谢的分解代谢路径中的限速酶。它催化亚精胺和精胺的乙酰化,并且参与细胞内聚胺的浓度以及其从细胞中转运出来的调控。此基因的缺陷与棘状秃发性毛发角化症(KFSD)相关。或者,已发现此基因的剪接转录物。
在一些实施方案中,靶基因为TYMP。TYMP基因(先前称为ECGF1)提供制备称为胸苷磷酸化酶的酶的指示。胸苷为称为核苷的分子,核苷(在化学修饰之后)用作DNA的结构单元。胸苷磷酸化酶将胸苷转化为两个更小的分子:2-脱氧核糖1-磷酸和胸腺嘧啶。此化学反应为胸苷分解中的重要步骤,其帮助调控细胞中核苷的水平。胸苷磷酸化酶在维持称为线粒体的细胞结构中适当量的胸苷中起重要作用。线粒体将来自食物的能量转化为细胞可使用的形式。虽然大多数DNA包装在核内的染色体中,但线粒体也具有少量他们自己的DNA(称为线粒体DNA或mtDNA)。线粒体使用包括胸苷的核苷以按需要构建新的mtDNA分子。在患有线粒体神经消化道脑病变(MNGIE)疾病的人中已鉴定出TYMP基因中的约50种突变。TYMP突变极大地降低或消除胸苷磷酸化酶的活性。此酶的缺乏使胸苷在体内积累至非常高的水平。过量的胸苷似乎损害mtDNA,从而破坏其平常维持和修复。因此,在mtDNA中突变可累积,从而使其变得不稳定。线粒体还可具有比平常更少的mtDNA(mtDNA消耗)。这些遗传变化损害线粒体的正常功能。虽然mtDNA异常构成作为MNGIE疾病的特征的消化和神经问题的基础,但不清楚缺陷型线粒体如何引起病症的特定特征。
在一些实施方案中,参考基因为STK4。由STK4基因编码的蛋白质为细胞质激酶,所述细胞质激酶在结构上类似于酵母Ste20p激酶,酵母Ste20p激酶在应激诱导的促分裂原活化的蛋白激酶级联反应的上游起作用。所编码的蛋白质可使髓磷脂碱性蛋白磷酸化并且经历自体磷酸化。已显示所编码的蛋白质的半胱天冬酶裂解片段能够将组蛋白H2B磷酸化。由此蛋白质催化的特定磷酸化与凋亡相关,并且此蛋白质可能诱导在此过程中观测到的染色质凝缩。
在一些实施方案中,测定可涉及以下参考基因中的一者或多者:PLGLB2、GABARAP、NACA、EIF1、UBB、UBC、CD81、TMBIM6、MYL12B、HSP90B1、CLDN18、RAMP2、MFAP4、FABP4、MARCO、RGL1、ZBTB16、C10orf116、GRK5、AGER、SCGB1A1、HBB、TCF21、GMFG、HYAL1、TEK、GNG11、ADH1A、TGFBR3、INPP1、ADH1B、STK4、ACTB、CASC3、SKP1和HNRNPA1;以及以下靶基因中的一者或多者:CTSS、FPR1、FPR2、FPRL1、FPRL2、CXCR2、NCF2、S100A12、MMP9、SAT1、TYMP、APOBEC3A、SELL、S100A9和PADI4。
可使用回归针对标准物对从患者样品产生的数据点进行拟合,使得结果以标准单位表示。在一些实施方案中,标准物由从一个或多个细胞系形成的RNA组成。在一些实施方案中,标准物可由合成RNA组成。标准物内的各RNA的片段的数目可为已知的,并且标准化单位可为针对每种靶标存在的RNA分子的数目。
测定可涉及不同序列的或具有靶向相似区域的不同可检测标记的组分、靶向相同基因的不同区域的组分或靶向除以上R1a测定中所列的那些外的基因的区域的组分。
结果可使用用于癌症的Viomics测试(诸如Viomics的NSCLC测试)的决策规则来进行评估。可创建绘图,其中一个轴为特定靶基因与第一参考基因的比率,并且另一个轴为靶基因与第二参考基因的比率。
当使用细胞系对照时,NSCLC和正常样品结果彼此显著不同。尽管存在一些重叠,但当针对细胞系对照进行拟合时,NSCLC样品一致地显示显著大于非癌症样品的靶基因表达与参考基因表达比率。
当合成RNA标准物而不是使用细胞系对照时,获得类似结果。重叠减少可归因于标准物中的变异性因连续稀释次数减少(从6到3)而降低。各连续稀释步骤都可能带来错误。
结果还可解释为第一靶基因表达的线性组合与第二靶基因表达的线性组合之间的单一比率。决策规则可规定超过给定阈值的任何得分都指示癌症,而低于阈值的得分指示没有癌症。可将合成标准物设计为使得每种标记物上的系数为1,使得得分计算为:得分=靶基因/(参考基因1+参考基因2)。
举例来说,可从样品确定选自以上列表的基因的基因表达值并且与从跨越典型地获得的值范围的一组合成标准物(例如在连续稀释系列中)确定的水平进行比较。对于每种基因,将从患者样品确定的基因表达水平与通过对合成标准物模板进行回归分析以对每种基因的累积水平值进行拟合所确定的基因表达水平进行比较。单独地获得每种基因的回归和拟合值。在获得拟合值后可进行额外的分析(例如计算比率)。
可将这些得分与阈值进行比较,使得如由患者样品所指示超过阈值的得分指示增高的肺癌风险。
可通过收集关于来自癌症与无癌症患者的小样品集合的数据,然后使用线性模型将其分离来确定各标准物的校正浓度、系数和阈值。可经由统计方法(诸如逻辑回归)或使用线性核函数的支持向量机来产生线性模型,或可通过考察来产生线性模型。
可实施排除准则,使得满足排除准则的任何样品都不报告结果。这些排除准则可包括在所描述的实施方案中的一者之前或之后执行的其他测试。排除准则还可以测试本身的结果为基础。举例来说,在一些实施方案中,极低量的标记物指示降解的样品,并且两种参考基因的表达水平之间的比率出人意料地大可表明存在污染。在一些实施方案中,如果与基因的累积水平的中值比率相比两种参考基因的比率相差超过10倍、5倍、4倍、3倍或2倍,那么将样品排除。
在一些实施方案中,所述方法可涉及统计距离测定。在一些实施方案中,所述方法基于结果相对于仅通过ROC曲线确定的固定截止值之间的统计距离来确定测定结果(例如阳性或阴性结果)。
基于特异性,可将结果分成数个组(高置信度、低置信度等)。还可通过一些简式对此数字进行转化以形成关于置信度的数值得分。
在一些实施方案中,所述方法可涉及用于基于RNA表达结果与一种或多种人口统计或生活方式特征的组合来预测存在于患者中的癌症类型的模型和推导。
RNA提取方法
分子生物学的标准教科书,包括Ausubel等(1997)Current Protocols ofMolecular Biology,John Wiley and Sons中公开了用于RNA提取的一般方法。具体地说,可使用来自商品制造商(诸如Qiagen)的纯化试剂盒、缓冲液组和蛋白酶根据制造商的说明书(QIAGEN Inc.,Valencia,Calif.)进行RNA分离。举例来说,可使用Qiagen RNeasy微柱从培养物中的细胞分离总RNA。许多RNA分离试剂盒为可商购获得的并且可用于所公开技术的方法中。
在一些实施方案中,可使用
Figure BDA0003617936540000491
RNA血液微型试剂盒(Qiagen,Germantown,MD)提取整个血液样品中的RNA。为从生物材料(例如全血)纯化总RNA,使生物材料与RNA溶解/结合溶液在其与固体载体接触之前接触。使用RNA溶解/结合溶液来溶解生物材料并且释放RNA,然后将其添加至固体载体中。另外,RNA溶解/结合溶液防止有害酶(诸如RNA酶)的有害作用。RNA溶解/结合溶液可成功地用于溶解所培养的细胞或球粒中的白血细胞,或溶解附着于培养板(诸如标准96孔板)或收集于培养板中的细胞。如果生物材料由组织大块或小粒子组成,那么RNA溶解/结合溶液可由于其有效溶解能力有效地用于将此类组织大块研磨成浆料。RNA溶解/结合溶液体积可根据细胞数目或组织尺寸按比例增大或减小。在生物材料溶解后,溶解产物可直接添加至固体载体或可穿过预净化膜以从溶解产物中消除大颗粒。适当产品的实例为Gentra固相RNA预净化柱(Gentra Systems,Inc.,Minneapolis,Minn.)。
或者,可将RNA溶解/结合溶液直接添加至固体载体,由此消除一个步骤,并且将方法进一步简化。在后面的此方法中,可将RNA溶解/结合溶液施加至固体载体,然后在固体载体上干燥,然后使生物材料与处理过的固体载体接触。举例来说,在一个实施方案中,将合适体积的RNA溶解/结合溶液直接添加至放置于Spin-
Figure BDA0003617936540000501
篮筐(Costar,Corning N.Y.)中的固体载体中,所述篮筐进一步放置于2ml旋转管中。加热固体载体直至在40-80℃之间的温度下干燥至少12小时,此后将任何过量的未结合RNA溶解/结合溶液移除,并且然后在干燥作用下储存。可将生物材料直接添加至用RNA溶解/结合溶液预处理的固体载体中,并且使其孵育至少一分钟,诸如至少5分钟,直到它适当地溶解并且释放核酸,并且结合至固体载体。
当生物材料包含细胞或病毒材料时,与RNA溶解/结合溶液直接接触或与用RNA溶解/结合溶液预处理的固体载体接触引起细胞膜和核膜或病毒包覆层溶解和/或破裂,从而释放核酸和其他污染物质,诸如蛋白质、磷脂等。释放的核酸在存在RNA-络合锂盐的情况下选择性结合至固体载体。具有任选还原剂帮助使得RNA酶活性降低,这在RNA酶含量高的组织中可为必需的。
此孵育期后,任选通过合适的方法(诸如离心、移液、压力、真空或通过这些手段与RNA洗涤溶液的组合使用)移除其余生物材料,使得核酸留下结合至固体载体。其余包括蛋白质、磷脂等非核酸生物材料可首先通过离心移除。通过这样做,溶解产物中未结合的污染物与固体载体分离。多个洗涤步骤将固体载体上基本上所有污染物去除,并且留下RNA优先结合至固体载体。
随后,可使用充足量的本领域技术人员已知的RNA洗脱溶液将结合的RNA洗脱。然后可将固体载体离心,或经受压力或真空,以使RNA从固体载体释放并且可然后收集在合适的容器中。
在一些实施方案中,所述方法可以从患者的样品提取cfRNA并且测定所提取的cfRNA开始。参见例如O'Driscoll,L.等(2008)“Feasibility and relevance of globalexpression profiling of gene transcripts in serum from breast cancer patientsusing whole genome microarrays and quantitative RT-PCR.”Cancer GenomicsProteomics 5:94–104,所述参考文献以全文引用的方式并入本文中。在一些实施方案中,使用一致的可重复的方法从血浆或其他RNA来源分离cfRNA以确保数据可靠性。为了从血液获得cfRNA,可使用以下所列的方案,不过还考虑其他方法。
可使用例如Qiagen的
Figure BDA0003617936540000511
循环核酸试剂盒从血浆或其他样品纯化cfRNA分子。文件“QIAamp循环核酸手册(QIAamp Circulating Nucleic Acid Handbook)”,第二版,2011年1月中描述了此试剂盒中的方案,所述文件以全文引用的方式并入本文中。此方案提供了一种用于从1mL的血浆纯化循环总核酸的方法的实施方案。简单地说,将溶解试剂和蛋白酶与惰性载体RNA一起添加。使总核酸(DNA和RNA)结合至柱子,并且将柱子洗涤多次,然后从柱子上洗脱下来。
举例来说,可通过执行如下步骤来进行所述方案。将100μl、200μl或300μl
Figure BDA0003617936540000512
蛋白酶K移液至50ml离心管中。向50ml管中添加1ml、2ml或3ml的血清或血浆。添加0.8ml、1.6ml或2.4ml缓冲液ACL(含有1.0μg载体RNA)。盖上盖子并且通过脉冲-涡流30s进行混合,确保管中形成可见的涡旋。为了确保高效溶解,将样品与缓冲液ACL充分混合,得到均匀的溶液。所述程序此时不应中断。
为了起始溶解孵育,在60℃下孵育30分钟。将管子放回实验室工作台并且将1.8ml、3.6ml或5.4ml缓冲液ACB添加至管中的溶解产物中。盖上盖子并且通过脉冲-涡流15-30秒进行充分混合。将溶解产物-缓冲液ACB混合物在冰上在管中孵育5分钟。将
Figure BDA0003617936540000521
微型柱插入
Figure BDA0003617936540000522
24Plus上的VacConnector中。将20ml管延长器插入开放的
Figure BDA0003617936540000523
微型柱中。确保管延长器牢牢插入
Figure BDA0003617936540000524
微型柱以避免样品渗漏。
使用于旋干的收集管保持在下面。将溶解产物-缓冲液ACB混合物施加至
Figure BDA0003617936540000525
微型柱的管延长器中。接通真空泵。当所有溶解产物已完全从柱子中抽出时,切断真空泵并且将压力释放至0毫巴。小心地移除并且弃去管延长器。请注意,大样品溶解产物体积(当以3ml样品起始时约11ml)通过真空力穿过
Figure BDA0003617936540000526
微型膜可能需要长达10分钟。为了快速并且方便地释放真空压力,应使用真空调节器(
Figure BDA0003617936540000527
连接系统的一部分)。为了避免交叉污染,当心不要将管延长器移至邻近的
Figure BDA0003617936540000528
微型柱。
将600μl缓冲液ACW1施加至
Figure BDA0003617936540000529
微型柱中。使柱子的盖子保持打开,并且接通真空泵。在所有缓冲液ACW1都已从
Figure BDA00036179365400005210
微型柱中抽出之后,切断真空泵并且将压力释放至0毫巴。将750μl缓冲液ACW2施加至
Figure BDA00036179365400005211
微型柱中。使柱子的盖子保持打开,并且接通真空泵。在所有缓冲液ACW2都已从
Figure BDA00036179365400005212
微型柱中抽出之后,切断真空泵并且将压力释放至0毫巴。将750μl的乙醇(96-100%)施加至
Figure BDA00036179365400005213
微型柱中。使柱子的盖子保持打开,并且接通真空泵。在所有乙醇都已从离心柱中抽出之后,切断真空泵并且将压力释放至0毫巴。盖上
Figure BDA00036179365400005214
微型柱的盖子。将其从真空歧管移除,并且弃去VacConnector。将
Figure BDA00036179365400005215
微型柱放置于清洁的2ml收集管中,并且全速离心(20,000xg;14,000rpm)3分钟。
Figure BDA0003617936540000531
微型柱放至新的2ml收集管中。打开盖子,并且将组合件在56℃下孵育10分钟以使膜完全干燥。将
Figure BDA0003617936540000532
微型柱放置于清洁的1.5ml洗脱管(提供)中并且弃去来自步骤14的2ml收集管。将20-150μl的缓冲液AVE小心地施加至
Figure BDA0003617936540000533
微型膜的中央。盖上盖子并且在室温下孵育3分钟。确保洗脱缓冲液AVE平衡至室温(15-25℃)。如果以小体积(<50μl)进行洗脱,那么必须将洗脱缓冲液分配至膜的中央以使结合的DNA完全洗脱。洗脱体积为灵活的并且可根据下游应用的要求调整适应。回收的洗脱物体积将比施加至
Figure BDA0003617936540000534
微型柱的洗脱体积少达5μl。在微量离心管中全速离心(20,000x g;14,000rpm)1分钟以洗脱核酸。以上实例
Figure BDA0003617936540000535
循环核酸手册1/2011关于本领域技术人员的知识具代表性并且它为说明性而非限制性的。替代实施方案(包括关于以上方法或用于cfRNA纯化的独特方法的变化型式)涵盖在本文中,并且本文公开的方法和组合物不限于任何特定cfRNA纯化方法。以下实施例1中进一步论述了示例性RNA方法。
i.基于测序的检测基因表达水平的方法
在一些实施方案中,可使用测序技术测定RNA水平。测序技术的实例包括但不限于一种或多种技术,诸如焦磷酸测序,例如‘454’方法(Margulies等,(2005)Genomesequencing in microfabricated high-density picolitre reactors.Nature 437:376-380;Ronaghi等(1996)Re al-time DNA sequencing using detection of pyrophosphaterelease.Anal.Biochem.242:84-89)、‘Solexa’或Illumina型测序(Fedurco等,(2006),BTA,a novel reagent for DNA attachment of glass and effi cient generation ofsolid-phase amplified DNA colonies.Nucleic Aci d Research 34,e22;Turcatti等(2008),A new class of cleavable flu orescent nucleotides:synthesis andoptimization as reversible termin ators for DNA sequencing bysynthesis.Nucleic Acid Research 36,e25)、SOLiD测序技术(Shendure,J.等(2005)Accurate multiplex polo ny sequencing of an evolved bacterial genome.Science309,1728-1732;McKernan,K.等(2006)Reagents,methods,and libraries for be ad-based sequencing.美国专利申请20080003571)、Heliscope技术(H arris,T.D.等(2008)Single-molecule DNA sequencing of a viral geno me.Science 320,106-109)、IonTorrent技术(Rothberg等,(2011)An integrated semiconductor device enabling non-optical genome seque ncing.Nature 475,348-352)、SMRT测序技术(PacificBiosciences)或基于GridION奈米孔的测序(Oxford Nanopore Technologies;http://www.nanoporetech.com/technology/the-gridion-system/the-gridion-syste m)。在一些实施方案中,可使用任何数目的所谓的‘下一代’DNA测序方法,如Shendure和Ji,“Next-generation DNA sequencing”,Natu re Biotechnology 26(10):1135-1145(2008)中或本领域技术人员可获得的其他技术中所述。用于测定DNA序列的其他方法也可适用,并且本文公开的实施方案不限于任何特定的确定在特定基因座处的碱基身份的方法以排除任何其他方法。
在一些实施方案中,使用允许克隆扩增的分子以及单一核酸分子的大规模平行测序的下一代测序(NGS)技术。NGS的非限制性实例包括使用可逆染料终止子的合成测序,以及连接测序。
在一些实施方案中,形成包含至少一个要检测的RNA分子、至少一个第一衔接子、至少一个第二衔接子以及双链特异性RNA连接酶的连接反应组合物。第一衔接子包含第一寡核苷酸,所述第一寡核苷酸在3'端包含至少两个核糖核苷;以及第二寡核苷酸,当第一寡核苷酸与第二寡核苷酸杂交在一起时所述第二寡核苷酸包含单链部分。第二衔接子包含第三寡核苷酸,所述第三寡核苷酸包含5'磷酸基团;以及第四寡核苷酸,当第三寡核苷酸与第四寡核苷酸杂交在一起时所述第四寡核苷酸包含单链部分。第一衔接子和第二衔接子通过双链特异性RNA连接酶连接至连接反应组合物中的RNA分子以形成连接产物。第一衔接子和第二衔接子归因于其结构直接与RNA分子退火,并且各衔接子同时或几乎同时而非依序(例如当第二衔接子和RNA分子与连接酶组合并且第二衔接子连接至RNA分子的3'端,然后第一衔接子随后与连接的RNA分子-第二衔接子组合并且第一衔接子然后连接至RNA分子-第二衔接子的5'端,使第二衔接子连接至RNA分子与使第一衔接子连接至RNA分子之间具有插入的纯化步骤时,参见例如Elbashir等,Genes and Development 15:188-200,2001;Berezikov等,Nat.Genet.Supp.38:S2-S7,2006)连接至与其退火的RNA分子。应了解,将组分添加至连接反应组合物中的顺序不具限制性并且组分可以任何顺序添加。还应了解,在添加组分的过程期间,可在添加反应组合物的所有组分之前在存在连接酶的情况下使衔接子与对应RNA分子连接,例如但不限于可在添加第一衔接子之前在存在连接酶的情况下使第二衔接子与对应RNA分子连接,并且此类反应在当前教示的预期范围内,前提条件是一个衔接子连接至RNA分子的时间与另一衔接子连接至RNA分子的时间之间没有纯化程序。将RNA引导的DNA聚合酶(有时称为RNA依赖性DNA聚合酶)与连接产物组合以形成反应混合物,将反应混合物在适合于逆转录产物的条件下孵育。将逆转录产物与核糖核酸酶(典型地核糖核酸酶H(RNA酶H))组合,并且从逆转转录产物消化至少一些核糖核苷以形成扩增模板。
接下来,将扩增模板与至少一种正向引物、至少一种反向引物和DNA引导的DNA聚合酶(有时称为DNA依赖性DNA聚合酶)组合以形成扩增反应组合物。将扩增反应组合物在适合于允许扩增产物产生的条件下进行热循环。在一些实施方案中,检测扩增产物的至少一种物质。在一些实施方案中,使用报告探针和/或核酸染料间接检测样品中RNA物质中的至少一者的存在。在某些实施方案中,扩增反应组合物还包含报告探针,例如但不限于
Figure BDA0003617936540000551
探针、分子信标、Scorpion.TM.引物等;或核酸染料,例如但不限于SYBR.RTM.Green或其他核酸结合染料或核酸嵌插染料。在当前教示的某些实施方案中,检测包括实时或端点检测技术,包括但不限于定量PCR。在一些实施方案中,确定扩增产物的至少一部分的序列,这允许鉴定对应RNA分子。在一些实施方案中,从起始物质中的RNA分子产生包含文库特异性核苷酸序列的扩增产物文库,其中至少一些扩增产物物质共享文库特异性标识,例如但不限于文库特异性核苷酸序列,包括但不限于条形码序列或杂交标签,或共同的标记物或亲和力标签。在一些实施方案中,将两个或更多个文库组合并且进行分析,然后基于文库特异性标识对结果进行反卷积。
在一些实施方案中,逆转录反应组合物中仅采用一种包含DNA引导的DNA聚合酶活性与RNA引导的DNA聚合酶活性的聚合酶DNA聚合酶,并且没有使用额外的聚合酶。在其他方法实施方案中,将RNA引导的DNA聚合酶与DNA引导的DNA聚合酶均添加至逆转录反应组合物中并且未添加额外的聚合酶至扩增反应组合物中。
在一些实施方案中,一种用于检测样品中的RNA分子的方法包括:将样品与至少一种第一衔接子、至少一种第二衔接子和包含双链特异性RNA连接酶活性的多肽组合以形成连接反应组合物,其中至少一种第一衔接子和至少一种第二衔接子在相同连接反应组合物中连接至样品的RNA分子以形成连接产物;以及检测连接产物的RNA分子或其替代物。在一些实施方案中,至少一种第一衔接子包含第一寡核苷酸,所述第一寡核苷酸的长度为10至60个核苷酸并且在3'端包含至少两个核糖核苷;以及第二寡核苷酸,所述第二寡核苷酸包含基本上与第一寡核苷酸互补的核苷酸序列并且当第一寡核苷酸与第二寡核苷酸形成双链体时还包含1至8个核苷酸的单链5'部分。在一些实施方案中,至少一种第二衔接子包含第三寡核苷酸,所述第三寡核苷酸的长度为10至60个核苷酸并且包含5'磷酸基团;以及第四寡核苷酸,所述第四寡核苷酸包含基本上与第三寡核苷酸互补的核苷酸序列并且当第三寡核苷酸与第四寡核苷酸形成双链体时还包含1至8个核苷酸的单链3'部分。在一些实施方案中,单链部分独立地具有简并核苷酸序列,或与RNA分子的一部分互补的序列。在一些实施方案中,第一和第三寡核苷酸具有不同的核苷酸序列。在连接反应组合物中,要检测的RNA分子与至少一种第一衔接子的单链部分以及至少一种第二衔接子的单链部分杂交。
在一些实施方案中,检测RNA分子或其替代物包括将连接产物与以下物质组合:i)RNA引导的DNA聚合酶,ii)包含DNA依赖性DNA聚合酶活性和RNA依赖性DNA聚合酶活性的DNA聚合酶,或iii)RNA引导的DNA聚合酶和DNA引导的DNA聚合酶;将连接产物逆转录以形成逆转录产物;使用核糖核酸酶H从逆转录产物消化至少一些核糖核苷以形成扩增模板;将扩增模板与至少一种正向引物、至少一种反向引物和DNA引导的DNA聚合酶(当如i)中组合连接产物时)组合,以形成扩增反应组合物;将扩增反应组合物循环以形成至少一种扩增产物,并且测定扩增产物的至少一部分的序列,从而检测RNA分子。
在一些实施方案中,一种用于产生RNA文库的方法包括将多种不同的RNA分子与多种第一衔接子物质、多种第二衔接子物质以及双链特异性RNA连接酶组合以形成连接反应组合物,其中至少一种第一衔接子包含第一寡核苷酸,所述第一寡核苷酸在3'端包含至少两个核糖核苷;以及第二寡核苷酸,当第一寡核苷酸与第二寡核苷酸杂交在一起时所述第二寡核苷酸包含单链部分,并且其中至少一种第二衔接子包含第三寡核苷酸,所述第三寡核苷酸包含5'磷酸基团;以及第四寡核苷酸,当第三寡核苷酸与第四寡核苷酸杂交在一起时所述第四寡核苷酸包含单链部分,以及将至少一种第一衔接子和至少一种第二衔接子连接至RNA分子以形成多种不同连接产物物质,其中第一衔接子和第二衔接子连接至相同连接反应组合物中的RNA分子。所述方法还包括将多种连接产物物质与RNA引导的DNA聚合酶组合,将多种连接产物物质中的至少一些逆转录以形成多种逆转录产物物质,使用核糖核酸酶H(RNA酶H)从多种逆转录产物中的至少一些消化至少一些核糖核苷以形成多种扩增模板物质,将多种扩增模板物质与至少一种正向引物、至少一种反向引物和DNA引导的DNA聚合酶组合以形成扩增反应组合物,以及将扩增反应组合物循环以形成包含多种扩增产物物质的文库,其中至少一些扩增产物物质包含文库中其他扩增产物物质中的至少一些共同拥有的鉴定序列。
在一些实施方案中,确定扩增产物的至少一部分的序列,从而检测所关注的RNA分子。术语“测序”在本文中以广义使用并且指本领域中已知允许鉴定RNA的至少一部分(包括但不限于延伸产物或载体插入物的至少一部分)中的至少一些连续核苷酸的顺序的任何技术。测序技术的一些非限制性实例包括Sanger的双脱氧终止子方法以及Maxam和Gilbert的化学裂解法,包括所述方法的变化型式;通过杂交(例如但不限于扩增产物杂交至微阵列或珠粒,诸如珠粒阵列)测序;焦磷酸测序(参见例如Ronaghi等,Science 281:363-65,1998);以及限制性酶切作图。一些测序方法包括电泳,包括但不限于毛细管电泳和凝胶电泳;质谱法;以及单分子检测。在一些实施方案中,测序包括直接测序、双重测序、循环测序、单碱基延伸测序(SBE)、固相测序或它们的组合。在一些实施方案中,测序包括使用例如但不限于以下仪器来检测测序产物:ABI
Figure BDA0003617936540000581
377DNA测序仪;ABI
Figure BDA0003617936540000582
310、3100、3100-Avant、3730或3730xl基因分析仪;ABI
Figure BDA0003617936540000583
3700DNA分析仪或Applied Biosystems
Figure BDA0003617936540000584
系统(全部来自Applied Biosystems);Genome Sequencer 20系统(RocheApplied Science);或质谱仪。在某些实施方案中,测序包括乳液PCR(参见例如Williams等,Nature Methods 3(7):545-50,2006)。在某些实施方案中,测序包括高通量测序技术,例如但不限于大规模平行签名测序(MPSS)。可在Zhou等,Methods of Molecular Biology331:285-311,Humana Press Inc.;Reinartz等,Briefings in Functional Genomics andProteomics,1:95-104,2002;Jongeneel等,Genome Research 15:1007-14,2005以及其他位置找到对MPSS的描述。在一些实施方案中,测序包括将dNTP(包括但不限于dATP、dCTP、dGTP、dTTP、dUTP、dITP或它们的组合并且包括dNTP的双脱氧核糖核苷酸型式)合并至扩增产物中。
可用于测定核酸分子的至少一部分的序列的其他示例性技术包括但不限于基于乳液的PCR继之以任何合适的大规模平行测序或其他高通量技术。在一些实施方案中,测定扩增产物的至少一部分的序列以检测对应RNA分子包括对扩增产物进行定量。在一些实施方案中,如例如标题为“Reagents,Methods,and Libraries For Bead-Based Sequencing”的PCT专利申请公布WO 06/084132以及标题为“Reagents,Methods,and Libraries forGel-Free Bead-Based Sequencing”的WO07/121489中所述,使用
Figure BDA0003617936540000591
系统(AppliedBiosystems)进行测序。在一些实施方案中,对扩增产物进行定量包括实时或终点定量PCR或两者。在一些实施方案中,对扩增产物进行定量包括产生要检测的RNA分子的表达谱,诸如mRNA表达谱或miRNA表达谱。在某些实施方案中,对扩增产物进行定量包括一种或多种5'-核酸酶测定,例如但不限于
Figure BDA0003617936540000592
基因表达测定和
Figure BDA0003617936540000593
miRNA测定,所述分析可包括包括但不限于低密度阵列的微流体装置。本领域中已知的任何合适的表达分析技术都可用于所公开方法的各个实施方案中。
本领域技术人员将了解,采用的测序方法典型地不限于本发明方法。相反地,提供对应扩增产物或要检测的RNA的至少一部分或来源于扩增产物的载体插入物的至少一部分的至少一些连续核苷酸的顺序的任何测序技术都可典型地用于当前方法中。可在McPherson,特别是章节5中;Sambrook和Russell;Ausubel等;Siuzdak,The ExpandingRole of Mass Spectrometry in Biotechnology,MCC Press,2003,特别是章节7中;以及Rapley以及其他位置中找到测序技术的描述。在一些实施方案中,在测序步骤之前通过酶降解(包括但不限于核酸外切酶I和虾碱性磷酸酶消化,例如但不限于ExoSAP-
Figure BDA0003617936540000594
试剂(USB Corporation))移除未合并的引物和/或dNTP。在一些实施方案中,适当时通过凝胶或柱纯化、沉降、过滤、珠粒、磁力分离或基于杂交拉出来移除未合并的引物、dNTP和/或ddNTP(参见例如ABI
Figure BDA0003617936540000595
Duplex.TM.384孔F/R序列捕获试剂盒,Applied Biosystems P/N4308082)。
本领域技术人员将了解,在某些实施方案中,所采用的测序/重新测序技术的读取长度可能为可有效检测的RNA分子尺寸的一个因素(参见例如Kling,Nat.Biotech.21(12):1425-27)。在一些实施方案中,将由来自第一样品的RNA分子产生的扩增产物用第一鉴定序列(本文中有时称为“条形码”)或其他标记物标记,将由来自第二样品的RNA分子产生的扩增产物用第二鉴定序列或第二标记物标记,并且汇集包含第一鉴定序列的扩增产物和包含第二鉴定序列的扩增产物,然后测定对应样品中对应RNA分子的序列。在某些实施方案中,将三个或更多个不同RNA文库组合,所述三个或更多个不同RNA文库各自包含特定于那个文库的标识序列。在一些实施方案中,第一衔接子、第二衔接子、正向引物、反向引物或它们的组合包含鉴定序列或鉴定序列的互补序列。
在一些实施方案中,如下文所述,测序包括使用商业上可获得的技术,诸如来自Affymetrix Inc.(Sunnyvale,Calif.)的杂交测序平台以及来自454Life Sciences(Bradford,Conn.)、Illumina/Solexa(Hayward,Calif.)以及Helicos Biosciences(Cambridge,Mass.)的合成测序平台以及来自Applied Biosystems(Foster City,Calif.)的连接测序平台。除使用Helicos Biosciences的合成测序进行的单分子测序之外,其他单分子测序技术包括但不限于Pacific Biosciences的
Figure BDA0003617936540000601
技术、ION
Figure BDA0003617936540000602
技术以及例如由Oxford Nanopore Technologies开发的纳米孔测序。
在一些实施方案中,所述方法包括如下形成表示RNA样品中的RNA分子的特定链的互补DNA(cDNA)文库:(a)在其中多个第一引物中的两个或更多个第一引物的3'区域与RNA样品中的两个或更多个RNA分子之间形成复合物的条件下使多个第一引物杂交至RNA样品,其中第一引物的3'区域包括随机核苷酸序列和第一核苷酸序列标签;(b)通过逆转录使复合物的多个第一引物延伸,从而产生两个或更多个RNA分子的互补DNA(cDNA)分子;(c)使包括第二核苷酸序列标签的多个双链多核苷酸分子在一定条件下杂交至两个或更多个cDNA分子,在所述条件中:(i)多个双链多核苷酸分子中的双链多核苷酸分子的3'短悬端与cDNA分子的3'区域之间形成复合物,其中3'短悬端包括第二随机核苷酸序列,并且(ii)多个双链多核苷酸分子中的双链多核苷酸分子的互补第二链的5'端靠近cDNA分子的3'端;(d)使双链多核苷酸分子的互补第二链的5'端连接至3'端两个或更多个cDNA分子,从而产生双链多核苷酸分子的未连接的链;(e)移除双链多核苷酸分子的未连接的链,从而形成包括第一和第二核苷酸序列标签的多个单链cDNA分子;以及(f)将多个单链cDNA分子转化成双链cDNA分子,从而形成表示RNA样品中的RNA分子的特定链的cDNA文库。
在其他实施方案中,所述方法包括如下形成表示RNA样品中的RNA分子的特定链的cDNA文库:(a)在多个第一引物中的两个或更多个第一引物的3'区域与RNA样品中的两个或更多个RNA分子之间形成复合物的条件下使多个第一引物杂交至RNA样品,其中单链引物的3'区域包括随机核苷酸序列和第一核苷酸序列标签;(b)通过逆转录使复合物的第一引物延伸,从而产生两个或更多个RNA分子的互补DNA(cDNA)分子;(c)在一定条件下使双链多核苷酸分子连接至cDNA分子,在所述条件中(c)在一定条件下使双链多核苷酸分子连接至cDNA分子,在所述条件中双链多核苷酸分子的5'端连接至cDNA分子并且RNA分子不连接至双链多核苷酸分子的3'端,其中双链DNA分子包括第二核苷酸序列标签;(d)移除所述RNA分子;以及(e)从所述cDNA分子合成互补第二链DNA分子,从而形成表示RNA样品中的RNA分子的特定链的cDNA文库。
在一些实施方案中,引物可使用非随机序列(例如在此实施方案的一些形式中可以与靶标杂交的随机或非随机非聚T或非聚T序列结束的聚T或聚A序列)杂交至聚核苷酸。作为另一实例,引物可包括对应于与外显子序列基本上互补或基本上相同的序列的序列。当同时靶向多个聚核苷酸时,靶向多个聚核苷酸的引物可为相同或不同的。
在一些实施方案中,大规模平行测序使用Illumina的合成测序和基于可逆终止子的测序化学(例如如Bentley等,Nature 6:53-59[2009]中所述)。在一些实施方案中,Illumina的测序技术依赖于RNA转录物的互补DNA(cDNA)附着至结合寡核苷酸锚的平面光学透明表面。模板cDNA经过末端修复以产生5'-磷酸化钝端,并且使用克列诺片段(Klenowfragment)的聚合酶活性将单个A碱基添加至钝端磷酸化DNA片段的3'端。此添加制备用于连接至寡核苷酸衔接子的DNA片段,其在3'端具有单个T碱基的短悬端以增加连接效率。衔接子寡核苷酸与流动池锚状物互补。在有限稀释条件下,将衔接子修饰的单链模板DNA添加至流动池中并且通过杂交至锚状物进行固定。使附着的DNA片段延伸并且进行桥式扩增以形成具有亿万个簇的超高密度测序流动池,所述簇各自含有相同模板的约1,000个拷贝。在一个实施方案中,使用PCR将互补DNA(cDNA)扩增,然后使其经历簇扩增。
在一些实施方案中,使用采用具有可移除荧光染料的可逆终止子的稳健四色DNA合成测序技术对模板进行测序。使用激光激发和全内反射光学实现高敏感度荧光检测。将约20-40bp(例如36bp)的短序列读段与重复被掩蔽的参考基因组进行比对,并且使用专门开发的数据分析管线软件来鉴定短序列读段至参考基因组的独特映射。还可使用非重复掩蔽的参考基因组。不论使用重复掩蔽的还是非重复掩蔽的参考基因组,都仅对独特映射至参考基因组的读段进行计数。在完成第一个读段之后,可使模板原位再生以从片段的相反末端实现第二个读段。因此,可使用DNA片段的单端或配对末端测序。进行存在于样品中的DNA片段的部分测序,并且将包含预定长度(例如36bp)的读段并且映射至已知参考基因组的序列标签进行计数。在一个实施方案中,对cDNA分子的克隆扩增拷贝的一个末端进行测序并且通过使用核苷酸数据库高效大规模比对(ELAND)软件的Illumina基因组分析仪的生物信息学比对分析进行加工。
ii.基于PCR的检测RNA表达水平的方法
通过RNA提取法产生的样品可为高度纯的并且不含PCR抑制剂,并且可适合于qPCR,如在一些实施方案中用于测定RNA相对表达作为对例如各种类型的癌症的测定。
在一些实施方案中,所述方法包括进行PCR或qPCR以产生扩增子。本文在下文中例示了PCR和qPCR方案并且可直接应用或经过调整用于使用目前描述的组合物来检测和/或鉴定靶基因和参考基因的用途。
一些实施方案提供了包括定量PCR(qPCR)(也称为实时PCR)的方法。qPCR可提供定量测量,并且还提供时间和污染减少的益处。如本文所用,“定量PCR”(“qPCR”或更特定地“实时qPCR”)是指在正在进行时直接监测PCR扩增的进展,而不需要对反应产物重复取样。在qPCR中,可在反应产物产生时经由信号传导机制(例如荧光)对其进行监测并且在信号升高至超过背景水平之后但在反应达到平台期之前进行跟踪。实现可检测或“阈值”水平的荧光(本文称为循环阈值或“CT”)所需的循环次数直接随PCR方法开始时可扩增靶标的浓度而变化,从而使得对信号强度的测量能够实时提供对样品中靶核酸的量的测量。
为设置PCR和qPCR反应,反应混合物最低包含模板核酸(例如如存在于测试样品中,除了在如下文所述的阴性对照的情况下)以及寡核苷酸引物和/或探针与合适缓冲液、盐等的组合,以及适当浓度的核酸聚合酶。如本文所用,“核酸聚合酶”是指催化核苷三磷酸聚合的酶。通常,酶将在退火至靶序列的引物的3'端起始合成,并且将沿模板在5'-3'方向上进行,直到合成终止。适当的浓度包括在目前描述的方法中催化此反应的浓度。已知可用于本文所公开方法中的DNA聚合酶包括例如大肠杆菌DNA聚合酶I、T7 DNA聚合酶、嗜热栖热菌(Tth)DNA聚合酶、嗜热脂肪芽孢杆菌DNA聚合酶、海滨嗜热球菌DNA聚合酶、水生栖热菌(Taq)DNA聚合酶和强烈炽热球菌(Pfu)DNA聚合酶、FASTSTARTTM Taq DNA聚合酶、APTATAQTMDNA聚合酶(Roche)、KLENTAQ 1TM DNA聚合酶(AB peptides Inc.)、HOTGOLDSTARTM DNA聚合酶(Eurogentec)、KAPATAQTM热启动DNA聚合酶、KAPA2GTM快速热启动DNA聚合酶(KapaBiosystemss)、PHUSIONTM热启动DNA聚合酶(Finnzymes)等。
除以上组分外,本发明方法的反应混合物包括引物、探针以及脱氧核糖核苷三磷酸(dNTP)。
通常,反应混合物将还包含对应于四种天然存在的核苷碱基的四种不同类型的dNTP,例如dATP、dTTP、dCTP以及dGTP。在一些实施方案中,每种dNTP将典型地以在约10至5000μM,通常为约20至1000μM、约100至800μM或约300至600μM范围内的量存在。
反应混合物可还包括水性缓冲介质,所述水性缓冲介质包括单价离子来源、二价阳离子来源以及缓冲剂。可采用任何方便的单价离子来源,诸如氯化钾、乙酸钾、乙酸铵、谷氨酸钾、氯化铵、硫酸铵等。二价阳离子可为镁、锰、锌等,其中阳离子将典型地为镁。可采用任何方便的镁阳离子来源,包括氯化镁、乙酸镁等。存在于缓冲液中的镁的量可在0.5至10mM范围内,并且可在约1至约6mM或约3至约5mM范围内。可存在于缓冲液中的代表性缓冲剂或盐包括Tris、三羟甲基甘氨酸(Tricine)、HEPES、MOPS等,其中缓冲剂的量将典型地在约5至150mM,通常为约10至100mM,并且更通常为约20至50mM范围内,其中在某些优选实施方案中,缓冲剂将以足以提供在约6.0至9.5范围内的pH值(例如约pH 6.0、6.5、7.0、7.5、8.0、8.5、9.0或9.5)的量存在。可存在于缓冲介质中的其他剂包括螯合剂,诸如EDTA、EGTA等。在一些实施方案中,反应混合物可包括BSA等。此外,在一些实施方案中,反应可包括防冻剂,诸如海藻糖,特别是当以可随时间推移加以储存的预混液的形式提供试剂时。
在制备反应混合物时,可将各种组成组分以任何方便的顺序加以组合。举例来说,可将缓冲液与引物、聚合酶然后与模板核酸组合,或可同时将各种组成组分全部组合以产生反应混合物。
或者,在本文所公开的方法中可根据制造商的说明书使用可商购获得的预混合试剂,或进行修改以改善反应条件(例如根据需要修改缓冲液浓度、阳离子浓度或dNTP浓度),包括例如Quantifast PCR混合液(Qiagen)、
Figure BDA0003617936540000651
通用PCR预混液(AppliedBiosystems)、O
Figure BDA0003617936540000652
Figure BDA0003617936540000653
(Cepheid)、IQ&#8482;Supermix(Bio-RadLaboratories)、
Figure BDA0003617936540000654
快速启动(Roche Applied Scien ce,Indianapolis,IN)或
Figure BDA0003617936540000655
QPCR预混液(Stratagene,La J olla,CA)。
可使反应混合物经历引物延伸反应条件(“足以提供基于聚合酶的核酸扩增产物”的条件),例如容许通过使用模板链作为模板将核苷酸添加至引物分子末端进行聚合酶介导的引物延伸的条件。在许多实施方案中,引物延伸反应条件为扩增条件,所述条件包括多个反应周期,其中各反应周期包括:(1)变性步骤,(2)退火步骤,以及(3)聚合步骤。如以下所论述,在一些实施方案中,扩增方案不包括致力于退火的特定时间,而是替代地仅包括致力于变性和延伸的特定时间。反应周期的数目将根据正在进行的应用而改变,但通常将为至少15,更通常至少20,并且可为高达60或更高,其中不同循环的数目将典型地在约20至40范围内。在进行超过约25个,通常超过约30个循环的方法中,将额外聚合酶引入反应混合物中使得适合于酶促引物延伸的条件得以维持可为方便的或需要的。
变性步骤包括将反应混合物加热至高温,并且使混合物在所述高温下维持足以使存在于反应混合物中的任何双链或杂交核酸解离的一段时间。对于变性,反应混合物的温度通常将升至约85至100℃,通常约90至98℃,并且更通常约93至96℃范围内的温度,并且在所述温度下维持在约3至120秒范围内,通常为约3秒的一段时间。
在变性之后,可使反应混合物经受足以使引物退火至存在于混合物(如果存在)中的模板核酸并且以使得使用作为模板与引物杂交的核酸使引物在5'至3'方向上延伸的方式使核苷酸聚合至引物末端的条件,例如足以酶促产生引物延伸产物的条件。在一些实施方案中,退火和延伸过程在相同步骤中进行。通常将对为实现这些条件使反应混合物降低达到的温度进行选择以提供最佳效率和特异性,并且通常将在约50至85℃、通常约55至70℃并且更通常约60至68℃范围内。在一些实施方案中,可将退火条件维持在约15秒至30分钟、通常约20秒至5分钟或约30秒至1分钟范围内或约30秒的一段时间。
此步骤可任选包括退火步骤和延伸步骤各自中的一者加上各步骤的温度和时间长度的变化和优化。在两步退火和延伸中,允许如上进行退火步骤。在引物退火至模板核酸之后,反应混合物将进一步经受足以使得核苷酸如上聚合至引物末端的条件。为了实现聚合条件,将使反应混合物的温度典型地升至在约65至75℃、通常约67至73℃范围内的温度或维持在所述温度下,并且维持在约15秒至20分钟、通常约30秒至5分钟范围内的一段时间。在一些实施方案中,本文所公开的方法不包括单独的退火和延伸步骤。相反地,所述方法包括变性和延伸步骤,没有任何专门用于退火的步骤。
以上变性、退火以及延伸的循环可使用典型地称为热循环器的自动化装置来进行。本文别处以及美国专利号5,612,473;5,602,756;5,538,871;以及5,475,610中描述了可采用的热循环器;所述专利的公开内容以引用的方式并入本文中。
还可将本文所述的方法用于用于检测靶核酸序列的基于非PCR的应用中,其中此类靶标可固定于固体载体上。Ausubel等编(1995)Current Protocols in MolecularBiology(Greene Publishing and Wiley-Interscience,NY)中以及由例如关于膜(PallCorporation,Schleicher&amp;Schuell);关于磁性珠粒(Dynal);关于培养板(Costar,Nalgenunc);关于珠粒阵列平台(Luminex和Becton Dickinson);以及关于根据本文所提供的实施方案可用的其他载体(CpG,Inc.)的制造商所提供的方案中描述了将核酸序列固定于固体载体上的方法。
产生类似扩增或检测/定量结果的各种试剂的确切量以及用于PCR或其他合适的扩增程序的条件(例如缓冲条件、循环时间等)的变化型式被视为等效型式。在一个实施方案中,本发明qPCR检测具有检测样品中的靶核酸的少于50个拷贝(优选少于25个拷贝、更优选少于15个拷贝、更优选少于10拷贝,例如5、4、3、2或1个拷贝)的敏感度。
在一些实施方案中,所述方法可涉及模板RNA的PCR扩增。可进行DNA酶处理以从RNA样品中移除DNA污染。可使用逆转录酶将靶RNA转化为cDNA并且此步骤可使用与PCR反应内所用相同的引物中的一者或多者。可通过例如用于扩增来自血浆的cDNA或其他cDNA的一致的可重复的方法来扩增靶cDNA。在一些实施方案中,可扩增cDNA中的一个或多个靶标并且经由
Figure BDA0003617936540000671
化学进行定量。此方案可能不是唯一的适合于检测RNA量的方案。然而,使用一致的方案来进行cDNA合成和扩增可能为重要的,因为方案的变化可能对最终结果具有大的影响。
在一些实施方案中,可使用根据制造商的方案提供的引物/探针,使用Qiagen测定#QF00119602来进行qPCR。Agilent的通用RNA可用作qPCR中的标准物。
可使用RNA标准物对多次运行的结果进行标准化。此标准物可在不同稀释度下运行。在一些实施方案中,可使用合成标准物。举例来说,可检验一种或多种标记物的正常范围和截止值,并且可获得合成标准物并且直接使用或加以稀释或组合,使得它们的水平类似于预测水平,诸如标记物的预测水平。在一些实施方案中,合成标准物以处于患者样品中的预测水平的一个数量级(例如高10倍或低10倍)或在所述范围内的水平存在。在一些实施方案中,合成标准物以与针对患者样品所预测的水平相差5倍(高5倍或低五倍)的差异或在所述范围内的差异存在。在一些实施方案中,合成标准物以与针对患者样品所预测的水平相差2倍(高2倍或低2倍)的差异或在所述范围内的差异存在。
可使用许多方法来确定合成标准物中每种合成RNA的适当水平。在一个实施方案中,可运行其中具代表性的一定数目的样品并且记录结果(例如Ct值或针对标准物的拟合值)。然后可基于与样品相同的测定运行各合成RNA并且可基于相同的量表来测量结果(例如Ct得分或针对标准物的拟合值)。在检验后,可确定应使用哪些标准物。举例来说,可运行50个样品并且针对给定基因获得在33-38范围内的Ct得分。每微升107、106、105、104、103、102个拷贝的标准物可产生24、28、32、36、40或44的Ct得分。因此,可决定使用105标准物,并且在测定设置期间稀释至104和103。使用此策略,为了涵盖将来的样品仅需要原始标准物和两种稀释物。可以使用类似的方法为相同多重检测中的其他标准物选择合适的浓度。使用此方法,可针对要测定的每种转录物使用不同的浓度,因此即使在多重检测中不同基因之间存在大的差异也可使用单一标准物。通过使用本文所公开的方法,可基于标准模板使用降低数目的扩增反应来测定广泛范围的累积水平的转录物。
举例来说,如果预期基因A将在100至10,000个拷贝/μl范围内并且基因B将在1,000,000至100,000,000个拷贝范围内,那么可形成10,000个拷贝基因A与100,000,000个拷贝基因B的混合合成标准物,由此为涵盖针对样品所预期的整个范围仅需要10倍稀释系列的三个标准物。在一些实施方案中,使用此类合成标准物可使产生涵盖基因a与基因B的所预期范围的标准曲线需要在qPCR反应板中运行的标准物或对照样品的数目显著降低。此方法将还使通过在连续稀释期间混配而进行移液从而引入小错误的风险最小化。
在一些实施方案中,可使用逆转录酶PCR(RT-PCR)来确定生物标记物的RNA水平,例如mRNA或miRNA水平。可在存在或不存在药物处理的情况下,使用RT-PCR比较在正常和肿瘤组织中不同样品群体中的生物标记物的此类RNA水平,以表征基因表达的模式,区别紧密相关的RNA,并且分析RNA结构。
典型地,第一步骤为从样品分离RNA,例如mRNA。起始物质可为从人样品(例如人肿瘤或肿瘤细胞系以及分别的对应正常组织或细胞系)分离的总RNA。因此,可从样品(例如肿瘤细胞或肿瘤细胞系)分离RNA,并且与来自健康供体的汇集DNA进行比较。如果mRNA的来源为原发性肿瘤,那么可提取mRNA。
无论RNA包含mRNA、miRNA还是其他类型的RNA,通过RT-PCR进行基因表达分析都可包括使RNA模板逆转录至cDNA中,随后在PCR反应中扩增。常用的逆转录酶包括但不限于禽成髓细胞瘤病毒逆转录酶(AMV-RT)和莫洛尼鼠(Moloney murine)白血病病毒逆转录酶(MMLV-RT)。根据表达分析的情况和目标,典型地使用特异性引物、随机六聚物、茎-环引物或寡dT引物来引发逆转录步骤。举例来说,可使用GeneAmp RNA PCR试剂盒(Perkin Elmer,Calif.,USA)根据制造商的说明书对提取的RNA进行逆转录。然后可将衍生的cDNA在后续PCR反应中用作模板。
在一些实施方案中,PCR步骤采用Taq DNA聚合酶,所述Taq DNA聚合酶具有5′-3′核酸酶活性,但缺乏3′-5′校对核酸内切酶活性。TaqMan PCR典型地利用Taq或Tth聚合酶的5′-核酸酶活性来水解结合至靶扩增子的杂交探针,但具有等效5′核酸酶活性的任何酶都可使用。使用两种寡核苷酸引物来产生PCR反应的典型扩增子。第三寡核苷酸或探针被设计成检测定位于两个PCR引物之间的核苷酸序列。探针为通过Taq DNA聚合酶不可伸长的,并且用报告荧光染料和淬灭荧光染料标记。当两种染料因其位于探针上而紧密定位在一起时,报告染料的任何激光诱导的发射都被淬灭染料淬灭。在扩增反应期间,Taq DNA聚合酶以模板依赖性方式裂解探针。所得探针片段在溶液中离解,并且来自所释放报告染料的信号未发生第二荧光团的淬火效应。合成的各新分子释放出一个报告染料分子,并且对未淬灭报告染料的检测为定量解释数据提供基础。
在一些实施方案中,TaqManTM RT-PCR可使用可商购获得的设备来进行,诸如ABIPRISM 7700TM Sequence Detection SystemTM(Perkin-Elmer-Applied Biosystems,Foster City,Calif.,USA)或Lightcycler(Roche Molecular Biochemicals,Mannheim,Germany)。在一个实施方案中,在实时定量PCR装置(诸如ABI PRISM 7700TM SequenceDetection SystemTM)上运行5′核酸酶程序。所述系统由热循环器、激光器、电荷耦合装置(CCD)、照相机以及计算机组成。所述系统在热循环器上以96孔模式扩增样品。在扩增期间,针对所有96个孔通过光纤电缆实时收集激光诱导的荧光信号,并且在CCD处检测。所述系统包括用于运行仪器以及用于分析数据的软件。TaqMan数据最初以Ct或阈值循环表示。在每个循环期间记录荧光值并且表示扩增至扩增反应中所述点的产物的量。荧光信号首次被记录为统计显著性时的点为阈值循环(Ct)。
在一些实施方案中,为使错误以及样品间变化的效应最小化,使用内标物进行RT-PCR。理想内标物在不同组织间以恒定水平表达,并且不受实验处理影响。经常用于标准化基因表达模式的RNA为看家基因甘油醛-3-磷酸-脱氢酶(GAPDH)和β-肌动蛋白的mRNA。
在一些实施方案中,实时定量PCR可使用双重标记的FRET荧光生成探针(例如TaqManTM探针)测量PCR产物累积。实时PCR既与其中各靶序列的内部竞争者用于标准化的定量竞争性PCR相容,又与使用样品内所含的标准化基因或用于RT-PCR的看家基因的定量比较PCR相容。参见例如Held等(1996)Genome Research 6:986-994。
在一些实施方案中,可使用PCR活瓣测定来测量样品中的RNA。如实施例1中详细论述,QuARTS和LQAS/TELQAS活瓣测定技术将基于聚合酶的靶DNA扩增方法与基于侵入性裂解的信号扩增方法组合在一起。下文描述了将逆转录与这些活瓣测定技术组合用于定量来自样品的RNA的测定。
iii.检测基因表达水平的替代方法
在一些实施方案中,可经由杂交至微阵列、nCounter或类似方式测定RNA水平。举例来说,常用于差异表达研究中的一种类别的阵列包括微阵列或寡核苷酸阵列。这些阵列利用大量探针,所述探针是基于底物直接合成的并且用于基于互补杂交的原理考查复合RNA或信息群体。典型地,这些微阵列提供跨越所关注的基因或核苷酸序列的所选区域的相对小长度(20聚体至25聚体)的16至20个寡核苷酸探针对的集合。寡核苷酸阵列中所用的探针对还可包括完美匹配和错配探针,所述探针被设计成杂交至相同RNA或信息链。完美匹配探针含有已知与所关注的信息完全互补的序列,而错配探针就其序列来说类似于完美匹配探针,除了它含有至少一个不同于完美匹配探针的错配核苷酸。在表达分析期间,关于完美匹配和错配探针对来自样品核苷酸群体的信息的杂交效率进行评估,以同时验证和定量许多信息的表达水平。在一些实施方案中,将整个基因阵列打印成微阵列。在一些实施方案中,微阵列上包括包含靶基因中的至少一者以及参考基因中的至少一者的基因子集。
在一些实施方案中,可使用例如由Nanostring technologies提供的诸如nCounter等装置来促进分析。nCounter分析系统为包含完全自动化准备站、数字分析器、CodeSet(分子条形码)以及进行分析所需的所有试剂和消耗品的集成系统。基于nCounter系统的分析由一个简单工艺流程中的非溶液杂交、杂交后加工、数字数据采集以及标准化组成。在一些实施方案中,所述方法为自动化的。在一些实施方案中,可将定制的或预先设计的条形码探针集合预先与作为分析的一部分的综合系统控制集合混合。
一些实施方案使用原位杂交测定来检测基因表达水平。在原位杂交测定中,将细胞固定至固体载体,典型地为载玻片。在一些实施方案中,可使用热量或碱使细胞变性。然后使细胞在中等温度下与杂交溶液接触以容许经过标记的特定探针的退火。优选将探针用放射性同位素或荧光报告子标记。
在一些实施方案中,FISH(荧光原位杂交)使用荧光探针,所述荧光探针仅结合至序列中与它们显示高程度序列相似性的那些部分。FISH为在一些实施方案中用于检测和定位细胞中的特定聚核苷酸序列的细胞遗传学技术。举例来说,可使用FISH来检测染色体上的DNA序列。还可使用FISH来检测和定位组织样品内的特定RNA,例如mRNA。FISH中使用结合至与其显示高程度的序列相似性的特定核苷酸序列的荧光探针。可使用荧光显微术来发现荧光探针是否结合以及在哪里结合。除检测特定核苷酸序列(例如转位、融合、断裂、复制以及其他染色体异常)外,FISH还可帮助确定细胞和组织内特定基因拷贝数目和/或基因表达的空间-时间模式。
在一些实施方案中,比较基因组杂交(CGH)采用原位杂交动力学来比较来自样品的不同DNA或RNA序列的拷贝数或一个样品中的不同DNA或RNA序列的拷贝数与另一样品中基本上相同的序列的拷贝数。在许多可用的CGH应用中,从受试者细胞或细胞群体分离DNA或RNA。比较可为定性的或定量的。拷贝数信息来源于参考基因组上不同位置间的杂交信号的强度的比较。美国专利号6,335,167中以及美国申请序列号60/804,818中描述了CGH的方法、技术以及应用,所述专利的相关部分以引用的方式并入本文中。
B.定量蛋白质分析
在一些实施方案中,通过检测蛋白质表达水平来确定基因表达水平。基于蛋白质的检测技术包括免疫亲和测定。可使用抗体从溶液样品免疫沉淀特定蛋白或分析用例如聚丙烯酰胺凝胶分离的蛋白质的免疫印迹。检测组织或细胞中的特定蛋白多晶型时也可使用免疫细胞化学法。
在其他实施方案中,还可使用替代的基于抗体的技术,包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、免疫放射测定(IRMA)以及免疫酶测定(IEMA)以及使用单克隆或多克隆抗体的夹心测定。参见例如美国专利号4,376,110和4,486,530,此两者以引用的方式并入本文中。
在一些实施方案中,使用免疫组织化学来检测蛋白质水平。免疫组织化学(IHC)为一种定位组织的细胞中的抗原(例如蛋白质)从而特定地使抗体结合至组织中的抗原的方法。抗原结合抗体可缀合或融合至允许其例如经由可视化进行检测的标签。在一些实施方案中,标签为可催化显色反应的酶,诸如碱性磷酸酶或辣根过氧化物酶。所述酶可融合至抗体或例如使用生物素-亲和素系统非共价结合。或者,可用荧光团(诸如荧光素、罗丹明(rhodamine)、DyLight氟或Alexa氟)对抗体进行标记。可直接对抗原结合抗体进行标记或它本身可由带有标签的检测抗体识别。使用IHC,可检测一种或多种蛋白质。基因产物的表达可与其与对照水平相比的染色强度有关。
在一些实施方案中,可使用液相色谱或质谱法来检测蛋白质水平。在HPLC-显微镜串联质谱法技术中,对蛋白质进行蛋白水解消化,并且通过逆相色谱分离来分离所得肽混合物。然后进行串联质谱法并且分析由其收集的数据。参见Gatlin等,Anal.Chem.,72:757-763(2000)。
用于获得基因表达水平数据的许多方法和装置为进行所述方法以及供与本文所公开的组合物和试剂盒一起使用所必需的,并且不应将单数据累积方法或装置视为限制性的。
II.甲基化标记物分析
在一些实施方案中,标记物为100个或更少碱基的区域,标记物为500个或更少碱基的区域,标记物为1000个或更少碱基的区域,标记物为5000个或更少碱基的区域,或在一些实施方案中,标记物为一个碱基。在一些实施方案中,标记物位于高CpG密度启动子中。
所述技术不受样品类型的限制。举例来说,在一些实施方案中,样品为粪便样品、组织样品、痰液、血液样品(例如血浆、血清、全血)、排泄物或尿液样品。
此外,所述技术在用于确定甲基化状态的方法方面不受限制。在一些实施方案中,测定包括使用甲基化特异性聚合酶链反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。在一些实施方案中,测定包括使用甲基化特异性寡核苷酸。在一些实施方案中,所述技术使用大规模平行测序(例如下一代测序)来确定甲基化状态,例如合成测序、实时(例如单分子)测序、珠粒乳液测序、纳米孔测序等。
所述技术提供了用于检测差异甲基化区(DMR)的试剂。在一些实施方案中,提供了一种寡核苷酸,所述寡核苷酸包含与具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释的染色体区;或者选自确定由ZNF781、BARX1和EMX1组成的组;由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组;由SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2和EMX1组成的组;由SHOX2、SOBP、ZNF781、BTACT、CYP26C1和DLX4组成的组;由SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2和SKI组成的组;由ZNF781、BARX1和EMX1以及SOBP和/或HOXA9组成的组;由BARX1、FLJ45983、SOBP、HOPX、IFFO1和ZNF781组成的组;由BARX1、FAM59B、HOXA9、SOBP和IFFO1组成的组的标记物的任何子集中的标记物互补的序列。
试剂盒实施方案提供了例如一种试剂盒,所述试剂盒包含亚硫酸氢盐试剂;以及对照核酸,所述对照核酸包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区,并且具有与未患癌症(例如肺癌)的受试者相关的甲基化状态。在一些实施方案中,试剂盒包含如本文所述的亚硫酸氢盐试剂和寡核苷酸。在一些实施方案中,试剂盒包含亚硫酸氢盐试剂;以及对照核酸,所述对照核酸包含来自此类染色体区的序列并且具有与患有肺癌的受试者相关的甲基化状态。
所述技术与组合物(例如反应混合物)的实施方案有关。在一些实施方案中,提供了一种组合物,所述组合物包含核酸和亚硫酸氢盐试剂,所述核酸包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区。一些实施方案提供了一种组合物,所述组合物包含核酸和如本文所述的寡核苷酸,所述核酸包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区。一些实施方案提供了一种组合物,所述组合物包含核酸和甲基化特异性限制酶,所述核酸包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区。一些实施方案提供了一种组合物,所述组合物包含核酸和聚合酶,所述核酸包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区。
提供了用于从受试者获得的样品中筛查赘瘤(例如肺癌)的额外相关方法实施方案,例如包括以下步骤的方法:确定包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区中的碱基的样品中的标记物的甲基化状态;将来自受试者样品的标记物的甲基化状态与来自未患肺癌的受试者的正常对照样品的标记物的甲基化状态进行比较;以及确定受试者样品与正常对照样品的甲基化状态的差异的置信区间和/或p值。在一些实施方案中,置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%或99.99%,并且p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。方法的一些实施方案提供了以下步骤:使包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区的核酸与亚硫酸氢盐试剂反应,以产生亚硫酸氢盐反应的核酸;对亚硫酸氢盐反应的核酸进行测序,以提供亚硫酸氢盐反应的核酸的核苷酸序列;将亚硫酸氢盐反应的核酸的核苷酸序列与包含来自未患肺癌的受试者的染色体区的核酸的核苷酸序列进行比较,以鉴定两个序列的差异;并且当存在差异时将受试者鉴定为具有赘瘤。
所述技术提供了用于在从受试者获得的样品中筛查肺癌的系统。系统的示例性实施方案包括例如用于在从受试者获得的样品中筛查肺癌的系统、包括被配置成确定样品的甲基化状态的分析组件、被配置成将样品的甲基化状态与对照样品或数据库中记录的参考样品甲基化状态进行比较的软件组件以及被配置成警示使用者癌症相关甲基化状态的警报组件的系统。在一些实施方案中,由接收结果的软件组件确定警报,所述结果来自多个测定(例如确定例如具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区的多种标记物的甲基化状态,以及基于多个结果来计算用于报告的值或结果。一些实施方案提供了一种加权参数的数据库,所述加权参数与具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的每种染色体区相关,本文提供所述数据库以用于计算值或结果和/或警告以向使用者(例如诸如医师、护士、临床医师等)报告。在一些实施方案中,报告多个测定的所有结果,并且在一些实施方案中,使用一个或多个结果来提供指示受试者的肺癌风险的基于多个测定的一个或多个结果的复合结果的得分、值或结果。
在系统的一些实施方案中,样品包含核酸,所述核酸包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区。在一些实施方案中,所述系统还包括用于分离核酸的组件、用于收集样品的组件,诸如用于收集粪便样品的组件。在一些实施方案中,所述系统包含核酸序列,所述核酸序列包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAXchr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区。在一些实施方案中,数据库包含来自未患肺癌的受试者的核酸序列。还提供了核酸,例如核酸的集合,各核酸具有包含具有选自EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区的序列。
相关系统实施方案包含如所描述的核酸集合,以及与所述核酸集合相关的核酸序列的数据库。一些实施方案还包含亚硫酸氢盐试剂。另外,一些实施方案还包含核酸测序仪。
在某些实施方案中,提供了用于表征从人受试者获得的样品的方法,所述方法包括a)从人受试者获得样品;b)测定样品中一种或多种标记物的甲基化状态,其中标记物包含具有选自以下标记物组:EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329的注释,优选来自如以上所列标记物的任何子集的染色体区中的碱基;以及c)将所测定标记物的甲基化状态与在不具有赘瘤的受试者中测定的标记物的甲基化状态进行比较。
在一些实施方案中,所述技术与评估生物样品中本文所鉴定的标记物中的一者或多者的存在以及甲基化状态有关。这些标记物包含如本文所论述的一个或多个差异甲基化区(DMR)。在所述技术的实施方案中对甲基化状态进行评估。因而,本文提供的技术不限于用于测量基因的甲基化状态的方法。举例来说,在一些实施方案中,通过基因组扫描法来测量甲基化状态。举例来说,一种方法涉及限制标志基因组扫描(Kawai等(1994)Mol.Cell.Biol.14:7421-7427),并且另一实例涉及甲基化特异性任意引物PCR(Gonzalgo等(1997)Cancer Res.57:594-599)。在一些实施方案中,通过用甲基化特异性限制酶(特别是甲基化敏感性酶)消化基因组DNA,随后进行所关注区域的DNA印迹分析(消化DNA印迹方法)来监测特定CpG位点处甲基化模式的改变。在一些实施方案中,分析甲基化模式的改变涉及一种方法,所述方法包括用一种或多种甲基化特异性限制酶消化基因组DNA,以及针对裂解或非裂解对区域进行分析,指示所分析区域的甲基化状态。在一些实施方案中,所处理的DNA的分析包括PCR扩增,并且扩增结果指示DNA由限制酶裂解或未由限制酶裂解。在一些实施方案中,对所产生的扩增产物的存在、不存在、量、尺寸以及序列中的一者或多者进行评估以分析所关注DNA的甲基化状态。参见例如Melnikov等,(2005)Nucl.Acids Res,33(10):e93;Hua等,(2011)Exp.Mol.Pathol.91(1):455-60;以及Singer-Sam等(1990)Nucl.Acids Res.18:687。此外,已报导利用DNA的亚硫酸氢盐处理作为甲基化分析的起始点的其他技术。这些技术包括甲基化特异性PCR(MSP)(Herman等(1992)Proc.Natl.Acad.Sci.USA 93:9821-9826)以及从亚硫酸氢盐转化的DNA扩增的PCR产物的限制酶消化(Sadri和Hornsby(1996)Nucl.Acids Res.24:5058-5059;以及Xiong和Laird(1997)Nucl.Acids Res.25:2532-2534)。已开发用于检测基因突变(Kuppuswamy等(1991)Proc.Natl.Acad.Sci.USA 88:1143-1147)和定量等位基因特异性表达(Szabo和Mann(1995)Genes Dev.9:3097-3108;以及Singer-Sam等(1992)PCR Methods Appl.1:160-163)的PCR技术。此类技术使用内部引物,所述内部引物退火至PCR产生的模板并且在所要测定的单核苷酸的5'立即终止。在一些实施方案中使用利用如美国专利号7,037,650中所述的“定量Ms-SNuPE测定”的方法。
在一些实施方案中,用于测定标记物的甲基化状态的设计包括对要由测定技术考查的标记物靶区域中的单独CpG基因座处的背景甲基化进行分析。举例来说,在一些实施方案中,从自被诊断患有疾病(例如癌症)的受试者分离的样品中检验到大量标记DNA的单独拷贝(例如>10,000,优选>100,000个单独拷贝)从而确定甲基化频率,并且将这些数据与从无病受试者分离的样品的类似大量标记DNA单独拷贝进行比较。可将样品的标记DNA内单独CpG基因座处的疾病相关甲基化与背景甲基化的频率进行比较,使得可选择具有更高信噪比(例如更高可检测甲基化和/或降低的背景甲基化)的CpG基因座用于测定设计。参见例如美国专利号9,637,792和10,519,510,所述专利各自以全文引用的方式并入本文中。在一些实施方案中,通过测定同时考查一组高信噪比CpG基因座(例如标记物区域中的2、3、4、5个或更多个单独CpG基因座),使得对于要根据测定结果归类为“甲基化”或“未甲基化”的标记物来说,所有CpG基因座一定具有预定甲基化状态(例如所有一定为甲基化的或所有都不可能为甲基化的)。
在评估甲基化状态后,常常以在特定位点处(例如在单个核苷酸处、在特定区域或基因座处、在较长的所关注序列处,例如DNA的长达约100-bp、200-bp、500-bp、1000-bp或更长的子序列)发生甲基化的DNA的单独链相对于样品中包含所述特定位点的总DNA群体的分数或百分比来表示甲基化状态。传统上,使用校准物通过PCR确定未甲基化核酸的量。然后,将已知量的DNA进行亚硫酸氢盐处理并且使用实时PCR或其他指数扩增,例如QuARTS测定(例如如由美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392以及美国专利申请序列号15/841,006提供)来确定所得甲基化特异性序列。
举例来说,在一些实施方案中,方法包括通过使用外标物产生未甲基化靶标的标准曲线。标准曲线是从至少两个点构建的并且使未甲基化DNA的实时Ct值与已知定量标准物相联系。然后,从至少两个点和外标物构建甲基化靶标的第二标准曲线。此第二标准曲线使甲基化DNA的Ct与已知定量标准物相联系。接下来,针对甲基化和未甲基化群体确定测试样品Ct值并且由通过头两个步骤产生的标准曲线计算DNA的基因组当量。由相对于群体中的DNA总量的甲基化DNA的量,例如(甲基化DNA的数目)/(甲基化DNA的数目+未甲基化DNA的数目)×100来计算所关注位点处甲基化的百分比。
本文还提供了用于实践所述方法的组合物和试剂盒。举例来说,在一些实施方案中,单独或以集合(例如用于扩增多种标记物的引物对的集合)的形式提供对一种或多种标记物具特异性的试剂(例如引物、探针)。还可提供用于进行检测测定的额外试剂(例如用于进行QuARTS、PCR、测序、亚硫酸氢盐或其他测定的酶、缓冲液、阳性和阴性对照)。在一些实施方案中,提供了含有进行一种方法所必需的、足以进行一种方法的或可用于进行一种方法的一种或多种试剂的试剂盒。还提供了含有所述试剂的反应混合物。还提供了含有多种试剂的预混液试剂集合,所述多种试剂可添加至彼此中和/或添加至测试样品中以完成反应混合物。
适合于这些测定技术的用于分离DNA的方法为本领域中已知的。具体地说,一些实施方案包括如美国专利申请序列号13/470,251(“Isolation of Nucleic Acids”)中所述分离核酸,所述专利申请以全文引用的方式并入本文中。
可通过任何手段分离基因组DNA,包括使用可商购获得的试剂盒。简单来说,其中所关注的DNA由细胞膜封装,通常通过酶、化学或机械手段将生物样品破坏并且溶解。然后可例如通过用蛋白酶K消化将DNA溶液中的蛋白质和其他污染物清除。然后从溶液回收基因组DNA。这可借助于包括盐析、有机萃取或使DNA结合至固相载体在内的多种方法来进行。方法的选择将受到包括时间、费用以及所需DNA量在内的若干因素的影响。包含赘生物质或赘生前物质的所有临床样品类型都适合用于本发明方法中,例如细胞系、组织学切片、活组织切片、石蜡包埋的组织、体液、粪便、结肠排出物、尿液、血浆、血清、全血、分离的血细胞、从血液分离的细胞以及它们的组合。
所述技术在用于制备样品和提供用于测试的核酸的方法方面不受限制。举例来说,在一些实施方案中,使用直接基因捕获(例如如美国专利申请序列号61/485386中详细描述)或通过相关方法从粪便样品或从血液或从血浆样品分离DNA。
所述技术涉及对可能与肺癌相关或可经过检验以确定肺癌不存在的任何样品进行分析。举例来说,在一些实施方案中,样品包括从患者获得的组织和/或生物流体。在一些实施方案中,样品包括分泌物。在一些实施方案中,样品包括痰液、血液、血清、血浆、胃分泌物、肺组织样品、肺细胞或从粪便回收的肺DNA。在一些实施方案中,受试者为人。此类样品可通过任何数目的本领域中已知的手段(诸如对熟练人员来说将显而易见的手段)来获得。
A.用于检测肺癌的甲基化测定
通过所选肺癌病例和肺对照组织的无偏全甲基化组测序来鉴定候选甲基化DNA标记物。在255个独立患者以及119个对照中对顶部标记物候选物进一步评估,其中37个来自良性结节,并且136个病例包括所有肺癌亚型。对从患者组织样品提取的DNA进行亚硫酸氢盐处理,然后通过定量等位基因特异性实时靶标和信号扩增(QuARTS扩增)对候选标记物和作为标准化基因的β-肌动蛋白(ACTB)进行测定。QuARTS测定化学在甲基化标记物选择和筛查中产生高辨别力。
基于单独标记物候选物的接受者操作特征分析,曲线下面积(AUC)从0.512变到0.941。在100%特异性下,在所有肺癌亚型中,组合的8甲基化标记物组(SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.12.526、HOXB2以及EMX1)产生98.5%的敏感度。此外,使用8标记物组,良性肺结节未产生假阳性。
B.甲基化检测测定和试剂盒
本文所述的标记物可用于多种甲基化检测测定中。最常使用的用于针对5-甲基胞嘧啶的存在对核酸进行分析的方法是基于由Frommer等描述的用于检测DNA中的5-甲基胞嘧啶的亚硫酸氢盐法(Frommer等(1992)Proc.Natl.Acad.Sci.USA 89:1827-31,所述参考文献出于所有目的明确地以全文引用的方式并入本文中)或其变化型式。映射5-甲基胞嘧啶的亚硫酸氢盐法是基于以下观察:胞嘧啶而非5-甲基胞嘧啶与酸式亚硫酸根离子(也称为亚硫酸氢盐)反应。反应通常根据以下步骤进行:首先,胞嘧啶与酸式亚硫酸盐反应以形成磺化胞嘧啶。接下来,磺化反应中间物的自发脱氨基作用产生磺化尿嘧啶。最后,磺化尿嘧啶在碱性条件下脱磺化以形成尿嘧啶。检测为可能的,因为尿嘧啶与腺嘌呤碱基配对(因此表现得像胸腺嘧啶),而5-甲基胞嘧啶与鸟嘌呤碱基配对(因此表现得像胞嘧啶)。这使得可通过例如亚硫酸氢盐基因组测序(Grigg G和Clark S,Bioessays(1994)16:431-36;Grigg G,DNA Seq.(1996)6:189-98)、如例如美国专利号5,786,146中所公开的甲基化特异性PCR(MSP)或使用包括序列特异性探针裂解的测定(例如QuARTS活瓣核酸内切酶测定,参见例如Zou等(2010)“Sensitive quantification of methylated markers with a novelmethylation specific technology”Clin Chem 56:A199;以及美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392)来辨别甲基化胞嘧啶与非甲基化胞嘧啶。
一些常规技术与包括将所要分析的DNA包围在琼脂糖基质中从而防止DNA扩散和复性(亚硫酸氢盐仅与单链DNA反应),以及用快速渗析代替沉淀和纯化步骤(Olek A等(1996)“A modified and improved method for bisulfite based cytosinemethylation analysis”Nucleic Acids Res.24:5064-6)的方法有关。因此,可分析单独细胞的甲基化状态,从而说明方法的效用和敏感度。Rein,T.等(1998)Nucleic AcidsRes.26:2255提供了用于检测5-甲基胞嘧啶的常规方法的综述。
亚硫酸氢盐技术典型地涉及在亚硫酸氢盐处理之后扩增已知核酸的短特异性片段,然后通过测序(Olek和Walter(1997)Nat.Genet.17:275-6)或引物延伸反应(Gonzalgo和Jones(1997)Nucleic Acids Res.25:2529-31;WO 95/00669;美国专利号6,251,594)对产物进行测定从而分析单独胞嘧啶位置。一些方法使用酶促消化(Xiong和Laird(1997)Nucleic Acids Res.25:2532-4)。本领域中还描述了通过杂交进行检测(Olek等,WO 99/28498)。另外,已描述关于单独基因使用亚硫酸氢盐技术进行甲基化检测(Grigg和Clark(1994)Bioessays 16:431-6;Zeschnigk等(1997)Hum Mol Genet.6:387-95;Feil等(1994)Nucleic Acids Res.22:695;Martin等(1995)Gene 157:261-4;WO 9746705;WO 9515373)。
可根据本发明技术将各种甲基化测定程序与亚硫酸氢盐处理结合使用。这些测定允许测定核酸序列内一个或多个CpG二核苷酸(例如CpG岛)的甲基化状态。此类测定涉及对亚硫酸氢盐处理的核酸进行测序、PCR(用于序列特异性扩增)、DNA印迹分析以及使用甲基化特异性限制酶(例如甲基化敏感性或甲基化依赖性酶)以及其他技术。
举例来说,通过使用亚硫酸氢盐处理已简化用于分析甲基化模式和5-甲基胞嘧啶分布的基因组测序(Frommer等(1992)Proc.Natl.Acad.Sci.USA 89:1827-1831)。另外,例如如Sadri和Hornsby(1997)Nucl.Acids Res.24:5058-5059所描述或如称为COBRA(组合亚硫酸氢盐限制分析)的方法(Xiong和Laird(1997)Nucleic Acids Res.25:2532-2534)中所体现,从亚硫酸氢盐转化的DNA扩增的PCR产物的限制酶消化可用于评估甲基化状态。
COBRATM分析为可用于确定少量基因组DNA中特定基因座处的DNA甲基化水平的定量甲基化测定(Xiong和Laird,Nucleic Acids Res.25:2532-2534,1997)。简单来说,使用限制酶消化来揭示亚硫酸氢钠处理的DNA的PCR产物中的甲基化依赖性序列差异。根据Frommer等(Proc.Natl.Acad.Sci.USA 89:1827-1831,1992)所描述的程序首次通过标准亚硫酸氢盐处理将甲基化依赖性序列差异引入基因组DNA中。然后使用对所关注的CpG岛具特异性的引物对亚硫酸氢盐转化的DNA进行PCR扩增,随后进行限制性内切核酸酶消化、凝胶电泳并且使用特异性的经过标记的杂交探针进行检测。原始DNA样品中的甲基化水平由在大范围DNA甲基化水平上线性定量的消化和未消化的PCR产物的相对量表示。此外,此技术可可靠地适用于从显微解剖的石蜡包埋组织样品获得的DNA。
用于COBRATM分析的典型试剂(例如如在典型COBRATM基试剂盒中可找到)可包括但不限于:用于特定基因座(例如特定基因、标记物、基因区域、标记物区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;限制酶和适当的缓冲液;基因杂交寡核苷酸;对照杂交寡核苷酸;用于寡核苷酸探针的激酶标记试剂盒;以及标记的核苷酸。另外,亚硫酸氢盐转化试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如沉淀、超滤、亲和柱);脱磺化缓冲液;以及DNA回收组分。
将诸如“MethyLightTM”(基于荧光的实时PCR技术)(Eads等,Cancer Res.59:2302-2306,1999)、Ms-SNuPETM(甲基化敏感性单核苷酸引物延伸)反应(Gonzalgo和Jones,Nucleic Acids Res.25:2529-2531,1997)、甲基化特异性PCR(“MSP”;Herman等,Proc.Natl.Acad.Sci.USA 93:9821-9826,1996;美国专利号5,786,146)以及甲基化CpG岛扩增(“MCA”;Toyota等,Cancer Res.59:2307-12,1999)等测定单独或与这些方法中的一者或多者组合使用。
“HeavyMethylTM”测定技术为一种用于基于亚硫酸氢盐处理的DNA的甲基化特异性扩增来评估甲基化差异的定量方法。覆盖扩增引物之间的CpG位置或被扩增引物覆盖的甲基化特异性阻断探针(“阻断剂”)能够实现核酸样品的甲基化特异性选择性扩增。
术语“HeavyMethylTM MethyLightTM”测定是指一种HeavyMethylTM MethyLightTM测定,所述测定为MethyLightTM测定的变化型式,其中MethyLightTM测定与涵盖扩增引物之间的CpG位置的甲基化特异性阻断探针组合。还可将HeavyMethylTM测定与甲基化特异性扩增引物组合使用。
用于HeavyMethylTM分析的典型试剂(例如如在典型MethyLightTM基试剂盒中可找到)可包括但不限于:用于特定基因座(例如特定基因、标记物、基因区域、标记物区域、亚硫酸氢盐处理的DNA序列、CpG岛或亚硫酸氢盐处理的DNA序列或CpG岛等)的PCR引物;阻断寡核苷酸;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
MSP(甲基化特异性PCR)允许评估实际上CpG岛内的任何CpG位点组的甲基化状态,与甲基化特异性限制酶的使用无关(Herman等Proc.Natl.Acad.Sci.USA 93:9821-9826,1996;美国专利号5,786,146)。简单来说,用亚硫酸氢钠修饰DNA,亚硫酸氢钠将未甲基化而非甲基化的胞嘧啶转化为尿嘧啶,并且随后用相较于未甲基化DNA对甲基化DNA具特异性的引物将产物扩增。MSP仅需要少量DNA,对给定CpG岛基因座的0.1%甲基化等位基因为敏感的,并且可对从石蜡包埋的样品提取的DNA进行。用于MSP分析的典型试剂(例如如在典型MSP基试剂盒中可找到)可包括但不限于:用于特定基因座(例如特定基因、标记物、基因区域、标记物区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的甲基化和未甲基化的PCR引物;优化的PCR缓冲液和脱氧核苷酸以及特异性探针。
MethyLightTM测定为一种高通量定量甲基化测定,所述高通量定量甲基化分析利用基于荧光的实时PCR(例如
Figure BDA0003617936540000891
),基于荧光的实时PCR在PCR步骤之后不再需要操纵(Eads等,Cancer Res.59:2302-2306,1999)。简单来说,MethyLightTM方法从基因组DNA的混合样品开始,所述混合样品在亚硫酸氢钠反应中根据标准程序转化为具有甲基化依赖性序列差异的混合汇集物(亚硫酸氢盐制程将未甲基化的胞嘧啶残基转化为尿嘧啶)。然后在“有偏”反应中例如使用与已知CpG二核苷酸重叠的PCR引物进行基于荧光的PCR。在扩增过程的水平上与荧光检测过程的水平上发生序列辨别。
使用MethyLightTM测定作为对核酸(例如基因组DNA样品)中的甲基化模式的定量测试,其中在探针杂交的水平上发生序列辨别。在定量型式中,在存在与特定推定甲基化位点重叠的荧光探针的情况下,PCR反应提供甲基化特异性扩增。引物与探针都不覆盖任何CpG二核苷酸的反应提供对输入DNA的量的无偏控制。或者,通过用不涵盖已知甲基化位点的对照寡核苷酸(例如HeavyMethylTM和MSP技术的基于荧光的型式)或用涵盖潜在甲基化位点的寡核苷酸探测有偏PCR汇集物来实现基因组甲基化的定性测试。
MethyLightTM方法与任何合适探针(例如
Figure BDA0003617936540000901
探针、
Figure BDA0003617936540000902
探针等)一起使用。举例来说,在一些应用中,将双链基因组DNA用亚硫酸氢钠处理并且使用
Figure BDA0003617936540000903
探针(例如使用MSP引物和/或HeavyMethyl阻断剂寡核苷酸以及
Figure BDA0003617936540000904
探针)进行两组PCR反应中的一者。
Figure BDA0003617936540000905
探针为用荧光“报告”和“淬灭”分子双重标记的并且经过设计对相对高GC含量区域具特异性,使得它在PCR循环中在比正向或反向引物高约10℃的温度下解链。这使得
Figure BDA0003617936540000906
探针在PCR退火/延伸步骤期间保持完全杂交。随着Taq聚合酶在PCR期间酶促合成新的链,它将最终到达退火的
Figure BDA0003617936540000907
探针。然后Taq聚合酶5'至3'核酸内切酶活性将通过对
Figure BDA0003617936540000908
探针进行消化而取代
Figure BDA0003617936540000909
探针以释放荧光报告分子,以便使用实时荧光检测系统定量检测其此时未淬灭的信号。
用于MethyLightTM分析的典型试剂(例如如在典型MethyLightTM基试剂盒中可找到)可包括但不限于:用于特定基因座(例如特定基因、标记物、基因区域、标记物区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;
Figure BDA0003617936540000911
Figure BDA0003617936540000912
探针;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
QMTM(定量甲基化)测定为一种基因组DNA样品中的甲基化模式的替代定量测试,其中在探针杂交的水平上发生序列辨别。在此定量型式中,在存在与特定推定甲基化位点重叠的荧光探针的情况下,PCR反应提供无偏扩增。引物与探针都不覆盖任何CpG二核苷酸的反应提供对输入DNA的量的无偏控制。或者,通过用不涵盖已知甲基化位点的对照寡核苷酸(HeavyMethylTM和MSP技术的基于荧光的型式)或用涵盖潜在甲基化位点的寡核苷酸探测有偏PCR汇集物来实现基因组甲基化的定性测试。
QMTM方法可在扩增过程中与任何合适的探针一起使用,例如
Figure BDA0003617936540000913
探针、
Figure BDA0003617936540000914
探针。举例来说,将双链基因组DNA用亚硫酸氢钠处理并且经受无偏引物和
Figure BDA0003617936540000915
探针处理。
Figure BDA0003617936540000916
探针为用荧光“报告”和“淬灭”分子双重标记的,并且经过设计对相对高GC含量区域具特异性,使得它在PCR循环中在比正向或反向引物高约10℃的温度下解链。这使得
Figure BDA0003617936540000917
探针在PCR退火/延伸步骤期间保持完全杂交。随着Taq聚合酶在PCR期间酶促合成新的链,它将最终到达退火的
Figure BDA0003617936540000918
探针。然后Taq聚合酶5'至3'核酸内切酶活性将通过对
Figure BDA0003617936540000919
探针进行消化而取代
Figure BDA00036179365400009110
探针以释放荧光报告分子,以便使用实时荧光检测系统定量检测其此时未淬灭的信号。用于QMTM分析的典型试剂(例如如在典型QMTM基试剂盒中可找到)可包括但不限于:用于特定基因座(例如特定基因、标记物、基因区域、标记物区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;
Figure BDA00036179365400009111
Figure BDA00036179365400009112
探针;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
Ms-SNuPETM技术为一种用于基于DNA的亚硫酸氢盐处理继之以单核苷酸引物延伸来评估特定CpG位点处的甲基化差异的定量方法(Gonzalgo和Jones,Nucleic AcidsRes.25:2529-2531,1997)。简单来说,将基因组DNA与亚硫酸氢钠反应以将未甲基化的胞嘧啶转化为尿嘧啶,同时留下5-甲基胞嘧啶不变。然后使用对亚硫酸氢盐转化的DNA具特异性的PCR引物进行所需靶序列的扩增,并且分离所得产物并且用作用于所关注的CpG位点处的甲基化分析的模板。可对少量DNA进行分析(例如显微解剖的病变部分)并且它避免使用限制酶来确定CpG位点处的甲基化状态。
用于Ms-SNuPETM分析的典型试剂(例如如在典型Ms-SNuPETM基试剂盒中可找到)可包括但不限于:用于特定基因座(例如特定基因、标记物、基因区域、标记物区域、亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;用于特定基因座的Ms-SNuPETM引物;反应缓冲液(用于Ms-SNuPE反应);以及标记的核苷酸。另外,亚硫酸氢盐转化试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如沉淀、超滤、亲和柱);脱磺化缓冲液;以及DNA回收组分。
简化代表性亚硫酸氢盐测序(RRBS)从核酸的亚硫酸氢盐处理开始以将所有未甲基化的胞嘧啶转化为尿嘧啶,随后为限制酶消化(例如通过识别包括CG序列的位点的酶,诸如MspI)并且在偶联至衔接子配位体之后进行片段的完全测序。限制酶的选择针对CpG密集区域富集片段,从而减少在分析期间可映射至多个基因位置的冗余序列的数目。因而,RRBS通过选择用于测序的限制片段的子集(例如通过使用制备型凝胶电泳进行尺寸选择)来降低核酸样品的复杂性。与全基因组亚硫酸氢盐测序相反,由限制酶消化产生的每个片段含有至少一个CpG二核苷酸的DNA甲基化信息。因而,RRBS针对启动子、CpG岛以及其他基因组特征富集在这些区域中具有高频率的限制酶切位点的样品,并且因此提供了用于评估一个或多个基因组基因座的甲基化状态的测定。
用于RRBS的典型方案包括以下步骤:用诸如MspI等限制酶消化核酸样品、填充短悬端和A-尾部、连接衔接子、亚硫酸氢盐转化以及PCR。参见例如等(2005)“Genome-scaleDNA methylation mapping of clinical samples at single-nucleotide resolution”Nat Methods 7:133-6;Meissner等(2005)“Reduced representation bisulfitesequencing for comparative high-resolution DNA methylation analysis”NucleicAcids Res.33:5868-77。
在一些实施方案中,使用定量等位基因特异性实时靶标和信号扩增(QuARTS)测定来评估甲基化状态。在各个QuARTS测定中依序发生三个反应,包括扩增(反应1)和初级反应中的靶探针裂解(反应2);以及次级反应中的FRET裂解和荧光信号产生(反应3)。当使用特异性引物扩增目标核酸时,带有活瓣序列的特异性检测探针松散地结合至扩增子。靶标结合位点处存在特定侵入性寡核苷酸通过在检测探针与活瓣序列之间切割使得5′核酸酶(例如FEN-1核酸内切酶)释放活瓣序列。活瓣序列与对应FRET盒的非发夹部分互补。因此,活瓣序列充当FRET盒上的侵入性寡核苷酸并且在FRET盒荧光团与淬灭剂之间实现裂解,这产生荧光信号。裂解反应可切割每个靶标的多个探针并且因此释放每个活瓣的多个荧光团,从而提供指数信号扩增。QuARTS可通过使用具有不同染料的FRET盒检测单个反应孔中的多个靶标。参见例如Zou等(2010)“Sensitive quantification of methylated markers witha novel methylation specific technology”Clin Chem 56:A199)以及美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392,所述参考文献各自出于所有目的以引用的方式并入本文中。
在一些实施方案中,在定量之前将亚硫酸氢盐处理的DNA纯化。这可通过本领域中已知的任何手段来进行,诸如但不限于超滤,例如借助于MicroconTM柱(由MilliporeTM制造)。根据改良的制造商方案进行纯化(参见例如PCT/EP2004/011715,所述专利以全文引用的方式并入本文中)。在一些实施方案中,亚硫酸氢盐处理的DNA结合至固体载体,例如磁性珠粒,并且在DNA结合至载体的同时进行脱磺化和洗涤。例如WO 2013/116375和美国专利号9,315,853以及美国专利申请序列号63/058,179中提供了此类实施方案的实例,所述专利各自以全文引用的方式并入本文中。在某些优选实施方案中,载体结合的DNA在于载体上脱磺化和洗涤之后立即准备用于甲基化测定。在一些实施方案中,在测定之前将脱磺化的DNA从载体洗脱。
在一些实施方案中,使用根据本发明的引物寡核苷酸的集合(例如参见图5)和扩增酶将经过处理的DNA的片段扩增。若干DNA区段的扩增可在同一个反应容器中同时进行。典型地,使用聚合酶链反应(PCR)进行扩增。
用于分离适合于这些测定技术的DNA的方法为本领域中已知的。具体地说,一些实施方案包括如美国专利号9,000,146;9,163,278;以及10,704,081中所述分离核酸,所述专利各自以全文引用的方式并入本文中。
在一些实施方案中,本文所述的标记物可用于对粪便样品进行的QUARTS测定。在一些实施方案中,提供了用于产生DNA样品的方法以及具体地说用于产生包含小体积(例如小于100、小于60微升)的高度纯化的低丰度核酸并且基本上和/或事实上不含抑制用于测试DNA样品的测定(例如PCR、INVADER、QuARTS测定等)的物质的DNA样品的方法。此类DNA样品可用于诊断测定,所述诊断分析定性检测存在于取自患者的样品中的基因、基因变体(例如等位基因)或基因修饰(例如甲基化)的存在,或定量测量其活性、表达或量。举例来说,一些癌症与特定突变体等位基因或特定甲基化状态的存在相关,并且因此检测和/或定量此类突变体等位基因或甲基化状态在癌症的诊断和治疗中具有预示价值。
许多有价值的基因标记物以极低量存在于样品中并且许多产生此类标记物的事件为罕见的。因此,甚至诸如PCR等敏感检测方法也需要大量DNA以提供足以满足或取代测定的检测阈值的低丰度靶标。此外,甚至低量的抑制物质的存在也会损害这些测定关于检测此类低量的靶标的准确性和精确性。因此,本文提供了提供必要的体积和浓度管理以产生此类DNA样品的方法。
在一些实施方案中,样品包括血液、血清、血浆或唾液。在一些实施方案中,受试者为人。此类样品可通过任何数目的本领域中已知的手段(诸如对熟练人员来说将显而易见的手段)来获得。可通过使样品经受本领域技术人员已知的各种技术来获得无细胞或基本上无细胞的样品,所述技术包括但不限于离心和过滤。虽然通常优选不使用侵入性技术来获得样品,但获得诸如组织匀浆、组织切片以及活组织切片试样等样品仍可能为优选的。所述技术在用于制备样品和提供用于测试的核酸的方法方面不受限制。举例来说,在一些实施方案中,使用例如如美国专利号8,808,990和9,169,511以及WO 2012/155072中详细描述的直接基因捕获或通过相关方法从粪便样品或从血液或从血浆样品分离DNA。
标记物的分析可单独地或与一个测试样品内的额外标记物同时进行。举例来说,可将若干标记物合并至一个测试中,以便有效处理多个样品并且潜在地提供更大的诊断和/或预后准确性。此外,本领域技术人员将认识到测试来自相同受试者的多个样品(例如在连续时间点)的价值。系统样品的此类测试可允许鉴定标记物甲基化状态随时间推移的变化。甲基化状态改变和甲基化状态不变都可提供关于疾病状态的有用信息,所述有用信息包括但不限于鉴定距离事件发作的大致时间、可救治组织的存在和量、药物疗法的适当性、各种疗法的有效性,以及受试者的结果(包括将来事件的风险)的鉴定。
生物标记物的分析可以多种物理模式进行。举例来说,可使用微量滴定板或自动化来促进大量测试样品的加工。或者,可开发单样品模式以便于例如在非卧床运输或急诊室环境中及时地进行立即治疗和诊断。
所述技术的实施方案预期以试剂盒的形式提供。试剂盒包括本文所述的组合物、装置、设备等的实施方案,以及试剂盒的使用说明书。此类说明书描述了用于从样品制备分析物,例如用于收集样品并且从样品制备核酸的适当方法。试剂盒的单独组分包装在适当的容器和包装(例如小瓶、盒子、泡罩包装、安瓿、罐、瓶、管等)中,并且将组分一起包装在适当的容器(例如一个或多个盒子)中以方便储存、装运和/或由试剂盒的使用者使用。应了解,液体组分(例如缓冲液)可以将由使用者复原的冻干形式提供。试剂盒可包括用于评估、验证和/或确保试剂盒性能的对照或参考。举例来说,用于测定存在于样品中的核酸的量的试剂盒可包括包含用于比较的已知浓度的相同核酸或另一核酸的对照,并且在一些实施方案中,包括对对照核酸具特异性的检测试剂(例如引物)。试剂盒适合于在临床环境中使用,并且在一些实施方案中,适合使用者在家中使用。在一些实施方案中,试剂盒的组分使得系统能够从样品制备核酸溶液。在一些实施方案中,系统的某些组分由使用者提供。
III.应用
在一些实施方案中,诊断测定鉴定个体中疾病或疾患的存在。在一些实施方案中,疾病为癌症(例如肺癌)。
在一些实施方案中,使用异常甲基化与肺癌相关的标记物(例如选自表1中所列的标记物或优选以下中的一者或多者的一种或多种标记物:EMX1、GRIND2、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329)。在一些实施方案中,测定还包括检测参考基因(例如β-肌动蛋白、ZDHHC1、B3GALT6。参见例如美国专利号10,465,248和WO 2018/017740,所述专利各自出于所有目的以引用的方式并入本文中)。
在一些实施方案中,使用异常表达与肺癌相关的标记物(优选为表3中所列的一种或多种标记物:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1),并且通过测量样品中RNA(例如mRNA)或蛋白质中的一者或多者来进行检测。在一些实施方案中,测定还包括检测参考基因(例如如表3中所示)。
在一些实施方案中,所述技术在治疗患者(例如患有肺癌、患有早期阶段肺癌或可能发展肺癌的患者)中获得应用,所述方法包括确定如本文所提供的一种或多种标记物的甲基化状态以及基于确定甲基化状态的结果对患者施以治疗。治疗可为施用药物化合物、疫苗、进行手术、对患者进行成像、进行另一测试。优选地,所述用途为在临床筛查的方法、预后评估的方法、监测治疗结果的方法、用于鉴定最可能对特定治疗性治疗作出反应的患者的方法、对患者或受试者进行成像的方法以及用于药物筛选和开发的方法中使用。
在一些实施方案中,提供了技术在用于在受试者中诊断肺癌的方法中获得应用。如本文所用的术语“诊断(diagnosing/diagnosis)”是指使得熟练技工可估计并且甚至确定受试者是否罹患给定疾病或疾患或将来可能发展给定疾病或疾患的方法。熟练技工常常基于一种或多种诊断指示物(诸如生物标记物)作出诊断,所述一种或多种诊断指示物的甲基化状态指示疾患的存在、严重程度或不存在。
与诊断一起,临床癌症预后涉及确定癌症的侵袭性以及肿瘤复发的可能性从而计划最有效的疗法。如果可进行更准确的预后或甚至可评估发展癌症的潜在风险,那么可选择适当的疗法,并且在一些情况下可选择对患者来说不太严格的疗法。癌症生物标记物的评估(例如确定甲基化状态)可用于将具有良好预后和/或发展癌症的风险低并且将不需要治疗或需要有限治疗的受试者与更可能发展癌症或遭受癌症复发并且可受益于更强的治疗的受试者分开。
因而,如本文所用,“作出诊断”或“诊断”还包括确定发展癌症的风险或确定预后,这可基于本文所公开的诊断生物标记物的测量用于预测临床结果(在存在或不存在医学治疗的情况下)、选择适当的治疗(或治疗是否将有效)或监测当前治疗以及可能改变治疗。
另外,在所述技术的一些实施方案中,可随时间推移对生物标记物进行多次测定以促进诊断和/或预后。可使用生物标记物的时间变化来预测临床结果,监测肺癌进展和/或监测适当疗法针对癌症的功效。在此类实施方案中,举例来说,可预期在有效治疗过程期间随时间推移在生物样品中观察到本文所公开的一种或多种生物标记物(以及潜在地一种或多种额外生物标记物(如果监测))的甲基化状态的改变。
所述技术还在用于确定是否在受试者中开始或继续癌症的预防或治疗的方法中获得应用。在一些实施方案中,所述方法包括提供在一段时间内来自受试者的一系列生物样品;对所述一系列生物样品进行分析以确定各个生物样品中本文所公开的至少一种生物标记物的甲基化状态;以及将各个生物样品中生物标记物中的一者或多者的甲基化状态的任何可测量的变化进行比较。可使用在所述时间段内生物标记物的甲基化状态的任何变化来预测发展癌症的风险、预测临床结果、确定是否开始或继续癌症的预防或治疗以及当前疗法是否有效治疗癌症。举例来说,可将第一时间点选择在开始治疗之前并且可将第二时间点选择在开始治疗之后的某个时间。可在取自不同时间点的各个样品中对甲基化状态进行测量并且记录定性和/或定量差异。不同样品的生物标记物水平的甲基化状态的变化可与发展肺癌的风险、预后、确定治疗功效和/或受试者中的癌症进展相关联。
在优选实施方案中,将本发明的方法和组合物用于在早期阶段,例如在疾病的症状出现之前治疗或诊断疾病。在一些实施方案中,将本发明的方法和组合物用于在临床阶段治疗或诊断疾病。
如上文所提到,在一些实施方案中,可对一种或多种诊断或预后生物标记物进行多次测定,并且可使用标记物的时间变化来确定诊断或预后。举例来说,可在初始时间测定诊断标记物,并且在第二时间再次测定。在此类实施方案中,标记物从初始时间到第二时间有所增加可诊断癌症的特定类型或其严重程度,或给定预后。同样地,标记物从初始时间到第二时间有所降低可指示癌症的特定类型或其严重程度,或给定预后。此外,一种或多种标记物改变的程度可与癌症的严重程度以及将来的有害事件有关。熟练技工将理解,虽然在某些实施方案中,比较测量可由多个时间点的相同生物标记物构成,但还可测量一个时间点的给定生物标记物以及第二时间点的第二生物标记物,并且这些标记物的比较可提供诊断信息。
如本文所用,短语“确定预后”是指使得熟练技工可预测受试者中疾患的过程或结果的方法。术语“预后”不是指以100%准确性预测疾患的过程或结果的能力,或者甚至不是指基于生物标记物的甲基化状态给定过程或结果可预见地或多或少可能发生。替代地,熟练技工将理解,术语“预后”是指某一过程或结果将发生的可能性增加;换句话说,是指当与未展现给定条件的那些个体相比时,在展现所述条件的受试者中一种过程或结果更可能发生。举例来说,在未展现所述条件的个体中,给定结果(例如罹患肺癌)的几率可能非常低。
在一些实施方案中,统计分析使预后指示物与有害结果的倾向相关联。举例来说,在一些实施方案中,如由一定水平的统计显著性所确定,从未患癌症的患者获得的不同于正常对照样品中的甲基化状态可指示受试者与水平更类似于对照样品中的甲基化状态的受试者相比更可能罹患癌症。另外,甲基化状态相较于基线(例如“正常”)水平的变化可反映受试者预后,并且甲基化状态的变化程度可与有害事件的严重程度有关。常常通过比较两个或更多个群体并且确定置信区间和/或p值来确定统计显著性。参见例如Dowdy和Wearden,Statistics for Research,John Wiley&Sons,New York,1983,所述参考文献以全文引用的方式并入本文中。本发明主题的示例性置信区间为90%、95%、97.5%、98%、99%、99.5%、99.9%以及99.99%,同时示例性p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001以及0.0001。
在其他实施方案中,可建立本文所公开的预后或诊断生物标记物的甲基化状态的阈值变化程度,并且将生物样品中生物标记物的甲基化状态的变化程度简单地与甲基化状态的阈值变化程度相比较。本文提供的生物标记物的甲基化状态的优选阈值变化为约5%、约10%、约15%、约20%、约25%、约30%、约50%、约75%、约100%以及约150%。在其他实施方案中,可建立“列线图”,通过列线图预后或诊断指示物(生物标记物或生物标记物的组合)的甲基化状态直接与朝向给定结果的相关倾向相关联。熟练技工熟悉此类列线图用于使两个数值相关联的用途,并且理解此测量中的不确定性与标记物浓度中的不确定性相同,因为参考的是单独样品测量,而非群体平均值。
在一些实施方案中,将对照样品与生物样品同时进行分析,使得从生物样品获得的结果可与从对照样品获得的结果进行比较。另外,预期可提供标准曲线,使用标准曲线可比较生物样品的测定结果。此类标准曲线呈现生物标记物的甲基化状态随测定单位(例如如果使用荧光标记,那么为荧光信号强度)的变化。使用取自多个供体的样品,标准曲线可提供正常组织中一种或多种生物标记物的对照甲基化状态,以及取自患有肺癌的供体的组织中一种或多种生物标记物的“处于风险中”的水平。
标记物的分析可单独地或与一个测试样品内的额外标记物同时进行。举例来说,可将若干标记物合并在一个测试中以便有效处理多个样品并且潜在地提供更大的诊断和/或预后准确性。此外,本领域技术人员将认识到测试来自相同受试者的多个样品(例如在连续时间点)的价值。系统样品的此类测试可允许鉴定标记物甲基化状态随时间推移的变化。甲基化状态改变和甲基化状态不变都可提供关于疾病状态的有用信息,所述有用信息包括但不限于鉴定距离事件发作的大致时间、可救治组织的存在和量、药物疗法的适当性、各种疗法的有效性,以及受试者的结果(包括将来事件的风险)的鉴定。
生物标记物的分析可以多种物理模式进行。举例来说,可使用微量滴定板或自动化来促进大量测试样品的加工。或者,可开发单样品模式以便于例如在非卧床运输或急诊室环境中及时地进行立即治疗和诊断。
在一些实施方案中,如果当与对照甲基化状态相比时,存在样品中至少一种生物标记物的可测量甲基化状态差异,那么将受试者诊断为患有肺癌。相反地,当在生物样品中未鉴定出甲基化状态变化时,可将受试者鉴定为未患肺癌、不处于癌症风险中或具有低癌症风险。在此方面,可将患有肺癌或具有其风险的受试者与具有较低至基本上没有癌症或其风险的受试者区别开。可将具有发展肺癌的风险的那些受试者列入更集中的和/或定期的筛查计划中。另一方面,具有较低至基本上没有风险的那些受试者可避免接受筛查程序,直至将来的筛查(例如根据本发明技术进行的筛查)指示那些患者中已经出现肺癌风险为止。
如上文所提到,根据本发明技术的方法的实施方案,检测一种或多种生物标记物的甲基化状态的变化可为定性测定或者它可为定量测定。因而,将受试者诊断为患有肺癌或处于发展肺癌的风险中的步骤表明实现了某些阈值测量,例如生物样品中一种或多种生物标记物的甲基化状态不同于预定对照甲基化状态。在方法的一些实施方案中,对照甲基化状态为生物标记物的任何可检测的甲基化状态。在将对照样品与生物样品同时进行测试的方法的其他实施方案中,预定甲基化状态为对照样品中的甲基化状态。在方法的其他实施方案中,预定甲基化状态是基于标准曲线和/或通过标准曲线鉴定。在方法的其他实施方案中,预定甲基化状态为特定状态或状态范围。因而,预定甲基化状态可部分基于所实践方法的实施方案以及所需特异性等在对本领域技术人员来说将显而易见的可接受限值内加以选择。
在一些实施方案中,使用一种或多种甲基化标记物以及合适的分析方法对来自患有或疑似患有肺癌的受试者的样品进行筛查,所述合适的测定方法提供将不同类型的肺癌,例如非小细胞(腺癌、大细胞癌、鳞状细胞癌)与小细胞癌区分开的数据。参见例如标记物参考编号AC27(图2;PLEC),所述标记物在腺癌和小细胞癌中为高度甲基化的(如平均甲基化与正常血沉棕黄层中所述基因座处的平均甲基化相比所示),但在大细胞或鳞状细胞癌中不为甲基化的;标记物参考编号AC23(图1;ITPRIPL1),所述标记物在腺癌中与任何其他样品类型中相比为更高度甲基化的;标记物参考编号LC2(图2;DOCK2)),所述标记物在大细胞癌中与任何其他样品类型中相比为更高度甲基化的;标记物参考编号SC221(图3;ST8SIA4),所述标记物在小细胞癌中与任何其他样品类型中相比为更高度甲基化的;以及标记物参考编号SQ36(图4,DOK1),所述标记物在鳞状细胞癌中与任何其他样品类型中相比为更高度甲基化的。
如本文所述选择的甲基化标记物可单独或组合(例如以组的形式)使用,使得来自受试者的样品的分析揭示肺赘瘤的存在并且还提供足以区别肺癌类型(例如小细胞癌与非小细胞癌)的信息。在优选实施方案中,标记物或标记物组合还提供足以区别腺癌、大细胞癌以及鳞状细胞癌;和/或足以表征未确定的癌瘤或混合病变的数据。在其他实施方案中,对甲基化标记物或其组合进行选择以在没有分化数据的情况下不管存在何种类型的肺癌均提供阳性结果(例如指示肺赘瘤存在的结果)。
近年来,越来越明显的是在许多患有癌症的患者的血液中可检测到代表转移性肿瘤细胞的循环上皮细胞。在生物和临床研究中对罕见细胞的分子分析为重要的。应用在对癌症患者的外周血中循环上皮细胞(CEpC)进行表征以得到疾病预后和个人化治疗范围内(参见例如Cristofanilli M等(2004)N Engl J Med 351:781-791;Hayes DF等(2006)ClinCancer Res 12:4218-4224;Budd GT等,(2006)Clin Cancer Res12:6403-6409;Moreno JG等(2005)Urology 65:713-718;Pantel等,(2008)Nat Rev 8:329-340;以及Cohen SJ等(2008)J Clin Oncol 26:3213-3221)。因此,本公开的实施方案提供了用于通过鉴定血浆或全血中甲基化标记物的存在来检测受试者中转移性癌症的存在的组合物和方法。
本文还描述了包括多重逆转录和预扩增,随后LQAS PCR-活瓣测定的测定(组合的逆转录和预扩增与LQAS测定称为RT-TELQAS测定(关于“逆转录-靶标富集长探针定量扩增信号”)。在RT-TELQAS测定中,将靶RNA(例如来自样品的总RNA)在RT-预扩增反应中处理,所述RT-预扩增反应含有例如20U的MMLV逆转录酶、1.5U的
Figure BDA0003617936540001031
DNA聚合酶、10mM MOPS缓冲液(pH7.5)、7.5mM MgCl2、250μM各dNTP以及寡核苷酸引物(例如对于12个靶标,12个引物对/24个引物,呈等摩尔量(例如200nM各引物)或呈经过修改以调节不同靶RNA的扩增效率的量,并且在中等温度(例如42℃)下孵育以便进行逆转录,随后进行有限次数的热循环(例如10循环的95℃、63℃、70℃)以提供对应于所包括的引物对的靶序列的预扩增。在热循环之后,如下文所述,将RT-预扩增反应的等分试样(例如10μL)用于LQAS PCR-活瓣测定。适合于在RT-TELQAS和RT-LQAS测定中检测的RNA不限于任何特定类型的RNA靶标。举例来说,可使用下文所述的RT-TELQAS和RT-LQAS方法对来自组织、细胞的各式各样RNA或来自血液的循环无细胞RNA(诸如蛋白质编码信使RNA(mRNA)、微RNA(miRNA)、piRNA、tRNA及其他非编码RNA分子(ncRNA))(参见例如SU Umu等“A comprehensive profile of circulating RNAsin human serum,”RNA Biology 15(2):242-250(2018),所述参考文献以全文引用的方式并入本文中)进行测定。
在优选实施方案中,所述方法在包含PCR-活瓣分析缓冲液的反应混合物中进行,所述PCR-活瓣测定缓冲液与标准PCR缓冲液相比包含相对高的Mg++和低的KCl(例如6-10mM,优选7.5mM Mg++,以及0.0至0.8mM KCl)。典型PCR缓冲液为1.5mM MgCl2、20mM Tris-HCl(pH8)以及50mM KCl,并且PCR-活瓣测定缓冲液包含7.5mM MgCl2、10mM MOPS、0.3mM Tris-HCl(pH 8.0)、0.8mM KCl、0.1μg/μL BSA、0.0001%吐温-20(Tween-20)以及0.0001%IGEPALCA-630。意外地,在下文所述的RT-LQAS和RT-TELQAS方法中,包括RT-LQAS活瓣测定的逆转录以及TELQAS方法的RT-预扩增的所有扩增步骤在相同的PCR-活瓣测定缓冲液中进行。当使用多重预扩增时,可使用相同引物对进行预扩增靶标富集以及定量PCR-活瓣测定,即引物不需要为巢式引物。参见例如美国专利号10,704,081,所述专利以引用的方式并入本文中。
实验实施例
提供以下实施例来说明本发明,但不限制本发明。为了便于理解,提供特定实施方案以帮助解释技术方案,换句话说这些实施方案仅用于说明目的,但不以任何方式限制本发明的范围。除非另外指明,否则未指示特定条件的实施方案是根据常规条件或制造商所建议的条件来进行。
实施例1
用于RNA分离、DNA分离、蛋白质分离的方法。
以下提供用于在分析之前进行RNA分离、DNA分离以及蛋白质样品制备的示例性方法。
从血液中分离RNA
将血液样品收集于适合于后续RNA检测的采血管(例如PAXgene血液RNA管;Qiagen,Inc.)中。可立即对样品进行分析或进行冷冻直到将来测定。通过标准方法(例如Qiasymphony PAXgene血液RNA试剂盒(产品编号:762635))根据制造商的说明书从样品提取RNA。在RT-LQAS中测试之前,可将RNA样品稀释(例如1:50,于10mM Tris-HCl(pH 8.0)、0.1mM EDTA中)。
从细胞和血浆中分离DNA
对于细胞系,可使用例如“
Figure BDA0003617936540001051
RSC ccfDNA血浆试剂盒(Promega Corp.,Madison,WI)从细胞条件培养基分离基因组DNA。在试剂盒方案之后,使用1mL的细胞条件培养基(CCM)代替血浆,并且根据试剂盒程序进行加工。洗脱体积为100μL,其中70μL通常用于亚硫酸氢盐转化。
用于从4mL的血浆样品分离DNA的示例性程序如下:
·向4mL的血浆样品中添加300μL的蛋白酶K(20mg/mL)并且混合。
·将3μL的1μg/μL的鱼DNA添加至血浆-蛋白酶K混合物中。
·将2mL的血浆溶解缓冲液添加至血浆中。
血浆溶解缓冲液为:
-4.3M硫氰酸胍
-10%IGEPAL CA-630(辛基苯氧基聚(亚乙基氧基)乙醇,分支链)
(5.3g的IGEPAL CA-630与45mL的4.8M硫氰酸胍组合)
·在55℃下将混合物孵育1小时,同时在500rpm下振荡。
·添加并且混合:
ο3mL的血浆溶解缓冲液
ο2mL的100%异丙醇
ο200μL磁性二氧化硅结合珠粒(16μg珠粒/μL)
(任选在每次添加之后混合和/或任选在添加至混合物中之前将溶解缓冲液与异丙醇预混合)
·在30℃下孵育30分钟,同时在500rpm下振荡。
·将一个或多个管置于磁体上并且使珠粒聚集。抽吸并且弃去上清液。
·将750μL GuHCl-EtOH添加至含有结合珠粒的容器中并且混合。
GuHCl-EtOH洗涤缓冲液为:
-3M GuHCl(盐酸胍)
-57%EtOH(乙醇)
·在400rpm下振荡1分钟。
·将样品转移至深孔板或2mL微量离心管。
·将管置于磁体上并且使珠粒聚集10分钟。抽吸并且弃去上清液。
·将1000μL洗涤缓冲液(10mM Tris HCl、80%EtOH)添加至珠粒中,并且在振荡的同时在30℃下孵育3分钟。
·将管置于磁体上并且使珠粒聚集。抽吸并且弃去上清液。
·将500μL洗涤缓冲液添加至珠粒中并且在振荡的同时在30℃下孵育3分钟。
·将管置于磁体上并且使珠粒聚集。抽吸并且弃去上清液。
·添加250μL洗涤缓冲液并且在振荡的同时在30℃下孵育3分钟。
·将管置于磁体上并且使珠粒聚集。抽吸并且弃去剩余缓冲液。
·添加250μL洗涤缓冲液并且在振荡的同时在30℃下孵育3分钟。
·将管置于磁体上并且使珠粒聚集。抽吸并且弃去剩余缓冲液。
·将珠粒在70℃下干燥15分钟,同时振荡。
·将125μL洗脱缓冲液(10mM Tris HCl(pH 8.0)、0.1mM EDTA)添加至珠粒中并且在振荡的同时在65℃下孵育25分钟。
·将管置于磁体上并且使珠粒聚集10分钟。
·抽吸并且将含有DNA的上清液转移至新的容器或管中。
亚硫酸氢盐转化
I.使用酸式亚硫酸铵进行DNA的磺化
1.在各个管中,将64μL DNA、7μL 1N NaOH以及9μL的含有0.2mg/mL BSA和0.25mg/mL的鱼DNA的载剂溶液组合。
2.在42℃下孵育20分钟。
3.添加120μL的45%酸式亚硫酸铵并且在66°下孵育75分钟。
4.在4℃下孵育10分钟。
II.使用磁性珠粒进行脱磺化
材料
·磁性珠粒(Promega MagneSil顺磁性粒子,Promega目录编号AS1050,16μg/μL)。
·结合缓冲液:6.5-7M盐酸胍。
·转化后洗涤缓冲液:含10mM Tris HCl(pH 8.0)的80%乙醇。
·脱磺化缓冲液:脱磺化缓冲液选择70%异丙醇、0.1N NaOH。
使用任何适当的装置或技术将样品混合以在实质上如下文所述的温度和混合速度下混合或孵育样品。举例来说,可使用Thermomixer(Eppendorf)来混合或孵育样品。示例性脱磺化如下:
1.用涡流瓶将珠粒储备物充分混合1分钟。
2.将50μL的珠粒等分至2.0mL管(例如来自USA Scientific)中。
3.将750μL的结合缓冲液添加至珠粒中。
4.添加150μL的来自步骤I的磺化DNA。
5.混合(例如1000RPM,30℃,30分钟)。
6.将管置于磁力架上并且放置5分钟。在管保持在架上的情况下,移除并且弃去上清液。
7.添加1,000μL的洗涤缓冲液。混合(例如1000RPM,30℃,3分钟)。
8.将管置于磁力架上并且放置5分钟。在管保持在架上的情况下,移除并且弃去上清液。
9.添加250μL的洗涤缓冲液。混合(例如1000RPM,30℃,3分钟)。
10.将管置于磁力支架上;在1分钟之后移除并且弃去上清液。
11.添加200μL的脱磺化缓冲液。混合(例如1000RPM,30℃,5分钟)。
12.将管置于磁力支架上;在1分钟之后移除并且弃去上清液。
13.添加250μL的洗涤缓冲液。混合(例如1000RPM,30℃,3分钟)。
14.将管置于磁力支架上;在1分钟之后移除并且弃去上清液。
15.将250μL的洗涤缓冲液添加至管中。混合(例如1000RPM,30℃,3分钟)。
16.将管置于磁力支架上;在1分钟之后移除并且弃去上清液。
17.将所有管在打开盖子的情况下在30℃下孵育15分钟。
18.将管从磁力支架移除并且将70μL的洗脱缓冲液直接添加至珠粒中。
19.将珠粒与洗脱-缓冲液一起孵育(例如1000RPM,40℃,45分钟)。
20.将管置于磁力支架上约一分钟;移除并且保存上清液。
然后将转化的DNA用于如下文所述的检测测定,例如预扩增和/或活瓣核酸内切酶测定。
对于亚硫酸氢盐处理的核酸的额外实施方案,另外US 10,704,081和2020年7月29日提交的美国专利申请序列系列号63/058,179,所述专利各自出于所有目的以全文引用的方式并入本文中,并且其可应用于本文所述的技术中。
在一些实施方案中,从来自受试者的不同血液样品分离RNA和DNA。举例来说,可将血液收集于被配置成用于最佳RNA保存和/或分离的第一收集管中以及被配置成用于最佳DNA保存和分离的第二收集管中,并且可从以此方式收集的血液部分提取RNA和DNA。在其他实施方案中,RNA和DNA均使用例如被配置成用于DNA与RNA的最佳保存和分离的收集管(例如来自NORGEN Biotek Corp.的cf-DNA/cf-RNA保存管(产品目录63950),用于无细胞DNA与无细胞RNA的保存和分离)从单个收集的血液样品提取。
在一些实施方案中,将RNA和DNA例如在RT-LQAS/RT-TELQ AS反应中一起测定。在一些实施方案中,将RNA和DNA单独分离和/或例如如上所述用亚硫酸氢盐单独处理,而在一些实施方案中,将RNA和DNA一起加工,例如在亚硫酸氢盐处理和后续纯化期间呈现两者,并且一起添加至测定反应中。
活瓣核酸内切酶测定
QuARTS和LQAS/TELQAS活瓣测定技术将基于聚合酶的靶DNA扩增方法与基于侵入性裂解的信号扩增方法组合。例如美国专利号8,361,720;8,715,937;8,916,344;以及9,212,392中描述了QuARTS技术,并且美国专利10,648,025中描述了使用具有较长靶标特异性区域的探针寡核苷酸(长探针定量扩增信号,“LQAS”)的活瓣测定,所述专利各自出于所有目的以全文引用的方式并入本文中。在本文所述的QuARTS测定中,活瓣寡核苷酸具有12个碱基的靶标特异性区域,而LQAS测定使用具有至少13个碱基的靶标特异性区域的活瓣寡核苷酸,并且使用不同热循环程序来进行扩增。以类似于实时PCR的方式来监测由QuARTS和LQAS反应产生的荧光信号,从而容许定量样品中靶核酸的量。
示例性QuARTS反应典型地包含约200-600nmol/L(例如500nmol/L)的各引物和检测探针、约100nmol/L的侵入性寡核苷酸、约600-700nmol/L的各FRET盒(FAM,例如如商业上由Hologic,Inc.供应;HEX,例如如商业上由BioSearch Technologies供应;以及Quasar670,例如如商业上由BioSearch Technologies供应,并且包含“黑洞”淬灭剂,例如BHQ-1、BHQ-2或BHQ-3,BioSearch Technologies)、6.675ng/μL FEN-1核酸内切酶(例如
Figure BDA0003617936540001113
2.0,Hologic,Inc.)、于30μL反应体积中的1单位Taq DNA聚合酶(例如
Figure BDA0003617936540001114
DNA聚合酶,Promega Corp.,Madison,WI)、10mmol/L 3-(n-吗啉基)丙磺酸(MOPS)、7.5mmol/L MgCl2以及250μmol/L的各dNTP。示例性QuARTS循环条件如下表中所示。在一些应用中,定量循环(Cq)的分析提供样品中靶DNA链的初始数目(例如拷贝数)的测量。
Figure BDA0003617936540001111
示例性LQAS反应典型地包含约200-600nmol/L的各引物、约100nmol/L的侵入性寡核苷酸、约500nmol/L的各活瓣寡核苷酸探针以及FRET盒。LQAS反应可例如经受以下热循环条件:
Figure BDA0003617936540001112
用于QuARTS和LQAS测定的多重靶向预扩增
亚硫酸氢盐转化的DNA的多重靶向预扩增
为从输入样品预扩增大多数或所有亚硫酸氢盐处理的DNA,可将大体积的经过处理的DNA用于单个大体积多重扩增反应中。举例来说,如上所述使用例如Maxwell Promega血液试剂盒#AS1400从细胞系(例如DFCI032细胞系(腺癌);H1755细胞系(神经内分泌)提取DNA。例如如上所述对DNA进行亚硫酸氢盐转化。
预扩增例如在反应混合物中进行,所述反应混合物含有7.5mM MgCl2、10mM MOPS、0.3mM Tris-HCl(pH 8.0)、0.8mM KCl、0.1μg/μL BSA、0.0001%吐温-20、0.0001%IGEPALCA-630、250μM各dNTP、寡核苷酸引物(例如对于12个靶标,12个引物对/24个引物,呈等摩尔量(包括但不限于例如200-500nM各引物的范围),或单独引物浓度经过调节以平衡不同靶区域的扩增效率)、0.025单位/μL热启动GoTaq浓度以及20至50%体积的亚硫酸氢盐处理的靶DNA(例如10μL的靶DNA至50μL反应混合物中,或50μL的靶DNA至125μL反应混合物中)。将热循环时间和温度选择为对反应和扩增容器的体积来说适合。举例来说,反应可如下进行循环:
Figure BDA0003617936540001121
在热循环之后,将预扩增反应的等分试样(例如10μL)在存在或不存在鱼DNA的情况下在10mM Tris、0.1mM EDTA中稀释至500μL。将经过稀释的预扩增DNA的等分试样(例如10μL)用于例如如上所述的QuARTS PCR-活瓣测定。还参见2015年10月30日提交的美国专利申请序列号62/249,097;2016年10月26日提交的申请序列号15/335,096以及2016年10月26日提交的PCT/US16/58875,所述专利各自出于所有目的以全文引用的方式并入本文中。
组合的预扩增和LQAS测定称为TELQAS测定(关于“靶标富集长探针定量扩增信号”)。
使用预扩增样品,如下设置QuARTS和TELQAS反应:
Figure BDA0003617936540001131
*10X寡核苷酸混合物=2μM各引物以及5μM各探针和FRET寡核苷酸
**20X酶混合物含有1单位/μL GoTaq热启动聚合酶(Promega)、292ng/μLCleavase 2.0活瓣核酸内切酶(Hologic)。
如上文所提到,QuARTS测定中的活瓣寡核苷酸具有12个碱基的靶标特异性区域,而LQAS测定使用具有至少13个碱基的靶标特异性区域的活瓣寡核苷酸并且经历不同热循环条件。
QuARTS反应经受以下热循环条件:
Figure BDA0003617936540001132
TELQAS反应经受以下热循环条件:
Figure BDA0003617936540001141
用于RNA检测的LQAS/TELQAS(“RT-LQAS”或“RT-TELQAS”)
示例性RT-LQAS反应含有20U的MMLV逆转录酶(MMLV-RT)、219ng的
Figure BDA0003617936540001143
2.0、1.5U的
Figure BDA0003617936540001144
DNA聚合酶、200nM的各引物、500nM各个探针和FRET寡核苷酸、10mM MOPS缓冲液(pH7.5)、7.5mM MgCl2以及250μM各nNTP。示例性方案如下:
1.将所需要的所需寡核苷酸混合物从-20℃冷冻器移出并且使其解冻。
2.在室温下将对照从-80℃解冻短暂时间,然后置于冰上。
3.在室温下将样品板从-80℃解冻短暂时间,然后置于冰上。
4.在适当尺寸的管中制备用于寡核苷酸混合物的预混液。
5.将MMLV-RT在H2O中1:20进行稀释
Figure BDA0003617936540001142
6.根据板布局使用基质移液管或八通道P20移液管将20μL的预混液移至96孔RT-LQAS板中。
7.加载10μL的样品、对照、校准物(根据板布局)。
8.将板密封并且简单离心。
9.使用以下反应条件在上运行各板
反应典型地在热循环器上运行,所述热循环器被配置成实时(例如连续地,或在一些或所有循环中在相同点)收集荧光数据。举例来说,Roche LightCycler 480仪器或应用生物系统QuantStudioDX实时PCR仪器可在以下条件下使用:
Figure BDA0003617936540001151
在一些实施方案中,如上所述,RT-LQAS测定可包括多重逆转录和预扩增的步骤,例如用于预扩增样品中的2、5、10、12或更多个靶标(或多于1个靶标的任何数目的靶标),并且可称为“RT-TELQAS”。在优选实施方案中,RT-预扩增在反应混合物中进行,所述反应混合物含有例如20U的MMLV逆转录酶、1.5U的
Figure BDA0003617936540001153
DNA聚合酶、10mM MOPS缓冲液(pH7.5)、7.5mM MgCl2、250μM各dNTP以及寡核苷酸引物(例如对于12个靶标,12个引物对/24个引物,呈等摩尔量(例如200nM各引物),或单独引物浓度经过调节以平衡不同靶标的扩增效率)。将热循环时间和温度选择为对反应和扩增容器的体积来说适合。举例来说,反应可如下进行循环:
Figure BDA0003617936540001152
Figure BDA0003617936540001161
在热循环之后,将RT-预扩增反应的等分试样(例如10μL)在存在或不存在鱼DNA的情况下在10mM Tris、0.1mM EDTA中稀释至500μL。将经过稀释的预扩增DNA的等分试样(例如10μL)用于如上所述的LQAS/TELQAS PCR-活瓣测定中。在一些实施方案中,使用额外量的相同引物对进行LQAS/TELQAS PCR活瓣测定。
实施例2
甲基化标记物的选择和测试
标记物选择方法:
基于来自16例腺癌肺癌、11例大细胞肺癌、14例小细胞肺癌、24例鳞状细胞肺癌以及18例非癌症肺的组织获得简化代表性亚硫酸氢盐测序(RRBS)数据,并且从26个健康患者获得血沉棕黄层样品的RRBS结果。
在与人基因组序列的亚硫酸氢盐转化形式进行比对之后,针对各样品类型(即组织或血沉棕黄层)计算各CpG岛处的平均甲基化,并且基于以下准则选择标记物区域:
·将区域选择为50个碱基对或更长。
·对于QuARTS活瓣测定设计,将区域选择为在以下中的每一者下具有最少1个甲基化CpG:a)探针区域,b)正向引物结合区,以及c)反向引物结合区。对于正向和反向引物,优选的是甲基化CpG接近引物的3′端,但不位于3'末端核苷酸处。图5中示出了示例性活瓣核酸内切酶测定寡核苷酸。
·优选地,所关注的区域中任何CpG处的血沉棕黄层甲基化不超过>0.5%。
·优选地,所关注的区域中的癌症组织甲基化为>10%。
·对于被设计成用于组织分析的测定,所关注的区域中的正常组织甲基化优选为<0.5%。
图2至图5示出了不同肺癌组织类型的RRBS数据。基于以上准则,选择下表中所示的标记物并且如图5中所示针对它们对QuARTS活瓣测定进行设计。
表1
Figure BDA0003617936540001171
Figure BDA0003617936540001181
Figure BDA0003617936540001191
针对与血沉棕黄层的交叉反应性对所选标记物进行分析.
1)血沉棕黄层筛查
基于从自健康患者的10mL血液获得的血沉棕黄层提取的DNA筛查来自以上列表的标记物。使用Promega Maxwell RSC系统(Promega Corp.,Fitchburg,WI)提取DNA并且使用Zymo EZ DNA MethylationTM试剂盒(Zymo Research,Irvine,CA)进行转化。使用具有亚硫酸氢盐转化的β-肌动蛋白DNA(“BTACT”)的二重反应,并且使用靶基因组DNA的约40,000条链,使用如上所述的QuARTS活瓣核酸内切酶测定对样品进行测试,以测试交叉反应性。这样做,针对3种标记物的测定显示显著的交叉反应性:
标记物 交叉反应性%
HIST1H2B 72.93%
chr7_636 3495.47%
chr5_132 0.20%
2)组织筛查
如以下表2中所示从各种商业和非商业来源(Asuragen、BioServe、ConversantBio、Cureline、Mayo Clinic、M D Anderson以及PrecisionMed)获得264个组织样品。
Figure BDA0003617936540001192
Figure BDA0003617936540001201
由圈出组织学独特病变以引导显微解剖的病理学家检验组织切片。使用PromegaMaxwell RSC系统进行总核酸提取。刮取福尔马林固定的石蜡包埋(FFPE)的载玻片并且使用
Figure BDA0003617936540001202
RSC DNA FFPE试剂盒(#AS1450)提取DNA,使用制造商的程序,但跳过RNA酶处理步骤。将相同程序用于FFPE卷曲。对于冷冻钻取活组织检查样品,使用改良的程序,所述改良的程序使用来自RSC DNA FFPE试剂盒的溶解缓冲液以及
Figure BDA0003617936540001203
RSC血液DNA试剂盒(#AS1400),省去RNA酶步骤。将样品在10mM Tris、0.1mM EDTA(pH 8.5)中洗脱并且使用10uL来设置6种多重PCR反应。
以10X浓度(10X=2μM各引物)制备以下多重PCR引物混合物:
·多重PCR反应1由以下标记物中的每一者组成:BARX1、LOC100129726、SPOCK2、TSC22D4、PARP15、MAX.chr8.145105646-145105653、ST8SIA1_22、ZDHHC1、BIN2_Z、SKI、DNMT3A、BCL2L11、RASSF1、FERMT3以及BTACT。
·多重PCR反应2由以下标记物中的每一者组成:ZNF671、ST8SIA1、NKX6-2、SLC12A8、FAM59B、DIDO1、MAX_Chr1.110、AGRN、PRKCB_28、SOBP以及BTACT。
·多重PCR反应3由以下标记物中的每一者组成:MAX.chr10.22624430-22624544、ZMIZ1、MAX.chr8.145105646-145105653、MAX.chr10.22541891-22541946、PRDM14、ANGPT1、MAX.chr16.50875223-50875241、PTGDR_9、ANKRD13B、DOCK2以及BTACT。
·多重PCR反应4由以下标记物中的每一者组成:MAX.chr19.16394489-16394575、HOXB2、ZNF132、MAX.chr19.37288426-37288480、MAX.chr12.52652268-52652362、FLJ45983、HOXA9、TRH、SP9、DMRTA2以及BTACT。
·多重PCR反应5由以下标记物中的每一者组成:EMX1、ARHGEF4、OPLAH、CYP26C1、ZNF781、DLX4、PTGDR、KLHDC7B、GRIN2D、chr17_737以及BTACT。
·多重PCR反应6由以下标记物中的每一者组成:TBX15、MATK、SHOX2、BCAT1、SUCLG2、BIN2、PRKAR1B、SHROOM1、S1PR4、NFIX以及BTACT。
将各多重PCR反应设置为最终浓度为0.2μM反应缓冲液、0.2μM各引物、0.05μM热启动Go Taq(5U/μL),产生40μL的预混液,所述预混液与10μL的DNA模板组合得到50μL的最终反应体积。
多重PCR的热谱需要95°持续5分钟的预孵育阶段;95°持续30秒、64°持续30秒、72°持续30秒的10个循环的扩增;以及保持在4°直到进一步加工的冷却阶段。在多重PCR完成后,使用20ng/μL的鱼DNA的稀释剂(例如于水或缓冲液中,参见以引用的方式并入本文中的美国专利号9,212,392)将PCR产物1:10稀释,并且将10μL的经过稀释的扩增样品用于各QuARTS测定反应。
将各QuARTS测定配置成三重形式,所述三重形式由2种甲基化标记物以及作为参考基因的BTACT组成。
·由多重PCR产物1,运行以下7种三重QuARTS测定:(1)BARX1、LOC100129726、BTACT;(2)SPOCK2、TSC22D4、BTACT;(3)PARP15、MAXchr8145105646-145105653、BTACT;(4)ST8SIA1_22、ZDHHC1、BTACT;(5)BIN2_Z、SKI、BTACT;(6)DNMT3A、BCL2L11、BTACT;(7)RASSF1、FERMT3以及BTACT。
·由多重PCR产物2,运行以下5种三重QuARTS测定:(1)ZNF671、ST8SIA1、BTACT;(2)NKX6-2、SLC12A8、BTACT;(3)FAM59B、DIDO1、BTACT;(4)MAX_Chr1110、AGRN、BTACT;(5)PRKCB_28、SOBP以及BTACT。
·由多重PCR产物3,运行以下5种三重QuARTS测定:(1)MAXchr1022624430-22624544、ZMIZ1、BTACT;(2)MAXchr8145105646-145105653、MAXchr1022541891-22541946、BTACT;(3)PRDM14、ANGPT1、BTACT;(4)MAXchr1650875223-50875241、PTGDR_9、BTACT;(5)ANKRD13B、DOCK2以及BTACT。
·由多重PCR产物4,运行以下5种三重QuARTS测定:(1)MAXchr1916394489-16394575、HOXB2、BTACT;(2)ZNF132、MAXchr1937288426-37288480、BTACT;(3)MAXchr1252652268-52652362、FLJ45983、BTACT;(4)HOXA9、TRH、BTACT;(5)SP9、DMRTA2以及BTACT。
·由多重PCR产物5,运行以下5种三重QuARTS测定:(1)EMX1、ARHGEF4、BTACT;(2)OPLAH、CYP26C1、BTACT;(3)ZNF781、DLX4、BTACT;(4)PTGDR、KLHDC7B、BTACT;(5)GRIN2D、chr17_737以及BTACT。
·由多重PCR产物6,运行以下5种三重QuARTS测定:(1)TBX15、MATK、BTACT;(2)SHOX2、BCAT1、BTACT;(3)SUCLG2、BIN2、BTACT;(4)PRKAR1B、SHROOM1、BTACT;(5)S1PR4、NFIX以及BTACT。
3)数据分析:
对于组织数据分析,包括正常组织中<0.5%甲基化并且癌症组织中>10%甲基化的基于RRBS准则选择的标记物。这产生用于进一步分析的51种标记物。
为确定标记物敏感度,进行以下步骤:
1.通过用针对各标记物所获得的链值除以ACTB(β-肌动蛋白)的链值来计算所述特定标记物的甲基化%。
2.基于正常组织确定各标记物的最大甲基化%。将此定义为100%特异性。
3.将关于各标记物的癌症组织阳性确定为对于所述标记物具有大于最大正常组织%的甲基化的癌症组织的数目。
以下示出51种标记物的敏感度。
表2
Figure BDA0003617936540001231
Figure BDA0003617936540001241
可使用标记物的组合来增加特异性和敏感度。举例来说,对于所测试的所有癌症组织来说,8种标记物(SLC12A8、KLHDC7B、PARP15、OPLAH、BCL2L11、MAX.chr12.526、HOXB2以及EMX1)的组合产生98.5%的敏感度(134/136癌症),具有100%特异性。
在一些实施方案中,因与特定肺癌组织类型(例如腺癌、大细胞癌、鳞状细胞癌或小细胞癌)相关的敏感和特异性检测而选择标记物,例如通过使用对于特定癌症类型或类型组合显示敏感度和特异性的标记物。
基于组织所测定的该组甲基化DNA标记物对于所有类型的肺癌都实现了极高辨别力,同时在正常肺组织和良性结节中保持阴性。对该组标记物的测定还可应用于基于血液或人体流体的测试,并且在例如肺癌筛查和辨别恶性与良性结节中获得应用。
实施例3
基于凝固血浆样品测试30-标记物集合
从实施例2中的标记物列表,选择30种标记物用于测试来自295个受试者(64个患有肺癌、231个正常对照的血浆样品的DNA。从来自各受试者的2mL血浆提取DNA并且如实施例1中所述用亚硫酸氢盐处理。如实施例1中所述,将亚硫酸氢盐转化的DNA的等分试样用于两种多重QuARTS测定中。选择用于分析的标记物为:
1.BARX1
2.BCL2L11
3.BIN2_Z
4.CYP26C1
5.DLX4
6.DMRTA2
7.DNMT3A
8.EMX1
9.FERMT3
10.FLJ45983
11.HOXA9
12.KLHDC7B
13.MAX.chr10.22624430-22624544
14.MAX.chr12.52652268-52652362
15.MAX.chr8.124173236-124173370
16.MAX.chr8.145105646-145105653
17.NFIX
18.OPLAH
19.PARP15
20.PRKCB_28
21.S1PR4
22.SHOX2
23.SKI
24.SLC12A8
25.SOBP
26.SP9
27.SUCLG2
28.TBX15
29.ZDHHC1
30.ZNF781
图5中示出了用于这些标记物的靶序列、亚硫酸氢盐转化的靶序列以及测定寡核苷酸。用于各个经过转化的靶标的引物和活瓣寡核苷酸(探针)如下:
表3
Figure BDA0003617936540001271
Figure BDA0003617936540001281
Figure BDA0003617936540001291
Figure BDA0003617936540001301
Figure BDA0003617936540001311
*B3GALT6标记物用作癌症甲基化标记物与参考靶标两者。参见07/19/16提交的美国专利申请序列号62/364,082,所述专利申请以全文引用的方式并入本文中。
Figure BDA0003617936540001313
关于斑马鱼参考DNA,参见07/19/16提交的美国专利申请序列号62/364,049,所述专利申请以全文引用的方式并入本文中。
如实施例1中所述,在两个多重预扩增反应中对如上所述从血浆制备的DNA进行扩增。多重预扩增反应包含用于扩增以下标记物组合的试剂。
表4
Figure BDA0003617936540001312
Figure BDA0003617936540001321
在预扩增之后,将预扩增混合物的等分试样在10mM Tris HCl、0.1mM EDTA中1:10稀释,然后如实施例1中所述在三重QuARTS PCR-活瓣测定中测定。组1三重反应使用来自多重混合物1的预扩增材料,并且组2反应使用来自多重混合物2的预扩增材料。三重组合如下:
组1:
Figure BDA0003617936540001322
组2:
Figure BDA0003617936540001331
各三重简称使用各基因名称的首字母(例如HOXA9-EMX1-BTA CT的组合=“HEA”)。如果不同标记物组合的简称发生重复或与另一实验重复,那么具有所述简称的第二分组包括数字2。FRET盒上所用的针对上文所列三重物的各个成员的染料报告子分别为FAM-HEX-Quasar670。
使用含有靶DNA序列的质粒来校准定量反应。对于各校准质粒,制备一系列10X校准物稀释储备物,所述稀释储备物具有含每微升10至106个靶链拷贝的鱼DNA稀释剂(含20ng/mL鱼DNA的10mM Tris-HCl、0.1mM EDTA)。对于三重反应,使用具有含有三重物的各个靶标的质粒的组合储备物。制备具有1x105个拷贝/μL的各质粒的混合物并且用于形成1:10稀释系列。使用通过对Cp相较于对数(质粒的链)进行绘图所产生的标准曲线来反算未知样品中的链。
使用接受者操作特征(ROC)曲线分析,计算针对各标记物的曲线下面积(AUC)并且在下表中示出,根据上部95%覆盖区间(Upper 95Pct Coverage Interval)排序。
表5
Figure BDA0003617936540001341
在区别来自癌症患者的样品与来自正常受试者的样品方面所述标记物表现极佳(参见以上ROC表)。标记物的组合使用改善了敏感度。举例来说,利用数据的逻辑拟合以及使用标记物SHOX2、SOBP、ZNF781、BTACT、CYP26C1以及DLX4的六-标记物拟合,ROC曲线分析给出了0.973的曲线下面积(AUC)。使用此6-标记物拟合,在93%特异性下获得92.2%的敏感度。使用SHOX2、SOBP、ZNF781、CYP26C1、SUCLG2以及SKI给出了AUC为0.97982的ROC曲线。
实施例4
以设盲方式对来自第二独立研究组的档案血浆进行测试。各组的肺癌病例和对照(显然健康的吸烟者)在年龄和性别上为平衡的(23个病例、80个对照)。使用如实施例1中所述的多重PCR继之以QuARTS(定量等位基因特异性实时靶标和信号扩增)测定,对从血浆提取的DNA进行甲基化DNA标记物的亚硫酸氢盐后定量。在此实验中对来自实施例3的顶部单独甲基化标记物进行测试以鉴定用于肺癌检测的最佳标记物组(2ml/患者)。
结果:测试了13种高性能甲基化DNA标记物(CYP26C1、SOBP、SUCLG2、SHOX2、ZDHHC1、NFIX、FLJ45983、HOXA9、B3GALT6、ZNF781、SP9、BARX1和EMX1)。使用两种方法分析数据:逻辑回归拟合和回归划分树法(regression partition tree approach)。逻辑拟合模型鉴定了4-标记物组(ZNF781、BARX1、EMX1以及SOBP),AUC为0.96并且总敏感度为91%并且特异性为90%。使用回归划分树法的数据分析鉴定了4种标记物(ZNF781、BARX1、EMX1以及HOXA9),AUC为0.96并且总敏感度为96%并且特异性为94%。在两种方法中,将B3GALT6用作总DNA输入的标准化标记物。在血浆中测定的这些甲基化DNA标记物组针对所有肺癌类型都实现了高敏感度和特异性。
实施例5
区分肺癌
使用上述方法,选择在检测与特定肺癌类型相关的甲基化中展现高性能的甲基化标记物。
对于疑似患有肺癌的受试者,收集样品(例如血浆样品),并且从样品分离DNA并且例如如实施例1中所述用亚硫酸氢盐试剂处理。如实施例1中所述使用多重PCR继之以QuARTS活瓣核酸内切酶测定对转化的DNA进行分析,所述分析被配置成针对不同甲基化标记物或甲基化标记物组合提供不同的可识别信号,从而提供数据集合,所述数据集合被配置成特异性地鉴定受试者中一种或多种不同类型的肺癌(例如腺癌、大细胞癌、鳞状细胞癌和/或小细胞癌)的存在。在优选实施方案中,生成报告,所述报告指示存在或不存在一种指示肺癌存在的测定结果,并且如果存在,那么进一步指示一种或多种所鉴定的肺癌类型的存在。在一些实施方案中,经历一段时间的过程或一系列处理从受试者收集样品,并且将测定结果进行比较以监测癌症病变的变化。
对不同类型的肺癌敏感的标记物和标记物组可用于例如对存在的一种或多种癌症类型进行归类、鉴定混合病变和/或监测随时间推移和/或响应于处理的癌症进展。
实施例6
使用如实施例1中所述的多重PCR继之以QuARTS(定量等位基因特异性实时靶标和信号扩增)测定,对从血浆提取的DNA进行甲基化DNA标记物的亚硫酸氢盐后定量。图5中示出了用于这些标记物的靶序列、亚硫酸氢盐转化的靶序列以及测定寡核苷酸。用于各个经过转化的靶标的引物和活瓣寡核苷酸(探针)如下:
表6
Figure BDA0003617936540001361
Figure BDA0003617936540001371
Figure BDA0003617936540001381
*所有甲基化测定为具有报告至Quasar的针对亚硫酸氢盐转化B3GALT6标记物的测定的三重测定:
Figure BDA0003617936540001382
如实施例1中所述,在多重预扩增反应中对如上所述从血浆制备的DNA进行扩增。在预扩增之后,将预扩增混合物的等分试样在10mM Tris HCl、0.1mM EDTA中1:10稀释,然后如实施例1中所述在三重QuARTS PCR-活瓣测定中测定。三重组合如下:
三重测定
BARX1/HOXB2/B3GALT6(BHB)
FLJ45983/IFFO1/B3GALT6(FIB)
HOXA9/SOBP/B3GALT6(HSB)
HOPX2149/TRH/B3GALT6(HTB)
ZNF781/FAM59B/B3GALT6(ZFB)
使用含有靶DNA序列的质粒来校准定量反应。对于各校准质粒,制备一系列10X校准物稀释储备物,所述稀释储备物具有含每微升10至106个靶链拷贝的鱼DNA稀释剂(含20ng/mL鱼DNA的10mM Tris-HCl、0.1mM EDTA)。对于三重反应,使用具有含有三重物的各个靶标的质粒的组合储备物。制备具有1x105个拷贝/μL的各质粒的混合物并且用于形成1:10稀释系列。使用通过对Cp相较于对数(质粒的链)进行绘图所产生的标准曲线来反算未知样品中的链。
利用使用相对于B3GALT6链的甲基化%的接受者操作特征(ROC)曲线分析,计算针对各标记物的曲线下面积(AUC)并且在下表中示出。
标记物名称 AUC
BARX1 0.754
FLJ45983 0.709
HOXA9 0.800
HOPX 0.654
ZNF781 0.760
HOXB2 0.700
IFFO1 0.788
SOBP 0.717
FAM59B 0.685
利用使用标记物BARX1、FLJ45983、SOBP、HOPX、IFFO1以及ZNF781的6-标记物逻辑拟合,ROC曲线分析显示0.85881的曲线下面积(AUC)。与单一标记物相比,标记物的组合使用改善了敏感度。
实施例7
mRNA与甲基化标记物组合以改善肺癌检测敏感度
先前已显示FPR1 mRNA(甲酰肽受体1)的表达水平为在血液中可检测的肺癌标志(Morris,S.等,Int J Cancer.,(2018)142:2355-2362)。在一些实施方案中,将上述甲基化标记物测定与一种或多种表达标记物的测量组合使用。示例性组合测定包括在来自相同受试者的一个或多个样品中测量FPR1 mRNA水平以及检测一种或多种甲基化标记DNA(例如如实施例1至实施例6中所述)。
SEQ ID NO:437中示出了FPR1序列(NM_001193306.1智人甲酰肽受体1(FPR1)转录物变体1mRNA。如Morris等,同上所描述,将血液样品收集于适合于后续RNA检测的采血管(例如PAXgene血液RNA管;Qiagen,Inc.)中。样品可立即测定或进行冷冻直到将来分析。通过标准方法(例如Qiasymphony PAXgene血液RNA试剂盒使用适合用于测量存在于样品中的特定RNA的测定(例如RT-PCR)确定RNA(例如mRNA标记物))的水平。在一些实施方案中,使用包括逆转录步骤的QuARTS活瓣核酸内切酶测定反应。参见例如美国专利申请号15/587,806,所述专利申请以引用的方式并入本文中。在优选实施方案中,将用于RT-PCR或RT-QuARTS测定的测定探针和/或引物设计为跨越一个或多个外显子连接点,使得所述测定将特异性地检测mRNA靶标,而非检测对应基因组基因座。
示例性RT-QuARTS反应含有20U的MMLV逆转录酶(MMLV-RT)、219ng的
Figure BDA0003617936540001402
2.0、1.5U的
Figure BDA0003617936540001403
DNA聚合酶、200nM的各引物、500nM各个探针和FRET寡核苷酸、10mMMOPS缓冲液(pH7.5)、7.5mM MgCl2以及250μM各dNTP。反应典型地在热循环器上运行,所述热循环器被配置成实时(例如连续地,或在一些或所有循环中在相同点)收集荧光数据。举例来说,Roche LightCycler 480系统可在以下条件下使用:42℃持续30分钟(RT反应);95℃持续3分钟;10个循环的95℃持续20秒、63℃持续30秒、70℃持续30秒;随后35个循环的95℃持续20秒、53℃持续1分钟、70℃持续30秒,以及在40℃下保持30秒。
在一些实施方案中,如以上在实施例1中所述,RT-QuARTS测定可包括多重预扩增的步骤,例如用于预扩增样品中的2、5、10、12或更多个靶标(或多于1个靶标的任何数目的靶标)。在优选实施方案中,RT-预扩增在反应混合物中进行,所述反应混合物含有例如20U的MMLV逆转录酶、1.5U的
Figure BDA0003617936540001404
DNA聚合酶、10mM MOPS缓冲液(pH7.5)、7.5mM MgCl2、250μM各dNTP以及寡核苷酸引物(例如对于12个靶标,12个引物对/24个引物,呈等摩尔量(例如200nM各引物),或单独引物浓度经过调节以平衡不同靶标的扩增效率)。将热循环时间和温度选择为对反应和扩增容器的体积来说适合。举例来说,反应可如下进行循环:
Figure BDA0003617936540001401
Figure BDA0003617936540001411
在热循环之后,将预扩增反应的等分试样(例如10μL)在存在或不存在鱼DNA的情况下在10mM Tris、0.1mM EDTA中稀释至500μL。如上所述,将经过稀释的预扩增DNA的等分试样(例如10μL)用于QuARTS PCR-活瓣测定。
在一些实施方案中,可对DNA靶标(例如甲基化DNA标记基因、突变标记基因和/或对应于RNA标记物的基因等)进行扩增并且在例如如以上实施例1中所述的QuARTS测定反应中与逆转录的cDNA一起检测。在一些实施方案中,对DNA和cDNA进行共同扩增并且在单管反应中检测,即在组合试剂与收集输出数据之间的任何点都不需要打开反应容器。在其他实施方案中,可在存在或不存在亚硫酸氢盐转化步骤的情况下单独地分离来自相同样品或来自不同样品的标记DNA,并且可在RT-QuARTS测定中与样品RNA组合。在其他实施方案中,可如上所述对RNA和/或DNA样品进行预扩增。
在Morris中,相对于看家基因(HNRNPA1)的FPR1 mRNA比率的ROC曲线分析在89%的特异性下产生68%的敏感度,并且使用甲基化标记物BARX1、FAM59B、HOXA9、SOBP和IFFO1的ROC曲线分析在92.3%的特异性下产生77.2%的敏感度。将这些测定一起使用在82%的特异性下产生92.7%的理论敏感度。
此分析表明针对FPR1 mRNA的水平与一种或多种甲基化标记物的检测的组合测定使得测定与任一单独方法相比具有改善的敏感度。将不同类别的标记物组合的癌症检测测定具有能够检测早期与晚期疾病阶段以及不同生物反应或癌症来源之间的生物差异的优点。对本领域技术人员来说将显而易见的是,可将其他RNA靶标(包括不为FPR1或除FPR1外的mRNA靶标,诸如LunX mRNA(Yu等,2014,Chin J Cancer Res.,26:89-94))与甲基化标记物组合以获得增加的敏感度。
实施例8
mRNA标记物与DNA标记物组合以改善肺癌检测敏感度的RT-LQAS分析
对于RNA,将血液收集于用于RNA测定的PAXgene血液RNA管中以及用于DNA测定的BD Vacutainer PPT血浆制备管(BD Biosciences)中,并且根据制造商的说明书储存样品。在Qiagen QIAsymphony仪器上根据制造商的说明书使用QIAsymphony PAXgene血液RNA试剂盒(编号:762635)提取RNA样品。在RT-LQAS中测试之前,将RNA样品在10mM TrisHCl(pH8.0)、0.1mM EDTA中1:50稀释。如实施例1中所述提取DNA。样品如下:
RNA研究:
来自患有肺癌的受试者的155个样品
来自健康正常受试者的317个样品
DNA研究:
来自患有肺癌的受试者的102个样品
来自健康正常受试者的142个样品
将引物和探针设计成用于检测如下文表3中所示的8种mRNA与3种参考基因的组合。
表3
Figure BDA0003617936540001421
Figure BDA0003617936540001431
图6中示出了用于上文所列的靶核酸的引物和活瓣寡核苷酸探针。如以上实施例1中所述进行RT-LQAS测定。所述分析使用如下计算的RNA水平%:
·使用RT-LQAS以及用于校准物的合成RNA靶标计算mRNA水平的链值;
·对三种参考基因(CASC3、SKP1、STK4)的链水平取平均值;
·用所测量的标记物的mRNA链除以三种参考基因的链的平均值;
·进行RNA%的ROC分析
计算单独地使用这些RNA标记物并且使用接受者操作特征(ROC)曲线分析进行分析的LQAS测定性能、针对各RNA标记物的曲线下面积(AUC)并且概述如下:
Figure BDA0003617936540001441
使用102个来自患有肺癌的受试者的样品以及142个来自健康正常受试者的样品进行RNA与甲基化DNA的分析。使用高性能mRNA标记物对PADI4和SELL,组合RNA标记物的逻辑拟合具有0.85626的曲线下面积,并且在90%特异性下显示63.7%的敏感度。使用高性能DNA甲基化标记物对HOXA9和IFFO1,组合DNA甲基化测定的逻辑拟合具有0.091677的曲线下面积,并且在90%特异性下显示78.4%的敏感度。将这些mRNA标记物与DNA甲基化标记物的结果组合产生0.95070的曲线下面积,并且在90%特异性下显示90.2%的敏感度。
实施例9
蛋白质(例如自身抗体)与甲基化标记物组合以改善肺癌检测敏感度
肺中的肿瘤相关抗原以及其他实体肿瘤可以自身抗体的形式引起体液免疫反应,并且已观察到这些抗体非常早(例如在症状呈现之前)就存在于病程中。(参见Chapman CJ,Murray A,McElveen JE等Thorax2008;63:228-233,所述参考文献出于所有目的以全文引用的方式并入本文中)。然而,自身抗体检测用于检测肺癌的敏感度为相对低的。举例来说,文献中已显示针对肿瘤抗原NY-ESO-1(登录号P78358,以SEQ ID NO:442显示的序列;也称为CTAG1B)的自身抗体为非小细胞肺癌(NSCLC;Chapman,同上)的良好标记物,但其敏感度对单独使用来说不够。一种或多种肿瘤相关自身抗体的检测与一种或多种甲基化标记物的检测组合提供具有更大敏感度的测定。
收集血液样品,并且如Chapman,同上所述使用标准方法(例如ELISA检测)检测自身抗体。如以上实施例1中所述检测从样品分离的DNA中的甲基化和/或突变标记物。
单独NY-ESO-1自身抗体的检测在95%特异性下产生40%的敏感度(Türeci等,Cancer Letters 236(1):64(2006)。如上文所论述,测定BARX1、FAM59B、HOXA9、SOBP和IFFO1标记物的组合的甲基化在92.3%特异性下产生77.2%的敏感度。将此自身抗体标记物的测定与针对此甲基化标记物组合的分析组合在87.7%的特异性下产生86.3%的组合理论敏感度。
此分析表明,自身抗体的水平与一种或多种甲基化标记物的分析的组合测定使得测定与任一单独方法相比具有改善的敏感度。将不同类别的标记物组合的癌症检测测定具有能够检测早期与晚期疾病阶段以及不同生物反应或癌症来源之间的生物差异的优点。
实施例10
mRNA、一种或多种甲基化标记物以及蛋白质(例如自身抗体)组合以改善肺癌检测敏感度
可进行来自受试者的一个或多个样品中一种或多种RNA、标记DNA以及自身抗体的组合的分析以增强受试者中肺癌和其他癌症的检测。用于样品制备以及DNA、RNA和蛋白质检测的方法为如上文所论述。
如实施例7中所论述,如Morris等所报告的相对于看家基因(HNRNPA1)的FPR1mRNA比率的分析在89%的特异性下产生68%的敏感度(Morris,同上);如Chapman所报告的单独NY-ESO-1自身抗体的检测在95%特异性下产生40%的敏感度;并且测定BARX1、FAM59B、HOXA9、SOBP和IFFO1标记物的组合的甲基化在92.3%特异性下产生77.2%的敏感度。将mRNA、自身抗体标记物的分析与针对此甲基化标记物组合的测定组合在77.9%的特异性下产生95.6%的组合理论敏感度,表明mRNA水平和自身抗体水平与一种或多种甲基化标记物的分析的组合测定使得测定与这些方法中任一单独方法相比具有改善的敏感度。
可通过增加用于检测一种或多种抗原的分析来进一步增强如上所述的测定。本领域技术人员将了解,可单独地或以任何组合的形式向以下中的任一者的检测中增加抗原检测:一种或多种RNA、一种或多种甲基化标记基因和/或一种或多种自身抗体,并且将进一步增强总敏感度。
实施例11
来自患有不同阶段癌症的受试者的样品中的RNA表达
从已知患有阶段I、阶段II、阶段III以及阶段IV非小细胞肺癌(“NSCLC”)的患者收集血液样品。为进行比较,对于非吸烟者与吸烟者两者,还从未患任何已知肺癌的人(推定地为“无癌症”个体)收集血液样品。未患任何已知肺癌的人可能实际上患有其他未检测到的癌症存在一定可能性。这些患者的存在将导致此测试的假阳性率的过度评估(因为来自“健康个体”的“假阳性”可能实际上表示这些个体中存在癌症)。将血液样品收集于PAXgene血液RNA管中,并且在室温下或在冰上运送至测试设备处,以使样品降解减至最少。在测试设备中接收样品之后,用
Figure BDA0003617936540001471
RNA血液微型试剂盒从各血液样品提取白血细胞RNA。
在提取RNA之后,使用Illumina TruSeq链总RNA文库制备型人/小鼠/大鼠方案从各血液样品的RNA制备cDNA文库。接下来,在Illumina NextSeq 550系统中对各血液样品的cDNA文库进行测序以分析整个转录组并且获得各基因的RNA表达水平。获得以下结果。
参考图7至图10,由对白血细胞RNA的整个转录组分析,鉴定在健康个体与肺癌患者之间显示显著基因表达改变的靶基因。基因表达改变推测起来反映了患者中免疫细胞对肿瘤的免疫反应。这些结果表明测量至少所公开的靶基因的RNA表达水平允许预测人中肺癌的存在。
如图7的图C中所示,各数据点表示个体的血液样品的靶基因FPR1的RNA表达水平(y轴)。x轴根据健康非吸烟者、健康吸烟者和阶段I-IV NSCLC患者对个体进行分组。与健康个体相比,阶段I-III NSCLC涉及FPR1基因表达水平的显著增加。此外,对于正常吸烟者来说,FPR1基因表达略微增加。
图7的图A和图B示出了分配为训练集的一部分数据以及分配为验证集的一部分数据的接受者操作特征(ROC)曲线。在各所选RNA表达阈值水平(在图C的y-值处的片状物),计算真阳性率和假阳性率。恰当鉴定为患有特定疾患的NSCLC患者的百分比定义真阳性率(敏感度),而恰当鉴定为未患NSCLC的健康人的百分比定义特异性。假阳性率定义为(1-特异性)。对于随机猜测,ROC曲线将为对角线并且曲线下面积(AUC)将为0.5。验证集的AUC为0.82,这证实FPR1基因表达预示NSCLC风险。
类似地,在图8的图C中,各数据点表示个体的白血细胞样品的靶基因S100A12的RNA表达水平(y轴)。x轴根据健康非吸烟者、健康吸烟者和阶段I-IV NSCLC患者对个体进行分组。与健康个体相比,阶段I-III NSCLC涉及S100A12基因表达水平的显著增加。图8的图A和图B示出了分配为训练集的一部分数据以及分配为验证集的一部分数据的ROC曲线。验证集的AUC为0.93,这证实S100A12基因表达预示NSCLC风险并且显著优于使用FPR1作为靶基因。
在图9的图C中,各数据点表示个体的白血细胞样品的靶基因MMP9的RNA表达水平(y轴)。x轴根据健康非吸烟者、健康吸烟者和阶段I-IV NSCLC患者对个体进行分组。与健康个体相比,阶段I-III NSCLC涉及MMP9基因表达水平的显著增加。此外,对于吸烟者来说,MMP9基因表达略微增加。图9的图A和图B示出了分配为训练集的一部分数据以及分配为验证集的一部分数据的ROC曲线。验证集的AUC为0.93,这证实MMP9基因表达预示NSCLC风险并且也显著优于使用FPR1作为靶基因。
在图10的图C中,各数据点表示个体的白血细胞样品的靶基因SAT1的RNA表达水平(y轴)。x轴根据健康非吸烟者、健康吸烟者和阶段I-IV NSCLC患者对个体进行分组。与健康个体相比,阶段I-III NSCLC涉及SAT1基因表达水平的显著增加。图10的图A和图B示出了分配为训练集的一部分数据以及分配为验证集的一部分数据的ROC曲线。验证集的AUC为0.79,这证实SAT1基因表达预示NSCLC风险。
这些实验结果表明,检测所公开的靶基因的RNA表达水平允许预测人中肺癌的存在。
实施例12
将RNA表达水平与参考基因的表达进行比较
图11至图13表明,将靶基因与参考基因的RNA表达水平进行比较可允许更好地预测人中肺癌的存在。
如图11的图A中所示,各数据点表示取自1)健康、2)具有良性肺肿瘤或3)已被诊断患有肺癌的个体的白血液样品。x轴(FPR1 FPKM)表示仅FPR1表达水平的每百万映射读段的每千碱基片段数标准化值。y轴(FPR1比率)表示FPR1表达水平与参考基因STK4表达水平的比率。如图11的图B中所示,针对FPR1比率进行ROC分析,并且发现AUC为0.89,这改善了单独使用FPR1表达的预测功效(图7)。
如图12的图A中所示,各数据点表示来自1)健康、2)具有良性肺肿瘤或3)已被诊断患有肺癌的个体的白血细胞样品。x轴(1FPKM)表示仅S100A12表达水平的每百万映射读段的每千碱基片段数标准化值。y轴(S100A12比率)表示S100A12表达水平与参考基因STK4表达水平的比率。如图12的图B所示,针对S100A12比率进行ROC分析,并且AUC为0.94,这改善了单独使用S100A12表达的预测功效(图8)。
如图13的图A中所示,各数据点表示来自健康、具有良性肺肿瘤或患有肺癌的个体的白血细胞样品。x轴(MMP9 FPKM)表示仅MMP9表达水平的每百万映射读段的每千碱基片段数标准化值。y轴(MMP9比率)表示MMP9表达水平与参考基因STK4表达水平的比率。如图13的图B中所示,针对MMP9比率进行ROC分析,并且AUC为0.94,这改善了单独使用MMP9表达的预测功效(图9)。
这些实验结果表明,将靶基因与所公开的参考基因的RNA表达水平进行比较使得更好地预测人中肺癌的存在。
实施例13
标记基因的组合的RNA表达水平
图14至图16表明,将两种靶基因的RNA表达水平一起使用允许预测人中肺癌的存在。
在图14中,使用来自实施例12的两种最有预测力的靶基因(例如S100A12和MMP9)的数据,了解了二元分类型式(由虚线表示)。S100A12在Y轴上并且MMP9在X轴上。所显示的数据为标准化的FPKM。各数据点表示来自为1)健康非吸烟者、2)健康吸烟者、3)患有阶段INSCLC、4)患有阶段II NSCLC、5)患有阶段III NSCLC或6)患有阶段IV NSCLC的个体的血液样品。所述分类型式对于阶段I NSCLC敏感度为0.87,对于阶段I-III NSCLC敏感度为0.88,并且特异性为0.9。这证实,将S100A12与MMP9的基因表达数据组合产生针对肺癌风险的良好预测功效。
或者,图15使用S100A12和SAT1的基因表达数据,并且图16使用S100A12和TYMP的基因表达数据。各数据点表示来自1)健康、2)具有良性肺肿瘤或3)已被诊断患有肺癌的个体的血液样品。图15示出了被选择用于使各组之间的距离最大化的基因。这使检测错误和分析前变量对数据的影响最小化。图16试图发现S100A12的正交标记物。发现TYMP用于区分良性结节与癌症非常好,这意味着它可用作针对CT扫描中所发现的结节的良好反映测试的一部分。
本申请中引用的所有文献和类似材料(包括但不限于专利、专利申请、文章、书、专著以及互联网网页)明确地出于任何目的以全文引用的方式并入本文中。除非另有定义,否则本文所用的所有技术和科学术语具有与本文所述的各个实施方案所属领域技术人员通常所理解相同的含义。当并入的参考文献中的术语定义似乎不同于本发明教示中所提供的定义时,应以本发明教示中所提供的定义为准。
虽然描述了本发明的某些实施方案,但这些实施方案仅通过举例而呈现,并且不旨在限制本公开的范围。实际上,本文所述的新颖方法和系统可体现为多种其他形式。另外,在不背离如所述的技术的范围和精神的情况下,对所描述的技术的组合物、方法、系统以及用途的各种修改、省略、取代以及变化对本领域技术人员来说将为显而易见的。虽然已结合特定示例性实施方案描述了所述技术,但应了解如所要求的本发明不应不适当地限于此类特定实施方案。实际上,对所描述的对药理学、生物化学、医学科学或相关领域技术人员来说显而易见的用于执行本发明的模式的各种修改旨在在以下权利要求的范围内。随附权利要求和其等效型式旨在涵盖此类将属于本公开的范围和精神内的形式或修改型式。因此,本发明的范围仅由随附权利要求限定。
本公开的范围不旨在由本说明书中本节或别处的优选实施方案的特定公开内容限制,而是可由如本说明书中本节或别处所呈现或如将来所呈现的权利要求限定。权利要求的措辞应基于权利要求中所用的措辞广义地解释并且不限于在本说明书中或在本申请诉讼期间所描述的实例,所述实例应视为非排他的。
结合特定方面、实施方案或实例所描述的特征、材料、特性或组应理解为将适用于本说明书本节或别处中所描述的任何其他方面、实施方案或实例,除非不相容。本说明书(包括任何伴随权利要求、摘要以及图式)中所公开的所有特征和/或如此公开的任何方法或工艺的所有步骤可以任何组合加以组合,除非组合中此类特征和/或步骤中的至少一些互相排斥。保护不限于任何前述实施方案的细节。保护延伸至任何新颖特征或本说明书(包括任何随附权利要求、摘要以及图式)中所公开的特征的任何新颖组合,或延伸至任何新颖步骤或如此公开的任何方法或工艺的步骤的任何新颖组合。
此外,本公开在分开的实现方式的背景下所描述的某些特征也可在单个实现方式中以组合形式实现。相反地,在单个实现方式背景下所描述的各种特征也可在多个实现方式中单独地或以任何合适的子组合形式实现。此外,虽然上文可将特征描述为以某些组合的形式起作用,但在一些情况下,可将来自所要求的组合的一种或多种特征从组合中去除,并且可要求组合为子组合或子组合的变化型式。
此外,虽然可以特定顺序在图式中展示或在本说明书中对操作进行描述,但此类操作不需要以所显示的特定顺序或以连续顺序进行,或者不需要进行所有操作来实现所需结果。未展示或描述的其他操作也可并入示例性方法和工艺中。举例来说,可在所描述的操作中的任一者之前、之后、同时或之间进行一种或多种额外操作。另外,可在其他实现方式中对所述操作进行重新排列或重新排序。本领域技术人员将了解,在一些实施方案中,所说明和/或公开的方法中采用的实际步骤可不同于图中所示的那些步骤。根据实施方案,可去除上述步骤中的某些步骤,可添加其他步骤。此外,可将上文所公开的特定实施方案的特征和性质以不同方式组合以形成额外实施方案,所有这些实施方案都属于本公开的范围内。另外,上述实现方式中的各种系统组件的分离不应被理解为在所有实现方式中都要求此类分离,并且应了解通常可将所描述的组分和系统一起整合在单一产品中或包装至多个产品中。举例来说,本文所述的储能系统的组件中的任一者可单独提供或整合在一起(例如包装在一起,或连接在一起)以形成储能系统。
出于本公开的目的,本文描述了某些方面、优点以及新颖特征。不一定所有此类优点都可根据任何特定实施方案实现。因此,举例来说,本领域技术人员将认识到,本公开可以实现如本文所教示的一种优点或一组优点的方式来实现或进行,而不一定实现如本文可能教示或暗示的其他优点。
序列表
<110> 精密科学发展有限责任公司(EXACT SCIENCES DEVELOPMENT COMPANY, LLC)
梅奥医学教育与研究基金会(MAYO FOUNDATION FOR MEDICAL EDUCATION ANDRESEARCH)
<120> 对疑似具有肺瘤变的受试者中的甲基化DNA、RNA和蛋白质的表征
<130> EXCTD-38699.601
<150> US 62/892,426
<151> 2019-08-27
<160> 491
<170> PatentIn version 3.5
<210> 1
<211> 116
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
gttcccggaa cggcctcttg ggggcgttcc agccccacgg acccgcaggg agtccccgcc 60
gcaatttgca tggggctcat ttgcatgacc ccgccccgcg cgggagtcgg gggcgc 116
<210> 2
<211> 116
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 2
gttttcggaa cggttttttg ggggcgtttt agttttacgg attcgtaggg agttttcgtc 60
gtaatttgta tggggtttat ttgtatgatt tcgtttcgcg cgggagtcgg gggcgt 116
<210> 3
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 3
ggcgttttag ttttacggat tcg 23
<210> 4
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 4
acaaataaac cccatacaaa ttacgac 27
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 5
cgccgaggcg aaaactccct 20
<210> 6
<211> 126
<212> DNA
<213> 智人(Homo sapiens)
<400> 6
cggattcaac atgggcaatg tgcctacact ttcattcttc cagaacacga tggcaactgt 60
cgtgagagta cgacagacca gtacaacaca aacgctctgc agagagatgc tccacacgtg 120
gaaccg 126
<210> 7
<211> 126
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 7
cggatttaat atgggtaatg tgtttatatt tttatttttt tagaatacga tggtaattgt 60
cgtgagagta cgatagatta gtataatata aacgttttgt agagagatgt tttatacgtg 120
gaatcg 126
<210> 8
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 8
ttttagaata cgatggtaat tgtcgt 26
<210> 9
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 9
acatctctct acaaaacgtt tatattatac taatc 35
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 10
cgccgaggct atcgtactct 20
<210> 11
<211> 109
<212> DNA
<213> 智人(Homo sapiens)
<400> 11
ggagctacga cgagcagctg cggctggcga tggaactgtc ggcgcaggag caggaggaga 60
ggcggcggcg cgcgcgccag gaggaggagg agctggagcg catcctgag 109
<210> 12
<211> 109
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 12
ggagttacga cgagtagttg cggttggcga tggaattgtc ggcgtaggag taggaggaga 60
ggcggcggcg cgcgcgttag gaggaggagg agttggagcg tattttgag 109
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 13
agttacgacg agtagttgcg 20
<210> 14
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 14
tcctcctact cctacgcc 18
<210> 15
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 15
ccacggacgc gacaattcca t 21
<210> 16
<211> 143
<212> DNA
<213> 智人(Homo sapiens)
<400> 16
ggtggcaacg gctggagtgc cgtcgcccgc gccactcacc ccggcgcggc gccctgcgcg 60
gccgctcagc ggaaggccag caggaagatc agtacgacgt tgatgagaac caggagcgcc 120
agcacggcgg agaccaccac gcg 143
<210> 17
<211> 143
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 17
ggtggtaacg gttggagtgt cgtcgttcgc gttatttatt tcggcgcggc gttttgcgcg 60
gtcgtttagc ggaaggttag taggaagatt agtacgacgt tgatgagaat taggagcgtt 120
agtacggcgg agattattac gcg 143
<210> 18
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 18
cgttcgcgtt atttatttcg gcg 23
<210> 19
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 19
gctcctaatt ctcatcaacg tcgt 24
<210> 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 20
cgccgagggc ggcgttttgc 20
<210> 21
<211> 100
<212> DNA
<213> 智人(Homo sapiens)
<400> 21
ggcccggggc cgcctgggcc cctaggggct ggacgtcaac ctgttagata gagggcgtgg 60
gaccccccgc aggcggctgc tcggacgacc gcatccggag 100
<210> 22
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 22
ggttcggggt cgtttgggtt tttaggggtt ggacgttaat ttgttagata gagggcgtgg 60
gatttttcgt aggcggttgt tcggacgatc gtattcggag 100
<210> 23
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 23
cgttaatttg ttagatagag ggcg 24
<210> 24
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 24
acgatcgtcc gaacaacc 18
<210> 25
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 25
ccacggacgc gcctacgaaa a 21
<210> 26
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 26
tccgaacaac cgcctac 17
<210> 27
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 27
ccacggacgc gaaaaatccc a 21
<210> 28
<211> 119
<212> DNA
<213> 智人(Homo sapiens)
<400> 28
gcttccagcc gcgcgctccg tgccactgcc gctctctgca gccccgcgtc cccgcagcct 60
ccccatggcc agcccgcttc gctccgctgc ggcccttgcc cgccaggtac ctcgaaccc 119
<210> 29
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 29
gtttttagtc gcgcgtttcg tgttattgtc gttttttgta gtttcgcgtt ttcgtagttt 60
ttttatggtt agttcgtttc gtttcgttgc ggtttttgtt cgttaggtat ttcgaattt 119
<210> 30
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 30
gtgttattgt cgttttttgt agtttcg 27
<210> 31
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 31
cgcaacgaaa cgaaacga 18
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 32
cgccgagggc gttttcgtag 20
<210> 33
<211> 140
<212> DNA
<213> 智人(Homo sapiens)
<400> 33
gcccgccgca cgccgcaatg ctccgcgctc cccgcggggt cgggcgactc agacagggac 60
cggaaaagaa ccacgcagaa gaaagcccta tttcttgtcg tctgttcctg tgcagccttg 120
cagcctcgcc gcccccgcgt 140
<210> 34
<211> 140
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 34
gttcgtcgta cgtcgtaatg tttcgcgttt ttcgcggggt cgggcgattt agatagggat 60
cggaaaagaa ttacgtagaa gaaagtttta ttttttgtcg tttgtttttg tgtagttttg 120
tagtttcgtc gttttcgcgt 140
<210> 35
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 35
cgtaatgttt cgcgtttttc g 21
<210> 36
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 36
actttcttct acgtaattct tttccga 27
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 37
cgccgagggc ggggtcgggc 20
<210> 38
<211> 85
<212> DNA
<213> 智人(Homo sapiens)
<400> 38
gccggggagt cgagaagcaa gtactagcgc tccaggaccg cgcgcgccgc cccgcgccgc 60
cccgcgccgc ccctcggtcc agagc 85
<210> 39
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 39
gtcggggagt cgagaagtaa gtattagcgt tttaggatcg cgcgcgtcgt ttcgcgtcgt 60
ttcgcgtcgt ttttcggttt agagt 85
<210> 40
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 40
agtattagcg ttttaggatc gcg 23
<210> 41
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 41
actctaaacc gaaaaacgac g 21
<210> 42
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 42
ccacggacgg cgaaacgacg c 21
<210> 43
<211> 74
<212> DNA
<213> 智人(Homo sapiens)
<400> 43
gccgggagcc cgcacttcct cctcgggggc ctcagaaaac cacagggcgc ggggccaggg 60
cggcggcccc cagg 74
<210> 44
<211> 74
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 44
gtcgggagtt cgtatttttt tttcgggggt tttagaaaat tatagggcgc ggggttaggg 60
cggcggtttt tagg 74
<210> 45
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 45
tcgggagttc gtattttttt ttcgg 25
<210> 46
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 46
aaaaccgccg ccctaac 17
<210> 47
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 47
cgccgaggcc ccgcgcccta 20
<210> 48
<211> 78
<212> DNA
<213> 智人(Homo sapiens)
<400> 48
cggggcctac cctcaggcag cgctcgctcg aggccagctt ccgagctcca acccctgccc 60
gaaacctcgg cctcactg 78
<210> 49
<211> 78
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 49
cggggtttat ttttaggtag cgttcgttcg aggttagttt tcgagtttta atttttgttc 60
gaaatttcgg ttttattg 78
<210> 50
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 50
gggtttattt ttaggtagcg ttcg 24
<210> 51
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 51
cgaaatttcg aacaaaaatt aaaactcga 29
<210> 52
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 52
ccacggacgg ttcgaggtta g 21
<210> 53
<211> 141
<212> DNA
<213> 智人(Homo sapiens)
<400> 53
tgtcctgaca cgatggccac aggcacagtt tgtggtgatg cccaggggcc cgcgcggccc 60
cacggtggtc cagtttacac tcgggccccg cactcctgaa gttccgcgcg ggaggagaag 120
ggcgtccctt tcgcagctcg g 141
<210> 54
<211> 141
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 54
tgttttgata cgatggttat aggtatagtt tgtggtgatg tttaggggtt cgcgcggttt 60
tacggtggtt tagtttatat tcgggtttcg tatttttgaa gtttcgcgcg ggaggagaag 120
ggcgtttttt tcgtagttcg g 141
<210> 55
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 55
tgatgtttag gggttcgcg 19
<210> 56
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 56
cgaaacttca aaaatacgaa acccga 26
<210> 57
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 57
cgccgagggc ggttttacgg 20
<210> 58
<211> 112
<212> DNA
<213> 智人(Homo sapiens)
<400> 58
ccggagcact cgccgctgcg cgccctgaag ccgctggcgg taggcggccc tcgaggccgg 60
cgggctgggc ggctcggcag cctgcgccgc ggcctccgcc tcggccgcca gc 112
<210> 59
<211> 112
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 59
tcggagtatt cgtcgttgcg cgttttgaag tcgttggcgg taggcggttt tcgaggtcgg 60
cgggttgggc ggttcggtag tttgcgtcgc ggttttcgtt tcggtcgtta gt 112
<210> 60
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 60
gtattcgtcg ttgcgcg 17
<210> 61
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 61
cctcgaaaac cgcctacc 18
<210> 62
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 62
ccacggacgc gccaacgact t 21
<210> 63
<211> 134
<212> DNA
<213> 智人(Homo sapiens)
<400> 63
cgccgtgagt gttatagttc ttaaaggcgg cgtgtccgga gtttcttcct tctggtgggg 60
ttcgtggtct cgccggctca ggagtgaagc tgcagatctt cgcggtgagt gttacagctc 120
ctaaggcggc gcat 134
<210> 64
<211> 134
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 64
cgtcgtgagt gttatagttt ttaaaggcgg cgtgttcgga gttttttttt tttggtgggg 60
ttcgtggttt cgtcggttta ggagtgaagt tgtagatttt cgcggtgagt gttatagttt 120
ttaaggcggc gtat 134
<210> 65
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 65
taaaggcggc gtgttcg 17
<210> 66
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 66
caacttcact cctaaaccga c 21
<210> 67
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 67
ccacggacgc gaaaccacga a 21
<210> 68
<211> 107
<212> DNA
<213> 智人(Homo sapiens)
<400> 68
aactggcctt ctggctactc cggaatcgcc aagcagatga ggccagaccg ccgccagcgc 60
tgatcacgcg cgctcccaca ggtcctggcg cgcgtgttca gccgcgc 107
<210> 69
<211> 107
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 69
aattggtttt ttggttattt cggaatcgtt aagtagatga ggttagatcg tcgttagcgt 60
tgattacgcg cgtttttata ggttttggcg cgcgtgttta gtcgcgt 107
<210> 70
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 70
tggttttttg gttatttcgg aatcgt 26
<210> 71
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 71
gcgcgtaatc aacgctaac 19
<210> 72
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 72
cgccgaggcg acgatctaac 20
<210> 73
<211> 85
<212> DNA
<213> 智人(Homo sapiens)
<400> 73
ggagcgggca gaggaggagc ccagcgccga ggcccaggcg cgccccgccc tcgcccctcc 60
ccgtgcccct cccccgctgc tcccc 85
<210> 74
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 74
ggagcgggta gaggaggagt ttagcgtcga ggtttaggcg cgtttcgttt tcgttttttt 60
tcgtgttttt ttttcgttgt ttttt 85
<210> 75
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 75
gaggaggagt ttagcgtcg 19
<210> 76
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 76
cacgaaaaaa aacgaaaacg aaac 24
<210> 77
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 77
cgccgaggcg cgcctaaacc 20
<210> 78
<211> 107
<212> DNA
<213> 智人(Homo sapiens)
<400> 78
gcggtctatc acgggcaccc ctaacacttg gtgagtgcgc agtgctctcg gcagtctctg 60
ggctccatac gatgcctacc gcacgcccta gcagaggagg tctctgt 107
<210> 79
<211> 107
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 79
gcggtttatt acgggtattt ttaatatttg gtgagtgcgt agtgttttcg gtagtttttg 60
ggttttatac gatgtttatc gtacgtttta gtagaggagg tttttgt 107
<210> 80
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 80
tgagtgcgta gtgttttcgg 20
<210> 81
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 81
ctcctctact aaaacgtacg ataaaca 27
<210> 82
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 82
cgccgaggat cgtataaaac 20
<210> 83
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 83
atatttggtg agtgcgtagt g 21
<210> 84
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 84
acgtacgata aacatcgtat aaaacc 26
<210> 85
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 85
cgccgagggt tttcggtagt 20
<210> 86
<211> 121
<212> DNA
<213> 智人(Homo sapiens)
<400> 86
tactccactg ccggcttggt gcccacgctc ggcttccgcc cacccatgga ctacgccttt 60
agcgatctca tgcgtgaccg ctcggccgcc gctgctgcgg cggtgcacaa ggagccgacc 120
t 121
<210> 87
<211> 121
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 87
tattttattg tcggtttggt gtttacgttc ggttttcgtt tatttatgga ttacgttttt 60
agcgatttta tgcgtgatcg ttcggtcgtc gttgttgcgg cggtgtataa ggagtcgatt 120
t 121
<210> 88
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 88
tggtgtttac gttcggtttt cgt 23
<210> 89
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 89
ccgcaacaac gacgacc 17
<210> 90
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 90
cgccgaggcg aacgatcacg 20
<210> 91
<211> 106
<212> DNA
<213> 智人(Homo sapiens)
<400> 91
aggccggtca cgaacaaagc gctggcgagt gcgcgcccgc ccacgcgcac aggtgcccgc 60
gacaagacgc cccgtccccg cccacgcggc ccccgcgggc tgagcc 106
<210> 92
<211> 106
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 92
aggtcggtta cgaataaagc gttggcgagt gcgcgttcgt ttacgcgtat aggtgttcgc 60
gataagacgt ttcgttttcg tttacgcggt tttcgcgggt tgagtt 106
<210> 93
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 93
gttacgaata aagcgttggc g 21
<210> 94
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 94
aacgaaacgt cttatcgcga 20
<210> 95
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 95
ccacggacgg agtgcgcgtt c 21
<210> 96
<211> 85
<212> DNA
<213> 智人(Homo sapiens)
<400> 96
gccggccccg cagcatcctc ctgctcgcgg ctctcccgcc acctgtcccg ctccctgccg 60
cgccctgggg cccgcaccta cccac 85
<210> 97
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 97
gtcggtttcg tagtattttt ttgttcgcgg ttttttcgtt atttgtttcg ttttttgtcg 60
cgttttgggg ttcgtattta tttat 85
<210> 98
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 98
cggtttcgta gtattttttt gttcg 25
<210> 99
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 99
gaaccccaaa acgcgac 17
<210> 100
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 100
cgccgagggc ggttttttcg 20
<210> 101
<211> 134
<212> DNA
<213> 智人(Homo sapiens)
<400> 101
cgcctcctgg gctccccccg gagtgggagg gagccgcggt cccgcctccg cgcccgttcc 60
ctcccaggcc cctcggccgc cgcgccgagc tttccgcgcg tggacagact gcccggccga 120
cggacggacg cagg 134
<210> 102
<211> 134
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 102
cgttttttgg gtttttttcg gagtgggagg gagtcgcggt ttcgttttcg cgttcgtttt 60
tttttaggtt tttcggtcgt cgcgtcgagt ttttcgcgcg tggatagatt gttcggtcga 120
cggacggacg tagg 134
<210> 103
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 103
gagtcgcggt ttcgttttc 19
<210> 104
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 104
gacgcgacga ccgaaaaac 19
<210> 105
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 105
cgccgaggcg cgttcgtttt 20
<210> 106
<211> 108
<212> DNA
<213> 智人(Homo sapiens)
<400> 106
tccggcgccg cgttttctag agaaccgggt ctcagcgatg ctcatttcag ccccgtctta 60
atgcaacaaa cgaaacccca cacgaacgaa aaggaacatg tctgcgct 108
<210> 107
<211> 107
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 107
tcggcgtcgc gttttttaga gaatcgggtt ttagcgatgt ttattttagt ttcgttttaa 60
tgtaataaac gaaattttat acgaacgaaa aggaatatgt ttgcgtt 107
<210> 108
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 108
ggcgtcgcgt tttttagaga a 21
<210> 109
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 109
ttccttttcg ttcgtataaa atttcgtt 28
<210> 110
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 110
ccacggacga tcgggtttta g 21
<210> 111
<211> 128
<212> DNA
<213> 智人(Homo sapiens)
<400> 111
gggcctgctg gccggggacc cgcgcgtcga gcgcctggtg cgcgacagcg cctcctactg 60
ccgcgagcgc ttcgaccccg acgagtactc cacggccgtg cgcgaggcgc cagcggagct 120
cgccgaag 128
<210> 112
<211> 128
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 112
gggtttgttg gtcggggatt cgcgcgtcga gcgtttggtg cgcgatagcg ttttttattg 60
tcgcgagcgt ttcgatttcg acgagtattt tacggtcgtg cgcgaggcgt tagcggagtt 120
cgtcgaag 128
<210> 113
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 113
cgatagcgtt ttttattgtc gcg 23
<210> 114
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 114
gcacgaccgt aaaatactcg tc 22
<210> 115
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 115
ccacggacgc gaaatcgaaa c 21
<210> 116
<211> 140
<212> DNA
<213> 智人(Homo sapiens)
<400> 116
tagcagcagc cgcagccatg gcggggatga agacagcctc cggggactac atcgactcgt 60
catgggagct gcgggtgttt gtgggagagg aggacccaga ggccgagtcg gtcaccctgc 120
gggtcactgg ggagtcgcac 140
<210> 117
<211> 140
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 117
tagtagtagt cgtagttatg gcggggatga agatagtttt cggggattat atcgattcgt 60
tatgggagtt gcgggtgttt gtgggagagg aggatttaga ggtcgagtcg gttattttgc 120
gggttattgg ggagtcgtat 140
<210> 118
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 118
gttttcgggg attatatcga ttcg 24
<210> 119
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 119
cccaataacc cgcaaaataa cc 22
<210> 120
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 120
cgccgaggcg actcgacctc 20
<210> 121
<211> 104
<212> DNA
<213> 智人(Homo sapiens)
<400> 121
gtcccagaga cgccctaggg tcagaggtca tctccgtggc aacggaaact tcccgcgcta 60
cggcggctcc aacgggccgc ttccgccgca ttgcgtagcg aagc 104
<210> 122
<211> 104
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 122
gttttagaga cgttttaggg ttagaggtta ttttcgtggt aacggaaatt tttcgcgtta 60
cggcggtttt aacgggtcgt tttcgtcgta ttgcgtagcg aagt 104
<210> 123
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 123
tttcgtggta acggaaattt ttcg 24
<210> 124
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 124
cgacgaaaac gacccgt 17
<210> 125
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 125
cgccgagggc gttacggcgg 20
<210> 126
<211> 107
<212> DNA
<213> 智人(Homo sapiens)
<400> 126
gcgccccggc cgcaggcgga ggacagggag gagcgcacac gagaaagctc ccacgcgccc 60
gcgcctcgcc tccgacggga aggcgcctct tccgaccgtc ctggatg 107
<210> 127
<211> 107
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 127
gcgtttcggt cgtaggcgga ggatagggag gagcgtatac gagaaagttt ttacgcgttc 60
gcgtttcgtt ttcgacggga aggcgttttt ttcgatcgtt ttggatg 107
<210> 128
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 128
gagcgtatac gagaaagttt ttacg 25
<210> 129
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 129
aacgccttcc cgtcgaa 17
<210> 130
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 130
ccacggacgg cgttcgcgtt t 21
<210> 131
<211> 108
<212> DNA
<213> 智人(Homo sapiens)
<400> 131
cgagagggcg cgagcacagc cgaggccatg gaggtgacgg cggaccagcc gcgctgggtg 60
agccaccacc accccgccgt gctcaacggg cagcacccgg acacgcac 108
<210> 132
<211> 108
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 132
cgagagggcg cgagtatagt cgaggttatg gaggtgacgg cggattagtc gcgttgggtg 60
agttattatt atttcgtcgt gtttaacggg tagtattcgg atacgtat 108
<210> 133
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 133
gggcgcgagt atagtcg 17
<210> 134
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 134
caacgcgact aatccgc 17
<210> 135
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 135
cgccgaggcc gtcacctcca 20
<210> 136
<211> 141
<212> DNA
<213> 智人(Homo sapiens)
<400> 136
cgccccctca cctccccgat catgccgttc cagacgccat cgatcttctt tccgtgcttg 60
ccattggtga ccaggtagag gtcgtagctg aagccgatgg tatgcgccag ccgcttcaga 120
atgtcgatgc agaaaccctt g 141
<210> 137
<211> 141
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 137
cgttttttta ttttttcgat tatgtcgttt tagacgttat cgattttttt ttcgtgtttg 60
ttattggtga ttaggtagag gtcgtagttg aagtcgatgg tatgcgttag tcgttttaga 120
atgtcgatgt agaaattttt g 141
<210> 138
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 138
tcgattatgt cgttttagac gttatcg 27
<210> 139
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 139
tctacatcga cattctaaaa cgactaac 28
<210> 140
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 140
ccacggacgc gcataccatc g 21
<210> 141
<211> 93
<212> DNA
<213> 智人(Homo sapiens)
<400> 141
cggcgaggct tcccgcctgg cgcattacaa caagcgctcg accatcacct ccagggagat 60
ccagacggcc gtgcgcctgc tgcttcccgg gga 93
<210> 142
<211> 93
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 142
cggcgaggtt tttcgtttgg cgtattataa taagcgttcg attattattt ttagggagat 60
ttagacggtc gtgcgtttgt tgtttttcgg gga 93
<210> 143
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 143
tggcgtatta taataagcgt tcg 23
<210> 144
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 144
aacaacaaac gcacgacc 18
<210> 145
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 145
ccacggacgc gtctaaatct c 21
<210> 146
<211> 101
<212> DNA
<213> 智人(Homo sapiens)
<400> 146
gggcgggcca ggcgctgggc acggtgatgg ccaccactgg ggccctgggc aactactacg 60
tggactcgtt cctgctgggc gccgacgccg cggatgagct g 101
<210> 147
<211> 101
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 147
gggcgggtta ggcgttgggt acggtgatgg ttattattgg ggttttgggt aattattacg 60
tggattcgtt tttgttgggc gtcgacgtcg cggatgagtt g 101
<210> 148
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 148
ttgggtaatt attacgtgga ttcg 24
<210> 149
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 149
actcatccgc gacgtc 16
<210> 150
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 150
ccacggacgc gacgcccaac a 21
<210> 151
<211> 95
<212> DNA
<213> 智人(Homo sapiens)
<400> 151
gggccattgc cagaagacgt cttctcgggg cgccaggatt cacctttcct tcccgacctc 60
aacttcttcg cggccgactc ctgtctccag ctatc 95
<210> 152
<211> 95
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 152
gggttattgt tagaagacgt tttttcgggg cgttaggatt tatttttttt tttcgatttt 60
aattttttcg cggtcgattt ttgtttttag ttatt 95
<210> 153
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 153
gttagaagac gttttttcgg gg 22
<210> 154
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 154
aaaacaaaaa tcgaccgcga 20
<210> 155
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 155
cgccgagggc gttaggattt 20
<210> 156
<211> 106
<212> DNA
<213> 智人(Homo sapiens)
<400> 156
ggccccggaa gcccagctcc cgggccctgg agcccgccac ggcggcagcc ctgcggcggc 60
ggctggacct gggcagttgc ctggacgtgc tggcctttgc ccagca 106
<210> 157
<211> 106
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 157
ggtttcggaa gtttagtttt cgggttttgg agttcgttac ggcggtagtt ttgcggcggc 60
ggttggattt gggtagttgt ttggacgtgt tggtttttgt ttagta 106
<210> 158
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 158
agttttcggg ttttggagtt cgtta 25
<210> 159
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 159
ccaaatccaa ccgccgc 17
<210> 160
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 160
cgccgaggac ggcggtagtt 20
<210> 161
<211> 106
<212> DNA
<213> 智人(Homo sapiens)
<400> 161
ggcggcgccg gcggctgcgc ggggggcgcc aggccctgct gctgctgctg ctgctgactg 60
cggtagtagg cggcggcggc cacggcggca aagttgtggg tctgga 106
<210> 162
<211> 106
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 162
ggcggcgtcg gcggttgcgc ggggggcgtt aggttttgtt gttgttgttg ttgttgattg 60
cggtagtagg cggcggcggt tacggcggta aagttgtggg tttgga 106
<210> 163
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 163
ttgattgcgg tagtaggcg 19
<210> 164
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 164
aacccacaac tttaccgcc 19
<210> 165
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 165
cgccgaggcg taaccgccgc 20
<210> 166
<211> 154
<212> DNA
<213> 智人(Homo sapiens)
<400> 166
ggtttccccc caccccggcc tcggggtctc tccacgtctc cccgccgacg tgctcacctg 60
ctcagggggc gcccccgagc cgcgccccgc gcccgccccc aggagggcct ccgcgagccg 120
gctgcacacc ccgaggcggt cccggctgca caac 154
<210> 167
<211> 154
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 167
ggtttttttt tatttcggtt tcggggtttt tttacgtttt ttcgtcgacg tgtttatttg 60
tttagggggc gttttcgagt cgcgtttcgc gttcgttttt aggagggttt tcgcgagtcg 120
gttgtatatt tcgaggcggt ttcggttgta taat 154
<210> 168
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 168
gtttcggggt ttttttacgt tttttcg 27
<210> 169
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 169
aaacgcgact cgaaaacgc 19
<210> 170
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 170
cgccgagggt cgacgtgttt 20
<210> 171
<211> 95
<212> DNA
<213> 智人(Homo sapiens)
<400> 171
ctccggtttt cgcggttctc agcgatatta ggcgcggcca gtgtctgaaa gctcctcggg 60
gttacgtcct ggggcgactg gaggcggctc acgac 95
<210> 172
<211> 95
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 172
tttcggtttt cgcggttttt agcgatatta ggcgcggtta gtgtttgaaa gtttttcggg 60
gttacgtttt ggggcgattg gaggcggttt acgat 95
<210> 173
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 173
cggtttttag cgatattagg cg 22
<210> 174
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 174
cccaaaacgt aaccccga 18
<210> 175
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 175
cgccgagggc ggttagtgtt 20
<210> 176
<211> 143
<212> DNA
<213> 智人(Homo sapiens)
<400> 176
cgacggccgc ggaggaggaa ggccaggggg aaatttgcat ttcgtaaaac cgcggttaag 60
aaatgacgat gccacgtaga caagccagtt gtgacgttca gcacaacgtg ctactgaact 120
accgagatcc gccaccaaat ggc 143
<210> 177
<211> 143
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 177
cgacggtcgc ggaggaggaa ggttaggggg aaatttgtat ttcgtaaaat cgcggttaag 60
aaatgacgat gttacgtaga taagttagtt gtgacgttta gtataacgtg ttattgaatt 120
atcgagattc gttattaaat ggt 143
<210> 178
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 178
gggaaatttg tatttcgtaa aatcg 25
<210> 179
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 179
acaactaact tatctacgta acatcgt 27
<210> 180
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 180
ccacggacgg cggttaagaa a 21
<210> 181
<211> 116
<212> DNA
<213> 智人(Homo sapiens)
<400> 181
ggcttggggt ccagccgccc gcccctgccg ccaccgcacc atgtcctgcc tctactcccg 60
cctcagcgcc ccctgcgggg tccgcgcctt cagctgcatc tcggcctgcg ggcccc 116
<210> 182
<211> 116
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 182
ggtttggggt ttagtcgttc gtttttgtcg ttatcgtatt atgttttgtt tttattttcg 60
ttttagcgtt ttttgcgggg ttcgcgtttt tagttgtatt tcggtttgcg ggtttt 116
<210> 183
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 183
tcgttcgttt ttgtcgttat cg 22
<210> 184
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 184
aaccgaaata caactaaaaa cgc 23
<210> 185
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 185
ccacggacgc gaaccccgca a 21
<210> 186
<211> 108
<212> DNA
<213> 智人(Homo sapiens)
<400> 186
ggaaggctgc agcgagagat ttacatattc atccgagctt aaggaagccg cgataatgca 60
ggtacagccc gaaacccacg cccccagacc ttatctgcgc gccccgcc 108
<210> 187
<211> 108
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 187
ggaaggttgt agcgagagat ttatatattt attcgagttt aaggaagtcg cgataatgta 60
ggtatagttc gaaatttacg tttttagatt ttatttgcgc gtttcgtt 108
<210> 188
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 188
ttcgagttta aggaagtcg 19
<210> 189
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 189
tctaaaaacg taaatttcga act 23
<210> 190
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 190
ccacggacgg cgataatgta g 21
<210> 191
<211> 137
<212> DNA
<213> 智人(Homo sapiens)
<400> 191
ggagttattt ttaaccatcg cctcccagaa cattacggag cttcctctct ccaacacgca 60
ggaaacccta cttggctgtg cttcctgcta acacgaggcc ctgcgattgc tgagaacaac 120
agccccgaga ctgcgcg 137
<210> 192
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 192
ggagttattt ttaattatcg ttttttagaa tattacggag tttttttttt ttaatacgta 60
ggaaatttta tttggttgtg ttttttgtta atacgaggtt ttgcgattgt tgagaataat 120
agtttcgaga ttgcgcg 137
<210> 193
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 193
tttaattatc gttttttaga atattacgga 30
<210> 194
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 194
actattattc tcaacaatcg caaaac 26
<210> 195
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 195
ccacggacgc ctcgtattaa c 21
<210> 196
<211> 117
<212> DNA
<213> 智人(Homo sapiens)
<400> 196
ggcgggcgct tggccaaaca gcccaagact gcggaatcac actcgccact gtgtacctgg 60
acgccatctg cagacccagc gcctgcgggg attccggaaa cgggagagcg ggcttcc 117
<210> 197
<211> 117
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 197
ggcgggcgtt tggttaaata gtttaagatt gcggaattat attcgttatt gtgtatttgg 60
acgttatttg tagatttagc gtttgcgggg atttcggaaa cgggagagcg ggttttt 117
<210> 198
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 198
agtttaagat tgcggaatta tattcgt 27
<210> 199
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 199
ttccgaaatc cccgcaa 17
<210> 200
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 200
cgccgaggaa cgctaaatct 20
<210> 201
<211> 156
<212> DNA
<213> 智人(Homo sapiens)
<400> 201
cgcaggctga ggccctcggg tccccagcgg gtcctcgcca tcagtcactc tctacgggcc 60
aggcctgggg gtcacggcct gcaggagcct ccctgcgcgg ccccactccc tcatctgcga 120
ccccgtgggg aggcgaccct gaccaccctc gttccg 156
<210> 202
<211> 156
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 202
cgtaggttga ggttttcggg tttttagcgg gttttcgtta ttagttattt tttacgggtt 60
aggtttgggg gttacggttt gtaggagttt ttttgcgcgg ttttattttt ttatttgcga 120
tttcgtgggg aggcgatttt gattattttc gtttcg 156
<210> 203
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 203
ggttgaggtt ttcgggtttt tag 23
<210> 204
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 204
cctccccacg aaatcgc 17
<210> 205
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 205
cgccgagggc gggttttcgt 20
<210> 206
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 206
aggagttttt ttgcgcgg 18
<210> 207
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 207
acgaaaataa tcaaaatcgc ctcc 24
<210> 208
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 208
cgccgaggcc cacgaaatcg 20
<210> 209
<211> 114
<212> DNA
<213> 智人(Homo sapiens)
<400> 209
cgggggaggg cggcatcagc cagagcctca gccgacggcg ctccccaggt ccacttcccg 60
ctccgatacc ctccccctaa gcacgatacc cagggcccag ggctgctctt ggcg 114
<210> 210
<211> 114
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 210
cgggggaggg cggtattagt tagagtttta gtcgacggcg ttttttaggt ttatttttcg 60
tttcgatatt ttttttttaa gtacgatatt tagggtttag ggttgttttt ggcg 114
<210> 211
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 211
gcggtattag ttagagtttt agtcg 25
<210> 212
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 212
acaaccctaa accctaaata tcgt 24
<210> 213
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 213
ccacggacgg acggcgtttt t 21
<210> 214
<211> 107
<212> DNA
<213> 智人(Homo sapiens)
<400> 214
ctccgctccc cgcaggcctg gccgcgcgac gggcacccag cgggttgtta tcaattattc 60
aggccccaag ttcacgggca ctgcatccat ttccctcgcg tgcgccc 107
<210> 215
<211> 107
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 215
tttcgttttt cgtaggtttg gtcgcgcgac gggtatttag cgggttgtta ttaattattt 60
aggttttaag tttacgggta ttgtatttat ttttttcgcg tgcgttt 107
<210> 216
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 216
tttcgtaggt ttggtcgcg 19
<210> 217
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 217
aacctaaata attaataaca acccgc 26
<210> 218
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 218
ccacggacgg cgacgggtat t 21
<210> 219
<211> 88
<212> DNA
<213> 智人(Homo sapiens)
<400> 219
gtgggccggg cgtgacgcgc ggtcaaagtg caatgatttt tcagttcggt tggctaaaca 60
gggtcagagc tgagagcgaa gcagaagg 88
<210> 220
<211> 88
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 220
gtgggtcggg cgtgacgcgc ggttaaagtg taatgatttt ttagttcggt tggttaaata 60
gggttagagt tgagagcgaa gtagaagg 88
<210> 221
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 221
tggttcgggc gtgacgcg 18
<210> 222
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 222
tctaacccta tttaaccaac cga 23
<210> 223
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 223
cgccgagggc ggttaaagtg 20
<210> 224
<211> 94
<212> DNA
<213> 智人(Homo sapiens)
<400> 224
ggacctcctc ggccccgccc catccgcctt cgggatgctg ctgagccccg tcacctccac 60
ccccttctcg gtcaaggaca tcctgcgact ggag 94
<210> 225
<211> 94
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 225
ggattttttc ggtttcgttt tattcgtttt cgggatgttg ttgagtttcg ttatttttat 60
ttttttttcg gttaaggata ttttgcgatt ggag 94
<210> 226
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 226
gattttttcg gtttcgtttt attcg 25
<210> 227
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 227
caatcgcaaa atatccttaa ccga 24
<210> 228
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 228
ccacggacgg ttttcgggat g 21
<210> 229
<211> 89
<212> DNA
<213> 智人(Homo sapiens)
<400> 229
ctgtcagtgc tgaccgagcg ccgcgccttc cggccatacg ggctccacgg tgcgcggttc 60
cccagccctc gcggccctcc ccgcccccg 89
<210> 230
<211> 89
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 230
ttgttagtgt tgatcgagcg tcgcgttttt cggttatacg ggttttacgg tgcgcggttt 60
tttagttttc gcggtttttt tcgttttcg 89
<210> 231
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 231
cgtcgcgttt ttcggttata cg 22
<210> 232
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 232
cgcgaaaact aaaaaaccgc g 21
<210> 233
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 233
ccacggacgg caccgtaaaa c 21
<210> 234
<211> 114
<212> DNA
<213> 智人(Homo sapiens)
<400> 234
cggagtatgg tgaggagcgc gggggacggg tgcgggaagg ggacagcagg gctgagcctg 60
gggcccgcaa gacccagcag cccgagcggg cgcagagacc ccacgccacg caca 114
<210> 235
<211> 114
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 235
cggagtatgg tgaggagcgc gggggacggg tgcgggaagg ggatagtagg gttgagtttg 60
gggttcgtaa gatttagtag ttcgagcggg cgtagagatt ttacgttacg tata 114
<210> 236
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 236
ggttgagttt ggggttcg 18
<210> 237
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 237
cgtaacgtaa aatctctacg ccc 23
<210> 238
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 238
ccacggacgc gctcgaacta c 21
<210> 239
<211> 95
<212> DNA
<213> 智人(Homo sapiens)
<400> 239
ggagagcagc ccgcagaacc tggccgcgta ctacacgcct ttcccgtcct atggacacta 60
cagaaacagc ctggccaccg tggaggaaga cttcc 95
<210> 240
<211> 95
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 240
ggagagtagt tcgtagaatt tggtcgcgta ttatacgttt ttttcgtttt atggatatta 60
tagaaatagt ttggttatcg tggaggaaga ttttt 95
<210> 241
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 241
gagtagttcg tagaatttgg tcg 23
<210> 242
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 242
ccacgataac caaactattt ctataatatc c 31
<210> 243
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 243
ccacggacgg cgtattatac g 21
<210> 244
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 244
ggagagtagt tcgtagaatt tgg 23
<210> 245
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 245
ctatttctat aatatccata aaacgaaaaa aacgt 35
<210> 246
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 246
ccacggacgg tcgcgtatta t 21
<210> 247
<211> 92
<212> DNA
<213> 智人(Homo sapiens)
<400> 247
gggaaggtgc cctgcgcgcg cgcgctcacc agatgaagtc ggtgcagtgg ctgcagaagg 60
tgggctgctt gaagaagcgg gcggtgaatt tg 92
<210> 248
<211> 92
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 248
gggaaggtgt tttgcgcgcg cgcgtttatt agatgaagtc ggtgtagtgg ttgtagaagg 60
tgggttgttt gaagaagcgg gcggtgaatt tg 92
<210> 249
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 249
ggaaggtgtt ttgcgcg 17
<210> 250
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 250
cttctacaac cactacaccg a 21
<210> 251
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 251
ccacggacgg cgcgcgttta t 21
<210> 252
<211> 107
<212> DNA
<213> 智人(Homo sapiens)
<400> 252
gcctcggggc ccggggactc acaattacgg gcagagaaca catagtgaag agcacggtca 60
tcagcgccag cagcaggagg tgatccagct cctccagggg ctgaggg 107
<210> 253
<211> 107
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 253
gtttcggggt tcggggattt ataattacgg gtagagaata tatagtgaag agtacggtta 60
ttagcgttag tagtaggagg tgatttagtt tttttagggg ttgaggg 107
<210> 254
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 254
gggttcgggg atttataatt acgg 24
<210> 255
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 255
cctcctacta ctaacgctaa taacc 25
<210> 256
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 256
ccacggacgc gtactcttca c 21
<210> 257
<211> 80
<212> DNA
<213> 智人(Homo sapiens)
<400> 257
ggcggctgca gcggcacccg cgctcctgca ccagggactg tgccgagccg cgcgcggacg 60
ggagggaagc gtcccctcag 80
<210> 258
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 258
ggcggttgta gcggtattcg cgtttttgta ttagggattg tgtcgagtcg cgcgcggacg 60
ggagggaagc gtttttttag 80
<210> 259
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 259
gttgtagcgg tattcgcg 18
<210> 260
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 260
cttctctccc gtccgcgc 18
<210> 261
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 261
cgccgaggcg cgactcgaca 20
<210> 262
<211> 143
<212> DNA
<213> 智人(Homo sapiens)
<400> 262
tccagaaaca cgggtatctc cgcgtggtgc tttgcggtcg ccgtcgttgt ggccgtccgg 60
ggtggggtgt gaggagggga cgaaggaggg aaggaagggc aaggcggggg gggctctgcg 120
agagcgcgcc cagccccgcc ttc 143
<210> 263
<211> 143
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 263
tttagaaata cgggtatttt cgcgtggtgt tttgcggtcg tcgtcgttgt ggtcgttcgg 60
ggtggggtgt gaggagggga cgaaggaggg aaggaagggt aaggcggggg gggttttgcg 120
agagcgcgtt tagtttcgtt ttt 143
<210> 264
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 264
agaaatacgg gtattttcgc g 21
<210> 265
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 265
ccacaacgac gacgacc 17
<210> 266
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 266
ccacggacgc gcaaaacacc a 21
<210> 267
<211> 120
<212> DNA
<213> 智人(Homo sapiens)
<400> 267
cggtcgggca ggcgggacgg agattacctg gctgtccagg ggaccttatg cagggtttgg 60
cccgagccca ggggcagcga ggggcgtctg cggatgcggc tccctgtgcg gcacaacacc 120
<210> 268
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 268
cggtcgggta ggcgggacgg agattatttg gttgtttagg ggattttatg tagggtttgg 60
ttcgagttta ggggtagcga ggggcgtttg cggatgcggt tttttgtgcg gtataatatt 120
<210> 269
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 269
gttcgagttt aggggtagcg 20
<210> 270
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 270
ccgcacaaaa aaccgca 17
<210> 271
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 271
ccacggacga tccgcaaacg c 21
<210> 272
<211> 55
<212> DNA
<213> 智人(Homo sapiens)
<400> 272
ccggagcact cgccgctgcg cgccctgaag ccgctggcgg taggcggccc tcgag 55
<210> 273
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 273
tcggagtatt cgtcgttgcg cgttttgaag tcgttggcgg taggcggttt tcgag 55
<210> 274
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 274
ggagtattcg tcgttgcg 18
<210> 275
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 275
cgaaaaccgc ctaccgc 17
<210> 276
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 276
cgccgagggc gttttgaagt 20
<210> 277
<211> 96
<212> DNA
<213> 智人(Homo sapiens)
<400> 277
cccgggccta cggtcctccc gccacctcca cggggcggct gttggggccc caccaggcag 60
agccgtgttc tcaggcgttg gctctcatgg aggtgg 96
<210> 278
<211> 96
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 278
ttcgggttta cggttttttc gttattttta cggggcggtt gttggggttt tattaggtag 60
agtcgtgttt ttaggcgttg gtttttatgg aggtgg 96
<210> 279
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 279
acggtttttt cgttattttt acggg 25
<210> 280
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 280
caacgcctaa aaacacgact c 21
<210> 281
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 281
cgccgagggg cggttgttgg 20
<210> 282
<211> 148
<212> DNA
<213> 智人(Homo sapiens)
<400> 282
gggcctgtcc cgttccctgc tccccataca ggcgaggctg cgtgcacaca gcttcctgta 60
ccccaggagg gcctgcctgg cacgcacccg gtggctgcac catccacacg caagactgca 120
acttcagatg ctccgcacgc tggagatg 148
<210> 283
<211> 148
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 283
gggtttgttt cgttttttgt tttttatata ggcgaggttg cgtgtatata gttttttgta 60
ttttaggagg gtttgtttgg tacgtattcg gtggttgtat tatttatacg taagattgta 120
attttagatg tttcgtacgt tggagatg 148
<210> 284
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 284
ttatataggc gaggttgcgt 20
<210> 285
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 285
cttacgtata aataatacaa ccaccgaata 30
<210> 286
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 286
ccacggacga cgtaccaaac a 21
<210> 287
<211> 88
<212> DNA
<213> 智人(Homo sapiens)
<400> 287
cggagctagg agggtggggc tcggagggcg caggaagagc ggctctgcga ggaaagggaa 60
aggagaggcc gcttctggga agggaccc 88
<210> 288
<211> 88
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 288
cggagttagg agggtggggt tcggagggcg taggaagagc ggttttgcga ggaaagggaa 60
aggagaggtc gtttttggga agggattt 88
<210> 289
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 289
ttaggagggt ggggttcg 18
<210> 290
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 290
ctttcctcgc aaaaccgc 18
<210> 291
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 291
ccacggacgg gagggcgtag g 21
<210> 292
<211> 59
<212> DNA
<213> 智人(Homo sapiens)
<400> 292
gccccggcgg gccccgaggc ggccgcggcc tgcaacgtca tcgtgaacgg cacgcgcgg 59
<210> 293
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 293
gtttcggcgg gtttcgaggc ggtcgcggtt tgtaacgtta tcgtgaacgg tacgcgcgg 59
<210> 294
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 294
tttcggcggg tttcgag 17
<210> 295
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 295
cgtaccgttc acgataacgt 20
<210> 296
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 296
cgccgagggg cggtcgcggt 20
<210> 297
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 297
cgccgaggtt acaaaccgcg 20
<210> 298
<211> 89
<212> DNA
<213> 智人(Homo sapiens)
<400> 298
ctaggcgaga tggtggaagg cgtgtccgta cgggggtggg ctggggtccc cgtgcagaag 60
ggcgcgcgag gacccaggct ggttttccc 89
<210> 299
<211> 89
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 299
ttaggcgaga tggtggaagg cgtgttcgta cgggggtggg ttggggtttt cgtgtagaag 60
ggcgcgcgag gatttaggtt ggttttttt 89
<210> 300
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 300
cgagatggtg gaaggcg 17
<210> 301
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 301
gcgcccttct acacgaa 17
<210> 302
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 302
ccacggacgg tgttcgtacg g 21
<210> 303
<211> 145
<212> DNA
<213> 智人(Homo sapiens)
<400> 303
gcgctgctgc gccgccaggc aaggcgaggg tccgggagaa ggctcggctc cctcctaaac 60
atgtggcccg tggcgtcccc ttgtcccctc cgagcgatgc tcctgcgccc ttcgccgcct 120
cccgcgctgc tgcgccgcca ggcaa 145
<210> 304
<211> 123
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 304
ggcgagggtt cgggagaagg ttcggttttt ttttaaatat gtggttcgtg gcgttttttt 60
gtttttttcg agcgatgttt ttgcgttttt cgtcgttttt cgcgttgttg cgtcgttagg 120
taa 123
<210> 305
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 305
aaatatgtgg ttcgtggcgt t 21
<210> 306
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 306
acgcaacaac gcgaaaaac 19
<210> 307
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 307
cgccgaggcg acgaaaaacg 20
<210> 308
<211> 137
<212> DNA
<213> 智人(Homo sapiens)
<400> 308
acgagaaaga gatcgtgcag ggggtgctgc aacagggcac ggcgtggagg aggaaccaga 60
ccgcggccag agcgttcagg tactcctgcc ctcgcggctc ctcccctcta gcgtcctttc 120
ctccccgagt gcagagg 137
<210> 309
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 309
acgagaaaga gatcgtgtag ggggtgttgt aatagggtac ggcgtggagg aggaattaga 60
tcgcggttag agcgtttagg tatttttgtt ttcgcggttt ttttttttta gcgttttttt 120
tttttcgagt gtagagg 137
<210> 310
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 310
ggggtgttgt aatagggtac g 21
<210> 311
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 311
ctaaacgctc taaccgcga 19
<210> 312
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 312
ccacggacgg gcgtggagga g 21
<210> 313
<211> 117
<212> DNA
<213> 智人(Homo sapiens)
<400> 313
cgcgccgttg gtcacctcgc cggccgccag cgtcgaatgg aagcccgact tgtaccagga 60
ctcgtacggg tgcgccatgc ccacgcgcgg gtacagcccg tcggctgccg tcgtgtg 117
<210> 314
<211> 117
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 314
cgcgtcgttg gttatttcgt cggtcgttag cgtcgaatgg aagttcgatt tgtattagga 60
ttcgtacggg tgcgttatgt ttacgcgcgg gtatagttcg tcggttgtcg tcgtgtg 117
<210> 315
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 315
tagcgtcgaa tggaagttcg a 21
<210> 316
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 316
ggtcgttagc gtcgaatg 18
<210> 317
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 317
gcgcgtaaac ataacgcacc 20
<210> 318
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 318
ccacggacgc cgtacgaatc c 21
<210> 319
<211> 85
<212> DNA
<213> 智人(Homo sapiens)
<400> 319
ggttccttcc cgtgggttct taatcgtctc gctgacttcc agaatgaaac tgcagaccct 60
cgcggtaaag atggcgtgac cagaa 85
<210> 320
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 320
ggtttttttt cgtgggtttt taatcgtttc gttgattttt agaatgaaat tgtagatttt 60
cgcggtaaag atggcgtgat tagaa 85
<210> 321
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 321
tcgtgggttt ttaatcgttt cg 22
<210> 322
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 322
tcacgccatc tttaccgc 18
<210> 323
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 323
ccacggacgc gaaaatctac a 21
<210> 324
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 324
ggtttttttt cgtgggtttt taatcg 26
<210> 325
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 325
ctaatcacgc catctttacc g 21
<210> 326
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 326
ccacggacgg tttcgttgat t 21
<210> 327
<211> 115
<212> DNA
<213> 智人(Homo sapiens)
<400> 327
ggagtgagtg cctacaacgc gcaggccgga ctgatccccc gttgctgcag gttggtgccc 60
caagctgcgg gtgctcgggc gccaactaaa gccagctctg tccagacgcg gaaag 115
<210> 328
<211> 115
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 328
ggagtgagtg tttataacgc gtaggtcgga ttgatttttc gttgttgtag gttggtgttt 60
taagttgcgg gtgttcgggc gttaattaaa gttagttttg tttagacgcg gaaag 115
<210> 329
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 329
cgtaggtcgg attgattttt cgt 23
<210> 330
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 330
tctaaacaaa actaacttta attaacgccc 30
<210> 331
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 331
ccacggacgc gaacacccgc a 21
<210> 332
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 332
aggaaattgc gggttttcg 19
<210> 333
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 333
ggaaggaaat tgcgggtttt c 21
<210> 334
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 334
ccaaaaatcg tcgctaaaaa tcaac 25
<210> 335
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 335
ccacggacgc gcgcattcac t 21
<210> 336
<211> 100
<212> DNA
<213> 智人(Homo sapiens)
<400> 336
ggcggccgcg acccctcccc gctgacctca ctcgagccgc cgcctggcgc agatataagc 60
ggcggcccat ctgaagaggg ctcggcaggc gcccggggtc 100
<210> 337
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 337
ggcggtcgcg attttttttc gttgatttta ttcgagtcgt cgtttggcgt agatataagc 60
ggcggtttat ttgaagaggg ttcggtaggc gttcggggtt 100
<210> 338
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 338
tttcgttgat tttattcgag tcg 23
<210> 339
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 339
tcttcaaata aaccgccgc 19
<210> 340
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 340
cgccgagggt cgtttggcgt 20
<210> 341
<211> 118
<212> DNA
<213> 智人(Homo sapiens)
<400> 341
cgggtggtga agctgcccca cggcctggga gagccttatc gccgcggtcg ctggacgtgt 60
gtggatgttt atgagcgaga cctggagccc cacagcttcg gcggactcct ggagggaa 118
<210> 342
<211> 118
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 342
cgggtggtga agttgtttta cggtttggga gagttttatc gtcgcggtcg ttggacgtgt 60
gtggatgttt atgagcgaga tttggagttt tatagtttcg gcggattttt ggagggaa 118
<210> 343
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 343
gtttgggaga gttttatcgt cg 22
<210> 344
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 344
cctccaaaaa tccgccga 18
<210> 345
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 345
cgccgagggc ggtcgttgga 20
<210> 346
<211> 70
<212> DNA
<213> 智人(Homo sapiens)
<400> 346
ggggcggggg ccgacagccc acgctggcgc ggcaggcgcg tgcgcccgcc gttttcgtga 60
gcccgagcag 70
<210> 347
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 347
ggggtcgggg tcgatagttt acgttggcgc ggtaggcgcg tgcgttcgtc gttttcgtga 60
gttcgagtag 70
<210> 348
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 348
gtcggggtcg atagtttacg 20
<210> 349
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 349
actcgaactc acgaaaacg 19
<210> 350
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 350
cgccgaggga cgaacgcacg 20
<210> 351
<211> 96
<212> DNA
<213> 智人(Homo sapiens)
<400> 351
ggagccccca gccccacgcg ggcacacgca gggtgggtgg tcacgcccgc agggtccgcg 60
agcgcggcgc agagcgcggg ccgtgggaag tttctc 96
<210> 352
<211> 96
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 352
ggagttttta gttttacgcg ggtatacgta gggtgggtgg ttacgttcgt agggttcgcg 60
agcgcggcgt agagcgcggg tcgtgggaag tttttt 96
<210> 353
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 353
gtagggtggg tggttacg 18
<210> 354
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 354
aacttcccac gacccgc 17
<210> 355
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 355
cgccgagggt tcgtagggtt 20
<210> 356
<211> 127
<212> DNA
<213> 智人(Homo sapiens)
<400> 356
ggcgccgcca ttgcggtcct cattttgctg ctggtgggtt gggctacagc aggcctctgg 60
agccacacca gggcacggga gtgggtgcag ggaccgtcac cgcgccttca cacgcaccat 120
agtgccc 127
<210> 357
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 357
ggcgtcgtta ttgcggtttt tattttgttg ttggtgggtt gggttatagt aggtttttgg 60
agttatatta gggtacggga gtgggtgtag ggatcgttat cgcgttttta tacgtattat 120
agtgttt 127
<210> 358
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 358
tggagttata ttagggtacg gga 23
<210> 359
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 359
acactataat acgtataaaa acgcgata 28
<210> 360
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 360
ccacggacga acgatcccta c 21
<210> 361
<211> 140
<212> DNA
<213> 智人(Homo sapiens)
<400> 361
ggcggcgagg ggcgcgtccg cgggtgggtt tcacctgggt ggtgggcatg tcgggcccgc 60
tagggcgagg gtctggccag gggcgtagtt ctcctggtgg gtggggacgc tccgtggcga 120
ttggggtcac tcctctgagg 140
<210> 362
<211> 140
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 362
ggcggcgagg ggcgcgttcg cgggtgggtt ttatttgggt ggtgggtatg tcgggttcgt 60
tagggcgagg gtttggttag gggcgtagtt tttttggtgg gtggggacgt ttcgtggcga 120
ttggggttat ttttttgagg 140
<210> 363
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 363
ggtggtgggt atgtcgg 17
<210> 364
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 364
ccaatcgcca cgaaacg 17
<210> 365
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 365
ccacggacgg gttcgttagg g 21
<210> 366
<211> 117
<212> DNA
<213> 智人(Homo sapiens)
<400> 366
ccgtgggcgc ggacagctgc cgggagcggc aggcgtctcg atcggggacg caggcacttc 60
cgtccctgca gagcatcaga cgcgtctcgg gacactgggg acaacatctc ctccgcg 117
<210> 367
<211> 117
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 367
tcgtgggcgc ggatagttgt cgggagcggt aggcgtttcg atcggggacg taggtatttt 60
cgtttttgta gagtattaga cgcgtttcgg gatattgggg ataatatttt tttcgcg 117
<210> 368
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 368
gttgtcggga gcggtagg 18
<210> 369
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 369
ccaatatccc gaaacgcgtc t 21
<210> 370
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 370
ccacggacgg cgtttcgatc g 21
<210> 371
<211> 120
<212> DNA
<213> 智人(Homo sapiens)
<400> 371
aagctgcgcc cggagacgtg ggagcgttct cttgttttcc gagtgcgcgg actcatcggg 60
tcacagttta tgcttttatg acgcggtgag tccagccact gattcctaac ggtttagagt 120
<210> 372
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 372
aagttgcgtt cggagacgtg ggagcgtttt tttgtttttc gagtgcgcgg atttatcggg 60
ttatagttta tgtttttatg acgcggtgag tttagttatt gatttttaac ggtttagagt 120
<210> 373
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 373
cgtttttttg tttttcgagt gcg 23
<210> 374
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 374
tcaataacta aactcaccgc gtc 23
<210> 375
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 375
ccacggacgg cggatttatc g 21
<210> 376
<211> 224
<212> DNA
<213> 智人(Homo sapiens)
<400> 376
ctctgacctg agtctccttt ggaactctgc aggttctatt tgctttttcc cagatgagct 60
ctttttctgg tgtttgtctc tctgactagg tgtctaagac agtgttgtgg gtgtaggtac 120
taacactggc tcgtgtgaca aggccatgag gctggtgtaa agcggccttg gagtgtgtat 180
taagtaggtg cacagtaggt ctgaacagac tccccatccc aaga 224
<210> 377
<211> 224
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 377
ttttgatttg agtttttttt ggaattttgt aggttttatt tgtttttttt tagatgagtt 60
ttttttttgg tgtttgtttt tttgattagg tgtttaagat agtgttgtgg gtgtaggtat 120
taatattggt ttgtgtgata aggttatgag gttggtgtaa agtggttttg gagtgtgtat 180
taagtaggtg tatagtaggt ttgaatagat tttttatttt aaga 224
<210> 378
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 378
ccatgaggct ggtgtaaag 19
<210> 379
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 379
ctactgtgca cctacttaat acac 24
<210> 380
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 380
cgccgagggc ggccttggag 20
<210> 381
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 381
gtgtttgttt ttttgattag gtgtttaaga 30
<210> 382
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 382
ctttacacca acctcataac cttatc 26
<210> 383
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 383
gacgcggaga tagtgttgtg g 21
<210> 384
<211> 139
<212> DNA
<213> 智人(Homo sapiens)
<400> 384
ggccacacag gcccactctg gccctctgag cccccggcgg acccagggca ttcaaggagc 60
ggctctgggc tgccagcgca ggcctccgcg caaacacagc aggctggaag tggcgctcat 120
caccggcacg tcttcccag 139
<210> 385
<211> 139
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 385
ggttatatag gtttattttg gttttttgag ttttcggcgg atttagggta tttaaggagc 60
ggttttgggt tgttagcgta ggttttcgcg taaatatagt aggttggaag tggcgtttat 120
tatcggtacg tttttttag 139
<210> 386
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 386
ggtttatttt ggttttttga gttttcgg 28
<210> 387
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 387
tccaacctac tatatttacg cgaa 24
<210> 388
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 388
ccacggacgg cggatttagg g 21
<210> 389
<211> 171
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 389
tccacgtggt gcccactctg gacaggtgga gcagagggaa ggtggtggca tggtggggag 60
ggtggcctgg aggacccgat tggctgagtg taaaccagga gaggacatga ctttcagccc 120
tgcagccaga cacagctgag ctggtgtgac ctgtgtggag agttcatctg g 171
<210> 390
<211> 180
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 390
tttatcgtgg tgtttatttt ggataggtgg agtagaggga aggtggtgcg tatggtgggc 60
gagcgcgtgc gtttggagga tttcgattgg ttgacgtgta aattaggacg aggatatgat 120
ttttagtttt gtagttagat atagttgagt tggtgtgatt tgtgtggaga gtttatttgg 180
<210> 391
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 391
cgcatggtgg gcgag 15
<210> 392
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 392
acacgtcagc caatcggg 18
<210> 393
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 393
gacgcggagg cgcgtgcgcc 20
<210> 394
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 394
tgcgtatggt gggcgag 17
<210> 395
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 395
cctaatttac acgtcaacca atcgaa 26
<210> 396
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 396
gacgcggagg cgcgtgcgtt t 21
<210> 397
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 397
ccacggacgg cgcgtgcgtt t 21
<210> 398
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 398
agccggtttt ccggctgaga cctcggcg 28
<210> 399
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 399
agccggtttt ccggctgaga cctcggcg 28
<210> 400
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 400
agccggtttt ccggctgaga ctccgcgtc 29
<210> 401
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 401
agccggtttt ccggctgaga cgtccgtgg 29
<210> 402
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 402
agccggtttt ccggctgaga ggacgcgc 28
<210> 403
<211> 108
<212> DNA
<213> 智人(Homo sapiens)
<400> 403
ggaaggaaat tgcgggttcc cgtctgcctt gtctccagct tctctgctga agcccggtag 60
cagtgaatgc gcgctgactt tcagcgacga ctcctggaag caacgcca 108
<210> 404
<211> 108
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 404
ggaaggaaat tgcgggtttt cgtttgtttt gtttttagtt tttttgttga agttcggtag 60
tagtgaatgc gcgttgattt ttagcgacga tttttggaag taacgtta 108
<210> 405
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 405
aggccacgga cgcgaaaaat cccacgc 27
<210> 406
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 406
gtcgagcgtt tggtgcg 17
<210> 407
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 407
ctcgtcgaaa tcgaaacgc 19
<210> 408
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 408
cgcgccgagg gcgatagcgt tttttattgt cg 32
<210> 409
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 409
cgaggttatg gaggtgacg 19
<210> 410
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 410
cgaatactac ccgttaaaca cg 22
<210> 411
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 411
aggccacgga cgggcggatt agtcgcg 27
<210> 412
<211> 330
<212> DNA
<213> 智人(Homo sapiens)
<400> 412
ggcggcgccg cgaccgcctt ccttcgctgc gtcccgcccg ctccacgcct cgctcaccgc 60
cgccgcttct ccctgccccg cagcgcgcag ggaccatgtc ggcggagacc gcgagcggcc 120
ccacagagga ccaggtggaa atcctggagt acaacttcaa caaggtcgac aagcacccgg 180
attccaccac gctgtgcctc atcgcggccg aggcaggcct ttccgaggag gagacccagg 240
tgcgtcccca cacgcgccca gcgcgccccg acccctgcct gggctgagcc ttctcgcggc 300
tgggcggtcc tgttcgtccg cgcctcccgc 330
<210> 413
<211> 330
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 413
ggcggcgtcg cgatcgtttt ttttcgttgc gtttcgttcg ttttacgttt cgtttatcgt 60
cgtcgttttt ttttgtttcg tagcgcgtag ggattatgtc ggcggagatc gcgagcggtt 120
ttatagagga ttaggtggaa attttggagt ataattttaa taaggtcgat aagtattcgg 180
attttattac gttgtgtttt atcgcggtcg aggtaggttt tttcgaggag gagatttagg 240
tgcgttttta tacgcgttta gcgcgtttcg atttttgttt gggttgagtt ttttcgcggt 300
tgggcggttt tgttcgttcg cgtttttcgt 330
<210> 414
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 414
gcgtcgcgat cgtttttttt cg 22
<210> 415
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 415
aacgacgacg ataaacgaaa cgta 24
<210> 416
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 416
aggccacgga cggttgcgtt tcgttcgttt 30
<210> 417
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 417
gtagcgcgta gggattatgt cg 22
<210> 418
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 418
tttccaccta atcctctata aaaccgc 27
<210> 419
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 419
aggccacgga cgctcgcgat ctccgc 26
<210> 420
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 420
acgttgtgtt ttatcgcgg 19
<210> 421
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 421
ctaaacgcgt ataaaaacgc ac 22
<210> 422
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 422
aggccacgga cggtcgaggt aggttttttc ga 32
<210> 423
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 423
caactcatcc gcgacg 16
<210> 424
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 424
aggccacgga cggtcgacgc ccaacaa 27
<210> 425
<211> 37
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 425
cgcgccgagg gcgttaggat ttattttttt ttttcga 37
<210> 426
<211> 72
<212> DNA
<213> 智人(Homo sapiens)
<400> 426
cgggacagag ccgaccaatc aggcggctcg gcagcggggc agaggtcagg gggcgggccg 60
aggggaagcc aa 72
<210> 427
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 427
cgggatagag tcgattaatt aggcggttcg gtagcggggt agaggttagg gggcgggtcg 60
aggggaagtt aa 72
<210> 428
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 428
cgggatagag tcgattaatt aggc 24
<210> 429
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 429
taacttcccc tcgacccg 18
<210> 430
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 430
cgcgccgagg cggttcggta gcgg 24
<210> 431
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 431
cgcgccgagg ttacaaaccg cgaccg 26
<210> 432
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 432
ttttcgttga ttttattcga gtcgtc 26
<210> 433
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 433
gaaccctctt caaataaacc gc 22
<210> 434
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 434
cgcgccgagg cgtttggcgt agatataagc 30
<210> 435
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 435
aggccacgga cggcggattt atcgggttat agt 33
<210> 436
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 436
acggacgcgg aggcggattt agggtattta aggag 35
<210> 437
<211> 1371
<212> RNA
<213> 智人(Homo sapiens)
<400> 437
aaucauuaga gccugaguca cucuccccag gagacccaga ccuagaacua cccagagcaa 60
gaccacagcu ggugaacagu ccagccuguc uccaguugga cuagccacaa uucaagugcu 120
ugaaaaccac auguggagca gacaagaugg agacaaauuc cucucucccc acgaacaucu 180
cuggagggac accugcugua ucugcuggcu aucucuuccu ggauaucauc acuuaucugg 240
uauuugcagu caccuuuguc cucggggucc ugggcaacgg gcuugugauc uggguggcug 300
gauuccggau gacacacaca gucaccacca ucaguuaccu gaaccuggcc guggcugacu 360
ucuguuucac cuccacuuug ccauucuuca uggucaggaa ggccauggga ggacauuggc 420
cuuucggcug guuccugugc aaauucgucu uuaccauagu ggacaucaac uuguucggaa 480
gugucuuccu gaucgcccuc auugcucugg accgcugugu uugcguccug cauccagucu 540
ggacccagaa ccaccgcacc gugagccugg ccaagaaggu gaucauuggg cccuggguga 600
uggcucugcu ccucacauug ccaguuauca uucgugugac uacaguaccu gguaaaacgg 660
ggacaguagc cugcacuuuu aacuuuucgc ccuggaccaa cgacccuaaa gagaggauaa 720
auguggccgu ugccauguug acggugagag gcaucauccg guucaucauu ggcuucagcg 780
cacccauguc caucguugcu gucaguuaug ggcuuauugc caccaagauc cacaagcaag 840
gcuugauuaa guccagucgu cccuuacggg uccucuccuu ugucgcagca gccuuuuuuc 900
ucugcugguc cccauaucag gugguggccc uuauagccac agucagaauc cgugaguuau 960
ugcaaggcau guacaaagaa auugguauug caguggaugu gacaagugcc cuggccuucu 1020
ucaacagcug ccucaacccc augcucuaug ucuucauggg ccaggacuuc cgggagaggc 1080
ugauccacgc ccuucccgcc agucuggaga gggcccugac cgaggacuca acccaaacca 1140
gugacacagc uaccaauucu acuuuaccuu cugcagaggu ggaguuacag gcaaagugag 1200
gagggagcug ggggacacuu ucgagcuccc agcuccagcu ucgucucacc uugaguuagg 1260
cugagccaca ggcauuuccu gcuuauuuua ggauuaccca cucaucagaa aaaaaaaaaa 1320
aagccuuugu guccccugau uuggggagaa uaaacagaua ugaguuuauu a 1371
<210> 438
<211> 106
<212> RNA
<213> 智人(Homo sapiens)
<400> 438
guugccaugu ugacggugag aggcaucauc cgguucauca uuggcuucag cgcacccaug 60
uccaucguug cugucaguua ugggcuuauu gccaccaaga uccaca 106
<210> 439
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 439
tgacggtgag aggcatca 18
<210> 440
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 440
ggtggcaata agcccataac tg 22
<210> 441
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 441
cggttcatca ttggcttcag cgc 23
<210> 442
<211> 180
<212> PRT
<213> 智人(Homo sapiens)
<400> 442
Met Gln Ala Glu Gly Arg Gly Thr Gly Gly Ser Thr Gly Asp Ala Asp
1 5 10 15
Gly Pro Gly Gly Pro Gly Ile Pro Asp Gly Pro Gly Gly Asn Ala Gly
20 25 30
Gly Pro Gly Glu Ala Gly Ala Thr Gly Gly Arg Gly Pro Arg Gly Ala
35 40 45
Gly Ala Ala Arg Ala Ser Gly Pro Gly Gly Gly Ala Pro Arg Gly Pro
50 55 60
His Gly Gly Ala Ala Ser Gly Leu Asn Gly Cys Cys Arg Cys Gly Ala
65 70 75 80
Arg Gly Pro Glu Ser Arg Leu Leu Glu Phe Tyr Leu Ala Met Pro Phe
85 90 95
Ala Thr Pro Met Glu Ala Glu Leu Ala Arg Arg Ser Leu Ala Gln Asp
100 105 110
Ala Pro Pro Leu Pro Val Pro Gly Val Leu Leu Lys Glu Phe Thr Val
115 120 125
Ser Gly Asn Ile Leu Thr Ile Arg Leu Thr Ala Ala Asp His Arg Gln
130 135 140
Leu Gln Leu Ser Ile Ser Ser Cys Leu Gln Gln Leu Ser Leu Leu Met
145 150 155 160
Trp Ile Thr Gln Cys Phe Leu Pro Val Phe Leu Ala Gln Pro Pro Ser
165 170 175
Gly Gln Arg Arg
180
<210> 443
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 443
ccagttggac tagccacaat tcaag 25
<210> 444
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 444
aggaatttgt ctccatcttg tctgc 25
<210> 445
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 445
cgcgccgagg ctccacatgt ggttttcaag 30
<210> 446
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 446
aggccacgga cgctccacat gtggttttca ag 32
<210> 447
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 447
gcccaagtct ccatcatgac 20
<210> 448
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 448
ggtggtccac aaaggtgtc 19
<210> 449
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 449
cgcgccgagg cctacgatga atttaagcac tg 32
<210> 450
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 450
acggacgcgg agcctacgat gaatttaagc actg 34
<210> 451
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 451
aggccacgga cgcctacgat gaatttaagc actg 34
<210> 452
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 452
acgaccggtt tggcttct 18
<210> 453
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 453
ccatcagcat tgccgtc 17
<210> 454
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 454
cgcgccgagg cctgggtgta gagtctctc 29
<210> 455
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 455
acggacgcgg agcctgggtg tagagtctct c 31
<210> 456
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 456
aggccacgga cgcctgggtg tagagtctct c 31
<210> 457
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 457
tatcatttgg ctggcaagga g 21
<210> 458
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 458
tcaccaaggg cgatttaata tgg 23
<210> 459
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 459
cgcgccgagg ggtcattcat acttctcttg gat 33
<210> 460
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 460
acggacgcgg agggtcattc atacttctct tggat 35
<210> 461
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 461
agaacatgga tgaccagtgg at 22
<210> 462
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 462
ggcagcgttt tgtgtggg 18
<210> 463
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 463
cgcgccgagg tgcaggatga aatggagatc 30
<210> 464
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 464
acggacgcgg agtgcaggat gaaatggaga tc 32
<210> 465
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 465
tgcgaaaaga tctgcaaaat tttctc 26
<210> 466
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 466
aggtcctcca tgatgtgttc tatg 24
<210> 467
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 467
cgcgccgagg caagaaggag aataagaatg aaaagg 36
<210> 468
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 468
acggacgcgg agcaagaagg agaataagaa tgaaaagg 38
<210> 469
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 469
aggccacgga cgcaagaagg agaataagaa tgaaaagg 38
<210> 470
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 470
ctgcttacaa aggagcttgc a 21
<210> 471
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 471
gccttggaat atttcatcaa tgacag 26
<210> 472
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 472
cgcgccgagg gctttatctt tgatattctt gatggt 36
<210> 473
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 473
aggccacgga cggctttatc tttgatattc ttgatggt 38
<210> 474
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 474
ggattcaatg tcatccagag cc 22
<210> 475
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 475
tctgacccac gatacagcag 20
<210> 476
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 476
cgcgccgagg ccagagcaga tgcaagtg 28
<210> 477
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 477
aggccacgga cgccagagca gatgcaagtg 30
<210> 478
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 478
acatgcaaaa cttgcagatt ttgg 24
<210> 479
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 479
tgttcctatc actgtattcc gct 23
<210> 480
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 480
acggacgcgg agttggccat ggtatctgta ag 32
<210> 481
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 481
aggccacgga cgttggccat ggtatctgta ag 32
<210> 482
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 482
gccggccgtc tccttaac 18
<210> 483
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 483
tctccatcag aactctgcaa c 21
<210> 484
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 484
acggacgcgg agcaccgaac accatgcc 28
<210> 485
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 485
gtgctgagga gtcggagtg 19
<210> 486
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 486
tccgagagaa cagcatcacc 20
<210> 487
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 487
cgcgccgagg gtgagagtga agatggcatt 30
<210> 488
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 488
aggccacgga cggtgagagt gaagatggca tt 32
<210> 489
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 489
tttgtaacct ttgacgacca tgac 24
<210> 490
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 490
ggccattcac agtatggtat ttct 24
<210> 491
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 491
aggccacgga cgtgaatgac aatcttatcc acgg 34

Claims (64)

1.一种用于测量从受试者取样的血液中一种或多种基因表达产物的量的方法,所述方法包括:
a)从自受试者取样的血液中提取:
i)至少一种基因表达标记物,其中所述至少一种基因表达标记物为选自S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1的标记基因的表达产物;以及
ii)至少一种参考标记物;
b)测量在a)中提取的所述至少一种基因表达标记物的量和至少一种参考标记物的量;
c)将所述至少一种基因表达标记物的量的值计算为所述至少一种参考标记物的量的百分比,其中所述值指示从所述受试者取样的所述血液中的所述至少一种基因表达标记物的量。
2.如权利要求1所述的方法,其中所述提取包括从选自全血、包含白血细胞的血液制品以及包含血浆的血液制品的样品提取标记物。
3.如权利要求1或权利要求2所述的方法,其中所述至少一种基因表达标记物包括蛋白质或RNA。
4.如权利要求3所述的方法,其中从自所述受试者取样的所述血液提取的RNA包括循环无细胞RNA。
5.如权利要求3-4中任一项所述的方法,其中从自所述受试者取样的所述血液提取的RNA包括由免疫细胞表达的RNA。
6.如权利要求3-5中任一项所述的方法,其中从自所述受试者取样的所述血液提取的RNA包括mRNA。
7.如权利要求1-6中任一项所述的方法,其中所述至少一种基因表达标记物由2、3、4、5、6、7、8或9种基因表达标记物组成。
8.如权利要求1-7中任一项所述的方法,其中所述至少一种参考标记物包括由选自以下的基因表达的RNA或蛋白质:PLGLB2、GABARAP、NACA、EIF1、UBB、UBC、CD81、TMBIM6、MYL12B、HSP90B1、CLDN18、RAMP2、MFAP4、FABP4、MARCO、RGL1、ZBTB16、C10orf116、GRK5、AGER、SCGB1A1、HBB、TCF21、GMFG、HYAL1、TEK、GNG11、ADH1A、TGFBR3、INPP1、ADH1B、STK4、ACTB、HNRNPA1、CASC3和SKP1。
9.如权利要求8所述的方法,其中所述至少一种参考标记物包括RNA。
10.如权利要求1-9中任一项所述的方法,其中所述至少一种参考标记物包括选自U1snRNA和U6 snRNA的RNA。
11.如权利要求1-10中任一项所述的方法,其中测量所述至少一种基因表达标记物的量包括使用以下中的一者或多者:逆转录、聚合酶链反应、核酸测序、质谱法、基于质量的分离和靶标捕获、定量焦磷酸测序、活瓣核酸内切酶测定、PCR-活瓣测定、酶联免疫吸附测定(ELISA)检测以及蛋白质免疫沉淀。
12.如权利要求11所述的方法,其中所述测量包括多重扩增。
13.如权利要求1-12中任一项所述的方法,所述方法还包括:
d)从自所述受试者取样的血液提取至少一种甲基化标记DNA和至少一种参考标记DNA;
e)测量至少一种甲基化标记DNA的量,其中所述至少一种甲基化标记DNA包含与以下中的至少一者相关的核苷酸序列:EMX1、GRIN2D、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAXchr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329;
f)测量至少一种参考标记DNA的量;以及
g)将所述至少一种甲基化标记DNA的量的值计算为所述参考标记DNA的量的百分比,其中所述值指示从受试者取样的所述血液中的所述至少一种甲基化标记DNA的量。
14.如权利要求13所述的方法,其中所述至少一种甲基化标记DNA由2、3、4、5、6、7、8、9、10、11、12、13、14或15种甲基化标记DNA组成。
15.如权利要求13或权利要求14所述的方法,其中从自所述受试者取样的所述血液提取的DNA包括循环无细胞DNA。
16.如权利要求13-15中任一项所述的方法,其中所述至少一种参考标记DNA选自B3GALT6 DNA和β-肌动蛋白DNA。
17.如权利要求13-16中任一项所述的方法,其中所述至少一种甲基化标记DNA包含与以下中的至少一者相关的核苷酸序列:BARX1、FLJ45983、HOPX、ZNF781、FAM59B、HOXA9、SOBP和IFFO1。
18.如权利要求17所述的方法,其中所述至少一种基因表达标记物包括选自FPR1、PADI4和SELL的标记基因的表达产物。
19.如权利要求13-18中任一项所述的方法,其中所述甲基化标记DNA用以对DNA的甲基化状态具特异性的方式选择性地修饰所述DNA的试剂处理。
20.如权利要求19所述的方法,其中所述试剂包括亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶。
21.如权利要求20所述的方法,其中所述亚硫酸氢盐试剂包括亚硫酸氢铵。
22.如权利要求13-21中任一项所述的方法,其中测量至少一种甲基化标记DNA的量包括使用以下中的一者或多者:聚合酶链反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离和靶标捕获。
23.如权利要求22所述的方法,其中所述测量包括多重扩增。
24.如权利要求13-23中任一项所述的方法,其中测量至少一种甲基化标记DNA的量包括使用选自由以下组成的组的一种或多种方法:甲基化特异性PCR、定量甲基化特异性PCR、甲基化特异性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序、活瓣核酸内切酶测定、PCR-活瓣测定和亚硫酸氢盐基因组测序PCR。
25.一种表征从受试者取样的血液的方法,所述方法包括:
i)处理从受试者取样的血液以产生提取的DNA和提取的RNA;
ii)测量所述提取的RNA中两种或更多种标记RNA的量,其中所述标记RNA选自S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1 RNA;
iii)测量所述提取的RNA中至少一种参考RNA的量,其中所述参考RNA选自CASC3A、SKP1和STK4;
iv)将所述两种或更多种标记RNA中的每一者的量的值计算为所述至少一种参考RNA的量的百分比,其中每种标记RNA的所述值指示从所述受试者取样的所述血液中的所述标记RNA的量;
v)用亚硫酸氢盐试剂处理所述提取的DNA以产生亚硫酸氢盐处理的DNA;
vi)测量所述亚硫酸氢盐处理的DNA中两种或更多种甲基化标记DNA的量,其中所述甲基化标记DNA选自EMX1、GRIN2D、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329基因;
vii)测量所述亚硫酸氢盐处理的DNA中至少一种参考DNA的量,其中所述至少一种参考DNA选自B3GALT6 DNA和β-肌动蛋白DNA;以及
viii)将所述两种或更多种甲基化标记DNA中的每一者的量的值计算为在所述亚硫酸氢盐处理的DNA中测量的参考DNA的量的百分比,其中每种甲基化标记DNA的所述值指示从所述受试者取样的所述血液中的所述甲基化标记DNA的量。
26.如权利要求13-25中任一项所述的方法,其中从收集于单个采血装置中的血液分离DNA和RNA。
27.如权利要求1-26中任一项所述的方法,其中所述受试者患有或疑似患有肺赘瘤。
28.如权利要求1-27中任一项所述的方法,其中从所述受试者取样的所述血液中所述至少一种基因表达标记物的量指示所述受试者的肺癌风险。
29.如权利要求13-28中任一项所述的方法,其中从所述受试者取样的所述血液中所述至少一种甲基化标记DNA的量指示所述受试者的肺癌风险。
30.一种试剂盒,所述试剂盒包含:
a)用于测量从受试者取样的血液中至少一种基因表达标记物的量的试剂的集合,其中所述至少一种基因表达标记物由选自以下的标记基因的表达产生:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1;
b)用于测量从所述受试者取样的血液中至少一种参考标记物的量的试剂的集合。
31.如权利要求30所述的试剂盒,所述试剂盒还包含用于从血液提取所述至少一种基因表达标记物和所述至少一种参考标记物的试剂的集合。
32.如权利要求30或31所述的试剂盒,其中所述至少一种基因表达标记物包括RNA和蛋白质中的一者或多者,并且其中所述至少一种参考标记物包括RNA、DNA和蛋白质中的一者或多者。
33.如权利要求30-32中任一项所述的试剂盒,其中所述试剂盒包含:
i)至少一种第一寡核苷酸,其中所述至少一种第一寡核苷酸的至少一部分特异性地与包含与选自以下的基因表达标记物相关的核苷酸序列的核酸链杂交:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1;
ii)至少一种第二寡核苷酸,其中所述至少一种第二寡核苷酸的至少一部分特异性地与参考标记物杂交,其中所述参考标记物为参考核酸。
34.如权利要求33所述的试剂盒,其中包含与基因表达标记物相关的核苷酸序列的所述核酸链选自RNA、cDNA或扩增DNA。
35.如权利要求33或34所述的试剂盒,其中所述参考核酸包括RNA或DNA。
36.如权利要求30-35中任一项所述的试剂盒,其中所述参考标记物包括由选自以下的基因表达的RNA或蛋白质:PLGLB2、GABARAP、NACA、EIF1、UBB、UBC、CD81、TMBIM6、MYL12B、HSP90B1、CLDN18、RAMP2、MFAP4、FABP4、MARCO、RGL1、ZBTB16、C10orf116、GRK5、AGER、SCGB1A1、HBB、TCF21、GMFG、HYAL1、TEK、GNG11、ADH1A、TGFBR3、INPP1、ADH1B、STK4、ACTB、HNRNPA1、CASC3和SKP1。
37.如权利要求33-36中任一项所述的试剂盒,所述试剂盒还包含:
c)用于测量从所述受试者取样的血液中至少一种甲基化标记DNA的量的试剂的集合,其中所述至少一种甲基化标记DNA包含与以下中的至少一者相关的核苷酸序列:EMX1、GRIN2D、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329。
38.如权利要求37所述的试剂盒,其中用于测量至少一种甲基化标记DNA的量的所述试剂的集合包含:
iii)至少一种第三寡核苷酸,其中所述至少一种第三寡核苷酸的至少一部分特异性地与包含与以下的甲基化标记基因相关的核苷酸序列的核酸链杂交:EMX1、GRIN2D、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329。
39.如权利要求38所述的试剂盒,所述试剂盒还包含至少一种第四寡核苷酸,其中所述至少一种第四寡核苷酸的至少一部分特异性地与参考标记DNA、优选地选自B3GALT6 DNA和β-肌动蛋白DNA的参考标记DNA杂交。
40.如权利要求38或39所述的试剂盒,其中包含与甲基化标记基因相关的核苷酸序列的核酸链和参考标记DNA中的至少一者包含亚硫酸氢盐处理的DNA。
41.如权利要求38-40中任一项所述的试剂盒,所述试剂盒还包含以对DNA的甲基化状态具特异性的方式选择性地修饰所述DNA的试剂。
42.如权利要求41所述的试剂盒,其中所述以对DNA的甲基化状态具特异性的方式选择性地修饰所述DNA的试剂包括亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶。
43.如权利要求42所述的试剂盒,其中所述亚硫酸氢盐试剂包括亚硫酸氢铵。
44.如权利要求33-43中任一项所述的试剂盒,其中所述至少一种第一、第二、第三和第四寡核苷酸中的一者或多者选自捕获寡核苷酸、一对核酸引物、核酸探针和侵入性寡核苷酸。
45.如权利要求44所述的试剂盒,其中所述捕获寡核苷酸连接至固体载体。
46.如权利要求45所述的试剂盒,其中所述固体载体为磁性珠粒。
47.如权利要求33-46中任一项所述的试剂盒,所述试剂盒包含
i)第一引物对,所述第一引物对用于从选自以下的标记基因的表达的基因表达标记物产物产生第一扩增DNA:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1;
ii)第一探针,所述第一探针包含与所述第一扩增DNA的区域互补的序列;
iii)第二引物对,所述第二引物对用于产生第二扩增DNA;
iv)第二探针,所述第二探针包含与所述第二扩增DNA的区域互补的序列;
v)逆转录酶;以及
vi)热稳定DNA聚合酶。
48.如权利要求47所述的试剂盒,其中所述第二扩增DNA由甲基化标记基因或参考标记核酸产生。
49.如权利要求47或48所述的试剂盒,其中所述第一探针还包含具有第一活瓣序列的活瓣部分,所述第一活瓣序列基本上不与所述第一扩增DNA互补。
50.如权利要求47-49中任一项所述的试剂盒,其中所述第二探针还包含具有第二活瓣序列的活瓣部分,所述第二活瓣序列基本上不与所述第二扩增DNA互补。
51.如权利要求49-50中任一项所述的试剂盒,所述试剂盒还包含以下中的一者或多者:
vii)包含与所述第一活瓣序列互补的序列的FRET盒;
viii)包含与所述第二活瓣序列互补的序列的FRET盒。
52.如权利要求49-51中任一项所述的试剂盒,所述试剂盒还包含活瓣核酸内切酶,优选FEN-1核酸内切酶。
53.一种组合物,所述组合物包含:
i)第一引物对,所述第一引物对用于从选自以下的基因的表达的基因表达标记物产物产生第一扩增DNA:S100A9、SELL、PADI4、APOBE3CA、S100A12、MMP9、FPR1、TYMP和SAT1;
ii)第一探针,所述第一探针包含与所述第一扩增DNA的区域互补的序列;
iii)第二引物对,所述第二引物对用于产生第二扩增DNA;
iv)第二探针,所述第二探针包含与所述第二扩增DNA的区域互补的序列;
v)逆转录酶;以及
vi)热稳定DNA聚合酶。
54.如权利要求53所述的组合物,所述组合物还包含从自受试者取样的血液提取的核酸,其中所述受试者优选患有或疑似患有肺赘瘤。
55.如权利要求54所述的组合物,其中所述核酸包括以下中的一者或多者:
-细胞RNA;
-循环无细胞RNA;
-细胞DNA;
-循环无细胞DNA。
56.如权利要求53-55中任一项所述的组合物,其中所述第二引物对从甲基化标记基因或参考标记核酸产生第二扩增DNA。
57.如权利要求56所述的组合物,其中所述第二引物对从选自以下的参考核酸产生第二扩增DNA:
-由选自以下的基因表达的RNA:PLGLB2、GABARAP、NACA、EIF1、UBB、UBC、CD81、TMBIM6、MYL12B、HSP90B1、CLDN18、RAMP2、MFAP4、FABP4、MARCO、RGL1、ZBTB16、C10orf116、GRK5、AGER、SCGB1A1、HBB、TCF21、GMFG、HYAL1、TEK、GNG11、ADH1A、TGFBR3、INPP1、ADH1B、STK4、ACTB、HNRNPA1、CASC3和SKP1;
-选自U1 snRNA和U6 snRNA的RNA;
-选自B3GALT6 DNA和β-肌动蛋白DNA的DNA。
58.如权利要求56所述的组合物,其中所述第二引物对从选自以下的甲基化标记基因产生第二扩增DNA:EMX1、GRIN2D、ANKRD13B、ZNF781、ZNF671、IFFO1、HOPX、BARX1、HOXA9、LOC100129726、SPOCK2、TSC22D4、MAX.chr8.124、RASSF1、ST8SIA1、NKX6_2、FAM59B、DIDO1、MAX_Chr1.110、AGRN、SOBP、MAX_chr10.226、ZMIZ1、MAX_chr8.145、MAX_chr10.225、PRDM14、ANGPT1、MAX.chr16.50、PTGDR_9、DOCK2、MAX_chr19.163、ZNF132、MAX chr19.372、TRH、SP9、DMRTA2、ARHGEF4、CYP26C1、PTGDR、MATK、BCAT1、PRKCB_28、ST8SIA_22、FLJ45983、DLX4、SHOX2、HOXB2、MAX.chr12.526、BCL2L11、OPLAH、PARP15、KLHDC7B、SLC12A8、BHLHE23、CAPN2、FGF14、FLJ34208、BIN2_Z、DNMT3A、FERMT3、NFIX、S1PR4、SKI、SUCLG2、TBX15和ZNF329。
59.如权利要求53-58中任一项所述的组合物,其中所述第一探针和/或所述第二探针包含含有荧光团的检测部分。
60.如权利要求53-58中任一项所述的组合物,其中所述第一探针还包含具有第一活瓣序列的活瓣部分,所述第一活瓣序列基本上不与所述第一扩增DNA互补,和/或其中所述第二探针还包含具有第二活瓣序列的活瓣部分,所述第二活瓣序列基本上不与所述第二扩增DNA互补。
61.如权利要求60所述的组合物,所述组合物还包含以下中的一者或多者:
vii)包含与所述第一活瓣序列互补的序列的FRET盒;
viii)包含与所述第二活瓣序列互补的序列的FRET盒。
62.如权利要求53-61中任一项所述的组合物,所述组合物还包含活瓣核酸内切酶,优选FEN-1核酸内切酶。
63.如权利要求53-62中任一项所述的组合物,所述组合物还包含含有6-10mM Mg++的缓冲液。
64.一种反应混合物,所述反应混合物包含权利要求53-63中任一项的组合物。
CN202080075372.4A 2019-08-27 2020-08-27 对疑似具有肺瘤变的受试者中的甲基化dna、rna和蛋白质的表征 Pending CN114945687A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962892426P 2019-08-27 2019-08-27
US62/892,426 2019-08-27
PCT/US2020/048270 WO2021041726A1 (en) 2019-08-27 2020-08-27 Characterizing methylated dna, rna, and proteins in subjects suspected of having lung neoplasia

Publications (1)

Publication Number Publication Date
CN114945687A true CN114945687A (zh) 2022-08-26

Family

ID=74686021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080075372.4A Pending CN114945687A (zh) 2019-08-27 2020-08-27 对疑似具有肺瘤变的受试者中的甲基化dna、rna和蛋白质的表征

Country Status (8)

Country Link
US (1) US20220403471A1 (zh)
EP (1) EP4022093A4 (zh)
JP (1) JP2022546504A (zh)
KR (1) KR20220092856A (zh)
CN (1) CN114945687A (zh)
AU (1) AU2020336115A1 (zh)
CA (1) CA3149601A1 (zh)
WO (1) WO2021041726A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2474626B1 (en) 2008-02-15 2014-08-13 Mayo Foundation For Medical Education And Research Detecting neoplasm from a stool sample
ES2812753T3 (es) 2014-03-31 2021-03-18 Mayo Found Medical Education & Res Detección de neoplasma colorectal
EP3574110A4 (en) 2017-01-27 2021-01-13 Exact Sciences Development Company, LLC DETECTION OF COLUMN NEOPLASIA BY ANALYSIS OF METHYLATED DNA
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
CN115997035A (zh) 2020-06-30 2023-04-21 通用诊断股份公司 用于检测多种癌症类型的系统和方法
WO2023278528A1 (en) * 2021-07-02 2023-01-05 Enzo Biochem, Inc. Method for detecting and quantifying dna methylation in a selected locus or region of dna
WO2023107709A1 (en) * 2021-12-10 2023-06-15 Adela, Inc. Methods and systems for generating sequencing libraries

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009529329A (ja) * 2006-03-09 2009-08-20 トラスティーズ オブ ボストン ユニバーシティ 鼻腔上皮細胞の遺伝子発現プロファイルを用いた、肺疾患のための診断および予後診断の方法
WO2010074924A1 (en) * 2008-12-23 2010-07-01 University Of Utah Research Foundation Identification and regulation of a novel dna demethylase system
EP2520661A1 (en) * 2011-05-02 2012-11-07 Rheinische Friedrich-Wilhelms-Universität Bonn Blood-based gene expression signatures in lung cancer
EP2527459A1 (en) * 2011-05-02 2012-11-28 Rheinische Friedrich-Wilhelms-Universität Bonn Blood-based gene detection of non-small cell lung cancer
HUE047739T2 (hu) * 2012-01-06 2020-05-28 Viomics Inc Rendszer és eljárás tüdõrák által módosított RNS molekulák kimutatására perifériás vérben
WO2017181146A1 (en) * 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
KR102436270B1 (ko) * 2016-05-05 2022-08-25 이그젝트 싸이언스 디블롭먼트 컴패니, 엘엘씨 메틸화된 dna 분석에 의한 폐 종양의 검출
WO2017201164A1 (en) * 2016-05-17 2017-11-23 Genecentric Diagnostics, Inc. Methods for subtyping of lung squamous cell carcinoma
KR20210099044A (ko) * 2018-11-27 2021-08-11 이그젝트 싸이언스 디블롭먼트 컴패니, 엘엘씨 폐 신생물 검출에서 메틸화된 dna, rna, 및 단백질의 특성화

Also Published As

Publication number Publication date
WO2021041726A1 (en) 2021-03-04
EP4022093A4 (en) 2024-05-22
EP4022093A1 (en) 2022-07-06
KR20220092856A (ko) 2022-07-04
AU2020336115A1 (en) 2022-04-14
JP2022546504A (ja) 2022-11-04
AU2020336115A8 (en) 2022-06-02
CA3149601A1 (en) 2021-03-04
US20220403471A1 (en) 2022-12-22

Similar Documents

Publication Publication Date Title
US11028447B2 (en) Detection of neoplasia by analysis of methylated dna
KR102667067B1 (ko) 메틸화된 dna 분석에 의한 결장 신조직형성의 검출
JP7512278B2 (ja) 肺腫瘍の検出におけるメチル化dna、rna、及びタンパク質の特性決定
US20220403471A1 (en) Characterizing methylated dna, rna, and proteins in subjects suspected of having lung neoplasia
KR20200105661A (ko) 유방암 검출방법
US9422592B2 (en) System and method of detecting RNAS altered by cancer in peripheral blood
JP7356349B2 (ja) 前立腺癌検出

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination