CN114651073A - 结肠直肠癌和/或进行性腺瘤的检测 - Google Patents

结肠直肠癌和/或进行性腺瘤的检测 Download PDF

Info

Publication number
CN114651073A
CN114651073A CN202080077593.5A CN202080077593A CN114651073A CN 114651073 A CN114651073 A CN 114651073A CN 202080077593 A CN202080077593 A CN 202080077593A CN 114651073 A CN114651073 A CN 114651073A
Authority
CN
China
Prior art keywords
methylation
colorectal cancer
dmr
set forth
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080077593.5A
Other languages
English (en)
Inventor
M·比滕茨
K·克鲁斯马
J·马丁内兹-巴雷亚
C·亨塞
M·切西科拉
P·科纳普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Diagnostics
Original Assignee
General Diagnostics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Diagnostics filed Critical General Diagnostics
Publication of CN114651073A publication Critical patent/CN114651073A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/56Staging of a disease; Further complications associated with the disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开尤其提供了用于结肠直肠癌和/或进行性腺瘤检测(例如筛查)的方法和与其相关的组合物。在各种实施方式中,本公开提供了用于筛查的方法,其包括分析一种或多种甲基化生物标志物的甲基化状态,以及与其相关的组合物。在各种实施方式中,本公开提供了用于检测(例如,筛查)的方法,其包括检测(例如,筛查)cfDNA(例如,ctDNA)中一种或多种甲基化生物标志物的甲基化状态。在各种实施方式中,本公开提供了用于筛查的方法,其包括使用MSRE‑qPCR和/或使用大规模平行测序(例如,下一代测序)检测(例如,筛查)cfDNA(例如,ctDNA)中一种或多种甲基化生物标志物的甲基化状态。

Description

结肠直肠癌和/或进行性腺瘤的检测
技术领域
本发明大体上涉及用于检测和/或预先筛查结肠直肠癌和/或进行性腺瘤的方法和试剂盒。在某些实施方式中,本文所述的方法和试剂盒利用人类基因组中已鉴定的差异甲基化区域作为标志物来确定受试者中结肠直肠癌和/或进行性腺瘤的存在和/或风险。
背景技术
癌症筛查是癌症预防、诊断和治疗的重要组成部分。根据一些报告,结肠直肠癌(CRC)已被鉴定为世界上第三大最常见的癌症类型和频率第二大的癌症死亡原因。根据一些报道,每年有超过180万例新发结肠直肠癌病例,约881,000人死于结肠直肠癌,占癌症死亡人数的约十分之一。建议进行定期结肠直肠癌筛查,尤其是50岁以上的个体。此外,50岁以下的个体的结肠直肠癌的发病率随着时间的推移而增加。统计数据表明,目前的结肠直肠癌筛查技术是不够的。尽管随着时间的推移有所改善,但目前只有约40%至44%的结肠直肠癌在早期、局部阶段通过筛查被检测到。这至少部分是由于当前筛查技术的灵敏度和/或特异性不足。目前推荐的技术包括对50岁以上的人进行结肠镜检查和/或粪便血液检测。
大多数结肠直肠癌起源于结肠息肉,根据组织学,结肠息肉最初表现为良性。因此,结肠息肉的先进检测和去除是结肠癌筛查的重要组成部分。然而,仅基于组织病理学分类很难确定哪些息肉会发展为浸润性癌症。对息肉的组织病理学分类通常对在例如结肠镜检查期间从结肠组织切除的样品进行,分类为进行性腺瘤的息肉具有进展为恶性肿瘤的趋势。进行性腺瘤被归类为具有一项或多项以下特征:尺寸大(即大于1厘米的腺瘤);具有高度不典型增生;具有突出的绒毛成分;和/或具有锯齿状特征。然而,即使当根据上述分类将腺瘤分类为进行性腺瘤时,腺瘤也可能不会进展为浸润性癌。
不希望受任何特定理论的束缚,进展为浸润性癌的腺瘤或息肉将获得和积累不同于正常组织的遗传改变。通过鉴定这些不同的改变,可以开发分子指纹来帮助确定腺瘤是否会进展为浸润性癌。开发用于确定晚期癌和结肠直肠癌的分子指纹的工具和技术将有助于在早期阶段鉴定结肠直肠癌。因此,需要工具和筛查技术来准确筛查早期阶段的结肠直肠癌。
发明内容
本公开尤其提供用于结肠直肠癌和/或进行性腺瘤筛查的方法和与其相关的组合物。在本文具体公开的各种实施方式中,本公开提供用于结肠直肠癌和/或进行性腺瘤筛查的方法,其包括鉴定在人类受试者的DNA的差异甲基化区域(DMR)中发现的一个或多个甲基化位点中的至少一个的甲基化状态。在本文具体公开的各种实施方式中,本公开提供了用于结肠直肠癌和/或进行性腺瘤筛查的方法,其包括筛查cfDNA(无细胞DNA),例如ctDNA(循环肿瘤DNA)中一种或多种甲基化生物标志物的甲基化状态。在各种实施方式中,本公开提供了用于结肠直肠癌和/或进行性腺瘤筛查的方法,其包括使用MSRE-qPCR筛查cfDNA,例如ctDNA中的一种或多种甲基化生物标志物的甲基化状态。本文提供的各种组合物和方法提供足以用于结肠直肠癌和/或进行性腺瘤筛查的临床应用的灵敏度和特异性。本文提供的各种组合物和方法可用于通过分析受试者的可及组织样品,例如作为血液或血液成分(例如,cfDNA,例如,ctDNA)、结肠直肠组织或粪便的组织样品,进行结肠直肠癌和/或进行性腺瘤筛查。
在某些实施方式中,本文公开的任何方法都可以在体外使用。
在一个方面,本公开提供了一种(i)筛查结肠直肠癌,或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括确定在表1或表7中列出的人类受试者DNA的差异甲基化区域(DMR)内发现的至少一个甲基化位点的甲基化状态。
在如前一段中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个DMR中的每一个,确定在该DMR内发现的至少三个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个DMR中的每一个,确定在该DMR内发现的至少四个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个DMR中的每一个,确定在该DMR内发现的至少五个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上DMR中的每一个,确定在该DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上DMR中的每一个,确定在该DMR内发现的至少三个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上DMR中的每一个,确定在该DMR内发现的至少四个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上DMR中的每一个,确定在该DMR内发现的至少五个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上DMR中的每一个,确定在该DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上DMR中的每一个,确定在该DMR内发现的至少三个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上DMR中的每一个,确定在该DMR内发现的至少四个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上DMR中的每一个,确定在该DMR内发现的至少五个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上DMR中的每一个,确定在该DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上DMR中的每一个,确定在该DMR内发现的至少三个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上DMR中的每一个,确定在该DMR内发现的至少四个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上DMR中的每一个,确定在该DMR内发现的至少五个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上DMR中的每一个,确定在该DMR内发现的至少三个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上DMR中的每一个,确定在该DMR内发现的至少四个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上DMR中的每一个,确定在该DMR内发现的至少五个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,DMR包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
在如前面段落中具体提及的各种实施方式中,该方法包括确定与参照相比,至少一个甲基化位点是否被甲基化(例如,其中参照是从已被确认为不患有进行性腺瘤或结肠直肠癌的一个或多个人类受试者群体获得的DNA),其中甲基化指示(i)结肠直肠癌,(ii)进行性腺瘤,或(iii)结肠直肠癌和/或进行性腺瘤。
在如前一段落中具体提及的各种实施方式中,其中该方法包括确定在表2中列出的每个DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括确定在表3中列出的每个DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括确定在表4中列出的每个DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,一个或多个DMR通过如表5中所列的寡核苷酸引物对扩增。
在如前面段落中具体提及的各种实施方式中,人类受试者的DNA分离自选自由人类受试者的组织(例如结肠直肠组织,例如息肉、腺瘤)、血液、血浆、尿液、唾液和粪便组成的组中的成员。
在如前面段落中具体提及的各种实施方式中,DNA是人类受试者的无细胞DNA。
在如前面段落中具体提及的各种实施方式中,受试者在筛查时没有结肠直肠癌和/或进行性腺瘤的症状。
在如前面段落中具体提及的各种实施方式中,所述受试者先前进行过结肠直肠癌和/或进行性腺瘤筛查。
在如前面段落中具体提及的各种实施方式中,受试者在过去10年内、过去5年内、过去4年内、过去3年内、过去2年内或过去1年内已进行过结肠直肠癌和/或进行性腺瘤筛查。
在如前面段落中具体提及的各种实施方式中,受试者先前的进行性腺瘤和/或结肠直肠癌筛查已诊断出所述受试者没患有(i)结肠直肠癌、(ii)进行性腺瘤或(iii)进行性腺瘤和/或结肠直肠癌。在该段落和前面段落中具体提及的各种实施方式中,已诊断出所述受试者没患有(i)结肠直肠癌、(ii)进行性腺瘤或(iii)进行性腺瘤和/或结肠直肠癌的先前进行性腺瘤和/或结肠直肠癌筛查是在一年内。
在如前面段落中具体提及的各种实施方式中,已诊断出受试者没患有进行性腺瘤和/或结肠直肠癌的先前进行性腺瘤和/或结肠直肠癌筛查是结肠镜检查。
在如前面段落中具体提及的各种实施方式中,该方法包括早期结肠直肠癌的诊断(例如,其中所述结肠直肠癌是0期、I期、IIA期、IIB期或IIC期结肠直肠癌)。
在如前面段落中具体提及的各种实施方式中,该方法包括早期结肠直肠癌的诊断,其中所述癌尚未转移。
在如前面段落中具体提及的各种实施方式中,使用选自由甲基化敏感性限制酶定量聚合酶链式反应(MSRE-qPCR)、甲基化特异性PCR、甲基化特异性核酸酶辅助的小等位基因富集PCR和杂交捕获靶向下一代测序组成的组中的一种或多种方法确定甲基化状态。
在如前面段落中具体提及的各种实施方式中,甲基化状态使用全基因组亚硫酸氢盐测序来确定。
在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
在另一个方面,本公开提供了一种用于(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查是否存在结肠直肠癌和/或进行性腺瘤的甲基化特异性限制酶定量聚合酶链式反应(MSRE-qPCR)的方法,该方法包括:(a)将人类受试者的DNA与一种或多种甲基化特异性限制酶接触;和(b)对酶消化的DNA或其扩增子进行qPCR,以确定DNA的一个或多个区域的甲基化状态,其中DNA的一个或多个区域中的每一个包含表1的一个或多个DMR的至少一部分,每部分的长度为至少10、至少15、至少20、至少24、至少30、至少40、至少50、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少1000个以上碱基对。
在如前一段中具体提及的各种实施方式中,其中DNA的一个或多个区域中的至少一个被相应的寡核苷酸引物对扩增(例如,其中引物对包含正向引物和反向引物)。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域中的每一个包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
在如前面段落中具体提及的各种实施方式中,相应的寡核苷酸引物对是表5中列出的寡核苷酸引物对。在本文和前面段落中具体提及的各种实施方式中,相应寡核苷酸引物对的正向引物与表5中列出的正向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性。
在如前面段落中具体提及的各种实施方式中,相应寡核苷酸引物对的反向引物与表5中列出的反向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性。
在如前面段落中具体提及的各种实施方式中,DNA分离自选自由人类受试者的组织(例如结肠直肠组织,例如息肉、腺瘤)、血液、血浆、尿液、唾液和粪便组成的组的成员。
在如前面段落中具体提及的各种实施方式中,DNA是人类受试者的无细胞DNA。
在如前面段落中具体提及的各种实施方式中,该方法提供的检测结肠直肠癌的灵敏度为至少0.67。在本段和前面段落中具体提及的各种实施方式中,该方法提供的检测结肠直肠癌的灵敏度为至少0.78。
在如前面段落中具体提及的各种实施方式中,该方法提供的用于检测进行性腺瘤和结肠直肠癌的组合的总体灵敏度为至少0.48。在本段和前面段落中具体提及的各种实施方式中,该方法提供的用于检测进行性腺瘤和结肠直肠癌的组合的总体灵敏度为至少0.53。
在如前面段落中具体提及的各种实施方式中,该方法提供的特异性为至少0.9。在本段和前面段落中具体提及的各种实施方式中,该方法提供的特异性为至少0.93。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域包含表2的每个DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域中的每一个与表2的相应DMR具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表2的相应DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域包含表3的每个DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域中的每一个与表3的相应DMR具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表3的相应DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域包含表4的每个DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域中的每一个与表4的相应DMR具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表4的相应DMR。
在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
在另一个方面,本公开提供了用于(i)筛查结肠直肠癌,或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的试剂盒,所述试剂盒包括:(a)至少一个寡核苷酸引物对,其设计用于扩增表1的一个或多个DMR的至少一部分,每个部分的长度至少10个、至少15个、至少20个、至少24个、至少30个、至少40个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少500个、至少1000个或更多碱基对;和(b)至少一种甲基化特异性限制酶和/或亚硫酸氢盐试剂。
在如前一段中具体提及的各种实施方式中,一个或多个DMR的一部分包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表2的每个DMR的寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表3的每个DMR的寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表4的每个DMR的寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括表5的至少一个寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对的至少一个寡核苷酸与表5的至少一种正向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表5的至少一种正向引物。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对的至少一个寡核苷酸与表5的至少一种反向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表5的至少一种反向引物。
在如前面段落中具体提及的各种实施方式中,试剂盒还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者存在结肠直肠癌;(ii)人类受试者的结肠直肠癌的易感性;(iii)人类受试者中结肠直肠癌的风险增加,和(iv)人类受试者结肠直肠癌的阶段。
在如前面段落中具体提及的各种实施方式中,试剂盒还包括使用一个或多个甲基化位点的以确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者中存在一种或多种进行性腺瘤;(ii)人体受试者的进行性腺瘤的易感性;(iii)人类受试者中进行性腺瘤的风险增加,和(iv)人类受试者中腺瘤的类型。
在如前面段落中具体提及的各种实施方式中,试剂盒还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者中存在结肠直肠癌和/或进行性腺瘤;(ii)人类受试者的结肠直肠癌和/或进行性腺瘤的易感性;(iii)人类受试者中结肠直肠癌和/或进行性腺瘤的风险增加,和(iv)人类受试者中结肠直肠癌和/或进行性腺瘤的阶段。
在如前面段落中具体提及的各种实施方式中,试剂盒在体外使用。
在另一个方面,本公开提供了用于(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的诊断性qPCR反应,所述诊断性qPCR反应包括:(a)人类DNA;(b)聚合酶;(c)至少一个寡核苷酸引物对,其设计用于扩增表1的一种或多种DMR的至少一部分,所述一种或多种DMR的每个部分的长度为至少10个、至少15个、至少20个、至少24个、至少30个、至少40个、至少50个、至少100个、150个、200个、250个、300个、350个、400个、500个、1000个以上碱基对,其中人类DNA是亚硫酸氢盐处理的人类DNA或甲基化特异性限制酶消化的人类DNA。
在如前一段中具体提及的各种实施方式中,一个或多个DMR的一部分包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表2的每个DMR的寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表3的每个DMR的寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括用于扩增表4的每个DMR的寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对包括表5的至少一个寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对的至少一个寡核苷酸与表5的至少一种正向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表5的至少一种正向引物。
在如前面段落中具体提及的各种实施方式中,寡核苷酸引物对的至少一个寡核苷酸与表5的至少一种反向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表5的至少一种反向引物。
在如前面段落中具体提及的各种实施方式中,反应还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者存在结肠直肠癌;(ii)人类受试者的结肠直肠癌的易感性;(iii)人类受试者中结肠直肠癌的风险增加,和(iv)人类受试者结肠直肠癌的阶段。
在如前面段落中具体提及的各种实施方式中,反应还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者中存在一种或多种进行性腺瘤;(ii)人体受试者的进行性腺瘤的易感性;(iii)人类受试者中进行性腺瘤的风险增加,和(iv)人类受试者中的腺瘤的类型。
在如前面段落中具体提及的各种实施方式中,反应还包括使用一个或多个甲基化位点的已确定的甲基化状态(例如,超甲基化百分比、超甲基化比率)来鉴定以下(i)至(iv)中的至少一种:(i)人类受试者中存在结肠直肠癌和/或进行性腺瘤;(ii)人类受试者的结肠直肠癌和/或进行性腺瘤的易感性;(iii)人类受试者中结肠直肠癌和/或进行性腺瘤的风险增加,和(iv)人类受试者中结肠直肠癌和/或进行性腺瘤的阶段。
在如前面段落中具体提及的各种实施方式中,反应在体外进行。
在另一方面,本公开提供了一种(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定一个或多个差异甲基化区域(DMR)的甲基化状态,所述一个或多个DMR中的每一个包含一个或多个基因或与所述一个或多个基因重叠,所述一个或多个基因选自由以下组成的组:PAX7、NTNG1、SYT6、LINC01248、KCNK3、GALNT14、CHST10、THSD7B、UNC80、EPHA6、MED12L、ADGRL3、RNF150、SPOCK3、GPM6A、HELT、GFPT2、HSPA1L、HSPA1A、NKAIN2、TMEM178B、DPP6、MICU3、ALKAL1、LOC401463、BHLHE22、RIMS2、LOC105375690、SLC25A32、DMRT1、CDKN2A、CDKN2B-AS1、PAX5、C1QL3、MYO3A、LOC101929073、GAD2、MYO3A、FOXI2、LOC105369438、AMOTL1、LOC101928847、NCAM1、DSCAML1、PTPRO、RERG、DPY19L2、CUX2、PCDH9、MIR4500HG、SLITRK5、SLC8A3、LOC646548、GATM、PIF1、RASGRF1、VAC14、VAT1L、JPH3、SLFN13、ZACN、SRP68、GALR2、ADCYAP1、CDH2、DOK6、ZNF461、ZNF829、ZNF568、ZNF540、ZNF571-AS1、CIC、ZNF582-AS1、ZNF582、ZNF471、ZNF264、ZNF671、ZNF551、ZNF776、NKX2-2、ADAMTS1、TIAM1和OLIG1;应用分类模型,所述分类模型使用所述一个或多个DMR中每一个的确定的甲基化状态作为输入;并且从所述模型中输出人类受试者的结肠直肠癌的预测状态或进行性腺瘤的预测状态或者结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
在如前一段中具体提及的各种实施方式中,该方法包括确定一种或多种DMR的甲基化状态,所述DMR包含基因GAD2、MYO3A和ALKAL1中的至少每一个或与其重叠。
在如前面段落中具体提及的各种实施方式中,该方法包括确定一种或多种DMR的甲基化状态,所述DMR包含基因GAD2、MYO3A、ALKAL1、RASGRF1、MICU3、RASGRF1、FOXI2、C1QL3、CDKN2A和CDKN2B-AS1中的至少每一个或与其重叠。
在如前面段落中具体提及的各种实施方式中,该方法包括确定一种或多种DMR的甲基化状态,所述DMR包含基因GAD2、MYO3A、ALKAL1、RASGRF1、MICU3、RASGRF1、FOXI2、C1QL3、CDKN2A、CDKN2B-AS1、SYT6、SLFN13、GPM6A、THSD7B、ZBF582-AS1、ZNF582、GATM、ZNF540、ZNF571-AS1、OLIG1、EPHA6、DPY19L2、SLC8A3、LOC646548、LOC101929073、UNC80、DPP6、ZNF568、JPH3、ZNF461、NTNG1、ADGRL3、ADAMST1、CDH2、LINC01248、PTPRO、RERG、SLC8A3、LOC646548、PAX5、GFPT2中的至少每一个或与其重叠。
在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(SVM)算法的分类模型。
在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
在另一方面,本公开提供了一种(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定一个或多个差异甲基化区域(DMR)的甲基化状态,所述一个或多个DMR中的每一个与选自由以下组成的组的至少一个序列具有至少80%、至少85%、至少90%、至少95%、至少99%、或至少99.5%的序列同一性或包含选自由以下组成的组的至少一个序列:SEQ ID NO.190、SEQ ID NO.191、SEQ ID NO.192、SEQ ID NO.193、SEQ ID NO.194、SEQ ID NO.195、SEQ ID NO.196、SEQ IDNO.197、SEQ ID NO.198、SEQ ID NO.199、SEQ ID NO.200、SEQ ID NO.201、SEQ ID NO.202、SEQ ID NO.203、SEQ ID NO.204、SEQ ID NO.205、SEQ ID NO.206、SEQ ID NO.207、SEQ IDNO.208、SEQ ID NO.209、SEQ ID NO.210、SEQ ID NO.211、SEQ ID NO.212、SEQ ID NO.213、SEQ ID NO.214、SEQ ID NO.215、SEQ ID NO.216、SEQ ID NO.217、SEQ ID NO.218、SEQ IDNO.219、SEQ ID NO.220、SEQ ID NO.221、SEQ ID NO.222、SEQ ID NO.223、SEQ ID NO.224、SEQ ID NO.225、SEQ ID NO.226、SEQ ID NO.227、SEQ ID NO.228和SEQ ID NO.229,应用分类模型,所述分类模型使用所述一个或多个DMR的确定的甲基化状态作为输入;并且从所述模型中输出人类受试者的(i)结肠直肠癌的预测状态或(ii)进行性腺瘤的预测状态或者(iii)结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
在前一段中具体提及的各种实施方式中,该方法包括确定三个以上差异甲基化区域(DMR)的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括确定10个以上差异甲基化区域(DMR)的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括确定40个差异甲基化区域(DMR)的甲基化状态。
在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(SVM)算法的分类模型。
在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
在另一方面,本公开提供了一种(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定在表1或表7中列出的人类受试者DNA的差异甲基化区域(DMR)内发现的至少一个甲基化位点的甲基化状态;通过计算设备的处理器基于至少一个甲基化位点的甲基化状态确定人类受试者DNA的差异甲基化区域(DMR)的甲基化状态;以及使用分类模型通过处理器确定人类受试者的(i)结肠直肠癌的预测状态,(ii)进行性腺瘤的预测状态,或(iii)结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
在如前一段中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个DMR中的每一个,确定在DMR内发现的至少3个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个DMR中的每一个,确定在DMR内发现的至少4个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的一个或多个DMR中的每一个,确定在DMR内发现的至少5个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上DMR中的每一个,确定在DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上DMR中的每一个,确定在DMR内发现的至少3个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上DMR中的每一个,确定在DMR内发现的至少4个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的三个以上DMR中的每一个,确定在DMR内发现的至少5个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上DMR中的每一个,确定在DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上DMR中的每一个,确定在DMR内发现的至少3个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上DMR中的每一个,确定在DMR内发现的至少4个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1或表7中列出的10个以上DMR中的每一个,确定在DMR内发现的至少5个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上DMR中的每一个,确定在DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上DMR中的每一个,确定在DMR内发现的至少3个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上DMR中的每一个,确定在DMR内发现的至少4个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表1中列出的35个以上DMR中的每一个,确定在DMR内发现的至少5个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上DMR中的每一个,确定在DMR内发现的至少3个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上DMR中的每一个,确定在DMR内发现的至少4个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括,对于表7中列出的40个以上DMR中的每一个,确定在DMR内发现的至少5个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,DMR包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
在如前面段落中具体提及的各种实施方式中,该方法包括由处理器确定与参照相比,至少一个甲基化位点是否被甲基化(例如,其中参照是来自一个或多个已证实未患有进行性腺瘤或结肠直肠癌的人类受试者群体的DNA),其中甲基化指示(i)结肠直肠癌,(ii)进行性腺瘤,或(iii)结肠直肠癌和/或进行性腺瘤。
在如前面段落中具体提及的各种实施方式中,该方法包括确定在表2中列出的每个DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括确定在表3中列出的每个DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括确定在表4中列出的每个DMR内发现的至少一个甲基化位点的甲基化状态。
在如前面段落中具体提及的各种实施方式中,DMR通过如表5中列出的寡核苷酸引物对扩增。
在如前面段落中具体提及的各种实施方式中,人类受试者的DNA分离自选自由人类受试者的组织(例如结肠直肠组织,例如息肉、腺瘤)、血液、血浆、尿液、唾液和粪便组成的组的成员。
在如前面段落中具体提及的各种实施方式中,DNA是人类受试者的无细胞DNA。
在如前面段落中具体提及的各种实施方式中,受试者在筛查时没有结肠直肠癌和/或进行性腺瘤的症状。
在如前面段落中具体提及的各种实施方式中,受试者先前进行过结肠直肠癌和/或进行性腺瘤筛查。在当前或前面段落中具体提及的各种实施方式中,受试者在过去10年内、过去5年内、过去4年内、过去3年内、过去2年内或过1年内已进行过结肠直肠癌和/或进行性腺瘤筛查。
在如前面段落中具体提及的各种实施方式中,受试者中的先前进行性腺瘤和/或结肠直肠癌的筛查已经诊断出所述受试者没患有(i)结肠直肠癌、(ii)进行性腺瘤或(iii)结肠直肠癌和/或进行性腺瘤。在当前或前面段落中具体提及的各种实施方式中,已诊断出所述受试者没患有(i)结肠直肠癌、(ii)进行性腺瘤或(iii)结肠直肠癌和/或进行性腺瘤的先前进行性腺瘤和/或结肠直肠癌筛查是在一年内。
在如前面段落中具体提及的各种实施方式中,已诊断出所述受试者没患有进行性腺瘤和/或结肠直肠癌的先前的进行性腺瘤和/或结肠直肠癌筛查是结肠镜检查。
在如前面段落中具体提及的各种实施方式中,该方法包括通过处理器鉴定早期结肠直肠癌的存在(例如,其中结肠直肠癌是0期、I期、IIA期、IIB期或IIC期结肠直肠癌)。
在如前面段落中具体提及的各种实施方式中,该方法包括通过处理器鉴定早期结肠直肠癌的存在,其中癌症尚未转移。
在如前面段落中具体提及的各种实施方式中,甲基化状态使用选自由甲基化敏感性限制酶定量聚合酶链式反应(MSRE-qPCR)、甲基化特异性PCR、甲基化特异性核酸酶辅助的小等位基因富集PCR、杂交捕获靶向下一代测序和基于扩增的靶向下一代测序组成的组中的一个或多个成员确定。
在如前面段落中具体提及的各种实施方式中,甲基化状态使用全基因组亚硫酸氢盐测序确定。
在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(SVM)算法的分类模型。
在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
在另一个方面,本公开提供了一种用于(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查是否存在结肠直肠癌和/或进行性腺瘤的甲基化特异性限制酶定量聚合酶链式反应(MSRE-qPCR)的方法,该方法包括:(a)将人类受试者的DNA与一种或多种甲基化特异性限制酶接触;(b)对酶消化的DNA或其扩增子进行qPCR,以确定一个或多个DNA区域的甲基化状态,其中一个或多个DNA区域中的每一个包含表1的一个或多个DMR的至少一部分,每个部分的长度为至少10个、至少15个、至少20个、至少24个、至少30个、至少40个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少500个、至少1000个以上碱基对;(c)通过计算设备的处理器将分类模型应用于所确定的一个或多个DNA区域的甲基化状态;(d)基于所应用的分类模型通过处理器确定人类受试者的结肠直肠癌的预测状态、进行性腺瘤的预测状态或者结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
在如前一段中具体提及的各种实施方式中,DNA的一个或多个区域中的至少一个通过相应的寡核苷酸引物对扩增(例如,其中所述引物对包含正向引物和反向引物)。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域中的每一个包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个以上甲基化敏感性限制位点。
在如前面段落中具体提及的各种实施方式中,相应的寡核苷酸引物对是表5中列出的寡核苷酸引物对。
在如前面段落中具体提及的各种实施方式中,相应寡核苷酸引物对的正向引物与表5中列出的正向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性。
在如前面段落中具体提及的各种实施方式中,相应寡核苷酸引物对的反向引物与表5中列出的反向引物具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性。
在如前面段落中具体提及的各种实施方式中,DNA分离自选自由人类受试者的组织(例如结肠直肠组织,例如息肉、腺瘤)、血液、血浆、尿液、唾液和粪便组成的组中的成员。
在如前面段落中具体提及的各种实施方式中,DNA是人类受试者的无细胞DNA。
在如前面段落中具体提及的各种实施方式中,该方法提供的检测结肠直肠癌的灵敏度为至少0.67。在本段和前面段落中具体提及的各种实施方式中,该方法提供的检测结肠直肠癌的灵敏度为至少0.78。
在如前面段落中具体提及的各种实施方式中,该方法提供的用于检测进行性腺瘤和结肠直肠癌的组合的总体灵敏度为至少0.48。在本段和前面段落中具体提及的各种实施方式中,该方法提供的用于检测进行性腺瘤和结肠直肠癌的组合的总体灵敏度为至少0.53。
在如前面段落中具体提及的各种实施方式中,该方法提供的特异性为至少0.9。在本段和前面段落中具体提及的各种实施方式中,该方法提供的特异性为至少0.93。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域包含表2的每个DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域中的每一个与表2的相应DMR具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表2的相应DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域包含表3的每个DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域中的每一个与表2的相应DMR具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表2的相应DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域包含表4的每个DMR。
在如前面段落中具体提及的各种实施方式中,DNA的一个或多个区域中的每一个与表4的相应DMR具有至少80%、至少85%、至少90%、至少95%、至少99%或至少99.5%的同一性,或包含表4的相应DMR。
在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(SVM)算法的分类模型。
在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
在另一方面,本公开提供了一种(i)筛查结肠直肠癌或者(ii)筛查进行性腺瘤或者(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定(例如,通过计算设备的处理器确定)一个或多个差异甲基化区域(DMR)的甲基化状态,所述一个或多个DMR中的每一个包含一个或多个基因或与所述一个或多个基因重叠,所述一个或多个基因选自由以下组成的组:PAX7、NTNG1、SYT6、LINC01248、KCNK3、GALNT14、CHST10、THSD7B、UNC80、EPHA6、MED12L、ADGRL3、RNF150、SPOCK3、GPM6A、HELT、GFPT2、HSPA1L、HSPA1A、NKAIN2、TMEM178B、DPP6、MICU3、ALKAL1、LOC401463、BHLHE22、RIMS2、LOC105375690、SLC25A32、DMRT1、CDKN2A、CDKN2B-AS1、PAX5、C1QL3、MYO3A、LOC101929073、GAD2、MYO3A、FOXI2、LOC105369438、AMOTL1、LOC101928847、NCAM1、DSCAML1、PTPRO、RERG、DPY19L2、CUX2、PCDH9、MIR4500HG、SLITRK5、SLC8A3、LOC646548、GATM、PIF1、RASGRF1、VAC14、VAT1L、JPH3、SLFN13、ZACN、SRP68、GALR2、ADCYAP1、CDH2、DOK6、ZNF461、ZNF829、ZNF568、ZNF540、ZNF571-AS1、CIC、ZNF582-AS1、ZNF582、ZNF471、ZNF264、ZNF671、ZNF551、ZNF776、NKX2-2、ADAMTS1、TIAM1和OLIG1;通过处理器应用分类模型,所述分类模型使用所述一个或多个DMR中每一个的已确定的甲基化状态作为输入;并且通过所述处理器从所述模型中输出人类受试者的(i)结肠直肠癌的预测状态,(ii)进行性腺瘤的预测状态,或者(iii)结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
在如前一段中具体提及的各种实施方式中,该方法包括确定一种或多种DMR的甲基化状态,所述DMR包含基因GAD2、MYO3A和ALKAL1中的至少每一个或与其重叠。
在如前面段落中具体提及的各种实施方式中,该方法包括确定一种或多种DMR的甲基化状态,所述DMR包含基因GAD2、MYO3A、ALKAL1、RASGRF1、MICU3、RASGRF1、FOXI2、C1QL3、CDKN2A和CDKN2B-AS1中的至少每一个或与其重叠。
在如前面段落中具体提及的各种实施方式中,该方法包括确定一种或多种DMR的甲基化状态,所述DMR包含基因GAD2、MYO3A、ALKAL1、RASGRF1、MICU3、RASGRF1、FOXI2、C1QL3、CDKN2A、CDKN2B-AS1、SYT6、SLFN13、GPM6A、THSD7B、ZBF582-AS1、ZNF582、GATM、ZNF540、ZNF571-AS1、OLIG1、EPHA6、DPY19L2、SLC8A3、LOC646548、LOC101929073、UNC80、DPP6、ZNF568、JPH3、ZNF461、NTNG1、ADGRL3、ADAMST1、CDH2、LINC01248、PTPRO、RERG、SLC8A3、LOC646548、PAX5、GFPT2中的至少每一个或与其重叠。
在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(SVM)算法的分类模型。
在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
在另一方面,本公开提供了一种(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,该方法包括:确定一个或多个差异甲基化区域(DMR)的甲基化状态,所述一个或多个DMR中的每一个与选自由以下组成的组的至少一个序列具有至少80%、至少85%、至少90%、至少95%、至少99%、或至少99.5%的序列同一性或包含选自由以下组成的组的至少一个序列:SEQ ID NO.190、SEQ ID NO.191、SEQ ID NO.192、SEQ ID NO.193、SEQ ID NO.194、SEQ ID NO.195、SEQ ID NO.196、SEQ IDNO.197、SEQ ID NO.198、SEQ ID NO.199、SEQ ID NO.200、SEQ ID NO.201、SEQ ID NO.202、SEQ ID NO.203、SEQ ID NO.204、SEQ ID NO.205、SEQ ID NO.206、SEQ ID NO.207、SEQ IDNO.208、SEQ ID NO.209、SEQ ID NO.210、SEQ ID NO.211、SEQ ID NO.212、SEQ ID NO.213、SEQ ID NO.214、SEQ ID NO.215、SEQ ID NO.216、SEQ ID NO.217、SEQ ID NO.218、SEQ IDNO.219、SEQ ID NO.220、SEQ ID NO.221、SEQ ID NO.222、SEQ ID NO.223、SEQ ID NO.224、SEQ ID NO.225、SEQ ID NO.226、SEQ ID NO.227、SEQ ID NO.228和SEQ ID NO.229;通过处理器应用分类模型,所述分类模型使用所述一个或多个DMR的确定的甲基化状态作为输入;并且通过处理器从所述模型中输出人类受试者的(i)结肠直肠癌的预测状态或(ii)进行性腺瘤的预测状态或者(iii)结肠直肠癌或进行性腺瘤的预测状态(例如,后者意味着患有结肠直肠癌和进行性腺瘤之一或两者的状态)。
在前一段中具体提及的各种实施方式中,该方法包括确定三个以上差异甲基化区域(DMR)中每一个的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括确定10个以上差异甲基化区域(DMR)中每一个的甲基化状态。
在如前面段落中具体提及的各种实施方式中,该方法包括确定40个差异甲基化区域(DMR)中每一个的甲基化状态。
在如前面段落中具体提及的各种实施方式中,分类模型是基于支持向量机(SVM)算法的分类模型。
在如前面段落中具体提及的各种实施方式中,该方法是体外方法。
在各个方面,本发明的方法和组合物可以与本领域已知(例如,如美国专利No.10,006,925中所公开的,其通过引用整体上并入本文)的生物标志物组合使用。
另一方面,本发明涉及鉴定一个或多个差异甲基化区域以用于(i)筛查结肠直肠癌或(ii)筛查进行性腺瘤,或(iii)筛查结肠直肠癌和/或进行性腺瘤的存在的方法,其中该方法包括:使用全基因组硫酸氢盐测序对诊断为患有(i)结肠直肠癌或(ii)进行性腺瘤,或(iii)结肠直肠癌和/或进行性腺瘤的受试者的第一群体(例如,至少10、至少20、至少50、至少100个以上受试者)的基因组的DNA进行测序;将第一群体的每个基因组与参比基因组(例如,其中参比基因组是GRCh38)比对;鉴定(例如,使用生物信息学工具,例如,MethylKit)多个甲基化结肠直肠癌和/或进行性腺瘤位点,其中多个甲基化结肠直肠癌和/或进行性腺瘤位点中的每一个是第一群体的DNA相对于参考群体(例如,包括健康受试者的群体)的相应位点的差异甲基化位点(例如,其中第一群体的DNA甲基化百分比相对于参考群体的差异为至少5%,至少10%、至少15%以上);生成包含多个差异甲基化区域(DMR)的列表,多个差异甲基化区域(DMR)中的每一个包含多个已鉴定的甲基化结肠直肠癌和/或进行性腺瘤癌位点中的一个或多个(例如,其中甲基化结肠直肠癌和/或进行性腺瘤癌位点是甲基化CpG区域或包含甲基化CpG区域)(例如,其中DMR包含至少三个甲基化CpG区域,CpG之间的最大距离为200个碱基对);确定第一群体的多个DMR中的每一个的甲基化状态(例如甲基化百分比、甲基化位点的数量);至少部分基于多个DMR中的每一个的甲基化状态对多个DMR进行排序;和过滤来自多个DMR的一组候选DMR(例如,过滤包含至少五个CPG区域的DMR)(例如,其中第一受试者组和参考群体之间的最小甲基化百分比差异为至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少15%以上)以用于结肠直肠癌和/或进行性腺瘤的诊断。
在如前一段中具体提及的各种实施方式中,该方法包括:鉴定多个DMR中的每一个内的一个或多个CpG区域;确定第一群体的多个DMR中的每一个内每个鉴定的CpG区域的甲基化状态(例如甲基化百分比、甲基化位点的数量);以及至少部分地基于DMR的一个或多个CpG区域中的每一个的确定的甲基化状态对多个DMR进行排序。
在如前面段落中具体提及的某些实施方式中,该方法进一步包括:确定参考群体的多个DMR中的每一个的甲基化状态;将参考群体的多个DMR中的每一个的确定的甲基化状态与第一群体的相应DMR的甲基化状态进行比较(例如,比较甲基化百分比);以及至少部分地基于所述比较对多个DMR进行排序。
在如前面段落中具体提及的某些实施方式中,第一群体的DNA分离自第一群体的每个人类受试者的组织(例如,结肠直肠组织,例如息肉、腺瘤)。
在如前面段落中具体提及的某些实施方式中,第一群体的DNA分离自第一群体的每个人类受试者的血液、血浆、尿液、唾液或粪便。
在其他方面,本发明涉及用于执行前述段落中提及的任何方法的系统,该系统包括处理器;以及其上具有指令的存储器,所述指令在由处理器执行时使处理器执行该方法的一个或多个(直至所有)步骤。
定义
一个或一种:冠词“一个”和“一种”在本文中用于指代一个或多于一个(即至少一个)冠词的语法对象。例如,“一种元素”是指一种元素或多于一种的元素。
约:术语“约”,当在本文中用于提及值时,是指在上下文中与所引用的值相似的值。一般而言,熟悉上下文的本领域技术人员将理解在该上下文中“约”所涵盖的相关差异程度。例如,在一些实施方式中,术语“约”可涵盖在参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或百分之几的值的范围。
进行性腺瘤:如本文所用,术语“进行性腺瘤”用于指结肠和直肠的腺瘤性息肉(腺瘤),其是良性(非癌性)的细胞生长。进行性腺瘤是结肠腺瘤性腺瘤,至少具有以下特征之一:尺寸≥1cm;管状绒毛状或绒毛状腺瘤;高度不典型增生;和锯齿状腺瘤伴发育不良。在某些情况下,例如,如本文所述,进行性腺瘤也可归类为“高风险”腺瘤。
施用:如本文所用,术语“施用”通常是指将组合物施用至受试者或系统,例如以实现包括在组合物中或以其他方式由组合物递送的试剂的递送。
试剂:如本文所用,术语“试剂”是指实体(例如,小分子、肽、多肽、核酸、脂质、多糖、复合物、组合、混合物、系统或现象,例如热、电流、电场、磁力、磁场等)。
改善:如本文所用,术语“改善”是指受试者状态的预防、减轻、缓和或改良。改善包括但不要求完全康复或完全预防疾病、病症或状况。
扩增子或扩增子分子:如本文所用,术语“扩增子”或“扩增子分子”是指通过从模板核酸分子转录产生的核酸分子,或具有与其互补的序列的核酸分子,或双链核酸,包括任何此类核酸分子。转录可以从引物开始。
扩增:如本文所用,术语“扩增”是指使用模板核酸分子与各种试剂组合以从模板核酸分子产生另外的核酸分子,这些另外的核酸分子可以相同或与模板核酸分子的片段相似(例如,具有至少70%的同一性,例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性)和/或是与其互补的序列。
扩增反应混合物:如本文所用,术语“扩增反应混合物”或“扩增反应”是指模板核酸分子连同足以扩增模板核酸分子的试剂。
生物样品:如本文所用,术语“生物样品”通常是指从感兴趣的生物来源(例如,组织或生物体或细胞培养物)获得或衍生的样品,如本文所述。在一些实施方式中,生物来源是或包括生物体,例如动物或人。在一些实施方式中,例如,如本文所提出的,生物样品是或包括生物组织或流体。在一些实施方式中,例如,如本文所提出的,生物样品可以是或包括细胞、组织或体液。在一些实施方式中,例如,如本文所提出的,生物样品可以是或包括血液、血细胞、无细胞DNA、自由漂浮的核酸、腹水、活检样品、手术试样、含有细胞的体液、痰、唾液、粪便、尿液、脑脊液、腹腔液、胸水、淋巴液、妇科液、分泌物、排泄物、皮肤拭子、阴道拭子、口腔拭子、鼻拭子、冲洗液或灌洗液,例如导管灌洗液或支气管肺泡灌洗液、抽吸物、刮屑、骨髓。在一些实施方式中,例如,如本文所提出的,生物样品是或包括从单个受试者或多个受试者获得的细胞。样品可以是直接从生物来源获得的“原始样品”,也可以是“处理过的样品”。生物样品也可称为“样品”。
生物标志物:如本文所用,术语“生物标志物”与其在本领域中的使用一致,是指其存在、水平或形式与特定生物事件或感兴趣的状态相关的实体,因此其被认为是成为该事件或状态的“标志物”。本领域技术人员将理解,例如,在DNA生物标志物的上下文中,生物标志物可以是或包括基因座(例如一个或多个甲基化基因座)和/或基因座的状态(例如,一个或多个甲基化基因座的状态)。仅举几个生物标志物的例子,在一些实施方式中,例如,如本文所提出的,生物标志物可以是或包括特定疾病、病症或状况的标志物,或者可以是特定疾病、病症或状况可以例如在受试者中发展、发生或复发的定量概率的定性标志物。在一些实施方式中,例如,如本文所提出的,生物标志物可以是或包括特定治疗结果的标志物,或其定量概率的定性。因此,在各种实施方式中,如本文所提出的,生物标志物可以预测、预后和/或诊断相关生物事件或感兴趣的状态。生物标志物可以是任何化学类别的实体。例如,在一些实施方式中,例如,如本文所提出的,生物标志物可以是或包括核酸、多肽、脂质、碳水化合物、小分子、无机试剂(例如,金属或离子)或其组合。在一些实施方式中,例如,如本文所提出的,生物标志物是细胞表面标志物。在一些实施方式中,例如,如本文所提出的,生物标志物是细胞内的。在一些实施方式中,例如,如本文所提出的,在细胞外发现生物标志物(例如,在细胞外分泌或以其他方式产生或存在,例如在体液中,例如血液、尿液、眼泪、唾液、脑脊液等)。在一些实施方式中,例如,如本文所提出的,生物标志物是甲基化基因座的甲基化状态。在某些情况下,例如,如本文所提出的,生物标志物可称为“标志物”。
仅举一个生物标志物的实例,在一些实施方式中,例如,如本文所提出的,该术语指由基因编码的产物的表达,其表达是特定肿瘤、肿瘤亚类、肿瘤分期等的特征。作为另选或另外,在一些实施方式中,例如,如本文所提出的,特定标志物的存在或水平可以与特定信号传导途径的活性(或活性水平)相关,例如,其活性是特定类别肿瘤特征的信号传导途径。
本领域技术人员将理解,生物标志物可以单独确定特定生物事件或感兴趣的状态,或者可以代表或有助于确定特定生物事件或感兴趣状态的统计概率。本领域技术人员将理解,标志物在其与特定生物事件或感兴趣状态相关的特异性和/或灵敏度方面可能不同。
血液成分:如本文所用,术语“血液成分”是指全血的任何成分,包括红细胞、白细胞、血浆、血小板、内皮细胞、间皮细胞、上皮细胞和无细胞DNA。血液成分还包括血浆成分,包括蛋白质、代谢物、脂质、核酸和碳水化合物,以及可存在于血液中的任何其他细胞,例如由于怀孕、器官移植、感染、损伤或疾病而存在于血液中的任何其他细胞。
癌症:如本文所用,术语“癌症”、“恶性肿瘤”、“赘生物”、“肿瘤”和“癌”可互换使用,指其中细胞表现出或表现了相对异常的、不受控制的和/或自主生长的疾病、病症或状况,因此它们展现出或展现了异常升高的增殖率和/或异常生长表型。在一些实施方式中,例如,如本文所提出的,癌症可包括一种或多种肿瘤。在一些实施方式中,例如,如本文所提出的,癌症可以是或包括癌前(例如良性)、恶性、转移前、转移和/或非转移的细胞。在一些实施方式中,例如,如本文所提出的,癌症可以是或包括实体瘤。在一些实施方式中,例如,如本文所提出的,癌症可以是或包括血液肿瘤。一般而言,本领域已知的不同类型癌症的实例包括例如结肠直肠癌,造血系统癌症包括白血病、淋巴瘤(霍奇金和非霍奇金)、骨髓瘤和骨髓增生性疾病;肉瘤,黑色素瘤,腺瘤,实体组织癌,口腔、咽喉、喉癌和肺癌的鳞状细胞癌,肝癌,泌尿生殖系统癌症如前列腺癌、宫颈癌、膀胱癌、子宫癌和子宫内膜癌,以及肾细胞癌,骨癌,胰腺癌,皮肤癌,皮肤或眼内黑色素瘤,内分泌系统癌,甲状腺癌,甲状旁腺癌,头颈癌,乳腺癌,胃肠癌和神经系统癌,良性病变等如乳头状瘤等。
化学治疗剂:如本文所用,术语“化学治疗剂”与其在本领域中的使用一致,是指一种或多种已知用于治疗癌症或有助于治疗癌症的或具有用于治疗癌症或有助于治疗癌症的已知特征的试剂。特别地,化学治疗剂包括促凋亡剂、细胞生长抑制剂和/或细胞毒性剂。在一些实施方式中,例如,如本文所提出的,化学治疗剂可以是或包括烷化剂、蒽环类、细胞骨架破坏剂(例如微管靶向部分,例如紫杉烷、美登素及其类似物)、埃坡霉素、组蛋白脱乙酰酶抑制剂HDAC)、拓扑异构酶抑制剂(例如抑制剂拓扑异构酶I和/或拓扑异构酶II)、激酶抑制剂、核苷酸类似物或核苷酸前体类似物、肽抗生素、铂类药物、维甲酸类、长春花生物碱了和/或具有相关抗增殖活性的类似物。在一些特定实施方式中,例如,如本文所提出的,化学治疗剂可以是或包括放线菌素、全反式视黄酸、奥瑞他汀、阿扎胞苷、硫唑嘌呤、博来霉素、硼替佐米、卡铂、卡培他滨、顺铂、氯霉素、环磷酰胺、姜黄素、阿糖胞苷、柔红霉素、多西紫杉醇、多西氟尿苷、多柔比星、表柔比星、埃坡霉素、依托泊苷、氟尿嘧啶、吉西他滨、羟基脲、伊达比星、伊马替尼、伊立替康、美登素和/或其类似物(如DM1)、氮芥、巯嘌呤、甲氨蝶呤、米托蒽醌、美坦素、奥沙利铂、紫杉醇、培美曲塞、泰尼泊苷、硫鸟嘌呤、托泊替康、戊柔比星、长春碱、长春新碱、长春地辛、长春瑞滨或其组合。在一些实施方式中,例如,如本文所提出的,可以在抗体-药物偶联物的上下文中使用化学治疗剂。在一些实施方式中,例如,如本文所提出的,化学治疗剂是在抗体-药物缀合物中发现的一种,其选自由以下组成的组:hLL1-多柔比星、hRS7-SN-38、hMN-14-SN-38、hLL2-SN-38、hA20-SN-38、hPAM4-SN-38、hLL1-SN-38、hRS7-Pro-2-P-Dox、hMN-14-Pro-2-P-Dox、hLL2-Pro-2-P-Dox、hA20-Pro-2-P-Dox、hPAM4-Pro-2-P-Dox、hLL1-Pro-2-P-Dox、P4/D10-多柔比星、吉妥珠单抗奥佐米星、本妥昔单抗、曲妥珠单抗、奥英妥珠单抗、格巴妥莫单抗(glembatumomab vedotin)、SAR3419、SAR566658、BIIB015、BT062、SGN-75、SGN-CD19A、AMG-172、AMG-595、BAY-94-9343、ASG-5ME、ASG-22ME、ASG-16M8F、MDX-1203、MLN-0264、anti-PSMA ADC、RG-7450、RG-7458、RG-7593、RG-7596、RG-7598、RG-7599、RG-7600、RG-7636、ABT-414、IMGN-853、IMGN-529、玛汀-沃瑟妥珠单抗(vorsetuzumab mafodotin)和莫星-洛沃妥珠单抗(lorvotuzumab mertansine)。在一些实施方式中,如本文所提出的,化学治疗剂可以是或包含法呢基-硫代水杨酸(FTS)、4-(4-氯-2-甲基苯氧基)-N-羟基丁酰胺(CMH)、雌二醇(E2)、四甲氧基芪(TMS)、δ-生育三烯酚、盐霉素或姜黄素。
可比较:如本文所用,术语“可比较”是指两个以上条件、环境、试剂、实体、群体等的组,它们可能彼此不相同,但足够相似以允许在之间进行比较,使得本领域技术人员将理解可以基于观察到的差异或相似性合理地得出结论。在一些实施方式中,例如,如本文所提出的,条件、环境、试剂、实体、群体等的可比较组通常以多个基本上相同的特征和零个、一个或多个不同的特征为特征。本领域普通技术人员将理解,在上下文中,需要何种程度的同一性才能使组中的成员是可比较的。例如,本领域普通技术人员将理解,当以足够数量和类型的基本上相同的特征为特征以保证观察到的差异可以全部或部分归因于其不相同的特征的合理结论。
可检测部分:如本文所用,术语“可检测部分”是指可检测的任何元素、分子、官能团、化合物、片段或其他部分。在一些实施方式中,例如,如本文所提出的,可检测部分单独提供或使用。在一些实施方式中,例如,如本文所提出的,提供和/或利用与另一试剂相关联(例如,连接至另一试剂)的可检测部分。可检测部分的实例包括但不限于各种配体、放射性同位素(例如3H、14C、18F、19F、32P、35S、135I、125I、123I、64Cu、187Re、111In、90Y、99mTc、177Lu、89Zr等)、荧光染料、化学发光剂、生物发光剂、光谱可分辨的无机荧光半导体纳米晶体(即量子点)、金属纳米颗粒、纳米团簇、顺磁性金属离子、酶、比色标记、生物素、地高辛(dioxigenin)、半抗原和可获得抗血清或单克隆抗体的蛋白质。
诊断:如本文所用,术语“诊断”是指确定受试者是否患有或将发展疾病、病症、状况或状态,和/或定量概率的定性。例如,在癌症的诊断中,诊断可以包括关于癌症的风险、类型、阶段、恶性度或其他分类的确定。在一些情况下,例如,如本文所提出的,诊断可以是或包括与预后和/或对一种或多种一般或特定治疗剂或方案的可能响应有关的确定。
诊断信息:如本文所用,术语“诊断信息”是指可用于提供诊断的信息。诊断信息可以包括但不限于生物标志物状态信息。
差异甲基化:如本文所用,术语“差异甲基化”描述了甲基化状态在第一条件和第二条件之间不同的甲基化位点。差异甲基化的甲基化位点可称为差异甲基化位点。在一些情况下,例如,如本文所提出的,DMR由通过使用寡核苷酸引物扩增产生的扩增子定义,例如,选择用于扩增DMR或扩增存在于扩增子中的感兴趣的DNA区域的一对寡核苷酸引物。在一些情况下,例如,如本文所提出的,DMR被定义为由一对寡核苷酸引物扩增的DNA区域,包括具有寡核苷酸引物的序列或与寡核苷酸引物互补的序列的区域。在一些情况下,例如,如本文所提出的,DMR被定义为由一对寡核苷酸引物扩增的DNA区域,不包括具有寡核苷酸引物的序列或与寡核苷酸引物互补的序列的区域。
差异甲基化区域:如本文所用,术语“差异甲基化区域”(DMR)是指包含一个或多个差异甲基化位点的DNA区域。在选定的感兴趣的条件下,例如癌症状态,包括更多数量或频率的甲基化位点的DMR可以被称为超甲基化DMR。在选定的感兴趣的条件下,例如癌症状态,包括较少数量或频率的甲基化位点的DMR可以被称为低甲基化DMR。作为结肠直肠癌甲基化生物标志物的DMR可称为结肠直肠癌DMR。在某些情况下,例如,如本文所提出的,作为结肠直肠癌甲基化生物标志物的DMR也可用于鉴定进行性腺瘤。在一些情况下,例如,如本文所提出的,作为进行性腺瘤的甲基化生物标志物的DMR可以被称为进行性腺瘤DMR。在一些情况下,例如,如本文所提出的,作为进行性腺瘤甲基化生物标志物的DMR也可用于鉴定结肠直肠癌。在一些情况下,例如,如本文所提出的,DMR可以是单核苷酸,该单核苷酸是甲基化位点。优选地,DMR的长度为至少约10、15、20、24、50、100、150、200、250、300、350、400、500、1000、1500、2000、2225、2500以上碱基对。
DNA区:如本文所用,“DNA区”是指较大DNA分子的任何连续部分。本领域技术人员将熟悉用于确定第一DNA区和第二DNA区是否对应的技术,例如基于第一DNA区和第二DNA区的序列相似性(例如,序列同一性或同源性)和/或上下文(例如,第一DNA区和第二DNA区上游和/或下游的核酸的序列同一性或同源性)。
除非本文另有说明,在人类中发现的或与人类相关的序列(例如,与人类DNA杂交的序列)发现于、基于和/或衍生自实例代表性的人基因组序列,其通常称为和本领域技术人员已知为智人(人类)基因组组装GRCh38、hg38和/或基因组参考联盟Human Build 38。本领域技术人员将进一步理解,hg38的DNA区可以通过已知系统提及,所述已知系统包括根据指定的编号鉴定特定核苷酸位置或其范围。
下游:如本文所用,术语“下游”是指第一DNA区相对于第二DNA区更靠近包括第一DNA区和第二DNA区的核酸的C末端。
基因:如本文所用,术语“基因”是指例如在染色体中的单个DNA区,其包括编码产物(例如,RNA产物和/或多肽产物)的编码序列,连同所有、一些或没有有助于调节编码序列表达的DNA序列。在一些实施方式中,例如,如本文所提出的,基因包括一个或多个非编码序列。在一些特定实施方式中,例如,如本文所提出的,基因包括外显子和内含子序列。在一些实施方式中,例如,如本文所提出的,基因包括一种或多种调控元件,其例如可以控制或影响基因表达的一个或多个方面(例如,细胞类型特异性表达、诱导性表达等)。在一些实施方式中,例如,如本文所提出的,基因包括启动子。在一些实施方式中,例如,如本文所提出的,基因包括(i)在编码序列上游延伸预定数量的核苷酸的DNA核苷酸和(ii)在编码序列下游延伸预定数量的核苷酸的DNA核苷酸中的一者或两者。在各种实施方式中,例如,如本文所提出的,预定数量的核苷酸可以是500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。
杂交:如本文所用,“杂交”是指第一核酸与第二核酸结合以形成双链结构,该结合通过核苷酸的互补配对发生。本领域技术人员将认识到,互补序列尤其可以杂交。在各种实施方式中,例如,如本文所提出的,杂交可发生在例如具有至少70%互补性,例如至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互补性的核苷酸序列之间。本领域技术人员将进一步理解第一核酸和第二核酸的杂交是否发生可取决于各种反应条件。可以发生杂交的条件是本领域已知的。
低甲基化:如本文所用,术语“低甲基化”是指与参考状态相比,在感兴趣的状态中甲基化核苷酸至少一个少一个的甲基化基因座的状态(例如,与健康对照相比在结肠直肠癌中甲基化核苷酸至少少一个)。
超甲基化:如本文所用,术语“超甲基化”是指与参考状态相比在感兴趣的状态中甲基化核苷酸至少一个多一个的甲基化基因座的状态(例如,与健康对照相比在结肠直肠癌中甲基化核苷酸至少多一个)。
同一性,同一的:如本文所用,术语“同一性”和“同一的”是指聚合性分子之间,例如核酸分子(例如,DNA分子和/或RNA分子)之间和/或多肽分子之间的总体相关性。计算两个提供的序列之间的百分比同一性的方法是本领域已知的。两个核酸或多肽序列的百分比同一性的计算,例如,可以通过比对两个序列(或一个或两个序列的互补序列)以实现最佳比较目的(例如,可以在第一序列和第二序列中的一个或两个中引入缺口以用于最佳比对,以及出于比较目的可以忽略不相同的序列)。然后比较相应位置处的核苷酸或氨基酸。当第一序列中的一个位置被与第二个序列中的相应位置相同的残基(例如,核苷酸或氨基酸)占据时,则分子在该位置是相同的。两个序列之间的百分比同一性是序列共享的相同位置数量的函数,可选地考虑缺口的数量和每个缺口的长度,可能需要引入其以实现两个序列的最佳比对。序列的比较和两个序列之间同一性百分比的确定可以使用计算算法来完成,例如BLAST(基本局部比对搜索工具)。
“改善”、“增加”或“减少”:如本文所用,这些术语或语法上可比较的比较术语表示相对于可比较的参考测量的值。例如,在一些实施方式中,例如,如本文所提出的,相对于使用可比较的参考试剂或没有试剂获得的评估值,使用感兴趣的试剂实现的评估值可以“提高”。替代地或另外地,在一些实施方式中,例如,如本文所提出的,相对于在不同条件下或在不同时间点(例如,在诸如施用感兴趣的试剂等事件之前或之后)在相同受试者或系统中获得的评估值,或在不同的比比较的受试者中(例如,在可比较的受试者或系统中,其与感兴趣的受试者或系统不同之处在于存在一种或多种特定疾病、感兴趣的障碍或状况,或之前接触过某种状况或试剂等),在感兴趣受试者或系统中的评估值可以“提高”。在一些实施方式中,例如,如本文所提出的,比较性术语指的是统计相关的差异(例如,足以实现统计相关性的普遍性和/或量级的差异)。本领域技术人员将意识到或将能够容易地确定在给定上下文中需要或足以实现此类统计显著性的差异的程度和/或普遍性。
甲基化:如本文所用,术语“甲基化”包括在(i)胞嘧啶的C5位置;(ii)胞嘧啶的N4位置;(iii)腺嘌呤的N6位置中的任何位置处的甲基化。甲基化还包括(iv)其他类型的核苷酸甲基化。甲基化的核苷酸可称为“甲基化核苷酸”或“甲基化核苷酸碱基”。在某些实施方式中,例如,如本文所提出的,甲基化特指胞嘧啶残基的甲基化。在某些情况下,例如,如本文所提出的,甲基化特指存在于CpG位点中的胞嘧啶残基的甲基化。
甲基化测试:如本文所用,术语“甲基化测试”是指可用于确定甲基化基因座的甲基化状态或甲基化位点的任何技术。
甲基化生物标志物:如本文所用,术语“甲基化生物标志物”是指生物标志物,其是或包括至少一个甲基化位点或基因座和/或至少一个甲基化基因座的甲基化状态,例如超甲基化基因座。特别地,甲基化生物标志物是一种生物标志物,其特征在于一个或多个核酸基因座的甲基化状态在第一状态和第二状态之间(例如,在癌性状态和非癌性状态之间)的变化。
甲基化基因座:如本文所用,术语“甲基化基因座”是指包含至少一个差异甲基化区域的DNA区。在选定的感兴趣的条件下,例如癌症状态,包括更多数量或频率的甲基化位点的甲基化基因座可以被称为超甲基化基因座。在选定的感兴趣的条件下,例如癌症状态,包括较少数量或频率的甲基化位点的甲基化基因座可以被称为低甲基化基因座。
甲基化位点:如本文所用,甲基化位点是指在至少一种条件下被甲基化的核苷酸或核苷酸位置。在其甲基化状态下,甲基化位点可称为甲基化的位点。
甲基化状态:如本文所用,“甲基化状态”、“甲基化态”或“甲基化谱”是指甲基化基因座内甲基化位点处甲基化的数量、频率或模式。因此,第一状态和第二状态之间甲基化状态的变化可以是或包括甲基化位点的数量、频率或模式的增加,或者可以是或包括甲基化位点的数量、频率或模式的减少。在各种情况下,例如,如本文所提出的,甲基化状态的变化是甲基化值的变化。在各种情况下,例如,如本文所提出的,“甲基化状态”是指在个体甲基化位点是否存在甲基化。
甲基化值:如本文所用,术语“甲基化值”是指甲基化状态的数字表示,例如,以代表甲基化基因座甲基化频率或比率的数字形式。在一些情况下,例如,如本文所提出的,甲基化值可以通过包括在用甲基化依赖性限制酶对样品进行限制性消化后定量样品中存在的完整核酸的量的方法产生。在一些情况下,例如,如本文所提出的,甲基化值可以通过包括在样品的亚硫酸氢盐反应之后比较扩增谱的方法产生。在一些情况下,例如,如本文所提出的,可以通过比较亚硫酸氢盐处理的和未处理的核酸的序列来产生甲基化值。在一些情况下,例如,如本文所提出的,甲基化值是或包括或基于定量PCR结果。
核酸:如本文所用,在其最广泛的意义上,术语“核酸”是指被引入或可以引入寡核苷酸链中的任何化合物和/或物质。在一些实施方式中,例如,如本文所提出的,核酸是通过磷酸二酯键引入或可以引入寡核苷酸链中的化合物和/或物质。从上下文中将清楚,在一些实施方式中,例如,如本文所提出的,术语核酸指单体核酸残基(例如,核苷酸和/或核苷),并且在一些实施方式中,例如,如本文所提出的,指包含多个单体核酸残基的多核苷酸链。核酸可以是或包括DNA、RNA或其组合。核酸可包括天然核酸残基、核酸类似物和/或合成残基。在一些实施方式中,例如,如本文所提出的,核酸包括天然核苷酸(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)。在一些实施方式中,例如,如本文所提出的,核酸是或包括一种或多种核苷酸类似物(例如,2-氨基腺苷、2-硫胸苷、肌苷、吡咯-嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5-丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷8-氧代腺苷、8-氧代鸟苷、0(6)-甲基鸟嘌呤、2-硫胞苷、甲基化碱基、嵌入碱基及其组合)。
在一些实施方式中,例如,如本文所提出的,核酸具有编码功能基因产物例如RNA或蛋白质的核苷酸序列。在一些实施方式中,例如,如本文所提出的,核酸包括一个或多个内含子。在一些实施方式中,例如,如本文所提出的,核酸包括一个或多个基因。在一些实施方式中,例如,如本文所提出的,核酸通过从天然来源分离、通过基于互补模板的聚合酶促合成(体内或体外)、在重组细胞或系统中繁殖和化学合成中的一种或多种来制备。
在一些实施方式中,例如,如本文所提出的,核酸类似物与核酸的不同之处在于它不利用磷酸二酯骨架。例如,在一些实施方式中,例如,如本文所提出的,核酸可以包括一种或多种肽核酸,其是本领域已知的并且在主链中具有肽键而不是磷酸二酯键。作为选择或另外,在一些实施方式中,例如,如本文所提出的,核酸具有一个或多个硫代磷酸酯和/或5'-N-亚磷酰胺键而不是磷酸二酯键。在一些实施方式中,例如,如本文所提出的,与天然核酸中的那些相比,核酸包含一种或多种经修饰的糖(例如,2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖)。
在一些实施方式中,例如,如本文所提出的,核酸是或包括至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、1 10、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000或更多个残基。在一些实施方式中,例如,如本文所提出的,核酸部分或完全是单链的,或者部分或完全是双链的。
核酸检测测试:如本文所用,术语“核酸检测测试”是指确定感兴趣核酸的核苷酸组成的任何方法。核酸检测测试包括但不限于DNA测序方法、基于聚合酶链式反应的方法、探针杂交方法、连接酶链反应等。
核苷酸:如本文所用,术语“核苷酸”是指例如DNA和/或RNA聚合物的多核苷酸的结构组分或构件。核苷酸包括碱基(例如,腺嘌呤、胸腺嘧啶、尿嘧啶、鸟嘌呤或胞嘧啶)和糖分子和至少一个磷酸基团。如本文所用,核苷酸可以是甲基化的核苷酸或未甲基化的核苷酸。本领域技术人员将理解,核酸术语,例如“基因座”或“核苷酸”可以指单个核酸分子的基因座或核苷酸和/或指基因座的累积群体或代表基因座或核苷酸的多个核酸(例如样品和/或受试者的代表中的多个核酸)中的核苷酸(例如,具有相同的相同核酸序列和/或核酸序列背景,或具有基本上相同的核酸序列和/或核酸背景)。
寡核苷酸引物:如本文所用,术语寡核苷酸引物或引物是指使用、能够使用或用于从模板核酸分子产生扩增子的核酸分子。在允许转录的条件下(例如,在核苷酸和DNA聚合酶的存在下,以及在合适的温度和pH值下),寡核苷酸引物可以提供从与寡核苷酸引物杂交的模板的转录起始点。通常,寡核苷酸引物是长度为5至200个核苷酸的单链核酸。本领域技术人员将理解用于从模板核酸分子产生扩增子的最佳引物长度可随包括温度参数、引物组成和转录或扩增方法在内的条件而变化。如本文所用,一对寡核苷酸引物是指分别与模板双链核酸分子的第一链和第二链互补的一组两条寡核苷酸引物。就模板核酸链而言,一对寡核苷酸引物的第一成员和第二成员可分别称为“正向”寡核苷酸引物和“反向”寡核苷酸引物,因为正向寡核苷酸引物能够和与模板核酸链互补的核酸链杂交,反向寡核苷酸引物能够与模板核酸链杂交,并且正向寡核苷酸引物相对于模板核酸链的位置为反向寡核苷酸引物序列相对于模板核酸链的位置的5'。本领域技术人员将理解,第一寡核苷酸引物和第二寡核苷酸引物分别作为正向寡核苷酸引物和反向寡核苷酸引物的鉴定是任意的,因为这些标识符取决于给定的核酸链或其互补物是否被用作模板核酸分子。
重叠:术语“重叠”在本文中用于指DNA的两个区域,每个区域包含与另一个区域中相同长度的子序列基本上相同的子序列(例如,DNA的两个区域具有共同的子序列)。“基本上相同”是指两个长度相同的子序列的差异小于给定数量的碱基对。在某些情况下,例如,如本文所提出的,每个子序列具有至少20个碱基对的长度,这些碱基对彼此相差少于4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少24个碱基对的长度,这些碱基对相差少于5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少50个碱基对的长度,这些碱基对相差少于10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少100个碱基对的长度,这些碱基对相差少于20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少200个碱基对的长度,这些碱基对相差少于40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少250个碱基对的长度,这些碱基对相差少于50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少300个碱基对的长度,这些碱基对相差少于60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少500个碱基对的长度,这些碱基对相差少于100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,每个子序列具有至少1000个碱基对的长度,这些碱基对相差少于200、100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如,两个子序列具有至少80%、至少85%、至少90%、至少95%相似性、至少97%相似性、至少98%相似性、至少99%相似性或至少99.5%相似性)。在某些情况下,例如,如本文所提出的,两个DNA区域的第一个区域的子序列可以包含两个DNA区域的第二个区域的全部(或反之亦然)(例如,共同的子序列可以包含一个或两个区域的全部)。
预防或防止:如本文所用的与疾病、病症或状况的发生相关的术语“预防”和“防止”是指降低发生疾病、病症或状况的风险;延迟疾病、病症或状况的发作;延迟疾病、病症或状况的一种或多种特征或症状的发作;和/或降低疾病、病症或状况的一种或多种特征或症状的频率和/或严重性。预防可以指对特定受试者的预防或对受试者群体的统计影响。当疾病、病症或状况的发作延迟了预定的时间段时,可以认为预防是完全的。
探针:如本文所用,术语“探针”是指能够与互补靶标杂交并包括可检测部分的单链或双链核酸分子。在某些实施方式中,例如,如本文所提出的,探针是限制性消化产物或合成产生的核酸,例如通过重组或扩增产生的核酸。在一些情况下,例如,如本文所提出的,探针是可用于检测、鉴定和/或分离靶序列例如基因序列的捕获探针。在各种情况下,例如,如本文所提出的,探针的可检测部分可以是例如酶(例如ELISA,以及基于酶的组织化学分析)、荧光部分、放射性部分或与发光信号相关的部分。
预后:如本文所用,术语“预后”是指确定至少一种可能的未来结果或事件的定量概率的定性。如本文所用,预后可以是对受试者中疾病、病症或状况例如癌症的可能进程的确定,关于受试者预期寿命的确定,或关于对治疗(例如特殊疗法)的响应的确定。
预后信息:如本文所用,术语“预后信息”是指可用于提供预后的信息。预后信息可包括但不限于生物标志物状态信息。
启动子:如本文所用,“启动子”可以指直接或间接(例如,通过启动子结合的蛋白质或物质)与RNA聚合酶结合并参与编码序列转录起始的DNA调控区。
参考:如本文所用,描述了相对于其进行比较的标准或对照。例如,在一些实施方式中,例如,如本文所提出的,将感兴趣的试剂、受试者、动物、个体、群体、样品、序列或值与参考或对照试剂、受试者、动物、个体、群体、样品、序列或值进行比较。在一些实施方式中,例如,如本文所提出的,与感兴趣样品中的特征的测试或确定基本上同时地测试和/或确定参考或其特征。在一些实施方式中,例如,如本文所提出的,参考是历史参考,可选地体现在有形媒介中。通常,如本领域技术人员将理解的,参考是在与评估中的那些可比较的条件或环境下确定或表征,例如,关于样品。当存在足够的相似性以证明对特定可能参考或对照的依赖和/或比较是合理的时,本领域技术人员将理解。
风险:如本文所用,关于疾病、病症或状况,术语“风险”是指特定个体发展疾病、病症或状况的定量概率(无论以百分比或其他方式表示)的定性。在一些实施方式中,例如,如本文所提出的,风险表示为百分比。在一些实施方式中,例如,如本文所提出的,风险是等于或大于0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100%的定量概率的定性。在一些实施方式中,例如,如本文所提出的,风险被表达为相对于参考风险或水平的风险或归因于参考的相同结果的风险的定量水平的定性。在一些实施方式中,例如,如本文所提出的,相对风险与参考样品相比增加或减少了的系数为1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10或更多。
样品:如本文所用,术语“样品”通常是指从感兴趣的来源获得或衍生的材料的等分试样。在一些实施方式中,例如,如本文所提出的,感兴趣的来源是生物或环境来源。在一些实施方式中,例如,如本文所提出的,样品是直接从感兴趣的来源获得的“原始样品”。在一些实施方式中,例如,如本文所提出的,从上下文中将清楚,术语“样品”是指通过处理原始样品(例如,通过去除一种或多种成分和/或通过将一种或多种试剂添加到原始样品中)获得的制剂。这样的“处理过的样品”可以包括例如从样品中提取的或通过使原始样品经受诸如核酸的扩增或逆转录、某些成分的分离和/或纯化等技术获得的细胞、核酸或蛋白质,等等。
在某些情况下,例如,如本文所提出的,处理过的样品可以是已被扩增(例如,预扩增)的DNA样品。因此,在各种情况下,例如,如本文所提出的,鉴定的样品可以指样品的原始形式或样品的加工形式。在一些情况下,酶消化的DNA样品可以指初级酶消化的DNA(酶消化的直接产物)或进一步加工的样品,例如酶消化的DNA,其已经经过扩增步骤(例如,中间扩增步骤,例如预扩增)和/或过滤步骤、纯化步骤或修饰样品的步骤以促进进一步的步骤,例如在确定甲基化状态(例如,DNA的原始样品的甲基化状态和/或存在于其原始来源背景中的DNA的原始样品的甲基化状态)。
筛查:如本文所用,术语“筛查”是指旨在生成诊断信息和/或预后信息的任何方法、技术、过程或任务。因此,本领域技术人员将理解,术语筛查涵盖确定个体是否患有、可能患有或发展、或有风险患有或发展疾病、病症或状况,例如,结肠直肠癌的方法、技术、过程或任务。
特异性:如本文所用,生物标志物的“特异性”是指以不存在感兴趣的事件或状态为特征的样品的百分比,对此,生物标志物的测量准确地表明不存在感兴趣的事件或状态(真阴性率)。在各种实施方式中,例如,如本文所提出的,阴性样品的表征不依赖于生物标志物,并且可以通过任何相关测量来实现,例如本领域技术人员已知的任何相关测量。因此,特异性反映了当在未表征感兴趣的事件或状态的样品中测量时生物标志物检测不存在感兴趣的事件或状态的概率。在其中感兴趣的事件或状态是结肠直肠癌的特定实施方式中,例如,如本文所提出的,特异性是指生物标志物检测没有结肠直肠癌的受试者中没有结肠直肠癌的概率。例如,可以通过组织学来确定没有结肠直肠癌。
灵敏度:如本文所用,生物标志物的“灵敏度”是指以存在感兴趣的事件或状态为特征的样品的百分比,对此,生物标志物的测量准确地表明存在感兴趣的事件或状态(真阳性率)。在各种实施方式中,例如,如本文所提出的,阳性样品的表征不依赖于生物标志物,并且可以通过任何相关测量来实现,例如本领域技术人员已知的任何相关测量。因此,灵敏度反映了当在以存在感兴趣的事件或状态为特征的样品中测量时,生物标志物将检测到感兴趣的事件或状态存在的概率。在其中感兴趣的事件或状态是结肠直肠癌的特定实施方式中,例如,如本文所提出的,灵敏度是指生物标志物检测患有结肠直肠癌的受试者中是否存在结肠直肠癌的概率。结肠直肠癌的存在可以例如通过组织学来确定。
实体瘤:如本文所用,术语“实体瘤”是指包括癌细胞在内的异常组织块。在各种实施方式中,例如,如本文所提出的,实体瘤是或包括不包含囊肿或液体区域的异常组织块。在一些实施方式中,例如,如本文所提出的,实体瘤可以是良性的;在一些实施方式中,实体瘤可以是恶性的。实体瘤的例子包括癌、淋巴瘤和肉瘤。在一些实施方式中,例如,如本文所提出的,实体瘤可以是或包括肾上腺、胆管、膀胱、骨、脑、乳腺、子宫颈、结肠、子宫内膜、食道、眼睛、胆囊、胃肠道、肾、喉、肝、肺、鼻腔、鼻咽、口腔、卵巢、阴茎、垂体、前列腺、视网膜、唾液腺、皮肤、小肠、胃、睾丸、胸腺、甲状腺、子宫、阴道和/或外阴肿瘤。
癌症分期:如本文所用,术语“癌症分期”是指对癌症进展水平的定性或定量评估。在一些实施方式中,例如,如本文所提出的,用于确定癌症分期的标准可以包括但不限于癌症在身体中的位置、肿瘤大小、癌症是否已经扩散到淋巴结、癌症是否已经扩散到身体的一个或多个不同部位等。在一些实施方式中,例如,如本文所提出的,可以使用所谓的TNM系统对癌症进行分期,根据该系统,T是指主要肿瘤的大小和范围,通常称为原发肿瘤;N是指附近有癌症的淋巴结数量;M是指癌症是否已经转移。在一些实施方式中,例如,如本文所提出的,癌症可被称为0期(存在异常细胞但尚未扩散到附近组织,也称为原位癌或CIS;CIS不是癌症,但它可以变成癌症)、I-III期(存在癌症;数字越大,肿瘤越大,扩散到附近组织越多),或IV期(癌症已扩散到身体的远处部位)。在一些实施方式中,例如,如本文所提出的,癌症可被指定为选自由以下组成的组的阶段:原位(存在异常细胞但未扩散至附近组织);局部(癌症仅限于它开始的地方,没有扩散的迹象);区域性(癌症已经扩散到附近的淋巴结、组织或器官):远处(癌症已经扩散到身体的远处部位);和未知(没有足够的信息来鉴定癌症分期)。
对……易感:对疾病、病症或状况“易感”的个体有风险发展该疾病、病症或状况。在一些实施方式中,例如,如本文所提出的,对疾病、病症或状况易感的个体不表现出该疾病、病症或状况的任何症状。在一些实施方式中,例如,如本文所提出的,对疾病、病症或状况易感的个体尚未被诊断出患有该疾病、病症和/或状况。在一些实施方式中,例如,如本文所提出的,对疾病、病症或状况易感的个体是已经暴露于与疾病、病症或状况的发展相关的状况或呈现与疾病、病症或状况的发展相关的生物标志物状态(例如甲基化状态)的个体。在一些实施方式中,例如,如本文所提出的,发展疾病、病症和/或状况的风险是基于人群的风险(例如,患有疾病、病症或状况的个体的家庭成员)。
受试者:如本文所用,术语“受试者”是指生物体,通常是哺乳动物(例如,人)。在一些实施方式中,例如,如本文所提出的,受试者患有疾病、病症或状况。在一些实施方式中,例如,如本文所提出的,受试者对疾病、病症或状况易感。在一些实施方式中,例如,如本文所提出的,受试者表现出疾病、病症或状况的一个或多个症状或特征。在一些实施方式中,例如,如本文所提出的,受试者未患有疾病、病症或状况。在一些实施方式中,例如,如本文所提出的,受试者不表现出疾病、病症或状况的任何症状或特征。在一些实施方式中,例如,如本文所提出的,受试者是具有对疾病、病症或状况的易感性或风险为特征的一种或多种特性的人。在一些实施方式中,例如,如本文所提出的,受试者是患者。在一些实施方式中,例如,如本文所提出的,受试者是已对其进行诊断和/或已对其进行治疗的个体。在某些情况下,例如,如本文所提出的,人类受试者可以互换地称为“个体”。
治疗剂:如本文所用,术语“治疗剂”是指当施用于受试者时引起所需药理学作用的任何试剂。在一些实施方式中,例如,如本文所提出的,如果一种试剂在合适的人群中表现出统计学上显著的效果,则该试剂被认为是治疗剂。在一些实施方式中,例如,如本文所提出的,合适的群体可以是模型生物体群体或人类群体。在一些实施方式中,例如,如本文所提出的,合适的群体可以通过各种标准定义,例如特定年龄组、性别、遗传背景、预先存在的临床状况等。在一些实施方式中,例如,如本文所提出的,治疗剂是可用于治疗疾病、病症或状况的物质。在一些实施方式中,例如,如本文所提出的,治疗剂是在其可上市用于施用于人类之前已经或需要由政府机构批准的试剂。在一些实施方式中,例如,如本文所提出的,治疗剂是需要医学处方才能施用于人类的试剂。
治疗:如本文所用,术语“治疗”(也称为“治疗”或“治疗”)是指施用部分或完全减轻、改善、缓解、抑制、延迟特定疾病、病症或状况的发作、降低特定疾病、病症或状况的严重程度和/或降低特定疾病、病症或状况的一种或多种症状、特征和/或原因的发生率,或为实现任何此类结果的目的而施用。在一些实施方式中,例如,如本文所提出的,此类治疗可以针对不表现出相关疾病、病症或状况的迹象的受试者和/或仅表现出疾病、病症或状况的早期征兆的受试者。作为选择或另外,此类治疗可以针对表现出相关疾病、病症和/或状况的一种或多种确定迹象的受试者。在一些实施方式中,例如,如本文所提出的,治疗可以针对已被诊断患有相关疾病、病症和/或状况的受试者。在一些实施方式中,例如,如本文所提出的,治疗可以针对已知具有一种或多种易感因素的受试者,所述一种或多种易感因素与相关疾病、病症或状况的发展风险增加在统计学上相关。在各种实例中,治疗是针对癌症的。
上游:如本文所用,术语“上游”是指第一DNA区相对于第二DNA区更靠近包括第一DNA区和第二DNA区的核酸的N末端。
未甲基化:如本文所用,术语“未甲基化”和“非甲基化”可互换使用,是指鉴定的DNA区不包括甲基化核苷酸。
变体:如本文所用,术语“变体”是指与参考实体显示显著结构同一性但与参考实体相比在一个或多个化学部分的存在、不存在或水平上与参考实体在结构上不同的实体。在一些实施方式中,例如,如本文所提出的,变体在功能上也不同于其参考实体。一般而言,特定实体是否被适当地视为参考实体的“变体”取决于其与参考实体的结构同一性程度。变体可以是与参考相当但不完全相同的分子。例如,变体核酸可以在核苷酸序列的一个或多个差异处不同于参考核酸。在一些实施方式中,例如,如本文所提出的,变体核酸显示与参考核酸的总体序列同一性为至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%。在许多实施方式中,例如,如本文所提出的,如果感兴趣的核酸具有与参考的序列相同但在特定位置有少量序列改变的序列,则感兴趣的核酸被认为是参考核酸的“变体”。在一些实施方式中,例如,如本文所提出的,与参考相比,变体具有10、9、8、7、6、5、4、3、2或1个取代的残基。在一些实施方式中,例如,如本文所提出的,与参考相比,变体具有不超过5、4、3、2或1个残基添加、取代或缺失。在各种实施方式中,例如,如本文所提出的,添加、取代或缺失的数目少于约25、约20、约19、约18、约17、约16、约15、约14、约13、约10、约9、约8个、约7个、约6个,并且通常少于约5个、约4个、约3个或约2个残基。
附图说明
通过结合附图参考以下描述,本公开的前述和其他目的、方面、特征和优点将变得更加明显和更好理解,其中:
图1是显示示例MSRE-qPCR方法的示意图。
图2是显示用于训练用于开发生物标志物特征的计算模型的166个受试者的训练集的特征的表格。女性受试者的数量,男性受试者的数量,以及受试者的平均年龄和范围。受试者被诊断为患有结肠直肠癌(CRC)、健康对照受试者(对照;被诊断患有增生性息肉,被诊断为患有非进行性腺瘤(NAA)的患者,以及结肠镜检查未发现结果的患者)。图2基于结肠镜检查评估进一步区分患有CRC的患者的癌症位置为近端或远端。
图3是显示用于验证所选标志物的535名人类受试者的验证组的特征的表格。3提供了女性受试者的数量、男性受试者的数量以及受试者的平均年龄和范围。受试者被诊断为患有结肠直肠癌(CRC),健康对照受试者(对照组;被诊断患有增生性息肉,被诊断为患有非进行性腺瘤(NAA)的患者,以及结肠镜检查未发现结果的患者)和患有进行性腺瘤(AA)的患者。
图4显示了对受试者的验证集进行的初始主成分分析的图表。受试者被分为三组:患有进行性腺瘤的患者(AA)、对照患者(CNT)和患有结肠直肠癌的患者(CRC)。对照患者(CNT)被定义为结肠镜检查未发现结果的患者、具有增生性息肉的患者和非进行性腺瘤的患者(NAA)。围绕三个分组中的每一个都绘制了相关圆圈。
图5A是显示使用DMR的40个标志物组对535个受试者组进行结肠直肠癌筛查的图表。显示了验证组所有受试者的ROC和AUC。
图5B是显示准确度值的图表,从左到右包括进行性腺瘤筛查的总体灵敏度、结肠直肠癌筛查的总体灵敏度、局部结肠直肠癌的结直肠筛查灵敏度、晚期结肠直肠癌的结直肠筛查灵敏度,以及对照受试者(结肠镜检查无结果、有增生性息肉和/或诊断为非进行性腺瘤(NAA)的患者)的结肠直肠筛查的特异性。
图6显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_29_1的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图7显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_272.3_2的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图8显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_277.7_2的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图9显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_272.4的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图10显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_174.3的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图11显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_260.2_1的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图12显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_260.1的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图13显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_137.1的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图14显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_17_2的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图15显示对于来自患有结肠直肠癌(结肠直肠癌和进行性腺瘤)的验证组的受试者和对照受试者(健康受试者、具有增生性息肉的患者和具有非进行性腺瘤的受试者),表示来自鉴定为UDX_230的区域的MSRE-qPCR的Ct(循环阈值)值的图表。数据代表用于测试的第二受试者组(530个受试者)。出于显示目的,从45中减去Ct值(45–Ct)。较高的45–Ct值对应于较高的甲基化状态,表明结肠直肠癌受试者中存在超甲基化。
图16是显示正常细胞和癌细胞之间甲基化状态的示例甲基化变化的示意图,并进一步表明甲基化状态的变化如何能够影响正常细胞和癌细胞之间的基因表达差异。
图17是例如,如本文所述在某些实施方式中使用的示例性云计算环境的框图。
图18是例如,如本文所述在某些实施发生中使用的示例性计算设备和示例性移动计算设备的框图。
本发明的特征和优点将在下面结合附图的详细描述中变得更加明显。
具体实施方式
预期要求保护的本发明的系统、架构、设备、方法和过程包括使用来自这里描述的实施方式的信息开发的变化和适应。如本说明书所设想的,可以执行本文描述的系统、架构、设备、方法和过程的适应和/或修改。
在整个说明书中,在物品、设备、系统和架构描述为具有、包括或包含特定组件的情况下,或者在过程和方法被描述为具有、包括或包含特定步骤的情况下,预期另外还存在本发明的物品、设备、系统和架构,其基本上由所述组件组成或由所述组件组成,并且存在基本上由所述处理步骤组成或由所述处理步骤组成的根据本发明的过程和方法。
应当理解,只要本发明保持可操作,步骤的顺序或执行某些动作的顺序是无关紧要的。此外,可以同时进行两个以上步骤或动作。
在此提及任何出版物,例如在背景部分中提及,并不承认该出版物作为本文提出的任何权利要求的现有技术。背景部分是为了清楚起见而呈现的,并不意味着对任何权利要求的现有技术的描述。
如所指出的,文献通过引用并入本文。如果特定术语的含义存在任何差异,则以上定义部分中提供的含义是控制性的。
提供标题是为了方便读者——标题的存在和/或放置并不旨在限制本文所述主题的范围。
结肠直肠癌的筛查
需要改进的筛查结肠直肠癌和/或进行性腺瘤的方法,包括用于早期结肠直肠癌的筛查。尽管建议对个体(例如50岁以上)进行筛查,但结肠直肠癌筛查计划通常是无效的或不令人满意的。改进的结肠直肠癌和/或进行性腺瘤筛查可改善诊断并降低结肠直肠癌死亡率。
DNA甲基化(例如,超甲基化或低甲基化)可以激活或失活基因,包括影响癌症发展的基因(参见,例如,图16)。因此,例如,超甲基化可使一种或多种通常用于抑制癌症的基因失活,从而导致或促进样品或受试者中的癌症发展。
本公开包括下述发现,本文提供的一个或多个甲基化基因座的甲基化状态,和/或本文提供的一个或多个DMR的甲基化状态,和/或本文提供的一个或多个甲基化位点的甲基化状态的确定可以提供例如具有高度灵敏度和/或特异性的结肠直肠癌和/或进行性腺瘤筛查。本公开提供包括或涉及结肠直肠癌和/或进行性腺瘤的甲基化生物标志物的组合物和方法,其单独地或在包含两种以上生物标志物的各种组中,以高度特异性和/或灵敏度提供对结肠直肠癌的筛查。
在各种实施方式中,例如,如本文所提出的,本公开的结肠直肠癌和/或进行性腺瘤甲基化生物标志物选自甲基化基因座,该基因座是或包括如以下表1中鉴定的差异甲基化区域(DMR)的序列的一部分(例如,至少1个共同碱基对)。DMR由DMR所在的染色体编号(Chr.No.)、染色体上DMR的起始位置(起始碱基对)、染色体上DMR的结束位置、DMR的宽度,与DMR重叠或包含在DMR中的一个或多个基因的注释名称(如果可获得),以及DMR的序列ID号,序列ID号如说明书的“序列”部分和提供的序列表中所示。所鉴定的区域的染色体编号和开始(起始碱基对)和结束(结束碱基对)位置是参考鉴定为GRCh38的人类基因组构建。
表1.进行性腺瘤和结肠直肠癌筛查时的69个目的DMR的列表。
Figure BDA0003632046900000441
Figure BDA0003632046900000451
Figure BDA0003632046900000461
为避免任何疑问,本文提供的任何甲基化生物标志物尤其可以是或被包括在结肠直肠癌甲基化生物标志物和/或进行性腺瘤甲基化生物标志物中。
在一些实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物可以是或包括单个甲基化基因座。在一些实施方式中,例如,如本文所提出的,所述甲基化生物标志物可以是或包括两个以上甲基化基因座。在一些实施方式中,例如,如本文所提出的,所述甲基化生物标志物可以是或包括单个差异甲基化区域(DMR)。甲基化生物标志物可以是或包括单个甲基化位点。在其他实施方式中,例如,如本文所提出的,甲基化生物标志物可以是或包括两个以上甲基化位点。在一些实施方式中,例如,如本文所提出的,甲基化基因座可以包括两个以上DMR并且进一步包括与一个或多个所包括的DMR相邻的DNA区。
在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因,例如表1中提供的基因。在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的一部分,例如表1中提供的基因的一部分。在一些情况下,例如,如本文所提出的,甲基化基因座包括但不限于基因的经鉴定核酸边界。在一些情况下,例如,如本文所提出的,甲基化基因座位于先前注释的基因之外,例如表1中提供的基因序列的未注释区域。在一些情况下,例如,如本文所提出的,甲基化基因座是或包括多个基因的一部分,例如,如表1中提供的。
在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的编码区,例如表1中提供的基因的编码区。在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的编码区的一部分,例如,表1中提供的基因的编码区的一部分。在一些情况下,例如,如本文所提出的,甲基化基因座包括但不限于基因编码区的经鉴定的核酸边界。
在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的启动子和/或其他调控区,例如表1中提供的基因的启动子和/或其他调控区。在一些情况下,例如,如本文所提出的,甲基化基因座是或包括基因的启动子和/或调控区的一部分,例如表1中提供的基因的启动子和/或调控区的一部分。在一些情况下,例如,如本文所提出的,甲基化基因座包括但不限于基因的启动子和/或其他调控区的经鉴定核酸边界。在一些实施方式中,例如,如本文所提出的,甲基化基因座是或包括高CpG密度启动子,或其一部分。
在一些实施方式中,例如,如本文所提出的,甲基化基因座是或包括非编码序列。在一些实施方式中,例如,如本文所提出的,甲基化基因座是或包括一个或多个外显子和/或一个或多个内含子。
在一些实施方式中,例如,如本文所提出的,甲基化基因座包括在编码序列上游延伸预定数量的核苷酸的DNA区,和/或在编码序列下游延伸预定数量的核苷酸的DNA区。在各种情况下,例如,如本文所提出的,上游和/或下游的预定数量的核苷酸是或包括例如500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。本领域技术人员将理解,能够影响编码序列表达的甲基化生物标志物通常可以在编码序列上游和/或下游的任何这些距离内。
本领域技术人员将理解,鉴定为甲基化生物标志物的甲基化基因座不必在单个实验、反应或扩增子中进行测试。鉴定为结肠直肠癌和/或进行性腺瘤甲基化生物标志物的单个甲基化基因座可以例如以下述方法测试,所述方法包括单独扩增甲基化基因座内的一个或多个独立或重叠DNA区(或提供足以扩增甲基化基因座内的一个或多个不同或重叠DNA区的寡核苷酸引物和条件)。本领域技术人员将进一步理解,不需要分析被鉴定为甲基化生物标志物的甲基化基因座的每个核苷酸的甲基化状态,也不需要分析存在于甲基化基因座内的每个CpG。相反,可以例如通过分析甲基化基因座内的单个DNA区,例如通过分析甲基化基因座内的单个DMR,来分析作为甲基化生物标志物的甲基化基因座。
本公开的DMR可以是甲基化基因座或包括甲基化基因座的一部分。在一些情况下,例如,如本文所提出的,DMR是具有例如长度为1至5,000bp的甲基化基因座的DNA区。在各种实施方式中,例如,如本文所提出的,DMR是具有长度等于或小于5000bp、4,000bp、3,000bp、2,000bp、1,000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp的甲基化基因座的DNA区。在一些实施方式中,例如,如本文所提出的,DMR的长度为1、2、3、4、5、6、7、8或9bp。
甲基化生物标志物,包括但不限于本文提供的甲基化基因座、甲基化位点和DMR。
为清楚起见,本领域技术人员将理解术语甲基化生物标志物被广泛使用,使得甲基化基因座可以是包括一个或多个DMR的甲基化生物标志物,其中每个DMR本身也是甲基化生物标志物,并且每个所述DMR可以包括一个或多个甲基化位点,每个所述甲基化位点本身也是甲基化生物标志物。此外,甲基化生物标志物可以包括两个以上甲基化基因座。因此,作为甲基化生物标志物的状态不会开启生物标志物中包含的核酸的连续性,而是开启第一状态和第二状态之间(例如在结肠直肠癌和对照之间,和/或在进行性腺瘤和对照之间)所包含的DNA区的甲基化状态变化的存在。
如本文所提供的,甲基化基因座可以是一个或多个甲基化基因座中的任何一个,其中每个甲基化基因座是或包括如表1中鉴定的遗传区域(例如,DMR)。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括单个甲基化基因座,该基因座是或包括表1中鉴定的基因(全部或部分)。
在一些具体实施方式中,例如,如本文所述,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括两个以上甲基化基因座,每个甲基化基因座是或包括表1中鉴定的遗传区域。在一些实施方式中,例如,如所述在本文中,甲基化生物标志物包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69个甲基化基因座,其中每个包括表1中鉴定的遗传区域(全部或部分)。
表2-4中提供的DMR序列是由表1的DMR中一部分组成、与其重叠或包含其的选定区域。也就是说,表2-4中每个已鉴定的DNA区域涵盖了表1中鉴定的DMR的一部分直至包括表1中鉴定的所有DMR。为了清楚起见,表1的DMR与表2-4的DMR重叠的评估是基于序列开始和结束位置以及染色体数进行的。如果在同一染色体上发现两个DMR,并且两个DMR序列中的一个在起点和终点之间或在两个DMR序列的第二个的起点和终点之一处具有起点和/或终点,则它们被视为重叠。例如,表4的UDX_224.14(SEQ ID No.190)涵盖了21号染色体上111个连续碱基对的选择。所有111个连续碱基对均在表1的SEQ ID No.67中找到,该序列也发现于21号染色体。UDX_224.14的起点是26844767,终点在26844877,而SEQ ID No.67的起点是26843133,终点是26845357。由于发现UDX_224.14的起点和终点都在SEQ ID No.67的起点和终点之间,并且都在同一条染色体上,因此它们相互重叠,因此共享相同的重叠序列。
在另一个实例中,表4的UDX_244_2(SEQ ID No.213)与表1的SEQ ID No.2的一部分重叠(即,不包括全部)。UDX_244_2的长度为213个碱基对,并与长度为242个碱基对的SEQID No.2共享73个碱基对的连续序列。UDX_224_2在1号染色体上的起始位置为107140056,结束位置为107140173。SEQ ID No.2的起始位置为107140100,结束位置为107140341。因此,由于SEQ ID No.2的起始位置在UDX_224.2的起始和结束位置之间并且都都位于1号染色体上,这些序列也被称为彼此“重叠”。在一些特定实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括三个以上甲基化基因座,三个以上甲基化基因座中的每一个是或包括在表1至4中任一个中鉴定的遗传区域,包括但不限于三个以上甲基化基因座的组合,它们分别是或包括在表2至4之一中鉴定的遗传区域。
在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括三个甲基化基因座,所述三个甲基化基因座包括这样的甲基化基因座,其是或包括表2中鉴定的遗传区域。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌甲基化生物标志物包括10个甲基化基因座,所述10个甲基化基因座包括这样的甲基化基因座,其是或包括表3中鉴定的遗传区域。在一些特定实施方式中,例如,如本文所提出的,结肠直肠癌甲基化生物标志物包括40个甲基化基因座,所述40个甲基化基因座包括这样的甲基化基因座,其是或包括表4中鉴定的遗传区域。
表2. 3个甲基化位点的组合,按对结肠直肠癌和/或进行性腺瘤诊断的重要性的顺序排序。
Figure BDA0003632046900000501
表3. 10个甲基化位点的组合,按对结肠直肠癌和/或进行性腺瘤诊断的重要性的顺序排序
Figure BDA0003632046900000502
表4. 40个甲基化位点的组合,按对结肠直肠癌和/或进行性腺瘤诊断的重要性的顺序排序
Figure BDA0003632046900000503
Figure BDA0003632046900000511
如本文所提供的,DMR可以是一种或多种DMR中的任何一种,其中的每一个都存在于甲基化基因座中,所述甲基化基因座是或包括表1中鉴定的遗传区域的(全部或部分)。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物是或包括单个DMR,所述单个DMR包括表1中鉴定的遗传区域的全部或部分,或存在于其中。
在一些具体的实施方式中,例如,如本文所提出的,结肠直肠癌甲基化生物标志物包括三个以上DMR,其中的每一个是、包括表1中鉴定的遗传区域的全部或部分,或存在于表1中鉴定的遗传区域中。在一些实施方式中,例如,如本文所提出的,结肠直肠癌甲基化生物标志物包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69个DMR,其中每个都包括表1中鉴定的遗传区域的(全部或部分)。
在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括两个以上DMR,所述两个以上DMR中的每一个是、包括表1-4中的任何一个鉴定的基因的全部或部分,或者存在于表1-4中的任何一个鉴定的基因中。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括三个DMR,所述三个DMR包括这样的DMR,其是、包括表2中鉴定的基因区域的全部或部分,或者存在于表2中鉴定的基因区域中。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括10个DMR,所述10个DMR包括这样的DMR,其是、包括表3中鉴定的基因区域的全部或部分,或者存在于表3中鉴定的基因区域中。在一些具体实施方式中,例如,如本文所提出的,结肠直肠癌和/或进行性腺瘤甲基化生物标志物包括40个DMR,所述40个DMR包括这样的DMR,其是、包括表4中鉴定的基因区域的全部或部分,或者存在于表4中鉴定的基因区域中。
在各种实施方式中,例如,如本文所提出的,甲基化生物标志物可以是或包括存在于本文提供的一个或多个甲基化基因座(例如,一个或多个DMR)中的一个或多个个体核苷酸(例如,CpG情况中的单个个体半胱氨酸残基)或多个个体半胱氨酸残基(例如,多个CpG的多个单独的半胱氨酸残基)。因此,在某些实施方式中,甲基化生物标志物是或包括多个个体甲基化位点的甲基化状态。
在各种实施方式中,例如,如本文所提出的,甲基化生物标志物是或包括或特征在于甲基化状态的变化,所述变化是一个或多个甲基化基因座(例如,一个或多个DMR)内的一个或多个甲基化位点的甲基化的变化。在各种实施方式中,例如,如本文所提出的,甲基化生物标志物是或包括甲基化状态的变化,所述变化是一个或多个甲基化基因座(例如,一个或多个DMR)内甲基化位点数量的变化。在各种实施方式中,例如,如本文所提出的,甲基化生物标志物是或包括甲基化状态的变化,所述变化是一个或多个甲基化基因座(例如,一个或多个DMR)内甲基化位点频率的变化。在各种实施方式中,例如,如本文所提出的,甲基化生物标志物是或包括甲基化状态的变化,所述变化是一个或多个甲基化基因座(例如,一个或多个DMR)内甲基化位点模式的变化。
在各种实施方式中,例如,如本文所提出的,一个或多个甲基化基因座(例如,一个或多个DMR)的甲基化状态表示为被甲基化的样品中存在的一个或多个甲基化基因座(例如,一个或多个DMR)的分数或百分比,例如,作为在一个或多个特定甲基化基因座(例如,一个或多个特定DMR)处甲基化的样品中DNA的单个DNA链的数量的分数。本领域技术人员将理解,在一些情况下,例如,如本文所提出的,甲基化的分数或百分比可以从例如样品内的一个或多个分析的DMR的甲基化DMR与未甲基化DMR的比率计算。在一些实施方式中,例如,如本文所提出的,一个或多个甲基化基因座(例如,一个或多个DMR)的甲基化状态表示为被甲基化的CpG岛的一个或多个区域的分数或百分比。
在各种实施方式中,例如,如本文所提出的,将一个或多个甲基化基因座(例如,一个或多个DMR)的甲基化状态与参考甲基化状态值和/或与参考样品中的一个或多个甲基化基因座(例如,一个或多个DMR)的甲基化状态进行比较。在某些情况下,例如,如本文所提出的,参考是来自相同来源的非同期样品,例如来自相同来源的先前样品,例如来自相同受试者。在某些情况下,例如,如本文所提出的,一个或多个甲基化基因座(例如,一个或多个DMR)的甲基化状态的参考是已知代表特定状态(例如,癌症状态或非癌症状态)的样品(例如,来自受试者的样品)或多个样品中一个或多个甲基化基因座(例如,一个或多个DMR)的甲基化状态)。因此,参考可以是或包括一个或多个预定阈值,该预定阈值可以是定量的(例如甲基化值)或定性的。在某些情况下,例如,如本文所提出的,DMR甲基化状态的参考是在不包括DMR的核苷酸的同一样品中存在的一个核苷酸或多个核苷酸(例如,多个连续寡核苷酸)的甲基化状态。本领域技术人员将理解,参考测量通常通过使用与进行非参考测量的方法相同、相似或相当的方法进行测量来产生。
不希望受任何特定科学理论的束缚,图16提供了基因调控序列的超甲基化或低甲基化可以影响表达的一种可能机制的示意图。如图16所示,低甲基化可导致表达增加和/或超甲基化可导致表达抑制。在各种情况下,例如,如本文所提出的,与参考相比,表达调控区例如启动子区和增强子区的甲基化增加可以降低或沉默可操作地连接的基因的表达,例如通常起到抑制癌症作用的可操作地连接的基因的表达。在各种实施方式中,例如,如本文所提出的,与参考相比,表达调节区例如启动子区和增强子区的甲基化降低可以增加可操作地连接的基因的表达,例如具有有助于肿瘤发生的活性的可操作地连接的基因的表达。不希望受任何特定科学理论的束缚,DNA甲基化可以提供比RNA表达或蛋白质表达本身更具有化学和生物学稳定性的癌症状态指标。
甲基化通常被认为是高度组织特异性的,提供了DNA序列分析中不一定存在的信息维度。
实质上有助于肿瘤发生的甲基化事件可以发生在例如与癌症相关基因(例如通常起到抑制癌症作用的基因)可操作地连接的DNA的表达调控区(例如,在启动子区、增强子区、转录因子结合位点、CTCF结合位点、CpG岛或其他序列)。因此,通常用于抑制癌症的基因的失活导致或促成肿瘤发生。
癌症
本公开的方法和组合物可用于筛查癌症,特别是结肠直肠癌,和结肠直肠癌的前体肿瘤(例如进行性腺瘤)。结肠直肠癌包括但不限于结肠癌、直肠癌及其组合。结肠直肠癌包括转移性结肠直肠癌和非转移性结肠直肠癌。结肠直肠癌包括位于结肠癌近端的癌症和位于结肠远端的癌症。
结肠直肠癌包括本领域已知的各种可能分期中的任何一个的结肠直肠癌,包括例如I期、II期、III期和IV期结肠直肠癌(例如0、I、IIA、IIB、IIC、IIIA、IIIB、IIIC、IVA、IVB和IVC期)。结肠直肠癌包括肿瘤/淋巴结/转移(TNM)分期系统的所有阶段。对于结肠直肠癌,T可以指肿瘤是否生长到结肠壁还是直肠壁中,如果如此的话多少层;N可以指肿瘤是否已经扩散到淋巴结,如果如此,有多少个淋巴结以及它们位于哪里;并且M可以指癌症是否已经扩散到身体的其他部位,如果如此,已经扩散到哪些部位,扩散到什么程度。T、N和M的特定阶段是本领域已知的。T阶段可以包括TX、T0、Tis、T1、T2、T3、T4a和T4b;N阶段可以包括NX、N0、N1a、N1b、N1c、N2a和N2b;M阶段可以包括M0、M1a和M1b。此外,结肠直肠癌的等级可包括GX、G1、G2、G3和G4。癌症、尤其是结肠直肠癌分期的各种手段是本领域众所周知的,例如在万维网上的cancer.net/cancer-types/colorectal-cancer/stages上总结的。
在某些情况下,例如,如本文所提出的,本公开内容包括早期结肠直肠癌的筛查。早期结肠直肠癌可以包括例如位于受试者内的结肠直肠癌,例如,因为它们尚未扩散至受试者的淋巴结,例如癌附近的淋巴结(N0期),并且尚未扩散至远端位点(M0期)。早期癌症包括对应于例如0至II C期的结肠直肠癌。
因此,本公开的结肠直肠癌尤其包括恶性前结肠直肠癌(例如进行性腺瘤)和恶性结肠直肠癌。本公开的方法和组合物可用于筛查所有形式和阶段的结肠直肠癌,包括但不限于本文命名的或本领域已知的那些,以及其所有亚组。因此,本领域技术人员将理解,此处提供的对结肠直肠癌的所有参考包括但不限于其所有形式和阶段的结肠直肠癌,包括但不限于本文命名的或本领域已知的那些,以及所有其亚组。
受试者和样品
使用本文提供的方法和组合物分析的样品可以是任何生物样品和/或任何样品,包括核酸。在各种特定实施方式中,使用本文提供的方法和组合物分析的样品可以是来自哺乳动物的样品。在各种特定实施方式中,使用本文提供的方法和组合物分析的样品可以是来自人类受试者的样品。在各种特定实施方式中,使用本文提供的方法和组合物分析的样品可以是来自小鼠、大鼠、猪、马、鸡或牛的样品。
在各种情况下,例如,如本文所提出的,人类受试者是被诊断或寻求诊断为患有癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,被诊断为或寻求诊断为有风险患癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,和/或被诊断为或寻求诊断为有直接风险患癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者。在各种情况下,例如,如本文所提出的,人类受试者是被鉴定为需要结肠直肠癌和/或进行性腺瘤筛查的受试者。在某些情况下,例如,如本文所提出的,人类受试者是被鉴定为需要由执业医师进行结肠直肠癌和/或进行性腺瘤筛查的受试者。在各种情况下,例如,如本文所提出的,人类受试者被鉴定为由于年龄而需要筛查,例如由于年龄等于或大于50岁,例如年龄等于或大于50、55、60、65、70、75、80、85或90岁。在各种情况下,例如,如本文所提出的,人类受试者是未被诊断为患有癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,没有风险患癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,或没有直接风险患癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,未被诊断为患有癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,和/或没有尝试诊断癌症(例如结肠直肠癌)或癌前肿瘤(例如进行性腺瘤)的受试者,或其任何组合。
来自受试者例如人类或其他哺乳动物受试者的样品可以是例如血液、血液成分、cfDNA、ctDNA、粪便或结肠直肠组织的样品。在一些特定实施方式中,样品是受试者的排泄物或体液(例如受试者的唾液、粪便、血液、淋巴液或尿液)、结肠直肠癌组织样品或腺瘤或息肉组织样品。来自受试者的样品可以是细胞或组织样品,例如具有癌症或包括癌细胞(例如具有肿瘤或转移性组织)的细胞或组织样品。在各种实施方式中,例如,如本文所提出的,可以通过活组织检查(例如,细针抽吸或组织活组织检查)或手术获得来自受试者例如人或其他哺乳动物受试者的样品。
在各种实施方式中,例如,如本文所提出的,样品是无细胞DNA(cfDNA)样品。cfDNA通常以短的双链片段形式存在于人体生物体液(例如血浆、血清或尿液)中。cfDNA的浓度通常很低,但在特定条件下会显著增加,包括但不限于怀孕、自身免疫性疾病、心肌梗塞和癌症。循环肿瘤DNA(ctDNA)是特异性源自癌细胞的循环DNA的组成部分。ctDNA可以存在于与白细胞和红细胞结合或不与白细胞和红细胞结合的人类生物体液中。用于检测肿瘤来源的cfDNA的各种测试基于对癌症(例如相关癌症)或癌前肿瘤(例如进行性腺瘤)特征的遗传或表观遗传修饰的检测。癌症特征的遗传或表观遗传修饰可包括但不限于肿瘤抑制基因中的致癌突变或癌症相关突变、活化的致癌基因、超甲基化和/或染色体疾病。检测癌症特征的遗传或表观遗传修饰可以确认所检测的cfDNA是ctDNA。
cfDNA和ctDNA可提供源组织甲基化状态的实时或近乎实时的指标。cfDNA和ctDNA在血液中的半衰期约为2小时,因此在给定时间采集的样品可以相对及时地反映源组织的状态。
从样品中分离核酸(例如,从血液或血浆中分离cfDNA)的各种方法是本领域已知的。核酸可以通过例如但不限于标准DNA纯化技术,通过直接基因捕获(例如,通过澄清样品以去除测试抑制剂并用捕获剂从澄清样品中捕获靶核酸(如果存在的话),以产生捕获复合物,并分离捕获复合物以回收目标核酸)来分离。
测量甲基化状态的方法
甲基化状态可以通过本领域已知的多种方法和/或通过本文提供的方法测量。本领域技术人员将理解,用于测量甲基化状态的方法通常可应用于来自任何来源和任何种类的样品,并且将进一步理解可用于将样品修饰成适合通过以下方法进行测量的形式的处理步骤。测量甲基化状态的方法包括但不限于,包括甲基化状态特异性聚合酶链式反应(PCR)的方法、包括核酸测序的方法、包括质谱的方法、包括甲基化特异性核酸酶的方法、包括基于质量的分离的方法、包括目标特异性捕获的方法,包括甲基化特异性寡核苷酸引物在内的方法,包括杂交捕获靶向下一代测序在内的方法,包括基于扩增子的靶向下一代测序在内的方法,以及包括全基因组亚硫酸氢盐测序在内的方法。甲基化的某些特定的测试使用亚硫酸氢盐试剂(例如,亚硫酸氢根离子)。
亚硫酸氢盐试剂尤其可包括亚硫酸氢盐(bisulfite)、焦亚硫酸氢盐(disulfite)、氢化亚硫酸盐(hydrogen sulfite)或它们的组合等,这些试剂可用于区分甲基化和未甲基化的核酸。亚硫酸氢盐与胞嘧啶和5-甲基胞嘧啶的相互作用不同。在典型的基于亚硫酸氢盐的方法中,DNA与亚硫酸氢盐接触会使未甲基化的胞嘧啶脱氨基为尿嘧啶,而甲基化的胞嘧啶不受影响;选择性保留甲基化胞嘧啶,而不是未甲基化胞嘧啶。因此,在经亚硫酸氢盐处理的样品中,尿嘧啶残基代替未甲基化的胞嘧啶残基,并因此提供未甲基化胞嘧啶残基的识别信号,而残留的(甲基化)胞嘧啶残基因此提供甲基化胞嘧啶残基的识别信号。可以例如,通过PCR或通过全基因组亚硫酸氢盐测序来分析经亚硫酸氢盐处理的样品。
各种甲基化测试程序可与亚硫酸氢盐处理结合使用,以确定靶序列如DMR的甲基化状态。此类测试可尤其包括甲基化特异性限制酶qPCR、甲基化敏感性限制酶qPCR、经亚硫酸氢盐处理的核酸的测序、PCR(例如,使用序列特异性扩增)、甲基化特异性核酸酶辅助的小等位基因富集PCR、甲基化敏感性高分辨率溶解、杂交捕获靶向下一代测序和基于扩增子的靶向下一代测序。在一些实施方式中,从经亚硫酸氢盐处理的DNA样品中扩增DMR,并根据例如Illumina方案或基于转座的Nextera XT方案制备DNA测序文库以用于测序。在某些实施方式中,高通量和/或下一代测序技术用于实现DNA序列的碱基对水平解析,允许分析甲基化状态。当与亚硫酸氢盐处理相结合并覆盖人类基因组的很大一部分(例如,>50%)时,这些全基因组测序技术可统称为全基因组亚硫酸氢盐测序(WGBS)。
在各种实施方式中,例如,如本文所提出的,甲基化状态通过包括使用甲基化特异性寡核苷酸引物的PCR扩增的方法(MSP方法)检测,例如应用于经亚硫酸氢盐处理的样品(参见例如Herman 1992 Proc.Natl.Acad.Sci.USA 93:9821-9826,其关于确定甲基化状态的方法通过引用并入本文)。使用甲基化状态特异性寡核苷酸引物来扩增经亚硫酸氢盐处理的DNA可以区分甲基化和非甲基化核酸。用于MSP方法的寡核苷酸引物对包括至少一种寡核苷酸引物,其能够与包括甲基化位点(例如CpG)的序列杂交。在与胞嘧啶残基互补的位置包含T残基的寡核苷酸引物将选择性地与其中胞嘧啶在亚硫酸氢盐处理之前未甲基化的模板杂交,而在与胞嘧啶残基互补的位置包含G残基的寡核苷酸引物将在亚硫酸氢盐处理之前,与其中胞嘧啶是甲基化胞嘧啶的模板选择性杂交。MSP结果可以在使用或不使用测序扩增子的情况下获得,例如使用凝胶电泳。MSP(甲基化特异性PCR)允许使用亚硫酸氢盐转化的DNA的PCR扩增对位点特异性DNA甲基化进行高灵敏度检测(检测水平为0.1%的等位基因,具有完全特异性)。
可用于确定样品在亚硫酸氢盐处理后的甲基化状态的另一种方法是甲基化敏感高分辨率溶解(MS-HRM)PCR(参见,例如Hussmann 2018 Methods Mol Biol.1708:551-571,其关于确定甲基化状态的方法通过引用并入本文)。MS-HRM是一种基于PCR的管内方法,其可基于杂交熔解检测感兴趣的特定基因座的甲基化水平。在执行MS-HRM之前对DNA进行亚硫酸氢盐处理可确保甲基化和未甲基化DNA之间的不同碱基组成,其用于通过高分辨率熔解分离所得扩增子。独特的引物设计促进了测试的高灵敏度,能够在未甲基化背景中检测低至0.1-1%的甲基化等位基因。用于MS-HRM测试的寡核苷酸引物设计为与甲基化等位基因互补,特定的退火温度使这些引物能够与甲基化和未甲基化等位基因退火,从而提高测试的灵敏度。
另一种可用于在亚硫酸氢盐处理样品后确定甲基化状态的方法是定量多重甲基化特异性PCR(QM-MSP)。QM-MSP使用甲基化特异性引物对DNA甲基化进行灵敏定量(参见,例如Fackler 2018 Methods Mol Biol.1708:473-496,其关于确定甲基化状态的方法通过引用并入本文)。QM-MSP是一种两步PCR方法,在第一步中,一对基因特异性引物(正向和反向)在一个PCR反应中同时和多重扩增同一基因的甲基化和未甲基化拷贝。在36个PCR循环后,该甲基化独立扩增步骤可产生每μL高达109个拷贝的扩增子。在第二步中,使用实时PCR和两个独立的荧光团检测同一孔中每个基因的甲基化/未甲基化DNA(例如6FAM和VIC),用标准曲线对第一次反应的扩增子进行量化。在100,000个参考基因拷贝中可检测到一个甲基化拷贝。
另一种可用于确定在亚硫酸氢盐处理样品后甲基化状态的方法是甲基化特异性核酸酶辅助小等位基因富集(MS-Name)(参见,例如,Liu 2017 Nucleic Acids Res.45(6):e39,其关于确定甲基化状态的方法通过引用并入本文)。Ms-NaME基于对在双链(ds)DNA(DSN)具有特异性的DNA核酸酶的存在下探针与靶序列的选择性杂交,从而杂交产生随后被DSN消化的双链DNA的区域。因此,靶向未甲基化序列的寡核苷酸探针产生局部双链区域,导致未甲基化靶标的消化;能够与甲基化序列杂交的寡核苷酸探针会产生局部双链区,其导致甲基化靶标的消化,使甲基化靶标保持完整。此外,寡核苷酸探针可以同时将DSN活性导向经亚硫酸氢盐处理的DNA中的多个靶标。随后的扩增可以富集未消化的序列。Ms-NaME可以单独使用或与本文提供的其他技术组合使用。
另一种可用于确定在亚硫酸氢盐处理样品后甲基化状态的方法是甲基化灵敏度单核苷酸引物延伸(Ms-SNuPETM)(参见例如Gonzalgo 2007 Nat Protoc.2(8):1931-6,其关于确定甲基化状态的方法通过引用并入本文)。在Ms-SNuPE中,执行链特异性PCR以生成DNA模板,以用于使用Ms-SNuPE进行定量甲基化分析。然后用寡核苷酸进行SNuPE,该寡核苷酸设计用于在被询问的CpG位点的紧接上游进行杂交。反应产物可以在聚丙烯酰胺凝胶上电泳,以用于通过磷光体图像分析进行可视化和定量。扩增子还可以携带直接或间接可检测的标记,例如荧光标记、放射性同位素或可脱离的分子片段或具有可通过质谱法区分的质量的其他实体。检测可以通过例如基质辅助激光解吸/电离质谱(MALDI)或使用电子喷雾质谱(ESI)来进行和/或可视化。
可用于在亚硫酸氢盐处理样品后确定甲基化状态的某些方法在基于扩增的方法中利用第一寡核苷酸引物、第二寡核苷酸引物和寡核苷酸探针。例如,寡核苷酸引物和探针可用于实时聚合酶链式反应(PCR)或液滴数字PCR(ddPCR)的方法中。在各种情况下,例如,如本文所提出的,第一寡核苷酸引物、第二寡核苷酸引物和/或寡核苷酸探针选择性杂交甲基化DNA和/或未甲基化DNA,使得扩增或探针信号指示样品的甲基化状态。
用于检测甲基化状态(例如,5-甲基胞嘧啶水平的存在)的其他基于亚硫酸氢盐的方法公开于例如Frommer(1992 Proc Natl Acad Sci U S A.1;89(5):1827-31,其通过引用并入本文)。
用于检测甲基化状态的基于亚硫酸氢盐的方法可以包括基于扩增子的靶向下一代测序,例如,参见Masser(2015 J Vis Exp,(96):52488,doi:10.3791/52488,其通过引用并入本文)。通常,基于扩增子的靶向下一代测序利用亚硫酸氢盐转化和区域特异性PCR扩增结合下一代文库构建,从而以高通量方式检查目标靶向区域的甲基化状态。
用于检测甲基化状态的另一种基于亚硫酸氢盐的方法可以包括基于杂交捕获的靶向下一代测序,例如参见Ivanov(2013,Nucleic Acids Res,doi:10.1093/nar.gks1467,其通过引用并入本文)。通常,该方法包括用亚硫酸氢盐处理基因组DNA。然后,靶区域与溶液中的DNA或RNA探针杂交或与固体支持物结合。然后根据已知方案对结合的靶区域进行富集和测序,参见Gasc(2016,Front.Microbiol.,doi:10.1093/nar/gkw309,其通过引用并入本文)。
可用于确定甲基化状态的某些方法不包括样品的亚硫酸氢盐处理。例如,可以通过基于PCR的方法检测甲基化状态的变化,所述方法中在PCR扩增(例如,通过MSRE-qPCR)之前用一种或多种甲基化敏感限制酶(MSRE)消化DNA。通常,MSRE具有包含至少一个CpG基序的识别位点,因此如果该位点包含5-甲基胞嘧啶,则MSRE的活性被阻止切割可能的识别位点。(参见,例如,Beikircher 2018 Methods Mol Biol.1708:407-424,其通过引用并入本文)。因此,MSRE根据MSRE识别位点的甲基化状态选择性消化核酸;它们可以在未甲基化的MSRE识别位点消化DNA,但不能在甲基化的MSRE识别位点消化DNA。在某些实施方式中,样品的等分试样可以用MSRE消化,产生其中未甲基化的DNA已被MSRE切割的加工样品,使得在MSRE位点识别内具有至少一个甲基化位点的未切割的和/或可扩增的DNA(例如,DNA分子的每个MSRE识别位点内的至少一个甲基化位点)相对于在MSRE识别位点内不包括至少一个甲基化位点(例如,在DNA分子的每个MSRE识别位点内不包括至少有一个甲基化位点)的未切割的和/或可扩增的DNA的比例增加。然后可以将限制性酶消化样品的未切割序列进行预扩增(例如以PCR),并定量,例如通过qPCR、实时PCR或数字PCR定量。用于MSRE-qPCR的寡核苷酸引物扩增包括一个或多个MSRE切割位点和/或多个MSRE切割位点的区域。包含多个MSRE切割位点的扩增子通常更有可能产生可靠的结果。DMR扩增子内切割位点的数量,以及在某些情况下(例如,如本文所提出的)所产生的DMR甲基化状态确定的鲁棒性,可以通过设计在DMR扩增子中包含多个MSRE识别位点(而不是单个识别位点)的DMR来增加。在各种情况下,例如,如本文所提出的,多个MSRE可以应用于同一样品,包括例如AciI、Hin6I、HpyCH4IV和HpaII中的两个以上(例如,包括AciI、Hin6I和HpyCH4IV)。多个MSRE(例如,AciI、Hin6I、HpyCH4IV和HpaII的组合,或AciI、Hin6I和HpyCH4IV的组合)可以在DMR扩增子内提供改善的MSRE识别位点频率。
鉴于血液中cfDNA的患病率较低,MSRE-qPCR还可以包括在通过MSRE消化样品之后但在qPCR之前进行预扩增步骤,以提高可用样品的数量。
在某些MSRE-qPCR实施方式中,例如,如本文所提出的,使用例如实时PCR或数字PCR在天然(例如未消化)形式的样品的等分试样中测量总DNA的量。
各种扩增技术可单独使用或与本文所述的其他技术结合使用以检测甲基化状态。本领域技术人员在阅读了本说明书后将理解如何将本领域已知的和/或本文描述的各种扩增技术与本领域已知的和/或本文提供的用于甲基化状态确定的各种其他技术结合起来。扩增技术包括但不限于PCR,例如定量PCR(qPCR)、实时PCR和/或数字PCR。本领域技术人员将理解聚合酶扩增可以在单个反应中多重扩增多个靶标。PCR扩增子的长度通常为100至2000个碱基对。在各种情况下,例如,如本文所提出的,扩增技术足以确定甲基化状态。
基于数字PCR(dPCR)的方法涉及将样品分配和分布在具有96孔、384孔或更多孔的板的孔中,或分配和分布在单个乳液液滴(ddPCR)中,例如,使用微流体装置,使得一些孔包括一个或多个模板拷贝,其他不包含模板拷贝。因此,扩增前每孔的平均模板分子数小于1。发生模板扩增的孔的数量提供了模板浓度的量度。如果样品已与MSRE接触,发生模板扩增的孔的数量提供了甲基化模板浓度的量度。
在各种实施方式中,例如,如本文所提出的,基于荧光的实时PCR测试,例如MethyLightTM,可用于测量甲基化状态(参见,例如Campan 2018 Methods Mol Biol.1708:497-513,其通过引用并入本文)。MethyLight是一种基于荧光的定量实时PCR方法,其可灵敏地检测和量化基因组候选区的DNA甲基化。MethyLight特别适合在未甲基化DNA的高背景下检测低频甲基化DNA区,因为它结合了甲基化特异性引发和甲基化特异性荧光探测。此外,MethyLight可与数字PCR结合使用,用于高度灵敏地检测个体甲基化分子,用于疾病检测和筛查。
用于确定甲基化状态的基于实时PCR的方法通常包括基于外部标准的分析生成未甲基化DNA的标准曲线的步骤。标准曲线可以由至少两个点构建,并且可以将消化的DNA的实时Ct值和/或未消化的DNA的实时Ct值与已知的定量标准进行比较。在特定情况下,例如,如本文所提出的,可以确定MSRE消化和/或未消化样品或样品等分试样的样品Ct值,并且可以从标准曲线计算DNA的基因组当量。可以评估MSRE消化和未消化DNA的Ct值,以鉴定消化的扩增子(例如,有效消化;例如,产生45的Ct值)。也可以鉴定在消化或未消化条件下未扩增的扩增子。然后可以跨条件直接比较感兴趣的扩增子的校正Ct值,以确定条件之间甲基化状态的相对差异。作为选择或另外,消化和未消化DNA的Ct值之间的delta差异可用于确定条件之间甲基化状态的相对差异。
测量甲基化状态的方法可以包括但不限于大规模平行测序(例如下一代测序)以确定甲基化状态,例如合成测序、实时(例如单分子)测序、珠乳液测序、纳米孔测序或本领域已知的其他测序技术。在一些实施方式中,例如,如本文所提出的,测量甲基化状态的方法可以包括全基因组测序,例如,具有碱基对分辨率。
在某些特定实施方式中,例如,如本文所提出的,MSRE-qPCR以及其他技术可用于确定是或包括单个甲基化基因座的结肠直肠癌甲基化生物标志物的甲基化状态。在某些特定实施方式中,例如,如本文所提出的,MSRE-qPCR以及其他技术可用于确定是或包括两个以上甲基化基因座的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在某些特定的实施方式中,例如,如本文所提出的,MSRE-qPCR以及其他技术可用于确定是或包括单个差异甲基化区域(DMR)的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在某些特定实施方式中,例如,如本文所提出的,MSRE-qPCR以及其他技术可用于确定是或包括两个以上DMR的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在某些特定实施方式中,例如,如本文所提出的,MSRE-qPCR以及其他技术可用于确定是或包括单个甲基化位点的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在某些特定实施方式中,例如,如本文所提出的,MSRE-qPCR以及其他技术可用于确定是或包括两个以上甲基化位点的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的甲基化状态。在各种实施方式中,例如,如本文所提出的,结肠直肠癌甲基化和/或进行性腺瘤生物标志物可以是本文提供的任何结肠直肠癌和/或进行性腺瘤甲基化生物标志物。本公开尤其包括用于扩增DMR,例如用于扩增表5中鉴定的DMR的寡核苷酸引物对。
在某些特定实施方式中,例如,如本文所提出的,cfDNA样品源自受试者血浆并与MSRE(甲基化敏感性限制酶)接触,MSRE是或包括AciI、Hin6I、HpyCH4IV和HpaII中的一个或多个(例如,AciI、Hin6I和HpyCH4IV)。经消化的样品可以用一个或多个DMR的寡核苷酸引物对进行扩增,例如用以下表5中提供的一个或多个寡核苷酸引物对。表5标识了染色体编号(Chr.No.)、唯一ID(UID)、染色体上遗传区域的起始位置(起始位置)、染色体上遗传区域的结束位置(结束位置)、区域宽度(序列宽度)、MSRE-qPCR中使用的正向引物(Fp)和反向引物(Rp)的序列ID编号(SEQ ID NO.)和由正向引物和反向引物扩增的DNA区域的SEQ ID NO.。经消化的DNA,例如,预扩增的经消化的DNA,可以用qPCR用一个或多个DMR的寡核苷酸引物对进行定量,例如,使用以下表5中提供的一个或多个寡核苷酸引物对。然后可以确定qPCRct值并用于确定每个DMR扩增子的甲基化状态。较低的Ct值(因此较高的45–Ct值)对应于较高的甲基化状态,证明具有结肠直肠癌和/或进行性腺瘤的受试者中的超甲基化。
表5.用相应引物对鉴定的40个高等级DMR。
Figure BDA0003632046900000631
Figure BDA0003632046900000641
本领域技术人员将理解,表5中提供的寡核苷酸引物对可根据本文鉴定的结肠直肠癌和/或进行性腺瘤甲基化生物标志物的任何组合使用。技术人员将意识到表5的寡核苷酸引物对可以单独包括或不包括在给定的分析中以分析特别期望的DRM组合。
本领域技术人员将进一步理解,虽然可以使用其他寡核苷酸引物对,但是选择和配对寡核苷酸引物以产生有用的DMR扩增子是重要的并且代表了实质性的贡献。
本领域技术人员将进一步理解,qPCR的方法、试剂和方案是本领域公知的。与传统PCR不同,qPCR能够检测扩增过程中(例如,在每个扩增循环结束时)随时间推移产生的扩增子,通常通过使用扩增响应荧光系统,例如,结合具有荧光检测能力的热循环仪。qPCR中使用的荧光报告基因的两种常见类型包括(i)双链DNA结合染料,其在结合时比未结合时发出的荧光更亮;(ii)标记的寡核苷酸(例如标记的寡核苷酸引物或标记的寡核苷酸探针)。
本领域技术人员将理解,以本文提供的结肠直肠癌筛查方法分析多个甲基化基因座(例如,多个DMR)的甲基化状态的实施方式中,每个甲基化基因座的甲基化状态可以是以多种形式中的任一种测量或表示,并且多个甲基化基因座的甲基化状态(优选地每个以相同、相似或可比较的方式测量和/或表示)一起或累积地以各种形式的任一种分析或表示。在各种实施方式中,例如,如本文所提出的,每个甲基化基因座的甲基化状态可以测量为Ct值。在各种实施方式中,例如,如本文所提出的,每个甲基化基因座的甲基化状态可以表示为测量样品和参考之间的Ct值差异。在各种实施方式中,例如,如本文所提出的,每个甲基化基因座的甲基化状态可以表示为与参考的定性比较,例如通过将每个甲基化基因座鉴定为超甲基化或未超甲基化。
在其中分析单个甲基化基因座的一些实施方式中,例如,如本文所提出的,单个甲基化基因座的超甲基化构成受试者患有或可能患有结肠直肠癌和/或进行性腺瘤的诊断,而不存在单甲基化基因座的超甲基化构成受试者可能不患有结肠直肠癌和/或进行性腺瘤的诊断。在一些实施方式中,例如,如本文所提出的,多个分析的甲基化基因座的单甲基化基因座(例如单个DMR)的超甲基化构成受试者患有或可能患有结肠直肠癌和/或进行性腺瘤的诊断,而在多个分析的甲基化基因座的任何甲基化基因座不存在超甲基化构成受试者可能不患有任一疾病的诊断。在一些实施方式中,例如,如本文所提出的,多个所分析的甲基化基因座中确定百分比(例如,预定百分比)(例如,至少10%(例如,至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%))的甲基化基因座超甲基化构成受试者患有或可能患有结肠直肠癌的诊断,而多个所分析的甲基化基因座中不存在确定百分比(例如,预定百分比)(例如,至少10%(例如,至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%))的甲基化基因座超甲基化构成受试者不可能患有结肠直肠癌或进行性腺瘤的诊断。在一些实施方式中,例如,如本文所提出的,多个经分析的甲基化基因座(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个甲基化基因座DMR)中确定数量(例如,预定数量)的甲基化基因座(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个DMR)的超甲基化构成受试者患有或可能患有结肠直肠癌和/或进行性腺瘤的诊断,而多个经分析的甲基化基因座(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个DMR)中不存在确定数量(例如,预定数量)的甲基化基因座(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个DMR)的超甲基化构成受试者不可能患有结肠直肠癌或进行性腺瘤的诊断。
在一些实施方式中,例如,如本文所提出的,定性或定量测量多个甲基化基因座(例如,多个DMR)的甲基化状态,并且组合多个甲基化基因座中的每一个的测量以提供诊断。在一些实施方式中,例如,如本文所提出的,多个甲基化基因座中的每一个的定量测量的甲基化状态的定性被单独加权,并且加权值被组合以提供可以与参考进行比较以提供诊断的单个值。为了仅提供这种方法的一个实例,支持向量机(SVM)算法可用于分析本公开的多个甲基化基因座的甲基化状态以产生诊断。支持向量机算法的至少一个目标是在N维空间(N—特征的数量)中鉴定一个超平面,该超平面对数据点进行明确分类,目标是找到一个具有最大边距的平面,即两类数据点之间的最大距离。如本实施例中所讨论的,SVM模型建立在源自训练样品集(例如,训练受试者组)的标记值(例如,Ct值)上,其在进行预测时被转化成支持向量值。在将SVM模型应用于验证样品集的新样品时,样品将被映射到模型的向量空间并分类为具有属于第一条件(例如对照组)、第二条件(例如,诊断有结肠直肠癌的组)或第三组(例如诊断有进行性腺瘤的组)的概率,例如,基于每个新样品相对于两个条件之间的间隙的位置。本领域技术人员将理解,一旦确定了相关组合物和方法,向量值可以与由R-package的predict()函数定义的SVM算法结合使用(参见超文本传输协议安全(HTTPS)://cran.r-project.org/web/packages/e1071/index.html,其SVM在此通过引用并入)以容易地生成对新样品的预测。因此,利用本文公开的用于结肠直肠癌诊断和/或进行性腺瘤的组合物和方法(并且仅在那时),利用算法输入信息组合来预测R包的predict()函数(参见超文本传输协议安全(HTTPS)://cran.r-project.org/web/packages/e1071/index.html,其SVM在此通过引用并入)的预测模型的生成以提供结肠直肠癌和/或进行性腺瘤诊断将是直截了当的。本领域技术人员将理解,使用在手头的本公开中,SVM向量的生成可以根据本文提供的方法以及本领域已知的其他方法来完成。
应用
本公开的方法和组合物可用于多种应用中的任何一种。例如,本公开的方法和组合物可用于筛查或帮助筛查结肠直肠癌或进行性腺瘤。在各种情况下,例如,如本文所提出的,使用本公开内容的方法和组合物进行筛查可以检测任何阶段的结肠直肠癌,包括但不限于早期结肠直肠癌,并且可以检测进行性腺瘤。在一些实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌和进行性腺瘤筛查适用于50岁以上,例如50、55、60、65、70、75、80、85或90岁以上的个体。在一些实施方式中,例如,如本文所提出的,使用本公开的方法和组合物进行的结肠直肠癌筛查适用于20岁以上,例如20、25、30、35、40、45、50、55、60、65、70、75、80、85或90岁以上的个体。在一些实施方式中,例如,如本文所提出的,使用本公开的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查适用于20至50岁,例如20至30岁、20至40岁、20至50岁、30岁至40岁、30至50岁或40至50岁的个体。在各种实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查适用于经历腹痛或不适的个体,例如,经历未诊断或不完全诊断的腹痛或不适的个体。在各种实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查适用于没有可能与结肠直肠癌相关的症状的个体。因此,在某些实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌筛查是完全或部分预防性或防止性的,至少对于晚期或非早期的结肠直肠癌而言如此。
在各种实施方式中,例如,如本文所提出的,使用本公开内容的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查可应用于无症状的人类受试者。如本文所用,如果受试者通过非侵入性可观察标记(例如,没有一个、几个或所有基于装置的探测、组织样品分析、体液分析、手术或结肠直肠癌筛查)没有报告和/或证明结肠直肠癌和/或进行性腺瘤的充分特征以支持对受试者可能患有结肠直肠癌和/或进行性腺瘤的医学合理怀疑,则受试者可以称为是“无症状的”。早期结肠直肠癌或存在进行性腺瘤特别可能在根据本公开内容的方法和组合物筛查的无症状个体中检测到。
在各种实施方式中,例如,如本文所公开的,使用本公开内容的方法和组合物进行的结肠直肠癌和/或筛查可应用于有症状的人类受试者。如本文所用,如果受试者通过非侵入性可观察标记(例如,没有基于装置的探测、组织样品分析、身体体液分析、手术或结肠直肠癌筛查)报告和/或证明结肠直肠癌和/或进行性腺瘤的充分特征以支持医学上合理怀疑受试者可能患有结肠直肠癌、进行性腺瘤和/或癌症,则受试者可以称为是“有症状的”。结肠直肠癌和进行性腺瘤的症状可以包括但不限于持续(例如持续超过3天)的排便习惯改变(腹泻、便秘或大便变窄),需要排便的感觉(这种感觉是排便后未缓解)、直肠出血(例如,鲜红色的血液)、便血(可导致大便呈黑色)、腹部绞痛、腹痛、虚弱、疲劳、意外体重减轻、贫血及其组合。本领域技术人员将理解,不会单独表明或引起结肠直肠癌和/或进行性腺瘤怀疑的个体症状当以组合(例如为了提供但非限制性的实例,腹部绞痛和便血的组合)存在时,可能会表明或引起所述怀疑。
本领域技术人员将理解对结肠直肠癌的定期、预防性和/或防止性筛查改善了结肠直肠癌和进行性腺瘤的诊断,包括和/或特别是早期癌症。如上所述,根据至少一种癌症分期系统,早期癌症包括结肠直肠癌的0至IIC期。因此,本公开尤其提供了适用于早期结肠直肠癌的诊断和治疗的方法和组合物。通常,特别是在根据本公开每年进行结肠直肠癌筛查和/或其中受试者在筛查时无症状的实施方式(例如,如本文所提出的)中,本发明的方法和组合物特别有可能检测到早期阶段结肠直肠癌和/或进行性腺瘤。
在各种实施方式中,例如,如本文所提出的,根据本公开的结肠直肠癌或进行性腺瘤筛查对给定受试者进行一次或对给定受试者进行多次。在各种实施方式中,例如,如本文所提出的,根据本公开定期进行筛查,例如每六个月、每年、每两年、每三年、每四年、每五年或每十年。
在各种实施方式中,例如,如本文所提出的,使用本文公开的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查将提供结肠直肠癌的诊断。在其他情况下,例如,如本文所提出的,使用本文公开的方法和组合物进行的结肠直肠癌和/或进行性腺瘤筛查将指示结肠直肠癌的诊断(例如通过发现进行性腺瘤),但不能确定结肠直肠癌和/或进行性腺瘤的诊断。在使用本公开的方法和组合物筛查结肠直肠癌和/或进行性腺瘤的各种情况下,例如,如本文所提出的,使用本公开的方法和组合物进行筛查之后可以进行进一步的诊断确认测试,该进一步的诊断确认测试可以确认、支持、破坏、或拒绝由先前筛查(例如,根据本公开的筛查)产生的诊断。如本文所用,诊断确认测试可以是提供被执业医师确认为确定性的诊断的结肠直肠癌和/或进行性腺瘤测试,例如基于结肠镜检查的诊断,或显著增加或降低先前诊断的可能性的结肠直肠癌测试是正确的,例如,根据本公开的筛查产生的诊断。诊断确认测试可以包括现有的筛查技术,这些技术通常需要在灵敏度、特异性和非侵入性中的一个或多个方面进行改进,特别是在检测早期结肠直肠癌方面。
在一些情况下,例如,如本文所提出的,诊断确认测试是一种测试,它是或包括受试者组织的视觉或结构检查,例如通过结肠镜检查。在一些实施方式中,例如,如本文所提出的,结肠镜检查包括或之后是组织学分析。结肠直肠癌的视觉和/或结构测试可以包括检查结肠和/或直肠的结构是否有任何异常组织和/或结构。例如,可以通过直肠使用内窥镜或通过CT扫描进行视觉和/或结构检查。在一些情况下,例如,如本文所提出的,诊断确认测试是结肠镜检查,例如,包括或随后进行组织学分析。根据一些报告,结肠镜检查是目前主要的和/或最依赖于诊断确认测试。
另一种基于计算机断层扫描(CT)的视觉和/或结构诊断确认测试是CT结肠成像,有时也称为虚拟结肠镜检查。CT扫描利用结肠和/或直肠的大量X射线图像来生成结肠的尺寸表示。尽管可用作诊断确认测试,但一些报告表明CT结肠成像不足以替代结肠镜检查,至少部分是因为医生没有实际接触受试者的结肠来获取组织以进行组织学分析。
另一种诊断确认测试可以是乙状结肠镜检查。在乙状结肠镜检查中,乙状结肠镜用于通过直肠对结肠和/或直肠的部分进行成像。根据一些报道,乙状结肠镜检查并未得到广泛应用。
一种特别的筛查技术是基于粪便的筛查测试(
Figure BDA0003632046900000691
(Exact SciencesCorporation,Madison,WI,United States),其将FIT分析与DNA的异常修饰(例如突变和甲基化)分析相结合。
Figure BDA0003632046900000692
测试与单独的FIT检测相比,显示出改善的灵敏度,但由于依从率低,临床上可能不切实际或无效,所述低依从率至少部分是由于受试者不喜欢使用基于粪便的检测(参见,例如,doi:10.1056/NEJMc1405215(e.g.,2014 N Engl J Med.371(2):184-188))。
Figure BDA0003632046900000693
测试似乎将几乎一半的合格人群排除在筛查计划之外(参见,例如,van der Vlugt 2017 Br J Cancer.116(1):44-49)。如本文提供的筛查的使用(例如通过基于血液的分析),将增加选择筛查结肠直肠癌的个体数量(参见,例如Adler 2014BMC Gastroenterol.14:183;Liles 2017 Cancer Treatment and ResearchCommunications 10:27-31)。就目前所知,只有一种现有的结肠直肠癌筛查技术Epiprocolon获得FDA批准和CE-IVD准售,并且是基于血液的。Epiprocolon基于SEPT9基因的超甲基化。Epiprocolon测试的结肠直肠癌检测的准确度低,灵敏度为68%,进行性腺瘤灵敏度仅为22%(参见,例如,Potter 2014 Clin Chem.60(9):1183-91)。本领域尤其需要一种非侵入性结肠直肠癌和进行性腺瘤筛查,其可以实现高受试者依从性,并且具有高和/或改进的特异性和/或灵敏度。
在各种实施方式中,例如,如本文所提出的,根据本公开的方法和组合物的筛查降低了结肠直肠癌死亡率,例如通过早期结肠直肠癌诊断,例如通过检测进行性腺瘤。数据支持结肠直肠癌筛查降低结肠直肠癌死亡率(参见,例如,Shaukat 2013 N Engl J Med.369(12):1106-14)。此外,结肠直肠癌特别难以治疗,至少部分是因为没有及时筛查的结肠直肠癌可能直到癌症过了早期阶段才被检测到。至少出于这个原因,结肠直肠癌的治疗通常是不成功的。为了使结肠直肠癌结果的全人群改善最大化,根据本公开的筛查的利用可以与例如合格受试者的招募配对以确保广泛筛查。
在各种实施方式中,例如,如本文所提出的,包括一种或多种本文公开的方法和/或组合物的结肠直肠癌和/或进行性腺瘤筛查之后是结肠直肠癌的治疗,例如早期结肠直肠癌的治疗。在各种实施方式中,例如,如本文所提出的,结肠直肠癌例如早期结肠直肠癌的治疗包括施用治疗方案,所述治疗方案包括手术、放射疗法和化学疗法中的一种或多种。在各种实施方式中,例如,如本文所提出的,结肠直肠癌例如早期结肠直肠癌的治疗包括施用包括本文提供的一种或多种治疗的治疗方案,以用于治疗0期结肠直肠癌、I期结肠直肠癌和/或II期结肠直肠癌。
在各种实施方式中,例如,如本文所提出的,进行性腺瘤和/或结肠直肠癌筛查是基于粪便的测试。通常,当使用基于粪便的测试代替目视或结构检查时,建议以比使用目视或结构检查所需的频率更高的频率使用。在一些情况下,例如,如本文所提出的,筛查测试是基于guiac的粪便潜血试验或粪便免疫化学试验(gFOBTs/FITs)(参见,例如Navarro2017 World J Gastroenterol.23(20):3632-3642,其关于结肠直肠癌测试通过引用并入本文)。FOBTs和FITs有时用于诊断结肠直肠癌(参见,例如,Nakamura 2010 J DiabetesInvestig.Oct 19;1(5):208-11,其关于结肠直肠癌测试通过引用并入本文)。FIT是基于粪便中潜血的检测,潜血的存在通常预示着结肠直肠癌或进行性腺瘤,但通常量不足以通过肉眼进行鉴定。例如,在典型的FIT中,该测试利用血红蛋白特异性试剂来测试粪便样品中的潜血。在各种情况下,例如,如本文所提出的,FIT试剂盒适合个人在其自己家中使用。当在没有其他诊断确认测试的情况下使用时,建议每年使用一次FIT。通常不依赖FIT为结肠直肠癌或进行性腺瘤的结论性诊断提供足够的诊断信息。
在各种实施方式中,例如,如本文所提出的,进行性腺瘤和/或结肠直肠癌筛查还包括gFOBT,其经设计以通过化学反应检测粪便中的潜血。与FIT一样,可能建议每年使用一次gFOBT。通常不依赖gFOBT为结肠直肠癌或进行性腺瘤的结论性诊断提供足够的诊断信息。
在各种情况下,例如,如本文所提出的,筛查测试还可以包括粪便DNA检测。结肠直肠癌或进行性腺瘤的粪便DNA检测可经设计以鉴定粪便样品中结肠直肠癌和/或进行性腺瘤的DNA序列特征。当在没有其他诊断确认测试的情况下使用时,建议每三年使用一次粪便DNA检测。通常不依赖粪便DNA检测来为结肠直肠癌和/或进行性腺瘤的结论性诊断提供足够的诊断信息。
在各种实施方式中,例如,如本文所提出的,结肠直肠癌的治疗包括通过以下中的一种或多种来治疗早期结肠直肠癌,例如0期结肠直肠癌或I期结肠直肠癌:手术切除癌组织(例如通过局部切除(例如通过结肠镜)、部分结肠切除术或全结肠切除术)。
在各种实施方式中,例如,如本文所提出的,结肠直肠癌的治疗包括通过以下中的一种或多种来治疗早期结肠直肠癌,例如II期结肠直肠癌:手术切除癌组织(例如,通过局部切除(例如,通过结肠镜)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌组织附近的淋巴结,以及化学疗法(例如,施用5-FU和亚叶酸、奥沙利铂或卡培他滨。
在各种实施方式中,例如,如本文所提出的,结肠直肠癌的治疗包括通过以下中的一种或多种来治疗III期结肠直肠癌:手术切除癌组织(例如,通过局部切除(例如,通过基于结肠镜检查的切除)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌组织附近的淋巴结,以及化学疗法(例如,施用5-FU和亚叶酸、奥沙利铂或卡培他滨中的一种或多种,例如以下述组合:(i)5-FU和亚叶酸,(ii)5-FU、亚叶酸和奥沙利铂(例如,FOLFOX),或(iii)卡培他滨和奥沙利铂(例如,CAPEOX))和放射疗法。
在各种实施方式中,例如,如本文所提出的,结肠直肠癌的治疗包括通过以下中的一种或多种来治疗IV期结肠直肠癌:手术切除癌组织(例如,通过局部切除(例如,通过基于结肠镜检查的切除)、部分结肠切除术或全结肠切除术)、手术切除已识别的结肠直肠癌组织附近的淋巴结,手术切除转移灶、化学疗法(例如,施用5-FU、亚叶酸、奥沙利铂、卡培他滨、伊立替康、VEGF靶向治疗剂(例如,贝伐单抗、阿柏西普、或雷莫芦单抗)、EGFR靶向治疗剂(例如,西妥昔单抗或帕尼单抗)、瑞戈非尼、三氟尿苷和替吡嘧啶中的一种或多种,例如以下述组合:(i)5-FU和亚叶酸,(ii)5-FU、亚叶酸和奥沙利铂(例如,FOLFOX),(iii)卡培他滨和奥沙利铂(例如,CAPEOX)、以及(v)氟尿嘧啶和替吡嘧啶(Lonsurf))、放射疗法、肝动脉输注(例如,如果癌已转移至肝脏)、肿瘤消融、肿瘤栓塞、结肠支架、结肠切除术、结肠造口术(例如,分流结肠造口术)和免疫疗法(例如,派姆单抗)。
本领域技术人员本文提供的结肠直肠癌的治疗可以例如如由执业医师确定的那样,单独或以任何组合,以任何顺序、方案和/或治疗程序使用。本领域技术人员将进一步理解,高级治疗选择可能适用于先前患有癌症或结肠直肠癌的受试者中的早期癌症,例如,被诊断为患有复发性结肠直肠癌的受试者。
在一些实施方式中,例如,如本文所提出的,本文提供的用于结肠直肠癌和进行性腺瘤筛查的方法和组合物可以告知例如由个体,医疗保健机构、医疗保健从业者、医疗保险提供者、政府机构或对医疗保健费用感兴趣的其他各方做出的治疗和/或支付(例如,医疗保健的费用的报销或减少,例如筛查或治疗)决定和/或行动。
在一些实施方式中,例如,如本文所提出的,本文提供的用于结肠直肠癌和进行性腺瘤筛查的方法和组合物可以告知与健康保险提供者是否偿付医疗保健费用支付者或接受者(或不)有关的决策,例如,用于(1)筛查本身(例如,报销筛查,除非不可用,仅适用于定期/定期筛查,或仅适用于临时和/或偶然动机的筛查);和/或用于(2)治疗,包括例如,基于筛查结果启动、维持和/或改变治疗。例如,在一些实施方式中,例如,如本文所提出的,本文提供的用于结肠直肠癌筛查的方法和组合物用作基础、有助于或支持确定是否将向医疗保健费用支付者或接受者提供报销或成本降低。在一些情况下,例如,如本文所提出的,寻求报销或降低成本的一方可以提供根据本说明书进行的筛查的结果以及对医疗保健费用的这种报销或成本降低的请求。在某些情况下,例如,如本文所提出的,作出关于是否提供医疗费用的报销或费用降低的决定的一方将全部或部分基于接收和/或审查根据本说明书进行的筛选的结果来作出决定。
为避免任何疑问,本领域技术人员将从本公开中理解,本说明书的用于结肠直肠癌和/或进行性腺瘤诊断的方法和组合物至少用于体外使用。因此,本公开的所有方面和实施方式可以至少在体外进行和/或使用。
试剂盒
本公开内容尤其包括试剂盒,该试剂盒包括一种或多种如本文提供的用于结肠直肠癌和/或进行性腺瘤筛查的组合物,任选地与其在结肠直肠癌筛查中的使用说明书组合。在各种实施方式中,例如,如本文所提出的,用于结肠直肠癌和/或进行性腺瘤筛查的试剂盒可包括以下中的一种或多种:一种或多种寡核苷酸引物(例如,一个或多个寡核苷酸引物对,例如见表15)、一种或多种MSRE、一种或多种用于qPCR的试剂(例如,足以完成qPCR反应混合物的试剂,包括但不限于dNTP和聚合酶),以及用于结肠直肠癌筛查的试剂盒的一种或多种成分的使用说明书。在各种实施方式中,用于结肠直肠癌筛查的试剂盒可包括以下中的一种或多种:一种或多种寡核苷酸引物(例如,一个或多个寡核苷酸引物对,例如见表15)、一种或多种亚硫酸氢盐试剂、一种或多种用于qPCR的试剂(例如,足以完成qPCR反应混合物的试剂,包括但不限于dNTP和聚合酶),以及用于结肠直肠癌筛查的试剂盒的一种或多种成分的使用说明书。
在某些实施方式中,本公开的试剂盒包括用于扩增如本文公开的甲基化基因座和/或DMR的至少一个寡核苷酸引物对。
在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增本公开的一个或多个甲基化区域的一个或多个寡核苷酸引物对。在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增一个或多个甲基化区域的一个或多个寡核苷酸引物对,所述甲基化区域是或包括表1中提供的一个或多个遗传区域的全部或部分。在一些特定情况下,例如,如本文所提出的,本公开的试剂盒包括用于多个甲基化区域的寡核苷酸引物对,每个甲基化区域包括表1中鉴定的遗传区域的(全部或部分),所述多个甲基化区域包括表1至4中的任一个中提供的甲基化区域的(全部或部分),例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69个甲基化区域。
在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增本公开的一种或多种DMR的一个或多个寡核苷酸引物对。在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增一种或多种DMR的一个或多个寡核苷酸引物对,所述DMR包括表1中鉴定的基因的(全部或部分)。在一些具体实施方式中,本公开的试剂盒包括用于多个DMR的寡核苷酸引物对,其中每个DMR包括表1中鉴定的(全部或部分)遗传区域,例如,根据表1-4中鉴定的遗传区域,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68或69个DMR。
在一些情况下,例如,如本文所提出的,本公开的试剂盒包括用于扩增表5的一种或多种DMR的一个或多个寡核苷酸引物对。在一些特定情况下,例如,如本文所提出的,本公开的试剂盒包括用于表5的多个DMR的寡核苷酸引物对,多个DMR包括表1的(全部或部分)DMR,例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个DMR,例如,如表2至4中任一个所提供的。
在各种实施方式中,例如,如本文所提出的,本公开的试剂盒包括表5中提供的一个或多个寡核苷酸引物对。本领域技术人员将理解表5中提供的寡核苷酸引物对可以以一个或多个寡核苷酸引物对的任何组合提供,例如以表2-4中任一项提供的组合。
本公开的试剂盒还可包括单独或在单一溶液中的一种或多种MSRE。在各种实施方式中,一个或多个MSRE选自包括AciI、Hin6I、HpyCH4IV和HpaII的MSRE组(例如,使得该试剂盒包括AciI、Hin6I和HpyCH4IV,单独或在单一溶液中)。在某些实施方式中,本公开的试剂盒包括一种或多种用于qPCR的试剂(例如,足以完成qPCR反应混合物的试剂,包括但不限于dNTP和聚合酶)。
实施例
本文的实施例确认,本公开尤其提供了用于筛查和治疗结肠直肠癌和/或进行性腺瘤的方法和组合物。本实施例进一步证明本文提供的组合物和方法在结肠直肠癌和/或进行性腺瘤的筛查和/或治疗中提供了显著高度的灵敏度和特异性。还提供了比较来自诊断为患有结肠直肠癌的受试者的样品中的生物标志物的甲基化和来自对照受试者的样品中的生物标志物的甲基化的临床研究,进一步证明了包括本公开的方法和/或组合物的结肠直肠癌的筛查。本实施例的样品是人或人源的。
实施例1.与结肠直肠癌相关的甲基化生物标志物的鉴定
本实施例包括与健康组织相比,在结肠直肠癌和进行性腺瘤中鉴定DMR的CpG区的超甲基化。具体而言,本实施例的实验检查了来自总共150个受试者的结肠直肠组织样品。受试者分组如下:(i)52个先前被诊断患有结肠直肠癌的受试者,(ii)33个被诊断患有进行性腺瘤的受试者,以及(iii)从52个被诊断患有结肠直肠癌的受试者和33个被诊断患有进行性腺瘤的受试者获得的65个健康结肠组织样品。组织样品是新鲜冷冻组织。
使用来自Illumina的NovaSeqTM 6000测序系统通过全基因组亚硫酸氢盐测序分析样品的DNA。全基因组亚硫酸氢盐测序已在本文先前描述。一般而言,全基因组亚硫酸氢盐测序涉及在使用如前所述的多种下一代技术中的任何一种对基因组进行测序之前,用亚硫酸氢盐(例如亚硫酸氢钠)处理DNA样品。
样品的平均测序覆盖率为37.5x,这意味着已测序基因组的给定区域已被唯一测序约37-38次。平均覆盖率大于30x表明测序已以临床级(即高)可靠性进行。
然后处理从样品中获得的原始测序文件,以确定与对照组织样品相比的差异甲基化区域(DMR)。首先,将原始序列与GRCh38(基因组研究联盟人类构建体38,GenomeResearch Consortium human build 38)的参比基因组进行比对,并使用BismarkBisulfite Mapper进行重复数据删除。Bismark输出每个样品的甲基化调用文件。这些甲基化调用文件包含每个碱基输出的甲基化百分比分数。然后使用MethylKit进一步分析甲基化调用输出文件。MethylKit用于比较结肠直肠癌组织与对照组织的输出文件以及进行性腺瘤组织与对照组织的输出文件。这些比较导致了结肠直肠癌和进行性腺瘤样品的DMR的鉴定。从MethylKit输出的已鉴定DMR被认为是存在至少3个CpG且CpG之间的最大距离为200bp的区域。对照和病例之间的最小甲基化百分比差异设置为10%。
然后针对进行性腺瘤和结肠直肠癌样品中相对于对照样品的超甲基化区域来过滤DMR。再次过滤DMR以选择每个区域长度的更高数量的甲基化CpG。考虑到两个相邻甲基化CpG之间最少5个CpG,且最多200bp。此外,通过排除病症和对照的甲基化之间差异小于25%的区域,使用病症(例如,结肠直肠癌或进行性腺瘤)和对照之间的最高平均甲基化百分比差异。
处理产生了69个DMR的列表(即,如下表6所示),这些DMR被选择用于进一步的靶向测定开发。如下表6中可见,每个DMR通过对应于本文提供的其序列的其序列ID(SEQ IDNO)、DMR所在的染色体编号、DMR在染色体上的起始和结束碱基对、DMR区域的宽度(区域宽度)以及落入DMR区域的一个(或多个)基因的注释名称(如果有)来标识。DMR的开始和结束碱基对和染色体数目对应于GRCh38参比基因组上的位置。基因名称的注释根据Ensemble基因组浏览器98。
表6.为靶向测定开发确定的69个DMR。
Figure BDA0003632046900000761
Figure BDA0003632046900000771
Figure BDA0003632046900000781
实施例2:通过MSRE-qPCR开发用于甲基化生物标志物的无细胞DNA检测
本实施例开发了一种基于循环无细胞DNA(cfDNA)确定结肠直肠癌和进行性腺瘤甲基化生物标志物的甲基化状态的测试。cfDNA不完整和片段化,并且cfDNA从癌细胞传输到血液的机制(作为一部分称为循环肿瘤DNA)是未知的。至少因为实施例1的69个甲基化生物标志物是从组织样品中鉴定的,因此在本实施例的实验之前不知道是否可以从cfDNA充分分析鉴定的结肠直肠癌甲基化生物标志物以成功捕获ctDNA部分,所述ctDNA部分允许鉴定对应于结肠直肠癌和/或进行性腺瘤的诊断的受试者或受试者样品。
作为确定是否可以从cfDNA中充分分析实施例1中鉴定的结肠直肠癌甲基化生物标志物以成功捕获允许鉴定结肠直肠癌受试者或样品的ctDNA部分的关键步骤,开发了一种灵敏的测试法来筛查这些生物标志物。特别是,开发了甲基化灵敏度限制酶(MSRE)-qPCR方法。开发MSRE-qPCR方法是为了测量DMR的甲基化,所述DMR覆盖血液样品中已鉴定的CpG位点,特别是在血液中存在的肿瘤的无细胞DNA(cfDNA)中。
MSRE-qPCR方法的开发具有重要意义,至少部分是因为通过分析cfDNA来分析源自肿瘤组织的CpG甲基化生物标志物具有挑战性,这归因于与样品的非肿瘤DNA背景相比,血液中循环的肿瘤来源的DNA的浓度低(0.1-1%)。因此,虽然通常优选开发依赖于容易获得的样品(例如血液、尿液或粪便)的生物标志物分析,但使用血液来分析肿瘤衍生的甲基化生物标志物是具有挑战性的。因此,即使在组织中鉴定了具有结肠直肠癌和进行性腺瘤特征的甲基化生物标志物之后,如上所述,也无法预测ctDNA的碎片化和知之甚少的性质是否允许使用在组织中鉴定的甲基化生物标志物进行成功筛查。
MSRE-qPCR需要设计扩增DNA区域的寡核苷酸引物(MSRE-qPCR寡核苷酸引物对),每个所述DNA区域包括至少一个MSRE切割位点(即,覆盖至少一个甲基化生物标志物位点的MSRE切割位点,使得允许在核酸分子中切割MSRE切割位点,其中所有的所述至少一个甲基化生物标志位点都未甲基化,并且在其中至少一个甲基化生物标志位点被甲基化的核酸分子中被阻断)。MSRE-qPCR测试可以利用多种限制性内切酶来扩大可通过单个MSRE-qPCR反应测试的甲基化生物标志物位点的范围,因为单个MSRE不太可能切割包括所有感兴趣的甲基化生物标志物位点的位点。本实施例的MSRE-qPCR测试利用MSREs AciI、Hin6I和HpyCH4IV,发现它们一起提供了足够的覆盖率。
图1中提供了MSRE-qPCR的示例性工作流程示意图。如本实施例中所执行的,根据制造商方案(QIAamp MinElute ccfDNA Handbook 08/2018,Qiagene)通过QIAampMinElute ccfDNA试剂盒从受试者血液(通常为约10mL的血浆样品)中提取循环无细胞肿瘤DNA。如图1所示,分离的cfDNA被分成两份等分试样,其中一份等分试样用于qPCR品质控制分析,第二份等分试样用于MSRE-qPCR。
对于MSRE-qPCR,2/3体积的洗脱cfDNA被MSRE消化。由于非甲基化DNA被选择性切割,因此将cfDNA与MSRE接触可富集样品的甲基化衍生信号;甲基化的DNA保持完整且可量化。剩余的1/3体积的洗脱cfDNA用于使用MSRE-qPCR寡核苷酸引物进行qPCR,以确认从cfDNA中成功扩增了扩增子,该扩增确认模板存在,从而提供技术品质控制。
如本文所应用的,成功开发了用于将DMR扩增的MSRE-qPCR寡核苷酸引物对,因此从实施例1的DMR中鉴定的甲基化生物标志物区域产生88个不同的靶DMR。88种不同的靶DMR列于下表7中。与匹配的对照组织相比,鉴定的区域在结肠直肠癌和进行性腺瘤中具有显著更高的超甲基化。根据Ensembl基因组浏览器98为具有注释的基因添加了基因注释。由于一些DMR与不同的基因重叠,因此列出了区域中的所有重叠基因。下面的表7包含DMR的唯一标识符(UID)、发现DMR的染色体编号(Chr)、DMR的开始和结束位置、DMR的长度/碱基对的数量、在DMR内发现的带注释的基因(或多个基因)的名称,以及已鉴定DMR的SEQ ID NO。列出的基因组区域参数,包括染色体数量和DMR开始和结束位置,对应于GRCh38的参比基因组。
DMR通常包括1至15个MSRE切割位点,所述MSRE切割位点共同覆盖了88个甲基化生物标志物区域中的每一个。如本文所用,四种基因(JUB、H19、SNRPN、IRF4)的甲基化状态提供了甲基化对照,允许监测测定的鲁棒性和再现性。
表7.为MSRE-qPCR鉴定的88个候选DMR。
Figure BDA0003632046900000801
Figure BDA0003632046900000811
Figure BDA0003632046900000821
实施例3:cfDNA的MSRE-qPCR通过结肠直肠癌状态成功区分了受试者
为了探测已鉴定甲基化生物标志物的临床诊断和预后能力,在从人类受试者血浆中提取的cfDNA中测试了由覆盖88个甲基化生物标志物区域的MSRE-qPCR寡核苷酸引物对扩增的DMR,和适当的对照。特别是,cfDNA是从2017年至2018年间在西班牙、英国和美国的筛查中心和肿瘤诊所寻求或正在获得有关可能的结肠直肠癌诊断的个体的样品。第一受试者组(“训练集”)包括166个这样的个体(参见图2中第一个受试者组的描述),第二受试者组(“验证集”)包括535个这样的个体(参见图3中第二受试者组的描述)。
为了验证甲基化生物标志物DMR对结肠直肠癌的预测能力,进一步对从来自受试者训练集的样品的MSRE-qPCR分析得到的数据进行分析,以基于表7的88个甲基化生物标志物位点进行初始特征选择。使用Monte-Carlo交叉验证超过50次,使用随机森林算法以进行特征排序,VIP>2的标志物用于构建基于支持向量机(SVM)算法的分类模型。该分析确定了几个标志物子集(如表2-4中所述的3、10和40),它们在SVM模型中给出了良好的预测。
用于在MSRE-qPCR中扩增40个DRM的寡核苷酸引物对(表5)覆盖至少一个MSRE切割位点。但是,通常会覆盖3至15个MSRE切割位点。MSRE-qPCR根据实施例2中描述的方法进行。
在测试的535个受试者中基于40个标志物组的初始主成分分析揭示了结肠直肠癌患者(即患有结肠直肠癌的患者)和对照患者(即结肠镜检查未发现结果、增生性息肉和/或非进行性腺瘤的患者)之间的良好分离),如图4所示。在测试的受试者组中,只有一些被诊断患有进行性腺瘤的患者与对照组表现出良好的分离。不希望受任何特定理论的束缚,在某些受试者中结果特征与结肠直肠癌的相似性可能表明进行性腺瘤在其进展为恶性结肠直肠癌的路径上更进一步。
基于SVM算法的结果的统计分析显示在图5A和5B中。40个标志物组允许以78%的灵敏度鉴定对照患者和患有结肠直肠癌的患者。从对照患者中确定患有进行性腺瘤的患者的灵敏度为14%。早期局部癌症检测的灵敏度为78%。图5A中提供了基于表4的40个标志物组的数据的ROC曲线分析,如SVM模型所鉴定的。
下面显示的表8显示了对具有少于40个DMR的组的额外研究。用于3个DMR组合研究的DMR列表显示在表2中。用于10个DMR组合研究的DMR列表显示在表3中。用于40个DMR组合研究的DMR列表显示在表4中。“灵敏度全体(SensitivityALL)”是指检测受试者是否患有结肠直肠癌或进行性腺瘤时的灵敏度。“灵敏度CRC”是指检测患有结肠直肠癌的受试者的灵敏度。“灵敏度AA”是指检测患有进行性腺瘤的受试者的灵敏度。为了突出一个特定的实例,3个标志物组表明结肠直肠癌和进行性腺瘤与对照受试者的分离特别好,总体灵敏度为48%,特异性为93%。在93%的特异性下,进行性腺瘤的检测灵敏度为14%,结肠直肠癌的检测灵敏度为67%。
表8.将40个结肠直肠癌DMR组及其子集应用于验证组的准确度度量。
Figure BDA0003632046900000841
实施例4.各种单独的甲基化生物标志物均具有高度信息性
对来自40个结肠直肠癌DMR组的个体结肠直肠癌和进行性腺瘤DMR的性能进行评估揭示了各种个体结肠直肠癌DMR足以筛查结肠直肠癌和进行性腺瘤(参见图6-15)。图6-15分别显示了表示来自被鉴定为UDX_29_1(图6)、UDX_272.3_2(图7)、UDX_277.7_2(图8)、UDX_272.4(图9).UDX_174.3(图10)、UDX_260.2_1(图11)、UDX_260.1(图12)、UDX_137.1(图13)、UDX_17_2(图14)、and UDX_230(图15)的DMR的MSRE-qPCR的Ct(循环阈值)值的图表。
对于选定的结肠直肠癌和进行性腺瘤DMR,图6-15显示了结肠直肠癌和进行性腺瘤样品(统称为“CRC”)和对照样品(表示为“CNT”;健康受试者、患有增生性息肉的患者和非进行性腺瘤受试者)。结果显示为从45中减去的MSRE-qPCRCt(“循环阈值”)值(即45–Ct值)以用于显示目的。
45-Ct值越高,样品中甲基化程度越高。本实施例提供的数据以及本实施例提供的数据累积地(包括例如图4-9)证明对于鉴定的每个单独的DMR,甲基化状态信号在受试者组之间足够稳定以允许临床筛查用于结肠直肠癌和进行性腺瘤的组合。因此,呈现在图4-15的结果证实了本文提供的结肠直肠癌和进行性腺瘤的甲基化标志物可以提供用于筛查结肠直肠癌和进行性腺瘤的整体、鲁棒的信号。此外,本领域技术人员将理解,本公开提供了单独独立地用于筛查结肠直肠癌和进行性腺瘤的组合的甲基化生物标志物,特别是本文提供的甲基化生物标志物可单独使用或与相互组合使用。
计算机系统和网络环境
如图17所示,示出和描述了网络环境1700的实现,其用于提供用于检索、管理和分析来自本文所述的多个源的数据的系统、方法和架构。简要概述,现在参考图17,示出并描述了示例性云计算环境1700的框图。云计算环境1700可以包括一个或多个资源提供者1702a、1702b、1702c(统称为1702)。每个资源提供者1702可以包括计算资源。在一些实施方式中,计算资源可以包括用于处理数据的任何硬件和/或软件。例如,计算资源可以包括能够执行算法、计算机程序和/或计算机应用程序的硬件和/或软件。在一些实施方式中,示例性计算资源可以包括具有存储和检索能力的应用服务器和/或数据库。每个资源提供者1702可以连接到云计算环境1700中的任何其他资源提供者1702。在一些实现中,资源提供者1702可以通过计算机网络1708连接。每个资源提供者1702可以通过计算机网络1708连接到一个或多个计算设备1704a、1704b、1704c(统称为1704)。
云计算环境1700可以包括资源管理器1706。资源管理器1706可以通过计算机网络1708连接到资源提供者1702和计算设备1704。在一些实施方式中,资源管理器1706可以促进由一个或多个资源提供者1702将计算资源提供至一个或多个计算设备1704。资源管理器1706可以从特定计算设备1704接收对计算资源的请求。资源管理器1706可以鉴定一个或多个资源提供者1702,所述资源提供者1702能够提供计算设备1704请求的计算资源。资源管理器1706可以选择资源提供者1702来提供计算资源。资源管理器1706可以促进资源提供者1702和特定计算设备1704之间的连接。在一些实施方式中,资源管理器1706可以建立特定资源提供者1702和特定计算设备1704之间的连接。在一些实施方式中,资源管理器1706可以将特定计算设备1704重定向到具有所请求计算资源的特定资源提供者1702。
图18展示可用于实施本发明中描述的技术的计算设备1800和移动计算装置1850的实例。计算设备1800旨在表示各种形式的数字计算机,例如膝上型电脑、台式机、工作站、个人数字助理、服务器、刀片式服务器、大型机和其他适当的计算机。移动计算设备1850旨在表示各种形式的移动设备,例如个人数字助理、蜂窝电话、智能电话和其他类似的计算设备。这里显示的组件、它们的连接和关系以及它们的功能仅是示例,而不是限制。
计算设备1800包括处理器1802、存储器1804、存储设备1806、连接到存储器1804的高速接口1808和多个高速扩展端口1810、以及连接到低速扩展端口1814和存储设备1806的低速接口1812。处理器1802、存储器1804、存储设备1806、高速接口1808、高速扩展端口1810和低速接口1812中的每一个使用各种总线互连,并且可以安装在普通主板上或以其他适当的方式安装。处理器1802可以处理用于在计算设备1800内执行的指令,包括存储在存储器1804中或存储设备1806上的指令,以在外部输入/输出设备上显示GUI的图形信息,例如连接到高速接口1808的显示器1816。在其他实施中,可以适当地使用多个处理器和/或多个总线以及多个存储器和存储器类型。
存储器1804在计算设备1800内存储信息。在一些实施方式中,存储器1804是一个或多个易失性存储器单元。在一些实施方式中,存储器1804是一个或多个非易失性存储器单元。存储器1804也可以是另一种形式的计算机可读介质,例如磁盘或光盘。
存储设备1806能够为计算设备1800提供大容量存储。在一些实施方式中,存储设备1806可以是或包含计算机可读介质,例如软盘设备、硬盘设备、光盘设备,或磁带设备、闪存或其他类似的固态存储设备,或设备阵列,包括存储区域网络或其他配置中的设备。指令可以存储在信息载体中。指令在由一个或多个处理设备(例如,处理器1802)执行时,执行一种或多种方法,例如上述那些。指令还可以由一个或多个存储设备存储,例如计算机或机器可读介质(例如,存储器1804、存储设备1806或处理器1802上的存储器)。
高速接口1808管理计算设备1800的带宽密集型操作,而低速接口1812管理较低带宽密集型操作。这种功能分配仅是示例。在一些实施方式中,高速接口1808耦合至存储器1804、显示器1816(例如,通过图形处理器或加速器),并且耦合至可以接受各种扩展卡(未示出)的高速扩展端口1810)。在实施中,低速接口1812耦合至存储设备1806和低速扩展端口1814。低速扩展端口1814可以包括各种通信端口(例如,USB、
Figure BDA0003632046900000861
以太网、例如,无线以太网),并且可以耦合至一个或多个输入/输出设备,例如键盘、定点设备、扫描仪或通过例如网络适配器耦合至网络设备,例如交换机或路由器。
如图所示,计算设备1800可以以多种不同的形式实施。例如,其可以实现为标准服务器1820,或在一组这样的服务器中多次实施。此外,其可以在个人计算机中实现,例如膝上型计算机1822。其也可以作为机架服务器系统1824的一部分来实施。或者,来自计算设备1800的组件可以与移动设备(例如移动计算设备1850)中的其他组件组合(未示出)。这样的设备中的每一个可以包含计算设备1800和移动计算设备1850中的一个或多个,并且整个系统可以由相互通信的多个计算设备组成。
移动计算设备1850包括处理器1852、存储器1864、诸如显示器1854的输入/输出设备、通信接口1866和收发器1868,以及其他组件。移动计算设备1850还可以配备有存储设备,例如微型驱动器或其他设备,以提供额外的存储。处理器1852、存储器1864、显示器1854、通信接口1866和收发器1868中的每一个都使用各种总线互连,并且可以将若干组件安装在公共母板上或以其他适当的方式安装。
处理器1852可以在移动计算设备1850内执行指令,包括存储在存储器1864中的指令。处理器1852可以实现为包括单独和多个模拟和数字处理器的芯片组。处理器1852可以提供例如移动计算设备1850的其他组件的协调,例如用户界面的控制、移动计算设备1850运行的应用程序和移动计算设备1850的无线通信。
处理器1852可以通过控制接口1858和耦合至显示器1854的显示接口1856与用户通信。显示器1854可以是例如TFT(薄膜晶体管液晶显示器)显示器或OLED(有机发光二极管)显示器或其他合适的显示技术。显示接口1856可以包括用于驱动显示器1854向用户呈现图形和其他信息的适当电路。控制接口1858可以接收来自用户的命令并将它们转换以提交给处理器1852。另外,外部接口1862可以提供与处理器1852的通信,从而使移动计算设备1850能够与其他设备进行近距离区域通信。外部接口1862可以例如在一些实施中提供有线通信,或者在其他实施中提供无线通信,并且还可以使用多个接口。
存储器1864将信息存储在移动计算设备1850内。存储器1864可以实施为一种或多种计算机可读介质、一个或多个易失性存储器单元、或一个或多个非易失性存储器单元。还可以提供扩展存储器1874并通过扩展接口1872连接至移动计算设备1850,扩展接口1872可以包括例如SIMM(单列直插存储器模块)卡接口。扩展存储器1874可以为移动计算设备1850提供额外的存储空间,或者也可以为移动计算设备1850存储应用程序或其他信息。具体地,扩展存储器1874可以包括用于执行或补充上述过程的指令,并且可能还包括安全信息。因此,例如,扩展存储器1874可以作为移动计算设备1850的安全模块提供,并且可以用允许安全使用移动计算设备1850的指令进行编程。此外,安全应用程序以及其他信息可以通过SIMM卡提供,例如以不可破解的方式将鉴定信息放置在SIMM卡上。
存储器可以包括例如闪存和/或NVRAM存储器(非易失性随机存取存储器),如下所述。在一些实施方式中,指令存储在信息载体中。所述指令在由一个或多个处理设备(例如,处理器1852)执行时,执行一种或多种方法,例如上述那些。指令还可以由一个或多个存储设备存储,例如一个或多个计算机或机器可读介质(例如,存储器1864、扩展存储器1874或处理器1852上的存储器)。在一些实施方式中,可以例如通过收发器1868或外部接口1862在传播的信号中接收指令。
移动计算设备1850可以通过通信接口1866进行无线通信,通信接口1866在必要时可以包括数字信号处理电路。通信接口1866可以提供各种模式或协议下的通信,例如GSM语音呼叫(全球移动通信系统)、SMS(短消息服务)、EMS(增强型消息服务)或MMS消息(多媒体消息服务)、CDMA(码分多址)、TDMA(时分多址)、PDC(个人数字蜂窝)、WCDMA(宽带码分多址)、CDMA2000或GPRS(通用分组无线服务)等。这种通信可以例如通过使用射频的收发器1868发生。此外,可能会发生短距离通信,例如使用
Figure BDA0003632046900000881
Wi-FiTM或其他此类收发器(未示出)。此外,GPS(全球定位系统)接收器模块1870可以向移动计算设备1850提供额外的导航和位置相关的无线数据,这些数据可以由在移动计算设备1850上运行的应用程序适当地使用。
移动计算设备1850还可以使用音频编解码器1860进行可听通信,该音频编解码器1860可以接收来自用户的语音信息并将其转换为可用的数字信息。音频编解码器1860同样可以为用户生成可听的声音,例如通过扬声器,例如,在移动计算设备1850的听筒(handset)中。这种声音可以包括来自语音电话呼叫的声音,可以包括录制的声音(例如,语音消息、音乐文件等)并且还可以包括由在移动计算设备1850上运行的应用程序生成的声音。
如图所示,移动计算设备1850可以以多种不同的形式实施。例如,其可以实施为蜂窝电话1880。其也可以实施为智能电话1882、个人数字助理或其他类似移动设备的一部分。
可以在数字电子电路、集成电路、专门设计的ASIC(专用集成电路)、计算机硬件、固件、软件和/或它们的组合中实现这里描述的系统和技术的各种实施方式。这些不同的实施可以包括在一个或多个计算机程序中的实施,所述计算机程序在包括至少一个可编程处理器的可编程系统上是可执行和/或可解释的,该可编程处理器可以是专用或通用的,耦合以从存储系统、至少一个输入设备和至少一个输出设备接收数据和指令,并将数据和指令传递给存储系统、至少一个输入设备和至少一个输出设备。
这些计算机程序(也称为程序、软件、软件应用程序或代码)包括用于可编程处理器的机器指令,并且可以以高级程序和/或面向对象的编程语言和/或汇编/机器来执行。如本文所用,术语机器可读介质和计算机可读介质是指用于向可编程处理器提供机器指令和/或数据的任何计算机程序产品、装置和/或设备(例如,磁盘、光盘、存储器、可编程逻辑设备(PLD)),包括接收机器指令作为机器可读信号的机器可读介质。术语机器可读信号是指用于向可编程处理器提供机器指令和/或数据的任何信号。
为了提供与用户的交互,这里描述的系统和技术可以在计算机上实施,所述计算机具有用于向用户显示信息的显示设备(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器),以及用户可以通过其向计算机提供输入的键盘和指点设备(例如鼠标或轨迹球)。也可以使用其他类型的设备来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感官反馈(例如,视觉反馈、听觉反馈或触觉反馈);可以以任何形式接收来自用户的输入,包括声音、语音或触觉输入。
此处描述的系统和技术可以在计算系统中实施,所述计算系统包括后端组件(例如,作为数据服务器)或包括中间件组件(例如,应用服务器)或包括前端组件的(例如,具有图形用户界面或Web浏览器的客户端计算机,用户可以通过其与此处描述的系统和技术的实现进行交互),或此类后端、中间件或前端组件的任何组合。系统的组件可以通过任何形式或媒介的数字数据通信(例如,通信网络)相互连接。通信网络的实例包括局域网(LAN)、广域网(WAN)和互联网。
计算系统可以包括客户端和服务器。客户端和服务器通常彼此远离并且通常通过通信网络进行交互。客户端和服务器的关系是通过在各自的计算机上运行并且彼此具有客户端-服务器关系的计算机程序而产生的。
在一些实施方式中,本文描述的模块(例如,数据聚合模块1830、映射模块1850、规范模块1870)可以被分离、组合或并入单个或组合模块中。图中描绘的模块并非旨在将本文描述的系统限制于其中所示的软件架构。
本文所述的不同实施方式的元件可以组合以形成以上未具体阐述的其他实施方式。元件可以被排除在本文描述的过程、计算机程序、数据库等之外,而不会对它们的操作产生不利影响。此外,图中描绘的逻辑流程不需要所示的特定顺序或次序来实现所需的结果。各种单独的元件可以组合成一个或多个单独的元件以执行本文所述的功能。
在整个描述中,在设备和系统被描述为具有、包括或包含特定组件的情况下,或者在过程和方法被描述为具有、包括或包含特定步骤的情况下,预期另外还存在主要由所列举的组分组成或由所列举的组分组成的本发明的设备和系统,并且存在基本上由所列举的加工步骤组成或由所列举的处理步骤组成的根据本发明的工艺和方法。
应当理解,只要本发明保持可操作,步骤的顺序或执行某些动作的顺序是无关紧要的。此外,可以同时进行两个以上步骤或动作。
虽然本发明已参照特定的优选实施方式进行了具体展示和描述,但本领域技术人员应理解,在不背离由所附权利要求限定的本发明的精神和范围的情况下,可以在其中进行形式和细节上的各种改变。
序列表
<110> 通用诊断公司
<120> 结肠直肠癌和/或进行性腺瘤的检测
<130> AX200120WO
<140>
<150> US16/680,427
<151> 2019-11-11
<160> 317
<170> BiSSAP 1.3.6
<210> 1
<211> 297
<212> DNA
<213> 人
<400> 1
tcgctcctct gctccaacaa cttatacttg ctcttttgcc tttgaatttc tgaggtttag 60
tgagttcgat tagccgcgtg ctcagaatca agttcgggaa gaaagaggag gaggatgaag 120
cggacaagaa ggaggacgac ggcgaaaaga aggccaaaca cagcatcgac ggcatcctgg 180
gcgacaaagg tagggaactt ccctgggctg cgaggcccca gcccgggttt tcccacgctc 240
cggtgtgcgg gccagtggtt cgctcccgcc gccggagcag gcgaccagaa ctccagc 297
<210> 2
<211> 242
<212> DNA
<213> 人
<400> 2
cgaggtcgtg gagcggcagc agctgcagcc ggagcagcac cagcaacagc aacagcgagc 60
gggacggagt taggaccgct cggagcgcac aggtctcgag gtagtataag gtttgctatc 120
cttccacttg ctggcagttg cagaagaaga tctgcttttt aagtgaaacg tacatgccac 180
ccctccgagg gctgcggctt ccccgggctt gcttctttgc cgctcctctt tccggctctc 240
gc 242
<210> 3
<211> 257
<212> DNA
<213> 人
<400> 3
cgacgcacgg acccggggac ctcgacactc gctaggaggc aagccctatt cctcagccgg 60
gcgcccctcg tctcccgctc tctccatgga cccctctcct ggcaaatcgc ccgcagagcg 120
agcttggaga tgcgagggaa actgaagccc caagggtgcc ccgtcctggg agcctggctg 180
tctgcggggt cccccgcatt ccgcagtagt aatacaggag ggccgggggc ttctacccca 240
acctccgctc cccttcg 257
<210> 4
<211> 264
<212> DNA
<213> 人
<400> 4
cgtcctgcgc aggaccggca gcccgaggcg gagacgaagg gggcccgcag ggactcctgg 60
ccttgcgtct tgggagagcg cacgctggcc tgcgctacac acacacactt cacagttgcg 120
ctgaaacaga gtcgggtttt ctgtacagga gataaaatga cggtagtgtg tgtgtttttt 180
gaaagagctg ttaaaaagct aagttcttct catttcagtg agagttcccc cttggattgt 240
ttgtgcgtgt attcaattca gccg 264
<210> 5
<211> 191
<212> DNA
<213> 人
<400> 5
cgagctgatc gagcggcagc ggctggagct gcggcagcag gagctgcggg cgcgctacaa 60
cctcagccag ggcggctacg aggagctgga gcgcgtcgtg ctgcgcctca agccgcacaa 120
ggccggcgtg cagtggcgct tcgccggctc cttctacttc gccatcaccg tcatcaccac 180
catcggtaac g 191
<210> 6
<211> 1319
<212> DNA
<213> 人
<400> 6
acgactgttc tggacccagt ttataaagac tgcctggctg gccaggaaat cccccagagg 60
cctccttccg tgtccccggg ccaaatctgt gaagagaaaa cggaaggcta ccatgtcacg 120
aaaaactatg atcaaataaa ttattatgcc ttttctccta ttgatctgcc ttttgtcaac 180
tgattttcag tgaaccttcg gagagccatg gggaagtttt ccctttcccc ctacagggct 240
ctgaatctga aggtaagagt gagcctatag ggggaacctt ctggctccct cacaggaact 300
gactgagcag gagttggaaa agccacttgg attcccattt cctcaactcc ccgccaatac 360
caaggcgtct gtttttacag gctctttcgt ggtgttctgg gcacattcaa cttccaatgc 420
agctgagagg gtcgggaaca gttagagaac aggggtggca gccgcccggg aggctgcaag 480
gcgctcgccc gcaacgcaca ggcgcgcgcg gcgcacccgg cctccggcct ccccaggtcg 540
ggcctggcag ctgcgggaag gaggtcagcg cagccgccac acttcgcccg ggcgctggcc 600
cgacccgacc gccggcgact ctctggcagc gcccggagac cgccagcccc tgggccgccc 660
gtccgcagag ccccctccgc cccgggaccc tcgcgcgcag ctcaagttgg gagccccgct 720
ccgcaggcga gcgcgcgccc accacccaca cccactgcca ctcatgcaca ccgcgggtcc 780
ggagatgccc ccgagcgttt taaaatccag aaacatcaca tggtagccac atccggcggc 840
tgttacctgc tcgcagcacc cagaccctcg ccctggtttc ccgggagccc gcaaacccgg 900
cacgcgggct gcgcgccctc ccgcaagcca ccgctcagcg ccagcgcgcc ggcaagccgc 960
ctaccttagg ggtctgcact tcaggtcccg tcggcacctc caacttcctc ttggttaccc 1020
agaagaacag cagcaccgtg atccagagca ccccgaagac tggcagaacc agccgacgag 1080
tcaggcgccg catggtcccc tttgccgctt cctctccgcg gcgctacgtc ccgggggcac 1140
cccccggcgg tcagggttgg cggggcagga gtcctggcga gcgcctcgct ctggggagct 1200
ctagacccag gatccggttg gaggggcggc aggatcctgc aaggcgccct tcccgcttcg 1260
aagagaagcg agcctgggtg gggggtgcag ggcgacccga aacgtggcag ggaaggacc 1319
<210> 7
<211> 723
<212> DNA
<213> 人
<400> 7
gcgtctgaga catttctcac tctggcactc taagcaatgc aataacccaa ctcctcatgg 60
cccaaagccc cagactctgg ttttcagaca aaacaacaac aacaacaaca acaacaaaaa 120
cccaccgtta tgacagtcct gccgctgagc taaccagaac ctggctgcac tactttccat 180
tcactgccca accctttcct gccttgcaga cttggaaagc aaaaatgaca ttttggaaaa 240
cctggttcac cttcccagcc agaagtgcag aactgcatgc ctcaacctcc aacttcggac 300
aggcctcctg acagcgaaga tcagaggctc agggcacccc ggggcccctc aggcagggaa 360
cgtgcattcc cacccctgac tcccctcgca ccgaagctgc acatgctcct tcttccctgc 420
cttcctctgc atgctccttg gacccaagct gaaccctttc ttcctctctc catctacaat 480
tacaaacgca aattctcagc caaggatgaa agaagtaaat tgtaggctcg cacaatatca 540
ataattccgc gggtcacagc atcccgcaca aggacgcctt cttattgcat aattaacgcg 600
aggaaggctc ttcccgctac tcccgcgaac tagggaggtc ttcaagtcgc caaaacacac 660
cgggatgtgg ctcgccagga caaaacccgc gggttccccg gtttttccgt gcgccccgcg 720
gcg 723
<210> 8
<211> 325
<212> DNA
<213> 人
<400> 8
gtttgcttgt tctcactctg cagccgcagc cagtggcgcc gctaccaagg tccccgcctc 60
gccatccggg tcctgcctga gcatccttat tggtgctcag ggctaggcgt gcattgctgc 120
taggggcgcg gaaaggttta tcgtgggtgg atgctgcccg gggcttgagt ggtttttaga 180
ggtcttgagt ggctcactct ccaatcagcg ctttctagag acagcgtggt cagcgtactt 240
gcttactttc aggattgcga gacgtcttta acccttgctg atcggctgac gctgcagctt 300
cctgtggctt cctgctcatt tcccg 325
<210> 9
<211> 1395
<212> DNA
<213> 人
<400> 9
cggatcttct cggacgcctc tggcttgggg ctgcgggaag cgtgggctgc ccggggcgca 60
gtgtgcggag accctctagg cgggcgggga cgccccacgc ggcgacctga gcaccgacct 120
catgcaacgg gaccgaacct tgggacccgg gcagcaggag ctctgttccc ttcacctcca 180
gcttggtttg agggatactg atgaaggaaa ccgggggttt cccgtcctgc gcggagagcc 240
tcggcgccca aaatcgaaag gccgggagtt gttctgcagg ctttgcaaac aggttgactg 300
agggtttcct ttcccgtagc gctgactgcg aaatctgtgc ataggcgttc agtgccagtg 360
gaggatagct gagcaagcca agaagttttg cagcttcctc tgatttatcg gtggagtgtc 420
aggaggctgt agcaacagtt tacatttccc ctgtccctgc gagtggctag gggcaagctg 480
ggctcggacg tgatatcctg ctgtttgtgg agaggaaact gggaacgggg cttgagagtg 540
aggggcaggg agggggggac aggcatattt tctactgcat cgcccatctg cacctgtccc 600
ctttgctgtc ttacatgtcc catagtatta aagttatttg aataagcaaa tgaaccccgc 660
tctttggtga ccgcgtattt tgaagttgga aaactttgca ggggacgagg gaatgttgag 720
gagggggcgt taagctctct cactctatcc ctttttaaag acaagaaaaa aactttcgtt 780
ggcgaaggtg gtactttttt cttttggaat gtctgagctc agagcttccc ataagaggta 840
ttgcgattca atactgtaca gtcaaggtga agttccacta agattatggg accgtggcat 900
attctacgga agataccagg gttccttggc gctctgttca ttgccagggt ggtctgctga 960
aagccggcag tttcccaccc tcagactcct tggagctctt taaatgacgg tctgcctggt 1020
gtttctcagc ggtacacctg tgagtgctct gttatcatgg aaatggtaac ccatgcaggt 1080
agggctcatg ccaaccagac tgtggtgggg tgtgtgtgtg tttgtgtgtg tgtgtataca 1140
tgcgcgtgcg tgtgaacgtg tgtgtttgga gtttcctttt gacaggtaat ctttggatgt 1200
caaagggata cagttatttg tctggcagtg tcagggcaat ctgagtttct cgagtaacta 1260
ggaggaggta atctccaggg aagccttttt gtgctcttga ctgtctactc agcagttggt 1320
gaaggcttcc tgaaagccac ttagggtgtt actaaccaaa tcaagaagtc ttactcagtg 1380
gtgagtgaaa gctcg 1395
<210> 10
<211> 197
<212> DNA
<213> 人
<400> 10
gcgactgctc tgcggttccc caaagctcct cctacccaga cggcgacagt ttggatgctg 60
aggttggaaa gcaggacagg ggacactcct gagtgcagct cggagcgggg aaagccgaat 120
tccgggggct gaagaggccg cgcaggggac gagcgcctgc gatgcggagc gtggacttct 180
tgggccgtac ccctgcg 197
<210> 11
<211> 1848
<212> DNA
<213> 人
<400> 11
ccgatatata aactccacac atggtatctt tttagaaatg atttgcatac atttaagttg 60
gtgtggacac accttcaaag agaggcagag gtgtatgaat tcctaatgag aatgagagta 120
tagtcaccaa tcagaaccct tcctcacatt ctccaaatcg cttgtatttc accatttctc 180
tccacgcagc agaatttttg acatgggaca tttcttgctc tcattctttc tttccttcca 240
atttactgta aggcattaag tgaaacttct tcagctatgg tgtgtggcac aaaaacatcg 300
cagcgcagga atgcatggaa tagaagggtc ctttcccttc cagaactctg taagcgtcaa 360
acgccgaccc ttggctccat ctcccgctcc cctgacctct tgtcactgtg ccatttccct 420
cctgtgcttt ctgcccactt ggaaaatatc gtatatcctt tacaagaccg ctactttctc 480
tcctctgttc acatttctcc attaccatcc acattttctc aaaacattcc gacgggtttt 540
gaagtggggt tttcaacctc cctcgactgt gatagccgaa gtcccttcaa gaaagaaaaa 600
tgatgttgga aatactagta acaaataaag tatcacggaa atccccaccc aagcgatacg 660
gtttccttga cgcgccctta accaaggcgt taagtttagc ctgacagcat ccctccctcc 720
tttcggttcc tggcctgatg agccgcctcc acctgcgagc ggtgcaggca tttttgttgt 780
cgactaaccc cctctagcgc cgaactggcg gcatccgagc cgcggctgcc aggccgggag 840
aaggctgggc ttggccgggc tctgcagcgc tccgggctcc gtccctgccc tgggcgcccg 900
cctccgccgc ggggcgaggt ggtggagacc gcggacgccg agggtcctcc cagtcagcac 960
gccgcgttgc cccggccctg gggcgggggc cgcggagtcc caccaagtgg cccgcgcctc 1020
ggcttccggg agacccgagc gcggggaggg agtgggtgcc gcgagggggc ggctcgcgcg 1080
gggagagccg tcagcccacg gcgcccctgc gctgctgtgg atgtggccac gcgccactcg 1140
gcccttggac tgctaggaga gcgcggcccg acgccaccac gccgtggacg ctcggggacc 1200
cctgaatccc agcgtcaagg ctgcgacgat gctcgtgacc tccaccgcga agtcacctcc 1260
gcaaggcgac gcaaggacct cggcgatccc gggcgccgta cacccgccac tttccagcct 1320
catgtaaccc cccctctgct gcttcctccc ggcgctttgc ttttctacaa ctggaagccg 1380
cgaaggcggc tactgcgctg agccgctcgc tctgctggtc aagtttgggc gacccgcgcg 1440
gaggagggtc gggctgactg ccgccgctga gctgtccccg gacgggagcg cctgtccacg 1500
gcactcaccc cctccagcgg tggaaatgtg gagaagtaag tgggaggcgg tgtcgggaac 1560
tgactcctct taaaacggtc ggcgccgctg ctctgaaatg ggcggctaag tgcttgtggg 1620
actaagggcg gcctcagaga tgcccggaaa atcgctgcca cggccagagt gcggcgcaga 1680
cgcggcagag ttggaggtgt ccgcggtgca ggctgctgcc cacgccgctc aggccaggtg 1740
ctgagggctc agcccgcgcc tcggccgaac cactctcagc cccgttgagc cacctcgtcc 1800
gcccggcttt catcgcaccg gccagaggaa agttcccgcg gcccccac 1848
<210> 12
<211> 680
<212> DNA
<213> 人
<400> 12
gcgcagccga gtacccgccg aaggctgtcc ccatcagtgc gtgtctgctg ccgggcagcg 60
gcagcatcca acctgcttta ttcctcctgc ctgcagcgcc acagcgagcg agcgagcgag 120
gagggggaga gagggagtct gtctgcaaag tgctgctccc tggtgctcag aggcggctgc 180
tccagctcca actctcattc atttcgccgg ttaacatgag agatcatggc cgccttcggg 240
cttctcagct atgagcagag accgctgaag cgcccccggc tcgggccgcc cgacgtctac 300
ccacaggacc ccaagcagaa ggaggtaagg gcgccggcgg cctccccggc aaccggggcc 360
gcgctctgca gcactgaccc ggggccaagt tggcccagcg ggcatcgccg gcgctgcggt 420
ggaagaggtc ggggaggggg attagaggcg ggggccaggc tgggggtgct gggcgacccc 480
ccggcggcgg agaccgagcg gctgtcagtc cccgcgctcc actggggcgc tcgctttcca 540
tgtgccggtc gctttcccgt tgccgggcct tgcacggcgc cgccgggcgc ttctcgggct 600
tcttccctgc cgaaaccttg ctcgctctca cccgtttctg cctgctttat ttttcttctt 660
gccgcttcgg taaatcgtcg 680
<210> 13
<211> 762
<212> DNA
<213> 人
<400> 13
cggccggtct tttgccccgg gctcaatggc tggattgtgg aaactgcacc cgccttcagg 60
ttgttgagca actgatggga cgatctcagg gaccggcgtt tacgaaaggt aatttattct 120
tcgcactctt cataataggg gtcgccctgg ccgggcgcag gcggcggcat ccaccgggcg 180
ggcaacaaga gggggtgcgg ggtgcatgca cactcgccct tccactcaca cactcgccct 240
cacacacaca cacactcatc cggtcgtggt gcggggcggg aagggaacct cctggctggt 300
gggcgctcgg gtctggcgcg ggttggagtt ttttccagcc attgggcgat ttgaccggcc 360
gaggggagtg agggggataa gagactgggc gcattcgcag ctgcacacgc tggggaatag 420
gaacagttcc caccccgtta attttccctc tcctctcacc ccagtggcat cccctggtgg 480
gggcagaaag cggacaggag ggcgactttt ctccgtcagg ctggaactgg tgccgctgga 540
ggcgggagcg ggctggagga cggacagggt ctgggtgaga agctgggctc tgggaagatg 600
gaaaatgcag ggtgccgagc ccggcgcgat tctccctcaa cgcttgcctg gagcatccct 660
ggcccctttt gcccaggtcg cgcccctgag tcttggagtc gcgctgcctc cccgcgccct 720
gcctgttgtg tctccttcac ggcagtttgg tttagacctg cg 762
<210> 14
<211> 660
<212> DNA
<213> 人
<400> 14
cgagcgtcct gctccttcgc ccggcttcgc cttctctcat aagggtggcc gggggcccac 60
gaacttgcag ggtggcggcc ctgcgccctc cagccccggc ggggacgggc acgattgctc 120
gtagtctggg gtgctgcggt gcggggtgct gcccagggtg tcccggccgc cgccactgag 180
cgctggggcg cgcgaatcca gctgcagccg ctgctgccct gcgccggttc cctcaggctg 240
cgggcgctgc gctcctgatc tcgccggtgg ctgcgcctgg gcacgcactt gccgcgggcg 300
gggcgggctt ggggacagtg ggagcgagca ggcagagcgg agtaagcggt ccgtgtgtgt 360
gtgtctgtat gtttgtgtgt gtgtgtgtgt gtgtgtataa tgtgtgcgtg caaggaggag 420
cttagtgtga tgtcaaagcc cctgggattc tcttgccatg ttcccttggt ctctctttat 480
gggcagcagc gacccctgtc gggtctcaaa ttcaacctca atcggcgact taatctaggt 540
ggaggtaaag aggaagcgac ccctcgacct ttgagtacgg gaataacttc ctgagcgtta 600
catttagcaa atgtatgtgc ctctcgtaaa cgaccctccc gtttgctgga agtactgccg 660
<210> 15
<211> 1258
<212> DNA
<213> 人
<400> 15
cgccgccgcg tttccctaaa cccctctcct cagaaaacgg agcccactcc ccacccacat 60
ccggcggccg cggcccccgc ctcggagcag cgcgcgcgtg tgcccgggga tgtgggtgcg 120
cggaacttac gtctcggaat ttgttccact gtccgacttc cttgtcatac tgagagattg 180
tggtgagcca ttgtttatca tccagaaaat taccgccgtc cgaccgcccc ccggctgcag 240
ccaccgccgc ggcagctgcg agagactgac tgcaccaagc ggctgcacac acacacagta 300
cggctgacac cttgagcatc tgggagagga gacacaacgg ggggtggggg ggcatgtcag 360
tgtcaaataa ggggtacgaa gccaggagcg accctggaaa acatgcatta gcaacgacga 420
gggtagaggg aggaggagac aagcagaggc aagcgtgtcc cctccccgca ggctttaccc 480
ccaaaagccg ggcactcaca cacacgcaga cccagaggag gagaggtggg tataaggaag 540
caagccccag ccgcagcagc ccgagcgggc acaaaaccgc ttcctggcac atcaccttgt 600
tgtgagccag cactgtgctc gcagctcctg ctggaaatgc agccctgctc tgccaactcg 660
ctgctttctg gagctgctgc acgcgccgcc gtctcgagcc gtccactcag ctccctgcgc 720
ccggcgcgct ccccccatct ccaccctccc ttcgcgcgcg gatctccagc ttactcccct 780
ccgttccccc tccctccccg acctccgttt ttttcctctt ccacctcctc ctatcccacc 840
ttcctctcgc tggatcccag ctacagttgg ctccggatag gacgcttggc tggagccaga 900
ggacgaggta gctcctagcc taggaatcct tatctgcttt gtaacctctc ccctccagaa 960
gaggttctca tgttcgcgag acagcctgct cattctctgc tcctggattt aacacaaagt 1020
gtactatctc tcgcagttgc ctctgctcca caatttccag ggttgtcagg cagacgtgag 1080
aaacaagatc tgaggaaaac tttatgcatt aataaataag aatacctgga cttcctaccc 1140
tgtaaagctc ctgaactcag ctcctcccta aagaaaggcc atctatccac aaggtcttgg 1200
gagatctgtt taatttcaga aaatttaaag tttgctgtga gcttctggat tactaccg 1258
<210> 16
<211> 640
<212> DNA
<213> 人
<400> 16
gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60
agagcagcat ctcccctgcg cctgtggata cgccagtcca gggatggcga gtgctttctc 120
ctccccagct tctccctcgc tcttcgaggt gactcgtggg accctgcgtc ctagtgctgg 180
gtgtgaatcg gctatttcac acccagttct tcctcccctc cgccacacgc agtcacattc 240
ctggagctat tccaagctgc ctccgctaag caccgaataa gcggaccctg cctggaaact 300
tgagcgaagc tgaactgcgc cgaactccac cgtccagtga cccgagccag tgtggacgcc 360
cttttaatca cgctgtttac ccaggtggaa tttaggaaga atcagccttc agcctcaacc 420
tcaaaccttt tgtgcaaatg ggcacttcgt ttggaaaggg actagaaatt gtccccagtc 480
tggccctgca ccagcacctt cctctgctca aacctgtaca aagtggaagt tttaggaagt 540
ttccatttct cgtgccccgt ttcaacttgc tccccaaaga gaacatgaaa acgtgggaac 600
tcgggaggac agagatctcc ctgtaatcgc ctcgctattc 640
<210> 17
<211> 572
<212> DNA
<213> 人
<400> 17
cgggcctcaa atgggaactt tggccagaaa atgtggtggg aggtgccctg cacccgcttt 60
gggctcgcgt ggggaagggg cactcagggt gtgtccgtcc tacgggcttt ctcgttcctc 120
cagcagaact tctagcggag tttgccaact acttccacta tggctaccac gagtgcatga 180
agaacctggt gcattacctc accacggtgg agcggatgga gaccaaggac acgaagtacg 240
cgcgcatcct cgccttcttg cagtccaagg cccgcctggg cgcggagccc gcctttccgc 300
cgctgggttc gctcccggag ccggatttct cctatcagct gcaccctgcg gggcccgaat 360
tcgctggtca cagcccgggc gaggccgctg tgttcccgca gggctctggt gccgggcctt 420
tcccctggcc gcctggcgcg gcccgcagcc ccgcgctgcc ctacctgccc agcgcgccag 480
tgccgctcgc tagcccagcg cagcagcaca gccccttcct gacaccggtg cagggcctgg 540
accggcatta cctcaacctg atcggccacg cg 572
<210> 18
<211> 248
<212> DNA
<213> 人
<400> 18
gcgaggggtc cggcatcact cgcgcgctcc ggaaacccgc gtgagccgct gttcctgccg 60
cgctcccatc tgagtgacag gcttgtttca gagctccgca gacctctaag cctggccctc 120
accctgcgtg gagagaacgc ccgggcttgg cggagagacg agaaaaccga ggctcccgga 180
ggcagacaag gactctgcca aaaccggacg ccgcggcggt ggcagaattc gaccctggga 240
tttgccgc 248
<210> 19
<211> 282
<212> DNA
<213> 人
<400> 19
ccgtgacgac ttataaaagc ccaggggcaa gcggtccgga taacggctag cctgaggagc 60
tgctgcgaca gtccactacc tttttcgaga gtgactcccg ttgtcccaag gcttcccaga 120
gcgaacctgt gcggctgcag gcaccggcgc gtcgagtttc cggcgtccgg aaggaccgag 180
ctcttctcgc ggatccagtg ttccgtttcc agcccccaat ctcagagcgg agccgacaga 240
gagcagggaa ccggcatggc caaagccgcg gcgatcggca tc 282
<210> 20
<211> 1031
<212> DNA
<213> 人
<400> 20
gcgccgctgc tgggacgcgg cgcggacccg catcattgcg cgcagcagcc gctgcagcag 60
ccgccgggga ccgcggagcc gggacgcccc cgctcggccc gcgccccgct ccccgcccca 120
cccccgcccg ccgggcccag caacgcaggg tgcctaggag ccgcgggctg cgcagggagg 180
cgggcagcgg ccctcgcgcg cttctgccgc ccccggagcc ggcgcgcggc gagcgcaggg 240
cgagcgcgcg tcgggcggcg gccgcgctgg ggggcgtgag gcgagcggcg cggagagcgg 300
caggggcgaa acttcgcggg ccagatgccc gagggcgcgg cggcgctgcc aggctgccgc 360
tgctgcccct gcgggccccg agcgcgcctc cgcaggcggc actgcccgcg gcgcggcgtg 420
tgcaccgagc gagtgaaggt atgtgtggcg ggcgcggctg gagctgccgc cgccgccgcc 480
gccgcgccag caggtcctaa tgcctgtcac ttcccaggac gctggcagca gcagcagccc 540
ggagcccccg agccctcggc aggtttgcgt gtccttcccc gcgatctgat tggataaagt 600
gggggctcga cggtggccga cgtgggacag tctggctgtg gcaggggtct cggaaaccat 660
gggttattgc agtggcaggt gcacgcttat ctttatctgt ggcatgcaac tggtaagtga 720
cacttgggtc cccttattct gtaatgtgtc tttgagatag tgggcagggg agtgcagcaa 780
agggtctgcc attgactaga atggacgaaa aagataaaag agaaggtgac agatatattg 840
cctatattga agatgatttc agggagacgc actctggggt acaggagagg tgagcctttc 900
cgttcccacc tatttctgtc ccttttaaga cagtttggca ggtgcgggtt aaacttgtct 960
ttaatttctt taggaaaagc aagatgtagc tcttgttctt tatgctttgc attcctattc 1020
atgtaacaac g 1031
<210> 21
<211> 795
<212> DNA
<213> 人
<400> 21
gcgacccaaa ccggggatgc agggagctcg cttggcccct ttgaaggccg actccgcaat 60
aagcagtttt tcctttaaat aaccgtagtg gatttgagag aattttccat ggctgaaaag 120
agaaacagga gctgtaggca acatccctaa atttataata atgcatgtaa acatgctaca 180
taccacatat atgtatatgt gcataaatat ggatgtggtt gggcacatac ctatctagac 240
accattgact tgcctggtca aagaataaga cttagacatt tcgtgcctgg gaaatggtgc 300
agtttatctt taaggagact agaaaaataa gagatgaggc tcacgttgca cggatgacat 360
cactagcttt tggctgcgcg ctcggtgttc tcgtctgtgg gttttagcca aggctgcagc 420
tacccgcgcc ggacgagaga gcgcggcagc agcttcctcc ggcgcccgca cccgggcaat 480
gcgatttccc cagtcccctg ggcgcagcct gggctctcgc gcctcccggg caccagccga 540
gcctgcgagg cctcggagcc gccgcggcta gaggaggagg cgacgagggg aagccgagtg 600
acccagcctc cctcccccac cctctcccca ttcatctcgg cgaccaccgc gcgccgggag 660
ccggatcgtg ggacgccgag gccaggacgg gattctctgc acgctgtcga gtgagccggc 720
atctcggcgc ccgggtgggc tgcgaagaaa atggtgcaat ctgagagcga ctgagcccag 780
ctgggcagag cagac 795
<210> 22
<211> 160
<212> DNA
<213> 人
<400> 22
ccggtgctcc cagaccccct tccttctcaa acacgcatca gacactttgc accaagaaaa 60
aacaaagggc atccctcctg gggccacctc tgccccctgt ccaggtacgc gctgtctggc 120
gcgccctgcg tgggggccgc aggttcagac acccgggcgc 160
<210> 23
<211> 554
<212> DNA
<213> 人
<400> 23
acgcttctca tttattttat atttatacaa acagcgcttc cctgaaaaat cagggtatcg 60
ttcaagattt tatctttatt cacagaagtt ttaaaatttt taacttttat atgcacaaga 120
cagttctgat ttgttgaatt aagtgaccgc gggtgtgcta atgcttctaa aaaacagcat 180
tagccttctc ccatcaaaag tccggaagct gcccttcagt cgtcaaagtg tttgccttaa 240
tttgcaatcg ttatgacttg agccaaatgc ttatacctca tttgtgtcgt atatgtgaag 300
atacaattgc aaatcgttca cgaccttgag tcaagacctt gagtttcctg aggtcaggag 360
accgttaggg aatgtgagtg tcccagacgg gcgctgagcc cagctcggag acccaccccg 420
cccgtagcag cggcgcgggc cccagagagc cccgcactcg gccgcgcctc agttacgctg 480
actcggctgt gcccgcagtg tcgcgctgtc gcgtagccag gtgtcgccgg gctggcgcgg 540
ttatttatga ctgc 554
<210> 24
<211> 1732
<212> DNA
<213> 人
<400> 24
acacgacttc tctgcctgtg gatgtctcat gaccctctag agcagcgact ttttcctccc 60
tcattccttc cactcccctc gggcatctaa gtagcaggaa cctgactgtc caaagttgat 120
ttgggagcag ccggctgccc ttctaaaatg atctaggaaa ggtgccagta acataagccg 180
ccgcctgctg aaactggcgc ttcctcagcc actcgctgcg gccagcgtga aaggggaggg 240
gaaaggggca ttcctggcac ggtcaggtgt ctacggacag caatcttagt taattctcaa 300
aaccccggaa gatccagaaa tggggtgctg acagggacct aacctgtcca ccacccctcg 360
gtcggtggga ctgaaaccca tgtctttgag ctgctttacc agtttatttc caaaaagtcc 420
tcctacacct gggaagggac atagaaagct gatcccattg ccagccggat ttctttactt 480
aactctcaac cgtggtaaat ctaattcgct tacgacctct ttccgagagc tgggaatctg 540
cagagatgct ctgttttctg ctgtactaat ctcaggcttc ccaaagcgag tgcctcgccc 600
agctcctagg ggaatccacg gagccccagg cgcagggcaa aggatggggc gggatgggga 660
catcgtacct gcgctccggg agccgctggg agtccggccg gccccggccg cggggaggaa 720
aagcaacggc ttgggctcct tatccgtgac gcgcgctccc ctgcgccccc ggggcctccc 780
gtgggctccg tgcggggaca aagccagcgc cagcaggaag agtgcgggca aaggggcgcc 840
gggcttaagg ggccgcatgt tcgcaagccg ggaggagaga gcgggagact ccgggaggat 900
cccgacgcag gtccggaggg tgcgcggccc aagagaaggc cagcgggacc acagcgcggc 960
tacgcggccg gccgcagtct tcaccgcgcg cctgcccttg tctacgtccc gggggtcggc 1020
tggagctgca ctgggactcg gtcctcagtg tgccgaagcc taagcgctgc ggggcgcggg 1080
gcgggaacgg gaggcggtgc ctggggccac ggggtcgtcc cccaggatga gggcgtgtcc 1140
cagcgcgcgg gaccctcgga agtccgcgct gggccgggcg ggcaccagcc tcggactcag 1200
cgggtctcag ggctccctgc gcaacgcctg cctcggatcc ggaccccggg ctcgctctct 1260
ggtcgccgtc cccgggagga cccagtaggg taactgccgc gtcgccccgg cggttctccc 1320
tgggctctgt ctcccgccgc ctccaccccc cgagcctcgg ggtccgtcac ggcttcccct 1380
ggctggcggg gtcagtagaa cccgcggcgc ctaggtccgg acggaaaaaa gcagggccgg 1440
ggtgcggcct ggatgagcgg agatctccgc gccttgggct caaaggtgcg gggtgcgctc 1500
tgctgccgag cccctgctcg ctcaggaaca ctggccacgc cgtcacgcca gccgcccctg 1560
ccccaggtct ggaggcccga cctgctctcc taggcgcagc accgcgttct cttccgcgtg 1620
ggggagcggc gggcggaaga ggtctggggc tgggcaccgg ggacacgcgc ccagctcccc 1680
tggcctccct ggggggagtg gccggtttca gtgcttcccc aggtgaaatc gc 1732
<210> 25
<211> 527
<212> DNA
<213> 人
<400> 25
gcggcggcag cagcagcagc agcagcagca gcagcaagaa atccaaagag caaaaggcgc 60
tgcggcttaa catcaatgcc cgagagcgcc ggcggatgca cgacctgaac gacgcgctgg 120
acgagctgcg cgcggtgatc ccctacgcgc acagcccctc ggtgcgaaag ctctccaaga 180
tcgccacgct gctgctcgcc aagaactaca tcctcatgca ggcgcaggcc ctggaggaga 240
tgcggcgcct agtcgcctac ctcaaccagg gccaggccat ctcggctgcc tccctgccca 300
gctcggcggc tgcagcggca gcagctgctg ccctgcaccc ggcgctcggc gcctacgagc 360
aggcagccgg ctacccgttc agcgccggac tgcccccggc tgcctcctgc ccggagaagt 420
gcgccctgtt taacagcgtc tcctccagcc tctgcaaaca gtgcacggag aagccttaaa 480
cacacccccg aaaaacacaa gaccgaccca aaatctagag gaaagcg 527
<210> 26
<211> 211
<212> DNA
<213> 人
<400> 26
cgccgctagc ccccgtcata tcttctccgc tttcgcttct ccactctagc cgggggtggg 60
gtgggtgggg ttggggtctc cgcgggggtt tccggccccg cggcccgctc ccgggtgtgc 120
ctggaggagt tctccctctg tggcgcgcgg gagccctgtg atgcgtcagc cggcgggacg 180
gatgagttgc ttctccggga aaccgtcctc g 211
<210> 27
<211> 315
<212> DNA
<213> 人
<400> 27
cggccggctg ctgcttacgc gggtaacctg tcggaaagcc ttgtttgttt ttctggaaaa 60
gtcgctgcaa tggacacagc gttgcgcggt ttccctgcgc gcctggggcg ctttttgtct 120
tcgccctccg tggatggagg ctgagcgcct cagccatttt gagagctctg gaaattttat 180
tagcatttta aaatttgcat tctcgaccga agattaaagt gcaaattact ttgaagatgt 240
tttaaagcac gcttaagaat tttaaagaat atgcgcaggt ggaaaaaagc gcgccagggt 300
ttgagatttg gtccg 315
<210> 28
<211> 142
<212> DNA
<213> 人
<400> 28
cgatggccca gctcctcagc caggtccacg ggcagacggc cccaggcatc gcgcacgtcc 60
agccgcgccc cggcccggtg cagcaccacc agcgtgtcca ggaagccctc ccgggcagcg 120
tcgtgcacgg gtcgggtgag ag 142
<210> 29
<211> 217
<212> DNA
<213> 人
<400> 29
cgcgccggcg ggggcagcgc cggccgccga ttagttttat ctcggaacgt caattgactt 60
agactgattg gcttcctgcc gccaatgtca attaaattgc aaatgcttgg cggaggccgg 120
cgcgagcggg cggcctcctt cccgggggcg ccgcgctcag ccttctcttt gcgccacgtt 180
cggccgcagc tgaattcatt tctccttcca cgtcgcg 217
<210> 30
<211> 62
<212> DNA
<213> 人
<400> 30
ccggtggtgg ggtcgtagtg gtttccgagg ttggtgacca cgtcgtcgaa cttgagcacc 60
tc 62
<210> 31
<211> 306
<212> DNA
<213> 人
<400> 31
cgggtccgag accctcgtag tgtggggaat ttcctgggag gaagatacta cgcggggccg 60
ggagcagaat ttgctccagg cactgggcca gtccatgagg gctccaggat ccaggggccc 120
cactcccttc tcgccgggct ccgggccaag gaagcgcggc cggagtcccg ggaagcccct 180
cggcagccag ccaagggccc tgcgaggatg tggatggcgc ggatggcgcg gcctccacct 240
gcgggcagtg gagagagcgg cgagaggaag aatattcccc gcgagccggg ataaggggcc 300
ccttcg 306
<210> 32
<211> 718
<212> DNA
<213> 人
<400> 32
acgtatctaa acaccattac caggctccac cagcccctct gctcctcagc ttagaggagt 60
ttttaaaacc tgttgagaat tatcgcagat acgtttggcc attatccagt cgtttcgatt 120
gtgcctttcc taaatgtccg cggttggcag aacgtgggag gaagaggacc cgcctaactc 180
ggggtaggtg gggacgcgct gctcactgtg gtgaggttga cacttgggcc ctgggtttca 240
cttgcaggtg ctgggcggcg gagagccccg agaaggagga ggagagagag ccagcagcca 300
acccctacga cttcaggagg ctcctgcgca aaacctccca gcgccggcgc ctcgtccagc 360
agtcctaacc gttcaacgag gcagtcaccg ccgtcggaag gcgctggagc ctgcggggca 420
gcaggggcca agcaggcact ctggggctgg caccagcagg cactgaagct gcggccctga 480
tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc ccgggccggc cttcgtgctc 540
cgaaacaaga gacctgggag ccctcgggaa acctcccccg acgctctctc tcggaactcc 600
cgcaccctcc tttctcacca gcccgccagt tgtggcaacc ctgtccttgt tcccctaatc 660
tatcactttg ttcttttttt ttgtgactcc tgtggactcc actgcgcctg ggatctcg 718
<210> 33
<211> 314
<212> DNA
<213> 人
<400> 33
cgcggagaaa cctggcgggg ccccggactc cccggcttgg gaaaagcgat gactgccctg 60
aactgctggg gcgttcgaaa tttccagggt cccgaccctc cgtggggtac gcgcgacttc 120
ggcgcagatg tcagtccgct gccttccggg ttgagggagc gaggactcca gacgacccca 180
gggccgctgt ccaggcccag ccccgcgttc tccacctcgc cacctcgctc tgcggctcca 240
gcctggagat ctacggactt cattgcgatc tcttgcgcag tgtagtcgcc ctctatccct 300
agccccgagt cccg 314
<210> 34
<211> 1352
<212> DNA
<213> 人
<400> 34
cgcggggaaa gttggcgcgc gcctgaccgc gcctggaagc cgcgcggtgc cagggccgag 60
ttgtccccca agtttctgcg gcgatttgtc actccctggg gatctggcgg tctgaatccc 120
gcggggcctc cggctcaggg attctgagcg ctgggagaga gaagcccgcg cttttcccgg 180
ggacctgcgc ttgagctggt gcttgtgcgg gttcgtcctg aatggtagcg attcgagttg 240
ttttctgctt ttcttctccc ccagacagtg agtttgtgga agcctcgccc gcatcctaca 300
gcccagacga gttaggtaag tctgctcatt ttgtctttta tttcttggtc gcaattctgc 360
ccgagaactg cgagtttggg gggcgtccat aggaactcag ctagggatgg ggctggggtt 420
ggagggcgga gggaaagggt caggggacac ctgctgcctt cgcggccgga accggccttt 480
cctcggcgct gtgctttcgg gggtggcagg gcaagtgtcc aatgagccgt gcgtgtgtgt 540
gtgtgtgcgt gcgtgtgcgt gtgtgtgtgt gtgagtgcgt gtgtgtgcgt gttcgtctgg 600
ggcagtggtg ctgctccgag gagcctggca cagcaaactt ccagagctgg ggcttctgaa 660
acctgcgctc atcttgccgg gaggacacag cggcgactgg ttctgacttg ccaagtacct 720
ggcacgagaa ggacgtcgtg tgggtcgtcc ttaccctgaa tttaatgaag tcaggggctg 780
aaaacggcgg tgtaatcatt aaactgtaag acctaggagc tgcttccctc cctgatttct 840
attcctcagt tagcctgtag gtgtctcgag ataggacatt ccatcctcat gcctgtcatg 900
gtaagtggag atttgcgatg ggtgaaccgg gacactcttg tcaagagaca ggctgaagag 960
agagtgaaga gaaggaaatg cgaatgggca ggatctctct aactcttcct gccacccatt 1020
ctcactcggt ggcttagtgg ctctcttttt tttttcttct gctttcaagg ttagtttagc 1080
tgctactggt ctgggctatc aagtctctcc ttactgttct ttcatcacta gcctgaatat 1140
cttgccttcc taagatgaaa tgaaaggatt tattttatga tatatgttga cagtaaagga 1200
ggaggggaac tgtccacaaa cagcggttta aatatgttta tcctcagtaa cacactcagc 1260
tgtggcaccc tgtccctggt cagcttcttg tgctgggaag aatgtcctca tcaagtccca 1320
caggacctga agcaaaattc cacctcaaca ac 1352
<210> 35
<211> 668
<212> DNA
<213> 人
<400> 35
cgagggggaa gtggcttgtc agccccggct ccgggaagag tgaacaataa ggctagggca 60
gccgccccag atcgttatat tcctgggtct aataaagtca ggatcgctgc tttgcttccc 120
ccgccccaga agaataacgg tttgcaaaat ggggcaaaat gggcagaatc gcacggccgt 180
tgttgttggt gtgaccgttg ttgcacccca gtcgacatga cgttagtttt tcatttgcca 240
aattgctggt tagttgcaaa gcctaccctc ggccgcgagc actgaaggat gggagggtcg 300
agcgccgcgt tttgacagga ggaagtgcgg aggggcggag ggcgaggagg gcgtgattgg 360
ggctgcctgg tgtgtgcgcg cgcgtgtgcg cgcgtgtgtc tttacacgcg ccgcgtgccc 420
agtgttgcac ggggcgggag aagaatggca ggtagccgcc cgaaacacct cgccctgtct 480
cctttctttg ggcgaggttc ccgatcctgg caaagtgtga acaataggga gctgggagga 540
agacagtagt gatgctgccg cgggtggcgg gggttgcgcc gccgcccaga gaacctcggc 600
agtgtgcagg gaggtgcatt tcattttggc tatttccatc ccggcctccc tggaaaattc 660
ttctgtgc 668
<210> 36
<211> 497
<212> DNA
<213> 人
<400> 36
cgacgatttt tgaggccacc cttccttgtc ccgcaatccg atcgcctagt aaatgccagc 60
agtatctggg ccttgagtct ggctttgacc cggcagtatc tacaaataag ggttatcctc 120
tttcccccaa cccacgatgt atcgcagtgg gctccggcag gctgcagact ccagacccct 180
ggagcaccgg cagggcaggg ttggacccct ccccgggtgg caaccctcca ctggagtgcc 240
cttcctcatc gtcttggggt taagagttgc cgcccggcca gggcaacagc cagggcaaag 300
ggagagagaa gccgccccgg ggcgagaagg agaaaagtta gagggctgaa caggtgacgc 360
tgagcttgtt ggagcgtgtg tgctccacca cgcaagggcg cggagttcgg ccgcctcatc 420
tcccgccatc tgcgcgcccg ggggcacgtc ctctgcgata gcctggaacc cagactacct 480
gcgcctgcct ggtcccg 497
<210> 37
<211> 998
<212> DNA
<213> 人
<400> 37
gcgcctggat tgctcaagag aggtcaggga aacccctcag aactcctgag acccagagat 60
tgagggaggg gttgaggcgg agtctgcaat gggggctgtc cagcagtagc aagcagcggg 120
ccgatcctgg tggagggttg ggaggctgct gtcattttat gggtcggcag ccagagtgag 180
agtgtccctg ctgccagagg actacggcgg gctgggcgcg gggtccccgc ctctcgctca 240
ccacacagac cccgcgcctc ctctggcagc cgcggtggtg gcggcggcag agcctcgccc 300
actccaatcc ccaccctctc catccttagt cattaaagaa cagcagcgcc tggcacgttc 360
ttggaggacc ccgggcgcag aggaggaaag ggagcaggcg cagggggact ggaaaggcag 420
catgcgctcg ccaggagcaa cctcggcgcc cagggtctga ggctgcagcc ccagttcgcc 480
attgtgagcc gccgccgggg gagtccgcta gcgcagccgt gcccccgagt ccccgtccgc 540
gcagcgatgg ggcacctgcc cacggggata cacggcgccc gccgcctcct gcctctgctc 600
tggctctttg tgctgttcaa ggtaggggag ctcctccacc cctttttccc agcggtccgg 660
gcggcagccg cgctccggcg ccctcgctct gccgttggga gcggcgcgcc ccagggcacg 720
atggcccagc cgcgggaagc gcctgccgtg cagcctgggc gcacgctttg ttgtcctcgc 780
gtgtgcgtgt tcctggtggt cttgagaggt agggggcggg gggaagaata agggaagttt 840
gctccctccg gctttcgccc tttgtgctct tttatcgctg ctgaaatcca catcaaaggt 900
gggcttgttg gatcgtgctt tctcaggcaa aatgaggtca ctttcttttc tggtttccac 960
tgcaccccaa cgctgcttaa cctttccgcc ctccctcg 998
<210> 38
<211> 735
<212> DNA
<213> 人
<400> 38
cgatctgaca gcccttcaaa ccaatatact ccctatctct ctctctcccc tggttcaatg 60
acaagatctt tggccaactt ctttctactc ggaccttgct attatttcct actaggcacc 120
cacaaaccct tgcttgttaa actgatctcc ttcaagactc aagaaaagcg ccatgcggct 180
ccctcctagg gctctcctgc cctctcctca ccgatgccga gagtggttct gctggagaac 240
cgccgcgcct gcagttcctg caccttttcc cggagctgcg ccagggaatt acggacgaac 300
tggaaggggc cgagaagaaa ggtcttggcc accacctcta gctccaagcc ttttcgctct 360
ttcagacttt ggatcctccc cggggaggac ctccaggagc cccttggcag tttcccgccg 420
cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 480
cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactccttgt 540
tttctcataa tcaaggagta tggtggagct gggtcaattt caggcacagc ccagccgagt 600
caggcgaggt ccagagagac ctgactcgcc tggcagcctc aacggacttg tccccgcagc 660
cgttgcggac ctcccggtcg tcatggcgac tgtgaaatgt ggggtggggc gcatgcgttg 720
gaagccattc gcgcg 735
<210> 39
<211> 359
<212> DNA
<213> 人
<400> 39
ccgtaaagaa ccctgagcta ctactcagac gaagcccccc tccccgccaa taataataat 60
ataatggcgc ggaaactgtg ggcggtggtg gtgacatttc ccacgactca gtggcgcccc 120
cgggcggctc ccaccctccc tccggccggc gcgtctacgc agccccaagt gctggctgcg 180
accctcggat cccaagcata tctggcgatg gagcggcggc agcccgaggc acgtgttgtg 240
tgtgctccga ttgcaaaaga aaaaaaaatg catttcaaac tattaacttt tttttaagcg 300
tgcaatgccg ggagctgggg gtagacaggt gcaagcgggg gtaggcgccc cgcgcgccc 359
<210> 40
<211> 2027
<212> DNA
<213> 人
<400> 40
ccgcgattag ttccggcaga gtgatgcagg tagggatgca gatacagccg agtaggtgag 60
ctctgcccca accgtctacc caattacaag catctttcgc ctacactgag gacacatcta 120
aacacagaat ttacaattgt gcatgcgaaa ctttacactt acgttagttg cctcaacctt 180
tcccctttcc cagtatgctg cagttaggaa tgatttgttc caacacatag aaagccatgc 240
atctggtagc accagtttgg ggagaaatca gaagcagcaa aatgtttcct ccttgtaaaa 300
tgtgttgctt cgggctggca aattagcaac tccagagaac aaattcacgg atttgtcgtt 360
agtcattctc tccacatttc gtctctctta cccactgggt ctgggttctt ctgggcattt 420
agcacacaca acacatagtt gcacttcttc agctcaggga tattttccac agcagcatgc 480
ataccatttc catccgatgc caatactgct taagtctcta acttcttgta ggaaacgtca 540
gagttgcggt gatgatgatt ctctgacagc tatccgggtg acagttgccc gaaaaattcc 600
taatcggtta tctcttgcgt gcttcagaga ctctgaggcg ctcctttccg tctcgcgtgc 660
tctccctctc tcccttcccc tctgcccctc tctccttctc cctctcctct ctctgaactg 720
aatttcttga tataactctc aataagccca gagggagggc gtgactgccc aggccccgcc 780
cccgggctct gattggcctg catcttgcgg cgcgggcggc cgcagcccgg cgcgagggag 840
ggagcgcgga acaaggcgct gactgtctcc cagcctcccc tcctccgcgc cccctcggca 900
gcagcgaaaa cccggaaatc tgatcctggc cccaggagag ccgggttcca tgaggtgcac 960
tgagcatgct ctgcagggtc cggcgtggga gggacgcgct ggcgctcccc aggcccgggc 1020
ggaagcggcg ctcgcaggcg ctgaaagcga gcgaccctct gagcccgggt ggtccggcgg 1080
gcaagggcgg cgcgggagac ccgcagggcg cgggcgcgga tccggggaac cagggccacc 1140
gctgcgggcg gatgggggtc accgaggcgg ctcgtctcca ggcgcacact tcgcacatct 1200
ctttgctaag tgaaggggcc aaaatgcaca gatgggggag tctacccagg aacagaggcg 1260
cgagacgtat agccacccct gggttgggag cacgagccag cagatccccg gagcgcgtta 1320
aacggacaac atgcccggtg ctgcaaatag aggcttttgc tggcagggac attggaaaga 1380
agggcggaga gggagtacag cgaaaggtgg ggaccgcaga atttggaatc tctgcggaga 1440
ccggaaagaa aattaatcgg agcacttcct acatgcagag ccacggaaac tgccttggaa 1500
agagaaagtg gcagcgtctg ggtcccctcg gtcagcccgg gccagtcggc tgcgcgtgcg 1560
aagtctcctc tagcggagcg ggaccggccg cggcggtgga tcgtggcggt ccctgcactt 1620
ctgctccagc cgcgcctgga aacctgagcc cggactcgcg gctgctgcaa aacccgcttc 1680
cagcccacct cactgcgaac tttgcttccg aggggctgga aggagtccca ggcagctgtt 1740
tcccaagctg tggaacactt cctttcccct aggcactttc tgctgattcc aactttcttt 1800
cctgtgattt tcgtcttttc ccgtgcattt catttctccg actccagctc tgtactaaat 1860
cctcacaagt ttctcgtttt catacgggaa ctggatggaa tgactcccca aaaaatacag 1920
ctttatttct caaatactga cccccaaagc actatctagt aatatatttg attgatcttt 1980
caaagtcagt aaaccacaaa ggtttgtgta atggcttgta cttaacg 2027
<210> 41
<211> 144
<212> DNA
<213> 人
<400> 41
acgtacaggg cggtgatcca gtatctaaat tctttgggag aaaatgaata gttcccccgc 60
ccccgccctc caggaaaaaa aaaaatctga gaatctgaga atgttcagcg cacccgcgaa 120
tttgcatcgg aggtgcgttt cccc 144
<210> 42
<211> 604
<212> DNA
<213> 人
<400> 42
gcgcgccctg gcggctccga gggacctggg ctcgggcttg cggtcgcgtc gcctgggctt 60
tccctgggct gggagcgcgc cgggtctccg ccttgcacgc tgtcaccgcg ggagacgtct 120
cggcctcgcc gcgcgcagag gggacgcgcg gagaggctgg tttctgggcg agcggagagc 180
tttgcccatt aagctgccgg aagaagccaa atcaaaaagc caatctccaa gcctccaaac 240
ggaacgtcac cctatcagct gggagacagc gccgcactga ctgacaagcc gcgcatattt 300
atcctcgcgc gcggagggga gactctcaga acgctcctcg accagcagcg aggaagtcga 360
gcccgcatcc cgcatcccgc atcccgcatc cagagccccc gagggacgaa ttcagatcca 420
acccctgccc cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc 480
ggcagcacgt caaaacggcg gcgcgtcctg acctggattc cgccgagttg ggagctccag 540
gcagcaggcg ggcgcgcggc accggctttc cccttgtcct caggagacgc tgcctgcaat 600
tccg 604
<210> 43
<211> 233
<212> DNA
<213> 人
<400> 43
cgcgagcggc tgggtgtcgg tgccctgctc tcctctgggc gccaggatgt tcctgcccag 60
tgcgtgtcca gaatagccgc tcagacaccg gctccaggtt cagccaggcg gggcgcgtcc 120
ctgcctccct cccctttgcc tgccactgcc ctccttctaa cgagggctca gctccgacta 180
ccccaggcct ccggggaccc tctccggatg cgctccccgc tttgcgcttt gcg 233
<210> 44
<211> 261
<212> DNA
<213> 人
<400> 44
acgcaagttc cccctgactg ggggacgccg cccagctcct ggagcctgcg aaggctcttg 60
aagctgagct tcccagggat accagaaggg acactctcgt gcaattccgg ctagggaaag 120
cgagggaagg tggcggctcc gggcagggag cgagcgagtg ctccacgccg cccgcaggat 180
cgagtgagtc acgcggccgc cagacgaggc cggtggcgca cgcacccgag atccgatgta 240
gtgcaccgcc tcggcgccgc g 261
<210> 45
<211> 47
<212> DNA
<213> 人
<400> 45
cgctcgttgc gacccaggct cagctccgcg gtgcgcaggg cctggcg 47
<210> 46
<211> 335
<212> DNA
<213> 人
<400> 46
ggcggccgcc agctgggagc ccaccaccgc tcgatggtac cgaaccgacc cgtgtagccc 60
cataacccca gcccaactcc gaggagctag cgcagaccgc tctccgccct cagctgcggc 120
gaggcaaggg ctggcagcgc tcggacgcct ccgtcttgcc cttcccatgc ctaagcgcgg 180
ggaattacac gttcccggtg tagaacagac gatcggggct attagggctg ggcggtggga 240
gtgggggttg ggagcaccat ttttggctgg acgtgtgtcc agactcatcg tctctggtcc 300
ttaggacccc atcttcctct gcatctccag gtgtc 335
<210> 47
<211> 317
<212> DNA
<213> 人
<400> 47
cggcggctgg ccaggggcac agagacgcac tccacacaga aacccaggct ggcggggtgg 60
gcggccgggg agccagccct gcagatgtta ctaagtgaaa cctgatgtgg tgacatgaga 120
atccacagaa cgtctcacaa acaacctgcc ccgggatgtt ttggattgag ttttgtggtt 180
atgacgtgaa gaaacctcac atgtcaggat aaaaataacc ctggcttcag tacataacgc 240
gagttacagt tcaacagaac cagatgtgaa aacgtcagcc acccagttca ggcccagcag 300
ggtccctgct ccactcc 317
<210> 48
<211> 235
<212> DNA
<213> 人
<400> 48
cgggtctgga agattgcgct acgggagttc tccgtctgag aggacaactc agctttcgca 60
cgggagggtt gatgcttaac agaattaaaa atatatgtat taagaaccgc aagcccactg 120
tgtgccagcc gccgttggta gttttacacg tgcgatctta tttaatactt cctgggacct 180
aatgagtcag gtgccatcat gatccgttta caggtaagaa agccgccgct cagcg 235
<210> 49
<211> 81
<212> DNA
<213> 人
<400> 49
cgaatcgcac ctcttctcct gtcctaatct caggctccag gcctggcttg cagtttctgg 60
ctcaccgcgc tgcggtcacc g 81
<210> 50
<211> 24
<212> DNA
<213> 人
<400> 50
cgcccccgcg gaaaccgctg ctcg 24
<210> 51
<211> 236
<212> DNA
<213> 人
<400> 51
gcgaggccag actgccccca cacctcctgt agccactgag cgcgaagtgc gttggttccg 60
agcgcgctgg tgggatccac aaagctcgca ttctctcagg aatcccctga gaaattaact 120
gtcccttgcc caacatgtct tctccaggct gtctgctaga gcctcaggcg cctccgccct 180
ccctcccgcg gcaccgtcac cagtgggtag tcacagcctc ccggagccca tagccg 236
<210> 52
<211> 533
<212> DNA
<213> 人
<400> 52
cgcctccgcg ccgcgcgccg ccgccgcctg gtaccgcccg gccgggagaa ggtgagattc 60
gcgcggcctc gcgcacaccc gcggctggga gctcgggact gcggtgacgg gaggggcagt 120
gtggtgaccc acccaggatt tttttttttt tcccgtgaaa gtcctcaagc ctgtcctctc 180
cctggcccga tcctattgca gcgacagaaa atcagcagcg ggcgggtctg tgtggacctg 240
agggccgcgt ggggaccgag gggggctgtg gcccaaagag tggcagtgag tggcgtcaag 300
gaacccacac tccgcatctg ccactcctag agccgggact agctcccgat cctagcagtt 360
gctctcgaga tcatcccggg agttattggc gagttctggg cctctggagg tttccctgtc 420
agcctccccg gccgccgagg gggcgcgcgc ccaacaaggg ggtctctagc ggccacctgg 480
ggacagaaac agtgaccctg ggcgcgcact ttgcctcccc gttagagatg tcg 533
<210> 53
<211> 280
<212> DNA
<213> 人
<400> 53
gcggaagccg cgagggatgc agcggcgggg accttggccg gtggaggatg tggaggtgga 60
agtggagcgg atggcgctcc ccaagagctc cgccacgcga ggtttcgggc tcgtggtttt 120
gcttcctccg ggtccccgct ccagggccgc tcggcgcgac gaagacgccg gggacagcgc 180
cgcggggagg gcgctccggg tcgtgcgtgc tgcacccaca aagagcagca gtcccgccac 240
tccgcgcctc cgctgcgtgg gggccgaggg gcgcttctcg 280
<210> 54
<211> 535
<212> DNA
<213> 人
<400> 54
cgacatagtc aagcagggct acgtgaaaat ccgcagcagg aagcttgggg tgagtggctc 60
gctcggcttg ctccttcccc ggcgctcgtt cggcccggct ggctgcctgg ggggggggca 120
gggagaggtg acccgtgcgg gtacagggca gagagggacc cggcccttag gcggatggcc 180
cgcttgttgc ttggccaggt gggggcccac acctgccggg gggctccgca gacggacctg 240
gggactccag gagcgcctga gtccccatcc tcgagtgcac cgggctgtct tcgaccgtgc 300
ggggaagtca gtagacgaaa ggggttgtca gttccaacga ggaacgtgcc ttggaggagg 360
tttctttgcg gtgctatcca cgatggtctg ttctcaaaag tgtgcgcctt tcgggtggaa 420
ctgctgtgtg tggcgacgct cgcgtgtgtt tagaatcacc attttctggt ctccgcttcc 480
caagctcaat tcgaaattcc cgtctgatgc cctcccagcg ccgcgcgtcc ctgcc 535
<210> 55
<211> 69
<212> DNA
<213> 人
<400> 55
gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg tcccgaagcc 60
ccctaccgc 69
<210> 56
<211> 1211
<212> DNA
<213> 人
<400> 56
cgtaaataaa tgagatttac acaaatagcc attcacaatc atggtcacag tcacctacaa 60
accccattta cacaaatgat caggcacaca atcacactgt cactaaagca cacccacgca 120
ccaggtcgct gtcccaacag taacacacag cccaaagaga aaccctactt cctcacgcat 180
tcaaaacaca cccacctaag ggctgatccc gcactcagag gcctaaaact atagacattc 240
ccttccgcgg cactggtgag ccaggatttc ttaccttcag cattctcagg gaaggctctg 300
gtccaagctc tgattcggat tccaagcgaa gccacacgcc cagctcttcc ttctccaccg 360
gcccgggaca tccttacctg cctctacccg gagaccattc ctgcgaggct cctaccggaa 420
gtagctgtgg acagcagtgt cctctgggaa atgcagtccg aggggagagc gcctggggtg 480
gagcgggtgt gttccgccgg gctccgggat gcacttgcgc agtttcaccc gaggctggag 540
tgacgccaac ctgttaatgt tcgttttcgg attctggact tcgggttccg ctgaggacgg 600
atttcggaat aggcacagtg gctgccccga acccctcaag gcggcctccg cgggctgtgg 660
ctgaagataa ttttcggcgg gcgcggacta acccggcttc cctttgtgga gttgtggtga 720
gaaaggtgtt ttgttgtgcg cgtgtccgaa ggtgactccg gaggagaagg tggatatgaa 780
ctgacggtga gggtgtagcg cgtgagattt gtatgtgaaa cgatttaaaa aaaaattttt 840
tttttggccg ggcgcggtgg ctcacgccaa ggcgggcgga tcaccgagac cagcctgacc 900
aacatggaga aaccccgtct ctactaaaaa tacaaaatta gccgggcgtg atggcgcatg 960
cctgtaatcc cagctactcg ggaggctgag gcaggagaat cgcttgaacc cgggaggcag 1020
aggttgcggt gagccgaggt cgcgccattg cactccagcc tgggcgacag agcaactcct 1080
tctcaaacaa acaaacaaaa ctgtatgtca tatatttgac tccatttatt tatttattta 1140
gagacagagt cttcttgccc tgttgcccgg gcaagaaaaa acaaacaaca acaacaacaa 1200
aaaactgtac g 1211
<210> 57
<211> 317
<212> DNA
<213> 人
<400> 57
gctgccgagt ccccgcagca gggggcgagc aagggactcg cggttgacgg gacacggatc 60
ctctaaggcc cagagtgtcc cgagtagcgg cagtggggag tgctcagggt acgctaatgg 120
tgagtggttg cagttgatgg gacaaaaaac tgtgatggga gttagtgtgg gtgtgtggtt 180
gtgtgtgtga gtgtgacggc acgaataatc tgatggggtg attgtgatat ttggttgcgc 240
gggattatga tgaaatgtgt gatatgtgtg tgattatgat taaggctgta gcgagtgtga 300
acgtggcgaa gtgtgcg 317
<210> 58
<211> 328
<212> DNA
<213> 人
<400> 58
tcggagatgt gcgggctgca tgcccacgct tcaccgctag gggaggtcag ggctgtgcga 60
tggggaagga agagagtgtc ggggcggtgc agtcgggatg ggagaagggt gtcagggcca 120
ctggccccca gctcggcaga gggcagtgtc gggccgcgcg caggcaggga gtgggtgtgg 180
tgtgaggctg gcgctggagc ggtctgggaa tgttaggagg tctagggtat cgcggccctg 240
cgtcctcttg tctggactaa aagtccgggc agttctcccc ggacctggat tgtgggccca 300
gcgacaggtg cttggcgatc tgtgcccg 328
<210> 59
<211> 303
<212> DNA
<213> 人
<400> 59
cgcctgggat tgcgaggtag gtaccgcctg cctgtgtgta ccggggctgc tgtctccggg 60
gaggggcttc tggcggacag gagaaccaag cagcctcagg agctgcctgg gtgtgtgtgt 120
ttctgtgcga gtgttgcata tctctgtgtg tgtttctgtg caagtgttgc atgtctgtgt 180
gtgtgggggg ggtggtgtct ggtgaaaaga atgtgtctcg tgcggtggag cgccgtttct 240
ctgtagtccg cgggctctct tatgcgccct cttgtggtcc caagtgtgct tttcttgttt 300
ttc 303
<210> 60
<211> 248
<212> DNA
<213> 人
<400> 60
gtgtgcgtgc ttctgtgcgt gtgtgtgtgt ttgtgcgcgt gcgtgtgctc atgcacggcc 60
ccgtggcagt gctgggtatg agctcttgcc ccagacatgc ccctgcctgc tccctgccag 120
gatctgggga gatggctgta cctggcagcc ctagggtgca gagcagagtg ggcagccgtc 180
cctcgggact ctcagctgcc cacttcttcc cacagtgcct ggccatgcca ggctgcccag 240
aggggcag 248
<210> 61
<211> 221
<212> DNA
<213> 人
<400> 61
gtgtgttcga gtccctgggt tgcttcctgg ggtctgtggt gctgggtgtg ctatctgcgt 60
gtgattctct agcgagagat tgtgggcgag tgaccgagtg ggcaaggggc cgtcactgtg 120
tgtgcgtgat tttgacagtg tgtggtggta gcttctgact ccgcgtgggt cgttgaatgt 180
atgactggga ccgtttagcg gtggatacac aactgtgtgc g 221
<210> 62
<211> 150
<212> DNA
<213> 人
<400> 62
gcgtaatcac gcactgcgca ggcaccgccc gctctgctct aaggtccctc tcactccttc 60
agcagcccga ggacaatccc ctcaacacta ggccacgcct tgtctccgcc cctctcgtcc 120
gacccctgga gagaggctgg cgcctgcgcg 150
<210> 63
<211> 237
<212> DNA
<213> 人
<400> 63
ccgcccgggg ctcctctgtc ccagctctgc ggcccagggg gtgacgtgat ggcggcagcg 60
gtgctgacgg accgggccca ggtgagtgga cggtggcttc gcggttgccg cttccttgcc 120
agcgctgagg cggtttccga agtgggtggg agcccaggta tcccctggat ttgtcttcgc 180
agtcgtcgtt cgctttggtg tgtggagctg gtttgccact taatttatac ctggccg 237
<210> 64
<211> 129
<212> DNA
<213> 人
<400> 64
cggtctcctc gtatccatcc tcgcagtccc caccccaaac taatgttctc ccctgagcaa 60
atttcgagac acttaaaatc ccagctaaga tcacgtcctt ctattcaaaa ccctcagtta 120
atctcaacg 129
<210> 65
<211> 848
<212> DNA
<213> 人
<400> 65
gcgagttcaa tgtcctccgt tccgtcaagt ttgggtttga gctttgggct cagctgccgt 60
ggtctggaga cctcgtaggc actctgcaag atgcctcgtt ctgctgcatg cttggggagg 120
aagttgagct gggtgctgga agttctgaac ccagcatgcc ccgggccgga ggagatttgc 180
ttggtgtctc cttagcgtcc cgaacaccgc gcgcccctgc tggggtaacc tgaacagctg 240
gacccctcaa ctcgatcttt attatcagca ttggggctcc agattccgta cacatctcta 300
gctctattca ttcttcctag gttgagaacg gacgcattgg gagtcctacg cccgggggaa 360
aggcaggaga ggggaggaag agaacctgtg cccctggaag ctagaggaga gcctcgctct 420
ctctgctgct ctgggttccg caacgaattg agttcgggtt caggcggctg gagcgggcgc 480
ggggaggctg aacaatcgcc ggaggcccag gaggggaggc gaatgtacac aggctaagtg 540
gccccactcc aggacaagtg gccctctaag tcggctcagt gtttacctgt ttactttccc 600
aggtagctca aacacgagcg ccttttctgc gctccagggc acgggggccg cccagaggca 660
ccctgctttc ccggcttctg ccctcccacg cctcagcttt acgccccctg ttgtgggggt 720
gcgctctaaa caacagcaaa ccaggcaaga aaggaagata caggagagca ggcgaggcct 780
cggcacaccc tacggagggg agcctttctt gtgcctgtgg aagaagtggg ctccgtggac 840
ggcatccg 848
<210> 66
<211> 79
<212> DNA
<213> 人
<400> 66
gcgcctggag gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg 60
agccgcagag actggcggc 79
<210> 67
<211> 2225
<212> DNA
<213> 人
<400> 67
cgggccttaa ggaatctcag actgcacagc tctgctgtct cattccaggg gtccctgggg 60
tgctccgctc ttgccaattc cgggcacaag gaccacccac tctgcccagc agcctctggc 120
cccactccca ctgccccagc gaaataagtt ccagcttcca ggcatgattg attatttgga 180
acagagcctt ccactccgga ctgagaccca acccctgcag aaagtcctaa actgggctgc 240
gaccactttg ctcccaggag cagaggagca ggggaaaagg ggagaattct ttaaaaaatg 300
acacgcgaga gagttaaaga aggaaaaagg caccaaagtg atgaaacaaa aagaactgga 360
gaataagcac tgcacagaga gaaggccgta gcaggaagga ccggcagtga ctttcaacag 420
tgcttgagag cagaattatg gccgcgagag ggagtgcaaa ctgggaggcg gggcaaaccc 480
gggaaagacc tcccaagcag gttctgcgaa ggggccccac cgccttcagc ccgcctgggt 540
cagccttata agggggaaag gggacagaag tctgcagaac agagatccta gcgtagccgc 600
tcagggtacc ttcccaggtc accattgctc ctctgccctc tccacatccg ccctcccgtg 660
agcgcaggat gcacgcacag gcagcggtta caaaactcag cgcaacgttg caacccgcac 720
aaaaggcgca cacaaaatca ttaaaaagaa atacacagag tggaaagaac tcgcacaagc 780
tccaactcgc taaaggtgga aggagtcagg ttacaaactc tccctccccg gcctaaatgc 840
tttgctttag tttgcagaaa atcgtttgtc agtttttttc ttggttattc attattcggg 900
caaatgcaag tatgttttct agctgagttc accaatccaa acctcaaacc acattcctcc 960
actccaggcc tccgttctgt ccgcggactt atgatcctgc ctgccagcag gagtctaccc 1020
tgaagtcgcg tgggatagat aaagtgagga gaggaggatg aatggacaga caaacgagag 1080
caattcttct acctgtgggc tgtcctacgc cttgcagtgc cgggtcctgc ggcgaccact 1140
gagccccttc gtcctcgccc tcagtccctt cgtcctcgtc ttcggtctcc gctttcccag 1200
tcggccgggg ctcgtcgtcc acgaccccgc acgtgccgcc gacgtcgccc tgccgattcc 1260
gccgcaggag gtggaactgt agtggtgccg gcggcttctc ccctggggcg gcggtggcga 1320
ggcgctcgct ggcggcgggc agcggctgga tgaaatacgc ctcccccagc aggtagaagg 1380
cgccgcgcac gccctcgcag aggctgaggg cggcagccga gctgggatcg ccattcacgg 1440
tgccggagta gaagcagtgc gccaggtcgg tttccggaag cggcgtctcg gacccggatt 1500
tgcgccccac gttctggagc gtgaagccgg gcgccaaaaa gctgctgtcg ggccgcagct 1560
ccagatccag ctgctggtca aaggcgtgca ggcggaggcg cgtggtcccg tgtcccgggg 1620
cgcgctccag ctccggcacc actagctcct cgtcctcctc ggaggggcgc ccgagtgcgt 1680
ccgacacggc cagtagcgcc gcggcgagca gcagcagcgt gggtactggc ccaaagctcc 1740
gagaccccgg agcccgctcc gcgttcccca tgtcgctgcc cagcttgcgc cttccgaacc 1800
cctcgggcac agctcgctgc attggagccc caggagacac cgctcgtagc agcgcacgga 1860
gcgagggacc tttagttcgg gtcgggagag caaagcctcg ttggcctgct ctggattgtt 1920
aaaattaaca atttctatta ttcgttggaa gggcgcgcag agccggctac agccgaagct 1980
cccggagtca ctaaaaggag gcgctgcagt tctgccggcg cgcgggaagt ttttcttcca 2040
gcgcaaagtt ggagacactg agaggcaggc gcaggcagag tggctctgct gggacaagaa 2100
gcgctctggg gcgcctccgg ggctgaggca acgcggagat tggtgcctgg cgcccctctt 2160
cggcctccgc cttggctgcg atgttgctca ctctgctcag ggctctcccc tctccgtccg 2220
gtagc 2225
<210> 68
<211> 997
<212> DNA
<213> 人
<400> 68
tcgaactaat ttaatcagat gtaaaattaa tgagaacccc gagacttccg acgtcccact 60
ccagaactcc catccaggtg cggtcgggag ccacagcttc tgaatattcc ttcggaactt 120
ttttctcact tgattcccaa gcctgtcatg gggttctttt tcaatggcac tgacctgcaa 180
ttacccaacg agcagcggga cagccccggg caggacgcat cctgggtggg tgacgtgatc 240
ccgcagtctc ctccccgacc ccatatccca tacaatgatc ctcgcttaca gaagtcaagg 300
gggaaagatg acgctttcaa agcccgaatc tctttaccct ggagccagaa ccagcgtcgc 360
cgccgtcccc tgcagctcag ccggcaacgc gcgccgagcc tcggggcgca gcttggagac 420
gcgcttgctc gttctgggaa ggggcacggg acgcacggtt ccccggcccc agctgcacag 480
ctcagctcgg ggctctcacc tatcctcgtt cagagccaca ttcggctgcc tcccctgacc 540
acccgacaca aagagattcg ccggtggaaa gaatcgattt caaaattcaa gctcaccgct 600
gctcaacaag gcgcgcacgt ttctccccgt ctggcttcac atgtcccaaa cttccagtaa 660
cagaaatgag gaagcagcag ccttccccgg ctgctggcgg aggcagtggg tgtaacttgt 720
gaagtttcgt gctatgatga atctggtcac ttgggtgtgt tggagagggt tggtcgctcc 780
tcccttcctc ctcccaccat cacctccctc ctctccgcct ccctctccaa tttaattctt 840
ccctctggca ttcgccggct gtcactcaga atcccagcac cctccccacc acatccttgg 900
gggcaatgta tttcgaaaag gtcttaacca ttttacggat gaacctggtc accctgcaca 960
aagcgtgagt gcttgtcaaa taattttcta cagcacg 997
<210> 69
<211> 284
<212> DNA
<213> 人
<400> 69
gcggcgcaag atcaacagcc gcgagcggaa gcgcatgcag gacctgaacc tggccatgga 60
cgccctgcgc gaggtcatcc tgccctactc agcggcgcac tgccagggcg cgcccggccg 120
caagctctcc aagatagcca cgctgctgct cgcccgcaac tacatcctac tgctgggcag 180
ctcgctgcag gagctgcgcc gcgcgctggg cgagggcgcc gggcccgccg cgccgcgcct 240
gctgctggcc gggctgcccc tgctcgccgc cgcgcccggc tccg 284
<210> 70
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 70
gcaccactag ctcctcgtcc tcct 24
<210> 71
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 71
ccggcgcgat tctccctcaa cg 22
<210> 72
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 72
gtgcgcggcc caagagaagg 20
<210> 73
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 73
tggggtcgta gtggtttccg aggt 24
<210> 74
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 74
gtggaggatg tggaggtgga agtg 24
<210> 75
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 75
gcatctatgc gggcatggtt actg 24
<210> 76
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 76
acctctgccc cctgtccagg ta 22
<210> 77
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 77
ctagggccga cttttccatc tcctc 25
<210> 78
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 78
cggcgctttg cttttctaca actg 24
<210> 79
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 79
tggagaagta agtgggaggc ggtgt 25
<210> 80
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 80
gaaaagcgat gactgccctg aactg 25
<210> 81
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 81
ccagcagcca acccctacga cttc 24
<210> 82
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 82
actgaagctg cggccctgat ct 22
<210> 83
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 83
cgcccgcagg atcgagtgag tc 22
<210> 84
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 84
tgagaagtca gacgggccgc gtaa 24
<210> 85
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 85
cgggctgggg ttggaagagt aac 23
<210> 86
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 86
ggctccgaat cgcacctctt ctcc 24
<210> 87
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 87
agggactcct ggccttgcgt ctt 23
<210> 88
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 88
ctcagttacg ctgactcggc tgtg 24
<210> 89
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 89
cgaggatgtg gatggcgcgg atg 23
<210> 90
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 90
ctgcattgag gccgggctgt gt 22
<210> 91
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 91
gcgacgcgtt tccctggtta cct 23
<210> 92
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 92
tctaacgagg gctcagctcc gacta 25
<210> 93
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 93
gggatgggga gtagagggag ggg 23
<210> 94
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 94
gcgaggtcat cctgccctac tcag 24
<210> 95
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 95
gccttctctt tgcgccacgt tcg 23
<210> 96
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 96
agagtgagag tgtccctgct gcca 24
<210> 97
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 97
cccactccaa tccccaccct ctcc 24
<210> 98
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 98
aactccgagg agctagcgca gac 23
<210> 99
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 99
gcctaagcgc ggggaattac acgt 24
<210> 100
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 100
aaaagccaat ctccaagcct ccaaacgg 28
<210> 101
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 101
gcggccaccc accctagtcg ttg 23
<210> 102
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 102
gctctgcctg tttgttccgc cc 22
<210> 103
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 103
gagcttggag atgcgaggga aact 24
<210> 104
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 104
gcctcggcgc ccaaaatcga aagg 24
<210> 105
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 105
ggagcgtgga cttcttgggc cg 22
<210> 106
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 106
ttcggattct ggacttcggg ttcc 24
<210> 107
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 107
ggtaggtacc gcctgcctgt gtgta 25
<210> 108
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 108
ggagtgggtg tggtgtgagg ctgg 24
<210> 109
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 109
ctcgcgatgt ttcagggtga gcc 23
<210> 110
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 110
gtctcggagc tttgggccag tacc 24
<210> 111
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 111
gaggcagcgc gactccaaga ctcag 25
<210> 112
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 112
gggacgtaga caagggcagg cg 22
<210> 113
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 113
tcagcgccgc cacctacagc ac 22
<210> 114
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 114
gacccggagg aagcaaaacc ac 22
<210> 115
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 115
cgtggacctg gctgaggagc tg 22
<210> 116
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 116
acagcctcgg tcaccgcatc 20
<210> 117
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 117
gagtaagctc aaagcggctg caatc 25
<210> 118
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 118
gcagtcagcc cgaccctcct 20
<210> 119
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 119
acttagccgc ccatttcaga gcagc 25
<210> 120
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 120
ggaaggcagc ggactgacat ctg 23
<210> 121
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 121
ttaggactgc tggacgaggc gccg 24
<210> 122
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 122
gagggctccc aggtctcttg tttc 24
<210> 123
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 123
aggcggtgca ctacatcgga tctc 24
<210> 124
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 124
ctcagatggg agcgcggcag gaacag 26
<210> 125
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 125
atccctggac tggcgtatcc acag 24
<210> 126
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 126
tcctgggagt gtgggccggt ga 22
<210> 127
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 127
tctgtttcag cgcaactgtg aagtg 25
<210> 128
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 128
cccaaccacg cagtcataaa taacc 25
<210> 129
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 129
ttcctctcgc cgctctctcc actg 24
<210> 130
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 130
agttgacccg ccgccagtct ct 22
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 131
accccgcgct gctccgtaga 20
<210> 132
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 132
gaccccaggg aacaggcaaa aag 23
<210> 133
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 133
cctaactccg tcccgctcgc tgtt 24
<210> 134
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 134
cagcagcgtg gctatcttgg agag 24
<210> 135
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 135
tgcgcgacgt ggaaggagaa atga 24
<210> 136
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 136
gcggggtctg tgtggtgagc gag 23
<210> 137
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 137
gtcctccaag aacgtgccag gcg 23
<210> 138
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 138
gcttaggcat gggaagggca agac 24
<210> 139
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 139
cactcccacc gcccagccct aata 24
<210> 140
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 140
aggataaata tgcgcggctt gtcagtca 28
<210> 141
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 141
cgccgttttg acgtgctgcc g 21
<210> 142
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 142
gcggcttggc gggctatctg tg 22
<210> 143
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 143
cccccggccc tcctgtatta ct 22
<210> 144
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 144
agtcagcgct acgggaaagg aaacc 25
<210> 145
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 145
ctgcacggcc ggagaagcga at 22
<210> 146
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 146
gcccgccgaa aattatcttc agcca 25
<210> 147
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 147
ctgaggctgc ttggttctcc tgtc 24
<210> 148
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 148
ggccgcgata ccctagacct ccta 24
<210> 149
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic primer
<400> 149
aacacacgaa cagcactcct ccgc 24
<210> 150
<211> 158
<212> DNA
<213> 人
<400> 150
gcaccactag ctcctcgtcc tcctgtctcg gagctttggg ccagtaccgc accactagct 60
cctcgtcctc ctcggagggg cgcccgagtg cgtccgacac ggccagtagc gccgcggcga 120
gcagcagcag cgtgggtact ggcccaaagc tccgagac 158
<210> 151
<211> 137
<212> DNA
<213> 人
<400> 151
ccggcgcgat tctccctcaa cggaggcagc gcgactccaa gactcagccg gcgcgattct 60
ccctcaacgc ttgcctggag catccctggc cccttttgcc caggtcgcgc ccctgagtct 120
tggagtcgcg ctgcctc 137
<210> 152
<211> 133
<212> DNA
<213> 人
<400> 152
gtgcgcggcc caagagaagg gggacgtaga caagggcagg cggtgcgcgg cccaagagaa 60
ggccagcggg accacagcgc ggctacgcgg ccggccgcag tcttcaccgc gcgcctgccc 120
ttgtctacgt ccc 133
<210> 153
<211> 174
<212> DNA
<213> 人
<400> 153
ggggtcgtag tggtttccga ggttcagcgc cgccacctac agcactgggg tcgtagtggt 60
ttccgaggtt ggtgaccacg tcgtcgaact tgagcacctc gtagccttca tgctgccgct 120
tgaggccggc gtagaaggcg atcttgggca ccgtgctgta ggtggcggcg ctga 174
<210> 154
<211> 140
<212> DNA
<213> 人
<400> 154
gtggaggatg tggaggtgga agtggacccg gaggaagcaa aaccacgtgg aggatgtgga 60
ggtggaagtg gagcggatgg cgctccccaa gagctccgcc acgcgaggtt tcgggctcgt 120
ggttttgctt cctccgggtc 140
<210> 155
<211> 145
<212> DNA
<213> 人
<400> 155
gcatctatgc gggcatggtt actgcgtgga cctggctgag gagctggcat ctatgcgggc 60
atggttactg cctctggtgc cccccgcagc cgcgcgcagg taccgtgcga catcgcgatg 120
gcccagctcc tcagccaggt ccacg 145
<210> 156
<211> 153
<212> DNA
<213> 人
<400> 156
cctctgcccc ctgtccaggt aacagcctcg gtcaccgcat cacctctgcc ccctgtccag 60
gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt tcagacaccc gggcgcggcg 120
cggggccctg atggatgcgg tgaccgaggc tgt 153
<210> 157
<211> 164
<212> DNA
<213> 人
<400> 157
ctagggccga cttttccatc tcctcgagta agctcaaagc ggctgcaatc ctagggccga 60
cttttccatc tcctcctcta cctccggctc ccgggcgagg gaggccccgc gccgcccctt 120
agactggctg cggccggaag attgcagccg ctttgagctt actc 164
<210> 158
<211> 156
<212> DNA
<213> 人
<400> 158
cggcgctttg cttttctaca actggcagtc agcccgaccc tcctcggcgc tttgcttttc 60
tacaactgga agccgcgaag gcggctactg cgctgagccg ctcgctctgc tggtcaagtt 120
tgggcgaccc gcgcggagga gggtcgggct gactgc 156
<210> 159
<211> 133
<212> DNA
<213> 人
<400> 159
tggagaagta agtgggaggc ggtgtactta gccgcccatt tcagagcagc tggagaagta 60
agtgggaggc ggtgtcggga actgactcct cttaaaacgg tcggcgccgc tgctctgaaa 120
tgggcggcta agt 133
<210> 160
<211> 155
<212> DNA
<213> 人
<400> 160
gaaaagcgat gactgccctg aactgggaag gcagcggact gacatctgga aaagcgatga 60
ctgccctgaa ctgctggggc gttcgaaatt tccagggtcc cgaccctccg tggggtacgc 120
gcgacttcgg cgcagatgtc agtccgctgc cttcc 155
<210> 161
<211> 126
<212> DNA
<213> 人
<400> 161
ccagcagcca acccctacga cttcttagga ctgctggacg aggcgccgcc agcagccaac 60
ccctacgact tcaggaggct cctgcgcaaa acctcccagc gccggcgcct cgtccagcag 120
tcctaa 126
<210> 162
<211> 150
<212> DNA
<213> 人
<400> 162
actgaagctg cggccctgat ctgagggctc ccaggtctct tgtttcactg aagctgcggc 60
cctgatctcc gcagaggctg cctgctgcgc tcggccctca agtgcccggg ccggccttcg 120
tgctccgaaa caagagacct gggagccctc 150
<210> 163
<211> 129
<212> DNA
<213> 人
<400> 163
cgcccgcagg atcgagtgag tcaggcggtg cactacatcg gatctccgcc cgcaggatcg 60
agtgagtcac gcggccgcca gacgaggccg gtggcgcacg cacccgagat ccgatgtagt 120
gcaccgcct 129
<210> 164
<211> 156
<212> DNA
<213> 人
<400> 164
tgagaagtca gacgggccgc gtaactcaga tgggagcgcg gcaggaacag tgagaagtca 60
gacgggccgc gtaaggggca gagcgagggg tccggcatca ctcgcgcgct ccggaaaccc 120
gcgtgagccg ctgttcctgc cgcgctccca tctgag 156
<210> 165
<211> 151
<212> DNA
<213> 人
<400> 165
cgggctgggg ttggaagagt aacatccctg gactggcgta tccacagcgg gctggggttg 60
gaagagtaac tcgggctgcg ggctgaacgc agtcggcaac cgcggaagag cagcatctcc 120
cctgcgcctg tggatacgcc agtccaggga t 151
<210> 166
<211> 148
<212> DNA
<213> 人
<400> 166
ggctccgaat cgcacctctt ctcctcctgg gagtgtgggc cggtgaggct ccgaatcgca 60
cctcttctcc tgtcctaatc tcaggctcca ggcctggctt gcagtttctg gctcaccgcg 120
ctgcggtcac cggcccacac tcccagga 148
<210> 167
<211> 130
<212> DNA
<213> 人
<400> 167
agggactcct ggccttgcgt ctttctgttt cagcgcaact gtgaagtgag ggactcctgg 60
ccttgcgtct tgggagagcg cacgctggcc tgcgctacac acacacactt cacagttgcg 120
ctgaaacaga 130
<210> 168
<211> 145
<212> DNA
<213> 人
<400> 168
ctcagttacg ctgactcggc tgtgcccaac cacgcagtca taaataaccc tcagttacgc 60
tgactcggct gtgcccgcag tgtcgcgctg tcgcgtagcc aggtgtcgcc gggctggcgc 120
ggttatttat gactgcgtgg ttggg 145
<210> 169
<211> 114
<212> DNA
<213> 人
<400> 169
cgaggatgtg gatggcgcgg atgttcctct cgccgctctc tccactgcga ggatgtggat 60
ggcgcggatg gcgcggcctc cacctgcggg cagtggagag agcggcgaga ggaa 114
<210> 170
<211> 121
<212> DNA
<213> 人
<400> 170
ctgcattgag gccgggctgt gtagttgacc cgccgccagt ctctctgcat tgaggccggg 60
ctgtgtaaac tgtagggtgc ctcgccgact cggagccgca gagactggcg gcgggtcaac 120
t 121
<210> 171
<211> 163
<212> DNA
<213> 人
<400> 171
gcgacgcgtt tccctggtta cctaccccgc gctgctccgt agagcgacgc gtttccctgg 60
ttacctgcgg ggccgcgtcc cggaggagcc tgagggccaa gagggccggc gcgcggtggg 120
cgcggcctgc ggggatgccg ggctctacgg agcagcgcgg ggt 163
<210> 172
<211> 149
<212> DNA
<213> 人
<400> 172
tctaacgagg gctcagctcc gactagaccc cagggaacag gcaaaaagtc taacgagggc 60
tcagctccga ctaccccagg cctccgggga ccctctccgg atgcgctccc cgctttgcgc 120
tttgcgcttt ttgcctgttc cctggggtc 149
<210> 173
<211> 164
<212> DNA
<213> 人
<400> 173
gggatgggga gtagagggag gggcctaact ccgtcccgct cgctgttggg atggggagta 60
gagggagggg gccctgttgc ctcagcgccc cgaggtcgtg gagcggcagc agctgcagcc 120
ggagcagcac cagcaacagc aacagcgagc gggacggagt tagg 164
<210> 174
<211> 128
<212> DNA
<213> 人
<400> 174
gcgaggtcat cctgccctac tcagcagcag cgtggctatc ttggagaggc gaggtcatcc 60
tgccctactc agcggcgcac tgccagggcg cgcccggccg caagctctcc aagatagcca 120
cgctgctg 128
<210> 175
<211> 107
<212> DNA
<213> 人
<400> 175
gccttctctt tgcgccacgt tcgtgcgcga cgtggaagga gaaatgagcc ttctctttgc 60
gccacgttcg gccgcagctg aattcatttc tccttccacg tcgcgca 107
<210> 176
<211> 130
<212> DNA
<213> 人
<400> 176
agagtgagag tgtccctgct gccagcgggg tctgtgtggt gagcgagaga gtgagagtgt 60
ccctgctgcc agaggactac ggcgggctgg gcgcggggtc cccgcctctc gctcaccaca 120
cagaccccgc 130
<210> 177
<211> 119
<212> DNA
<213> 人
<400> 177
cccactccaa tccccaccct ctccgtcctc caagaacgtg ccaggcgccc actccaatcc 60
ccaccctctc catccttagt cattaaagaa cagcagcgcc tggcacgttc ttggaggac 119
<210> 178
<211> 149
<212> DNA
<213> 人
<400> 178
aactccgagg agctagcgca gacgcttagg catgggaagg gcaagacaac tccgaggagc 60
tagcgcagac cgctctccgc cctcagctgc ggcgaggcaa gggctggcag cgctcggacg 120
cctccgtctt gcccttccca tgcctaagc 149
<210> 179
<211> 123
<212> DNA
<213> 人
<400> 179
gcctaagcgc ggggaattac acgtcactcc caccgcccag ccctaatagc ctaagcgcgg 60
ggaattacac gttcccggtg tagaacagac gatcggggct attagggctg ggcggtggga 120
gtg 123
<210> 180
<211> 147
<212> DNA
<213> 人
<400> 180
aaaagccaat ctccaagcct ccaaacggag gataaatatg cgcggcttgt cagtcaaaaa 60
gccaatctcc aagcctccaa acggaacgtc accctatcag ctgggagaca gcgccgcact 120
gactgacaag ccgcgcatat ttatcct 147
<210> 181
<211> 113
<212> DNA
<213> 人
<400> 181
gcggccaccc accctagtcg ttgcgccgtt ttgacgtgct gccggcggcc acccacccta 60
gtcgttggag cctggcgccc gcgcctcccg gccggcagca cgtcaaaacg gcg 113
<210> 182
<211> 145
<212> DNA
<213> 人
<400> 182
gctctgcctg tttgttccgc ccgcggcttg gcgggctatc tgtggctctg cctgtttgtt 60
ccgcccccgc ggaaaccgct gctcgctggg caggggcttt ctgttttgca gccggaacag 120
gaacacagat agcccgccaa gccgc 145
<210> 183
<211> 156
<212> DNA
<213> 人
<400> 183
gagcttggag atgcgaggga aactcccccg gccctcctgt attactgagc ttggagatgc 60
gagggaaact gaagccccaa gggtgccccg tcctgggagc ctggctgtct gcggggtccc 120
ccgcattccg cagtagtaat acaggagggc cggggg 156
<210> 184
<211> 139
<212> DNA
<213> 人
<400> 184
gcctcggcgc ccaaaatcga aaggagtcag cgctacggga aaggaaaccg cctcggcgcc 60
caaaatcgaa aggccgggag ttgttctgca ggctttgcaa acaggttgac tgagggtttc 120
ctttcccgta gcgctgact 139
<210> 185
<211> 114
<212> DNA
<213> 人
<400> 185
ggagcgtgga cttcttgggc cgctgcacgg ccggagaagc gaatggagcg tggacttctt 60
gggccgtacc cctgcggctc aagctgcccc ggattcgctt ctccggccgt gcag 114
<210> 186
<211> 166
<212> DNA
<213> 人
<400> 186
ttcggattct ggacttcggg ttccgcccgc cgaaaattat cttcagccat tcggattctg 60
gacttcgggt tccgctgagg acggatttcg gaataggcac agtggctgcc ccgaacccct 120
caaggcggcc tccgcgggct gtggctgaag ataattttcg gcgggc 166
<210> 187
<211> 133
<212> DNA
<213> 人
<400> 187
ggtaggtacc gcctgcctgt gtgtactgag gctgcttggt tctcctgtcg gtaggtaccg 60
cctgcctgtg tgtaccgggg ctgctgtctc cggggagggg cttctggcgg acaggagaac 120
caagcagcct cag 133
<210> 188
<211> 118
<212> DNA
<213> 人
<400> 188
ggagtgggtg tggtgtgagg ctggggccgc gataccctag acctcctagg agtgggtgtg 60
gtgtgaggct ggcgctggag cggtctggga atgttaggag gtctagggta tcgcggcc 118
<210> 189
<211> 119
<212> DNA
<213> 人
<400> 189
ctcgcgatgt ttcagggtga gccaacacac gaacagcact cctccgcctc gcgatgtttc 60
agggtgagcc ggacgcaggc gtgcctgcgc agtgcgcgga ggagtgctgt tcgtgtgtt 119
<210> 190
<211> 111
<212> DNA
<213> 人
<400> 190
ggcaccacta gctcctcgtc ctcctcggag gggcgcccga gtgcgtccga cacggccagt 60
agcgccgcgg cgagcagcag cagcgtgggt actggcccaa agctccgaga c 111
<210> 191
<211> 91
<212> DNA
<213> 人
<400> 191
cccggcgcga ttctccctca acgcttgcct ggagcatccc tggccccttt tgcccaggtc 60
gcgcccctga gtcttggagt cgcgctgcct c 91
<210> 192
<211> 92
<212> DNA
<213> 人
<400> 192
ggtgcgcggc ccaagagaag gccagcggga ccacagcgcg gctacgcggc cggccgcagt 60
cttcaccgcg cgcctgccct tgtctacgtc cc 92
<210> 193
<211> 130
<212> DNA
<213> 人
<400> 193
gtggggtcgt agtggtttcc gaggttggtg accacgtcgt cgaacttgag cacctcgtag 60
ccttcatgct gccgcttgag gccggcgtag aaggcgatct tgggcaccgt gctgtaggtg 120
gcggcgctga 130
<210> 194
<211> 95
<212> DNA
<213> 人
<400> 194
ggtggaggat gtggaggtgg aagtggagcg gatggcgctc cccaagagct ccgccacgcg 60
aggtttcggg ctcgtggttt tgcttcctcc gggtc 95
<210> 195
<211> 100
<212> DNA
<213> 人
<400> 195
ggcatctatg cgggcatggt tactgcctct ggtgcccccc gcagccgcgc gcaggtaccg 60
tgcgacatcg cgatggccca gctcctcagc caggtccacg 100
<210> 196
<211> 113
<212> DNA
<213> 人
<400> 196
cacctctgcc ccctgtccag gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt 60
tcagacaccc gggcgcggcg cggggccctg atggatgcgg tgaccgaggc tgt 113
<210> 197
<211> 115
<212> DNA
<213> 人
<400> 197
cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 60
cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactc 115
<210> 198
<211> 113
<212> DNA
<213> 人
<400> 198
ccggcgcttt gcttttctac aactggaagc cgcgaaggcg gctactgcgc tgagccgctc 60
gctctgctgg tcaagtttgg gcgacccgcg cggaggaggg tcgggctgac tgc 113
<210> 199
<211> 84
<212> DNA
<213> 人
<400> 199
gtggagaagt aagtgggagg cggtgtcggg aactgactcc tcttaaaacg gtcggcgccg 60
ctgctctgaa atgggcggct aagt 84
<210> 200
<211> 108
<212> DNA
<213> 人
<400> 200
ggaaaagcga tgactgccct gaactgctgg ggcgttcgaa atttccaggg tcccgaccct 60
ccgtggggta cgcgcgactt cggcgcagat gtcagtccgc tgccttcc 108
<210> 201
<211> 79
<212> DNA
<213> 人
<400> 201
gccagcagcc aacccctacg acttcaggag gctcctgcgc aaaacctccc agcgccggcg 60
cctcgtccag cagtcctaa 79
<210> 202
<211> 105
<212> DNA
<213> 人
<400> 202
cactgaagct gcggccctga tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc 60
ccgggccggc cttcgtgctc cgaaacaaga gacctgggag ccctc 105
<210> 203
<211> 84
<212> DNA
<213> 人
<400> 203
ccgcccgcag gatcgagtga gtcacgcggc cgccagacga ggccggtggc gcacgcaccc 60
gagatccgat gtagtgcacc gcct 84
<210> 204
<211> 107
<212> DNA
<213> 人
<400> 204
ctgagaagtc agacgggccg cgtaaggggc agagcgaggg gtccggcatc actcgcgcgc 60
tccggaaacc cgcgtgagcc gctgttcctg ccgcgctccc atctgag 107
<210> 205
<211> 105
<212> DNA
<213> 人
<400> 205
gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60
agagcagcat ctcccctgcg cctgtggata cgccagtcca gggat 105
<210> 206
<211> 103
<212> DNA
<213> 人
<400> 206
aggctccgaa tcgcacctct tctcctgtcc taatctcagg ctccaggcct ggcttgcagt 60
ttctggctca ccgcgctgcg gtcaccggcc cacactccca gga 103
<210> 207
<211> 83
<212> DNA
<213> 人
<400> 207
cagggactcc tggccttgcg tcttgggaga gcgcacgctg gcctgcgcta cacacacaca 60
cttcacagtt gcgctgaaac aga 83
<210> 208
<211> 97
<212> DNA
<213> 人
<400> 208
cctcagttac gctgactcgg ctgtgcccgc agtgtcgcgc tgtcgcgtag ccaggtgtcg 60
ccgggctggc gcggttattt atgactgcgt ggttggg 97
<210> 209
<211> 68
<212> DNA
<213> 人
<400> 209
gcgaggatgt ggatggcgcg gatggcgcgg cctccacctg cgggcagtgg agagagcggc 60
gagaggaa 68
<210> 210
<211> 78
<212> DNA
<213> 人
<400> 210
gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg agccgcagag 60
actggcggcg ggtcaact 78
<210> 211
<211> 121
<212> DNA
<213> 人
<400> 211
ggcgacgcgt ttccctggtt acctgcgggg ccgcgtcccg gaggagcctg agggccaaga 60
gggccggcgc gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg 120
t 121
<210> 212
<211> 102
<212> DNA
<213> 人
<400> 212
ttctaacgag ggctcagctc cgactacccc aggcctccgg ggaccctctc cggatgcgct 60
ccccgctttg cgctttgcgc tttttgcctg ttccctgggg tc 102
<210> 213
<211> 118
<212> DNA
<213> 人
<400> 213
ggggatgggg agtagaggga gggggccctg ttgcctcagc gccccgaggt cgtggagcgg 60
cagcagctgc agccggagca gcaccagcaa cagcaacagc gagcgggacg gagttagg 118
<210> 214
<211> 81
<212> DNA
<213> 人
<400> 214
cgcgaggtca tcctgcccta ctcagcggcg cactgccagg gcgcgcccgg ccgcaagctc 60
tccaagatag ccacgctgct g 81
<210> 215
<211> 61
<212> DNA
<213> 人
<400> 215
agccttctct ttgcgccacg ttcggccgca gctgaattca tttctccttc cacgtcgcgc 60
a 61
<210> 216
<211> 84
<212> DNA
<213> 人
<400> 216
cagagtgaga gtgtccctgc tgccagagga ctacggcggg ctgggcgcgg ggtccccgcc 60
tctcgctcac cacacagacc ccgc 84
<210> 217
<211> 73
<212> DNA
<213> 人
<400> 217
gcccactcca atccccaccc tctccatcct tagtcattaa agaacagcag cgcctggcac 60
gttcttggag gac 73
<210> 218
<211> 103
<212> DNA
<213> 人
<400> 218
caactccgag gagctagcgc agaccgctct ccgccctcag ctgcggcgag gcaagggctg 60
gcagcgctcg gacgcctccg tcttgccctt cccatgccta agc 103
<210> 219
<211> 76
<212> DNA
<213> 人
<400> 219
tgcctaagcg cggggaatta cacgttcccg gtgtagaaca gacgatcggg gctattaggg 60
ctgggcggtg ggagtg 76
<210> 220
<211> 92
<212> DNA
<213> 人
<400> 220
aaaaagccaa tctccaagcc tccaaacgga acgtcaccct atcagctggg agacagcgcc 60
gcactgactg acaagccgcg catatttatc ct 92
<210> 221
<211> 70
<212> DNA
<213> 人
<400> 221
cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc ggcagcacgt 60
caaaacggcg 70
<210> 222
<211> 102
<212> DNA
<213> 人
<400> 222
ggctctgcct gtttgttccg cccccgcgga aaccgctgct cgctgggcag gggctttctg 60
ttttgcagcc ggaacaggaa cacagatagc ccgccaagcc gc 102
<210> 223
<211> 111
<212> DNA
<213> 人
<400> 223
cgagcttgga gatgcgaggg aaactgaagc cccaagggtg ccccgtcctg ggagcctggc 60
tgtctgcggg gtcccccgca ttccgcagta gtaatacagg agggccgggg g 111
<210> 224
<211> 91
<212> DNA
<213> 人
<400> 224
agcctcggcg cccaaaatcg aaaggccggg agttgttctg caggctttgc aaacaggttg 60
actgagggtt tcctttcccg tagcgctgac t 91
<210> 225
<211> 71
<212> DNA
<213> 人
<400> 225
cggagcgtgg acttcttggg ccgtacccct gcggctcaag ctgccccgga ttcgcttctc 60
cggccgtgca g 71
<210> 226
<211> 118
<212> DNA
<213> 人
<400> 226
tttcggattc tggacttcgg gttccgctga ggacggattt cggaataggc acagtggctg 60
ccccgaaccc ctcaaggcgg cctccgcggg ctgtggctga agataatttt cggcgggc 118
<210> 227
<211> 85
<212> DNA
<213> 人
<400> 227
aggtaggtac cgcctgcctg tgtgtaccgg ggctgctgtc tccggggagg ggcttctggc 60
ggacaggaga accaagcagc ctcag 85
<210> 228
<211> 71
<212> DNA
<213> 人
<400> 228
gggagtgggt gtggtgtgag gctggcgctg gagcggtctg ggaatgttag gaggtctagg 60
gtatcgcggc c 71
<210> 229
<211> 73
<212> DNA
<213> 人
<400> 229
tctcgcgatg tttcagggtg agccggacgc aggcgtgcct gcgcagtgcg cggaggagtg 60
ctgttcgtgt gtt 73
<210> 230
<211> 120
<212> DNA
<213> 人
<400> 230
ggcgaaaaga aggccaaaca cagcatcgac ggcatcctgg gcgacaaagg tagggaactt 60
ccctgggctg cgaggcccca gcccgggttt tcccacgctc cggtgtgcgg gccagtggtt 120
<210> 231
<211> 118
<212> DNA
<213> 人
<400> 231
ggggatgggg agtagaggga gggggccctg ttgcctcagc gccccgaggt cgtggagcgg 60
cagcagctgc agccggagca gcaccagcaa cagcaacagc gagcgggacg gagttagg 118
<210> 232
<211> 69
<212> DNA
<213> 人
<400> 232
gcaccagcaa cagcaacagc gagcgggacg gagttaggac cgctcggagc gcacaggtct 60
cgaggtagt 69
<210> 233
<211> 111
<212> DNA
<213> 人
<400> 233
cgagcttgga gatgcgaggg aaactgaagc cccaagggtg ccccgtcctg ggagcctggc 60
tgtctgcggg gtcccccgca ttccgcagta gtaatacagg agggccgggg g 111
<210> 234
<211> 83
<212> DNA
<213> 人
<400> 234
cagggactcc tggccttgcg tcttgggaga gcgcacgctg gcctgcgcta cacacacaca 60
cttcacagtt gcgctgaaac aga 83
<210> 235
<211> 81
<212> DNA
<213> 人
<400> 235
gcgctcatcg tgtgcacctt cacctacctg ctggtgggcg ccgcggtctt cgacgcgctg 60
gagtcggagc ccgagctgat c 81
<210> 236
<211> 94
<212> DNA
<213> 人
<400> 236
aacagcagca ccgtgatcca gagcaccccg aagactggca gaaccagccg acgagtcagg 60
cgccgcatgg tcccctttgc cgcttcctct ccgc 94
<210> 237
<211> 98
<212> DNA
<213> 人
<400> 237
cgcacaatat caataattcc gcgggtcaca gcatcccgca caaggacgcc ttcttattgc 60
ataattaacg cgaggaaggc tcttcccgct actcccgc 98
<210> 238
<211> 91
<212> DNA
<213> 人
<400> 238
gtggctcact ctccaatcag cgctttctag agacagcgtg gtcagcgtac ttgcttactt 60
tcaggattgc gagacgtctt taacccttgc t 91
<210> 239
<211> 97
<212> DNA
<213> 人
<400> 239
gcagtgtgcg gagaccctct aggcgggcgg ggacgcccca cgcggcgacc tgagcaccga 60
cctcatgcaa cgggaccgaa ccttgggacc cgggcag 97
<210> 240
<211> 91
<212> DNA
<213> 人
<400> 240
agcctcggcg cccaaaatcg aaaggccggg agttgttctg caggctttgc aaacaggttg 60
actgagggtt tcctttcccg tagcgctgac t 91
<210> 241
<211> 77
<212> DNA
<213> 人
<400> 241
atcgaaaggc cgggagttgt tctgcaggct ttgcaaacag gttgactgag ggtttccttt 60
cccgtagcgc tgactgc 77
<210> 242
<211> 87
<212> DNA
<213> 人
<400> 242
gcccatctgc acctgtcccc tttgctgtct tacatgtccc atagtattaa agttatttga 60
ataagcaaat gaaccccgct ctttggt 87
<210> 243
<211> 71
<212> DNA
<213> 人
<400> 243
cggagcgtgg acttcttggg ccgtacccct gcggctcaag ctgccccgga ttcgcttctc 60
cggccgtgca g 71
<210> 244
<211> 113
<212> DNA
<213> 人
<400> 244
ccggcgcttt gcttttctac aactggaagc cgcgaaggcg gctactgcgc tgagccgctc 60
gctctgctgg tcaagtttgg gcgacccgcg cggaggaggg tcgggctgac tgc 113
<210> 245
<211> 84
<212> DNA
<213> 人
<400> 245
gtggagaagt aagtgggagg cggtgtcggg aactgactcc tcttaaaacg gtcggcgccg 60
ctgctctgaa atgggcggct aagt 84
<210> 246
<211> 85
<212> DNA
<213> 人
<400> 246
tcagctatga gcagagaccg ctgaagcgcc cccggctcgg gccgcccgac gtctacccac 60
aggaccccaa gcagaaggag gtaag 85
<210> 247
<211> 91
<212> DNA
<213> 人
<400> 247
cccggcgcga ttctccctca acgcttgcct ggagcatccc tggccccttt tgcccaggtc 60
gcgcccctga gtcttggagt cgcgctgcct c 91
<210> 248
<211> 115
<212> DNA
<213> 人
<400> 248
gcccggcttc gccttctctc ataagggtgg ccgggggccc acgaacttgc agggtggcgg 60
ccctgcgccc tccagccccg gcggggacgg gcacgattgc tcgtagtctg gggtg 115
<210> 249
<211> 110
<212> DNA
<213> 人
<400> 249
gggcactcac acacacgcag acccagagga ggagaggtgg gtataaggaa gcaagcccca 60
gccgcagcag cccgagcggg cacaaaaccg cttcctggca catcaccttg 110
<210> 250
<211> 98
<212> DNA
<213> 人
<400> 250
ggcactcaca cacacgcaga cccagaggag gagaggtggg tataaggaag caagccccag 60
ccgcagcagc ccgagcgggc acaaaaccgc ttcctggc 98
<210> 251
<211> 105
<212> DNA
<213> 人
<400> 251
gcgggctggg gttggaagag taactcgggc tgcgggctga acgcagtcgg caaccgcgga 60
agagcagcat ctcccctgcg cctgtggata cgccagtcca gggat 105
<210> 252
<211> 107
<212> DNA
<213> 人
<400> 252
cgcatcctcg ccttcttgca gtccaaggcc cgcctgggcg cggagcccgc ctttccgccg 60
ctgggttcgc tcccggagcc ggatttctcc tatcagctgc accctgc 107
<210> 253
<211> 107
<212> DNA
<213> 人
<400> 253
ctgagaagtc agacgggccg cgtaaggggc agagcgaggg gtccggcatc actcgcgcgc 60
tccggaaacc cgcgtgagcc gctgttcctg ccgcgctccc atctgag 107
<210> 254
<211> 88
<212> DNA
<213> 人
<400> 254
gcgtaagggg cagagcgagg ggtccggcat cactcgcgcg ctccggaaac ccgcgtgagc 60
cgctgttcct gccgcgctcc catctgag 88
<210> 255
<211> 86
<212> DNA
<213> 人
<400> 255
caatctcaga gcggagccga cagagagcag ggaaccggca tggccaaagc cgcggcgatc 60
ggcatcgacc tgggcaccac ctactc 86
<210> 256
<211> 111
<212> DNA
<213> 人
<400> 256
gtgtgcaccg agcgagtgaa ggtatgtgtg gcgggcgcgg ctggagctgc cgccgccgcc 60
gccgccgcgc cagcaggtcc taatgcctgt cacttcccag gacgctggca g 111
<210> 257
<211> 85
<212> DNA
<213> 人
<400> 257
ctcacgttgc acggatgaca tcactagctt ttggctgcgc gctcggtgtt ctcgtctgtg 60
ggttttagcc aaggctgcag ctacc 85
<210> 258
<211> 73
<212> DNA
<213> 人
<400> 258
caggacggga ttctctgcac gctgtcgagt gagccggcat ctcggcgccc gggtgggctg 60
cgaagaaaat ggt 73
<210> 259
<211> 97
<212> DNA
<213> 人
<400> 259
gcagaagacg gcgctgggaa gagctgcgtg acgctcgggg gctggcggct gggccggcag 60
cgcgccgtgg cggcgtgacc tgtccatggt gttgaag 97
<210> 260
<211> 113
<212> DNA
<213> 人
<400> 260
cacctctgcc ccctgtccag gtacgcgctg tctggcgcgc cctgcgtggg ggccgcaggt 60
tcagacaccc gggcgcggcg cggggccctg atggatgcgg tgaccgaggc tgt 113
<210> 261
<211> 97
<212> DNA
<213> 人
<400> 261
cctcagttac gctgactcgg ctgtgcccgc agtgtcgcgc tgtcgcgtag ccaggtgtcg 60
ccgggctggc gcggttattt atgactgcgt ggttggg 97
<210> 262
<211> 92
<212> DNA
<213> 人
<400> 262
ggtgcgcggc ccaagagaag gccagcggga ccacagcgcg gctacgcggc cggccgcagt 60
cttcaccgcg cgcctgccct tgtctacgtc cc 92
<210> 263
<211> 98
<212> DNA
<213> 人
<400> 263
gcggatgcac gacctgaacg acgcgctgga cgagctgcgc gcggtgatcc cctacgcgca 60
cagcccctcg gtgcgaaagc tctccaagat cgccacgc 98
<210> 264
<211> 95
<212> DNA
<213> 人
<400> 264
ggcagccggc tacccgttca gcgccggact gcccccggct gcctcctgcc cggagaagtg 60
cgccctgttt aacagcgtct cctccagcct ctgca 95
<210> 265
<211> 115
<212> DNA
<213> 人
<400> 265
cacgtcggag ctcgcctgga tccgggcgtt ggcagccgaa gggccctggc cccgggactc 60
tccgccgcta gcccccgtca tatcttctcc gctttcgctt ctccactcta gccgg 115
<210> 266
<211> 91
<212> DNA
<213> 人
<400> 266
ttgtttttct ggaaaagtcg ctgcaatgga cacagcgttg cgcggtttcc ctgcgcgcct 60
ggggcgcttt ttgtcttcgc cctccgtgga t 91
<210> 267
<211> 100
<212> DNA
<213> 人
<400> 267
ggcatctatg cgggcatggt tactgcctct ggtgcccccc gcagccgcgc gcaggtaccg 60
tgcgacatcg cgatggccca gctcctcagc caggtccacg 100
<210> 268
<211> 61
<212> DNA
<213> 人
<400> 268
agccttctct ttgcgccacg ttcggccgca gctgaattca tttctccttc cacgtcgcgc 60
a 61
<210> 269
<211> 130
<212> DNA
<213> 人
<400> 269
gtggggtcgt agtggtttcc gaggttggtg accacgtcgt cgaacttgag cacctcgtag 60
ccttcatgct gccgcttgag gccggcgtag aaggcgatct tgggcaccgt gctgtaggtg 120
gcggcgctga 130
<210> 270
<211> 68
<212> DNA
<213> 人
<400> 270
gcgaggatgt ggatggcgcg gatggcgcgg cctccacctg cgggcagtgg agagagcggc 60
gagaggaa 68
<210> 271
<211> 79
<212> DNA
<213> 人
<400> 271
gccagcagcc aacccctacg acttcaggag gctcctgcgc aaaacctccc agcgccggcg 60
cctcgtccag cagtcctaa 79
<210> 272
<211> 105
<212> DNA
<213> 人
<400> 272
cactgaagct gcggccctga tctccgcaga ggctgcctgc tgcgctcggc cctcaagtgc 60
ccgggccggc cttcgtgctc cgaaacaaga gacctgggag ccctc 105
<210> 273
<211> 108
<212> DNA
<213> 人
<400> 273
ggaaaagcga tgactgccct gaactgctgg ggcgttcgaa atttccaggg tcccgaccct 60
ccgtggggta cgcgcgactt cggcgcagat gtcagtccgc tgccttcc 108
<210> 274
<211> 108
<212> DNA
<213> 人
<400> 274
cagcggcgac tggttctgac ttgccaagta cctggcacga gaaggacgtc gtgtgggtcg 60
tccttaccct gaatttaatg aagtcagggg ctgaaaacgg cggtgtaa 108
<210> 275
<211> 140
<212> DNA
<213> 人
<400> 275
ggtgtgaccg ttgttgcacc ccagtcgaca tgacgttagt ttttcatttg ccaaattgct 60
ggttagttgc aaagcctacc ctcggccgcg agcactgaag gatgggaggg tcgagcgccg 120
cgttttgaca ggaggaagtg 140
<210> 276
<211> 114
<212> DNA
<213> 人
<400> 276
tgtgcgcgcg tgtgtcttta cacgcgccgc gtgcccagtg ttgcacgggg cgggagaaga 60
atggcaggta gccgcccgaa acacctcgcc ctgtctcctt tctttgggcg aggt 114
<210> 277
<211> 114
<212> DNA
<213> 人
<400> 277
agctgggagg aagacagtag tgatgctgcc gcgggtggcg ggggttgcgc cgccgcccag 60
agaacctcgg cagtgtgcag ggaggtgcat ttcattttgg ctatttccat cccg 114
<210> 278
<211> 116
<212> DNA
<213> 人
<400> 278
ctcatcgtct tggggttaag agttgccgcc cggccagggc aacagccagg gcaaagggag 60
agagaagccg ccccggggcg agaaggagaa aagttagagg gctgaacagg tgacgc 116
<210> 279
<211> 84
<212> DNA
<213> 人
<400> 279
cagagtgaga gtgtccctgc tgccagagga ctacggcggg ctgggcgcgg ggtccccgcc 60
tctcgctcac cacacagacc ccgc 84
<210> 280
<211> 73
<212> DNA
<213> 人
<400> 280
gcccactcca atccccaccc tctccatcct tagtcattaa agaacagcag cgcctggcac 60
gttcttggag gac 73
<210> 281
<211> 115
<212> DNA
<213> 人
<400> 281
cctagggccg acttttccat ctcctcctct acctccggct cccgggcgag ggaggccccg 60
cgccgcccct tagactggct gcggccggaa gattgcagcc gctttgagct tactc 115
<210> 282
<211> 71
<212> DNA
<213> 人
<400> 282
cctcggatcc caagcatatc tggcgatgga gcggcggcag cccgaggcac gtgttgtgtg 60
tgctccgatt g 71
<210> 283
<211> 98
<212> DNA
<213> 人
<400> 283
cgcgtgcgaa gtctcctcta gcggagcggg accggccgcg gcggtggatc gtggcggtcc 60
ctgcacttct gctccagccg cgcctggaaa cctgagcc 98
<210> 284
<211> 96
<212> DNA
<213> 人
<400> 284
cgcgtgcgaa gtctcctcta gcggagcggg accggccgcg gcggtggatc gtggcggtcc 60
ctgcacttct gctccagccg cgcctggaaa cctgag 96
<210> 285
<211> 88
<212> DNA
<213> 人
<400> 285
ggctctgatt ggcctgcatc ttgcggcgcg ggcggccgca gcccggcgcg agggagggag 60
cgcggaacaa ggcgctgact gtctccca 88
<210> 286
<211> 124
<212> DNA
<213> 人
<400> 286
tgcagggacg tacagggcgg tgatccagta tctaaattct ttgggagaaa atgaatagtt 60
cccccgcccc cgccctccag gaaaaaaaaa aatctgagaa tctgagaatg ttcagcgcac 120
ccgc 124
<210> 287
<211> 92
<212> DNA
<213> 人
<400> 287
aaaaagccaa tctccaagcc tccaaacgga acgtcaccct atcagctggg agacagcgcc 60
gcactgactg acaagccgcg catatttatc ct 92
<210> 288
<211> 70
<212> DNA
<213> 人
<400> 288
cgcggccacc caccctagtc gttggagcct ggcgcccgcg cctcccggcc ggcagcacgt 60
caaaacggcg 70
<210> 289
<211> 102
<212> DNA
<213> 人
<400> 289
ttctaacgag ggctcagctc cgactacccc aggcctccgg ggaccctctc cggatgcgct 60
ccccgctttg cgctttgcgc tttttgcctg ttccctgggg tc 102
<210> 290
<211> 84
<212> DNA
<213> 人
<400> 290
ccgcccgcag gatcgagtga gtcacgcggc cgccagacga ggccggtggc gcacgcaccc 60
gagatccgat gtagtgcacc gcct 84
<210> 291
<211> 129
<212> DNA
<213> 人
<400> 291
cgctcgttgc gacccaggct cagctccgcg gtgcgcaggg cctggcgcct tcgcggctgc 60
ccgcccgggc tcagctcctc cacagccacg cggcaccgca gctccgagtc ctcatattcc 120
cctgccgcc 129
<210> 292
<211> 103
<212> DNA
<213> 人
<400> 292
caactccgag gagctagcgc agaccgctct ccgccctcag ctgcggcgag gcaagggctg 60
gcagcgctcg gacgcctccg tcttgccctt cccatgccta agc 103
<210> 293
<211> 76
<212> DNA
<213> 人
<400> 293
tgcctaagcg cggggaatta cacgttcccg gtgtagaaca gacgatcggg gctattaggg 60
ctgggcggtg ggagtg 76
<210> 294
<211> 72
<212> DNA
<213> 人
<400> 294
ctggcttcag tacataacgc gagttacagt tcaacagaac cagatgtgaa aacgtcagcc 60
acccagttca gg 72
<210> 295
<211> 113
<212> DNA
<213> 人
<400> 295
tattaagaac cgcaagccca ctgtgtgcca gccgccgttg gtagttttac acgtgcgatc 60
ttatttaata cttcctggga cctaatgagt caggtgccat catgatccgt tta 113
<210> 296
<211> 103
<212> DNA
<213> 人
<400> 296
aggctccgaa tcgcacctct tctcctgtcc taatctcagg ctccaggcct ggcttgcagt 60
ttctggctca ccgcgctgcg gtcaccggcc cacactccca gga 103
<210> 297
<211> 102
<212> DNA
<213> 人
<400> 297
ggctctgcct gtttgttccg cccccgcgga aaccgctgct cgctgggcag gggctttctg 60
ttttgcagcc ggaacaggaa cacagatagc ccgccaagcc gc 102
<210> 298
<211> 113
<212> DNA
<213> 人
<400> 298
gaaaaacaga gaggcgaggc cagactgccc ccacacctcc tgtagccact gagcgcgaag 60
tgcgttggtt ccgagcgcgc tggtgggatc cacaaagctc gcattctctc agg 113
<210> 299
<211> 110
<212> DNA
<213> 人
<400> 299
cgagttctgg gcctctggag gtttccctgt cagcctcccc ggccgccgag ggggcgcgcg 60
cccaacaagg gggtctctag cggccacctg gggacagaaa cagtgaccct 110
<210> 300
<211> 95
<212> DNA
<213> 人
<400> 300
ggtggaggat gtggaggtgg aagtggagcg gatggcgctc cccaagagct ccgccacgcg 60
aggtttcggg ctcgtggttt tgcttcctcc gggtc 95
<210> 301
<211> 76
<212> DNA
<213> 人
<400> 301
tggcctccaa ctttaacgac atagtcaagc agggctacgt gaaaatccgc agcaggaagc 60
ttggggtgag tggctc 76
<210> 302
<211> 121
<212> DNA
<213> 人
<400> 302
ggcgacgcgt ttccctggtt acctgcgggg ccgcgtcccg gaggagcctg agggccaaga 60
gggccggcgc gcggtgggcg cggcctgcgg ggatgccggg ctctacggag cagcgcgggg 120
t 121
<210> 303
<211> 118
<212> DNA
<213> 人
<400> 303
tttcggattc tggacttcgg gttccgctga ggacggattt cggaataggc acagtggctg 60
ccccgaaccc ctcaaggcgg cctccgcggg ctgtggctga agataatttt cggcgggc 118
<210> 304
<211> 96
<212> DNA
<213> 人
<400> 304
ttgtgatatt tggttgcgcg ggattatgat gaaatgtgtg atatgtgtgt gattatgatt 60
aaggctgtag cgagtgtgaa cgtggcgaag tgtgcg 96
<210> 305
<211> 71
<212> DNA
<213> 人
<400> 305
gggagtgggt gtggtgtgag gctggcgctg gagcggtctg ggaatgttag gaggtctagg 60
gtatcgcggc c 71
<210> 306
<211> 85
<212> DNA
<213> 人
<400> 306
aggtaggtac cgcctgcctg tgtgtaccgg ggctgctgtc tccggggagg ggcttctggc 60
ggacaggaga accaagcagc ctcag 85
<210> 307
<211> 79
<212> DNA
<213> 人
<400> 307
accctggggt gtagctctgt gtcccactgt gtgatgacgt gtgcgtgctt ctgtgcgtgt 60
gtgtgtgttt gtgcgcgtg 79
<210> 308
<211> 73
<212> DNA
<213> 人
<400> 308
tctcgcgatg tttcagggtg agccggacgc aggcgtgcct gcgcagtgcg cggaggagtg 60
ctgttcgtgt gtt 73
<210> 309
<211> 86
<212> DNA
<213> 人
<400> 309
gggcacaggt ggggtccgtc aggccgcccg gggctcctct gtcccagctc tgcggcccag 60
ggggtgacgt gatggcggca gcggtg 86
<210> 310
<211> 104
<212> DNA
<213> 人
<400> 310
accggtctcc tcgtatccat cctcgcagtc cccaccccaa actaatgttc tcccctgagc 60
aaatttcgag acacttaaaa tcccagctaa gatcacgtcc ttct 104
<210> 311
<211> 109
<212> DNA
<213> 人
<400> 311
aggcaggaga ggggaggaag agaacctgtg cccctggaag ctagaggaga gcctcgctct 60
ctctgctgct ctgggttccg caacgaattg agttcgggtt caggcggct 109
<210> 312
<211> 65
<212> DNA
<213> 人
<400> 312
ggctcttttg catgcaggcc cgcctgaatg gggcgcctgg aggctgcatt gaggccgggc 60
tgtgt 65
<210> 313
<211> 78
<212> DNA
<213> 人
<400> 313
gctgcattga ggccgggctg tgtaaactgt agggtgcctc gccgactcgg agccgcagag 60
actggcggcg ggtcaact 78
<210> 314
<211> 101
<212> DNA
<213> 人
<400> 314
cttcccaggt caccattgct cctctgccct ctccacatcc gccctcccgt gagcgcagga 60
tgcacgcaca ggcagcggtt acaaaactca gcgcaacgtt g 101
<210> 315
<211> 111
<212> DNA
<213> 人
<400> 315
ggcaccacta gctcctcgtc ctcctcggag gggcgcccga gtgcgtccga cacggccagt 60
agcgccgcgg cgagcagcag cagcgtgggt actggcccaa agctccgaga c 111
<210> 316
<211> 108
<212> DNA
<213> 人
<400> 316
atctctttac cctggagcca gaaccagcgt cgccgccgtc ccctgcagct cagccggcaa 60
cgcgcgccga gcctcggggc gcagcttgga gacgcgcttg ctcgttct 108
<210> 317
<211> 81
<212> DNA
<213> 人
<400> 317
cgcgaggtca tcctgcccta ctcagcggcg cactgccagg gcgcgcccgg ccgcaagctc 60
tccaagatag ccacgctgct g 81

Claims (17)

1.一种在受试者中筛查结肠直肠癌和/或进行性腺瘤的体外方法,所述方法包括:
-在受试者的DNA样品中确定DMR组中所有DMR基因座的甲基化状态,其中所述DMR组包含表2、3或4的基因座,
-将所获得的数据与从健康个体获得的参考值进行比较,
-如果与参考样品相比在一个或多个基因座中检测到超甲基化,则诊断所述受试者的结肠直肠癌和/或进行性腺瘤。
2.如权利要求1所述的方法,其中,所述甲基化状态通过甲基化特异性限制酶定量聚合酶链式反应(MSRE-qPCR)确定。
3.如权利要求1至2中任一项所述的方法,其中,所述DMR基因座通过表5中提供的寡核苷酸引物对来扩增。
4.如权利要求1至3中任一项所述的方法,其中,所述DNA是从所述人类受试者的血液、血浆或粪便中分离的。
5.如权利要求1至4中任一项所述的方法,其中,所述DNA是所述人类受试者的无细胞DNA。
6.如权利要求1至5中任一项所述的方法,其中,所述受试者在筛查时没有结肠直肠癌的症状。
7.如权利要求1至6中任一项所述的方法,其中,所述受试者先前进行过结肠直肠癌筛查。
8.如权利要求7所述的方法,其中,所述受试者在过去10年内、过去5年内、过去4年内、过去3年内、过去2年内或过去1年内已进行过结肠直肠癌筛查。
9.如权利要求7或8所述的方法,其中,所述受试者先前的结肠直肠癌筛查已诊断出所述受试者没患有结肠直肠癌。
10.如权利要求9所述的方法,其中,已诊断出所述受试者没患有结肠直肠癌的先前结肠直肠癌筛查是在一年内。
11.如权利要求9或10所述的方法,其中,已诊断出所述受试者没患有结肠直肠癌的先前结肠直肠癌筛查是结肠镜检查。
12.如权利要求1至11中任一项所述的方法,其中,所述方法包括早期结肠直肠癌的诊断,任选地其中所述结肠直肠癌是0期、I期、IIA期、IIB期或IIC期结肠直肠癌。
13.如权利要求1至12中任一项所述的方法,其中,所述方法包括早期结肠直肠癌的诊断,其中所述癌尚未转移。
14.如权利要求1所述的方法,其中,使用选自由甲基化敏感性限制酶定量聚合酶链式反应(MSRE-qPCR)、甲基化特异性PCR、甲基化特异性核酸酶辅助的小等位基因富集PCR和下一代测序组成的组中的一种或多种方法确定甲基化状态。
15.一种试剂盒,所述试剂盒包括:
(a)用于检测表2、3或4中定义的一个DMR组中每个DMR基因座的甲基化状态的引物对,其中所述引物对是表5中的那些,
该试剂盒任选地进一步包括:
(b)至少一种甲基化特异性限制酶和/或亚硫酸氢盐试剂,
(c)聚合酶。
16.如权利要求1至14中任一项所述的方法,所述诊断还包括确定是否存在致癌突变。
17.如权利要求16所述的方法,其中,所述致癌突变在选自由Kras、NRAS、PIK3CA、PTEN、TP53、BRAF和APC基因组成的一组基因中的基因中。
CN202080077593.5A 2019-11-11 2020-09-21 结肠直肠癌和/或进行性腺瘤的检测 Pending CN114651073A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/680,427 2019-11-11
US16/680,427 US11898199B2 (en) 2019-11-11 2019-11-11 Detection of colorectal cancer and/or advanced adenomas
PCT/EP2020/076220 WO2021094017A1 (en) 2019-11-11 2020-09-21 Detection of colorectal cancer and/or advanced adenomas

Publications (1)

Publication Number Publication Date
CN114651073A true CN114651073A (zh) 2022-06-21

Family

ID=72752874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080077593.5A Pending CN114651073A (zh) 2019-11-11 2020-09-21 结肠直肠癌和/或进行性腺瘤的检测

Country Status (8)

Country Link
US (1) US11898199B2 (zh)
EP (1) EP4028556A1 (zh)
JP (1) JP2023500386A (zh)
KR (1) KR20220097503A (zh)
CN (1) CN114651073A (zh)
AU (1) AU2020384237A1 (zh)
CA (1) CA3155798A1 (zh)
WO (1) WO2021094017A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11396679B2 (en) 2019-05-31 2022-07-26 Universal Diagnostics, S.L. Detection of colorectal cancer
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
WO2022002424A1 (en) 2020-06-30 2022-01-06 Universal Diagnostics, S.L. Systems and methods for detection of multiple cancer types
EP4320276A1 (en) * 2021-05-14 2024-02-14 Universal Diagnostics, S.A. Methods for disease detection
WO2022238559A1 (en) * 2021-05-14 2022-11-17 Universal Diagnostics Sl Methods for disease detection
CN115537464B (zh) * 2021-06-30 2023-06-20 武汉艾米森生命科技有限公司 一种结直肠癌或癌前病变的诊断或辅助诊断试剂、核酸组合、试剂盒及应用
WO2023064053A1 (en) * 2021-10-15 2023-04-20 The Johns Hopkins University Camera-based hemoglobin detection
CN114594259B (zh) * 2022-04-22 2022-09-13 北京易科拜德科技有限公司 一种新型的用于结直肠癌预后预测和诊断的模型及其应用
WO2024105132A1 (en) * 2022-11-16 2024-05-23 Universal Diagnostics, S.A. Methods for stratification and early detection of advanced adenoma and/or colorectal cancer using dna methylation markers

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US6605432B1 (en) 1999-02-05 2003-08-12 Curators Of The University Of Missouri High-throughput methods for detecting DNA methylation
US6812339B1 (en) 2000-09-08 2004-11-02 Applera Corporation Polymorphisms in known genes associated with human disease, methods of detection and uses thereof
US7662549B1 (en) 2000-10-27 2010-02-16 The University Of Southern California Methylation altered DNA sequences as markers associated with human cancer
US20040142325A1 (en) 2001-09-14 2004-07-22 Liat Mintz Methods and systems for annotating biomolecular sequences
US20040265833A1 (en) 2003-06-23 2004-12-30 Cathy Lofton-Day Methods and nucleic acids for the analysis of colorectal cell proliferative disorders
JP2007119359A (ja) 2005-10-25 2007-05-17 Fujifilm Corp 癌抑制剤
WO2007143037A2 (en) * 2006-05-31 2007-12-13 Orion Genomics Llc Gene methylation in cancer diagnosis
EP2050828A3 (en) 2006-06-12 2009-08-26 Oncomethylome Sciences S.A. Methylation markers for early detection and prognosis of colon cancers
GB0700374D0 (en) 2007-01-09 2007-02-14 Oncomethylome Sciences S A NDRG family methylation markers
US20100298158A1 (en) 2007-05-21 2010-11-25 Dana-Farber Cancer Institute, Inc. Compositions, Kits, and Methods for Identification, Assessment, Prevention, and Therapy of Cancer
BRPI0811755A2 (pt) 2007-06-22 2014-11-11 Univ Columbia Amplificação específica de senquência de dna específicas de tumor.
WO2010062914A1 (en) 2008-11-26 2010-06-03 The Johns Hopkins University Methods for identifying cancer risk
US20110318738A1 (en) 2008-12-23 2011-12-29 University Of Utah Research Foundation Identification and regulation of a novel dna demethylase system
DK2420578T3 (en) 2009-04-17 2017-10-02 Nat Defense Medical Center A method of screening for cancer
US8048634B2 (en) 2009-08-18 2011-11-01 National Defense Medical Center Cancer screening method
US10428388B2 (en) 2009-11-05 2019-10-01 Genomictree, Inc. Method for detecting the methylation of colorectal-cancer-specific methylation marker genes for colorectal cancer diagnosis
KR101142131B1 (ko) 2009-11-05 2012-05-11 (주)지노믹트리 장암 진단을 위한 장암 특이적 메틸화 마커 유전자의 메틸화 검출방법
WO2011126768A2 (en) 2010-03-29 2011-10-13 Mayo Foundation For Medical Education And Research Methods and materials for detecting colorectal cancer and adenoma
NZ608153A (en) 2010-09-13 2014-12-24 Clinical Genomics Pty Ltd Epigenetic markers of colorectal cancers and diagnostic methods using the same
US9957570B2 (en) 2010-10-04 2018-05-01 The Johns Hopkins University DNA hypermethylation diagnostic biomarkers for colorectal cancer
EP2481813A1 (en) 2011-02-01 2012-08-01 Centro di Riferimento Oncologico - Istituto Nazionale Tumori - Aviano Markers of cutaneous melanoma and uses thereof
GB201102014D0 (en) 2011-02-04 2011-03-23 Ucl Business Plc Method for predicting risk of developing cancer
US10752953B2 (en) 2011-05-12 2020-08-25 The Johns Hopkins University Method of detecting cancer through generalized loss of stability of epigenetic domains, and compositions thereof
US8557787B2 (en) * 2011-05-13 2013-10-15 The Board Of Trustees Of The Leland Stanford Junior University Diagnostic, prognostic and therapeutic uses of long non-coding RNAs for cancer and regenerative medicine
US20130065228A1 (en) 2011-06-01 2013-03-14 University Of Southern California Genome-scale analysis of aberrant dna methylation in colorectal cancer
WO2012170715A1 (en) 2011-06-07 2012-12-13 Caris Mpi, Inc. Molecular profiling for cancer
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
AU2012324545A1 (en) 2011-10-17 2014-06-05 King Abdullah University Of Science And Technology Composite biomarker for non-invasive screening, diagnosis and prognosis of colorectal cancer
EP2798088B1 (en) 2011-12-27 2018-06-06 Region Syddanmark Detection of adenomas of the colon or rectum
WO2013142545A1 (en) 2012-03-20 2013-09-26 Exact Sciences Corporation Marker panel for detecting cancer
US10941449B2 (en) 2012-05-18 2021-03-09 Clinical Genomics Pty. Ltd. Method of screening for colorectal cancer
EP2891719A4 (en) 2012-08-28 2016-06-15 Istat Biomedical Co Ltd COMPOSITION TEST FOR CANCER SCREENING
EP2899275B1 (en) 2012-09-19 2018-06-27 Sysmex Corporation Method for obtaining information about endometrial cancer, and marker and kit for obtaining information about endometrial cancer
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
WO2014062218A1 (en) 2012-10-16 2014-04-24 University Of Southern California Colorectal cancer dna methylation markers
US20130189684A1 (en) 2013-03-12 2013-07-25 Sequenom, Inc. Quantification of cell-specific nucleic acid markers
EP4234721A3 (en) 2013-03-14 2023-10-18 Mayo Foundation for Medical Education and Research Detecting neoplasm
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
EP2886659A1 (en) 2013-12-20 2015-06-24 AIT Austrian Institute of Technology GmbH Gene methylation based colorectal cancer diagnosis
WO2015116837A1 (en) 2014-01-30 2015-08-06 The Regents Of The University Of California Methylation haplotyping for non-invasive diagnosis (monod)
EP4234722A3 (en) 2014-03-31 2023-09-20 Mayo Foundation for Medical Education and Research Detecting colorectal neoplasm
EP4306659A3 (en) 2014-04-14 2024-03-27 Yissum Research and Development Company of the Hebrew University of Jerusalem Ltd. A method and kit for determining the tissue or cell origin of dna
JP6418595B2 (ja) 2014-07-11 2018-11-07 シスメックス株式会社 複数種類の癌に関する情報を取得する方法、システムおよびプログラム
US20170356051A1 (en) 2014-10-17 2017-12-14 Tohoku University Method for estimating sensitivity to drug therapy for colorectal cancer
WO2016109712A1 (en) 2014-12-31 2016-07-07 Case Western Reserve University Methods and compositions for detecting esophageal neoplasias and/or metaplasias in the esophagus
EP3294906A1 (en) 2015-05-11 2018-03-21 Natera, Inc. Methods and compositions for determining ploidy
BR112017024747A2 (pt) 2015-05-18 2018-11-13 Karius Inc composições e métodos para enriquecer populações de ácidos nucleicos
GB201511152D0 (en) 2015-06-24 2015-08-05 Ucl Business Plc Method of diagnosing bladder cancer
JP6931236B2 (ja) 2015-07-23 2021-09-01 ザ チャイニーズ ユニバーシティ オブ ホンコン 無細胞dnaの断片化パターンの分析
US10428391B2 (en) 2015-07-27 2019-10-01 The Johns Hopkins University Method to use viral and host methylation markers for cervical cancer screening and triage in liquid prep, serum/plasma, and urine: PCR and sequencing based process methods
US20170101674A1 (en) 2015-08-21 2017-04-13 Toma Biosciences, Inc. Methods, compositions, and kits for nucleic acid analysis
KR20180081042A (ko) 2015-08-31 2018-07-13 메이오 파운데이션 포 메디칼 에쥬케이션 앤드 리써치 위 신생물 검출 방법
WO2017043497A1 (ja) 2015-09-08 2017-03-16 国立大学法人山口大学 大腸腫瘍の有無を検査する方法
EP3350344A1 (en) 2015-09-17 2018-07-25 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Cancer detection methods
EP3443066A4 (en) 2016-04-14 2019-12-11 Guardant Health, Inc. EARLY DETECTION METHODS FOR CANCER
US10370726B2 (en) * 2016-04-14 2019-08-06 Mayo Foundation For Medical Education And Research Detecting colorectal neoplasia
EP3452620A4 (en) 2016-05-04 2020-01-01 Queen's University At Kingston CELL-FREE DETECTION OF METHYLATED TUMOR DNA
WO2017192221A1 (en) 2016-05-05 2017-11-09 Exact Sciences Corporation Detection of lung neoplasia by analysis of methylated dna
GB2568608B (en) 2016-05-27 2022-10-12 Personalis Inc Personalized genetic testing
US10006925B2 (en) 2016-05-30 2018-06-26 Universal Diagnostics, S. L. Methods and systems for metabolite and/or lipid-based detection of colorectal cancer and/or adenomatous polyps
US11499196B2 (en) 2016-06-07 2022-11-15 The Regents Of The University Of California Cell-free DNA methylation patterns for disease and condition analysis
WO2018057888A1 (en) 2016-09-23 2018-03-29 Driver, Inc. Integrated systems and methods for automated processing and analysis of biological samples, clinical information processing and clinical trial matching
US20190352721A1 (en) 2016-09-29 2019-11-21 Hanumat Co., Ltd. Method for determining likelihood of sporadic colorectal cancer development
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
WO2018087129A1 (en) 2016-11-08 2018-05-17 Region Nordjylland, Aalborg University Hospital Colorectal cancer methylation markers
CN110325650A (zh) 2016-12-22 2019-10-11 夸登特健康公司 用于分析核酸分子的方法和系统
AU2018211956A1 (en) 2017-01-27 2019-07-25 Exact Sciences Corporation Detection of colon neoplasia by analysis of methylated DNA
WO2018195211A1 (en) 2017-04-19 2018-10-25 Singlera Genomics, Inc. Compositions and methods for detection of genomic variance and dna methylation status
WO2018209361A2 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Universal early cancer diagnostics
EP3431612A1 (en) 2017-07-20 2019-01-23 INSERM (Institut National de la Santé et de la Recherche Médicale) Method for molecular typing of tumors in a single targeted next generation sequencing experiment
US11674962B2 (en) 2017-07-21 2023-06-13 Genentech, Inc. Therapeutic and diagnostic methods for cancer
MX2020001575A (es) 2017-08-07 2020-11-18 Univ Johns Hopkins Materiales y métodos para evaluar y tratar el cáncer.
WO2019035100A2 (en) 2017-08-18 2019-02-21 University Of Southern California PROGNOSTIC MARKERS OF CANCER RECIDIVE
WO2019068082A1 (en) 2017-09-29 2019-04-04 Arizona Board Of Regents On Behalf Of The University Of Arizona DNA METHYLATION BIOMARKERS FOR THE DIAGNOSIS OF CANCER
CA3084584A1 (en) * 2017-11-30 2019-06-06 Mayo Foundation For Medical Education And Research Detecting breast cancer
EP3765638A2 (en) 2018-03-13 2021-01-20 Yissum Research Development Company of the Hebrew University of Jerusalem Ltd. Diagnostic use of cell free dna chromatin immunoprecipitation
US20200017916A1 (en) 2018-05-31 2020-01-16 Wright State University Blood-based biomarkers for the detection of colorectal cancer
WO2020069350A1 (en) 2018-09-27 2020-04-02 Grail, Inc. Methylation markers and targeted methylation probe panel
KR20210099044A (ko) 2018-11-27 2021-08-11 이그젝트 싸이언스 디블롭먼트 컴패니, 엘엘씨 폐 신생물 검출에서 메틸화된 dna, rna, 및 단백질의 특성화
US10533214B2 (en) 2018-12-21 2020-01-14 Inivata Ltd. Method for measuring mutational load
CA3127329A1 (en) 2019-01-24 2020-07-30 Mayo Foundation For Medical Education And Research Detecting endometrial cancer
US20200365229A1 (en) 2019-05-13 2020-11-19 Grail, Inc. Model-based featurization and classification
WO2020236939A2 (en) 2019-05-23 2020-11-26 Paradigm Diagnostics Tissue preparation using nuclease
US11396679B2 (en) 2019-05-31 2022-07-26 Universal Diagnostics, S.L. Detection of colorectal cancer
US11001898B2 (en) 2019-05-31 2021-05-11 Universal Diagnostics, S.L. Detection of colorectal cancer
AU2020285322A1 (en) 2019-05-31 2021-12-16 Universal Diagnostics, S.A. Detection of colorectal cancer
EP3983431A4 (en) 2019-06-17 2023-12-13 The Board of Trustees of the Leland Stanford Junior University DIAGNOSES AND TREATMENTS BASED ON MOLECULAR CHARACTERIZATION OF COLORECTAL CANCER
EP4004238A1 (en) 2019-07-23 2022-06-01 Grail, LLC Systems and methods for determining tumor fraction
US20220403471A1 (en) 2019-08-27 2022-12-22 Exact Sciences Corporation Characterizing methylated dna, rna, and proteins in subjects suspected of having lung neoplasia
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
US20210332440A1 (en) 2020-04-17 2021-10-28 Universal Diagnostics, S.L. Detection of advanced adenoma and/or early stage colorectal cancer
US20210324477A1 (en) 2020-04-21 2021-10-21 Grail, Inc. Generating cancer detection panels according to a performance metric
US20210355542A1 (en) 2020-05-15 2021-11-18 Universal Diagnostics, S.L. Methods and systems for identifying methylation biomarkers
WO2022003572A1 (en) 2020-06-29 2022-01-06 Epify B.V. Method for detecting colorectal cancer
WO2022002424A1 (en) 2020-06-30 2022-01-06 Universal Diagnostics, S.L. Systems and methods for detection of multiple cancer types
WO2022002423A1 (en) 2020-06-30 2022-01-06 Universal Diagnostics, S.L. Detection of colorectal neoplasms
CN117813403A (zh) 2021-05-14 2024-04-02 通用诊断股份公司 用于疾病检测的方法

Also Published As

Publication number Publication date
US20210139948A1 (en) 2021-05-13
EP4028556A1 (en) 2022-07-20
JP2023500386A (ja) 2023-01-05
CA3155798A1 (en) 2021-05-20
US11898199B2 (en) 2024-02-13
AU2020384237A1 (en) 2022-05-05
WO2021094017A1 (en) 2021-05-20
KR20220097503A (ko) 2022-07-07

Similar Documents

Publication Publication Date Title
US11898199B2 (en) Detection of colorectal cancer and/or advanced adenomas
US11396679B2 (en) Detection of colorectal cancer
EP3963111B1 (en) Detection of colorectal cancer
US20230183815A1 (en) Detection of colorectal neoplasms
US20210332440A1 (en) Detection of advanced adenoma and/or early stage colorectal cancer
EP4150121A1 (en) Systems and methods for detection of multiple cancer types
US20210230707A1 (en) Detection of colorectal cancer
US20220411878A1 (en) Methods for disease detection
US20240158862A1 (en) Methods for stratification and early detection of advanced adenoma and/or colorectal cancer using dna methylation markers
EP4299764A1 (en) Methods for detecting pancreatic cancer using dna methylation markers
WO2024105132A1 (en) Methods for stratification and early detection of advanced adenoma and/or colorectal cancer using dna methylation markers
TW202307218A (zh) 用於疾病偵測的方法
TW202311533A (zh) 用於疾病偵測的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40067265

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Seville, Spain

Applicant after: General Diagnostics AG

Address before: Seville, Spain

Applicant before: General diagnostics