CN109069670A - 妇科肿瘤的诊断方法 - Google Patents

妇科肿瘤的诊断方法 Download PDF

Info

Publication number
CN109069670A
CN109069670A CN201780015221.8A CN201780015221A CN109069670A CN 109069670 A CN109069670 A CN 109069670A CN 201780015221 A CN201780015221 A CN 201780015221A CN 109069670 A CN109069670 A CN 109069670A
Authority
CN
China
Prior art keywords
sample
carcinoma
endometrium
methylation
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780015221.8A
Other languages
English (en)
Other versions
CN109069670B (zh
Inventor
赖鸿政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youxun Medical Devices Co ltd
Original Assignee
Taipei Medical University TMU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taipei Medical University TMU filed Critical Taipei Medical University TMU
Publication of CN109069670A publication Critical patent/CN109069670A/zh
Application granted granted Critical
Publication of CN109069670B publication Critical patent/CN109069670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57442Specifically defined cancers of the uterus and endometrial
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • G01N2333/4701Details
    • G01N2333/4703Regulators; Modulating activity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/902Oxidoreductases (1.)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2440/00Post-translational modifications [PTMs] in chemical analysis of biological material
    • G01N2440/12Post-translational modifications [PTMs] in chemical analysis of biological material alkylation, e.g. methylation, (iso-)prenylation, farnesylation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Cell Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Reproductive Health (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

在此揭示多种方法,其可基于一或更多种标记基因的高度甲基化以决定是否有妇科肿瘤或妇科肿瘤的恶性程度。

Description

妇科肿瘤的诊断方法
技术领域
本揭示内容是关于癌症的诊断。具体来说,本揭示内容是基于特定基因标记的甲基化状况来进行癌症诊断的方法。
背景技术
妇科癌是指起源于女性生殖器官的异常细胞不受控制的生长。妇科癌的主要类型包括子宫颈癌、卵巢癌、子宫内膜癌/子宫癌(以下简称子宫内膜癌)、阴道癌与阴门癌;另外,妊娠性滋养层细胞疾病(gestational trophoblastic disease,GTD)与原发性腹膜癌则属于较罕见的妇科癌。
子宫内膜癌(endometrial cancer,EC)是全美好发的妇科癌之一,也是全球妇女癌症确诊数第六高的疾病。根据世界卫生组织的GLOBOCAN计划统计,在2012年,子宫内膜癌的罹病人数与死亡人数分别是大约31万人与7万6千人,而预估在2020年,每年会有38万笔新确诊病例以及9万3千人死亡。
大多数的子宫内膜癌患者为停经妇女。然而,对于尚未显示症状的患者,目前仍没有方便、可靠的检测方法。对于出现症状或患病风险较高的女性,则可以采集子宫内膜检体或进行阴道超声波,以诊断或排除子宫内膜癌。
透过组织病理学的评估,可将子宫内膜癌分为两大类。第一型子宫内膜癌包含高度至中度分化(第1至2级)的子宫内膜样腺癌(endometrioid adenocarcinomas)。第二型子宫内膜癌包含浆液性(serous type)、亮细胞(clear cell)与分化不良(第3级)的子宫内膜样腺癌。大多数的第一型EC可在早期(第I或II期)诊断出来,且其预后通常较佳;但第二型EC一般都是在较晚期才被确诊,预后也相对较差。虽然大多数的子宫内膜样类型的EC患者可在早期被确诊,但仍有15%的患者在晚期才被发现,且5年存活率低于50%(第III期约40–50%;第IV期约15–20%)。因此,早期诊断仍然是改善患者预后的最佳方案。然而,目前没有理想的方法能用于EC筛检。
EC最常见的症状是异常的子宫出血,但还有很多其它疾病也会导致相同的症状。即使当停经后妇女的子宫出现流血症状时,只有10%的案例是由EC引起的。如何选择理想的检查方案取决于敏感性、特异性、概率准确度与成本。可利用阴道超声波(Transvaginalultrasound,TVU)来排除EC。然而,出现症状的停经后妇女以及采用荷尔蒙替代疗法的妇女的TVU门坎值较低,因为血液循环中的女性类固醇荷尔蒙会导致子宫内膜厚度变异。相较于TUV,在门诊透过抽吸刮除法取得的子宫内膜样本在诊断上的敏感性与特异性可能较高。不过,这种侵入性程序的失败率可能高达54%。当妇女不适合进行子宫内膜采样,或无法得到确定诊断结果时,临床指引推荐在麻醉下进行分段扩刮术(dilatation and curettage,D&C)。因此,许多患者会经历重复的侵入性诊断程序,包括子宫内膜采样或D&C,不但造成患者不便,也增加患者心理与经济上的负担。
另一方面,子宫镜手术的诊断准确度较高,在停经前与停经后的妇女中,其整体敏感度与特异性分别高达86.4%与99.2%。即便如此,对于经TVU诊断出子宫内膜厚度之后,子宫内膜厚度高于多少门坎值才应进一步进行子宫内膜采样或子宫镜手术,目前仍有争议。另一种非侵入式的EC诊断是测量血清与子宫颈阴道的血清癌抗原(CA)–125浓度。但CA-125检测的准确度很容易受到一些良性状况的影响,譬如子宫肌腺症或子宫肌瘤以及子宫内膜异位等。亦可利用子宫颈口细胞进行细胞学分析来诊断EC,但异常结果的比例在第一型EC中约有32.3%至86.0%,而第二型EC则是约57.1%至100%。
有鉴于此,相关领域亟需提出一种用以诊断妇科肿瘤(特别是子宫内膜癌)的方法。
发明内容
发明内容旨在提供本揭示内容的简化摘要,以使阅读者对本揭示内容具备基本的理解。此发明内容并非本揭示内容的完整概述,且其用意并非在指出本发明实施例的重要/关键组件或界定本发明的范围。
本发明的一方面是关于用以评估一个体是否患有子宫内膜癌(EC)的方法。
根据本揭示内容一实施方式,此方法包含以下步骤:
(a)由该个体取得一样本;
(b)决定该样本中至少一目标基因的甲基化状况,其中上述至少一目标基因是BHLHE22(序列编号:1)或THY1(序列编号:2)或两者;
(c)决定该至少一目标基因是否高度甲基化;以及
(d)基于步骤(c)的结果评估该个体是否罹患EC,其中至少
一目标基因的高度甲基化代表该个体罹患EC。
根据本揭示内容多种不同的实施方式,所述样本是取自一个体(较佳为人体)的样本或原存在于个体(较佳为人体)内的样本。举例来说,所述样本是取自于个体的子宫内膜组织或细胞样本(如,子宫颈抹片细胞)。
根据本揭示内容某些实施方式,所述至少一目标基因还包含下列额外基因其中至少一种:ADARB2(序列编号:3)、CDO1(序列编号:4)、CELF4(序列编号:5)、CLVS2(序列编号:6)、GATA4(序列编号:7)、HOXA9(序列编号:8)、MTMR7(序列编号:9)、NTM(序列编号:10)、PRKCDBP(序列编号:11)、TBX5(序列编号:12)以及ZNF662(序列编号:13)。在这些实施方式中,决定BHLHE22及/或THY1的甲基化状况,并决定至少一种额外基因的甲基化状况,而后在步骤(d)中,基于上述所选基因的高度甲基化状况来进行评估。
根据其它实施方式,所述至少一目标基因包含BHLHE22、CDO1、THY1、CELF4、CLVS2、GATA4、NTM、PRKCDBP与TBX5。
根据某些实施方式,所述至少一目标基因包含BHLHE22与CDO1。在其它情形中,所述至少一目标基因包含BHLHE22与CELF4。或者是,上述至少一基因包含BHLHE22、CDO1与CELF。在这些情形中,于步骤(b)决定BHLHE22还有CDO1和CELF4其中之一或两者的甲基化状况,并且在步骤(d)中,基于BHLHE22还有CDO1和CELF4其中之一或两者的高度甲基化状况来进行评估。在视需要而采用的实施方式中,所述样本是取自于个体的子宫颈抹片细胞。
根据本揭示内容多种实施方式,所述子宫内膜癌是第一型子宫内膜癌;在其它实施方式中,所述子宫内膜癌是第二型子宫内膜癌。
在视需要而实施的实施方式中,可利用以下技术进行本揭示内容上述实施方式中所述的测定基因甲基化状况的步骤:甲基化特异度聚合酶连锁反应(methylation-specific polymerase chain reaction;MSP)、定量甲基化特异度聚合酶连锁反应(quantitative methylation-specific polymerase chain reaction;qMSP)、亚硫酸盐测序(bisulfite sequencing;BS)、亚硫酸盐焦磷酸测序(bisulfite pyrosequencing)、微数组(microarrays)、质谱分析(mass spectrometry)、变性高液相层析法(denaturing high-performance liquid chromatography;DHPLC)、焦磷酸测序法(pyrosequencing)、甲基化DNA免疫沉淀法与定量聚合酶连锁反应(methylated DNA immunoprecipitation(MeDIP或mDIP)coupled with quantitative polymerase chain reaction)、甲基化DNA免疫沉淀测序法(methylated DNA immunoprecipitation sequencing;MeDIP-seq)或纳米孔测序法(nanopore sequencing)。
本发明的另一方面是关于用以评估一个体是否患有妇科癌或结肠癌的方法。
根据本揭示内容一实施方式,此方法包含以下步骤:
(a)由该个体取得一样本;
(b)决定该样本中至少一目标基因的甲基化状况,其中上述至少一目标基因是选自由以下所组成的群组:ADARB2(序列编号:3)、CLVS2(序列编号:6)、HOXA9(序列编号:8)、MTMR7(序列编号:9)以及NTM(序列编号:10);
(c)决定该至少一目标基因是否高度甲基化;以及
(d)基于步骤(c)的结果评估该个体是否罹患妇科癌或结肠癌,其中至少一目标基因的高度甲基化代表该个体罹患妇科癌或结肠癌。
根据本揭示内容多种不同的实施方式,所述样本是取自一个体(较佳为人体)的样本或原存在于个体(较佳为人体)内的样本。举例来说,所述样本是取自于个体的子宫内膜组织或细胞样本(如,子宫颈抹片细胞)。
在本发某些实施方式中,所述妇科癌为第一型子宫内膜癌、第二型子宫内膜癌、卵巢癌、阴道癌、阴门癌、妊娠性滋养层细胞疾病(gestational trophoblastic disease,GTD)以及原发性腹膜癌(primary peritoneal carcinoma)。
在视需要而实施的实施方式中,可利用以下技术进行本揭示内容上述实施方式中所述的测定基因甲基化状况的步骤:甲基化特异度聚合酶连锁反应(MSP)、定量甲基化特异度聚合酶连锁反应(qMSP)、亚硫酸盐测序(BS)、亚硫酸盐焦磷酸测序、微数组、质谱分析、变性高液相层析法(DHPLC)、焦磷酸测序法、甲基化DNA免疫沉淀法与定量聚合酶连锁反应、甲基化DNA免疫沉淀测序法(MeDIP-seq)或纳米孔测序法。
本揭示内容的又另一方面是关于本案所述的生物标记的用途。具体来说,所述一或多生物标记可用制备一诊断试剂盒,以用于评估个体是否患有与上述一或多个标记相关的癌症。
当可想见,本揭示内容的范围亦涵盖各种诊断试剂盒,这些试剂盒可用以测量上述生物标记的甲基化程度。
在参阅下文实施方式后,本发明所属技术领域中具有通常知识者当可轻易了解本发明的基本精神及其它发明目的,以及本发明所采用的技术手段与实施方式。
附图说明
为让本发明的上述与其它目的、特征、优点与实施例能更明显易懂,所附图式的说明如下:
第1图为根据本揭示内容一实验例的相关矩阵(图框A)与热图(图框B),其绘示来自MBDcap-Seq以及癌症基因组图谱(TCGA)的组织公开数据的候选基因的甲基化特征;
第2图摘要整理了根据本揭示内容一实施方式,BHLHE22、CDO1、CELF4以及ZNF662等基因的甲基化程度分布图(图框A)以及上述四种基因的分析效力(图框B);
第3图摘要整理了根据本揭示内容一实施方式,子宫内膜组织样本中15个候选基因的甲基化状况,其可用于侦测子宫内膜癌;
第4图摘要整理了根据本揭示内容一实施方式,子宫颈抹片样本中12个候选基因的甲基化程度,其可用于侦测子宫内膜癌;
第5图摘要整理了根据本揭示内容一实施方式,某些候选基因针对训练集(图框A)与测试集(图框B)样本的分析效力;以及
第6图摘要整理了根据本揭示内容一实施方式,在结肠癌或卵巢癌中交互测试候选基因的结果。
具体实施方式
为了使本揭示内容的叙述更加详尽与完备,下文针对了本发明的实施方式与具体实施例提出了说明性的描述;但这并非实施或运用本发明具体实施例的唯一形式。实施方式中涵盖了多个具体实施例的特征以及用以建构与操作这些具体实施例的方法步骤与其顺序。然而,亦可利用其它具体实施例来达成相同或均等的功能与步骤顺序。
除非本说明书另有定义,此处所用的科学与技术词汇的含义与本发明所属技术领域中具有通常知识者所理解与惯用的意义相同。
此外,在不和上下文冲突的情形下,本说明书所用的单数名词涵盖该名词的复数型;而所用的复数名词时亦涵盖该名词的单数型。具体来说,除非上下文另有明确的说明,否则在本说明书与申请专利范围中,单数型式的“一”包含“复数个”。此外,在本说明书与申请专利范围中,“至少一”与“一或更多”等表述方式的意义相同,两者都代表包含了一、二、三或更多。更有甚者,在本说明书与申请专利范围中,“A、B及C其中至少一者”、“A、B或C其中至少一者”以及“A、B和/或C其中至少一者”系指涵盖了仅有A、仅有B、仅有C、A与B两者、B与C两者、A与C两者、以及A、B与C三者。
虽然用以界定本发明较广范围的数值范围与参数皆是约略的数值,此处已尽可能精确地呈现具体实施例中的相关数值。然而,任何数值本质上不可避免地含有因个别测试方法所致的标准偏差。在此处,“约”通常系指实际数值在一特定数值或范围的正负10%、5%、1%或0.5%之内。或者是,“约”一词代表实际数值落在平均值的可接受标准误差之内,视本发明所属技术领域中具有通常知识者的考虑而定。除了实验例之外,或除非另有明确的说明,当可理解此处所用的所有范围、数量、数值与百分比(例如用以描述材料用量、时间长短、温度、操作条件、数量比例及其它相似者)均经过“约”的修饰。因此,除非另有相反的说明,本说明书与附随申请专利范围所揭示的数值参数皆为约略的数值,且可视需求而更动。至少应将这些数值参数理解为所指出的有效位数与套用一般进位法所得到的数值。在此处,将数值范围表示成由一端点至另一段点或介于二端点之间;除非另有说明,此处所述的数值范围皆包含端点。
在此所述“诊断(diagnosis)”一词是指鉴别病理状态、疾病或症状,例如不同妇科组织来源的肿瘤,包含子宫颈、卵巢、子宫内膜/子宫、阴道、阴门、子宫与衬接子宫的腹膜。在某些实例中,所述“诊断”一词是指鉴别恶性和良性瘤。在另一些实例中,诊断一词系指鉴别恶性肿瘤与正常组织。
在本揭示内容中,所述“肿瘤(neoplasm)”一词是指异常新生的细胞或生长速度较正常细胞快的异常生长细胞。肿瘤会产生良性或恶性的无结构团块(肿块)。所谓“良性(benign)”是指非癌性的瘤或肿瘤,如,其细胞不会侵袭周边组织或转移至远处;而“恶性”则是指转移性瘤或肿瘤,其可侵袭周边组织且不受正常细胞生长控制。
在本文中,“癌(cancer)”一词是指动物中所有类型的癌症或恶性瘤或肿瘤。依据本揭示内容多种不同的实施方式,此处揭示的方法是关于一或多种源自妇科器官/组织的恶性肿瘤的诊断和/或预后。“癌症(carcinoma)”一词是指源自于上皮细胞的恶性肿瘤或癌。举例而言,本揭示内容多种实施方式所示的妇科癌症包含,但不限于,卵巢癌、子宫内膜癌、阴道癌、阴门癌以及原发性腹膜癌。
当位于基因的核心启动子区域的CpG双核苷酸内的胞嘧啶的C5位置和甲基团共价键结时,称为“甲基化”。所述“甲基化状况(methylation state)”是指基因或一感兴趣的核酸序列内一或多个CpG双核苷酸上是否存在5-甲基-胞嘧啶(5-mCyt)。在此,所述“甲基化程度(methylation level)”是指基因或核酸序列的一或多个复本中甲基化的量。可将所述感兴趣的基因或核酸序列的甲基化程度表示成绝对数值。再者,也可采用“相对甲基化程度(relative methylation level)”的概念,以甲基化DNA的量相对于DNA总量来表示,或者是表示成甲基化的基因或核酸序列的复本数目相对于该基因或核酸序列的复本总数。此外,“甲基化程度(methylation level)”则是指在感兴趣的DNA片段中,甲基化的CpG部位所占的百分比。
在此所述“甲基化图谱(methylation profile)”是指样本中一或多个目标基因的甲基化程度的一组数据。在某些实施方式中,所述甲基化图谱是相较于从未知类型的样本所取得的一甲基化参照图谱的图谱,所述样本例如癌化样本或非癌化样本或不同癌症阶段的样本。
在此处,“差异性甲基化(differential methylation)”是指样本或族群中一或多个目标基因甲基化程度和其它样本或族群中一或多个目标基因甲基化程度两者间有所差异。差异性甲基化可区分为甲基化程度提升(高度甲基化(hypermethylation))或甲基化程度减少(低度甲基化(hypomethylation))。在此处,“高度甲基化”是指测试样本中目标基因的甲基化程度比参照样本中目标基因的平均甲基化程度增加至少10%。依据本揭示内容多种不同的实施方式,所述甲基化程度增加是指增加至少15、20、25、30、35、40、45或50%。
当可想见,在本揭示内容中所述的所有基因或多核苷酸序列各包含其变异体,这些变异体和所述基因或多核苷酸序列有至少75%的核苷酸序列相似度。再者,除非另有指明,在任情况下,本揭示内容的基因或多核苷酸序列可以“有至少75%核苷酸序列相似度之多核苷酸”一词取代。因此,除非另有相反的说明,此处所述的基因或多核苷酸序列在皆可理解为涵盖“其亚硫酸盐转化序列以及与该基因或该亚硫酸盐转化序列有至少75%核苷酸序列相似度的多核苷酸序列”。
此处针对核苷酸序列所述的“序列相似度百分比”(Percent(%)sequenceidentity)系指一候选序列的核苷酸残基与一参考多核苷酸序列的核苷酸残基完全相同的百分比。于进行上述比对时,可将所述的候选序列与所述参考多核苷酸序列并排,并于必要时引入间隙,以使二序列形成最高的序列相似度,且在计算相似度时,不会将保守性置换视为相同核苷酸。相关领域已有多种方法可供进行上述并排,譬如可公开取得的软件如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)等。本发明所属技术领域中具有通常知识者在进行并排时,可选择适当的参数与计算方式,以得到最佳的排列方式。一候选多核苷酸序列A相较于一参考多核苷酸序列B的核苷酸序列相似度(在本说明书中亦称之为序列A与序列B具有特定百分比(%)的核苷酸序列相似度)的计算方式如下:
其中X是利用Blastp或Blastn分析数据库对序列A、B进行排列后所得到的相同核苷酸残基数目(identical matches),而Y是A、B二序列中较短者的核苷酸残基总数。
在本说明书中,“个体”(个体)或“患者”(patient)等词可替换使用,其系指可利用本发明方法诊断和/或预后的动物,包含人类。因此,“个体”或“患者”包含任何可因本揭示内容的处置而获益的哺乳类动物。所述哺乳类动物涵盖哺乳动物纲的所有成员,包括人类、灵长类动物、家畜和农畜(如兔子、猪、绵羊和牛)、动物园动物或竞赛用动物、宠物,以及啮齿类动物(如,小鼠和大鼠)。“非人类哺乳动物”一词则涵盖除了人类以外的所有哺乳动物纲成员。在一实例中,所述患者为人类。
所述“样本”一词在此包含任何从个体或患者上取得的样本。依据本揭示内容的方法,所述样本包含可供测定甲基化程度的DNA分子。举例而言,所述从个体或患者上取得的样本包含,但不限于:血液、抹片、痰、尿液、粪便、体液、胆汁、肠胃道分泌物、淋巴液、骨肉瘤骨髓、器官抽出物和或组织切片。可利用所属技术领域中具有通常知识者习知的技术测定这些从个体或患者身上所取得的样本。再者,所属技术领域中具有通常知识者皆知可利用已知的方法与试剂从所述样本中分离出DNA,如,利用酚/氯仿或是以商用试剂盒萃取DNA。
本揭示内容至少一部分是基于发现个体内一或多个目标基因的差异性甲基化程度(特别是高度甲基化)与肿瘤进程及罹患肿瘤的相关性。因此,可以单独或组合使用这些目标基因作为生物标记,以用于预测个体患有肿瘤或瘤的风险或易感性,决定肿瘤的恶性程度。再者,可基于患者体内相关基因的甲基化程度,来量身打造个人化治疗方针。举例而言,对于带有一或多个高度甲基化目标基因的患者,可以施用去甲基化药剂或其它表基因药物(epigenetic drug)以治疗肿瘤。
有鉴于此,本揭示内容提供各种不同的诊断方法,分别列示如下。举例而言,在此所有的方法皆涵盖测定至少一目标基因的甲基化状况或甲基化程度。因此,下文先说明在多数(或所有)所请方法中,共通的步骤。
依据本揭示内容各种不同的方面和/或实施方式,本揭示内容所提出的方法至少包含以下共通步骤:(a)采样步骤;(b)至少一甲基化测定步骤;以及(c)至少一过甲基化决定步骤。
在采样步骤中,若所述方法涉及一活体,则自该个体取得一生物性样本。根据本揭示内容多种不同的实施方式,所述样本是取自一个体(较佳为人体)的样本或原存在于个体内的样本;所述样本包括组织、组织样本或细胞样本(如,组织切片,例如,针吸式切片、刷式切片、表面切片、针切片、穿刺样本、切除性切片、开放性切片、切开性切片、内视镜切片、子宫颈抹片细胞、子宫刮取细胞或阴道灌洗样本)、肿瘤、肿瘤样本或生物性液体(如,腹腔液、血液(含血浆)、血清、淋巴液、脊髓液)。依据本揭示内容特定的实施例,所述样本是取自于个体的卵巢组织、细胞样本(如,子宫颈抹片细胞)和体液(如,血清和血浆)。根据本发明某些实施例的方法直接使用生物性样本,譬如,组织切片样本、子宫颈抹片细胞和体液样本(如,血液或尿液);此时,可省略采样步骤,并取得既有样本以供后续分析。
关于步骤(b),在下文提出的实验例中,利用qMSP或亚硫酸盐焦磷酸测序来测定甲基化,但当可想见,本发明所述方法不限于此:反之,所请发明的范围涵盖能够定量地决定一特定基因的甲基化状况或程度的均等方法。此外,上述方法与其均等技术亦适用于下文所述的实施方式;因此,为求简洁,在下文所述方面/实施方式中不会重复适用于决定甲基化状况或程度的方法。
在过甲基化决定步骤(c)中,判定至少一目标基因是否发生高度甲基化。
在本揭示内容中,本揭示内容提出用以评估一个体是否患有子宫内膜癌妇科(endometrial cancer;EC)的方法,本方法包含上述共通步骤(a)、(b)与(c),以及一评估步骤(d);在此步骤中,基于步骤(c)的结果来决定该个体是否患有EC。具体来说,上述至少一目标基因的高度甲基化代表所述个体患有EC。根据本揭示内容某些实施方式,上述至少一目标基因未出现高度甲基化代表所述个体并未罹患子宫内膜瘤(endometrial neoplasm)或其子宫内膜瘤为良性;举例来说,子宫肌腺瘤(myoma)就是一种常见的良性子宫内膜瘤。
根据本揭示内容多种实施方式,所述至少一目标基因为BHLHE22或THY1或两者。
在某些实施方式中,除了BHLHE22及/或THY1之外,所述目标基因还包含至少一种以下基因:ADARB2、CDO1、CELF4、CLVS2、GATA4、HOXA9、MTMR7、NTM、PRKCDBP、TBX5以及ZNF662。
根据某些视需要而采用的实施方式,所述至少一目标基因包含BHLHE22与CDO1。在某些实施方式中,所述至少一目标基因包含BHLHE22、CDO1与TBX5。在另一些实施方式中,所述至少一目标基因包含BHLHE22、THY1、CDO1与CLVS2。在又另一些实施方式中,所述至少一目标基因包含BHLHE22、CDO1与CELF4。在另一例子中,所述至少一目标基因包含BHLHE22与CELF4。或者是,所述至少一目标基因包含THY1与CDO1。又或者是,所述至少一目标基因包含THY1与CDO1,还有CLVS2与GATA4其中任一者或两者。在某些实施方式中,所述至少一目标基因包含BHLHE22、CDO1、THY1、CELF4、CLVS2、GATA4、NTM、PRKCDBP与TBX5。
在某些实施方式中,当决定了一个以上目标基因的甲基化状况时,所述的评估步骤可基于这些基因是出现过甲基化而决定。
根据本揭示内容多种实施方式,所述样本来自该个体的子宫颈抹片细胞或子宫内膜样本。
根据本揭示内容某些实施方式,此处提出的方法可用以在早期(如,根据国际妇产科联合会原则判定的第I或II期)评估个体是否罹患子宫内膜癌。在某些视需要而采用的实施方式中,所述样本来自个体的子宫颈抹片细胞,且BHLHE22还有CDO1和CELF4两者中至少一个的过甲基化表示所述个体患有子宫内膜癌。根据本揭示内容多种实施方式,所述子宫内膜癌可以是第一型或第二型子宫内膜癌。相较于传统的诊断方法,通常都是在癌症发生的较后期(如,第III或IV期)才诊断出第二型子宫内膜癌,此处提出的方法能在癌症进展到较为恶性的阶段前及早诊断,这也是本案的优点之一。
当可理解,亦可运用本揭示内容所确认的生物标记来制备用以评估个体是否患有子宫内膜癌的诊断工具。
举例来说,所述试剂盒所包含的材料可用以决定一或更多种所述生物标记的甲基化程度,所述生物标记如:BHLHE22、THY1、ADARB2、CDO1、CELF4、CLVS2、GATA4、HOXA9、MTMR7、NTM、PRKCDBP、TBX5与ZNF662。
本揭示内容的第二个方面揭示用以评估个体是否罹患妇科癌或结肠癌的方法。所述方法亦包含上述共通步骤(a)、(b)与(c),且包含一评估步骤(d),在此步骤中基于步骤(c)的结果决定所述个体是否罹患妇科癌或结肠癌。具体来说,所述至少一目标基因的过甲基化代表所述个体患有妇科癌或结肠癌。根据本揭示内容某些实施方式,所述至少一目标基因未出现过甲基化代表该个体并未罹患妇科肿瘤或结肠肿瘤,或所述妇科肿瘤或结肠肿瘤是良性的。
根据本揭示内容多种实施方式,所述至少一目标基因是选自以下所组成的群组:ADARB2、CLVS2、HOXA9、MTMR7与NTM。
根据本揭示内容某些实施方式,所述妇科癌是第一型子宫内膜癌、第二型子宫内膜癌、卵巢癌、阴道癌、阴门癌、妊娠性滋养层细胞疾病(GTD)或原发性腹膜癌。
相似地,亦可运用本揭示内容所确认的生物标记来制备用以评估个体是否患有妇科癌或结肠癌的诊断工具。
举例来说,所述试剂盒所包含的材料可用以决定一或更多种所述生物标记的甲基化程度,所述生物标记如:ADARB2、CLVS2、HOXA9、MTMR7与NTM。
下文提出多个实验例来说明本发明的某些方面,以利本发明所属技术领域中具有通常知识者实作本发明,且不应将这些实验例视为对本发明范围的限制。据信习知技艺者在阅读了此处提出的说明后,可在不需过度解读的情形下,完整利用并实践本发明。此处所引用的所有公开文献,其全文皆视为本说明书的一部分。
材料与方法
1.组织样本
所有组织样本都是在2014年10月至2015年5月间,于台北医学大学附设双和医院取得。所纳入的个体为30至80岁的女性。从每一参与者的医院病例收集以下信息:年纪、肿瘤的组织分类、国际妇产科联合会癌症期别与组织分类。本试验经台北医学大学附设双和医院人体试验委员会同意,并遵循赫尔辛基2000宣言。本试验取得所有参与者的知情同意。
从手术取得子宫内膜样本后立刻以液态氮冷冻并储存于-80℃,以供后续使用。由妇产科病理医师进行组织检验,以对每一样本进行病理学诊断。刮取子宫肌瘤患者卵巢上皮细胞,以得到正常上皮卵巢组织样本。
从经诊断患有子宫肌瘤或恶性子宫内膜肿瘤的患者以及在取样时并未罹患卵巢与子宫颈疾病的女性患者身上取得子宫颈抹片细胞。内子宫颈(endocervical)抹片细胞的采集步骤如下。将新的内子宫颈采样刷伸入内子宫颈管,接着,轻轻的旋转采样刷三至五次,以确保采样确实。其后,将采样刷浸入含2毫升(Ambion;Lifetechnologies;USA)的离心管(15毫升)中,接着将离心管封盖。将内子宫颈抹片细胞样本存放于4℃。以震荡器混合10秒后,将含抹片细胞的样本平均分配至三个离心管中(每管1毫升),并将其存放在-80℃备用。
2.发现及验证
在发现组中,使用来自以下数据库的公开数据来识别甲基化生物标记:癌症基因组图谱(The Cancer Genome Atlas,TCGA),包括270个恶性子宫内膜肿瘤组织和28个正常子宫内膜组织;Em-MethylCap-seq,包括78个恶性子宫内膜肿瘤组织和11个正常子宫内膜组织;以及HCL数据,包括10个恶性子宫内膜肿瘤组织和10个子宫肌瘤中的正常子宫内膜组织。用来验证甲基化生物标记的样本包括:25个子宫内膜恶性肿瘤组织、5个子宫肌瘤的正常子宫内膜组织,以及15、10与15个分别来自子宫内膜恶性肿瘤组织、子宫肌瘤以及正常子宫内膜组织的子宫颈抹片细胞。
对于验证组中的训练集,使用来自患有子宫内膜癌、子宫肌瘤患者与健康患者的子宫颈抹片细胞,每组样本数为28个。实验例1验证组中的测试集使用了相同的样本数目。实验例2中的验证组的测试集分别使用了50、40以及56个来自患有子宫内膜恶性肿瘤组织、子宫肌瘤的患者以及正常子宫内膜的患者的子宫颈抹片细胞。
3.全基因体DNA甲基化分析
3.1. 450K甲基化珠粒数组
使用450K甲基化芯片数组(Illumina Inc.,San Diego,CA,USA)来进行298个子宫内膜组织样本(子宫内膜样腺癌以及28个邻近的正常组织)的第一甲基化分析,以便找出EC的差异化甲基化图谱。使用来自TCGA数据库的第三级数据。以β值并进行常态分布处理后,表示每一CpG的甲基化分数。癌症样本的肿瘤细胞性(neoplastic cellularity)大于等于40%。移除对应到性染色体上的探针以及所涵盖的单一核苷多型性状(single nucleotidepolymorphism;SNP),本研究专注在剩余的379,054个CpG部位。利用曼氏-惠氏U检定分析有显著差异甲基化的CpG部位,且P≤0.001。进一步辨识出位于编码基因转录起始部位(transcriptional start sites;TSS)的最邻近位置(-1000至+1000范围内)中的CpG部位。此外,选出以EC读数中位数减去正常读数后过甲基化差异前5%者。
3.2.MethylCap测序
利用MethylMiner甲基化DNA增量试剂盒(Invitrogen,Carlsbad,CA)并依制造商的使用手册来处理2微克的基因体DNA,以得到富含甲基化的DNA。简言之,基因体DNA经超声波处理至约200-bp,以MBD蛋白质捕捉,并利用1M盐类缓冲液沉淀。依据Illumina(SanDiego,CA)所提供的标准流程,利用富含甲基化DNA产生序列库以供测序。利用IlluminaGenome Analyzer IIx System测序MethylCap-seq序列库。利用标准化Illumina pipeline进行影像分析和碱基判定。利用ELAND算法将独一的读值(读值最高36-bp)和人类参考基因体(hg18)对映,并允许最多两个碱基对的配对错误。
将独一对映的读值用于进一步的标准化与差异化甲基化分析。根据下列公式1与公式2累加读值数目,以计算甲基化程度。
N_(Read,i)为在第i个筐(bin)处的标准化读值数目;U_(Read,i)是在第i个筐处独一对映的读值数目;而N_U是独一对映读值的总数。“INT”是向负无限方向舍去后最接近的整数组件;而“^”是次方运算子(power operator)。利用标准化的独一读值的平均值来表示甲基化程度区域。在比较群组A与B时(G=A或B),分别计算一指定区域R(其框大小为m,且起始框为第s个)中两个群组的平均甲基化程度(AVGR,G)。群组A的样本数目为S_A,而群组B的样本数目为S_B。
AVGR,G代表群组G在R区域的平均甲基化程度。MR,G是群组G中每一样本在R区域的甲基化程度。使用双尾曼氏-惠氏U检定来确认R区域中不同甲基化的统计显著性(P≤0.001)。分析个体样本与对照样本间的差异化甲基化基因座。分析横跨编码基因TSS上游与下游各1000碱基对的共2000个碱基对的区域的甲基化程度。本研究排除位于性染色体的TSS区域,并分析剩余的23,215个TSS区域,并选出以EC读数中位数减去正常读数后过甲基化差异前5%者。
TCGA数据库使用450K甲基化芯片数组来分析组织样本,且该数据库中包括了来自417个子宫内膜组织的数据集。在这些资料集中,本研究选择肿瘤细胞比例大于等于40%的371个癌症病例。利用无母数检定(non-parametric test)来探讨个体样本与对照样本间CpG部位的差异化甲基化。一开始选择P≤0.001且有较高β值的差异化甲基化(前5%)的探针。之后,辨识出位于编码基因转录起始部位-1000至+1000范围内的显著探针。依本研究的选择标准,所选的高度甲基化基因带有至少五个利用上述方法辨识出的探针。
3.3.DNA甲基化图谱的丛集分析与候选基因的选择
使用MeV4版本4.9,运用曼哈顿距离(Manhattan distance)下的完全连锁聚合阶层丛集法来得到DNA甲基化图谱的热图。在每一组中,选择一到两个较不常被报导和癌症的甲基化改变有关的候选基因,且其在非EC患者的正常子宫内膜中信号强度较低者。
4.定量DNA甲基聚合酶连锁反应
4.1.制备基因体DNA和亚硫酸盐转化
利用QIAmp DNA Mini Kit萃取试剂盒(QIAGEN GmbH,Hilden,Germany)从样本中萃取基因体DNA。利用EZDNA Methylation Kit试剂盒(ZYMO RESEARCH,CA,USA)并依制造商建议,将基因体DNA(1微克)进行亚硫酸盐修饰,并将其溶于70μL的无核酸酶水中。以上述亚硫酸盐DNA作为模版来进行DNA甲基化分析。
4.2.定量甲基化-特异度聚合酶连锁反应(qMSP)
使用特异度探针和引子进行定量甲基化-特异度PCR,并参照总输入DNA中未甲基化的COL2A1来决定相对DNA甲基化程度。
利用LightCycler 480SYBR Green I Master (Roche,Indianapolis,IN,USA)扩增PCR产物。20μl的反应混合物中含有2μL经亚硫酸盐转化的DNA、引子(浓度分别为250nM)以及10μl的。使用LightCycler 480,反应参数为:95℃、5分钟、50个循环的95℃、10秒,60℃、30秒,以及72℃、30秒,且最终延长为72℃、5分钟。所有样本中的每一个基因进行两次重复试验。利用以下公式计算ΔCp以得到DNA甲基化程度:(基因Cp值)-(COL2A的Cp值)]。基因Cp值减去COL2A的Cp值大于36者认定为侦测失败。利用Oligo 7.0Primer Analysis软件设计所用引子。
5.统计分析
以曼氏-惠氏U检定来比较两个群组的甲基化程度。以克氏-威氏(Kruskal–Wallis)检定来比较超过两个群组的甲基化程度。
在独立组中(independence cohort),以真阳性率(即,敏感度)和伪阳性率(1减去特异度的差)作图,而得到受试者操作特征曲线(receiver operating characteristiccurve;ROC)。为了评估最佳准确度,利用ROC曲线下面积(area under the curve;AUC)来确认最佳化阈值,以区分来自两组的样本。进行200次的自助抽样法(bootstrapping)并利用pROC试剂盒R的cloes.left法以求出最佳阈值。所述方法使用以下公式来计算最小总和[(1-准确度)2+(1-专一性)2]。利用逻辑回归来预测OR以及95%信赖区间(CI),以描述与每一候选基因或基因组合的甲基化状况相关的EC风险。利用双尾检定来评估显著差异,P<0.05。利用R(版本3.1.2)与MedCalc(版本14.12.0)的统计试剂盒来进行上述分析与图式。使用G*Power(版本3.1.9.2),运用费氏精确事后检定(Fisher’s exact post hoc tests)以及0.01的假定α错误比例(assumed alpha error proportion)来评估统计检定力。
实验例1
鉴别与子宫内膜癌诊断相关的高度甲基化基因
于发现组中,利用来自MethyCap测序与甲基化珠粒芯片的数据来鉴别子宫内膜癌中的新颖高度甲基化基因。识别每一基因的转录起始部位(TSS)±1kb范围内的差异化甲基化区域(differential methylation region;DMR)。在第一分析阶段中,比较来自不同数据集的子宫内膜癌样本与正常样本间基因的甲基化程度,因而辨识出其甲基化模式有一致性分群(consensus clustering)的180个基因。经过本案提出的筛选标准,依临床相关度与功能富集(functional enrichment)分析,选出23个基因(参见第1图图框A)。
进一步验证发现组中选出的23个候选基因,将来自正常子宫内膜组织(n=15)、子宫肌瘤组织(n=10)与恶性子宫内膜癌组织(n=15)的混合DNA进行qMSP,并识别出14个候选基因。再进一步验证这14个候选基因,将来自经诊断罹患恶性子宫内膜癌(EC,n=56)或子宫肌瘤(Myo,n=40)的患者的子宫颈抹片细胞或来自正常子宫内膜组织(Nor,n=50)个体的子宫颈抹片细胞的混合DNA进行亚硫酸盐焦磷酸测序。分析结果(第2图与表1)显示,这9个基因亦可用在以子宫颈抹片细胞来区分个体的子宫内膜组织是否带有子宫内膜癌或是否为正常或带有子宫肌瘤。
表1
利用Youden′s法基于甲基化程度在子宫内膜癌相对于非恶性癌症个体中的分布进行甲基化程度的二分法。OR利用单变数逻辑回归计算。实际a≤0.10),以及检定效力(1-β)>0.99,利用事后成对费雪精确检定计算。
具体来说,第2图图框A显示BHLHE22、CDO1、CELF4与ZNF662的甲基化状况。利用个别的子宫颈抹片细胞,可以确认EC样本中的DNA甲基化状况高于正常子宫内膜组织与子宫肌瘤组织的甲基化状况。图中的水平线表示表1所列的阈值。P值系利用克氏-威氏检计算。
更有甚者,如第2图图框B所示,这4个基因都展现了理想的ROC曲线下面积,其AUC值接近1(0.89至0.95),表示有较佳的分群。
亦分析了基因组合的分群功效,其结果摘要整理于表1,由表1可以看出,相较于单一基因,利用所述基因组合有较佳的专一性。更明确地说,BHLHE22、CELF4与CDO1组合检测中,任两者阳性的敏感度为91.8%、专一性为95.5%,且其风险提高率为236.3倍(95%CI,56.4-989.6)。这些结果和早期EC侦测的结果相似(敏感度89.5%、专一性95.5%、OR为178.5,95%CI,42.2-754.9)。利用来自经诊断患有第二型子宫内膜样癌患者的子宫颈抹片细胞来决定候选基因的甲基化状况,结果如表2所示。
表2
Mu黏液性:CC澄清细胞:En子宫内膜样;期别根据国际妇产科联合会原则判定。根据子宫内膜样类型所计算的结果来计算阈值。BHLHE22、cELF4与CDO1的阈值分别是21.9、14.0和69.5。粗斜体标示者的甲基化指数高于阈值。CYCA-03-2010患者在外部医疗院所经刮宫诊断罹患血清型子宫内膜癌,但本院以子宫样本诊断,显示仅罹患复杂非典型增生症。
实验例2
鉴别与子宫内膜癌诊断相关的高度甲基化基因
于发现组中,利用上文所述数据集来鉴别子宫内膜癌中的新颖高度甲基化基因。识别每一基因的转录起始部位(TSS)±1kb范围内的差异化甲基化区域(differentialmethylation region;DMR)。在第一分析阶段中,比较来自不同TCGA数据集的子宫内膜癌样本与正常样本间基因的甲基化程度,因而辨识出46个基因。此外,比较来自TCGA数据集中肿瘤与正常样本间的基因甲基化程度,以识别候选基因。共识别出15个一致地展现出高度甲基化的候选基因(参见第1图图框B)。
进一步验证发现组中选出的15个候选基因,将来自正常子宫内膜组织(EmN_Myo,n=5)与恶性子宫内膜癌组织(EC,n=25)的混合DNA进行qMSP。分析结果(第3图)显示这15个候选基因在恶性子宫内膜癌组织中都发生明显的过甲基化。
进一步验证这些候选基因,将来自正常子宫内膜组织(N_Em,n=15)个体的子宫颈抹片细胞或来自经诊断罹患恶性子宫内膜癌(EC,n=15)或子宫肌瘤(Myo,n=10)的患者的子宫颈抹片细胞的混合DNA进行qMSP。分析结果(第4图)显示,这15个基因中的11个基因亦可用在以子宫颈抹片细胞来区分个体的子宫内膜组织是否带有恶性子宫内膜癌或是否为正常或带有子宫肌瘤。上述11个基因是:ADARB2、BHLHE22、CDO1、CLVS2、GATA4、HOXA9、MTMR7、NTM、PRKCDBP、TBX5与THY1。应注意到,虽然FOXI2显示出差异性甲基化,但其信号较弱,故因此并未将其纳入后续分析。
后续分析涵盖了上述11个候选基因还有先前研究所找出的CELF4基因,以分析其甲基化图谱。第5图显示候选基因用于鉴别EC与非EC样本的效力,图中分别显示训练集(图框A)和测试集(图框B)数据的ROC曲线下面积。与比较面积等于0.5时,所有分析的P值小于0.001。以空心圆圈标示阈值,并整理于表3。
表3
在训练集中,ADARB2、HOXA9与MTMR7的组合分析未提升准确度,因此在测试集中并未进一步验证。
表3的数据显示,受测基因中的6个基因(BHLHE22、CDO1、CELF4、CLVS2、GATA4与THY1)在鉴别正常或具有子宫肌瘤的个体以及罹患子宫内膜癌的患者时,展现了显著的准确度(至少80%)。此外,BHLHE22、CDO1、CELF4、CLVS2与THY1的AUC值介于0.83至0.9之间,意味着这些基因有较佳的分群效果。选择准确度较佳的基因进行后续分析,以评估基因组合的效果,结果摘要整理于表4。
表4
利用所有子宫颈抹片细胞与逻辑回归模型计算风险分数。
表4的数据显示,利用全子宫颈抹片细胞时,所述基因组合的准确度优于任何单一基因(表4,56个EC样本,56个子宫肌瘤样本与56个正常样本)。
实验例3
候选基因于妇科癌与结肠癌的交互检验
进一步检验ADARB2、CLVS2、HOXA9、MTMR7、NTM以及PRKCDBP于鉴别异常妇科疾病或结肠癌的能力,其结果摘要整理于第6图(每一符号代表来自5名个体的混合DNA的资料)。在结肠组织样本(Co)中,ADARB2、CLVS2、HOXA9、MTMR7以及NTM于结肠癌患者(Ca)中的甲基化程度高于这些基因在正常结肠组织(1N)中的甲基化程度。在卵巢组织(Ov)中,所述7个基因在卵巢癌患者中都有较高的甲基化程度。每一个三角形与圆形代表来自五个等量DNA样本的混合DNA数据。
虽然上文实施方式中揭露了本发明的具体实施例,然其并非用以限定本发明,本发明所属技术领域中具有通常知识者,在不悖离本发明的原理与精神的情形下,当可对其进行各种更动与修饰,因此本发明的保护范围当以附随申请专利范围所界定者为准。
序列表
<110> 赖鸿政
<120> 妇科肿瘤的诊断方法
<130> P2947-PCT
<150> US62368182
<151> 2016-07-29
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3199
<212> DNA
<213> Homo sapiens
<400> 1
cgtctacgta gtatttctgt ccccggaaga ctggatctca gggaattatt atggaagata 60
ctgctgagcc cctttcatcc tttccaggtg aaaatacaga catttttgtg tcgccctcac 120
ccttccttta tgaaataagg tgcccaactg ttctgatatt accattcaaa aacaggttct 180
gtggcgaacc tcatttgtga atctattaca gagattaata gattatttct cctttttcaa 240
ctaattctca gtggggaaat ttaaccatat ggtaaggaga gaattagaat ttcatcacat 300
tagagcaaaa tgtaatgaaa agagtccaac acctggggcc aactccgaaa gccacaatta 360
aaaggttttt aatgaaacca gagaaaccaa aaattgcata gtcttcagta cttctgccat 420
ataagaaaga gttattggaa ggtgttggga aatattgttt ttacttatgt cataaggatg 480
aaaaccagct gctaaatacc atgtgtaccc agagaccgaa ctcaggagtg agatgaccgc 540
gtgtaccagt gcccatccgg agaggagcac ttgtttttac attctccctt cccgaaccct 600
ccaagaacaa ccgaggctga tccagatgtc cttaaatggc ttccgggtaa ataaatatgc 660
ataaatgcct cacttcgtgt gggagcggat ttgactcctg gtgaagttga ctcttttgaa 720
gcaatcagat tttcatctta aggaaagttt gagaaaccgg tttgtttgtt tgttttcttc 780
ctgtttagga aattgtgtac ttcacaatta ccatcactgt aacagttatt tggagaccac 840
tgcaaaatca ctgccacccc accttaaaaa aaaatgggct gcatgatcac ttgctcttca 900
ttttgctttt ttctttcttt ttttccaatc tgggtaggaa atgggcagtg gcgggtgtgg 960
aaacgaggca gagtgttcgg ggggacgact gctttgctct ctgaccagct gaaaacctag 1020
agtgaatttt gggcaagcca gctgggacac caccttctct cggaaagtcc catccccaaa 1080
tccagaccag tcatcctacg aacaggggtg gagtataatt ctcgcccgga agggtaattt 1140
agcacaagct gagacagcag tggcgaggga agggcagtgg ggggtggggt gcggtgggtg 1200
ggggcgtctg ctttccacag gactcccagg cttcgccgcc gatctacaat ttgctgaagg 1260
agcaaagaac atcctcggct ctaagtaggg cttttagtgt gctcattgat gagtgaaagt 1320
cgccacacat gtcaagctaa aggcagttgt tgggttacta acaggaccca gcgccttgca 1380
aacatatgcg ctaagctgtg tatacagatg gcaggcagaa taatggagca ggcgcctttt 1440
ataaagctct agctgctgcc tgtcttcaga cctgggaaat gaaactattc agacttgcgg 1500
ccagatagcg cctgcgattg tttgttaccg ttttaatcct attaattaaa acgttaacct 1560
gattgggtag aaagcgctgt cccaacaggc gagtcttctt cataataacc tactcagaga 1620
taatgatgta aaagactccc ccgtctgtgg cggcggctgt ttgatgggtc cggaaatctc 1680
ttgaaggtga atccaagcaa gataaacggt gcggagagga ggcgcggggc tgggctcaga 1740
gcggcggcgg cggcggctcc actccctccg cgcccaccct cccaccatgc ggggccgcgg 1800
cccatggtga gccccagcag ccagcaccat cggctggaga cgaagaagaa gaagaagagg 1860
aggcggcgag cgcgggggaa ggcgaaaaag aaaaagaaag aaggggagag ggctcccggc 1920
agcaccagga ccgacgcgcg caccagctcc ggagcccagc tcgcgcgcgt ctgtggggcc 1980
gcctgactcc ggggccgagg cggcggcggc ggcagcgggc gcggcggccc gggctgcgcg 2040
ccggcgcggg accatggagc gcgggatgca cctcggtgca gcggccgccg gcgaggacga 2100
cctcttcctg cacaagagcc tgagcgcctc cacctccaag cgcttggaag cggctttccg 2160
ctccacgccc ccgggcatgg acctgtccct ggcgccgccg cctcgggaac gcccggcgtc 2220
ctcctcctcg tcgcccctgg gctgcttcga gccggctgac cccgaggggg cagggctgct 2280
gttgccgccg cctggaggag gcggcggcgg cagcgcggga agtggcggcg gcggcggcgg 2340
cggggtgggt gtccccgggc tgctagtagg ttcagccggc gttgggggcg accctagcct 2400
aagcagcctg ccggccgggg ccgccctttg cctcaagtac ggcgaaagcg cgagccgggg 2460
ctcggtggcc gagagcagcg gcggcgagca gagccccgac gacgacagcg acggtcgctg 2520
cgagctcgtg ctgcgggccg gagtagccga cccgcgggcc tccccgggag cgggaggtgg 2580
tggcgcgaag gcagccgagg gctgctccaa tgcccacctc cacggcggcg ccagcgtccc 2640
cccggggggc ctgggcggcg gcggcggcgg gggtagcagc agcggtagca gtggcggcgg 2700
tggcggtagc ggtagcggca gcggcggcag cagcagcagc agcagcagca gcagcaagaa 2760
atccaaagag caaaaggcgc tgcggcttaa catcaatgcc cgagagcgcc ggcggatgca 2820
cgacctgaac gacgcgctgg acgagctgcg cgcggtgatc ccctacgcgc acagcccctc 2880
ggtgcgaaag ctctccaaga tcgccacgct gctgctcgcc aagaactaca tcctcatgca 2940
ggcgcaggcc ctggaggaga tgcggcgcct agtcgcctac ctcaaccagg gccaggccat 3000
ctcggctgcc tccctgccca gctcggcggc tgcagcggca gcagctgctg ccctgcaccc 3060
ggcgctcggc gcctacgagc aggcagccgg ctacccgttc agcgccggac tgcccccggc 3120
tgcctcctgc ccggagaagt gcgccctgtt taacagcgtc tcctccagcc tctgcaaaca 3180
gtgcacggag aagccttaa 3199
<210> 2
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 2
ggcctcagcc agcagagccc agatgccttc tgcagttaag atccctggac tcagaatcag 60
aaagctgtta agcaggaagg agtgcgctgc catgaagagg cagacagaag ccagagccag 120
tgtgtctgga atgcatcagg tagatgaatg ggaagatggc tgggatggag ttggagggag 180
gagggaagtc agcagccagg ggccaggaca ttcatggcct taaaaagtat cctacaaaca 240
agaagccagg ttagctcacc tatgaagagg gacagtctta ccagatcatg tgttagagtc 300
cccagatcct ggggagcgtg agaaaagtgc agactcagct ggctctagta ctagattaag 360
gaggtcctag gtgggcaagg ccagctgcat ttttcataaa atgccctaga aacctctgca 420
gtttaccaaa gtgaatagct cctttggact taaccatctg caaggctcat tccagttaga 480
gtgttccatc accctaaatg ctgggaaacc aagcgaatct cctcccactt gcaagcttcc 540
aacagtggct tccaacagtg ccactgcagt atcagaaact gcagggaagg tgccagggct 600
gacttccatg aagaaatagg agaacaggca ggcagacatt ggggaggccc acagaatgtc 660
gtgatcagaa ttcataaaga ggctggcagg atacaaatca atcaaataaa cgttagttca 720
aaaaaattca ctacacctgt gagtgagaga aagtcatcag cactgtctct aaaaatgagc 780
ctagggcttc tggtgacatc caatcggtgg gttatcagga gtgccccagg tgatcaggag 840
ttggcctcga ctcagtcctt tttgtgctgt ctcctcctct ttcccagagt tcctctctct 900
cttctcccac taggcaggga tgagcaagag gaatggctca cccttgagag ctggggtcca 960
tagcccaggt cagttctcca gctctcccac ttaccagcca agacaggagg tgaggattga 1020
gatgggatga acccagcagg cggccatggg ttaaaggtcg ccatgaatgt aatgtgccca 1080
gcacagtgcc tgctaaaagg caacactccc ttcctggtct gaagaccaaa caagcagact 1140
gtactcagga aagccagaag aaccttccag ctgtctggac cagaaggtgc cagcccaggg 1200
gctgaagaag acgtaatgcc cagagcaaaa agcgcctgca gccccctgaa gggctgggtg 1260
ctctggaata gatgaggggg cgaaatgggg ctggggacca gggacggaca gggtgggtcc 1320
agcacctgcc tcgcttccga agggctgctc caacactgaa aaacacccaa ccagcttcct 1380
ttcagaaaga ctggaatatt ccaaaacttc tcactggagg ctccggagga ggtgggctcc 1440
agctgaaaag gaaatgtgga ggcgtgggcg ctcccggcct gcatcctgca cctcttacac 1500
tttggttttc ccacagactc ctgaagaata ggtcagaaga aagggttaaa gccttaaaag 1560
gggaacaacc attgcggggc tcagggagga ggataatgtt ctttgggctg ccgcaccctg 1620
atccccgggg tcccgaaccc tcccgtccct ggccaggcct gccagccaca gggtgagggc 1680
ccccttccgc cgcaacctgc cactctcaca ccaatgcggg accgccttct cttccttccc 1740
caccccccac cccaccctgc cgtcctttct cccccaatct ccgcctctga ttggctgagc 1800
ccccggctcc ccgctccccc tctcctccat ccccggtgaa aactgcgggc tccgagctgg 1860
gtgcagcaac cggaggcggc ggcgcgtctg gaggaggctg cagcagcgga agaccccagt 1920
ccaggtggga actggagccg gtgggacctg gggctcgggg accgccgtca ggcgcccatg 1980
caagacttcc caacactagg cttcgggcca cggtccgagg gcgcccaggg aagaagggcg 2040
cagagcttag ggaggggcct gctttccagg caggggcggg agggggatgc ttctgcaggg 2100
caggggccgc gtggcaccct gatgtctttc ggggaaggcg ctcccgggct ttcgcccgct 2160
gggggactgg tgtctggggc tggggcgctg gagaacaggg aggaagggca ccaaggacag 2220
cctgtgggtc tacattccac ccagacgtcc ccaaacccag ctcgcagagg cggggaggag 2280
gacggatgaa actgcgggga gaggatggag gatggcgagc tagagggaat ctgccgggtg 2340
acctcgcggc gggctgggtg cggggcaccg gaggagaagg aagccgcagt gccgcaggcg 2400
gggactgggt ggaaggcggg cggacggggg aggggagagc tggaaaagga tgagagaggg 2460
ggaaggggga ctcatttggg aaaggagagg attggaatac ggaaatggat taaggatgag 2520
gcccgccggg ggcttgagag ggaggaagag cagaccttct ctgggtctgg agccgcctga 2580
ggacacagac cagaggaaat gaatacagac tgcacctccc cagccgctct ccacccctcc 2640
cctggctctt ctaccctctc cagccccaga cccatttctt ccctttcttg ctctggccat 2700
tgctccccct tcccctccta gatcccaagc ccgcacaaca tctcaaacaa gagtcctcga 2760
ttcaaaagcc agatgccgac cccccttcct cctggatctg gctcagggca gcagctccac 2820
cccgggacag agagagcatt gattgtagct gcagccgccg cgggatccta gcctcacccg 2880
tcaaggggct gagcgccagg gaccctgaac tcgtctagtg gtgcgccctg cgcacccggg 2940
cgcactcaac cgaggcaatg ccctgcgcgc tctcgcgggt gcacgcccct tctgtggcct 3000
ctcctgggcg agcactgctc tgcagatagg ctagactacc ggctccgcgt cgcctcgcca 3060
agggttggtt cagccaaggc tgcaaaaaac aaaaaaagac caggcagaca gcctatccag 3120
ggtggctatt gaaactgggc tggaaaactg cagtcccagg aactccagag agctggacat 3180
tgggaagcat ccttggctca catacaatcg gagatcacta tgtctttctc tcctccagga 3240
acacgattag cttgtgtcct atccagatag gaatagatgc tccctatctg ggagcatcct 3300
tagctatggt gaatggtatc tagccatcca ctggggatgg cgagtgactt agggatttgt 3360
gtctcacgta tatgaagcag tcatcgccag atgttggttg tttttcttaa cccccatcat 3420
aacccggtgg gtatgtaaga ttcagagaga ttcattcatt cattcacaat aaatatcttt 3480
ggagtgtatg ctatatgcca gtaatctgca aacggaaacg gttttgagca ttggggattt 3540
tcttctgaac aggaaatggg aagtccctaa atggggagtc tttgtttaac agatacagag 3600
ttttactttg aaagacaaaa agagttccgg agatgggctg catagcaacg tgaatgtatc 3660
cagcactgct gaatatactg aatttaagta ctgaatttaa atggttaaaa tagtaattat 3720
tatgcttttt gtattttacc acgattaaat ttttttttta aatacgaagc ctcagccctc 3780
ataggtctta tattaccata cactatgtta atgtaagaag aggagaaaga gtggtaaagt 3840
tacttaaagt cacccagcta gtaagtgctc catggccaag cgcagaaaca caccgtgact 3900
gggcttgttc tccctccttc cttgctttcc ctgagcagga aagagccagt ggcagtatca 3960
tgttcagtga gatgcaggga cgagaggggg aatggagaga 4000
<210> 3
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 3
attctaaaag gaaaacgcag aagccctgtc tttctgaggc ttgtctgcaa catacgctca 60
ttccttccaa attatttgct ggaaaaaatt taataaataa tcatagagta attaacatgt 120
tccagttcct gtctatactg gttgatactg attcaacgag tatgaatgaa cttatgaggt 180
gggtgacgtt gttatcccca gtttacagat gaggaaactg aggcacggtt taacttaccc 240
gaggtcatag cagtagagtt aagatttgaa atcaaatgtc ttactctctc tcatcaatga 300
aaactgagct acgatctatc agctcagcac ataacaacac aggatcatcc taattatttc 360
caatgtcccc cagagtgatt cttttttctt atgataaaaa ttatctggaa atttctaggc 420
acataagcag ctgaaaaggt tgcatgtgag gcaatgaata gcagaaatat ttgtgtgcca 480
tttttatatc aacatgttaa tgtgtgctaa tgaattttag agtggatttt tttaaaaaca 540
tgactattgt aattaaaagc ttatgtgatt taaatacaag atgcaatgat gattaccaga 600
ttctattcct ctttatattt tacataagac ttccagggtt ccataagtat aatcttgaaa 660
cataggacat tcctggaaaa aaaaattgct taaaactatt tcagtgtgca atccacctct 720
ttgtaaatgt tactttcttc catccaaata ttacatttgg caacaaaact ctccgctgag 780
agctttctct tccttttgtg tcattgttcc ctaaataaag caacacatga aattcctgac 840
ggcaaaaatc agactcagat cccaaaacct ctgtctttat gcaagattta tcttttgcat 900
tggaaacggc caaggaatat gaagagggga aagaagaggc aaacagacaa gcatgcaggc 960
tctgaggaat aaatgcccct caggacgctg tctcctgggg aattgcaaac ctcagtccgt 1020
ttctgaggaa gtgcggtctc tgcatttctg aaagaggtat ttccccccct tgacacaagg 1080
agcatggtaa tgaattgact agttaaaaac tgttggttgg aaaaacccgt ccctgtgtct 1140
ttctgagcag ggcgagctga gctgtccgcg aggctgcggc aggaggcctc gtcctcccgg 1200
gcagggtccc tcctggaggc tcccccggtc tctcccagac gcacccgcgc cgcgtccttg 1260
ttccccggga gcagcctccc tccagccgcc ggtcctggga gcttcaccgt ccaaacggga 1320
gctgagtttg caagcggcca ggcggcggtg cggctggtgc tgctgctgat gtcagagcca 1380
gaaagcagtt gtgattggat ctaattagac gctgctgcag caaatagaca agctccctgc 1440
gtgattggct tcaaagtggc tggtgccaaa caactagcag aggcgcaaaa gtagcctccc 1500
tgcgctggga gcccagagca ggaggcagag cccgcgggaa gctcggagca ctcaggacgc 1560
cgcgcgccct tccccgccct ccctgaccag ggagcagctc gctccaggcg cccagccgag 1620
gcccccagcc cagtgggagc aagtcataga gaacaattcg agagacagag agacggagcg 1680
cgctttcctg ctcagtcctg aaaagtgagc cgctcccggg tttgcaacct caagcttcgc 1740
agcagcggcg gcggcggctg ccgggaagga ggcaggtgca ggtgcaggag ggaggcggct 1800
ctgggctccg cgcctgggtc tcggccatgg cctcggtcct ggggagcggc agagggtctg 1860
gagggctgag cagtcaactc aaatgcaagt ccaagaggag gaggaggcgg aggtccaagc 1920
ggaaaggtaa ggaccgcgtg gcgcgccggc ccctgccccc cttcaccccc ggcttctcca 1980
ccccggcctc tcatggggtc tccgggcttg tccgttgtga gcagcttcac tttggggtgc 2040
tggcgggatg gctgctccgt gcagggcgct cgggagttca gatcccgtgg aaatgtctgg 2100
ggcctcctct tgcccagagg ggacagtgag cagccacgct gcgacatgtt tgagggaccc 2160
ggacgaagtg gggcgagggc ggcgaggagc tccccgggga ccccgcgcgt ctccgggccc 2220
cgcagtcccc agtggccggc cgggctggca ctgccttcca ccctccggag gccatctcgt 2280
ctcccagtgc caaaggaatt acccaaaaac gggggaacga gccctcgcgc cagctactcc 2340
catccaaact gtcccggagg aagggatagg cgaagccctg cgatcgcctc tccaaattgg 2400
ctggcagttt ttactcaatg tggtgcccgt cgatttgtaa acattgggtc gtaaagagaa 2460
cacagggctc gtccttggag aaataagcag aaatgaatac aggaaaacag aaagaagcat 2520
catattttgt tagtggtaga aaaaaaccgc aaaccaggaa agcaggaaaa gcagccggct 2580
gacagcggcc actgacaaac tcagctgtgc cttgttactg atattcctgg ggctgggccg 2640
cgctgaagtt agtcaatgct acagcaaggg agggctttca cactggggat tttgcaaaat 2700
tagcaatcgc tccaatatga gagcaatgcc cccagtgcca tcgtagcctg tgtgcatgcc 2760
aggaagaatt aaaagattct tctcatgccg acccttctct cctagaggaa cctgtgttat 2820
tgtcagttcc tagtgagcct gcaggagaaa gttcagttct aatcatgatt tgaaatgtgc 2880
tgattttttt taagtgaggt agaagtataa agaacggttg gaaaaacaca gctagaattg 2940
atcagctttg ccagttgttt gaaagcagga ggcaacgtta ggtgtgtttg gggttgtcca 3000
tctttcctga agaattttca tctttgcatt ggcctaagat aagtttctac cagaccgttt 3060
cctgtgtgcc ctcgaaccgt caccaggtcc tttattgcct cttccaataa tagaaattat 3120
ccagacagtc agcaggcata aatgtcaata gcaaacagtc attcattatg accgaacgtc 3180
aggaccactg ggagggattg gcccccacaa cttcctcaaa aggttttgga gcctttggtt 3240
tcagaaggga ggtgatgttg tggttctcat ttacctctca gctgctaagt gtgcgcttgc 3300
gattcacttt gttgtttgaa attatcattt tgaaacagac ctgttagtgt cctccaaaga 3360
taatgccaac acaaagtggc attgatattg agaaagtcac cggattgaat aatgaatatg 3420
acttttaaaa gaggaaaaag gaagcatcat ctttacactt gaaatgttca catttcccaa 3480
tattttttga ttagtctatt taaatattta gagttgaaga atgtggagta atagttcgca 3540
ataatgcatt ttataaatat aaacaggagg aaagtgttgc ctttctccaa attcacttgc 3600
cttgccagga agcgtcagtc atgctagctt agaaagtatt caatttaggg ggaaaaagga 3660
aatctgggga aagacttcat ttgctataaa cttaacttta gcaattcaaa ataaaactcc 3720
tatagcaaat atttccatac cttggttatt ttgaatatgt caagtccctt aattttcata 3780
gccaaaaatt gaagcgggaa agggcattca ggttttgtac actgatttct gttacgaaga 3840
gatttctggc gtgcgggaga atttcccagg gcacctgccg gcagctatct tgataggaaa 3900
gtcaaatcaa acggctaaag attcaatttt tggggaaacg ttaaccatgt agatgtaact 3960
gatcaaatta aaaggtaaag taaccagcta agagacacat 4000
<210> 4
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 4
cgtgaatata ttactttcat aaaaatgtaa aaagaaaaag aggagtcaga gaaagaaaat 60
gaattgtcag aaaaatttag aagttttatc aactgaaatg cagaaaagat aaattgtgct 120
tgcatttcat ttttgttgtt cattccaaac atttatggat tagactagct gaaatgaagt 180
aattaagaga ctcaatagaa aacattgcca agaataaaaa ataatttgag gaaaccatga 240
aaagtttaca ggttactctg tcacaaaata ctttgttaat tcactacccc gcagcaacac 300
acatcaccaa ggctggcttc tggaatgctt tctacttgta gccatttttg aacaataggt 360
gattccgctt ttaacaacac tgttagaata taatgtagcg agttttacca gagatgttta 420
agactacctg gcacaagtaa atttcattgt atacatgtat atacacgagg gagggtgatc 480
atagtctaga aaaaaacagg tcttcagaag tctagaactt taataacctt aaatccaaat 540
tattccctgc gtccatccat aatgagaagg aagaaatcta cacttgcatt tcttccacct 600
ttcacatctt tctcatttaa atcctactgt acttgatttg tgttgttccc aacgtactag 660
gtgctatgca tgacgtagaa acgtgtttcc ttatatgtat gtactagcag gctccttcaa 720
gcacatgcct aaggttgaaa gattcaaata taattatagc ctcttaaatt attgcgtcag 780
agcccgccct atcccctcag aaaaagcccc cttttacacc atcaaatgaa atatcaggtt 840
atttgcactg gatatttttt aaaagaaaat atttgatttt aaaatcaaag agttcttggt 900
tttccatcat ttcactaatt gtcttactag agacccgagt ctcctttgtc aaaatatatt 960
tcagtacgca ttttaaaaaa tatgtgtgtg tgtatactta aatatatata tatataaagt 1020
cttggactta ttttcaccta gcctggggca tatcgtggat agtttcaatc gacaaaacag 1080
gcactctctg gcctaggagt ggaatccatc ctcaattttc gcaggctcct cacaattctc 1140
tatttggaag aagtgtccct ctccttccct tttcttttcc tcctttactc agcgtcagtc 1200
cccgcagcca tctcctccga ccctttttgt ctacgtccca gcgtcgcgaa ccacagcggc 1260
ggaggtggag cggggagagg cgttaggccg ggcggctaaa acgcgccgtt aaagtggggg 1320
agagattgcg cggagcccac gcgatccctg ggacgccgga gacaacgggg ctcttgggaa 1380
ggcgcggagc ccggggaagc cggggatgtg cgcgtgagcc gtgcccgcag ggtctccccg 1440
cctccgccac ctttcttggg tggctctccg cctcgtcctc cctccgaggg ccgttggtac 1500
attcctagtg actccaagcg cttaaaaggg gcccgggagg atgaacccca cagatctgaa 1560
cctgatttgt gtgtgcaccg cgtctccagc gatcccggat ccactgcgct gccaggggcc 1620
tgggggtggg tctcttgctg tctctgcgac gacatcctta cgtttcggca ctctaatgct 1680
gggtttgtgc gtgtgtgtct gcttagcggt ctagcgggct gttaggctcc ctcgccccca 1740
gctccttggc tcgctcagct cctccaccgc agcccagcag tgagacgcgc gcgcagccag 1800
ctccccacga gatggaacag accgaagtgc tgaagccacg gaccctggct gatctgatcc 1860
gcatcctgca ccagctcttt gccggcgatg aggtcaatgt agaggaggtg caggccatca 1920
tggaagccta cgagagcgac cccaccgagt gggcaatgta cgccaagttc gaccagtaca 1980
ggtgagcgcg ctgcagcttc aatgccaggc ggcgcccact cgccccgtct gaggaggaat 2040
ggacgtgggg gacgcagccc aaagtgactg gctcgggaag ctcgggccgc gctgcgtccg 2100
ccgctcgccc cctcgctggc cagccgcggg gctggcacga ctcgcttggg gctccgcggc 2160
cacagcgcag gcggaaggtg gatcctactg gccttgctga cctccggccg ggaacggcgg 2220
acaggcgccg ggaagggagg ccaccgcgcg tctgcgagat tttctgttct cttctctccc 2280
gcaaacccct ctgcttctaa accaccagtc ctcctgcccc tggcctcggg agcaatgccc 2340
acactcccaa gccatcgtta accccgggcg cggagatgcg gagagaccgc actcaggttc 2400
gggccctcct gacaccttaa ggaaccgtct ggccggacta gcagagggtg ctcccagggg 2460
agcactacat cagccatcgg gagaagtgtg tgatgttgaa gaagacaagt cacccgcgtc 2520
agttctccat cactgcgcct tcggtcgcct gcaaccgggc accttatagc aagcattttt 2580
actcatgtaa aatagcgtct tgtggccgtc agctgccact acggaatttc tgctgttccc 2640
tttcccaaac caatttaact aacttccccg actgtgggtt tattcaaatc cactgccaag 2700
tttcgcagat taaatattcg accgtcgttt ttttcagccc ccaaatgatc tgatttatct 2760
tatccttgct tctgacgatc tgtaatgtaa attaaagacc cctacttccc agatgtactt 2820
gagtgaggtg ccctggtaag ctggcttttt tgcagccccg gcttggtgat taagtcgaat 2880
ctctctacca atcctccggg gccagaggta aaatttaatc accccgaagt gtgagaggtt 2940
ctactttttc tgagcagtta gtgcgtcagt ctttgtggtt ttttgggttt agggttagga 3000
gaaaggggta agtgaaagaa aagaataagg aaagaagtaa gtttgttttt cttgggagca 3060
ggttctttta gtcactcttc aacatgtggg atgtttcgta aagttttgtt ggcatgggcg 3120
gtttcaactg tattttagga tttgaaatag aaaaagtgaa gaccactaag gatcccattt 3180
ttcatataca agtgacttga ggaaattcct ttggctccta tcagcttagt tcatggtaga 3240
gcccttctgt agccgtgaaa gctagcagag agtctagctt ttaaattttc ttgcatttgc 3300
tccaggtaat tgaagacttg ttatgggaca ggtactcttc cagacacttg acacatatga 3360
ggaatggcag gcaatgaaga agttgaatga cttgcactag gtcttctatc gatagcggct 3420
ccaggctccc ggggttagca ttgttgttcc agagcctaca ctctaaacca ctgttaaacc 3480
aggacaggtt gtaacagttt ttaatcttta atctttagaa caagtgtatt ttcaaggacc 3540
ttgaactagt ctcgattgac aaactctaaa gcttttgaag tgcaaccagc tgggttgatc 3600
ggtcttttca cagatatctg aggtacagct cattaacata atggatgtag tcccgagggg 3660
gcagttgggg gaagacagga gatgggagag aagtcaattc tacagtattt tttgcattaa 3720
ataggtgcct agcgctgtga aggattctgt tctctgactt tgggagggcc agtgcagaag 3780
aatcaagaca gaatatgctc ccgtgtgggc caggctgtga attctttgaa agaagctgca 3840
gagaagcaac aaagattatc ctaagacttc tggaggaaga attaggatcc ttctgcagga 3900
actcagttta ctgtgaattg aaggttgtgt acacagcttc ttgttaggtc ataaaggcta 3960
caaagtaggg aaaactgagg ctaaaaagca cttactaagt 4000
<210> 5
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 5
gaggctgccc tgaaaaagca aacatgagag aggacggggt gcaggtaaat atcattaacg 60
tgaaaatctg ctaccccagc caagttcacc accagtattc acccctacag gcggggccgc 120
tcggaccctg ctcccggctc cgcgcctgcc actccctttc ccgcgcagcc gagatgccag 180
ccccagtggg cctggcgggg agtccggcgg ggtccggacc gggcggctcg acccccggtc 240
cccacggcag gaacgactca gcctcgcacc tcgggagctg taggtgccga aaacgaaacc 300
cgcgggggca gcgcacgccg cgcgagtctc ggtccggcgg caacccagat agcgattcag 360
gggctttatt cttttgatgg tgattaaaaa aatatattct atttgaaccc gtaaagcaga 420
cgagggcaaa tcaagccatc ccccgcgctg gctcaccggc caccgcgccc agcgccttcc 480
tccccctccg gcgggcgagc gggcaggggc gcccgactcc taccttcctc ccgccagcca 540
ccgggggacc agccgcgctc tccggggcgg gggaggccgc ccgggacggg gacccccacc 600
ttccgccttc ggaagcgggt tggggcgggg gtcggacccc gagtctctac tccccgtccc 660
tctgcccccc ggcgcggccc gacagctccc agccccatcc tggcaggtgg cttgggtggc 720
ggtagatgcc gggcgggagg aagatgtggg gctgctctgg caggttgggg gtgcgaggag 780
gaaaaaaaaa cagagaaaga cacacacaga gagacaggga gagagcgcgc gcgagagagc 840
tcttgtctat agatttatcc acataatata tatttatgta gctttttttc tctcgacact 900
gatgaatgcg cgctcggatc cccgggcgga ctccctccaa gccggctcgc ttttctagtc 960
taaataaata aataaagcca gatggaagaa aaaagcgccc attccacctc cgccgccgcc 1020
ccgcccgcca tccctgcctt tgcttcgccc gcctggcgcc ctaatagagc atagcttggt 1080
ggataaagcc cccctacata cccacacgaa aataaaaatc actattttta aaatacaaaa 1140
agttgcacct gctgctatta caaaaagaac ccccaaaagg caaagagagg aggccggctg 1200
cccggctcct cacggacacc cgctccccgc ggccgccggg cccggaatct cagcgcctcc 1260
cgaagagcca tgcgcctggc gctatttata gccgggggcc gtctcggact gtaccatcgc 1320
cacggcgcgg ggccgccgac gggggaggcg cggtggccgc cgccccacgc cgccctgccc 1380
ccggccgccg cccgccgtgg cgcgggcccc cacagcgcgc ccattcccgg ccccccgcgc 1440
cctcctccgc gcgcgcacac tcgccacccc cacccctggt ctggctggga acttgaaccg 1500
gtccagcctg tttaaacgga aaggacagag atcctgtctg ttcaatgtaa aaaaaaaaaa 1560
aaaaaaaaaa aaaagaaaaa aagaaaaaaa aaatcagatc agaccgagag agagaggaga 1620
gagggagaga gagagggaga gagagaggga gagagagagg agagggaggg agggagagag 1680
agagggggga gagcagagag agagcgcgag cgcgagcgag cgagagaaga ggagaaagag 1740
agagagcaga gagcgagcgg agagcgaggt gtagagaaac cgagggggag agaacccgag 1800
tgtgtgtatg cgtgtgcgtg tgtgagcgcg agcgagcgag agagaggagc gagagagtgt 1860
gagcgagaaa gaataaaagg aaagaagatt ttctctatgt atataaagat ggccacgtta 1920
gcaaacggac aggctgacaa cgcaagcctc agtaccaacg ggctcggcag cagcccgggc 1980
agtgccgggc acatgaacgg attaagccac agcccgggga acccgtcgac cattcccatg 2040
aaggaccacg atgccatcaa gctgttcatt gggcagatcc cccgcaacct ggatgagaag 2100
gacctcaagc ccctcttcga ggagtttggc aaaatctacg agcttacggt tctgaaggac 2160
aggttcacag gcatgcacaa aggtgagtac acctttccct cccaactttg ccggggagca 2220
ggagcgggct ggcgggccga ccggccggcc ggcgactgac gagcggcgga ctaagcgaga 2280
ggaagcctcg ggcgggcgcg gtggagggag gcgctcgggc agcggagacc agagctgggg 2340
tgcgtgggga gctgttcgct ggggcaagac tgggttttgg gcgaggtgct gataggaacg 2400
atgccatgga gagagcagcg ggcgccgatg aagagaaaga gagaggggat cgaggagacg 2460
gggcttggat ttttgggtac agcgacctga aagatgggga tggggaaggc tgcaccggtc 2520
gagcccagga cgctgagcgg acggactcgc gggctcctgg ccggccgagg accgagggtg 2580
ctgtccatcg ccgtggtgct gaaaatacta aaggaggtgg tctcctcatc ctttgctccg 2640
ggctagagta gcaggagcgc agccgtctaa aagggagaga ggtgacaaat tcaaagagaa 2700
atttttattt aaatgtaaca gtaaactctc cctgtcgagc tgtgtgcctc aataatctga 2760
ttgtggtgtg aatggtggtg tgtgttgggg gtgggggggt tggatgtttg aaggaaccag 2820
tgataaaacc taaggcaaga attagcaagg aaccagccat cccctgggtg gagtgggggg 2880
tctggcaagc ctggatagtc cccttcccag gaaagcgggg ctttgggaaa aaaatatgtg 2940
tgtgcgagat ttgcattttg aaaggtgtac cctaatttat cccaaactca ccatgcagag 3000
agctttatag tacattattt ctcccttgaa gcgatcattg ccagtgagtg cttgggggag 3060
ggggagacag aataatcaaa gaattaaaac acagcaactt tttaggaaag tggtcatggg 3120
aattgtccgc agcctgcctg ttttctcctt gttttattat ctttaaagca gagccccaaa 3180
cgtgttcagt tgtagaatgt gtgtgggtgg ctggtgggtg acgaaattag cccagtgctc 3240
cgcttcctaa cagtaatata taggatgtgc agcgggaatg aatcggtgct ggatctatgt 3300
gggcaagtta aatgctttct gagagagatt gatcgccagg cagggaagga gcacggggct 3360
aaggaagttg taggggatgt gtatggatgt tccgttttta ataaacagta gtgtggagag 3420
ccgccgaaga tgctgttaca gctggtggtt ttaaagatga aaacacacgc acacccaccc 3480
ccacatagag agcagcctca tccttggcca caaatgggct atggacacag ctgatcctcc 3540
agcacattag gtgcagagcg cagagctgtc tggctctcta agcagcagcg attttcacta 3600
tcacaaccac cctctttctc cagccctccc ttcgttcgaa tactaaacag agctccaaac 3660
tcttcatagt tggagtccca gagagcagtt tttattggct ttagtatctt ccagcttgcc 3720
tgctgaggag taaatcttaa agttaatggc atgttgagta acacaaaaac acagcagaat 3780
ggaaatatac tgggtttgtt ggggtggggt gagggtgggg gctgtaatgg agagagaagg 3840
caacctttat ccaatatgga gaaaatgtct gtctgttcaa aagagagatt ggaaaggtgg 3900
aacggggagg cagccttcaa aataatattc gaagaaaaaa agaaaacact ttctttttcc 3960
ccccctccct ctcaagtcaa ccatatcttt gtagtttttc 4000
<210> 6
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 6
tcacttaaaa tcctagaagg accttatata tagtgcatat atataacaca catatacaca 60
cacttaagtg gtttattttc tgccttcccc atttaaaaca taaattcctt gacaataatg 120
actgtgtgtg tgtgtgtgtg tgtgtgtgta atttattgtc ttattcgggt tcctacatta 180
atttgcatta atttaattaa taaatgctct agctctacca tacaaccctt ttccttcttt 240
ctttttatca acaccatcgc catgagaaga gcaaaaacaa gtgtgcctgt attttgaggg 300
ttctcatagt catcaacatt gaaaatgaca agataagaaa tgtcaagata agaaaatgac 360
aaaatttgct tatcttcaag accacctcct atacacagaa tgcagaaaaa tgccccacac 420
ctcgtggaac tcagtaaata ttagttgcat tgaattaact tcaattcaag accccattct 480
acagtttata aagtcaaaag ttgctcttag taacacgctc agtaatatgt gctgtgtttt 540
gaaaatagaa aatatccctt ttcctcaaat ccatagatag tcatattaag cgcaaggact 600
tctgtttatt tataatgatt ctcatataca gatgcataca actgaaggaa ggatggtatg 660
tgtttccaga aatatttgct ttatgatgag atatgagtga agttcctatt tttttcttcc 720
tttgagaatt atgtttttat tatcatttac cctagtgctc attttcatcc tcttcaacag 780
aaatttagca gggagactgg ttgaaaaact attcatataa gttcctccgg aggcttaatc 840
atcagtacat tgtcttggaa ccactctggt gttttctaaa ttaaatatct ctgtctacaa 900
caaatgcgaa aagtacagaa tgtttccgta ctccttctac atcaaaattg cctcctacag 960
gaacgagaaa atgcgtgtca atgtgaatta ccgtctacaa cagctactct ccaggctgat 1020
ctggggtctt gcacacaaag ggcgaagaga ggggcgtggg gaggctggaa agcatggttg 1080
ccccgcctgg cccggcgacg cccgctcagc agcctgctga ggagtgggga cgaagagcag 1140
cctaaactta gggctcggga tatttcgatg ccacccaaat tgccgtccta ccccaacgag 1200
gcagggaaag gagcggagcg cgcgcgcgag ctgagtgagt gcttacgtcg cagcgagatc 1260
tgtgctggga taattagaga ggagttgggc tgagccgagt cctctttcag cagcagcagc 1320
cggagccgcc gccgcagccc ggtggggcaa ccctgactcg gaccgctcgg gagagcccca 1380
ggagaggcca gcgccgcgca gcagccgccc cgctgcgccc acctccccgg ctgctcccgg 1440
agggctcaca aaggcggtgg ccgcccgagt ggccttctcc atccaggcgt tcgcgtcctc 1500
ctccccacct tctctcccga aggcgaaaat ggcagggcca ggcgagaacc tgggacagcg 1560
gtggccctag ccctgcgatc ctcacccctc ctgctaggag aggctgcggg ctgcccgcgg 1620
acgatgtggc cgcggctgct cccgagcgca tcttcggccc gggtccccgc cgccacccct 1680
cttctctgct ccttccatcc cgcccagagg agttgatgcc gctgtcgccg ccgccgccgc 1740
tgctgaagcc gcggctgatg gatgccaggg agtgccgcat tgcttagcga ccccgcctct 1800
gggtttgctg gtaggagcgg ctgctctttc ttctttcttg ctttggggtt ttatagaaaa 1860
gataaggaca tttttatttt attcttcaca acgtcctccc cttctcttcg tttttgaaat 1920
gtgcattccc agagatatcc ccggtcccct ccctccccct cccccctttt ctccaacccc 1980
gcggcaagtc cgtggaaatg aagggctaga ggaaggcaga agttgggggt ggggttgggg 2040
gagcccacgc tggtaccaac gccaccagaa cccctgctgg tgccttatga gatcacggtg 2100
tatctcagag gggtggtggg aaggtgcgct atctgcagag tcttcaccta attggatcac 2160
aataatctta aataaatcac acaaatttgt cttttaaaaa tagcgtcttt gaataagtac 2220
agggagaaat aatctccttt ctcccccctc tttctctctg tctctttttc tttctggcaa 2280
agatgatctc tctccgccct ggagctcagc gctgaagagc taccttatta ttaatcagaa 2340
tttccatcgc cacccctggc aggcgtatcc ttcagcaggg accgcaggaa cattcacagt 2400
gcaggggctg agatgtgcgt gggggttgtt tttgttacat cttggaagag aagagaagag 2460
gacagtacca agatcagaaa cacccgtgct aggtggaatt aggggtgatt tgttaggaaa 2520
gagaaaggac aagaagagga gtgcggagcc cttcaggggt tcacatctct ttaaaggaaa 2580
ggaaagaggg agccaaagta gggtgttgta ttttaggggg cagaggaaga agtttacacc 2640
ccccggcccc cccagctttg ctgggggaaa gcaggagcaa cagggcactt gattggacac 2700
caagattatt aatttcctgt aggggagagg aagcaggcag caggaggtct gggggctgga 2760
gtctggtggt ggcaaggacc aggtttgctt tgggacagtc aacaaggtct tctgagggaa 2820
agctcagaga taggcagaac aatgactcat ttgcaagccg gtctctcccc tgagaccctg 2880
gagaaagctc gcctggagct caatgaaaac ccagacacgc tgcaccagga catccaggag 2940
gtgagggata tggtcatcac caggccggac attggctttc tgcgcacgga tgatgccttc 3000
atcttacgct tcttgcgggc taggaagttt catcactttg aggccttccg cctcctggcg 3060
cagtactttg agtaccggca gcagaacctg gacatgttca aaagctttaa ggccaccgac 3120
cctggcatca agcaggcact gaaggatggc ttccctgggg gcctggccaa tctggaccac 3180
tatggcagga agattctagt cctttttgct gccaattggg atcagagcag gtaaatccta 3240
aatccaaact tgtattctcc ttttactctc ccattttcca gaatttaccc cgagtagtgt 3300
catggttttg tagatttgat atttttgttt atttggcttg gagaaaagag aaacaaacca 3360
ggagatgagt ttttggtggg caccctggga agggaggagg gcttgtattt ttacttttaa 3420
aacttacttc actaacaccc actttctact gcagctttaa ggtgctacct taaccacgtt 3480
attgcacaga gatctaaatc acttaacttg taaataaagc ttctctgtat gtttcacctt 3540
ctgaaaaagt ttattgggct ggataaacca gtaagaaaat ggggacaact tttcctcctt 3600
cttcctaaaa aaattcttaa actagaccca tcatcattgt catcatcatc atcatcatcc 3660
tctctttggt actgacgttt tatcttttaa gcatagcctg gcgttcgacc aaaagcaagt 3720
agttttgttg cttgggaagt tctctgtttg gtgatgtgta gaagaaggaa taatatgatt 3780
tgtgtccctt cagtgaaagg aagagttgca tcctctgtcg ctgagcatgc ctgctgacac 3840
tgaaaatgta cactgactgg tgtatgtgtc ctacacctgc cactaatcta aagaatctgt 3900
ctcctgtctc atgtgatttt tcatcttttg gaaggaagtg gaaaatattc agatgtgtca 3960
gttggtggac tttttgagct catgtgctac ttaatagaga 4000
<210> 7
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 7
tgtcgccccc agcttccggg atgcaggccc gccggggtct agaggggcgg ctgccgtgcg 60
tccagcctgt gcgcaggcct ttcgccgctc ggcgccccag gcagcctcag tttcctttcc 120
tctgtttgcg ccccagtgaa cctccgcacc tctcattcag ggaagagaat tccccgcgca 180
gccgcgctcg tttcttcctc tgggattttc ctgagaatcc ccaggagttg gccacgatcc 240
catggggggt ttccttctac ccagccccgc gtcctggcct cgtccttaac ccccgggttg 300
ccttcactca ggctgggaat ccacgattga tttcctacta cggaagcggg tggcgttccc 360
agcctgcttt cggagcagca cgggtttcgt gcagggtgtt atcccgaccc cttcccccat 420
ccctctaatc tggcttgaga agcccgtgct ggagagaaaa acgcggcctt aaaaaaaaaa 480
aaaagtttaa ccgaaagcgt gagagccacc cgccggctgt tatctggggc tgaaggctgc 540
ggtaatcgat gggttatttt tacgcggtaa tagggccctg tgattgctct attaaccttt 600
agacctgtct gagggactct ccggctcgca gccccgctgc gctggggcct ccaggctctg 660
acgccgactc ccaactcagg cctgacacat tcccctcccc cataccctgg aagagccccc 720
tccatgaaga agctcccctg gaccgcctgg ctccccagcc cttgccacgt cccttggatt 780
ggtgcagagc cgccgcaggc tgcagaaaaa agggggaaag attagaagag aggaggccac 840
aggagatggg aagtgtcgcc aggaagggat gcagattgca taaatacata aaattgaggc 900
tgaggcctgg gctcccgacc atctccctgg gattttggga aggcaaaagg gaggcttcgg 960
tctctacgct ctgattttag gaggcagtct gggtgtctcc tgaacctcca aggaatccgg 1020
ggctgggagg atccccacta cccctgccca ggaactagca tccagccggg caccccgggt 1080
gacccagtgc cccacacaag atcgagagtt gagcccaaga ggtcaccttc ttctctactg 1140
gccccgcccc tcgcccgccg ctgcgggatg aggaccacag gaaggggggg cggggaggga 1200
gaaagggaac tcattaataa agctgaccct gggcaccaca gcgaacccaa tcgacctccg 1260
gctgggttgc gggtgattcc ccgctccctg gcggtagcac ttgggcattt tccgcggaga 1320
ccccagagcc tggactttgc ctgctggggg agctttccgc acagtcccgc agcctgcgcc 1380
cagcggaggt gtagccgggg ccgcgcaccc ccgccccgcc cttgcacgtg actcccacag 1440
gccagtcagc gccctagggc cgagttgctg ggccggggac ccgagccgcg agctggggac 1500
ttggaggcgg ccggcgcagg ggccgcgaga ggcttcgtcg ccgctgcagc tccgggggct 1560
cccaggggag cgtgcgcgga acctccaggc ccagcaggta gggctttttt cttccctttc 1620
tttgctcctt cccgcggtcc cccaaactcg gagcttctcc gcctttgctt gtctggaggt 1680
agagaggtag ctagtgggag gaaaagagac gtgcgctact cacttcaccg aaattgccca 1740
acccctgctc tgcttttgac tttgccttag caacttcttt aagtcaaagt aagacttggg 1800
ggcaaaacag agaaatattg gaagcgcctt tggattcttt ccgtgtgaac ttgaacgctt 1860
tcaatccctg tccccgtgtg cacattctcc aacccttgtt tgcatatcgc aggccggggc 1920
ctgggtggtg atggtggccg cgtgaagtta ccgggactga cgggcccggg acaggctgca 1980
cggcagctcg cacatggagg gaagtagacg gaggcttgtc gcccaccagc gactccgggg 2040
acgcagggtg gcagtgccag gcagctccgc tgggcctcag gggcccccgg gagccgctct 2100
gaggtgcgga gaggctgctg agtggcggaa ctattcatgc cctttctggc cggcctcctc 2160
gccctcgggg ctggggtcca gggactgaat gctcctctgg aagctcacca ccccacctgc 2220
ccgcgctgct tctacctgaa actggccaag ggcccgagcc cggaccggag ccgtgacttc 2280
cctccgccgg ccacggggct gcccggatcc gccgggttat gtcgcttggc tttgggctca 2340
ggggtcaccg tgggcagagg ggggtgccgg ggtcgcggac tgccaccagg ttgaggaaag 2400
gaggggcctt ttggctgggg aaagagcgtg gtgggggacc cgcggccgat ggaatccctg 2460
gggcagcgcg gcccgcaccg tggaggttgg ggaagcgcct cggggaagtg tttcctgtgt 2520
tcccagaaaa ggaagacaac cgagagcagg tttcaggctt ttaaagaaag cctggggtgt 2580
ggaggtgatg ctccgcacac gtctgtgtct cctcccctgc tgcggccggc ttggttgtgc 2640
cggctagcgt gcgaccgtcc tcctcgctgc aggccgagag cggaggcgta aacccaggcc 2700
agcgaggagt gtcctataaa gggacgggga cttttcggcg cttgcaattc tcccattctg 2760
aaaaatagat cggaagaggg ctattggttg attcttgaaa ggggagcgca tttcctgttg 2820
gcctgcgaat ttggggtgaa ctgggacaag tgatcagaag gagagcaaaa actccccgat 2880
tttggcagcc tcgggagctg ctgggctttc tccgccaact gcaggatcca ggctcaattt 2940
caacaaccag ccagaggcgt tttccaagag cagctaattc cttgtttttc cagaaagtta 3000
tagaggagta ttttctccac cttctgttgt tctagtaatc caactcaggc actatatcag 3060
ccatttgaaa aggcagagaa tgtgataaag acaaatatta gattgatgac attttttgca 3120
tttacctttt aaagtctgca agttactacc tgtgtgtata ctggaagttg gattataaaa 3180
ttctaaatct cctttctttt ccaaagttat gaaagaaaaa aaattacatt atcttgaaga 3240
actgcaggag ttgagtattc cagaaaatgc aatgaaatag gtcagctact tgattttaaa 3300
agtcaaatac tggatctttt attaaggtaa acccataatt ctttaacttt attttcaaag 3360
ggaaaagttg gtgacctcag gtcaattttt aaaaaaatct attctctaac caaacttgct 3420
ggaatgaact atttgccaaa ccaataagtt attgcatatt ttgaaagcaa ataagctttt 3480
aggagttacc atgtgactat ataatacaat acagtactat tccattatta ttactagtga 3540
tgttgcaaaa aatggtgaaa agcattatgt agtgtgtatt aaagattcca tttccagatt 3600
tttacagtaa taaagatgat catttattat agtatataca tttgaggtac tttcttgtat 3660
tatactagaa atctgtagta atagtcaact gttatttaga actttctttt tgcctgttag 3720
gacagtttta taaaaatctg ttataagtgt tttacaaata ttaatttata atcctcactc 3780
ctaagcttca cgatgactct acaaaataag tacctttaat atctgcattt tgcagatgag 3840
gaaactaagg cacagagagg ctaagtaatt tgtctaaagg tgtttattcc gtaagtctca 3900
gagcctggat tcatatatag ttaacattct tgtaaatcta ctattgaaat aaaaaagaaa 3960
actttgtcgg gagtagttgc ctcttcttaa agagagaaat 4000
<210> 8
<211> 3428
<212> DNA
<213> Homo sapiens
<400> 8
agtttccttc caattaacgg agtggcggcg accttttaat ttacccccaa cgggtgagaa 60
ataaacttcc ccaacgtggc caggcccagg aatgggactg gagtcgatgc ccttttaccc 120
ctccccgttc taatttccag ccctggcctt gagctgtggc tgcctctctt tgggccttgt 180
acctctccgc cgagtctccg ggccccgtag gtaaccaagg cgaggcccgg agtagcagct 240
ggaaagggag gaaggagccc tgaaaggctc acgcggcccc gggacaggcc acatcggtgc 300
gggcctccca ggttccggag ctgcggggtc tcttaggcga ggctgccttt tcccaaaccg 360
aacttgcctt ccattcatgc cacttgtagt tttttcccca gctgggattc acggagcgca 420
accaggcttg cagcgctcat ggttagagcc tctgaggctg gagcacaggg ctgggtcgcc 480
agccgcctgc gcctgggaat cctgattgcc agctgatgag aaaggcgggc tgggcgcgcg 540
tgtgcgtggg gtcgagggcc ggggaccgag cgcgccgcac aaccaaccag gccctcaaaa 600
ccttcgccct ggtggcggct ggccgctccc tcctggccag ctcctccgtg gggtcctcgt 660
agcaaaggcg aatttaaggg ttgcccgggc gcccctcgct ccaggcgggt agctgtgggg 720
acctacaccc gcggtactcc ctgagcggcc ggtccctgcc tggagtgccc tggtagggcc 780
ggcggcggct ccgtttggga cggatcctgc gttgaatttg acttttcgag ggcggccgcg 840
ggtaaactcg cctctcccgg ggaccgcagg gattatttac agggagctcg ccaaccaaac 900
acaacagtct aacctttcca agtcctcgta aatttttaca gctgggagcc acggcgaggc 960
aaacgaatct gttggtcgtt tccgacttcc cgccagcctg tgtggcttct gaaacaataa 1020
ctccttatga aatatcataa atatagattt aaatacagta gagcgacaat gcgatttggc 1080
tgctttttta tggcttcaat tattgtctaa ttttatgtga ggggctccgc tggccgcact 1140
cgcacgcggg acccgcgcct tcttgatggc gtgattaatt gtgatataaa atagtccgct 1200
taagaagtgt gtgtatgggg ggggagacgg gagagtacag agacaaggct agatttgatc 1260
ttttaatcgt cgttggccac aattaaaaca aaccccatcg tagagcggca cgatcccttt 1320
acataaaaac atatggcttt tgctataaaa attatgactg caaaacatcg gaccattaat 1380
agcgtgcgga gtgatttacg cgttattgtt ctgctggacg ggcacgtgac gcgcacggcc 1440
aatgggggcg cgggcgccgg caacttatta ggtgactgta cttccccccc ggtgccacca 1500
agttgttaca tgaaatctgc agtttcataa tttccgtggg tcgggccggg cgggccaggc 1560
gctgggcacg gtgatggcca ccactggggc cctgggcaac tactacgtgg actcgttcct 1620
gctgggcgcc gacgccgcgg atgagctgag cgttggccgc tatgcgccgg ggaccctggg 1680
ccagcctccc cggcaggcgg cgacgctggc cgagcacccc gacttcagcc cgtgcagctt 1740
ccagtccaag gcgacggtgt ttggcgcctc gtggaaccca gtgcacgcgg cgggcgccaa 1800
cgctgtaccc gctgcggtgt accaccacca tcaccaccac ccctacgtgc acccccaggc 1860
gcccgtggcg gcggcggcgc cggacggcag gtacatgcgc tcctggctgg agcccacgcc 1920
cggtgcgctc tccttcgcgg gcttgccctc cagccggcct tatggcatta aacctgaacc 1980
gctgtcggcc agaaggggtg actgtcccac gcttgacact cacactttgt ccctgactga 2040
ctatgcttgt ggttctcctc cagttgatag agaaaaacaa cccagcgaag gcgccttctc 2100
tgaaaacaat gctgagaatg agagcggcgg agacaagccc cccatcgatc ccagtaagtg 2160
tctcctccct tcaaatccgc cgccgcctcc acgccggcct cccggatctg ctggcccgcc 2220
aggtttctct cgagcctgcc ttcgtcctcg ctggaagcct ctcgagttgg ggccaggagc 2280
cagaagttgg tgtttgggac gcctcagata gggccccaag tctggagagc agtgaagagc 2340
ggcccgcagg gctacgggag aggaggcggc tgctgcagcg agagggggcg gggcgggcac 2400
ttcgggacga gccaagactg gccgcccctc tccttggctg cccaggccca ggaccgagat 2460
actttgggcc gttcttcgaa agcagtgcag cccagagagc cttttgtaca actagattgt 2520
ccgtgagcgg cggcagccag ggcagccgga gctgggacgc tgggggagac ggccgattcc 2580
ttccacttct tgccttcggc cagtggcggc gtaaatcctg ccaagatgag gctgcgggcg 2640
acccgggcca caagggtccc catgacagat tattcaaata agccacagac gtgatcagcg 2700
gccttagggc gccctgacgg cttgcccagc tccgaaggcc ttccaggaag gttaaataag 2760
gagtgggggg cgtagaggga caggttggga aagaaagacg aagtcagtga acgggacaga 2820
ggaatcctaa tcttgctaca gaacacaagg cagcatgctt tccctctgcg tggcaaggag 2880
acctgtttcc aaatttcatt ctatacagcg ttttgagagt gggaggaagg agaaggggga 2940
caagaggaca gagtaggaga aaggaaggtc tcggagggga gggcgagcca aagttttact 3000
gcgtgcaatt ttaagtgact gtctgtgcgt ctgtctgcca gggttccatt gtgtccgagg 3060
cctgactgcc tttcctaacc agttcagcag agttctgcac ttcggccaga gaccccatgc 3120
aggaggctca tttgccccag cgggatgtgc gtcttctgct cctaaaccca gtgtttctct 3180
tccccgcaga taacccagca gccaactggc ttcatgcgcg ctccactcgg aaaaagcggt 3240
gcccctatac aaaacaccag accctggaac tggagaaaga gtttctgttc aacatgtacc 3300
tcaccaggga ccgcaggtac gaggtggctc gactgctcaa cctcaccgag aggcaggtca 3360
agatctggtt ccagaaccgc aggatgaaaa tgaagaaaat caacaaagac cgagcaaaag 3420
acgagtga 3428
<210> 9
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 9
taattacgct gaataggatc gtattgagtt tgtaataatt agcaatacca tccctaagga 60
aacagggttt ggtctcactg ccaaatcaga agtttgcctt gcctcaagag aaatataagt 120
attctggaaa aagtcttgca agtgtttttg ataagaattc aaatctcctc aggccattga 180
atatcacagg attttgggaa aatgcccagt taaaatcaag gttgtatttt aaaattctgt 240
tagcaaaagt atttgcaact gaattatcta tgtgataaaa gttgcataag aagaattctc 300
tagaagacgt ttggtaactt gcaatcaagt agtttaggtc ttgcttatgg ttaggtgtcc 360
ctagagatct ttaaaggcat taccaactcc ctctttaaaa aaatcacaaa cacaaaggta 420
gagacagtgc attattttga ctctcaaatt ccctttccac ttcaacatag tataggctag 480
gctcaattca gcgttaaagt tcagtggctt tatgtgacaa caacaacgaa agtgttcttt 540
tcacttccaa aagaatcagc tgtggctttc cagagtagtt cttctaataa tgtaaactaa 600
tggtaaactt gttctaattg cctcccaaag cagtaggagg atgaaatggt agaagacctg 660
tgaaagaggg atctggaatt ttaaaaataa attcaacacc gtattaatta tttgctggaa 720
ggctgcaatg tgtccaggta ttagataaaa aaacggtaag cagagtctct acggaaaaaa 780
aaaaaaaatc acaatccagc ctgaaagatg agtaagagcg aggaaaaaat tgaacagaac 840
tatgtagaat tctataaaat ttcacttatg gtggagcatt gtactcttag ggctgcaaga 900
aaaaaaaaat ggagggcgtt cttcctctct ttggcttttc ccaagaggcc taacgctaac 960
aatggcacca actactgtta ataccatcaa tagggaaatg gtaccgcata atggatgctt 1020
tgtatctcta tctctcagtt cagttggagc taaataaaga gggcaaatga gcacccaaca 1080
ctgtgccagg ggaaaagtgt cgcctgcaac agtgaagtcg caggtggatg tgagatgcct 1140
gacttaggag cgcgcttacc aaggcgctaa cactgctgct attatttcca cccgcacccc 1200
gagcgctatg ccggccgcgc ctgggatgaa acacacacat tgagcctaca agaccgtcct 1260
gggtctagag tgtctgtggc agccttcttt tctgccccac cctgaaatcc tagctatccc 1320
aggacgccct agaaggaagc ccagggacgg tgtggagcag cctgtactcc ccatctctct 1380
tccaggaggc cacacccaaa acaaggccct ctttgtgtct cggagaacag tggccgtata 1440
gtgctccgcc ggctgcccct gttaagagag agcgagcagc cctcgccccg gcaaccccag 1500
gcagaggcgc gtcgcggcgg cggcgcaggt gggcgcaggc gcggaggtgg gctctctagg 1560
gccgcgcggg agccccgggt ccgcacgccg cgcgcggaac acctgggggc ggagccaaga 1620
ccgcgtcccg cccactcccg ggcgcgaagc cccctccccg cgcccctccc atcgcgccgc 1680
agaggcgcgc aggtgcgtga ggccgcgccc gcccgggacc ctgcagacgt gggccagcca 1740
tggagcacat ccgtacgccc aaggttggtg acaccagcgc gggcggagga gggacgggag 1800
gagatggggg aggaggagga gggatgctga gcgcgcggga ggccgactgc tttgaggggc 1860
accggcggag cctggaccgc gggcgaggga ggagcaggca ttgcctgagc atcccggggt 1920
gcctgcgagc ccggtcgttc tcttgctgcc tcccaggcct agccttagct gctgctgggt 1980
ctgacctctt ggttttgggg gagcgcagtg gacacaaggg tgaacgggag ggaacctcag 2040
ttgtctgcta gtaactgggt gtagatcaac ccttctttct cctggcacga ggctttctct 2100
tttagctgtt ggccgctcag agtagttgaa agggaaataa gcctttcggt gacaggtgca 2160
aggaaaacga gctaaatgca gagggactcc tgcgcttgga agcttgttaa atctagggtg 2220
tcaggcccac ccggctcggc cttcccagtc agcatcctca tcctgagcgt agcagctgca 2280
aggggcctta cacagaacgg ataatcaata ttcattgtag gttgaatgat ggtgtgttct 2340
tgccttttcc agtccgtttt gttcgttaga gaaaaggatg cagcttacgg attcgtcacg 2400
cactgttgtg ttttaacaac accagctttt gctaattaac aaaagcaaat ggtccctgat 2460
cactccagta aattaacatt ggaaacgttg atcgctgtac caaatcttcc tcctcagttg 2520
tactgataat ctaatttaga atgaaaatga tgatcgacgt tactgcatga taaaaaccct 2580
aaacgagtga aagaatatgc ttaaaaaccc tattggctgt ctgttgttac taccaccaca 2640
gctccttgcg tttttgcagg atgaacttcc attcaaaatg taggcccctg acaggtcaaa 2700
gctaggtcag agtggccata gctcaggtgg ttccagggat cccacacatt taagaggggt 2760
gggggcaatt gctttatggc cagcaagaat tgattcctaa attttggaat agttcctgag 2820
tacctttttg taaaagcaga ttaaaatgat ctcatgtcat tggaagaaga aatcttttag 2880
tttgctggag aatgtcagtt ccgacagtaa atttaaattg tattgatttt gcactaggga 2940
attaagttgt cgcttcacaa tcatgaaatt gtaaacttag aagacaatgc tacaaaccac 3000
agaataggtg gctcaaagct ttcagagttt aagtggtact aaataattta ttccagaagg 3060
gtgaatttaa ctcatggact ctgcccttgc caagggcatt cttcctcctt ccatgatgaa 3120
gggagccgtt tgtaaaagtg atagctgttg tggatattga tagcaagaat gatacagtga 3180
catggcagtg gatgccactt tgttagagaa tatgaatttg ggggagtcaa ggccttttct 3240
gttctatata caaagccacc tggtacaaag tcacgtgtga acctgagttg caagcagtgt 3300
tcttactctt aaaattggtg tttatggata ccctctaagc agtgcagtac ttgaagtcag 3360
aaatccttat ttatctggaa atggaaacaa attgggggaa aatggaaaat tgtctgaagt 3420
gttactgaat tgggtgagtc attaacattt gggataaagc tggtgaaaaa aataagaaat 3480
tacagaggtt ggatggatcg gattcattta ttcatttatt ttattctaca agcatttaga 3540
acctttcatg tgccaggctc tgtgttaagt gctggaagcg tccaggaact cacaatctct 3600
aaggggaggc agttgtaaat atgtcagtgt atgatagaga catgtgcaag gtgcagtggg 3660
tagagaggga gactgaagag aggatcagct ctgccctcaa ggtcaaggga agccttctta 3720
gaagagccgt cttaacatgg aaggacttaa ggaggactag gagcattttc aacagtggtc 3780
atgtacttgt ataaatatat attgtaataa ataattacaa ccctaaagaa actgaaaaca 3840
ataacaatgg tcaaagataa atgattcctt gaggttaaat aacatcctcc ttttgtttta 3900
catttttaag ggcaaaatta attttcacag tctaaatgaa aaagagaaca acattactta 3960
cagagcttgc agagttaaat atataattgt tactggtcat 4000
<210> 10
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 10
agtgattggt actgctcgaa ggttgccaga atgagtattg taccgaagcc cttatggtta 60
tatgactcag ttataatggt tcagtctctt tgataccgga tggctttttg gaagaccatt 120
tttctgttat ttaacagttg ttaacaacaa caacaacaaa aagcttcctg gttgtgtttg 180
atagagtcta ggggaaaaac aaagccactg ttgcctcctc tccatcccca aggagaatgt 240
gggtcagggc tggaggccgg ctctgggaat ccctgagaag ggagcattat taatgtcacc 300
accactgtgc ctgctgagct gctctgtgct tcccccttgc acaagaacca ggcccagcca 360
gggaaaggaa acgcaggcca ttccctcaga gccgaagtta agggagaaat aataatacag 420
gcacaggagg accagcagca gccagagagg agaagtgaca gggaccgagg caaatccagt 480
ctctccccgg gtttcaagaa tttgagaaac acacctctta aagatgaaat cagctgtgcg 540
agagtgtgag gcccaggaaa cctgggagtc tgctgtataa atacagcaag tggctcacac 600
tcatccaccc aagtgagcac ttttgcaggc ccagcatctt ttaatggcga caaaacaaga 660
ataaagaatg taagtgggtg tctgaacttg accaacattt tgatgatgcg atttttccag 720
tttcgcacac taagaggctt ctgtgatttt ggatttgttt tatatatggc agatctctag 780
aatggtagtg ttgagtctct ggggttttga gcagctttgt ggggggctgc tgggcgggtg 840
ctgtactact gaataactat gaggttcttc taaaacatcc tccgaacact ctgagtttac 900
tctgaatgct aatgggatta atctgatcat tttaaaggtg catgtatgca tgctgcaggg 960
tgttcctttc ccagttaatt agtttgtgac ccttattaag atgtctcaag tctgaggctg 1020
attaaggctg catggtaact ttgtcttttt tcctaatttg gaagcgcgta aatggttaaa 1080
ctcctggcct gggctgggct ggtgcacagc ctgggcccgg cgcggcgggg gttaaggtgg 1140
gcgcccgcgc cccgcgcccc gcgccctccc gccgggatga gagcgcagtc cgcgccgcca 1200
gcccgcccgc tcgctccgag gcggcaccgg gagaaagtgg cggtcaggga tggagctgct 1260
gccatgacaa ccccggcggt cggggcccgc gcgcgtcggg gctgctcccg ggaggaaggc 1320
ggcgcggagg ccgggggcgg ccgctgagct tggcgtccgc gcggctccgg tgcgggctgc 1380
gccgcgcctt ccccagcgag ctaccgagct tggggccgcc gcggtccgct cccgccgccc 1440
ggcctctccc tcctcggcca ccgccgcagc ccctgccccg ccgagccccg ccggacagcg 1500
gcggccgcag cgcgcatttg ggctccgagg aagttgaccg aggcggctgc cgcaggatcc 1560
cgggcccgga tcgcacgaag cccgcgcggc cgtctcctcc gcgcgccacc cctgcgcctc 1620
ccgcgagctc cacttcccat ctgctattgt ttccgattgt tttccggtgg cgagcccggc 1680
tccgaaactt acaaagtgtt ggatgtcccc cgttcgaact gagggactgc agaccgcctc 1740
tgggtagctg gatgaagccc accccgtccc cttctggtac caaagtgctt actcctctcc 1800
aaagtgccgt gtctgaactg ccgctgggaa gaagcggctc ctgagacgcg cccacacctt 1860
tcacctgccg cgcgcttccc cctcctcggc caccttcccg gcggaagcag cgaggaggga 1920
gccccctttg gccgtcctcc gtggaaccgg ttttccgagg ctggcaaaag ccgaggctgg 1980
atttggggga ggaatattag actcggagga gtctgcgcgc ttttctcctc cccgcgcctc 2040
ccggtcgccg cgggttcacc gctcagtccc cgcgctcgct ccgcacccca cccacttcct 2100
gtgctcgccc ggggggcgtg tgccgtgcgg ctgccggagt tcggggaagt tgtggctgtc 2160
gagaatgggg gtctgtgggt acctgttcct gccctggaag tgcctcgtgg tcgtgtctct 2220
caggctgctg ttccttgtac ccacaggagt gcccgtgcgc agcggagatg ccaccttccc 2280
caaagctatg gacaacgtga cggtccggca gggggagagc gccaccctca ggtagggagc 2340
tgacattgtt ctgcgaactg atggtttgta tggggtcggg gtaaggggca ggggtgcagg 2400
tgtgtgcact gaggcgtgcc tgggttggcg gagaggtcgc tggttccctg ggctgcacaa 2460
tttatggctg cgctgggggc tctgcccggg aatgtggcag tcgtagggaa aggctcagag 2520
gttctggcgg tgagcttttt cccaaaaact ggcctctgcg gctcaggcac ttgttaaagg 2580
tgaggggtgg ctggaccagg tggtcgccga gattgaggga cttgtgcctg gcactgtctg 2640
tgcctgagcc tggtggccgt ggtgacaggg ggcttggagg ggctccccgc gagcagtctt 2700
ctctgaagtt aatgagcccc aaaggagggg tctggcttgg agtgaatgcc cccactcgcc 2760
catgccatag ggctttgcca gccctggctc ctgcactctg ggagagccgc tgctttgtcc 2820
tgggcctgac tgtgcccggg ctttcctggg gtgccttcat gccgtgagct ggtgggcaga 2880
cagagatgct ttctcctgtc tgaacgtggc tttctgaggc ccaagtcatg gagtctgatt 2940
tgtccgtgga aaatggcatt tactgtagtg aactgtgttc tgttcctgct ctccaccaaa 3000
acggtacatg caaaactcgt ctactgaaga gaaactaggt ttcagtgttg ggttgggtcc 3060
tgattggctt ctggggttaa ggcttacagg cactggggga ggagaagaag aagaatcttg 3120
gttatgcttt gtgtaaggta gaatgattct atctccctga ttaccttgcc tgcagaaacg 3180
ctaactgaat ttccagtgtt gataaaccac acctctcata tgcgggcaaa acacttaatg 3240
attgcgatgg gaaattttat tctctgggat tttataagag aataagcatg aggtggacgt 3300
taagaaggtt catgggaacg atttccctgc ctctccttgg tttagtctgc cctcctaaat 3360
aaagttttcc aaactaagcg acagaactaa ccacaaggca acatggcaat attcctgtcc 3420
tttgcacatg aagatttctg gaaagataac cctggtgctg gtgtctactg ttttgcccct 3480
ctgatgactt cttctaggat tgggttgttt tggactgtat acttaaggca atatctatag 3540
gatagaaaat ggtgaagagg aggcaatgtc aatacagagc tgagttatca ggacattgcc 3600
aaaggaagtg tgtaatttag ggacccgtgc agggctacaa gcatccagtg atcctttgtc 3660
taggcaaagc ttaacctcat ggctctggtg aactcctagt tatttgttgg ctcacgagac 3720
ccacctcttc cactcttctg agcaaaaata aagcaacttc cttcccccac tcagaaatga 3780
ttgtgtatct gctttaaaaa tggatttcag gggagttaca aatatgcagt gatttcagac 3840
tacttaaata aaaaaccaaa aataaatgtc tagagcagta ataatcaagg aaattttctt 3900
gttcaagaaa tgcttgttct ctggatgccc tctttgtccc tagtccttgg ctgcaaggag 3960
ggcctcccag ggacagagac attctgaatg gggaacattt 4000
<210> 11
<211> 2848
<212> DNA
<213> Homo sapiens
<400> 11
tttctggcat tagctgccca cgtctgtggc acttcaggcc catgtaacta tttccagagt 60
gacacaagtt tcttccacag ttgtcaacaa gtggccctca caggttcagt gagaagagga 120
agagggagag agatcatcag gattaatgga ttacttgcat ttgtgagacg gtttgccaag 180
tattgctaca aacaaggcac gggattttct tttttctttt cttttttttt tgagatggag 240
tcttgctctg tcctccaggc tgtagtgcag tggagcaatc ttggtttact gcattctctg 300
cctcccaggt tcaaacgatt cttctgcctc agccctcccg agtagctggg attacaggcg 360
tgtgtcacaa cgccctgcta atttttgtat ttttagtaga gacggggttt tgccatgttg 420
cccaggctgg tctggaactc cctgcctcac gtgatcctcc cccctcggcc tcccaaagtg 480
gtgggattac aagcatgagc caccgcgccc ggctaaggca tgggatgttt cgaactgctg 540
acattagaaa ttcacaatcc acatcattaa ctggatcctc catgcccact ctctccctct 600
ctgcagcagc aatttcaaat ctttactctc cgcagttcca cagaacacaa gaaacaaaca 660
aacaagcaaa aaaagtcagg caggagccca agtaacctct atcaaagcaa agaccagtgc 720
ctagtctaac gcttttaagg attttaaaag aggtgaaggt gtcctgctta tcctccaagc 780
ttgggtgctg gggccggggc ggctgagatt taccagtgaa acccaaagaa agagagggca 840
gaaaactaga gaaaagaaac cagataatgc tacccaagag gacgaaataa agaagcagga 900
aacgaagcct gaggctaaac cctggagatg actattagga aaacaccaga ggatgccccg 960
cccgccagcc cacaatgagc agcctgtcca agtcacaaag cggggcctcg ggccttgaca 1020
gttcgcgatc tgtaagcaga atgttccagg gcctccctgt cgcctgcatc cagcctgggg 1080
gcaatcttca ctggtgtggg aggccgaaag tggacggcga cggaggcccc tctggttatc 1140
tctttgccgt gccaacacag tctctgcgcc cactaagatg catgaaataa aaatttccgt 1200
gactcgccct ttgcagtgga gaactgaaac aggcacacca gggaattgga gcggaggagg 1260
gtaactcaaa ctcagagtga gagggtttgc agggggccga tttggggcca acaggcttcc 1320
cagcaggccc ccggcgcggg acagcggaag gcgaaacgct ttcaagagac cccgctgcca 1380
acatccccac gccctcgcgc cctcccgccg ccccagaagg ccaactccgc ctgcctgagt 1440
cacagctgga gctggggagg agccagggaa aggaggcccc tgaccgtagt gcggccagca 1500
gttgcaggca gacggagcag agcggtcagg gatcatgagg gagagtgcgt tggagcgggg 1560
gcctgtgccc gaggcgccgg cggggggtcc cgtgcacgcc gtgacggtgg tgaccctgct 1620
ggagaagctg gcctccatgc tggagactct gcgggagcgg cagggaggcc tggctcgaag 1680
gcagggaggc ctggcagggt ccgtgcgccg catccagagc ggcctgggcg ctctgagtcg 1740
cagccacgac accaccagca acaccttggc gcagctgctg gccaaggcgg agcgcgtgag 1800
ctcgcacgcc aacgccgccc aagagcgcgc ggtgcgccgc gcagcccagg tgcagcggct 1860
ggaggccaac cacgggctgc tggtggcgcg cgggaagctc cacgttctgc tcttcaaggt 1920
cagtgacctc aaacggtccc caatccgagg cctttgccgg cctgtgggcc accagctggg 1980
ggctccccgc ttccatccac ctaccacacc cacattcctg acccctcccg ccgtctgttg 2040
ctgtggaaca gactcacaga gccgcaccca cttcccaaga cccagcccca tccctccctc 2100
tcacgcctga gccccgcctg gccaatccaa gcccgcccag ctctagctca ggccacgtcc 2160
gcagaatttg gtctgagtcc cagccaatcc ctaaaataac ggtggttgaa agggcattcc 2220
gtgactgcgg gcactatcct cttctcgccc ctcaccaggc ctcacctact ttacagcgtt 2280
ttgcagttcg cacgcagctt tccctcccct taccttccca cgcctgcctt tccccccaga 2340
ctctggctgc ggaggtaaaa ggtttccctt gtgtaattaa ggagtgagtt tcgggctgct 2400
gggggtaagg agctgccagg atcagtgctg tgtccgtcac atgcaggagg agggtgaagt 2460
cccagccagc gctttccaga aggcaccaga gcccttgggc ccggcggacc agtccgagct 2520
gggcccagag cagctggagg ccgaagttgg agagagctcg gacgaggagc cggtggagtc 2580
cagggcccag cggctgcggc gcaccggatt gcagaaggta cagagcctcc gaagggccct 2640
ttcgggccgg aaaggccctg cagcgccacc gcccaccccg gtcaagccgc ctcgccttgg 2700
gcctggccgg agcgctgaag cccagccgga agcccagcct gcgctggagc ccacgctgga 2760
gccagagcct ccgcaggaca ccgaggaaga tcccgggaga cctggggctg ccgaagaagc 2820
tctgctccaa atggagagtg tagcctga 2848
<210> 12
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 12
cctggcaaga atggattctc tcgaaaggtt tgaaaatccc tattttgctt ggtggcccag 60
accatctgtg ctcaatgagc taagcaaatc tggctgggct attacctggg agagtccaga 120
tttttcctct ctggaggggc ctgaagatta tttatgggaa ttaattttat ccccaaatct 180
ctgagaactt aaagggattg ggaaggtctt tctggatttc cctttccctc tactggagat 240
gtagcggttc agccttcttc cgatgccatg tttgtttttc gtgtcttcgg cctagggtcg 300
ccttgccagc aagcctaaag gcctccaagc tgacttggag ggtgagggtg ttttcacaaa 360
taaatacatc gcctgggcaa agggaaaata tctgtttgca aacaaacctg gaaggtggag 420
tgagcaccat agcaaaggag ggctggcttt ctccccggtt gccccacatt cagggttgga 480
gattctccac tttggcattt tgcagcaatg gcctggcctg ggattttagc agagcagtca 540
cagagggtta cacagctgct gacctcgggg catttctcct ccctccatcc ctttctccag 600
accttgactt gcaggcccaa gtctcttatc agaaccctag aaaaatcagt atgatggggg 660
tacaggaggt aaggatggga aacagaacag gactcctgac atttactcca agcaccaata 720
ttcggtgtcc caatctgggt ctgctcagac tgagacctac tgactgtgtt tgtgctttta 780
ttgacctctt caactcaccc taaaaaaaaa aaatacatct cagagaggga aagggcaagg 840
agaggagacc agtggagatg aaaaccctag ccagtcccca gtgactgttt gattatttta 900
ataaaactgg gcactgcctt gtgtacacct ggagcagggg acgtctggtg gccccactgg 960
gtggggggtg agggcccgca gcgatttctt agcatctttg atctcggccc ccatcccaat 1020
gcaccttcac cctgccttca ccccagagtc gttgagagta ggggtgatga gtagggggtg 1080
gaggggagat gtcaggaagg cgagcgccgg ccaggcgggg tcaggcagct ctccttctcg 1140
aggtcagcgt tggagagaat gtctgcaagg ctgcggaggc ccgcggtgtg tttgtgtgtg 1200
tgcgtccaga ctcggttctc tgcaccgcca gcgtcactga gattacttcc cgattagaag 1260
ccgaccgcgt ttgaaatgat ttgtgcagga gtttttgcag ccaccgcttg ctcagagaag 1320
cagagatgga tggaggttgg gaaaggggta gagaggaggg agttattgca ggtctgtgtt 1380
gagagtcgta ttgtgatttg agtgttcggg aaatctagtg gaaatttggg gtggggggaa 1440
gggaggacgg gagggtggga gggagagaga agggggaggg cgacagagtg cagtgggagc 1500
tagttggata ggcgatttca gtactttgtg agcatcgagg caacccaacg tcactgtgct 1560
cagctgagtt ggcttgtatt tcagagagag agagagaggg agagagagtg agagagactg 1620
actcttacct cgaatccggg aactttaatc ctgaaagctg cgctcagaaa ggacttcgac 1680
cattcactgg gcttccaact ttccctccct gggggtgtaa aggaggagcg gggcactgag 1740
attatatggt tgccggtgct cttggaggct attttgtgtt ctttggcgct tgccaactgg 1800
gaagtattta gggagagcaa gcgcacagca gaggaggtgt gtgttggagg tgggcagtcg 1860
ccgcggaggc tccagcggta ggtgcgccct agtaggcagc agtagccgct attctgggta 1920
agcagtaaac cccgcataaa ccccggagcc accatgcctg ctcccccgcc tcaccgccgg 1980
cttccctgct aggagcagca gaggatgtgg tgaatgcacc ggcttcaccg aacgaggtaa 2040
ccgtcccggc agatggcccg ggaggctcag gagggagctc gtcggccgag tcggctgggg 2100
cggcgggaat ggcggattcc agcccggctt tgcattctgc agagcacagc ttgcagagat 2160
tttgcgcggc tcggagctcc ccggcaaatg gagtctggga ggccgccgcg gctggcggag 2220
cggcattgag gtttgcagaa gcacggcctg gttctgtcaa accgcatctt gttcgcctcc 2280
gccagcccag agctccccgg gaccctggcg agggcgcggg gtaggattct ccccgcggcc 2340
ggcagtgaat gggagcgcgt gtaggggcgc cagccctgct ttcttttgtt gtgagtaggc 2400
agcggggctc cagtcgccgc ctccctgaag ccccgagaac gaggcgaaga aagctgcttg 2460
caagtcaggc ctcagaagct gtccttctcc tcggccccat ttctagatct ctggccacag 2520
caggtcaggg tgggatctgg ccgcttgctt aagcagctgc tgaggttttg ggggaccatc 2580
gcttgtgccc gcttcccaaa gtcttcccgt tctaggggga attcctactt gcgtatagaa 2640
gagattggaa ggagatcaga gagcaggaga caggctcatc gggcttgaac agctctgcgg 2700
cagttatttt gtgtgttcta agctcatacg cctgcaaacc cgggccgttc tatgcattgc 2760
ggggacccgg gctgcagatt caatgtctcc agcctaggac ttatccgaga atgattttgt 2820
cctcgccaat cctgagcctg agcctgcagt tttagcaggc caggcctggc tgaagttcag 2880
agaaacccct ttcggcctgg tcactccaca aaatgcccgc catcccccgc ccggcatcag 2940
agcgctggtg gcgggcaccc agtgacgagc cttcctcgga acggctgcac ggtgactttc 3000
ttcatctagt cttctgtttg gctacttttt atcttttaac gaatcttact taaggttggg 3060
ataaagaaaa ggatgtttaa ttttaaagga cttttaatgt taaggcctgt aactggtaaa 3120
aggtgtatat gaattctctt ttgaacctag tctcaatctg cacaaccttc cccttctgtg 3180
tttttctttt tgcaagaggc gggttatttc acacatttct gcctgctgca gaaaactatt 3240
cctcttgtga ggtttaataa aaagagtttc gacggcatct tgtaatttgg cgaagaaaga 3300
aattctctaa aggacactgg gtttttgttt tgttttgttt ttggttccta cccagtggct 3360
tccaaaaata cccacgcctt atctttattg gctcttccag aagtccagac aaatttgacg 3420
ggcagcttgc ttatcacgga gagcctgcgc aggggagatg cgggcctcac cttctccggg 3480
tctgacgcgg gtcttttgca agaagttgtg cctgcttata aagtaatagt aatactacta 3540
ggaatactag taacagtaat aattctaggg ccttctgcag tcaccttcgg ctgggaacgg 3600
aggtgctggt agctggaaac tgggggccaa actgctccct cctgtcacta gaattgtgct 3660
ctccaacctt tctctcgttc tctctctgtc ctccccaccc ccatctcccc ctgcttcttg 3720
tcctcagagc agaaccttgc gcgggcacag ggccctgggc gcaccatggc cgacgcagac 3780
gagggctttg gcctggcgca cacgcctctg gagcctgacg caaaagacct gccctgcgat 3840
tcgaaacccg agagcgcgct cggggccccc agcaagtccc cgtcgtcccc gcaggccgcc 3900
ttcacccagc aggtaaggag acctcgcgct tcgggtccct ttgcagagat caaagtcaga 3960
gtctggcttt cctgctcggc ttctcttgcg gggacagaac 4000
<210> 13
<211> 4000
<212> DNA
<213> Homo sapiens
<400> 13
gagaaagcca aaaatttccc cctaccaatt acataagatt ccctgcttct agttagcccg 60
cctgtagttt ccccatgcca gcaacttcca ataagggaat acctgaagcc attccttttt 120
tccactgtga agctttcccc actcttctgc ctgactttca gtctgctgaa tgcaagtgat 180
gagggctgac tctcttgtca tatatagcaa gctctgaata atagtctttg ttctcatttg 240
aataatcttt attttcacac ttcttaaaaa atttaatttc ctggcatgtt gcataatgtt 300
aggtaagcca ttttctctct ttgggcctta ctttcttcaa ctgaaaaact ggttcaacat 360
ttattcattc ttttattccg taagccaaaa ataaaattca aagccctctg accatatgaa 420
tggatctctc ctcttggcta agggcattcc aaagttaacg tgaaaaactg gttcaggcca 480
taatgggaag gaggagttgg acatggctca ttatgctccc ctaccttttg aaattcagga 540
ccagctgacc agcattaaca tcaacacaga ccttaagact gatagaacag cctctttaag 600
tctcacagac tatccggtag tgtgataatg atgagaaaca tttgcagtct attctctgaa 660
gcctgctaca ggctccatct gcatgataaa actttggtct ccacaagccc ttatcttaac 720
tgagacatcc ctttctattg attctaagtc tttatacaat aacttaactc tttcaaccaa 780
ttgccactca gaaaatcttt gaatccacct atgtcctgaa agcctcctct tccagttgtc 840
ccacctttcc ataccgaacc aacgtacatc ttacatgtat taattgatgt cttatgtctt 900
cctaaaatgt gtaaaaccaa gttgtagccc gaccacgttg ggcacatgtt ctcaggatct 960
cctggggctg tggcacgggc catggtcact catatttggc tcaggataaa tcccttcaaa 1020
tattttacag tttgactttt cgtggacaat tctacaaata ttccttggca gttaaagaaa 1080
taactcccca ggaggtgcta gacatcgggc gcatgttaga ggcacaaaga tgagaatgtt 1140
aaaagacata aaatacaggt ctgctctggg aatgcaaaaa ctggtaaaag gagagataaa 1200
agagcaggtg cagtctagtg aagtacccgc tacctcctat cagcaaatat ctgtccacct 1260
agggtgcagc gagctggaga ggaaggggtg gcctagagcg caggggaagg attcctcccc 1320
agccgcctgc acccctaccc cggtagcggt ccctgggatc gtccgtgtct ccaggagaac 1380
cggaccgctc tcccctccct ccccgagcga gaaaggagga ccacagagat gcggcgccct 1440
ccgccgtcct agagcaaccg gagcggcccg agccccggcc tcccggatgc tggggcctgg 1500
cgggtgtgga gcacggggag tcgggcgtgg ggcgggcagg gagtggagtc ggggtcttac 1560
tccggtggct gcagggcgca gggtagccgt gtcaggcctg cccaggtgca gagcgctctt 1620
ccgcgacccc aacagcctct ggtccggtct ggcgcgccct cgctttccca gagggcgacc 1680
tgggctatgg cggccgtggc gctggcgagc gggacacgcc tcggccttgt cctcgagctg 1740
ctcccgggac agcccgcgct gccccgggcg cgccgggtga gtgcggggcc ggagcctgga 1800
agcagtcttg gccctgccct gggttctagg cccggagacg gggtggtgcg gcggctggga 1860
aatgggggta caacccagag tgaggggcct cgagggacag gcagcacagc ggagtcgaca 1920
cccctggacc tgagcctcaa ggagagcaga cgtgcagcgg cacggggttg agccgactgc 1980
tggggcagag cgcacagagt gctgtcgggg gcgatgaatg gccagaattt cagagctgcc 2040
tttacagagc tggttatgtt tgagctgggt attaggttga aaaggaattt gcaatgcagg 2100
agcaggaagg aagaactgga tattcaggca agagtagccg caggtgcaag gacacagaac 2160
agggtgagga aagagtttgg tttcccaatg caatggtgag aggatcggag atgagagtgg 2220
tggtggctga tgatcctggc caggaaagct gggtctgtga gtagtgaatg gaattgtctg 2280
tagtgcagag gaatgtggac tctattaggc agacaaagtt gagccagcca aagccttgga 2340
gccctggagt gctggataaa tagctgtgga gactttctag tgcgcaagga ctgaagtgca 2400
gtggaccaga atgggctcct ccacagtgtg gagactgaga ccctgaagga ggcagtggct 2460
gagaattacg ggaagtccca acggctggag gtcagcagta tttgtttctt aagaggatga 2520
gagaaagaag gtgcaggagc tgagactcct agagatatag aaaatgggga catggagatt 2580
gggacgtggg taagcaagtg aggtgggatc tttgtgagag tgttgcgggt ggtgggggtg 2640
cagggagtaa agtcacaacg aggatctgcc ctgttgagta cagtgttcag agcaacctga 2700
atgttctgag gagccctagc tgcctctgtg gctggtggca gtgactgggg aggacaaagg 2760
aggaagagtc ctatacaggg gcagcaggga tggcaggaat ggggacggaa ggcagtgtgg 2820
cataacaggc aagagccaga gtcaaacagg cctgggttct gtctcagttc tggaactttg 2880
ggggaagtta atccctccga gtctcagttt cctcttctaa aaaacggatc tgatagtagg 2940
ctatgagaca taacaaagaa tatatgtcaa gtgcttggca caggcttaat aaatgatagt 3000
tgttatcaag ggtgggtgac ctctgaagga ggacacattg tggagagagg atgggaccta 3060
gagcacagat gtggtttggg gtataaggat gaaacaagaa aacttttgca gactcatgaa 3120
aaagaggaga aaatgtttgc tgaaataaag atgaagagac atgagaaaat tgatggctga 3180
tgccttgtct ctttgtacat aggaggcaaa aatcttctgc tgatagagtt cctgtagaca 3240
ttcagaatcc agaatcccca caggcacccc cacagtacct tttgatgccc tgtctcccct 3300
tcctcttggc ctggtcctgg ggttgtccta gggcatttaa acacatgttg tttcaggagt 3360
cagtgacctt cgaggatgtg gccgtctact tctctgagaa cgaatggatc ggcctgggcc 3420
ctgctcagag agccctgtac agggatgtga tgctggagaa ttatggggct gtggcttccc 3480
tgggtaaggg tctctccctt tgggccctgc ctccaccctt gagagtttgc tggctccttt 3540
tttctcaaag gctcaggagt tgttgataac cctcagctca atggcagctt caggctcttg 3600
gatttttaat gacctaacct cagcagccgt tggaaagtag gaagtcctgg tatcagtttg 3660
ggccttatac aggacttcct tgctccagag tgagaggtgc caaaccccta cccttgtgtt 3720
gtgggtatag tgagaagaga gcaaattcat ggtgctccac tgagccttca gttccctccc 3780
ctctcggttt gcaagatcca gcctaattcc aagcatcctc atgaggatgt ctgaacttga 3840
gagctctaag agggagagga caggtaagaa ttgaggactc aattcctcaa tgagtgaaat 3900
catccatttg ctgactcaaa cagttactga gtcgtctgtc aacttcctga cctttgtaag 3960
tctcctggcc cctctcttgt cctttcccct ggaattcctt 4000

Claims (20)

1.一种用作生物标记的BHLHE22、THY1或其组合用以制备诊断子宫内膜癌试剂试剂盒的用途,其中该诊断试剂试剂盒是基于取自于一个体的样本,评估该样本中作为生物标记的BHLHE22、THY1或其组合的甲基化判断该样本是否为子宫内膜癌样本。
2.如权利要求1所述的用途,其中该生物标记还包含CDO1。
3.如权利要求1所述的用途,其中该生物标记还包含ADARB2、CDO1、CELF4、CLVS2、GATA4、HOXA9、MTMR7、NTM、PRKCDBP、TBX5和ZNF662其中至少一者。
4.如权利要求1所述的用途,其中该生物标记包含BHLHE22、CDO1、THY1、CELF4、CLVS2、GATA4、NTM、PRKCDBP和TBX5。
5.如权利要求1至4任一项所述的用途,其中该样本是来自该个体的子宫内膜组织或子宫颈抹片细胞。
6.如权利要求1所述的用途,其中该样本是来自该个体的子宫颈抹片细胞,该生物标记为BHLHE22并还包含CDO1和CELF4其中至少一者。
7.如权利要求1所述的用途,其中所述的子宫内膜癌是第一型子宫内膜癌。
8.如权利要求1所述的用途,其中所述的子宫内膜癌是第二型子宫内膜癌。
9.一种用作生物标记的ADARB2、CLVS2、HOXA9、MTMR7、NTM或其组合用以制备诊断妇科癌或结肠癌试剂试剂盒的用途,其中该诊断试剂试剂盒是基于取自于一个体的样本,评估该样本中作为生物标记的ADARB2、CLVS2、HOXA9、MTMR7、NTM或其组合的甲基化判断该样本是否为妇科癌或结肠癌样本。
10.如权利要求1所述的用途,其中所述的妇科癌症是第一型子宫内膜癌、第二型子宫内膜癌、卵巢癌、阴道癌、阴门癌、妊娠性滋养层细胞疾病或原发性腹膜癌。
11.一种用以评估一个体是否罹患子宫内膜癌的方法,至少包含以下步骤:
(a)自该个体取得一样本;
(b)测定该样本中至少一目标基因的甲基化状况,其中该至少
一目标基因包含以下至少一者:BHLHE22与THY1;
(c)决定该至少一目标基因是否高度甲基化;以及
(d)基于步骤(c)的结果评估该个体是否罹患子宫内膜癌,其中该至少一目标基因的高度甲基化代表该个体罹患子宫内膜癌。
12.如权利要求1所述的方法,其中该至少一目标基因还包含CDO1,且该步骤(b)还包含决定CDO1的甲基化状况。
13.如权利要求1所述的方法,其中该至少一目标基因还包含:ADARB2、CDO1、CELF4、CLVS2、GATA4、HOXA9、MTMR7、NTM、PRKCDBP、TBX5和ZNF662,且该步骤(b)还包含决定ADARB2、CDO1、CELF4、CLVS2、GATA4、HOXA9、MTMR7、NTM、PRKCDBP、TBX5和ZNF662其中至少一者的甲基化状况。
14.如权利要求3所述的方法,其中该至少一目标基因为BHLHE22、CDO1、THY1、CELF4、CLVS2、GATA4、NTM、PRKCDBP和TBX5。
15.如权利要求1至4任一项所述的方法,其中该样本是来自子宫内膜组织或子宫颈抹片细胞。
16.如权利要求1所述的方法,其中该样本是来自子宫颈抹片细胞,该至少一目标基因为BHLHE22并更包含CDO1与CELF4其中至少一者,且该步骤(b)还包含决定CDO1与CELF4其中至少一者的甲基化状况。
17.如权利要求6所述的方法,其中所述的子宫内膜癌是第一型子宫内膜癌。
18.如权利要求6所述的方法,其中所述的子宫内膜癌是第二型子宫内膜癌。
19.一种用以评估一个体是否罹患妇科癌症或结肠癌的方法,至少包含以下步骤:
(a)自该个体取得一样本;
(b)测定该样本中至少一目标基因的甲基化状况,其中该至少一目标基因包含以下至少一者:ADARB2、CLVS2、HOXA9、MTMR7和NTM;
(c)决定该至少一目标基因是否高度甲基化;以及
(d)基于步骤(c)的结果评估该个体是否罹患妇科癌症,其中
该至少一目标基因的高度甲基化代表该个体罹患妇科癌症。
20.如权利要求9所述的方法,其中所述的妇科癌症是第一型子宫内膜癌、第二型子宫内膜癌、卵巢癌、阴道癌、阴门癌或原发性腹膜癌。
CN201780015221.8A 2016-07-29 2017-07-28 妇科肿瘤的诊断方法 Active CN109069670B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662368182P 2016-07-29 2016-07-29
US62/368,182 2016-07-29
PCT/CN2017/094917 WO2018019294A1 (en) 2016-07-29 2017-07-28 Methods for gynecologic neoplasm diagnosis

Publications (2)

Publication Number Publication Date
CN109069670A true CN109069670A (zh) 2018-12-21
CN109069670B CN109069670B (zh) 2022-05-10

Family

ID=61015645

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780015221.8A Active CN109069670B (zh) 2016-07-29 2017-07-28 妇科肿瘤的诊断方法

Country Status (15)

Country Link
US (1) US20190153544A1 (zh)
EP (1) EP3490612A4 (zh)
JP (3) JP6767512B2 (zh)
KR (1) KR102258887B1 (zh)
CN (1) CN109069670B (zh)
BR (1) BR112019001712A2 (zh)
CA (1) CA3032038A1 (zh)
IL (1) IL264542B2 (zh)
MX (1) MX2019001214A (zh)
NZ (1) NZ750327A (zh)
RU (1) RU2723531C1 (zh)
SG (2) SG10202101024UA (zh)
TW (1) TWI648403B (zh)
WO (1) WO2018019294A1 (zh)
ZA (1) ZA201900570B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113337614A (zh) * 2021-08-05 2021-09-03 北京起源聚禾生物科技有限公司 子宫内膜癌早期筛查诊断用标志物、引物探针及试剂盒
WO2023010964A1 (zh) * 2021-08-05 2023-02-09 北京起源聚禾生物科技有限公司 子宫内膜癌早期筛查诊断用标志物、引物探针及试剂盒
US11866790B2 (en) 2022-03-03 2024-01-09 Beijing Originpoly Bio-Tec Co., Ltd Combination of DNA methylation markers and use thereof, primers, probes and kit for early detection of ovarian cancer
WO2024060775A1 (zh) * 2022-09-22 2024-03-28 上海奕谱生物科技有限公司 新型的肿瘤检测标志物TAGMe及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101570779A (zh) * 2008-04-29 2009-11-04 赖鸿政 一种癌症筛检的方法
CN101864480A (zh) * 2009-04-17 2010-10-20 赖鸿政 一种癌症筛检的方法
CN104204222A (zh) * 2011-08-30 2014-12-10 Dcb-美国有限责任公司 预测易罹患卵巢赘瘤或卵巢癌预后的生物标记
CN104513851A (zh) * 2013-10-08 2015-04-15 陈永恩 侦测膀胱癌的新颖表基因生物标记及其方法
CN105224827A (zh) * 2008-07-01 2016-01-06 小利兰·斯坦福大学托管委员会 用于评价临床不育的方法和系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005115388A1 (en) * 2004-05-12 2005-12-08 Biorunx Co., Ltd. A therapeutic agent containing nicotinic acid or its derivatives as an effective ingredient for prevention and treatment of cancer
US7754428B2 (en) * 2006-05-03 2010-07-13 The Chinese University Of Hong Kong Fetal methylation markers
CN101230399B (zh) * 2008-01-07 2010-06-02 中国科学院化学研究所 一种检测dna甲基化的方法
US20110195848A1 (en) * 2010-01-08 2011-08-11 Roopra Avtar S Gene expression and breast cancer
EP2683834B1 (en) * 2011-03-10 2017-12-06 Oslo Universitetssykehus HF Methods and biomarkers for detection of gastrointestinal cancers
AU2012380717B2 (en) * 2012-05-24 2018-08-16 Fundacio Institucio Catalana De Recerca I Estudis Avancats Method for the identification of the origin of a cancer of unknown primary origin by methylation analysis
ES2886507T3 (es) * 2012-10-29 2021-12-20 Univ Johns Hopkins Prueba de Papanicolaou para cánceres de ovario y de endometrio
WO2015153283A1 (en) * 2014-03-31 2015-10-08 Mayo Foundation For Medical Education And Research Detecting colorectal neoplasm
WO2016049024A2 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo
TW201632629A (zh) * 2015-01-14 2016-09-16 臺北醫學大學 用於癌症診斷與預後的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101570779A (zh) * 2008-04-29 2009-11-04 赖鸿政 一种癌症筛检的方法
CN105586408A (zh) * 2008-04-29 2016-05-18 赖鸿政 一种癌症筛检的方法
CN105224827A (zh) * 2008-07-01 2016-01-06 小利兰·斯坦福大学托管委员会 用于评价临床不育的方法和系统
CN101864480A (zh) * 2009-04-17 2010-10-20 赖鸿政 一种癌症筛检的方法
CN104204222A (zh) * 2011-08-30 2014-12-10 Dcb-美国有限责任公司 预测易罹患卵巢赘瘤或卵巢癌预后的生物标记
CN104513851A (zh) * 2013-10-08 2015-04-15 陈永恩 侦测膀胱癌的新颖表基因生物标记及其方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YING-CHIEH CHEN等: "Quantitative DNA methylation analysis of selected genes in endometrial carcinogenesis", 《TAIWANESE JOURNAL OF OBSTETRICS & GYNECOLOGY》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113337614A (zh) * 2021-08-05 2021-09-03 北京起源聚禾生物科技有限公司 子宫内膜癌早期筛查诊断用标志物、引物探针及试剂盒
WO2023010964A1 (zh) * 2021-08-05 2023-02-09 北京起源聚禾生物科技有限公司 子宫内膜癌早期筛查诊断用标志物、引物探针及试剂盒
US11866790B2 (en) 2022-03-03 2024-01-09 Beijing Originpoly Bio-Tec Co., Ltd Combination of DNA methylation markers and use thereof, primers, probes and kit for early detection of ovarian cancer
WO2024060775A1 (zh) * 2022-09-22 2024-03-28 上海奕谱生物科技有限公司 新型的肿瘤检测标志物TAGMe及其应用

Also Published As

Publication number Publication date
MX2019001214A (es) 2019-09-19
AU2017304949A1 (en) 2019-02-21
CA3032038A1 (en) 2018-02-01
TWI648403B (zh) 2019-01-21
JP6971502B2 (ja) 2021-11-24
CN109069670B (zh) 2022-05-10
EP3490612A1 (en) 2019-06-05
ZA201900570B (en) 2019-10-30
BR112019001712A2 (pt) 2019-05-07
EP3490612A4 (en) 2020-04-01
NZ750327A (en) 2022-07-29
SG11201900589PA (en) 2019-02-27
WO2018019294A1 (en) 2018-02-01
US20190153544A1 (en) 2019-05-23
TW201805433A (zh) 2018-02-16
JP7182317B2 (ja) 2022-12-02
KR20190025941A (ko) 2019-03-12
JP2019524058A (ja) 2019-09-05
KR102258887B1 (ko) 2021-06-01
SG10202101024UA (en) 2021-03-30
JP2022036935A (ja) 2022-03-08
IL264542A (en) 2019-05-30
IL264542B2 (en) 2024-02-01
IL264542B1 (en) 2023-10-01
RU2723531C1 (ru) 2020-06-16
JP6767512B2 (ja) 2020-10-14
JP2021019587A (ja) 2021-02-18

Similar Documents

Publication Publication Date Title
KR101828290B1 (ko) 자궁내막암 마커
EP1888785B1 (en) Thyroid fine needle aspiration molecular assay
CN111386352B (zh) 利用基因的cpg甲基化变化评估肝癌的预后或者风险的方法
RU2723531C1 (ru) Способы диагностики неоплазий женских репродуктивных органов
BRPI0616090A2 (pt) métodos e materiais para identificação da origem de um carcinoma de origem primária desconhecida
CN106978480A (zh) 用于癌症的分子诊断试验
BRPI0708534A2 (pt) ensaio molecular para prognosticar a recorrência de cáncer do cólon dukes b
US20140011199A1 (en) Non-invasive cancer diagnosis
WO2004081564A1 (en) Expression profiling of tumours
CA2726736A1 (en) Composition and method for determining esophageal cancer
CN109423515B (zh) 一组用于肝癌检测的基因标志物及其应用
KR20150067151A (ko) 암을 스크리닝하는 방법
WO2013052108A2 (en) Methods and compositions for the treatment and diagnosis of ovarian cancer
CN111363811A (zh) 基于foxd3基因的肺癌诊断剂及试剂盒
US8206896B2 (en) Detection of uterine leiomyosarcoma using LMP2
KR20180030347A (ko) 폐암 질환의 진단용 마커
CN111363812B (zh) 基于dmrta2基因的肺癌诊断剂及试剂盒
KR20090025898A (ko) 폐암 환자의 폐암 재발 위험을 예측하기 위한 마커, 키트,마이크로어레이 및 방법
KR102416607B1 (ko) 방사선 저항성 지표 단백질 및 이의 검출방법
CN111363814B (zh) 基于dmrta2和foxd3基因的肺癌诊断试剂及试剂盒
CN111363818B (zh) 基于pax3基因的肺癌诊断剂及试剂盒
AU2004219989B2 (en) Expression profiling of tumours
KR20190032068A (ko) 이차성 급성골수성백혈병으로의 이행 여부 판별용 바이오마커 조성물 및 그 검출 방법
CN111363816A (zh) 基于pax3和zic4基因的肺癌诊断试剂及试剂盒
WO2007039963A1 (ja) 脳腫瘍患者の予後を予測するための脳腫瘍マーカーおよびその用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1260740

Country of ref document: HK

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211123

Address after: Neutral zone Chinese Taiwan New Taipei City

Applicant after: Cool gene Biotechnology Co., Ltd

Address before: Taiwan, Taipei, China

Applicant before: TAIPEI MEDICAL University

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211215

Address after: C7, Yiyuan innovation industrial base, No. 65, Shikou Road, Sijiqing, Haidian District, Beijing

Applicant after: BEIJING USCI MEDICAL LABORATORY Co.,Ltd.

Address before: Neutral zone Chinese Taiwan New Taipei City

Applicant before: Cool gene Biotechnology Co., Ltd

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220112

Address after: 102629 floors 1-3, South half of building 4, No. 38 Yongda Road, Daxing biomedical industry base, Zhongguancun Science and Technology Park, Daxing District, Beijing

Applicant after: BEIJING YOUXUN MEDICAL DEVICES Co.,Ltd.

Address before: 100195 C7, Yiyuan innovation industrial base, 65 Shikou Road, sijiqingxing, Haidian District, Beijing

Applicant before: BEIJING USCI MEDICAL LABORATORY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant