CN101802226A - 分析卵巢癌病症的方法 - Google Patents
分析卵巢癌病症的方法 Download PDFInfo
- Publication number
- CN101802226A CN101802226A CN200880107276A CN200880107276A CN101802226A CN 101802226 A CN101802226 A CN 101802226A CN 200880107276 A CN200880107276 A CN 200880107276A CN 200880107276 A CN200880107276 A CN 200880107276A CN 101802226 A CN101802226 A CN 101802226A
- Authority
- CN
- China
- Prior art keywords
- seq
- dna
- people
- sequence
- ovarian cancer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Oncology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Hospice & Palliative Care (AREA)
- Animal Behavior & Ethology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- General Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及用于分析卵巢癌病症的方法,包括确定选自SEQ ID NO.1-SEQ ID NO.10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的基因组甲基化状态。任选地,额外进行以下步骤:将来自甲基化状态测试的一个或多个结果输入获自诊断多变量模型的分类器,计算样品来自正常组织或卵巢癌组织的可能性,和/或,计算预测中的置信度的关联p-值。
Description
发明领域
本发明属于生物学和化学领域,更具体属于分子生物学和人类遗传学领域。本发明涉及鉴定人DNA中的甲基化位点,特别是某些确定的序列中的甲基化位点的领域,所述序列当甲基化时,表明存在卵巢癌。
发明背景
卵巢癌是女性中的第五位的癌症死亡原因,是妇科恶性肿瘤导致的第一位的死亡原因,并且是第二常见的诊断的妇科恶性肿瘤(默克诊疗手册第18部分,妇科和产科第241章,妇科肿瘤)。
它是特发的,表示确切原因是未知的。该疾病在工业化国家中更常见,日本例外。在美国,女性一生中具有1.4%-2.5%(40-60名女性中的1名)的发生卵巢癌的几率。
卵巢癌一半以上的死亡发生在55-74岁的女性中,大约四分之一的卵巢癌死亡发生在35-54岁的女性中。
发生卵巢癌的风险似乎受到一些因素的影响。
与使用避孕药如柠檬酸克罗米酚的关联一直以来是有争议的。1991年的一项分析提出了使用药物可能增加卵巢癌的风险的可能性。从那时起进行了一些队列研究和病例-对照研究,而没有针对所述关联提供结论性的证据。
有一些很好的证据证明遗传因素是重要的。BRCA1或BRCA2基因的某些突变的携带者,更常见在一些人群(如德系犹太女性)中,发生乳腺癌和卵巢癌的风险更高,通常比一般人群发病更早。有乳腺癌的个人病史或乳腺癌和/或卵巢癌的家族史的患者,特别是如果年轻,可能具有升高的风险。子宫癌、结肠癌或其他胃肠癌的强家族史可能表明存在称作遗传性非息肉结肠直肠癌的综合征(HNPCC,也称作Lynch II综合征),这赋予更高的发生卵巢癌的风险。
已经研究的其他因素,例如滑石粉的使用、石棉暴露、高饮食脂肪含量和儿童期腮腺炎感染,是有争议的,并且还没有确定地证实。
卵巢癌是根据肿瘤史分类(ICD-O代码)。组织学指导了临床治疗、控制和预后的很多方面。
卵巢肿瘤也可以根据它们的推测细胞来源进行分类。主要的类别是表面上皮-间质肿瘤、性索-间质肿瘤(ICD-O 8590)、生殖细胞肿瘤(ICD-O9060-9090)和继发或转移性肿瘤。
表面上皮-间质肿瘤是最常见的和原型卵巢癌。认为它们来自卵巢表面被覆,并且包括浆液性囊腺癌(8441/3)和粘液性囊腺癌(8470/3)。腹腔被覆了与组成卵巢表面被覆相同的细胞,并且癌可以从那里开始。在这种情况下,称作原发性腹膜癌。但是,其治疗与卵巢癌的治疗基本相同。
性索-间质肿瘤(8590)包括激素活性病变,例如产生雌激素的粒层细胞肿瘤(8620/3)和男性化Sertoli-Leydig细胞肿瘤或男性细胞瘤。
卵巢的生殖细胞肿瘤(9060-9090)来自生殖细胞,并且倾向于在年轻女性和女孩中发生。这些肿瘤占大约5%的卵巢癌。它们倾向于包封良好,并且很多是良性的,因此与其他卵巢肿瘤相比预后较好。
也存在混合的继发肿瘤或转移性肿瘤。
卵巢癌通常是原发的,但也可以是继发的,即,转移的结果来自身体其他部位的原发癌,例如,来自乳腺癌或来自胃肠癌,在此情况下卵巢癌是Krukenberg癌。
历史上卵巢癌称作“沉默杀伤者”,因为直到治愈的机会很小,都不认为出现了症状。但是,最近的研究显示这一术语是不正确的,并且与普通群体中的女性相比,在患卵巢癌的女性中更容易发生以下症状。这些症状包括胃胀气、盆腔或腹部疼痛、进食困难或很快有饱感、泌尿系统症状(尿急或尿频)。
早期诊断与改进的预后相关。
患有卵巢癌的女性常常报道一些其他症状。这些症状包括疲倦、消化不良、背痛、性交痛、便秘和月经不规律。但是,这些其他症状对于鉴定卵巢癌不是很有用,因为它们也以相同的频率出现在不患有卵巢癌的普通群体中的女性中。
卵巢癌在它的早期阶段(I/II)难以诊断,直到它播散并且发展到更晚的阶段(III/IV)。这是由于大多数常见症状不特异的事实。
卵巢癌具有不良预后。它是不成比例地致死的,因为症状是模糊和不特异的,因此诊断晚。超过60%展示该癌症的患者已经具有III期或IV期癌症,此时已经播散超过卵巢。
恶性卵巢癌将细胞脱落在腹腔内天然存在的流体内。这些细胞可以植入在其他腹部(腹膜)结构上,包括子宫、膀胱、肠、肠壁的被覆(网膜),并且甚至可以播散到肺。这些细胞甚至可以在怀疑癌症之前形成新的肿瘤生长。
超过50%的患卵巢癌的女性在疾病的晚期阶段诊断,因为不存在经济的卵巢癌筛选测试。所有阶段的5年存活率仅仅是35%-38%。但是,如果在疾病早期诊断,5年存活率可以达到90%-98%。
因此,获得分析卵巢癌病症的方法和检测受试者中的卵巢癌的方法是有利的。
发明概述
本发明教导了用于分析卵巢癌病症的方法,包括确定选自SEQ ID NO.1-91的序列中的一个或多个CpG二核苷酸的基因组甲基化状态和/或确定特别是SEQ ID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的基因组甲基化状态。
感兴趣的区域在表1A和表1B中指定(“起始”和“终止”)。
CpG岛是这样的区域:其中大量胞嘧啶和鸟嘌呤在DNA的主链中彼此邻接(即,通过磷酸二酯键连接)。它们位于且临近大约40%的哺乳动物基因启动子(约70%在人启动子中)。CpG符号中的“p”是指胞嘧啶和鸟嘌呤之间的磷酸二酯键。
CpG岛的长度典型地是100-3000个碱基对。这些区域的特征在于CpG二核苷酸含量等于或大于统计学预期的含量(≈6%),而基因组的其余部分具有低得多的CpG频率(≈1%),这是一种称作CG抑制的现象。不同于基因编码区中的CpG位点,在大多数情况下,如果表达基因,启动子的CpG岛中的CpG位点是未甲基化的。这种观察结果导致推测出基因的启动子中的CpG位点的甲基化可能抑制基因的表达。甲基化对于沿组蛋白修饰进行印迹是重要的。CpG岛的通常正式定义是具有至少200bp的区域,其GC百分比高于50%,并且观察的/预期的CpG比大于0.6。
本文中,CpG二核苷酸是可以在体内,特别是人体内以甲基化和未甲基化的状态存在的CpG二核苷酸。
本发明涉及一种方法,其中用本文公开的一个或多个序列的未甲基化模式检测原发癌,并且其中用获得的甲基化模式预测对卵巢癌治疗的治疗反应。
本文中,受试者理解为是所有人、患者、动物,无论它们是否表现病理学改变。在本发明的含义中,任何采集自细胞、组织、器官、生物等的样品都可以是要诊断的患者的样品。在一个优选实施方案中,本发明的患者是人。在本发明的一个进一步优选的实施方案中,患者是怀疑患有选自下组的疾病的人:原发性卵巢癌、继发性卵巢癌、表面上皮-间质肿瘤、性索-间质肿瘤、生殖细胞肿瘤。
本方法用于卵巢细胞增殖性病症的改进的诊断、治疗和监测,例如,通过使得能够改进所述病症的亚类之间和对所述病症的遗传倾向的鉴定和区分。本发明相对于现有技术提供了改进,因为它使得能够对卵巢细胞增殖性病症进行高度特异性的分类,从而使得能够对患者进行改进的和知情的治疗。
本文中,要求保护的序列也包括指定序列的反向互补序列。
附图简述
图1显示基因组的差异甲基化区域的确定方法。这在实施例中更详细概括。
图2显示聚类的样品(列)与甲基化基因座(行)。甲基化标记可以区分肿瘤(上面的条的左部分)与正常组织(上面的条的右部分)。
图3显示基于甲基化特征的卵巢样品的聚类。未监督的聚类可以区分正常和肿瘤样品。
实施方案的详述
发明人出乎意料地发现,一小部分选择出的DNA序列可以用于分析卵巢癌病症。这可以通过确定本文公开的序列或其反向互补序列中一个或多个CpG二核苷酸的基因组甲基化状态而进行。总共鉴定出了约900种适于所述分析的序列。发现91种序列是特别适合的。
基于恰好10种序列,例如从表1A或B的前10种(P值0.0001),可以得到94%的分类准确率。这些序列可以存在于下表1A所示的基因中。
表1A
所述序列也可存在于下表1B所示的基因间区域中。
表1B
SEQ IDNO. | ID | 染色体 | 起始 | 终止 | P-值 |
50 | ID89944 | chr19 | 10843569 | 10843613 | 0.0000227 |
51 | ID102184 | chr2 | 63152348 | 63153687 | 0.0000231 |
52 | ID28331 | chr11 | 27698553 | 27698834 | 0.0000338 |
SEQ IDNO. | ID | 染色体 | 起始 | 终止 | P-值 |
53 | ID144851 | chr5 | 114908035 | 114908080 | 0.0000553 |
54 | ID128185 | chr3 | 58546910 | 58547629 | 0.00008 |
55 | ID93003 | chr19 | 40483018 | 40483248 | 0.000110513 |
56 | ID136801 | chr4 | 68239844 | 68239927 | 0.000144546 |
57 | ID146275 | chr5 | 140146252 | 140146717 | 0.000215464 |
58 | ID131177 | chr3 | 148621317 | 148621647 | 0.000216975 |
59 | ID12952 | chr1 | 158307786 | 158308067 | 0.000242093 |
60 | ID39999 | chr12 | 63439190 | 63439288 | 0.000286113 |
61 | ID116585 | chr20 | 61967316 | 61967544 | 0.000287984 |
62 | ID73971 | chr17 | 26742913 | 26742971 | 0.000311873 |
63 | ID125133 | chr3 | 13654044 | 13654318 | 0.000372628 |
64 | ID99092 | chr2 | 1654591 | 1654895 | 0.000372925 |
65 | ID69936 | chr16 | 88767910 | 88769082 | 0.000397396 |
66 | ID78601 | chr17 | 67623230 | 67623629 | 0.00041658 |
67 | ID148836 | chr5 | 179854129 | 179854384 | 0.000420579 |
68 | ID21285 | chr10 | 79714238 | 79714714 | 0.000425735 |
69 | ID158039 | chr7 | 922643 | 922835 | 0.000459 |
70 | ID32408 | chr11 | 70345916 | 70347923 | 0.000464267 |
71 | ID76532 | chr17 | 43973948 | 43974107 | 0.00051907 |
SEQ IDNO. | ID | 染色体 | 起始 | 终止 | P-值 |
72 | ID178855 | chr9 | 93408533 | 93408596 | 0.0005196 |
73 | ID81125 | chr17 | 78514384 | 78516444 | 0.000559665 |
74 | ID100286 | chr2 | 24625709 | 24625843 | 0.000582927 |
75 | ID155118 | chr6 | 119711684 | 119711950 | 0.000636 |
76 | ID89463 | chr19 | 8668749 | 8668987 | 0.000646711 |
77 | ID9880 | chr1 | 94718230 | 94718935 | 0.000655989 |
78 | ID177108 | chr9 | 37016858 | 37016916 | 0.000661917 |
79 | ID68281 | chr16 | 81219051 | 81219377 | 0.000665387 |
80 | ID178263 | chr9 | 83765733 | 83765839 | 0.000669707 |
81 | ID34175 | chr11 | 113165828 | 113166488 | 0.00067498 |
82 | ID147847 | chr5 | 175420376 | 175420628 | 0.000688163 |
83 | ID47981 | chr13 | 111756373 | 111756614 | 0.000693087 |
84 | ID146308 | chr5 | 140181734 | 140181814 | 0.000694524 |
85 | ID17523 | chr10 | 1273925 | 1274241 | 0.00074504 |
86 | ID166673 | chr7 | 149355326 | 149355615 | 0.000762 |
87 | ID91016 | chr19 | 15399966 | 15400044 | 0.000779943 |
88 | ID101572 | chr2 | 45143519 | 45143913 | 0.000805715 |
89 | ID39294 | chr12 | 52897679 | 52898035 | 0.000854819 |
90 | ID50743 | chr14 | 61349222 | 61349293 | 0.00087795 |
SEQ IDNO. | ID | 染色体 | 起始 | 终止 | P-值 |
91 | ID157888 | chr7 | 750241 | 750295 | 0.000912 |
形成本发明的基础的基因优选用于形成“基因板(gene panel)”,即,包含本发明的特定基因序列和/或它们各自的提供信息的甲基化位点的集合。基因板的形成使得能够快速和特异性分析卵巢癌的特定方面。本发明中描述和使用的基因板可以出乎意料高的效率使用,用于诊断、治疗和监测卵巢细胞增殖性病症并且分析发生卵巢细胞增殖性病症的倾向,特别是检测卵巢肿瘤。
此外,与单个基因诊断和检测工具相比,来自多种基因阵列的多个CpG位点的使用,能够允许相对高度的灵敏度和特异性。
本发明涉及用于分析卵巢癌病症的方法,包括确定选自SEQ ID NO.1-SEQ ID NO.10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的基因组甲基化状态。
在一个实施方案中,优选确定SEQ ID NO.1-91的序列中的一个或多个序列的甲基化状态,其中如表1A或1B指出的,所述序列具有小于0.0001的p-值。
CpG岛的甲基化状态指示卵巢癌。但是,优选地,确定每个CpG的甲基化状态,并且确定差异甲基化模式,因为并不是所有CpG岛都必须甲基化。
在本发明的方法的一个实施方案中,该分析是检测受试者中的卵巢癌,并且其中进行以下步骤:(a)提供来自要分析的受试者的样品,(b)确定选自SEQ ID NO.1-SEQ ID NO.10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的甲基化状态。
任选地,额外地进行以下步骤:(a)将来自甲基化状态测试的一个或多个结果输入获自诊断多变量模型(Diagnostic Multi VariateModel)的分类器,(b)计算样品来自正常组织或卵巢癌组织的可能性,和/或,(c)计算预测中的置信度的关联p-值。
例如,我们使用支持向量机分类器(support vector machineclassifier),基于来自患者的预定组的组织来“学习”肿瘤或正常样品的重要特征。算法现在输出分类器(一种公式,其中变量是来自使用的特征组的甲基化比)。然后将来自新的患者样品的甲基化比输入此分类器。结果可以是1或0。与边缘平面的距离用于提供p-值。
优选的是确定SEQ ID NO.1-SEQ ID NO.10和/或SEQ ID NO.50-SEQID NO.60的序列中的至少4个序列的甲基化状态。
优选的是,额外地,确定SEQ ID NO.11-49和/或61-91的序列中的一个或多个序列的甲基化状态。
在一个实施方案中,确定SEQ ID.NO.1-SEQ ID NO.91的序列中的至少10个序列、20个序列、30个序列、40个序列或超过50个序列的甲基化状态。特别优选的是确定SEQ ID.NO.1-SEQ ID NO.91的序列中所有序列的甲基化状态。
在一个实施方案中,确定SEQ ID NO.1-SEQ ID NO.10和SEQ ID NO.50-SEQ ID NO.60的序列的甲基化状态。原则上,本发明也涉及确定SEQ ID NO.1-SEQ ID NO.91的序列中仅一个序列的甲基化状态。
有许多用于确定DNA分子的甲基化状态的方法。优选地是,通过选自下组的一种或多种方法确定甲基化状态:亚硫酸氢盐测序、焦磷酸测序(pyrosequencing)、甲基化敏感性单链构象分析(MS-SSCA)、高分辨率解链分析(HRM)、甲基化敏感性单核苷酸引物延伸(MS-SnuPE)、碱基特异性切割/MALDI-TOF、甲基化特异性PCR(MSP)、基于微阵列的方法、mspI切割。其他已知的检测5-甲基胞嘧啶的方法的综述可以从以下综述文件收集:Rein,T.,DePamphilis,M.L.,Zorbas,H.,NucleicAcids Res.1998,26,2255。其他方法公开于US 2006/0292564A1中。
在一个优选实施方案中,甲基化状态是通过msp I切割、衔接子的连接、McrBC消化、PCR扩增、标记和随后的杂交来确定的。
在一个优选实施方案中,甲基化状态如下确定。
优选的是要分析的样品来自选自下组的组织类型:例如,来自要分析的组织的组织活检物、阴道组织、舌、胰腺、肝、脾、卵巢、肌肉、关节组织、神经组织、胃肠组织、肿瘤组织、体液、血液、血清、唾液和尿。
在一个优选实施方案中,检测原发癌。
在本发明的方法的一个实施方案中,将获得的甲基化模式用于预测对卵巢癌治疗的治疗反应。
本发明涉及探针,如位于上CpG位点的区域中的寡核苷酸。本发明的寡聚物通常用于所谓的“组”中,所述组包含SEQ ID NO.1-SEQ ID NO.91,或所述序列中的至少10个,优选20个,更优选30个,最优选超过50个序列内的每个CpG二核苷酸的至少一个寡核苷酸。本发明还涉及位于CpG位点的区域中的寡核苷酸的反向互补序列。
用于所述分析的探针是基于以下一个或多个标准定义的:(1)探针序列仅仅在人基因组中出现一次;(2)C/G核苷酸的探针密度是30%-70%;(3)杂交的解链特征和其他标准是根据Mei R et al,Proc Natl Acad SciU S A.2003 Sep 30;100(20):11237-42。
在一个非常优选的实施方案中,本发明涉及一组寡核苷酸,其特异于SEQ ID NO.1-10和/或SEQ ID NO:50-60,或SEQ ID NO.50-60的序列。本发明的寡核苷酸可以特异于体内存在形式的序列,或它可以特异于已经进行了亚硫酸氢盐处理的序列。所述探针的长度是10-80个核苷酸,更优选的长度是15-40个核苷酸。
在本发明的寡核苷酸组的情况下,优选的是至少一个寡核苷酸与固相结合。进一步优选的是一个组的所有寡核苷酸都与固相结合。
本发明进一步涉及至少10个探针(寡核苷酸和/或PNA-寡聚物)的组,其用于检测基因组DNA的胞嘧啶甲基化状态,所述检测是通过分析所述序列或所述序列的经过处理的形式(根据SEQ ID NO.1-SEQ ID NO.91及其互补序列)。
这些探针使得能够改进卵巢细胞增殖性病症的检测、诊断、治疗和监测。
该组寡核苷酸也可以用于通过分析根据SEQ ID NO.1-SEQ ID NO.91之一的所述序列或所述序列的经过处理的形式而检测单核苷酸多态性(SNPs)。
根据本发明,优选的是通过本发明可得到的不同寡核苷酸和/或PNA-寡聚物的排列(也称作“阵列”)是以可能结合于固相的方式存在的。
这种不同寡核苷酸和/或PNA-寡聚物序列的阵列的特征可以在于它是以矩形或六边形点阵的形式排列在固相上。这种固相表面优选由硅、玻璃、聚苯乙烯、铝、钢、铁、铜、镍、银或金制成。但是,硝酸纤维素以及塑料,如可以小团形式存在的尼龙或树脂基质,是合适的替代物。
因此,本发明的进一步的主题是用于制造固定于载体材料的阵列的方法,所述阵列用于卵巢细胞增殖性病症的改进的检测、诊断、治疗和监测和/或发生卵巢细胞增殖性病症的倾向的检测。在所述方法中,本发明的至少一种寡核苷酸与固相偶联。用于制备所述阵列的方法是已知的,例如参见美国专利号5,744,305,其是通过固相化学和对光不安的保护基团的方式制备的。本发明的另外的主题涉及用于卵巢细胞增殖性病症的改进的检测、诊断、治疗和监测的DNA芯片。此外,DNA芯片使得能够检测发生卵巢细胞增殖性病症的倾向。
DNA芯片包含至少一种本发明的核酸和/或寡核苷酸。DNA芯片是已知的,例如,参见美国专利号No.5,837,832。
本发明涉及包含核酸的组合物或阵列,所述核酸的序列与SEQ ID NO.1-91的序列中的至少10个序列相同,其中所述组合物或阵列包含不超过100种不同的核酸分子。
本发明涉及包含至少5个序列的组合物或阵列,所述序列的累积p值小于0.001,优选小于0.0001。
此外,本发明的主题是试剂盒,其可以包含例如含亚硫酸氢盐的试剂、含有至少两个寡核苷酸的一组引物寡核苷酸,在每种情况下所述寡核苷酸的序列相应于或互补于SEQ ID NO.1-SEQ ID NO.91中指出的碱基序列的长度为至少15个碱基的区段。优选的是所述引物是用于SEQID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60。
实施例
样品
从挪威奥斯陆的Norwegian Radium医院获得患者样品,并且根据法律要求,获得患者知情同意书。
CPG岛
从UCSC基因组浏览器获得有注解的CpG岛。用公开的Gardiner-Garden定义(Gardiner-Garden,M.and M.Frommer(1987).″CpG islands in vertebrate genomes.″J Mol Biol 196(2):261-82)预测这些岛,其中涉及以下标准:长度>=200bp,%GC>=50%,观察/预期CpG>=0.6。基因组中存在约26219个范围是200bp-2000bp的CpG岛。通过Msp I限制性断裂,可以充分覆盖这些岛。
按照以下说明,采用390K形式,通过Nimblegen Systems制备阵列。用来自人基因组构造33(hg17)的CpG岛注解来设计50聚体叠片式阵列。50聚体在岛序列坐标的任一侧移动,以便使岛均匀分布。390K形式具有367,658个可获得的特征,其不能用50聚体叠片满足所有岛。因此,我们基于大小制备了要表示的岛的截止值,仅仅测定了大小为200b-2000b的CpG岛。设计了对照探针,用于表示背景信号。以前已经描述了样品制备:表示(Lucito,R.,J.Healy,et al.(2003).″Representational oligonucleotide microarray analysis:ahigh-resolution method to detect genome copy number variation.″Genome Res 13(10):2291-305.),具有以下改变。使用的主要限制性内切核酸酶是MspI。消化后,连接以下接头(MspI24聚体和MSPI12聚体)。12聚体是未磷酸化的,并且不连接。连接后,通过苯酚氯仿清洗材料,沉淀,离心,并且重新悬浮。将材料分成两份,一半通过内切核酸酶McrBC消化,另一半模拟消化。每个样品对采用少至4个250μl试管,用于扩增各自具有100ul反应体积的代表物。循环条件是95℃下1分钟,72℃下3分钟,共15个循环,然后是在72℃下延伸10分钟。当完成时,合并每对的试管的内容物。通过苯酚∶氯仿萃取来清洗代表物,沉淀,重新悬浮,并且测定浓度。按照描述对DNA进行标记(Lucito,R.,J.Healy,et al.(2003).″Representationaloligonucleotide microarray analysis:a high-resolution method todetect genome copy number variation.″Genome Res 13(10):2291-305.),其中仅有微小改变。简言之,将2ug DNA模板置于(溶解于pH 8的TE中)0.2mL PCR管中。加入5μl随机单体(SigmaGenosys),用dH2O补充到25μL,混合。将试管放置在100℃的Tetrad中5分钟,然后放置在冰上5分钟。在其中加入5μl NEB缓冲液2,5μL dNTPs(0.6nm dCTP,1.2nm dATP,dTTP,dGTP),5μl来自GEHealthcare的标记(Cy3-dCTP或Cy5-dCTP),2μl NEB Klenow片段和2μl dH2O。用于杂交和洗涤的程序按照以前的报道(Lucito,R.,J.Healy,et al.(2003).″Representational oligonucleotidemicroarray analysis:a high-resolution method to detect genomecopy number variation.″Genome Res 13(10):2291-305),例外是用于杂交的烤炉温度增加到50℃。用Axon GenePix 4000B扫描仪设置,以5μm的像素大小扫描阵列。用GenePix Pro 4.0软件对阵列的强度进行定量。将阵列数据输入S-PLUS中用于进一步的分析。
数据分析
在GenePix 4000B扫描仪上扫描微阵列图像,用Nimblescan软件(Nimblegen Systems Inc)提取数据。对于每种探针,计算每个实验的McrBc和对照处理样品的比值的几何平均值(GeoMeanRatio)及其相关染料交换。然后用分位数标准化方法(Bolstad,B.M.,R.A.Irizarry,et al.(2003).″A comparison of normalization methods for highdensity oligonucleotide array data based on variance and bias″Bioinformatics 19(2):185-93)对数据集内所有样品的GeoMeanRatio进行标准化。然后,集中每个实验的标准化比值,用中位数平滑模型(median polish model)对每个MspI片段中所有探针得到一个值。然后,将集中的数据用于进一步的分析。
用方差分析鉴定最显著的岛。为了确定肿瘤和正常样品间甲基化的最一致出现的改变,我们使用了t检验方法。在进行了多测试校正后采用0.001的p值截止值(False Discovery Rate,Benjamini andHotchberg(Benjamini 1995)),我们获得了一系列916个MspI片段,其显示不同的甲基化。
监督学习:我们使用了监督机学习分类器(supervised machinelearning classifier)来鉴定区分肿瘤样品与正常样品所需的特征数目。采用留下一个的方法(leave one out method)(Lin,C.-C.C.a.C.-J.(2001).LIBSVM:a library for support vector machines),使用了公众可得到的支持向量机(SVM)文库(LibSVM Ver 2.8)来获得分类准确性。首先用单独的训练数据之间的t检验来选择用于分类的甲基化特征。然后使用径向基函数(radial basis function,RBF)核在最前面的10、50和100个特征上训练SVM。
对于N个样品,对(N-1)个样品进行t检验,以鉴定甲基化比值具有显著差异的片段。对于卵巢数据集,此检验对18个卵巢样品进行了18次,从而在t检验计算中每个样品留下一次。然后用来自(N-1)个样品的最前面10个片段特征的甲基化比训练SVM,用来自一个未训练样品的比值进行测试。基于正好10个特征,我们能够实现94%的分类准确率。感兴趣的是,在该分析中分类为正常的两个肿瘤样品在基因表达和ROMA分析中也都是最接近于正常的。
甲基化位点的检测
在一个优选实施方案中,该方法包括以下步骤:在该方法的第一个步骤中,必须从诸如细胞系、组织或血样的来源分离基因组DNA样品。可以通过本领域技术人员标准的方式进行提取,包括使用去污剂裂解、超声处理和用玻璃珠涡旋。一旦核酸已经提取,就可以将基因组双链DNA用于分析中。
在一个优选实施方案中,可以在该方法的下一个步骤前切割DNA,这可以通过本领域技术人员的标准方式进行,特别是,但不限于限制性内切核酸酶。
在该方法的第二个步骤中,用以下方式处理基因组DNA样品,即,使在5’-位置未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或在杂交行为方面与胞嘧啶不相似的其他碱基。这在下文中理解为“预处理”。
上文描述的基因组DNA的处理优选用亚硫酸氢盐(亚硫酸盐,亚硫酸disulfite)和随后的碱水解进行,其导致未甲基化的胞嘧啶核碱基转化为尿嘧啶或在碱基vairine行为方面与胞嘧啶不相似的其他碱基。如果将亚硫酸氢盐溶液用于反应,则添加发生在未甲基化的胞嘧啶碱基。此外,必须存在变性试剂或溶剂以及自由基拦截物(radicalinterceptor)。然后,随后的碱水解导致未甲基化的胞嘧啶核碱基转化为尿嘧啶。然后将转化的DNA用于检测甲基化的胞嘧啶。
对片段进行扩增。由于统计学和实践的考虑,优选扩增10个以上具有100-2000个碱基对的长度的不同片段。可以在一个和相同的反应容器中进行几个DNA片段的扩增。通常,通过聚合酶链反应(PCR)进行扩增。本领域技术人员了解所述引物的设计。这些应该包括至少两个寡核苷酸,其序列各自与附录中指出的碱基序列(SEQ ID NO.1-SEQ IDNO.91)的长度为至少15个碱基对的片段反向互补或相同。所述引物寡核苷酸优选特征在于它们不含任何CpG二核苷酸。在该方法的一个特别优选的实施方案中,设计所述引物寡核苷酸的序列,以便仅仅选择性与目的卵巢细胞特异性DNA退火并且扩增所述DNA,从而使背景或不相关DNA的扩增最少化。在本发明的上下文中,背景DNA表示以下基因组DNA,其不具有相关组织特异性甲基化模式,在本申请中,相关组织是健康的和患病的卵巢细胞。
根据本发明,优选的是至少一个引物寡核苷酸在扩增过程中与固相结合。不同的寡核苷酸和/或PNA-寡聚物序列可以矩形或六边形点阵的形式排列在平面固相上,固相表面优选由硅、玻璃、聚苯乙烯、铝、钢、铁、铜、镍、银或金制成,也可以使用其他材料,如硝酸纤维素或塑料。通过扩增获得的片段可以携带直接或间接可检测的标记。优选的是荧光标记、放射性核素或具有可以在质谱仪中检测的典型质量的可分离分子片段形式的标记,优选的是产生的片段在质谱仪中具有单个阳性或阴性净电荷,从而具有更好的可检测性。可以通过基质辅助激光解吸电离质谱法(MALDI)或使用电喷雾质谱法(ESI)进行检测和显现。
在下一个步骤中,分析核酸扩增子,以便在处理前确定基因组DNA的甲基化状态。
可以用替代方法进行核酸的处理后分析。经过处理的核酸的甲基化状态特异性分析的一些方法是已知的,其他替代方法也将是本领域技术人员明确了解的。
采用本领域已知的方法,可以在本发明的扩增步骤中进行分析。在一个这样的实施方案中,可以使用甲基化特异性引物寡核苷酸检测包含SEQ ID NO.1-SEQ ID NO.91的核酸内预先选择的CpG位置的甲基化状态。该技术描述于美国专利号6,265,171。
序列表
<110>Philips Intellectual Property&Standards GmbH
<120>分析卵巢癌病症的方法
<130>PH009040
<160>91
<170>PatentIn version 3.4
<210>1
<211>118
<212>DNA
<213>人(Homo sapiens)
<400>1
gccctggcac cgtgagggga aagaggcgtc aggtgcctgg ctgaagcctg aaggtgaccc 60
gaaaacaagt cagagcccga gagatccacc cgcgcccgcg cgggggacca agggcccg 118
<210>2
<211>1517
<212>DNA
<213>人
<400>2
ggcctggcgc aacgctgagc agctggcgcg tcccgcgcgg ccccagttct gcgcagcttc 60
ccgaggctcc gcaccagccg cgcttctgtc cgcctgcagg tagggagcgt tgttcctccg 120
cgggtgccca cggcccagta tctctggcta gctcgctggg cactttagga cggagggtct 180
ctacaccctt tctttgggat ggagagagga gaagggaaag ggaacgcgat ggtctagggg 240
gcagtagagc caattacctg ttggggttaa taagaacagg caatgcatct ggccttcctc 300
caggcgcgat tcagttttgc tctaaaaata atttatacct ctaaaaataa ataagatagg 360
tagtatagga taggtagtca ttcttatgcg actgtgtgtt cagaatatag ctctgatgct 420
aggctggagg tctggacacg ggtccaagtc caccgccagc tgcttgctag taacatgact 480
tgtgtaagtt atcccagctg cagcatctaa gtaagtctct tcctgcgcta agcaggtcca 540
ggatccctga acggaattta tttgctctgt ccattctgag aacccaaagg agtcctaaaa 600
gaggaatgga ggagcctaag aataaaaata gtataataaa acatttctta gacacattga 660
ccttggccta tgtcaaagtt cagtctgggt ttgtcttata acacaaggag taaaagtacc 720
attgttctac ctcttttttt aatacttgaa aaaaatttac tgtggatgct tttctatgaa 780
ttaaataacc ttctaaaaaa tgttttcatt gctgcattcg attagattgg gtaactaaat 840
gaaattaatt cctcactgtt gggtataaag gttatttaca gtggttctgt cttagccatt 900
cactgaactc attgcatata tatctctgga atattgctga ttgtttcctt caagtaaact 960
tagaagtgta actacttagt caaagagcct gaatatttta aaggcctttt gaagaaaact 1020
gaaaatgctt tccagaaagg atgtatcagt tgacaatgac agtcgtcaac agtatttaag 1080
gagaactatg atactctgaa gaaaaactta gcctttctca gtaaaagtag gtaggcagag 1140
gccacatgac agcagttaga gtgtggtctt caaggaagtc acagaaatac tgtggggaat 1200
tgaaacccca tgtggaaaat gtacaagagt gtctcagtgt gactgagaag gaggttgggc 1260
atggggtttc atggagttta ataaagtttg gtcacttagt agaggtttaa taaatcaact 1320
gtcttaatct ttgatcctac ttaagaattt tttttttgtt tttgtagaga tggggctctt 1380
gttatgttgc ccaggctgtt ctcgaactcc tagcctcagg cgatcctccc tcctcaggct 1440
ccagaagtcc tgggattact ggcgggagcc accatgcagg cctcttgctc ctacttttga 1500
gaaaggaagt ttaaccg 1517
<210>3
<211>968
<212>DNA
<213>人
<400>3
ggcccaccca gggctcaagc cctgaccccc ctgggcccct gggctgcccc gccccgatag 60
gaattcattc cgtcagccca acgcagccaa tcggggcggt ccacgccagg tggactgctg 120
tgccccgcgg ggtcattagg ttaattgcag cctggacaca ccccactgag ttctaccgtt 180
ggccctccat gtacccagct tccacatctg tggattccaa aagacacaga gagaatcttc 240
ttgggagtaa aagcgaaaat aacaacaccg caagacagaa tcgtaggaag aagaaccaac 300
agaggatgac aactctttac ctggcattga cgttgtgtga ggggacttgg aaacattggt 360
agaaaagtgg gattaaggga gaaagaggaa aaaggcgtat tttactcctc aacctcggct 420
ccatcagcat caagaccctt ctggaagcag tgtcttttcc ccgccgtcta gcccatccct 480
taaagccccc agggtcctgg gaatttaact atttccatgc aatctttttt ccattgttaa 540
ctgaagaaaa ctgggtgccc cttacaggtt ttccaagaca aggaaacaaa gagaagtcag 600
caggcgccaa atcaggattg tcaggtggac gcctcacggt ttcccatggc aagtcttgcc 660
cagctgccct tgttcgaaga aaggcatgat caggaacact gtcgtggtgg agaagaagtc 720
tctggtgggg accttcttcg ctccagcttt ggctaacttt ctgaaaacgc tctgctagcg 780
agcagatgtg atcagggttt ggccctgcag aaagtcaacc agcagaatcc ctctagcatc 840
tccccccccc accccgcccc caacggtggc catgacctct gctcttgact gctcctctgc 900
agcttcgact ggagcactgc cacctcttgg tagccatggc ttcgtgcttg gtcttcagga 960
tcctgccg 968
<210>4
<211>357
<212>DNA
<213>人
<400>4
gggcacaggc aagcggacga gccagttatc cctcagagct cctgctgcct cgcccgcttt 60
ctctcggaaa cgtgaagtgt ggcctcagct gaaagtgagg tgagcgtgag tgtggacatg 120
tgtcagtgtg cgtgtgcatg ggaggagtgt gtgtgcgctt gatgacgatg atggagccca 180
gtgagccacc gtccgtggag tgtcagagcc tcctaggatg gccacgccga aggtgcggaa 240
ggaggcggct ggcccagcgt cagacgtttc cagcatccgc gggagtgaaa cggaggctgg 300
tgggtggttg tgatgtgttt ctttaagaat ggatcctgca ggttcttctt cctcccg 357
<210>5
<211>48
<212>DNA
<213>人
<400>5
gccccgcgct tggcgcccga ctcgcctcgt cccgaacaat gcatgccg 48
<210>6
<211>792
<212>DNA
<213>人
<400>6
gctccgcagc ctccgcgcag tccgctcggc tctggcactt gcgggaggtg gtgacggcta 60
gccgtcgccg cccgcgccag aacttgcgtc tcctcccccg acctgcattg gggggagggg 120
accgagggcg gagctggggg cgtggggagg gaatgtctgg gatggtctgg tattgcacag 180
ccgaggaaca ccagagttcc ttctgggaag acgggctagg gagctcagtg gtctcaggtc 240
tggtttcaga gttccgcctc tgcgtgcctc agtttaccct ttcccccttt gcccaagggg 300
gcaaggtaga gcgctgtcgg ggattgggtt tcataatccc cttccacttg acctccccgc 360
cacacccact aatcttcagg aactcaagtt ctcgcttttc ccagacgcac gcaagaaccg 420
tgcaccatct cgctcgctct ctgcccgccc gcgccttaca ccttccccgc tcggccgcag 480
aaacagaaga tccaggagcg atgctctccc actgtccctt cttcccgccc gcgcgcttcc 540
tttctcggtt cccactctga ctgggaaaca gaaaatcaac gcgcggcgcg gctgcaaagt 600
cggtttccta ttggtcagcg cctcctgggc tgagcccgcc cgccccgcct cttctcccac 660
ctaggcgggg cctccccgca gacccccgac tgcctccagc ccgcagtccc accgcctgcc 720
aggagatctt aaaggggccg cggccgcaat cagacgctga gcggcgtggg gagggggtgg 780
ctcagtgacc cg 792
<210>7
<211>955
<212>DNA
<213>人
<400>7
gcccaggctt cggctctcag cttagggaga ttctgataat acgcagagcc caaggtgtgt 60
gtagttttaa caaaaagctt cccaagcgaa tctgatacac atctaggatt aagaaacact 120
gctttaaact aagaaaggac taactgcaga agttcagcca caagtcaacc agatgtatgc 180
ccttaacatt cacatgagca gttggctaaa gtctcttata aggctatttc tatttccgag 240
gtttcagaac gggtagttat agtctgaaat acaccccaga ggacagagtc aggtccaatc 300
ttttctgtaa gacaccttgc tcaagactgc tgtgaaggaa taagagagct gcagccaaag 360
atcatcccaa agtctcccag aacactctat cattatatcc atctcacatg aaatatgggt 420
gtgtacattt tttccttcac tagattggca agtattccag cgcagggcaa atctcttttt 480
tctcccacca aggaacacaa tatcccatac ataataggtg tttgacaggt ttttttttta 540
aattgaattg aatccttacc tagctcctag ggtctgacta tatataccca taaattatac 600
atctgtttat aaaacatttc aatcacacca aagaacatat atatggaaga aagaacgata 660
aacaagcacc catggaccca cccccccgtt tatgaaacag aactttgcca gtgctttcga 720
agttccttac tgaactagat cttttaaaaa cagcaacgat tttctgaatt ttaatcagaa 780
ggcatgcatt ccttcattca ttgattcgat tccgtcatgg tcagacccgc ctaccaagtg 840
tcaacatgat atacacgatg taagtattcc actgttgggg tgaggagggt caaaagtgac 900
aatatgctat ctccagagac tacggatcgc ctttgctgca aatggtccca acccg 955
<210>8
<211>242
<212>DNA
<213>人
<400>8
gcgacccaag aagagtaagc aaactaccgt ccacccagcg gatcaggtcc aatccctgcg 60
cctcggccca atccctagag ccccgcggcg ccgtatcccc tcccccccaa ctctggaccc 120
cgccgtctgt ccccgcggca tcaccagggt gctggagttt tccgagcagg ccccttgcgc 180
taagcgagag gatctgtgag ggaaagttgg gagagccact tctggctttt gtgaagatcc 240
cg 242
<210>9
<211>264
<212>DNA
<213>人
<400>9
gaggtggggt ggggaagtgg cgctggagct cagcttcctg cttttatgct cggcggccac 60
cgtgatgcac acacactcga ggtccgccac cccgcagtgc cgtgcacccc tctgccccca 120
cctcggaatt tttgtgcccg agcgctcggg atccacggca aaaccaggca cattcctccc 180
tctgcagact caccgcctgg tttgtagaca ctggtctccg cctggggcgt caatagtttc 240
aggatttaaa gcagaaagac accg 264
<210>10
<211>248
<212>DNA
<213>人
<400>10
gcctgctcag actaggttct gcccactctg accttctaaa tggtacgtgg gaggacgtcc 60
gtccccttcg gacccaagag tcaccgtaac actctagaag gggagaaaag gagcgagggc 120
ggcaggcgac agagaacctc gcgagtcagc ggccccgcgc agaccccccc aggcacggtc 180
ccctgcggcc acgtcggctg ctcggcgcct gcgcaatctc tttctctcca gcgaaaccga 240
ggcctccg 248
<210>11
<211>62
<212>DNA
<213>人
<400>11
ggagcctagt gccatgcagc agcggcggcg gtggcggctt cccaagcgcg gcggcaaatc 60
cg 62
<210>12
<211>117
<212>DNA
<213>人
<400>12
gagggctcgg gaccagcgcg agcaccttcc ctggaagccc acatccatca cccagcgatc 60
tcctctccat cgagagcagg gcttgctgag agtggcggag gaccttgaag gctcccg 117
<210>13
<211>63
<212>DNA
<213>人
<400>13
gggactgcag tcagctattt aaacctcccg cccacctttt ctttagaccc gcgtctcacc 60
ccg 63
<210>14
<211>62
<212>DNA
<213>人
<400>14
gccgcatgag acgctcccgc ccattggccc gccgtatccg ccaccgccat tggcccgccc 60
cg 62
<210>15
<211>105
<212>DNA
<213>人
<400>15
ggccaacctg agggtacggc gctggcggtg cgggtccctg ggcgggcgcg gcgggaatag 60
cggcctcggg gagatgcggt gcgaagggac cgagagggaa gcccg 105
<210>16
<211>38
<212>DNA
<213>人
<400>16
gtgtcccccc tccctctcat aacgttcccc gcacaccg 38
<210>17
<211>441
<212>DNA
<213>人
<400>17
ggggccacgt aatgctgagt gctgattggc tgctcttggc tcctcccctc atcccgcttt 60
tggcccaaga gcgtggtgca gattcacccg cgcgaggtag gcgctctggt gcttgcggag 120
gacgcttcct tcctcagatg caccgatctt cccgatactg cctttggagc ggctagattg 180
ctagccttgg ctgctccatt ggcctgcctt gccccttacc tgccgattgc atatgaactc 240
ttcttctgtc tgtacatcgt tgtcgtcgga gtcgtcgcga tcgtcgtggc gctcgtgtga 300
tggccttcgt ccgtttagag tagtgtagtt agttaggggc caacgaagaa gaaagaagac 360
gcgattagtg cagagatgct ggaggtggtc agttactaag ctagagtaag atagcggagc 420
gaaaagagcc aaacctagcc g 441
<210>18
<211>268
<212>DNA
<213>人
<400>18
gaagtcaggc ccgagggagc tgggagggcg ttagcgaagc caggttcggt cgtgggggtg 60
gggaagtgca ggagtggcgc gcggcgtact acatgtcccg tgagcctccg cggcgggacg 120
gggcggggcc gcgggacgcc aggaggcgga ggcggagtgg agttaggtaa gagcgttacc 180
agccgtcttg tctgttgggc cgaggtcccc cttcaggggc gccctctggt gcgtcttttt 240
cactcagtgt ccttttgggg ggtccccg 268
<210>19
<211>266
<212>DNA
<213>人
<400>19
gctgggctgc ggggcggggc ctggacggcc acgtgactcg cggggcgggg ccagagtccg 60
cggagggacg ggaggcgggg cctggactgc ctcgtgacca gtggggcggg gcctgagcca 120
gctgtgtgcg gatggggcgg ggctttggag gccgcgtgac cagcggcggg tcacgtgacg 180
cggtgcctgg cgccgagcct cccaagatgg cggtgtgcat cgcggtgatt gccaaggagg 240
tgcgtacgcg cggcgtgggg cgtccg 266
<210>20
<211>39
<212>DNA
<213>人
<400>20
gtgagtgctt gccctccctg gttacctcgc cagtctccg 39
<210>21
<211>250
<212>DNA
<213>人
<400>21
gggatcagac gggaggtgga gttgcgcggg gagggcgggc gagtcgggcg cccgctctga 60
gagtcggttt cttttccccc tcttgcgtgg ggcggggtgg tgcgttccga gttcccagga 120
gttcgacgcg ggcgggtgcc gaggggaggg gagtggcggc ggcggcgggc ggctcccgct 180
tcagcctcgg cagtggcgtc ggcgacggcg gtgtcgaggc agccgccagc gttcggccaa 240
gtgtcagccg 250
<210>22
<211>156
<212>DNA
<213>人
<400>22
ggaggtggag gttgcagtga accgagatcg tgccactgta ctccagtctg ggtgacagag 60
cgagactcca tctcaaaaaa acaaaaaaaa acgaaaaaaa aaaaaaagac ggacgtaccg 120
aagaacggcg gtaactcctc cccctcgagc cgcccg 156
<210>23
<211>229
<212>DNA
<213>人
<400>23
ggagagctgc agcgccatgg ccagggacac aaacaaaagc acgcgcttcc actccgcgga 60
cagcaaccac agcggctcca acagcacttc cccgccaagc gtttcaaaag taacgacgca 120
gcacgtcgtc aggtcctttg cgcaggcgcg acgagccttt aagcccagcc ccacgcagcg 180
gggacctgcc ctttctctca gccttcctgt gatgtcgcgg gagcggccg 229
<210>24
<211>187
<212>DNA
<213>人
<400>24
gagccaacag gtgcggggtg tgggggaccc ccaggcctgg gatgggggtt ccaaaggacc 60
cgcggcgagg gatgggagga gccaagagtc tcggggggta acctgggtgc tgggagactg 120
gctcctcggc cagcgctgct ctcctctagg caggctccga gtgccctcgc tcccccgcgc 180
cttcccg 187
<210>25
<211>324
<212>DNA
<213>人
<400>25
gagcgaggcc agtgggttcc tcggtttggc ctgatcacac tggaggaggc cctgcttgcg 60
tcagtcttgg cgctagaacc cgagggcctg gagccgccag gggagacgcg gagctcggcc 120
gagacgaggt ggcttttggc acctctttac cctctggccc cagtgctgac tggggaatag 180
tcgctttgac cgtgcaaaga gcattctagg cggggtgggg gggttctgct gtgtgtgcca 240
gtgttaggta ttgcccccat tgcttttaga aatatgccct gcatggtgaa tctccgtctc 300
tactaaaata caaaaattag gccg 324
<210>26
<211>61
<212>DNA
<213>人
<400>26
gagagctgcg agccccgact ttctcgccag gctctccagt acattccgag gctccacccc 60
g 61
<210>27
<211>1124
<212>DNA
<213>人
<400>27
gtatgaggcc acccttggtg ctgtctgtaa ttatctagac atggcagcca ggatccaaca 60
gctttgcgtt ttaactcata tggtctttcc tggcgaattc cttgcccccc tctgctcccc 120
acttagcttg acttcctgtc ttttatcatc cgcaatctat caagatccta caatgtgctc 180
agtgtagggc ggaacaaatc actgttttac ctcacaattt aaggaaggca gggggctagt 240
ttttaagata aaaatctttt aacaaaacat aaactcccca aaatttccta caagccaaac 300
agcattgtca caccctcaca agctcttatt acttacacag ccaaatgact caagattact 360
aacgtttcta ttcataagga gtttgctggc ctcagatcaa cacaatcaag ccctccccca 420
ccttccttct ctctcccctg ggagactgac gtttggaact cacgccgcac caggtttttt 480
cagaatgaag acgatgtgtg ttcgctgctg gaactgtttg tcctgggatt ttataaacac 540
ctcccccact cctttttaaa gttctgtttt tgaggtgggg gaaaaggagg tcggaatctg 600
tttagccttt aaatctccca attcagaaat atattctaag aatttaatag aaaaagacca 660
agggctgtgt ctgctattta ctgcagaact gggtattcct atcagaaatc acctacatgt 720
gtcaccaaga tcagagacaa ggatgaggga aacagcatga tccctgcctt ctggagggtt 780
acagttgaag cttccgctgc ttctgcactt gacctcaaaa caaacaaaaa acccaccgca 840
aacaacaaca aaaaaatcca ggcccacctt tccccttgga tctttcactt gacagctttc 900
tcggcccaaa ataaggcacc ctacatctga atgcatccct aaggccttac cgcacccagt 960
ccaggaggca gtcctggcag ctgccctcca ccgaactccg cgctttttca cacacgctcg 1020
tggaaggaga aaaccgctca aacaactgga ctcggcccgt ttcctttcgg taacctcccc 1080
acagcccaac acgctgtccc cagacgctgc ccgctcccac cccg 1124
<210>28
<211>250
<212>DNA
<213>人
<400>28
gggagcagga aggtatgagc ctcagctgag cgaaaccctc cttgcagcca ccacggaggg 60
acggggcgcg tctccttctg aatgacgcaa ggggcggggc gcgtggtggg gcggggaagg 120
cgcgaggcgc gccgcgatcg gggactgtcc taagacgggc ggggcgcgct gcgctaggga 180
ctgtcataaa aggggcggga cgcgccgcgg tcgggatgac gtgagctggg ggcgctcgtc 240
gctgcagccg 250
<210>29
<211>56
<212>DNA
<213>人
<400>29
gaccagcaga gcaatccgaa acccagccca cgtgggttcc cagaccacca actccg 56
<210>30
<211>253
<212>DNA
<213>人
<400>30
gatgagcctg gcttcggcgc tgacgctctg gccctggggg ctgcctggct ggtgtcaggt 60
agcggaagac gcctggagag tcactcgctc cttcccccac ccgcccccac cgctgctcgt 120
gccaggacgc gcagtttgca gttgcagctc tggcactggc gcgggatggc ggagcttccc 180
ttggatggcg tcagggtcac tgagtgcaca gcctacctgg tctgagggtc tgctcctcct 240
ggacacctct ccg 253
<210>31
<211>232
<212>DNA
<213>人
<400>31
gtgcggggga acgagaccct gcgggagcat taccagtacg tggggaagtt ggcgggcagg 60
ctgaaggagg cctccgaggg cagcacgctc accaccgtgc tcttcttggt catctgcagc 120
ttcatcgtct tggagaacct gatggttttg attgccatct ggaaaaacaa taaatttcac 180
aaccgcatgt actttttcat tggcaacctg gctctctgcg acctgctggc cg 232
<210>32
<211>559
<212>DNA
<213>人
<400>32
gctgcatcca ctgggtctct ggctacaggc agagagccag tcagcagtgc ccctgcagct 60
gtttggggct gggggctccg atgatgccag agccctaggg tttacaggca cctaggcaga 120
ttcgaggatc caagtccctg ccacatgcgt ttgggtgaga ccgacctcac tgcctcagtt 180
tcctcctata cactgatgct atcaacaaaa atacccactt caggaggtgg ttgtaaagat 240
tatacaagag actgcagagc gttaggcagc acctggcaca agacaaatgc tcagtaaaag 300
accactgctg tcattaaggt caacaccagc cctgagctcc tgccctggag ctgacccagc 360
gctcacgccc aggatcagaa agggagggct ggggctgatg agctgggagg tggtgtgcgc 420
ccttctcctg cctccagctc ctctctggac ccctgtcctg gcacctcttc ggtccctggt 480
tcggtctgcc cctttcccac cgcggcccgt cttaggccag gatgtgctcc ctgccctgcg 540
gactctggag cagggcccg 559
<210>33
<211>389
<212>DNA
<213>人
<400>33
ggggcaacct agaatccacc agtggggaga gtaaggcgac tcggagaaag gcgaggggct 60
aatgcatccg ttctaataac tctgacttta actcggggct agatggggaa acactggaca 120
gttctacccc gaggtgtgac agaacttgac cttcatttta aatcggtcca tctgtttagg 180
ctagtgagaa aaaacaatat ttgaactcgg gcagtccagc tcaggagtct gtgctgtcgg 240
gattaaagaa tcagtcgaca cccccagggc tgagccccgc agcaagcgcc ccgcgggtgc 300
tggcccccag actgtggtta ccgccatcct ttcacttaaa ctccgccccg attactcccc 360
cgctccaggg ctccgcatcc actctgccg 389
<210>34
<211>45
<212>DNA
<213>人
<400>34
ggctgggggt ggggaaggga ggccgccaca gctcccgccc cgccg 45
<210>35
<211>67
<212>DNA
<213>人
<400>35
ggggattcgc gctgggctcc gagagcccgc agaaccagcg tcgtgtcctg ggcgagctgg 60
gaggccg 67
<210>36
<211>3776
<212>DNA
<213>人
<400>36
ggagttacac tcgaagtaga gaaacggaaa ccccattata ttagctacct tttcggcagt 60
gcaccaaccc tctaccgcct gccatacagc cttgaagaaa gggcaggtca ccttccccca 120
cctgtcccca cctctccttt cctccttgtc tttacccaca gcttcaccaa ggccctgaga 180
tgcttccgcg gtgtggttaa aacctggctc tattctctga ctgtccttcc ccaggagtgg 240
ttctctccca gctgctctcc cctcccaggg tctccttcct actcccactg gccaaggcag 300
ggcatacccc caatacaccc ctcaccccac atctcagaaa tactccttta tctattttct 360
cattcaagag agctagaatt ttaaacagta aattccttgt gaaatgctgc aattactcct 420
tttaaatgaa agatctagaa gaaattggaa tctcctttct acagtgaggg atgcagacaa 480
aagaaaacaa ggaacttaag ggaggattgg ccagatggaa gtcgggggaa ctttgctggg 540
atctgtagag ggcagaacca gcctggctgc ctcaccaccc tcgccatccc tcccgagtgt 600
gtggcacatc actgtatcct agcgtttgcc atgttggact gtcctggttt actgccgtgt 660
atcttccaca ttggaccacg agctgcttga gggtagggtc atatcacctt tgtcttttta 720
ttcccagtat ttcaaatgtg gctgacacac agagagctct gaatacagac acacgcagag 780
caaaatgcct aacacgattg agcattcgta ccaggccctg ttctaagagc tttagaccca 840
ataagtcatt tacttcccac accaacctta caagttaata ctacattaat attccaactt 900
cataaatgtg taactgaagc acagaggggt ttaggaactt gcaccaagtc acagagcttg 960
aaggatccat ggcttgaacc caggcaggct gactccaatc ttagctttaa tgaatgaatg 1020
aataaaagaa caaacaatac aacaaatgag tgtgtcttgc ttttggccaa ggggtttatt 1080
taaaattatc atttcagaaa tctttctgcc cagtgatctg actttgtttc aaattgggac 1140
tttttttttt ttcttagcta acccacctta aaatcataag tcagttttcc tctctcaact 1200
tactggagac atttctgatt aatcaagtac gttcatgcat ttcctcagaa tggtgaactc 1260
atcattagtc cgtccctatt taactttttc cacctgccct cagctgggcc aaccccgagc 1320
tcctcaacca cagtcagtcc tttctccttc cctccctccc tccctcccct tcctccttcc 1380
ctccccttcc tccctccctc cccttcttcc ttctctccct tctctccccc atccctccct 1440
cccttcctcc cttcttcagc cacatcttgc tccacccccc tatacatacc tgcggcatca 1500
gccttaaggg atcctttgcc actttctctt cagagctgca ttttaacatg tgcaacatta 1560
tttggatggt ccccttagca tgtgtggccc acttgctatt tgcttttcat ccagacctag 1620
ctcaagtatc cctttctctc tctgtctctc tgtctgtctc tctctctgtc tctctctgaa 1680
gcttcctcta gccccaacag atgaagtgct ccctctgggt gctctgggag catcgtgttc 1740
ctacttctgc tgtagtgctt atctcagatg gaattgaatt ttacggttag tgtgtgtccc 1800
tcccaattaa actttaaact ccttgaagga aggcatattt cttgctccta tctgtctctg 1860
ctgacatggc aaagagacct ggcacaaagt aaagacacaa tagatacttg ttttattgca 1920
tttgcctgtg aacatatgat ggattgaaca cagttttacc agttcacctt aaaaatgact 1980
acttaaggct gcttatgcat ggcacaaaga cacaacatgc atcaaatcct agcagagagt 2040
acattttcct ggtccttcaa gtataagaaa accttgctat ttttgcctgc gtatggtttt 2100
aataggattg ataaaacaga agagagatgg ttccctaaat cagtttgagg tattcaattc 2160
agtttagcag ctcaaaaggc tgacatttgc cttatttgaa ggttggacag ctctgcagct 2220
atttatctgc tttattgcaa tgggagtgat gactgcatag gcaagctgag aagctggcat 2280
tggggaaatt gccagaaaac ttcatatagt gtaaaatatc atatagtgta aaatgatcag 2340
aaaagtgata tacaaatgct gcatgaacaa ataattatgt aaactatgta agtcagagaa 2400
actaaaatct taaagtcaga ggctttttgg ataattaaat tgttttaacc cacccacaaa 2460
cctactgcag gaatgattct attccaaaga aatggttaat agtaagacca gaaggggaaa 2520
aaagaacacc agggagaact aaagtcaatc caaatccaag cacaagctgc tgttgacatg 2580
ttacacataa aaaggcttgc tctggggctt gcaggtcctt cttagcagag cggtgagaaa 2640
acttaatgtc cactgtgggt ggcacattgt ggtgtcactg gcagttgagc tgtttggtat 2700
cattgccatg gcattactat gcattcctct gcaaactgca tctcgctggc ttttctccaa 2760
gccaaataaa acacaaaatg ggtcaggctt agtgagactg aaatgttgcc tcctttccct 2820
ctgccttgtc ctcagctagc tttaaggcaa gcatcacatt ggattcaaag accagctgat 2880
gctctttcag tatgattact tatgctgtga ttgacaatgt ggaggaaata gcgtatatgg 2940
ccaacgatag ggcattgact aagtaggtca ttattcagcc aaacaaaggt acagtatgct 3000
gtgattttaa aatgatgccg tagattacta aattacatga aaatatactt gtaagaatat 3060
tatgtgacaa agaagcatgc tataaaagtg tagtcactgt tgaatcctat tgtataaaat 3120
gtgtgtaagt gtatacacaa aaaaactctg aaagagtaca cactttagtg ctaagagtac 3180
ttatctctgc agatctttat ttttgtcttt tttggaaatc tcgcttgctt ttatgataaa 3240
tttgcaaggt tactctttta agtgttactt tatcattaca ggaaagaata gagagaataa 3300
attctcttcc cctgggaata aatttaagag ttttcaaaga gaattacagc ctatgtaata 3360
tccagcgata tttggactcg aatagaaagt tctgaatcaa agagttgcgt agaatatcaa 3420
gggatgatct aacagccatc ctcttgcctg ggatacccac agccccattt actcaggctg 3480
tgggctcact gagaaggaga caacattggc cactgtttta ctttcttctc tgttaaagct 3540
gccttggtcc ttctgtctcc tctgatagta tcgagtcatt cagatgtatt tgctttagtt 3600
gattgccatg ctttcaaaca ggttccataa gctacacatc cacttttaag actaaattga 3660
gcttcattga atgtccttaa tgaccacaac taattcctag cccaaaggag ggaagctgca 3720
gccaactccc tcaatcctca agaacaacaa tgccgataga acccctgtgt gatccg 3776
<210>37
<211>237
<212>DNA
<213>人
<400>37
gagtgaggcg gcgcaggccg cgcgggaggg cctctgcctg ctgcagcgca gggcgggcgg 60
gggcgggggg gcgcttaccg tgagcggagc ggatcggcct gactggagcc ctgaggagga 120
ggagaaagag gaggaggaaa aggaggagca cgaaaaacta cactgcggcg acggcggcgg 180
ctcccattgc ggagctggca gccgagccgt ggaaaggggg gggctctcgt gcagccg 237
<210>38
<211>100
<212>DNA
<213>人
<400>38
ggcctagctt tggggcgcag gcgcgctggc cgccgcggcg gggggtcggc cgccagtgac 60
gtcaggacgc cgtgcgggtt ccgtccccca acaagccccg 100
<210>39
<211>334
<212>DNA
<213>人
<400>39
gggcgggtag gggtgggtca tgttccttgg cttgggggca gttacaaggg tacagtgggg 60
cttgttgaag ggcaaaagtt ctgtaagttc gtcccgacag gccaaagaaa ccccagagcc 120
gtctttcgac tgactacagc ctggaagaga ggccaagacc actccctgcc tctattgctc 180
catttctgag ttggtctcac tttccacccc actgacggcg cgctgcgtga ggggcggggc 240
atagagggag gggaggggct atgcgaaaga aggcggggag agtggggtgg ggccgctcct 300
tggaacggaa gcgcgcggcc tcgaggccct tccg 334
<210>40
<211>33
<212>DNA
<213>人
<400>40
gtgtcctaaa agatgagggg cggggcgcgg ccg 33
<210>41
<211>254
<212>DNA
<213>人
<400>41
gatgccatct gcggctgctg aaggaggcgc ctccagaaaa gatgccgagt gttgcaagct 60
gtcgatgcag ccaagagccg aagaggcatc ttgccgattg gggagggagc ggcgcttacg 120
tgtttattgg cttaactctc ccgtgtccgc ggcgtaaagg gctgctgcag agggctggag 180
gggggagagc gcggagcgtc ctcagagcct cagtacttct gaccccaata ccttgccacc 240
ctcctcccct gccg 254
<210>42
<211>46
<212>DNA
<213>人
<400>42
gggggcgagg ccgttccccg cccgttccca gggcccgccc aggccg 46
<210>43
<211>286
<212>DNA
<213>人
<400>43
gaggcaggag gatggggagg aggcggccag gtctgcggca caaattaggc cattaattcc 60
tgcctgctcc tagagaaggc aaagtttctg tcctggaata cgtttccaaa gacacagctt 120
ctggaagggg aagggaaagg atggagaggc tgcgcggtgc tgatttcacc cgacaggcaa 180
tgctcgcgtt ccttggagtg ggaggggtcg gggcgatgag aaacctctgg gggatcgggg 240
caggtggaca cgcgcgctcg gagctgtcca aggcctggtc tccccg 286
<210>44
<211>57
<212>DNA
<213>人
<400>44
ggggcgagcg gctgtgcgcg gggccaaggg cgggggcagc aggtgagtgc gcggccg 57
<210>45
<211>964
<212>DNA
<213>人
<400>45
gcccactgat ggagttataa aggtgaagaa ctagtctagt gaagaatgca gactgagagt 60
aaacagacaa atacaatgtg actgagctgt attgttaaat acaagaaagg actatcagga 120
agactttttg gaaaaagaag catctacact gagaccataa aaattagtag gagtcagtca 180
aataaatgtg ggaggaggag aaagggatta ttccaggtaa agaaaacaag ttcaaggctt 240
gagaggtaaa aggtggcttg gtgtggtgga aaaggtgaaa gaaatttgcg actggagagc 300
aagaaatatg gtcgagaagg actaaaaaaa agtagacagg gagagcccag atgctgaagg 360
gtctagaaaa cctcagtatg gttttggagc tttgccctga aagcaataga atgcctttga 420
attgtctgaa gcagatggta acttgatcag gtctgctttt tgcaaagtgg agaatgcttt 480
ggaaggaagc aagtgtgcac gcagcgggac ccattagact aatgtataaa tcctgcctgg 540
aggtcatcac tggacagggg aggtggggga ggcggtgaag ataaacaaaa ggggataaat 600
ttgaaatatc ctgttttaaa aggaggtaga atccacagaa cttggcaatg gattggatgt 660
gagaagtgag aggaatcagt gatgactgcc agctttctga cctgaacgag tggatgaagg 720
gaagccgagt tttgggggga aagagaaaca tataatacca acatttaaaa cataataaga 780
ctaagaggct gaaggaaagg gtagaacctt caatctgagc cgagcggggc cgacagcgct 840
gggcagcatc ccacgccttt ttctccgcga ggcccacgca accagccaac taaagcgaag 900
aaccacgtga gggagacccc actgcgcacc aggcgcgagc cctgcgcatg cccgttgggt 960
cccg 964
<210>46
<211>252
<212>DNA
<213>人
<400>46
gaggtggcgg gtgggagagg gaatgagcag ggatgcaggg taggccctga gttgctgggg 60
gctcagcatg gccgctgcgc acattgcatc attttgtcga cactggtgtg ggtgaaatct 120
tccaaaagaa attaaaacag aaaaaaaaaa aaagaagggt ctgggactta gcagaaacaa 180
gccacaatct ccagattcta ctattcctgg gccacgtgag gagcgcccac ccgtctggcg 240
ctgcgttccc cg 252
<210>47
<211>300
<212>DNA
<213>人
<400>47
ggcggacccg agcaaatcag caagcctgct cctccacggg gatgggggac ggcggggggg 60
aggaaaagga gagtgtgtct gtgtgtgtga gtgtgtgtgt atgtgtgtgc gtgcgcgcgt 120
gtgtgttgcg cgcgcgcgcg cgcgaacagg gagagaggga gagggggaga gagaagagga 180
cagggagagc gcagagagga aaactgcaga aaaccacagg gaaagtacgg taccgcctca 240
gatcttttca tttaaaaaaa aaaaaaaact tacttctagt tcattttccc atcactcccg 300
<210>48
<211>118
<212>DNA
<213>人
<400>48
ggtggggtga ggagaggagg ggctggggga gggggagaga ggcggggtga ggggagcggc 60
gaggacggga cggagggaga gggggcgaga gagatggaag gagagcgagg agccaccg 118
<210>49
<211>50
<212>DNA
<213>人
<400>49
ggcgggcccc aggctgcagg ggcggtggcg gcgctgagct gggcgggccg 50
<210>50
<211>45
<212>DNA
<213>人
<400>50
gactcggcgg gcatcgccct ctacagccgt gagtacgggg ccccg 45
<210>51
<211>1340
<212>DNA
<213>人
<400>51
gtagctttca aaacgacaaa ctaggcaaac tatacatctc caccactcca attttgtcag 60
aatgctaatg agcttgctct gatctttact cggcttcccg tgttttctac atcttcaagg 120
accacatggc gctagcaaaa taaagacaac taaatgagaa tttcgaatgc tttttgtgtt 180
aggacctggt gcttttcagt ggacgcactc gttgaatatt ctcaacttaa aagagtacaa 240
cagggggttg ggtatgaact ttttaacagg aggaaatttg aacaaaagta aattagtgag 300
atgaggaaaa tatgagaaaa atttctgatt aatttccact ccataatatc aatgacacct 360
tcagccccac tcatactctt ctaacaagag atgctgataa aagatgaatg attctgtgtt 420
gttcacagtg aatgtttagt ggttttttaa tagcagcatt ctacataaaa ggcaccagga 480
agtactccgc attagcagtt gagatcacta gttaatagga tgatgtcttt tagcttttgt 540
cacaagatta ttagaaagga tgggtttctg ttctcatcat tgcatagttt ggagtgcctg 600
ttgagtacaa gtgctaaaat acaggtttct cagtattgtt tcacatgtaa agcaaaaagc 660
cttttaatgc aacacctttt tcctttttac caggtgattt tgttattgat ctctaatctg 720
cccctttagc tgtattaaat gcttaaagtg ttctgctttt ccatgtagcc ttgatgctag 780
ctatttgtgt ctataaattc attaacatta aaacaggatc tatatagact attagagtct 840
atgagttaga aaatggcata ttacatactt gtttagggca taaataacaa cataaattta 900
agattatctg cataaatgtt ataaaaatat gttcgttgat aatatgttat gagattttaa 960
ttatgtattt ataaggaaca tatttttcac aatctctctt ttctttagca atcactgtac 1020
acttaccagg agaataagag tagtcaactc catttcttac catatccatc catacctaga 1080
aagaagaaaa aaccaaaact gggtacattt ttatatataa agatatttga acacggctgg 1140
gcacaggctc acgcctgtaa tcccagtact ttgggaggcc gaagcaggtg gatcacctga 1200
ggtcgggagt tcaagaccag cctgaccaac atggagaaac cccgtctcta ctaaagatac 1260
aaaaattagc cgagtgtggt ggcgcatgcc tgtaatccca gctactcggg aggctgaggc 1320
aggagaatcg cttgagcccg 1340
<210>52
<211>282
<212>DNA
<213>人
<400>52
gagcttgcca agagtctatt ccagcctaca ccgctaggaa gccaacttca gcgagctcaa 60
tgaggggacc aaactggggc tcgctttcca aacgctccgc tccaaaatct gactctctct 120
ccagccccga tctcagtgtg agccgaacct cagaaaagac gctttttaag ggcgacacag 180
ggttggcttt acagcggggc caagaagact acctgggggt accgccacct cggacaaatc 240
cgttggctct gtccaaggtg ctgaatggac tcctatcgcc cg 282
<210>53
<211>46
<212>DNA
<213>人
<400>53
gcgccctcct tcccgcccag gccttccgcg ggcacctcag gccccg 46
<210>54
<211>720
<212>DNA
<213>人
<400>54
ggctccagtt tctttatgcc tgattgcctg ctactcgagt cgtgcccatt ttcctctctc 60
ctggcccaaa cttcctgcgc ctacagccgc cttcaggcac ttgtgtgagt ctctgtttaa 120
gagatcagcc aggaggtgga acctcacagg acttctgtgg tcaagaaact gtgtgagcgt 180
gttctcacac ataggaagaa agcaatgtat gtcatagatc cccaaaagga tgaatgcagg 240
aagagggaag gaacaaagga aggaaagaaa ggcagaaagg aggaagaaaa aaaaagtaat 300
taaaaagaat gacgtgagga ttgtttgagc ccaggagttg gagatcagcc tgggcagcac 360
tagggagaac tcgtccctac aaaaaattta aaaaattagc tgggtgtggt ggtgcgcacc 420
tgtagtccca gctactcggg aggctgaggc gggaggatgg ggaggatcgc ttgagcccag 480
gagttggaag ctgcagtgag ctatgattgc accactgcac tccagtcggg gagaaagaat 540
gagaccctgt cacaaacaaa caaaaaagca aaaagaatga cggaaggtta ggaaagaagc 600
agagcaacga agcagaggcg cccagcggcg gactggccag ggactgagcg ccgtgcacca 660
cagagccctc ctcgcccact tcccgcggcg agggtggcgt tgctcccact tacccgaccg 720
<210>55
<211>231
<212>DNA
<213>人
<400>55
ggaggcggtg gccgagagcc tgctcctgga gctggaggag gtgacccccg ccgaagacgg 60
cgtctatgcc tgcctggccg agaatgccta tggccaggac aaccgcaccg tggggctcag 120
tgtcatgtgt gagtggccca ctctgtgcgt ccacacgccc acctgcagcc gagagataaa 180
gggaaagggg cctcatccag ggcgagcatg ggctgggtcc cgaggggacc g 231
<210>56
<211>84
<212>DNA
<213>人
<400>56
gccccgctga gccagcgcaa ctgtctgagg tggaagccca cacggaccac agctccagga 60
agccgagcaa gaaacgaatc gccg 84
<210>57
<211>466
<212>DNA
<213>人
<400>57
ggtggcgtcc aaaacacaca gggaccttct ggaggtaaat ctgcagaatg gcattttgtt 60
tgtgaattct cggatcgatc gcgaggagct gtgccagtgg agcgcggagt gcagcatcca 120
cctggagttg atcgccgaca ggccgctgca ggttttccat gtggaggtga aggtgaaaga 180
cattaacgat aatccacccg tcttcagggg cagagaacaa ataatattta ttcctgaatc 240
tagactcctg aattcgcgtt ttccgataga aggagctgct gatgcagaca ttggtgctaa 300
cgctcttcta acgtacacgc tcagcccgag tgattatttc tctttggatg tagaggcaag 360
tgatgaactg agtaaatctc tttggcttga attgagaaaa tatttggata gagaagaaac 420
accagaactt cacttattac tgactgccac tgatgggggc aaaccg 466
<210>58
<211>331
<212>DNA
<213>人
<400>58
gaagccaggg ctcccagcgt ctagtcaggg gcgcagaaac cctcgttcct ccaaaccccc 60
gccacaggga ccactccaga agaaacccat tcgtgatttg ggtccctttg tgtttgagta 120
ttgtggggag tgggctatct agactctaag gactccaagc taacgatgac ctgtgtgggc 180
cttgctctga acagaaaact caaactcagc gtgggttccc gcgtcttccc caaaaggcca 240
aggcccaaag aacccttttc atttggcgag gggcttgagg aagggagggg ctggggcggg 300
agagggtcgg ggtctgcaag ccagcggccc g 331
<210>59
<211>282
<212>DNA
<213>人
<400>59
ggtggtgagc gagggcggca agcccaaggt gcgcgtatgc taccgcgggg aggacaagac 60
gttctacccc gaggagatct cgtccatggt gctgagcaag atgaaggaga cggccgaggc 120
gtacctgggc cagcccgtga agcacgcagt gatcaccgtg cccgcctatt tcaatgactc 180
gcagcgccag gccaccaagg acgcgggggc catcgcgggg ctcaacgtgt tgcggatcat 240
caatgagccc acggcagctg ccatcgccta tgggctggac cg 282
<210>60
<211>99
<212>DNA
<213>人
<400>60
ggttcccgca gccaccccga agacccccag gcagccgccc agcaccagca gtagcagcgc 60
tgggctgcag gagggcaggt ggcgggggct gccccgccg 99
<210>61
<211>229
<212>DNA
<213>人
<400>61
gggccactga cctcgaagct tatgatggtc gtggtgtgtt ttttgcccgc ggcccagacc 60
gcttcctggg ctctctccag ccgccctcct ggtctcccct gggaccgttc cgaggtgtgg 120
ttccctggcg cccgccgttg ctcccgtagt ttgggttctg tcgctcccag caggtctcgc 180
ttatgccgcc caccccgtgc cctgctcttg cttgctctgc caccccccg 229
<210>62
<211>59
<212>DNA
<213>人
<400>62
gagggcgcgc ggcgatggcg gcggcgggca ggcggcgggc gcggcgggcg aggggtccg 59
<210>63
<211>275
<212>DNA
<213>人
<400>63
gcctatcctc cctgcaggaa gtgcgagcgc accacgtgcc atgacttcct ggagtgccag 60
aactcgccag cgcgcatcac gcactaccag ctcaacttcc agacgggcct cctggtgcct 120
gcgcatatct tccgcattgg ccccgcgcca gccttcacgg gggacaccat cgccctgaac 180
atcatcaagg gcaatgagga gggctacttt ggcacgcgca ggctcaatgc ctacacgggt 240
gtggtctacc tgcagcgggc cgtgctggag ccccg 275
<210>64
<211>305
<212>DNA
<213>人
<400>64
gtgcccgact cagggagtga tgtcgagaca cacacatcac caggaagagc ccaggggtgc 60
acagtgcccc tcaaggcact aaccgtagag gcgtgagtag catagggctt gtgcacaccc 120
aggcatcggg tgtcgagctc aaggcgaggg agtgtgccag cggcacaggt cagggaagtt 180
tgtgaaggag accaggtggg agccactcac agaaatcagt aacatgaaaa ccacagccac 240
aaaaccacca ctgtcactca acgcccatca tcacgggcag gacagttcta catcatctcc 300
ctccg 305
<210>65
<211>1173
<212>DNA
<213>人
<400>65
ggtggctcag cccagctcct gcctaggaaa gccttagtgt tgggagggac cctgatgact 60
gaggagcctg gtagctccag gtcgcccaca ctttcaggtc tcttgcacca gaaggtggca 120
ggatccattg ggaggaaaca ggccaccttg gaaggtgtcc ctgggccccc atccccaggg 180
attgaggccg tagggggccc gctctgctgc gttgaccaga ctcctgggct ttgaaggctc 240
ctgggcccag taagaaggag gtgggtgcca aggttgagga ggaagcatcc gagtatgtgt 300
aggaggagga cagggtgtga ccatagactg ccaaaagctg caggtggatc gggggaccct 360
gggggctcag gatccagcaa ggggcggcag gagtaaagga ggaaggaatg acaggtgcaa 420
ataccttccc accaaagccc tttatgccct ctggctcctc cccagagttg tccccactct 480
cagtcggtca cccactcctt gaacttgaga tcggtgtcgg tggtgctaaa gccatcatca 540
gcaatgacat catcaccccc tcctcctcat ggatgaccgt gtgctcctcg tcactcgcta 600
tgacctcgct ggccatgtgc tgggaatgag cagctcacgt gggcggcagc agggctgccc 660
acgggtcacc tccctcacca ggggctgcaa agtggcctgg agctccatgc tgagtagaag 720
gctttgggcc agagtatgat gcagtgccag acaccacctg tgtcagttcc cgtagtgcct 780
gacggtctat ttccctgccg tccaggctgt gtaccccgct gtgggagaag gcttgggcca 840
ggctgagcca ggttccctga ctgtgtgcag ccgttctgcc ccacagaagc tgctccttgg 900
tatccgagct ctggagtgtt tgggctgcaa ctgacaggag ttcagaggac accccagggg 960
cagtggcagt gcccgtctct gatatgctcc gctcccacga gcccttgtta cactcctgct 1020
agcccctggc ttgtgggctt ggcctctgag ctggacttct ttcggtcctt gttgcaagtg 1080
ggccaccttc acctggaagg ccaggtcgta tttctgcatc tcattgggcc ccagggtgta 1140
ccaccgctcg ctcagcatct ggctgacggt ccg 1173
<210>66
<211>400
<212>DNA
<213>人
<400>66
gaaaacaaaa ggctgaagac agaaaaagaa gacatttact attccacttc ttccttttac 60
atcagtgaga gaaagggcct tgggagaaag atggcacaga gagaaacaaa agaaagaaag 120
aaagaaaacc aaaaatctct gctttctcaa aaatccctgg tctgcctatc taggctggga 180
gagaccccga gggcagcctg tctctcctgc agcctttgca gtcagcgaca ggcatcatga 240
aattaatttg aaataaacaa tgacaaagca ggaagctcaa cgggtccctg agttgctttg 300
ggcccccact cctccccgaa gcccctgggc tgtttaacaa agccgtgggt ccgcctaccc 360
caagcacttt ttgtgacgtc acagctccga ggaccatccg 400
<210>67
<211>256
<212>DNA
<213>人
<400>67
ggggccgaga gggcgggagg gcgtagtggc ggcccgtcgg ggcggctgag gcgggcagcc 60
gaagcagtgg ctctcggagg gggaacaaag agcagcgact aaggcggcag aggagcggcg 120
gcggtggcgg cgctgcagca gcgggcggga ctggtatggt ggttccacag ggcagacccc 180
gctgcactca cagggaggag gaggcggcag cggcggagga aggcggcgca ccccgagagg 240
tgagcgaggc aggccg 256
<210>68
<211>477
<212>DNA
<213>人
<400>68
gaaccaatct cagcctccct tccactagtc attagtctcc cccgctgcag gtagagtgac 60
aggcaggctc aggagctcct gaaaaggcct ttgttttatc gccttcagtt cagatgcttc 120
agagcactag caggccatat tttaatctca ggtctttgca aacaaaatcg ttaaaagcag 180
atggctgtga agactgccat gaatattaat agatattgaa aaaaaggccc cttaatcttt 240
ccataaatct ttctgaggag gtgggggaag acttggagat gagggctgca gtgtagttgc 300
aggtaccctg gcccttccta tctgggcttg atcctaataa ctgaggaatt agcacaaaga 360
taggtggttc cagcccagag ttgggcactg agatgggcct ggagaagcag tcttgggctt 420
gccatctcct gtcttccttt ctccttcccc tgcagagctg ggctgggtga ggacccg 477
<210>69
<211>193
<212>DNA
<213>人
<400>69
ggccctgggg cagcacagct tcccgattcc cacgtgcctc tgcgtctcgg cgccacgggt 60
gactttcggt ccagatgcca gcaaagacat ctctctgtct accaggcaac cacctccatc 120
ctcacctcct cacgggcaga ctctaactac ctccgctctc tccacaaatg ccagtgcgag 180
cgcagcctcg ccg 193
<210>70
<211>2008
<212>DNA
<213>人
<400>70
gcccgtgata atcgtgcctg cagcagcttt tcactggcta caggattcag cccttaggct 60
gaagccacgc ttggctccga agtttccact gcacaggacc agggctacca tctgacaaac 120
tgcaaggcaa gagaaaacac gtgtcctccc tgggattggg tctgggggaa ccttcatgcc 180
tcagaggaga agaacgtcac aagtagttta ggacacaggt ggcagtgacg aagctcttgg 240
ggacatggat ggtgctggca gaactcaagg gggatagagg tggtgctggc agaggtcaca 300
gggacaaaga tggcactggc agagttcata ggggacagag gtggagttgg cagagttcat 360
gagggacaga ggtggcgctg gaagagttca cgggggacag aggtggcgct ggcagagttc 420
acgggggaca gaggtggcac tggcagagtt cacgggggac agaggtggca ctggcagagc 480
tcatggggga cagaggtggc gttggcagag cccatggggg acagaggtgg cgctggcaga 540
ggtcatgggg gacagaggtg gcgctggcag aggtcatggg ggacagaggt ggcgctggca 600
gaggtcatgg gggacagagg tggcgctggc agagctcata ggggacagag gtggcgctgg 660
cagagctcat gggggtcaga ggtggcgttg gcagaggtca cggggggcag aggtggcact 720
ggcagaggtc acgggggaca gaggtggcac tggcagaggt cacgggggac agaggtggca 780
ctggcagagg tcacggggga cagaggtggc gctggcagag cccatggggg acagaggtga 840
tgttggcaga gttcatgggg gacaggtggc gttggcagag cccacggggg acagaggtgg 900
cgctggcaga gctcacgggg gacagaggtg gcgctggcag agctcacggg ggacagaggt 960
ggcgctggca gagctcacgg gggacagagg tggcgctggc agagctcacg ggggacagag 1020
gtggcgctgg cagagctcac gggggacaga ggtggcgctg gcagagttca cgggggacag 1080
aggtggcgct ggcagagttc acgggggaca gaggtggcgc tggcagagtt catgggggac 1140
agaggtggcg gtggcagagt taatggggga cagaggtggt gttggcagaa ctcatggggg 1200
acagaggtgg cactggcaga gttcataggg gacagaggtg gcgttggcag aactcggggg 1260
acagaggtgt cattggcaga ggtcataggg gacagaggtg gcgttggcag agttcacggg 1320
ggacagaggt ggcattggca gaactcatga gggacagagg tggcgctggc agagttcatg 1380
agggacagag gtggcgctgg cagcgttcac gggggacaga ggtggcgttg gcagcgttca 1440
cgggggacag aggtggcgtt ggcagcattc acgggggaca gaggtggcat tggcagaact 1500
catgagggac agaggtggcg ctggcagaac tcatgaggga cagaggtggt gttagtagag 1560
ctcatgaggg acagaggtgg cgttggcagc gttcatgggg gacagaggtg gcgttggcag 1620
cattcatggg gggcagaggt ggcggtggcc gagttcatga gggacagagg tggcgttgac 1680
agagctcctg ggggacagag gtggcactgg caaagcacat gaggacaaag gtggtgctgg 1740
tagatttcac tgaggacaaa ggtggcacta gcagagctca caggtacaga ggtggtattg 1800
acagctccca aggacagagg tggtgctggc agcgctcaca agggacacat gtggtgctgg 1860
caggtttcat tgaagacaaa gatggcattg gcagggctca caggacagag gtggcgttga 1920
tggagctcct gagggcagag gaggtgctgg cagagctcat gggggatgga gggtgctggc 1980
agagctcacg ggagacagtt gtgacccg 2008
<210>71
<211>160
<212>DNA
<213>人
<400>71
gactctcctt ccatctcgcg tcctcagcgt ccgttgggct ccactttaaa aataaaaaaa 60
tcaaactaac taaaacgaag gtgggacccc ccaggctccc cttcttccct ggcctctgga 120
aaatccagct gggaggacgc aggggcgggg gcagatcccg 160
<210>72
<211>64
<212>DNA
<213>人
<400>72
gtgcgcgcgc agcccgcgag gcggggccgt gtcagtgagg cctactccca gctttttcct 60
cccg 64
<210>73
<211>2061
<212>DNA
<213>人
<400>73
ggccagaggc tgtggagact cggatcctga ggcaaaagga agccgagtca gggacgcgct 60
tccttcccca gggctcgtcc ccagcgccac ccgcccttct ctagagcccc atccccagcg 120
cgaacctcca ggaggaagca gcagtcacca cgcggggaca gaagggggag agctcgagcc 180
agggcccagc gattggagtc cgcggaacgc agggacatga agtccagcag agaaaactaa 240
aaactggcaa cacttccatg gataaaaatt cagcctctcc ctctacaata gcaacaaacc 300
ccaaaccagg aaacagagac ccctgtaaat aacccaccaa gataaattcc acaccctcca 360
ccagtgtttc aggctacagg gtgggatatg cggggaggtg gcggagaccc atcttgaatc 420
agaaattcaa ggactaagtg caaaactgga ccctaatggg gtgggtctag agcattgaag 480
aaagtgcatt agtgcttggc tagggctggc aggtggctgt tagatgaggt gcgcccctgg 540
gtgcaggaag tgttttttgg gggatgacaa cttcctaaca ttagatggta gtggtgactg 600
gtgattgtac agccctataa atttgctaaa aaaaaattga attgcacatt ttaataggtg 660
aattgtatgg catgtgaatt atacctcaat aaagctttta tataaaattg gatcgattta 720
actaaaaaaa gaaattttaa gaagagacaa aattggttgg gtgtggtggc tcatgccttt 780
aatctcagca ctttggaagg ctgaggtcgg gggggtggat tgcttgagcc caggagttcg 840
agaccagcct gggcaacatg tcgaaaccag tctctaccaa aaataggaaa aaagtagctg 900
ggcatggttg tgtgcacctg tagtctcagc tactcaggag gctgaggtac aaggattgct 960
tgaacctggg aggcagaggt tgtagtgagt gagccactgc actccagcct caggaacaga 1020
gtgagaccct gtctcaaaaa aaaaaaaaaa aaaaaggaac aaaatatatg aaaaatgaag 1080
actaaattac aaaatcctta agagaaaatg attttaatta aaaatttaat aagggacact 1140
gaagaaagga aaatagaaat tatataatga aagaagtgaa aagggttaga aagactaaga 1200
aaatctaacc aacatagaat tggagttttt aaaacacaaa aaacaataga catagctagt 1260
atttaaaacg gacgcctaca ggtgcgtccc acgggggatg gggacacgga cgcctgcagg 1320
tgcaccccca cggggggacg gggacacgga cgcctgcagg tgcaccccac ggggaggacg 1380
gagacatgga tgcctgcagg tgcaccccca cggggaggac ggggacacgg acgcctacag 1440
gtgcaccccc acggggggga cggggacaca gacgcctgca ggtgcacccc cacgggggga 1500
cggggacacg gacgcctgca ggtgcacccc cacggggggg acggggacac ggacgcctgc 1560
aggtgcaccc ccacgggggg atggggacac ggacgcctgc aggtgcaccc cacggggagg 1620
acggggacac ggacgcctgc aggtgcaccc ccacgggggg gacggtgaca cggacgcctg 1680
caggtgcacc cccacgggag gacggggaca cggacgcctg caggtgcacc cccacaggag 1740
aacggggaca tggatgcctg aacgtgcact cccacaggga ggacggggac atggacacct 1800
gcaggtgcac acccacaggg aggacgggga catggacgcc tgcaggtgca cccccatggg 1860
gaggacgggg acacggatgc ctgcaggtgc acccccatgg ggaggacggg gacacagaca 1920
cctgcaggtg cactcccacg ggggggatgg ggacacagac gcctgcaggt gcactcccac 1980
gggggggacg gggacatgga cgcctgcagg tgcaccccca tgggggggac ggggacacag 2040
acgcctgcag gtgcaccccc g 2061
<210>74
<211>135
<212>DNA
<213>人
<400>74
ggaacgggcg gggcggggcg gggcgcgaag ggggcggtgc cgcgagcggg gggcggtggc 60
ggcggcggcg gtggcggccg aggaggagaa catggcggcc gcggagagcg gctgaaatgc 120
ctgttcttca ggccg 135
<210>75
<211>267
<212>DNA
<213>人
<400>75
gctgcaaggc ggggctggag tggaacagga ccccgctgag cagcttggag gagtctggca 60
ggaagaagat cgccccgaag cagagcgtga tgaaggcgct gaataccagc agcagcacga 120
acttctccgt caggcggagg gcggcggggc ccgacccctt cctgccaccg ccgccgccga 180
gccccccgcc caggacgccg cccgcggggc tgctgaagag cggcaacagg ccccccacgg 240
gcatcgctcc cgctgtccag tggtccg 267
<210>76
<211>239
<212>DNA
<213>人
<400>76
gctgtagcag aggctttact gcccccacgc cctccccagc tctgccctgg tcagtagcat 60
ttgcggtaca cgatataggg accctgttcc tcgtactgct cccgcaggac ccagcaggac 120
tggaaggcgc gcagggaggc caggatggag cccccgatcc atacggagaa attcctggtg 180
ggctgggcag ccaccaccac gtgggtctcg gctggcagag cgcgcagcag ctctgcccg 239
<210>77
<211>706
<212>DNA
<213>人
<400>77
ggaagagccc agagccatca gtgtgccagt ccaggactca gctcaggaag agtcaggttc 60
agcccgccag gaagggtttt cagtaagtta tggaaaaaga taaatcccac acgtgtgaca 120
agagttagga ctgcatacaa atgaaaaaag ccaaacttca ctttttccac ttttatctga 180
aatgtcgcta cactgaaact tccacagaga cccacgggga cgtgtggcct gtcacaccgt 240
cggctgtatt ggatcaggat tatttcttat gaaggtctgc tttgccagta cgcagcaggt 300
cccagtctct acgccgtccc gaacacctcg tagaaatacg gggcatgcac aacgttgtac 360
ctgctccaat ctaagcagca atccagccct tttggattgc ctctacccaa acctagaaca 420
aagatggcca ggaaaagacc agggacgctc tttattaagg gaagatgcac atataatgaa 480
agataatatc caaacctctg cacgccaaca cgtgcagacg caggcacaag tcctatcata 540
ttgaaggtcg caactcactg ggaagccctt tccccagagt taaagcggga gctaaaagtc 600
cgcttatgca acaacagtcc aattactcgg acaccccgag caaaactctc cagcggaagg 660
ggcagcgggg tctggggcgc caactccctc cctgcaactc ccgccg 706
<210>78
<211>59
<212>DNA
<213>人
<400>78
gggtagctgc ggccaaggcg cccgcggctt cgggggcata gcgtaggggc ccgcctccg 59
<210>79
<211>327
<212>DNA
<213>人
<400>79
ggctgcagct gcttgttaac cctcagagcg ccacggcgcg agggaagggc acgccaacca 60
ggagaggggg cgagggagat gcggtccgcc tgcagtcacc tctgcacctc agagatttcg 120
ggaagtttga gtgcaggaaa gcagcgctcc gaggccaggc ctggggtgct ggccgctgcg 180
gggggcacgc cctgcgctgc tcaggggcct gtggtttcgg agagcacccc gatccagtcc 240
cccatcgcct ctctggcagg cgttgggact tggagtgagc tggcagcctg caagtgggtg 300
gataagagcc agggcagggc agggccg 327
<210>80
<211>107
<212>DNA
<213>人
<400>80
gctgggggcg cgggagcggc gggcgcggcg ggctggaggg cgggcaccgc gaagggaggg 60
cgccccactt ccccgcaccg cccgccaggc ccgccgagca ctgaccg 107
<210>81
<211>661
<212>DNA
<213>人
<400>81
gtcctggtgg aggcgcagct gtactaccac tggcaggcct tgcagatcct agacgagctg 60
gcagcgaagc tcaagcgcag gatgcggaaa tcttcctcac atcaaatatt tgaaaacaaa 120
ctagaaactg tccaaccgca tttctactgc gcccgcccgc agatgcagtt ttctccgcac 180
gtgcgcgcct tctctccttc ccgccctcag ggtccacggc caccatggcg tatcaggggc 240
agcagtacct gtggcagcat tggcctttgc agcggcggca gcagcaccag gctctgcagc 300
ggcacccccc agcggcttaa gccatggcgc ttctcagggc attcagcagc agcgttgctg 360
taaccgacaa agacaccttc gaattaagca cattcctcga ttccagcaaa gcaccgcaac 420
atgaccgaaa tgagcttcct gagcagcgag gtattggtgg gggacttgat gtcccccttc 480
gaccagtcgg gtttgggggc tgaagaaagc ctaggtctct tagataacta cctggaggtg 540
gccaagcact tcaaacctca tgggttctcc agggacaagg ctaaggcggg cttctccgaa 600
tggctggctg tggatgggtt aggcagtccc tccaataaca gcaaggagga tgccttctcc 660
g 661
<210>82
<211>253
<212>DNA
<213>人
<400>82
gagaggtgtc caggaggagc agaccctcag accaggtagg ctgtgcactc ggtgaccctg 60
acgccatcca agggaagctc cgccatcccg cgccagtgcc tgagctgcaa ctgcaaactg 120
cgcgtcctgg cacgagcagc ggtgggggcg ggtgggggaa ggagcgagtg actctccagg 180
cgtcttccgc tacctgacac cagccaggca gcccccaggg ccagagcgtc agcgccgaag 240
ccaggctcat ccg 253
<210>83
<211>242
<212>DNA
<213>人
<400>83
gaaagaggga ggcgcggggc cgcgcttggg gcctgccgct gcacgccagc ctgggcaaag 60
agctgccacc ttctgcgggc gaagcgggtc gggacgcagg acggcagcgg ggctggaggc 120
agctacgtgg gtccacaccc ccatgccctg caaggctcct tggccctgct tctcctctgt 180
ctcggcggga gaggagcagc ctcggtttta cagaatttca gggtcgcgtc tccagcgccc 240
cg 242
<210>84
<211>81
<212>DNA
<213>人
<400>84
ggtggcgtcc aagggccgcg gggaccttct ggaggtaaat ctgcagaatg gcattttgtt 60
tgtgaattct cggatcgacc g 81
<210>85
<211>317
<212>DNA
<213>人
<400>85
gaaggacgag ggctgcaaag gtgttttctg gagggaaacg tggagtaagg aggaagcctg 60
gaattttagc atcttcccag cgcacacggc ggctttattg gtgtgccagg gatgtctcta 120
gtctgaataa aaagggatgc tttctggctc accctgtgcc aggatagagg gaagcgtgtt 180
ctgagccagg catggggccc catctgctcc ctggcagccc ccagccgcgg cgtccgcctt 240
ccctggagcc cgtccccagc cgctcacctc aggtgcagct ccagctgcgt gtagaggaag 300
tgcaggaacg cccgccg 317
<210>86
<211>290
<212>DNA
<213>人
<400>86
ggaaacagtt caggacgctc aagaccagaa gcgggagcaa acccaaaagg agctccaagg 60
aggtgtgtgt ggggagagcc agggggacgc aggactaggc tctttcctgc gcaaggggtg 120
gggaaacccg cgaaagccag ggagtcgcgc gcactcacgc cctcccgcca ccagggcaga 180
gccaccgctg caaggagccc acgggtgcgc gctccgctcc agggcggatc tttccacacc 240
cccctcaccc tcaaaagctc aggctggagc ggtcatcagt gcggactccg 290
<210>87
<211>79
<212>DNA
<213>人
<400>87
gcggctgcgg cggccgagag gtcctgcttc ccccaggggc tggccatacc cgcggccttc 60
agcttggcct tcttggccg 79
<210>88
<211>395
<212>DNA
<213>人
<400>88
gcaaatccgc gcagcgcatc gcgcccagtc tcggagactg caaccaccgc caaggagtac 60
gcgcggcagg aaacttctgc ggcccaattt cttccccagc tttggcatct ccgaaggcac 120
gtacccgccc tcggcacaag ctctctcgtc ttccacttcg acctcgaggt ggagaaagag 180
gctggcaagg gctgtgcgcg tcgctggtgt ggggagggca gcaggctgcc cctccccgct 240
tctgcagcga gttttcccag ccaggaaaag ggagggagct gtttcaggaa tttcagtgcc 300
ttcacctagc gactgacaca agtcgtgtgt ataggaaggc gtctggctgt ttcgggactc 360
accagagagc atcgccaacc agaacggccc acccg 395
<210>89
<211>357
<212>DNA
<213>人
<400>89
ggcgggtgtg ggatcatcta cccaccctgc ggctccttcc cgctcgcagt gaaggaagga 60
cgctcagacc aacaggggct caggtattct gggtgtcagg acccttcctc ctgcacgcat 120
cttacgcagg gtggggctga gggcgtgagg gcacaagtca ttgaggacat ggagggaacc 180
cacgctcgtc ccgatagatt gtcacggtcc tgaggcggga cggtcaggac agggaagatg 240
tatttcttcc ccctgcatcc cctcccgcac cgcgtctgaa ctcctctggg agcgcaagaa 300
cagtaacaat gctgcgcccc ttcccccacc ctttgactcc gctcgcaacc tagcccg 357
<210>90
<211>72
<212>DNA
<213>人
<400>90
gtttcccgaa cctgggcggc cgtcgggcag ccccctcgtc cgaccatggc gactgacagt 60
gagtgcgctc cg 72
<210>91
<211>55
<212>DNA
<213>人
<400>91
ggcctctggg atttgggggt cacgcccgac ctctgggatt tgggggtcac gcccg 55
Claims (13)
1.用于分析卵巢癌病症的方法,包括确定选自SEQ ID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的基因组甲基化状态。
2.权利要求1的方法,其中所述分析是检测受试者中的卵巢癌,并且其中进行以下步骤:
a.提供来自要分析的受试者的样品
b.确定选自SEQ ID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的甲基化状态。
3.权利要求1或2的方法,其中额外进行以下步骤:
a.将来自甲基化状态测试的一个或多个结果输入获自诊断多变量模型的分类器,
b.计算样品来自正常组织或卵巢癌组织的可能性,和/或,
c.计算预测中的置信度的关联p-值。
4.权利要求1-3的方法,其中确定SEQ ID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60的序列中的至少4个序列的甲基化状态。
5.权利要求1-4的方法,其中额外地确定SEQ ID NO.11-49和/或61-91的一个或多个序列的甲基化状态。
6.权利要求1-5的方法,其中确定SEQ ID.NO.1-91中至少20个序列的甲基化状态。
7.权利要求1-6的方法,其中确定SEQ ID NO.1-SEQ ID NO.10和SEQ ID NO.50-SEQ ID NO.60的序列的甲基化状态。
8.权利要求1-7的方法,其中通过选自下组的一种或多种方法确定甲基化状态:
a.亚硫酸氢盐测序
b.焦磷酸测序
c.甲基化敏感性单链构象分析(MS-SSCA)
d.高分辨率解链分析(HRM)
e.甲基化敏感性单核苷酸引物延伸(MS-SnuPE)
f.碱基特异性切割/MALDI-TOF
g.甲基化特异性PCR(MSP)
h.基于微阵列的方法,和
i.msp I切割。
9.权利要求1-8的任一项的方法,其中要分析的样品来自选自下组的组织类型:例如,来自要分析的组织的组织活检物、阴道组织、舌、胰腺、肝、脾、卵巢、肌肉、关节组织、神经组织、胃肠组织、肿瘤组织、体液、血液、血清、唾液和尿。
10.权利要求2-9的方法,其中检测原发癌。
11.权利要求1-10的方法,其中将获得的甲基化模式用于预测对卵巢癌治疗的治疗反应。
12.包含核酸的组合物或阵列,所述核酸的序列与SEQ ID NO.1-91的序列中的至少10个序列相同,其中所述组合物或阵列包含不超过100种不同的核酸分子。
13.权利要求12的组合物或阵列,包含至少5个序列,所述序列的累积p值小于0.001,优选小于0.0001。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US97283907P | 2007-09-17 | 2007-09-17 | |
US60/972839 | 2007-09-17 | ||
PCT/IB2008/053743 WO2009037633A2 (en) | 2007-09-17 | 2008-09-16 | Method for the analysis of ovarian cancer disorders |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101802226A true CN101802226A (zh) | 2010-08-11 |
Family
ID=40451226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880107276A Pending CN101802226A (zh) | 2007-09-17 | 2008-09-16 | 分析卵巢癌病症的方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8652777B2 (zh) |
EP (1) | EP2193210B1 (zh) |
JP (1) | JP5512521B2 (zh) |
CN (1) | CN101802226A (zh) |
RU (1) | RU2511408C2 (zh) |
WO (1) | WO2009037633A2 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102732637A (zh) * | 2012-07-17 | 2012-10-17 | 山东大学齐鲁医院 | 一种多重巢式甲基化特异性pcr检测试剂盒及其使用方法与应用 |
CN102732516A (zh) * | 2012-07-17 | 2012-10-17 | 山东大学齐鲁医院 | 一种多重巢式甲基化特异性pcr扩增引物及其使用方法与应用 |
CN103620608A (zh) * | 2010-10-08 | 2014-03-05 | 皇家飞利浦电子股份有限公司 | 生物医学标记物之间多模态关联的鉴定 |
CN105296655A (zh) * | 2015-11-26 | 2016-02-03 | 北京市中医研究所 | 检测顺式作用元件有无甲基化修饰或其修饰位点的方法 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10236078B2 (en) | 2008-11-17 | 2019-03-19 | Veracyte, Inc. | Methods for processing or analyzing a sample of thyroid tissue |
WO2010129934A2 (en) | 2009-05-07 | 2010-11-11 | Veracyte, Inc. | Methods and compositions for diagnosis of thyroid conditions |
WO2011128820A2 (en) | 2010-04-16 | 2011-10-20 | Koninklijke Philips Electronics N.V. | Methods for the analysis of breast cancer disorders |
CN104204222A (zh) * | 2011-08-30 | 2014-12-10 | Dcb-美国有限责任公司 | 预测易罹患卵巢赘瘤或卵巢癌预后的生物标记 |
WO2013096661A1 (en) * | 2011-12-22 | 2013-06-27 | Illumina, Inc. | Methylation biomarkers for ovarian cancer |
US10706957B2 (en) | 2012-09-20 | 2020-07-07 | The Chinese University Of Hong Kong | Non-invasive determination of methylome of tumor from plasma |
US9732390B2 (en) | 2012-09-20 | 2017-08-15 | The Chinese University Of Hong Kong | Non-invasive determination of methylome of fetus or tumor from plasma |
US11976329B2 (en) | 2013-03-15 | 2024-05-07 | Veracyte, Inc. | Methods and systems for detecting usual interstitial pneumonia |
CA2946538A1 (en) | 2014-04-04 | 2015-10-08 | Del Mar Pharmaceuticals | Use of dianhydrogalactitol and analogs or derivatives thereof to treat non-small-cell carcinoma of the lung and ovarian cancer |
EP3770274A1 (en) | 2014-11-05 | 2021-01-27 | Veracyte, Inc. | Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data |
RU2612890C1 (ru) * | 2015-12-11 | 2017-03-13 | Федеральное Государственное Бюджетное Учреждение науки Институт химической биологии и фундаментальной медицины Сибирского отделения РАН (ИХБФМ СО РАН) | Метод определения уровня метилирования промоторной области гена COL1A2 для диагностики рака толстой кишки |
US11217329B1 (en) | 2017-06-23 | 2022-01-04 | Veracyte, Inc. | Methods and systems for determining biological sample integrity |
US20230055572A1 (en) * | 2021-05-18 | 2023-02-23 | Venn Biosciences Corporation | Biomarkers for diagnosing ovarian cancer |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US5837832A (en) | 1993-06-25 | 1998-11-17 | Affymetrix, Inc. | Arrays of nucleic acid probes on biological chips |
AU685627B2 (en) * | 1994-03-18 | 1998-01-22 | Myriad Genetics, Inc. | Germline mutations in the MTS gene and method for detecting predisposition to cancer at the MTS gene |
US6017704A (en) | 1996-06-03 | 2000-01-25 | The Johns Hopkins University School Of Medicine | Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids |
WO2004020662A2 (en) | 2002-08-27 | 2004-03-11 | Epigenomics Ag | Method and nucleic acids for the analysis of breast cell proliferative disorders |
US20070178458A1 (en) * | 2003-09-05 | 2007-08-02 | O'brien Philippa | Methods of diagnosis and prognosis of ovarian cancer II |
WO2005068664A2 (en) * | 2004-01-09 | 2005-07-28 | The Regents Of The University Of California | Cell-type-specific patterns of gene expression |
CA2580306A1 (en) * | 2004-09-15 | 2006-03-23 | Fox Chase Cancer Center | Methods for the detection of ovarian cancer |
US7507536B2 (en) | 2005-10-07 | 2009-03-24 | The Johns Hopkins University | Methylation markers for diagnosis and treatment of ovarian cancer |
US20070087358A1 (en) * | 2005-10-19 | 2007-04-19 | Melanie Ehrlich | Methods for diagnosing cancer based on DNA methylation status in NBL2 |
-
2008
- 2008-09-16 JP JP2010524619A patent/JP5512521B2/ja not_active Expired - Fee Related
- 2008-09-16 CN CN200880107276A patent/CN101802226A/zh active Pending
- 2008-09-16 EP EP08831839.9A patent/EP2193210B1/en not_active Not-in-force
- 2008-09-16 RU RU2010115267/10A patent/RU2511408C2/ru not_active IP Right Cessation
- 2008-09-16 WO PCT/IB2008/053743 patent/WO2009037633A2/en active Application Filing
- 2008-09-16 US US12/678,423 patent/US8652777B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103620608A (zh) * | 2010-10-08 | 2014-03-05 | 皇家飞利浦电子股份有限公司 | 生物医学标记物之间多模态关联的鉴定 |
CN102732637A (zh) * | 2012-07-17 | 2012-10-17 | 山东大学齐鲁医院 | 一种多重巢式甲基化特异性pcr检测试剂盒及其使用方法与应用 |
CN102732516A (zh) * | 2012-07-17 | 2012-10-17 | 山东大学齐鲁医院 | 一种多重巢式甲基化特异性pcr扩增引物及其使用方法与应用 |
CN102732516B (zh) * | 2012-07-17 | 2014-01-01 | 山东大学齐鲁医院 | 一种多重巢式甲基化特异性pcr扩增引物及其使用方法与应用 |
CN102732637B (zh) * | 2012-07-17 | 2014-01-08 | 山东大学齐鲁医院 | 一种多重巢式甲基化特异性pcr检测试剂盒及其使用方法与应用 |
CN105296655A (zh) * | 2015-11-26 | 2016-02-03 | 北京市中医研究所 | 检测顺式作用元件有无甲基化修饰或其修饰位点的方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2010538637A (ja) | 2010-12-16 |
EP2193210A2 (en) | 2010-06-09 |
RU2511408C2 (ru) | 2014-04-10 |
US8652777B2 (en) | 2014-02-18 |
WO2009037633A2 (en) | 2009-03-26 |
JP5512521B2 (ja) | 2014-06-04 |
US20100273674A1 (en) | 2010-10-28 |
RU2010115267A (ru) | 2011-10-27 |
WO2009037633A3 (en) | 2009-07-02 |
EP2193210B1 (en) | 2014-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101802226A (zh) | 分析卵巢癌病症的方法 | |
EP2193209B1 (en) | Method for the analysis of breast cancer disorders | |
CN105886657B (zh) | 结直肠癌的外遗传标记以及使用它们的诊断方法 | |
CN102311953B (zh) | 尿液诊断膀胱癌的方法和试剂盒 | |
CA2615858A1 (en) | Compositions and methods for cancer diagnostics comprising pan-cancer markers | |
CN101878315A (zh) | 使用膀胱癌特异性甲基化标记基因的膀胱癌诊断试剂盒和芯片 | |
CN110129436A (zh) | Dna甲基化的数字序列分析 | |
US11535897B2 (en) | Composite epigenetic biomarkers for accurate screening, diagnosis and prognosis of colorectal cancer | |
CN110819715A (zh) | 用于结直肠癌检测的免疫基因标志物及试剂盒 | |
CN110093409A (zh) | 一种基于高通量测序的感染线检测方法以及试剂盒 | |
US11542559B2 (en) | Methylation-based biomarkers in breast cancer screening, diagnosis, or prognosis | |
CN117813403A (zh) | 用于疾病检测的方法 | |
KR100892588B1 (ko) | 위암 특이적 메틸화 마커 유전자를 이용한 위암 진단용키트 및 칩 | |
CN115491421A (zh) | 胰腺癌诊断相关dna甲基化标志物及其应用 | |
JP2023534125A (ja) | がんを検出および予測する方法 | |
EP3075851B1 (en) | Method for acquiring information on gastric cancer and kit for detection of gastric cancer | |
WO2024027796A1 (zh) | 标志物在诊断乳腺癌或预测乳腺癌风险中的用途 | |
CN117305466B (zh) | 一种能够识别单碱基甲基化状态的检测方法 | |
CN117025777A (zh) | 用于评估甲状腺癌风险的标志物、探针组合物、系统及其应用 | |
TW202307218A (zh) | 用於疾病偵測的方法 | |
CN117025776A (zh) | 用于评估甲状腺癌风险的标志物、探针组合物、系统及其应用 | |
TW202311533A (zh) | 用於疾病偵測的方法 | |
WO2022101646A1 (en) | Methods for assessing vaginal microbiota community type | |
KR20110043100A (ko) | Ankrd15, hpd, psmd9, wdr66, gpc6, pax9, lrrc28, tns4, axl, 및 hnrpul1 유전자로부터 유래된 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100811 |