CN101802226A

CN101802226A - 分析卵巢癌病症的方法

Info

Publication number: CN101802226A
Application number: CN200880107276A
Authority: CN
Inventors: S·卡马拉卡兰; R·卢西托; J·B·希克斯
Original assignee: Koninklijke Philips Electronics NV; Cold Spring Harbor Laboratory
Current assignee: Koninklijke Philips NV; Cold Spring Harbor Laboratory
Priority date: 2007-09-17
Filing date: 2008-09-16
Publication date: 2010-08-11
Also published as: JP2010538637A; EP2193210A2; RU2511408C2; US8652777B2; WO2009037633A2; JP5512521B2; US20100273674A1; RU2010115267A; WO2009037633A3; EP2193210B1

Abstract

本发明涉及用于分析卵巢癌病症的方法，包括确定选自SEQ ID NO.1-SEQ ID NO.10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的基因组甲基化状态。任选地，额外进行以下步骤：将来自甲基化状态测试的一个或多个结果输入获自诊断多变量模型的分类器，计算样品来自正常组织或卵巢癌组织的可能性，和/或，计算预测中的置信度的关联p-值。

Description

分析卵巢癌病症的方法

发明领域

本发明属于生物学和化学领域，更具体属于分子生物学和人类遗传学领域。本发明涉及鉴定人DNA中的甲基化位点，特别是某些确定的序列中的甲基化位点的领域，所述序列当甲基化时，表明存在卵巢癌。

发明背景

卵巢癌是女性中的第五位的癌症死亡原因，是妇科恶性肿瘤导致的第一位的死亡原因，并且是第二常见的诊断的妇科恶性肿瘤(默克诊疗手册第18部分，妇科和产科第241章，妇科肿瘤)。

它是特发的，表示确切原因是未知的。该疾病在工业化国家中更常见，日本例外。在美国，女性一生中具有1.4％-2.5％(40-60名女性中的1名)的发生卵巢癌的几率。

卵巢癌一半以上的死亡发生在55-74岁的女性中，大约四分之一的卵巢癌死亡发生在35-54岁的女性中。

发生卵巢癌的风险似乎受到一些因素的影响。

与使用避孕药如柠檬酸克罗米酚的关联一直以来是有争议的。1991年的一项分析提出了使用药物可能增加卵巢癌的风险的可能性。从那时起进行了一些队列研究和病例-对照研究，而没有针对所述关联提供结论性的证据。

有一些很好的证据证明遗传因素是重要的。BRCA1或BRCA2基因的某些突变的携带者，更常见在一些人群(如德系犹太女性)中，发生乳腺癌和卵巢癌的风险更高，通常比一般人群发病更早。有乳腺癌的个人病史或乳腺癌和/或卵巢癌的家族史的患者，特别是如果年轻，可能具有升高的风险。子宫癌、结肠癌或其他胃肠癌的强家族史可能表明存在称作遗传性非息肉结肠直肠癌的综合征(HNPCC，也称作Lynch II综合征)，这赋予更高的发生卵巢癌的风险。

已经研究的其他因素，例如滑石粉的使用、石棉暴露、高饮食脂肪含量和儿童期腮腺炎感染，是有争议的，并且还没有确定地证实。

卵巢癌是根据肿瘤史分类(ICD-O代码)。组织学指导了临床治疗、控制和预后的很多方面。

卵巢肿瘤也可以根据它们的推测细胞来源进行分类。主要的类别是表面上皮-间质肿瘤、性索-间质肿瘤(ICD-O 8590)、生殖细胞肿瘤(ICD-O9060-9090)和继发或转移性肿瘤。

表面上皮-间质肿瘤是最常见的和原型卵巢癌。认为它们来自卵巢表面被覆，并且包括浆液性囊腺癌(8441/3)和粘液性囊腺癌(8470/3)。腹腔被覆了与组成卵巢表面被覆相同的细胞，并且癌可以从那里开始。在这种情况下，称作原发性腹膜癌。但是，其治疗与卵巢癌的治疗基本相同。

性索-间质肿瘤(8590)包括激素活性病变，例如产生雌激素的粒层细胞肿瘤(8620/3)和男性化Sertoli-Leydig细胞肿瘤或男性细胞瘤。

卵巢的生殖细胞肿瘤(9060-9090)来自生殖细胞，并且倾向于在年轻女性和女孩中发生。这些肿瘤占大约5％的卵巢癌。它们倾向于包封良好，并且很多是良性的，因此与其他卵巢肿瘤相比预后较好。

也存在混合的继发肿瘤或转移性肿瘤。

卵巢癌通常是原发的，但也可以是继发的，即，转移的结果来自身体其他部位的原发癌，例如，来自乳腺癌或来自胃肠癌，在此情况下卵巢癌是Krukenberg癌。

历史上卵巢癌称作“沉默杀伤者”，因为直到治愈的机会很小，都不认为出现了症状。但是，最近的研究显示这一术语是不正确的，并且与普通群体中的女性相比，在患卵巢癌的女性中更容易发生以下症状。这些症状包括胃胀气、盆腔或腹部疼痛、进食困难或很快有饱感、泌尿系统症状(尿急或尿频)。

早期诊断与改进的预后相关。

患有卵巢癌的女性常常报道一些其他症状。这些症状包括疲倦、消化不良、背痛、性交痛、便秘和月经不规律。但是，这些其他症状对于鉴定卵巢癌不是很有用，因为它们也以相同的频率出现在不患有卵巢癌的普通群体中的女性中。

卵巢癌在它的早期阶段(I/II)难以诊断，直到它播散并且发展到更晚的阶段(III/IV)。这是由于大多数常见症状不特异的事实。

卵巢癌具有不良预后。它是不成比例地致死的，因为症状是模糊和不特异的，因此诊断晚。超过60％展示该癌症的患者已经具有III期或IV期癌症，此时已经播散超过卵巢。

恶性卵巢癌将细胞脱落在腹腔内天然存在的流体内。这些细胞可以植入在其他腹部(腹膜)结构上，包括子宫、膀胱、肠、肠壁的被覆(网膜)，并且甚至可以播散到肺。这些细胞甚至可以在怀疑癌症之前形成新的肿瘤生长。

超过50％的患卵巢癌的女性在疾病的晚期阶段诊断，因为不存在经济的卵巢癌筛选测试。所有阶段的5年存活率仅仅是35％-38％。但是，如果在疾病早期诊断，5年存活率可以达到90％-98％。

因此，获得分析卵巢癌病症的方法和检测受试者中的卵巢癌的方法是有利的。

发明概述

本发明教导了用于分析卵巢癌病症的方法，包括确定选自SEQ ID NO.1-91的序列中的一个或多个CpG二核苷酸的基因组甲基化状态和/或确定特别是SEQ ID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的基因组甲基化状态。

感兴趣的区域在表1A和表1B中指定(“起始”和“终止”)。

CpG岛是这样的区域：其中大量胞嘧啶和鸟嘌呤在DNA的主链中彼此邻接(即，通过磷酸二酯键连接)。它们位于且临近大约40％的哺乳动物基因启动子(约70％在人启动子中)。CpG符号中的“p”是指胞嘧啶和鸟嘌呤之间的磷酸二酯键。

CpG岛的长度典型地是100-3000个碱基对。这些区域的特征在于CpG二核苷酸含量等于或大于统计学预期的含量(≈6％)，而基因组的其余部分具有低得多的CpG频率(≈1％)，这是一种称作CG抑制的现象。不同于基因编码区中的CpG位点，在大多数情况下，如果表达基因，启动子的CpG岛中的CpG位点是未甲基化的。这种观察结果导致推测出基因的启动子中的CpG位点的甲基化可能抑制基因的表达。甲基化对于沿组蛋白修饰进行印迹是重要的。CpG岛的通常正式定义是具有至少200bp的区域，其GC百分比高于50％，并且观察的/预期的CpG比大于0.6。

本文中，CpG二核苷酸是可以在体内，特别是人体内以甲基化和未甲基化的状态存在的CpG二核苷酸。

本发明涉及一种方法，其中用本文公开的一个或多个序列的未甲基化模式检测原发癌，并且其中用获得的甲基化模式预测对卵巢癌治疗的治疗反应。

本文中，受试者理解为是所有人、患者、动物，无论它们是否表现病理学改变。在本发明的含义中，任何采集自细胞、组织、器官、生物等的样品都可以是要诊断的患者的样品。在一个优选实施方案中，本发明的患者是人。在本发明的一个进一步优选的实施方案中，患者是怀疑患有选自下组的疾病的人：原发性卵巢癌、继发性卵巢癌、表面上皮-间质肿瘤、性索-间质肿瘤、生殖细胞肿瘤。

本方法用于卵巢细胞增殖性病症的改进的诊断、治疗和监测，例如，通过使得能够改进所述病症的亚类之间和对所述病症的遗传倾向的鉴定和区分。本发明相对于现有技术提供了改进，因为它使得能够对卵巢细胞增殖性病症进行高度特异性的分类，从而使得能够对患者进行改进的和知情的治疗。

本文中，要求保护的序列也包括指定序列的反向互补序列。

附图简述

图1显示基因组的差异甲基化区域的确定方法。这在实施例中更详细概括。

图2显示聚类的样品(列)与甲基化基因座(行)。甲基化标记可以区分肿瘤(上面的条的左部分)与正常组织(上面的条的右部分)。

图3显示基于甲基化特征的卵巢样品的聚类。未监督的聚类可以区分正常和肿瘤样品。

实施方案的详述

发明人出乎意料地发现，一小部分选择出的DNA序列可以用于分析卵巢癌病症。这可以通过确定本文公开的序列或其反向互补序列中一个或多个CpG二核苷酸的基因组甲基化状态而进行。总共鉴定出了约900种适于所述分析的序列。发现91种序列是特别适合的。

基于恰好10种序列，例如从表1A或B的前10种(P值0.0001)，可以得到94％的分类准确率。这些序列可以存在于下表1A所示的基因中。

表1A

所述序列也可存在于下表1B所示的基因间区域中。

表1B

SEQ IDNO.	ID	染色体	起始	终止	P-值
SEQ IDNO.	ID	染色体	起始	终止	P-值	50	ID89944	chr19	10843569	10843613	0.0000227
51	ID102184	chr2	63152348	63153687	0.0000231	50	ID89944	chr19	10843569	10843613	0.0000227
51	ID102184	chr2	63152348	63153687	0.0000231	52	ID28331	chr11	27698553	27698834	0.0000338

SEQ IDNO.	ID	染色体	起始	终止	P-值
SEQ IDNO.	ID	染色体	起始	终止	P-值	53	ID144851	chr5	114908035	114908080	0.0000553
54	ID128185	chr3	58546910	58547629	0.00008	53	ID144851	chr5	114908035	114908080	0.0000553
54	ID128185	chr3	58546910	58547629	0.00008	55	ID93003	chr19	40483018	40483248	0.000110513
56	ID136801	chr4	68239844	68239927	0.000144546	55	ID93003	chr19	40483018	40483248	0.000110513
56	ID136801	chr4	68239844	68239927	0.000144546	57	ID146275	chr5	140146252	140146717	0.000215464
58	ID131177	chr3	148621317	148621647	0.000216975	57	ID146275	chr5	140146252	140146717	0.000215464
58	ID131177	chr3	148621317	148621647	0.000216975	59	ID12952	chr1	158307786	158308067	0.000242093
60	ID39999	chr12	63439190	63439288	0.000286113	59	ID12952	chr1	158307786	158308067	0.000242093
60	ID39999	chr12	63439190	63439288	0.000286113	61	ID116585	chr20	61967316	61967544	0.000287984
62	ID73971	chr17	26742913	26742971	0.000311873	61	ID116585	chr20	61967316	61967544	0.000287984
62	ID73971	chr17	26742913	26742971	0.000311873	63	ID125133	chr3	13654044	13654318	0.000372628
64	ID99092	chr2	1654591	1654895	0.000372925	63	ID125133	chr3	13654044	13654318	0.000372628
64	ID99092	chr2	1654591	1654895	0.000372925	65	ID69936	chr16	88767910	88769082	0.000397396
66	ID78601	chr17	67623230	67623629	0.00041658	65	ID69936	chr16	88767910	88769082	0.000397396
66	ID78601	chr17	67623230	67623629	0.00041658	67	ID148836	chr5	179854129	179854384	0.000420579
68	ID21285	chr10	79714238	79714714	0.000425735	67	ID148836	chr5	179854129	179854384	0.000420579
68	ID21285	chr10	79714238	79714714	0.000425735	69	ID158039	chr7	922643	922835	0.000459
70	ID32408	chr11	70345916	70347923	0.000464267	69	ID158039	chr7	922643	922835	0.000459
70	ID32408	chr11	70345916	70347923	0.000464267	71	ID76532	chr17	43973948	43974107	0.00051907

SEQ IDNO.	ID	染色体	起始	终止	P-值
SEQ IDNO.	ID	染色体	起始	终止	P-值	72	ID178855	chr9	93408533	93408596	0.0005196
73	ID81125	chr17	78514384	78516444	0.000559665	72	ID178855	chr9	93408533	93408596	0.0005196
73	ID81125	chr17	78514384	78516444	0.000559665	74	ID100286	chr2	24625709	24625843	0.000582927
75	ID155118	chr6	119711684	119711950	0.000636	74	ID100286	chr2	24625709	24625843	0.000582927
75	ID155118	chr6	119711684	119711950	0.000636	76	ID89463	chr19	8668749	8668987	0.000646711
77	ID9880	chr1	94718230	94718935	0.000655989	76	ID89463	chr19	8668749	8668987	0.000646711
77	ID9880	chr1	94718230	94718935	0.000655989	78	ID177108	chr9	37016858	37016916	0.000661917
79	ID68281	chr16	81219051	81219377	0.000665387	78	ID177108	chr9	37016858	37016916	0.000661917
79	ID68281	chr16	81219051	81219377	0.000665387	80	ID178263	chr9	83765733	83765839	0.000669707
81	ID34175	chr11	113165828	113166488	0.00067498	80	ID178263	chr9	83765733	83765839	0.000669707
81	ID34175	chr11	113165828	113166488	0.00067498	82	ID147847	chr5	175420376	175420628	0.000688163
83	ID47981	chr13	111756373	111756614	0.000693087	82	ID147847	chr5	175420376	175420628	0.000688163
83	ID47981	chr13	111756373	111756614	0.000693087	84	ID146308	chr5	140181734	140181814	0.000694524
85	ID17523	chr10	1273925	1274241	0.00074504	84	ID146308	chr5	140181734	140181814	0.000694524
85	ID17523	chr10	1273925	1274241	0.00074504	86	ID166673	chr7	149355326	149355615	0.000762
87	ID91016	chr19	15399966	15400044	0.000779943	86	ID166673	chr7	149355326	149355615	0.000762
87	ID91016	chr19	15399966	15400044	0.000779943	88	ID101572	chr2	45143519	45143913	0.000805715
89	ID39294	chr12	52897679	52898035	0.000854819	88	ID101572	chr2	45143519	45143913	0.000805715
89	ID39294	chr12	52897679	52898035	0.000854819	90	ID50743	chr14	61349222	61349293	0.00087795

SEQ IDNO.	ID	染色体	起始	终止	P-值
SEQ IDNO.	ID	染色体	起始	终止	P-值	91	ID157888	chr7	750241	750295	0.000912

形成本发明的基础的基因优选用于形成“基因板(gene panel)”，即，包含本发明的特定基因序列和/或它们各自的提供信息的甲基化位点的集合。基因板的形成使得能够快速和特异性分析卵巢癌的特定方面。本发明中描述和使用的基因板可以出乎意料高的效率使用，用于诊断、治疗和监测卵巢细胞增殖性病症并且分析发生卵巢细胞增殖性病症的倾向，特别是检测卵巢肿瘤。

此外，与单个基因诊断和检测工具相比，来自多种基因阵列的多个CpG位点的使用，能够允许相对高度的灵敏度和特异性。

本发明涉及用于分析卵巢癌病症的方法，包括确定选自SEQ ID NO.1-SEQ ID NO.10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的基因组甲基化状态。

在一个实施方案中，优选确定SEQ ID NO.1-91的序列中的一个或多个序列的甲基化状态，其中如表1A或1B指出的，所述序列具有小于0.0001的p-值。

CpG岛的甲基化状态指示卵巢癌。但是，优选地，确定每个CpG的甲基化状态，并且确定差异甲基化模式，因为并不是所有CpG岛都必须甲基化。

在本发明的方法的一个实施方案中，该分析是检测受试者中的卵巢癌，并且其中进行以下步骤：(a)提供来自要分析的受试者的样品，(b)确定选自SEQ ID NO.1-SEQ ID NO.10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的甲基化状态。

任选地，额外地进行以下步骤：(a)将来自甲基化状态测试的一个或多个结果输入获自诊断多变量模型(Diagnostic Multi VariateModel)的分类器，(b)计算样品来自正常组织或卵巢癌组织的可能性，和/或，(c)计算预测中的置信度的关联p-值。

例如，我们使用支持向量机分类器(support vector machineclassifier)，基于来自患者的预定组的组织来“学习”肿瘤或正常样品的重要特征。算法现在输出分类器(一种公式，其中变量是来自使用的特征组的甲基化比)。然后将来自新的患者样品的甲基化比输入此分类器。结果可以是1或0。与边缘平面的距离用于提供p-值。

优选的是确定SEQ ID NO.1-SEQ ID NO.10和/或SEQ ID NO.50-SEQID NO.60的序列中的至少4个序列的甲基化状态。

优选的是，额外地，确定SEQ ID NO.11-49和/或61-91的序列中的一个或多个序列的甲基化状态。

在一个实施方案中，确定SEQ ID.NO.1-SEQ ID NO.91的序列中的至少10个序列、20个序列、30个序列、40个序列或超过50个序列的甲基化状态。特别优选的是确定SEQ ID.NO.1-SEQ ID NO.91的序列中所有序列的甲基化状态。

在一个实施方案中，确定SEQ ID NO.1-SEQ ID NO.10和SEQ ID NO.50-SEQ ID NO.60的序列的甲基化状态。原则上，本发明也涉及确定SEQ ID NO.1-SEQ ID NO.91的序列中仅一个序列的甲基化状态。

有许多用于确定DNA分子的甲基化状态的方法。优选地是，通过选自下组的一种或多种方法确定甲基化状态：亚硫酸氢盐测序、焦磷酸测序(pyrosequencing)、甲基化敏感性单链构象分析(MS-SSCA)、高分辨率解链分析(HRM)、甲基化敏感性单核苷酸引物延伸(MS-SnuPE)、碱基特异性切割/MALDI-TOF、甲基化特异性PCR(MSP)、基于微阵列的方法、mspI切割。其他已知的检测5-甲基胞嘧啶的方法的综述可以从以下综述文件收集：Rein，T.，DePamphilis，M.L.，Zorbas，H.，NucleicAcids Res.1998，26，2255。其他方法公开于US 2006/0292564A1中。

在一个优选实施方案中，甲基化状态是通过msp I切割、衔接子的连接、McrBC消化、PCR扩增、标记和随后的杂交来确定的。

在一个优选实施方案中，甲基化状态如下确定。

优选的是要分析的样品来自选自下组的组织类型：例如，来自要分析的组织的组织活检物、阴道组织、舌、胰腺、肝、脾、卵巢、肌肉、关节组织、神经组织、胃肠组织、肿瘤组织、体液、血液、血清、唾液和尿。

在一个优选实施方案中，检测原发癌。

在本发明的方法的一个实施方案中，将获得的甲基化模式用于预测对卵巢癌治疗的治疗反应。

本发明涉及探针，如位于上CpG位点的区域中的寡核苷酸。本发明的寡聚物通常用于所谓的“组”中，所述组包含SEQ ID NO.1-SEQ ID NO.91，或所述序列中的至少10个，优选20个，更优选30个，最优选超过50个序列内的每个CpG二核苷酸的至少一个寡核苷酸。本发明还涉及位于CpG位点的区域中的寡核苷酸的反向互补序列。

用于所述分析的探针是基于以下一个或多个标准定义的：(1)探针序列仅仅在人基因组中出现一次；(2)C/G核苷酸的探针密度是30％-70％；(3)杂交的解链特征和其他标准是根据Mei R et al，Proc Natl Acad SciU S A.2003 Sep 30；100(20)：11237-42。

在一个非常优选的实施方案中，本发明涉及一组寡核苷酸，其特异于SEQ ID NO.1-10和/或SEQ ID NO：50-60，或SEQ ID NO.50-60的序列。本发明的寡核苷酸可以特异于体内存在形式的序列，或它可以特异于已经进行了亚硫酸氢盐处理的序列。所述探针的长度是10-80个核苷酸，更优选的长度是15-40个核苷酸。

在本发明的寡核苷酸组的情况下，优选的是至少一个寡核苷酸与固相结合。进一步优选的是一个组的所有寡核苷酸都与固相结合。

本发明进一步涉及至少10个探针(寡核苷酸和/或PNA-寡聚物)的组，其用于检测基因组DNA的胞嘧啶甲基化状态，所述检测是通过分析所述序列或所述序列的经过处理的形式(根据SEQ ID NO.1-SEQ ID NO.91及其互补序列)。

这些探针使得能够改进卵巢细胞增殖性病症的检测、诊断、治疗和监测。

该组寡核苷酸也可以用于通过分析根据SEQ ID NO.1-SEQ ID NO.91之一的所述序列或所述序列的经过处理的形式而检测单核苷酸多态性(SNPs)。

根据本发明，优选的是通过本发明可得到的不同寡核苷酸和/或PNA-寡聚物的排列(也称作“阵列”)是以可能结合于固相的方式存在的。

这种不同寡核苷酸和/或PNA-寡聚物序列的阵列的特征可以在于它是以矩形或六边形点阵的形式排列在固相上。这种固相表面优选由硅、玻璃、聚苯乙烯、铝、钢、铁、铜、镍、银或金制成。但是，硝酸纤维素以及塑料，如可以小团形式存在的尼龙或树脂基质，是合适的替代物。

因此，本发明的进一步的主题是用于制造固定于载体材料的阵列的方法，所述阵列用于卵巢细胞增殖性病症的改进的检测、诊断、治疗和监测和/或发生卵巢细胞增殖性病症的倾向的检测。在所述方法中，本发明的至少一种寡核苷酸与固相偶联。用于制备所述阵列的方法是已知的，例如参见美国专利号5,744,305，其是通过固相化学和对光不安的保护基团的方式制备的。本发明的另外的主题涉及用于卵巢细胞增殖性病症的改进的检测、诊断、治疗和监测的DNA芯片。此外，DNA芯片使得能够检测发生卵巢细胞增殖性病症的倾向。

DNA芯片包含至少一种本发明的核酸和/或寡核苷酸。DNA芯片是已知的，例如，参见美国专利号No.5,837,832。

本发明涉及包含核酸的组合物或阵列，所述核酸的序列与SEQ ID NO.1-91的序列中的至少10个序列相同，其中所述组合物或阵列包含不超过100种不同的核酸分子。

本发明涉及包含至少5个序列的组合物或阵列，所述序列的累积p值小于0.001，优选小于0.0001。

此外，本发明的主题是试剂盒，其可以包含例如含亚硫酸氢盐的试剂、含有至少两个寡核苷酸的一组引物寡核苷酸，在每种情况下所述寡核苷酸的序列相应于或互补于SEQ ID NO.1-SEQ ID NO.91中指出的碱基序列的长度为至少15个碱基的区段。优选的是所述引物是用于SEQID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60。

实施例

样品

从挪威奥斯陆的Norwegian Radium医院获得患者样品，并且根据法律要求，获得患者知情同意书。

CPG岛

从UCSC基因组浏览器获得有注解的CpG岛。用公开的Gardiner-Garden定义(Gardiner-Garden，M.and M.Frommer(1987).″CpG islands in vertebrate genomes.″J Mol Biol 196(2)：261-82)预测这些岛，其中涉及以下标准：长度＞＝200bp，％GC＞＝50％，观察/预期CpG＞＝0.6。基因组中存在约26219个范围是200bp-2000bp的CpG岛。通过Msp I限制性断裂，可以充分覆盖这些岛。

按照以下说明，采用390K形式，通过Nimblegen Systems制备阵列。用来自人基因组构造33(hg17)的CpG岛注解来设计50聚体叠片式阵列。50聚体在岛序列坐标的任一侧移动，以便使岛均匀分布。390K形式具有367,658个可获得的特征，其不能用50聚体叠片满足所有岛。因此，我们基于大小制备了要表示的岛的截止值，仅仅测定了大小为200b-2000b的CpG岛。设计了对照探针，用于表示背景信号。以前已经描述了样品制备：表示(Lucito，R.，J.Healy，et al.(2003).″Representational oligonucleotide microarray analysis：ahigh-resolution method to detect genome copy number variation.″Genome Res 13(10)：2291-305.)，具有以下改变。使用的主要限制性内切核酸酶是MspI。消化后，连接以下接头(MspI24聚体和MSPI12聚体)。12聚体是未磷酸化的，并且不连接。连接后，通过苯酚氯仿清洗材料，沉淀，离心，并且重新悬浮。将材料分成两份，一半通过内切核酸酶McrBC消化，另一半模拟消化。每个样品对采用少至4个250μl试管，用于扩增各自具有100ul反应体积的代表物。循环条件是95℃下1分钟，72℃下3分钟，共15个循环，然后是在72℃下延伸10分钟。当完成时，合并每对的试管的内容物。通过苯酚∶氯仿萃取来清洗代表物，沉淀，重新悬浮，并且测定浓度。按照描述对DNA进行标记(Lucito，R.，J.Healy，et al.(2003).″Representationaloligonucleotide microarray analysis：a high-resolution method todetect genome copy number variation.″Genome Res 13(10)：2291-305.)，其中仅有微小改变。简言之，将2ug DNA模板置于(溶解于pH 8的TE中)0.2mL PCR管中。加入5μl随机单体(SigmaGenosys)，用dH2O补充到25μL，混合。将试管放置在100℃的Tetrad中5分钟，然后放置在冰上5分钟。在其中加入5μl NEB缓冲液2，5μL dNTPs(0.6nm dCTP，1.2nm dATP，dTTP，dGTP)，5μl来自GEHealthcare的标记(Cy3-dCTP或Cy5-dCTP)，2μl NEB Klenow片段和2μl dH2O。用于杂交和洗涤的程序按照以前的报道(Lucito，R.，J.Healy，et al.(2003).″Representational oligonucleotidemicroarray analysis：a high-resolution method to detect genomecopy number variation.″Genome Res 13(10)：2291-305)，例外是用于杂交的烤炉温度增加到50℃。用Axon GenePix 4000B扫描仪设置，以5μm的像素大小扫描阵列。用GenePix Pro 4.0软件对阵列的强度进行定量。将阵列数据输入S-PLUS中用于进一步的分析。

数据分析

在GenePix 4000B扫描仪上扫描微阵列图像，用Nimblescan软件(Nimblegen Systems Inc)提取数据。对于每种探针，计算每个实验的McrBc和对照处理样品的比值的几何平均值(GeoMeanRatio)及其相关染料交换。然后用分位数标准化方法(Bolstad，B.M.，R.A.Irizarry，et al.(2003).″A comparison of normalization methods for highdensity oligonucleotide array data based on variance and bias″Bioinformatics 19(2)：185-93)对数据集内所有样品的GeoMeanRatio进行标准化。然后，集中每个实验的标准化比值，用中位数平滑模型(median polish model)对每个MspI片段中所有探针得到一个值。然后，将集中的数据用于进一步的分析。

用方差分析鉴定最显著的岛。为了确定肿瘤和正常样品间甲基化的最一致出现的改变，我们使用了t检验方法。在进行了多测试校正后采用0.001的p值截止值(False Discovery Rate，Benjamini andHotchberg(Benjamini 1995))，我们获得了一系列916个MspI片段，其显示不同的甲基化。

监督学习：我们使用了监督机学习分类器(supervised machinelearning classifier)来鉴定区分肿瘤样品与正常样品所需的特征数目。采用留下一个的方法(leave one out method)(Lin，C.-C.C.a.C.-J.(2001).LIBSVM：a library for support vector machines)，使用了公众可得到的支持向量机(SVM)文库(LibSVM Ver 2.8)来获得分类准确性。首先用单独的训练数据之间的t检验来选择用于分类的甲基化特征。然后使用径向基函数(radial basis function，RBF)核在最前面的10、50和100个特征上训练SVM。

对于N个样品，对(N-1)个样品进行t检验，以鉴定甲基化比值具有显著差异的片段。对于卵巢数据集，此检验对18个卵巢样品进行了18次，从而在t检验计算中每个样品留下一次。然后用来自(N-1)个样品的最前面10个片段特征的甲基化比训练SVM，用来自一个未训练样品的比值进行测试。基于正好10个特征，我们能够实现94％的分类准确率。感兴趣的是，在该分析中分类为正常的两个肿瘤样品在基因表达和ROMA分析中也都是最接近于正常的。

甲基化位点的检测

在一个优选实施方案中，该方法包括以下步骤：在该方法的第一个步骤中，必须从诸如细胞系、组织或血样的来源分离基因组DNA样品。可以通过本领域技术人员标准的方式进行提取，包括使用去污剂裂解、超声处理和用玻璃珠涡旋。一旦核酸已经提取，就可以将基因组双链DNA用于分析中。

在一个优选实施方案中，可以在该方法的下一个步骤前切割DNA，这可以通过本领域技术人员的标准方式进行，特别是，但不限于限制性内切核酸酶。

在该方法的第二个步骤中，用以下方式处理基因组DNA样品，即，使在5’-位置未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或在杂交行为方面与胞嘧啶不相似的其他碱基。这在下文中理解为“预处理”。

上文描述的基因组DNA的处理优选用亚硫酸氢盐(亚硫酸盐，亚硫酸disulfite)和随后的碱水解进行，其导致未甲基化的胞嘧啶核碱基转化为尿嘧啶或在碱基vairine行为方面与胞嘧啶不相似的其他碱基。如果将亚硫酸氢盐溶液用于反应，则添加发生在未甲基化的胞嘧啶碱基。此外，必须存在变性试剂或溶剂以及自由基拦截物(radicalinterceptor)。然后，随后的碱水解导致未甲基化的胞嘧啶核碱基转化为尿嘧啶。然后将转化的DNA用于检测甲基化的胞嘧啶。

对片段进行扩增。由于统计学和实践的考虑，优选扩增10个以上具有100-2000个碱基对的长度的不同片段。可以在一个和相同的反应容器中进行几个DNA片段的扩增。通常，通过聚合酶链反应(PCR)进行扩增。本领域技术人员了解所述引物的设计。这些应该包括至少两个寡核苷酸，其序列各自与附录中指出的碱基序列(SEQ ID NO.1-SEQ IDNO.91)的长度为至少15个碱基对的片段反向互补或相同。所述引物寡核苷酸优选特征在于它们不含任何CpG二核苷酸。在该方法的一个特别优选的实施方案中，设计所述引物寡核苷酸的序列，以便仅仅选择性与目的卵巢细胞特异性DNA退火并且扩增所述DNA，从而使背景或不相关DNA的扩增最少化。在本发明的上下文中，背景DNA表示以下基因组DNA，其不具有相关组织特异性甲基化模式，在本申请中，相关组织是健康的和患病的卵巢细胞。

根据本发明，优选的是至少一个引物寡核苷酸在扩增过程中与固相结合。不同的寡核苷酸和/或PNA-寡聚物序列可以矩形或六边形点阵的形式排列在平面固相上，固相表面优选由硅、玻璃、聚苯乙烯、铝、钢、铁、铜、镍、银或金制成，也可以使用其他材料，如硝酸纤维素或塑料。通过扩增获得的片段可以携带直接或间接可检测的标记。优选的是荧光标记、放射性核素或具有可以在质谱仪中检测的典型质量的可分离分子片段形式的标记，优选的是产生的片段在质谱仪中具有单个阳性或阴性净电荷，从而具有更好的可检测性。可以通过基质辅助激光解吸电离质谱法(MALDI)或使用电喷雾质谱法(ESI)进行检测和显现。

在下一个步骤中，分析核酸扩增子，以便在处理前确定基因组DNA的甲基化状态。

可以用替代方法进行核酸的处理后分析。经过处理的核酸的甲基化状态特异性分析的一些方法是已知的，其他替代方法也将是本领域技术人员明确了解的。

采用本领域已知的方法，可以在本发明的扩增步骤中进行分析。在一个这样的实施方案中，可以使用甲基化特异性引物寡核苷酸检测包含SEQ ID NO.1-SEQ ID NO.91的核酸内预先选择的CpG位置的甲基化状态。该技术描述于美国专利号6,265,171。

序列表

<110>Philips Intellectual Property&Standards GmbH

<120>分析卵巢癌病症的方法

<130>PH009040

<160>91

<170>PatentIn version 3.4

<210>1

<211>118

<212>DNA

<213>人(Homo sapiens)

<400>1

gccctggcac cgtgagggga aagaggcgtc aggtgcctgg ctgaagcctg aaggtgaccc 60

gaaaacaagt cagagcccga gagatccacc cgcgcccgcg cgggggacca agggcccg 118

<210>2

<211>1517

<212>DNA

<213>人

<400>2

ggcctggcgc aacgctgagc agctggcgcg tcccgcgcgg ccccagttct gcgcagcttc 60

ccgaggctcc gcaccagccg cgcttctgtc cgcctgcagg tagggagcgt tgttcctccg 120

cgggtgccca cggcccagta tctctggcta gctcgctggg cactttagga cggagggtct 180

ctacaccctt tctttgggat ggagagagga gaagggaaag ggaacgcgat ggtctagggg 240

gcagtagagc caattacctg ttggggttaa taagaacagg caatgcatct ggccttcctc 300

caggcgcgat tcagttttgc tctaaaaata atttatacct ctaaaaataa ataagatagg 360

tagtatagga taggtagtca ttcttatgcg actgtgtgtt cagaatatag ctctgatgct 420

aggctggagg tctggacacg ggtccaagtc caccgccagc tgcttgctag taacatgact 480

tgtgtaagtt atcccagctg cagcatctaa gtaagtctct tcctgcgcta agcaggtcca 540

ggatccctga acggaattta tttgctctgt ccattctgag aacccaaagg agtcctaaaa 600

gaggaatgga ggagcctaag aataaaaata gtataataaa acatttctta gacacattga 660

ccttggccta tgtcaaagtt cagtctgggt ttgtcttata acacaaggag taaaagtacc 720

attgttctac ctcttttttt aatacttgaa aaaaatttac tgtggatgct tttctatgaa 780

ttaaataacc ttctaaaaaa tgttttcatt gctgcattcg attagattgg gtaactaaat 840

gaaattaatt cctcactgtt gggtataaag gttatttaca gtggttctgt cttagccatt 900

cactgaactc attgcatata tatctctgga atattgctga ttgtttcctt caagtaaact 960

tagaagtgta actacttagt caaagagcct gaatatttta aaggcctttt gaagaaaact 1020

gaaaatgctt tccagaaagg atgtatcagt tgacaatgac agtcgtcaac agtatttaag 1080

gagaactatg atactctgaa gaaaaactta gcctttctca gtaaaagtag gtaggcagag 1140

gccacatgac agcagttaga gtgtggtctt caaggaagtc acagaaatac tgtggggaat 1200

tgaaacccca tgtggaaaat gtacaagagt gtctcagtgt gactgagaag gaggttgggc 1260

atggggtttc atggagttta ataaagtttg gtcacttagt agaggtttaa taaatcaact 1320

gtcttaatct ttgatcctac ttaagaattt tttttttgtt tttgtagaga tggggctctt 1380

gttatgttgc ccaggctgtt ctcgaactcc tagcctcagg cgatcctccc tcctcaggct 1440

ccagaagtcc tgggattact ggcgggagcc accatgcagg cctcttgctc ctacttttga 1500

gaaaggaagt ttaaccg 1517

<210>3

<211>968

<212>DNA

<213>人

<400>3

ggcccaccca gggctcaagc cctgaccccc ctgggcccct gggctgcccc gccccgatag 60

gaattcattc cgtcagccca acgcagccaa tcggggcggt ccacgccagg tggactgctg 120

tgccccgcgg ggtcattagg ttaattgcag cctggacaca ccccactgag ttctaccgtt 180

ggccctccat gtacccagct tccacatctg tggattccaa aagacacaga gagaatcttc 240

ttgggagtaa aagcgaaaat aacaacaccg caagacagaa tcgtaggaag aagaaccaac 300

agaggatgac aactctttac ctggcattga cgttgtgtga ggggacttgg aaacattggt 360

agaaaagtgg gattaaggga gaaagaggaa aaaggcgtat tttactcctc aacctcggct 420

ccatcagcat caagaccctt ctggaagcag tgtcttttcc ccgccgtcta gcccatccct 480

taaagccccc agggtcctgg gaatttaact atttccatgc aatctttttt ccattgttaa 540

ctgaagaaaa ctgggtgccc cttacaggtt ttccaagaca aggaaacaaa gagaagtcag 600

caggcgccaa atcaggattg tcaggtggac gcctcacggt ttcccatggc aagtcttgcc 660

cagctgccct tgttcgaaga aaggcatgat caggaacact gtcgtggtgg agaagaagtc 720

tctggtgggg accttcttcg ctccagcttt ggctaacttt ctgaaaacgc tctgctagcg 780

agcagatgtg atcagggttt ggccctgcag aaagtcaacc agcagaatcc ctctagcatc 840

tccccccccc accccgcccc caacggtggc catgacctct gctcttgact gctcctctgc 900

agcttcgact ggagcactgc cacctcttgg tagccatggc ttcgtgcttg gtcttcagga 960

tcctgccg 968

<210>4

<211>357

<212>DNA

<213>人

<400>4

gggcacaggc aagcggacga gccagttatc cctcagagct cctgctgcct cgcccgcttt 60

ctctcggaaa cgtgaagtgt ggcctcagct gaaagtgagg tgagcgtgag tgtggacatg 120

tgtcagtgtg cgtgtgcatg ggaggagtgt gtgtgcgctt gatgacgatg atggagccca 180

gtgagccacc gtccgtggag tgtcagagcc tcctaggatg gccacgccga aggtgcggaa 240

ggaggcggct ggcccagcgt cagacgtttc cagcatccgc gggagtgaaa cggaggctgg 300

tgggtggttg tgatgtgttt ctttaagaat ggatcctgca ggttcttctt cctcccg 357

<210>5

<211>48

<212>DNA

<213>人

<400>5

gccccgcgct tggcgcccga ctcgcctcgt cccgaacaat gcatgccg 48

<210>6

<211>792

<212>DNA

<213>人

<400>6

gctccgcagc ctccgcgcag tccgctcggc tctggcactt gcgggaggtg gtgacggcta 60

gccgtcgccg cccgcgccag aacttgcgtc tcctcccccg acctgcattg gggggagggg 120

accgagggcg gagctggggg cgtggggagg gaatgtctgg gatggtctgg tattgcacag 180

ccgaggaaca ccagagttcc ttctgggaag acgggctagg gagctcagtg gtctcaggtc 240

tggtttcaga gttccgcctc tgcgtgcctc agtttaccct ttcccccttt gcccaagggg 300

gcaaggtaga gcgctgtcgg ggattgggtt tcataatccc cttccacttg acctccccgc 360

cacacccact aatcttcagg aactcaagtt ctcgcttttc ccagacgcac gcaagaaccg 420

tgcaccatct cgctcgctct ctgcccgccc gcgccttaca ccttccccgc tcggccgcag 480

aaacagaaga tccaggagcg atgctctccc actgtccctt cttcccgccc gcgcgcttcc 540

tttctcggtt cccactctga ctgggaaaca gaaaatcaac gcgcggcgcg gctgcaaagt 600

cggtttccta ttggtcagcg cctcctgggc tgagcccgcc cgccccgcct cttctcccac 660

ctaggcgggg cctccccgca gacccccgac tgcctccagc ccgcagtccc accgcctgcc 720

aggagatctt aaaggggccg cggccgcaat cagacgctga gcggcgtggg gagggggtgg 780

ctcagtgacc cg 792

<210>7

<211>955

<212>DNA

<213>人

<400>7

gcccaggctt cggctctcag cttagggaga ttctgataat acgcagagcc caaggtgtgt 60

gtagttttaa caaaaagctt cccaagcgaa tctgatacac atctaggatt aagaaacact 120

gctttaaact aagaaaggac taactgcaga agttcagcca caagtcaacc agatgtatgc 180

ccttaacatt cacatgagca gttggctaaa gtctcttata aggctatttc tatttccgag 240

gtttcagaac gggtagttat agtctgaaat acaccccaga ggacagagtc aggtccaatc 300

ttttctgtaa gacaccttgc tcaagactgc tgtgaaggaa taagagagct gcagccaaag 360

atcatcccaa agtctcccag aacactctat cattatatcc atctcacatg aaatatgggt 420

gtgtacattt tttccttcac tagattggca agtattccag cgcagggcaa atctcttttt 480

tctcccacca aggaacacaa tatcccatac ataataggtg tttgacaggt ttttttttta 540

aattgaattg aatccttacc tagctcctag ggtctgacta tatataccca taaattatac 600

atctgtttat aaaacatttc aatcacacca aagaacatat atatggaaga aagaacgata 660

aacaagcacc catggaccca cccccccgtt tatgaaacag aactttgcca gtgctttcga 720

agttccttac tgaactagat cttttaaaaa cagcaacgat tttctgaatt ttaatcagaa 780

ggcatgcatt ccttcattca ttgattcgat tccgtcatgg tcagacccgc ctaccaagtg 840

tcaacatgat atacacgatg taagtattcc actgttgggg tgaggagggt caaaagtgac 900

aatatgctat ctccagagac tacggatcgc ctttgctgca aatggtccca acccg 955

<210>8

<211>242

<212>DNA

<213>人

<400>8

gcgacccaag aagagtaagc aaactaccgt ccacccagcg gatcaggtcc aatccctgcg 60

cctcggccca atccctagag ccccgcggcg ccgtatcccc tcccccccaa ctctggaccc 120

cgccgtctgt ccccgcggca tcaccagggt gctggagttt tccgagcagg ccccttgcgc 180

taagcgagag gatctgtgag ggaaagttgg gagagccact tctggctttt gtgaagatcc 240

cg 242

<210>9

<211>264

<212>DNA

<213>人

<400>9

gaggtggggt ggggaagtgg cgctggagct cagcttcctg cttttatgct cggcggccac 60

cgtgatgcac acacactcga ggtccgccac cccgcagtgc cgtgcacccc tctgccccca 120

cctcggaatt tttgtgcccg agcgctcggg atccacggca aaaccaggca cattcctccc 180

tctgcagact caccgcctgg tttgtagaca ctggtctccg cctggggcgt caatagtttc 240

aggatttaaa gcagaaagac accg 264

<210>10

<211>248

<212>DNA

<213>人

<400>10

gcctgctcag actaggttct gcccactctg accttctaaa tggtacgtgg gaggacgtcc 60

gtccccttcg gacccaagag tcaccgtaac actctagaag gggagaaaag gagcgagggc 120

ggcaggcgac agagaacctc gcgagtcagc ggccccgcgc agaccccccc aggcacggtc 180

ccctgcggcc acgtcggctg ctcggcgcct gcgcaatctc tttctctcca gcgaaaccga 240

ggcctccg 248

<210>11

<211>62

<212>DNA

<213>人

<400>11

ggagcctagt gccatgcagc agcggcggcg gtggcggctt cccaagcgcg gcggcaaatc 60

cg 62

<210>12

<211>117

<212>DNA

<213>人

<400>12

gagggctcgg gaccagcgcg agcaccttcc ctggaagccc acatccatca cccagcgatc 60

tcctctccat cgagagcagg gcttgctgag agtggcggag gaccttgaag gctcccg 117

<210>13

<211>63

<212>DNA

<213>人

<400>13

gggactgcag tcagctattt aaacctcccg cccacctttt ctttagaccc gcgtctcacc 60

ccg 63

<210>14

<211>62

<212>DNA

<213>人

<400>14

gccgcatgag acgctcccgc ccattggccc gccgtatccg ccaccgccat tggcccgccc 60

cg 62

<210>15

<211>105

<212>DNA

<213>人

<400>15

ggccaacctg agggtacggc gctggcggtg cgggtccctg ggcgggcgcg gcgggaatag 60

cggcctcggg gagatgcggt gcgaagggac cgagagggaa gcccg 105

<210>16

<211>38

<212>DNA

<213>人

<400>16

gtgtcccccc tccctctcat aacgttcccc gcacaccg 38

<210>17

<211>441

<212>DNA

<213>人

<400>17

ggggccacgt aatgctgagt gctgattggc tgctcttggc tcctcccctc atcccgcttt 60

tggcccaaga gcgtggtgca gattcacccg cgcgaggtag gcgctctggt gcttgcggag 120

gacgcttcct tcctcagatg caccgatctt cccgatactg cctttggagc ggctagattg 180

ctagccttgg ctgctccatt ggcctgcctt gccccttacc tgccgattgc atatgaactc 240

ttcttctgtc tgtacatcgt tgtcgtcgga gtcgtcgcga tcgtcgtggc gctcgtgtga 300

tggccttcgt ccgtttagag tagtgtagtt agttaggggc caacgaagaa gaaagaagac 360

gcgattagtg cagagatgct ggaggtggtc agttactaag ctagagtaag atagcggagc 420

gaaaagagcc aaacctagcc g 441

<210>18

<211>268

<212>DNA

<213>人

<400>18

gaagtcaggc ccgagggagc tgggagggcg ttagcgaagc caggttcggt cgtgggggtg 60

gggaagtgca ggagtggcgc gcggcgtact acatgtcccg tgagcctccg cggcgggacg 120

gggcggggcc gcgggacgcc aggaggcgga ggcggagtgg agttaggtaa gagcgttacc 180

agccgtcttg tctgttgggc cgaggtcccc cttcaggggc gccctctggt gcgtcttttt 240

cactcagtgt ccttttgggg ggtccccg 268

<210>19

<211>266

<212>DNA

<213>人

<400>19

gctgggctgc ggggcggggc ctggacggcc acgtgactcg cggggcgggg ccagagtccg 60

cggagggacg ggaggcgggg cctggactgc ctcgtgacca gtggggcggg gcctgagcca 120

gctgtgtgcg gatggggcgg ggctttggag gccgcgtgac cagcggcggg tcacgtgacg 180

cggtgcctgg cgccgagcct cccaagatgg cggtgtgcat cgcggtgatt gccaaggagg 240

tgcgtacgcg cggcgtgggg cgtccg 266

<210>20

<211>39

<212>DNA

<213>人

<400>20

gtgagtgctt gccctccctg gttacctcgc cagtctccg 39

<210>21

<211>250

<212>DNA

<213>人

<400>21

gggatcagac gggaggtgga gttgcgcggg gagggcgggc gagtcgggcg cccgctctga 60

gagtcggttt cttttccccc tcttgcgtgg ggcggggtgg tgcgttccga gttcccagga 120

gttcgacgcg ggcgggtgcc gaggggaggg gagtggcggc ggcggcgggc ggctcccgct 180

tcagcctcgg cagtggcgtc ggcgacggcg gtgtcgaggc agccgccagc gttcggccaa 240

gtgtcagccg 250

<210>22

<211>156

<212>DNA

<213>人

<400>22

ggaggtggag gttgcagtga accgagatcg tgccactgta ctccagtctg ggtgacagag 60

cgagactcca tctcaaaaaa acaaaaaaaa acgaaaaaaa aaaaaaagac ggacgtaccg 120

aagaacggcg gtaactcctc cccctcgagc cgcccg 156

<210>23

<211>229

<212>DNA

<213>人

<400>23

ggagagctgc agcgccatgg ccagggacac aaacaaaagc acgcgcttcc actccgcgga 60

cagcaaccac agcggctcca acagcacttc cccgccaagc gtttcaaaag taacgacgca 120

gcacgtcgtc aggtcctttg cgcaggcgcg acgagccttt aagcccagcc ccacgcagcg 180

gggacctgcc ctttctctca gccttcctgt gatgtcgcgg gagcggccg 229

<210>24

<211>187

<212>DNA

<213>人

<400>24

gagccaacag gtgcggggtg tgggggaccc ccaggcctgg gatgggggtt ccaaaggacc 60

cgcggcgagg gatgggagga gccaagagtc tcggggggta acctgggtgc tgggagactg 120

gctcctcggc cagcgctgct ctcctctagg caggctccga gtgccctcgc tcccccgcgc 180

cttcccg 187

<210>25

<211>324

<212>DNA

<213>人

<400>25

gagcgaggcc agtgggttcc tcggtttggc ctgatcacac tggaggaggc cctgcttgcg 60

tcagtcttgg cgctagaacc cgagggcctg gagccgccag gggagacgcg gagctcggcc 120

gagacgaggt ggcttttggc acctctttac cctctggccc cagtgctgac tggggaatag 180

tcgctttgac cgtgcaaaga gcattctagg cggggtgggg gggttctgct gtgtgtgcca 240

gtgttaggta ttgcccccat tgcttttaga aatatgccct gcatggtgaa tctccgtctc 300

tactaaaata caaaaattag gccg 324

<210>26

<211>61

<212>DNA

<213>人

<400>26

gagagctgcg agccccgact ttctcgccag gctctccagt acattccgag gctccacccc 60

g 61

<210>27

<211>1124

<212>DNA

<213>人

<400>27

gtatgaggcc acccttggtg ctgtctgtaa ttatctagac atggcagcca ggatccaaca 60

gctttgcgtt ttaactcata tggtctttcc tggcgaattc cttgcccccc tctgctcccc 120

acttagcttg acttcctgtc ttttatcatc cgcaatctat caagatccta caatgtgctc 180

agtgtagggc ggaacaaatc actgttttac ctcacaattt aaggaaggca gggggctagt 240

ttttaagata aaaatctttt aacaaaacat aaactcccca aaatttccta caagccaaac 300

agcattgtca caccctcaca agctcttatt acttacacag ccaaatgact caagattact 360

aacgtttcta ttcataagga gtttgctggc ctcagatcaa cacaatcaag ccctccccca 420

ccttccttct ctctcccctg ggagactgac gtttggaact cacgccgcac caggtttttt 480

cagaatgaag acgatgtgtg ttcgctgctg gaactgtttg tcctgggatt ttataaacac 540

ctcccccact cctttttaaa gttctgtttt tgaggtgggg gaaaaggagg tcggaatctg 600

tttagccttt aaatctccca attcagaaat atattctaag aatttaatag aaaaagacca 660

agggctgtgt ctgctattta ctgcagaact gggtattcct atcagaaatc acctacatgt 720

gtcaccaaga tcagagacaa ggatgaggga aacagcatga tccctgcctt ctggagggtt 780

acagttgaag cttccgctgc ttctgcactt gacctcaaaa caaacaaaaa acccaccgca 840

aacaacaaca aaaaaatcca ggcccacctt tccccttgga tctttcactt gacagctttc 900

tcggcccaaa ataaggcacc ctacatctga atgcatccct aaggccttac cgcacccagt 960

ccaggaggca gtcctggcag ctgccctcca ccgaactccg cgctttttca cacacgctcg 1020

tggaaggaga aaaccgctca aacaactgga ctcggcccgt ttcctttcgg taacctcccc 1080

acagcccaac acgctgtccc cagacgctgc ccgctcccac cccg 1124

<210>28

<211>250

<212>DNA

<213>人

<400>28

gggagcagga aggtatgagc ctcagctgag cgaaaccctc cttgcagcca ccacggaggg 60

acggggcgcg tctccttctg aatgacgcaa ggggcggggc gcgtggtggg gcggggaagg 120

cgcgaggcgc gccgcgatcg gggactgtcc taagacgggc ggggcgcgct gcgctaggga 180

ctgtcataaa aggggcggga cgcgccgcgg tcgggatgac gtgagctggg ggcgctcgtc 240

gctgcagccg 250

<210>29

<211>56

<212>DNA

<213>人

<400>29

gaccagcaga gcaatccgaa acccagccca cgtgggttcc cagaccacca actccg 56

<210>30

<211>253

<212>DNA

<213>人

<400>30

gatgagcctg gcttcggcgc tgacgctctg gccctggggg ctgcctggct ggtgtcaggt 60

agcggaagac gcctggagag tcactcgctc cttcccccac ccgcccccac cgctgctcgt 120

gccaggacgc gcagtttgca gttgcagctc tggcactggc gcgggatggc ggagcttccc 180

ttggatggcg tcagggtcac tgagtgcaca gcctacctgg tctgagggtc tgctcctcct 240

ggacacctct ccg 253

<210>31

<211>232

<212>DNA

<213>人

<400>31

gtgcggggga acgagaccct gcgggagcat taccagtacg tggggaagtt ggcgggcagg 60

ctgaaggagg cctccgaggg cagcacgctc accaccgtgc tcttcttggt catctgcagc 120

ttcatcgtct tggagaacct gatggttttg attgccatct ggaaaaacaa taaatttcac 180

aaccgcatgt actttttcat tggcaacctg gctctctgcg acctgctggc cg 232

<210>32

<211>559

<212>DNA

<213>人

<400>32

gctgcatcca ctgggtctct ggctacaggc agagagccag tcagcagtgc ccctgcagct 60

gtttggggct gggggctccg atgatgccag agccctaggg tttacaggca cctaggcaga 120

ttcgaggatc caagtccctg ccacatgcgt ttgggtgaga ccgacctcac tgcctcagtt 180

tcctcctata cactgatgct atcaacaaaa atacccactt caggaggtgg ttgtaaagat 240

tatacaagag actgcagagc gttaggcagc acctggcaca agacaaatgc tcagtaaaag 300

accactgctg tcattaaggt caacaccagc cctgagctcc tgccctggag ctgacccagc 360

gctcacgccc aggatcagaa agggagggct ggggctgatg agctgggagg tggtgtgcgc 420

ccttctcctg cctccagctc ctctctggac ccctgtcctg gcacctcttc ggtccctggt 480

tcggtctgcc cctttcccac cgcggcccgt cttaggccag gatgtgctcc ctgccctgcg 540

gactctggag cagggcccg 559

<210>33

<211>389

<212>DNA

<213>人

<400>33

ggggcaacct agaatccacc agtggggaga gtaaggcgac tcggagaaag gcgaggggct 60

aatgcatccg ttctaataac tctgacttta actcggggct agatggggaa acactggaca 120

gttctacccc gaggtgtgac agaacttgac cttcatttta aatcggtcca tctgtttagg 180

ctagtgagaa aaaacaatat ttgaactcgg gcagtccagc tcaggagtct gtgctgtcgg 240

gattaaagaa tcagtcgaca cccccagggc tgagccccgc agcaagcgcc ccgcgggtgc 300

tggcccccag actgtggtta ccgccatcct ttcacttaaa ctccgccccg attactcccc 360

cgctccaggg ctccgcatcc actctgccg 389

<210>34

<211>45

<212>DNA

<213>人

<400>34

ggctgggggt ggggaaggga ggccgccaca gctcccgccc cgccg 45

<210>35

<211>67

<212>DNA

<213>人

<400>35

ggggattcgc gctgggctcc gagagcccgc agaaccagcg tcgtgtcctg ggcgagctgg 60

gaggccg 67

<210>36

<211>3776

<212>DNA

<213>人

<400>36

ggagttacac tcgaagtaga gaaacggaaa ccccattata ttagctacct tttcggcagt 60

gcaccaaccc tctaccgcct gccatacagc cttgaagaaa gggcaggtca ccttccccca 120

cctgtcccca cctctccttt cctccttgtc tttacccaca gcttcaccaa ggccctgaga 180

tgcttccgcg gtgtggttaa aacctggctc tattctctga ctgtccttcc ccaggagtgg 240

ttctctccca gctgctctcc cctcccaggg tctccttcct actcccactg gccaaggcag 300

ggcatacccc caatacaccc ctcaccccac atctcagaaa tactccttta tctattttct 360

cattcaagag agctagaatt ttaaacagta aattccttgt gaaatgctgc aattactcct 420

tttaaatgaa agatctagaa gaaattggaa tctcctttct acagtgaggg atgcagacaa 480

aagaaaacaa ggaacttaag ggaggattgg ccagatggaa gtcgggggaa ctttgctggg 540

atctgtagag ggcagaacca gcctggctgc ctcaccaccc tcgccatccc tcccgagtgt 600

gtggcacatc actgtatcct agcgtttgcc atgttggact gtcctggttt actgccgtgt 660

atcttccaca ttggaccacg agctgcttga gggtagggtc atatcacctt tgtcttttta 720

ttcccagtat ttcaaatgtg gctgacacac agagagctct gaatacagac acacgcagag 780

caaaatgcct aacacgattg agcattcgta ccaggccctg ttctaagagc tttagaccca 840

ataagtcatt tacttcccac accaacctta caagttaata ctacattaat attccaactt 900

cataaatgtg taactgaagc acagaggggt ttaggaactt gcaccaagtc acagagcttg 960

aaggatccat ggcttgaacc caggcaggct gactccaatc ttagctttaa tgaatgaatg 1020

aataaaagaa caaacaatac aacaaatgag tgtgtcttgc ttttggccaa ggggtttatt 1080

taaaattatc atttcagaaa tctttctgcc cagtgatctg actttgtttc aaattgggac 1140

tttttttttt ttcttagcta acccacctta aaatcataag tcagttttcc tctctcaact 1200

tactggagac atttctgatt aatcaagtac gttcatgcat ttcctcagaa tggtgaactc 1260

atcattagtc cgtccctatt taactttttc cacctgccct cagctgggcc aaccccgagc 1320

tcctcaacca cagtcagtcc tttctccttc cctccctccc tccctcccct tcctccttcc 1380

ctccccttcc tccctccctc cccttcttcc ttctctccct tctctccccc atccctccct 1440

cccttcctcc cttcttcagc cacatcttgc tccacccccc tatacatacc tgcggcatca 1500

gccttaaggg atcctttgcc actttctctt cagagctgca ttttaacatg tgcaacatta 1560

tttggatggt ccccttagca tgtgtggccc acttgctatt tgcttttcat ccagacctag 1620

ctcaagtatc cctttctctc tctgtctctc tgtctgtctc tctctctgtc tctctctgaa 1680

gcttcctcta gccccaacag atgaagtgct ccctctgggt gctctgggag catcgtgttc 1740

ctacttctgc tgtagtgctt atctcagatg gaattgaatt ttacggttag tgtgtgtccc 1800

tcccaattaa actttaaact ccttgaagga aggcatattt cttgctccta tctgtctctg 1860

ctgacatggc aaagagacct ggcacaaagt aaagacacaa tagatacttg ttttattgca 1920

tttgcctgtg aacatatgat ggattgaaca cagttttacc agttcacctt aaaaatgact 1980

acttaaggct gcttatgcat ggcacaaaga cacaacatgc atcaaatcct agcagagagt 2040

acattttcct ggtccttcaa gtataagaaa accttgctat ttttgcctgc gtatggtttt 2100

aataggattg ataaaacaga agagagatgg ttccctaaat cagtttgagg tattcaattc 2160

agtttagcag ctcaaaaggc tgacatttgc cttatttgaa ggttggacag ctctgcagct 2220

atttatctgc tttattgcaa tgggagtgat gactgcatag gcaagctgag aagctggcat 2280

tggggaaatt gccagaaaac ttcatatagt gtaaaatatc atatagtgta aaatgatcag 2340

aaaagtgata tacaaatgct gcatgaacaa ataattatgt aaactatgta agtcagagaa 2400

actaaaatct taaagtcaga ggctttttgg ataattaaat tgttttaacc cacccacaaa 2460

cctactgcag gaatgattct attccaaaga aatggttaat agtaagacca gaaggggaaa 2520

aaagaacacc agggagaact aaagtcaatc caaatccaag cacaagctgc tgttgacatg 2580

ttacacataa aaaggcttgc tctggggctt gcaggtcctt cttagcagag cggtgagaaa 2640

acttaatgtc cactgtgggt ggcacattgt ggtgtcactg gcagttgagc tgtttggtat 2700

cattgccatg gcattactat gcattcctct gcaaactgca tctcgctggc ttttctccaa 2760

gccaaataaa acacaaaatg ggtcaggctt agtgagactg aaatgttgcc tcctttccct 2820

ctgccttgtc ctcagctagc tttaaggcaa gcatcacatt ggattcaaag accagctgat 2880

gctctttcag tatgattact tatgctgtga ttgacaatgt ggaggaaata gcgtatatgg 2940

ccaacgatag ggcattgact aagtaggtca ttattcagcc aaacaaaggt acagtatgct 3000

gtgattttaa aatgatgccg tagattacta aattacatga aaatatactt gtaagaatat 3060

tatgtgacaa agaagcatgc tataaaagtg tagtcactgt tgaatcctat tgtataaaat 3120

gtgtgtaagt gtatacacaa aaaaactctg aaagagtaca cactttagtg ctaagagtac 3180

ttatctctgc agatctttat ttttgtcttt tttggaaatc tcgcttgctt ttatgataaa 3240

tttgcaaggt tactctttta agtgttactt tatcattaca ggaaagaata gagagaataa 3300

attctcttcc cctgggaata aatttaagag ttttcaaaga gaattacagc ctatgtaata 3360

tccagcgata tttggactcg aatagaaagt tctgaatcaa agagttgcgt agaatatcaa 3420

gggatgatct aacagccatc ctcttgcctg ggatacccac agccccattt actcaggctg 3480

tgggctcact gagaaggaga caacattggc cactgtttta ctttcttctc tgttaaagct 3540

gccttggtcc ttctgtctcc tctgatagta tcgagtcatt cagatgtatt tgctttagtt 3600

gattgccatg ctttcaaaca ggttccataa gctacacatc cacttttaag actaaattga 3660

gcttcattga atgtccttaa tgaccacaac taattcctag cccaaaggag ggaagctgca 3720

gccaactccc tcaatcctca agaacaacaa tgccgataga acccctgtgt gatccg 3776

<210>37

<211>237

<212>DNA

<213>人

<400>37

gagtgaggcg gcgcaggccg cgcgggaggg cctctgcctg ctgcagcgca gggcgggcgg 60

gggcgggggg gcgcttaccg tgagcggagc ggatcggcct gactggagcc ctgaggagga 120

ggagaaagag gaggaggaaa aggaggagca cgaaaaacta cactgcggcg acggcggcgg 180

ctcccattgc ggagctggca gccgagccgt ggaaaggggg gggctctcgt gcagccg 237

<210>38

<211>100

<212>DNA

<213>人

<400>38

ggcctagctt tggggcgcag gcgcgctggc cgccgcggcg gggggtcggc cgccagtgac 60

gtcaggacgc cgtgcgggtt ccgtccccca acaagccccg 100

<210>39

<211>334

<212>DNA

<213>人

<400>39

gggcgggtag gggtgggtca tgttccttgg cttgggggca gttacaaggg tacagtgggg 60

cttgttgaag ggcaaaagtt ctgtaagttc gtcccgacag gccaaagaaa ccccagagcc 120

gtctttcgac tgactacagc ctggaagaga ggccaagacc actccctgcc tctattgctc 180

catttctgag ttggtctcac tttccacccc actgacggcg cgctgcgtga ggggcggggc 240

atagagggag gggaggggct atgcgaaaga aggcggggag agtggggtgg ggccgctcct 300

tggaacggaa gcgcgcggcc tcgaggccct tccg 334

<210>40

<211>33

<212>DNA

<213>人

<400>40

gtgtcctaaa agatgagggg cggggcgcgg ccg 33

<210>41

<211>254

<212>DNA

<213>人

<400>41

gatgccatct gcggctgctg aaggaggcgc ctccagaaaa gatgccgagt gttgcaagct 60

gtcgatgcag ccaagagccg aagaggcatc ttgccgattg gggagggagc ggcgcttacg 120

tgtttattgg cttaactctc ccgtgtccgc ggcgtaaagg gctgctgcag agggctggag 180

gggggagagc gcggagcgtc ctcagagcct cagtacttct gaccccaata ccttgccacc 240

ctcctcccct gccg 254

<210>42

<211>46

<212>DNA

<213>人

<400>42

gggggcgagg ccgttccccg cccgttccca gggcccgccc aggccg 46

<210>43

<211>286

<212>DNA

<213>人

<400>43

gaggcaggag gatggggagg aggcggccag gtctgcggca caaattaggc cattaattcc 60

tgcctgctcc tagagaaggc aaagtttctg tcctggaata cgtttccaaa gacacagctt 120

ctggaagggg aagggaaagg atggagaggc tgcgcggtgc tgatttcacc cgacaggcaa 180

tgctcgcgtt ccttggagtg ggaggggtcg gggcgatgag aaacctctgg gggatcgggg 240

caggtggaca cgcgcgctcg gagctgtcca aggcctggtc tccccg 286

<210>44

<211>57

<212>DNA

<213>人

<400>44

ggggcgagcg gctgtgcgcg gggccaaggg cgggggcagc aggtgagtgc gcggccg 57

<210>45

<211>964

<212>DNA

<213>人

<400>45

gcccactgat ggagttataa aggtgaagaa ctagtctagt gaagaatgca gactgagagt 60

aaacagacaa atacaatgtg actgagctgt attgttaaat acaagaaagg actatcagga 120

agactttttg gaaaaagaag catctacact gagaccataa aaattagtag gagtcagtca 180

aataaatgtg ggaggaggag aaagggatta ttccaggtaa agaaaacaag ttcaaggctt 240

gagaggtaaa aggtggcttg gtgtggtgga aaaggtgaaa gaaatttgcg actggagagc 300

aagaaatatg gtcgagaagg actaaaaaaa agtagacagg gagagcccag atgctgaagg 360

gtctagaaaa cctcagtatg gttttggagc tttgccctga aagcaataga atgcctttga 420

attgtctgaa gcagatggta acttgatcag gtctgctttt tgcaaagtgg agaatgcttt 480

ggaaggaagc aagtgtgcac gcagcgggac ccattagact aatgtataaa tcctgcctgg 540

aggtcatcac tggacagggg aggtggggga ggcggtgaag ataaacaaaa ggggataaat 600

ttgaaatatc ctgttttaaa aggaggtaga atccacagaa cttggcaatg gattggatgt 660

gagaagtgag aggaatcagt gatgactgcc agctttctga cctgaacgag tggatgaagg 720

gaagccgagt tttgggggga aagagaaaca tataatacca acatttaaaa cataataaga 780

ctaagaggct gaaggaaagg gtagaacctt caatctgagc cgagcggggc cgacagcgct 840

gggcagcatc ccacgccttt ttctccgcga ggcccacgca accagccaac taaagcgaag 900

aaccacgtga gggagacccc actgcgcacc aggcgcgagc cctgcgcatg cccgttgggt 960

cccg 964

<210>46

<211>252

<212>DNA

<213>人

<400>46

gaggtggcgg gtgggagagg gaatgagcag ggatgcaggg taggccctga gttgctgggg 60

gctcagcatg gccgctgcgc acattgcatc attttgtcga cactggtgtg ggtgaaatct 120

tccaaaagaa attaaaacag aaaaaaaaaa aaagaagggt ctgggactta gcagaaacaa 180

gccacaatct ccagattcta ctattcctgg gccacgtgag gagcgcccac ccgtctggcg 240

ctgcgttccc cg 252

<210>47

<211>300

<212>DNA

<213>人

<400>47

ggcggacccg agcaaatcag caagcctgct cctccacggg gatgggggac ggcggggggg 60

aggaaaagga gagtgtgtct gtgtgtgtga gtgtgtgtgt atgtgtgtgc gtgcgcgcgt 120

gtgtgttgcg cgcgcgcgcg cgcgaacagg gagagaggga gagggggaga gagaagagga 180

cagggagagc gcagagagga aaactgcaga aaaccacagg gaaagtacgg taccgcctca 240

gatcttttca tttaaaaaaa aaaaaaaact tacttctagt tcattttccc atcactcccg 300

<210>48

<211>118

<212>DNA

<213>人

<400>48

ggtggggtga ggagaggagg ggctggggga gggggagaga ggcggggtga ggggagcggc 60

gaggacggga cggagggaga gggggcgaga gagatggaag gagagcgagg agccaccg 118

<210>49

<211>50

<212>DNA

<213>人

<400>49

ggcgggcccc aggctgcagg ggcggtggcg gcgctgagct gggcgggccg 50

<210>50

<211>45

<212>DNA

<213>人

<400>50

gactcggcgg gcatcgccct ctacagccgt gagtacgggg ccccg 45

<210>51

<211>1340

<212>DNA

<213>人

<400>51

gtagctttca aaacgacaaa ctaggcaaac tatacatctc caccactcca attttgtcag 60

aatgctaatg agcttgctct gatctttact cggcttcccg tgttttctac atcttcaagg 120

accacatggc gctagcaaaa taaagacaac taaatgagaa tttcgaatgc tttttgtgtt 180

aggacctggt gcttttcagt ggacgcactc gttgaatatt ctcaacttaa aagagtacaa 240

cagggggttg ggtatgaact ttttaacagg aggaaatttg aacaaaagta aattagtgag 300

atgaggaaaa tatgagaaaa atttctgatt aatttccact ccataatatc aatgacacct 360

tcagccccac tcatactctt ctaacaagag atgctgataa aagatgaatg attctgtgtt 420

gttcacagtg aatgtttagt ggttttttaa tagcagcatt ctacataaaa ggcaccagga 480

agtactccgc attagcagtt gagatcacta gttaatagga tgatgtcttt tagcttttgt 540

cacaagatta ttagaaagga tgggtttctg ttctcatcat tgcatagttt ggagtgcctg 600

ttgagtacaa gtgctaaaat acaggtttct cagtattgtt tcacatgtaa agcaaaaagc 660

cttttaatgc aacacctttt tcctttttac caggtgattt tgttattgat ctctaatctg 720

cccctttagc tgtattaaat gcttaaagtg ttctgctttt ccatgtagcc ttgatgctag 780

ctatttgtgt ctataaattc attaacatta aaacaggatc tatatagact attagagtct 840

atgagttaga aaatggcata ttacatactt gtttagggca taaataacaa cataaattta 900

agattatctg cataaatgtt ataaaaatat gttcgttgat aatatgttat gagattttaa 960

ttatgtattt ataaggaaca tatttttcac aatctctctt ttctttagca atcactgtac 1020

acttaccagg agaataagag tagtcaactc catttcttac catatccatc catacctaga 1080

aagaagaaaa aaccaaaact gggtacattt ttatatataa agatatttga acacggctgg 1140

gcacaggctc acgcctgtaa tcccagtact ttgggaggcc gaagcaggtg gatcacctga 1200

ggtcgggagt tcaagaccag cctgaccaac atggagaaac cccgtctcta ctaaagatac 1260

aaaaattagc cgagtgtggt ggcgcatgcc tgtaatccca gctactcggg aggctgaggc 1320

aggagaatcg cttgagcccg 1340

<210>52

<211>282

<212>DNA

<213>人

<400>52

gagcttgcca agagtctatt ccagcctaca ccgctaggaa gccaacttca gcgagctcaa 60

tgaggggacc aaactggggc tcgctttcca aacgctccgc tccaaaatct gactctctct 120

ccagccccga tctcagtgtg agccgaacct cagaaaagac gctttttaag ggcgacacag 180

ggttggcttt acagcggggc caagaagact acctgggggt accgccacct cggacaaatc 240

cgttggctct gtccaaggtg ctgaatggac tcctatcgcc cg 282

<210>53

<211>46

<212>DNA

<213>人

<400>53

gcgccctcct tcccgcccag gccttccgcg ggcacctcag gccccg 46

<210>54

<211>720

<212>DNA

<213>人

<400>54

ggctccagtt tctttatgcc tgattgcctg ctactcgagt cgtgcccatt ttcctctctc 60

ctggcccaaa cttcctgcgc ctacagccgc cttcaggcac ttgtgtgagt ctctgtttaa 120

gagatcagcc aggaggtgga acctcacagg acttctgtgg tcaagaaact gtgtgagcgt 180

gttctcacac ataggaagaa agcaatgtat gtcatagatc cccaaaagga tgaatgcagg 240

aagagggaag gaacaaagga aggaaagaaa ggcagaaagg aggaagaaaa aaaaagtaat 300

taaaaagaat gacgtgagga ttgtttgagc ccaggagttg gagatcagcc tgggcagcac 360

tagggagaac tcgtccctac aaaaaattta aaaaattagc tgggtgtggt ggtgcgcacc 420

tgtagtccca gctactcggg aggctgaggc gggaggatgg ggaggatcgc ttgagcccag 480

gagttggaag ctgcagtgag ctatgattgc accactgcac tccagtcggg gagaaagaat 540

gagaccctgt cacaaacaaa caaaaaagca aaaagaatga cggaaggtta ggaaagaagc 600

agagcaacga agcagaggcg cccagcggcg gactggccag ggactgagcg ccgtgcacca 660

cagagccctc ctcgcccact tcccgcggcg agggtggcgt tgctcccact tacccgaccg 720

<210>55

<211>231

<212>DNA

<213>人

<400>55

ggaggcggtg gccgagagcc tgctcctgga gctggaggag gtgacccccg ccgaagacgg 60

cgtctatgcc tgcctggccg agaatgccta tggccaggac aaccgcaccg tggggctcag 120

tgtcatgtgt gagtggccca ctctgtgcgt ccacacgccc acctgcagcc gagagataaa 180

gggaaagggg cctcatccag ggcgagcatg ggctgggtcc cgaggggacc g 231

<210>56

<211>84

<212>DNA

<213>人

<400>56

gccccgctga gccagcgcaa ctgtctgagg tggaagccca cacggaccac agctccagga 60

agccgagcaa gaaacgaatc gccg 84

<210>57

<211>466

<212>DNA

<213>人

<400>57

ggtggcgtcc aaaacacaca gggaccttct ggaggtaaat ctgcagaatg gcattttgtt 60

tgtgaattct cggatcgatc gcgaggagct gtgccagtgg agcgcggagt gcagcatcca 120

cctggagttg atcgccgaca ggccgctgca ggttttccat gtggaggtga aggtgaaaga 180

cattaacgat aatccacccg tcttcagggg cagagaacaa ataatattta ttcctgaatc 240

tagactcctg aattcgcgtt ttccgataga aggagctgct gatgcagaca ttggtgctaa 300

cgctcttcta acgtacacgc tcagcccgag tgattatttc tctttggatg tagaggcaag 360

tgatgaactg agtaaatctc tttggcttga attgagaaaa tatttggata gagaagaaac 420

accagaactt cacttattac tgactgccac tgatgggggc aaaccg 466

<210>58

<211>331

<212>DNA

<213>人

<400>58

gaagccaggg ctcccagcgt ctagtcaggg gcgcagaaac cctcgttcct ccaaaccccc 60

gccacaggga ccactccaga agaaacccat tcgtgatttg ggtccctttg tgtttgagta 120

ttgtggggag tgggctatct agactctaag gactccaagc taacgatgac ctgtgtgggc 180

cttgctctga acagaaaact caaactcagc gtgggttccc gcgtcttccc caaaaggcca 240

aggcccaaag aacccttttc atttggcgag gggcttgagg aagggagggg ctggggcggg 300

agagggtcgg ggtctgcaag ccagcggccc g 331

<210>59

<211>282

<212>DNA

<213>人

<400>59

ggtggtgagc gagggcggca agcccaaggt gcgcgtatgc taccgcgggg aggacaagac 60

gttctacccc gaggagatct cgtccatggt gctgagcaag atgaaggaga cggccgaggc 120

gtacctgggc cagcccgtga agcacgcagt gatcaccgtg cccgcctatt tcaatgactc 180

gcagcgccag gccaccaagg acgcgggggc catcgcgggg ctcaacgtgt tgcggatcat 240

caatgagccc acggcagctg ccatcgccta tgggctggac cg 282

<210>60

<211>99

<212>DNA

<213>人

<400>60

ggttcccgca gccaccccga agacccccag gcagccgccc agcaccagca gtagcagcgc 60

tgggctgcag gagggcaggt ggcgggggct gccccgccg 99

<210>61

<211>229

<212>DNA

<213>人

<400>61

gggccactga cctcgaagct tatgatggtc gtggtgtgtt ttttgcccgc ggcccagacc 60

gcttcctggg ctctctccag ccgccctcct ggtctcccct gggaccgttc cgaggtgtgg 120

ttccctggcg cccgccgttg ctcccgtagt ttgggttctg tcgctcccag caggtctcgc 180

ttatgccgcc caccccgtgc cctgctcttg cttgctctgc caccccccg 229

<210>62

<211>59

<212>DNA

<213>人

<400>62

gagggcgcgc ggcgatggcg gcggcgggca ggcggcgggc gcggcgggcg aggggtccg 59

<210>63

<211>275

<212>DNA

<213>人

<400>63

gcctatcctc cctgcaggaa gtgcgagcgc accacgtgcc atgacttcct ggagtgccag 60

aactcgccag cgcgcatcac gcactaccag ctcaacttcc agacgggcct cctggtgcct 120

gcgcatatct tccgcattgg ccccgcgcca gccttcacgg gggacaccat cgccctgaac 180

atcatcaagg gcaatgagga gggctacttt ggcacgcgca ggctcaatgc ctacacgggt 240

gtggtctacc tgcagcgggc cgtgctggag ccccg 275

<210>64

<211>305

<212>DNA

<213>人

<400>64

gtgcccgact cagggagtga tgtcgagaca cacacatcac caggaagagc ccaggggtgc 60

acagtgcccc tcaaggcact aaccgtagag gcgtgagtag catagggctt gtgcacaccc 120

aggcatcggg tgtcgagctc aaggcgaggg agtgtgccag cggcacaggt cagggaagtt 180

tgtgaaggag accaggtggg agccactcac agaaatcagt aacatgaaaa ccacagccac 240

aaaaccacca ctgtcactca acgcccatca tcacgggcag gacagttcta catcatctcc 300

ctccg 305

<210>65

<211>1173

<212>DNA

<213>人

<400>65

ggtggctcag cccagctcct gcctaggaaa gccttagtgt tgggagggac cctgatgact 60

gaggagcctg gtagctccag gtcgcccaca ctttcaggtc tcttgcacca gaaggtggca 120

ggatccattg ggaggaaaca ggccaccttg gaaggtgtcc ctgggccccc atccccaggg 180

attgaggccg tagggggccc gctctgctgc gttgaccaga ctcctgggct ttgaaggctc 240

ctgggcccag taagaaggag gtgggtgcca aggttgagga ggaagcatcc gagtatgtgt 300

aggaggagga cagggtgtga ccatagactg ccaaaagctg caggtggatc gggggaccct 360

gggggctcag gatccagcaa ggggcggcag gagtaaagga ggaaggaatg acaggtgcaa 420

ataccttccc accaaagccc tttatgccct ctggctcctc cccagagttg tccccactct 480

cagtcggtca cccactcctt gaacttgaga tcggtgtcgg tggtgctaaa gccatcatca 540

gcaatgacat catcaccccc tcctcctcat ggatgaccgt gtgctcctcg tcactcgcta 600

tgacctcgct ggccatgtgc tgggaatgag cagctcacgt gggcggcagc agggctgccc 660

acgggtcacc tccctcacca ggggctgcaa agtggcctgg agctccatgc tgagtagaag 720

gctttgggcc agagtatgat gcagtgccag acaccacctg tgtcagttcc cgtagtgcct 780

gacggtctat ttccctgccg tccaggctgt gtaccccgct gtgggagaag gcttgggcca 840

ggctgagcca ggttccctga ctgtgtgcag ccgttctgcc ccacagaagc tgctccttgg 900

tatccgagct ctggagtgtt tgggctgcaa ctgacaggag ttcagaggac accccagggg 960

cagtggcagt gcccgtctct gatatgctcc gctcccacga gcccttgtta cactcctgct 1020

agcccctggc ttgtgggctt ggcctctgag ctggacttct ttcggtcctt gttgcaagtg 1080

ggccaccttc acctggaagg ccaggtcgta tttctgcatc tcattgggcc ccagggtgta 1140

ccaccgctcg ctcagcatct ggctgacggt ccg 1173

<210>66

<211>400

<212>DNA

<213>人

<400>66

gaaaacaaaa ggctgaagac agaaaaagaa gacatttact attccacttc ttccttttac 60

atcagtgaga gaaagggcct tgggagaaag atggcacaga gagaaacaaa agaaagaaag 120

aaagaaaacc aaaaatctct gctttctcaa aaatccctgg tctgcctatc taggctggga 180

gagaccccga gggcagcctg tctctcctgc agcctttgca gtcagcgaca ggcatcatga 240

aattaatttg aaataaacaa tgacaaagca ggaagctcaa cgggtccctg agttgctttg 300

ggcccccact cctccccgaa gcccctgggc tgtttaacaa agccgtgggt ccgcctaccc 360

caagcacttt ttgtgacgtc acagctccga ggaccatccg 400

<210>67

<211>256

<212>DNA

<213>人

<400>67

ggggccgaga gggcgggagg gcgtagtggc ggcccgtcgg ggcggctgag gcgggcagcc 60

gaagcagtgg ctctcggagg gggaacaaag agcagcgact aaggcggcag aggagcggcg 120

gcggtggcgg cgctgcagca gcgggcggga ctggtatggt ggttccacag ggcagacccc 180

gctgcactca cagggaggag gaggcggcag cggcggagga aggcggcgca ccccgagagg 240

tgagcgaggc aggccg 256

<210>68

<211>477

<212>DNA

<213>人

<400>68

gaaccaatct cagcctccct tccactagtc attagtctcc cccgctgcag gtagagtgac 60

aggcaggctc aggagctcct gaaaaggcct ttgttttatc gccttcagtt cagatgcttc 120

agagcactag caggccatat tttaatctca ggtctttgca aacaaaatcg ttaaaagcag 180

atggctgtga agactgccat gaatattaat agatattgaa aaaaaggccc cttaatcttt 240

ccataaatct ttctgaggag gtgggggaag acttggagat gagggctgca gtgtagttgc 300

aggtaccctg gcccttccta tctgggcttg atcctaataa ctgaggaatt agcacaaaga 360

taggtggttc cagcccagag ttgggcactg agatgggcct ggagaagcag tcttgggctt 420

gccatctcct gtcttccttt ctccttcccc tgcagagctg ggctgggtga ggacccg 477

<210>69

<211>193

<212>DNA

<213>人

<400>69

ggccctgggg cagcacagct tcccgattcc cacgtgcctc tgcgtctcgg cgccacgggt 60

gactttcggt ccagatgcca gcaaagacat ctctctgtct accaggcaac cacctccatc 120

ctcacctcct cacgggcaga ctctaactac ctccgctctc tccacaaatg ccagtgcgag 180

cgcagcctcg ccg 193

<210>70

<211>2008

<212>DNA

<213>人

<400>70

gcccgtgata atcgtgcctg cagcagcttt tcactggcta caggattcag cccttaggct 60

gaagccacgc ttggctccga agtttccact gcacaggacc agggctacca tctgacaaac 120

tgcaaggcaa gagaaaacac gtgtcctccc tgggattggg tctgggggaa ccttcatgcc 180

tcagaggaga agaacgtcac aagtagttta ggacacaggt ggcagtgacg aagctcttgg 240

ggacatggat ggtgctggca gaactcaagg gggatagagg tggtgctggc agaggtcaca 300

gggacaaaga tggcactggc agagttcata ggggacagag gtggagttgg cagagttcat 360

gagggacaga ggtggcgctg gaagagttca cgggggacag aggtggcgct ggcagagttc 420

acgggggaca gaggtggcac tggcagagtt cacgggggac agaggtggca ctggcagagc 480

tcatggggga cagaggtggc gttggcagag cccatggggg acagaggtgg cgctggcaga 540

ggtcatgggg gacagaggtg gcgctggcag aggtcatggg ggacagaggt ggcgctggca 600

gaggtcatgg gggacagagg tggcgctggc agagctcata ggggacagag gtggcgctgg 660

cagagctcat gggggtcaga ggtggcgttg gcagaggtca cggggggcag aggtggcact 720

ggcagaggtc acgggggaca gaggtggcac tggcagaggt cacgggggac agaggtggca 780

ctggcagagg tcacggggga cagaggtggc gctggcagag cccatggggg acagaggtga 840

tgttggcaga gttcatgggg gacaggtggc gttggcagag cccacggggg acagaggtgg 900

cgctggcaga gctcacgggg gacagaggtg gcgctggcag agctcacggg ggacagaggt 960

ggcgctggca gagctcacgg gggacagagg tggcgctggc agagctcacg ggggacagag 1020

gtggcgctgg cagagctcac gggggacaga ggtggcgctg gcagagttca cgggggacag 1080

aggtggcgct ggcagagttc acgggggaca gaggtggcgc tggcagagtt catgggggac 1140

agaggtggcg gtggcagagt taatggggga cagaggtggt gttggcagaa ctcatggggg 1200

acagaggtgg cactggcaga gttcataggg gacagaggtg gcgttggcag aactcggggg 1260

acagaggtgt cattggcaga ggtcataggg gacagaggtg gcgttggcag agttcacggg 1320

ggacagaggt ggcattggca gaactcatga gggacagagg tggcgctggc agagttcatg 1380

agggacagag gtggcgctgg cagcgttcac gggggacaga ggtggcgttg gcagcgttca 1440

cgggggacag aggtggcgtt ggcagcattc acgggggaca gaggtggcat tggcagaact 1500

catgagggac agaggtggcg ctggcagaac tcatgaggga cagaggtggt gttagtagag 1560

ctcatgaggg acagaggtgg cgttggcagc gttcatgggg gacagaggtg gcgttggcag 1620

cattcatggg gggcagaggt ggcggtggcc gagttcatga gggacagagg tggcgttgac 1680

agagctcctg ggggacagag gtggcactgg caaagcacat gaggacaaag gtggtgctgg 1740

tagatttcac tgaggacaaa ggtggcacta gcagagctca caggtacaga ggtggtattg 1800

acagctccca aggacagagg tggtgctggc agcgctcaca agggacacat gtggtgctgg 1860

caggtttcat tgaagacaaa gatggcattg gcagggctca caggacagag gtggcgttga 1920

tggagctcct gagggcagag gaggtgctgg cagagctcat gggggatgga gggtgctggc 1980

agagctcacg ggagacagtt gtgacccg 2008

<210>71

<211>160

<212>DNA

<213>人

<400>71

gactctcctt ccatctcgcg tcctcagcgt ccgttgggct ccactttaaa aataaaaaaa 60

tcaaactaac taaaacgaag gtgggacccc ccaggctccc cttcttccct ggcctctgga 120

aaatccagct gggaggacgc aggggcgggg gcagatcccg 160

<210>72

<211>64

<212>DNA

<213>人

<400>72

gtgcgcgcgc agcccgcgag gcggggccgt gtcagtgagg cctactccca gctttttcct 60

cccg 64

<210>73

<211>2061

<212>DNA

<213>人

<400>73

ggccagaggc tgtggagact cggatcctga ggcaaaagga agccgagtca gggacgcgct 60

tccttcccca gggctcgtcc ccagcgccac ccgcccttct ctagagcccc atccccagcg 120

cgaacctcca ggaggaagca gcagtcacca cgcggggaca gaagggggag agctcgagcc 180

agggcccagc gattggagtc cgcggaacgc agggacatga agtccagcag agaaaactaa 240

aaactggcaa cacttccatg gataaaaatt cagcctctcc ctctacaata gcaacaaacc 300

ccaaaccagg aaacagagac ccctgtaaat aacccaccaa gataaattcc acaccctcca 360

ccagtgtttc aggctacagg gtgggatatg cggggaggtg gcggagaccc atcttgaatc 420

agaaattcaa ggactaagtg caaaactgga ccctaatggg gtgggtctag agcattgaag 480

aaagtgcatt agtgcttggc tagggctggc aggtggctgt tagatgaggt gcgcccctgg 540

gtgcaggaag tgttttttgg gggatgacaa cttcctaaca ttagatggta gtggtgactg 600

gtgattgtac agccctataa atttgctaaa aaaaaattga attgcacatt ttaataggtg 660

aattgtatgg catgtgaatt atacctcaat aaagctttta tataaaattg gatcgattta 720

actaaaaaaa gaaattttaa gaagagacaa aattggttgg gtgtggtggc tcatgccttt 780

aatctcagca ctttggaagg ctgaggtcgg gggggtggat tgcttgagcc caggagttcg 840

agaccagcct gggcaacatg tcgaaaccag tctctaccaa aaataggaaa aaagtagctg 900

ggcatggttg tgtgcacctg tagtctcagc tactcaggag gctgaggtac aaggattgct 960

tgaacctggg aggcagaggt tgtagtgagt gagccactgc actccagcct caggaacaga 1020

gtgagaccct gtctcaaaaa aaaaaaaaaa aaaaaggaac aaaatatatg aaaaatgaag 1080

actaaattac aaaatcctta agagaaaatg attttaatta aaaatttaat aagggacact 1140

gaagaaagga aaatagaaat tatataatga aagaagtgaa aagggttaga aagactaaga 1200

aaatctaacc aacatagaat tggagttttt aaaacacaaa aaacaataga catagctagt 1260

atttaaaacg gacgcctaca ggtgcgtccc acgggggatg gggacacgga cgcctgcagg 1320

tgcaccccca cggggggacg gggacacgga cgcctgcagg tgcaccccac ggggaggacg 1380

gagacatgga tgcctgcagg tgcaccccca cggggaggac ggggacacgg acgcctacag 1440

gtgcaccccc acggggggga cggggacaca gacgcctgca ggtgcacccc cacgggggga 1500

cggggacacg gacgcctgca ggtgcacccc cacggggggg acggggacac ggacgcctgc 1560

aggtgcaccc ccacgggggg atggggacac ggacgcctgc aggtgcaccc cacggggagg 1620

acggggacac ggacgcctgc aggtgcaccc ccacgggggg gacggtgaca cggacgcctg 1680

caggtgcacc cccacgggag gacggggaca cggacgcctg caggtgcacc cccacaggag 1740

aacggggaca tggatgcctg aacgtgcact cccacaggga ggacggggac atggacacct 1800

gcaggtgcac acccacaggg aggacgggga catggacgcc tgcaggtgca cccccatggg 1860

gaggacgggg acacggatgc ctgcaggtgc acccccatgg ggaggacggg gacacagaca 1920

cctgcaggtg cactcccacg ggggggatgg ggacacagac gcctgcaggt gcactcccac 1980

gggggggacg gggacatgga cgcctgcagg tgcaccccca tgggggggac ggggacacag 2040

acgcctgcag gtgcaccccc g 2061

<210>74

<211>135

<212>DNA

<213>人

<400>74

ggaacgggcg gggcggggcg gggcgcgaag ggggcggtgc cgcgagcggg gggcggtggc 60

ggcggcggcg gtggcggccg aggaggagaa catggcggcc gcggagagcg gctgaaatgc 120

ctgttcttca ggccg 135

<210>75

<211>267

<212>DNA

<213>人

<400>75

gctgcaaggc ggggctggag tggaacagga ccccgctgag cagcttggag gagtctggca 60

ggaagaagat cgccccgaag cagagcgtga tgaaggcgct gaataccagc agcagcacga 120

acttctccgt caggcggagg gcggcggggc ccgacccctt cctgccaccg ccgccgccga 180

gccccccgcc caggacgccg cccgcggggc tgctgaagag cggcaacagg ccccccacgg 240

gcatcgctcc cgctgtccag tggtccg 267

<210>76

<211>239

<212>DNA

<213>人

<400>76

gctgtagcag aggctttact gcccccacgc cctccccagc tctgccctgg tcagtagcat 60

ttgcggtaca cgatataggg accctgttcc tcgtactgct cccgcaggac ccagcaggac 120

tggaaggcgc gcagggaggc caggatggag cccccgatcc atacggagaa attcctggtg 180

ggctgggcag ccaccaccac gtgggtctcg gctggcagag cgcgcagcag ctctgcccg 239

<210>77

<211>706

<212>DNA

<213>人

<400>77

ggaagagccc agagccatca gtgtgccagt ccaggactca gctcaggaag agtcaggttc 60

agcccgccag gaagggtttt cagtaagtta tggaaaaaga taaatcccac acgtgtgaca 120

agagttagga ctgcatacaa atgaaaaaag ccaaacttca ctttttccac ttttatctga 180

aatgtcgcta cactgaaact tccacagaga cccacgggga cgtgtggcct gtcacaccgt 240

cggctgtatt ggatcaggat tatttcttat gaaggtctgc tttgccagta cgcagcaggt 300

cccagtctct acgccgtccc gaacacctcg tagaaatacg gggcatgcac aacgttgtac 360

ctgctccaat ctaagcagca atccagccct tttggattgc ctctacccaa acctagaaca 420

aagatggcca ggaaaagacc agggacgctc tttattaagg gaagatgcac atataatgaa 480

agataatatc caaacctctg cacgccaaca cgtgcagacg caggcacaag tcctatcata 540

ttgaaggtcg caactcactg ggaagccctt tccccagagt taaagcggga gctaaaagtc 600

cgcttatgca acaacagtcc aattactcgg acaccccgag caaaactctc cagcggaagg 660

ggcagcgggg tctggggcgc caactccctc cctgcaactc ccgccg 706

<210>78

<211>59

<212>DNA

<213>人

<400>78

gggtagctgc ggccaaggcg cccgcggctt cgggggcata gcgtaggggc ccgcctccg 59

<210>79

<211>327

<212>DNA

<213>人

<400>79

ggctgcagct gcttgttaac cctcagagcg ccacggcgcg agggaagggc acgccaacca 60

ggagaggggg cgagggagat gcggtccgcc tgcagtcacc tctgcacctc agagatttcg 120

ggaagtttga gtgcaggaaa gcagcgctcc gaggccaggc ctggggtgct ggccgctgcg 180

gggggcacgc cctgcgctgc tcaggggcct gtggtttcgg agagcacccc gatccagtcc 240

cccatcgcct ctctggcagg cgttgggact tggagtgagc tggcagcctg caagtgggtg 300

gataagagcc agggcagggc agggccg 327

<210>80

<211>107

<212>DNA

<213>人

<400>80

gctgggggcg cgggagcggc gggcgcggcg ggctggaggg cgggcaccgc gaagggaggg 60

cgccccactt ccccgcaccg cccgccaggc ccgccgagca ctgaccg 107

<210>81

<211>661

<212>DNA

<213>人

<400>81

gtcctggtgg aggcgcagct gtactaccac tggcaggcct tgcagatcct agacgagctg 60

gcagcgaagc tcaagcgcag gatgcggaaa tcttcctcac atcaaatatt tgaaaacaaa 120

ctagaaactg tccaaccgca tttctactgc gcccgcccgc agatgcagtt ttctccgcac 180

gtgcgcgcct tctctccttc ccgccctcag ggtccacggc caccatggcg tatcaggggc 240

agcagtacct gtggcagcat tggcctttgc agcggcggca gcagcaccag gctctgcagc 300

ggcacccccc agcggcttaa gccatggcgc ttctcagggc attcagcagc agcgttgctg 360

taaccgacaa agacaccttc gaattaagca cattcctcga ttccagcaaa gcaccgcaac 420

atgaccgaaa tgagcttcct gagcagcgag gtattggtgg gggacttgat gtcccccttc 480

gaccagtcgg gtttgggggc tgaagaaagc ctaggtctct tagataacta cctggaggtg 540

gccaagcact tcaaacctca tgggttctcc agggacaagg ctaaggcggg cttctccgaa 600

tggctggctg tggatgggtt aggcagtccc tccaataaca gcaaggagga tgccttctcc 660

g 661

<210>82

<211>253

<212>DNA

<213>人

<400>82

gagaggtgtc caggaggagc agaccctcag accaggtagg ctgtgcactc ggtgaccctg 60

acgccatcca agggaagctc cgccatcccg cgccagtgcc tgagctgcaa ctgcaaactg 120

cgcgtcctgg cacgagcagc ggtgggggcg ggtgggggaa ggagcgagtg actctccagg 180

cgtcttccgc tacctgacac cagccaggca gcccccaggg ccagagcgtc agcgccgaag 240

ccaggctcat ccg 253

<210>83

<211>242

<212>DNA

<213>人

<400>83

gaaagaggga ggcgcggggc cgcgcttggg gcctgccgct gcacgccagc ctgggcaaag 60

agctgccacc ttctgcgggc gaagcgggtc gggacgcagg acggcagcgg ggctggaggc 120

agctacgtgg gtccacaccc ccatgccctg caaggctcct tggccctgct tctcctctgt 180

ctcggcggga gaggagcagc ctcggtttta cagaatttca gggtcgcgtc tccagcgccc 240

cg 242

<210>84

<211>81

<212>DNA

<213>人

<400>84

ggtggcgtcc aagggccgcg gggaccttct ggaggtaaat ctgcagaatg gcattttgtt 60

tgtgaattct cggatcgacc g 81

<210>85

<211>317

<212>DNA

<213>人

<400>85

gaaggacgag ggctgcaaag gtgttttctg gagggaaacg tggagtaagg aggaagcctg 60

gaattttagc atcttcccag cgcacacggc ggctttattg gtgtgccagg gatgtctcta 120

gtctgaataa aaagggatgc tttctggctc accctgtgcc aggatagagg gaagcgtgtt 180

ctgagccagg catggggccc catctgctcc ctggcagccc ccagccgcgg cgtccgcctt 240

ccctggagcc cgtccccagc cgctcacctc aggtgcagct ccagctgcgt gtagaggaag 300

tgcaggaacg cccgccg 317

<210>86

<211>290

<212>DNA

<213>人

<400>86

ggaaacagtt caggacgctc aagaccagaa gcgggagcaa acccaaaagg agctccaagg 60

aggtgtgtgt ggggagagcc agggggacgc aggactaggc tctttcctgc gcaaggggtg 120

gggaaacccg cgaaagccag ggagtcgcgc gcactcacgc cctcccgcca ccagggcaga 180

gccaccgctg caaggagccc acgggtgcgc gctccgctcc agggcggatc tttccacacc 240

cccctcaccc tcaaaagctc aggctggagc ggtcatcagt gcggactccg 290

<210>87

<211>79

<212>DNA

<213>人

<400>87

gcggctgcgg cggccgagag gtcctgcttc ccccaggggc tggccatacc cgcggccttc 60

agcttggcct tcttggccg 79

<210>88

<211>395

<212>DNA

<213>人

<400>88

gcaaatccgc gcagcgcatc gcgcccagtc tcggagactg caaccaccgc caaggagtac 60

gcgcggcagg aaacttctgc ggcccaattt cttccccagc tttggcatct ccgaaggcac 120

gtacccgccc tcggcacaag ctctctcgtc ttccacttcg acctcgaggt ggagaaagag 180

gctggcaagg gctgtgcgcg tcgctggtgt ggggagggca gcaggctgcc cctccccgct 240

tctgcagcga gttttcccag ccaggaaaag ggagggagct gtttcaggaa tttcagtgcc 300

ttcacctagc gactgacaca agtcgtgtgt ataggaaggc gtctggctgt ttcgggactc 360

accagagagc atcgccaacc agaacggccc acccg 395

<210>89

<211>357

<212>DNA

<213>人

<400>89

ggcgggtgtg ggatcatcta cccaccctgc ggctccttcc cgctcgcagt gaaggaagga 60

cgctcagacc aacaggggct caggtattct gggtgtcagg acccttcctc ctgcacgcat 120

cttacgcagg gtggggctga gggcgtgagg gcacaagtca ttgaggacat ggagggaacc 180

cacgctcgtc ccgatagatt gtcacggtcc tgaggcggga cggtcaggac agggaagatg 240

tatttcttcc ccctgcatcc cctcccgcac cgcgtctgaa ctcctctggg agcgcaagaa 300

cagtaacaat gctgcgcccc ttcccccacc ctttgactcc gctcgcaacc tagcccg 357

<210>90

<211>72

<212>DNA

<213>人

<400>90

gtttcccgaa cctgggcggc cgtcgggcag ccccctcgtc cgaccatggc gactgacagt 60

gagtgcgctc cg 72

<210>91

<211>55

<212>DNA

<213>人

<400>91

ggcctctggg atttgggggt cacgcccgac ctctgggatt tgggggtcac gcccg 55

Claims

1.用于分析卵巢癌病症的方法，包括确定选自SEQ ID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的基因组甲基化状态。

2.权利要求1的方法，其中所述分析是检测受试者中的卵巢癌，并且其中进行以下步骤：

a.提供来自要分析的受试者的样品

b.确定选自SEQ ID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60的序列中一个或多个CpG二核苷酸的甲基化状态。

3.权利要求1或2的方法，其中额外进行以下步骤：

a.将来自甲基化状态测试的一个或多个结果输入获自诊断多变量模型的分类器，

b.计算样品来自正常组织或卵巢癌组织的可能性，和/或，

c.计算预测中的置信度的关联p-值。

4.权利要求1-3的方法，其中确定SEQ ID NO.1-10和/或SEQ ID NO.50-SEQ ID NO.60的序列中的至少4个序列的甲基化状态。

5.权利要求1-4的方法，其中额外地确定SEQ ID NO.11-49和/或61-91的一个或多个序列的甲基化状态。

6.权利要求1-5的方法，其中确定SEQ ID.NO.1-91中至少20个序列的甲基化状态。

7.权利要求1-6的方法，其中确定SEQ ID NO.1-SEQ ID NO.10和SEQ ID NO.50-SEQ ID NO.60的序列的甲基化状态。

8.权利要求1-7的方法，其中通过选自下组的一种或多种方法确定甲基化状态：

a.亚硫酸氢盐测序

b.焦磷酸测序

c.甲基化敏感性单链构象分析(MS-SSCA)

d.高分辨率解链分析(HRM)

e.甲基化敏感性单核苷酸引物延伸(MS-SnuPE)

f.碱基特异性切割/MALDI-TOF

g.甲基化特异性PCR(MSP)

h.基于微阵列的方法，和

i.msp I切割。

9.权利要求1-8的任一项的方法，其中要分析的样品来自选自下组的组织类型：例如，来自要分析的组织的组织活检物、阴道组织、舌、胰腺、肝、脾、卵巢、肌肉、关节组织、神经组织、胃肠组织、肿瘤组织、体液、血液、血清、唾液和尿。

10.权利要求2-9的方法，其中检测原发癌。

11.权利要求1-10的方法，其中将获得的甲基化模式用于预测对卵巢癌治疗的治疗反应。

12.包含核酸的组合物或阵列，所述核酸的序列与SEQ ID NO.1-91的序列中的至少10个序列相同，其中所述组合物或阵列包含不超过100种不同的核酸分子。

13.权利要求12的组合物或阵列，包含至少5个序列，所述序列的累积p值小于0.001，优选小于0.0001。