CN101044247A

CN101044247A - 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法

Info

Publication number: CN101044247A
Application number: CNA03824456XA
Authority: CN
Inventors: J·E·莫纳汉; X·赵; Y·陈; K·格拉特; S·卡马特卡
Original assignee: THOUSAND YEARS MEDICAMENTS Inc
Current assignee: THOUSAND YEARS MEDICAMENTS Inc; Millennium Pharmaceuticals Inc
Priority date: 2002-08-20
Filing date: 2003-08-20
Publication date: 2007-09-26
Anticipated expiration: 2023-08-20
Also published as: JP2006514823A; ATE519862T1; AU2003265556A1; EP2311978A1; JP2011036247A; AU2003265556A8; EP1565581A2; US20080286781A1; EP2311979A1; US7361511B2; WO2004018999A2; US20120264625A1; EP1565581A4; WO2004018999A3; EP1565581B1; EP2311980A1; KR20050058407A; CN102220423A; CA2496272A1; EP2314716A1

Abstract

本发明涉及与子宫颈癌包括癌变前状态如发育异常相关的核酸分子和蛋白。也提供了用于检测，鉴定，预防和治疗人子宫颈癌的组合物，试剂盒及方法。

Description

用于鉴定，评估，预防和治疗子宫颈癌的组合物，试剂盒及方法

相关申请

本申请要求2002年8月20日递交的美国临时专利申请系列号60/404,770的优先权，其明确地并入作为参考。

发明领域

本发明的领域是子宫颈癌，包括子宫颈癌的诊断、鉴定、处理和治疗。

发明背景

在美国以及甚至在世界范围内报告的癌症病例增加的数量都备受关注。当前对于特定类型癌症仅有少数几种治疗方法有效，并且无法提供绝对成功的保证。为使疗效最好，这些治疗方法不仅需要对恶性肿瘤早期检测，还需要对恶性肿瘤的严重程度进行可靠的评估。

子宫颈癌是妇女最常见的恶性肿瘤之一，并且在世界范围内仍然是一个重要的公众健康问题。仅在美国，扩散性子宫颈癌大约占所有妇产科癌症的19％。在1996年，估计有14,700个新诊断的病例和4900人因该疾病死亡(American Cancer Society，Cancer Facts & Figures1996，Atlanta，Ga.：American Cancer Society，1996)。在许多发展中国家，大规模普查计划无法广泛进行，临床问题更为严重。在世界范围内，新病例数量估计达471,000，且四年生存率仅有40％(Munoz等.，1989，Epidemiology of CervicalCancer In：“HumanPapillomavirus”，New York，Oxford Press，pp 9-39；National Institutesof Health，Consensus Development Conference Statement on CervicalCancer，Apr.1-3，1996)。

鉴于如此，当及早检测到扩散前病变时，子宫颈癌仍然是一种可以很好预防的癌症类型。当前，脱落细胞染色的(Papanicolaou-stained)子宫颈涂片(也称为巴氏涂片或巴氏试验)的细胞学检查是用于检测子宫颈癌的主要方法，并且是迄今为止所发展的最具性价比的癌症筛选试验方法(Greenberg，M.D等.，1995，Clin Obstet Gynecol38(3)：600-609)。引人注目的是因为该方法的提出，在美国及世界上许多其它国家中子宫颈癌的发病率和死亡率减少了超过70％。(EddyD.M.，1990，Ann.Intern.Med.113(3)：214-226)。Bethesda系统描绘了巴氏试验的异常形态改变，该系统包括ASCUS(未确定意义的非典型鳞状细胞)、AGUS(未确定意义的非典型腺细胞)、LSIL(低度鳞状上皮内病变)、HSIL(高度鳞状上皮内病变)和鳞状细胞癌及腺癌(National Cancer Institute Workshop：The 1988 Bethesda Systemfor reporting cervical/vaginal cytologic diagnosis.JAMA，262(7)：931-934)。巴氏试验的成就最主要归因于对癌前病变的诊断和治疗。

当前，对具有HSIL和更重疾病患者的处理是相对标准化的。大多数具有上述病变的妇女经历了阴道镜检查和合适定向的活组织检查。如果组织学诊断确诊，可进行消融或切除治疗如环形电切术(LEEP)、冷冻手术或锥形切除术。然而，对于不确定或低度细胞学结果(ASCUS和LSIL)的处理争论很大。主要是因为基于形态学检验的特性，其不可避免地导致观测者之间的差异性以及巴氏试验与后续的组织学结果的不一致。据报道初步巴氏试验的平均灵敏度大约为58％，重复试验的准确度仅有约66％(Fahey M.T.，等.，1995，Am.J.Epidemiol.141：680-689)。低灵敏度和不佳的再现性使得对ASCUS和LSIL患者的处理复杂化。如果在妇女初步诊断为ASCUS和LSIL后推荐使用“加速重复巴氏试验”，患者将冒延误诊为潜在的高度病变的危险。但是，如果这些患者普遍地使用阴道镜检查，大多数妇女可结束治疗。在阴道镜检查中只有5-10％具有ASCUS的妇女具有高度病变，且超过80％的LSIL将消退为正常或继续保持它们目前的状态(Cox，J.T.，2000，Clinics in Laboratory Medicine.20(2)：303-343，Ostor A.G.，1993，Int.J.Gynecol.Pathol.12(2)186-192)。

AGUS代表了较ASCUS或LSIL更大的危险，因为对于该情形细胞学检查灵敏度低且疾病进展更快(Anderson M.C.，1995，BaillieresClin.Obstet.Gynecol.9：105)。发现9-54％具有AGUS的妇女经活组织检查证实具有子宫颈上皮内瘤样变，0-8％的妇女经活组织检查证实患有原位腺癌(AIS)，以及小于1-9％的妇女患有扩散性癌(Wright，T.C.，等.，2002，JAMA，287(16)：2120-2129)。由于此巨大危险，所有具有AGUS的患者应使用阴道镜检查(Wright，T.C.，等，2002)。

通过使用测定发育异常细胞的存在和严重程度的客观标记物可减少子宫颈细胞学检查的主观性。因为高危人乳头状病毒(HPV)感染与子宫颈癌的发展密切相关(Walboomers，J.M.，等.，1999，J.Pathol.189：12-19)，所以使用类似于Hybrid Capture II(Digene Diagnostics，Silver Spring，MD)或PCR的HPV测试方法似乎提供了一种客观量度(Wick，M.J.，2000，Clinics in Laboratory Medicine，20(2)：271-287)。但是，因为特别是在年轻妇女中大多数HPV感染和所产生的鳞状上皮内病变可自发消退，HPV检测无法特异地鉴定其病变持续或发展为扩散性癌的患者(Sasieni，P.D.，2000，J.Am.Med.Womens Assoc.55(4)：216-219，Sasieni，P.D.，2000，Br.J.Cancer，83(5)：561-565)。在ASCUS-LSIL治疗类选法研究(Triage Study)(ALTS)的报道中，对于高危HPV类型，83％具有LSIL的妇女巴氏试验结果是阳性，该水平太高以至无法在治疗类选法中使用(Humanpapillomavirus testing for triage of women with cytologic evidence oflow-grade squamous intraepithelial lesions：baseline data from arandomized trial.The Atypical Squamous Cells of UndeterminedSignificance/Low-Grade Squamous Intraepithelial Lesions Triage Study(ALTS)Group，2000，J.Natl.Cancer Ist.92：397-402)。虽然对于检测具有ASCUS的妇女中HSIL的巴氏试验结果，使用HPV检测的治疗类选法明显改善了灵敏度，但是特异性与使用常规细胞学检查相当(Solomon，D.，等.，2001，J.Natl.Cancer Inst.93(4)：293-299)。在巴氏试验中，更理想的子宫颈筛选标记可鉴定所有的子宫颈癌，大多数HSIL以及在具有LSIL和ASCUS的患者中小百分比的真正的初期癌。

现在通常认为子宫颈致癌作用以一种分步方式发生(Ried，T.，等.，1999，Genes Chromosomes Cancer，25(3)：195-204)。正常的上皮细胞转变为瘤前病变和扩散性癌是相继发生的。形态学上定义的发育异常和恶性畸形步骤是肿瘤遗传过程中细胞基因改变的反映。因此，需要提供用于鉴定、评估、预防和治疗子宫颈癌的生物标记物。

发明简述

本发明涉及癌标记物(在下文中“标记物”或“本发明的标记物”)，其列于表1中。本发明提供了编码或相应于标记物的核酸和蛋白(在下文中分别为“标记物核酸”的“标记物蛋白”)。表1提供了标记物核酸和蛋白序列的序列号，列于附带的序列表中(SEQ ID NOs：1-44)。表2列出了新鉴定的核苷酸和氨基酸序列。表3列出了新鉴定的核苷酸序列。表1-3提供了一些所述标记物核酸和蛋白序列的序列号，列于附带的序列表中，和标记物的基因名称。本发明进一步提供了与所述蛋白和/或该蛋白片段特异结合的抗体、抗体衍生物和抗体片段。

本发明也涉及用于诊断、疾病分期、预测、监测和治疗子宫颈癌的各种方法、试剂和试剂盒。在本文中使用的“子宫颈癌”包括癌(如，原位癌、扩散性癌、转移癌)和癌前状态(如，发育异常，包括CIN或SIL)。在一个实施方案中，本发明提供了一种评估是否患者患子宫颈癌或对于发展为子宫颈癌具有较正常更高的危险的诊断方法，包含步骤如下：比较患者样本中本发明标记物的表达水平和对照，如来自不患子宫颈癌的患者中所述标记物的正常表达水平。与正常水平比较，患者样本中所述标记物的表达水平明显提高表明所述患者患子宫颈癌或对于发展为子宫颈癌具有较正常更高的危险。

根据本发明的内容，所述标记物选自根据本发明方法的阳性预测值为至少约10％，优选约25％，更优选约50％以及最优选约90％的标记物。在至少约20％，更优选约50％以及最优选约75％的任一如下状态中：病期0子宫颈癌患者，病期I子宫颈癌患者，病期II子宫颈癌患者，病期III子宫颈癌患者，病期IV子宫颈癌患者，I级子宫颈癌患者，II级子宫颈癌患者，III级子宫颈癌患者，鳞状上皮细胞(表皮样的)子宫颈癌患者，子宫颈腺癌患者，子宫颈腺鳞癌患者，小细胞子宫颈癌患者，恶性子宫颈癌患者，原发性子宫颈瘤患者，原发性恶性子宫颈淋巴瘤患者和继发性恶性子宫颈淋巴瘤患者，以及所有与子宫颈相关的其它类型癌、恶性肿瘤和转化，也优选用于本发明方法的标记物与正常子宫颈细胞相比具有至少两倍的差异表达。

在一个实施方案中，本发明提供了一种评估是否患者患子宫颈癌的诊断方法(如，新的检测(“筛选”)，复发的检测，反射测定)，所述方法包含比较：

a)患者样本中本发明标记物的表达水平，和

b)对照的非子宫颈癌样本中所述标记物的正常表达水平。

与正常水平比较，患者样本中标记物明显更高的表达水平表明该患者患子宫颈癌。

在另一个实施方案中，本发明提供了一种评估是否患者患子宫颈癌的诊断方法(如，新的检测(“筛选”)，复发的检测，反射测定)，所述方法包含比较：

a)患者样本中本发明的标记物组的表达水平，和

b)对照的非子宫颈癌样本中所述标记物组的正常表达水平。

与正常水平比较，患者样本中标记物组明显更高的表达水平表明该患者患子宫颈癌。

本发明也提供了用于评估用于抑制患者子宫颈癌的治疗的有效性的诊断方法。所述方法包含比较：

a)在提供给患者至少部分治疗前获得自该患者的第一样本中本发明标记物的表达，和

b)在提供部分治疗后获得自该患者的第二样本中所述标记物的表达。

相对于第一样本，第二样本中标记物明显更低的表达水平表明所述用于抑制患者子宫颈癌的疗法是有效的。

可以理解的是在这些方法中，所述“疗法”可以是任何用于治疗子宫颈癌的疗法包括，但不限于，化学疗法、放射疗法、肿瘤组织的外科手术切除、基因治疗和生物学疗法如给予抗体及化学增活素。因此，本发明的方法可用于评估治疗前、治疗中和治疗后的患者，例如，用于评估肿瘤负荷的减轻。

在一个优选实施方案中，所述诊断方法用于指导使用化学或生物试剂的治疗。这些方法包含比较：

a)获得自患者并保持在存在化学或生物试剂条件下的第一样本中本发明标记物的表达，和

b)获得自患者并保持在不存在所述试剂条件下的第二样本中所述标记物的表达。

相对于第一样本，第二样本中标记物明显更低的表达水平表明所述试剂能有效用于抑制患者子宫颈癌。在一个实施方案中，所述第一和第二样本可以是获得自患者一次抽样样本的部分或是获得自患者混合样本的部分。

本发明另外提供了一种用于评估患者子宫颈癌进展的监测方法，所述方法包含：

a)在第一时间点检测患者样本中本发明标记物的表达；

b)在随后的时间点按时重复步骤a)；和

c)比较步骤a)和b)中检测到的表达水平，以及由此监测患者中子宫颈癌的进展。

较在第一时间点样本中标记物的表达水平，在随后时间点样本中标记物明显更高的表达水平表明子宫颈癌有进展，但是明显更低的表达水平则表明子宫颈癌有退化。

本发明进一步提供了一种用于确定是否子宫颈癌有转移或在未来可能转移的诊断方法，所述方法包含比较：

a)患者样本中本发明标记物的表达水平，和

b)对照样本中所述标记物体的正常表达水平(或非转移水平)。

与正常水平(或非转移水平)比较，患者样本中明显更高的表达水平表明子宫颈癌有转移或在未来可能转移。

此外，本发明提供了一种用于选择用于抑制患者子宫颈癌的组合物的测试方法。所述方法包含如下步骤：

a)从患者处获得包含癌细胞的样本；

b)将所述样本的等分试样分别保持在存在多种测试组合物的条件下；

c)比较每个等分试样中本发明标记物的表达；和

d)相对于在存在其它测试组合物条件下的所述标记物表达水平，选择一种能明显减低含有所述测试组合物的等分试样中所述标记物表达水平的测试组合物。

另外，本发明提供了一种评估化合物子宫颈致癌作用潜力的测试方法。所述方法包含如下步骤：

a)将子宫颈细胞的等分试样分别保持在存在和不存在所述化合物的条件下；和

b)比较每一个等分试样中本发明标记物的表达。

相对于在不存在所述化合物的条件下所保持的等分试样，在存在所述化合物的条件下所保持的等分试样中所述标记物明显更高的表达水平表明所述化合物具有子宫颈致癌潜力。

另外，本发明进一步提供了一种抑制患者子宫颈癌的方法。所述方法包含如下步骤：

a)从患者处获得包含癌细胞的样本；

b)将所述样本的等分试样分别保持在存在多种组合物的条件下；

c)比较每个等分试样中本发明标记物的表达；和

d)相对于在存在其它组合物的条件下所述标记物的表达水平，给予患者至少一种能明显减低在含有所述组合物的等分试样中所述标记物表达水平的组合物。

在前述方法中，所述样本或患者样本包含获得自患者的细胞。所述细胞可在收集的子宫颈涂片中发现，例如，通过子宫颈刷收集。在另一个实施方案中，所述样本是体液。所述液体包括，例如，血液、淋巴液、腹水、妇科分泌液、尿液和通过阴道冲洗收集的液体。在更进一步实施方案中，所述患者样本是体内样本。

根据本发明内容，可评估样本中本发明标记物的表达水平，例如，通过检测样本中如下物质的存在：

·相应的标记物蛋白(如，具有在表1中列为“SEQ ID NO(AAs)”序列之一的蛋白)，或所述蛋白片段(如，通过使用一种试剂，如一种抗体、抗体衍生物、抗体片段或单链抗体，其与所述蛋白或蛋白片段特异性结合)

·相应的标记物核酸(如，具有在表1中列为“SEQ ID NO(nts)”的核酸序列之一的核苷酸转录产物，或其互补物)，或所述核酸片段(如，通过将获得自样本的转录的多核苷酸与其上附着有一或多个核酸的底物接触，所述核酸具有SEQ ID NO(nts)任一核酸序列的全部或片段，或其互补物)

·一种代谢物，其直接(即，催化)或间接产生自相应的标记物蛋白。

根据本发明内容，通过使用多种(如，2、3、5或10或更多)子宫颈癌标记物，包括本领域已知的子宫颈癌标记物，执行任一前述方法。在所述方法中，将样本中多种标记物的每一种标记物的表达水平与获得自对照的不患子宫颈癌的人样本中同类型多种标记物的每一种标记物的正常表达水平比较，多种标记物中至少一种标记物是本发明的标记物。相对于标记物的相应正常或对照水平，样本中一或多种本发明标记物或它们某些组合的表达水平明显改变(即，在上述使用单标记物的方法中所规定的增加或减少)，表明患者患子宫颈癌。对于所有前述方法，优选那些所述方法的阳性预测值为至少约10％的标记物。

在另一方面，本发明提供了一种抗体、抗体衍生物或抗体片段，其与标记物蛋白(如，具有列于序列表中氨基酸序列之一的蛋白)或所述蛋白片段特异性结合。本发明也提供了用于制造上述抗体、抗体衍生物和抗体片段的方法。上述方法可包含用含有标记物蛋白(如，具有列于序列表中氨基酸序列之一的蛋白)的全部，或具有10或更多个氨基酸的片段免疫哺乳动物，其中所述蛋白或肽可获得自细胞或通过化学合成获得。本发明的方法也包含生产单克隆和单链抗体，其中可进一步包含从免疫的哺乳动物中分离脾细胞，将分离的脾细胞与无限增殖化细胞系融合以形成杂交瘤，以及筛选那些能产生特异性结合标记物蛋白或所述蛋白片段的抗体的特殊杂交瘤。

在另一方面，本发明涉及各种诊断和化验试剂盒。在一个实施方案中，本发明提供一种用于评估是否患者患子宫颈癌的试剂盒。所述试剂盒包含一种用于评估本发明标记物表达的试剂。在另一个实施方案中，本发明提供了一种用于评估用于抑制患者子宫颈癌的化学或生物试剂适用性的试剂盒。所述试剂盒包含一种用于评估本发明标记物表达的试剂，和可还包含一或多种上述试剂。在更进一步实施方案中，本发明提供了用于评估子宫颈癌细胞存在或治疗子宫颈癌的试剂盒。所述试剂盒包含一种抗体、抗体衍生物或抗体片段，其特异性结合标记物蛋白或所述蛋白片段。所述试剂盒也可包含多种抗体、抗体衍生物或抗体片段，其中所述多种所述抗体试剂特异性结合标记物蛋白或所述蛋白片段。

在另外一个实施方案中，本发明也提供了一种用于评估子宫颈癌细胞存在的试剂盒，其中所述试剂盒包含一种核酸探针，其特异性结合标记物核酸或所述核酸片段。所述试剂盒也可包含多种探针，其中每个探针特异性结合标记物核酸或所述核酸片段。

在另一方面，本发明涉及用于治疗患子宫颈癌或处于发展为子宫颈癌危险的患者的方法。上述方法可包含减少本发明标记物表达和/或干扰其生物学功能。在一个实施方案中，所述方法包含提供给患者一种标记物核酸或其片段的反义寡核苷酸或互补多核苷酸。例如，通过载体递送提供给患者一种反义多核苷酸，所述载体表达标记物核酸或其片段的反义多核苷酸。在另一个实施方案中，所述方法包含提供给患者一种抗体、抗体衍生物或抗体片段，其特异性结合标记物蛋白或所述蛋白片段。在一个优选实施方案中，所述抗体、抗体衍生物或抗体片段特异性结合具有列于序列表中氨基酸序列之一的蛋白或所述蛋白片段。

可以理解的是本发明的方法和试剂盒也可包括已知的癌标记物，包括已知的子宫颈癌标记物。可更进一步理解所述方法和试剂盒可用于鉴定除子宫颈癌之外的其它癌症。

附图简要说明

图1描述了子宫颈组织样本的簇状图表。通过34个正常、LSIL、HSIL和子宫颈癌组织样本转录分布图的分级群聚创建了树状图。每一个样本标记物具有其组织类型和标识码。图1中缩写定义如下：N_ecto：正常子宫颈阴道部；N_endo：正常子宫颈内膜；LSIL：低度鳞状上皮内病变；HSIL：高度鳞状上皮内病变；T_scc：鳞状细胞癌；T_aca：腺癌。虚线将34个样本划分为两大组：对照组和疾病组。实心圆表示错误的簇样本。

图2描述了在正常、发育异常和子宫颈癌组织中通过cDNA微阵列杂交得到的MCM6和Claudin 1转录分布图(TP)。每个数据点代表两次微阵列杂交的平均值。通过对阵列上所有点取中值强度归一化TP强度。图2中缩写定义如下：Endo：正常子宫颈内膜组织；Ecto：正常子宫颈阴道部组织；LSIL：低度鳞状上皮内病变；HSIL：高度鳞状上皮内病变；SCC：鳞状细胞癌；ACA：腺癌。

发明详述

本发明涉及新发现的列于表1的与子宫颈细胞癌状态相关的癌标记物。已经发现这些标记物任一或这些标记物组合表达水平高于它们正常表达水平，就与患者中子宫颈癌包括癌前状态如发育异常的存在相关。提供了用于检测样本中子宫颈癌存在、样本中子宫颈癌不存在、子宫颈癌病期和与在患者中预防、诊断、鉴定和治疗子宫颈癌相关的子宫颈癌其它特性的方法。也提供了治疗子宫颈癌的方法。

表1列出了本发明的标记物，相对于正常(即非癌)子宫颈细胞和包含列于表2-13中的标记物，它们在子宫颈癌细胞中过表达。表1提供了核苷酸转录产物的cDNA序列和其编码的或相应于每一个标记的蛋白的氨基酸序列的序列表标识，也提供了蛋白编码序列在cDNA序列中的位置。表2列出了新鉴定的核苷酸和氨基酸序列。表3列出了新鉴定的核苷酸序列。表4通过转录分布试验和在SCC、ACA和HSIL中它们的标记物得分鉴定了所选择的本发明标记物。表5通过原位杂交鉴定了在子宫颈癌中过表达的本发明标记物并指出了标记物表达的位置。表6使用子宫颈组织微阵列鉴定了本发明标记物和它们表达频率。表7鉴定了基因特异性引物。表8列出了组织栏的末端PCR溴化乙锭琼脂糖凝胶图片中范围在0-5的得分。表9-13列出了在每个测试组织中靶基因的表达。

定义

在本文中使用时，下列每个术语具有与在该段落中其定义相关的含义。

本文中所用的冠词“一”和“一个”指一或多于一(即，至少一)的本文中语法上的对象。作为例子，“一种元件”指一种元件或多于一种元件。

“标记物”是一种基因，与其在正常或健康组织或细胞中表达水平相比，在组织或细胞中其改变的表达水平与疾病状态相关，例如与癌症相关。“标记物核酸”是一种本发明标记物编码的或相应于本发明标记物的核酸(如，mRNA，cDNA)。上述标记物核酸包括DNA(如，cDNA)，所述DNA包含列于序列表的任一核酸序列的完整或部分序列或该序列的互补物。标记物核酸也包括RNA，所述RNA包含列于序列表的任一核酸序列的完整或部分序列或该序列的互补物，其中用尿嘧啶残基取代所有的胸腺嘧啶残基。“标记物蛋白”是一种本发明标记物编码的或相应于本发明标记物的蛋白。标记物蛋白包含列于序列表的任一序列的完整或部分序列。术语“蛋白”和“多肽”可交换使用。

“标记组”指多于一个标记物的组。

术语“探针”指任何分子，其能选择性结合特别指定的靶分子，例如，核苷酸转录产物或本发明标记物编码的或相应于本发明标记的蛋白。探针可由本领域技术人员合成，也可来自合适的生物制品。为达到检测靶分子的目的，可特别设计带标记的探针，如本文中所描述的。能用作为探针的分子的例子包括，但不限于，RNA、DNA、蛋白、抗体和有机分子。

“子宫颈相关的”体液是一种液体，当其在患者体内时，接触或经过子宫颈细胞或进入所述细胞，或接触或经过可通过的子宫颈细胞中流出的蛋白。所述细胞可在收集的子宫颈涂片中发现，例如，通过子宫颈刷收集。子宫颈相关的体液的例子包括血液、淋巴液、腹水、妇科分泌液、胆囊液、尿液和通过阴道冲洗收集的液体。

标记物的“正常”表达水平是在受试人或不患子宫颈癌患者的子宫颈细胞中所述标记物的表达水平。

标记物的“过表达”或“明显更高的表达水平”指在测试样本中的表达水平高于用于评估表达的试验的标准误，和较对照样本(如，来自不具有所述标记物相关疾病的健康患者的样本)中所述标记物表达水平以及优选地，在一些对照样本中所述标记物的平均表达水平，优选至少高两倍，和更优选高3、4、5或10倍。

标记物的“明显更低的表达水平”指在测试样本中的表达水平较对照样本(如，来自不具有所述标记物相关疾病的健康患者的样本)中所述标记物表达水平以及优选地，在一些对照样本中所述标记物的平均表达水平，至少低两倍，和更优选低3、4、5或10倍。

在本文中使用时，术语“启动子/调节序列”指可操作地连接着所述启动子/调节序列的基因产物表达所必需的核酸序列。在一些例子中，所述序列可以是核心启动子序列以及在其它例子中，所述序列也可包括增强子序列和其它基因产物表达所必需的调控元件。例如，所述启动子/调节序列可以是一种以组织特异性方式表达基因产物的序列。

“组成型”启动子是一种核苷酸序列，当其可操作地与编码或规定基因产物的多核苷酸连接时，在所述细胞大多数或所有的生理条件下，导致在活的人细胞中产生所述基因产物。

“诱导型”启动子是一种核苷酸序列，当其可操作地与编码或规定基因产物的多核苷酸连接时，仅当相应于所述启动子的诱导剂在所述细胞中存在时，才导致在活的人细胞中实质上产生所述基因产物。

“组织特异型”启动子是一种核苷酸序列，当其可操作地与编码或规定基因产物的多核苷酸连接时，仅在如果所述细胞是相应于所述启动子的组织类型的细胞条件下，才导致在活的人细胞中实质上产生所述基因产物。

“转录的多核苷酸”或“核苷酸转录产物”是一种多核苷酸(如，mRNA、hnRNA、cDNA或上述RNA或cDNA的类似物)，其与成熟mRNA的全部或部分互补或同源，所述成熟mRNA由本发明的标记物转录以及正常的转录后加工(如，剪接)所产生，如果可能的话，由RNA转录产物的转录，以及RNA转录产物的反转录产生。

“互补的”指在两个核酸链区之间或在同一个核酸链两个区之间序列互补的概括性概念。已知第一核酸区的腺嘌呤残基能与第二核酸区的残基形成特定的氢键(“碱基配对”)，如果第二核酸区的残基是胸腺嘧啶或尿嘧啶，第二区对于第一区是反平行的。同样地，已知第一条核酸链的胞嘧啶残基能与第二条核酸链的残基碱基配对，如果第二条链的残基是鸟嘌呤，第二条链对于第一条链是反平行的。如果，当所述两个区排列为反平行方式时，核酸的第一区与同样或不同的核酸的第二区互补，至少一个第一区的核苷酸残基能与第二区的残基碱基配对。优选地，第一区包含第一部分和第二区包含第二部分，由此，当第一和第二部分以反平行方式排列时，至少约50％，和优选至少约75％，至少约90％，或至少约95％的第一区核苷酸残基能与第二区中核苷酸残基碱基配对。更优选地，所有的第一区核苷酸残基能与第二区中核苷酸残基碱基配对。

本文中所使用的“同源的”指在同一个核酸链两个区之间或在两个不同核酸链区之间的核苷酸序列相似性。当在两个区中核苷酸残基位置被同样的核苷酸残基所占据时，那么在该位置上这两个区是同源的。如果每个区的至少一个核苷酸残基位置被同样的核苷酸残基所占据，第一区与第二区是同源的。根据这两个区中被同样的核苷酸残基所占据的核苷酸残基位置的比例表示两个区之间的同源性。作为例子，具有核苷酸序列5′-ATTGCC-3′的区和具有核苷酸序列5′-TATGGC-3′的区具有50％同源性。优选地，第一区包含第一部分和第二区包含第二部分，由此，至少约50％，和优选至少约75％，至少约90％，或至少约95％的每个部分的核苷酸残基位置被同样的核苷酸残基所占据。更优选地，每个部分的所有核苷酸残基位置都被同样的核苷酸残基所占据。

如果分子与底物共价或非共价相连，对于底物该分子是“固定的”或“附着的”，上述底物可用液体(如，标准枸橼酸盐水，pH7.4)冲洗，所述分子的实质部分没有从底物上分离。

当在本文中所用时，“天然存在的”核酸分子指具有在自然界中发现的生物体中出现的核苷酸序列的RNA或DNA分子。

如果癌症的至少一种症状减轻、终止、放缓或阻止，该癌症被“抑制”。在本文中使用时，如果子宫颈癌的复发或转移减少、放缓、延迟或阻止，其也被“抑制”。

试剂盒是任何一种产品(如，一种包装或容器)，其包含至少一种试剂，如一种探针，用于特异性检测本发明标记物的表达。该试剂盒可以标准单位的形式推广、分发或出售用于执行本发明的方法。

“本发明的蛋白”包含标记物蛋白及其片段；标记物蛋白变体及其片段；包含标记物或标记物蛋白变体至少15个氨基酸片段的肽和多肽；和包含标记物或标记物蛋白变体，或标记物或标记物蛋白变体至少15个氨基酸片段的融合蛋白。

除非在本文中另有规定，术语“抗体”和“抗体”概括地包含了天然存在的抗体类型(如，IgG，IgA，IgM，IgE)和重组抗体，如单链抗体、嵌合和人源化抗体以及多特异性抗体，也包括前述所有抗体的片段和衍生物，该片段和衍生物具有至少一个抗原结合位点。抗体衍生物可包含与抗体结合的蛋白或化学部分。

描述

本发明部分基于新鉴定的标记物，与它们在正常的(即，非癌)子宫颈细胞中表达相比，所述标记物在子宫颈癌细胞中过表达。在本文中子宫颈细胞中一或多种这些标记物增强的表达与组织的癌状态相关。本发明提供了用于评估子宫颈细胞(如，获得自人细胞、培养的人细胞、存档或保藏的人细胞和体内细胞)癌状态和治疗患子宫颈癌的患者的组合物、试剂盒和方法。

本发明所述的组合物、试剂盒、和方法具有如下用途，其中：

1)评估是否患者患子宫颈癌；

2)评估人类患者子宫颈癌的病期；

3)评估患者子宫颈癌的级别；

4)评估患者子宫颈癌的良性或恶性性质；

5)评估患者子宫颈癌的转移潜力；

6)评估患者子宫颈癌相关的新生物的组织学类型；

7)制造用于治疗子宫颈癌和/或评估是否患者患子宫颈癌的抗体、抗体片段或抗体衍生物；

8)评估子宫颈癌细胞的存在；

9)评估用于抑制患者子宫颈癌一或多种受试化合物的效力；

10)评估用于抑制患者子宫颈癌的治疗的有效性；

11)监测患者子宫颈癌的进展；

12)选择用于抑制患者子宫颈癌的组合物或治疗；

13)治疗患子宫颈癌的患者；

14)抑制患者子宫颈癌；

15)评估受试化合物的子宫颈致癌作用潜力；和

16)预防处于发展为子宫颈癌危险的患者子宫颈癌的发作。

因此，本发明包括一种评估是否患者患子宫颈癌的方法，其包括评估是否患者具有转移前子宫颈癌。该方法包含比较患者样本中本发明标记物(列于表1)的表达水平和对照中所述标记物的正常表达水平，如非子宫颈癌样本。与正常水平相比，患者样本中标记物明显更高的表达水平表明该患者患子宫颈癌。

本发明也提供了含有核酸的基因运载工具、宿主细胞和组合物(所有本文中描述的)，所述核酸包含列于序列表中任一核酸序列的全部、或15个或更多核苷酸的片段，或上述序列的互补物，和多肽，所述多肽包含列于序列表中任一氨基酸序列的全部、或10个或更多氨基酸的片段。

如本文所述，患者子宫颈癌与本发明一或多种标记物增加的表达水平相关。虽然，如上所讨论，其中一些表达水平改变导致了子宫颈癌的发生，其它一些改变诱导、保持并促进子宫颈癌细胞的癌状态。因此，可通过减少和/或干扰标记物表达和/或那些标记物编码蛋白的功能来抑制通过一或多种本发明标记物表达水平增加而鉴定的子宫颈癌。

通常在本领域中已知许多方法可抑制本发明标记物的表达。例如，给子宫颈癌细胞提供反义寡核苷酸以抑制标记物的转录、翻译或同时抑制两者。另一方面，编码能特异性结合标记物蛋白的抗体、抗体衍生物或抗体片段的多核苷酸，和可操作地与合适的启动子/调控区连接，能提供给细胞以产生能抑制标记物蛋白功能或活性的细胞内抗体。也可通过用能特异性结合标记物蛋白的抗体、抗体衍生物或抗体片段处理子宫颈癌细胞来抑制标记物表达和/或功能。使用本文中描述的方法，能筛选多种分子，特别是包括足够小的以致能穿过细胞膜的分子，以鉴定能抑制标记物表达或抑制标记物蛋白功能的分子。给患者提供所鉴定的化合物以抑制患者的子宫癌细胞。

任何本发明的标记物或标记物组合，也包括任何已知的标记物与本发明标记物的组合，可用于本发明的组合物、试剂盒和方法中。一般而言，优选使用在子宫颈癌细胞中标记物表达水平和在正常子宫颈细胞中相同标记物表达水平之间差异越可能大的标记物。尽管该差异可小到用于评估该标记物表达的方法的检测极限，但是优选该差异至少大于该评估方法的标准误，以及优选较正常子宫颈组织中相同标记物的表达水平至少2-，3-，4-，5-，6-，7-，8-，9-，10-，15-，20-，25-，100-，500-，1000-倍或更大的差异。

认为某些标记物蛋白从子宫颈细胞(即，正常和癌细胞的一种或两者)分泌到围绕着细胞的胞外空间。这些标记物优选用于本发明某些实施方案中的组合物、试剂盒和方法，基于在子宫颈相关的体液样本中能检测到上述标记物蛋白的事实，较组织的活组织检查切片样本，这些标记物能更容易地收集自人类患者。另外，优选用于检测标记物蛋白的体内技术，包括将抗该蛋白的标记的抗体导入患者体内。例如，可用放射性标记物标记抗体，可通过标准成像技术检测患者体内该放射性标记物的存在和位置。

对于本领域技术人员而言，测定任何特殊标记物蛋白是否是分泌蛋白是一件简单的事情。为进行该测定，标记物蛋白表达在，例如，哺乳动物细胞中，优选人子宫颈细胞系中，收集细胞外液，评估在细胞外液中存在或不存在标记物蛋白(如，使用特异性结合该蛋白的标记的抗体)。

接下来的例子是一种用于检测蛋白分泌的方法。在5％(v/v)CO₂，95％空气气氛中，在含有培养液(补充有10％胎牛血清的Dulbecco氏改良的Eagle氏培养液{DMEM})的加样孔中，约8×10⁵293T细胞在37℃下温育至约60-70％汇合。接着用每孔中含有2微克包含编码标记物蛋白表达载体的DNA和10微升LipofectAMINE^TM(GIBCO/BRLCatalog no.18342-012)的标准转染混合物转染细胞。转染混合物保持约5小时，接着用新鲜的培养液更换并保持在空气气氛中。每个孔用不含有甲硫氨酸或半胱氨酸的DEME(DMEM-MC；ICN Catalog no.16-424-54)轻轻地冲洗两次。在每个孔中加入约1毫升的DMEM-MC和约50微居里的Trans-³⁵S^TM试剂(ICN Catalog no.51006)。加样孔保持在上述的5％CO₂气氛中并在37℃下温育选定的一段时间。接着温育，除去150微升的条件培养液并离心除去漂浮细胞和碎片。在上清液中标记物蛋白的存在表明该蛋白被分泌。

可以理解的是含有子宫颈细胞的患者样本可用于本发明的方法。在这些实施方案中，通过评估子宫颈细胞样本(如，获得自患者的子宫颈涂片)中标记物的数量(如，绝对数量或浓度)可评估标记物的表达水平。当然，在评估样本中标记物数量前，可用多种众所周知的收集后制备或贮藏技术(如核酸和/或蛋白提取、固定、贮藏、冷冻、超滤、浓缩、蒸发、离心等)处理细胞样本。同样地，也可用收集后制备或贮藏技术(如，固定)处理子宫颈涂片。

本发明的组合物、试剂盒和方法可用于检测标记物蛋白的表达，该标记物蛋白至少有一部分在表达该蛋白的细胞表面展示。对于本领域技术人员而言，测定标记物蛋白或其部分是否暴露于细胞表面是一件简单的事情。例如，可用免疫学方法检测全细胞中的标记物蛋白，或用众所周知的基于计算机的序列分析方法来预测至少一个胞外域(即，包括分泌蛋白和具有至少一个细胞表面域的蛋白)的存在。无需裂解该细胞(如，使用与标记物蛋白的细胞表面域特异性结合的标记抗体)就可检测到具有至少一部分在表达该蛋白的细胞表面展示的标记物蛋白的表达。

通过用于检测转录核酸或蛋白的任一众所周知的方法可评估本发明标记物的表达。上述方法非限制性的例子包括用于检测分泌、细胞表面、胞质或核蛋白的免疫学方法、蛋白纯化方法、蛋白功能或活性分析方法、核酸杂交方法、核酸反转录方法和核酸扩增方法。

在一个优选实施方案中，使用能特异性结合标记物蛋白或其片段，包括全部或部分进行了常规的翻译后修饰的标记物蛋白，的一种抗体(如，一种放射性标记的、发色团标记的、荧光团标记的或酶标记的抗体)、抗体衍生物(如，结合有底物或或蛋白—配体对{如，生物素—抗生物素蛋白链菌素}的蛋白或配体的抗体)，或抗体片段(如，单链抗体、分离的抗体超变区，等)来评估标记物的表达。

在另一个优选实施方案中，通过制备来自患者样本细胞的mRNA/cDNA(即，转录的多核苷酸)，和通过将mRNA/cDNA和与标记物核酸或其片段互补的对照多核苷酸杂交来评估标记物的表达。在与对照多核苷酸杂交前，能使用任一多聚酶链式反应方法来任选地扩增cDNA；优选不被扩增。同样地，可使用定量PCR评估标记物的表达水平以检测一或多种标记物的表达。可选地，任何已知检测本发明标记物突变或变体(如，单核苷酸多态性、缺失等)的方法可用于检测患者中标记物的存在。

在一个相关实施方案中，将获得自样本的转录多核苷酸混合物和底物接触，该底物固定有与标记物核酸的至少一部分(如，至少7，10，15，20，25，30，40，50，100，500或更多的核苷酸残基)互补的或同源的多核苷酸。如果在底物上，互补的或同源的多核苷酸的检测有差别(如，使用不同的发色团或荧光团，或固定在不同的所选择的位置)，那么使用一种单一底物就可同时评估多种标记物的表达水平(如，固定在所选择位置的多核苷酸的“基因芯片”微阵列)。当使用包括将一种核酸与另一种杂交的用于评估标记物表达的一种方法时，优选在严谨杂交条件下进行杂交。

因为本发明的组合物、试剂盒和方法依赖于检测本发明一或多种标记物的表达水平的差异，优选标记物的表达水平明显大于用于在至少一种正常子宫颈细胞和子宫颈癌细胞中评估表达的方法的最小检测极限。

很清楚通过使用一或多种本发明的标记物来常规筛选额外的患者样本，可认识到在不同类型的癌症中某些标记物是过表达的，包括特殊的子宫颈癌，也包括另外的癌症如乳癌、卵巢癌等。例如，可证实某些本发明的标记物在大多数(即，50％或更多)或基本上全部(即，80％或更多)的子宫颈癌中过表达。此外，可证实某些本发明的标记物与不同病期的(即，病期0，I，II，III和IV子宫颈癌，也包括亚分类IA1，IA2，IB，IB1，IB2，IIA，IIB，IIIA，IIIB，IVA和IVB，对于子宫颈原发癌使用FIGO病期分组系统(见GynecologicOncology，1991，41：199和Cancer，1992，69：482))，以及癌前状态的(如，发育异常包括CIN或SIL)，不同组织学亚型的(如，鳞状上皮细胞癌和鳞状上皮细胞癌变体如疣状癌、淋巴上皮癌类似癌、乳头状鳞状新生物和梭形细胞鳞状细胞癌(见，Cervical Cancer andPreinvasive Neoplasia，1996，pp.90-91)浆液样、粘蛋白状、子宫内膜样和透明细胞亚型，也包括亚分类和交叉分类的腺癌、乳头腺癌、乳头状囊腺癌、表面乳头状癌、恶性腺纤维瘤、囊腺纤维瘤、腺癌、囊腺癌、腺棘皮癌、子宫内膜间质肉瘤、中胚层{富勒氏}混合瘤、恶性瘤、混合上皮细胞瘤和未分化癌，对于恶性子宫颈瘤的分类，使用WHO/FIGO系统；Scully，Atlas of Tumor Pathology，第3辑，Washington DC)，和不同级别的(即，I级{良好分化的}，II级{中度良好分化的}和III级{从周围正常组织低分化的})子宫颈癌相关。此外，对于本发明标记物的表达而言，评估了大量的患者样本，且来自所获得样本中的单独的患者结果是相关的，也可证实某些本发明标记物改变的表达与恶性肿瘤密切相关，以及本发明其它标记物改变的表达与良性肿瘤密切相关。因此，本发明的组合物、试剂盒和方法可用于鉴定患者中子宫颈癌的一或多种病期、级别、组织学类型和良性/恶性性质。

当本发明的组合物、试剂盒和方法用于鉴定患者中子宫颈癌的一或多种病期、级别、组织学类型和良性/恶性性质时，优选，标记物或本发明的标记物组选自在至少约20％、和优选至少约40％、60％或80％，和更优选基本上全部患子宫颈癌的患者中获得阳性结果的，该子宫颈癌具有相应的病期、级别、组织学类型和良性/恶性性质。优选地，标记物或本发明的标记物组选自在一般人群中阳性预测值(PPV)大于约10％的(更优选外加特异性测定大于80％的)。

当多种本发明的标记物用于本发明的组合物、试剂盒和方法中时，可在一种单独的反应混合物中(即，对于每种标记物使用试剂，如不同的荧光探针)或在相应于一或多种标记物的单独的反应混合物中，将患者样本中每种标记物的表达水平与同类型的非癌样本中多种标记物的每种正常表达水平比较。在一个实施方案中，相对于相应的正常水平，在样本中多种表达标记物中超过一种的表达水平的明显增加表明患者患子宫颈癌。当使用多种标记物时，优选使用2，3，4，5，8，10，12，15，20，30或50或更多的单独的标记物，其中优选更少的标记物。

为使本发明的组合物、试剂盒和方法的灵敏度最大化(即，因为患者样本中非癌器官的细胞的干扰)，优选在此使用的本发明的标记物是一种具有受限的组织分布，如通常不在非癌组织中表达的标记物。

已知仅有少量标记物与子宫颈癌相关(如，bcl-2，15A8抗原，cdc6，Mcm5和EGFR)。当然这些标记物不包括本发明的标记物，尽管在一个标记物组中它们可与一或多种本发明的标记物联合使用，例如。众所周知某些类型的基因，如癌基因、肿瘤抑制基因、生长因子类似基因、蛋白酶类似基因和蛋白激酶类似基因通常与不同类型的癌的发生相关。因此，在本发明的标记物中，优选使用那些类似由已知癌基因和肿瘤抑制基因编码的已知蛋白的相应蛋白，和那些类似生长因子、蛋白酶和蛋白激酶的相应蛋白。

认为本发明的组合物、试剂盒和方法对于具有增加的发展为子宫颈癌危险的患者和他们的医学顾问具有特殊的效用。认可的具有增加的发展为子宫颈癌危险的患者包括，例如，具有子宫颈癌家族史的患者，鉴定为具有突变的癌基因(即，至少一种等位基因)的患者，和大龄患者(即，大于50或60岁的妇女)。

可用不同的方法来评估正常(即，非癌)人子宫颈组织中标记物的表达。在一个实施方案中，通过评估看来是非癌的子宫颈细胞的一部分中标记物的表达水平和通过将正常表达水平与怀疑是患癌的子宫颈细胞的一部分中的表达水平比较来评估该正常表达水平。可选地，和特别地作为可获得自按程序进行的本文中所描述方法的结果的详细信息，对于本发明的标记物的正常表达而言，可使用种群平均值。在另一个实施方案中，标记物的‘正常的’表达水平可通过评估获得自非癌患者的患者样本，获得自在怀疑该患者患子宫颈癌之前获得的患者样本，来自存档的患者样本和类似物中标记物的表达来测定。

本发明包括用于评估样本(如，存档的组织样本或获得自患者的样本)中子宫颈癌细胞存在的组合物、试剂盒和方法。这些组合物、试剂盒和方法基本上与那些上述的，除了其中不可避免的用于不同于患者样本的样本中的组合物、试剂盒和方法外，基本上是相同的。例如，当所用的样本是蜡封(parafinized)的、存档的人组织样本时，需要调节用于评估样本中标记物表达水平的本发明组合物、试剂盒或方法中化合物的比率。在本领域和本领域普通技术人员中这样的方法是众所周知的。

本发明包括用于评估子宫颈癌细胞(如，在样本，如在患者样本中)存在的试剂盒。该试剂盒包含多种试剂，每种都能特异性结合标记物核酸或蛋白。合适用于与标记物蛋白结合的试剂包括抗体、抗体衍生物、抗体片段和类似物。合适用于与标记物核酸(如，基因组DNA、mRNA、剪接的mRNA、cDNA或类似物)结合的试剂包括互补的核酸。例如，核酸试剂可包括固定于底物的寡核苷酸(标记的或未标记的)，不与底物结合的标记的寡核苷酸，PCR引物对，分子信标探针和类似物。

本发明的试剂盒也可任选地包含用于操作本发明方法的额外成分。作为例子，该试剂盒可包含合适用于互补核苷酸退火或用于特异性结合该蛋白的抗体和蛋白的结合的液体(如，SSC缓冲液)，一或多个样本室，一份描述操作本发明方法的说明书，一种正常子宫颈样本，一种子宫颈癌细胞样本，和类似物。

本发明也包括一种制造分离的杂交瘤的方法，该杂交瘤产生用于评估患者是否患子宫颈癌的抗体。在此方法中，合成或分离包含标记物蛋白全部或片段的蛋白或多肽(如，通过从表达其的细胞中纯化或通过在体内或体外用已知方法转录并翻译编码蛋白或多肽的核酸)。一种脊椎动物，优选哺乳动物如小鼠、大鼠、兔或绵羊用上述蛋白或多肽免疫。该脊椎动物可任选地(和优选地)用上述蛋白或多肽免疫至少一段额外时间，使得该脊椎动物对于上述蛋白或多肽显示加强的免疫响应。使用本领域众所周知的任一方法，分离自免疫的脊椎动物的脾细胞与无限增殖化细胞系融合形成杂交瘤。该方法中形成的杂交瘤接着用标准方法筛选以鉴定能产生特异性结合标记物蛋白或其片段的抗体的一或多种杂交瘤。本发明也包括根据上述方法制得的杂交瘤和使用该杂交瘤制得的抗体。

本发明也包括一种评估用于抑制子宫颈癌细胞的受试化合物的效力的方法。如上所述，本发明标记物的表达水平的差异与子宫颈细胞的癌状态相关。尽管认为本发明某些标记物表达水平的改变类似于子宫颈细胞癌状态所产生的结果，但是同样也认为本发明其它标记物的表达水平改变导致、保持并促进了那些细胞的癌状态。因此，能抑制患者子宫颈癌的化合物可导致本发明一或多种标记物的表达水平改变至接近该标记物的正常表达水平的水平(即，非癌子宫颈细胞中该标记物的表达水平)。

因此，该方法包含比较在第一子宫颈细胞样本中并保持在存在受试化合物的条件下标记物的表达与在第二子宫颈细胞样本中并保持在不存在受试化合物的条件下标记物的表达。在存在受试化合物条件下，本发明标记物的表达明显减少表明该受试化合物抑制子宫颈癌。子宫颈细胞样本可以，例如，是获得自患者的正常子宫颈细胞的一次抽样样本，获得自患者的正常子宫颈细胞的混合样本的等分试样，正常子宫颈细胞系的细胞，获得自患者的子宫颈癌细胞的一次抽样样本，获得自患者的子宫颈癌细胞的混合样本的等分试样，子宫颈癌细胞系的细胞，或类似物。在一个实施方案中，样本是获得自患者的子宫颈癌细胞，测试多种已知能有效地用于抑制的不同子宫颈癌的化合物以鉴定出能最好的抑制患者子宫颈癌的化合物。

同样地，该方法可用于评估用于患者子宫颈癌的治疗的有效性。在该方法中，评估了一对样本中(一个样本给予该治疗，另一个样本不给予该治疗)本发明一或多种标记物的表达水平。当用评估受试化合物效力的方法时，如果该治疗导致本发明标记物明显更低的表达水平，那么对于抑制子宫颈癌而言，该治疗是有效的。同上，如果来自所选择的患者的样本用于该方法中，那么可在体外评估可选择的治疗以选择一种对于抑制患者子宫颈癌最有效的治疗。

如上所述，人子宫颈细胞的癌状态与本发明标记物的表达水平的改变相关。本发明包括一种用于评估受试化合物的人子宫颈细胞致癌作用潜力的方法。该方法包含将人子宫颈细胞等分试样分别保持在存在和不存在受试化合物的条件下。比较每个等分试样中本发明标记物的表达。保持在存在受试化合物的条件下的等分试样中本发明标记物表达水平明显更高(相对于保持在不存在受试化合物条件下的等分试样)，表明该受试化合物具有潜在的人子宫颈细胞致癌作用。通过比较相应标记物表达水平增强或抑制的程度，通过比较表达水平增强或抑制的标记物的数量，或两者都比较，可评估不同受试化合物的相对致癌作用潜力。

在下列段落中更详细描述了本发明的不同方面。

I.分离的核酸分子

本发明的一个方面涉及分离的核酸分子，包括编码标记物体蛋白或其部分的核酸。本发明分离的核酸也包括足以用作为杂交探针以鉴定标记物核酸分子及其片段的核酸分子，如，那些合适用作为用于标记物核酸分子的扩增或突变的PCR引物的。在本文中使用时，术语“核酸分子”意指包括DNA分子(如，cDNA或基因组DNA)和RNA分子(如，mRNA)以及用核苷酸类似物所制备的DNA或RNA类似物。核酸分子可以是单链或双链的，但优选双链DNA。

“分离的”核酸分子是从核酸分子的天然来源中所存在的其它核酸分子中分离的核酸分子。优选地，在该核酸所源自的生物体基因组DNA中，“分离的”核酸分子不具备侧接该核酸的天然(即，位于该核酸5′和3′末端的序列)序列(优选蛋白编码序列)。例如，在各种实施方案中，该分离的核酸分子可含有低于约5kB，4kB，3kB，2kB，1kB，0.5kB或0.1kB的在该核酸分子源自的细胞基因组DNA中侧接该核酸分子的天然核苷酸序列。此外，“分离的“核酸分子，如cDNA分子，当通过重组技术上生产时，可基本上不含有其它细胞物质或培养基，或当化学合成时，基本上不含有化合物前体或其它化合物。

可使用标准的分子生物学技术和本文所述的数据库记录的序列信息分离本发明的核酸分子。使用所记录的核酸序列的全部或部分，使用标准的杂交和克隆技术可分离本发明的核酸分子(如，描述于Sambrook等，编.，Molecular Cloning：A Laboratory Manual，第2版，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NY，1989)。

根据标准PCR扩增技术，使用cDNA、mRNA或基因组DNA作为模板和合适的寡核苷酸引物可扩增本发明的核酸分子。所扩增的核酸可克隆自合适的载体中并通过DNA序列分析来鉴定。此外，通过标准的合成技术，如使用自动DNA合成仪，可制备相应于本发明核酸分子的全部或部分的核苷酸。

在另一个优选实施方案中，本发明分离的核酸分子包含具有与标记物核酸的核苷酸序列或编码标记物蛋白的核酸的核苷酸序列互补的核苷酸序列的核酸分子。与给定的核苷酸序列互补的核酸分子是一种与给定的核苷酸序列完全互补，并能与所给定的核苷酸序列杂交从而形成稳定的双链体。

此外，本发明的核酸分子可仅包含部分核酸序列，其中全长的核酸序列包含标记物核酸或编码标记物蛋白。这样的核酸可用作为，例如，探针或引物。通常用一或多种基本上纯化的寡核苷酸作为探针/引物。该寡核苷酸通常包含在严谨条件下能与本发明的核酸的至少约7，优选约15，更优选约25，50，75，100，125，150，175，200，250，300，350或400或更多的连续核苷酸杂交的核苷酸序列的一个区。

基于本发明的核酸分子序列的探针可用于检测相应于本发明一或多个标记物的转录产物或基因组序列。该探针包含附于其上的标记基团，如，放射性同位素、荧光化合物、酶、或酶辅因子。这样的探针可用作为用于鉴定蛋白表达异常的细胞或组织的诊断试剂盒的一部分，例如通过测定患者细胞样本中编码蛋白的核酸分子的水平，如检测mRNA水平或确定编码该蛋白的基因是否已突变或缺失。

本发明进一步包含由于遗传密码简并性而不同于编码标记物蛋白(如，具有列于序列表中氨基酸序列之一的蛋白)的核酸的核苷酸序列的核酸分子，并因此编码同样的蛋白。

本领域的技术人员可以理解的是DNA序列多态性导致的氨基酸序列改变可存在于种群中(如，人群中)。由于等位基因自然变异，这样的遗传多态性可在种群的个体间存在。等位基因是可选择出现在给定的基因位点的一组基因之一。此外，可以理解的是影响RNA表达水平的DNA多态性也存在可影响该基因总的表达水平(如，通过影响调控或降解)。

在本文中使用时，词组“等位基因变体”指在给定的位点出现的核苷酸序列或指该核苷酸序列编码的多肽。

在本文中使用时，术语“基因”和“重组基因”指包含编码相应于本发明标记物多肽的开放阅读框的核酸分子。在给定基因的核苷酸序列中该天然产生的等位基因变体通常能导致1-5％变异。通过对许多不同个体中感兴趣的基因测序可鉴定可选择的等位基因。通过使用杂交探针来鉴定不同个体中此同样的基因位点可容易地进行上述鉴定。任一和所有这样的核苷酸变体和产生的氨基酸多态性或变体是天然等位基因变异的结果，并且不改变本发明保护范围所规定的功能活性。

在另一个实施方案中，本发明分离的核酸分子长度至少是7，15，20，25，30，40，60，80，100，150，200，250，300，350，400，450，550，650，700，800，900，1000，1200，1400，1600，1800，2000，2200，2400，2600，2800，3000，3500，4000，4500，或更多个核苷酸，并在严谨条件下与标记物核酸或与编码标记物蛋白的核酸杂交。在本文中使用时，术语“在严谨条件下杂交”是用来描述用于杂交和洗涤的条件，在该条件下，彼此之间具有至少60％(65％，70％，优选75％)同一性的核苷酸序列通常仍能互相杂交。这样的严谨条件为本领域技术人员所众所周知，并能在Current Protocols in Molecular Biology，John Wiley & Sons，N.Y.(1989)6.3.1-6.3.6节中找到。一个优选的，非限制性的严谨杂交条件的例子是在6X氯化钠/柠檬酸钠(SSC)中，在45℃下杂交，接着用0.2X SSC，0.1％SDS在50-65℃下洗涤一或多次。

除了能存在于种群中的本发明核酸分子的天然存在的等位基因变体外，本领域的技术人员可进一步理解能通过突变导入序列改变，因此导致了所编码蛋白的氨基酸序列的改变，但不改变所编码蛋白的生物活性。例如，可进行核苷酸取代导致在“非必需的”氨基酸残基处的氨基酸取代。“非必需的”氨基酸残基是一种在野生型序列中能被改变但不改变生物活性的残基，但是，“必需的”氨基酸残基对生物活性而言是必需的。例如，对于活性而言，在不同物种同系物之间非保守的或仅是半保守的氨基酸残基可能是非必需的，因此很可能成为改变的对象。可选地，对于活性而言，在不同物种(如，鼠和人)同系物之间保守的氨基酸残基可能是必需的，因此就不可能作为改变的对象。

因此，本发明的另一个方面是关于编码不同标记物蛋白的核酸分子，该标记物蛋白含有对于活性而言是非必需的氨基酸残基改变。这样的标记物蛋白变体的氨基酸序列不同于天然存在的标记物蛋白，但仍保持生物活性。在一个实施方案中，这样一个标记物蛋白变体具有与标记物蛋白的氨基酸序列至少约40％，50％，60％，70％，80％，90％，95％或98％同一性的氨基酸序列。

通过在标记物核酸的核苷酸序列中导入一或多个核苷酸取代、添加或缺失得到编码标记物蛋白变体的分离的核酸分子，使得一或多个氨基酸残基取代、添加或缺失导入所编码的蛋白。通过标准技术可导入突变，如定点诱变和PCR-介导的诱变。优选地，在一或多个预测的非必需氨基酸残基处进行保守氨基酸取代。“保守氨基酸取代”指氨基酸残基被具有类似侧链的氨基酸残基所取代。在本领域中已经定义了具有类似侧链的氨基酸残基家族。这些家族包括具有碱性侧链的氨基酸残基(如，赖氨酸、精氨酸、组氨酸)，酸性侧链的氨基酸残基(如，天冬氨酸、谷氨酸)，不带电荷的极性侧链的氨基酸残基(如，甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)，非极性侧链的氨基酸残基(如，丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)，β-分支侧链的氨基酸残基(如，苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链的氨基酸残基(如，酪氨酸、苯丙氨酸、色氨酸、组氨酸)。可选地，突变可随机导入编码序列的全部或部分中，如通过饱和诱变，可通过鉴定仍保持活性的突变体的生物活性来筛选所产生的突变体。在诱变后，重组表达编码蛋白并测定该蛋白活性。

本发明包含反义核酸分子，即能与本发明的有义核酸互补的分子，如，与双链标记物cDNA分子的编码链互补或与标记物mRNA序列互补。因此，本发明的反义核酸能通过氢键(即，退火)与本发明的有义核酸结合。该反义核酸能与完整编码链或其部分互补，如，蛋白编码区(或开放阅读框)的全部或部分。反义核酸分子也可以与编码标记物蛋白的核苷酸序列的编码链的非编码区的全部或部分反义。非编码区(“5′和3′非翻译区”)是侧接在编码区且不翻译为氨基酸的5′和3′序列。

反义寡核苷酸长度可以是，例如，约5，10，15，20，25，30，35，40，45或50或更多个核苷酸。使用本领域已知的化学合成和酶连反应方法可得到本发明的反义核酸。例如，使用天然存在的核苷酸或设计用于增加分子生物学稳定性或增加在反义和有义核酸之间形成的双链的物理稳定性的不同的修饰的核苷酸的可化学合成反义核酸，如可使用磷硫酰衍生物和吖啶取代的核苷酸。可用于产生反义核酸的修饰的核苷酸的例子包括5-氟尿嘧啶，5-溴尿嘧啶，5-氯尿嘧啶，5-碘尿嘧啶，次黄嘌呤，黄嘌呤，4-乙酰胞嘧啶，5-(羧基羟甲基)尿嘧啶，5-羧甲基氨甲基-2-硫尿核苷，5-羧甲基氨甲基尿嘧啶，二氢尿嘧啶，β-D-半乳糖基queosine，肌苷，N6-异戊烯腺嘌呤，1-甲基鸟嘌呤，1-甲基肌苷，2，2-二甲基鸟嘌呤，2-甲基腺嘌呤，2-甲基鸟嘌呤，3-甲基胞嘧啶，5-甲基胞嘧啶，N6-腺嘌呤，7-甲基鸟嘌呤，5-甲基氨甲基尿嘧啶，5-甲氧基氨甲基-2-硫尿嘧啶，β-D-甘露糖基queosine，5′-甲氧基羧甲基尿嘧啶，5-甲氧基尿嘧啶，2-甲基硫代-N6-异戊烯腺嘌呤，尿嘧啶-5-乙醇酸(v)，wybutoxosine，假尿嘧啶，queosine，2-巯基胞嘧啶，5-甲基-2-巯基尿嘧啶，2-巯基尿嘧啶，4-巯基尿嘧啶，5-甲基尿嘧啶，尿嘧啶-5-乙醇酸甲酯，尿嘧啶-5-乙醇酸(v)，5-甲基-2-巯基尿嘧啶，3-(3-氨基-3-N-2-3-羧丙基)尿嘧啶，(acp3)w和2，6-二氨基嘌呤。可选地，可用生物学方法产生反义核酸，该方法使用表达载体，其中核酸已被亚克隆入该载体的反义方向(即，由插入的核酸转录的RNA与感兴趣的靶核酸呈反义方向，在以下部分作进一步说明)。

通常给予受试者本发明的反义核酸分子，或在原位产生该反义核酸分子以使它们与编码标记物蛋白的细胞mRNA和/或基因组DNA杂交或结合以抑制标记物的表达，如，通过抑制转录和/或翻译。杂交通过常规的核苷酸互补可形成稳定的双链体，或，例如，通过双螺旋的大沟中的特异性相互作用，在这种情况下，反义核酸分子结合DNA双链体。给予本发明反义核酸分子的途径的例子包括在组织部位直接注射或将反义核酸灌输入子宫颈相关的体液中。可选地，可修饰反义核酸分子以靶定所选择的细胞，和接着通过全身方式给予。例如，对于全身性给药而言，可修饰反义核酸使之与所选择的细胞表面的受体或表达的抗原特异性结合，如，通过将反义核酸分子与肽或抗体连接，所述肽或抗体与细胞表面受体或抗原结合。使用本文中所述的载体也可将反义核酸分子递送至细胞中。为达到反义分子足够的细胞内浓度，优选在载体构建体中反义核酸分子可置于强pol II或pol III启动子的控制下。

本发明的反义核酸分子可以是α-端基核酸分子。α-端基核酸分子难过与互补的RNA形成特殊的双链杂合体，与通常使用的α-单位不同，链之间互相平行延伸(Gaultier等，1987，Nucleic Acids Res.15：6625-6641)。反义核酸分子也可包含2′-o-甲基核糖核苷酸(Inoue等.，1987，Nucleic Acids Res.15：6131-6148)或嵌合的RNA-DNA类似物(Inoue等，1987，FEBS Lett.215：327-330)。

本发明也包含核酶。核酶是催化性RNA分子，其具有核糖核酸酶活性，能裂解单链核酸，如mRNA，其具有与所裂解的单链核酸互补的互补区。因此，核酶(如，在Haselhoff和Gerlach，1988，Nature334：585-591中所述的锤头状核酶)可用于催化裂解mRNA转录产物由此抑制mRNA编码蛋白的翻译。基于相应于该标记物的cDNA的核苷酸序列，可设计对编码标记物蛋白的核酸分子具有特异性的核酶。例如，可构建四膜虫(Tetrahymena)L-19 IVS RNA的衍生物，其中，活性部位的核苷酸序列与要裂解的核苷酸序列互补(见，Cech等，美国专利第4,987,071号；和Cech等，美国专利第5,116,742号)。可选地，编码本发明多肽的mRNA可用于从RNA分子库中选择具有特定核糖核酸酶活性的催化性RNA(参见如Bartel和Szostak，1993，Science261：1411-1418)。

本发明也包含形成三螺旋结构的核酸分子。例如，通过将靶核苷酸序列与编码标记物核酸或蛋白的基因的调控区(如，启动子和/或增强子)互补以形成三螺旋结构阻止了该基因在靶细胞中的转录，来抑制本发明标记物的表达。通常见Helene(1991)Anticancer Drug Des.6(6)：569-84；Helene(1992)Ann.N.Y.Acad.Sci.660：27-36；和Maher(1992)Bioassays 14(12)：807-15。

在各种实施方案中，可修饰本发明核酸分子的碱基部分、糖部分或磷酸酯主链以改良，如分子的稳定性、杂交性或溶解性。例如，可修饰核酸的脱氧核糖磷酸酯主链以产生肽核酸(见，Hyrup等，1996，Bioorganic & Medicinal Chemistry 4(1)：5-23)。在本文中使用时，术语“肽核酸”或“PNAs”指核酸模拟物，如，DNA模拟物，其中伪肽(pseudopeptide)主链取代了脱氧核糖磷酸主链，且仅保留有4种天然核苷碱基。在低离子强度的条件下，已显示PNAs中性主链可与DNA和RNA特异性杂交。可通过使用标准固相肽合成技术进行PNA寡聚体的合成，如描述于Hyrup等.(1996)，出处同上；Perry-O′Keefe等.(1996)Proc.Natl.Acad.Sci.USA 93：14670-675。

PNAs可作为治疗和诊断应用。例如，PNAs可用作为反义或反基因(antigene)试剂用于基因表达的序列特异性调控，通过如，在基因中分析单碱基配对突变，通过如，PNA定向PCR钳制(clamping)；当与其它酶(如S1核酸酶)结合使用时，作为人工限制性酶(Hyrup(1996)，出处同上)；或作为DNA测序和杂交的探针或引物(Hyrup，1996，出处同上；Perry-O′Keefe等，1996，Proc.Natl.Acad.Sci.USA93：14670-675)。

在另一个实施方案中，通过在PNA上连接亲脂性或其它辅助基团，通过形成PNA-DNA嵌合体，或通过使用脂质体或其它本领域已知的药物递送技术可修饰PNAs，如以增加它们的稳定性或细胞摄取能力。例如，产生的PNA-DNA嵌合体可将PNA和DNA的有益特性结合。当PNA部分能提供高亲和力和特异性时，这样的嵌合体允许DNA识别与DNA部分相互作用的酶，如核糖核酸酶H和DNA聚合酶。使用合适长度的接头可连接PNA-DNA嵌合体，根据碱基堆积、在核碱基之间键的数目和取向选择接头(Hyrup，1996，出处同上)。根据Hyrup(1996)，出处同上，和Finn等.(1996)Nucleic Acids Res.24(17)：3357-63所描述的方法进行PNA-DNA嵌合体的合成。例如，，使用标准的亚磷酰胺偶联化学和修饰的核苷类似物在固相支持物上合成DNA链。化合物，如5′-(4-甲氧基三苯甲基)氨基-5′-脱氧-胸苷亚磷酰胺可用于连接PNA和DNA的5′末端(Mag等，1989，Nucleic AcidsRes.17：5973-88)。接着以逐步进行的方法偶联上PNA单体以产生具有5′PNA片段和3′DNA片段的嵌合分子(Finn等，1996，Nucleic AcidsRes.24(17)：3357-63)。可选地，可合成具有5′DNA片段和3′PNA片段的嵌合分子(Peterser等，1975，Bioorganic Med.Chem.Lett.5：1119-11124)。

在另一个实施方案中，寡核苷酸包括其它附加的基团如肽(如，用于体内靶定宿主细胞受体)，或有利于转运通过细胞膜(参见如Letsinger等，1989，Proc.Natl.Acad.Sci.USA 86：6553-6556；Lemaitre等，1987，Proc.Natl.Acad.Sci.USA 84：648-652；PCT公开号WO88/09810)或血脑屏障的试剂(参见如PCT公开号WO 89/10134)。此外，可用启动的杂交裂解试剂修饰寡核苷酸(参见如，Krol等，1988，Bio/Techniques 6：958-976)或嵌入试剂(参见如，Zon，1988，Pharm.Res.5：539-549)。为此，寡核苷酸可与其它分子缀合，如，肽、启动杂交的交联剂、运输载体、启动杂交的裂解剂等。

本发明也包括分子信标核酸，其具有至少一个区，该区能与本发明核酸互补，使得该分子信标可用于样本中本发明核酸的定量。“分子信标”核酸是一种包含一对互补区并具有与之相连的荧光团和荧光猝灭剂的核酸。荧光团和猝灭剂以这样的定向连接于该核酸的不同部分，当互补区相互退火时，猝灭剂猝灭了荧光团的荧光。当该核酸的互补区彼此间不退火时，荧光团的荧光被猝灭到较低程度。分子信标核酸描述于，例如，美国专利第5,876,930号中。

II.分离的蛋白和抗体

本发明的一个方面涉及分离的标记物蛋白及其生物活性部分，也关于合适作为免疫原来提取抗标记物蛋白或其片段的抗体的多肽片段。在一个实施方案中，通过使用标准蛋白纯化技术的合适纯化方法可从细胞或组织来源的物质中分离出天然的标记物蛋白。在另一个实施方案中，通过重组DNA技术产生包含标记物蛋白全部或片段的蛋白或肽。对于重组表达，还可选择的是使用化学肽合成技术合成这样的蛋白或肽。

“分离的”或“纯化的”蛋白或其生物活性片段是基本上不含有来自产生该蛋白的细胞或组织来源的细胞物质或其它污染蛋白，或当化学合成时，基本上不含有化合物前体或其它化合物。术语“基本上不含有细胞物质”包括在蛋白制备物，其中该蛋白与其中分离或重组产生这种蛋白的细胞的细胞成分分离。因此，蛋白基本上不含有细胞物质，包括具有小于约30％，20％，10％或5％(干重)的异源蛋白(在本文中也称为“污染蛋白”)的蛋白制备物。当该蛋白或其生物活性部分是重组产生时，也优选实际上不含有培养基，即培养基含量小于约20％，10％或5％的蛋白制备物的体积。当该蛋白通过化学合成产生时，优选基本上不含有化合物前体或其它化合物，即，在蛋白的合成过程中与化合物前体或其它化合物分离。因此，这样的蛋白制备物具有小于约30％，20％，10％，5％(干重)的化合物前体或除了感兴趣的多肽外的化合物。

标记物蛋白的生物活性部分包括多肽，该多肽包含与标记物蛋白的氨基酸序列基本上同一的或源自其的氨基酸序列，包括与全长蛋白相比更少的氨基酸，并显示相应全长蛋白的至少一种活性。通常，生物活性部分包含一个具有相应全长蛋白的至少一种活性的区域或基序。本发明标记物蛋白的生物活性部分可以是一种多肽，其长度是，例如10，25，50，100或更多个氨基酸。而且，在标记物蛋白所缺失的其它区域的其它生物活性部分可通过重组技术制备，并用于鉴定天然形式标记物蛋白的一或多种功能活性。

优选的标记物蛋白编码自核苷酸序列包含列于序列表中任一序列的序列。其它有用的蛋白与这些序列之一是基本上同一的(如，至少约40％，优选50％，60％，70％，80％，90％，95％或99％)，且保留相应天然存在的标记物蛋白的功能活性，但由于天然等位基因变异或诱变在氨基酸序列上不同。

为测定两个氨基酸序列或两个核酸之间的同一性百分数，比对序列以寻求最佳的比较效果(如，可在第一个氨基酸或核酸序列中导入空位以与第二个氨基酸或核酸序列进行最佳的比对)。接着比较在相应的氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当在第一个序列中一个位置与第二个序列中相应位置被同样的氨基酸或核苷酸占据时，那么该分子在该位点是相同的。两个序列间的同一性百分数序列所具有相同位置的数量的函数(即，％同一性＝#相同的位置数/总的#位置数(如，重叠的位置)×100)。在一个实施方案中，两个序列具有相同的长度。

可使用数学算法来确定两个序列之间的同一性百分数。一个优选的，非限制性的用于比较两个序列数学算法例子是Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 87：2264-2268的算法，其改良自Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90：5873-5877的算法。该算法被并入Altschul，等.(1990)J.Mol.Biol.215：403-410的BLASTN和BLASTX程序中。可用BLASTN程序进行BLAST核苷酸搜索，得分＝100，字符长度＝12以获得与本发明核酸分子同源的核酸序列。可用BLASTP程序进行BLAST蛋白搜索，得分＝50，字符长度＝3以获得与本发明蛋白分子同源的氨基酸序列。为获得用于比较目的的空位比对，可使用Altschul等.(1997)Nucleic Acids Res.25：3389-3402中所描述的称为有空位的(Gapped)BLAST的新版本BLAST算法，对于BLASTN，BLASTP和BLASTX程序，其能执行局部空位比对。可选地，PSI-Blast可用于执行重复搜索检测两个分子之间的远缘关系。当使用BLAST，有空位的BLAST和PSI-Blast程序时，使用各个程序(如，BLASTX和BLASTN)的默认参数。见http：//www.ncbi.nlm.nih.gov。另一个优选的，非限制性的用于序列比较的算法例子是Myers和Miller，(1988)CABIOS 4：11-17的算法。该算法被并入ALIGN程序(2.0版)中，该程序是GCG序列比对软件包的一部分。当使用ALIGN程序用于比较氨基酸序列时，可使用PAM120权重残基表，空位长度罚分为12，和空位罚分为4。然而另一个对于鉴定局部序列区域相似性和比对的有用的算法是FASTA算法，描述于Pearson和Lipman(1988)Proc.Natl.Acad.Sci.USA 85：2444-2448。当使用FASTA算法用于比较核苷酸或氨基酸序列时，例如，可使用具有κ-元组值为2的PAM 120权重残基表。

使用类似于那些上述的，允许有或不允许有空位的方法，可确定两个序列之间的同一性百分数。在计算同一性百分数中，仅有准确匹配被计算在内。

本发明也提供包含标记物蛋白或其片段的嵌合或融合蛋白。在本文中使用时，“嵌合蛋白”或“融合蛋白”包含可操作地连接到异源多肽(即，不同于标记物蛋白的多肽)的标记物蛋白的全部或部分(优选生物活性部分)。在融合蛋白中，术语“可操作地连接”用来表示标记物蛋白或其片段和异源多肽互相进行符合读框的融合。异源多肽可融合到标记物蛋白或片段的氨基末端或羧基末端。

一种有用的融合蛋白是GST融合蛋白，其中标记物蛋白或片段融合到GST序列的羧基末端。这样的融合蛋白能方便本发明重组多肽的纯化。

在另一个实施方案中，融合蛋白在其氨基末端含有异源信号序列。例如，能除去标记物蛋白的天然信号序列并用来自另外蛋白的信号序列取代。例如，杆状病毒包膜蛋白的gp67分泌序列可用作为异源信号序列(Ausubel等，编，Current Protocols in Molecular Biology，John Wiley & Sons，NY，1992)。其它真核异源信号序列的例子包括蜂毒肽和人胎盘碱性磷酸酶的分泌序列(Stratagene；La Jolla，California)。还在另一个例子中，有用的原核异源信号序列包括phoA分泌信号(Sambrook等，出处同上)和蛋白A分泌信号(PharmaciaBiotech；Piscataway，New Jersey)。

还在另一个实施方案中，融合蛋白是一种免疫球蛋白融合蛋白，其中标记物蛋白的全部或部分与源自免疫球蛋白家族一员的序列融合。本发明的免疫球蛋白融合蛋白可掺入药物组合物中并给予患者以抑制配体(可溶的或膜结合的)与细胞表面蛋白(受体)之间的相互作用，因此抑制了体内信号转导。免疫球蛋白融合蛋白可用于影响标记物蛋白的同源配体的生物利用度。配体/受体相互作用的抑制在治疗上能用于治疗增生和分化紊乱，并用于调节(如，促进或抑制)细胞存活。此外，本发明的免疫球蛋白融合蛋白可用作为免疫原在患者体中来产生抗标记物蛋白的抗体，来纯化配体和在筛选试验中鉴定抑制标记物蛋白与配体相互作用的分子。

本发明的嵌合和融合蛋白可通过标准的重组DNA技术产生。在另一个实施方案中，通过常规技术包括自动化DNA合成仪可合成融合基因。可选地，使用锚定引物可进行基因片段的PCR扩增，所述锚定引物产生了两个连续的基因片段之间的互补的突出物，所述突出物随后退火并再扩增产生嵌合基因序列(参见如，Ausubel等，出处同上)。此外，许多也编码融合部分(如，GST多肽)的表达载体是商业上可获得的。编码本发明多肽的核酸可克隆入上述表达载体中使得融合部分与本发明的多肽进行符合读框的连接。

使用信号序列可便于标记物蛋白的分泌和分离。信号序列通常通过疏水氨基酸核而被鉴定，在一或更多的裂解过程中该疏水氨基酸核通常裂解自分泌过程中的成熟蛋白。当成熟蛋白通过分泌途径时，含有加工位点的上述信号肽可允许信号序列从成熟蛋白上裂解下来。因此，本发明涉及具有信号序列的标记物蛋白、融合蛋白或其片段，以及涉及信号序列已经蛋白水解裂解的上述蛋白(即，裂解产物)。在一个实施方案中，在表达载体中编码信号序列的核酸序列能可操作地连接感兴趣的蛋白，如标记物蛋白或其片段。信号序列指导蛋白的分泌，如从该表达载体所转染的真核宿主中，且该信号序列随后或同时被裂解。接着通过本领域所众所周知的方法能容易地从细胞外培养基中纯化蛋白。可选地，通过使用能便于纯化的序列，如具有GST结构域的，信号序列能被连接到感兴趣的蛋白。

本发明也涉及标记物蛋白变体。该变体具有改变的氨基酸序列，其能起激动剂(模拟物)或拮抗剂的作用。通过诱变作用能产生变体，如不连续的点突变或截短。激动剂能基本上保持相同或部分的蛋白天然存在形式的生物活性。蛋白的拮抗剂能抑制一或多种蛋白天然存在形式的活性，通过例如，竞争性结合细胞信号级联的下游或上游元件，包括感兴趣的蛋白。因此，通过用具有有限功能的变体治疗能引发特定的生物效应。相对于用蛋白天然形式的治疗，用具有部分蛋白天然存在形式的生物活性的变体治疗患者可在患者中产生更少的副作用。

能起激动剂(模拟物)或拮抗剂作用的标记物蛋白变体可通过筛选本发明蛋白的突变体组合文库，如截短突变体组合文库，以鉴定激动剂或拮抗剂活性。在一个实施方案中，通过在核酸水平上组合诱变产生变体杂文库(variegated library)，以及该变体杂文库编码自杂基因文库(variegated gene library)。变体杂文库可通过，例如，合成的寡核苷酸混合物通过酶连接入基因序列，使得潜在蛋白序列的简并组表达为单独多肽，或可选地，表达为一组大的融合蛋白(如，对于噬菌体展示而言)。许多方法能用于从简并的寡核苷酸序列产生标记物蛋白潜在变体文库。用于合成简并寡核苷酸的方法是本领域众所周知的(见，例如，Narang，1983，Tetrahedron 39：3；Itakura等，1984，Annu.Rev.Biochem.53：323；Itakura等，1984，Science 198：1056；Ike等，1983 Nucleic Acid Res.11：477)。

另外，标记物蛋白片段文库可用于产生多肽杂群(variegatedpopulation)用于筛选和随后标记物蛋白或其片段变体的选择。例如，可产生编码序列片段文库，包括：通过在每个分子仅存在约一个切口条件下，用核酸酶处理感兴趣的编码序列的双链标准PCR片段，退火该双链DNA，复性该DNA以形成双链DNA，该双链DNA包括来自不同带切口产物的有义/反义对，通过用S1核酸酶从重新形成的双链体上切除单链部分，并将产生的片段连接如表达载体中。通过这种方法，可得到编码不同大小的感兴趣蛋白氨基末端和内部片段的表达文库。

本领域已知一些技术，可用于筛选通过点突变或截短产生的组合文库基因产物，和用于筛选具有所选特性的基因产物的cDNA文库。最普遍使用的技术应适用于高通量分析，对于筛选大基因文库而言，通常包括将基因文库克隆入可复制的表达载体中，用所产生的载体文库转染合适的细胞，和在其中所需活性的检测便于编码其产物被检测的基因的载体的分离的条件下，表达该组合基因。回归总体诱变(REM)，一种能增加功能突变体在文库中出现频率的技术，可与筛选试验结合使用来鉴定本发明蛋白的变体(Arkin和Yourvan，1992，Proc.Natl.Acad.Sci.USA 89：7811-7815；Delgrave等，1993，ProteinEngineering 6(3)：327-331)。

本发明另一个方面涉及抗本发明蛋白的抗体。在优选实施方案中，该抗体特异性结合标记物蛋白或其片段。可交换使用的术语“抗体”和“抗体”指免疫球蛋白分子和包含其免疫活性部分的片段和衍生物(即，上述部分含有抗原结合位点，其能特异性结合抗原，例如标记物蛋白，如标记物蛋白的表位)。能特异性结合本发明蛋白的抗体是一种能结合该蛋白，但在样本中，如天然含有该蛋白的生物样本中基本上不结合其它分子的抗体。免疫球蛋白分子的免疫活性部分的例子包括，但不限于，单链抗体(scAb)、F(ab)和F(ab′)₂片段。

本发明分离的蛋白或其片段可用作为免疫原来产生抗体。可使用全长蛋白或，可选地，本发明提供了用作为免疫原的抗原肽片段。本发明蛋白的抗原肽包含至少8个(优选10，15，20或30或更多个)本发明蛋白之一的氨基酸序列的氨基酸残基，和包含至少一个该蛋白的表位，使产生的抗该肽抗体与该蛋白形成免疫复合物。优选的表位包含位于蛋白表面区，如亲水区的抗原肽。疏水性序列分析、亲水性序列分析、或类似的分析可用于鉴定亲水区。在优选的实施方案中，一种分离的标记物蛋白或其片段用作为免疫原。

免疫原通常用于制备抗体，通过免疫合适的(即，免疫活性的)对象，如兔、山羊、小鼠或其它哺乳动物或脊椎动物。一种合适的免疫原制剂包含，例如，重组体表达或化学合成的蛋白或肽。该制剂可进一步包括一种佐剂，如福氏完全或不完全佐剂，或一种类似的免疫刺激剂。优选的免疫原组合物是那些不含有其它人蛋白的，例如，使用非人宿主细胞重组表达本发明蛋白得到的免疫原组合物。在该方法中，所产生的抗体组合物具有与除本发明蛋白外的其它人蛋白减少的结合或不结合。

本发明提供了多克隆和单克隆抗体。术语“单克隆抗体”或“单克隆抗体组合物”，在本文中使用时，指仅含有一种能与特定的表位起免疫反应的抗原结合位点的抗体分子的群体。优选的多克隆和单克隆抗体组合物是一种抗本发明蛋白的抗体已选择的组合物。特别优选的多克隆和单克隆抗体制剂是一种仅含有抗标记物蛋白或其片段的抗体的制剂。

多克隆抗体可通过用本发明的蛋白作为免疫原免疫合适的对象制备。通过标准方法可全程监测免疫对象中的抗体浓度，如通过使用固定化多肽的酶联免疫吸附测定(ELISA)。在免疫后的合适时间点，如，当特异性抗体浓度最高时，从对象中获得产生抗体的细胞并通过标准技术用于制备单克隆抗体(mAb)，如杂交瘤技术，最初描述于Kohler和Milstein(1975)Nature 256：495-497，人B细胞杂交瘤技术(见Kozbor等，1983，Immunol.Today 4：72)，EBV-杂交瘤技术(见Cole等，Monoclonal Antibodies and Cancer Therapy中pp.77-96，AlanR.Liss，Inc.，1985)或三体杂交瘤技术。用于产生杂交瘤的技术是众所周知的(通常见，Current Protocols in Immunology，Coligan等，编，John Wiley & Sons，New York，1994)。通过对杂交瘤培养物上清液筛选结合感兴趣多肽的抗体可检测产生本发明单克隆抗体的杂交瘤细胞，如，使用标准ELISA方法。

可选的为制备分泌单克隆抗体的杂交瘤，通过用感兴趣的多肽筛选组合免疫球蛋白文库(如，抗体噬菌体展示文库)可鉴定并分离抗本发明蛋白的单克隆抗体。用于产生和筛选噬菌体展示文库的试剂盒是商业上可获得的(如，Pharmacia重组噬菌体抗体系统，目录号27-9400-01；和Stratagene SurfZAP噬菌体展示试剂盒，目录号240612)。此外，特别适用于产生和筛选抗体展示文库的方法和试剂的例子可发现于，例如，美国专利第5,223,409号；PCT公开号WO 92/18619；PCT公开号WO 91/17271；PCT公开号WO 92/20791；PCT公开号WO92/15679；PCT公开号WO 93/01288；PCT公开号WO 92/01047；PCT公开号WO 92/09690；PCT公开号WO 90/02809；Fuchs等.(1991)Bio/Technology 9：1370-1372；Hay等.(1992)Hum.Antibod.Hybridomas3：81-85；Huse等.(1989)Science 246：1275-1281；Griffiths等.(1993)EMBO J.12：725-734。

本发明也提供了特异性结合本发明蛋白的重组抗体。在优选的实施方案中，该重组抗体特异性结合标记物蛋白或其片段。重组抗体包括，但不限于，嵌合和人源化单克隆抗体，包含人和非人部分，单链抗体或多特异性抗体。嵌合抗体是一种其中不同部分源自不同动物种类的分子，如那些具有源自鼠mAb的可变区和人免疫球蛋白恒定区的(参见如Cabilly等，美国专利第4,816,567号；和Boss等，美国专利第4,816,397号，其全文在此合并作为参考)。单链抗体具有由单个多肽组成的抗原结合位点。它们可通过本领域已知的技术生产，例如使用描述于Ladner等，美国专利第4,946,778号(其全文在此合并作为参考)；Bird等，(1988)Science 242：423-426；Whitlow等，(1991)Methods in Enzymology 2：1-9；Whitlow等，(1991)Methods inEnzymology 2：97-105；和Huston等，(1991)Methods in EnzymologyMolecular Design and Modeling：Concepts and Applications 203：46-88的方法。多特异性抗体是具有至少两个特异性结合不同抗原的抗原结合位点的抗体分子。这样的分子可通过本领域已知的技术生产，例如使用描述于Segal，美国专利第4,676,980号(其所公开的全文在此合并作为参考)；Holliger等，(1993)Proc.Natl.Acad.Sci.USA90：6444-6448；Whitlow等，(1994)Protein Eng.7：1017-1026和美国专利第6,121,424号的方法。

人源化抗体是来自非人物种的具有一或多个来自非人物种互补决定区(CDRS)和来自人免疫球蛋白分子框架区的抗体分子(参见如，Queen，美国专利第5,585,089号，其全文在此合并作为参考)。人源化单克隆抗体可通过本领域已知的重组DNA技术生产，例如使用描述于PCT公开号WO 87/02671；欧洲专利申请号184,187；欧洲专利申请号171,496；欧洲专利申请号173,494；PCT公开号WO86/01533；美国专利第4,816,567号；欧洲专利申请号125,023；Better等.(1988)Science240：1041-1043；Liu等.(1987)Proc.Natl.Acad.Sci.USA 84：3439-3443；Liu等.(1987)J.Immunol.139：3521-3526；Sun等.(1987)Proc.Natl.Acad.Sci.USA 84：214-218；Nishimura等.(1987)Cancer Res.47：999-1005；Wood等.(1985)Nature 314：446-449；和Shaw等.(1988)J.Natl.Cancer Inst.80：1553-1559)；Morrison(1985)Science229：1202-1207；Oi等.(1986)Bio/Techniques 4：214；美国专利第5,225,539号；Jones等.(1986)Nature 321：552-525；Verhoeyan等.(1988)Science 239：1534；和Beidler等.(1988)J.Immunol.141：4053-4060。

更优选地，人源化抗体可产生自，例如，使用不能表达内源性免疫球蛋白重链和轻链基因，但能表达人重链和轻链基因的转基因小鼠。用选定的抗原，如相应于本发明标记物的多肽的全部或部分，以常规方法免疫转基因小鼠。使用常规杂交瘤技术可获得抗该抗原的单克隆抗体。通过在B细胞分化过程中转基因小鼠重排，进行了人免疫球蛋白转基因，和随后经历了类转换和体细胞突变。因此，使用该技术，可产生在治疗上有用的IgG、IgA和IgE抗体。用于生产人抗体该技术的综述见Lonberg和Huszar(1995)Int.Rev.Immunol.13：65-93)。用于生产人抗体和人单克隆抗体技术的详细讨论以及用于生产上述抗体的实验方法参见如美国专利第5,625,126号；美国专利第5,633,425号；美国专利第5,569,825号；美国专利第5,661,016号和美国专利第5,545,806号。此外，公司如Abgenix，Inc.(Freemont，CA)使用类似于上述的技术可允诺提供抗选定的抗原的人抗体。

使用称为“引导选择”的技术可产生识别选定表位的完整人抗体。在该方法中，选定的非人单克隆抗体，如鼠抗体，被用于引导选择识别相同表位的完整人抗体(Jespers等，1994，Bio/technology 12：899-903)。

本发明的抗体在产生(如，从对象的血液或血清)或合成后可通过众所周知的技术分离，并进一步纯化。例如，使用蛋白A层析可纯化IgG抗体。通过如亲和层析，对本发明蛋白特异的抗体可被选择或(如，部分纯化)或纯化。例如，如在本文中所描述的，产生重组表达和纯化(或部分纯化)的本发明的蛋白，并共价地或非共价地偶联到固相载体，如层析柱。接着用该柱子亲和纯化对本发明蛋白特异的抗体，该抗体来自含有抗许多表位的抗体的样本，因此产生了基本上纯化的抗体组合物，即，一种基本上不含有污染抗体的抗体。在上下文中，基本上纯化的抗体组合物表示抗体样本含有至多仅30％(干重)的污染抗体，该抗体所抗的表位不同于本发明所需蛋白的那些表位，和优选至多20％，还更优选至多10％，和最优选至多5％(干重)的样本是污染抗体。纯化的抗体组合物指组合物中至少99％的抗体是抗本发明所需蛋白。

在一个优选实施方案中，本发明基本上纯化的抗体可特异性结合本发明蛋白的信号肽、分泌序列、胞外域、跨膜或胞质域或细胞质膜。在一个特别优选的实施方案中，本发明基本上纯化的抗体特异性结合本发明蛋白氨基酸序列的分泌序列或胞外域。在一个更优选的实施方案中，本发明基本上纯化的抗体特异性结合标记物蛋白氨基酸序列的分泌序列或胞外域。

通过标准技术，如亲和层析或免疫沉淀，抗本发明蛋白的抗体可用于分离蛋白。此外，该抗体可用于检测标记物蛋白或其片段(如，在细胞裂解液或细胞上清液中)以评估标记物表达的水平和分布。该抗体也可用于诊断以监测组织或体液中(如，在子宫颈相关体液中)蛋白水平，作为临床试验程序的一部分，如，用于确定给定治疗的用药法的有效性。通过使用抗体衍生物，其包含偶联有可检测物质的本发明的抗体，可有利于检测。可检测物质的例子包括多种酶、辅基、荧光物质、发光物质、生物发光物质和放射性物质。合适的酶的例子包括辣根过氧化酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶；合适的辅基复合物的例子包括抗生物素蛋白链菌素/生物素和抗生物素蛋白/生物素；合适的荧光物质的例子包括伞形酮、荧光素、异硫氰酸荧光素、若丹明、二氯三吖嗪胺荧光素(dichlorotriazinylaminefluorescein)、丹磺酰氯或藻红蛋白；发光物质的例子包括鲁米诺；生物发光物质的例子包括荧光酶、虫荧光素和水母发光蛋白，以及合适的放射性物质的例子包括¹²⁵I、¹³¹I、³⁵S或³H。

在治疗癌症中本发明的抗体也可用作为治疗剂。在一个优选实施方案中，本发明完整的人抗体被用于治疗性处理人癌症患者，特别是那些患子宫颈癌的患者。在另一个优选实施方案中，特异性结合标记物蛋白或其片段的抗体被用于治疗性处理。此外，该治疗性抗体可以是抗体衍生物或免疫毒素，包含缀合有治疗部分如细胞毒素、治疗剂或放射性金属离子的抗体。细胞毒素或细胞毒素剂包括任何对细胞有害的试剂。例子包括紫杉醇、细胞松弛素B、短杆菌肽D、溴化乙锭、吐根碱、丝裂霉素、鬼臼乙叉甙、鬼臼噻吩苷、长春新碱、长春碱、秋水仙碱、阿霉素、柔红霉素、二羟基炭疽菌素二酮(dihydroxyanthracin dione)、米托蒽醌、光辉霉素，放线菌素D、1-去氢睾甾酮、糖皮质激素、普鲁卡因、丁卡因、利多卡因、萘氧丙醇胺和嘌呤霉素以及它们的类似物或同系物。治疗剂包括，但不限于，抗代谢物(如，甲氨蝶呤、6-巯基嘌呤、6-硫鸟嘌呤、阿糖胞苷、5-氟尿嘧啶氨烯咪胺)，烷化剂(如，氮芥、thioepa苯丁酸氮芥、苯丙氨酸氮芥、卡氮芥(BSNU)和罗氮芥(CCNU)、cyclothosphamide、白消安、二溴甘露醇、链唑霉素、丝裂霉素C和顺铂(II)(DDP))，蒽环类抗生素(如，柔红霉素(原柔红霉素)和阿霉素)，抗生素(如，放线菌素D(原放线菌素)、博来霉素、光辉霉素和安曲霉素(AMC))，和抗有丝分裂剂(如，长春新碱和长春碱)。

本发明缀合的抗体可用于减轻特定的生物反应，对于药物部分而言，并不解释为限制经典的化学治疗剂。例如，药物部分可以是具有所需生物活性的蛋白或多肽。该蛋白可包括，例如，毒素，如核糖体抑制蛋白(见，Better等，美国专利第6,146,631号，其所公开的全文在此合并作为参考)，相思豆毒素、蓖麻毒素A、假单胞菌外毒素或白喉毒素；蛋白，如肿瘤坏死因子、α-干扰素、β-干扰素、神经生长因子、血小板衍生的生长因子、组织纤维蛋白溶酶原激活剂；或，生物反应调节剂，如，淋巴因子、白介素-1(“IL-1”)、白介素-2(“IL-2”)、白介素-6(“IL-6”)、粒细胞-巨噬细胞集落刺激因子(“GM-CSF”)、粒细胞集落刺激因子(“G-CSF”)或其它生长因子。

用于将上述治疗部分缀合到抗体的技术是众所周知的，参见如，Arnon等，“Monoclonal Antibodies ForImmunotargeting Of Drugs InCancer Therapy”，in Monoclonal Antibodies And Cancer Therapy，Reisfeld等.(编)，pp.243-56(Alan R.Liss，Inc.1985)；Hellstrom等，“Antibodies For Drug Delivery”，in Controlled Drug Delivery(第二版)，Robinson等.(编)，pp.623-53(Marcel Dekker，Inc.1987)；Thorpe，“Antibody Carriers Of Cytotoxic Agents In Cancer Therapy：A Review”，in Monoclonal Antibodies′84：Biological And ClinicalApplications，Pinchera，等，(编)，pp.475-506(1985)；“Analysis，Results，And Future Prospective Of The Therapeutic Use OfRadiolabeled Antibody In Cancer Therapy”，in Monoclonal AntibodiesFor Cancer Detection And Therapy，Baldwin等，(编)，pp.303-16(Academic Press 1985)，和Thorpe等，“THE Preparation AndCytotoxic Properties Of Antibody-Toxin Conjugates”，Immunol.Rev.，62：119-58(1982)。

因此，在一方面，本发明提供了基本上纯化的抗体、抗体片段和衍生物，其全部都特异性结合本发明的蛋白，以及优选地，结合标记物蛋白。在各种实施方案中，本发明基本上纯化的抗体，或其片段或衍生物，可以是人、非人、嵌合和/或人源化抗体。在另一方面，本发明提供了非人抗体、抗体片段和衍生物，其全部都特异性结合本发明的蛋白，以及优选地，结合标记物蛋白。上述非人抗体可以是山羊、小鼠、绵羊、马、小鸡、兔或大鼠抗体。可选地，本发明的非人抗体可以是嵌合和/或人源化抗体。此外，本发明的非人抗体可以是多克隆抗体或单克隆抗体。还在另一方面，本发明提供了单克隆抗体、抗体片段和衍生物，其全部都特异性结合本发明的蛋白，以及优选地，结合标记物蛋白。单克隆抗体可以是人、人源化、嵌合和/或非人抗体。

本发明也提供了一种试剂盒，其含有缀合有可检测物质的本发明抗体和使用说明书。本发明的另一方面是包含本发明抗体的药物组合物。在一个优选实施方案中，药物组合物包含一种本发明的抗体和一种药学上可接受的载体。

III.重组表达载体和宿主细胞

本发明的另一方面涉及载体，优选表达载体，含有编码标记物蛋白(或该蛋白一部分)的核酸。在本文中使用时，术语“载体”指能转运与它连接的另一种核酸的核酸分子。一种类型的载体是“质粒”，指一种环状双链DNA，在它上面可以连接其它DNA片段。另一种类型的载体是病毒载体，可以将其它DNA片段连接到该病毒基因组上。某些载体在其所导入的宿主细胞中能自主复制(如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其它载体(如，非附加型哺乳动物载体)在导入该宿主细胞的条件下被整合入宿主细胞基因组中，以及因此与宿主基因组一起复制。此外，某些载体，称为表达载体，能指导可操作地与它连接的基因的表达。一般而言，在重组DNA技术中所用的表达载体通常是质粒(载体)的形式。然而，本发明还包括这样的其它形式的表达载体，如病毒载体(如，复制缺陷型反转录病毒、腺病毒和腺伴随病毒)，它们能发挥相同的功能。

本发明的重组表达载体包含本发明的核酸，其以合适于在宿主细胞中表达该核酸的形式存在。意味着该重组表达载体包括一或多种调节序列，根据要用于表达的宿主细胞选择该序列，其可操作地连接要表达的核酸序列。重组表达载体中“可操作地连接”规定为表示感兴趣的核苷酸序列以一种能够表达该核苷酸序列的方式连接到调节序列(如，当该载体导入宿主细胞时，存在一种体外转录/翻译系统或宿主细胞中)。术语“调节序列”意在包括启动子、增强子和其它表达调控元件(如，多腺苷酸化信号)。上述调节序列被描述，例如，于Goeddel，Methods in Enzymology：Gene Expression Technology vol.185，Academic Press，San Diego，CA(1991)中。调节序列包括那些在许多种宿主细胞中指导核苷酸序列组成型表达的和那些仅在某些宿主细胞中指导核苷酸序列表达的序列(如，组织特异性调节序列)。本领域的技术人员可以理解的是表达载体的设计可基于这些因素，如所选择的要转化的宿主细胞、所需蛋白的表达水平和类似的。本发明的表达载体可导入宿主细胞中，因此产生蛋白或多肽，包括融合蛋白或多肽，由本文所述的核酸编码。

本发明的重组表达载体可设计用于在原核(如，大肠杆菌)或真核细胞(如，昆虫细胞{使用杆状病毒表达载体}、酵母细胞或哺乳动物细胞)中表达标记物蛋白或其片段。合适的宿主细胞进一步讨论于Goeddel，出处同上。可选地，重组表达载体可在体外转录并翻译，例如使用T7启动子调节序列和T7聚合酶。

在原核生物中进行的蛋白表达最通常在大肠杆菌中进行，采用含有指导融合或非融合蛋白表达的组成型或诱导型启动子的载体。融合载体添加许多氨基酸到编码蛋白中，通常在重组蛋白的氨基末端。上述融合载体一般提供三种用途：1)增加重组蛋白的表达；2)增加重组蛋白的可溶性；和3)通过在亲和纯化中作为配体有助于重组蛋白的纯化。通常，在融合表达载体中，在融合部分和重组蛋白连接处导入蛋白酶裂解位点，以便能够在纯化融合蛋白后将重组蛋白与融合部分分离。上述酶和它们的相关识别序列，包括因子Xa、凝血酶和肠激酶。典型的融合表达载体包括分别与目标重组蛋白融合有谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A的pGEX(Pharmacia BiotechInc；Smith和Johnson，1988，Gene 67：31-40)，pMAL(New EnglandBiolabs，Beverly，MA)和pRIT5(Pharmacia，Piscataway，NJ)。

合适的诱导型非融合大肠杆菌表达载体的例子包括pTrc(Amann等，1988，Gene 69：301-315)和pET 11d(Studier等，p.60-89，GeneExpression Technology：Methods in Enzymology vol.185，AcademicPress，San Diego，CA，1991)。来自pTrc载体的目标基因表达取决于从杂交的trp-lac融合启动子启动的宿主RNA聚合酶转录。来自pET11d载体的目标基因表达取决于从T7gn10-lac融合启动子启动的通过病毒RNA聚合酶(T7gn1)共表达介导的转录。在lacUV5启动子转录控制的条件下，通过T7 gn1基因的驻留原噬菌体的宿主菌株BL21(DE3)或HMS174(DE3)提供了病毒聚合酶。

一种使大肠杆菌中重组蛋白表达增强的方法是在具有受抑制的蛋白酶裂解重组蛋白能力的细菌宿主中表达该蛋白(Gottesman，p.119-128，Gene Expression Technology：Methods in Enzymology vol.185，Academic Press，San Diego，CA，1990)。另一种方法是改变要被插入表达载体的核酸的核酸序列，使得对于每个氨基酸而言各自的密码子是那些在大肠杆菌中能优先利用的(Wada等，1992，Nucleic AcidsRes.20：2111-2118)。上述本发明核酸序列的改变可通过标准的DNA技术进行。

在另一个实施方案中，表达载体是酵母表达载体。在酿酒酵母(S.Cerevisiae)中用于表达的载体的例子包括pYepSec1(Baldari等，1987，EMBO J.6：229-234)，pMFa(Kurjan和Herskowitz，1982，Cell 30：933-943)，pJRY88(Schultz等，1987，Gene 54：113-123)，pYES2(Invitrogen Corporation，San Diego，CA)和pPicZ(InvitrogenCorp，San Diego，CA)。

可选地，表达载体是杆状病毒表达载体。可用于在培养的昆虫细胞(如，Sf9细胞)中表达蛋白的杆状病毒表达载体包括pAc系列(Smith等，1983，Mol.Cell.Biol.3：2156-2165)和pVL系列(Luchlow和Summers，1989，Virology 170：31-39)。

还在另一个实施方案中，使用哺乳动物表达载体在哺乳动物细胞中表达本发明的核酸。哺乳动物表达载体的例子包括pCDM8(Seed，1987，Nature 329：840)和pMT2PC(Kaufman等，1987，EMBO J.6：187-195)。当用于哺乳动物细胞时，表达载体的控制功能通常提供自病毒调控元件。例如，一般使用的启动子是来源自多瘤病毒、腺病毒2、巨细胞病毒和猿猴病毒40。其它合适于原核和真核细胞的表达系统见Sambrook等，出处同上，的16和17章。

在另一个实施方案中，重组哺乳动物表达载体能够优先在特定细胞类型中指导核酸表达(如，组织特异性调控元件被用于表达核酸)。组织特异性调控元件为本领域已知。合适的组织特异性启动子非限制性例子包括白蛋白启动子(肝特异性；Pinkert等，1987，Genes Dev.1：268-277)，淋巴特异性启动子(Calame和Eaton，1988，Adv.Immunol.43：235-275)，特别是T细胞受体(Winoto和Baltimore，1989，EMBOJ.8：729-733)和免疫球蛋白的启动子(Banerji等，1983，Cell33：729-740；Queen和Baltimore，1983，Cell 33：741-748)，神经细胞特异性启动子(如，神经微丝启动子；Byrne和Ruddle，1989，Proc.Natl.Acad.Sci.USA 86：5473-5477)，胰腺特异性启动子(Edlund等，1985，Science 230：912-9160)和乳腺特异性启动子(如，牛奶乳清启动子；美国专利第4,873,316号和欧洲专利公开号264,166)。也包含发育调节启动子，例如鼠hox启动子(Kessel和Gruss，1990，Science249：374-379)和α-胎蛋白启动子(Camperand Tilghman，1989，GenesDev.3：537-546)。

本发明进一步提供了包含克隆入表达载体反义方向的本发明DNA分子的重组表达载体。就是说，该DNA分子以一种允许RNA分子表达的方式(通过该DNA分子的转录)可操作地连接调节序列，该RNA分子反义于编码本发明多肽的mRNA。与克隆入反义方向核酸可操作地连接的调节序列可选自指导反义RNA分子在不同细胞中连续表达的序列，例如病毒启动子和/或增强子，或调节序列可选自指导反义RNA组成型、组织特异性或细胞特异性表达的序列。反义表达载体可以是重组质粒、噬菌粒或减毒病毒，其中在高效调节区调控下产生反义核酸，其活性可通过该载体导入的细胞类型来决定。调节使用反义基因的基因表达的讨论见Weintraub等，1986，Trends in Genetics，Vol.1(1)。

本发明的另一方面涉及已导入本发明重组表达载体的宿主细胞。术语“宿主细胞”和“重组宿主细胞”在本文中可交换地使用。可以理解的是该术语不仅指特定的受试者细胞，也指该细胞后代或潜在的后代。因为，由于突变或环境影响，某些修饰可存在于后代中，所以后代实际上与亲本细胞并不相同，但仍包括在本文中所使用的该术语的范围内。

宿主细胞可以是任何原核(如，大肠杆菌)或真核细胞(如，昆虫细胞、酵母或哺乳动物细胞)。

通过常规的转化或转染技术，载体DNA可导入原核或真核细胞中。在本文中使用时，术语“转化”和“转染”规定为指将外源核酸导入宿主细胞的多种本领域公认的技术，包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染或电穿孔。合适用于转化或转染宿主细胞的方法可发现于Sambrook等(出处同上)，和其它实验室手册。

为了稳定转染哺乳动物细胞，业已了解的是，根据所使用的表达载体和转染技术，仅有少数细胞可将外源DNA整合入它们基因组中。为鉴定和选择这些整合体，通常将编码选择标记(如，对抗生素有抗性的)的基因与感兴趣的基因一同导入宿主细胞中。优选的选择标记包括那些对药物如G418、潮霉素和甲氨蝶呤具抗性的标记。具有导入核酸的稳定转染细胞可通过药物筛选来鉴定(如，已整合选择标记的细胞将存活，而其它细胞则死亡)。

本发明的一种宿主细胞，如培养中的原核或真核宿主细胞可用于产生标记物蛋白或其片段。因此，本发明进一步提供了使用本发明的宿主细胞用于生产标记物蛋白或其片段的方法。在一个实施方案中，该方法包含在合适的培养基中培养本发明的宿主细胞(其中导入了编码标记物蛋白或其片段的重组表达载体)，使得产生标记物蛋白或其片段。在另一个实施方案中，该方法进一步包含从培养基或宿主细胞中分离标记物蛋白或其片段。

本发明的宿主细胞也可用于产生非人转基因动物。例如，在一个实施方案中，本发明的宿主细胞是已导入编码标记物蛋白或其片段的序列的受精卵母细胞或胚胎干细胞。接着，该宿主细胞可用于产生非人转基因动物，其中编码本发明标记物蛋白的外源基因序列已导入它们的基因组中，或产生同源重组动物，其中编码标记物蛋白的外源基因已改变。上述动物可用于研究标记物蛋白的功能和/或活性，以及用于鉴定和/或评估标记物蛋白的调节剂。在本文中使用时，“转基因动物”指非人动物，优选哺乳动物，更优选啮齿动物如大鼠或小鼠，其中一或多个动物细胞包括转基因。其它的转基因动物的例子包括非人灵长类、绵羊、狗、奶牛、山羊、小鸡、两栖动物等。转基因是外源DNA，其整合入发育的转基因动物的细胞基因组中，以及在成熟动物的基因组中仍存在，因此在该转基因动物一或多种细胞型或组织中指导编码基因产物的表达。在本文中使用时，“同源重组动物”指非人动物，优选哺乳动物，更优选小鼠，其中在动物发育前，通过内源基因和导入动物细胞(如动物的胚细胞的)外源DNA分子之间同源重组改变了内源基因。

可通过将编码标记物蛋白的核酸导入受精卵母细胞的雄性原核中产生本发明的转基因动物，如通过显微注射、反转录病毒感染和将卵母细胞在假孕雌性养育动物体中发育。在转基因中也包括内含子序列和多腺苷酸化信号以增加该转基因表达效率。组织特异性调节序列可操作地与转基因连接以指导本发明多肽在特定细胞中的表达。通过胚胎操作和显微注射用于产生转基因动物，特别是动物，如小鼠的方法，已经成为本领域的常规方法，以及描述于，例如，美国专利第4,736,866号和4,870,009号，美国专利第4,873,191号和Hogan，Manipulating theMouse Embryo，Cold Spring HarborLaboratory Press，Cold SpringHarbor，N.Y.，1986中。类似的方法被用于产生其它的转基因动物。基于在其基因组中转基因的存在和/或编码转基因的mRNA在该动物组织或细胞中的表达可鉴定转基因生成动物。接着，转基因生成动物可用于繁殖带有转基因的其它动物。此外，具有转基因的转基因动物可进一步培育成具有其它转基因的转基因动物。

为产生同源重组动物，制备含有编码标记物蛋白的基因的至少一部分的载体，在该基因中已导入缺失、添加或取代，因此改变了该基因，如，功能上破坏。在一个优选实施方案中，载体可设计使得在同源重组下，内源基因功能上受到破坏(即，不再编码功能蛋白；也称为“敲除”载体)。可选地，载体可设计使得在同源重组下，内源基因突变或以别的方式改变，但仍然编码功能蛋白(如，上游调控区可改变，由此改变了该内源蛋白的表达)。在同源重组载体中，基因改变的部分在其5′和3′末端侧接有额外的基因核酸，以便于在载体携带的外源基因与胚胎干细胞中内源基因之间的同源重组产生。额外的侧接核酸序列具有足够的长度以便于成功地与内源基因同源重组。通常，几千个碱基的侧接DNA(在5′和3′末端)包括在载体中(参见如Thomas和Capecchi，1987，Cell 51：503 for a description of homologousrecombination vectors)。该载体被导入胚胎干细胞系中(如，通过电穿孔)，以及该细胞中导入的基因已与选定的内源基因同源重组(参见如，Li等，1992，Cell 69：915)。接着将选定的细胞注射到动物(如，小鼠)胚泡中以形成凝聚嵌合体(参见如Bradley，Teratocarcinomas andEmbryonic Stem Cells：A Practical Approach，Robertson，编.，IRL，Oxford，1987，pp.113-152)。接着，嵌合胚被植入合适的假孕雌性养育动物体中，并让该胚胎发育成熟。在它们生殖细胞中获得了同源重组DNA的后代可用于繁殖动物，其中通过种系传递转基因，该动物的所有细胞含有同源重组DNA。用于构建同源重组载体和同源重组动物的方法进一步描述于Bradley(1991)Current Opinion inBio/Technology 2：823-829和PCT公开号WO 90/11354，WO 91/01140，WO 92/0968，和WO 93/04169中。

在另一个实施方案中，可产生转基因非人动物，其含有能够调节转基因表达的选择系统。该系统的一个例子是噬菌体P1的cre/loxP重组酶系统。对于cre/loxP重组酶系统的描述参见如，Lakso等.(1992)Proc.Natl.Acad.Sci.USA 89：6232-6236。另一个重组酶系统的例子是酿酒酵母(Saccharomyces cerevisiae)的FLP重组酶系统(O′Gorman等，1991，Science 251：1351-1355)。如果cre/loxP重组酶系统用于调节转基因的表达，需要含有编码Cre重组酶和一种选定蛋白的转基因的动物。可通过构建“双”转基因动物来提供上述动物，如，通过将两种转基因动物交配，一种含有编码一种选定蛋白的转基因和另一种含有编码重组酶的转基因。

根据描述于Wilmut等.(1997)Nature 385：810-813和PCT公开号WO 97/07668及WO 97/07669中的方法也可产生非人转基因动物的克隆。

IV.药物组合物

可将本发明的核酸分子、多肽、和抗体(在本文中也被称为“活性化合物”)掺入适合施用的药物组合物中。所述所述组合物通常包含所述核酸分子、蛋白或抗体以及药学上可接受载体。在本文中所使用的术语“药学上可接受载体”意在包括与药用施用相容的任何或所有溶剂、分散介质、包衣剂、抗细菌和抗真菌剂、等渗和缓释吸收剂，及类似物。用于药用活性物质的所述介质和制剂的使用在本领域中是众所周知的。除非与所述活性化合物不相容，任何常见介质或制剂都可预见应用于所述组合物中。还可将补充性活性化合物掺入所述组合物中。

本发明包括制备调节核酸或蛋白标记物表达或活性的药物组合物的方法。所述方法包括把药学上可接受载体与调节核酸或蛋白标记物表达或活性的试剂相配伍。所述方法可进一步包括额外的活性物质。因此，本发明进一步包括用于制备药物组合物的方法，包括将药学上可接受载体与调节核酸或蛋白标记物表达或活性的试剂和一或多种额外的活性物质相配伍。

本发明也提供了鉴定调节物的方法(在本文中也被称为“筛选试验”)，调节物即候选或受试化合物或试剂(如，肽、模拟肽、类肽、小分子或其它药物)，其可以(a)与所述标记物结合，或(b)对所述标记物活性具有调节(如，刺激或抑制)效应，或更特别地(c)对所述标记物与其一个或多个天然底物(如，肽、蛋白、激素、辅因子或核酸)的相互作用具有调节效应，或(d)对所述标记物的表达具有调节效应。所述试验通常包含在所述标记物和一或多个试验成分之间的反应。其它成分可以是受试化合物本身，或是受试化合物与所述标记物天然结合配体的组合物。

本发明的受试化合物可从任何可能的来源获得，包括天然和/或合成化合物的系统文库。受试化合物也可通过本领域已知众多组合文库方法中的任一方法而获得，包括：生物文库；类肽文库(具有肽功能以及新的、非肽主链的分子文库，其抗酶降解但仍然具有生物活性；参见如Zuckermann等，1994，J.Med.Chem.37：2678-85)；立体寻址的平行固相或液相文库；需要解卷积的合成文库方法；“一珠一化合物”文库方法；以及使用亲合层析选择的合成文库方法。所述生物文库和类肽文库方法仅限用于肽文库，而所述其它四种方法可适用于化合物的肽、非肽寡聚物或小分子文库(Lam，1997，Anticancer Drug Des.12：145)。

分子文库合成方法的例子可在现有技术中找到，例如在：DeWitt等.(1993)Proc.Natl.Acad.Sci.U.S.A.90：6909；Erb等.(1994)Proc.Natl.Acad.Sci.USA 91：11422；Zuckermann等(1994).J.Med.Chem.37：2678；Cho等(1993)Science 261：1303；Carrell等(1994)Angew.Chem.Int.Ed.Engl 33：2059；Carell等(1994)Angew.Chem.Int.Ed.Engl 33：2061；以及在Gallop等(1994)J.Med.Chem.37：1233。

化合物文库可呈溶液形式(如，Houghten，1992，Biotechniques13：412-421)，或在珠(Lam，1991，Nature 354：82-84)、芯片(Fodor，1993，Nature 364：555-556)、细菌和/或孢子(Ladner，美国专利第5,223,409号)、质粒(Cull等，Proc.Natl.Acad.Sci.USA 1992，89：1865-1869)上或在噬菌体上(Scott和Smith，1990，Science249：386-390；Devlin，1990，Science 249：404-406；Cwirla等，1990，Proc.Natl.Acad.Sci.87：6378-6382；Felici，1991，J.Mol.Biol.222：301-310；Ladner，出处同上)。

在一个实施方案中，本发明提供了筛选候选或受试化合物的试验方法，其中所述化合物是蛋白的底物，所述蛋白由标记物或其生物活性部分编码或相应于标记物或其生物活性部分。在另一个实施方案中，本发明提供了筛选候选或受试化合物的试验方法，其中所述化合物与蛋白结合，所述蛋白由标记物或其生物活性部分编码或相应于标记物或其生物活性部分。可进行受试化合物直接与蛋白结合能力的测定，例如通过将所述化合物与放射性同位素或酶标记偶联，从而使所述化合物与标记物的结合可通过检测复合物中标记的标记物化合物来测定。例如，化合物(如标记物底物)可用¹²⁵I、³⁵S、¹⁴C或³H直接或间接地，以及能用放射辐射直接计数或闪烁计数检测的同位素来标记。可选地，试验成分可用如辣根过氧化物酶、碱性磷酸酶或荧光素酶、以及能检测合适底物转化为产物的酶标记来进行酶标记。

在另一个实施方案中，本发明提供了筛选候选或受试化合物的试验方法，其中所述化合物调节标记物的表达或蛋白的活性，所述蛋白由标记物或其生物活性部分编码或相应于标记物或其生物活性部分。在所有的可能性中，由标记物或其生物活性部分编码或相应于标记物或其生物活性部分的蛋白可在体内与一或多个分子相互作用，例如但不仅限于，肽、蛋白、激素、辅因子和核酸。为了论述的目的，所述细胞和细胞外分子在本文中被称为“结合配体”或标记物“底物”。

为了便于所述筛选，本发明的一个必要实施方案是使用由标记物或其生物活性部分编码或相应于标记物或其生物活性部分的蛋白鉴定蛋白天然的体内结合配体。对于本领域技术人员而言，有许多已知的方法可完成上述筛选。一个例子是在双杂交实验或三杂交实验中把标记物蛋白用作为“诱饵蛋白”(参见如美国专利第5,283,317号；Zervos等，1993，Cell 72：223-232；Madura等，1993，J.Biol.Chem.268：12046-12054；Bartel等，1993，Biotechniques 14：920-924；Iwabuchi等，1993 Oncogene 8：1693-1696；Brent WO94/10300)，以鉴定能与所述标记物(结合配体)结合或相互作用的其它蛋白，并因此可能涉及所述标记物的天然功能。所述标记物结合配体也可能涉及通过标记物蛋白或标记物蛋白介导的信号途径的下游元件进行的信号传播。可选地，所述标记物蛋白结合配体也被发现可以是所述标记物蛋白的抑制剂。

双杂交系统是基于大多数转录因子组件性质的，其由可分离的DNA结合和活化结构域组成。简而言之，所述试验方法利用两个不同的DNA构建体。在一个构建体中，编码标记物蛋白的基因与编码已知转录因子(如，GAL-4)的DNA结合域的基因融合。在另一个构建体中，来自DNA序列文库的编码未鉴定蛋白(“猎物”或“样本”)的DNA序列与编码已知转录因子活化结构域的基因融合。如果“诱饵”和“猎物”蛋白能在体内相互作用，形成标记物依赖的复合物，则转录因子的DNA结合和活化结构域变得很靠近。这种靠近使得与转录调节位点可操作地相连的报告基因(如，LacZ)的转录对转录因子相应。报告基因的表达可容易地被检测出，并且包括功能性转录因子的细胞集落可被分离并用于获得克隆的基因，所述基因编码与所述标记物蛋白相互作用的蛋白。

在另一个实施方案中，为鉴定调节(如正或负效应)标记物蛋白与其底物和/或结合配体之间相互作用的化合物，可通过应用本发明来设计试验方法。所述化合物可包括，但不仅限于，诸如抗体、肽、激素、寡核苷酸、核酸及其类似物的分子。所述化合物也可从任何可能的来源中获得，包括天然和/或合成化合物的系统文库。用于本实施方案中的优选的试验成分是在本文中鉴定出的子宫颈癌标记物蛋白、已知的结合配体和/或相同的底物、以及受试化合物。受试化合物可从任何来源获得。

用于鉴定干扰所述标记物蛋白与其结合配体之间相互作用的化合物的试验系统的基本原理涉及在足以使两个产物相互作用和结合从而形成复合物的条件和时间下，制备包括标记物蛋白及其结合配体的反应混合物。为测试试剂的抑制活性，在受试化合物存在或不存在的条件下制备反应混合物。受试化合物可一开始就包括在反应混合物中，或在加入标记物蛋白及其结合配体后再被添加。对照反应混合物在不存在受试化合物或具有安慰剂的条件下温育。然后检测所述标记物蛋白及其结合配体之间形成的任一复合物。对照反应中形成复合物，但在包含受试化合物的反应混合物中较少或没有所述的形成，表明所述化合物干扰标记物蛋白及其结合配体的相互作用。反之，在存在化合物的条件下比对照反应中形成了更多的复合物，表明所述化合物可增强标记物蛋白及其结合配体的相互作用。

可以异质(heterogeneous)或同质(homogeneous)形式进行干扰标记物蛋白及其结合配体相互作用的化合物的试验。异质试验包括把标记物蛋白或其结合配体锚定在固相上并在反应后检测锚定在固相上的复合物。同质试验中，在液相中进行整个反应。在两种方法中，可以改变添加反应物的顺序以获得不同的关于受试化合物的信息。例如，干扰标记物蛋白及其结合配体相互作用(如通过竞争)的化合物可通过在存在受试物质的条件下进行反应来鉴定，即在标记物及其相互反应的结合配体加入前或同时把受试物质加进反应混合物。可选地，受试化合物破坏形成的复合物，如能置换复合物中一个具有较高结合常数的化合物，可通过在复合物形成后把受试化合物加入反应混合物中来进行测试。所述不同的方式简要描述如下。

在异质试验系统中，标记物蛋白或其结合配体锚定在固体表面或基质上，而其它相应的非锚定成分可直接或间接地被标记。实际上，微滴定板常用于该方法。通过许多非共价或共价的方法固定锚定的物种，这些方法对本领域所属技术人员来说通常是众所周知的。经常仅通过用标记物蛋白或其结合配体溶液包被固体表面并烘干来进行非共价结合。可选地，锚定固定的试验成分的特异性抗体也可用于此。所述表面经常被预制备并储存起来。

在相关的实施方案中，提供一种融合蛋白，其增加了使一或两个试验成分锚定于基质的结构域。例如，谷胱甘肽-S-转移酶/标记物融合蛋白或谷胱甘肽-S-转移酶/结合配体可吸附于谷胱甘肽琼脂糖珠(Sigma Chemical，St.Louis，MO)或谷胱甘肽衍生化的微滴定板上，然后其与受试化合物，或与受试化合物与非吸附标记物或其结合配体化合，并且所述混合物在有利于形成复合物的条件(如生理条件)下温育。温育后，洗涤珠或微滴定板上的孔以直接或间接除去任何未结合的试验成分、未固定的试验复合物，例如，如上所述的。可选地，所述复合物可从基质上解离，并可利用标准技术确定标记物结合或活性水平。

其它把蛋白固定于基质上的技术也可用于本发明的筛选试验中。例如，标记物蛋白或标记物蛋白结合配体可以利用缀合生物素和抗生物素蛋白链菌素来固定。利用本领域已知技术(如，生物素化试剂盒，Pierce Chemicals，Rockford，IL)用生物素-NHS(N-羟基-琥珀酰亚胺)制备生物素化的标记物蛋白或靶分子，并固定于抗生物素蛋白链菌素包被的96孔板(Pierce Chemical)的孔中。在某些实施方案中，可预制备蛋白固定的表面并储存起来。

为了进行所述测试，固定的试验成分的相应部分与或不与受试化合物一起暴露于包被的表面。反应完成后，除去(如洗去)未反应的试验成分以及任何形成的复合物仍然固定于固相表面上。有许多方法可进行锚定在固相表面上的复合物的检测。在预标记的未固定的成分的位置，检测到固定在表面上的标记表明形成了复合物。在没有预标记的未固定的成分的位置，一种间接标记可用于检测锚定在表面上的复合物；如，利用对最初未固定物特异性的标记的抗体(所述抗体依次可直接标记或用如标记的抗Ig抗体来间接标记)。根据加入反应成分的顺序，可检测调节(抑制或增强)复合物形成的或破坏预形成复合物的受试化合物。

在本发明替换的实施方案中，可使用同质试验。这通常是一个与上述那些反应相似的反应，其在受试化合物存在或不存在的条件下在液相中进行。然后从未反应的成分中分离生成的复合物，并测定复合物的生成量。如异质试验系统所述的，反应物加入液相的顺序可得出受试化合物调节(抑制或增强)复合物形成和破坏预形成复合物的信息。

在所述的同质试验中，通过使用众多标准技术，包括但不仅限于：差速离心、层析、电泳和免疫沉淀，从未反应的试验成分中分离反应产物。在差速离心中，通过一系列离心步骤，根据基于复合物不同大小和密度的不同沉淀平衡状态，复合的分子可从未复合的分子中分离出来(参见如，Rivas，G.，和Minton，A.P.，Trens Biochem Sci 1993Aug；18(8)：284-7)。标准的层析技术也可用于从未复合的分子中分离复合的分子。例如，凝胶过滤层析以大小为基础，并通过利用层析柱中合适的凝胶过滤树脂分离分子，例如，相对较大的复合物可从相对较小的未复合成分中分离出来。相似地，复合物较之未复合分子相对不同的电荷性质可用来从残留的反应物单体中特异分离所述复合物，例如通过应用离子交换层析树脂。所述树脂和层析技术对本领域技术人员而言是众所周知的(参见如，Heegaard，1998，J Mol.Recognit11：141-148；Hage和Tweed，1997，J.Chromatogr.B.Biomed.Sci.Appl.，699：499-525)。也可用凝胶电泳从未结合物中分离复合的分子(参见如，Ausubel等(编)，Current Protocols in Molecular Biology，J.Wiley & Sons，New York.1999)。例如，在该技术中，蛋白或核酸复合物根据大小或电荷来分离。为了在电泳过程中保持互相结合作用，通常优选不存在还原剂的变性胶，而适合特定相互作用物的条件对于本领域技术人员来说是众所周知的。免疫沉淀是另一种用于从溶液中分离蛋白质-蛋白质复合物的常用技术(参见如，Ausubel等(编)，Current Protocols in Molecular Biology，J.Wiley & Sons，New York.1999)。在该技术中，通过将抗体与可便于离心收集的多聚物珠缀和，与特异于结合分子之一的抗体结合的所有蛋白可从溶液中沉淀出来。所述结合的试验成分从珠中释放出来(通过特异性酶解过程或其它不干扰复合物中蛋白质-蛋白质相互作用的众所周知的技术)，并进行第二步免疫沉淀，这次利用的是对相应地不同相互反应性的试验成分的特异的抗体。在该方法中，仅有形成的复合物仍将附着于珠上。可以比较在受试化合物存在或不存在的条件下复合物形成的变化，从而提供了与调节标记物蛋白及其结合体的化合物的能力相关的信息。

在同质或异质试验系统中，不进行进一步样本操作而直接检测标记物蛋白及其天然结合配体和/或受试化合物之间相互作用的方法也在本发明的范围之内。例如，可用荧光能量转换技术(参见如Lakowicz等，美国专利第5,631,169号；Stavrianopoulos等，美国专利第4,868,103号)，一般而言，该技术包括在第一“供体”分子(如标记物或受试化合物)上添加荧光标记从而通过第二“受体”分子(如标记物或受试化合物)上的荧光标记吸收发出的荧光能量，接着基于吸收的能量而发出荧光。可选地，“供体”蛋白分子可仅利用色氨酸残基的天然荧光能量。选择释放不同光波长的标记，从而使“受体”分子标记可与“供体”分子区分。由于标记间能量转换的效率与分子分离距离相关，因此可测定分子间空间关系。在分子之间发生结合的条件下，在所述试验中“受体”分子标记的荧光发射应最大化。可通过众所周知的标准荧光检测方法(如利用荧光计)方便地测量FET结合情况。能参与增强或阻止预形成复合物中的一种物质的受试物质会导致与背景不同的信号产生。在这种方法中，在控制的试验中可鉴定调节标记物和其结合体相互作用的受试物质。

在另一个实施方案中，用一种方法鉴定标记物表达的调节分子，其中细胞与候选化合物接触并测定细胞中mRNA或蛋白标记物的表达。将存在候选化合物的mRNA或蛋白标记物的表达水平与不存在候选化合物的mRNA或蛋白质标记物的表达水平相比较。然后根据该比较结果，候选化合物可被鉴定为标记物表达的调节分子。例如，mRNA或蛋白标记物在存在候选化合物的条件下比不存在时表达得更多(统计上明显更多)时，则所述候选化合物就被鉴定为mRNA或蛋白标记物表达的刺激因子。相反地，mRNA或蛋白标记物在存在候选化合物的条件下比不存在时表达得更少(统计上明显更少)时，则所述候选化合物就被鉴定为mRNA或蛋白标记物表达的抑制因子。通过在本文中所述的检测mRNA或蛋白标记物的方法可以确定细胞中mRNA或蛋白标记物的表达水平。

在另一方面，本发明涉及在本文中所述的两个或更多试验的组合。例如，利用基于细胞的或无细胞的试验，可以鉴定调节试剂，并在体内可进一步确证试剂调节蛋白标记物活性的能力，如在完整动物模型中的细胞转化和/或肿瘤发生。

本发明进一步涉及由上述筛选试验鉴定的新试剂。因此，在合适动物模型中进一步使用在本文中所鉴定的试剂包括在本发明范围内。例如，在本文中所鉴定的试剂(如，标记物调节试剂、反义标记物核酸分子、标记物特异性抗体、或标记物结合配体)可用在动物模型中以测定用所述试剂治疗的有效性、毒性、或副作用。可选地，本文中所鉴定的试剂可用在动物模型中以测定所述试剂的作用机理。另外，本发明涉及由上述筛选试验鉴定的新试剂在本文所述的治疗中的应用。

以普通医生、兽医或研究人员的知识可知道小分子试剂和蛋白或多肽试剂的合适剂量是依赖于许多因素的。例如，根据治疗的患者或样本的特性、大小、和情况，如果可行的话，进一步根据组合物施用的途径以及医师所希望本发明核酸或多肽所具有的效果来改变这些试剂的剂量。小分子剂量的例子包括每公斤患者或样本体重的毫克或微克量(如约每公斤1微克至约每公斤500毫克、约每公斤100微克至约每公斤5毫克、或约每公斤1微克至约每公斤50微克)。蛋白或多肽剂量的例子包括每公斤患者或样本体重的克、毫克或微克量(如约每公斤1微克至约每公斤5克、约每公斤100微克至约每公斤5毫克、或约每公斤1毫克至约每公斤50毫克)。进一步可知道这些试剂之一的合适剂量依赖于与调节表达或活性相关的试剂的效力。利用本文所述的试验确定所述合适的剂量。例如，当一或多种这些试剂施用于动物(如人)从而调节本发明的多肽或核酸的表达或活性时，医生、兽医或研究人员可以首先给出较低剂量的处方，接着增加剂量直至获得合适的反应。另外，可知道任何特定动物患者的特定剂量水平依赖于多种因素，包括所使用的特定试剂的活性、患者的年龄、体重、综合健康状况、性别、以及饮食、给药时间、给药途径、排出率、任何药物组合、和要调节的表达或活性程度。

将本发明的药物组合物制备成与其预期的施用途径相容。施用途径的例子包括肠胃外途径，如，静脉内、皮内、皮下、口腔(如吸入)、经皮(外用)、经黏膜、以及直肠施用。用于肠胃外、皮内或皮下使用的溶液或悬浮液包括以下成分：诸如注射用水的无菌稀释剂、盐溶液、固定油、聚乙二醇、甘油、丙二醇或其它合成溶剂；抗细菌剂，如苄醇或甲基对羟基苯甲酸酯；抗氧化剂，如抗坏血酸或亚硫酸氢钠；螯合剂，如乙二胺四乙酸；缓冲液，如醋酸盐、柠檬酸盐、磷酸盐和调节渗透压的试剂，如氯化钠或葡萄糖。pH可用如盐酸或氢氧化钠的酸或碱调节。肠胃外制剂可包装在玻璃或塑料制的安瓿瓶、一次性注射器或多剂量管瓶中。

适合注射使用的药物组合物包括无菌水溶液(其中是水溶性的)或分散液，和用于临时制备无菌注射溶液或分散液的无菌粉末。为在静脉内施用，合适的载体包括生理盐水、抑菌水、Cremophor EL(BASF；Parsippany，NJ)或磷酸盐缓冲液(PBS)。在所有情况下，所述组合物必须是无菌的，并且其流动性应当达到容易注射的程度。在生产和储存的条件下它必须是稳定的，并且必须防止诸如细菌和真菌的微生物的污染作用。所述载体可以是溶剂或分散介质，包括例如水、乙醇、多元醇(如，甘油、丙二醇和液体聚乙二醇，以及类似物)及其合适的混合物。例如，可通过包被诸如卵磷脂的包衣剂保持分散液所需的粒度以及通过使用表面活性剂保持合适的流动性。可通过各种抗细菌剂和抗真菌剂，例如，对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸、硫柳汞、及类似物实现抑制微生物的作用。在很多场合下，优选在所述组合物中包括等渗剂，例如，糖、多元醇，如甘露糖醇、山梨醇、或氯化钠。可通过在组合物中加入延长吸收的试剂，如单硬脂酸铝和凝胶，延长可注射组合物的吸收时间。

可通过将所需数量的活性化合物(如多肽或抗体)与上面列举的成分之一或其组合一起掺入合适的溶剂中制备无菌注射溶液，如果需要，接着通过过滤消毒。一般而言，通过将活性化合物掺入含有基础分散介质和上面所列举的必需的其它成分的无菌赋形剂中可制备分散液。对于制备无菌注射溶液的无菌粉末而言，优选的制备方法是真空干燥和冷冻干燥，由此可产生活性成分和来自上述无菌过滤溶液的任何其它必需成分的粉末。

口服组合物通常包括惰性稀释剂或可食用载体。它们可装在凝胶胶囊中或压成片剂。为了口服治疗施用，活性化合物可与赋形剂混合并制成片剂、锭剂或胶囊形式使用。口服组合物也可用流体载体制备成漱口水，其中流体载体中的化合物可口服使用，洗漱并吐出或吞咽。

药学上相容的结合剂和/或佐剂材料可添加作为所述组合物的一部分。所述片剂、丸剂、胶囊、锭剂、及类似物能包含以下成分中的任意一种或包含具有相似性质的化合物：诸如微晶纤维素的粘合剂、黄蓍胶或明胶；赋形剂，如淀粉或乳糖，分散剂，如藻酸、Primogel或玉米淀粉；润滑剂，如硬脂酸镁或Sterotes；滑动剂，如胶状二氧化硅；甜味剂，如蔗糖或糖精；或香味剂，如薄荷、水杨酸甲酯或柠檬香剂。

为了通过吸入施用，所述化合物以气溶胶喷雾形式从压力容器或分液器或雾化器中喷出，所述压力容器或分液器包括合适的推进剂，例如，气体，如二氧化碳。

也可通过黏膜或经皮方式系统施用。为经黏膜或经皮施用，在该制剂中使用适合穿透屏障的渗透剂。所述渗透剂一般为本领域已知的，并包括，例如对于经黏膜施用而言，洗涤剂、胆酸盐、和梭链孢酸衍生物。通过使用鼻腔喷雾剂或栓剂可实现黏膜施用。对于经皮施用而言，如本领域所普遍公知的，活性化合物可制备为软膏、敷膏、凝胶或霜剂。

所述化合物也可以栓剂(如，使用常规的栓剂基料，如可可脂和其它甘油脂)或保留灌肠剂形式制备，用于直肠递送。

在一个实施方案中，所述活性化合物是与载体一起制备的，所述载体能防止该化合物从体内快速清除，如控制释放制剂，包括植入和微胶囊化递送系统。可以使用可生物降解的、生物相容的聚合物，比如亚乙基乙烯乙酸酯、聚酐、聚甘油酸、胶原、聚原酸酯以及聚乳酸。制备所述试剂的方法对本领域技术人员来说是显而易见的。也可从Alza公司和Nova制药有限公司获得商品化的原料。还可将脂质体悬浮液(包括脂质体，在其中或其上带有单克隆抗体)也可用作药学上可接受载体。根据本领域技术人员已知的方法，如美国专利第4,522,811号所述的，可以制备所述悬浮液。

为了便于施用以及剂量的统一性，以剂量单位形式制备口服或肠胃外组合物是特别有利的。本文所用的剂量单位指的是适合作为治疗患者的单位剂量的、在物理上独立的单位；每个单位包含预定数量的活性化合物，它是计算出的能与需要的药物载体一起产生需要的治疗效果的用量。有关本发明剂量单位形式的规定，是由活性化合物的特征和要获得的特定治疗效果，以及本领域中在将所述活性化合物用于治疗个体所固有的制约所决定的，并且直接取决于这些因素。

对于抗体而言，优选剂量为0.1mg/kg至100mg/kg体重(一般10mg/kg至20mg/kg)。如果抗体作用在大脑，则通常合适的剂量为50mg/kg至100mg/kg。一般而言，部分人抗体和全长人抗体在人体中比其它抗体具有更长的半衰期。因此，经常可用较低的剂量和较低的给药频率。诸如脂化修饰可用于稳定抗体并增加吸收和组织渗透(如，进入子宫颈上皮)。Cruikshank等.(1997)J.Acquired ImmuneDeficiency Syndromes and Human Retrovirology 14：193描述了脂化抗体的方法。

本发明也提供了预防和/或治疗子宫颈癌的疫苗组合物。本发明提供了子宫颈癌疫苗组合物，其中为了刺激抗子宫颈癌免疫应答而向患者导入表1的标记物蛋白、或表1的标记物蛋白的组合。本发明也提供了子宫颈癌疫苗组合物，其中向患者导入表达表1鉴定的标记物或其片段的基因表达构建体，从而使患者中转染的细胞产生了高于正常水平的由表1标记物编码的蛋白或蛋白片段并引发免疫应答。

在一个实施方案中，提供并使用子宫颈癌疫苗作为预防子宫颈癌的免疫治疗剂。在另一个实施方案中，提供并使用在子宫颈癌疫苗作为治疗子宫颈癌的免疫治疗剂。

作为例子，通过各种途径施用疫苗，如皮内、皮下、或经肌肉施用，包含表1标记物蛋白的子宫颈癌疫苗可以用于预防和/或治疗患者的子宫颈癌。另外，子宫颈癌疫苗可与佐剂和/或免疫调节剂一起施用以提升疫苗的活性和患者的应答。在一个实施方案中，适于持续或间隔释放的包含所述疫苗的装置和/或组合物可以植入体内或以所述具有相对较慢释放的材料局部应用于体内。子宫颈癌疫苗可以与免疫调节分子一起导入，其可改变产生的免疫应答的类型从而产生更有效去除癌的应答。

在另一个实施方案中，通过肌肉注射，或通过微抛射体包被并利用为高速抛射入皮肤而设计的装置，可以导入包含表1标记物表达构建体的子宫颈癌疫苗。然后患者细胞会表达表1的标记物蛋白或蛋白片段并诱导出免疫应答。另外，子宫颈癌疫苗可以与免疫调节分子的表达构建体一起导入，如细胞因子，其可增加免疫应答或调节产生的免疫应答的类型从而产生更有效去除癌的应答。

标记物核酸分子可以插入载体中并用作基因治疗载体。通过如静脉注射、局部给药(美国专利第5,328,470号)，或通过定向注射(参见如Chen等，1994，Proc.Natl.Acad.Sci.USA 91：3054-3057)，可把基因治疗载体递送到患者体中。基因治疗载体药物的制备可包括在可接受稀释剂中的基因治疗载体，或者可包含包埋了基因递送介质物的缓释基质。可选地，从重组细胞中可以完整产生完整的基因递送载体，如反转录病毒载体，所述药物制备则可以包括一或多个能产生基因递送系统的细胞。

所述药物组合物可以与指导施用说明书一起包装在容器、包装物或分液器中。

V.预测医学

本发明涉及预测医学领域，其中诊断试验、预后试验、药物基因组学以及监测临床试验用于预后(预测)目的从而预防性地治疗个体。因此，本发明的一个方面涉及诊断试验以确定一或多个蛋白或核酸标记物的表达水平，这是为了确定个体是否有发展成为宫颈癌的危险。这些试验用于预后(预测)目的从而在癌症发生前预防性地治疗个体。

而本发明的另一方面涉及在临床试验中监测试剂对本发明标记物表达或活性的影响(例如，施用药物或其它化合物以抑制子宫颈癌或者治疗或预防其它病症{即为了了解所述处理过程可能有的对子宫颈癌的任一效果})。它们以及其它试剂在以下章节中会有进一步详细叙述。

A.诊断试验

用作监测生物样本中蛋白或核酸标记物存在或不存在的示例方法包括从测试者中获得生物样本(如与子宫颈相关的体液)并且使生物样本接触能检测多肽或核酸(如mRNA、基因组DNA、或cDNA)的化合物或试剂。因而本发明的检测方法能在诸如体外和体内的生物样本中用于检测mRNA、蛋白质、cDNA、或基因组DNA。例如，mRNA的体外检测技术包括Northern杂交和原位杂交。蛋白质标记物的体外检测技术包括酶联免疫吸附试验(ELISA)、Western印迹、免疫沉淀以及免疫荧光法。基因组DNA的体外检测技术包括Southern杂交。另外，蛋白质标记物的体内检测技术包括向患者导入直接抗蛋白或其片段的标记的抗体。例如，用放射性标记来标记抗体，通过标准成像技术就能检测出其在患者中的存在与位置。

所述诊断和预后试验的普遍原理包括在合适条件下制备包含标记物的样本或反应混合物和探针，并经过一段时间足以使标记物和探针相互作用并结合，从而在反应混合物中形成能被分离和/或检测的复合物。可以用各种方式进行这些试验。

例如，进行这种试验的一个方法可以包括把标记物或探针锚定在固相支持物上，也被称为基质，并在反应后检测锚定在固相支持物上的目标标记物/探针复合物。在这种方法的一个实施方案中，将要测试标记物存在和/或浓度的患者样本，可以被锚定在载体或固相支持物上。在另一个实施方案中，也可能是相反的情况，其中把探针锚定在固相上并把患者样本当作试验中未锚定成分来进行反应。

已有许多现成的方法可将试验成分锚定到固相上去。这包括，但不仅限于，通过生物素和抗生物素蛋白链菌素结合固定的标记物或探针分子。这种生物素化的试验成分可以利用本领域已知的技术(如，生物素化试剂盒，Pierce Chemicals，Rockford，IL)从生物素-NHS(N-羟基-琥珀酰亚胺)中制备，并固定于抗生物素蛋白链菌素包被的96孔板(Pierce Chemical)的孔中。在某些实施方案中，可以预制备固定了试验成分的表面并储存起来。

其它适于所述试验的载体或固相支持物包括任何能结合标记物或探针所属种类的分子材料。众所周知的支持物或载体包括，但不仅限于，玻璃、聚苯乙烯、尼龙、聚丙烯、尼龙、聚乙烯、葡聚糖、淀粉酶、天然和修饰的纤维素、聚丙烯酰胺，辉长石以及磁石。

为了用上述方法进行试验，向其上锚定了第二成分的固相物中加入未固定的成分。反应完成后，在形成的复合物仍会固定在固相上的条件下去除(如，洗去)未复合上去的成分。可以用在本文中所述的众多方法来进行锚定在固相上的标记物/探针复合物的检测。

在优选实施方案中，当探针为未锚定的试验成分时，为了试验的检测和读出之用，可以用本文所讨论的和本领域技术人员的众所周知的可检测标记来直接或间接地标记探针。

不通过进一步操作或标记这两种成分(标记物或探针)也可以直接检测标记物/探针复合物的组成，如通过利用荧光能量转换技术(参见如，Lakowicz等，美国专利第5,631,169号；Stavrianopoulos等，美国专利第4,868,103号)。例如，选用在第一“供体”分子上的荧光标记，用合适波长的入射光来激发，其释放的荧光能量用在第二“受体”分子上的荧光标记来吸收，其接着根据吸收的能量发出荧光。可选地，“供体”蛋白质分子可利用色氨酸残基的天然荧光能量。选择释放不同光波长的标记，从而“受体”分子标记可以从“供体”的波长中区分出来。由于标记间能量转换的效率与分子分离距离相关，因此可以测定出分子间的空间关系。在结合发生在分子之间的情况下，试验中“受体”分子标记的荧光发射会变得最大。通过已知标准的荧光测定检测方法(如利用荧光计)可以方便地测出FET结合情况。

在另一个实施方案中，不标记这两种成分(探针或标记物)而就利用诸如实时生物分子相互作用分析(BIA)(参见如，Sjolander，S.和Urbaniczky，C.，1991，Anal.Chem.63：2338-2345以及Szabo等，1995，Curr.Opin.Struct.Biol.5：699-705)等技术就能进行探针识别标记物能力的测定。在本文中使用的“BIA”或“表面等离子共振”，指的是不通过标记任何相互作用物(如，BIA核)而实时研究生物特异性相互作用的技术。结合表面质量的改变(指示结合情况)导致近表面光折射率的改变(表面等离子共振(SPR)的光学现象)，这导致产生了能用作指示生物分子间实时反应的检测信号。

可选地，在另一个实施方案中，可用液相中用作溶质的标记物和探针来进行相似的诊断和预后试验。在所述试验中，通过众多标准技术把复合的标记物和探针从未复合成分中分离出来，包括但不见限于：差速离心、层析、电泳和免疫沉淀法。在差速离心法中，根据基于复合物不同大小和密度而造成的不同的沉淀平衡性，通过一系列离心步骤可以从未复合试验成分中分离出标记物/探针复合(参见如，Rivas，G.和Minton，A.P.，1993，Trends Biochem Sci.18(8)：284-7)。标准层析技术也可以用于把复合分子从未复合成分中分离出来。例如，凝胶过滤层析基于大小并通过利用凝胶柱中合适的凝胶过滤树脂来分离分子，例如，相对较大的复合物可以从相对较小的未复合成分中分离出来。相似地，可以利用相对于未复合成分不同的标记物/探针复合物的电荷性质来从未复合成分中分离出复合物，例如通过利用离子交换层析树脂。所述树脂和层析技术对本领域技术人员来说是众所周知的(参见如，Heegaard，N.H.，1998，J.Mol.Recognit.Winter11(1-6)：141-8；Hage，D.S.和Tweed，S.A.J Chromatogr B BiomedSci Appl 1997 Oct 10；699(1-2)：499-525)。凝胶电泳也可以用来从未结合成分中分离复合的试验成分(参见如，Ausubel等编著的CurrentProtocols in Molecular Biology，John Wiley & Sons，New York，1987-1999)。例如在该技术中，根据大小或电荷来分离蛋白或核酸复合物。为了在电泳过程中保持相互结合作用，通常优选非变性胶基质材料和不存在还原剂的条件。特定试验及其成分的合适条件对于本领域技术人员来说是众所周知的。

在一个特定的实施方案中，利用本领域已知方法通过原位和体外形式的方法都可以用来确定生物样本中的mRNA标记物的水平。术语“生物样本”其意包括分离自患者的组织、细胞、生物液体及其分离物，以及患者体内的组织、细胞和液体。许多检测方法利用了分离的RNA。对于体外方法，任何不阻止mRNA分离的RNA分离技术可以用于从子宫颈细胞中纯化RNA(参见如，Ausubel等编的CurrentProtocols in Molecular Biology，John Wiley & Sons，New York 1987-1999)。另外，可以利用本领域技术人已知的技术，比如Chomczynski的单步RNA分离流程(1989，美国专利第4,843,155号)，来迅速处理大量组织样本。

分离的mRNA可以用于杂交或扩增试验，其包括但不仅限于，Southern或Northern分析、聚合酶链式反应分析和探针阵列。一个优选的检测mRNA水平的诊断方法包括把分离的mRNA同核酸分子(探针)接触，所述核酸分子能同要检测基因编码的mRNA杂交。例如，核酸分子探针可以是全长cDNA或其部分，比如寡核苷酸，其长度至少为7、15、30、50、100、250或500个核苷酸并足以在严谨条件下与编码本发明标记物的mRNA或基因组DNA特异杂交。其它用在本发明诊断试验中的合适探针也在本文中描述。mRNA同探针的杂交表明所考虑的标记物正在被表达。

在一种方式中，例如通过在琼脂糖凝胶上分离mRNA并从胶上把mRNA转移到诸如硝酸纤维的膜上，使得mRNA固定在固体表面上并与探针接触。在可选的方式中，例如在Affymetrix基因芯片阵列中，使探针固定在固体表面上并使探针与mRNA接触。本领域技术人员能够容易改变已知的mRNA检测方法使之用于检测本发明标记物编码的mRNA的水平上。

确定样本中mRNA标记物水平的可选的方法包括核酸扩增方法，如用rtPCR(Mullis所阐述的实验实例，1987，美国专利第4,683,202号)、连接酶链式反应(Barany，1991，Proc.Natl.Acad.Sci.USA，88：189-193)、自持续序列复制(Guatelli等，1990，Proc.Natl.Acad Sci.USA 87：1874-1878)、转录扩增系统(Kwoh等，1989，Proc.Natl.Acad.Sci.USA 86：1173-1177)、Q-Beta复制酶(Lizardi等，1988，Bio/Technology 6：1197)、滚动循环复制(Lizardi等，美国专利第5,854,033号)或任何其它核酸扩增方法，接着利用本领域技术人员已知的技术来检测扩增的分子。如果所述分子存在数量非常低，则这些检测方案对于检测核酸分子尤其有用。在此所用的扩增引物定义为核酸分子对，其能向基因(分别是正链和负链，或反之亦然)的5′或3′区域退火并在引物对间包含了一个小区域。一般地，扩增引物长度约为10至30个核苷酸并且侧接有长度约50至200个核苷酸的区域。在合适条件下并用合适的试剂，则这些引物使得包含了与引物侧接的核苷酸序列的核酸分子扩增。

对于原位方法，mRNA不必在检测前从子宫颈细胞中分离出来。在该方法中，用已知组织学方法制备/处理细胞或组织样本。然后将样本固定于支持物上，通常是玻片，然后同能与编码标记物的mRNA杂交的探针接触。

作为进行测定标记物绝对表达水平的替换，测定可以基于标记物标准化了的表达水平。通过比较其与不作为标记物的基因的表达情况，如，与持续表达的家务基因，来纠正标记物绝对表达水平，使得表达水平标准化。用来标准化的合适基因包括家务基因，如肌动蛋白基因或上皮细胞特异性基因。标准化使得可以比较一个样本(如患者样本)同另一个样本(如非子宫颈癌样本)的表达水平，或不同来源样本之间的表达水平。

可选地，表达水平可以规定为相对表达水平。为了测定标记物的相对表达水平，在测定所考虑的样本表达水平前，用正常细胞对癌细胞分离物的10个或更多样本来测定标记物的表达水平，优选50个或更多样本。测定更大量样本中每个测试基因的平均表达水平并将其用作标记物表达水平的基准。然后，测试样本所测得的标记物表达水平(绝对表达水平)除以该标记物所得的平均表达值。这就规定了相对表达水平。

优选地，用于基准测定的样本来自子宫颈组织的子宫颈癌或非子宫颈癌细胞。依据相对表达水平的应用来选择细胞来源。把普通细胞中发现的表达情况用作平均表达分值以帮助确认所测的标记物是否是子宫颈特异性的(相对于普通细胞)。另外，当积累了更多的数据后，可以修正平均表达值，基于累积的数据得出改进的相对表达值。子宫颈细胞的表达数据提供了一种将子宫颈癌严重程度分级的方法。

在本发明另一个实施方案中，检测蛋白标记物。本发明优选的检测蛋白标记物的试剂是能与该蛋白或其片段结合的抗体，优选具有可检测标记的抗体。抗体可以是多克隆的，或更优选地，是单克隆的。可以使用完整的抗体、或其片段或衍生物(如Fab或F(ab′)₂)。术语“标记的”，其涉及引物或抗体时，其意在包括通过把可检测物质与探针或抗体偶联而直接标记探针或抗体，以及通过与直接标记的其它试剂反应而间接标记探针或抗体。间接标记的例子包括利用荧光标记的第二抗体检测第一抗体和用生物素末端标记DNA探针从而使其可用荧光标记的抗生物素蛋白链菌素来检测。

利用本领域技术人员已知的技术可以分离子宫颈细胞的蛋白质。例如，所用的蛋白质分离方法如Harlow和Lane文(Harlow和Lane，1988，Antibodies：A Laboratory Manual，Cold Spring HarborLaboratory Press，Cold Spring Harbor，New York)中所述的那样。

可以用多种方法来确定样本是否包含与特定抗体结合的蛋白。所述方法的例子包括，但不仅限于，酶标免疫实验(EIA)、放射免疫实验(RIA)、Western印迹分析以及酶联免疫吸附试验(ELISA)。本领域技术人员可以容易改变已知的蛋白质/抗体检测方法来用于测定子宫颈细胞是否表达本发明的标记物。

在一种方法中，抗体或抗体片段或衍生物可以用在诸如Western印迹或免疫荧光技术的方法中来检测表达的蛋白质。在所述应用中，一般优选把抗体或蛋白质固定在固体支持物上。合适的固相支持物或载体包括任何能结合抗原或抗体的支持物。众所周知的支持物或载体包括玻璃、聚苯乙烯、聚丙烯、葡聚糖、尼龙、淀粉酶、天然和修饰的纤维素、聚丙烯酰胺，辉长石以及磁石。

本领域技术人员会知道许多其它结合抗体或抗原的合适载体，并能改变这种支持物以应用于本发明。例如，子宫颈细胞中分离的蛋白质可以在聚丙烯酰胺凝胶上进行电泳并固定于诸如硝酸纤维的固相支持物上。然后可以用合适的缓冲液洗涤支持物，接着用可检测标记的抗体处理。然后第二次用缓冲液洗涤支持物以去除未结合的抗体。然后通过常规的方法检测固体支持物上结合的标记的量。

本发明也包括检测生物样本(如子宫颈涂片)中蛋白或核酸存在的试剂盒。可以用所述试剂盒测定患者是否正患有或有极大危险发展成为子宫颈癌。例如，所述试剂盒可包含一种能检测生物样本中蛋白或核酸标记物的化合物或试剂以及测定样本中蛋白或mRNA数量的装置(如，结合蛋白或其片段的抗体，或结合编码蛋白质的DNA或mRNA的寡核苷酸探针)。试剂盒也可包括用于解释用试剂盒得到结果的说明书。

对于基于抗体的试剂盒，所述试剂盒可包含，如：(1)结合蛋白标记物的第一抗体(如，附着在固体支持物上的)；和，可选地，(2)不同的第二抗体，其结合蛋白或第一抗体并与可检测标记连接。

对于基于寡核苷酸的试剂盒，所述试剂盒可包含，如：(1)寡核苷酸，如，可检测标记的寡核苷酸，其与编码蛋白标记物的核酸序列杂交，或(2)用于扩增核酸分子标记物的引物对。所述试剂盒也可包含，如，缓冲剂、防腐剂或蛋白稳定剂。所述试剂盒可进一步包含对于检测可检测标记所必需的成分(如酶或底物)。所述试剂盒也可包含一个对照样本或一系列对照样本，其可被检测并与测试样本相比较。所述试剂盒的每个成分可以与用于解释用试剂盒进行试验所得的结果的说明书一起包装在单个容器中，而且各种容器都可以装置在一个包装物中。

B.药物基因组学

本发明的标记物也可用作药物基因组学的标记物。这里所用的“药物基因组学的标记物”指客观的生化标记物，其表达水平与患者的特异临床药物反应或易感性相关(如参见McLeod等.(1999)Eur.J.Cancer 35(12)：1650-1652)。药物基因组学的标记物表达的存在或数量与用特定药物或药物种类治疗的患者的预测反应有关，更具体地是与患者的肿瘤的预测反应有关。通过评估患者中的一或多个药物基因组学的标记物表达的存在或数量，可以选出最适合于患者的或预计有更大成功程度的药物疗法。例如，对于治疗患者可能存在的特异肿瘤，根据患者中特异肿瘤标记物编码的RNA或蛋白的存在或数量，可以选出最优化的药物或治疗流程。因此应用药物基因组学的标记物可以在不用尝试不同药物或疗法的情况下，对每个癌症患者选出或设计出最合适的疗法。

药物基因组学的另一方面涉及改变身体对药物作用的遗传状况。这些药物遗传状况可以以罕见的缺陷或多态性而出现。例如，葡萄糖-6-磷酸脱氢酶(G6PD)缺乏是常见的遗传性先天性代谢病，其中主要临床并发症是在摄取氧化药物(抗疟疾药、磺胺药、镇痛药、硝基呋喃)和食用蚕豆后出现溶血。

作为一种说明性实施方案，药物代谢酶的活性是药物作用强度和持久性的主要决定因素。药物代谢酶(如，N-乙酰转移酶2(NAT 2)和细胞色素P450酶CYP2D6和CYP2C19)遗传多态性的发现给出了解释，即为什么有些患者在服用药物的标准和安全剂量后没有获得预期的药效或者显示出过大的药物反应和严重的毒性。这些多态性在人群中表现为两种表型，即充分代谢型(EM)和不良代谢型(PM)。不同群体中PM的倾向不同。例如，编码CYP2D6的基因是高度多态性，而且已经在PM中鉴定出数个突变，其均导致功能性CYP2D6缺失。CYP2D6和CYP2C19的不良代谢型在其接受标准剂量后通常会出现过大的药物反应和副作用。假如代谢物是活性治疗成分的话，则PM将不显示治疗反应，正如通过其CYP2D6形成的代谢物吗啡介导的可待因的镇痛效果所证实的。其它极端情况是所谓的超快代谢型，其对标准剂量没有反应。近来，已确定出超快代谢的分子基础是由于CYP2D6基因扩增。

因此，可以测定本发明标记物在个体中的表达水平从而选出治疗或预防个体的合适试剂。另外，可以利用药物基因组学研究运用编码药物代谢酶的多态性等位基因的基因型来鉴定个体的药物反应表型。该知识，当应用于剂量或药物选择时，能够避免不良反应或治疗失败，因而在用本发明标记物表达的调节剂治疗患者时，可增强治疗或预防功效。

C.监测临床试验

监测试剂(如，药物化合物)对本发明标记物表达水平的影响不仅可以用在基础药物筛选中，而且可用在临床试验中。例如，在接受子宫颈癌治疗的患者的临床试验中能检测试剂影响标记物表达的效力。在优选的实施方案中，本发明提供了一种用试剂(如，激动剂、拮抗剂、模拟肽、蛋白、肽、核酸、小分子、或其它候选药物)监测患者治疗有效性的方法，包括如下步骤(i)在施用试剂前从患者中获取用药前的样本；(ii)检测用药前样本中一个或多个所选的本发明标记物的表达水平；(iii)从患者中获取一个或多个用药后样本；(iv)检测用药后样本中的标记物的表达水平；(v)把用药前样本中的标记物表达水平同用药后样本或样本群中的标记物表达水平相比较；和(vi)据此改变向患者施用的试剂。例如，在治疗过程中标记物的增加表达可以显示出无效的剂量和增加剂量的需求。相反地，标记物的减少表达可以显示出有效的治疗并且不需要改变剂量。

D.电子设备可读介质和阵列

这也提供了包括本发明标记物的电子设备可读介质。在本文中所用的“电子设备可读介质”是指任何用于储存、保持或容纳数据或信息的介质，其可用电子设备直接读出和访问。这种介质包括，但不仅限于：磁储存介质，如软盘、硬盘储存介质、和磁盘；光储存介质，如光盘；电储存介质，如RAM、ROM、EPROM、EEPROM以及类似物；一般的硬盘和这些种类的混合产品，如磁/光储存介质。改变或配置介质使其上记录本发明的标记物。

在本文中使用时，术语“电子设备”其意在包括为存储数据或信息而配置或改变的任何合适的计算或处理设备或其它装置。适合用于本发明的电子设备的例子包括独立计算设备；网络，包括局域网(LAN)、广域网(WAN)因特网、企业内部互联网以及外部互联网；电器，如个人数字助理(PDA)、手机、寻呼机及类似物；和本地或分布式处理系统。

在本文中使用时，“记录”是指用于在电子设备可读介质上储存或编码信息的过程。本领域技术人员能够容易地采用当前已知的任何方法在已知的介质上记录信息来生产包括本发明标记物的产品。

可用各种软件和格式在电子设备可读介质上储存本发明标记物信息。例如，核酸序列标记物可以用字处理文本文件来表示，其可用商业化软件的格式，如WordPerfect和MicroSoft Word，或者用ASCII文件的形式来表示，其储存于数据库应用程序中，如DB2、Sybase、Oracle或类似程序，以及用其它形式。为了获得或创建其上记录有本发明标记物的介质，可以用许多数据处理结构格式(如文本文件或数据库)。

通过以可读形式提供本发明标记物，技术人员可以为各种目的定期地访问标记物序列信息。例如，所属领域技术人员可以用本发明可读形式的核苷酸或氨基酸序列来把靶序列或靶结构基序同储存在数据储存装置中的序列信息相比较。利用检索方法来鉴定本发明序列中符合特定靶序列或靶结构基序的片段或区域。

因此本发明提供了一种为执行确定患者是否患子宫颈癌或易患子宫颈癌的方法而保存指令的介质，其中所述方法包括确定标记物存在或不存在的步骤，并基于标记物的存在或不存在，确定患者是否患子宫颈癌或易患子宫颈癌和/或推荐特定的治疗子宫颈癌或子宫颈癌前状态的方法。

本发明进一步在电子系统和/或网络中提供一种确定患者是否患子宫颈癌或易患与标记物相关的子宫颈癌的方法，其中所述方法包括确定标记物存在或不存在的步骤，并基于标记物的存在或不存在，确定患者是否患子宫颈癌或易患子宫颈癌，和/或推荐特定的治疗子宫颈癌或子宫颈癌前状态的方法。该方法可以进一步包括接受同患者相关的表型信息和/或从网络中获得同患者相关的表型信息的步骤。

本发明也在网络中提供了一种确定患者是否患子宫颈癌或易患与标记物相关的子宫颈癌的方法，所述方法包括接受同标记物相关信息、接受同患者相关的表型信息、从网络中获得相应的标记物和/或子宫颈癌信息的步骤，并基于一个或多个表型信息、标记物、和所获得的信息，确定患者是否患子宫颈癌或易患子宫颈癌。该方法可以进一步包括推荐特定的治疗子宫颈癌或子宫颈癌前状态的的步骤。

本发明也提供了一种确定患者是否患子宫颈癌或易患子宫颈癌的商业方法，所述方法包括接受同患者相关的表型信息、从网络中获得相应的标记物和/或子宫颈癌信息的步骤，并基于一个或多个表型信息、标记物、和所获得的信息，确定患者是否患子宫颈癌或易患子宫颈癌。该方法可以进一步包括推荐特定的治疗子宫颈癌或子宫颈癌前状态的的步骤。

本发明也包括一种包含本发明标记物的阵列。所述阵列可用于检测阵列中一个或多个基因的表达。在一个实施方案中，阵列可用于检测组织中的基因表达以确定阵列中基因的组织特异性。用这种方式，可同时测试多至7600个基因的表达。这可以开发特征图谱以显示在一个或多个组织中特异表达的一组基因。

除了这些定性测定方法，本发明可以定量基因表达的情况。因此，不仅是组织特异性的，而且组织中一组基因的表达水平也是能确定的。因此，基因可以基于其组织表达本身和该组织中表达水平来分组。例如，这可用在确定组织之间的基因表达的关系中。因此，可以干扰一个组织并且测定对第二个组织中的基因表达的影响。在本文中，可以测定一种细胞类型对另一种细胞类型响应生物刺激的影响。例如，这种测定方法可用于了解在基因表达水平上的细胞-细胞相互作用的影响。如果治疗性地施用试剂以处理一种细胞类型，但其具有对另一种细胞类型的不良影响，则本发明提供了一种测试以确定不良影响的分子基础并据此提供联用中和试剂或其它处理不良影响的时机。相似地，即使在单一细胞类型中，也可以在分子水平上测定不良生物影响。因此，可以确定并抵消试剂对于除靶基因之外的基因表达的影响。

在另一个实施方案中，所述阵列可被用于监测阵列中一个或多个基因表达的时间过程。如此所述，这可以发生在各种生物关系中，例如子宫颈癌的发展、子宫颈癌的进程、以及过程，如与子宫颈癌相关的细胞转化。

所述阵列也可用于确定在相同细胞中或在不同细胞中一个基因表达对另外的基因表达的影响。这提供了，如在不能调节最终或下游靶位时，可以选择用于介入治疗的替代的分子靶位。

所述阵列也可用于确定在正常或异常的细胞中一个或多个基因不同的表达模式。这提供了一组基因，其能用作介入诊断或治疗的分子靶位。

E.替代标记物

本发明的标记物可以用作一种或多种失调或疾病状态或者导致病态状态的替代标记物，尤其是子宫颈癌的。这里所用的“替代标记物”是一个客观的生化标记物，其与疾病或失调的缺失或存在、或与疾病或失调的进程相关(如，与肿瘤的存在或不存在)。所述标记物的存在或数量不依赖于疾病。因而，这些标记物用来显示特定治疗过程是否能有效减轻病态或失调。当病态或失调难以用标准方法来评估时(如早期阶段的肿瘤)，或在达到潜在危险的临床点前已需要评估疾病进程时(如，在心肌梗塞或完全发展成AIDS的不良临床结果显现前，用胆固醇水平作为替代标记物进行评估心血管疾病，和用HIV RNA水平作为替代标记物进行分析HIV感染)，替代标记物尤其有用。现有的替代标记物应用的例子包括：Koomen等.(2000)J.Mass.Spectrom.35：258-264；和James(1994)AIDS Treatment News Archive 209。

本发明的标记物也可用作药效学标记物。这里所用的“药效学标记物”是一个客观的生化标记物，其特异地与药物效果相关。药效学标记物的存在或数量并不与药物所施用的病态或失调相关；因此，药效学标记物的存在或数量可作为患者的药物存在或活性的指试标准。例如，药效学标记物可作为生物组织中药物浓度的指试标准，其中标记物在与药物水平相关的组织中可以是被表达的或转录的，或是未被表达或转录的。以这种方式，用药效学标记物监测药物的分布或吸收。相似地，药效学标记物的存在或数量与药物代谢产物的存在或数量相关，如药效学标记物的存在或数量可作为体内的药物相对衰减率的指试标准。药效学标记物尤其可应用于增加检测药物效果的灵敏度，尤其在以低剂量施用药物的时候。由于即使是少量的药物也足以活化大量标记物的转录或表达，因此扩增的标记物在量上比药物本身更容易检测。而且，由于标记物本身的性质使得标记物更容易检测；例如，利用在此所述的方法，在基于免疫的监测系统中用抗体做蛋白标记物，或用标记物特异性放射性标记探针来检测mRNA标记物。另外，对于可能超出直接观察范围之外的药物治疗，应用药效学标记物可以提供以机理为基础的风险预测。现有应用药效学标记物的例子包括：Matsuda等的US 6,033,862；Hattis等.(1991)Env.Health Perspect.90：229-238；Schentag(1999)Am.J.Health-Syst.Pharm.56 Suppl.3：S21-S24；和Nicolau(1999)Am，J.Health-Syst.Pharm.56 Suppl.3：S16-S20。

实施例1：用cDNA和组织微阵列鉴定子宫颈癌标记物

I.材料和方法

样本收集和RNA制备

收集子宫颈组织并速冻于液氮中。在进行提取RNA前先确认组织的组织结构和细胞成分。利用Trizol试剂(Life Technologies)从冷冻的组织中提取总RNA，接着用Qiagen的Rneasy试剂盒进行二次洗涤步骤以增加RNA探针标记的效率(Qiagen，Valencia CA)。利用AgilentTechnologies 2100型生物分析仪计算28S/18S核糖体RNA比率，比率至少为1.0的RNA才应用于本研究中。

cDNA微阵列杂交

包括得自Research Genetics(Hunstville，AL)的30,732个单基因克隆的cDNA微阵列点样在尼龙滤膜上。通过反转录方法使用³³P-dCTP、寡dT-30引物以及Superscript II反转录酶(Life Technologies)，把总共4-6μg的总RNA用作模板以制备放射性标记的cDNA。用cot-1DNA和聚dA 40-60(Pharmacia，Peapack，NJ)预退火³³P标记的第一链cDNA以减少非特异性杂交。用约6×10⁶个计数单位的标记的引物在缓冲液中在65℃下杂交每块滤膜16小时，缓冲液包含7％十二烷基磺酸钠(SDS)、250mM Na3PO4(pH 7.2)、1mM EDTA、0.5％酪蛋白-Hammerstein和0.1mg/ml鲑鱼精子DNA。用4％和1％SDS洗涤缓冲液(20mM Na3PO4(pH 7.2)，1mM EDTA和4％或1％SDS)洗滤膜后，将其置于Fuji磷光成像仪屏幕下并用BAS 2500型扫描仪扫描。用由Millennium Pharmaceuticals公司开发的自动分析程序GridGuru v1.0定量这些点。

标记物得分算法和数据处理

为纠正杂交效率的差异，用滤膜上所有点的中值强度来标准化每个阵列滤膜上的数字化数据。进行基于阵列和基于基因的分级分类并用Stanford的基因簇和树可视软件使之可视化。通过计算每个基因的标记物得分使差异表达的基因分级。

为计算标记物得分，把样本分成对照和试验组。标记物得分的起始点是试验样本高于对照样本的平均变化倍(率)。设计得分使之反映出差异表达的变化程度(表达率)和试验样本数，而不被少部分有很高数值的测试样本所支配。为减少该“逸出值”效应，把大于10的表达率故意当作表达率为10的来处理。在得出试验样本平均变化倍数前，用渐近压缩函数通过改变试验：对照表达率来完成所需的标记物得分运算。当试验组并不比对照更高表达时，标记物得分记为1，反之则值大于1。任何基因的标记物得分不会超过10。

因此，基因g的标记物得分S_g计算作为试验：对照的压缩比率平均值：

Sg＝(∑Sgs)/N_试验

Sgs＝C(xgs/(k+xg^Q))，其中Sgs代表基因g和样本s的标记物得分，

C(r)是压缩函数，当r≥1时C(r)＝A(1-e^-r/A)，且当r＜1时C(r)＝1，

A是变化倍数的上渐近数(我们用10)，

xgs是样本s中基因g的表达值，

xg^Q是样本表达值的百分之Q；通常，Q＝50，

k是反映数据中外加噪声的常数，如，重复测量中变量的固定分量。该参数从用微阵列技术的校准试验中得到0.25的值。

N_试验试验样本的数量。

组织微阵列的原位杂交

这里提供一种福尔马林固定的、石蜡包埋的子宫颈组织微阵列，其包含从正常、低度鳞状上皮内病变(LSIL)、高度鳞状上皮内病变(HSIL)、鳞状细胞癌(SCC)和腺癌(ACA)中获得的中心组织。用自动组织-Tek DRS 2000型滑动染色仪(Sakura，Torrance，CA)根据前述方法(Duncan，L.M.，等，2001，J.Clin.Oncol.19(2)：568-576)来进行预杂交处理。用含4％多聚甲醛的PBS对子宫颈组织脱蜡、再水化，之后固定15分钟。用PBS洗后，用2μg/ml蛋白酶K于37℃消化组织微阵列15分钟，再用4％多聚甲醛/PBS温育10分钟。接着用0.2N HCl温育组织切片10分钟，用0.25％醋酸酐/0.1mol/L三羟乙基胺温育10分钟，并用乙醇梯度脱水。利用源自IMAGE克隆的500ng线性化质粒DNA，用体外转录反应中的³⁵S-UTP(RiboprobeCombination System，Promega，Madison，WI)标记反义探针。利用含5×10⁷cpm/ml的标记探针的10mM Tris-HCl(pH 7.6)缓冲液在50℃下杂交18小时，其中缓冲液包含50％甲酰胺、10％葡聚糖硫酸酯、1x Denhardt氏溶液、0.6M NaCl、10mM DTT、0.25％SDS和200μg/mltRNA。杂交后，用5x标准柠檬酸盐液(SSC)在50℃下洗玻片10分钟，用50％甲酰胺/2X SSC在50℃下洗30分钟，用10mM Tris-HCl(pH 7.6)/500mM NaCl/1mM EDTA(TNE)在37℃下洗10分钟，在含10μg/ml RNA酶的TNE中在37℃下温育30分钟，用TNE在37℃下洗板10分钟，在2x SSC中在50℃下一次温育20分钟，在0.2xSSC中在50℃下二次温育20分钟，并用乙醇梯度脱水。在Kodak NTB2型照相乳胶(Eastman Kodak，Rochester，NY)中浸泡玻片并在4℃下曝光14-21天，以此测定mRNA转录产物的位置。玻片用Myers苏木精和乙醇曙红Y复染。

II.结果

子宫颈组织cDNA微阵列的转录图谱

在包含30,732个克隆的cDNA微阵列(30K微阵列)上测定12个正常子宫颈组织(9个来自子宫颈阴道部，3个来自子宫颈内膜)、5个LSIL、5个HSIL、9个SCC和3个ACA的图谱。为评估数据集合区分疾病和正常组织的能力，基于基因表达模式的整体相似性来进行34个样本数据集合的分级分组(图1)。树状图显示12个正常子宫颈组织中的10个和所有的LSIL样本集中在一组中(定为“对照组”)，而12个肿瘤样本中的11个和5个HSIL样本中的3个集中在另一组中(定为“疾病组”)。该分离显示正常子宫颈阴道部上皮、正常子宫颈内膜上皮和LSIL的总体基因表达图谱非常相似，然而3/5HSIL样本更像子宫颈癌。这些发现显示尽管从不同年龄的患者和不同临床位置取样，但健全的数据集合能够从疾病组织中区分出对照组织。

标记物筛选

为了鉴定能区分对照组与疾病组的基因标记物，在30K cDNA微阵列上从三个标记物筛选示例中计算出每个克隆的标记物得分：9个SCC比对照组(9个子宫颈阴道部，3个子宫颈内膜和5个LSIL)、5个HSIL比对照组和3个ACA比对照组。为了揭示与子宫颈细胞转化相关的新标记物，在标记物筛选中排除与免疫应答相关的上调基因(如免疫球蛋白、MHC)。SCC或ACA示例中标记物得分前50位的克隆和在50至100位之间的在SCC和ACA样本中过表达的克隆选为顶级标记物。HSIL示例中的得分并不独立于选择标记物而使用，因为考虑到肿瘤中增加的表达对于好的标记物的表现来说是至关重要的。选择标记物，它们在SCC、ACA和HSIL示例中的得分如表4所示。发现SCC样本中的大多数上调基因也在ACA中提高。当许多从SCC和/或ACA示例中筛选出的标记物得分≥3.0时，而仅有一些HSIL标记物得分超过2.0，这显示增加表达可看作从发育异常至扩散性肿瘤的损伤发展。图2显示表4的两个基因，它们在正常、LSIL、HSIL、SCC和ACA组织中表现出典型而又明显不同的表达模式类型。在HSIL、鳞状细胞瘤和腺瘤中过表达了MCM 6，而仅有鳞状细胞瘤过表达了Claudin 1。

为了解这些上调基因的特征，基于所有临床样本的表达图谱进行分级分类。这些过表达的基因分成两个主要的组别。一个组主要由编码细胞外基质(ECM)蛋白(胶原蛋白、层蛋白、粘连蛋白)或者起着细胞-ECM相互作用或ECM降解和重塑作用的蛋白(如成骨蛋白、基质金属蛋白酶、尿激酶)的基因组成。另一组包括许多涉及细胞复制和增殖的基因。实例包括DNA复制许可因子(MCM 6)、拓扑异构酶2A以及肿瘤基因B-Myb。

标记物的原位杂交(ISH)确认

也可用ISH评估临床组织样本中的标记物。利用组织微阵列进行ISH实验以确认转录图谱结果并测定起着增加mRNA表达作用的细胞类型。根据石蜡切片的水平检测26-87个正常子宫颈中心组织(来自子宫颈阴道部和子宫颈内膜)、2-10个LSIL、5-33个HSIL和10-21个癌中心组织(包括SCC、ACA和低分化肿瘤)。一般的，检测子宫颈上皮细胞中的ISH信号(表5)。上皮细胞中过表达的基因起着细胞生长和细胞-ECM相互作用。上皮细胞差异表达多种基因。该发现暗示了癌发展期间在子宫颈上皮和其微环境之间等价的基因调节。

对代表基因claudin 1进行显微照相。正常的子宫颈和子宫颈内/外膜组织和LSIL中只有很少的或没有来自Claudin 1探针的信号。基因表达在HSIL中提高了并在子宫颈肿瘤中进一步提高。Claudin 1的表达仅限于上皮，而在cDNA微阵列上测定的5个HSIL和3个ACA样本中没有明显的升高(图2)。不受理论所限，该例中ISH增加的灵敏度可能是由于信号的焦点性质造成的。通过ISH，这种焦点信号是很显见的，但是其可能在RNA制备时的全组织匀浆中丢失。

由于子宫颈筛选评估了子宫颈上皮脱落的细胞的形态变化，因此基质细胞不可能在Pap测试样本中出现。因此标记物筛选集中于那些能在子宫颈发育异常和扩散性肿瘤的上皮细胞中差异表达的候选标记物。为了解不同类型的子宫颈损伤和肿瘤中每种标记物升高的频率，用所有微阵列上的中心组织进行频率计算。计算基于半定量随机评分法。信号的计分范围是从0至3：0-无信号；1-弱而模糊的信号；2-确定的弱至中等的信号；3-强至非常强的信号。表6显示本发明标记物的评分结果。要认为是阳性的，则中心组织必须具有≥2的信号分值。在微阵列包含一个病人的超过一个中心组织的情况下，阳性认定必须是至少50％的中心组织≥2。为了更好地使结果可视化，以正常子宫颈组织阳性中心增加的频率为顺序来提供选出的标记物。发现标记物升高的频率与临床异常状态高度相关，并在一个从标记物至特定临床状态标记物的大范围内变化。例如，IFI27具有相对较高(＞20％)的正常子宫颈组织的阳性中心，而诸如ITGB6和CLDN1的标记物在正常组织中相对较低并在LSIL和HSIL中开始升高。BST2阳性中心出现在肿瘤进程的较晚阶段，在从高度癌变前病变至扩散性疾病的转变之中。这些发现证实了在子宫颈癌发展期间存在能鉴别连续分子变化的标记物。

实施例2：基因表达分析

RNA制备

按照厂商的说明书(Invitrogen)利用TRIZOL试剂，用单步法从各种人体组织中提取总RNA。用DNA酶I(Ambion)在37℃下处理每个要制备的RNA 1小时。利用β-2微小球蛋白作为内部扩增对照，样本如果需要至少38个PCR扩增循环以达到荧光阈值水平(或18s核糖体基因进行35个PCR扩增循环)，则确定DNA酶I处理已完成。DNA酶I处理后，通过琼脂糖凝胶电泳和溴化乙锭染色来确认RNA样本的完整性。用酚抽提后，根据厂商的说明书(Applied Biosytems)利用Taqman反转录试剂从样本中制备cDNA。未加反转录酶的RNA负对照也模仿对每个RNA样本进行反转录。

TAQMAN

用TAQMAN定量PCR(Applied Biosytems)测定各种正常和疾病(如，癌的)人体组织或细胞系中制得的cDNA中的基因表达。

探针的制备

基于特定基因及其相关转录产物序列，用Primer Express软件(Applied Biosystems)设计探针。每个靶基因探针用FAM(6-羧基荧光素)标记，而18s对照探针用不同的荧光染料VIC来标记。因此靶基因和内部对照基因不一样的标记能使测定在同一个孔中进行。检测引物和探针对特定基因的每个转录产物的灵敏度和特异性。把18s和靶基因的正向或反向引物和探针加入到TAQMAN通用PCR主要混合液(Applied Biosystems)中。尽管引物和探针的终浓度可能发生变化，但是每个在特定实验中都是内在一致的。典型的实验包含18s的100nM正向和反向引物加上200nM探针和靶基因的900nM正向或反向引物加上250nM探针。在ABI PRISM 7700型序列检测系统(AppliedBiosystems)上进行TAQMAN基质实验。热循环条件如下：50℃下维持2分钟并在95℃下维持10分钟，接着两步95℃下15秒40个循环的PCR，接着60℃下1分钟。

相对于相同组织中的18s表达，应用以下方法定量计算各种组织中的基因表达。阈循环(Ct)值定义为检测到的统计上荧光明显增加的循环。较低的Ct值指示了较高的mRNA浓度。应用以下公式：ΔCt＝Ct(靶转录产物)-Ct(18s)，扣除18s核糖体基因的Ct值使基因的Ct值标准化从而获得ΔCt值。然后用2-ΔCt给出的算术公式计算相对表达。然后用数字表示每个所测的组织中的靶基因的表达(表9-13)。表9-13鉴定了样本(样本#)、组织病期和靶基因的表达。假如可行，被测试的标记物(列于表1)也可用变体、引物和探针(列于表7)来鉴定。例如在表12中，与M30A[1]相应的数据用表7中所鉴定的正向引物1(F1)、反向引物1(R1)和探针1(P1)鉴定出标记物M30A。

用末端PCR进行的基因表达分析

集中不同组织的总RNA以用作产生第一链cDNA的模板。子宫颈栏由子宫颈肿瘤库、子宫颈正常组织库、“其它正常组织”库和“其它肿瘤”库组成。库由等量的每个样本组成。

库的类型	组成成分
库的类型	组成成分	子宫颈肿瘤库	4个肿瘤样本(鳞状细胞癌)
子宫颈正常组织库	3个正常子宫颈样本	子宫颈肿瘤库	4个肿瘤样本(鳞状细胞癌)
子宫颈正常组织库	3个正常子宫颈样本	其它肿瘤库	子宫颈癌-4个鳞状细胞癌样本结肠癌-5个腺癌样本肺肿瘤-3个鳞状细胞癌、3个腺癌、1个支气管癌和1个巨大细胞未分化癌卵巢肿瘤-2个浆液性癌和2个透明细胞癌前瘤腺肿瘤-5个腺癌
其它正常组织库	样本各自来自正常的心脏、肾脏、小肠、脾、WBC、肺、肝脏、脑、骨髓、和结肠组织	其它肿瘤库

应用ThermoScript RT-PCR系统(Invitrogen，San Diego，CA)获取cDNA。按照厂商的说明书，1μgRNA和1μl 50μM寡(dT)20引物以10μl体积在65℃下变性5分钟。在85℃下温育5分钟从而终止反应。最终产物用水稀释成最终体积100μl。

就在开放阅读框起始点或外面设计出基因特异性引物(表7)。根据引物和期望产物的大小优化PCR的条件。通过降低的循环条件把2μl cDNA用于20μl反应体系中。在包含琼脂糖凝胶的溴化乙啶中处理产物。然后对凝胶图片进行半定量分析并评分。

对组织栏中的末端PCR的溴化乙啶琼脂糖凝胶图片在0-5的范围内进行评分(表8)。由3人独立对每个图片评分并汇编其结果。比较结果以证实在条带的相对强度上是一致的并在需要的地方进行修饰。然后把3个得分的中值记为最终得分。

表中提供的数据概述

表1鉴定了本发明的标记物(SEQ ID NO：1-44)，它们表示成名称(“标记物”)，如果可行的话，则表示成该基因所众所周知的名称(“基因名称”)，由标记物编码或相应于标记物的核苷酸转录产物cDNA序列的序列表标识(“SEQ ID NO(nts)”)、由核苷酸转录产物编码的蛋白的氨基酸序列的序列表标识(“SEQ ID NO(AAs)”)、以及cDNA序列中的蛋白编码序列的位置(“CDS”)。

表2和3列出了新鉴定的核苷酸和氨基酸序列，它们表示成名称(“标记物”)，如果可行的话，则表示成该基因所众所周知的名称(“基因名称”)、由标记物编码或相应于标记物的核苷酸转录产物cDNA序列的序列表标识(“SEQ ID NO(nts)”)、由核苷酸转录产物编码的蛋白的氨基酸序列的序列表标识(“SEQ ID NO(AAs)”)、以及cDNA序列中的蛋白编码序列的位置(“CDS”)。

表4鉴定了本发明的标记物及其在SCC、ACA和HSIL中的标记物得分。表4的标记物表示成名称(“标记物”)，如果可行的话，则表示成该基因所众所周知的名称(“基因名称”)、鳞状细胞癌范例的标记物得分(“SCC得分”)、腺癌示例的标记物得分(“ACA得分”)、以及高度鳞状上皮内病变范例的标记物得分(“HSIL得分”)。

表5列出了子宫颈癌中用原位杂交鉴定出过表达的标记物并指出了标记物表达的位置。表5的标记物表示成名称(“标记物”)，如果可行的话，则表示成该基因所众所周知的名称(“基因名称”)、子宫颈上皮细胞中检测到的原位杂交信号(“信号定位”)。

表6列出了子宫颈发育异常的上皮细胞和扩散性肿瘤中的标记物的差异表达。表6的标记物表示成名称(“标记物”)，如果可行的话，则表示成该基因所众所周知的名称(“基因名称”)，并对每一个标记物，则列出表示为标记物升高频率(“频率”)和子宫颈阴道部和子宫颈内膜细胞(“正常(EC+END)”)中的阳性数比患者数的比值(“#阳性/#患者”)、标记物升高频率(“频率”)和低度鳞状上皮内病变(“LSIL”)中的阳性数比患者数的比值(“#阳性/#患者”)、标记物升高频率(“频率”)和高度鳞状上皮内病变(“HSIL”)中的阳性数比患者数的比值(″#阳性/#患者″)、以及标记物升高频率(“频率”)和鳞状细胞癌和腺癌(“肿瘤(SCC+ACA)”)中的阳性数比患者数的比值(“#阳性/#患者”)。

表7列出了基因特异性引物。表7鉴定了标记物，它们表示成名称(“标记物”)、对应于Taqman引物1匹配位置的基因特异性引物(“匹配位置：Taqman引物1”)、对应于Taqman引物2匹配位置的基因特异性引物(“匹配位置：Taqman引物2”)、对应于Taqman探针匹配位置的基因特异性引物(“匹配位置：Taqman探针”)、对应于末端PCR引物1匹配位置的基因特异性引物(“匹配位置：末端PCR引物1”)、以及对应于末端PCR引物1匹配位置的基因特异性引物(“匹配位置：末端PCR引物1”)。表7鉴定了正向1的(“F1”)；正向2的(“F2”)；反向1的(“R1”)；反向2的(“R2”)引物，以及探针(“P1”表示探针1；以及“P2”表示探针2)。

表8列出了组织栏的末端PCR溴化乙锭琼脂糖凝胶图片中范围在0-5的得分。表8鉴定了标记物，它们表示成名称(“标记物”)、以及所用的样本(“正常子宫颈”和“子宫颈肿瘤”)。

表9-13鉴定了每个所测组织中靶基因的表达。表9-13鉴定了样本，它们表示成数量(“样本#”)、样本的组织病期(“组织病期”)、和靶基因的表达(“基因名称”)。表9-13也鉴定了与表1中所列的标记物名称相对应的标记物名称、引物和探针(列于表7)，如果可行的话，则是经过检测的。例如，在表12中，与“M30A[1]”相对应的数据利用表7所述的正向引物1(F1)、反向引物1(R1)和探针1(P1)鉴定了标记物。

利用前述方法获得的标记物不应被解释作为限制。本申请全文中引用的所有参考文献、数据库、专利和公开的专利申请都明确地并入作为参考。

其它实施方案

在使用不超过常规实验技术的条件下，本领域技术人员会知道或能确认本文中描述的本发明具体实施方案的许多等价实施方案。所述等价实施方案规定为被如下权利要求所涵盖。

表1

序列相关信息
序列相关信息					标记物	基因名称	SEQ ID NO(nts)	SEQ ID NO(AAs)	CDS
M1A	APOL1：载脂蛋白L1	1	2	162..1358	标记物	基因名称	SEQ ID NO(nts)	SEQ ID NO(AAs)	CDS
M1A	APOL1：载脂蛋白L1	1	2	162..1358	M718	APOL2：载脂蛋白L2	3	4	337..1350
OV3A	AQP5：水通道蛋白5，变体1	5	6	517..1314	M718	APOL2：载脂蛋白L2	3	4	337..1350
OV3A	AQP5：水通道蛋白5，变体1	5	6	517..1314	M719	AQP5：水通道蛋白5，变体2	7	8	517..1149
M720	AQP5：水通道蛋白5，变体3	9	10	517..1185	M719	AQP5：水通道蛋白5，变体2	7	8	517..1149
M720	AQP5：水通道蛋白5，变体3	9	10	517..1185	M5A	BST2：骨髓基质细胞抗原2	11	12	78..620
M10A	CLDN1：claudin-1，衰老相关的上皮膜蛋白1	13	14	221..856	M5A	BST2：骨髓基质细胞抗原2	11	12	78..620
M10A	CLDN1：claudin-1，衰老相关的上皮膜蛋白1	13	14	221..856	M29A	COTL1：cocatosin-样1(网柱原虫属)	15	16	150..576
M30A	IFI27：干扰素，α-诱导蛋白27，变体1	17	18	120..488	M29A	COTL1：cocatosin-样1(网柱原虫属)	15	16	150..576
M30A	IFI27：干扰素，α-诱导蛋白27，变体1	17	18	120..488	M721	IFI27：干扰素，α-诱导蛋白27，变体2	19	20	120..479
M488A	ITGA3：整联蛋白，α3(抗原CD49C，VLA-3受体的α3亚基)	21	22	240..3353	M721	IFI27：干扰素，α-诱导蛋白27，变体2	19	20	120..479
M488A	ITGA3：整联蛋白，α3(抗原CD49C，VLA-3受体的α3亚基)	21	22	240..3353	M35	ITGB6：整联蛋白，β6，变体1	23	24	195..2561
M722	ITGB6：整联蛋白，β6，变体2	25	26	241..2388	M35	ITGB6：整联蛋白，β6，变体1	23	24	195..2561
M722	ITGB6：整联蛋白，β6，变体2	25	26	241..2388	M723	ITGB6：整联蛋白，β6，变体3	27	28	195..2240
M666	KCNAB1：钾电压控制通道，颤抖(shaker)相关亚科，β分子	29	30	89..1315	M723	ITGB6：整联蛋白，β6，变体3	27	28	195..2240
M666	KCNAB1：钾电压控制通道，颤抖(shaker)相关亚科，β分子	29	30	89..1315	M489A	MCM6：微型染色体蛋白维持缺陷型(mis5，S.pombe)6	31	32	56..2521
OV43A	MSLN：mesothelin，巨核细胞强化因子	33	34	88..1956	M489A	MCM6：微型染色体蛋白维持缺陷型(mis5，S.pombe)6	31	32	56..2521
OV43A	MSLN：mesothelin，巨核细胞强化因子	33	34	88..1956	M51A	MYBL2：B-MYB，转录因子(v-myb成髓细胞血症病毒性癌基因同系物)	35	36	128..2230
M58	PLAU：纤溶酶原激活剂，尿激酶	37	38	77..1372	M51A	MYBL2：B-MYB，转录因子(v-myb成髓细胞血症病毒性癌基因同系物)	35	36	128..2230
M58	PLAU：纤溶酶原激活剂，尿激酶	37	38	77..1372	M22A	RTP801：组织缺氧诱导因子(HIF-1)响应基因	39	40	198..896
M74A	TPO2A：DNA拓扑异构酶II，α同工酶	41	42	127..4722	M22A	RTP801：组织缺氧诱导因子(HIF-1)响应基因	39	40	198..896
M74A	TPO2A：DNA拓扑异构酶II，α同工酶	41	42	127..4722	M78	ZNF-P66：C2H2型锌指蛋白(66kD)	43	44	45..1343

表2

序列相关信息
序列相关信息					标记物	基因名称	SEQ ID NO(nts)	SEQ ID NO(AAs)	CDS
M1A	APOL1：载脂蛋白L1	1	2	162..1358	标记物	基因名称	SEQ ID NO(nts)	SEQ ID NO(AAs)	CDS
M1A	APOL1：载脂蛋白L1	1	2	162..1358	M719	AQP5：水通道蛋白5，变体2	7	8	517..1149
M720	AQP5：水通道蛋白5，变体3	9	10	517..1185	M719	AQP5：水通道蛋白5，变体2	7	8	517..1149
M720	AQP5：水通道蛋白5，变体3	9	10	517..1185	M721	IFI27：干扰素，α-诱导蛋白27，变体2	19	20	120..479
M488A	ITGA3：整联蛋白，α3(抗原CD49C，VLA-3受体的α3亚基)	21	22	240..3353	M721	IFI27：干扰素，α-诱导蛋白27，变体2	19	20	120..479
M488A	ITGA3：整联蛋白，α3(抗原CD49C，VLA-3受体的α3亚基)	21	22	240..3353	M722	ITGB6：整联蛋白，β6，变体2	25	26	241..2388
M723	ITGB6：整联蛋白，β6，变体3	27	28	195..2240	M722	ITGB6：整联蛋白，β6，变体2	25	26	241..2388
M723	ITGB6：整联蛋白，β6，变体3	27	28	195..2240	M78	ZNF-P66：C2H2型锌指蛋白(66kD)	43	44	45..1343

表3

序列相关信息标记物基因名称SEQ ID NO
					SEQ ID NO	CDS			(nts)
					SEQ ID NO	CDS			(nts)	(AAs)	M5A	BST2：骨髓基质细胞抗原2	11
12	78..620	M30A	IFI27：干扰素，α-诱导蛋白27，变体1	17						(AAs)	M5A	BST2：骨髓基质细胞抗原2	11
12	78..620	M30A	IFI27：干扰素，α-诱导蛋白27，变体1	17	18	120..488	M35	ITGB6：整联蛋白，β6，变体1	23
					18	120..488	M35	ITGB6：整联蛋白，β6，变体1	23

表4

标记物	基因名称	SCC得分	ACA得分	HSIL得分
标记物	基因名称	SCC得分	ACA得分	HSIL得分	M666	KCNAB1：钾电压控制通道，颤抖(shaker)相关亚科，β分子	3.6	3.9	1.4
M10A	CLDN1：claudin-1，衰老相关的上皮膜蛋白1	3.3	1.0	1.3	M666	KCNAB1：钾电压控制通道，颤抖(shaker)相关亚科，β分子	3.6	3.9	1.4
M10A	CLDN1：claudin-1，衰老相关的上皮膜蛋白1	3.3	1.0	1.3	M29A	COTL1：cocatosin-样1(网柱原虫属)	3.2	1.9	1.0
M5A	BST2：骨髓基质细胞抗原2	3.1	3.5	1.7	M29A	COTL1：cocatosin-样1(网柱原虫属)	3.2	1.9	1.0
M5A	BST2：骨髓基质细胞抗原2	3.1	3.5	1.7	M78	ZNF-P66：C2H2型锌指蛋白(66kD)	3.0	3.1	1.4
M22A	RTP801：组织缺氧诱导因子(HIF-1)响应基因	2.9	3.0	1.4	M78	ZNF-P66：C2H2型锌指蛋白(66kD)	3.0	3.1	1.4
M22A	RTP801：组织缺氧诱导因子(HIF-1)响应基因	2.9	3.0	1.4	M30AM721	IFI27：干扰素，α-诱导蛋白27，变体1和2	2.9	2.5	1.2
M1A	APOL1：载脂蛋白L1	2.8	3.1	1.9	M30AM721	IFI27：干扰素，α-诱导蛋白27，变体1和2	2.9	2.5	1.2
M1A	APOL1：载脂蛋白L1	2.8	3.1	1.9	M488A	ITGA3：整联蛋白，α3(抗原CD49C，VLA-3受体的α3亚基)	2.7	3.7	1.1
M35M722M723	ITGB6：整联蛋白，β6，变体1，2和3	2.4	3.9	1.0	M488A	ITGA3：整联蛋白，α3(抗原CD49C，VLA-3受体的α3亚基)	2.7	3.7	1.1
M35M722M723	ITGB6：整联蛋白，β6，变体1，2和3	2.4	3.9	1.0	M51A	MYBL2：B-MYB，转录因子(v-myb成髓细胞血症病毒性癌基因同系物)	2.3	4.2	1.8
M489A	MCM6：微型染色体蛋白维持缺陷型(mis5，S.pombe)6	2.3	3.2	1.5	M51A	MYBL2：B-MYB，转录因子(v-myb成髓细胞血症病毒性癌基因同系物)	2.3	4.2	1.8
M489A	MCM6：微型染色体蛋白维持缺陷型(mis5，S.pombe)6	2.3	3.2	1.5	M74A	TPO2A：DNA拓扑异构酶II，α同工酶	1.7	3.2	1.6
OV3AM719M720	AQP5：水通道蛋白5，变体1，2和3	1.0	3.2	1.6	M74A	TPO2A：DNA拓扑异构酶II，α同工酶	1.7	3.2	1.6

表5

标记物	基因名称	信号定位
标记物	基因名称	信号定位	M666	KCNAB1：钾电压控制通道，颤抖(shaker)相关亚科，β分子	上皮细胞
M29A	COTL1：cocatosin-样1(网柱原虫属)	上皮细胞	M666	KCNAB1：钾电压控制通道，颤抖(shaker)相关亚科，β分子	上皮细胞
M29A	COTL1：cocatosin-样1(网柱原虫属)	上皮细胞	M74A	TPO2A：DNA拓扑异构酶II，α同工酶	上皮细胞
M30AM721	IFI27：干扰素，α-诱导蛋白27，变体1和2	上皮细胞	M74A	TPO2A：DNA拓扑异构酶II，α同工酶	上皮细胞
M30AM721	IFI27：干扰素，α-诱导蛋白27，变体1和2	上皮细胞	M78	ZNF-P66：C2H2型锌指蛋白(66kD)	上皮细胞
M488A	ITGA3：整联蛋白，α3(抗原CD49C，VLA-3受体的α3亚基)	上皮细胞	M78	ZNF-P66：C2H2型锌指蛋白(66kD)	上皮细胞
M488A	ITGA3：整联蛋白，α3(抗原CD49C，VLA-3受体的α3亚基)	上皮细胞	OV3AM719M720	AQP5：水通道蛋白5，变体1，2和3	上皮细胞
M5A	BST2：骨髓基质细胞抗原2	上皮细胞	OV3AM719M720	AQP5：水通道蛋白5，变体1，2和3	上皮细胞
M5A	BST2：骨髓基质细胞抗原2	上皮细胞	M22A	RTP801：组织缺氧诱导因子(HIF-1)响应基因	上皮细胞
M51A	MYBL2：B-MYB，转录因子(v-myb成髓细胞血症病毒性癌基因同系物)	上皮细胞	M22A	RTP801：组织缺氧诱导因子(HIF-1)响应基因	上皮细胞
M51A	MYBL2：B-MYB，转录因子(v-myb成髓细胞血症病毒性癌基因同系物)	上皮细胞	M35M722M723	ITGB6：整联蛋白，β6，变体1，2和3	上皮细胞
M16	CRIP1：富含半胱氨酸蛋白1(肠内的)	上皮细胞	M35M722M723	ITGB6：整联蛋白，β6，变体1，2和3	上皮细胞
M16	CRIP1：富含半胱氨酸蛋白1(肠内的)	上皮细胞	M489A	MCM6：微型染色体蛋白维持缺陷型(mis5，S.pombe)6	上皮细胞
M10A	CLDN1：claudin-1，衰老相关的上皮膜蛋白1	上皮细胞	M489A	MCM6：微型染色体蛋白维持缺陷型(mis5，S.pombe)6	上皮细胞
M10A	CLDN1：claudin-1，衰老相关的上皮膜蛋白1	上皮细胞	M1A	APOL1：载脂蛋白L1	上皮细胞

表6

^a：中心组织阳性是那些具有ISH得分≥2的。

^b：正常子宫颈阴道部和子宫颈内膜细胞。

^c：在某些受限于基底/旁基底(parabasal)细胞的正常鳞状上皮中表达。

阴影格表示在至少20％患者中ISH得分≥2。

表7

	Taqman/PCR引物相关信息
	Taqman/PCR引物相关信息					标记物	匹配位置：Taqman引物1	匹配位置：Taqman引物2	匹配位置：Taqman探针	匹配位置：末端PCR引物1	匹配位置：末端PCR引物2
M1A	99-121	238-218	186-160	82-103	1673-1693	标记物	匹配位置：Taqman引物1	匹配位置：Taqman引物2	匹配位置：Taqman探针	匹配位置：末端PCR引物1	匹配位置：末端PCR引物2
M1A	99-121	238-218	186-160	82-103	1673-1693	M718	166-188	251-231	190-217	143-164	1680-1700
OV3A	914-935	980-964	938-961	512-534	1432-1449	M718	166-188	251-231	190-217	143-164	1680-1700
OV3A	914-935	980-964	938-961	512-534	1432-1449	M719	842-857	912-895	869-894	512-534	1267-1284
M720	1097-1116	1174-1155	1154-1133	512-534	1512-1529	M719	842-857	912-895	869-894	512-534	1267-1284
M720	1097-1116	1174-1155	1154-1133	512-534	1512-1529	M5A				1-23；34-56	628-647
M10A				164-182	888-908	M5A				1-23；34-56	628-647
M10A				164-182	888-908	M29A				123-139	592-610
M30A	(F1)208-228//(F2)257-275	(R1)315-298//(R2)336-316	(P1)260-242//(P2)277-296	7-26	510-529	M29A				123-139	592-610
M30A	(F1)208-228//(F2)257-275	(R1)315-298//(R2)336-316	(P1)260-242//(P2)277-296	7-26	510-529	M721	(F1)208-228//(F2)248-266	(R1)306-289//(R2)327-307	(P1)258-234)//P2)268-287	7-26	501-520
M488A				187-209	3412-3434	M721	(F1)208-228//(F2)248-266	(R1)306-289//(R2)327-307	(P1)258-234)//P2)268-287	7-26	501-520
M488A				187-209	3412-3434	M35	(F1)1900-1920//(F2)628-648	(R1)1970-1950//(R2)698-672	(P1)1923-1945//(P2)670-650	188-208	2592-2616
M722	(F1)1727-1747//(F2)318-337//(F3)455-475	(R1)1797-1777//(R2)409-391//(R3)525-499	(P1)1750-1772//(P2)377-360//(P3)497-477	188-208	2419-2443	M35	(F1)1900-1920//(F2)628-648	(R1)1970-1950//(R2)698-672	(P1)1923-1945//(P2)670-650	188-208	2592-2616
M722	(F1)1727-1747//(F2)318-337//(F3)455-475	(R1)1797-1777//(R2)409-391//(R3)525-499	(P1)1750-1772//(P2)377-360//(P3)497-477	188-208	2419-2443	M723	(F1)1796-1818//(F2)628-648	(R1)1891-1870//(R2)698-672	(P1)1869-1843//(P2)670-650	188-208	2271-2295
M666				89-108	1288-1312	M723	(F1)1796-1818//(F2)628-648	(R1)1891-1870//(R2)698-672	(P1)1869-1843//(P2)670-650	188-208	2271-2295
M666				89-108	1288-1312	M489A				21-39	2563-2580
OV43A				1198-1215	1272-1290	M489A				21-39	2563-2580
OV43A				1198-1215	1272-1290	M51A				216-233	2291-2315
M58				52-70	1396-1415	M51A				216-233	2291-2315
M58				52-70	1396-1415	M22A				139-159	997-1017
M74A						M22A				139-159	997-1017
M74A						M78				6-25	1393-1418

表8

标记物	正常子宫颈	子宫颈肿瘤
标记物	正常子宫颈	子宫颈肿瘤	M1A	1	5
M718	1	3	M1A	1	5
M718	1	3	OV3A	1	4
M719	1	4	OV3A	1	4
M719	1	4	M720	1	4
M5A	3	3	M720	1	4
M5A	3	3	M10A	3	5
M29A	2	5	M10A	3	5
M29A	2	5	M30A	4	5
M721	4	5	M30A	4	5
M721	4	5	M488A	2	5
M35	0	5	M488A	2	5
M35	0	5	M722	0	5
M723	0	5	M722	0	5
M723	0	5	M666	0	5
M489A	2	5	M666	0	5
M489A	2	5	OV43A	0	4
M51A	0	5	OV43A	0	4
M51A	0	5	M58	2	2
M22A	1	5	M58	2	2
M22A	1	5	M74A
M78	0	2	M74A

表9：水通道蛋白5的表达

样本#	组织病期	OV3A	M719	M720
样本#	组织病期	OV3A	M719	M720
1	正常	0.37	0.01	0.00
1	正常	0.37	0.01	0.00	2	正常	0.02	0.00	0.00
3	正常	0.98	0.01	0.02	2	正常	0.02	0.00	0.00
3	正常	0.98	0.01	0.02	4	正常	0.01	0.00	0.00
5	正常	0.39	0.01	0.01	4	正常	0.01	0.00	0.00
5	正常	0.39	0.01	0.01	6	正常	0.00	0.00	0.00
7	正常	1.59	0.07	0.01	6	正常	0.00	0.00	0.00
7	正常	1.59	0.07	0.01	8	正常	0.12	0.00	0.00
9	正常	0.00	0.00	0.00	8	正常	0.12	0.00	0.00
9	正常	0.00	0.00	0.00	10	正常	0.00	0.00	0.00
11	SCC	0.79	0.05	0.01	10	正常	0.00	0.00	0.00
11	SCC	0.79	0.05	0.01	12	SCC	0.23	0.01	0.00
13	SCC	0.17	0.00	0.01	12	SCC	0.23	0.01	0.00
13	SCC	0.17	0.00	0.01	14	SCC	0.66	0.03	0.01
15	SCC	1.37	0.03	0.00	14	SCC	0.66	0.03	0.01
15	SCC	1.37	0.03	0.00	16	SCC	3.22	0.33	0.02
17	SCC	0.00	0.00	0.00	16	SCC	3.22	0.33	0.02
17	SCC	0.00	0.00	0.00	18	SCC/AIS	0.12	0.00	0.00
19	SSC	0.02	0.00	0.00	18	SCC/AIS	0.12	0.00	0.00
19	SSC	0.02	0.00	0.00	20	低分化腺鳞状	0.18	0.01	0.00
21	SSC	0.01	0.00	0.00	20	低分化腺鳞状	0.18	0.01	0.00
21	SSC	0.01	0.00	0.00	22	腺癌	0.02	0.00	0.00
23	腺癌	0.78	0.03	0.01	22	腺癌	0.02	0.00	0.00
23	腺癌	0.78	0.03	0.01	24	SCC	0.12	0.01	0.00
25	SSC	0.00	0.00	0.00	24	SCC	0.12	0.01	0.00
25	SSC	0.00	0.00	0.00	26	SSC	0.00	0.00	0.00
27	SSC	0.00	0.00	0.00	26	SSC	0.00	0.00	0.00
27	SSC	0.00	0.00	0.00	28	SSC	0.08	0.01	0.00
29	SSC	1.59	0.06	0.02	28	SSC	0.08	0.01	0.00
29	SSC	1.59	0.06	0.02	30	SSC	0.07	0.00	0.00
31	腺癌	0.27	0.01	0.00	30	SSC	0.07	0.00	0.00
31	腺癌	0.27	0.01	0.00	32	腺癌	1.29	0.03	0.03
33	SCC	0.03	0.00	0.00	32	腺癌	1.29	0.03	0.03
33	SCC	0.03	0.00	0.00	34	SSC	0.01	0.00	0.00
35	SSC	6.92	0.11	0.05	34	SSC	0.01	0.00	0.00
35	SSC	6.92	0.11	0.05	36	SSC	0.03	0.00	0.00
37	SSC	0.15	0.00	0.00	36	SSC	0.03	0.00	0.00
37	SSC	0.15	0.00	0.00	38	SSC	0.00	0.00	0.00
39	SSC	0.01	0.00	0.00	38	SSC	0.00	0.00	0.00
39	SSC	0.01	0.00	0.00	40	SSC	0.06	0.00	0.00
41	SSC	0.02	0.00	0.00	40	SSC	0.06	0.00	0.00
41	SSC	0.02	0.00	0.00	42	肿瘤	0.13	0.00	0.00

表10：载脂蛋白L1的表达

样本#	组织病期	M1A
样本#	组织病期	M1A
1	正常	0.60
1	正常	0.60	2	正常	0.14
3	正常	0.60	2	正常	0.14
3	正常	0.60	4	正常	0.48
5	正常	0.44	4	正常	0.48
5	正常	0.44	6	正常	0.24
7	正常	0.18	6	正常	0.24
7	正常	0.18	8	正常	0.34
9	正常	0.52	8	正常	0.34
9	正常	0.52	10	正常	0.62
11	SCC	1.56	10	正常	0.62
11	SCC	1.56	12	SCC	2.02
13	SCC	2.50	12	SCC	2.02
13	SCC	2.50	14	SCC	3.15
15	SCC	1.14	14	SCC	3.15
15	SCC	1.14	16	SCC	3.42
17	SCC	2.51	16	SCC	3.42
17	SCC	2.51	18	SCC/AIS	17.88
19	SSC	1.18	18	SCC/AIS	17.88
19	SSC	1.18	20	低分化腺鳞状	1.32
21	SSC	1.38	20	低分化腺鳞状	1.32
21	SSC	1.38	22	腺癌	6.61
23	腺癌	0.08	22	腺癌	6.61
23	腺癌	0.08	24	SCC	1.37
25	SSC	6.28	24	SCC	1.37
25	SSC	6.28	26	SSC	1.91
27	SSC	5.14	26	SSC	1.91
27	SSC	5.14	28	SSC	0.59
29	SSC	0.30	28	SSC	0.59
29	SSC	0.30	30	SSC	5.30
31	腺癌	2.10	30	SSC	5.30
31	腺癌	2.10	32	腺癌	1.51
33	SCC	8.09	32	腺癌	1.51
33	SCC	8.09	34	SSC	0.35
35	SSC	0.38	34	SSC	0.35
35	SSC	0.38	36	SSC	4.11
37	SSC	1.83	36	SSC	4.11
37	SSC	1.83	38	SSC	3.99
39	SSC	4.48	38	SSC	3.99
39	SSC	4.48	40	SSC	3.77
41	SSC	10.08	40	SSC	3.77
41	SSC	10.08	42	肿瘤	0.12

表11：载脂蛋白L2的表达

样本#	组织病期	M718
样本#	组织病期	M718
1	正常	0.20
1	正常	0.20	2	正常	0.06
3	正常	0.19	2	正常	0.06
3	正常	0.19	4	正常	0.15
5	正常	0.20	4	正常	0.15
5	正常	0.20	6	正常	0.15
7	正常	0.13	6	正常	0.15
7	正常	0.13	8	正常	0.26
9	正常	0.32	8	正常	0.26
9	正常	0.32	10	正常	0.34
11	SCC	1.15	10	正常	0.34
11	SCC	1.15	12	SCC	0.42
13	SCC	0.67	12	SCC	0.42
13	SCC	0.67	14	SCC	0.93
15	SCC	0.51	14	SCC	0.93
15	SCC	0.51	16	SCC	0.69
17	SCC	0.54	16	SCC	0.69
17	SCC	0.54	18	SCC/AIS	0.75
19	SSC	0.36	18	SCC/AIS	0.75
19	SSC	0.36	20	低分化腺鳞状	0.67
21	SSC	0.30	20	低分化腺鳞状	0.67
21	SSC	0.30	22	腺癌	0.82
23	腺癌	0.11	22	腺癌	0.82
23	腺癌	0.11	24	SCC	0.52
25	SSC	2.68	24	SCC	0.52
25	SSC	2.68	26	SSC	0.51
27	SSC	1.82	26	SSC	0.51
27	SSC	1.82	28	SSC	0.51
29	SSC	0.17	28	SSC	0.51
29	SSC	0.17	30	SSC	1.90
31	腺癌	0.34	30	SSC	1.90
31	腺癌	0.34	32	腺癌	0.49
33	SCC	1.82	32	腺癌	0.49
33	SCC	1.82	34	SSC	0.11
35	SSC	0.28	34	SSC	0.11
35	SSC	0.28	36	SSC	0.62
37	SSC	0.55	36	SSC	0.62
37	SSC	0.55	38	SSC	0.68
39	SSC	0.72	38	SSC	0.68
39	SSC	0.72	40	SSC	0.38
41	SSC	0.87	40	SSC	0.38
41	SSC	0.87	42	肿瘤	0.34

表12：干扰素，α-诱导蛋白27的表达

样本#	组织病期	M30A[1]	M721[1]	M30A[2]M721[2]
样本#	组织病期	M30A[1]	M721[1]	M30A[2]M721[2]
1	正常	1.75	1.77	3.84
1	正常	1.75	1.77	3.84	2	正常	0.21	1.25	1.44
3	正常	2.73	4.15	9.46	2	正常	0.21	1.25	1.44
3	正常	2.73	4.15	9.46	4	正常	0.00	39.85	17.37
5	正常	14.62	29.54	62.89	4	正常	0.00	39.85	17.37
5	正常	14.62	29.54	62.89	6	正常	14.47	20.68	32.12
7	正常	1.04	12.95	8.31	6	正常	14.47	20.68	32.12
7	正常	1.04	12.95	8.31	8	正常	4.56	8.96	15.70
9	正常	18.02	23.27	46.52	8	正常	4.56	8.96	15.70
9	正常	18.02	23.27	46.52	10	正常	5.83	39.68	32.94
11	SCC	6.66	7.60	15.26	10	正常	5.83	39.68	32.94
11	SCC	6.66	7.60	15.26	12	SCC	0.98	5.48	5.08
13	SCC	0.00	24.93	14.39	12	SCC	0.98	5.48	5.08
13	SCC	0.00	24.93	14.39	14	SCC	3.58	26.17	19.23
15	SCC	12.51	8.70	37.53	14	SCC	3.58	26.17	19.23
15	SCC	12.51	8.70	37.53	16	SCC	0.00	366.10	244.10
17	SCC	23.94	78.32	127.98	16	SCC	0.00	366.10	244.10
17	SCC	23.94	78.32	127.98	18	SCC/AIS	32.25	287.87	251.55
19	SSC	4.24	3.31	15.21	18	SCC/AIS	32.25	287.87	251.55
19	SSC	4.24	3.31	15.21	20	低分化腺鳞状	6.88	6.04	24.17
21	SSC	6.51	5.44	17.83	20	低分化腺鳞状	6.88	6.04	24.17
21	SSC	6.51	5.44	17.83	22	腺癌	14.72	74.02	110.70
23	腺癌	0.06	0.05	0.25	22	腺癌	14.72	74.02	110.70
23	腺癌	0.06	0.05	0.25	24	SCC	11.61	7.58	32.57
25	SSC	0.00	117.40	71.70	24	SCC	11.61	7.58	32.57
25	SSC	0.00	117.40	71.70	26	SSC	0.00	73.80	35.81
27	SSC	11.76	6.31	31.11	26	SSC	0.00	73.80	35.81
27	SSC	11.76	6.31	31.11	28	SSC	14.72	9.34	31.94
29	SSC	0.67	0.42	2.69	28	SSC	14.72	9.34	31.94
29	SSC	0.67	0.42	2.69	30	SSC	34.47	33.49	107.11
31	腺癌	0.00	10.66	5.03	30	SSC	34.47	33.49	107.11
31	腺癌	0.00	10.66	5.03	32	腺癌	6.97	5.66	16.30
33	SCC	17.92	97.36	101.33	32	腺癌	6.97	5.66	16.30
33	SCC	17.92	97.36	101.33	34	SSC	11.51	7.52	22.49
35	SSC	6.89	42.12	38.96	34	SSC	11.51	7.52	22.49
35	SSC	6.89	42.12	38.96	36	SSC	2.73	35.04	25.04
37	SSC	13.85	7.68	34.26	36	SSC	2.73	35.04	25.04
37	SSC	13.85	7.68	34.26	38	SSC	0.00	28.34	18.79
39	SSC	20.60	15.88	94.41	38	SSC	0.00	28.34	18.79
39	SSC	20.60	15.88	94.41	40	SSC	0.00	13.33	9.11
41	SSC	10.09	12.91	40.59	40	SSC	0.00	13.33	9.11
41	SSC	10.09	12.91	40.59	42	肿瘤	0.41	0.68	2.13

表13：整联蛋白，β6的表达

样本#	组织病期	M35[1]/M722[1]	M722[2]	M723[1]	M35[2]/M722[3]/M723[2]
样本#	组织病期	M35[1]/M722[1]	M722[2]	M723[1]	M35[2]/M722[3]/M723[2]
1	正常	0.45	0.0005	0.019	0.57
1	正常	0.45	0.0005	0.019	0.57	2	正常	0.21	0.0002	0.006	0.32
3	正常	0.09	0.0001	0.001	0.17	2	正常	0.21	0.0002	0.006	0.32
3	正常	0.09	0.0001	0.001	0.17	4	正常	0.13	0.0002	0.003	0.27
5	正常	0.11	0.0002	0.012	0.18	4	正常	0.13	0.0002	0.003	0.27
5	正常	0.11	0.0002	0.012	0.18	6	正常	0.55	0.0004	0.014	0.72
7	正常	0.11	0.0001	0.003	0.13	6	正常	0.55	0.0004	0.014	0.72
7	正常	0.11	0.0001	0.003	0.13	8	正常	0.08	0.0000	0.003	0.09
9	正常	0.27	0.0002	0.006	0.26	8	正常	0.08	0.0000	0.003	0.09
9	正常	0.27	0.0002	0.006	0.26	10	正常	0.56	0.0005	0.016	0.77
11	SCC	1.42	0.0016	0.058	1.90	10	正常	0.56	0.0005	0.016	0.77
11	SCC	1.42	0.0016	0.058	1.90	12	SCC	0.25	0.0004	0.007	0.56
13	SCC	8.24	0.0033	0.333	10.81	12	SCC	0.25	0.0004	0.007	0.56
13	SCC	8.24	0.0033	0.333	10.81	14	SCC	0.26	0.0001	0.003	0.29
15	SCC	0.55	0.0003	0.014	0.62	14	SCC	0.26	0.0001	0.003	0.29
15	SCC	0.55	0.0003	0.014	0.62	16	SCC	1.22	0.0008	0.032	1.57
17	SCC	3.46	0.0048	0.181	5.36	16	SCC	1.22	0.0008	0.032	1.57
17	SCC	3.46	0.0048	0.181	5.36	18	SCC/AIS	1.58	0.0004	0.107	2.45
19	SSC	0.39	0.0004	0.023	0.66	18	SCC/AIS	1.58	0.0004	0.107	2.45
19	SSC	0.39	0.0004	0.023	0.66	20	低分化腺鳞状	0.56	0.0005	0.022	0.91

21	SSC	2.92	0.0013	0.092	3.95
21	SSC	2.92	0.0013	0.092	3.95	22	腺癌	0.48	0.0002	0.012	0.68
23	腺癌	0.30	0.0003	0.002	0.56	22	腺癌	0.48	0.0002	0.012	0.68
23	腺癌	0.30	0.0003	0.002	0.56	24	SCC	1.75	0.0010	0.083	3.34
25	SSC	0.43	0.0003	0.029	0.79	24	SCC	1.75	0.0010	0.083	3.34
25	SSC	0.43	0.0003	0.029	0.79	26	SSC	0.31	00004	0.018	0.46
27	SSC	0.60	0.0009	0.026	0.89	26	SSC	0.31	00004	0.018	0.46
27	SSC	0.60	0.0009	0.026	0.89	28	SSC	3.30	0.0025	0.131	4.45
29	SSC	2.28	0.0037	0124	4.37	28	SSC	3.30	0.0025	0.131	4.45
29	SSC	2.28	0.0037	0124	4.37	30	SSC	0.54	0.0007	0.021	0.87
31	腺癌	0.27	0.0002	0.007	0.58	30	SSC	0.54	0.0007	0.021	0.87
31	腺癌	0.27	0.0002	0.007	0.58	32	腺癌	0.27	0.0003	0.012	0.35
33	SCC	3.46	0.0036	0.127	4.77	32	腺癌	0.27	0.0003	0.012	0.35
33	SCC	3.46	0.0036	0.127	4.77	34	SSC	0.67	0.0004	0.036	1.19
35	SSC	0.94	0.0003	0.047	1.06	34	SSC	0.67	0.0004	0.036	1.19
35	SSC	0.94	0.0003	0.047	1.06	36	SSC	1.66	0.0004	0.057	1.74
37	SSC	2.20	0.0016	0.086	3.34	36	SSC	1.66	0.0004	0.057	1.74
37	SSC	2.20	0.0016	0.086	3.34	38	SSC	0.46	0.0002	0.008	0.41
39	SSC	0.82	0.0004	0.030	0.74	38	SSC	0.46	0.0002	0.008	0.41
39	SSC	0.82	0.0004	0.030	0.74	40	SSC	0.41	0.0002	0.013	0.29
41	SSC	3.04	0.0021	0.076	2.69	40	SSC	0.41	0.0002	0.013	0.29
41	SSC	3.04	0.0021	0.076	2.69	42	肿瘤	0.07	0.0000	0.001	0.06

序列表

<110>Millennium Pharmaceuticals，Inc.et al.

<120>用于鉴定，评估，预防和治疗宫颈癌的组合物，试剂盒和方法

<130>MRI-062PC

<150>60/404770

<151>2002-08-20

<160>44

<170>FastSEQ for Windows Version 4.0

<210>1

<211>2848

<212>DNA

<213>人

<400>1

actttccctt tcgaattcct cggtatatct tggggactgg aggacctgtc tggttattat 60

acagacgcat aactggaggt gggatccaca cagctcagaa cagctggatc ttgctcagtc 120

tctgccaggg gaagattcct tggaggaggc cctgcagcga catggaggga gctgctttgc 180

tgagagtctc tgtcctctgc atctggatga gtgcactttt ccttggtgtg ggagtgaggg 240

cagaggaagc tggagcgagg gtgcaacaaa acgttccaag tgggacagat actggagatc 300

ctcaaagtaa gcccctcggt gactgggctg ctggcaccat ggacccagag agcagtatct 360

ttattgagga tgccattaag tatttcaagg aaaaagtgag cacacagaat ctgctactcc 420

tgctgactga taatgaggcc tggaacggat tcgtggctgc tgctgaactg cccaggaatg 480

aggcagatga gctccgtaaa gctctggaca accttgcaag acaaatgatc atgaaagaca 540

aaaactggca cgataaaggc cagcagtaca gaaactggtt tctgaaagag tttcctcggt 600

tgaaaagtaa gcttgaggat aacataagaa ggctccgtgc ccttgcagat ggggttcaga 660

aggtccacaa aggcaccacc atcgccaatg tggtgtctgg ctctctcagc atttcctctg 720

gcatcctgac cctcgtcggc atgggtctgg cacccttcac agagggaggc agccttgtac 780

tcttggaacc tgggatggag ttgggaatca cagcagcttt gaccgggatt accagcagta 840

ccatagacta cggaaagaag tggtggacac aagcccaagc ccacgacctg gtcatcaaaa 900

gccttgacaa attgaaggag gtgaaggagt ttttgggtga gaacatatcc aactttcttt 960

ccttagctgg caatacttac caactcacac gaggcattgg gaaggacatc cgtgccctca 1020

gacgagccag agccaatctt cagtcagtac cgcatgcctc agcctcacgc ccccgggtca 1080

ctgagccaat ctcagctgaa agcggtgaac aggtggagag agttaatgaa cccagcatcc 1140

tggaaatgag cagaggagtc aagctcacgg atgtggcccc tgtaagcttc tttcttgtgc 1200

tggatgtagt ctacctcgtg tacgaatcaa agcacttaca tgagggggca aagtcagaga 1260

cagctgagga gctgaagaag gtggctcagg agctggagga gaagctaaac attctcaaca 1320

ataattataa gattctgcag gcggaccaag aactgtgacc acagggcagg gcagccacca 1380

ggagagatat gcctggcagg ggccaggaca aaatgcaaac tttttttttt ttctgagaca 1440

gagtcttgct ctgtcgccaa gttggagtgc aatggtgcga tctcagctca ctgcaagctc 1500

tgcctcccgt gttcaagcga ttctcctgcc ttggcctccc aagtagctgg gactacaggc 1560

gcctaccacc atgcccagct aatttttgta tttttaatag agatggggtt tcaccatgtt 1620

ggccaggatg gtctcgatct cctgacctct tgatctgccc accttggcct cccaaagtgc 1680

tgggattaca ggcgtgagcc atcgcttttg acccaaatgc aaacatttta ttagggggat 1740

aaagagggtg aggtaaagtt tatggaactg agtgttaggg actttggcat ttccatagct 1800

gagcacagca ggggaggggt taatgcagat ggcagtgcag caaggagaag gcaggaacat 1860

tggagcctgc aataagggaa aaatgggaac tggagagtgt ggggaatggg aagaagcagt 1920

ttactttaga ctaaagaata tattgggggg ccgggtgtag tggctcatgc ctgtaatccg 1980

agcactttgg gaggccaagg cgggcggatc acgaggtcag gagatcaaga ccatcctggc 2040

taacacagtg aaaccccgtc tctactaaaa atacaaaaaa ttagccgggc atggtggcgg 2100

gcgcctgtag ttccagctaa ctgggcggct gaggcaggag aatggcgtga acctgggagg 2160

tggagcttgc agtgagccga gatatcgcca ctgcactcca gcctgggtga cagagcgaga 2220

ctccatctca aaaaaaaaaa aaaaaagaat atattgacgg aagaatagag aggaggcttg 2280

aaggaaccag caatgagaag gccaggaaaa gaaagagctg aaaatggaga aagcccaaga 2340

gttagaacag ttggatacag gagaagaaac agcggctcca ctacagaccc agccccaggt 2400

tcaatgtcct ccgaagaatg aagtctttcc ctggtgatgg tcccctgccc tgtctttcca 2460

gcatccactc tcccttgtcc tcctgggggc atatctcagt caggcagcgg cttcctgatg 2520

atggtcgttg gggtggttgt catgtgatgg gtcccctcca ggttactaaa gggtgcatgt 2580

cccctgcttg aacactgaag ggcaggtggt gggccatggc catggtcccc agctgaggag 2640

caggtgtccc tgagaaccca aacttcccag agagtatgtg agaaccaacc aatgaaaaca 2700

gtcccatcgc tcttacccgg taagtaaaca gtcagaaaat tagcatgaaa gcagtttagc 2760

attgggagga agctcagatc tctagagctg tcttgtcgcc gcccaggatt gacctgtgtg 2820

taagtcccaa taaactcacc tactcatc 2848

<210>2

<211>398

<212>PRT

<213>人

<400>2

Met Glu Gly Ala Ala Leu Leu Arg Val Ser Val Leu Cys Ile Trp Met

1 5 10 15

Ser Ala Leu Phe Leu Gly Val Gly Val Arg Ala Glu Glu Ala Gly Ala

20 25 30

Arg Val Gln Gln Asn Val Pro Ser Gly Thr Asp Thr Gly Asp Pro Gln

35 40 45

Ser Lys Pro Leu Gly Asp Trp Ala Ala Gly Thr Met Asp Pro Glu Ser

50 55 60

Ser Ile Phe Ile Glu Asp Ala Ile Lys Tyr Phe Lys Glu Lys Val Ser

65 70 75 80

Thr Gln Asn Leu Leu Leu Leu Leu Thr Asp Asn Glu Ala Trp Asn Gly

85 90 95

Phe Val Ala Ala Ala Glu Leu Pro Arg Asn Glu Ala Asp Glu Leu Arg

100 105 110

Lys Ala Leu Asp Asn Leu Ala Arg Gln Met Ile Met Lys Asp Lys Asn

115 120 125

Trp His Asp Lys Gly Gln Gln Tyr Arg Asn Trp Phe Leu Lys Glu Phe

130 135 140

Pro Arg Leu Lys Ser Lys Leu Glu Asp Asn Ile Arg Arg Leu Arg Ala

145 150 155 160

Leu Ala Asp Gly Val Gln Lys Val His Lys Gly Thr Thr Ile Ala Asn

165 170 175

Val Val Ser Gly Ser Leu Ser Ile Ser Ser Gly Ile Leu Thr Leu Val

180 185 190

Gly Met Gly Leu Ala Pro Phe Thr Glu Gly Gly Ser Leu Val Leu Leu

195 200 205

Glu Pro Gly Met Glu Leu Gly Ile Thr Ala Ala Leu Thr Gly Ile Thr

210 215 220

Ser Ser Thr Ile Asp Tyr Gly Lys Lys Trp Trp Thr Gln Ala Gln Ala

225 230 235 240

His Asp Leu Val Ile Lys Ser Leu Asp Lys Leu Lys Glu Val Lys Glu

245 250 255

Phe Leu Gly Glu Asn Ile Ser Asn Phe Leu Ser Leu Ala Gly Asn Thr

260 265 270

Tyr Gln Leu Thr Arg Gly Ile Gly Lys Asp Ile Arg Ala Leu Arg Arg

275 280 285

Ala Arg Ala Asn Leu Gln Ser Val Pro His Ala Ser Ala Ser Arg Pro

290 295 300

Arg Val Thr Glu Pro Ile Ser Ala Glu Ser Gly Glu Gln Val Glu Arg

305 310 315 320

Val Asn Glu Pro Ser Ile Leu Glu Met Ser Arg Gly Val Lys Leu Thr

325 330 335

Asp Val Ala Pro Val Ser Phe Phe Leu Val Leu Asp Val Val Tyr Leu

340 345 350

Val Tyr Glu Ser Lys His Leu His Glu Gly Ala Lys Ser Glu Thr Ala

355 360 365

Glu Glu Leu Lys Lys Val Ala Gln Glu Leu Glu Glu Lys Leu Asn Ile

370 375 380

Leu Asn Asn Asn Tyr Lys Ile Leu Gln Ala Asp Gln Glu Leu

385 390 395

<210>3

<211>2545

<212>DNA

<213>人

<400>3

gtgctgggga gcagcgtgtt tactgtgctt ggtcatgagc tgctgggaag ttgtgacttt 60

cactttccct ttcgaattcc agggtatatc tgggaggccg gaggacgtgt ctggttatta 120

cacagatgca cagctggacg tgggatccac acagctcaga acagttggat cttgctcagt 180

ctctgtcaga ggaagatccc ttggacaaga ggaccctgcc ttggtgtgag agtgagggaa 240

gaggaagctg gaacgagggt taaggaaaac cttccagtct ggacagtgac tggagagctc 300

caaggaaagc ccctcggtaa cccagccgct ggcaccatga acccagagag cagtatcttt 360

attgaggatt accttaagta tttccaggac caagtgagca gagagaatct gctacaactg 420

ctgactgatg atgaagcctg gaatggattc gtggctgctg ctgaactgcc cagggatgag 480

gcagatgagc tccgtaaagc tctgaacaag cttgcaagtc acatggtcat gaaggacaaa 540

aaccgccacg ataaagacca gcagcacagg cagtggtttt tgaaagagtt tcctcggttg 600

aaaagggagc ttgaggatca cataaggaag ctccgtgccc ttgcagagga ggttgagcag 660

gtccacagag gcaccaccat tgccaatgtg gtgtccaact ctgttggcac tacctctggc 720

atcctgaccc tcctcggcct gggtctggca cccttcacag aaggaatcag ttttgtgctc 780

ttggacactg gcatgggtct gggagcagca gctgctgtgg ctgggattac ctgcagtgtg 840

gtagaactag taaacaaatt gcgggcacga gcccaagccc gcaacttgga ccaaagcggc 900

accaatgtag caaaggtgat gaaggagttt gtgggtggga acacacccaa tgttcttacc 960

ttagttgaca attggtacca agtcacacaa gggattggga ggaacatccg tgccatcaga 1020

cgagccagag ccaaccctca gttaggagcg tatgccccac ccccgcatat cattgggcga 1080

atctcagctg aaggcggtga acaggttgag agggttgttg aaggccccgc ccaggcaatg 1140

agcagaggaa ccatgatcgt gggtgcagcc actggaggca tcttgcttct gctggatgtg 1200

gtcagccttg catatgagtc aaagcacttg cttgaggggg caaagtcaga gtcagctgag 1260

gagctgaaga agcgggctca ggagctggag gggaagctca actttctcac caagatccat 1320

gagatgctgc agccaggcca agaccaatga ccccagagca gtgcagccac cagggcagaa 1380

atgccgggca caggccagga caaaatgcag actttttttt tttttttttt ttttttttga 1440

gatggagtct cgctctatcg cccaggatgg agtgcagtgg ctcaatctcg gctcactgca 1500

aactccgcct cccgggttca caccattctc cggcctcagt ctcccgagta gctgggacta 1560

caggcacctg ccaccacgcc cggctaattt ttttgtattt tcactggaga cggggtttca 1620

ctgtgttagc cacgatggtc tccatctcct gacctcgtga tctgcccacc tcggcctccc 1680

aaagtgctgg gattacaggc gtgagccacc gcgcctggcc aaaatgcaga cattttatta 1740

gggggataag gagggcaagg taaagcttat ggaactgagt gttagtgact ttggcatttg 1800

tgtagctgag cacagcaagg gaggggttaa tgcagatggc aagtgcacca aggagaaggc 1860

aggaacactg gagcctgcaa taagggagga gagaggactg gagagtgtgg ggaatgggaa 1920

gaagtagttt actttggact aaagaatata ttgggcgaag aatagagggg gagcttgcag 1980

gaaccagcaa tgagaaggcc aggaaaagaa agagctgaaa atggagaaaa ccagagttag 2040

aactgttgga tacaggagaa gaaacagcag ctccactacc gacccccccc caggtttgat 2100

gtccttccaa gaataaagtc tttccctggt gatggtctct cgctctgtct ttccagcatc 2160

cactctccct tgtccttctg ggggtgtatc acagtcagcc agtggcttct tcatgatggt 2220

ggttggggtg gttgtcatgt gacgggtccc ctccaggtta ctaaagggtg catgtcccct 2280

gcttgaaccc tgagaggcag gtggtaggcc atggccacaa tccccagctg aggagcaggt 2340

gtccctgaga acccaaactt cccagagagt atctgagaac caaccaatga aaacagtccc 2400

atcgctctta gccggtaagt aaacagtcag aagattagca tgaaagcagt ttagcattgg 2460

gaggaagcac agatctctag agctgtcctg tcgctgccca ggattgacct gtgtgtaagt 2520

cccaataaac tcacctactc accaa 2545

<210>4

<211>337

<212>PRT

<213>人

<400>4

Met Asn Pro Glu Ser Ser Ile Phe Ile Glu Asp Tyr Leu Lys Tyr Phe

1 5 10 15

Gln Asp Gln Val Ser Arg Glu Asn Leu Leu Gln Leu Leu Thr Asp Asp

20 25 30

Glu Ala Trp Asn Gly Phe Val Ala Ala Ala Glu Leu Pro Arg Asp Glu

35 40 45

Ala Asp Glu Leu Arg Lys Ala Leu Asn Lys Leu Ala Ser His Met Val

50 55 60

Met Lys Asp Lys Asn Arg His Asp Lys Asp Gln Gln His Arg Gln Trp

65 70 75 80

Phe Leu Lys Glu Phe Pro Arg Leu Lys Arg Glu Leu Glu Asp His Ile

85 90 95

Arg Lys Leu Arg Ala Leu Ala Glu Glu Val Glu Gln Val His Arg Gly

100 105 110

Thr Thr Ile Ala Asn Val Val Ser Asn Ser Val Gly Thr Thr Ser Gly

115 120 125

Ile Leu Thr Leu Leu Gly Leu Gly Leu Ala Pro Phe Thr Glu Gly Ile

130 135 140

Ser Phe Val Leu Leu Asp Thr Gly Met Gly Leu Gly Ala Ala Ala Ala

145 150 155 160

Val Ala Gly Ile Thr Cys Ser Val Val Glu Leu Val Asn Lys Leu Arg

165 170 175

Ala Arg Ala Gln Ala Arg Asn Leu Asp Gln Ser Gly Thr Asn Val Ala

180 185 190

Lys Val Met Lys Glu Phe Val Gly Gly Asn Thr Pro Asn Val Leu Thr

195 200 205

Leu Val Asp Asn Trp Tyr Gln Val Thr Gln Gly Ile Gly Arg Asn Ile

210 215 220

Arg Ala Ile Arg Arg Ala Arg Ala Asn Pro Gln Leu Gly Ala Tyr Ala

225 230 235 240

Pro Pro Pro His Ile Ile Gly Arg Ile Ser Ala Glu Gly Gly Glu Gln

245 250 255

Val Glu Arg Val Val Glu Gly Pro Ala Gln Ala Met Ser Arg Gly Thr

260 265 270

Met Ile Val Gly Ala Ala Thr Gly Gly Ile Leu Leu Leu Leu Asp Val

275 280 285

Val Ser Leu Ala Tyr Glu Ser Lys His Leu Leu Glu Gly Ala Lys Ser

290 295 300

Glu Ser Ala Glu Glu Leu Lys Lys Arg Ala Gln Glu Leu Glu Gly Lys

305 310 315 320

Leu Asn Phe Leu Thr Lys Ile His Glu Met Leu Gln Pro Gly Gln Asp

325 330 335

Gln

<210>5

<211>2100

<212>DNA

<213>人

<400>5

agacgccccg aggtcggagt gaagcgccgg gaccgagccc cgtctcccag ggagtccggg 60

gcgcacggca ccgaggagag cgcgggagcc aacctgggcg catcatgcgc agggcccggg 120

acgctgggcc ggtctacacc gccgcctggg tcacgtggcc cggacgggcc ggcggctgcc 180

ccggccgggg ggcgggggtc gcgccggggt tgcgctggac gacggagagc ggcgggcccg 240

cagcggcctg gagcctccca acccgcgccg cgctggccct cgagcgtagg agccgccccc 300

tgcccccccg cgccggcccc gcgcccggcc gcccgccccc tatatagcgc gccccagcag 360

ggcccgcgcc aggccgccag cctcggagtg ggcgcgggac agtgcgcggc gccccgcagc 420

caggcccccg cccccgccgc atccacctcc tccgccgcct gcgacccaac gggcgccccc 480

cgccgcggca gctgccgccg ggcccccgcg gccaccatga agaaggaggt gtgctccgtg 540

gccttcctca aggccgtgtt cgcagagttc ttggccaccc tcatcttcgt cttctttggc 600

ctgggctcgg ccctcaagtg gccgtcggcg ctgcctacca tcctgcagat cgcgctggcg 660

tttggcctgg ccataggcac gctggcccag gccctgggac ccgtgagcgg cggccacatc 720

aaccccgcca tcaccctggc cctcttggtg ggcaaccaga tctcgctgct ccgggctttc 780

ttctacgtgg cggcccagct ggtgggcgcc attgccgggg ctggcatcct ctacggtgtg 840

gcaccgctca atgcccgggg caatctggcc gtcaacgcgc tcaacaacaa cacaacgcag 900

ggccaggcca tggtggtgga gctgattctg accttccagc tggcactctg catcttcgcc 960

tccactgact cccgccgcac cagccctgtg ggctccccag ccctgtccat tggcctgtct 1020

gtcaccctgg gccaccttgt cggaatctac ttcactggct gctccatgaa cccagcccgc 1080

tcttttggcc ctgcggtggt catgaatcgg ttcagccccg ctcactgggt tttctgggta 1140

gggcccatcg tgggggcggt cctggctgcc atcctttact tctacctgct cttccccaac 1200

tccctgagcc tgagtgagcg tgtggccatc atcaaaggca cgtatgagcc tgacgaggac 1260

tgggaggagc agcgggaaga gcggaagaag accatggagc tgaccacccg ctgaccagtg 1320

tcaggcaggg gccagcccct cagcccctga gccaaggggg aaaagaagaa aaagtaccta 1380

acacaagctt cctttttgca caaccggtcc tcttggctga ggaggaggag ctggtcaccc 1440

tggctgcaca gttagagagg ggagaaggaa cccatgatgg gactcctggg gtaggggcca 1500

ggggctgggg tctgctgggg acaggtctct ctgggacaga cctcagagat tgtgaatgca 1560

gtgccaagct cacaggctgc aagggccagg ccagaaaagg gtgggcctgc agcctgcacc 1620

ccccaccttc cccaaccctt cctcaagagc tgaagggatc ccagccccta ggtgggcaga 1680

ggcagaccct ccccagagct ccttaggaag aagacagact ggttcattga atgccgcctt 1740

atttatttct ggtgaggatg catgcgtggg gctgctggtg tttagagtgg gggctaccca 1800

ataaatcact gatactcaaa acaccagcag accctcccca gagctcctta ggaagaagac 1860

agactggttc attgaatgcc gccttattta tttctggtga ggatgcatgc gtggggctgc 1920

tggtgtttag agtgggggct acccaataaa tcactgatac tcacattccg cctctgtctc 1980

tcctcagagt gccttgagac actctggccc attgcctctc ctctttgtca tcccacatcc 2040

tccaccacga tctccacagg gtaccagggg accccaggac aagtgctctg tgggaagaaa 2100

<210>6

<211>265

<212>PRT

<213>人

<400>6

Met Lys Lys Glu Val Cys Ser Val Ala Phe Leu Lys Ala Val Phe Ala

1 5 10 15

Glu Phe Leu Ala Thr Leu Ile Phe Val Phe Phe Gly Leu Gly Ser Ala

20 25 30

Leu Lys Trp Pro Ser Ala Leu Pro Thr Ile Leu Gln Ile Ala Leu Ala

35 40 45

Phe Gly Leu Ala Ile Gly Thr Leu Ala Gln Ala Leu Gly Pro Val Ser

50 55 60

Gly Gly His Ile Asn Pro Ala Ile Thr Leu Ala Leu Leu Val Gly Asn

65 70 75 80

Gln Ile Ser Leu Leu Arg Ala Phe Phe Tyr Val Ala Ala Gln Leu Val

85 90 95

Gly Ala Ile Ala Gly Ala Gly Ile Leu Tyr Gly Val Ala Pro Leu Asn

100 105 110

Ala Arg Gly Asn Leu Ala Val Asn Ala Leu Asn Asn Asn Thr Thr Gln

115 120 125

Gly Gln Ala Met Val Val Glu Leu Ile Leu Thr Phe Gln Leu Ala Leu

130 135 140

Cys Ile Phe Ala Ser Thr Asp Ser Arg Arg Thr Ser Pro Val Gly Ser

145 150 155 160

Pro Ala Leu Ser Ile Gly Leu Ser Val Thr Leu Gly His Leu Val Gly

165 170 175

Ile Tyr Phe Thr Gly Cys Ser Met Asn Pro Ala Arg Ser Phe Gly Pro

180 185 190

Ala Val Val Met Asn Arg Phe Ser Pro Ala His Trp Val Phe Trp Val

195 200 205

Gly Pro Ile Val Gly Ala Val Leu Ala Ala Ile Leu Tyr Phe Tyr Leu

210 215 220

Leu Phe Pro Asn Ser Leu Ser Leu Ser Glu Arg Val Ala Ile Ile Lys

225 230 235 240

Gly Thr Tyr Glu Pro Asp Glu Asp Trp Glu Glu Gln Arg Glu Glu Arg

245 250 255

Lys Lys Thr Met Glu Leu Thr Thr Arg

260 265

<210>7

<211>1935

<212>DNA

<213>人

<400>7

agacgccccg aggtcggagt gaagcgccgg gaccgagccc cgtctcccag ggagtccggg 60

gcgcacggca ccgaggagag cgcgggagcc aacctgggcg catcatgcgc agggcccggg 120

acgctgggcc ggtctacacc gccgcctggg tcacgtggcc cggacgggcc ggcggctgcc 180

ccggccgggg ggcgggggtc gcgccggggt tgcgctggac gacggagagc ggcgggcccg 240

cagcggcctg gagcctccca acccgcgccg cgctggccct cgagcgtagg agccgccccc 300

tgcccccccg cgccggcccc gcgcccggcc gcccgccccc tatatagcgc gccccagcag 360

ggcccgcgcc aggccgccag cctcggagtg ggcgcgggac agtgcgcggc gccccgcagc 420

caggcccccg cccccgccgc atccacctcc tccgccgcct gcgacccaac gggcgccccc 480

cgccgcggca gctgccgccg ggcccccgcg gccaccatga agaaggaggt gtgctccgtg 540

gccttcctca aggccgtgtt cgcagagttc ttggccaccc tcatcttcgt cttctttggc 600

ctgggctcgg ccctcaagtg gccgtcggcg ctgcctacca tcctgcagat cgcgctggcg 660

tttggcctgg ccataggcac gctggcccag gccctgggac ccgtgagcgg cggccacatc 720

aaccccgcca tcaccctggc cctcttggtg ggcaaccaga tctcgctgct ccgggctttc 780

ttctacgtgg cggcccagct ggtgggcgcc attgccgggg ctggcatcct ctacggtgtg 840

gcaccgctca atgcccgggg caatctggcc gtcaacgcga tctacttcac tggctgctcc 900

atgaacccag cccgctcttt tggccctgcg gtggtcatga atcggttcag ccccgctcac 960

tgggttttct gggtagggcc catcgtgggg gcggtcctgg ctgccatcct ttacttctac 1020

ctgctcttcc ccaactccct gagcctgagt gagcgtgtgg ccatcatcaa aggcacgtat 1080

gagcctgacg aggactggga ggagcagcgg gaagagcgga agaagaccat ggagctgacc 1140

acccgctgac cagtgtcagg caggggccag cccctcagcc cctgagccaa gggggaaaag 1200

aagaaaaagt acctaacaca agcttccttt ttgcacaacc ggtcctcttg gctgaggagg 1260

aggagctggt caccctggct gcacagttag agaggggaga aggaacccat gatgggactc 1320

ctggggtagg ggccaggggc tggggtctgc tggggacagg tctctctggg acagacctca 1380

gagattgtga atgcagtgcc aagctcacag gctgcaaggg ccaggccaga aaagggtggg 1440

cctgcagcct gcacccccca ccttccccaa cccttcctca agagctgaag ggatcccagc 1500

ccctaggtgg gcagaggcag accctcccca gagctcctta ggaagaagac agactggttc 1560

attgaatgcc gccttattta tttctggtga ggatgcatgc gtggggctgc tggtgtttag 1620

agtgggggct acccaataaa tcactgatac tcaaaacacc agcagaccct ccccagagct 1680

ccttaggaag aagacagact ggttcattga atgccgcctt atttatttct ggtgaggatg 1740

catgcgtggg gctgctggtg tttagagtgg gggctaccca ataaatcact gatactcaca 1800

ttccgcctct gtctctcctc agagtgcctt gagacactct ggcccattgc ctctcctctt 1860

tgtcatccca catcctccac cacgatctcc acagggtacc aggggacccc aggacaagtg 1920

ctctgtggga agaaa 1935

<210>8

<211>210

<212>PRT

<213>人

<400>8

Met Lys Lys Glu Val Cys Ser Val Ala Phe Leu Lys Ala Val Phe Ala

1 5 10 15

Glu Phe Leu Ala Thr Leu Ile Phe Val Phe Phe Gly Leu Gly Ser Ala

20 25 30

Leu Lys Trp Pro Ser Ala Leu Pro Thr Ile Leu Gln Ile Ala Leu Ala

35 40 45

Phe Gly Leu Ala Ile Gly Thr Leu Ala Gln Ala Leu Gly Pro Val Ser

50 55 60

Gly Gly His Ile Asn Pro Ala Ile Thr Leu Ala Leu Leu Val Gly Asn

65 70 75 80

Gln Ile Ser Leu Leu Arg Ala Phe Phe Tyr Val Ala Ala Gln Leu Val

85 90 95

Gly Ala Ile Ala Gly Ala Gly Ile Leu Tyr Gly Val Ala Pro Leu Asn

100 105 110

Ala Arg Gly Asn Leu Ala Val Asn Ala Ile Tyr Phe Thr Gly Cys Ser

115 120 125

Met Asn Pro Ala Arg Ser Phe Gly Pro Ala Val Val Met Asn Arg Phe

130 135 140

Ser Pro Ala His Trp Val Phe Trp Val Gly Pro Ile Val Gly Ala Val

145 150 155 160

Leu Ala Ala Ile Leu Tyr Phe Tyr Leu Leu Phe Pro Asn Ser Leu Ser

165 170 175

Leu Ser Glu Arg Val Ala Ile Ile Lys Gly Thr Tyr Glu Pro Asp Glu

180 185 190

Asp Trp Glu Glu Gln Arg Glu Glu Arg Lys Lys Thr Met Glu Leu Thr

195 200 205

Thr Arg

210

<210>9

<211>2180

<212>DNA

<213>人

<400>9

agacgccccg aggtcggagt gaagcgccgg gaccgagccc cgtctcccag ggagtccggg 60

gcgcacggca ccgaggagag cgcgggagcc aacctgggcg catcatgcgc agggcccggg 120

acgctgggcc ggtctacacc gccgcctggg tcacgtggcc cggacgggcc ggcggctgcc 180

ccggccgggg ggcgggggtc gcgccggggt tgcgctggac gacggagagc ggcgggcccg 240

cagcggcctg gagcctccca acccgcgccg cgctggccct cgagcgtagg agccgccccc 300

tgcccccccg cgccggcccc gcgcccggcc gcccgccccc tatatagcgc gccccagcag 360

ggcccgcgcc aggccgccag cctcggagtg ggcgcgggac agtgcgcggc gccccgcagc 420

caggcccccg cccccgccgc atccacctcc tccgccgcct gcgacccaac gggcgccccc 480

cgccgcggca gctgccgccg ggcccccgcg gccaccatga agaaggaggt gtgctccgtg 540

gccttcctca aggccgtgtt cgcagagttc ttggccaccc tcatcttcgt cttctttggc 600

ctgggctcgg ccctcaagtg gccgtcggcg ctgcctacca tcctgcagat cgcgctggcg 660

tttggcctgg ccataggcac gctggcccag gccctgggac ccgtgagcgg cggccacatc 720

aaccccgcca tcaccctggc cctcttggtg ggcaaccaga tctcgctgct ccgggctttc 780

ttctacgtgg cggcccagct ggtgggcgcc attgccgggg ctggcatcct ctacggtgtg 840

gcaccgctca atgcccgggg caatctggcc gtcaacgcgc tcaacaacaa cacaacgcag 900

ggccaggcca tggtggtgga gctgattctg accttccagc tggcactctg catcttcgcc 960

tccactgact cccgccgcac cagccctgtg ggctccccag ccctgtccat tggcctgtct 1020

gtcaccctgg gccaccttgt cggaatctac ttcactggct gctccatgaa cccagcccgc 1080

tcttttggcc ctgcggtggt catgaatcgg ttcagccccg ctcactgggg tctgcttcta 1140

tccctgcgtg gaggggacac gcgctctgtt catccgtctc tctgaggacc cacgtgtccc 1200

ctctgaaggt tttctgggta gggcccatcg tgggggcggt cctggctgcc atcctttact 1260

tctacctgct cttccccaac tccctgagcc tgagtgagcg tgtggccatc atcaaaggca 1320

cgtatgagcc tgacgaggac tgggaggagc agcgggaaga gcggaagaag accatggagc 1380

tgaccacccg ctgaccagtg tcaggcaggg gccagcccct cagcccctga gccaaggggg 1440

aaaagaagaa aaagtaccta acacaagctt cctttttgca caaccggtcc tcttggctga 1500

ggaggaggag ctggtcaccc tggctgcaca gttagagagg ggagaaggaa cccatgatgg 1560

gactcctggg gtaggggcca ggggctgggg tctgctgggg acaggtctct ctgggacaga 1620

cctcagagat tgtgaatgca gtgccaagct cacaggctgc aagggccagg ccagaaaagg 1680

gtgggcctgc agcctgcacc ccccaccttc cccaaccctt cctcaagagc tgaagggatc 1740

ccagccccta ggtgggcaga ggcagaccct ccccagagct ccttaggaag aagacagact 1800

ggttcattga atgccgcctt atttatttct ggtgaggatg catgcgtggg gctgctggtg 1860

tttagagtgg gggctaccca ataaatcact gatactcaaa acaccagcag accctcccca 1920

gagctcctta ggaagaagac agactggttc attgaatgcc gccttattta tttctggtga 1980

ggatgcatgc gtggggctgc tggtgtttag agtgggggct acccaataaa tcactgatac 2040

tcacattccg cctctgtctc tcctcagagt gccttgagac actctggccc attgcctctc 2100

ctctttgtca tcccacatcc tccaccacga tctccacagg gtaccagggg accccaggac 2160

aagtgctctg tgggaagaaa 2180

<210>10

<211>222

<212>PRT

<213>人

<400>10

Met Lys Lys Glu Val Cys Ser Val Ala Phe Leu Lys Ala Val Phe Ala

1 5 10 15

Glu Phe Leu Ala Thr Leu Ile Phe Val Phe Phe Gly Leu Gly Ser Ala

20 25 30

Leu Lvs Trp Pro Ser Ala Leu Pro Thr Ile Leu Gln Ile Ala Leu Ala

35 40 45

Phe Gly Leu Ala Ile Gly Thr Leu Ala Gln Ala Leu Gly Pro Val Ser

50 55 60

Gly Gly His Ile Asn Pro Ala Ile Thr Leu Ala Leu Leu Val Gly Asn

65 70 75 80

Gln Ile Ser Leu Leu Arg Ala Phe Phe Tyr Val Ala Ala Gln Leu Val

85 90 95

Gly Ala Ile Ala Gly Ala Gly Ile Leu Tyr Gly Val Ala Pro Leu Asn

100 105 110

Ala Arg Gly Asn Leu Ala Val Asn Ala Leu Asn Asn Asn Thr Thr Gln

115 120 125

Gly Gln Ala Met Val Val Glu Leu Ile Leu Thr Phe Gln Leu Ala Leu

130 135 140

Cys Ile Phe Ala Ser Thr Asp Ser Arg Arg Thr Ser Pro Val Gly Ser

145 150 155 160

Pro Ala Leu Ser Ile Gly Leu Ser Val Thr Leu Gly His Leu Val Gly

165 170 175

Ile Tyr Phe Thr Gly Cys Ser Met Asn Pro Ala Arg Ser Phe Gly Pro

180 185 190

Ala Val Val Met Asn Arg Phe Ser Pro Ala His Trp Gly Leu Leu Leu

195 200 205

Ser Leu Arg Gly Gly Asp Thr Arg Ser Val His Pro Ser Leu

210 215 220

<210>11

<211>1051

<212>DNA

<213>人

<400>11

cctaactcca ggccagactc cttagcaccc tcccctaact ccaggccaga ctcctttcag 60

ctaaaggggt ggaattcatg gcatctactt cgtatgacta ttgcagagtg cccatggaag 120

acggggataa gcgctgtaag cttctgctgg ggataggaat tctggtgctc ctgatcatcg 180

tgattctggg ggtgcccttg attatcttca ccatcaaggc caacagcgag gcctgccggg 240

acggccttcg ggcagtgatg gagtgtcgca atgtcaccca tctcctgcaa caagagctga 300

ccgaggccca gaagggcttt caggatgtgg aggcccaggc cgccacctgc aaccacactg 360

tgatggccct aatggcttcc ctggatgcag agaaggccca aggacaaaag aaagtggagg 420

agcttgaggg agagatcact acattaaacc ataagcttca ggacgcgtct gcagaggtgg 480

agcgactgag aagagaaaac caggtcttaa gcgtgagaat cgcggacaag aagtactacc 540

ccagctccca ggactccagc tccgctgcgg cgccccagct gctgattgtg ctgctgggcc 600

tcagcgctct gctgcagtga gatcccagga agctggcaca tcttggaagg tccgtcctgc 660

tcggcttttc gcttgaacat tcccttgatc tcatcagttc tgagcgggtc atggggcaac 720

acggttagcg gggagagcac ggggtagccg gagaagggcc tctggagcag gtctggaggg 780

gccatggggc agtcctgggt gtggggacac agtcgggttg acccagggct gtctccctcc 840

agagcctccc tccggacaat gagtcccccc tcttgtctcc caccctgaga ttgggcatgg 900

ggtgcggtgt ggggggcatg tgctgcctgt tgttatgggt tttttttgcg gggggggttg 960

cttttttctg gggtctttga gctccaaaaa ataaacactt cctttgaggg agagcaaaaa 1020

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 1051

<210>12

<211>180

<212>PRT

<213>人

<400>12

Met Ala Ser Thr Ser Tyr Asp Tyr Cys Arg Val Pro Met Glu Asp Gly

1 5 10 15

Asp Lys Arg Cys Lys Leu Leu Leu Gly Ile Gly Ile Leu Val Leu Leu

20 25 30

Ile Ile Val Ile Leu Gly Val Pro Leu Ile Ile Phe Thr Ile Lys Ala

35 40 45

Asn Ser Glu Ala Cys Arg Asp Gly Leu Arg Ala Val Met Glu Cys Arg

50 55 60

Asn Val Thr His Leu Leu Gln Gln Glu Leu Thr Glu Ala Gln Lys Gly

65 70 75 80

Phe Gln Asp Val Glu Ala Gln Ala Ala Thr Cys Asn His Thr Val Met

85 90 95

Ala Leu Met Ala Ser Leu Asp Ala Glu Lys Ala Gln Gly Gln Lys Lys

100 105 110

Val Glu Glu Leu Glu Gly Glu Ile Thr Thr Leu Asn His Lys Leu Gln

115 120 125

Asp Ala Ser Ala Glu Val Glu Arg Leu Arg Arg Glu Asn Gln Val Leu

130 135 140

Ser Val Arg Ile Ala Asp Lys Lys Tyr Tyr Pro Ser Ser Gln Asp Ser

145 150 155 160

Ser Ser Ala Ala Ala Pro Gln Leu Leu Ile Val Leu Leu Gly Leu Ser

165 170 175

Ala Leu Leu Gln

180

<210>13

<211>3445

<212>DNA

<213>人

<400>13

gagcaaccgc agcttctagt atccagactc cagcgccgcc ccgggcgcgg accccaaccc 60

cgacccagag cttctccagc ggcggcgcag cgagcagggc tccccgcctt aacttcctcc 120

gcggggccca gccaccttcg ggagtccggg ttgcccacct gcaaactctc cgccttctgc 180

acctgccacc cctgagccag cgcgggcgcc cgagcgagtc atggccaacg cggggctgca 240

gctgttgggc ttcattctcg ccttcctggg atggatcggc gccatcgtca gcactgccct 300

gccccagtgg aggatttact cctatgccgg cgacaacatc gtgaccgccc aggccatgta 360

cgaggggctg tggatgtcct gcgtgtcgca gagcaccggg cagatccagt gcaaagtctt 420

tgactccttg ctgaatctga gcagcacatt gcaagcaacc cgtgccttga tggtggttgg 480

catcctcctg ggagtgatag caatctttgt ggccaccgtt ggcatgaagt gtatgaagtg 540

cttggaagac gatgaggtgc agaagatgag gatggctgtc attgggggtg cgatatttct 600

tcttgcaggt ctggctattt tagttgccac agcatggtat ggcaatagaa tcgttcaaga 660

attctatgac cctatgaccc cagtcaatgc caggtacgaa tttggtcagg ctctcttcac 720

tggctgggct gctgcttctc tctgccttct gggaggtgcc ctactttgct gttcctgtcc 780

ccgaaaaaca acctcttacc caacaccaag gccctatcca aaacctgcac cttccagcgg 840

gaaagactac gtgtgacaca gaggcaaaag gagaaaatca tgttgaaaca aaccgaaaat 900

ggacattgag atactatcat taacattagg accttagaat tttgggtatt gtaatctgaa 960

gtatggtatt acaaaacaaa caaacaaaca aaaaacccat gtgttaaaat actcagtgct 1020

aaacatggct taatcttatt ttatcttctt tcctcaatat aggagggaag atttttccat 1080

ttgtattact gcttcccatt gagtaatcat actcaattgg gggaaggggt gctccttaaa 1140

tatatataga tatgtatata tacatgtttt tctattaaaa atagacagta aaatactatt 1200

ctcattatgt tgatactagc atacttaaaa tatctctaaa ataggtaaat gtatttaatt 1260

ccatattgat gaagatgttt attggtatat tttctttttc gtctatatat acatatgtaa 1320

cagtcaaata tcatttactc ttcttcatta gctttgggtg cctttgccac aagacctagc 1380

ctaatttacc aaggatgaat tctttcaatt cttcatgcgt gcccttttca tatacttatt 1440

ttatttttta ccataatctt atagcacttg catcgttatt aagcccttat ttgttttgtg 1500

tttcattggt ctctatctcc tgaatctaac acatttcata gcctacattt tagtttctaa 1560

agccaagaag aatttattac aaatcagaac tttggaggca aatctttctg catgaccaaa 1620

gtgataaatt cctgttgacc ttcccacaca atccctgtac tctgacccat agcactcttg 1680

tttgctttga aaatatttgt ccaattgagt agctgcatgc tgttccccca ggtgttgtaa 1740

cacaacttta ttgattgaat ttttaagcta cttattcata gttttatatc cccctaaact 1800

acctttttgt tccccattcc ttaattgtat tgttttccca agtgtaatta tcatgcgttt 1860

tatatcttcc taataaggtg tggtctgttt gtctgaacaa agtgctagac tttctggagt 1920

gataatctgg tgacaaatat tctctctgta gctgtaagca agtcacttaa tctttctacc 1980

tcttttttct atctgccaaa ttgagataat gatacttaac cagttagaag aggtagtgtg 2040

aatattaatt agtttatatt actctcattc tttgaacatg aactatgcct atgtagtgtc 2100

tttatttgct cagctggctg agacactgaa gaagtcactg aacaaaacct acacacgtac 2160

cttcatgtga ttcactgcct tcctctctct accagtctat ttccactgaa caaaacctac 2220

acacatacct tcatgtggtt cagtgccttc ctctctctac cagtctattt ccactgaaca 2280

aaacctacgc acataccttc atgtggctca gtgccttcct ctctctacca gtctatttcc 2340

attctttcag ctgtgtctga catgtttgtg ctctgttcca ttttaacaac tgctcttact 2400

tttccagtct gtacagaatg ctatttcact tgagcaagat gatgtaatgg aaagggtgtt 2460

ggcattggtg tctggagacc tggatttgag tcttggtgct atcaatcacc gtctgtgttt 2520

gagcaaggca tttggctgct gtaagcttat tgcttcatct gtaagcggtg gtttgtaatt 2580

cctgatcttc ccacctcaca gtgatgttgt ggggatccag tgagatagaa tacatgtaag 2640

tgtggttttg taatttaaaa agtgctatac taagggaaag aattgaggaa ttaactgcat 2700

acgttttggt gttgcttttc aaatgtttga aaacaaaaaa aatgttaaga aatgggtttc 2760

ttgccttaac cagtctctca agtgatgaga cagtgaagta aaattgagtg cactaaacaa 2820

ataagattct gaggaagtct tatcttctgc agtgagtatg gcccgatgct ttctgtggct 2880

aaacagatgt aatgggaaga aataaaagcc tacgtgttgg taaatccaac agcaagggag 2940

atttttgaat cataataact cataaggtgc tatctgttca gtgatgccct cagagctctt 3000

gctgttagct ggcagctgac gctgctagga tagttagttt ggaaatggta cttcataata 3060

aactacacaa ggaaagtcag ccactgtgtc ttatgaggaa ttggacctaa taaattttag 3120

tgtgccttcc aaacctgaga atatatgctt ttggaagtta aaatttaaat ggcttttgcc 3180

acatacatag atcttcatga tgtgtgagtg taattccatg tggatatcag ttaccaaaca 3240

ttacaaaaaa attttatggc ccaaaatgac caacgaaatt gttacaatag aatttatcca 3300

attttgatct ttttatattc ttctaccaca cctggaaaca gaccaataga cattttgggg 3360

ttttataata ggaatttgta taaagcatta ctctttttca ataaattgtt ttttaattta 3420

aaaaaaggaa aaaaaaaaaa aaaaa 3445

<210>14

<211>211

<212>PRT

<213>人

<400>14

Met Ala Asn Ala Gly Leu Gln Leu Leu Gly Phe Ile Leu Ala Phe Leu

1 5 10 15

Gly Trp Ile Gly Ala Ile Val Ser Thr Ala Leu Pro Gln Trp Arg Ile

20 25 30

Tyr Ser Tyr Ala Gly Asp Asn Ile Val Thr Ala Gln Ala Met Tyr Glu

35 40 45

Gly Leu Trp Met Ser Cys Val Ser Gln Ser Thr Gly Gln Ile Gln Cys

50 55 60

Lys Val Phe Asp Ser Leu Leu Asn Leu Ser Ser Thr Leu Gln Ala Thr

65 70 75 80

Arg Ala Leu Met Val Val Gly Ile Leu Leu Gly Val Ile Ala Ile Phe

85 90 95

Val Ala Thr Val Gly Met Lys Cys Met Lys Cys Leu Glu Asp Asp Glu

100 105 110

Val Gln Lys Met Arg Met Ala Val Ile Gly Gly Ala Ile Phe Leu Leu

115 120 125

Ala Gly Leu Ala Ile Leu Val Ala Thr Ala Trp Tyr Gly Asn Arg Ile

130 135 140

Val Gln Glu Phe Tyr Asp Pro Met Thr Pro Val Asn Ala Arg Tyr Glu

145 150 155 160

Phe Gly Gln Ala Leu Phe Thr Gly Trp Ala Ala Ala Ser Leu Cys Leu

165 170 175

Leu Gly Gly Ala Leu Leu Cys Cys Ser Cys Pro Arg Lys Thr Thr Ser

180 185 190

Tyr Pro Thr Pro Arg Pro Tyr Pro Lys Pro Ala Pro Ser Ser Gly Lys

195 200 205

Asp Tyr Val

210

<210>15

<211>1850

<212>DNA

<213>人

<400>15

cgcgctcgca gctcgcaggc gccgcgtagc cgtcgccacc gccgccagcc cgtgcgccct 60

cggcgcgtac ccgccgcgct cccatccccg ccgccggcca ggggcgcgct cggccgcccc 120

ggacagtgtc ccgctgcggc tccgcggcga tggccaccaa gatcgacaaa gaggcttgcc 180

gggcggcgta caacctggtg cgcgacgacg gctcggccgt catctgggtg acttttaaat 240

atgacggctc caccatcgtc cccggcgagc agggagcgga gtaccagcac ttcatccagc 300

agtgcacaga tgacgtccgg ttgtttgcct tcgtgcgctt caccaccggg gatgccatga 360

gcaagaggtc caagtttgcc ctcatcacgt ggatcggtga gaacgtcagc gggctgcagc 420

gcgccaaaac cgggacggac aagaccctgg tgaaggaggt cgtacagaat ttcgctaagg 480

agtttgtgat cagtgatcgg aaggagctgg aggaagattt catcaagagc gagctgaaga 540

aggcgggggg agccaattac gacgcccaga cggagtaacc ccagcccccg ccacaccacc 600

ccttgccaaa gtcatctgcc tgctccccgg gggagaggac cgccggcctc agctactagc 660

ccaccagccc accagggaga aaagaagcca tgagaggcag cgcccgccac cctgtgtcca 720

cagcccccac cttcccgctt cccttagaac cctgccgtgt cctatctcat gacgctcatg 780

gaacctcttt ctttgatctt ctttttcttt tctccccctc ttttttgttc taaagaaaag 840

tcattttgat gcaaggtcct gcctgccatc agatccgagg tgcctcctgc agtgacccct 900

tttcctggca tttctcttcc acgcgacgag gtctgcctag tgagatctgc atgacctcac 960

gttgctttcc agagcccggg cctattttgc catctcagtt ttcctggacc ctgcttcctg 1020

tgtaccactg aggggcagct gggccaggag ctgtgcccgg tgcctgcagc cttcataagc 1080

acacacgtcc attccctact aaggcccaga cctcctggta tctgccccgg gctccctcat 1140

cccacctcca tccggagttg cctaagatgc atgtccagca taggcaggat tgctcggtgg 1200

tgagaaggtt aggtccggct cagactgaat aagaagagat aaaatttgcc ttaaaactta 1260

cctggcagtg gctttgctgc acggtctgaa accacctgtt cccaccctct tgaccgaaat 1320

ttccttgtga cacagagaag ggcaaaggtc tgagcccaga gttgacggag ggagtatttc 1380

agggttcact tcaggggctc ccaaagcgac aagatcgtta gggagagagg cccagggtgg 1440

ggactgggaa tttaaggaga gctgggaacg gatcccttag gttcaggaag cttctgtgta 1500

agctgcgagg atggcttggg ccgaagggtt gctctgcccg ccgcgctagc tgtgagctga 1560

gcaaagccct gggctcacag caccccaaaa gcctgtggct tcagtcctgc gtctgcacca 1620

cacattcaaa aggatcgttt tgttttgttt ttaaagaaag gtgagattgg cttggttctt 1680

catgagcaca tttgatatag ctctttttct gtttttcctt gctcatttcg ttttggggaa 1740

gaaatctgta ctgtattggg attgtaaaga acatctctgc actcagacag tttacagaaa 1800

taaatgtttt ttttgttttt cagaaaaaaa aaaaaaaaaa aaaaaaaaaa 1850

<210>16

<211>142

<212>PRT

<213>人

<400>16

Met Ala Thr Lys Ile Asp Lys Glu Ala Cys Arg Ala Ala Tyr Asn Leu

1 5 10 15

Val Arg Asp Asp Gly Ser Ala Val Ile Trp Val Thr Phe Lys Tyr Asp

20 25 30

Gly Ser Thr Ile Val Pro Gly Glu Gln Gly Ala Glu Tyr Gln His Phe

35 40 45

Ile Gln Gln Cys Thr Asp Asp Val Arg Leu Phe Ala Phe Val Arg Phe

50 55 60

Thr Thr Gly Asp Ala Met Ser Lys Arg Ser Lys Phe Ala Leu Ile Thr

65 70 75 80

Trp Ile Gly Glu Asn Val Ser Gly Leu Gln Arg Ala Lys Thr Gly Thr

85 90 95

Asp Lys Thr Leu Val Lys Glu Val Val Gln Asn Phe Ala Lys Glu Phe

100 105 110

Val Ile Ser Asp Arg Lys Glu Leu Glu Glu Asp Phe Ile Lys Ser Glu

115 120 125

Leu Lys Lys Ala Gly Gly Ala Asn Tyr Asp Ala Gln Thr Glu

130 135 140

<210>17

<211>662

<212>DNA

<213>人

<400>17

acacatccaa gcttaagacg gtgaggtcag cttcacattc tcaggaactc tccttctttg 60

ggtctagctg aagttgagga tctcttactc tctaagccac ggaattaacc cgagcaggca 120

tggaggcctc tgctctcacc tcatcagcag tgaccagtgt ggccaaagtg gtcagggtgg 180

cctctggctc tgccgtagtt ttgcccctgg ccaggattgc tacagttgtg attggaggag 240

ttgtggccat ggcggctgtg cccatggtgc tcagtgccat gggcttcact gcggcgggaa 300

tcgcctcgtc ctccatagca gccaagatga tgtccgcggc ggccattgcc aatgggggtg 360

gagttgcctc gggcagcctt gtgggtactc tgcagtcact gggagcaact ggactctccg 420

gattgaccaa gttcatcctg ggctccattg ggtctgccat tgcggctgtc attgcgaggt 480

tctactagct ccctgcccct cgccctgcag agaagagaac catgccaggg gagaaggcac 540

ccagccatcc tgacccagcg aggagccaac tatcccaaat atacctgggt gaaatatacc 600

aaattctgca tctccagagg aaaataagaa ataaagatga attgttgcaa ctcttaaaaa 660

aa 662

<210>18

<211>122

<212>PRT

<213>人

<400>18

Met Glu Ala Ser Ala Leu Thr Ser Ser Ala Val Thr Ser Val Ala Lys

1 5 10 15

Val Val Arg Val Ala Ser Gly Ser Ala Val Val Leu Pro Leu Ala Arg

20 25 30

Ile Ala Thr Val Val Ile Gly Gly Val Val Ala Met Ala Ala Val Pro

35 40 45

Met Val Leu Ser Ala Met Gly Phe Thr Ala Ala Gly Ile Ala Ser Ser

50 55 60

Ser Ile Ala Ala Lys Met Met Ser Ala Ala Ala Ile Ala Asn Gly Gly

65 70 75 80

Gly Val Ala Ser Gly Ser Leu Val Gly Thr Leu Gln Ser Leu Gly Ala

85 90 95

Thr Gly Leu Ser Gly Leu Thr Lys Phe Ile Leu Gly Ser Ile Gly Ser

100 105 110

Ala Ile Ala Ala Val Ile Ala Arg Phe Tyr

115 120

<210>19

<211>653

<212>DNA

<213>人

<400>19

acacatccaa gcttaagacg gtgaggtcag cttcacattc tcaggaactc tccttctttg 60

ggtctagctg aagttgagga tctcttactc tctaagccac ggaattaacc cgagcaggca 120

tggaggcctc tgctctcacc tcatcagcag tgaccagtgt ggccaaagtg gtcagggtgg 180

cctctggctc tgccgtagtt ttgcccctgg ccaggattgc tacagttgtg attggaggag 240

ttgtggctgt gcccatggtg ctcagtgcca tgggcttcac tgcggcggga atcgcctcgt 300

cctccatagc agccaagatg atgtccgcgg cggccattgc caatgggggt ggagttgcct 360

cgggcagcct tgtggctact ctgcagtcac tgggagcaac tggactctcc ggattgacca 420

agttcatcct gggctccatt gggtctgcca ttgcggctgt cattgcgagg ttctactagc 480

tccctgcccc tcgccctgca gagaagagaa ccatgccagg ggagaaggca cccagccatc 540

ctgacccagc gaggagccaa ctatcccaaa tatacctggg tgaaatatac caaattctgc 600

atctccagag gaaaataaga aataaagatg aattgttgca actcttaaaa aaa 653

<210>20

<211>119

<212>PRT

<213>人

<400>20

Met Glu Ala Ser Ala Leu Thr Ser Ser Ala Val Thr Ser Val Ala Lys

1 5 10 15

Val Val Arg Val Ala Ser Gly Ser Ala Val Val Leu Pro Leu Ala Arg

20 25 30

Ile Ala Thr Val Val Ile Gly Gly Val Val Ala Val Pro Met Val Leu

35 40 45

Ser Ala Met Gly Phe Thr Ala Ala Gly Ile Ala Ser Ser Ser Ile Ala

50 55 60

Ala Lys Met Met Ser Ala Ala Ala Ile Ala Asn Gly Gly Gly Val Ala

65 70 75 80

Ser Gly Ser Leu Val Ala Thr Leu Gln Ser Leu Gly Ala Thr Gly Leu

85 90 95

Ser Gly Leu Thr Lys Phe Ile Leu Gly Ser Ile Gly Ser Ala Ile Ala

100 105 110

Ala Val Ile Ala Arg Phe Tyr

115

<210>21

<211>4755

<212>DNA

<213>人

<400>21

gccgggggac ccctccctcc tgtcctcctt gcggtcgacc ggtgcgcttg ccagatccgc 60

cgcgaagccg ggatcgaagg cgacagcgcg gccaaggggg cgcggccggg acaagctggg 120

ggccggttgc ccggggcagg gacggcggcg acccggccgc tggggaggca ggaagataga 180

cccacggatc ttaggaaggg atccgagagc gcagccgcgc gccccgcgcc ccacgcctga 240

tgctctgtgc gctcgccttg atggtggcgg ccggcggctg cgtcgtctcc gccttcaacc 300

tggatacccg attcctggta gtgaaggagg ccgggaaccc gggcagcctc ttcggctact 360

cggtcgccct ccatcggcag acagagcggc agcagcgcta cctgctcctg gctggtgccc 420

cccgggagct cgctgtgccc gatggctaca ccaaccggac tggtgctgtg tacctgtgcc 480

cactcactgc ccacaaggat gactgtgagc ggatgaacat cacagtgaaa aatgaccctg 540

gccatcacat tattgaggac atgtggcttg gagtgactgt ggccagccag ggccctgcag 600

gcagagttct ggtctgtgcc caccgctaca cccaggtgct gtggtcaggg tcagaagacc 660

agcggcgcat ggtgggcaag tgctacgtgc gaggcaatga cctagagctg gactccagtg 720

atgactggca gacctaccac aacgagatgt gcaatagcaa cacagactac ctggagacgg 780

gcatgtgcca gctgggcacc agcggtggct tcacccagaa cactgtgtac ttcggcgccc 840

ccggtgccta caactggaaa ggaaacagct acatgattca gcgcaaggag tgggacttat 900

ctgagtatag ttacaaggac ccagaggacc aaggaaacct ctatattggg tacacgatgc 960

aggtaggcag cttcatcctg caccccaaaa acatcaccat tgtgacaggt gccccacggc 1020

accgacatat gggcgcggtg ttcttgctga gccaggaggc aggcggagac ctgcggagga 1080

ggcaggtgct ggagggctcg caggtgggcg cctattttgg cagcgccatt gccctggcag 1140

acctgaacaa tgatgggtgg caggacctcc tggtgggcgc cccctactac ttcgagagga 1200

aagaggaagt agggggtgcc atctatgtct tcatgaacca ggcgggaacc tccttccctg 1260

ctcacccctc actccttctt catggcccca gtggctctgc ctttggttta tctgtggcca 1320

gcattggtga catcaaccag gatggatttc aggatattgc tgtgggagct ccgtttgaag 1380

gcttgggcaa agtgtacatc tatcacagta gctctaaggg gctccttaga cagccccagc 1440

aggtaatcca tggagagaag ctgggactgc ctgggttggc caccttcggc tattccctca 1500

gtgggcagat ggatgtggat gagaacttct acccagacct tctagtggga agcctgtcag 1560

accacattgt gctgctgcgg gcccggcccg tcatcaacat cgtccacaag accttggtgc 1620

ccaggccagc tgtgctggac cctgcacttt gcacggccac ctcttgtgtg caagtggagc 1680

tgtgctttgc ttacaaccag agtgccggga accccaacta caggcgaaac atcaccctgg 1740

cctacactct ggaggctgac agggaccgcc ggccgccccg gctccgcttt gccggcagtg 1800

agtccgctgt cttccacggc ttcttctcca tgcccgagat gcgctgccag aagctggagc 1860

tgctcctgat ggacaacctc cgtgacaaac tccgccccat catcatctcc atgaactact 1920

ctttaccttt gcggatgccc gatcgccccc ggctggggct gcggtccctg gacgcctacc 1980

cgatcctcaa ccaggcacag gctctggaga accacactga ggtccagttc cagaaggagt 2040

gcgggcctga caacaagtgt gagagcaact tgcagatgcg ggcagccttc gtgtcagagc 2100

agcagcagaa gctgagcagg ctccagtaca gcagagacgt ccggaaattg ctcctgagca 2160

tcaacgtgac gaacacccgg acctcggagc gctccgggga ggacgcccac gaggcgctgc 2220

tcaccctggt ggtgcctccc gccctgctgc tgtcctcagt gcgccccccc ggggcctgcc 2280

aagctaatga gaccatcttt tgcgagctgg ggaacccctt caaacggaac cagaggatgg 2340

agctgctcat cgcctttgag gtcatcgggg tgaccctgca cacaagggac cttcaggtgc 2400

agctgcagct ctccacgtcg agtcaccagg acaacctgtg gcccatgatc ctcactctgc 2460

tggtggacta tacactccag acctcgctta gcatggtaaa tcaccggcta caaagcttct 2520

ttggggggac agtgatgggt gagtctggca tgaaaactgt ggaggatgta ggaagccccc 2580

tcaagtatga attccaggtg ggcccaatgg gggaggggct ggtgggcctg gggaccctgg 2640

tcctaggtct ggagtggccc tacgaagtca gcaatggcaa gtggctgctg tatcccacgg 2700

agatcaccgt ccatggcaat gggtcctggc cctgccgacc acctggagac cttatcaacc 2760

ctctcaacct cactctttct gaccctgggg acaggccatc atccccacag cgcaggcggc 2820

gacagctgga tccaggggga ggccagggcc ccccacctgt cactctggct gctgccaaaa 2880

aagccaagtc tgagactgtg ctgacctgtg ccacagggcg tgcccactgt gtgtggctag 2940

agtgccccat ccctgatgcc cccgttgtca ccaacgtgac tgtgaaggca cgagtgtgga 3000

acagcacctt catcgaggat tacagagact ttgaccgagt ccgggtaaat ggctgggcta 3060

ccctattcct ccgaaccagc atccccacca tcaacatgga gaacaagacc acgtggttct 3120

ctgtggacat tgactcggag ctggtggagg agctgccggc cgaaatcgag ctgtggctgg 3180

tgctggtggc cgtgggtgca gggctgctgc tgctggggct gatcatcctc ctgctgtgga 3240

agtgcggctt cttcaagcga gcccgcactc gcgccctgta tgaagctaag aggcagaagg 3300

cggagatgaa gagccagccg tcagagacag agaggctgac cgacgactac tgagggggca 3360

gccccccgcc cccggcccac ctggtgtgac ttctttaagc ggacccgcta ttatcagatc 3420

atgcccaagt accacgcagt gcggatccgg gaggaggagc gctacccacc tccagggagc 3480

accctgccca ccaagaagca ctgggtgacc agctggcaga ctcgggacca atactactga 3540

cgtcctccct gatcccaccc cctcctcccc cagtgtcccc tttcttccta tttatcataa 3600

gttatgcctc tgacagtcca caggggccac cacctttggc tggtagcagc aggctcaggc 3660

acatacacct cgtcaagagc atgcacatgc tgtctggccc tggggatctt cccacaggag 3720

ggccagcgct gtggacctta caacgccgag tgcactgcat tcctgtgccc tagatgcacg 3780

tggggcccac tgctcgtgga ctgtgctggt gcatcacgga tggtgcatgg gctcgccgtg 3840

tctcagcctc tgccagcgcc aaaacaagcc aaagagcctc ccaccagagc cgggaggaaa 3900

aggcccctgc aatgtggtga cacctccccc tttcacactg gatccatctt gagccacagt 3960

cactggattg actttgctgt caaaactact gacagggagc agcccccggg ccgctggctg 4020

gtgggccccc aatgacaccc atgccagaga ggtggggatc ctgcctaagg ttgtctacgg 4080

gggcacttgg aggacctggc gtgctcagac ccaacagcaa aggaactaga aagaaggacc 4140

cagaacggct tgctttcctg catctctgtg aagcctctct ccttggccac agactgaact 4200

cgcagggaat gcagcaggaa ggaacaaaga caggcaaacg gcaacgtagc ctgggctcac 4260

tgtgctgggg cacggcggga tcctccacag agaggagggg accaattctg gacagacaga 4320

tgttgggagg atacagagga gatgccactt ctcactcacc actaccagcc agcctcagaa 4380

ggccccagag agaccctgca agaccacgga gggagcgaca cttgaatgta gaataggcag 4440

ggggccctgc cccaccccat ccagccagac cccacgctga ccatgcgtca ggggcctaga 4500

ggtggagttc ttagctatcc ttggctttca gagccagcct ggctctgccc cctcccccat 4560

gggctgtgtc ctaaggccca tttgagaagc tgaggctagt tccagaaaac ctctcctgac 4620

ccctgcctgt tggcaggccc actccccagc cccagcccct tccatggtac tgtagcaggg 4680

gaattccctc cccctccttg tgccttcttt gtatataggc ttctcacggc gaccaataaa 4740

cagctcccag tttgt 4755

<210>22

<211>1037

<212>PRT

<213>人

<400>22

Met Leu Cvs Ala Leu Ala Leu Met Val Ala Ala Gly Gly Cys Val Val

1 5 10 15

Ser Ala Phe Asn Leu Asp Thr Arg Phe Leu Val Val Lys Glu Ala Gly

20 25 30

Asn Pro Gly Ser Leu Phe Gly Tyr Ser Val Ala Leu His Arg Gln Thr

35 40 45

Glu Arg Gln Gln Arg Tyr Leu Leu Leu Ala Gly Ala Pro Arg Glu Leu

50 55 60

Ala Val Pro Asp Gly Tyr Thr Asn Arg Thr Gly Ala Val Tyr Leu Cys

65 70 75 80

Pro Leu Thr Ala His Lys Asp Asp Cys Glu Arg Met Asn Ile Thr Val

85 90 95

Lys Asn Asp Pro Gly His His Ile Ile Glu Asp Met Trp Leu Gly Val

100 105 110

Thr Val Ala Ser Gln Gly Pro Ala Gly Arg Val Leu Val Cys Ala His

115 120 125

Arg Tyr Thr Gln Val Leu Trp Ser Gly Ser Glu Asp Gln Arg Arg Met

130 135 140

Val Gly Lys Cys Tyr Val Arg Gly Asn Asp Leu Glu Leu Asp Ser Ser

145 150 155 160

Asp Asp Trp Gln Thr Tyr His Asn Glu Met Cys Asn Ser Asn Thr Asp

165 170 175

Tyr Leu Glu Thr Gly Met Cys Gln Leu Gly Thr Ser Gly Gly Phe Thr

180 185 190

Gln Asn Thr Val Tyr Phe Gly Ala Pro Gly Ala Tyr Asn Trp Lys Gly

195 200 205

Asn Ser Tyr Met Ile Gln Arg Lys Glu Trp Asp Leu Ser Glu Tyr Ser

210 215 220

Tyr Lys Asp Pro Glu Asp Gln Gly Asn Leu Tyr Ile Gly Tyr Thr Met

225 230 235 240

Gln Val Gly Ser Phe Ile Leu His Pro Lys Asn Ile Thr Ile Val Thr

245 250 255

Gly Ala Pro Arg His Arg His Met Gly Ala Val Phe Leu Leu Ser Gln

260 265 270

Glu Ala Gly Gly Asp Leu Arg Arg Arg Gln Val Leu Glu Gly Ser Gln

275 280 285

Val Gly Ala Tyr Phe Gly Ser Ala Ile Ala Leu Ala Asp Leu Asn Asn

290 295 300

Asp Gly Trp Gln Asp Leu Leu Val Gly Ala Pro Tyr Tyr Phe Glu Arg

305 310 315 320

Lys Glu Glu Val Gly Gly Ala Ile Tyr Val Phe Met Asn Gln Ala Gly

325 330 335

Thr Ser Phe Pro Ala His Pro Ser Leu Leu Leu His Gly Pro Ser Gly

340 345 350

Ser Ala Phe Gly Leu Ser Val Ala Ser Ile Gly Asp Ile Asn Gln Asp

355 360 365

Gly Phe Gln Asp Ile Ala Val Gly Ala Pro Phe Glu Gly Leu Gly Lys

370 375 380

Val Tyr Ile Tyr His Ser Ser Ser Lys Gly Leu Leu Arg Gln Pro Gln

385 390 395 400

Gln Val Ile His Gly Glu Lys Leu Gly Leu Pro Gly Leu Ala Thr Phe

405 410 415

Gly Tyr Ser Leu Ser Gly Gln Met Asp Val Asp Glu Asn Phe Tyr Pro

420 425 430

Asp Leu Leu Val Gly Ser Leu Ser Asp His Ile Val Leu Leu Arg Ala

435 440 445

Arg Pro Val Ile Asn Ile Val His Lys Thr Leu Val Pro Arg Pro Ala

450 455 460

Val Leu Asp Pro Ala Leu Cys Thr Ala Thr Ser Cys Val Gln Val Glu

465 470 475 480

Leu Cys Phe Ala Tyr Asn Gln Ser Ala Gly Asn Pro Asn Tyr Arg Arg

485 490 495

Asn Ile Thr Leu Ala Tyr Thr Leu Glu Ala Asp Arg Asp Arg Arg Pro

500 505 510

Pro Arg Leu Arg Phe Ala Gly Ser Glu Ser Ala Val Phe His Gly Phe

515 520 525

Phe Ser Met Pro Glu Met Arg Cys Gln Lys Leu Glu Leu Leu Leu Met

530 535 540

Asp Asn Leu Arg Asp Lys Leu Arg Pro Ile Ile Ile Ser Met Asn Tyr

545 550 555 560

Ser Leu Pro Leu Arg Met Pro Asp Arg Pro Arg Leu Gly Leu Arg Ser

565 570 575

Leu Asp Ala Tyr Pro Ile Leu Asn Gln Ala Gln Ala Leu Glu Asn His

580 585 590

Thr Glu Val Gln Phe Gln Lys Glu Cys Gly Pro Asp Asn Lys Cys Glu

595 600 605

Ser Asn Leu Gln Met Arg Ala Ala Phe Val Ser Glu Gln Gln Gln Lys

610 615 620

Leu Ser Arg Leu Gln Tyr Ser Arg Asp Val Arg Lys Leu Leu Leu Ser

625 630 635 640

Ile Asn Val Thr Asn Thr Arg Thr Ser Glu Arg Ser Gly Glu Asp Ala

645 650 655

His Glu Ala Leu Leu Thr Leu Val Val Pro Pro Ala Leu Leu Leu Ser

660 665 670

Ser Val Arg Pro Pro Gly Ala Cys Gln Ala Asn Glu Thr Ile Phe Cys

675 680 685

Glu Leu Gly Asn Pro Phe Lys Arg Asn Gln Arg Met Glu Leu Leu Ile

690 695 700

Ala Phe Glu Val Ile Gly Val Thr Leu His Thr Arg Asp Leu Gln Val

705 710 715 720

Gln Leu Gln Leu Ser Thr Ser Ser His Gln Asp Asn Leu Trp Pro Met

725 730 735

Ile Leu Thr Leu Lau Val Asp Tyr Thr Leu Gln Thr Ser Leu Ser Met

740 745 750

Val Asn His Arg Leu Gln Ser Phe Phe Gly Gly Thr Val Met Gly Glu

755 760 765

Ser Gly Met Lys Thr Val Glu Asp Val Gly Ser Pro Leu Lys Tyr Glu

770 775 780

Phe Gln Val Gly Pro Met Gly Glu Gly Leu Val Gly Leu Gly Thr Leu

785 790 795 800

Val Leu Gly Leu Glu Trp Pro Tyr Glu Val Ser Asn Gly Lys Trp Leu

805 810 815

Leu Tyr Pro Thr Glu Ile Thr Val His Gly Asn Gly Ser Trp Pro Cys

820 825 830

Arg Pro Pro Gly Asp Leu Ile Asn Pro Leu Asn Leu Thr Leu Ser Asp

835 840 845

Pro Gly Asp Arg Pro Ser Ser Pro Gln Arg Arg Arg Arg Gln Leu Asp

850 855 860

Pro Gly Gly Gly Gln Gly Pro Pro Pro Val Thr Leu Ala Ala Ala Lys

865 870 875 880

Lys Ala Lys Ser Glu Thr Val Leu Thr Cys Ala Thr Gly Arg Ala His

885 890 895

Cys Val Trp Leu Glu Cys Pro Ile Pro Asp Ala Pro Val Val Thr Asn

900 905 910

Val Thr Val Lys Ala Arg Val Trp Asn Ser Thr Phe Ile Glu Asp Tyr

915 920 925

Arg Asp Phe Asp Arg Val Arg Val Asn Gly Trp Ala Thr Leu Phe Leu

930 935 940

Arg Thr Ser Ile Pro Thr Ile Asn Met Glu Asn Lys Thr Thr Trp Phe

945 950 955 960

Ser Val Asp Ile Asp Ser Glu Leu Val Glu Glu Leu Pro Ala Glu Ile

965 970 975

Glu Leu Trp Leu Val Leu Val Ala Val Gly Ala Gly Leu Leu Leu Leu

980 985 990

Gly Leu Ile Ile Leu Leu Leu Trp Lys Cys Gly Phe Phe Lys Arg Ala

995 1000 1005

Arg Thr Arg Ala Leu Tyr Glu Ala Lys Arg Gln Lys Ala Glu Met Lys

1010 1015 1020

Ser Gln Pro Ser Glu Thr Glu Arg Leu Thr Asp Asp Tyr

1025 1030 1035

<210>23

<211>4647

<212>DNA

<213>人

<400>23

gtagcctctg ttttcatttc agtcttaatg aaaactttct aacttatatc tcaagtttct 60

tttcaaagca gtgtaagtag tatttaaaat gttatacttc aagaaagaaa gactttaacg 120

atattcagcg ttggtcttgt aacgctgaag gtaattcatt ttttaatcgg tctgcacagc 180

aagaactgaa acgaatgggg attgaactgc tttgcctgtt ctttctattt ctaggaagga 240

atgatcacgt acaaggtggc tgtgccctgg gaggtgcaga aacctgtgaa gactgcctgc 300

ttattggacc tcagtgtgcc tggtgtgctc aggagaattt tactcatcca tctggagttg 360

gcgaaaggtg tgatacccca gcaaaccttt tagctaaagg atgtcaatta aacttcatcg 420

aaaaccctgt ctcccaagta gaaatactta aaaataagcc tctcagtgta ggcagacaga 480

aaaatagttc tgacattgtt cagattgcgc ctcaaagctt gatccttaag ttgagaccag 540

gtggtgcgca gactctgcag gtgcatgtcc gccagactga ggactacccg gtggatttgt 600

attacctcat ggacctctcc gcctccatgg atgacgacct caacacaata aaggagctgg 660

gctcccggct ttccaaagag atgtctaaat taaccagcaa ctttagactg ggcttcggat 720

cttttgtgga aaaacctgta tcccctttcg tgaaaacaac accagaagaa attgccaacc 780

cttgcagtag tattccatac ttctgtttac ctacatttgg attcaagcac attttgccat 840

tgacaaatga tgctgaaaga ttcaatgaaa ttgtgaagaa tcagaaaatt tctgctaata 900

ttgacacacc cgaaggtgga tttgatgcaa ttatgcaagc tgctgtgtgt aaggaaaaaa 960

ttggctggcg gaatgactcc ctccacctcc tggtctttgt gagtgatgct gattctcatt 1020

ttggaatgga cagcaaacta gcaggcatcg tcattcctaa tgacgggctc tgtcacttgg 1080

acagcaagaa tgaatactcc atgtcaactg tcttggaata tccaacaatt ggacaactca 1140

ttgataaact ggtacaaaac aacgtgttat tgatcttcgc tgtaacccaa gaacaagttc 1200

atttatatga gaattacgca aaacttattc ctggagctac agtaggtcta cttcagaagg 1260

actccggaaa cattctccag ctgatcatct cagcttatga agaactgcgg tctgaggtgg 1320

aactggaagt attaggagac actgaaggac tcaacttgtc atttacagcc atctgtaaca 1380

acggtaccct cttccaacac caaaagaaat gctctcacat gaaagtggga gacacagctt 1440

ccttcagcgt gactgtgaat atcccacact gcgagagaag aagcaggcac attatcataa 1500

agcctgtggg gctgggggat gccctggaat tacttgtcag cccagaatgc aactgcgact 1560

gtcagaaaga agtggaagtg aacagctcca aatgtcacca cgggaacggc tctttccagt 1620

gtggggtgtg tgcctgccac cctggccaca tggggcctcg ctgtgagtgt ggcgaggaca 1680

tgctgagcac agattcctgc aaggaggccc cagatcatcc ctcctgcagc ggaaggggtg 1740

actgctactg tgggcagtgt atctgccact tgtctcccta tggaaacatt tatgggcctt 1800

attgccagtg tgacaatttc tcctgcgtga gacacaaagg gctgctctgc ggaggtaacg 1860

gcgactgtga ctgtggtgaa tgtgtgtgca ggagcggctg gactggcgag tactgcaact 1920

gcaccaccag cacggactcc tgcgtctctg aagatggagt gctctgcagc gggcgcgggg 1980

actgtgtttg tggcaagtgt gtttgcacaa accctggagc ctcaggacca acctgtgaac 2040

gatgtcctac ctgtggtgac ccctgtaact ctaaacggag ctgcattgag tgccacctgt 2100

cagcagctgg ccaagcccga gaagaatgtg tggacaagtg caaactagct ggtgcgacca 2160

tcagtgaaga agaagatttc tcaaaggatg gttctgtttc ctgctctctg caaggagaaa 2220

atgaatgtct tattacattc ctaataacta cagataatga ggggaaaacc atcattcaca 2280

gcatcaatga aaaagattgt ccgaagcctc caaacattcc catgatcatg ttaggggttt 2340

ccctggctat tcttctcatc ggggttgtcc tactgtgcat ctggaagcta ctggtgtcat 2400

ttcatgatcg taaagaagtt gccaaatttg aagcagaacg atcaaaagcc aagtggcaaa 2460

cgggaaccaa tccactctac agaggatcca caagtacttt taaaaatgta acttataaac 2520

acagggaaaa acaaaaggta gacctttcca cagattgcta gaactacttt atgcatgaaa 2580

aaagtctgtt tcactgatat gaaatgttaa tgcactattt aatttttttc tctttgttgc 2640

ttcaaaatga ggttggttta agataataat aggacatctg cagataagtc atcctctaca 2700

tgaaggtgac agactgttgg cagtttcaaa ataatcaaga agagaaatat ccttagcaaa 2760

gagatgactt tggggatcat ttgaggaata ctaactctgt tgcattaatg cttcaaaaaa 2820

tcatcaaatg attcatgggg gcctgatttg catttgaaaa atgtttgaaa ttagagtctc 2880

atttgtttca ggaatgcagc tacctgagtt ttttgtctcg gcaaagtcac aaagcccata 2940

tactcacatt gtgtgtctat acttgccaat taattctaaa cttgtaggaa atatgccctc 3000

tcttaaagga gaattttttt taaatctctg agaaatgaga ttctgagttt atttcagcta 3060

aaaggttgca attcttctga agatatctca aatataaggt tgaaagttaa gtgttaataa 3120

tttttgtgaa tttatacaca cctaaacgtt aagtacacaa atattttatt tgttttacaa 3180

ataaggaata agtaatttat aaattaagaa gttacctata aaaataaaaa gataacaacc 3240

ctatcatata gcttattttt aaattacctg aaaaacgata ttctacactg tttccttttt 3300

gactctgagt tttcaaactg ttacttctcc catatttctc aatccatttc actcagttgc 3360

acagtctttt aaaccctgta attgtcatac caaagtttct ttttaaaaaa aaattacttt 3420

aaatgcttag tttattcaaa gagcgatcca ataatataaa aggaacatgt gttaaacaca 3480

ataaaatttt aaatggctct aaatcaagca catcaagagt atacaagtct taaaggcttt 3540

ttaatacata ctcttttccc atctatgtaa cccaacttgc acatttcagc tgcatgtggt 3600

gaatatgcat catatattta ctttaagagg taagatttta cttgcaaaat acatgtgcaa 3660

attaggatcc atcagttgat ggaagagatg gactctagaa tattatttct tgtggttatt 3720

actcctttac aaagcacttt cgtctcactt gatcctcata aggaaactaa ggctcagaat 3780

gagtagagct gggttcagaa tctagctctt ctaactccaa gccatctcct ctttccactg 3840

caggaaactg cctcttttgt cagtgaaata atagaaagat tgtgttagtt aagtgataac 3900

tgtcatttgt ttgaaaatgt tcgagactga acaaatagca tttaaactgc tggcatatag 3960

atgagatatt gtacttttgt gcaatgttta ttacctttga ttaaattgta atgtgaagct 4020

tttactaggt gaatagttca ttatgtagtg gaggcttcgt ggttgtccat tgaattgtca 4080

cagcaaaatc tataagtttc ttcaattcta caagatagat ccatatacct ttgatcactt 4140

ggagactctt tttttgctgg tttctagata actcaggtaa atcagacctt tacagagtac 4200

agggctaggt gaaagaatta ctgaaaaatc accttgaaaa tccgaagggc tgatataccc 4260

tttatgttcc tgactgatgc gcagaacctg ggggaaatct acagcaatat acaggttgca 4320

atgctgataa cacaacagca atcctctcct ctacgtggac ttactgttgt ttttttaatt 4380

attattggaa tgggatttta gaaaatagaa gttacctttg tgtgtgtttt agggaaggta 4440

gagaagaatc tgctctttct ctgaatactg ttttgacccc aggcaggacc ttggaaaggc 4500

caaaacatta acagtagtac ttctgttcac tgaagagtta tgttacatga agataaaatg 4560

gttttgtcgt gtttattatt gtattttgtg ttgatataaa taaacatggt aatttaaaca 4620

atgaaaaaaa aaaaaaaaaa aaaaaaa 4647

<210>24

<211>788

<212>PRT

<213>人

<400>24

Met Gly Ile Glu Leu Leu Cys Leu Phe Phe Leu Phe Leu Gly Arg Asn

1 5 10 15

Asp His Val Gln Gly Gly Cys Ala Leu Gly Gly Ala Glu Thr Cys Glu

20 25 30

Asp Cys Leu Leu Ile Gly Pro Gln Cys Ala Trp Cys Ala Gln Glu Asn

35 40 45

Phe Thr His Pro Ser Gly Val Gly Glu Arg Cys Asp Thr Pro Ala Asn

50 55 60

Leu Leu Ala Lys Gly Cys Gln Leu Asn Phe Ile Glu Asn Pro Val Ser

65 70 75 80

Gln Val Glu Ile Leu Lys Asn Lys Pro Leu Ser Val Gly Arg Gln Lys

85 90 95

Asn Ser Ser Asp Ile Val Gln Ile Ala Pro Gln Ser Leu Ile Leu Lys

100 105 110

Leu Arg Pro Gly Gly Ala Gln Thr Leu Gln Val His Val Arg Gln Thr

115 120 125

Glu Asp Tyr Pro Val Asp Leu Tyr Tyr Leu Met Asp Leu Ser Ala Ser

130 135 140

Met Asp Asp Asp Leu Asn Thr Ile Lys Glu Leu Gly Ser Arg Leu Ser

145 150 155 160

Lys Glu Met Ser Lys Leu Thr Ser Asn Phe Arg Leu Gly Phe Gly Ser

165 170 175

Phe Val Glu Lys Pro Val Ser Pro Phe Val Lys Thr Thr Pro Glu Glu

180 185 190

Ile Ala Asn Pro Cys Ser Ser Ile Pro Tyr Phe Cys Leu Pro Thr Phe

195 200 205

Gly Phe Lys His Ile Leu Pro Leu Thr Asn Asp Ala Glu Arg Phe Asn

210 215 220

Glu Ile Val Lys Asn Gln Lys Ile Ser Ala Asn Ile Asp Thr Pro Glu

225 230 235 240

Gly Gly Phe Asp Ala Ile Met Gln Ala Ala Val Cys Lys Glu Lys Ile

245 250 255

Gly Trp Arg Asn Asp Ser Leu His Leu Leu Val Phe Val Ser Asp Ala

260 265 270

Asp Ser His Phe Gly Met Asp Ser Lys Leu Ala Gly Ile Val Ile Pro

275 280 285

Asn Asp Gly Leu Cys His Leu Asp Ser Lys Asn Glu Tyr Ser Met Ser

290 295 300

Thr Val Leu Glu Tyr Pro Thr Ile Gly Gln Leu Ile Asp Lys Leu Val

305 310 315 320

Gln Asn Asn Val Leu Leu Ile Phe Ala Val Thr Gln Glu Gln Val His

325 330 335

Leu Tyr Glu Asn Tyr Ala Lys Leu Ile Pro Gly Ala Thr Val Gly Leu

340 345 350

Leu Gln Lys Asp Ser Gly Asn Ile Leu Gln Leu Ile Ile Ser Ala Tyr

355 360 365

Glu Glu Leu Arg Ser Glu Val Glu Leu Glu Val Leu Gly Asp Thr Glu

370 375 380

Gly Leu Asn Leu Ser Phe Thr Ala Ile Cys Asn Asn Gly Thr Leu Phe

385 390 395 400

Gln His Gln Lys Lys Cys Ser His Met Lys Val Gly Asp Thr Ala Ser

405 410 415

Phe Ser Val Thr Val Asn Ile Pro His Cys Glu Arg Arg Ser Arg His

420 425 430

Ile Ile Ile Lys Pro Val Gly Leu Gly Asp Ala Leu Glu Leu Leu Val

435 440 445

Ser Pro Glu Cys Asn Cys Asp Cys Gln Lys Glu Val Glu Val Asn Ser

450 455 460

Ser Lys Cys His His Gly Asn Gly Ser Phe Gln Cys Gly Val Cys Ala

465 470 475 480

Cys His Pro Gly His Met Gly Pro Arg Cys Glu Cys Gly Glu Asp Met

485 490 495

Leu Ser Thr Asp Ser Cys Lys Glu Ala Pro Asp His Pro Ser Cys Ser

500 505 510

Gly Arg Gly Asp Cys Tyr Cys Gly Gln Cys Ile Cys His Leu Ser Pro

515 520 525

Tyr Gly Asn Ile Tyr Gly Pro Tyr Cys Gln Cys Asp Asn Phe Ser Cys

530 535 540

Val Arg His Lys Gly Leu Leu Cys Gly Gly Asn Gly Asp Cys Asp Cys

545 550 555 560

Gly Glu Cys Val Cys Arg Ser Gly Trp Thr Gly Glu Tyr Cys Asn Cys

565 570 575

Thr Thr Ser Thr Asp Ser Cys Val Ser Glu Asp Gly Val Leu Cys Ser

580 585 590

Gly Arg Gly Asp Cys Val Cys Gly Lys Cys Val Cys Thr Asn Pro Gly

595 600 605

Ala Ser Gly Pro Thr Cys Glu Arg Cys Pro Thr Cys Gly Asp Pro Cys

610 615 620

Asn Ser Lys Arg Ser Cys Ile Glu Cys His Leu Ser Ala Ala Gly Gln

625 630 635 640

Ala Arg Glu Glu Cys Val Asp Lys Cys Lys Leu Ala Gly Ala Thr Ile

645 650 655

Ser Glu Glu Glu Asp Phe Ser Lys Asp Gly Ser Val Ser Cys Ser Leu

660 665 670

Gln Gly Glu Asn Glu Cys Leu Ile Thr Phe Leu Ile Thr Thr Asp Asn

675 680 685

Glu Gly Lys Thr Ile Ile His Ser Ile Asn Glu Lys Asp Cys Pro Lys

690 695 700

Pro Pro Asn Ile Pro Met Ile Met Leu Gly Val Ser Leu Ala Ile Leu

705 710 715 720

Leu Ile Gly Val Val Leu Leu Cys Ile Trp Lys Leu Leu Val Ser Phe

725 730 735

His Asp Arg Lys Glu Val Ala Lys Phe Glu Ala Glu Arg Ser Lys Ala

740 745 750

Lys Trp Gln Thr Gly Thr Asn Pro Leu Tyr Arg Gly Ser Thr Ser Thr

755 760 765

Phe Lys Asn Val Thr Tyr Lys His Arg Glu Lys Gln Lys Val Asp Leu

770 775 780

Ser Thr Asp Cys

785

<210>25

<211>4474

<212>DNA

<213>人

<400>25

gtagcctctg ttttcatttc agtcttaatg aaaactttct aacttatatc tcaagtttct 60

tttcaaagca gtgtaagtag tatttaaaat gttatacttc aagaaagaaa gactttaacg 120

atattcagcg ttggtcttgt aacgctgaag gtaattcatt ttttaatcgg tctgcacagc 180

aagaactgaa acgaatgggg attgaactgc tttgcctgtt ctttctattt ctaggaagga 240

atgatcacgt acaaggtggc tgtgccctgg gaggtgcaga aacctgtgaa gactgcctgc 300

ttattggacc tcagtgtgcc tggtgtgctc aggagaattt tactcatcca tctggagttg 360

gcgaaaggtg gtgcgcagac tctgcaggtg catgtccgcc agactgagga ctacccggtg 420

gatttgtatt acctcatgga cctctccgcc tccatggatg acgacctcaa cacaataaag 480

gagctgggct cccggctttc caaagagatg tctaaattaa ccagcaactt tagactgggc 540

ttcggatctt ttgtggaaaa acctgtatcc cctttygtga aaacaacacc agaagaaatt 600

gccaaccctt gcagtagtat tccatacttc tgtttaccta catttggatt caagcacatt 660

ttgccattga caaatgatgc tgaaagattc aatgaaattg tgaagaatca gaaaatttct 720

gctaatattg acacacccga aggtggattt gatgcaatta tgcaagctgc tgtgtgtaag 780

gaaaaaattg gctggcggaa tgactccctc cacctcctgg tctttgtgag tgatgctgat 840

tctcattttg gaatggacag caaactagca ggcatcgtca ttcctaatga cgggctctgt 900

cacttggaca gcaagaatga atactccatg tcaactgtct tggaatatcc aacaattgga 960

caactcattg ataaactggt acaaaacaac gtgttattga tcttcgctgt aacccaagaa 1020

caagttcatt tatatgagaa ttacgcaaaa cttattcctg gagctacagt aggtctactt 1080

cagaaggact ccggaaacat tctccagctg atcatctcag cttatgaaga actgcggtct 1140

gaggtggaac tggaagtatt aggagacact gaaggactca acttgtcatt tacagccatc 1200

tgtaacaacg gtaccctctt ccaacaccaa aagaaatgct ctcacatgaa agtgggagac 1260

acagcttcct tcagcgtgac tgtgaatatc ccacactgcg agagaagaag caggcacatt 1320

atcataaagc ctgtggggct gggggatgcc ctggaattac ttgtcagccc agaatgcaac 1380

tgcgactgtc agaaagaagt ggaagtgaac agctccaaat gtcaccacgg gaacggctct 1440

ttccagtgtg gggtgtgtgc ctgccaccct ggccacatgg ggcctcgctg tgagtgtggc 1500

gaggacatgc tgagcacaga ttcctgcaag gaggccccag atcatccctc ctgcagcgga 1560

aggggtgact gctactgtgg gcagtgtatc tgccacttgt ctccctatgg aaacatttat 1620

gggccttatt gccagtgtga caatttctcc tgcgtgagac acaaagggct gctctgcgga 1680

ggtaacggcg actgtgactg tggtgaatgt gtgtgcagga gcggctggac tggcgagtac 1740

tgcaactgca ccaccagcac ggactcctgc gtctctgaag atggagtgct ctgcagcggg 1800

cgcggggact gtgtttgtgg caagtgtgtt tgcacaaacc ctggagcctc aggaccaacc 1860

tgtgaacgat gtcctacctg tggtgacccc tgtaactcta aacggagctg cattgagtgc 1920

cacctgtcag cagctggcca agcccgagaa gaatgtgtgg acaagtgcaa actagctggt 1980

gcgaccatca gtgaagaaga agatttctca aaggatggtt ctgtttcctg ctctctgcaa 2040

ggagaaaatg aatgtcttat tacattccta ataactacag ataatgaggg gaaaaccatc 2100

attcacagca tcaatgaaaa agattgtccg aagcctccaa acattcccat gatcatgtta 2160

ggggtttccc tggctattct tctcatcggg gttgtcctac tgtgcatctg gaagctactg 2220

gtgtcatttc atgatcgtaa agaagttgcc aaatttgaag cagaacgatc aaaagccaag 2280

tggcaaacgg gaaccaatcc actctacaga ggatccacaa gtacttttaa aaatgtaact 2340

tataaacaca gggaaaaaca aaaggtagac ctttccacag attgctagaa ctactttatg 2400

catgaaaaaa gtctgtttca ctgatatgaa atgttaatgc actatttaat ttttttctct 2460

ttgttgcttc aaaatgaggt tggtttaaga taataatagg acatctgcag ataagtcatc 2520

ctctacatga aggtgacaga ctgttggcag tttcaaaata atcaagaaga gaaatatcct 2580

tagcaaagag atgactttgg ggatcatttg aggaatacta actctgttgc attaatgctt 2640

caaaaaatca tcaaatgatt catgggggcc tgatttgcat ttgaaaaatg tttgaaatta 2700

gagtctcatt tgtttcagga atgcagctac ctgagttttt tgtctcggca aagtcacaaa 2760

gcccatatac tcacattgtg tgtctatact tgccaattaa ttctaaactt gtaggaaata 2820

tgccctctct taaaggagaa ttttttttaa atctctgaga aatgagattc tgagtttatt 2880

tcagctaaaa ggttgcaatt cttctgaaga tatctcaaat ataaggttga aagttaagtg 2940

ttaataattt ttgtgaattt atacacacct aaacgttaag tacacaaata ttttatttgt 3000

tttacaaata aggaataagt aatttataaa ttaagaagtt acctataaaa ataaaaagat 3060

aacaacccta tcatatagct tatttttaaa ttacctgaaa aacgatattc tacactgttt 3120

cctttttgac tctgagtttt caaactgtta cttctcccat atttctcaat ccatttcact 3180

cagttgcaca gtcttttaaa ccctgtaatt gtcataccaa agtttctttt taaaaaaaaa 3240

ttactttaaa tgcttagttt attcaaagag cgatccaata atataaaagg aacatgtgtt 3300

aaacacaata aaattttaaa tggctctaaa tcaagcacat caagagtata caagtcttaa 3360

aggcttttta atacatactc ttttcccatc tatgtaaccc aacttgcaca tttcagctgc 3420

atgtggtgaa tatgcatcat atatttactt taagaggtaa gattttactt gcaaaataca 3480

tgtgcaaatt aggatccatc agttgatgga agagatggac tctagaatat tatttcttgt 3540

ggttattact cctttacaaa gcactttcgt ctcacttgat cctcataagg aaactaaggc 3600

tcagaatgag tagagctggg ttcagaatct agctcttcta actccaagcc atctcctctt 3660

tccactgcag gaaactgcct cttttgtcag tgaaataata gaaagattgt gttagttaag 3720

tgataactgt catttgtttg aaaatgttcg agactgaaca aatagcattt aaactgctgg 3780

catatagatg agatattgta cttttgtgca atgtttatta cctttgatta aattgtaatg 3840

tgaagctttt actaggtgaa tagttcatta tgtagtggag gcttcgtggt tgtccattga 3900

attgtcacag caaaatctat aagtttcttc aattctacaa gatagatcca tatacctttg 3960

atcacttgga gactcttttt ttgctggttt ctagataact caggtaaatc agacctttac 4020

agagtacagg gctaggtgaa agaattactg aaaaatcacc ttgaaaatcc gaagggctga 4080

tatacccttt atgttcctga ctgatgcgca gaacctgggg gaaatctaca gcaatataca 4140

ggttgcaatg ctgataacac aacagcaatc ctctcctcta cgtggactta ctgttgtttt 4200

tttaattatt attggaatgg gattttagaa aatagaagtt acctttgtgt gtgttttagg 4260

gaaggtagag aagaatctgc tctttctctg aatactgttt tgaccccagg caggaccttg 4320

gaaaggccaa aacattaaca gtagtacttc tgttcactga agagttatgt tacatgaaga 4380

taaaatggtt ttgtcgtgtt tattattgta ttttgtgttg atataaataa acatggtaat 4440

ttaaacaatg aaaaaaaaaa aaaaaaaaaa aaaa 4474

<210>26

<211>715

<212>PRT

<213>人

<400>26

Met Ile Thr Tyr Lys Val Ala Val Pro Trp Glu Val Gln Lys Pro Val

1 5 10 15

Lys Thr Ala Cys Leu Leu Asp Leu Ser Val Pro Gly Val Leu Arg Arg

20 25 30

Ile Leu Leu Ile His Leu Glu Leu Ala Lys Gly Gly Ala Gln Thr Leu

35 40 45

Gln Val His Val Arg Gln Thr Glu Asp Tyr Pro Val Asp Leu Tyr Tyr

50 55 60

Leu Met Asp Leu Ser Ala Ser Met Asp Asp Asp Leu Asn Thr Ile Lys

65 70 75 80

Glu Leu Gly Ser Arg Leu Ser Lys Glu Met Ser Lys Leu Thr Ser Asn

85 90 95

Phe Arg Leu Gly Phe Gly Ser Phe Val Glu Lys Pro Val Ser Pro Phe

100 105 110

Val Lys Thr Thr Pro Glu Glu Ile Ala Asn Pro Cys Ser Ser Ile Pro

115 120 125

Tyr Phe Cys Leu Pro Thr Phe Gly Phe Lys His Ile Leu Pro Leu Thr

130 135 140

Asn Asp Ala Glu Arg Phe Asn Glu Ile Val Lys Asn Gln Lys Ile Ser

145 150 155 160

Ala Asn Ile Asp Thr Pro Glu Gly Gly Phe Asp Ala Ile Met Gln Ala

165 170 175

Ala Val Cys Lys Glu Lys Ile Gly Trp Arg Asn Asp Ser Leu His Leu

180 185 190

Leu Val Phe Val Ser Asp Ala Asp Ser His Phe Gly Met Asp Ser Lys

195 200 205

Leu Ala Gly Ile Val Ile Pro Asn Asp Gly Leu Cys His Leu Asp Ser

210 215 220

Lys Asn Glu Tyr Ser Met Ser Thr Val Leu Glu Tyr Pro Thr Ile Gly

225 230 235 240

Gln Leu Ile Asp Lys Leu Val Gln Asn Asn Val Leu Leu Ile Phe Ala

245 250 255

Val Thr Gln Glu Gln Val His Leu Tyr Glu Asn Tyr Ala Lys Leu Ile

260 265 270

Pro Gly Ala Thr Val Gly Leu Leu Gln Lys Asp Ser Gly Asn Ile Leu

275 280 285

Gln Leu Ile Ile Ser Ala Tyr Glu Glu Leu Arg Ser Glu Val Glu Leu

290 295 300

Glu Val Leu Gly Asp Thr Glu Gly Leu Asn Leu Ser Phe Thr Ala Ile

305 310 315 320

Cys Asn Asn Gly Thr Leu Phe Gln His Gln Lys Lys Cys Ser His Met

325 330 335

Lys Val Gly Asp Thr Ala Ser Phe Ser Val Thr Val Asn Ile Pro His

340 345 350

Cys Glu Arg Arg Ser Arg His Ile Ile Ile Lys Pro Val Gly Leu Gly

355 360 365

Asp Ala Leu Glu Leu Leu Val Ser Pro Glu Cys Asn Cys Asp Cys Gln

370 375 380

Lys Glu Val Glu Val Asn Ser Ser Lys Cys His His Gly Asn Gly Ser

385 390 395 400

Phe Gln Cys Gly Val Cys Ala Cys His Pro Gly His Met Gly Pro Arg

405 410 415

Cys Glu Cys Gly Glu Asp Met Leu Ser Thr Asp Ser Cys Lys Glu Ala

420 425 430

Pro Asp His Pro Ser Cys Ser Gly Arg Gly Asp Cys Tyr Cys Gly Gln

435 440 445

Cys Ile Cys His Leu Ser Pro Tyr Gly Asn Ile Tyr Gly Pro Tyr Cys

450 455 460

Gln Cys Asp Asn Phe Ser Cys Val Arg His Lys Gly Leu Leu Cys Gly

465 470 475 480

Gly Asn Gly Asp Cys Asp Cys Gly Glu Cys Val Cys Arg Ser Gly Trp

485 490 495

Thr Gly Glu Tyr Cys Asn Cys Thr Thr Ser Thr Asp Ser Cys Val Ser

500 505 510

Glu Asp Gly Val Leu Cys Ser Gly Arg Gly Asp Cys Val Cys Gly Lys

515 520 525

Cys Val Cys Thr Asn Pro Gly Ala Ser Gly Pro Thr Cys Glu Arg Cys

530 535 540

Pro Thr Cys Gly Asp Pro Cys Asn Ser Lys Arg Ser Cys Ile Glu Cys

5455 50 555 560

His Leu Ser Ala Ala Gly Gln Ala Arg Glu Glu Cys Val Asp Lys Cys

565 570 575

Lys Leu Ala Gly Ala Thr Ile Ser Glu Glu Glu Asp Phe Ser Lys Asp

580 585 590

Gly Ser Val Ser Cys Ser Leu Gln Gly Glu Asn Glu Cys Leu Ile Thr

595 600 605

Phe Leu Ile Thr Thr Asp Asn Glu Gly Lys Thr Ile Ile His Ser Ile

610 615 620

Asn Glu Lys Asp Cys Pro Lys Pro Pro Asn Ile Pro Met Ile Met Leu

625 630 635 640

Gly Val Ser Leu Ala Ile Leu Leu Ile Gly Val Val Leu Leu Cys Ile

645 650 655

Trp Lys Leu Leu Val Ser Phe His Asp Arg Lys Glu Val Ala Lys Phe

660 665 670

Glu Ala Glu Arg Ser Lys Ala Lys Trp Gln Thr Gly Thr Asn Pro Leu

675 680 685

Tyr Arg Gly Ser Thr Ser Thr Phe Lys Asn Val Thr Tyr Lys His Arg

690 695 700

Glu Lys Gln Lys Val Asp Leu Ser Thr Asp Cys

705 710 715

<210>27

<211>4327

<212>DNA

<213>人

<400>27

gtagcctctg ttttcatttc agtcttaatg aaaactttct aacttatatc tcaagtttct 60

tttcaaagca gtgtaagtag tatttaaaat gttatacttc aagaaagaaa gactttaacg 120

atattcagcg ttggtcttgt aacgctgaag gtaattcatt ttttaatcgg tctgcacagc 180

aagaactgaa acgaatgggg attgaactgc tttgcctgtt ctttctattt ctaggaagga 240

atgatcacgt acaaggtggc tgtgccctgg gaggtgcaga aacctgtgaa gactgcctgc 300

ttattggacc tcagtgtgcc tggtgtgctc aggagaattt tactcatcca tctggagttg 360

gcgaaaggtg tgatacccca gcaaaccttt tagctaaagg atgtcaatta aacttcatcg 420

aaaaccctgt ctcccaagta gaaatactta aaaataagcc tctcagtgta ggcagacaga 480

aaaatagttc tgacattgtt cagattgcgc ctcaaagctt gatccttaag ttgagaccag 540

gtggtgcgca gactctgcag gtgcatgtcc gccagactga ggactacccg gtggatttgt 600

attacctcat ggacctctcc gcctccatgg atgacgacct caacacaata aaggagctgg 660

gctcccggct ttccaaagag atgtctaaat taaccagcaa ctttagactg ggcttcggat 720

cttttgtgga aaaacctgta tccccttttg tgaaaacaac accagaagaa attgccaacc 780

cttgcagtag tattccatac ttctgtttac ctacatttgg attcaagcac attttgccat 840

tgacaaatga tgctgaaaga ttcaatgaaa ttgtgaagaa tcagaaaatt tctgctaata 900

ttgacacacc cgaaggtgga tttgatgcaa ttatgcaagc tgctgtgtgt aaggaaaaaa 960

ttggctggcg gaatgactcc ctccacctcc tggtctttgt gagtgatgct gattctcatt 1020

ttggaatgga cagcaaacta gcaggcatcg tcattcctaa tgacgggctc tgtcacttgg 1080

acagcaagaa tgaatactcc atgtcaactg tcttggaata tccaacaatt ggacaactca 1140

ttgataaact ggtacaaaac aacgtgttat tgatcttcgc tgtaacccaa gaacaagttc 1200

atttatatga gaattacgca aaacttattc ctggagctac agtaggtcta cttcagaagg 1260

actccggaaa cattctccag ctgatcatct cagcttatga agaactgcgg tctgaggtgg 1320

aactggaagt attaggagac actgaaggac tcaacttgtc atttacagcc atctgtaaca 1380

acggtaccct cttccaacac caaaagaaat gctctcacat gaaagtggga gacacagctt 1440

ccttcagcgt gactgtgaat atcccacact gcgagagaag aagcaggcac attatcataa 1500

agcctgtggg gctgggggat gccctggaat tacttgtcag cccagaatgc aactgcgact 1560

gtcagaaaga agtggaagtg aacagctcca aatgtcacca cgggaacggc tctttccagt 1620

gtggggtgtg tgcctgccac cctggccaca tggggcctcg ctgtgagtgt ggcgaggaca 1680

tgctgagcac agattcctgc aaggaggccc cagatcatcc ctcctgcagc ggaaggggtg 1740

actgctactg tgggcagtgt atctgccact tgtctcccta tggaaacatt tatgggcctt 1800

attgccagtg tgacaatttc tcctgcgtga gacacaaagg gctgctctgc ggagatttct 1860

caaaggatgg ttctgtttcc tgctctctgc aaggagaaaa tgaatgtctt attacattcc 1920

taataactac agataatgag gggaaaacca tcattcacag catcaatgaa aaagattgtc 1980

cgaagcctcc aaacattccc atgatcatgt taggggtttc cctggctatt cttctcatcg 2040

gggttgtcct actgtgcatc tggaagctac tggtgtcatt tcatgatcgt aaagaagttg 2100

ccaaatttga agcagaacga tcaaaagcca agtggcaaac gggaaccaat ccactctaca 2160

gaggatccac aagtactttt aaaaatgtaa cttataaaca cagggaaaaa caaaaggtag 2220

acctttccac agattgctag aactacttta tgcatgaaaa aagtctgttt cactgatatg 2280

aaatgttaat gcactattta atttttttct ctttgttgct tcaaaatgag gttggtttaa 2340

gataataata ggacatctgc agataagtca tcctctacat gaaggtgaca gactgttggc 2400

agtttcaaaa taatcaagaa gagaaatatc cttagcaaag agatgacttt ggggatcatt 2460

tgaggaatac taactctgtt gcattaatgc ttcaaaaaat catcaaatga ttcatggggg 2520

cctgatttgc atttgaaaaa tgtttgaaat tagagtctca tttgtttcag gaatgcagct 2580

acctgagttt tttgtctcgg caaagtcaca aagcccatat actcacattg tgtgtctata 2640

cttgccaatt aattctaaac ttgtaggaaa tatgccctct cttaaaagga gaattttttt 2700

taaatctctg agaaatgaga ttctgagttt atttcagcta aaaggttgca attcttctga 2760

agatatctca aatataaggt tgaaagttaa gtgttaataa tttttgtgaa tttatacaca 2820

cctaaacgtt aagtacacaa atattttatt tgttttacaa ataaggaata agtaatttat 2880

aaattaagaa gttacctata aaaataaaaa gataacaacc ctatcatata gcttattttt 2940

aaattacctg aaaaacgata ttctacactg tttccttttt gactctgagt tttcaaactg 3000

ttacttctcc catatttctc aatccatttc actcagttgc acagtctttt aaaccctgta 3060

attgtcatac caaagtttct ttttaaaaaa aaattacttt aaatgcttag tttattcaaa 3120

gagcgatcca ataatataaa aggaacatgt gttaaacaca ataaaatttt aaatggctct 3180

aaatcaagca catcaagagt atacaagtct taaaggcttt ttaatacata ctcttttccc 3240

atctatgtaa cccaacttgc acatttcagc tgcatgtggt gaatatgcat catatattta 3300

ctttaagagg taagatttta cttgcaaaat acatgtgcaa attaggatcc atcagttgat 3360

ggaagagatg gactctagaa tattatttct tgtggttatt actcctttac aaagcacttt 3420

cgtctcactt gatcctcata aggaaactaa ggctcagaat gagtagagct gggttcagaa 3480

tctagctctt ctaactccaa gccatctcct ctttccactg caggaaactg cctcttttgt 3540

cagtgaaata atagaaagat tgtgttagtt aagtgataac tgtcatttgt ttgaaaatgt 3600

tcgagactga acaaatagca tttaaactgc tggcatatag atgagatatt gtacttttgt 3660

gcaatgttta ttacctttga ttaaattgta atgtgaagct tttactaggt gaatagttca 3720

ttatgtagtg gaggcttcgt ggttgtccat tgaattgtca cagcaaaatc tataagtttc 3780

ttcaattcta caagatagat ccatatacct ttgatcactt ggagactctt tttttgctgg 3840

tttctagata actcaggtaa atcagacctt tacagagtac agggctaggt gaaagaatta 3900

ctgaaaaatc accttgaaaa tccgaagggc tgatataccc tttatgttcc tgactgatgc 3960

gcagaacctg ggggaaatct acagcaatat acaggttgca atgctgataa cacaacagca 4020

atcctctcct ctacgtggac ttactgttgt ttttttaatt attattggaa tgggatttta 4080

gaaaatagaa gttacctttg tgtgtgtttt agggaaggta gagaagaatc tgctctttct 4140

ctgaatactg ttttgacccc aggcaggacc ttggaaaggc caaaacatta acagtagtac 4200

ttctgttcac tgaagagtta tgttacatga agataaaatg gttttgtcgt gtttattatt 4260

gtattttgtg ttgatataaa taaacatggt aatttaaaca atgaaaaaaa aaaaaaaaaa 4320

aaaaaaa 4327

<210>28

<211>681

<212>PRT

<213>人

<400>28

Met Gly Ile Glu Leu Leu Cys Leu Phe Phe Leu Phe Leu Gly Arg Asn

1 5 10 15

Asp His Val Gln Gly Gly Cys Ala Leu Gly Gly Ala Glu Thr Cys Glu

20 25 30

Asp Cys Leu Leu Ile Gly Pro Gln Cys Ala Trp Cys Ala Gln Glu Asn

35 40 45

Phe Thr His Pro Ser Gly Val Gly Glu Arg Cys Asp Thr Pro Ala Asn

50 55 60

Leu Leu Ala Lys Gly Cys Gln Leu Asn Phe Ile Glu Asn Pro Val Ser

65 70 75 80

Gln Val Glu Ile Leu Lys Asn Lys Pro Leu Ser Val Gly Arg Gln Lys

85 90 95

Asn Ser Ser Asp Ile Val Gln Ile Ala Pro Gln Ser Leu Ile Leu Lys

100 105 110

Leu Arg Pro Gly Gly Ala Gln Thr Leu Gln Val His Val Arg Gln Thr

115 120 125

Glu Asp Tyr Pro Val Asp Leu Tyr Tyr Leu Met Asp Leu Ser Ala Ser

130 135 140

Met Asp Asp Asp Leu Asn Thr Ile Lys Glu Leu Gly Ser Arg Leu Ser

145 150 155 160

Lys Glu Met Ser Lys Leu Thr Ser Asn Phe Arg Leu Gly Phe Gly Ser

165 170 175

Phe Val Glu Lys Pro Val Ser Pro Phe Val Lys Thr Thr Pro Glu Glu

180 185 190

Ile Ala Asn Pro Cys Ser Ser Ile Pro Tyr Phe Cys Leu Pro Thr Phe

195 200 205

Gly Phe Lys His Ile Leu Pro Leu Thr Asn Asp Ala Glu Arg Phe Asn

210 215 220

Glu Ile Val Lys Asn Gln Lys Ile Ser Ala Asn Ile Asp Thr Pro Glu

225 230 235 240

Gly Gly Phe Asp Ala Ile Met Gln Ala Ala Val Cys Lys Glu Lys Ile

245 250 255

Gly Trp Arg Asn Asp Ser Leu His Leu Leu Val Phe Val Ser Asp Ala

260 265 270

Asp Ser His Phe Gly Met Asp Ser Lys Leu Ala Gly Ile Val Ile Pro

275 280 285

Asn Asp Gly Leu Cys His Leu Asp Ser Lys Asn Glu Tyr Ser Met Ser

290 295 300

Thr Val Leu Glu Tyr Pro Thr Ile Gly Gln Leu Ile Asp Lys Leu Val

305 310 315 320

Gln Asn Asn Val Leu Leu Ile Phe Ala Val Thr Gln Glu Gln Val His

325 330 335

Leu Tyr Glu Asn Tyr Ala Lys Leu Ile Pro Gly Ala Thr Val Gly Leu

340 345 350

Leu Gln Lys Asp Ser Gly Asn Ile Leu Gln Leu Ile Ile Ser Ala Tyr

355 360 365

Glu Glu Leu Arg Ser Glu Val Glu Leu Glu Val Leu Gly Asp Thr Glu

370 375 380

Gly Leu Asn Leu Ser Phe Thr Ala Ile Cys Asn Asn Gly Thr Leu Phe

385 390 395 400

Gln His Gln Lys Lys Cys Ser His Met Lys Val Gly Asp Thr Ala Ser

405 410 415

Phe Ser Val Thr Val Asn Ile Pro His Cys Glu Arg Arg Ser Arg His

420 425 430

Ile Ile Ile Lys Pro Val Gly Leu Gly Asp Ala Leu Glu Leu Leu Val

435 440 445

Ser Pro Glu Cys Asn Cys Asp Cys Gln Lys Glu Val Glu Val Asn Ser

450 455 460

Ser Lys Cys His His Gly Asn Gly Ser Phe Gln Cys Gly Val Cys Ala

465 470 475 480

Cys His Pro Gly His Met Gly Pro Arg Cys Glu Cys Gly Glu Asp Met

485 490 495

Leu Ser Thr Asp Ser Cys Lys Glu Ala Pro Asp His Pro Ser Cys Ser

500 505 510

Gly Arg Gly Asp Cys Tyr Cys Gly Gln Cys Ile Cys His Leu Ser Pro

515 520 525

Tyr Gly Asn Ile Tyr Gly Pro Tyr Cys Gln Cys Asp Asn Phe Ser Cys

530 535 540

Val Arg His Lys Gly Leu Leu Cys Gly Asp Phe Ser Lys Asp Gly Ser

545 550 555 560

Val Ser Cys Ser Leu Gln Gly Glu Asn Glu Cys Leu Ile Thr Phe Leu

565 570 575

Ile Thr Thr Asp Asn Glu Gly Lys Thr Ile Ile His Ser Ile Asn Glu

580 585 590

Lys Asp Cys Pro Lys Pro Pro Asn Ile Pro Met Ile Met Leu Gly Val

595 600 605

Ser Leu Ala Ile Leu Leu Ile Gly Val Val Leu Leu Cys Ile Trp Lys

610 615 620

Leu Leu Val Ser Phe His Asp Arg Lys Glu Val Ala Lys Phe Glu Ala

625 630 635 640

Glu Arg Ser Lys Ala Lys Trp Gln Thr Gly Thr Asn Pro Leu Tyr Arg

645 650 655

Gly Ser Thr Ser Thr Phe Lys Asn Val Thr Tyr Lys His Arg Glu Lys

660 665 670

Gln Lys Val Asp Leu Ser Thr Asp Cys

675 680

<210>29

<211>3176

<212>DNA

<213>人

<400>29

tgataaccca aggtattcac agcaagatac agtgagtctt aaagttaagc accgtgcaat 60

tagctttgct tccttgggtt tttgaaacat gcatctgtat aaacctgcct gtgcagacat 120

cccgagcccc aagctgggtc tgccaaaatc cagtgaatcg gctctaaaat gtagatggca 180

cctagcagtg accaagactc agcctcaggc ggcctgcaaa cctgtgaggc ccagtggagc 240

agccgaacag aaatatgtgg aaaagtttct acgtgttcat ggaatttcgt tgcaggaaac 300

caccagagca gagacgggca tggcatacag gaatcttgga aaatcaggac tcagagtttc 360

ttgcttgggt cttggaacat gggtgacatt tggaggtcaa atttcagatg aggttgctga 420

acggctgatg accatcgcct atgaaagtgg tgttaacctc tttgatactg ccgaagtcta 480

tgctgctgga aaggctgaag tgattctggg gagcatcatc aagaagaaag gctggaggag 540

gtccagtctg gtcataacaa ccaaactcta ctggggtgga aaagctgaaa cagaaagagg 600

gctgtcaaga aagcatatta ttgaaggatt gaagggctcc ctccagaggc tgcagctcga 660

gtatgtggat gtggtctttg caaatcgacc ggacagtaac actcccatgg aagaaattgt 720

ccgagccatg acacatgtga taaaccaagg catggcgatg tactggggca cctcgagatg 780

gagtgctatg gagatcatgg aagcctattc tgtagcaaga cagttcaata tgatcccacc 840

ggtctgtgaa caagctgagt accatctttt ccagagagag aaagtggagg tccagctgcc 900

agagctctac cacaaaatag gtgttggcgc aatgacatgg tctccacttg cctgtggaat 960

catctcagga aaatacggaa acggggtgcc tgaaagttcc agggcttcac tgaagtgcta 1020

ccagtggttg aaagaaagaa ttgtaagtga agaagggaga aaacagcaaa acaagctaaa 1080

agacctttcc ccaattgcgg agcgtctggg atgcacacta cctcagctag ctgttgcgtg 1140

gtgcctgaga aatgaaggtg tgagttctgt gctcctggga tcatccactc ctgaacaact 1200

cattgaaaac cttggtgcca ttcaggttct cccaaagatg acatcacatg tggtaaatga 1260

gattgataac atactgcgca acaagcccta cagcaagaag gactatagat cataaggcaa 1320

tgcatgaacc acagaagctg catggttaaa atagcggcct gtgcccagta cagaaaggtg 1380

ttactaacca gtcttttgaa tcacttagca gcttgctcgt caacctctag tgtccctccc 1440

tggattcttt gaggtgtctg ctgtcgctac cactgtgcac atctgaaaac tcacaaccaa 1500

gaaaatccat tctattttct tatcttggac tggagtcacc tattcttgca ttgctgtata 1560

cacctcatgc ttatgcaatg ggaagaatat gggggccagg gggtgtggta ctaccttcag 1620

gcatttggta actcaaagaa ggctgtacag atatattttt tcaaaaagaa caaaatccac 1680

agatgcaatg tgagttgcgt aagaaacaga gtagatagac taaattcagt gaaggaaagg 1740

aattgagaga tttttcttag taaatagatt attgttaagt aaatagttat taaaaatata 1800

tctcactgca aaaaaaaaaa aagcagtatc ttcactcaaa agtcttgctt ggaagaataa 1860

gcagaaagaa ttttatatat tttttttcta ttttcacatt catactaaca agttttgttc 1920

catttgttat tcaataaaac aaaaatttct aggtatttgc tttattacct ttcaaatatt 1980

tactgttgct tggccccaag aatggccttg tacaacttat ccagaatgtc tattaggatt 2040

ctaatgttat gtccacttac aagtagagac agtaaaagga tgaataccca atctttagtg 2100

acaatgcagc tgatttatga aagagagggc tacactgcta tggaaactta gcttcaaaga 2160

aaatgcaatg tatctgcaat taggtgttca ttttttacta cattttatta aaacctgctt 2220

tatactttca actgcttgta ggcacaactt ctgcaagttt aaatatttga gctttacaaa 2280

taaacataca catgctcagt ttttttaagt aaacctgtaa aatacccagg aaggcaaatg 2340

ttcattgttt aattagcact gggattttat aatataatgt ttggtatttt tgaggcattg 2400

ttaacatgaa agtcaaccac tggctttgtg aaaaatgcta tgtcactatt cagaatatgc 2460

tgggtaaatt aacttgccta gtgaaaagca aaatgttaaa gaaagaactt ctggttctat 2520

aatcatatta tatgcactaa actatatgca tgaaagttct ttgcatggat taatggggct 2580

tacccttgtt gcactcgaaa tctgaggtgt atctagccct gccactattg gctacttacc 2640

ctcattaata tcccacttga gaaaaattgt gagactatac tgtgtcaata tctgtaaaaa 2700

gagagaaaac atgttttttt ttttttgaag ggggtggtgt gggagtggcc ctttaactcc 2760

tatttggcta tctgaggatg tacaaaattc tcatttaatt ttctggtcag caagttcccc 2820

acacagaaat cactctgagg tttacagaag aactgtaata ttattttaaa atgcgatttt 2880

ctgtcattag ttctagatat gtacttcatg gttaaattct aaatctgaaa atgctagtgg 2940

gagatatcaa gaaattttct ttttgattac tagtacctgt attctaacag agagtttgaa 3000

ttttttgccc gtgttatcag aatgatggaa attgatcatt ttcagttgtt cattgtgtat 3060

tcaatccagc tgaactgctg tatgtataga ggagcttgag gtgctgtcta atgggaaatg 3120

tgatttgatt gatttatttg cttagagtaa taaaagcatt ttgtgcattc aatctt 3176

<210>30

<211>408

<212>PRT

<213>人

<400>30

Met His Leu Tyr Lys Pro Ala Cys Ala Asp Ile Pro Ser Pro Lys Leu

1 5 10 15

Gly Leu Pro Lys Ser Ser Glu Ser Ala Leu Lys Cys Arg Trp His Leu

20 25 30

Ala Val Thr Lys Thr Gln Pro Gln Ala Ala Cys Lys Pro Val Arg Pro

35 40 45

Ser Gly Ala Ala Glu Gln Lys Tyr Val Glu Lys Phe Leu Arg Val His

50 55 60

Gly Ile Ser Leu Gln Glu Thr Thr Arg Ala Glu Thr Gly Met Ala Tyr

65 70 75 80

Arg Asn Leu Gly Lys Ser Gly Leu Arg Val Ser Cys Leu Gly Leu Gly

85 90 95

Thr Trp Val Thr Phe Gly Gly Gln Ile Ser Asp Glu Val Ala Glu Arg

100 105 110

Leu Met Thr Ile Ala Tyr Glu Ser Gly Val Asn Leu Phe Asp Thr Ala

115 120 125

Glu Val Tyr Ala Ala Gly Lys Ala Glu Val Ile Leu Gly Ser Ile Ile

130 135 140

Lys Lys Lys Gly Trp Arg Arg Ser Ser Leu Val Ile Thr Thr Lys Leu

145 150 155 160

Tyr Trp Gly Gly Lys Ala Glu Thr Glu Arg Gly Leu Ser Arg Lys His

165 170 175

Ile Ile Glu Gly Leu Lys Gly Ser Leu Gln Arg Leu Gln Leu Glu Tyr

180 185 190

Val Asp Val Val Phe Ala Asn Arg Pro Asp Ser Asn Thr Pro Met Glu

195 200 205

Glu Ile Val Arg Ala Met Thr His Val Ile Asn Gln Gly Met Ala Met

210 215 220

Tyr Trp Gly Thr Ser Arg Trp Ser Ala Met Glu Ile Met Glu Ala Tyr

225 230 235 240

Ser Val Ala Arg Gln Phe Asn Met Ile Pro Pro Val Cys Glu Gln Ala

245 250 255

Glu Tyr His Leu Phe Gln Arg Glu Lys Val Glu Val Gln Leu Pro Glu

260 265 270

Leu Tyr His Lys Ile Gly Val Gly Ala Met Thr Trp Ser Pro Leu Ala

275 280 285

Cys Gly Ile Ile Ser Gly Lys Tyr Gly Asn Gly Val Pro Glu Ser Ser

290 295 300

Arg Ala Ser Leu Lys Cys Tyr Gln Trp Leu Lys Glu Arg Ile Val Ser

305 310 315 320

Glu Glu Gly Arg Lys Gln Gln Asn Lys Leu Lys Asp Leu Ser Pro Ile

325 330 335

Ala Glu Arg Leu Gly Cys Thr Leu Pro Gln Leu Ala Val Ala Trp Cys

340 345 350

Leu Arg Asn Glu Gly Val Ser Ser Val Leu Leu Gly Ser Ser Thr Pro

355 360 365

Glu Gln Leu Ile Glu Asn Leu Gly Ala Ile Gln Val Leu Pro Lys Met

370 375 380

Thr Ser His Val Val Asn Glu Ile Asp Asn Ile Leu Arg Asn Lys Pro

385 390 395 400

Tyr Ser Lys Lys Asp Tyr Arg Ser

405

<210>31

<211>3744

<212>DNA

<213>人

<400>31

ccacgcgtcc ggtggcggtc gagcgtggcg taggcgaatc ctcggcacta agcatatgga 60

cctcgcggcg gcagcggagc cgggcgccgg cagccagcac ctggaggtcc gcgacgaggt 120

ggccgagaag tgccagaaac tgttcctgga cttcttggag gagtttcaga gcagcgatgg 180

agaaattaaa tacttgcaat tagcagagga actgattcgt cctgagagaa acacattggt 240

tgtgagtttt gtggacctgg aacaatttaa ccagcaactt tccaccacca ttcaagagga 300

gttctataga gtttaccctt acctgtgtcg ggccttgaaa acattcgtca aagaccgtaa 360

agagatccct cttgccaagg atttttatgt tgcattccaa gacctgccta ccagacacaa 420

gattcgagag ctcacctcat ccagaattgg tttgctcact cgcatcagtg ggcaggtggt 480

gcggactcac ccagttcacc cagagcttgt gagcggaact tttctgtgct tggactgtca 540

gacagtgatc agggatgtag aacagcagtt caaatacaca cagccaaaca tctgccgaaa 600

tccagtttgt gccaacagga ggagattctt actggataca aataaatcaa gatttgttga 660

ttttcaaaag gttcgtattc aagagaccca agctgagctt cctcgaggga gtatcccccg 720

cagtttagaa gtaattttaa gggctgaagc tgtggaatca gctcaagctg gtgacaagtg 780

tgactttaca gggacactga ttgttgtgcc tgacgtctcc aagcttagca caccaggagc 840

acgtgcagaa actaattccc gtgtcagtgg tgttgatgga tatgagacag aaggcattcg 900

aggactccgg gcccttggtg ttagggacct ttcttatagg ctggtctttc ttgcctgctg 960

tgttgcgcca accaacccaa ggtttggggg gaaagagctc agagatgagg aacagacagc 1020

tgagagcatt aagaaccaaa tgactgtgaa agaatgggag aaagtgtttg agatgagtca 1080

agataaaaat ctataccaca atctttgtac cagcctgttc cctactatac atggcaatga 1140

tgaagtaaaa cggggtgtcc tgctgatgct ctttggtggc gttccaaaga caacaggaga 1200

agggacctct cttcgagggg acataaatgt ttgcattgtt ggtgacccaa gtacagctaa 1260

gagccaattt ctcaagcacg tggaggagtt cagccccaga gctgtctaca ccagtggtaa 1320

agcgtccagt gctgctggct taacagcagc tgttgtgaga gatgaagaat ctcatgagtt 1380

tgtcattgag gctggagctt tgatgttggc tgataatggt gtgtgttgta ttgatgaatt 1440

tgataagatg gacgtgcggg atcaagttgc tattcatgaa gctatggaac agcagaccat 1500

atccatcact aaagcaggag tgaaggctac tctgaacgcc cggacgtcca ttttggcagc 1560

agcaaaccca atcagtggac actatgacag atcaaaatca ttgaaacaga atataaattt 1620

gtcagctccc atcatgtccc gattcgatct cttctttatc cttgtggatg aatgtaatga 1680

ggttacagat tatgccattg ccaggcgcat agtagatttg cattcaagaa ttgaggaatc 1740

aattgatcgt gtctattccc tcgatgatat cagaagatat cttctctttg caagacagtt 1800

taaacccaag atttccaaag agtcagagga cttcattgtg gagcaatata aacatctccg 1860

ccagagagat ggttctggag tgaccaagtc ttcatggagg attacagtgc gacagcttga 1920

gagcatgatt cgtctctctg aagctatggc tcggatgcac tgctgtgatg aggtccaacc 1980

taaacatgtg aaggaagctt tccggttact gaataaatca atcatccgtg tggaaacacc 2040

tgatgtcaat ctagatcaag aggaagagat ccagatggag gtagatgagg gtgccggtgg 2100

catcaatggt catgctgaca gccctgctcc tgtgaacggg atcaatggct acaatgaaga 2160

cataaatcaa gagtctgctc ccaaagcctc cttaaggctg ggcttctctg agtactgccg 2220

aatctctaac cttattgtgc ttcacctcag aaaggtggaa gaagaagagg acgagtcagc 2280

attaaagagg agcgagcttg ttaactggta cttgaaggaa atcgaatcag agatagactc 2340

tgaagaagaa cttataaata aaaaaagaat catagagaaa gttattcatc gactcacaca 2400

ctatgatcat gttctaattg agctcaccca ggctggattg aaaggctcca cagagggaag 2460

tgagagctat gaagaagatc cctacttggt agttaaccct aactacttgc tcgaagattg 2520

agatagtgaa agtaactgac cagagctgag gaactgtggc acagcacctc gtggcctgga 2580

gcctggctgg agctctgcta gggacagaag tgtttctgga agtgatgctt ccaggatttg 2640

ttttcagaaa caagaattga gttgatggtc ctatgtgtca cattcatcac aggtttcata 2700

ccaacacagg cttcagcact tcctttggtg tgtttcctgt cccagtgaag ttggaaccaa 2760

ataatgtgta gtctctataa ccaatacctt tgttttcatg tgtaagaaaa ggcccattac 2820

ttttaaggta tgtgctgtcc tattgagcaa ataacttttt ttcaattgcc agctactgct 2880

tttattcatc aaaataaaat aacttgttct gaagttgtct attggatttc tttctactgt 2940

accctgatta ttacttccat ctacttctga atgtgagact ttcccttttt gcttaacctg 3000

gagtgaagag gtagaactgt ggtattatgg atgaggtttc tatgagaagg agtcattaga 3060

gaactcatat gaaagctaga ggccttagag atgactttcc aaggttaatt ccagtttttt 3120

ttttttttaa gtttataaaa gtttattata cttttttaaa attactcttt agtaatttat 3180

tttacttctg tgtcctaagg gtaatttctc aggattgttt tcaaattgct tttttagggg 3240

aaataggtca tttgctatat tacaagcaat ccccaaattt tatggtcttc caggaaaagt 3300

tattaccgtt tatgatacta acagttcctg agacttagct atgatcagta tgttcatgag 3360

gtggagcagt tcctgtgttg cagcttttaa caacagatgg cattcattaa atcacaaagt 3420

atgttaaagg tcacaaaagc aaaataactg tctgaggcta aggcccacgt gggacagtct 3480

aatacccatg agtactcaac ttgccttgat gtctgagctt tccagtgcaa tgtgaatttg 3540

agcagccaga aatctattag tagaaagcaa gacagattaa tataggttaa aacaatgatt 3600

taaatatgtt tctcccaata attatctctt tccctggaat caacttgtat gaaaccttgt 3660

caaaatgtac tccacaagta tgtacaatta agtattttaa aaataaatgg caaacattaa 3720

aaaaaaaaaa aaaaaaaaaa aaaa 3744

<210>32

<211>821

<212>PRT

<213>人

<400>32

Met Asp Leu Ala Ala Ala Ala Glu Pro Gly Ala Gly Ser Gln His Leu

1 5 10 15

Glu Val Arg Asp Glu Val Ala Glu Lys Cys Gln Lys Leu Phe Leu Asp

20 25 30

Phe Leu Glu Glu Phe Gln Ser Ser Asp Gly Glu Ile Lys Tyr Leu Gln

35 40 45

Leu Ala Glu Glu Leu Ile Arg Pro Glu Arg Asn Thr Leu Val Val Ser

50 55 60

Phe Val Asp Leu Glu Gln Phe Asn Gln Gln Leu Ser Thr Thr Ile Gln

65 70 75 80

Glu Glu Phe Tyr Arg Val Tyr Pro Tyr Leu Cys Arg Ala Leu Lys Thr

85 90 95

Phe Val Lys Asp Arg Lys Glu Ile Pro Leu Ala Lys Asp Phe Tyr Val

100 105 110

Ala Phe Gln Asp Leu Pro Thr Arg His Lys Ile Arg Glu Leu Thr Ser

115 120 125

Ser Arg Ile Gly Leu Leu Thr Arg Ile Ser Gly Gln Val Val Arg Thr

130 135 140

His Pro Val His Pro Glu Leu Val Ser Gly Thr Phe Leu Cys Leu Asp

145 150 155 160

Cys Gln Thr Val Ile Arg Asp Val Glu Gln Gln Phe Lys Tyr Thr Gln

165 170 175

Pro Asn Ile Cys Arg Asn Pro Val Cys Ala Asn Arg Arg Arg Phe Leu

180 185 190

Leu Asp Thr Asn Lys Ser Arg Phe Val Asp Phe Gln Lys Val Arg Ile

195 200 205

Gln Glu Thr Gln Ala Glu Leu Pro Arg Gly Ser Ile Pro Arg Ser Leu

210 215 220

Glu Val Ile Leu Arg Ala Glu Ala Val Glu Ser Ala Gln Ala Gly Asp

225 230 235 240

Lys Cys Asp Phe Thr Gly Thr Leu Ile Val Val Pro Asp Val Ser Lys

245 250 255

Leu Ser Thr Pro Gly Ala Arg Ala Glu Thr Asn Ser Arg Val Ser Gly

260 265 270

Val Asp Gly Tyr Glu Thr Glu Gly Ile Arg Gly Leu Arg Ala Leu Gly

275 280 285

Val Arg Asp Leu Ser Tyr Arg Leu Val Phe Leu Ala Cys Cys Val Ala

290 295 300

Pro Thr Asn Pro Arg Phe Gly Gly Lys Glu Leu Arg Asp Glu Glu Gln

305 310 315 320

Thr Ala Glu Ser Ile Lys Asn Gln Met Thr Val Lys Glu Trp Glu Lys

325 330 335

Val Phe Glu Met Ser Gln Asp Lys Asn Leu Tyr His Asn Leu Cys Thr

340 345 350

Ser Leu Phe Pro Thr Ile His Gly Asn Asp Glu Val Lys Arg Gly Val

355 360 365

Leu Leu Met Leu Phe Gly Gly Val Pro Lys Thr Thr Gly Glu Gly Thr

370 375 380

Ser Leu Arg Gly Asp Ile Asn Val Cys Ile Val Gly Asp Pro Ser Thr

385 390 395 400

Ala Lys Ser Gln Phe Leu Lys His Val Glu Glu Phe Ser Pro Arg Ala

405 410 415

Val Tyr Thr Ser Gly Lys Ala Ser Ser Ala Ala Gly Leu Thr Ala Ala

420 425 430

Val Val Arg Asp Glu Glu Ser His Glu Phe Val Ile Glu Ala Gly Ala

435 440 445

Leu Met Leu Ala Asp Asn Gly Val Cys Cys Ile Asp Glu Phe Asp Lys

450 455 460

Met Asp Val Arg Asp Gln Val Ala Ile His Glu Ala Met Glu Gln Gln

465 470 475 480

Thr Ile Ser Ile Thr Lys Ala Gly Val Lys Ala Thr Leu Asn Ala Arg

485 490 495

Thr Ser Ile Leu Ala Ala Ala Asn Pro Ile Ser Gly His Tyr Asp Arg

500 505 510

Ser Lys Ser Leu Lys Gln Asn Ile Asn Leu Ser Ala Pro Ile Met Ser

515 520 525

Arg Phe Asp Leu Phe Phe Ile Leu Val Asp Glu Cys Asn Glu Val Thr

530 535 540

Asp Tyr Ala Ile Ala Arg Arg Ile Val Asp Leu His Ser Arg Ile Glu

545 550 555 560

Glu Ser Ile Asp Arg Val Tyr Ser Leu Asp Asp Ile Arg Arg Tyr Leu

565 570 575

Leu Phe Ala Arg Gln Phe Lys Pro Lys Ile Ser Lys Glu Ser Glu Asp

580 585 590

Phe Ile Val Glu Gln Tyr Lys His Leu Arg Gln Arg Asp Gly Ser Gly

595 600 605

Val Thr Lys Ser Ser Trp Arg Ile Thr Val Arg Gln Leu Glu Ser Met

610 615 620

Ile Arg Leu Ser Glu Ala Met Ala Arg Met His Cys Cys Asp Glu Val

625 630 635 640

Gln Pro Lys His Val Lys Glu Ala Phe Arg Leu Leu Asn Lys Ser Ile

645 650 655

Ile Arg Val Glu Thr Pro Asp Val Asn Leu Asp Gln Glu Glu Glu Ile

660 665 670

Gln Met Glu Val Asp Glu Gly Ala Gly Gly Ile Asn Gly His Ala Asp

675 680 685

Ser Pro Ala Pro Val Asn Gly Ile Asn Gly Tyr Asn Glu Asp Ile Asn

690 695 700

Gln Glu Ser Ala Pro Lys Ala Ser Leu Arg Leu Gly Phe Ser Glu Tyr

705 710 715 720

Cys Arg Ile Ser Asn Leu Ile Val Leu His Leu Arg Lys Val Glu Glu

725 730 735

Glu Glu Asp Glu Ser Ala Leu Lys Arg Ser Glu Leu Val Asn Trp Tyr

740 745 750

Leu Lys Glu Ile Glu Ser Glu Ile Asp Ser Glu Glu Glu Leu Ile Asn

755 760 765

Lys Lys Arg Ile Ile Glu Lys Val Ile His Arg Leu Thr His Tyr Asp

770 775 780

His Val Leu Ile Glu Leu Thr Gln Ala Gly Leu Lys Gly Ser Thr Glu

785 790 795 800

Gly Ser Glu Ser Tyr Glu Glu Asp Pro Tyr Leu Val Val Asn Pro Asn

805 810 815

Tyr Leu Leu Glu Asp

820

<210>33

<211>2111

<212>DNA

<213>人

<400>33

ggccggccac tcccgtctgc tgtgacgcgc ggacagagag ctaccggtgg acccacggtg 60

cctccctccc tgggatctac acagaccatg gccttgccaa cggctcgacc cctgttgggg 120

tcctgtggga cccccgccct cggcagcctc ctgttcctgc tcttcagcct cggatgggtg 180

cagccctcga ggaccctggc tggagagaca gggcaggagg ctgcacccct ggacggagtc 240

ctggccaacc cacctaacat ttccagcctc tcccctcgcc aactccttgg cttcccgtgt 300

gcggaggtgt ccggcctgag cacggagcgt gtccgggagc tggctgtggc cttggcacag 360

aagaatgtca agctctcaac agagcagctg cgctgtctgg ctcaccggct ctctgagccc 420

cccgaggacc tggacgccct cccattggac ctgctgctat tcctcaaccc agatgcgttc 480

tcggggcccc aggcctgcac ccgtttcttc tcccgcatca cgaaggccaa tgtggacctg 540

ctcccgaggg gggctcccga gcgacagcgg ctgctgcctg cggctctggc ctgctggggt 600

gtgcgggggt ctctgctgag cgaggctgat gtgcgggctc tgggaggcct ggcttgcgac 660

ctgcctgggc gctttgtggc cgagtcggcc gaagtgctgc taccccggct ggtgagctgc 720

ccgggacccc tggaccagga ccagcaggag gcagccaggg cggctctgca gggcggggga 780

cccccctacg gccccccgtc gacatggtct gtctccacga tggacgctct gcggggcctg 840

ctgcccgtgc tgggccagcc catcatccgc agcatcccgc agggcatcgt ggccgcgtgg 900

cggcaacgct cctctcggga cccatcctgg cggcagcctg aacggaccat cctccggccg 960

cggttccggc gggaagtgga gaagacagcc tgtccttcag gcaagaaggc ccgcgagata 1020

gacgagagcc tcatcttcta caagaagtgg gagctggaag cctgcgtgga tgcggccctg 1080

ctggccaccc agatggaccg cgtgaacgcc atccccttca cctacgagca gctggacgtc 1140

ctaaagcata aactggatga gctctaccca caaggttacc ccgagtctgt gatccagcac 1200

ctgggctacc tcttcctcaa gatgagccct gaggacattc gcaagtggaa tgtgacgtcc 1260

ctggagaccc tgaaggcttt gcttgaagtc aacaaagggc acgaaatgag tcctcaggtg 1320

gccaccctga tcgaccgctt tgtgaaggga aggggccagc tagacaaaga caccctagac 1380

accctgaccg ccttctaccc tgggtacctg tgctccctca gccccgagga gctgagctcc 1440

gtgcccccca gcagcatctg ggcggtcagg ccccaggacc tggacacgtg tgacccaagg 1500

cagctggacg tcctctatcc caaggcccgc cttgctttcc agaacatgaa cgggtccgaa 1560

tacttcgtga agatccagtc cttcctgggt ggggccccca cggaggattt gaaggcgctc 1620

agtcagcaga atgtgagcat ggacttggcc acgttcatga agctgcggac ggatgcggtg 1680

ctgccgttga ctgtggctga ggtgcagaaa cttctgggac cccacgtgga gggcctgaag 1740

gcggaggagc ggcaccgccc ggtgcgggac tggatcctac ggcagcggca ggacgacctg 1800

gacacgctgg ggctggggct acagggcggc atccccaacg gctacctggt cctagacctc 1860

agcgtgcaag aggccctctc ggggacgccc tgcctcctag gacctggacc tgttctcacc 1920

gtcctggcac tgctcctagc ctccaccctg gcctgagggc cccactccct tgctggcccc 1980

agccctgctg gggatccccg cctggccagg agcaggcacg ggtgatcccc gttccacccc 2040

aagagaactc gcgctcagta aacgggaaca tgccccctgc agacacgtaa aaaaaaaaaa 2100

aaaaaaaaaa a 2111

<210>34

<211>622

<212>PRT

<213>人

<400>34

Met Ala Leu Pro Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly Thr Pro

1 5 10 15

Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val Gln

20 25 30

Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu

35 40 45

Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg

50 55 60

Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu

65 70 75 80

Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu

85 90 95

Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro

100 105 110

Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro

115 120 125

Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile

130 135 140

Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln

145 150 155 160

Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu

165 170 175

Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu

180 185 190

Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu

195 200 205

Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg

210 215 220

Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp

225 230 235 240

Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly

245 250 255

Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg

260 265 270

Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile

275 280 285

Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser

290 295 300

Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys

305 310 315 320

Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met

325 330 335

Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu

340 345 350

Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val

355 360 365

Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile

370 375 380

Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu

385 390 395 400

Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp

405 410 415

Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr

420 425 430

Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu

435 440 445

Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp

450 455 460

Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala

465 470 475 480

Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile

485 490 495

Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser

500 505 510

Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr

515 520 525

Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly

530 535 540

Pro His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg

545 550 555 560

Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu

565 570 575

Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser

580 585 590

Val Gln Glu Ala Leu Ser Gly Thr Pro Cys Leu Leu Gly Pro Gly Pro

595 600 605

Val Leu Thr Val Leu Ala Lau Leu Leu Ala Ser Thr Leu Ala

610 615 620

<210>35

<211>2731

<212>DNA

<213>人

<400>35

gcgcttggcg ggagatagaa aagtgcttca acccgcgccg gcggcgactg cagttcctgc 60

gagcgaggag cgcgggacct gctgacacgc tgacgccttc gagcgcggcc cggggcccgg 120

agcggccgga gcagcccggg tcctgacccc ggcccggctc ccgctccggg ctctgccggc 180

gggcgggcga gcgcggcgcg gtccgggccg gggggatgtc tcggcggacg cgctgcgagg 240

atctggatga gctgcactac caggacacag attcagatgt gccggagcag agggatagca 300

agtgcaaggt caaatggacc catgaggagg acgagcagct gagggccctg gtgaggcagt 360

ttggacagca ggactggaag ttcctggcca gccacttccc taaccgcact gaccagcaat 420

gccagtacag gtggctgaga gttttgaatc cagaccttgt caaggggcca tggaccaaag 480

aggaagacca aaaagtcatc gagctggtta agaagtatgg cacaaagcag tggacactga 540

ttgccaagca cctgaagggc cggctgggga agcagtgccg tgaacgctgg cacaaccacc 600

tcaaccctga ggtgaagaag tcttgctgga ccgaggagga ggaccgcatc atctgcgagg 660

cccacaaggt gctgggcaac cgctgggccg agatcgccaa gatgttgcca gggaggacag 720

acaatgctgt gaagaatcac tggaactcta ccatcaaaag gaaggtggac acaggaggct 780

tcttgagcga gtccaaagac tgcaagcccc cagtgtactt gctgctggag ctcgaggaca 840

aggacggcct ccagagtgcc cagcccacgg aaggccaggg aagtcttctg accaactggc 900

cctccgtccc tcctaccata aaggaggagg aaaacagtga ggaggaactt gcagcagcca 960

ccacatcgaa ggaacaggag cccatcggta cagatctgga cgcagtgcga acaccagagc 1020

ccttggagga attcccgaag cgtgaggacc aggaaggctc cccaccagaa acgagcctgc 1080

cttacaagtg ggtggtggag gcagctaacc tcctcatccc cgctgtgggt tctagcctct 1140

ctgaagccct ggacttgatc gagtcggacc ctgatgcttg gtgtgacctg agtaaatttg 1200

acctccctga ggaaccatct gcagaggaca gtatcaacaa cagcctagtg cagctgcaag 1260

cgtcacatca gcagcaagtc ctgccacccc gccagccttc cgccctggtg cccagtgtga 1320

ccgagtaccg cctggatggc cacaccatct cagacctgag ccggagcagc cggggcgagc 1380

tgatccccat ctcccccagc actgaagtcg ggggctctgg cattggcaca ccgccctctg 1440

tgctcaagcg gcagaggaag aggcgtgtgg ctctgtcccc tgtcactgag aatagcacca 1500

gtctgtcctt cctggattcc tgtaacagcc tcacgcccaa gagcacacct gttaagaccc 1560

tgcccttctc gccctcccag tttctgaact tctggaacaa acaggacaca ttggagctgg 1620

agagcccctc gctgacatcc accccagtgt gcagccagaa ggtggtggtc accacaccac 1680

tgcaccggga caagacaccc ctgcaccaga aacatgctgc gtttgtaacc ccagatcaga 1740

agtactccat ggacaacact ccccacacgc caaccccgtt caagaacgcc ctggagaagt 1800

acggacccct gaagcccctg ccacagaccc cgcacctgga ggaggacttg aaggaggtgc 1860

tgcgttctga ggctggcatc gaactcatca tcgaggacga catcaggccc gagaagcaga 1920

agaggaagcc tgggctgcgg cggagcccca tcaagaaagt ccggaagtct ctggctcttg 1980

acattgtgga tgaggatgtg aagctgatga tgtccacact gcccaagtct ctatccttgc 2040

cgacaactgc cccttcaaac tcttccagcc tcaccctgtc aggtatcaaa gaagacaaca 2100

gcttgctcaa ccagggcttc ttgcaggcca agcccgagaa ggcagcagtg gcccagaagc 2160

cccgaagcca cttcacgaca cctgccccta tgtccagtgc ctggaagacg gtggcctgcg 2220

gggggaccag ggaccagctt ttcatgcagg agaaagcccg gcagctcctg ggccgcctga 2280

agcccagcca cacatctcgg accctcatct tgtcctgagg tgttgagggt gtcacgagcc 2340

cattctcatg tttacagggg ttgtgggggc agagggggtc tgtgaatctg agagtcattc 2400

aggtgacctc ctgcagggag ccttctgcca ccagcccctc cccagactct caggtggagg 2460

caacagggcc atgtgctgcc ctgttgccga gcccagctgt gggcggctcc tggtgctaac 2520

aacaaagttc cacttccagg tctgcctggt tccctcccca aggccacagg gagctccgtc 2580

agcttctccc aagcccacgt caggcctggc ctcatctcag accctgctta ggatggggga 2640

tgtggccagg ggtgctcctg tgctcaccct ctcttggtgc atttttttgg aagaataaaa 2700

ttgcctctct cttaaaaaaa aaaaaaaaaa a 2731

<210>36

<211>700

<212>PRT

<213>人

<400>36

Met Ser Arg Arg Thr Arg Cys Glu Asp Leu Asp Glu Leu His Tyr Gln

1 5 10 15

Asp Thr Asp Ser Asp Val Pro Glu Gln Arg Asp Ser Lys Cys Lys Val

20 25 30

Lys Trp Thr His Glu Glu Asp Glu Gln Leu Arg Ala Leu Val Arg Gln

35 40 45

Phe Gly Gln Gln Asp Trp Lys Phe Leu Ala Ser His Phe Pro Asn Arg

50 55 60

Thr Asp Gln Gln Cys Gln Tyr Arg Trp Leu Arg Val Leu Asn Pro Asp

65 70 75 80

Leu Val Lys Gly Pro Trp Thr Lys Glu Glu Asp Gln Lys Val Ile Glu

85 90 95

Leu Val Lys Lys Tyr Gly Thr Lys Gln Trp Thr Leu Ile Ala Lys His

100 105 110

Leu Lys Gly Arg Leu Gly Lys Gln Cys Arg Glu Arg Trp His Asn His

115 120 125

Leu Asu Pro Glu Val Lys Lys Ser Cys Trp Thr Glu Glu Glu Asp Arg

130 135 140

Ile Ile Cys Glu Ala His Lys Val Leu Gly Asn Arg Trp Ala Glu Ile

145 150 155 160

Ala Lys Met Leu Pro Gly Arg Thr Asp Asn Ala Val Lys Asn His Trp

165 170 175

Asn Ser Thr Ile Lys Arg Lys Val Asp Thr Gly Gly Phe Leu Ser Glu

180 185 190

Ser Lys Asp Cys Lys Pro Pro Val Tyr Leu Leu Leu Glu Leu Glu Asp

195 200 205

Lys Asp Gly Leu Gln Ser Ala Gln Pro Thr Glu Gly Gln Gly Ser Leu

210 215 220

Leu Thr Asn Trp Pro Ser Val Pro Pro Thr Ile Lys Glu Glu Glu Asn

225 230 235 240

Ser Glu Glu Glu Leu Ala Ala Ala Thr Thr Ser Lys Glu Gln Glu Pro

245 250 255

Ile Gly Thr Asp Leu Asp Ala Val Arg Thr Pro Glu Pro Leu Glu Glu

260 265 270

Phe Pro Lys Arg Glu Asp Gln Glu Gly Ser Pro Pro Glu Thr Ser Leu

275 280 285

Pro Tyr Lys Trp Val Val Glu Ala Ala Asn Leu Leu Ile Pro Ala Val

290 295 300

Gly Ser Ser Leu Ser Glu Ala Leu Asp Leu Ile Glu Ser Asp Pro Asp

305 310 315 320

Ala Trp Cys Asp Leu Ser Lys Phe Asp Leu Pro Glu Glu Pro Ser Ala

325 330 335

Glu Asp Ser Ile Asn Asn Ser Leu Val Gln Leu Gln Ala Ser His Gln

340 345 350

Gln Gln Val Leu Pro Pro Arg Gln Pro Ser Ala Leu Val Pro Ser Val

355 360 365

Thr Glu Tyr Arg Leu Asp Gly His Thr Ile Ser Asp Leu Ser Arg Ser

370 375 380

Ser Arg Gly Glu Leu Ile Pro Ile Ser Pro Ser Thr Glu Val Gly Gly

385 390 395 400

Ser Gly Ile Gly Thr Pro Pro Ser Val Leu Lys Arg Gln Arg Lys Arg

405 410 415

Arg Val Ala Leu Ser Pro Val Thr Glu Asn Ser Thr Ser Leu Ser Phe

420 425 430

Leu Asp Ser Cys Asn Ser Leu Thr Pro Lys Ser Thr Pro Val Lys Thr

435 440 445

Leu Pro Phe Ser Pro Ser Gln Phe Leu Asn Phe Trp Asn Lys Gln Asp

450 455 460

Thr Leu Glu Leu Glu Ser Pro Ser Leu Thr Ser Thr Pro Val Cys Ser

465 470 475 480

Gln Lys Val Val Val Thr Thr Pro Leu His Arg Asp Lys Thr Pro Leu

485 490 495

His Gln Lys His Ala Ala Phe Val Thr Pro Asp Gln Lys Tyr Ser Met

500 505 510

Asp Asn Thr Pro His Thr Pro Thr Pro Phe Lys Asn Ala Leu Glu Lys

515 520 525

Tyr Gly Pro Leu Lys Pro Leu Pro Gln Thr Pro His Leu Glu Glu Asp

530 535 540

Leu Lys Glu Val Leu Arg Ser Glu Ala Gly Ile Glu Leu Ile Ile Glu

545 550 555 560

Asp Asp Ile Arg Pro Glu Lys Gln Lys Arg Lys Pro Gly Leu Arg Arg

565 570 575

Ser Pro Ile Lys Lys Val Arg Lys Ser Leu Ala Leu Asp Ile Val Asp

580 585 590

Glu Asp Val Lys Leu Met Met Ser Thr Leu Pro Lys Ser Leu Ser Leu

595 600 605

Pro Thr Thr Ala Pro Ser Asn Ser Ser Ser Leu Thr Leu Ser Gly Ile

610 615 620

Lys Glu Asp Asn Ser Leu Leu Asn Gln Gly Phe Leu Gln Ala Lys Pro

625 630 635 640

Glu Lys Ala Ala Val Ala Gln Lys Pro Arg Ser His Phe Thr Thr Pro

645 650 655

Ala Pro Met Ser Ser Ala Trp Lys Thr Val Ala Cys Gly Gly Thr Arg

660 665 670

Asp Gln Leu Phe Met Gln Glu Lys Ala Arg Gln Leu Leu Gly Arg Leu

675 680 685

Lys Pro Ser His Thr Ser Arg Thr Leu Ile Leu Ser

690 695 700

<210>37

<211>2304

<212>DNA

<213>人

<400>37

gtccccgcag cgccgtcgcg ccctcctgcc gcaggccacc gaggccgccg ccgtctagcg 60

ccccgacctc gccaccatga gagccctgct ggcgcgcctg cttctctgcg tcctggtcgt 120

gagcgactcc aaaggcagca atgaacttca tcaagttcca tcgaactgtg actgtctaaa 180

tggaggaaca tgtgtgtcca acaagtactt ctccaacatt cactggtgca actgcccaaa 240

gaaattcgga gggcagcact gtgaaataga taagtcaaaa acctgctatg aggggaatgg 300

tcacttttac cgaggaaagg ccagcactga caccatgggc cggccctgcc tgccctggaa 360

ctctgccact gtccttcagc aaacgtacca tgcccacaga tctgatgctc ttcagctggg 420

cctggggaaa cataattact gcaggaaccc agacaaccgg aggcgaccct ggtgctatgt 480

gcaggtgggc ctaaagccgc ttgtccaaga gtgcatggtg catgactgcg cagatggaaa 540

aaagccctcc tctcctccag aagaattaaa atttcagtgt ggccaaaaga ctctgaggcc 600

ccgctttaag attattgggg gagaattcac caccatcgag aaccagccct ggtttgcggc 660

catctacagg aggcaccggg ggggctctgt cacctacgtg tgtggaggca gcctcatcag 720

cccttgctgg gtgatcagcg ccacacactg cttcattgat tacccaaaga aggaggacta 780

catcgtctac ctgggtcgct caaggcttaa ctccaacacg caaggggaga tgaagtttga 840

ggtggaaaac ctcatcctac acaaggacta cagcgctgac acgcttgctc accacaacga 900

cattgccttg ctgaagatcc gttccaagga gggcaggtgt gcgcagccat cccggactat 960

acagaccatc tgcctgccct cgatgtataa cgatccccag tttggcacaa gctgtgagat 1020

cactggcttt ggaaaagaga attctaccga ctatctctat ccggagcagc tgaaaatgac 1080

tgttgtgaag ctgatttccc accgggagtg tcagcagccc cactactacg gctctgaagt 1140

caccaccaaa atgctatgtg ctgctgaccc ccaatggaaa acagattcct gccagggaga 1200

ctcaggggga cccctcgtct gttccctcca aggccgcatg actttgactg gaattgtgag 1260

ctggggccgt ggatgtgccc tgaaggacaa gccaggcgtc tacacgagag tctcacactt 1320

cttaccctgg atccgcagtc acaccaagga agagaatggc ctggccctct gagggtcccc 1380

agggaggaaa cgggcaccac ccgctttctt gctggttgtc atttttgcag tagagtcatc 1440

tccatcagct gtaagaagag actgggaaga taggctctgc acagatggat ttgcctgtgg 1500

caccaccagg gtgaacgaca atagctttac cctcacggat aggcctgggt gctggctgcc 1560

cagaccctct ggccaggatg gaggggtggt cctgactcaa catgttactg accagcaact 1620

tgtctttttc tggactgaag cctgcaggag ttaaaaaggg cagggcatct cctgtgcatg 1680

ggctcgaagg gagagccagc tcccccgacc ggtgggcatt tgtgaggccc atggttgaga 1740

aatgaataat ttcccaatta ggaagtgtaa gcagctgagg tctcttgagg gagcttagcc 1800

aatgtgggag cagcggtttg gggagcagag acactaacga cttcagggca gggctctgat 1860

attccatgaa tgtatcagga aatatatatg tgtgtgtatg tttgcacact tgttgtgtgg 1920

gctgtgagtg taagtgtgag taagagctgg tgtctgattg ttaagtctaa atatttcctt 1980

aaactgtgtg gactgtgatg ccacacagag tggtctttct ggagaggtta taggtcactc 2040

ctggggcctc ttgggtcccc cacgtgacag tgcctgggaa tgtacttatt ctgcagcatg 2100

acctgtgacc agcactgtct cagtttcact ttcacataga tgtccctttc ttggccagtt 2160

atcccttcct tttagcctag ttcatccaat cctcactggg tggggtgagg accactcctt 2220

acactgaata tttatatttc actattttta tttatatttt tgtaatttta aataaaagtg 2280

atcaataaaa tgtgattttt ctga 2304

<210>38

<211>431

<212>PRT

<213>人

<400>38

Met Arg Ala Leu Leu Ala Arg Leu Leu Leu Cys Val Leu Val Val Ser

1 5 10 15

Asp Ser Lys Gly Ser Asn Glu Leu His Gln Val Pro Ser Asn Cys Asp

20 25 30

Cys Leu Asn Gly Gly Thr Cys Val Ser Asn Lys Tyr Phe Ser Asn Ile

35 40 45

His Trp Cys Asn Cys Pro Lys Lys Phe Gly Gly Gln His Cys Glu Ile

50 55 60

Asp Lys Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly

65 70 75 80

Lys Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser

85 90 95

Ala Thr Val Leu Gln Gln Thr Tyr His Ala His Arg Ser Asp Ala Leu

100 105 110

Gln Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg

115 120 125

Arg Arg Pro Trp Cys Tyr Val Gln Val Gly Leu Lys Pro Leu Val Gln

130 135 140

Glu Cys Met Val His Asp Cys Ala Asp Gly Lys Lys Pro Ser Ser Pro

145 150 155 160

Pro Glu Glu Leu Lys Phe Gln Cys Gly Gln Lys Thr Leu Arg Pro Arg

165 170 175

Phe Lys Ile Ile Gly Gly Glu Phe Thr Thr Ile Glu Asn Gln Pro Trp

180 185 190

Phe Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Val Thr Tyr Val

195 200 205

Cys Gly Gly Ser Leu Ile Ser Pro Cys Trp Val Ile Ser Ala Thr His

210 215 220

Cys Phe Ile Asp Tyr Pro Lys Lys Glu Asp Tyr Ile Val Tyr Leu Gly

225 230 235 240

Arg Ser Arg Leu Asn Ser Asn Thr Gln Gly Glu Met Lys Phe Glu Val

245 250 255

Glu Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp Thr Leu Ala His

260 265 270

His Asn Asp Ile Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys

275 280 285

Ala Gln Pro Ser Arg Thr Ile Gln Thr Ile Cys Leu Pro Ser Met Tyr

290 295 300

Asn Asp Pro Gln Phe Gly Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys

305 310 315 320

Glu Asn Ser Thr Asp Tyr Leu Tyr Pro Glu Gln Leu Lys Met Thr Val

325 330 335

Val Lys Leu Ile Ser His Arg Glu Cys Gln Gln Pro His Tyr Tyr Gly

340 345 350

Ser Glu Val Thr Thr Lys Met Leu Cys Ala Ala Asp Pro Gln Trp Lys

355 360 365

Thr Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Cys Ser Leu

370 375 380

Gln Gly Arg Met Thr Leu Thr Gly Ile Val Ser Trp Gly Arg Gly Cys

385 390 395 400

Ala Leu Lys Asp Lys Pro Gly Val Tyr Thr Arg Val Ser His Phe Leu

405 410 415

Pro Trp Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu

420 425 430

<210>39

<211>1760

<212>DNA

<213>人

<400>39

gcagcaggcc aagggggagg tgcgagcgtg gacctgggac gggtctgggc ggctctcggt 60

ggttggcacg ggttcgcaca cccattcaag cggcaggacg cacttgtctt agcagttctc 120

gctgaccgcg ctagctgcgg cttctacgct ccggcactct gagttcatca gcaaacgccc 180

tggcgtctgt cctcaccatg cctagccttt gggaccgctt ctcgtcgtcg tccacctcct 240

cttcgccctc gtccttgccc cgaactccca ccccagatcg gccgccgcgc tcagcctggg 300

ggtcggcgac ccgggaggag gggtttgacc gctccacgag cctggagagc tcggactgcg 360

agtccctgga cagcagcaac agtggcttcg ggccggagga agacacggct tacctggatg 420

gggtgtcgtt gcccgacttc gagctgctca gtgaccctga ggatgaacac ttgtgtgcca 480

acctgatgca gctgctgcag gagagcctgg cccaggcgcg gctgggctct cgacgccctg 540

cgcgcctgct gatgcctagc cagttggtaa gccaggtggg caaagaacta ctgcgcctgg 600

cctacagcga gccgtgcggc ctgcgggggg cgctgctgga cgtctgcgtg gagcagggca 660

agagctgcca cagcgtgggc cagctggcac tcgaccccag cctggtgccc accttccagc 720

tgaccctcgt gctgcgcctg gactcacgac tctggcccaa gatccagggg ctgtttagct 780

ccgccaactc tcccttcctc cctggcttca gccagtccct gacgctgagc actggcttcc 840

gagtcatcaa gaagaagctg tacagctcgg aacagctgct cattgaggag tgttgaactt 900

caacctgagg gggccgacag tgccctccaa gacagagacg actgaacttt tggggtggag 960

actagaggca ggagctgagg gactgattcc agtggttgga aaactgaggc agccacctaa 1020

ggtggaggtg ggggaatagt gtttcccagg aagctcattg agttgtgtgc gggtggctgt 1080

gcattgggga cacatacccc tcagtactgt agcatggaac aaaggcttag gggccaacaa 1140

ggcttccagc tggatgtgtg tgtagcatgt accttattat ttttgttact gacagttaac 1200

agtggtgtga catccagaga gcagctgggc tgctcccgcc ccagcctggc ccagggtgaa 1260

ggaagaggca cgtgctcctc agagcagccg gagggagggg ggaggtcgga ggtcgtggag 1320

gtggtttgtg tatcttactg gtctgaaggg accaagtgtg tttgttgttt gttttgtatc 1380

ttgtttttct gatcggagca tcactactga cctgttgtag gcagctatct tacagacgca 1440

tgaatgtaag agtaggaagg ggtgggtgtc agggatcact tgggatcttt gacacttgaa 1500

aaattacacc tggcagctgc gtttaagcct tcccccatcg tgtactgcag agttgagctg 1560

gcaggggagg ggctgagagg gtgggggctg gaacccctcc ccgggaggag tgccatctgg 1620

gtcttccatc tagaactgtt tacatgaaga taagatactc actgttcatg aatacacttg 1680

atgttcaagt attaagacct atgcaatatt ttttactttt ctaataaaca tgtttgttaa 1740

aacaaaaaaa aaaaaaaaaa 1760

<210>40

<211>232

<212>PRT

<213>人

<400>40

Met Pro Ser Leu Trp Asp Arg Phe Ser Ser Ser Ser Thr Ser Ser Ser

1 5 10 15

Pro Ser Ser Leu Pro Arg Thr Pro Thr Pro Asp Arg Pro Pro Arg Ser

20 25 30

Ala Trp Gly Ser Ala Thr Arg Glu Glu Gly Phe Asp Arg Ser Thr Ser

35 40 45

Leu Glu Ser Ser Asp Cys Glu Ser Leu Asp Ser Ser Asn Ser Gly Phe

50 55 60

Gly Pro Glu Glu Asp Thr Ala Tyr Leu Asp Gly Val Ser Leu Pro Asp

65 70 75 80

Phe Glu Leu Leu Ser Asp Pro Glu Asp Glu His Leu Cys Ala Asn Leu

85 90 95

Met Gln Leu Leu Gln Glu Ser Leu Ala Gln Ala Arg Leu Gly Ser Arg

100 105 110

Arg Pro Ala Arg Leu Leu Met Pro Ser Gln Leu Val Ser Gln Val Gly

115 120 125

Lys Glu Leu Leu Arg Leu Ala Tyr Ser Glu Pro Cys Gly Leu Arg Gly

130 135 140

Ala Leu Leu Asp Val Cys Val Glu Gln Gly Lys Ser Cys His Ser Val

145 150 155 160

Gly Gln Leu Ala Leu Asp Pro Ser Leu Val Pro Thr Phe Gln Leu Thr

165 170 175

Leu Val Leu Arg Leu Asp Ser Arg Leu Trp Pro Lys Ile Gln Gly Leu

180 185 190

Phe Ser Ser Ala Asn Ser Pro Phe Leu Pro Gly Phe Ser Gln Ser Leu

195 200 205

Thr Leu Ser Thr Gly Phe Arg Val Ile Lys Lys Lys Leu Tyr Ser Ser

210 215 220

Glu Gln Leu Leu Ile Glu Glu Cys

225 230

<210>41

<211>5698

<212>DNA

<213>人

<400>41

aggttcaagt ggagctctcc taaccgacgc gcgtctgtgg agaagcggct tggtcggggg 60

tggtctcgtg gggtcctgcc tgtttagtcg ctttcagggt tcttgagccc cttcacgacc 120

gtcaccatgg aagtgtcacc attgcagcct gtaaatgaaa atatgcaagt caacaaaata 180

aagaaaaatg aagatgctaa gaaaagactg tctgttgaaa gaatctatca aaagaaaaca 240

caattggaac atattttgct ccgcccagac acctacattg gttctgtgga attagtgacc 300

cagcaaatgt gggtttacga tgaagatgtt ggcattaact atagggaagt cacttttgtt 360

cctggtttgt acaaaatctt tgatgagatt ctagttaatg ctgcggacaa caaacaaagg 420

gacccaaaaa tgtcttgtat tagagtcaca attgatccgg aaaacaattt aattagtata 480

tggaataatg gaaaaggtat tcctgttgtt gaacacaaag ttgaaaagat gtatgtccca 540

gctctcatat ttggacagct cctaacttct agtaactatg atgatgatga aaagaaagtg 600

acaggtggtc gaaatggcta tggagccaaa ttgtgtaaca tattcagtac caaatttact 660

gtggaaacag ccagtagaga atacaagaaa atgttcaaac agacatggat ggataatatg 720

ggaagagctg gtgagatgga actcaagccc ttcaatggag aagattatac atgtatcacc 780

tttcagcctg atttgtctaa gtttaaaatg caaagcctgg acaaagatat tgttgcacta 840

atggtcagaa gagcatatga tattgctgga tccaccaaag atgtcaaagt ctttcttaat 900

ggaaataaac tgccagtaaa aggatttcgt agttatgtgg acatgtattt gaaggacaag 960

ttggatgaaa ctggtaactc cttgaaagta atacatgaac aagtaaacca caggtgggaa 1020

gtgtgtttaa ctatgagtga aaaaggcttt cagcaaatta gctttgtcaa cagcattgct 1080

acatccaagg gtggcagaca tgttgattat gtagctgatc agattgtgac taaacttgtt 1140

gatgttgtga agaagaagaa caagggtggt gttgcagtaa aagcacatca ggtgaaaaat 1200

cacatgtgga tttttgtaaa tgccttaatt gaaaacccaa cctttgactc tcagacaaaa 1260

gaaaacatga ctttacaacc caagagcttt ggatcaacat gccaattgag tgaaaaattt 1320

atcaaagctg ccattggctg tggtattgta gaaagcatac taaactgggt gaagtttaag 1380

gcccaagtcc agttaaacaa gaagtgttca gctgtaaaac ataatagaat caagggaatt 1440

cccaaactcg atgatgccaa tgatgcaggg ggccgaaact ccactgagtg tacgcttatc 1500

ctgactgagg gagattcagc caaaactttg gctgtttcag gccttggtgt ggttgggaga 1560

gacaaatatg gggttttccc tcttagagga aaaatactca atgttcgaga agcttctcat 1620

aagcagatca tggaaaatgc tgagattaac aatatcatca agattgtggg tcttcagtac 1680

aagaaaaact atgaagatga agattcattg aagacgcttc gttatgggaa gataatgatt 1740

atgacagatc aggaccaaga tggttcccac atcaaaggct tgctgattaa ttttatccat 1800

cacaactggc cctctcttct gcgacatcgt tttctggagg aatttatcac tcccattgta 1860

aaggtatcta aaaacaagca agaaatggca ttttacagcc ttcctgaatt tgaagagtgg 1920

aagagttcta ctccaaatca taaaaaatgg aaagtcaaat attacaaagg tttgggcacc 1980

agcacatcaa aggaagctaa agaatacttt gcagatatga aaagacatcg tatccagttc 2040

aaatattctg gtcctgaaga tgatgctgct atcagcctgg cctttagcaa aaaacagata 2100

gatgatcgaa aggaatggtt aactaatttc atggaggata gaagacaacg aaagttactt 2160

gggcttcctg aggattactt gtatggacaa actaccacat atctgacata taatgacttc 2220

atcaacaagg aacttatctt gttctcaaat tctgataacg agagatctat cccttctatg 2280

gtggatggtt tgaaaccagg tcagagaaag gttttgttta cttgcttcaa acggaatgac 2340

aagcgagaag taaaggttgc ccaattagct ggatcagtgg ctgaaatgtc ttcttatcat 2400

catggtgaga tgtcactaat gatgaccatt atcaatttgg ctcagaattt tgtgggtagc 2460

aataatctaa acctcttgca gcccattggt cagtttggta ccaggctaca tggtggcaag 2520

gattctgcta gtccacgata catctttaca atgctcagct ctttggctcg attgttattt 2580

ccaccaaaag atgatcacac gttgaagttt ttatatgatg acaaccagcg tgttgagcct 2640

gaatggtaca ttcctattat tcccatggtg ctgataaatg gtgctgaagg aatcggtact 2700

gggtggtcct gcaaaatccc caactttgat gtgcgtgaaa ttgtaaataa catcaggcgt 2760

ttgatggatg gagaagaacc tttgccaatg cttccaagtt acaagaactt caagggtact 2820

attgaagaac tggctccaaa tcaatatgtg attagtggtg aagtagctat tcttaattct 2880

acaaccattg aaatctcaga gcttcccgtc agaacatgga cccagacata caaagaacaa 2940

gttctagaac ccatgttgaa tggcaccgag aagacacctc ctctcataac agactatagg 3000

gaataccata cagataccac tgtgaaattt gttgtgaaga tgactgaaga aaaactggca 3060

gaggcagaga gagttggact acacaaagtc ttcaaactcc aaactagtct cacatgcaac 3120

tctatggtgc tttttgacca cgtaggctgt ttaaagaaat atgacacggt gttggatatt 3180

ctaagagact tttttgaact cagacttaaa tattatggat taagaaaaga atggctccta 3240

ggaatgcttg gtgctgaatc tgctaaactg aataatcagg ctcgctttat cttagagaaa 3300

atagatggca aaataatcat tgaaaataag cctaagaaag aattaattaa agttctgatt 3360

cagaggggat atgattcgga tcctgtgaag gcctggaaag aagcccagca aaaggttcca 3420

gatgaagaag aaaatgaaga gagtgacaac gaaaaggaaa ctgaaaagag tgactccgta 3480

acagattctg gaccaacctt caactatctt cttgatatgc ccctttggta tttaaccaag 3540

gaaaagaaag atgaactctg caggctaaga aatgaaaaag aacaagagct ggacacatta 3600

aaaagaaaga gtccatcaga tttgtggaaa gaagacttgg ctacatttat tgaagaattg 3660

gaggctgttg aagccaagga aaaacaagat gaacaagtcg gacttcctgg gaaagggggg 3720

aaggccaagg ggaaaaaaac acaaatggct gaagttttgc cttctccgcg tggtcaaaga 3780

gtcattccac gaataaccat agaaatgaaa gcagaggcag aaaagaaaaa taaaaagaaa 3840

attaagaatg aaaatactga aggaagccct caagaagatg gtgtggaact agaaggccta 3900

aaacaaagat tagaaaagaa acagaaaaga gaaccaggta caaagacaaa gaaacaaact 3960

acattggcat ttaagccaat caaaaaagga aagaagagaa atccctggtc tgattcagaa 4020

tcagatagga gcagtgacga aagtaatttt gatgtccctc cacgagaaac agagccacgg 4080

agagcagcaa caaaaacaaa attcacaatg gatttggatt cagatgaaga tttctcagat 4140

tttgatgaaa aaactgatga tgaagatttt gtcccatcag atgctagtcc acctaagacc 4200

aaaacttccc caaaacttag taacaaagaa ctgaaaccac agaaaagtgt cgtgtcagac 4260

cttgaagctg atgatgttaa gggcagtgta ccactgtctt caagccctcc tgctacacat 4320

ttcccagatg aaactgaaat tacaaaccca gttcctaaaa agaatgtgac agtgaagaag 4380

acagcagcaa aaagtcagtc ttccacctcc actaccggtg ccaaaaaaag ggctgcccca 4440

aaaggaacta aaagggatcc agctttgaat tctggtgtct ctcaaaagcc tgatcctgcc 4500

aaaaccaaga atcgccgcaa aaggaagcca tccacttctg atgattctga ctctaatttt 4560

gagaaaattg tttcgaaagc agtcacaagc aagaaatcca agggggagag tgatgacttc 4620

catatggact ttgactcagc tgtggctcct cgggcaaaat ctgtacgggc aaagaaacct 4680

ataaagtacc tggaagagtc agatgaagat gatctgtttt aaaatgtgag gcgattattt 4740

taagtaatta tcttaccaag cccaagactg gttttaaagt tacctgaagc tcttaacttc 4800

ctcccctctg aatttagttt ggggaaggtg tttttagtac aagacatcaa agtgaagtaa 4860

agcccaagtg ttctttagct ttttataata ctgtctaaat agtgaccatc tcatgggcat 4920

tgttttcttc tctgctttgt ctgtgttttg agtctgcttt cttttgtctt taaaacctga 4980

tttttaagtt cttctgaact gtagaaatag ctatctgatc acttcagcgt aaagcagtgt 5040

gtttattaac catccactaa gctaaaacta gagcagtttg atttaaaagt gtcactcttc 5100

ctccttttct actttcagta gatatgagat agagcataat tatctgtttt atcttagttt 5160

tatacataat ttaccatcag atagaacttt atggttctag tacagatact ctactacact 5220

cagcctctta tgtgccaagt ttttctttaa gcaatgagaa attgctcatg ttcttcatct 5280

tctcaaatca tcagaggcca aagaaaaaca ctttggctgt gtctataact tgacacagtc 5340

aatagaatga agaaaattag agtagttatg tgattatttc agctcttgac ctgtcccctc 5400

tggctgcctc tgagtctgaa tctcccaaag agagaaacca atttctaaga ggactggatt 5460

gcagaagact cggggacaac atttgatcca agatcttaaa tgttatattg ataaccatgc 5520

tcagcaatga gctattagat tcattttggg aaatctccat aatttcaatt tgtaaacttt 5580

gttaagacct gtctacattg ttatatgtgt gtgacttgag taatgttatc aacgtttttg 5640

taaatattta ctatgttttt ctattagcta aattccaaca attttgtact ttaataaa 5698

<210>42

<211>1531

<212>PRT

<213>人

<400>42

Met Glu Val Ser Pro Leu Gln Pro Val Asn Glu Asn Met Gln Val Asn

1 5 10 15

Lys Ile Lys Lys Asn Glu Asp Ala Lys Lys Arg Leu Ser Val Glu Arg

20 25 30

Ile Tyr Gln Lys Lys Thr Gln Leu Glu His Ile Leu Leu Arg Pro Asp

35 40 45

Thr Tyr Ile Gly Ser Val Glu Leu Val Thr Gln Gln Met Trp Val Tyr

50 55 60

Asp Glu Asp Val Gly Ile Asn Tyr Arg Glu Val Thr Phe Val Pro Gly

65 70 75 80

Leu Tyr Lys Ile Phe Asp Glu Ile Leu Val Asn Ala Ala Asp Asn Lys

85 90 95

Gln Arg Asp Pro Lys Met Ser Cys Ile Arg Val Thr Ile Asp Pro Glu

100 105 110

Asn Asn Leu Ile Ser Ile Trp Asn Asn Gly Lys Gly Ile Pro Val Val

115 120 125

Glu His Lys Val Glu Lys Met Tyr Val Pro Ala Leu Ile Phe Gly Gln

130 135 140

Leu Leu Thr Ser Ser Asn Tyr Asp Asp Asp Glu Lys Lys Val Thr Gly

145 150 155 160

Gly Arg Asn Gly Tyr Gly Ala Lys Leu Cys Asn Ile Phe Ser Thr Lys

165 170 175

Phe Thr Val Glu Thr Ala Ser Arg Glu Tyr Lys Lys Met Phe Lys Gln

180 185 190

Thr Trp Met Asp Asn Met Gly Arg Ala Gly Glu Met Glu Leu Lys Pro

195 200 205

Phe Asn Gly Glu Asp Tyr Thr Cys Ile Thr Phe Gln Pro Asp Leu Ser

210 215 220

Lys Phe Lys Met Gln Ser Leu Asp Lys Asp Ile Val Ala Leu Met Val

225 230 235 240

Arg Arg Ala Tyr Asp Ile Ala Gly Ser Thr Lys Asp Val Lys Val Phe

245 250 255

Leu Asn Gly Asn Lys Leu Pro Val Lys Gly Phe Arg Ser Tyr Val Asp

260 265 270

Met Tyr Leu Lys Asp Lys Leu Asp Glu Thr Gly Asn Ser Leu Lys Val

275 280 285

Ile His Glu Gln Val Asn His Arg Trp Glu Val Cys Leu Thr Met Ser

290 295 300

Glu Lys Gly Phe Gln Gln Ile Ser Phe Val Asn Ser Ile Ala Thr Ser

305 310 315 320

Lys Gly Gly Arg His Val Asp Tyr Val Ala Asp Gln Ile Val Thr Lys

325 330 335

Leu Val Asp Val Val Lys Lys Lys Asn Lys Gly Gly Val Ala Val Lys

340 345 350

Ala His Gln Val Lys Asn His Met Trp Ile Phe Val Asn Ala Leu Ile

355 360 365

Glu Asn Pro Thr Phe Asp Ser Gln Thr Lys Glu Asn Met Thr Leu Gln

370 375 380

Pro Lys Ser Phe Gly Ser Thr Cys Gln Leu Ser Glu Lys Phe Ile Lys

385 390 395 400

Ala Ala Ile Gly Cys Gly Ile Val Glu Ser Ile Leu Asn Trp Val Lys

405 410 415

Phe Lys Ala Gln Val Gln Leu Asn Lys Lys Cys Ser Ala Val Lys His

420 425 430

Asn Arg Ile Lys Gly Ile Pro Lys Leu Asp Asp Ala Asn Asp Ala Gly

435 440 445

Gly Arg Asn Ser Thr Glu Cys Thr Leu Ile Leu Thr Glu Gly Asp Ser

450 455 460

Ala Lys Thr Leu Ala Val Ser Gly Leu Gly Val Val Gly Arg Asp Lys

465 470 475 480

Tyr Gly Val Phe Pro Leu Arg Gly Lys Ile Leu Asn Val Arg Glu Ala

485 490 495

Ser His Lys Gln Ile Met Glu Asn Ala Glu Ile Asn Asn Ile Ile Lys

500 505 510

Ile Val Gly Leu Gln Tyr Lys Lys Asn Tyr Glu Asp Glu Asp Ser Leu

515 520 525

Lys Thr Leu Arg Tyr Gly Lys Ile Met Ile Met Thr Asp Gln Asp Gln

530 535 540

Asp Gly Ser His Ile Lys Gly Leu Leu Ile Asn Phe Ile His His Asn

545 550 555 560

Trp Pro Ser Leu Leu Arg His Arg Phe Leu Glu Glu Phe Ile Thr Pro

565 570 575

Ile Val Lys Val Ser Lys Asn Lys Gln Glu Met Ala Phe Tyr Ser Leu

580 585 590

Pro Glu Phe Glu Glu Trp Lys Ser Ser Thr Pro Asn His Lys Lys Trp

595 600 605

Lys Val Lys Tyr Tyr Lys Gly Leu Gly Thr Ser Thr Ser Lys Glu Ala

610 615 620

Lys Glu Tyr Phe Ala Asp Met Lys Arg His Arg Ile Gln Phe Lys Tyr

625 630 635 640

Ser Gly Pro Glu Asp Asp Ala Ala Ile Ser Leu Ala Phe Ser Lys Lys

645 650 655

Gln Ile Asp Asp Arg Lys Glu Trp Leu Thr Asn Phe Met Glu Asp Arg

660 665 670

Arg Gln Arg Lys Leu Leu Gly Leu Pro Glu Asp Tyr Leu Tyr Gly Gln

675 680 685

Thr Thr Thr Tyr Leu Thr Tyr Asn Asp Phe Ile Asn Lys Glu Leu Ile

690 695 700

Leu Phe Ser Asn Ser Asp Asn Glu Arg Ser Ile Pro Ser Met Val Asp

705 710 715 720

Gly Leu Lys Pro Gly Gln Arg Lys Val Leu Phe Thr Cys Phe Lys Arg

725 730 735

Asn Asp Lys Arg Glu Val Lys Val Ala Gln Leu Ala Gly Ser Val Ala

740 745 750

Glu Met Ser Ser Tyr His His Gly Glu Met Ser Leu Met Met Thr Ile

755 760 765

Ile Asn Leu Ala Gln Asn Phe Val Gly Ser Asn Asn Leu Asn Leu Leu

770 775 780

Gln Pro Ile Gly Gln Phe Gly Thr Arg Leu His Gly Gly Lys Asp Ser

785 790 795 800

Ala Ser Pro Arg Tyr Ile Phe Thr Met Leu Ser Ser Leu Ala Arg Leu

805 810 815

Leu Phe Pro Pro Lys Asp Asp His Thr Leu Lys Phe Leu Tyr Asp Asp

820 825 830

Asn Gln Arg Val Glu Pro Glu Trp Tyr Ile Pro Ile Ile Pro Met Val

835 840 845

Leu Ile Asn Gly Ala Glu Gly Ile Gly Thr Gly Trp Ser Cys Lys Ile

850 855 860

Pro Asn Phe Asp Val Arg Glu Ile Val Asn Asn Ile Arg Arg Leu Met

865 870 875 880

Asp Gly Glu Glu Pro Leu Pro Met Leu Pro Ser Tyr Lys Asn Phe Lys

885 890 895

Gly Thr Ile Glu Glu Leu Ala Pro Asn Gln Tyr Val Ile Ser Gly Glu

900 905 910

Val Ala Ile Leu Asn Ser Thr Thr Ile Glu Ile Ser Glu Leu Pro Val

915 920 925

Arg Thr Trp Thr Gln Thr Tyr Lys Glu Gln Val Leu Glu Pro Met Leu

930 935 940

Asn Gly Thr Glu Lys Thr Pro Pro Leu Ile Thr Asp Tyr Arg Glu Tyr

945 950 955 960

His Thr Asp Thr Thr Val Lys Phe Val Val Lys Met Thr Glu Glu Lys

965 970 975

Leu Ala Glu Ala Glu Arg Val Gly Leu His Lys Val Phe Lys Leu Gln

980 985 990

Thr Ser Leu Thr Cys Asn Ser Met Val Leu Phe Asp His Val Gly Cys

995 1000 1005

Leu Lys Lys Tyr Asp Thr Val Leu Asp Ile Leu Arg Asp Phe Phe Glu

1010 1015 1020

Leu Arg Leu Lys Tyr Tyr Gly Leu Arg Lys Glu Trp Leu Leu Gly Met

1025 1030 1035 1040

Leu Gly Ala Glu Ser Ala Lys Leu Asn Asn Gln Ala Arg Phe Ile Leu

1045 1050 1055

Glu Lys Ile Asp Gly Lys Ile Ile Ile Glu Asn Lys Pro Lys Lys Glu

1060 1065 1070

Leu Ile Lys Val Leu Ile Gln Arg Gly Tyr Asp Ser Asp Pro Val Lys

1075 1080 1085

Ala Trp Lys Glu Ala Gln Gln Lys Val Pro Asp Glu Glu Glu Asn Glu

1090 1095 1100

Glu Ser Asp Asn Glu Lys Glu Thr Glu Lys Ser Asp Ser Val Thr Asp

1105 1110 1115 1120

Ser Gly Pro Thr Phe Asn Tyr Leu Leu Asp Met Pro Leu Trp Tyr Leu

1125 1130 1135

Thr Lys Glu Lys Lys Asp Glu Leu Cys Arg Leu Arg Asn Glu Lys Glu

1140 1145 1150

Gln Glu Leu Asp Thr Leu Lys Arg Lys Ser Pro Ser Asp Leu Trp Lys

1155 1160 1165

Glu Asp Leu Ala Thr Phe Ile Glu Glu Leu Glu Ala Val Glu Ala Lys

1170 1175 1180

Glu Lys Gln Asp Glu Gln Val Gly Leu Pro Gly Lys Gly Gly Lys Ala

1185 1190 1195 1200

Lys Gly Lys Lys Thr Gln Met Ala Glu Val Leu Pro Ser Pro Arg Gly

1205 1210 1215

Gln Arg Val Ile Pro Arg Ile Thr Ile Glu Met Lys Ala Glu Ala Glu

1220 1225 1230

Lys Lys Asn Lys Lys Lys Ile Lys Asn Glu Asn Thr Glu Gly Ser Pro

1235 1240 1245

Gln Glu Asp Gly Val Glu Leu Glu Gly Leu Lys Gln Arg Leu Glu Lys

1250 1255 1260

Lys Gln Lys Arg Glu Pro Gly Thr Lys Thr Lys Lys Gln Thr Thr Leu

1265 1270 1275 1280

Ala Phe Lys Pro Ile Lys Lys Gly Lys Lys Arg Asn Pro Trp Ser Asp

1285 1290 1295

Ser Glu Ser Asp Arg Ser Ser Asp Glu Ser Asn Phe Asp Val Pro Pro

1300 1305 1310

Arg Glu Thr Glu Pro Arg Arg Ala Ala Thr Lys Thr Lys Phe Thr Met

1315 1320 1325

Asp Leu Asp Ser Asp Glu Asp Phe Ser Asp Phe Asp Glu Lys Thr Asp

1330 1335 1340

Asp Glu Asp Phe Val Pro Ser Asp Ala Ser Pro Pro Lys Thr Lys Thr

1345 1350 1355 1360

Ser Pro Lys Leu Ser Asn Lys Glu Leu Lys Pro Gln Lys Ser Val Val

1365 1370 1375

Ser Asp Leu Glu Ala Asp Asp Val Lys Gly Ser Val Pro Leu Ser Ser

1380 1385 1390

Ser Pro Pro Ala Thr His Phe Pro Asp Glu Thr Glu Ile Thr Asn Pro

1395 1400 1405

Val Pro Lys Lys Asn Val Thr Val Lys Lys Thr Ala Ala Lys Ser Gln

1410 1415 1420

Ser Ser Thr Ser Thr Thr Gly Ala Lys Lys Arg Ala Ala Pro Lys Gly

1425 1430 1435 1440

Thr Lys Arg Asp Pro Ala Lau Asn Ser Gly Val Ser Gln Lys Pro Asp

1445 1450 1455

Pro Ala Lys Thr Lys Asn Arg Arg Lys Arg Lys Pro Ser Thr Ser Asp

1460 1465 1470

Asp Ser Asp Ser Asn Phe Glu Lys Ile Val Ser Lys Ala Val Thr Ser

1475 1480 1485

Lys Lys Ser Lys Gly Glu Ser Asp Asp Phe His Met Asp Phe Asp Ser

1490 1495 1500

Ala Val Ala Pro Arg Ala Lys Ser Val Arg Ala Lys Lys Pro Ile Lys

1505 1510 1515 1520

Tyr Leu Glu Glu Ser Asp Glu Asp Asp Leu Phe

1525 1530

<210>43

<211>4797

<212>DNA

<213>人

<400>43

gcagtgaaca caacctttcc cctgagccac tggaattgga cagaatgccc cattctcctc 60

tgatctccat tcctcatgtg tggtgtcacc cagaagagga ggaaagaatg catgatgaac 120

ttctacaagc agtatccaag gggccggtga tgttcaggga tgtttccata gacttctctc 180

aagaggaatg ggaatgcctg gacgctgatc agatgaattt atacaaagaa gtgatgttgg 240

agaatttcag caacctggtt tcagtgggac tttccaattc taagccagct gtgatctcct 300

tattggaaca aggaaaagag ccctggatgg ttgatagaga gctgactaga ggcctgtgtt 360

cagatctgga atcaatgtgt gagaccaaaa tattatctct aaagaagaga catttcagtc 420

aagtaataat tacccgtgaa gacatgtcta cttttattca gcccacattt cttattccac 480

ctcaaaaaac tatgagtgaa gagaaaccat gggaatgtaa gatatgtgga aagaccttta 540

atcaaaactc acaatttatc caacatcaga gaattcattt tggtgaaaaa cactatgaat 600

ctaaggagta tgggaagtcc tttagtcgtg gctcactcgt tactcgacat cagaggattc 660

acactggtaa aaaaccctat gaatgtaagg aatgtggcaa ggcttttagt tgtagttcat 720

atttttctca acatcagagg attcacactg gtgagaaacc ctatgaatgt aaggaatgtg 780

gaaaagcctt taagtattgc tcaaacctta atgatcatca gagaattcac actggtgaga 840

aaccctatga atgtaaagta tgtggaaaag cctttactaa aagttcacaa ctttttctac 900

atctgagaat tcatactggt gagaaacctt atgaatgtaa agaatgtggg aaagccttta 960

ctcaacactc aaggcttatt cagcatcaga gaatgcatac tggtgagaaa ccttatgaat 1020

gtaagcagtg tgggaaggcc tttaatagtg cctcaacact tactaaccat cacagaattc 1080

atgctggtga gaagctctat gaatgtgaag aatgtagaaa ggcctttatt cagagctcag 1140

aacttattca acatcagaga atccatacag atgaaaaacc atatgaatgt aatgaatgtg 1200

ggaaggcctt taataaaggc tcaaatctta ctcgacatca gagaattcac actggtgaga 1260

aaccctatga ctgtaaggaa tgtggaaagg cttttggtag tcgctctgac ctcattcgcc 1320

atgagggaat tcatactggt tgaatgacag taaagtaaga ccattttgtt aacctttata 1380

ataatttttt taaaacaggt aaggagaaca aattaggata catattatca aaggttctcc 1440

tatgtattcg tttttaaacg atacgataac aaagtaccaa gtaccaaaac cttggtggct 1500

taaaacaaga gaaatttatt ctctcatagt ttagagcctg gaaatctaaa ctcaagggtg 1560

ctgatcgttt tggttccttc tgaggactct gaggatctgt tctatgcctt tttcctaacc 1620

tctgttaaca gctggcagtc cttggcattc catggctttt acatacacca ttccaatctc 1680

tgcctccatc ttcacattgc attctcgctg tgtatctctg tgtatgtctt ttatttggac 1740

accagtcagg ttagattggg gctacctggt gacctcatct taacttgatt atatctgcca 1800

agaccctgtt tccaagtaag gtcacattta ccggtaccag gggttaggac ttcagcatat 1860

ctttttaggg gatacagttc aacccataat accctgttag aatgattttg tctaatatat 1920

ttgtaatttc cttttataca taagttgtta gtcaaattta ttttatttta ttttattttg 1980

agacagagtc tcgctctgtt gcccaggctg gagtgcagtg gtgtgatctc agctcactgc 2040

aacctccagc tcctgagttc aagcgattct tgtgcctcag cctctcaagt agttgggatt 2100

acaggcatgc gccaccatgc ccggctaatt tttttttttt tttttttgta tttttagtag 2160

cgacggggtt tcaccatgtt ggccaggctg gtcttgaact cctgacttca agtgatctgc 2220

ccgcctcagc ctcccaaagt gctgggatta cagacgtgag ccaccgtgat ggccaaaaca 2280

gactttatac caacaaaaat taaaaaggac aaagaaggtc atttataatg ataaaggata 2340

aattcaacaa gaagataaaa caatcctaaa tatgtatgca cccaacactg caacacccag 2400

atccataaca cagatactac tagacctaag aaaagagata gacagcaata caacaatagc 2460

aggggacttc accactccat tgacagcact agacagatca ctgggacaga aatcaacaaa 2520

gaaactctgg acttaaattg gactctacac caaatggacc caacagacat ctgaagaaca 2580

ttctacccaa caaccacaga atatatactc ttctcttctg tgcatggaac attctcaaaa 2640

ataggtcata tactggacca caaagcaagt atcaataaat tttaaaaaaa caaaatcata 2700

tctaacatct tctctgacca tagtggaata aaactagata tcaataccaa gaggaactct 2760

caaaacagat acatggaatt taaacagctt gctcctgaat gatttttgga tcaatgatga 2820

aactaaggtg gaaatttaaa attttttgaa ataaatgaaa atagagacaa aacacatgaa 2880

aacatctgag atacagcaaa agcagtgcta agagaggatt ttatagcatt aaatgcctac 2940

accaaaaaga tagaaaaatc tcaaatgaat agcctaacgt cacatctcaa ggaactagga 3000

aaaaacaaaa caaactcaac ccaaagctgg cagaagaaaa gcaataacaa atatcagagc 3060

aggcaaaaat gagactgaga acaaaggaat gcaaaagatc aataaaagaa aaagttggtt 3120

ctttgtaaag ataaaactga cagaccacta gctagattaa ccaagaaaaa aagaagattc 3180

aaataaatac aatcagaaat gataaggtga tattataact gataacacag acatataaaa 3240

tatcagcaga aactatatgc acatattaga aaacctagag gaagtggata aattcctaga 3300

aacacataac cttccaagat tgaaccaggg agaaatagga atcctcaaca gactactgag 3360

tattgaaatt gaatcagtaa tagaaaaaaa tcttgcaaaa acaaaaagcc caggaccaga 3420

cagattcaca gctgaattct actagacatg caaggaagaa ctagtaacag cactattgaa 3480

actattccaa aaattatagg agggaatcct ccctaactca ttctacaaag ccagtatcat 3540

cctgatactg aagccaggca aggataaaac acacaaaaaa actacaagcc aatatccctg 3600

atgaaaatag acacaaaaat cttcagcaaa atactagcaa accaaatcaa acagtacata 3660

aaaaagatag taacagcaca gtcaagtgga ttttattcct ggggtgtaag gatggctcaa 3720

catatgcaac tcaatacatg attcatcaca tacacagaat taaaaataag ccaggcactc 3780

acacctgtaa tcccagcact ttgcaaggcc aaggcgggca gatcacatga tgtcaagagt 3840

ttgagaccag tctggctgac atggcgaaac cctgtctcta ctaaaaatag aaaaattggc 3900

tgggcatggt ggcaggcact gtagtcccag ctacttggga ggctgaggca ggagaattac 3960

ttgaacctga gaagcggagg ttgcagtgag ctgagatagt gccattgcac tccagcctgg 4020

gcaacagagc aaattgcttg aatgtgggag gtggaggttg cagtgagccg agattatgcc 4080

attgcactcc agccggggga gcaacaaagc cagactccat ctcaaaaaaa aaccaaaaaa 4140

aatcctattt agtacaaggt acattattta ggtaatgagt ccattaaaag ccaacacttt 4200

ccccactaca ctatatgtgt atgtaacaca actgcccttg taacttccta aacctataat 4260

taagaaacaa taaaaggcaa attaagaatg cttttttaaa aggtgggggc attatgctaa 4320

taagttactg tggatttcag agtgcagagt agaaagatca caagaattta gtgtggtagg 4380

tgggaacaga aaatgggtgt ataaatttta ttgacgtggg agtactggat attgtagaga 4440

cagatatcat cagggcaagg agattaaaga tttttgcatt gacggtttga cactatattg 4500

tggtaataac actgtatgtg ttgggagata gaacaggaaa catcttccct ggaatatgta 4560

tactattaaa tgttttatca aacttttgat caaacaagac agcacaattt ataatttcat 4620

ttctatttct atgttatgag aaactgatca tttattcaaa tgtttaacag gcatgttcat 4680

gttactataa actcttctgt ttctccatca cgttgttggt catctttact gattacaaat 4740

ttctttacat atttaagaaa tatatatatt tctttatata ttaaaaaaaa aaaaaaa 4797

<210>44

<211>432

<212>PRT

<213>人

<400>44

Met Pro His Ser Pro Leu Ile Ser Ile Pro His Val Trp Cys His Pro

1 5 10 15

Glu Glu Glu Glu Arg Met His Asp Glu Leu Leu Gln Ala Val Ser Lys

20 25 30

Gly Pro Val Met Phe Arg Asp Val Ser Ile Asp Phe Ser Gln Glu Glu

35 40 45

Trp Glu Cys Leu Asp Ala Asp Gln Met Asn Leu Tyr Lys Glu Val Met

50 55 60

Leu Glu Asn Phe Ser Asn Leu Val Ser Val Gly Leu Ser Asn Ser Lys

65 70 75 80

Pro Ala Val Ile Ser Leu Leu Glu Gln Gly Lys Glu Pro Trp Met Val

85 90 95

Asp Arg Glu Leu Thr Arg Gly Leu Cys Ser Asp Leu Glu Ser Met Cys

100 105 110

Glu Thr Lys Ile Leu Ser Leu Lys Lys Arg His Phe Ser Gln Val Ile

115 120 125

Ile Thr Arg Glu Asp Met Ser Thr Phe Ile Gln Pro Thr Phe Leu Ile

130 135 140

Pro Pro Gln Lys Thr Met Ser Glu Glu Lys Pro Trp Glu Cys Lys Ile

145 150 155 160

Cys Gly Lys Thr Phe Asn Gln Asn Ser Gln Phe Ile Gln His Gln Arg

165 170 175

Ile His Phe Gly Glu Lys His Tyr Glu Ser Lys Glu Tyr Gly Lys Ser

180 185 190

Phe Ser Arg Gly Ser Leu Val Thr Arg His Gln Arg Ile His Thr Gly

195 200 205

Lys Lys Pro Tyr Glu Cys Lys Glu Cys Gly Lys Ala Phe Ser Cys Ser

210 215 220

Ser Tyr Phe Ser Gln His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr

225 230 235 240

Glu Cys Lys Glu Cys Gly Lys Ala Phe Lys Tyr Cys Ser Asn Leu Asn

245 250 255

Asp His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Lys Val

260 265 270

Cys Gly Lys Ala Phe Thr Lys Ser Ser Gln Leu Phe Leu His Leu Arg

275 280 285

Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Lys Glu Cys Gly Lys Ala

290 295 300

Phe Thr Gln His Ser Arg Leu Ile Gln His Gln Arg Met His Thr Gly

305 310 315 320

Glu Lys Pro Tyr Glu Cys Lys Gln Cys Gly Lys Ala Phe Asn Ser Ala

325 330 335

Ser Thr Leu Thr Asn His His Arg Ile His Ala Gly Glu Lys Leu Tyr

340 345 350

Glu Cys Glu Glu Cys Arg Lys Ala Phe Ile Gln Ser Ser Glu Leu Ile

355 360 365

Gln His Gln Arg Ile His Thr Asp Glu Lys Pro Tyr Glu Cys Asn Glu

370 375 380

Cys Gly Lys Ala Phe Asn Lys Gly Ser Asn Leu Thr Arg His Gln Arg

385 390 395 400

Ile His Thr Gly Glu Lys Pro Tyr Asp Cys Lys Glu Cys Gly Lys Ala

405 410 415

Phe Gly Ser Arg Ser Asp Leu Ile Arg His Glu Gly Ile His Thr Gly

420 425 430

Claims

1.一种评估是否患者患子宫颈癌或具有癌变前状态的方法，所述方法包含比较：

a)患者样本中标记物的表达水平，其中所述标记物选自列于表1的标记物，和

b)在正常对照组子宫颈癌样本中所述标记物的表达水平，

其中在患者样本中所述标记物的表达水平和正常水平之间的明显差异表明患者患子宫颈癌或具有癌变前状态。

2.权利要求1的方法，其中所述患者具有CIN或SIL。

3.权利要求1的方法，其中所述标记物相应于分泌蛋白。

4.权利要求1的方法，其中所述标记物相应于转录的多核苷酸或其部分，其中所述多核苷酸包含所述标记物。

5.权利要求1的方法，其中所述样本包含获得自患者的细胞。

6.权利要求5的方法，其中所述样本是子宫颈涂片。

7.权利要求5的方法，其中所述细胞位于液体中，所述液体选自：通过腹膜冲洗收集的液体，通过子宫冲洗收集的液体，子宫液，子宫渗出液，胸膜液，胆囊液和子宫颈渗出液(exudate)。

8.权利要求1的方法，其中通过检测样本中相应于标记物的蛋白的存在评估样本中标记物的表达水平。

9.权利要求8的方法，其中使用与蛋白特异性结合的试剂检测蛋白的存在。

10.权利要求9的方法，其中所述试剂选自：抗体，抗体衍生物和抗体片段。

11.权利要求1的方法，其中通过检测样本中转录的多核苷酸或其部分的存在评估样本中标记物的表达水平，其中所述转录多核苷酸包含所述标记物。

12.权利要求11的方法，其中所述转录的多核苷酸是mRNA。

13.权利要求11的方法，其中所述转录的多核苷酸是cDNA。

14.权利要求11的方法，其中检测步骤进一步包含扩增转录的多核苷酸。

15.权利要求1的方法，其中通过检测样本中转录的多核苷酸的存在评估样本中所述标记物的表达水平，在严谨杂交条件下，转录的多核苷酸与标记物或多核苷酸的部分退火，其中所述多核苷酸包含物标记物。

16.权利要求1的方法，其中样本中所述标记物的表达水平与不患有子宫颈癌患者中所述标记物的正常表达水平相差至少约2倍。

17.权利要求1的方法，其中样本中所述标记物的表达水平与不患有子宫颈癌患者中所述标记物的正常表达水平相差至少约5倍。

18.权利要求的方法1，包含比较：

a)样本中多种(plurality)标记物的每一个标记物的表达水平，所述标记物独立地选自列于表1的标记物，和

b)获得自正常对照组人子宫颈样本的同类型多种标记物的每一个标记物的表达水平，

其中相对于相应的标记物正常表达水平，超过一个标记物的表达水平明显改变，表明患者患子宫颈癌或具癌变前状态。

19.权利要求18的方法，其中相对于相应的标记物正常表达水平，每一个标记物的表达水平明显改变，表明患者患子宫颈癌。

20.权利要求18的方法，其中所述多种标记物包含至少3个标记物。

21.权利要求18的方法，其中所述多种标记物包含至少5个标记物。

22.一种用于检测患者中子宫颈癌或癌变前状态的进展的方法，所述方法包含：

a)在第一时间点检测患者样本中标记物的表达，其中所述标记物选自列于表1的标记物；

b)在随后的时间点按时重复步骤a)；和

c)比较步骤a)和b)中检测到的表达水平，以及由此监测患者中子宫颈癌或癌变前状态的进展。

23.权利要求22的方法，其中所述标记物相应于分泌蛋白。

24.权利要求22的方法，其中所述标记物相应于转录的多核苷酸或其部分，其中所述多核苷酸包含所述标记物。

25.权利要求22的方法，其中所述样本包含获得自患者的细胞。

26.权利要求25的方法，其中所述患者样本是子宫颈涂片。

27.权利要求22的方法，其中在第一时间点和随后时间点之间，患者进行外科手术摘除肿瘤。

28.一种评估用于抑制患者子宫颈癌的受试化合物的效力的方法，所述方法包含比较：

a)获得自患者并暴露于受试化合物的第一样本中标记物的表达，其中所述标记物选自列于表1的标记物，和

b)获得自患者的第二样本中所述标记物的表达，其中所述样本不暴露于受试化合物，

其中相对于第二样本，第一样本中标记物明显更低的表达水平表明所述受试化合物对于抑制患者的子宫颈癌是有效的。

29.权利要求28的方法，其中所述第一和第二样本是获得自患者的一次抽样样本的部分。

30.权利要求28的方法，其中所述第一和第二样本是获得自患者的混合样本的部分。

31.一种评估用于抑制患者子宫颈癌的治疗的有效性的方法，所述方法包含比较：

a)在提供给患者至少部分治疗前获得自患者的第一样本中标记物的表达，其中所述标记物选自列于表1的标记物，和

b)在提供部分治疗后获得自患者的第二样本中标记物的表达，

其中相对于第一样本，第二样本中标记物明显更低的表达水平表明所述用于抑制患者子宫颈癌的治疗是有效的。

32.一种选择用于抑制患者子宫颈癌的组合物的方法，所述方法包含：

a)从患者处获得包含癌细胞的样本；

b)将样本的等分试样分别暴露于存在多种测试组合物的条件下；

c)比较每个等分试样中标记物的表达，其中所述标记物选自列于表1的标记物；和

d)相对于其它测试组合物，选择一种能导致含有所述测试组合物的等分试样中标记物明显更低的表达水平的测试组合物。

33.一种抑制患者子宫颈癌的方法，所述方法包含：

a)从患者处获得包含癌细胞的样本；

b)将样本的等分试样分别保持在存在多种测试组合物的条件下；

d)相对于其它测试组合物，给予患者至少一种能导致含有所述测试组合物的等分试样中标记物明显更低的表达水平的测试组合物。

34.一种用于评估是否患者患子宫颈癌或具癌变前状态的试剂盒，所述试剂盒包含用于评估标记物表达的试剂，所述标记物选自列于表1的标记物。

35.一种用于评估子宫颈癌细胞或癌变前子宫颈细胞或病变存在的试剂盒，所述试剂盒包含核酸探针，其中所述探针与相应于标记物的转录的多核苷酸特异性结合，所述标记物选自列于表1的标记物。

36.一种用于评估用于抑制患者子宫颈癌的多种化合物的每一种化合物的适用性的试剂盒，所述试剂盒包含：

a)多种化合物；和

b)用于评估标记物表达的试剂，所述标记物选自列于表1的标记物。

37.一种用于评估人子宫颈癌细胞或癌变前子宫颈细胞或病变存在的试剂盒，所述试剂盒包含抗体，其中所述抗体与相应于标记物的蛋白特异性结合，所述标记物选自列于表1的标记物。

38.一种评估受试化合物子宫颈细胞致癌潜力的方法，所述方法包含：

a)将子宫颈细胞的等分试样分别保持在存在和不存在所述受试化合物的条件下；和

b)比较每一个等分试样中标记物的表达，其中所述标记物选自列于表1的标记物，

其中相对于在不存在所述受试化合物的条件下所保持的等分试样，在存在所述受试化合物的条件下所保持的等分试样中的标记物明显增加的表达水平表明所述受试化合物具有人子宫颈细胞致癌潜力。

39.一种用于评估受试化合物子宫颈细胞致癌潜力的试剂盒，所述试剂盒包含子宫颈细胞和用于评估标记物表达的试剂，其中所述标记物选自列于表1的标记物。

40.一种治疗患有子宫颈癌的患者的方法，所述方法包含向患者细胞提供一种与相应于一种标记物的多核苷酸互补的反义寡核苷酸，所述标记物选自列于表1的标记物。

41.一种在处于子宫颈癌发展的危险中的患者中抑制子宫颈癌的方法，所述方法包含抑制基因的表达，所述基因相应于一种标记物，所述标记物选自列于表1的标记物。

42.一种分离的核酸分子，其包含一种核苷酸序列，所述核苷酸序列选自表2和3中所列的核苷酸序列。

43.一种载体，其含有权利要求42的核酸分子。

44.一种宿主细胞，其含有权利要求42的核酸分子。

45.一种分离的多肽，其由一种核酸分子编码，所述核酸分子包含一种核苷酸序列，所述核苷酸序列选自SEQ ID NOs：1，7，9，11，17，19，21，23，25，27，33和43的核苷酸序列。

46.一种抗体，其选择性结合权利要求45的多肽。

47.一种分离的多肽，其包含一种氨基酸序列，所述氨基酸序列选自SEQ ID NOs：2，8，10，20，22，26，28和44的氨基酸序列。

48.一种抗体，其选择性结合权利要求47的多肽。