CN101044247A - 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法 - Google Patents

用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法 Download PDF

Info

Publication number
CN101044247A
CN101044247A CNA03824456XA CN03824456A CN101044247A CN 101044247 A CN101044247 A CN 101044247A CN A03824456X A CNA03824456X A CN A03824456XA CN 03824456 A CN03824456 A CN 03824456A CN 101044247 A CN101044247 A CN 101044247A
Authority
CN
China
Prior art keywords
marker
patient
sample
cervical cancer
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA03824456XA
Other languages
English (en)
Other versions
CN101044247B (zh
Inventor
J·E·莫纳汉
X·赵
Y·陈
K·格拉特
S·卡马特卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
THOUSAND YEARS MEDICAMENTS Inc
Millennium Pharmaceuticals Inc
Original Assignee
THOUSAND YEARS MEDICAMENTS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by THOUSAND YEARS MEDICAMENTS Inc filed Critical THOUSAND YEARS MEDICAMENTS Inc
Publication of CN101044247A publication Critical patent/CN101044247A/zh
Application granted granted Critical
Publication of CN101044247B publication Critical patent/CN101044247B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5011Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing antineoplastic activity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57411Specifically defined cancers of cervix
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/56Staging of a disease; Further complications associated with the disease

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Toxicology (AREA)
  • General Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)

Abstract

本发明涉及与子宫颈癌包括癌变前状态如发育异常相关的核酸分子和蛋白。也提供了用于检测,鉴定,预防和治疗人子宫颈癌的组合物,试剂盒及方法。

Description

用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法
相关申请
本申请要求2002年8月20日递交的美国临时专利申请系列号60/404,770的优先权,其明确地并入作为参考。
发明领域
本发明的领域是子宫颈癌,包括子宫颈癌的诊断、鉴定、处理和治疗。
发明背景
在美国以及甚至在世界范围内报告的癌症病例增加的数量都备受关注。当前对于特定类型癌症仅有少数几种治疗方法有效,并且无法提供绝对成功的保证。为使疗效最好,这些治疗方法不仅需要对恶性肿瘤早期检测,还需要对恶性肿瘤的严重程度进行可靠的评估。
子宫颈癌是妇女最常见的恶性肿瘤之一,并且在世界范围内仍然是一个重要的公众健康问题。仅在美国,扩散性子宫颈癌大约占所有妇产科癌症的19%。在1996年,估计有14,700个新诊断的病例和4900人因该疾病死亡(American Cancer Society,Cancer Facts & Figures1996,Atlanta,Ga.:American Cancer Society,1996)。在许多发展中国家,大规模普查计划无法广泛进行,临床问题更为严重。在世界范围内,新病例数量估计达471,000,且四年生存率仅有40%(Munoz等.,1989,Epidemiology of CervicalCancer In:“HumanPapillomavirus”,New York,Oxford Press,pp 9-39;National Institutesof Health,Consensus Development Conference Statement on CervicalCancer,Apr.1-3,1996)。
鉴于如此,当及早检测到扩散前病变时,子宫颈癌仍然是一种可以很好预防的癌症类型。当前,脱落细胞染色的(Papanicolaou-stained)子宫颈涂片(也称为巴氏涂片或巴氏试验)的细胞学检查是用于检测子宫颈癌的主要方法,并且是迄今为止所发展的最具性价比的癌症筛选试验方法(Greenberg,M.D等.,1995,Clin Obstet Gynecol38(3):600-609)。引人注目的是因为该方法的提出,在美国及世界上许多其它国家中子宫颈癌的发病率和死亡率减少了超过70%。(EddyD.M.,1990,Ann.Intern.Med.113(3):214-226)。Bethesda系统描绘了巴氏试验的异常形态改变,该系统包括ASCUS(未确定意义的非典型鳞状细胞)、AGUS(未确定意义的非典型腺细胞)、LSIL(低度鳞状上皮内病变)、HSIL(高度鳞状上皮内病变)和鳞状细胞癌及腺癌(National Cancer Institute Workshop:The 1988 Bethesda Systemfor reporting cervical/vaginal cytologic diagnosis.JAMA,262(7):931-934)。巴氏试验的成就最主要归因于对癌前病变的诊断和治疗。
当前,对具有HSIL和更重疾病患者的处理是相对标准化的。大多数具有上述病变的妇女经历了阴道镜检查和合适定向的活组织检查。如果组织学诊断确诊,可进行消融或切除治疗如环形电切术(LEEP)、冷冻手术或锥形切除术。然而,对于不确定或低度细胞学结果(ASCUS和LSIL)的处理争论很大。主要是因为基于形态学检验的特性,其不可避免地导致观测者之间的差异性以及巴氏试验与后续的组织学结果的不一致。据报道初步巴氏试验的平均灵敏度大约为58%,重复试验的准确度仅有约66%(Fahey M.T.,等.,1995,Am.J.Epidemiol.141:680-689)。低灵敏度和不佳的再现性使得对ASCUS和LSIL患者的处理复杂化。如果在妇女初步诊断为ASCUS和LSIL后推荐使用“加速重复巴氏试验”,患者将冒延误诊为潜在的高度病变的危险。但是,如果这些患者普遍地使用阴道镜检查,大多数妇女可结束治疗。在阴道镜检查中只有5-10%具有ASCUS的妇女具有高度病变,且超过80%的LSIL将消退为正常或继续保持它们目前的状态(Cox,J.T.,2000,Clinics in Laboratory Medicine.20(2):303-343,Ostor A.G.,1993,Int.J.Gynecol.Pathol.12(2)186-192)。
AGUS代表了较ASCUS或LSIL更大的危险,因为对于该情形细胞学检查灵敏度低且疾病进展更快(Anderson M.C.,1995,BaillieresClin.Obstet.Gynecol.9:105)。发现9-54%具有AGUS的妇女经活组织检查证实具有子宫颈上皮内瘤样变,0-8%的妇女经活组织检查证实患有原位腺癌(AIS),以及小于1-9%的妇女患有扩散性癌(Wright,T.C.,等.,2002,JAMA,287(16):2120-2129)。由于此巨大危险,所有具有AGUS的患者应使用阴道镜检查(Wright,T.C.,等,2002)。
通过使用测定发育异常细胞的存在和严重程度的客观标记物可减少子宫颈细胞学检查的主观性。因为高危人乳头状病毒(HPV)感染与子宫颈癌的发展密切相关(Walboomers,J.M.,等.,1999,J.Pathol.189:12-19),所以使用类似于Hybrid Capture II(Digene Diagnostics,Silver Spring,MD)或PCR的HPV测试方法似乎提供了一种客观量度(Wick,M.J.,2000,Clinics in Laboratory Medicine,20(2):271-287)。但是,因为特别是在年轻妇女中大多数HPV感染和所产生的鳞状上皮内病变可自发消退,HPV检测无法特异地鉴定其病变持续或发展为扩散性癌的患者(Sasieni,P.D.,2000,J.Am.Med.Womens Assoc.55(4):216-219,Sasieni,P.D.,2000,Br.J.Cancer,83(5):561-565)。在ASCUS-LSIL治疗类选法研究(Triage Study)(ALTS)的报道中,对于高危HPV类型,83%具有LSIL的妇女巴氏试验结果是阳性,该水平太高以至无法在治疗类选法中使用(Humanpapillomavirus testing for triage of women with cytologic evidence oflow-grade squamous intraepithelial lesions:baseline data from arandomized trial.The Atypical Squamous Cells of UndeterminedSignificance/Low-Grade Squamous Intraepithelial Lesions Triage Study(ALTS)Group,2000,J.Natl.Cancer Ist.92:397-402)。虽然对于检测具有ASCUS的妇女中HSIL的巴氏试验结果,使用HPV检测的治疗类选法明显改善了灵敏度,但是特异性与使用常规细胞学检查相当(Solomon,D.,等.,2001,J.Natl.Cancer Inst.93(4):293-299)。在巴氏试验中,更理想的子宫颈筛选标记可鉴定所有的子宫颈癌,大多数HSIL以及在具有LSIL和ASCUS的患者中小百分比的真正的初期癌。
现在通常认为子宫颈致癌作用以一种分步方式发生(Ried,T.,等.,1999,Genes Chromosomes Cancer,25(3):195-204)。正常的上皮细胞转变为瘤前病变和扩散性癌是相继发生的。形态学上定义的发育异常和恶性畸形步骤是肿瘤遗传过程中细胞基因改变的反映。因此,需要提供用于鉴定、评估、预防和治疗子宫颈癌的生物标记物。
发明简述
本发明涉及癌标记物(在下文中“标记物”或“本发明的标记物”),其列于表1中。本发明提供了编码或相应于标记物的核酸和蛋白(在下文中分别为“标记物核酸”的“标记物蛋白”)。表1提供了标记物核酸和蛋白序列的序列号,列于附带的序列表中(SEQ ID NOs:1-44)。表2列出了新鉴定的核苷酸和氨基酸序列。表3列出了新鉴定的核苷酸序列。表1-3提供了一些所述标记物核酸和蛋白序列的序列号,列于附带的序列表中,和标记物的基因名称。本发明进一步提供了与所述蛋白和/或该蛋白片段特异结合的抗体、抗体衍生物和抗体片段。
本发明也涉及用于诊断、疾病分期、预测、监测和治疗子宫颈癌的各种方法、试剂和试剂盒。在本文中使用的“子宫颈癌”包括癌(如,原位癌、扩散性癌、转移癌)和癌前状态(如,发育异常,包括CIN或SIL)。在一个实施方案中,本发明提供了一种评估是否患者患子宫颈癌或对于发展为子宫颈癌具有较正常更高的危险的诊断方法,包含步骤如下:比较患者样本中本发明标记物的表达水平和对照,如来自不患子宫颈癌的患者中所述标记物的正常表达水平。与正常水平比较,患者样本中所述标记物的表达水平明显提高表明所述患者患子宫颈癌或对于发展为子宫颈癌具有较正常更高的危险。
根据本发明的内容,所述标记物选自根据本发明方法的阳性预测值为至少约10%,优选约25%,更优选约50%以及最优选约90%的标记物。在至少约20%,更优选约50%以及最优选约75%的任一如下状态中:病期0子宫颈癌患者,病期I子宫颈癌患者,病期II子宫颈癌患者,病期III子宫颈癌患者,病期IV子宫颈癌患者,I级子宫颈癌患者,II级子宫颈癌患者,III级子宫颈癌患者,鳞状上皮细胞(表皮样的)子宫颈癌患者,子宫颈腺癌患者,子宫颈腺鳞癌患者,小细胞子宫颈癌患者,恶性子宫颈癌患者,原发性子宫颈瘤患者,原发性恶性子宫颈淋巴瘤患者和继发性恶性子宫颈淋巴瘤患者,以及所有与子宫颈相关的其它类型癌、恶性肿瘤和转化,也优选用于本发明方法的标记物与正常子宫颈细胞相比具有至少两倍的差异表达。
在一个实施方案中,本发明提供了一种评估是否患者患子宫颈癌的诊断方法(如,新的检测(“筛选”),复发的检测,反射测定),所述方法包含比较:
a)患者样本中本发明标记物的表达水平,和
b)对照的非子宫颈癌样本中所述标记物的正常表达水平。
与正常水平比较,患者样本中标记物明显更高的表达水平表明该患者患子宫颈癌。
在另一个实施方案中,本发明提供了一种评估是否患者患子宫颈癌的诊断方法(如,新的检测(“筛选”),复发的检测,反射测定),所述方法包含比较:
a)患者样本中本发明的标记物组的表达水平,和
b)对照的非子宫颈癌样本中所述标记物组的正常表达水平。
与正常水平比较,患者样本中标记物组明显更高的表达水平表明该患者患子宫颈癌。
本发明也提供了用于评估用于抑制患者子宫颈癌的治疗的有效性的诊断方法。所述方法包含比较:
a)在提供给患者至少部分治疗前获得自该患者的第一样本中本发明标记物的表达,和
b)在提供部分治疗后获得自该患者的第二样本中所述标记物的表达。
相对于第一样本,第二样本中标记物明显更低的表达水平表明所述用于抑制患者子宫颈癌的疗法是有效的。
可以理解的是在这些方法中,所述“疗法”可以是任何用于治疗子宫颈癌的疗法包括,但不限于,化学疗法、放射疗法、肿瘤组织的外科手术切除、基因治疗和生物学疗法如给予抗体及化学增活素。因此,本发明的方法可用于评估治疗前、治疗中和治疗后的患者,例如,用于评估肿瘤负荷的减轻。
在一个优选实施方案中,所述诊断方法用于指导使用化学或生物试剂的治疗。这些方法包含比较:
a)获得自患者并保持在存在化学或生物试剂条件下的第一样本中本发明标记物的表达,和
b)获得自患者并保持在不存在所述试剂条件下的第二样本中所述标记物的表达。
相对于第一样本,第二样本中标记物明显更低的表达水平表明所述试剂能有效用于抑制患者子宫颈癌。在一个实施方案中,所述第一和第二样本可以是获得自患者一次抽样样本的部分或是获得自患者混合样本的部分。
本发明另外提供了一种用于评估患者子宫颈癌进展的监测方法,所述方法包含:
a)在第一时间点检测患者样本中本发明标记物的表达;
b)在随后的时间点按时重复步骤a);和
c)比较步骤a)和b)中检测到的表达水平,以及由此监测患者中子宫颈癌的进展。
较在第一时间点样本中标记物的表达水平,在随后时间点样本中标记物明显更高的表达水平表明子宫颈癌有进展,但是明显更低的表达水平则表明子宫颈癌有退化。
本发明进一步提供了一种用于确定是否子宫颈癌有转移或在未来可能转移的诊断方法,所述方法包含比较:
a)患者样本中本发明标记物的表达水平,和
b)对照样本中所述标记物体的正常表达水平(或非转移水平)。
与正常水平(或非转移水平)比较,患者样本中明显更高的表达水平表明子宫颈癌有转移或在未来可能转移。
此外,本发明提供了一种用于选择用于抑制患者子宫颈癌的组合物的测试方法。所述方法包含如下步骤:
a)从患者处获得包含癌细胞的样本;
b)将所述样本的等分试样分别保持在存在多种测试组合物的条件下;
c)比较每个等分试样中本发明标记物的表达;和
d)相对于在存在其它测试组合物条件下的所述标记物表达水平,选择一种能明显减低含有所述测试组合物的等分试样中所述标记物表达水平的测试组合物。
另外,本发明提供了一种评估化合物子宫颈致癌作用潜力的测试方法。所述方法包含如下步骤:
a)将子宫颈细胞的等分试样分别保持在存在和不存在所述化合物的条件下;和
b)比较每一个等分试样中本发明标记物的表达。
相对于在不存在所述化合物的条件下所保持的等分试样,在存在所述化合物的条件下所保持的等分试样中所述标记物明显更高的表达水平表明所述化合物具有子宫颈致癌潜力。
另外,本发明进一步提供了一种抑制患者子宫颈癌的方法。所述方法包含如下步骤:
a)从患者处获得包含癌细胞的样本;
b)将所述样本的等分试样分别保持在存在多种组合物的条件下;
c)比较每个等分试样中本发明标记物的表达;和
d)相对于在存在其它组合物的条件下所述标记物的表达水平,给予患者至少一种能明显减低在含有所述组合物的等分试样中所述标记物表达水平的组合物。
在前述方法中,所述样本或患者样本包含获得自患者的细胞。所述细胞可在收集的子宫颈涂片中发现,例如,通过子宫颈刷收集。在另一个实施方案中,所述样本是体液。所述液体包括,例如,血液、淋巴液、腹水、妇科分泌液、尿液和通过阴道冲洗收集的液体。在更进一步实施方案中,所述患者样本是体内样本。
根据本发明内容,可评估样本中本发明标记物的表达水平,例如,通过检测样本中如下物质的存在:
·相应的标记物蛋白(如,具有在表1中列为“SEQ ID NO(AAs)”序列之一的蛋白),或所述蛋白片段(如,通过使用一种试剂,如一种抗体、抗体衍生物、抗体片段或单链抗体,其与所述蛋白或蛋白片段特异性结合)
·相应的标记物核酸(如,具有在表1中列为“SEQ ID NO(nts)”的核酸序列之一的核苷酸转录产物,或其互补物),或所述核酸片段(如,通过将获得自样本的转录的多核苷酸与其上附着有一或多个核酸的底物接触,所述核酸具有SEQ ID NO(nts)任一核酸序列的全部或片段,或其互补物)
·一种代谢物,其直接(即,催化)或间接产生自相应的标记物蛋白。
根据本发明内容,通过使用多种(如,2、3、5或10或更多)子宫颈癌标记物,包括本领域已知的子宫颈癌标记物,执行任一前述方法。在所述方法中,将样本中多种标记物的每一种标记物的表达水平与获得自对照的不患子宫颈癌的人样本中同类型多种标记物的每一种标记物的正常表达水平比较,多种标记物中至少一种标记物是本发明的标记物。相对于标记物的相应正常或对照水平,样本中一或多种本发明标记物或它们某些组合的表达水平明显改变(即,在上述使用单标记物的方法中所规定的增加或减少),表明患者患子宫颈癌。对于所有前述方法,优选那些所述方法的阳性预测值为至少约10%的标记物。
在另一方面,本发明提供了一种抗体、抗体衍生物或抗体片段,其与标记物蛋白(如,具有列于序列表中氨基酸序列之一的蛋白)或所述蛋白片段特异性结合。本发明也提供了用于制造上述抗体、抗体衍生物和抗体片段的方法。上述方法可包含用含有标记物蛋白(如,具有列于序列表中氨基酸序列之一的蛋白)的全部,或具有10或更多个氨基酸的片段免疫哺乳动物,其中所述蛋白或肽可获得自细胞或通过化学合成获得。本发明的方法也包含生产单克隆和单链抗体,其中可进一步包含从免疫的哺乳动物中分离脾细胞,将分离的脾细胞与无限增殖化细胞系融合以形成杂交瘤,以及筛选那些能产生特异性结合标记物蛋白或所述蛋白片段的抗体的特殊杂交瘤。
在另一方面,本发明涉及各种诊断和化验试剂盒。在一个实施方案中,本发明提供一种用于评估是否患者患子宫颈癌的试剂盒。所述试剂盒包含一种用于评估本发明标记物表达的试剂。在另一个实施方案中,本发明提供了一种用于评估用于抑制患者子宫颈癌的化学或生物试剂适用性的试剂盒。所述试剂盒包含一种用于评估本发明标记物表达的试剂,和可还包含一或多种上述试剂。在更进一步实施方案中,本发明提供了用于评估子宫颈癌细胞存在或治疗子宫颈癌的试剂盒。所述试剂盒包含一种抗体、抗体衍生物或抗体片段,其特异性结合标记物蛋白或所述蛋白片段。所述试剂盒也可包含多种抗体、抗体衍生物或抗体片段,其中所述多种所述抗体试剂特异性结合标记物蛋白或所述蛋白片段。
在另外一个实施方案中,本发明也提供了一种用于评估子宫颈癌细胞存在的试剂盒,其中所述试剂盒包含一种核酸探针,其特异性结合标记物核酸或所述核酸片段。所述试剂盒也可包含多种探针,其中每个探针特异性结合标记物核酸或所述核酸片段。
在另一方面,本发明涉及用于治疗患子宫颈癌或处于发展为子宫颈癌危险的患者的方法。上述方法可包含减少本发明标记物表达和/或干扰其生物学功能。在一个实施方案中,所述方法包含提供给患者一种标记物核酸或其片段的反义寡核苷酸或互补多核苷酸。例如,通过载体递送提供给患者一种反义多核苷酸,所述载体表达标记物核酸或其片段的反义多核苷酸。在另一个实施方案中,所述方法包含提供给患者一种抗体、抗体衍生物或抗体片段,其特异性结合标记物蛋白或所述蛋白片段。在一个优选实施方案中,所述抗体、抗体衍生物或抗体片段特异性结合具有列于序列表中氨基酸序列之一的蛋白或所述蛋白片段。
可以理解的是本发明的方法和试剂盒也可包括已知的癌标记物,包括已知的子宫颈癌标记物。可更进一步理解所述方法和试剂盒可用于鉴定除子宫颈癌之外的其它癌症。
附图简要说明
图1描述了子宫颈组织样本的簇状图表。通过34个正常、LSIL、HSIL和子宫颈癌组织样本转录分布图的分级群聚创建了树状图。每一个样本标记物具有其组织类型和标识码。图1中缩写定义如下:Necto:正常子宫颈阴道部;Nendo:正常子宫颈内膜;LSIL:低度鳞状上皮内病变;HSIL:高度鳞状上皮内病变;Tscc:鳞状细胞癌;Taca:腺癌。虚线将34个样本划分为两大组:对照组和疾病组。实心圆表示错误的簇样本。
图2描述了在正常、发育异常和子宫颈癌组织中通过cDNA微阵列杂交得到的MCM6和Claudin 1转录分布图(TP)。每个数据点代表两次微阵列杂交的平均值。通过对阵列上所有点取中值强度归一化TP强度。图2中缩写定义如下:Endo:正常子宫颈内膜组织;Ecto:正常子宫颈阴道部组织;LSIL:低度鳞状上皮内病变;HSIL:高度鳞状上皮内病变;SCC:鳞状细胞癌;ACA:腺癌。
发明详述
本发明涉及新发现的列于表1的与子宫颈细胞癌状态相关的癌标记物。已经发现这些标记物任一或这些标记物组合表达水平高于它们正常表达水平,就与患者中子宫颈癌包括癌前状态如发育异常的存在相关。提供了用于检测样本中子宫颈癌存在、样本中子宫颈癌不存在、子宫颈癌病期和与在患者中预防、诊断、鉴定和治疗子宫颈癌相关的子宫颈癌其它特性的方法。也提供了治疗子宫颈癌的方法。
表1列出了本发明的标记物,相对于正常(即非癌)子宫颈细胞和包含列于表2-13中的标记物,它们在子宫颈癌细胞中过表达。表1提供了核苷酸转录产物的cDNA序列和其编码的或相应于每一个标记的蛋白的氨基酸序列的序列表标识,也提供了蛋白编码序列在cDNA序列中的位置。表2列出了新鉴定的核苷酸和氨基酸序列。表3列出了新鉴定的核苷酸序列。表4通过转录分布试验和在SCC、ACA和HSIL中它们的标记物得分鉴定了所选择的本发明标记物。表5通过原位杂交鉴定了在子宫颈癌中过表达的本发明标记物并指出了标记物表达的位置。表6使用子宫颈组织微阵列鉴定了本发明标记物和它们表达频率。表7鉴定了基因特异性引物。表8列出了组织栏的末端PCR溴化乙锭琼脂糖凝胶图片中范围在0-5的得分。表9-13列出了在每个测试组织中靶基因的表达。
定义
在本文中使用时,下列每个术语具有与在该段落中其定义相关的含义。
本文中所用的冠词“一”和“一个”指一或多于一(即,至少一)的本文中语法上的对象。作为例子,“一种元件”指一种元件或多于一种元件。
“标记物”是一种基因,与其在正常或健康组织或细胞中表达水平相比,在组织或细胞中其改变的表达水平与疾病状态相关,例如与癌症相关。“标记物核酸”是一种本发明标记物编码的或相应于本发明标记物的核酸(如,mRNA,cDNA)。上述标记物核酸包括DNA(如,cDNA),所述DNA包含列于序列表的任一核酸序列的完整或部分序列或该序列的互补物。标记物核酸也包括RNA,所述RNA包含列于序列表的任一核酸序列的完整或部分序列或该序列的互补物,其中用尿嘧啶残基取代所有的胸腺嘧啶残基。“标记物蛋白”是一种本发明标记物编码的或相应于本发明标记物的蛋白。标记物蛋白包含列于序列表的任一序列的完整或部分序列。术语“蛋白”和“多肽”可交换使用。
“标记组”指多于一个标记物的组。
术语“探针”指任何分子,其能选择性结合特别指定的靶分子,例如,核苷酸转录产物或本发明标记物编码的或相应于本发明标记的蛋白。探针可由本领域技术人员合成,也可来自合适的生物制品。为达到检测靶分子的目的,可特别设计带标记的探针,如本文中所描述的。能用作为探针的分子的例子包括,但不限于,RNA、DNA、蛋白、抗体和有机分子。
“子宫颈相关的”体液是一种液体,当其在患者体内时,接触或经过子宫颈细胞或进入所述细胞,或接触或经过可通过的子宫颈细胞中流出的蛋白。所述细胞可在收集的子宫颈涂片中发现,例如,通过子宫颈刷收集。子宫颈相关的体液的例子包括血液、淋巴液、腹水、妇科分泌液、胆囊液、尿液和通过阴道冲洗收集的液体。
标记物的“正常”表达水平是在受试人或不患子宫颈癌患者的子宫颈细胞中所述标记物的表达水平。
标记物的“过表达”或“明显更高的表达水平”指在测试样本中的表达水平高于用于评估表达的试验的标准误,和较对照样本(如,来自不具有所述标记物相关疾病的健康患者的样本)中所述标记物表达水平以及优选地,在一些对照样本中所述标记物的平均表达水平,优选至少高两倍,和更优选高3、4、5或10倍。
标记物的“明显更低的表达水平”指在测试样本中的表达水平较对照样本(如,来自不具有所述标记物相关疾病的健康患者的样本)中所述标记物表达水平以及优选地,在一些对照样本中所述标记物的平均表达水平,至少低两倍,和更优选低3、4、5或10倍。
在本文中使用时,术语“启动子/调节序列”指可操作地连接着所述启动子/调节序列的基因产物表达所必需的核酸序列。在一些例子中,所述序列可以是核心启动子序列以及在其它例子中,所述序列也可包括增强子序列和其它基因产物表达所必需的调控元件。例如,所述启动子/调节序列可以是一种以组织特异性方式表达基因产物的序列。
“组成型”启动子是一种核苷酸序列,当其可操作地与编码或规定基因产物的多核苷酸连接时,在所述细胞大多数或所有的生理条件下,导致在活的人细胞中产生所述基因产物。
“诱导型”启动子是一种核苷酸序列,当其可操作地与编码或规定基因产物的多核苷酸连接时,仅当相应于所述启动子的诱导剂在所述细胞中存在时,才导致在活的人细胞中实质上产生所述基因产物。
“组织特异型”启动子是一种核苷酸序列,当其可操作地与编码或规定基因产物的多核苷酸连接时,仅在如果所述细胞是相应于所述启动子的组织类型的细胞条件下,才导致在活的人细胞中实质上产生所述基因产物。
“转录的多核苷酸”或“核苷酸转录产物”是一种多核苷酸(如,mRNA、hnRNA、cDNA或上述RNA或cDNA的类似物),其与成熟mRNA的全部或部分互补或同源,所述成熟mRNA由本发明的标记物转录以及正常的转录后加工(如,剪接)所产生,如果可能的话,由RNA转录产物的转录,以及RNA转录产物的反转录产生。
“互补的”指在两个核酸链区之间或在同一个核酸链两个区之间序列互补的概括性概念。已知第一核酸区的腺嘌呤残基能与第二核酸区的残基形成特定的氢键(“碱基配对”),如果第二核酸区的残基是胸腺嘧啶或尿嘧啶,第二区对于第一区是反平行的。同样地,已知第一条核酸链的胞嘧啶残基能与第二条核酸链的残基碱基配对,如果第二条链的残基是鸟嘌呤,第二条链对于第一条链是反平行的。如果,当所述两个区排列为反平行方式时,核酸的第一区与同样或不同的核酸的第二区互补,至少一个第一区的核苷酸残基能与第二区的残基碱基配对。优选地,第一区包含第一部分和第二区包含第二部分,由此,当第一和第二部分以反平行方式排列时,至少约50%,和优选至少约75%,至少约90%,或至少约95%的第一区核苷酸残基能与第二区中核苷酸残基碱基配对。更优选地,所有的第一区核苷酸残基能与第二区中核苷酸残基碱基配对。
本文中所使用的“同源的”指在同一个核酸链两个区之间或在两个不同核酸链区之间的核苷酸序列相似性。当在两个区中核苷酸残基位置被同样的核苷酸残基所占据时,那么在该位置上这两个区是同源的。如果每个区的至少一个核苷酸残基位置被同样的核苷酸残基所占据,第一区与第二区是同源的。根据这两个区中被同样的核苷酸残基所占据的核苷酸残基位置的比例表示两个区之间的同源性。作为例子,具有核苷酸序列5′-ATTGCC-3′的区和具有核苷酸序列5′-TATGGC-3′的区具有50%同源性。优选地,第一区包含第一部分和第二区包含第二部分,由此,至少约50%,和优选至少约75%,至少约90%,或至少约95%的每个部分的核苷酸残基位置被同样的核苷酸残基所占据。更优选地,每个部分的所有核苷酸残基位置都被同样的核苷酸残基所占据。
如果分子与底物共价或非共价相连,对于底物该分子是“固定的”或“附着的”,上述底物可用液体(如,标准枸橼酸盐水,pH7.4)冲洗,所述分子的实质部分没有从底物上分离。
当在本文中所用时,“天然存在的”核酸分子指具有在自然界中发现的生物体中出现的核苷酸序列的RNA或DNA分子。
如果癌症的至少一种症状减轻、终止、放缓或阻止,该癌症被“抑制”。在本文中使用时,如果子宫颈癌的复发或转移减少、放缓、延迟或阻止,其也被“抑制”。
试剂盒是任何一种产品(如,一种包装或容器),其包含至少一种试剂,如一种探针,用于特异性检测本发明标记物的表达。该试剂盒可以标准单位的形式推广、分发或出售用于执行本发明的方法。
“本发明的蛋白”包含标记物蛋白及其片段;标记物蛋白变体及其片段;包含标记物或标记物蛋白变体至少15个氨基酸片段的肽和多肽;和包含标记物或标记物蛋白变体,或标记物或标记物蛋白变体至少15个氨基酸片段的融合蛋白。
除非在本文中另有规定,术语“抗体”和“抗体”概括地包含了天然存在的抗体类型(如,IgG,IgA,IgM,IgE)和重组抗体,如单链抗体、嵌合和人源化抗体以及多特异性抗体,也包括前述所有抗体的片段和衍生物,该片段和衍生物具有至少一个抗原结合位点。抗体衍生物可包含与抗体结合的蛋白或化学部分。
描述
本发明部分基于新鉴定的标记物,与它们在正常的(即,非癌)子宫颈细胞中表达相比,所述标记物在子宫颈癌细胞中过表达。在本文中子宫颈细胞中一或多种这些标记物增强的表达与组织的癌状态相关。本发明提供了用于评估子宫颈细胞(如,获得自人细胞、培养的人细胞、存档或保藏的人细胞和体内细胞)癌状态和治疗患子宫颈癌的患者的组合物、试剂盒和方法。
本发明所述的组合物、试剂盒、和方法具有如下用途,其中:
1)评估是否患者患子宫颈癌;
2)评估人类患者子宫颈癌的病期;
3)评估患者子宫颈癌的级别;
4)评估患者子宫颈癌的良性或恶性性质;
5)评估患者子宫颈癌的转移潜力;
6)评估患者子宫颈癌相关的新生物的组织学类型;
7)制造用于治疗子宫颈癌和/或评估是否患者患子宫颈癌的抗体、抗体片段或抗体衍生物;
8)评估子宫颈癌细胞的存在;
9)评估用于抑制患者子宫颈癌一或多种受试化合物的效力;
10)评估用于抑制患者子宫颈癌的治疗的有效性;
11)监测患者子宫颈癌的进展;
12)选择用于抑制患者子宫颈癌的组合物或治疗;
13)治疗患子宫颈癌的患者;
14)抑制患者子宫颈癌;
15)评估受试化合物的子宫颈致癌作用潜力;和
16)预防处于发展为子宫颈癌危险的患者子宫颈癌的发作。
因此,本发明包括一种评估是否患者患子宫颈癌的方法,其包括评估是否患者具有转移前子宫颈癌。该方法包含比较患者样本中本发明标记物(列于表1)的表达水平和对照中所述标记物的正常表达水平,如非子宫颈癌样本。与正常水平相比,患者样本中标记物明显更高的表达水平表明该患者患子宫颈癌。
本发明也提供了含有核酸的基因运载工具、宿主细胞和组合物(所有本文中描述的),所述核酸包含列于序列表中任一核酸序列的全部、或15个或更多核苷酸的片段,或上述序列的互补物,和多肽,所述多肽包含列于序列表中任一氨基酸序列的全部、或10个或更多氨基酸的片段。
如本文所述,患者子宫颈癌与本发明一或多种标记物增加的表达水平相关。虽然,如上所讨论,其中一些表达水平改变导致了子宫颈癌的发生,其它一些改变诱导、保持并促进子宫颈癌细胞的癌状态。因此,可通过减少和/或干扰标记物表达和/或那些标记物编码蛋白的功能来抑制通过一或多种本发明标记物表达水平增加而鉴定的子宫颈癌。
通常在本领域中已知许多方法可抑制本发明标记物的表达。例如,给子宫颈癌细胞提供反义寡核苷酸以抑制标记物的转录、翻译或同时抑制两者。另一方面,编码能特异性结合标记物蛋白的抗体、抗体衍生物或抗体片段的多核苷酸,和可操作地与合适的启动子/调控区连接,能提供给细胞以产生能抑制标记物蛋白功能或活性的细胞内抗体。也可通过用能特异性结合标记物蛋白的抗体、抗体衍生物或抗体片段处理子宫颈癌细胞来抑制标记物表达和/或功能。使用本文中描述的方法,能筛选多种分子,特别是包括足够小的以致能穿过细胞膜的分子,以鉴定能抑制标记物表达或抑制标记物蛋白功能的分子。给患者提供所鉴定的化合物以抑制患者的子宫癌细胞。
任何本发明的标记物或标记物组合,也包括任何已知的标记物与本发明标记物的组合,可用于本发明的组合物、试剂盒和方法中。一般而言,优选使用在子宫颈癌细胞中标记物表达水平和在正常子宫颈细胞中相同标记物表达水平之间差异越可能大的标记物。尽管该差异可小到用于评估该标记物表达的方法的检测极限,但是优选该差异至少大于该评估方法的标准误,以及优选较正常子宫颈组织中相同标记物的表达水平至少2-,3-,4-,5-,6-,7-,8-,9-,10-,15-,20-,25-,100-,500-,1000-倍或更大的差异。
认为某些标记物蛋白从子宫颈细胞(即,正常和癌细胞的一种或两者)分泌到围绕着细胞的胞外空间。这些标记物优选用于本发明某些实施方案中的组合物、试剂盒和方法,基于在子宫颈相关的体液样本中能检测到上述标记物蛋白的事实,较组织的活组织检查切片样本,这些标记物能更容易地收集自人类患者。另外,优选用于检测标记物蛋白的体内技术,包括将抗该蛋白的标记的抗体导入患者体内。例如,可用放射性标记物标记抗体,可通过标准成像技术检测患者体内该放射性标记物的存在和位置。
对于本领域技术人员而言,测定任何特殊标记物蛋白是否是分泌蛋白是一件简单的事情。为进行该测定,标记物蛋白表达在,例如,哺乳动物细胞中,优选人子宫颈细胞系中,收集细胞外液,评估在细胞外液中存在或不存在标记物蛋白(如,使用特异性结合该蛋白的标记的抗体)。
接下来的例子是一种用于检测蛋白分泌的方法。在5%(v/v)CO2,95%空气气氛中,在含有培养液(补充有10%胎牛血清的Dulbecco氏改良的Eagle氏培养液{DMEM})的加样孔中,约8×105293T细胞在37℃下温育至约60-70%汇合。接着用每孔中含有2微克包含编码标记物蛋白表达载体的DNA和10微升LipofectAMINETM(GIBCO/BRLCatalog no.18342-012)的标准转染混合物转染细胞。转染混合物保持约5小时,接着用新鲜的培养液更换并保持在空气气氛中。每个孔用不含有甲硫氨酸或半胱氨酸的DEME(DMEM-MC;ICN Catalog no.16-424-54)轻轻地冲洗两次。在每个孔中加入约1毫升的DMEM-MC和约50微居里的Trans-35STM试剂(ICN Catalog no.51006)。加样孔保持在上述的5%CO2气氛中并在37℃下温育选定的一段时间。接着温育,除去150微升的条件培养液并离心除去漂浮细胞和碎片。在上清液中标记物蛋白的存在表明该蛋白被分泌。
可以理解的是含有子宫颈细胞的患者样本可用于本发明的方法。在这些实施方案中,通过评估子宫颈细胞样本(如,获得自患者的子宫颈涂片)中标记物的数量(如,绝对数量或浓度)可评估标记物的表达水平。当然,在评估样本中标记物数量前,可用多种众所周知的收集后制备或贮藏技术(如核酸和/或蛋白提取、固定、贮藏、冷冻、超滤、浓缩、蒸发、离心等)处理细胞样本。同样地,也可用收集后制备或贮藏技术(如,固定)处理子宫颈涂片。
本发明的组合物、试剂盒和方法可用于检测标记物蛋白的表达,该标记物蛋白至少有一部分在表达该蛋白的细胞表面展示。对于本领域技术人员而言,测定标记物蛋白或其部分是否暴露于细胞表面是一件简单的事情。例如,可用免疫学方法检测全细胞中的标记物蛋白,或用众所周知的基于计算机的序列分析方法来预测至少一个胞外域(即,包括分泌蛋白和具有至少一个细胞表面域的蛋白)的存在。无需裂解该细胞(如,使用与标记物蛋白的细胞表面域特异性结合的标记抗体)就可检测到具有至少一部分在表达该蛋白的细胞表面展示的标记物蛋白的表达。
通过用于检测转录核酸或蛋白的任一众所周知的方法可评估本发明标记物的表达。上述方法非限制性的例子包括用于检测分泌、细胞表面、胞质或核蛋白的免疫学方法、蛋白纯化方法、蛋白功能或活性分析方法、核酸杂交方法、核酸反转录方法和核酸扩增方法。
在一个优选实施方案中,使用能特异性结合标记物蛋白或其片段,包括全部或部分进行了常规的翻译后修饰的标记物蛋白,的一种抗体(如,一种放射性标记的、发色团标记的、荧光团标记的或酶标记的抗体)、抗体衍生物(如,结合有底物或或蛋白—配体对{如,生物素—抗生物素蛋白链菌素}的蛋白或配体的抗体),或抗体片段(如,单链抗体、分离的抗体超变区,等)来评估标记物的表达。
在另一个优选实施方案中,通过制备来自患者样本细胞的mRNA/cDNA(即,转录的多核苷酸),和通过将mRNA/cDNA和与标记物核酸或其片段互补的对照多核苷酸杂交来评估标记物的表达。在与对照多核苷酸杂交前,能使用任一多聚酶链式反应方法来任选地扩增cDNA;优选不被扩增。同样地,可使用定量PCR评估标记物的表达水平以检测一或多种标记物的表达。可选地,任何已知检测本发明标记物突变或变体(如,单核苷酸多态性、缺失等)的方法可用于检测患者中标记物的存在。
在一个相关实施方案中,将获得自样本的转录多核苷酸混合物和底物接触,该底物固定有与标记物核酸的至少一部分(如,至少7,10,15,20,25,30,40,50,100,500或更多的核苷酸残基)互补的或同源的多核苷酸。如果在底物上,互补的或同源的多核苷酸的检测有差别(如,使用不同的发色团或荧光团,或固定在不同的所选择的位置),那么使用一种单一底物就可同时评估多种标记物的表达水平(如,固定在所选择位置的多核苷酸的“基因芯片”微阵列)。当使用包括将一种核酸与另一种杂交的用于评估标记物表达的一种方法时,优选在严谨杂交条件下进行杂交。
因为本发明的组合物、试剂盒和方法依赖于检测本发明一或多种标记物的表达水平的差异,优选标记物的表达水平明显大于用于在至少一种正常子宫颈细胞和子宫颈癌细胞中评估表达的方法的最小检测极限。
很清楚通过使用一或多种本发明的标记物来常规筛选额外的患者样本,可认识到在不同类型的癌症中某些标记物是过表达的,包括特殊的子宫颈癌,也包括另外的癌症如乳癌、卵巢癌等。例如,可证实某些本发明的标记物在大多数(即,50%或更多)或基本上全部(即,80%或更多)的子宫颈癌中过表达。此外,可证实某些本发明的标记物与不同病期的(即,病期0,I,II,III和IV子宫颈癌,也包括亚分类IA1,IA2,IB,IB1,IB2,IIA,IIB,IIIA,IIIB,IVA和IVB,对于子宫颈原发癌使用FIGO病期分组系统(见GynecologicOncology,1991,41:199和Cancer,1992,69:482)),以及癌前状态的(如,发育异常包括CIN或SIL),不同组织学亚型的(如,鳞状上皮细胞癌和鳞状上皮细胞癌变体如疣状癌、淋巴上皮癌类似癌、乳头状鳞状新生物和梭形细胞鳞状细胞癌(见,Cervical Cancer andPreinvasive Neoplasia,1996,pp.90-91)浆液样、粘蛋白状、子宫内膜样和透明细胞亚型,也包括亚分类和交叉分类的腺癌、乳头腺癌、乳头状囊腺癌、表面乳头状癌、恶性腺纤维瘤、囊腺纤维瘤、腺癌、囊腺癌、腺棘皮癌、子宫内膜间质肉瘤、中胚层{富勒氏}混合瘤、恶性瘤、混合上皮细胞瘤和未分化癌,对于恶性子宫颈瘤的分类,使用WHO/FIGO系统;Scully,Atlas of Tumor Pathology,第3辑,Washington DC),和不同级别的(即,I级{良好分化的},II级{中度良好分化的}和III级{从周围正常组织低分化的})子宫颈癌相关。此外,对于本发明标记物的表达而言,评估了大量的患者样本,且来自所获得样本中的单独的患者结果是相关的,也可证实某些本发明标记物改变的表达与恶性肿瘤密切相关,以及本发明其它标记物改变的表达与良性肿瘤密切相关。因此,本发明的组合物、试剂盒和方法可用于鉴定患者中子宫颈癌的一或多种病期、级别、组织学类型和良性/恶性性质。
当本发明的组合物、试剂盒和方法用于鉴定患者中子宫颈癌的一或多种病期、级别、组织学类型和良性/恶性性质时,优选,标记物或本发明的标记物组选自在至少约20%、和优选至少约40%、60%或80%,和更优选基本上全部患子宫颈癌的患者中获得阳性结果的,该子宫颈癌具有相应的病期、级别、组织学类型和良性/恶性性质。优选地,标记物或本发明的标记物组选自在一般人群中阳性预测值(PPV)大于约10%的(更优选外加特异性测定大于80%的)。
当多种本发明的标记物用于本发明的组合物、试剂盒和方法中时,可在一种单独的反应混合物中(即,对于每种标记物使用试剂,如不同的荧光探针)或在相应于一或多种标记物的单独的反应混合物中,将患者样本中每种标记物的表达水平与同类型的非癌样本中多种标记物的每种正常表达水平比较。在一个实施方案中,相对于相应的正常水平,在样本中多种表达标记物中超过一种的表达水平的明显增加表明患者患子宫颈癌。当使用多种标记物时,优选使用2,3,4,5,8,10,12,15,20,30或50或更多的单独的标记物,其中优选更少的标记物。
为使本发明的组合物、试剂盒和方法的灵敏度最大化(即,因为患者样本中非癌器官的细胞的干扰),优选在此使用的本发明的标记物是一种具有受限的组织分布,如通常不在非癌组织中表达的标记物。
已知仅有少量标记物与子宫颈癌相关(如,bcl-2,15A8抗原,cdc6,Mcm5和EGFR)。当然这些标记物不包括本发明的标记物,尽管在一个标记物组中它们可与一或多种本发明的标记物联合使用,例如。众所周知某些类型的基因,如癌基因、肿瘤抑制基因、生长因子类似基因、蛋白酶类似基因和蛋白激酶类似基因通常与不同类型的癌的发生相关。因此,在本发明的标记物中,优选使用那些类似由已知癌基因和肿瘤抑制基因编码的已知蛋白的相应蛋白,和那些类似生长因子、蛋白酶和蛋白激酶的相应蛋白。
认为本发明的组合物、试剂盒和方法对于具有增加的发展为子宫颈癌危险的患者和他们的医学顾问具有特殊的效用。认可的具有增加的发展为子宫颈癌危险的患者包括,例如,具有子宫颈癌家族史的患者,鉴定为具有突变的癌基因(即,至少一种等位基因)的患者,和大龄患者(即,大于50或60岁的妇女)。
可用不同的方法来评估正常(即,非癌)人子宫颈组织中标记物的表达。在一个实施方案中,通过评估看来是非癌的子宫颈细胞的一部分中标记物的表达水平和通过将正常表达水平与怀疑是患癌的子宫颈细胞的一部分中的表达水平比较来评估该正常表达水平。可选地,和特别地作为可获得自按程序进行的本文中所描述方法的结果的详细信息,对于本发明的标记物的正常表达而言,可使用种群平均值。在另一个实施方案中,标记物的‘正常的’表达水平可通过评估获得自非癌患者的患者样本,获得自在怀疑该患者患子宫颈癌之前获得的患者样本,来自存档的患者样本和类似物中标记物的表达来测定。
本发明包括用于评估样本(如,存档的组织样本或获得自患者的样本)中子宫颈癌细胞存在的组合物、试剂盒和方法。这些组合物、试剂盒和方法基本上与那些上述的,除了其中不可避免的用于不同于患者样本的样本中的组合物、试剂盒和方法外,基本上是相同的。例如,当所用的样本是蜡封(parafinized)的、存档的人组织样本时,需要调节用于评估样本中标记物表达水平的本发明组合物、试剂盒或方法中化合物的比率。在本领域和本领域普通技术人员中这样的方法是众所周知的。
本发明包括用于评估子宫颈癌细胞(如,在样本,如在患者样本中)存在的试剂盒。该试剂盒包含多种试剂,每种都能特异性结合标记物核酸或蛋白。合适用于与标记物蛋白结合的试剂包括抗体、抗体衍生物、抗体片段和类似物。合适用于与标记物核酸(如,基因组DNA、mRNA、剪接的mRNA、cDNA或类似物)结合的试剂包括互补的核酸。例如,核酸试剂可包括固定于底物的寡核苷酸(标记的或未标记的),不与底物结合的标记的寡核苷酸,PCR引物对,分子信标探针和类似物。
本发明的试剂盒也可任选地包含用于操作本发明方法的额外成分。作为例子,该试剂盒可包含合适用于互补核苷酸退火或用于特异性结合该蛋白的抗体和蛋白的结合的液体(如,SSC缓冲液),一或多个样本室,一份描述操作本发明方法的说明书,一种正常子宫颈样本,一种子宫颈癌细胞样本,和类似物。
本发明也包括一种制造分离的杂交瘤的方法,该杂交瘤产生用于评估患者是否患子宫颈癌的抗体。在此方法中,合成或分离包含标记物蛋白全部或片段的蛋白或多肽(如,通过从表达其的细胞中纯化或通过在体内或体外用已知方法转录并翻译编码蛋白或多肽的核酸)。一种脊椎动物,优选哺乳动物如小鼠、大鼠、兔或绵羊用上述蛋白或多肽免疫。该脊椎动物可任选地(和优选地)用上述蛋白或多肽免疫至少一段额外时间,使得该脊椎动物对于上述蛋白或多肽显示加强的免疫响应。使用本领域众所周知的任一方法,分离自免疫的脊椎动物的脾细胞与无限增殖化细胞系融合形成杂交瘤。该方法中形成的杂交瘤接着用标准方法筛选以鉴定能产生特异性结合标记物蛋白或其片段的抗体的一或多种杂交瘤。本发明也包括根据上述方法制得的杂交瘤和使用该杂交瘤制得的抗体。
本发明也包括一种评估用于抑制子宫颈癌细胞的受试化合物的效力的方法。如上所述,本发明标记物的表达水平的差异与子宫颈细胞的癌状态相关。尽管认为本发明某些标记物表达水平的改变类似于子宫颈细胞癌状态所产生的结果,但是同样也认为本发明其它标记物的表达水平改变导致、保持并促进了那些细胞的癌状态。因此,能抑制患者子宫颈癌的化合物可导致本发明一或多种标记物的表达水平改变至接近该标记物的正常表达水平的水平(即,非癌子宫颈细胞中该标记物的表达水平)。
因此,该方法包含比较在第一子宫颈细胞样本中并保持在存在受试化合物的条件下标记物的表达与在第二子宫颈细胞样本中并保持在不存在受试化合物的条件下标记物的表达。在存在受试化合物条件下,本发明标记物的表达明显减少表明该受试化合物抑制子宫颈癌。子宫颈细胞样本可以,例如,是获得自患者的正常子宫颈细胞的一次抽样样本,获得自患者的正常子宫颈细胞的混合样本的等分试样,正常子宫颈细胞系的细胞,获得自患者的子宫颈癌细胞的一次抽样样本,获得自患者的子宫颈癌细胞的混合样本的等分试样,子宫颈癌细胞系的细胞,或类似物。在一个实施方案中,样本是获得自患者的子宫颈癌细胞,测试多种已知能有效地用于抑制的不同子宫颈癌的化合物以鉴定出能最好的抑制患者子宫颈癌的化合物。
同样地,该方法可用于评估用于患者子宫颈癌的治疗的有效性。在该方法中,评估了一对样本中(一个样本给予该治疗,另一个样本不给予该治疗)本发明一或多种标记物的表达水平。当用评估受试化合物效力的方法时,如果该治疗导致本发明标记物明显更低的表达水平,那么对于抑制子宫颈癌而言,该治疗是有效的。同上,如果来自所选择的患者的样本用于该方法中,那么可在体外评估可选择的治疗以选择一种对于抑制患者子宫颈癌最有效的治疗。
如上所述,人子宫颈细胞的癌状态与本发明标记物的表达水平的改变相关。本发明包括一种用于评估受试化合物的人子宫颈细胞致癌作用潜力的方法。该方法包含将人子宫颈细胞等分试样分别保持在存在和不存在受试化合物的条件下。比较每个等分试样中本发明标记物的表达。保持在存在受试化合物的条件下的等分试样中本发明标记物表达水平明显更高(相对于保持在不存在受试化合物条件下的等分试样),表明该受试化合物具有潜在的人子宫颈细胞致癌作用。通过比较相应标记物表达水平增强或抑制的程度,通过比较表达水平增强或抑制的标记物的数量,或两者都比较,可评估不同受试化合物的相对致癌作用潜力。
在下列段落中更详细描述了本发明的不同方面。
I.分离的核酸分子
本发明的一个方面涉及分离的核酸分子,包括编码标记物体蛋白或其部分的核酸。本发明分离的核酸也包括足以用作为杂交探针以鉴定标记物核酸分子及其片段的核酸分子,如,那些合适用作为用于标记物核酸分子的扩增或突变的PCR引物的。在本文中使用时,术语“核酸分子”意指包括DNA分子(如,cDNA或基因组DNA)和RNA分子(如,mRNA)以及用核苷酸类似物所制备的DNA或RNA类似物。核酸分子可以是单链或双链的,但优选双链DNA。
“分离的”核酸分子是从核酸分子的天然来源中所存在的其它核酸分子中分离的核酸分子。优选地,在该核酸所源自的生物体基因组DNA中,“分离的”核酸分子不具备侧接该核酸的天然(即,位于该核酸5′和3′末端的序列)序列(优选蛋白编码序列)。例如,在各种实施方案中,该分离的核酸分子可含有低于约5kB,4kB,3kB,2kB,1kB,0.5kB或0.1kB的在该核酸分子源自的细胞基因组DNA中侧接该核酸分子的天然核苷酸序列。此外,“分离的“核酸分子,如cDNA分子,当通过重组技术上生产时,可基本上不含有其它细胞物质或培养基,或当化学合成时,基本上不含有化合物前体或其它化合物。
可使用标准的分子生物学技术和本文所述的数据库记录的序列信息分离本发明的核酸分子。使用所记录的核酸序列的全部或部分,使用标准的杂交和克隆技术可分离本发明的核酸分子(如,描述于Sambrook等,编.,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989)。
根据标准PCR扩增技术,使用cDNA、mRNA或基因组DNA作为模板和合适的寡核苷酸引物可扩增本发明的核酸分子。所扩增的核酸可克隆自合适的载体中并通过DNA序列分析来鉴定。此外,通过标准的合成技术,如使用自动DNA合成仪,可制备相应于本发明核酸分子的全部或部分的核苷酸。
在另一个优选实施方案中,本发明分离的核酸分子包含具有与标记物核酸的核苷酸序列或编码标记物蛋白的核酸的核苷酸序列互补的核苷酸序列的核酸分子。与给定的核苷酸序列互补的核酸分子是一种与给定的核苷酸序列完全互补,并能与所给定的核苷酸序列杂交从而形成稳定的双链体。
此外,本发明的核酸分子可仅包含部分核酸序列,其中全长的核酸序列包含标记物核酸或编码标记物蛋白。这样的核酸可用作为,例如,探针或引物。通常用一或多种基本上纯化的寡核苷酸作为探针/引物。该寡核苷酸通常包含在严谨条件下能与本发明的核酸的至少约7,优选约15,更优选约25,50,75,100,125,150,175,200,250,300,350或400或更多的连续核苷酸杂交的核苷酸序列的一个区。
基于本发明的核酸分子序列的探针可用于检测相应于本发明一或多个标记物的转录产物或基因组序列。该探针包含附于其上的标记基团,如,放射性同位素、荧光化合物、酶、或酶辅因子。这样的探针可用作为用于鉴定蛋白表达异常的细胞或组织的诊断试剂盒的一部分,例如通过测定患者细胞样本中编码蛋白的核酸分子的水平,如检测mRNA水平或确定编码该蛋白的基因是否已突变或缺失。
本发明进一步包含由于遗传密码简并性而不同于编码标记物蛋白(如,具有列于序列表中氨基酸序列之一的蛋白)的核酸的核苷酸序列的核酸分子,并因此编码同样的蛋白。
本领域的技术人员可以理解的是DNA序列多态性导致的氨基酸序列改变可存在于种群中(如,人群中)。由于等位基因自然变异,这样的遗传多态性可在种群的个体间存在。等位基因是可选择出现在给定的基因位点的一组基因之一。此外,可以理解的是影响RNA表达水平的DNA多态性也存在可影响该基因总的表达水平(如,通过影响调控或降解)。
在本文中使用时,词组“等位基因变体”指在给定的位点出现的核苷酸序列或指该核苷酸序列编码的多肽。
在本文中使用时,术语“基因”和“重组基因”指包含编码相应于本发明标记物多肽的开放阅读框的核酸分子。在给定基因的核苷酸序列中该天然产生的等位基因变体通常能导致1-5%变异。通过对许多不同个体中感兴趣的基因测序可鉴定可选择的等位基因。通过使用杂交探针来鉴定不同个体中此同样的基因位点可容易地进行上述鉴定。任一和所有这样的核苷酸变体和产生的氨基酸多态性或变体是天然等位基因变异的结果,并且不改变本发明保护范围所规定的功能活性。
在另一个实施方案中,本发明分离的核酸分子长度至少是7,15,20,25,30,40,60,80,100,150,200,250,300,350,400,450,550,650,700,800,900,1000,1200,1400,1600,1800,2000,2200,2400,2600,2800,3000,3500,4000,4500,或更多个核苷酸,并在严谨条件下与标记物核酸或与编码标记物蛋白的核酸杂交。在本文中使用时,术语“在严谨条件下杂交”是用来描述用于杂交和洗涤的条件,在该条件下,彼此之间具有至少60%(65%,70%,优选75%)同一性的核苷酸序列通常仍能互相杂交。这样的严谨条件为本领域技术人员所众所周知,并能在Current Protocols in Molecular Biology,John Wiley & Sons,N.Y.(1989)6.3.1-6.3.6节中找到。一个优选的,非限制性的严谨杂交条件的例子是在6X氯化钠/柠檬酸钠(SSC)中,在45℃下杂交,接着用0.2X SSC,0.1%SDS在50-65℃下洗涤一或多次。
除了能存在于种群中的本发明核酸分子的天然存在的等位基因变体外,本领域的技术人员可进一步理解能通过突变导入序列改变,因此导致了所编码蛋白的氨基酸序列的改变,但不改变所编码蛋白的生物活性。例如,可进行核苷酸取代导致在“非必需的”氨基酸残基处的氨基酸取代。“非必需的”氨基酸残基是一种在野生型序列中能被改变但不改变生物活性的残基,但是,“必需的”氨基酸残基对生物活性而言是必需的。例如,对于活性而言,在不同物种同系物之间非保守的或仅是半保守的氨基酸残基可能是非必需的,因此很可能成为改变的对象。可选地,对于活性而言,在不同物种(如,鼠和人)同系物之间保守的氨基酸残基可能是必需的,因此就不可能作为改变的对象。
因此,本发明的另一个方面是关于编码不同标记物蛋白的核酸分子,该标记物蛋白含有对于活性而言是非必需的氨基酸残基改变。这样的标记物蛋白变体的氨基酸序列不同于天然存在的标记物蛋白,但仍保持生物活性。在一个实施方案中,这样一个标记物蛋白变体具有与标记物蛋白的氨基酸序列至少约40%,50%,60%,70%,80%,90%,95%或98%同一性的氨基酸序列。
通过在标记物核酸的核苷酸序列中导入一或多个核苷酸取代、添加或缺失得到编码标记物蛋白变体的分离的核酸分子,使得一或多个氨基酸残基取代、添加或缺失导入所编码的蛋白。通过标准技术可导入突变,如定点诱变和PCR-介导的诱变。优选地,在一或多个预测的非必需氨基酸残基处进行保守氨基酸取代。“保守氨基酸取代”指氨基酸残基被具有类似侧链的氨基酸残基所取代。在本领域中已经定义了具有类似侧链的氨基酸残基家族。这些家族包括具有碱性侧链的氨基酸残基(如,赖氨酸、精氨酸、组氨酸),酸性侧链的氨基酸残基(如,天冬氨酸、谷氨酸),不带电荷的极性侧链的氨基酸残基(如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸),非极性侧链的氨基酸残基(如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸),β-分支侧链的氨基酸残基(如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链的氨基酸残基(如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。可选地,突变可随机导入编码序列的全部或部分中,如通过饱和诱变,可通过鉴定仍保持活性的突变体的生物活性来筛选所产生的突变体。在诱变后,重组表达编码蛋白并测定该蛋白活性。
本发明包含反义核酸分子,即能与本发明的有义核酸互补的分子,如,与双链标记物cDNA分子的编码链互补或与标记物mRNA序列互补。因此,本发明的反义核酸能通过氢键(即,退火)与本发明的有义核酸结合。该反义核酸能与完整编码链或其部分互补,如,蛋白编码区(或开放阅读框)的全部或部分。反义核酸分子也可以与编码标记物蛋白的核苷酸序列的编码链的非编码区的全部或部分反义。非编码区(“5′和3′非翻译区”)是侧接在编码区且不翻译为氨基酸的5′和3′序列。
反义寡核苷酸长度可以是,例如,约5,10,15,20,25,30,35,40,45或50或更多个核苷酸。使用本领域已知的化学合成和酶连反应方法可得到本发明的反义核酸。例如,使用天然存在的核苷酸或设计用于增加分子生物学稳定性或增加在反义和有义核酸之间形成的双链的物理稳定性的不同的修饰的核苷酸的可化学合成反义核酸,如可使用磷硫酰衍生物和吖啶取代的核苷酸。可用于产生反义核酸的修饰的核苷酸的例子包括5-氟尿嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-碘尿嘧啶,次黄嘌呤,黄嘌呤,4-乙酰胞嘧啶,5-(羧基羟甲基)尿嘧啶,5-羧甲基氨甲基-2-硫尿核苷,5-羧甲基氨甲基尿嘧啶,二氢尿嘧啶,β-D-半乳糖基queosine,肌苷,N6-异戊烯腺嘌呤,1-甲基鸟嘌呤,1-甲基肌苷,2,2-二甲基鸟嘌呤,2-甲基腺嘌呤,2-甲基鸟嘌呤,3-甲基胞嘧啶,5-甲基胞嘧啶,N6-腺嘌呤,7-甲基鸟嘌呤,5-甲基氨甲基尿嘧啶,5-甲氧基氨甲基-2-硫尿嘧啶,β-D-甘露糖基queosine,5′-甲氧基羧甲基尿嘧啶,5-甲氧基尿嘧啶,2-甲基硫代-N6-异戊烯腺嘌呤,尿嘧啶-5-乙醇酸(v),wybutoxosine,假尿嘧啶,queosine,2-巯基胞嘧啶,5-甲基-2-巯基尿嘧啶,2-巯基尿嘧啶,4-巯基尿嘧啶,5-甲基尿嘧啶,尿嘧啶-5-乙醇酸甲酯,尿嘧啶-5-乙醇酸(v),5-甲基-2-巯基尿嘧啶,3-(3-氨基-3-N-2-3-羧丙基)尿嘧啶,(acp3)w和2,6-二氨基嘌呤。可选地,可用生物学方法产生反义核酸,该方法使用表达载体,其中核酸已被亚克隆入该载体的反义方向(即,由插入的核酸转录的RNA与感兴趣的靶核酸呈反义方向,在以下部分作进一步说明)。
通常给予受试者本发明的反义核酸分子,或在原位产生该反义核酸分子以使它们与编码标记物蛋白的细胞mRNA和/或基因组DNA杂交或结合以抑制标记物的表达,如,通过抑制转录和/或翻译。杂交通过常规的核苷酸互补可形成稳定的双链体,或,例如,通过双螺旋的大沟中的特异性相互作用,在这种情况下,反义核酸分子结合DNA双链体。给予本发明反义核酸分子的途径的例子包括在组织部位直接注射或将反义核酸灌输入子宫颈相关的体液中。可选地,可修饰反义核酸分子以靶定所选择的细胞,和接着通过全身方式给予。例如,对于全身性给药而言,可修饰反义核酸使之与所选择的细胞表面的受体或表达的抗原特异性结合,如,通过将反义核酸分子与肽或抗体连接,所述肽或抗体与细胞表面受体或抗原结合。使用本文中所述的载体也可将反义核酸分子递送至细胞中。为达到反义分子足够的细胞内浓度,优选在载体构建体中反义核酸分子可置于强pol II或pol III启动子的控制下。
本发明的反义核酸分子可以是α-端基核酸分子。α-端基核酸分子难过与互补的RNA形成特殊的双链杂合体,与通常使用的α-单位不同,链之间互相平行延伸(Gaultier等,1987,Nucleic Acids Res.15:6625-6641)。反义核酸分子也可包含2′-o-甲基核糖核苷酸(Inoue等.,1987,Nucleic Acids Res.15:6131-6148)或嵌合的RNA-DNA类似物(Inoue等,1987,FEBS Lett.215:327-330)。
本发明也包含核酶。核酶是催化性RNA分子,其具有核糖核酸酶活性,能裂解单链核酸,如mRNA,其具有与所裂解的单链核酸互补的互补区。因此,核酶(如,在Haselhoff和Gerlach,1988,Nature334:585-591中所述的锤头状核酶)可用于催化裂解mRNA转录产物由此抑制mRNA编码蛋白的翻译。基于相应于该标记物的cDNA的核苷酸序列,可设计对编码标记物蛋白的核酸分子具有特异性的核酶。例如,可构建四膜虫(Tetrahymena)L-19 IVS RNA的衍生物,其中,活性部位的核苷酸序列与要裂解的核苷酸序列互补(见,Cech等,美国专利第4,987,071号;和Cech等,美国专利第5,116,742号)。可选地,编码本发明多肽的mRNA可用于从RNA分子库中选择具有特定核糖核酸酶活性的催化性RNA(参见如Bartel和Szostak,1993,Science261:1411-1418)。
本发明也包含形成三螺旋结构的核酸分子。例如,通过将靶核苷酸序列与编码标记物核酸或蛋白的基因的调控区(如,启动子和/或增强子)互补以形成三螺旋结构阻止了该基因在靶细胞中的转录,来抑制本发明标记物的表达。通常见Helene(1991)Anticancer Drug Des.6(6):569-84;Helene(1992)Ann.N.Y.Acad.Sci.660:27-36;和Maher(1992)Bioassays 14(12):807-15。
在各种实施方案中,可修饰本发明核酸分子的碱基部分、糖部分或磷酸酯主链以改良,如分子的稳定性、杂交性或溶解性。例如,可修饰核酸的脱氧核糖磷酸酯主链以产生肽核酸(见,Hyrup等,1996,Bioorganic & Medicinal Chemistry 4(1):5-23)。在本文中使用时,术语“肽核酸”或“PNAs”指核酸模拟物,如,DNA模拟物,其中伪肽(pseudopeptide)主链取代了脱氧核糖磷酸主链,且仅保留有4种天然核苷碱基。在低离子强度的条件下,已显示PNAs中性主链可与DNA和RNA特异性杂交。可通过使用标准固相肽合成技术进行PNA寡聚体的合成,如描述于Hyrup等.(1996),出处同上;Perry-O′Keefe等.(1996)Proc.Natl.Acad.Sci.USA 93:14670-675。
PNAs可作为治疗和诊断应用。例如,PNAs可用作为反义或反基因(antigene)试剂用于基因表达的序列特异性调控,通过如,在基因中分析单碱基配对突变,通过如,PNA定向PCR钳制(clamping);当与其它酶(如S1核酸酶)结合使用时,作为人工限制性酶(Hyrup(1996),出处同上);或作为DNA测序和杂交的探针或引物(Hyrup,1996,出处同上;Perry-O′Keefe等,1996,Proc.Natl.Acad.Sci.USA93:14670-675)。
在另一个实施方案中,通过在PNA上连接亲脂性或其它辅助基团,通过形成PNA-DNA嵌合体,或通过使用脂质体或其它本领域已知的药物递送技术可修饰PNAs,如以增加它们的稳定性或细胞摄取能力。例如,产生的PNA-DNA嵌合体可将PNA和DNA的有益特性结合。当PNA部分能提供高亲和力和特异性时,这样的嵌合体允许DNA识别与DNA部分相互作用的酶,如核糖核酸酶H和DNA聚合酶。使用合适长度的接头可连接PNA-DNA嵌合体,根据碱基堆积、在核碱基之间键的数目和取向选择接头(Hyrup,1996,出处同上)。根据Hyrup(1996),出处同上,和Finn等.(1996)Nucleic Acids Res.24(17):3357-63所描述的方法进行PNA-DNA嵌合体的合成。例如,,使用标准的亚磷酰胺偶联化学和修饰的核苷类似物在固相支持物上合成DNA链。化合物,如5′-(4-甲氧基三苯甲基)氨基-5′-脱氧-胸苷亚磷酰胺可用于连接PNA和DNA的5′末端(Mag等,1989,Nucleic AcidsRes.17:5973-88)。接着以逐步进行的方法偶联上PNA单体以产生具有5′PNA片段和3′DNA片段的嵌合分子(Finn等,1996,Nucleic AcidsRes.24(17):3357-63)。可选地,可合成具有5′DNA片段和3′PNA片段的嵌合分子(Peterser等,1975,Bioorganic Med.Chem.Lett.5:1119-11124)。
在另一个实施方案中,寡核苷酸包括其它附加的基团如肽(如,用于体内靶定宿主细胞受体),或有利于转运通过细胞膜(参见如Letsinger等,1989,Proc.Natl.Acad.Sci.USA 86:6553-6556;Lemaitre等,1987,Proc.Natl.Acad.Sci.USA 84:648-652;PCT公开号WO88/09810)或血脑屏障的试剂(参见如PCT公开号WO 89/10134)。此外,可用启动的杂交裂解试剂修饰寡核苷酸(参见如,Krol等,1988,Bio/Techniques 6:958-976)或嵌入试剂(参见如,Zon,1988,Pharm.Res.5:539-549)。为此,寡核苷酸可与其它分子缀合,如,肽、启动杂交的交联剂、运输载体、启动杂交的裂解剂等。
本发明也包括分子信标核酸,其具有至少一个区,该区能与本发明核酸互补,使得该分子信标可用于样本中本发明核酸的定量。“分子信标”核酸是一种包含一对互补区并具有与之相连的荧光团和荧光猝灭剂的核酸。荧光团和猝灭剂以这样的定向连接于该核酸的不同部分,当互补区相互退火时,猝灭剂猝灭了荧光团的荧光。当该核酸的互补区彼此间不退火时,荧光团的荧光被猝灭到较低程度。分子信标核酸描述于,例如,美国专利第5,876,930号中。
II.分离的蛋白和抗体
本发明的一个方面涉及分离的标记物蛋白及其生物活性部分,也关于合适作为免疫原来提取抗标记物蛋白或其片段的抗体的多肽片段。在一个实施方案中,通过使用标准蛋白纯化技术的合适纯化方法可从细胞或组织来源的物质中分离出天然的标记物蛋白。在另一个实施方案中,通过重组DNA技术产生包含标记物蛋白全部或片段的蛋白或肽。对于重组表达,还可选择的是使用化学肽合成技术合成这样的蛋白或肽。
“分离的”或“纯化的”蛋白或其生物活性片段是基本上不含有来自产生该蛋白的细胞或组织来源的细胞物质或其它污染蛋白,或当化学合成时,基本上不含有化合物前体或其它化合物。术语“基本上不含有细胞物质”包括在蛋白制备物,其中该蛋白与其中分离或重组产生这种蛋白的细胞的细胞成分分离。因此,蛋白基本上不含有细胞物质,包括具有小于约30%,20%,10%或5%(干重)的异源蛋白(在本文中也称为“污染蛋白”)的蛋白制备物。当该蛋白或其生物活性部分是重组产生时,也优选实际上不含有培养基,即培养基含量小于约20%,10%或5%的蛋白制备物的体积。当该蛋白通过化学合成产生时,优选基本上不含有化合物前体或其它化合物,即,在蛋白的合成过程中与化合物前体或其它化合物分离。因此,这样的蛋白制备物具有小于约30%,20%,10%,5%(干重)的化合物前体或除了感兴趣的多肽外的化合物。
标记物蛋白的生物活性部分包括多肽,该多肽包含与标记物蛋白的氨基酸序列基本上同一的或源自其的氨基酸序列,包括与全长蛋白相比更少的氨基酸,并显示相应全长蛋白的至少一种活性。通常,生物活性部分包含一个具有相应全长蛋白的至少一种活性的区域或基序。本发明标记物蛋白的生物活性部分可以是一种多肽,其长度是,例如10,25,50,100或更多个氨基酸。而且,在标记物蛋白所缺失的其它区域的其它生物活性部分可通过重组技术制备,并用于鉴定天然形式标记物蛋白的一或多种功能活性。
优选的标记物蛋白编码自核苷酸序列包含列于序列表中任一序列的序列。其它有用的蛋白与这些序列之一是基本上同一的(如,至少约40%,优选50%,60%,70%,80%,90%,95%或99%),且保留相应天然存在的标记物蛋白的功能活性,但由于天然等位基因变异或诱变在氨基酸序列上不同。
为测定两个氨基酸序列或两个核酸之间的同一性百分数,比对序列以寻求最佳的比较效果(如,可在第一个氨基酸或核酸序列中导入空位以与第二个氨基酸或核酸序列进行最佳的比对)。接着比较在相应的氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当在第一个序列中一个位置与第二个序列中相应位置被同样的氨基酸或核苷酸占据时,那么该分子在该位点是相同的。两个序列间的同一性百分数序列所具有相同位置的数量的函数(即,%同一性=#相同的位置数/总的#位置数(如,重叠的位置)×100)。在一个实施方案中,两个序列具有相同的长度。
可使用数学算法来确定两个序列之间的同一性百分数。一个优选的,非限制性的用于比较两个序列数学算法例子是Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264-2268的算法,其改良自Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877的算法。该算法被并入Altschul,等.(1990)J.Mol.Biol.215:403-410的BLASTN和BLASTX程序中。可用BLASTN程序进行BLAST核苷酸搜索,得分=100,字符长度=12以获得与本发明核酸分子同源的核酸序列。可用BLASTP程序进行BLAST蛋白搜索,得分=50,字符长度=3以获得与本发明蛋白分子同源的氨基酸序列。为获得用于比较目的的空位比对,可使用Altschul等.(1997)Nucleic Acids Res.25:3389-3402中所描述的称为有空位的(Gapped)BLAST的新版本BLAST算法,对于BLASTN,BLASTP和BLASTX程序,其能执行局部空位比对。可选地,PSI-Blast可用于执行重复搜索检测两个分子之间的远缘关系。当使用BLAST,有空位的BLAST和PSI-Blast程序时,使用各个程序(如,BLASTX和BLASTN)的默认参数。见http://www.ncbi.nlm.nih.gov。另一个优选的,非限制性的用于序列比较的算法例子是Myers和Miller,(1988)CABIOS 4:11-17的算法。该算法被并入ALIGN程序(2.0版)中,该程序是GCG序列比对软件包的一部分。当使用ALIGN程序用于比较氨基酸序列时,可使用PAM120权重残基表,空位长度罚分为12,和空位罚分为4。然而另一个对于鉴定局部序列区域相似性和比对的有用的算法是FASTA算法,描述于Pearson和Lipman(1988)Proc.Natl.Acad.Sci.USA 85:2444-2448。当使用FASTA算法用于比较核苷酸或氨基酸序列时,例如,可使用具有κ-元组值为2的PAM 120权重残基表。
使用类似于那些上述的,允许有或不允许有空位的方法,可确定两个序列之间的同一性百分数。在计算同一性百分数中,仅有准确匹配被计算在内。
本发明也提供包含标记物蛋白或其片段的嵌合或融合蛋白。在本文中使用时,“嵌合蛋白”或“融合蛋白”包含可操作地连接到异源多肽(即,不同于标记物蛋白的多肽)的标记物蛋白的全部或部分(优选生物活性部分)。在融合蛋白中,术语“可操作地连接”用来表示标记物蛋白或其片段和异源多肽互相进行符合读框的融合。异源多肽可融合到标记物蛋白或片段的氨基末端或羧基末端。
一种有用的融合蛋白是GST融合蛋白,其中标记物蛋白或片段融合到GST序列的羧基末端。这样的融合蛋白能方便本发明重组多肽的纯化。
在另一个实施方案中,融合蛋白在其氨基末端含有异源信号序列。例如,能除去标记物蛋白的天然信号序列并用来自另外蛋白的信号序列取代。例如,杆状病毒包膜蛋白的gp67分泌序列可用作为异源信号序列(Ausubel等,编,Current Protocols in Molecular Biology,John Wiley & Sons,NY,1992)。其它真核异源信号序列的例子包括蜂毒肽和人胎盘碱性磷酸酶的分泌序列(Stratagene;La Jolla,California)。还在另一个例子中,有用的原核异源信号序列包括phoA分泌信号(Sambrook等,出处同上)和蛋白A分泌信号(PharmaciaBiotech;Piscataway,New Jersey)。
还在另一个实施方案中,融合蛋白是一种免疫球蛋白融合蛋白,其中标记物蛋白的全部或部分与源自免疫球蛋白家族一员的序列融合。本发明的免疫球蛋白融合蛋白可掺入药物组合物中并给予患者以抑制配体(可溶的或膜结合的)与细胞表面蛋白(受体)之间的相互作用,因此抑制了体内信号转导。免疫球蛋白融合蛋白可用于影响标记物蛋白的同源配体的生物利用度。配体/受体相互作用的抑制在治疗上能用于治疗增生和分化紊乱,并用于调节(如,促进或抑制)细胞存活。此外,本发明的免疫球蛋白融合蛋白可用作为免疫原在患者体中来产生抗标记物蛋白的抗体,来纯化配体和在筛选试验中鉴定抑制标记物蛋白与配体相互作用的分子。
本发明的嵌合和融合蛋白可通过标准的重组DNA技术产生。在另一个实施方案中,通过常规技术包括自动化DNA合成仪可合成融合基因。可选地,使用锚定引物可进行基因片段的PCR扩增,所述锚定引物产生了两个连续的基因片段之间的互补的突出物,所述突出物随后退火并再扩增产生嵌合基因序列(参见如,Ausubel等,出处同上)。此外,许多也编码融合部分(如,GST多肽)的表达载体是商业上可获得的。编码本发明多肽的核酸可克隆入上述表达载体中使得融合部分与本发明的多肽进行符合读框的连接。
使用信号序列可便于标记物蛋白的分泌和分离。信号序列通常通过疏水氨基酸核而被鉴定,在一或更多的裂解过程中该疏水氨基酸核通常裂解自分泌过程中的成熟蛋白。当成熟蛋白通过分泌途径时,含有加工位点的上述信号肽可允许信号序列从成熟蛋白上裂解下来。因此,本发明涉及具有信号序列的标记物蛋白、融合蛋白或其片段,以及涉及信号序列已经蛋白水解裂解的上述蛋白(即,裂解产物)。在一个实施方案中,在表达载体中编码信号序列的核酸序列能可操作地连接感兴趣的蛋白,如标记物蛋白或其片段。信号序列指导蛋白的分泌,如从该表达载体所转染的真核宿主中,且该信号序列随后或同时被裂解。接着通过本领域所众所周知的方法能容易地从细胞外培养基中纯化蛋白。可选地,通过使用能便于纯化的序列,如具有GST结构域的,信号序列能被连接到感兴趣的蛋白。
本发明也涉及标记物蛋白变体。该变体具有改变的氨基酸序列,其能起激动剂(模拟物)或拮抗剂的作用。通过诱变作用能产生变体,如不连续的点突变或截短。激动剂能基本上保持相同或部分的蛋白天然存在形式的生物活性。蛋白的拮抗剂能抑制一或多种蛋白天然存在形式的活性,通过例如,竞争性结合细胞信号级联的下游或上游元件,包括感兴趣的蛋白。因此,通过用具有有限功能的变体治疗能引发特定的生物效应。相对于用蛋白天然形式的治疗,用具有部分蛋白天然存在形式的生物活性的变体治疗患者可在患者中产生更少的副作用。
能起激动剂(模拟物)或拮抗剂作用的标记物蛋白变体可通过筛选本发明蛋白的突变体组合文库,如截短突变体组合文库,以鉴定激动剂或拮抗剂活性。在一个实施方案中,通过在核酸水平上组合诱变产生变体杂文库(variegated library),以及该变体杂文库编码自杂基因文库(variegated gene library)。变体杂文库可通过,例如,合成的寡核苷酸混合物通过酶连接入基因序列,使得潜在蛋白序列的简并组表达为单独多肽,或可选地,表达为一组大的融合蛋白(如,对于噬菌体展示而言)。许多方法能用于从简并的寡核苷酸序列产生标记物蛋白潜在变体文库。用于合成简并寡核苷酸的方法是本领域众所周知的(见,例如,Narang,1983,Tetrahedron 39:3;Itakura等,1984,Annu.Rev.Biochem.53:323;Itakura等,1984,Science 198:1056;Ike等,1983 Nucleic Acid Res.11:477)。
另外,标记物蛋白片段文库可用于产生多肽杂群(variegatedpopulation)用于筛选和随后标记物蛋白或其片段变体的选择。例如,可产生编码序列片段文库,包括:通过在每个分子仅存在约一个切口条件下,用核酸酶处理感兴趣的编码序列的双链标准PCR片段,退火该双链DNA,复性该DNA以形成双链DNA,该双链DNA包括来自不同带切口产物的有义/反义对,通过用S1核酸酶从重新形成的双链体上切除单链部分,并将产生的片段连接如表达载体中。通过这种方法,可得到编码不同大小的感兴趣蛋白氨基末端和内部片段的表达文库。
本领域已知一些技术,可用于筛选通过点突变或截短产生的组合文库基因产物,和用于筛选具有所选特性的基因产物的cDNA文库。最普遍使用的技术应适用于高通量分析,对于筛选大基因文库而言,通常包括将基因文库克隆入可复制的表达载体中,用所产生的载体文库转染合适的细胞,和在其中所需活性的检测便于编码其产物被检测的基因的载体的分离的条件下,表达该组合基因。回归总体诱变(REM),一种能增加功能突变体在文库中出现频率的技术,可与筛选试验结合使用来鉴定本发明蛋白的变体(Arkin和Yourvan,1992,Proc.Natl.Acad.Sci.USA 89:7811-7815;Delgrave等,1993,ProteinEngineering 6(3):327-331)。
本发明另一个方面涉及抗本发明蛋白的抗体。在优选实施方案中,该抗体特异性结合标记物蛋白或其片段。可交换使用的术语“抗体”和“抗体”指免疫球蛋白分子和包含其免疫活性部分的片段和衍生物(即,上述部分含有抗原结合位点,其能特异性结合抗原,例如标记物蛋白,如标记物蛋白的表位)。能特异性结合本发明蛋白的抗体是一种能结合该蛋白,但在样本中,如天然含有该蛋白的生物样本中基本上不结合其它分子的抗体。免疫球蛋白分子的免疫活性部分的例子包括,但不限于,单链抗体(scAb)、F(ab)和F(ab′)2片段。
本发明分离的蛋白或其片段可用作为免疫原来产生抗体。可使用全长蛋白或,可选地,本发明提供了用作为免疫原的抗原肽片段。本发明蛋白的抗原肽包含至少8个(优选10,15,20或30或更多个)本发明蛋白之一的氨基酸序列的氨基酸残基,和包含至少一个该蛋白的表位,使产生的抗该肽抗体与该蛋白形成免疫复合物。优选的表位包含位于蛋白表面区,如亲水区的抗原肽。疏水性序列分析、亲水性序列分析、或类似的分析可用于鉴定亲水区。在优选的实施方案中,一种分离的标记物蛋白或其片段用作为免疫原。
免疫原通常用于制备抗体,通过免疫合适的(即,免疫活性的)对象,如兔、山羊、小鼠或其它哺乳动物或脊椎动物。一种合适的免疫原制剂包含,例如,重组体表达或化学合成的蛋白或肽。该制剂可进一步包括一种佐剂,如福氏完全或不完全佐剂,或一种类似的免疫刺激剂。优选的免疫原组合物是那些不含有其它人蛋白的,例如,使用非人宿主细胞重组表达本发明蛋白得到的免疫原组合物。在该方法中,所产生的抗体组合物具有与除本发明蛋白外的其它人蛋白减少的结合或不结合。
本发明提供了多克隆和单克隆抗体。术语“单克隆抗体”或“单克隆抗体组合物”,在本文中使用时,指仅含有一种能与特定的表位起免疫反应的抗原结合位点的抗体分子的群体。优选的多克隆和单克隆抗体组合物是一种抗本发明蛋白的抗体已选择的组合物。特别优选的多克隆和单克隆抗体制剂是一种仅含有抗标记物蛋白或其片段的抗体的制剂。
多克隆抗体可通过用本发明的蛋白作为免疫原免疫合适的对象制备。通过标准方法可全程监测免疫对象中的抗体浓度,如通过使用固定化多肽的酶联免疫吸附测定(ELISA)。在免疫后的合适时间点,如,当特异性抗体浓度最高时,从对象中获得产生抗体的细胞并通过标准技术用于制备单克隆抗体(mAb),如杂交瘤技术,最初描述于Kohler和Milstein(1975)Nature 256:495-497,人B细胞杂交瘤技术(见Kozbor等,1983,Immunol.Today 4:72),EBV-杂交瘤技术(见Cole等,Monoclonal Antibodies and Cancer Therapy中pp.77-96,AlanR.Liss,Inc.,1985)或三体杂交瘤技术。用于产生杂交瘤的技术是众所周知的(通常见,Current Protocols in Immunology,Coligan等,编,John Wiley & Sons,New York,1994)。通过对杂交瘤培养物上清液筛选结合感兴趣多肽的抗体可检测产生本发明单克隆抗体的杂交瘤细胞,如,使用标准ELISA方法。
可选的为制备分泌单克隆抗体的杂交瘤,通过用感兴趣的多肽筛选组合免疫球蛋白文库(如,抗体噬菌体展示文库)可鉴定并分离抗本发明蛋白的单克隆抗体。用于产生和筛选噬菌体展示文库的试剂盒是商业上可获得的(如,Pharmacia重组噬菌体抗体系统,目录号27-9400-01;和Stratagene SurfZAP噬菌体展示试剂盒,目录号240612)。此外,特别适用于产生和筛选抗体展示文库的方法和试剂的例子可发现于,例如,美国专利第5,223,409号;PCT公开号WO 92/18619;PCT公开号WO 91/17271;PCT公开号WO 92/20791;PCT公开号WO92/15679;PCT公开号WO 93/01288;PCT公开号WO 92/01047;PCT公开号WO 92/09690;PCT公开号WO 90/02809;Fuchs等.(1991)Bio/Technology 9:1370-1372;Hay等.(1992)Hum.Antibod.Hybridomas3:81-85;Huse等.(1989)Science 246:1275-1281;Griffiths等.(1993)EMBO J.12:725-734。
本发明也提供了特异性结合本发明蛋白的重组抗体。在优选的实施方案中,该重组抗体特异性结合标记物蛋白或其片段。重组抗体包括,但不限于,嵌合和人源化单克隆抗体,包含人和非人部分,单链抗体或多特异性抗体。嵌合抗体是一种其中不同部分源自不同动物种类的分子,如那些具有源自鼠mAb的可变区和人免疫球蛋白恒定区的(参见如Cabilly等,美国专利第4,816,567号;和Boss等,美国专利第4,816,397号,其全文在此合并作为参考)。单链抗体具有由单个多肽组成的抗原结合位点。它们可通过本领域已知的技术生产,例如使用描述于Ladner等,美国专利第4,946,778号(其全文在此合并作为参考);Bird等,(1988)Science 242:423-426;Whitlow等,(1991)Methods in Enzymology 2:1-9;Whitlow等,(1991)Methods inEnzymology 2:97-105;和Huston等,(1991)Methods in EnzymologyMolecular Design and Modeling:Concepts and Applications 203:46-88的方法。多特异性抗体是具有至少两个特异性结合不同抗原的抗原结合位点的抗体分子。这样的分子可通过本领域已知的技术生产,例如使用描述于Segal,美国专利第4,676,980号(其所公开的全文在此合并作为参考);Holliger等,(1993)Proc.Natl.Acad.Sci.USA90:6444-6448;Whitlow等,(1994)Protein Eng.7:1017-1026和美国专利第6,121,424号的方法。
人源化抗体是来自非人物种的具有一或多个来自非人物种互补决定区(CDRS)和来自人免疫球蛋白分子框架区的抗体分子(参见如,Queen,美国专利第5,585,089号,其全文在此合并作为参考)。人源化单克隆抗体可通过本领域已知的重组DNA技术生产,例如使用描述于PCT公开号WO 87/02671;欧洲专利申请号184,187;欧洲专利申请号171,496;欧洲专利申请号173,494;PCT公开号WO86/01533;美国专利第4,816,567号;欧洲专利申请号125,023;Better等.(1988)Science240:1041-1043;Liu等.(1987)Proc.Natl.Acad.Sci.USA 84:3439-3443;Liu等.(1987)J.Immunol.139:3521-3526;Sun等.(1987)Proc.Natl.Acad.Sci.USA 84:214-218;Nishimura等.(1987)Cancer Res.47:999-1005;Wood等.(1985)Nature 314:446-449;和Shaw等.(1988)J.Natl.Cancer Inst.80:1553-1559);Morrison(1985)Science229:1202-1207;Oi等.(1986)Bio/Techniques 4:214;美国专利第5,225,539号;Jones等.(1986)Nature 321:552-525;Verhoeyan等.(1988)Science 239:1534;和Beidler等.(1988)J.Immunol.141:4053-4060。
更优选地,人源化抗体可产生自,例如,使用不能表达内源性免疫球蛋白重链和轻链基因,但能表达人重链和轻链基因的转基因小鼠。用选定的抗原,如相应于本发明标记物的多肽的全部或部分,以常规方法免疫转基因小鼠。使用常规杂交瘤技术可获得抗该抗原的单克隆抗体。通过在B细胞分化过程中转基因小鼠重排,进行了人免疫球蛋白转基因,和随后经历了类转换和体细胞突变。因此,使用该技术,可产生在治疗上有用的IgG、IgA和IgE抗体。用于生产人抗体该技术的综述见Lonberg和Huszar(1995)Int.Rev.Immunol.13:65-93)。用于生产人抗体和人单克隆抗体技术的详细讨论以及用于生产上述抗体的实验方法参见如美国专利第5,625,126号;美国专利第5,633,425号;美国专利第5,569,825号;美国专利第5,661,016号和美国专利第5,545,806号。此外,公司如Abgenix,Inc.(Freemont,CA)使用类似于上述的技术可允诺提供抗选定的抗原的人抗体。
使用称为“引导选择”的技术可产生识别选定表位的完整人抗体。在该方法中,选定的非人单克隆抗体,如鼠抗体,被用于引导选择识别相同表位的完整人抗体(Jespers等,1994,Bio/technology 12:899-903)。
本发明的抗体在产生(如,从对象的血液或血清)或合成后可通过众所周知的技术分离,并进一步纯化。例如,使用蛋白A层析可纯化IgG抗体。通过如亲和层析,对本发明蛋白特异的抗体可被选择或(如,部分纯化)或纯化。例如,如在本文中所描述的,产生重组表达和纯化(或部分纯化)的本发明的蛋白,并共价地或非共价地偶联到固相载体,如层析柱。接着用该柱子亲和纯化对本发明蛋白特异的抗体,该抗体来自含有抗许多表位的抗体的样本,因此产生了基本上纯化的抗体组合物,即,一种基本上不含有污染抗体的抗体。在上下文中,基本上纯化的抗体组合物表示抗体样本含有至多仅30%(干重)的污染抗体,该抗体所抗的表位不同于本发明所需蛋白的那些表位,和优选至多20%,还更优选至多10%,和最优选至多5%(干重)的样本是污染抗体。纯化的抗体组合物指组合物中至少99%的抗体是抗本发明所需蛋白。
在一个优选实施方案中,本发明基本上纯化的抗体可特异性结合本发明蛋白的信号肽、分泌序列、胞外域、跨膜或胞质域或细胞质膜。在一个特别优选的实施方案中,本发明基本上纯化的抗体特异性结合本发明蛋白氨基酸序列的分泌序列或胞外域。在一个更优选的实施方案中,本发明基本上纯化的抗体特异性结合标记物蛋白氨基酸序列的分泌序列或胞外域。
通过标准技术,如亲和层析或免疫沉淀,抗本发明蛋白的抗体可用于分离蛋白。此外,该抗体可用于检测标记物蛋白或其片段(如,在细胞裂解液或细胞上清液中)以评估标记物表达的水平和分布。该抗体也可用于诊断以监测组织或体液中(如,在子宫颈相关体液中)蛋白水平,作为临床试验程序的一部分,如,用于确定给定治疗的用药法的有效性。通过使用抗体衍生物,其包含偶联有可检测物质的本发明的抗体,可有利于检测。可检测物质的例子包括多种酶、辅基、荧光物质、发光物质、生物发光物质和放射性物质。合适的酶的例子包括辣根过氧化酶、碱性磷酸酶、β-半乳糖苷酶或乙酰胆碱酯酶;合适的辅基复合物的例子包括抗生物素蛋白链菌素/生物素和抗生物素蛋白/生物素;合适的荧光物质的例子包括伞形酮、荧光素、异硫氰酸荧光素、若丹明、二氯三吖嗪胺荧光素(dichlorotriazinylaminefluorescein)、丹磺酰氯或藻红蛋白;发光物质的例子包括鲁米诺;生物发光物质的例子包括荧光酶、虫荧光素和水母发光蛋白,以及合适的放射性物质的例子包括125I、131I、35S或3H。
在治疗癌症中本发明的抗体也可用作为治疗剂。在一个优选实施方案中,本发明完整的人抗体被用于治疗性处理人癌症患者,特别是那些患子宫颈癌的患者。在另一个优选实施方案中,特异性结合标记物蛋白或其片段的抗体被用于治疗性处理。此外,该治疗性抗体可以是抗体衍生物或免疫毒素,包含缀合有治疗部分如细胞毒素、治疗剂或放射性金属离子的抗体。细胞毒素或细胞毒素剂包括任何对细胞有害的试剂。例子包括紫杉醇、细胞松弛素B、短杆菌肽D、溴化乙锭、吐根碱、丝裂霉素、鬼臼乙叉甙、鬼臼噻吩苷、长春新碱、长春碱、秋水仙碱、阿霉素、柔红霉素、二羟基炭疽菌素二酮(dihydroxyanthracin dione)、米托蒽醌、光辉霉素,放线菌素D、1-去氢睾甾酮、糖皮质激素、普鲁卡因、丁卡因、利多卡因、萘氧丙醇胺和嘌呤霉素以及它们的类似物或同系物。治疗剂包括,但不限于,抗代谢物(如,甲氨蝶呤、6-巯基嘌呤、6-硫鸟嘌呤、阿糖胞苷、5-氟尿嘧啶氨烯咪胺),烷化剂(如,氮芥、thioepa苯丁酸氮芥、苯丙氨酸氮芥、卡氮芥(BSNU)和罗氮芥(CCNU)、cyclothosphamide、白消安、二溴甘露醇、链唑霉素、丝裂霉素C和顺铂(II)(DDP)),蒽环类抗生素(如,柔红霉素(原柔红霉素)和阿霉素),抗生素(如,放线菌素D(原放线菌素)、博来霉素、光辉霉素和安曲霉素(AMC)),和抗有丝分裂剂(如,长春新碱和长春碱)。
本发明缀合的抗体可用于减轻特定的生物反应,对于药物部分而言,并不解释为限制经典的化学治疗剂。例如,药物部分可以是具有所需生物活性的蛋白或多肽。该蛋白可包括,例如,毒素,如核糖体抑制蛋白(见,Better等,美国专利第6,146,631号,其所公开的全文在此合并作为参考),相思豆毒素、蓖麻毒素A、假单胞菌外毒素或白喉毒素;蛋白,如肿瘤坏死因子、α-干扰素、β-干扰素、神经生长因子、血小板衍生的生长因子、组织纤维蛋白溶酶原激活剂;或,生物反应调节剂,如,淋巴因子、白介素-1(“IL-1”)、白介素-2(“IL-2”)、白介素-6(“IL-6”)、粒细胞-巨噬细胞集落刺激因子(“GM-CSF”)、粒细胞集落刺激因子(“G-CSF”)或其它生长因子。
用于将上述治疗部分缀合到抗体的技术是众所周知的,参见如,Arnon等,“Monoclonal Antibodies ForImmunotargeting Of Drugs InCancer Therapy”,in Monoclonal Antibodies And Cancer Therapy,Reisfeld等.(编),pp.243-56(Alan R.Liss,Inc.1985);Hellstrom等,“Antibodies For Drug Delivery”,in Controlled Drug Delivery(第二版),Robinson等.(编),pp.623-53(Marcel Dekker,Inc.1987);Thorpe,“Antibody Carriers Of Cytotoxic Agents In Cancer Therapy:A Review”,in Monoclonal Antibodies′84:Biological And ClinicalApplications,Pinchera,等,(编),pp.475-506(1985);“Analysis,Results,And Future Prospective Of The Therapeutic Use OfRadiolabeled Antibody In Cancer Therapy”,in Monoclonal AntibodiesFor Cancer Detection And Therapy,Baldwin等,(编),pp.303-16(Academic Press 1985),和Thorpe等,“THE Preparation AndCytotoxic Properties Of Antibody-Toxin Conjugates”,Immunol.Rev.,62:119-58(1982)。
因此,在一方面,本发明提供了基本上纯化的抗体、抗体片段和衍生物,其全部都特异性结合本发明的蛋白,以及优选地,结合标记物蛋白。在各种实施方案中,本发明基本上纯化的抗体,或其片段或衍生物,可以是人、非人、嵌合和/或人源化抗体。在另一方面,本发明提供了非人抗体、抗体片段和衍生物,其全部都特异性结合本发明的蛋白,以及优选地,结合标记物蛋白。上述非人抗体可以是山羊、小鼠、绵羊、马、小鸡、兔或大鼠抗体。可选地,本发明的非人抗体可以是嵌合和/或人源化抗体。此外,本发明的非人抗体可以是多克隆抗体或单克隆抗体。还在另一方面,本发明提供了单克隆抗体、抗体片段和衍生物,其全部都特异性结合本发明的蛋白,以及优选地,结合标记物蛋白。单克隆抗体可以是人、人源化、嵌合和/或非人抗体。
本发明也提供了一种试剂盒,其含有缀合有可检测物质的本发明抗体和使用说明书。本发明的另一方面是包含本发明抗体的药物组合物。在一个优选实施方案中,药物组合物包含一种本发明的抗体和一种药学上可接受的载体。
III.重组表达载体和宿主细胞
本发明的另一方面涉及载体,优选表达载体,含有编码标记物蛋白(或该蛋白一部分)的核酸。在本文中使用时,术语“载体”指能转运与它连接的另一种核酸的核酸分子。一种类型的载体是“质粒”,指一种环状双链DNA,在它上面可以连接其它DNA片段。另一种类型的载体是病毒载体,可以将其它DNA片段连接到该病毒基因组上。某些载体在其所导入的宿主细胞中能自主复制(如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其它载体(如,非附加型哺乳动物载体)在导入该宿主细胞的条件下被整合入宿主细胞基因组中,以及因此与宿主基因组一起复制。此外,某些载体,称为表达载体,能指导可操作地与它连接的基因的表达。一般而言,在重组DNA技术中所用的表达载体通常是质粒(载体)的形式。然而,本发明还包括这样的其它形式的表达载体,如病毒载体(如,复制缺陷型反转录病毒、腺病毒和腺伴随病毒),它们能发挥相同的功能。
本发明的重组表达载体包含本发明的核酸,其以合适于在宿主细胞中表达该核酸的形式存在。意味着该重组表达载体包括一或多种调节序列,根据要用于表达的宿主细胞选择该序列,其可操作地连接要表达的核酸序列。重组表达载体中“可操作地连接”规定为表示感兴趣的核苷酸序列以一种能够表达该核苷酸序列的方式连接到调节序列(如,当该载体导入宿主细胞时,存在一种体外转录/翻译系统或宿主细胞中)。术语“调节序列”意在包括启动子、增强子和其它表达调控元件(如,多腺苷酸化信号)。上述调节序列被描述,例如,于Goeddel,Methods in Enzymology:Gene Expression Technology vol.185,Academic Press,San Diego,CA(1991)中。调节序列包括那些在许多种宿主细胞中指导核苷酸序列组成型表达的和那些仅在某些宿主细胞中指导核苷酸序列表达的序列(如,组织特异性调节序列)。本领域的技术人员可以理解的是表达载体的设计可基于这些因素,如所选择的要转化的宿主细胞、所需蛋白的表达水平和类似的。本发明的表达载体可导入宿主细胞中,因此产生蛋白或多肽,包括融合蛋白或多肽,由本文所述的核酸编码。
本发明的重组表达载体可设计用于在原核(如,大肠杆菌)或真核细胞(如,昆虫细胞{使用杆状病毒表达载体}、酵母细胞或哺乳动物细胞)中表达标记物蛋白或其片段。合适的宿主细胞进一步讨论于Goeddel,出处同上。可选地,重组表达载体可在体外转录并翻译,例如使用T7启动子调节序列和T7聚合酶。
在原核生物中进行的蛋白表达最通常在大肠杆菌中进行,采用含有指导融合或非融合蛋白表达的组成型或诱导型启动子的载体。融合载体添加许多氨基酸到编码蛋白中,通常在重组蛋白的氨基末端。上述融合载体一般提供三种用途:1)增加重组蛋白的表达;2)增加重组蛋白的可溶性;和3)通过在亲和纯化中作为配体有助于重组蛋白的纯化。通常,在融合表达载体中,在融合部分和重组蛋白连接处导入蛋白酶裂解位点,以便能够在纯化融合蛋白后将重组蛋白与融合部分分离。上述酶和它们的相关识别序列,包括因子Xa、凝血酶和肠激酶。典型的融合表达载体包括分别与目标重组蛋白融合有谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A的pGEX(Pharmacia BiotechInc;Smith和Johnson,1988,Gene 67:31-40),pMAL(New EnglandBiolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ)。
合适的诱导型非融合大肠杆菌表达载体的例子包括pTrc(Amann等,1988,Gene 69:301-315)和pET 11d(Studier等,p.60-89,GeneExpression Technology:Methods in Enzymology vol.185,AcademicPress,San Diego,CA,1991)。来自pTrc载体的目标基因表达取决于从杂交的trp-lac融合启动子启动的宿主RNA聚合酶转录。来自pET11d载体的目标基因表达取决于从T7gn10-lac融合启动子启动的通过病毒RNA聚合酶(T7gn1)共表达介导的转录。在lacUV5启动子转录控制的条件下,通过T7 gn1基因的驻留原噬菌体的宿主菌株BL21(DE3)或HMS174(DE3)提供了病毒聚合酶。
一种使大肠杆菌中重组蛋白表达增强的方法是在具有受抑制的蛋白酶裂解重组蛋白能力的细菌宿主中表达该蛋白(Gottesman,p.119-128,Gene Expression Technology:Methods in Enzymology vol.185,Academic Press,San Diego,CA,1990)。另一种方法是改变要被插入表达载体的核酸的核酸序列,使得对于每个氨基酸而言各自的密码子是那些在大肠杆菌中能优先利用的(Wada等,1992,Nucleic AcidsRes.20:2111-2118)。上述本发明核酸序列的改变可通过标准的DNA技术进行。
在另一个实施方案中,表达载体是酵母表达载体。在酿酒酵母(S.Cerevisiae)中用于表达的载体的例子包括pYepSec1(Baldari等,1987,EMBO J.6:229-234),pMFa(Kurjan和Herskowitz,1982,Cell 30:933-943),pJRY88(Schultz等,1987,Gene 54:113-123),pYES2(Invitrogen Corporation,San Diego,CA)和pPicZ(InvitrogenCorp,San Diego,CA)。
可选地,表达载体是杆状病毒表达载体。可用于在培养的昆虫细胞(如,Sf9细胞)中表达蛋白的杆状病毒表达载体包括pAc系列(Smith等,1983,Mol.Cell.Biol.3:2156-2165)和pVL系列(Luchlow和Summers,1989,Virology 170:31-39)。
还在另一个实施方案中,使用哺乳动物表达载体在哺乳动物细胞中表达本发明的核酸。哺乳动物表达载体的例子包括pCDM8(Seed,1987,Nature 329:840)和pMT2PC(Kaufman等,1987,EMBO J.6:187-195)。当用于哺乳动物细胞时,表达载体的控制功能通常提供自病毒调控元件。例如,一般使用的启动子是来源自多瘤病毒、腺病毒2、巨细胞病毒和猿猴病毒40。其它合适于原核和真核细胞的表达系统见Sambrook等,出处同上,的16和17章。
在另一个实施方案中,重组哺乳动物表达载体能够优先在特定细胞类型中指导核酸表达(如,组织特异性调控元件被用于表达核酸)。组织特异性调控元件为本领域已知。合适的组织特异性启动子非限制性例子包括白蛋白启动子(肝特异性;Pinkert等,1987,Genes Dev.1:268-277),淋巴特异性启动子(Calame和Eaton,1988,Adv.Immunol.43:235-275),特别是T细胞受体(Winoto和Baltimore,1989,EMBOJ.8:729-733)和免疫球蛋白的启动子(Banerji等,1983,Cell33:729-740;Queen和Baltimore,1983,Cell 33:741-748),神经细胞特异性启动子(如,神经微丝启动子;Byrne和Ruddle,1989,Proc.Natl.Acad.Sci.USA 86:5473-5477),胰腺特异性启动子(Edlund等,1985,Science 230:912-9160)和乳腺特异性启动子(如,牛奶乳清启动子;美国专利第4,873,316号和欧洲专利公开号264,166)。也包含发育调节启动子,例如鼠hox启动子(Kessel和Gruss,1990,Science249:374-379)和α-胎蛋白启动子(Camperand Tilghman,1989,GenesDev.3:537-546)。
本发明进一步提供了包含克隆入表达载体反义方向的本发明DNA分子的重组表达载体。就是说,该DNA分子以一种允许RNA分子表达的方式(通过该DNA分子的转录)可操作地连接调节序列,该RNA分子反义于编码本发明多肽的mRNA。与克隆入反义方向核酸可操作地连接的调节序列可选自指导反义RNA分子在不同细胞中连续表达的序列,例如病毒启动子和/或增强子,或调节序列可选自指导反义RNA组成型、组织特异性或细胞特异性表达的序列。反义表达载体可以是重组质粒、噬菌粒或减毒病毒,其中在高效调节区调控下产生反义核酸,其活性可通过该载体导入的细胞类型来决定。调节使用反义基因的基因表达的讨论见Weintraub等,1986,Trends in Genetics,Vol.1(1)。
本发明的另一方面涉及已导入本发明重组表达载体的宿主细胞。术语“宿主细胞”和“重组宿主细胞”在本文中可交换地使用。可以理解的是该术语不仅指特定的受试者细胞,也指该细胞后代或潜在的后代。因为,由于突变或环境影响,某些修饰可存在于后代中,所以后代实际上与亲本细胞并不相同,但仍包括在本文中所使用的该术语的范围内。
宿主细胞可以是任何原核(如,大肠杆菌)或真核细胞(如,昆虫细胞、酵母或哺乳动物细胞)。
通过常规的转化或转染技术,载体DNA可导入原核或真核细胞中。在本文中使用时,术语“转化”和“转染”规定为指将外源核酸导入宿主细胞的多种本领域公认的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染或电穿孔。合适用于转化或转染宿主细胞的方法可发现于Sambrook等(出处同上),和其它实验室手册。
为了稳定转染哺乳动物细胞,业已了解的是,根据所使用的表达载体和转染技术,仅有少数细胞可将外源DNA整合入它们基因组中。为鉴定和选择这些整合体,通常将编码选择标记(如,对抗生素有抗性的)的基因与感兴趣的基因一同导入宿主细胞中。优选的选择标记包括那些对药物如G418、潮霉素和甲氨蝶呤具抗性的标记。具有导入核酸的稳定转染细胞可通过药物筛选来鉴定(如,已整合选择标记的细胞将存活,而其它细胞则死亡)。
本发明的一种宿主细胞,如培养中的原核或真核宿主细胞可用于产生标记物蛋白或其片段。因此,本发明进一步提供了使用本发明的宿主细胞用于生产标记物蛋白或其片段的方法。在一个实施方案中,该方法包含在合适的培养基中培养本发明的宿主细胞(其中导入了编码标记物蛋白或其片段的重组表达载体),使得产生标记物蛋白或其片段。在另一个实施方案中,该方法进一步包含从培养基或宿主细胞中分离标记物蛋白或其片段。
本发明的宿主细胞也可用于产生非人转基因动物。例如,在一个实施方案中,本发明的宿主细胞是已导入编码标记物蛋白或其片段的序列的受精卵母细胞或胚胎干细胞。接着,该宿主细胞可用于产生非人转基因动物,其中编码本发明标记物蛋白的外源基因序列已导入它们的基因组中,或产生同源重组动物,其中编码标记物蛋白的外源基因已改变。上述动物可用于研究标记物蛋白的功能和/或活性,以及用于鉴定和/或评估标记物蛋白的调节剂。在本文中使用时,“转基因动物”指非人动物,优选哺乳动物,更优选啮齿动物如大鼠或小鼠,其中一或多个动物细胞包括转基因。其它的转基因动物的例子包括非人灵长类、绵羊、狗、奶牛、山羊、小鸡、两栖动物等。转基因是外源DNA,其整合入发育的转基因动物的细胞基因组中,以及在成熟动物的基因组中仍存在,因此在该转基因动物一或多种细胞型或组织中指导编码基因产物的表达。在本文中使用时,“同源重组动物”指非人动物,优选哺乳动物,更优选小鼠,其中在动物发育前,通过内源基因和导入动物细胞(如动物的胚细胞的)外源DNA分子之间同源重组改变了内源基因。
可通过将编码标记物蛋白的核酸导入受精卵母细胞的雄性原核中产生本发明的转基因动物,如通过显微注射、反转录病毒感染和将卵母细胞在假孕雌性养育动物体中发育。在转基因中也包括内含子序列和多腺苷酸化信号以增加该转基因表达效率。组织特异性调节序列可操作地与转基因连接以指导本发明多肽在特定细胞中的表达。通过胚胎操作和显微注射用于产生转基因动物,特别是动物,如小鼠的方法,已经成为本领域的常规方法,以及描述于,例如,美国专利第4,736,866号和4,870,009号,美国专利第4,873,191号和Hogan,Manipulating theMouse Embryo,Cold Spring HarborLaboratory Press,Cold SpringHarbor,N.Y.,1986中。类似的方法被用于产生其它的转基因动物。基于在其基因组中转基因的存在和/或编码转基因的mRNA在该动物组织或细胞中的表达可鉴定转基因生成动物。接着,转基因生成动物可用于繁殖带有转基因的其它动物。此外,具有转基因的转基因动物可进一步培育成具有其它转基因的转基因动物。
为产生同源重组动物,制备含有编码标记物蛋白的基因的至少一部分的载体,在该基因中已导入缺失、添加或取代,因此改变了该基因,如,功能上破坏。在一个优选实施方案中,载体可设计使得在同源重组下,内源基因功能上受到破坏(即,不再编码功能蛋白;也称为“敲除”载体)。可选地,载体可设计使得在同源重组下,内源基因突变或以别的方式改变,但仍然编码功能蛋白(如,上游调控区可改变,由此改变了该内源蛋白的表达)。在同源重组载体中,基因改变的部分在其5′和3′末端侧接有额外的基因核酸,以便于在载体携带的外源基因与胚胎干细胞中内源基因之间的同源重组产生。额外的侧接核酸序列具有足够的长度以便于成功地与内源基因同源重组。通常,几千个碱基的侧接DNA(在5′和3′末端)包括在载体中(参见如Thomas和Capecchi,1987,Cell 51:503 for a description of homologousrecombination vectors)。该载体被导入胚胎干细胞系中(如,通过电穿孔),以及该细胞中导入的基因已与选定的内源基因同源重组(参见如,Li等,1992,Cell 69:915)。接着将选定的细胞注射到动物(如,小鼠)胚泡中以形成凝聚嵌合体(参见如Bradley,Teratocarcinomas andEmbryonic Stem Cells:A Practical Approach,Robertson,编.,IRL,Oxford,1987,pp.113-152)。接着,嵌合胚被植入合适的假孕雌性养育动物体中,并让该胚胎发育成熟。在它们生殖细胞中获得了同源重组DNA的后代可用于繁殖动物,其中通过种系传递转基因,该动物的所有细胞含有同源重组DNA。用于构建同源重组载体和同源重组动物的方法进一步描述于Bradley(1991)Current Opinion inBio/Technology 2:823-829和PCT公开号WO 90/11354,WO 91/01140,WO 92/0968,和WO 93/04169中。
在另一个实施方案中,可产生转基因非人动物,其含有能够调节转基因表达的选择系统。该系统的一个例子是噬菌体P1的cre/loxP重组酶系统。对于cre/loxP重组酶系统的描述参见如,Lakso等.(1992)Proc.Natl.Acad.Sci.USA 89:6232-6236。另一个重组酶系统的例子是酿酒酵母(Saccharomyces cerevisiae)的FLP重组酶系统(O′Gorman等,1991,Science 251:1351-1355)。如果cre/loxP重组酶系统用于调节转基因的表达,需要含有编码Cre重组酶和一种选定蛋白的转基因的动物。可通过构建“双”转基因动物来提供上述动物,如,通过将两种转基因动物交配,一种含有编码一种选定蛋白的转基因和另一种含有编码重组酶的转基因。
根据描述于Wilmut等.(1997)Nature 385:810-813和PCT公开号WO 97/07668及WO 97/07669中的方法也可产生非人转基因动物的克隆。
IV.药物组合物
可将本发明的核酸分子、多肽、和抗体(在本文中也被称为“活性化合物”)掺入适合施用的药物组合物中。所述所述组合物通常包含所述核酸分子、蛋白或抗体以及药学上可接受载体。在本文中所使用的术语“药学上可接受载体”意在包括与药用施用相容的任何或所有溶剂、分散介质、包衣剂、抗细菌和抗真菌剂、等渗和缓释吸收剂,及类似物。用于药用活性物质的所述介质和制剂的使用在本领域中是众所周知的。除非与所述活性化合物不相容,任何常见介质或制剂都可预见应用于所述组合物中。还可将补充性活性化合物掺入所述组合物中。
本发明包括制备调节核酸或蛋白标记物表达或活性的药物组合物的方法。所述方法包括把药学上可接受载体与调节核酸或蛋白标记物表达或活性的试剂相配伍。所述方法可进一步包括额外的活性物质。因此,本发明进一步包括用于制备药物组合物的方法,包括将药学上可接受载体与调节核酸或蛋白标记物表达或活性的试剂和一或多种额外的活性物质相配伍。
本发明也提供了鉴定调节物的方法(在本文中也被称为“筛选试验”),调节物即候选或受试化合物或试剂(如,肽、模拟肽、类肽、小分子或其它药物),其可以(a)与所述标记物结合,或(b)对所述标记物活性具有调节(如,刺激或抑制)效应,或更特别地(c)对所述标记物与其一个或多个天然底物(如,肽、蛋白、激素、辅因子或核酸)的相互作用具有调节效应,或(d)对所述标记物的表达具有调节效应。所述试验通常包含在所述标记物和一或多个试验成分之间的反应。其它成分可以是受试化合物本身,或是受试化合物与所述标记物天然结合配体的组合物。
本发明的受试化合物可从任何可能的来源获得,包括天然和/或合成化合物的系统文库。受试化合物也可通过本领域已知众多组合文库方法中的任一方法而获得,包括:生物文库;类肽文库(具有肽功能以及新的、非肽主链的分子文库,其抗酶降解但仍然具有生物活性;参见如Zuckermann等,1994,J.Med.Chem.37:2678-85);立体寻址的平行固相或液相文库;需要解卷积的合成文库方法;“一珠一化合物”文库方法;以及使用亲合层析选择的合成文库方法。所述生物文库和类肽文库方法仅限用于肽文库,而所述其它四种方法可适用于化合物的肽、非肽寡聚物或小分子文库(Lam,1997,Anticancer Drug Des.12:145)。
分子文库合成方法的例子可在现有技术中找到,例如在:DeWitt等.(1993)Proc.Natl.Acad.Sci.U.S.A.90:6909;Erb等.(1994)Proc.Natl.Acad.Sci.USA 91:11422;Zuckermann等(1994).J.Med.Chem.37:2678;Cho等(1993)Science 261:1303;Carrell等(1994)Angew.Chem.Int.Ed.Engl 33:2059;Carell等(1994)Angew.Chem.Int.Ed.Engl 33:2061;以及在Gallop等(1994)J.Med.Chem.37:1233。
化合物文库可呈溶液形式(如,Houghten,1992,Biotechniques13:412-421),或在珠(Lam,1991,Nature 354:82-84)、芯片(Fodor,1993,Nature 364:555-556)、细菌和/或孢子(Ladner,美国专利第5,223,409号)、质粒(Cull等,Proc.Natl.Acad.Sci.USA 1992,89:1865-1869)上或在噬菌体上(Scott和Smith,1990,Science249:386-390;Devlin,1990,Science 249:404-406;Cwirla等,1990,Proc.Natl.Acad.Sci.87:6378-6382;Felici,1991,J.Mol.Biol.222:301-310;Ladner,出处同上)。
在一个实施方案中,本发明提供了筛选候选或受试化合物的试验方法,其中所述化合物是蛋白的底物,所述蛋白由标记物或其生物活性部分编码或相应于标记物或其生物活性部分。在另一个实施方案中,本发明提供了筛选候选或受试化合物的试验方法,其中所述化合物与蛋白结合,所述蛋白由标记物或其生物活性部分编码或相应于标记物或其生物活性部分。可进行受试化合物直接与蛋白结合能力的测定,例如通过将所述化合物与放射性同位素或酶标记偶联,从而使所述化合物与标记物的结合可通过检测复合物中标记的标记物化合物来测定。例如,化合物(如标记物底物)可用125I、35S、14C或3H直接或间接地,以及能用放射辐射直接计数或闪烁计数检测的同位素来标记。可选地,试验成分可用如辣根过氧化物酶、碱性磷酸酶或荧光素酶、以及能检测合适底物转化为产物的酶标记来进行酶标记。
在另一个实施方案中,本发明提供了筛选候选或受试化合物的试验方法,其中所述化合物调节标记物的表达或蛋白的活性,所述蛋白由标记物或其生物活性部分编码或相应于标记物或其生物活性部分。在所有的可能性中,由标记物或其生物活性部分编码或相应于标记物或其生物活性部分的蛋白可在体内与一或多个分子相互作用,例如但不仅限于,肽、蛋白、激素、辅因子和核酸。为了论述的目的,所述细胞和细胞外分子在本文中被称为“结合配体”或标记物“底物”。
为了便于所述筛选,本发明的一个必要实施方案是使用由标记物或其生物活性部分编码或相应于标记物或其生物活性部分的蛋白鉴定蛋白天然的体内结合配体。对于本领域技术人员而言,有许多已知的方法可完成上述筛选。一个例子是在双杂交实验或三杂交实验中把标记物蛋白用作为“诱饵蛋白”(参见如美国专利第5,283,317号;Zervos等,1993,Cell 72:223-232;Madura等,1993,J.Biol.Chem.268:12046-12054;Bartel等,1993,Biotechniques 14:920-924;Iwabuchi等,1993 Oncogene 8:1693-1696;Brent WO94/10300),以鉴定能与所述标记物(结合配体)结合或相互作用的其它蛋白,并因此可能涉及所述标记物的天然功能。所述标记物结合配体也可能涉及通过标记物蛋白或标记物蛋白介导的信号途径的下游元件进行的信号传播。可选地,所述标记物蛋白结合配体也被发现可以是所述标记物蛋白的抑制剂。
双杂交系统是基于大多数转录因子组件性质的,其由可分离的DNA结合和活化结构域组成。简而言之,所述试验方法利用两个不同的DNA构建体。在一个构建体中,编码标记物蛋白的基因与编码已知转录因子(如,GAL-4)的DNA结合域的基因融合。在另一个构建体中,来自DNA序列文库的编码未鉴定蛋白(“猎物”或“样本”)的DNA序列与编码已知转录因子活化结构域的基因融合。如果“诱饵”和“猎物”蛋白能在体内相互作用,形成标记物依赖的复合物,则转录因子的DNA结合和活化结构域变得很靠近。这种靠近使得与转录调节位点可操作地相连的报告基因(如,LacZ)的转录对转录因子相应。报告基因的表达可容易地被检测出,并且包括功能性转录因子的细胞集落可被分离并用于获得克隆的基因,所述基因编码与所述标记物蛋白相互作用的蛋白。
在另一个实施方案中,为鉴定调节(如正或负效应)标记物蛋白与其底物和/或结合配体之间相互作用的化合物,可通过应用本发明来设计试验方法。所述化合物可包括,但不仅限于,诸如抗体、肽、激素、寡核苷酸、核酸及其类似物的分子。所述化合物也可从任何可能的来源中获得,包括天然和/或合成化合物的系统文库。用于本实施方案中的优选的试验成分是在本文中鉴定出的子宫颈癌标记物蛋白、已知的结合配体和/或相同的底物、以及受试化合物。受试化合物可从任何来源获得。
用于鉴定干扰所述标记物蛋白与其结合配体之间相互作用的化合物的试验系统的基本原理涉及在足以使两个产物相互作用和结合从而形成复合物的条件和时间下,制备包括标记物蛋白及其结合配体的反应混合物。为测试试剂的抑制活性,在受试化合物存在或不存在的条件下制备反应混合物。受试化合物可一开始就包括在反应混合物中,或在加入标记物蛋白及其结合配体后再被添加。对照反应混合物在不存在受试化合物或具有安慰剂的条件下温育。然后检测所述标记物蛋白及其结合配体之间形成的任一复合物。对照反应中形成复合物,但在包含受试化合物的反应混合物中较少或没有所述的形成,表明所述化合物干扰标记物蛋白及其结合配体的相互作用。反之,在存在化合物的条件下比对照反应中形成了更多的复合物,表明所述化合物可增强标记物蛋白及其结合配体的相互作用。
可以异质(heterogeneous)或同质(homogeneous)形式进行干扰标记物蛋白及其结合配体相互作用的化合物的试验。异质试验包括把标记物蛋白或其结合配体锚定在固相上并在反应后检测锚定在固相上的复合物。同质试验中,在液相中进行整个反应。在两种方法中,可以改变添加反应物的顺序以获得不同的关于受试化合物的信息。例如,干扰标记物蛋白及其结合配体相互作用(如通过竞争)的化合物可通过在存在受试物质的条件下进行反应来鉴定,即在标记物及其相互反应的结合配体加入前或同时把受试物质加进反应混合物。可选地,受试化合物破坏形成的复合物,如能置换复合物中一个具有较高结合常数的化合物,可通过在复合物形成后把受试化合物加入反应混合物中来进行测试。所述不同的方式简要描述如下。
在异质试验系统中,标记物蛋白或其结合配体锚定在固体表面或基质上,而其它相应的非锚定成分可直接或间接地被标记。实际上,微滴定板常用于该方法。通过许多非共价或共价的方法固定锚定的物种,这些方法对本领域所属技术人员来说通常是众所周知的。经常仅通过用标记物蛋白或其结合配体溶液包被固体表面并烘干来进行非共价结合。可选地,锚定固定的试验成分的特异性抗体也可用于此。所述表面经常被预制备并储存起来。
在相关的实施方案中,提供一种融合蛋白,其增加了使一或两个试验成分锚定于基质的结构域。例如,谷胱甘肽-S-转移酶/标记物融合蛋白或谷胱甘肽-S-转移酶/结合配体可吸附于谷胱甘肽琼脂糖珠(Sigma Chemical,St.Louis,MO)或谷胱甘肽衍生化的微滴定板上,然后其与受试化合物,或与受试化合物与非吸附标记物或其结合配体化合,并且所述混合物在有利于形成复合物的条件(如生理条件)下温育。温育后,洗涤珠或微滴定板上的孔以直接或间接除去任何未结合的试验成分、未固定的试验复合物,例如,如上所述的。可选地,所述复合物可从基质上解离,并可利用标准技术确定标记物结合或活性水平。
其它把蛋白固定于基质上的技术也可用于本发明的筛选试验中。例如,标记物蛋白或标记物蛋白结合配体可以利用缀合生物素和抗生物素蛋白链菌素来固定。利用本领域已知技术(如,生物素化试剂盒,Pierce Chemicals,Rockford,IL)用生物素-NHS(N-羟基-琥珀酰亚胺)制备生物素化的标记物蛋白或靶分子,并固定于抗生物素蛋白链菌素包被的96孔板(Pierce Chemical)的孔中。在某些实施方案中,可预制备蛋白固定的表面并储存起来。
为了进行所述测试,固定的试验成分的相应部分与或不与受试化合物一起暴露于包被的表面。反应完成后,除去(如洗去)未反应的试验成分以及任何形成的复合物仍然固定于固相表面上。有许多方法可进行锚定在固相表面上的复合物的检测。在预标记的未固定的成分的位置,检测到固定在表面上的标记表明形成了复合物。在没有预标记的未固定的成分的位置,一种间接标记可用于检测锚定在表面上的复合物;如,利用对最初未固定物特异性的标记的抗体(所述抗体依次可直接标记或用如标记的抗Ig抗体来间接标记)。根据加入反应成分的顺序,可检测调节(抑制或增强)复合物形成的或破坏预形成复合物的受试化合物。
在本发明替换的实施方案中,可使用同质试验。这通常是一个与上述那些反应相似的反应,其在受试化合物存在或不存在的条件下在液相中进行。然后从未反应的成分中分离生成的复合物,并测定复合物的生成量。如异质试验系统所述的,反应物加入液相的顺序可得出受试化合物调节(抑制或增强)复合物形成和破坏预形成复合物的信息。
在所述的同质试验中,通过使用众多标准技术,包括但不仅限于:差速离心、层析、电泳和免疫沉淀,从未反应的试验成分中分离反应产物。在差速离心中,通过一系列离心步骤,根据基于复合物不同大小和密度的不同沉淀平衡状态,复合的分子可从未复合的分子中分离出来(参见如,Rivas,G.,和Minton,A.P.,Trens Biochem Sci 1993Aug;18(8):284-7)。标准的层析技术也可用于从未复合的分子中分离复合的分子。例如,凝胶过滤层析以大小为基础,并通过利用层析柱中合适的凝胶过滤树脂分离分子,例如,相对较大的复合物可从相对较小的未复合成分中分离出来。相似地,复合物较之未复合分子相对不同的电荷性质可用来从残留的反应物单体中特异分离所述复合物,例如通过应用离子交换层析树脂。所述树脂和层析技术对本领域技术人员而言是众所周知的(参见如,Heegaard,1998,J Mol.Recognit11:141-148;Hage和Tweed,1997,J.Chromatogr.B.Biomed.Sci.Appl.,699:499-525)。也可用凝胶电泳从未结合物中分离复合的分子(参见如,Ausubel等(编),Current Protocols in Molecular Biology,J.Wiley & Sons,New York.1999)。例如,在该技术中,蛋白或核酸复合物根据大小或电荷来分离。为了在电泳过程中保持互相结合作用,通常优选不存在还原剂的变性胶,而适合特定相互作用物的条件对于本领域技术人员来说是众所周知的。免疫沉淀是另一种用于从溶液中分离蛋白质-蛋白质复合物的常用技术(参见如,Ausubel等(编),Current Protocols in Molecular Biology,J.Wiley & Sons,New York.1999)。在该技术中,通过将抗体与可便于离心收集的多聚物珠缀和,与特异于结合分子之一的抗体结合的所有蛋白可从溶液中沉淀出来。所述结合的试验成分从珠中释放出来(通过特异性酶解过程或其它不干扰复合物中蛋白质-蛋白质相互作用的众所周知的技术),并进行第二步免疫沉淀,这次利用的是对相应地不同相互反应性的试验成分的特异的抗体。在该方法中,仅有形成的复合物仍将附着于珠上。可以比较在受试化合物存在或不存在的条件下复合物形成的变化,从而提供了与调节标记物蛋白及其结合体的化合物的能力相关的信息。
在同质或异质试验系统中,不进行进一步样本操作而直接检测标记物蛋白及其天然结合配体和/或受试化合物之间相互作用的方法也在本发明的范围之内。例如,可用荧光能量转换技术(参见如Lakowicz等,美国专利第5,631,169号;Stavrianopoulos等,美国专利第4,868,103号),一般而言,该技术包括在第一“供体”分子(如标记物或受试化合物)上添加荧光标记从而通过第二“受体”分子(如标记物或受试化合物)上的荧光标记吸收发出的荧光能量,接着基于吸收的能量而发出荧光。可选地,“供体”蛋白分子可仅利用色氨酸残基的天然荧光能量。选择释放不同光波长的标记,从而使“受体”分子标记可与“供体”分子区分。由于标记间能量转换的效率与分子分离距离相关,因此可测定分子间空间关系。在分子之间发生结合的条件下,在所述试验中“受体”分子标记的荧光发射应最大化。可通过众所周知的标准荧光检测方法(如利用荧光计)方便地测量FET结合情况。能参与增强或阻止预形成复合物中的一种物质的受试物质会导致与背景不同的信号产生。在这种方法中,在控制的试验中可鉴定调节标记物和其结合体相互作用的受试物质。
在另一个实施方案中,用一种方法鉴定标记物表达的调节分子,其中细胞与候选化合物接触并测定细胞中mRNA或蛋白标记物的表达。将存在候选化合物的mRNA或蛋白标记物的表达水平与不存在候选化合物的mRNA或蛋白质标记物的表达水平相比较。然后根据该比较结果,候选化合物可被鉴定为标记物表达的调节分子。例如,mRNA或蛋白标记物在存在候选化合物的条件下比不存在时表达得更多(统计上明显更多)时,则所述候选化合物就被鉴定为mRNA或蛋白标记物表达的刺激因子。相反地,mRNA或蛋白标记物在存在候选化合物的条件下比不存在时表达得更少(统计上明显更少)时,则所述候选化合物就被鉴定为mRNA或蛋白标记物表达的抑制因子。通过在本文中所述的检测mRNA或蛋白标记物的方法可以确定细胞中mRNA或蛋白标记物的表达水平。
在另一方面,本发明涉及在本文中所述的两个或更多试验的组合。例如,利用基于细胞的或无细胞的试验,可以鉴定调节试剂,并在体内可进一步确证试剂调节蛋白标记物活性的能力,如在完整动物模型中的细胞转化和/或肿瘤发生。
本发明进一步涉及由上述筛选试验鉴定的新试剂。因此,在合适动物模型中进一步使用在本文中所鉴定的试剂包括在本发明范围内。例如,在本文中所鉴定的试剂(如,标记物调节试剂、反义标记物核酸分子、标记物特异性抗体、或标记物结合配体)可用在动物模型中以测定用所述试剂治疗的有效性、毒性、或副作用。可选地,本文中所鉴定的试剂可用在动物模型中以测定所述试剂的作用机理。另外,本发明涉及由上述筛选试验鉴定的新试剂在本文所述的治疗中的应用。
以普通医生、兽医或研究人员的知识可知道小分子试剂和蛋白或多肽试剂的合适剂量是依赖于许多因素的。例如,根据治疗的患者或样本的特性、大小、和情况,如果可行的话,进一步根据组合物施用的途径以及医师所希望本发明核酸或多肽所具有的效果来改变这些试剂的剂量。小分子剂量的例子包括每公斤患者或样本体重的毫克或微克量(如约每公斤1微克至约每公斤500毫克、约每公斤100微克至约每公斤5毫克、或约每公斤1微克至约每公斤50微克)。蛋白或多肽剂量的例子包括每公斤患者或样本体重的克、毫克或微克量(如约每公斤1微克至约每公斤5克、约每公斤100微克至约每公斤5毫克、或约每公斤1毫克至约每公斤50毫克)。进一步可知道这些试剂之一的合适剂量依赖于与调节表达或活性相关的试剂的效力。利用本文所述的试验确定所述合适的剂量。例如,当一或多种这些试剂施用于动物(如人)从而调节本发明的多肽或核酸的表达或活性时,医生、兽医或研究人员可以首先给出较低剂量的处方,接着增加剂量直至获得合适的反应。另外,可知道任何特定动物患者的特定剂量水平依赖于多种因素,包括所使用的特定试剂的活性、患者的年龄、体重、综合健康状况、性别、以及饮食、给药时间、给药途径、排出率、任何药物组合、和要调节的表达或活性程度。
将本发明的药物组合物制备成与其预期的施用途径相容。施用途径的例子包括肠胃外途径,如,静脉内、皮内、皮下、口腔(如吸入)、经皮(外用)、经黏膜、以及直肠施用。用于肠胃外、皮内或皮下使用的溶液或悬浮液包括以下成分:诸如注射用水的无菌稀释剂、盐溶液、固定油、聚乙二醇、甘油、丙二醇或其它合成溶剂;抗细菌剂,如苄醇或甲基对羟基苯甲酸酯;抗氧化剂,如抗坏血酸或亚硫酸氢钠;螯合剂,如乙二胺四乙酸;缓冲液,如醋酸盐、柠檬酸盐、磷酸盐和调节渗透压的试剂,如氯化钠或葡萄糖。pH可用如盐酸或氢氧化钠的酸或碱调节。肠胃外制剂可包装在玻璃或塑料制的安瓿瓶、一次性注射器或多剂量管瓶中。
适合注射使用的药物组合物包括无菌水溶液(其中是水溶性的)或分散液,和用于临时制备无菌注射溶液或分散液的无菌粉末。为在静脉内施用,合适的载体包括生理盐水、抑菌水、Cremophor EL(BASF;Parsippany,NJ)或磷酸盐缓冲液(PBS)。在所有情况下,所述组合物必须是无菌的,并且其流动性应当达到容易注射的程度。在生产和储存的条件下它必须是稳定的,并且必须防止诸如细菌和真菌的微生物的污染作用。所述载体可以是溶剂或分散介质,包括例如水、乙醇、多元醇(如,甘油、丙二醇和液体聚乙二醇,以及类似物)及其合适的混合物。例如,可通过包被诸如卵磷脂的包衣剂保持分散液所需的粒度以及通过使用表面活性剂保持合适的流动性。可通过各种抗细菌剂和抗真菌剂,例如,对羟基苯甲酸酯、氯丁醇、苯酚、抗坏血酸、硫柳汞、及类似物实现抑制微生物的作用。在很多场合下,优选在所述组合物中包括等渗剂,例如,糖、多元醇,如甘露糖醇、山梨醇、或氯化钠。可通过在组合物中加入延长吸收的试剂,如单硬脂酸铝和凝胶,延长可注射组合物的吸收时间。
可通过将所需数量的活性化合物(如多肽或抗体)与上面列举的成分之一或其组合一起掺入合适的溶剂中制备无菌注射溶液,如果需要,接着通过过滤消毒。一般而言,通过将活性化合物掺入含有基础分散介质和上面所列举的必需的其它成分的无菌赋形剂中可制备分散液。对于制备无菌注射溶液的无菌粉末而言,优选的制备方法是真空干燥和冷冻干燥,由此可产生活性成分和来自上述无菌过滤溶液的任何其它必需成分的粉末。
口服组合物通常包括惰性稀释剂或可食用载体。它们可装在凝胶胶囊中或压成片剂。为了口服治疗施用,活性化合物可与赋形剂混合并制成片剂、锭剂或胶囊形式使用。口服组合物也可用流体载体制备成漱口水,其中流体载体中的化合物可口服使用,洗漱并吐出或吞咽。
药学上相容的结合剂和/或佐剂材料可添加作为所述组合物的一部分。所述片剂、丸剂、胶囊、锭剂、及类似物能包含以下成分中的任意一种或包含具有相似性质的化合物:诸如微晶纤维素的粘合剂、黄蓍胶或明胶;赋形剂,如淀粉或乳糖,分散剂,如藻酸、Primogel或玉米淀粉;润滑剂,如硬脂酸镁或Sterotes;滑动剂,如胶状二氧化硅;甜味剂,如蔗糖或糖精;或香味剂,如薄荷、水杨酸甲酯或柠檬香剂。
为了通过吸入施用,所述化合物以气溶胶喷雾形式从压力容器或分液器或雾化器中喷出,所述压力容器或分液器包括合适的推进剂,例如,气体,如二氧化碳。
也可通过黏膜或经皮方式系统施用。为经黏膜或经皮施用,在该制剂中使用适合穿透屏障的渗透剂。所述渗透剂一般为本领域已知的,并包括,例如对于经黏膜施用而言,洗涤剂、胆酸盐、和梭链孢酸衍生物。通过使用鼻腔喷雾剂或栓剂可实现黏膜施用。对于经皮施用而言,如本领域所普遍公知的,活性化合物可制备为软膏、敷膏、凝胶或霜剂。
所述化合物也可以栓剂(如,使用常规的栓剂基料,如可可脂和其它甘油脂)或保留灌肠剂形式制备,用于直肠递送。
在一个实施方案中,所述活性化合物是与载体一起制备的,所述载体能防止该化合物从体内快速清除,如控制释放制剂,包括植入和微胶囊化递送系统。可以使用可生物降解的、生物相容的聚合物,比如亚乙基乙烯乙酸酯、聚酐、聚甘油酸、胶原、聚原酸酯以及聚乳酸。制备所述试剂的方法对本领域技术人员来说是显而易见的。也可从Alza公司和Nova制药有限公司获得商品化的原料。还可将脂质体悬浮液(包括脂质体,在其中或其上带有单克隆抗体)也可用作药学上可接受载体。根据本领域技术人员已知的方法,如美国专利第4,522,811号所述的,可以制备所述悬浮液。
为了便于施用以及剂量的统一性,以剂量单位形式制备口服或肠胃外组合物是特别有利的。本文所用的剂量单位指的是适合作为治疗患者的单位剂量的、在物理上独立的单位;每个单位包含预定数量的活性化合物,它是计算出的能与需要的药物载体一起产生需要的治疗效果的用量。有关本发明剂量单位形式的规定,是由活性化合物的特征和要获得的特定治疗效果,以及本领域中在将所述活性化合物用于治疗个体所固有的制约所决定的,并且直接取决于这些因素。
对于抗体而言,优选剂量为0.1mg/kg至100mg/kg体重(一般10mg/kg至20mg/kg)。如果抗体作用在大脑,则通常合适的剂量为50mg/kg至100mg/kg。一般而言,部分人抗体和全长人抗体在人体中比其它抗体具有更长的半衰期。因此,经常可用较低的剂量和较低的给药频率。诸如脂化修饰可用于稳定抗体并增加吸收和组织渗透(如,进入子宫颈上皮)。Cruikshank等.(1997)J.Acquired ImmuneDeficiency Syndromes and Human Retrovirology 14:193描述了脂化抗体的方法。
本发明也提供了预防和/或治疗子宫颈癌的疫苗组合物。本发明提供了子宫颈癌疫苗组合物,其中为了刺激抗子宫颈癌免疫应答而向患者导入表1的标记物蛋白、或表1的标记物蛋白的组合。本发明也提供了子宫颈癌疫苗组合物,其中向患者导入表达表1鉴定的标记物或其片段的基因表达构建体,从而使患者中转染的细胞产生了高于正常水平的由表1标记物编码的蛋白或蛋白片段并引发免疫应答。
在一个实施方案中,提供并使用子宫颈癌疫苗作为预防子宫颈癌的免疫治疗剂。在另一个实施方案中,提供并使用在子宫颈癌疫苗作为治疗子宫颈癌的免疫治疗剂。
作为例子,通过各种途径施用疫苗,如皮内、皮下、或经肌肉施用,包含表1标记物蛋白的子宫颈癌疫苗可以用于预防和/或治疗患者的子宫颈癌。另外,子宫颈癌疫苗可与佐剂和/或免疫调节剂一起施用以提升疫苗的活性和患者的应答。在一个实施方案中,适于持续或间隔释放的包含所述疫苗的装置和/或组合物可以植入体内或以所述具有相对较慢释放的材料局部应用于体内。子宫颈癌疫苗可以与免疫调节分子一起导入,其可改变产生的免疫应答的类型从而产生更有效去除癌的应答。
在另一个实施方案中,通过肌肉注射,或通过微抛射体包被并利用为高速抛射入皮肤而设计的装置,可以导入包含表1标记物表达构建体的子宫颈癌疫苗。然后患者细胞会表达表1的标记物蛋白或蛋白片段并诱导出免疫应答。另外,子宫颈癌疫苗可以与免疫调节分子的表达构建体一起导入,如细胞因子,其可增加免疫应答或调节产生的免疫应答的类型从而产生更有效去除癌的应答。
标记物核酸分子可以插入载体中并用作基因治疗载体。通过如静脉注射、局部给药(美国专利第5,328,470号),或通过定向注射(参见如Chen等,1994,Proc.Natl.Acad.Sci.USA 91:3054-3057),可把基因治疗载体递送到患者体中。基因治疗载体药物的制备可包括在可接受稀释剂中的基因治疗载体,或者可包含包埋了基因递送介质物的缓释基质。可选地,从重组细胞中可以完整产生完整的基因递送载体,如反转录病毒载体,所述药物制备则可以包括一或多个能产生基因递送系统的细胞。
所述药物组合物可以与指导施用说明书一起包装在容器、包装物或分液器中。
V.预测医学
本发明涉及预测医学领域,其中诊断试验、预后试验、药物基因组学以及监测临床试验用于预后(预测)目的从而预防性地治疗个体。因此,本发明的一个方面涉及诊断试验以确定一或多个蛋白或核酸标记物的表达水平,这是为了确定个体是否有发展成为宫颈癌的危险。这些试验用于预后(预测)目的从而在癌症发生前预防性地治疗个体。
而本发明的另一方面涉及在临床试验中监测试剂对本发明标记物表达或活性的影响(例如,施用药物或其它化合物以抑制子宫颈癌或者治疗或预防其它病症{即为了了解所述处理过程可能有的对子宫颈癌的任一效果})。它们以及其它试剂在以下章节中会有进一步详细叙述。
A.诊断试验
用作监测生物样本中蛋白或核酸标记物存在或不存在的示例方法包括从测试者中获得生物样本(如与子宫颈相关的体液)并且使生物样本接触能检测多肽或核酸(如mRNA、基因组DNA、或cDNA)的化合物或试剂。因而本发明的检测方法能在诸如体外和体内的生物样本中用于检测mRNA、蛋白质、cDNA、或基因组DNA。例如,mRNA的体外检测技术包括Northern杂交和原位杂交。蛋白质标记物的体外检测技术包括酶联免疫吸附试验(ELISA)、Western印迹、免疫沉淀以及免疫荧光法。基因组DNA的体外检测技术包括Southern杂交。另外,蛋白质标记物的体内检测技术包括向患者导入直接抗蛋白或其片段的标记的抗体。例如,用放射性标记来标记抗体,通过标准成像技术就能检测出其在患者中的存在与位置。
所述诊断和预后试验的普遍原理包括在合适条件下制备包含标记物的样本或反应混合物和探针,并经过一段时间足以使标记物和探针相互作用并结合,从而在反应混合物中形成能被分离和/或检测的复合物。可以用各种方式进行这些试验。
例如,进行这种试验的一个方法可以包括把标记物或探针锚定在固相支持物上,也被称为基质,并在反应后检测锚定在固相支持物上的目标标记物/探针复合物。在这种方法的一个实施方案中,将要测试标记物存在和/或浓度的患者样本,可以被锚定在载体或固相支持物上。在另一个实施方案中,也可能是相反的情况,其中把探针锚定在固相上并把患者样本当作试验中未锚定成分来进行反应。
已有许多现成的方法可将试验成分锚定到固相上去。这包括,但不仅限于,通过生物素和抗生物素蛋白链菌素结合固定的标记物或探针分子。这种生物素化的试验成分可以利用本领域已知的技术(如,生物素化试剂盒,Pierce Chemicals,Rockford,IL)从生物素-NHS(N-羟基-琥珀酰亚胺)中制备,并固定于抗生物素蛋白链菌素包被的96孔板(Pierce Chemical)的孔中。在某些实施方案中,可以预制备固定了试验成分的表面并储存起来。
其它适于所述试验的载体或固相支持物包括任何能结合标记物或探针所属种类的分子材料。众所周知的支持物或载体包括,但不仅限于,玻璃、聚苯乙烯、尼龙、聚丙烯、尼龙、聚乙烯、葡聚糖、淀粉酶、天然和修饰的纤维素、聚丙烯酰胺,辉长石以及磁石。
为了用上述方法进行试验,向其上锚定了第二成分的固相物中加入未固定的成分。反应完成后,在形成的复合物仍会固定在固相上的条件下去除(如,洗去)未复合上去的成分。可以用在本文中所述的众多方法来进行锚定在固相上的标记物/探针复合物的检测。
在优选实施方案中,当探针为未锚定的试验成分时,为了试验的检测和读出之用,可以用本文所讨论的和本领域技术人员的众所周知的可检测标记来直接或间接地标记探针。
不通过进一步操作或标记这两种成分(标记物或探针)也可以直接检测标记物/探针复合物的组成,如通过利用荧光能量转换技术(参见如,Lakowicz等,美国专利第5,631,169号;Stavrianopoulos等,美国专利第4,868,103号)。例如,选用在第一“供体”分子上的荧光标记,用合适波长的入射光来激发,其释放的荧光能量用在第二“受体”分子上的荧光标记来吸收,其接着根据吸收的能量发出荧光。可选地,“供体”蛋白质分子可利用色氨酸残基的天然荧光能量。选择释放不同光波长的标记,从而“受体”分子标记可以从“供体”的波长中区分出来。由于标记间能量转换的效率与分子分离距离相关,因此可以测定出分子间的空间关系。在结合发生在分子之间的情况下,试验中“受体”分子标记的荧光发射会变得最大。通过已知标准的荧光测定检测方法(如利用荧光计)可以方便地测出FET结合情况。
在另一个实施方案中,不标记这两种成分(探针或标记物)而就利用诸如实时生物分子相互作用分析(BIA)(参见如,Sjolander,S.和Urbaniczky,C.,1991,Anal.Chem.63:2338-2345以及Szabo等,1995,Curr.Opin.Struct.Biol.5:699-705)等技术就能进行探针识别标记物能力的测定。在本文中使用的“BIA”或“表面等离子共振”,指的是不通过标记任何相互作用物(如,BIA核)而实时研究生物特异性相互作用的技术。结合表面质量的改变(指示结合情况)导致近表面光折射率的改变(表面等离子共振(SPR)的光学现象),这导致产生了能用作指示生物分子间实时反应的检测信号。
可选地,在另一个实施方案中,可用液相中用作溶质的标记物和探针来进行相似的诊断和预后试验。在所述试验中,通过众多标准技术把复合的标记物和探针从未复合成分中分离出来,包括但不见限于:差速离心、层析、电泳和免疫沉淀法。在差速离心法中,根据基于复合物不同大小和密度而造成的不同的沉淀平衡性,通过一系列离心步骤可以从未复合试验成分中分离出标记物/探针复合(参见如,Rivas,G.和Minton,A.P.,1993,Trends Biochem Sci.18(8):284-7)。标准层析技术也可以用于把复合分子从未复合成分中分离出来。例如,凝胶过滤层析基于大小并通过利用凝胶柱中合适的凝胶过滤树脂来分离分子,例如,相对较大的复合物可以从相对较小的未复合成分中分离出来。相似地,可以利用相对于未复合成分不同的标记物/探针复合物的电荷性质来从未复合成分中分离出复合物,例如通过利用离子交换层析树脂。所述树脂和层析技术对本领域技术人员来说是众所周知的(参见如,Heegaard,N.H.,1998,J.Mol.Recognit.Winter11(1-6):141-8;Hage,D.S.和Tweed,S.A.J Chromatogr B BiomedSci Appl 1997 Oct 10;699(1-2):499-525)。凝胶电泳也可以用来从未结合成分中分离复合的试验成分(参见如,Ausubel等编著的CurrentProtocols in Molecular Biology,John Wiley & Sons,New York,1987-1999)。例如在该技术中,根据大小或电荷来分离蛋白或核酸复合物。为了在电泳过程中保持相互结合作用,通常优选非变性胶基质材料和不存在还原剂的条件。特定试验及其成分的合适条件对于本领域技术人员来说是众所周知的。
在一个特定的实施方案中,利用本领域已知方法通过原位和体外形式的方法都可以用来确定生物样本中的mRNA标记物的水平。术语“生物样本”其意包括分离自患者的组织、细胞、生物液体及其分离物,以及患者体内的组织、细胞和液体。许多检测方法利用了分离的RNA。对于体外方法,任何不阻止mRNA分离的RNA分离技术可以用于从子宫颈细胞中纯化RNA(参见如,Ausubel等编的CurrentProtocols in Molecular Biology,John Wiley & Sons,New York 1987-1999)。另外,可以利用本领域技术人已知的技术,比如Chomczynski的单步RNA分离流程(1989,美国专利第4,843,155号),来迅速处理大量组织样本。
分离的mRNA可以用于杂交或扩增试验,其包括但不仅限于,Southern或Northern分析、聚合酶链式反应分析和探针阵列。一个优选的检测mRNA水平的诊断方法包括把分离的mRNA同核酸分子(探针)接触,所述核酸分子能同要检测基因编码的mRNA杂交。例如,核酸分子探针可以是全长cDNA或其部分,比如寡核苷酸,其长度至少为7、15、30、50、100、250或500个核苷酸并足以在严谨条件下与编码本发明标记物的mRNA或基因组DNA特异杂交。其它用在本发明诊断试验中的合适探针也在本文中描述。mRNA同探针的杂交表明所考虑的标记物正在被表达。
在一种方式中,例如通过在琼脂糖凝胶上分离mRNA并从胶上把mRNA转移到诸如硝酸纤维的膜上,使得mRNA固定在固体表面上并与探针接触。在可选的方式中,例如在Affymetrix基因芯片阵列中,使探针固定在固体表面上并使探针与mRNA接触。本领域技术人员能够容易改变已知的mRNA检测方法使之用于检测本发明标记物编码的mRNA的水平上。
确定样本中mRNA标记物水平的可选的方法包括核酸扩增方法,如用rtPCR(Mullis所阐述的实验实例,1987,美国专利第4,683,202号)、连接酶链式反应(Barany,1991,Proc.Natl.Acad.Sci.USA,88:189-193)、自持续序列复制(Guatelli等,1990,Proc.Natl.Acad Sci.USA 87:1874-1878)、转录扩增系统(Kwoh等,1989,Proc.Natl.Acad.Sci.USA 86:1173-1177)、Q-Beta复制酶(Lizardi等,1988,Bio/Technology 6:1197)、滚动循环复制(Lizardi等,美国专利第5,854,033号)或任何其它核酸扩增方法,接着利用本领域技术人员已知的技术来检测扩增的分子。如果所述分子存在数量非常低,则这些检测方案对于检测核酸分子尤其有用。在此所用的扩增引物定义为核酸分子对,其能向基因(分别是正链和负链,或反之亦然)的5′或3′区域退火并在引物对间包含了一个小区域。一般地,扩增引物长度约为10至30个核苷酸并且侧接有长度约50至200个核苷酸的区域。在合适条件下并用合适的试剂,则这些引物使得包含了与引物侧接的核苷酸序列的核酸分子扩增。
对于原位方法,mRNA不必在检测前从子宫颈细胞中分离出来。在该方法中,用已知组织学方法制备/处理细胞或组织样本。然后将样本固定于支持物上,通常是玻片,然后同能与编码标记物的mRNA杂交的探针接触。
作为进行测定标记物绝对表达水平的替换,测定可以基于标记物标准化了的表达水平。通过比较其与不作为标记物的基因的表达情况,如,与持续表达的家务基因,来纠正标记物绝对表达水平,使得表达水平标准化。用来标准化的合适基因包括家务基因,如肌动蛋白基因或上皮细胞特异性基因。标准化使得可以比较一个样本(如患者样本)同另一个样本(如非子宫颈癌样本)的表达水平,或不同来源样本之间的表达水平。
可选地,表达水平可以规定为相对表达水平。为了测定标记物的相对表达水平,在测定所考虑的样本表达水平前,用正常细胞对癌细胞分离物的10个或更多样本来测定标记物的表达水平,优选50个或更多样本。测定更大量样本中每个测试基因的平均表达水平并将其用作标记物表达水平的基准。然后,测试样本所测得的标记物表达水平(绝对表达水平)除以该标记物所得的平均表达值。这就规定了相对表达水平。
优选地,用于基准测定的样本来自子宫颈组织的子宫颈癌或非子宫颈癌细胞。依据相对表达水平的应用来选择细胞来源。把普通细胞中发现的表达情况用作平均表达分值以帮助确认所测的标记物是否是子宫颈特异性的(相对于普通细胞)。另外,当积累了更多的数据后,可以修正平均表达值,基于累积的数据得出改进的相对表达值。子宫颈细胞的表达数据提供了一种将子宫颈癌严重程度分级的方法。
在本发明另一个实施方案中,检测蛋白标记物。本发明优选的检测蛋白标记物的试剂是能与该蛋白或其片段结合的抗体,优选具有可检测标记的抗体。抗体可以是多克隆的,或更优选地,是单克隆的。可以使用完整的抗体、或其片段或衍生物(如Fab或F(ab′)2)。术语“标记的”,其涉及引物或抗体时,其意在包括通过把可检测物质与探针或抗体偶联而直接标记探针或抗体,以及通过与直接标记的其它试剂反应而间接标记探针或抗体。间接标记的例子包括利用荧光标记的第二抗体检测第一抗体和用生物素末端标记DNA探针从而使其可用荧光标记的抗生物素蛋白链菌素来检测。
利用本领域技术人员已知的技术可以分离子宫颈细胞的蛋白质。例如,所用的蛋白质分离方法如Harlow和Lane文(Harlow和Lane,1988,Antibodies:A Laboratory Manual,Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York)中所述的那样。
可以用多种方法来确定样本是否包含与特定抗体结合的蛋白。所述方法的例子包括,但不仅限于,酶标免疫实验(EIA)、放射免疫实验(RIA)、Western印迹分析以及酶联免疫吸附试验(ELISA)。本领域技术人员可以容易改变已知的蛋白质/抗体检测方法来用于测定子宫颈细胞是否表达本发明的标记物。
在一种方法中,抗体或抗体片段或衍生物可以用在诸如Western印迹或免疫荧光技术的方法中来检测表达的蛋白质。在所述应用中,一般优选把抗体或蛋白质固定在固体支持物上。合适的固相支持物或载体包括任何能结合抗原或抗体的支持物。众所周知的支持物或载体包括玻璃、聚苯乙烯、聚丙烯、葡聚糖、尼龙、淀粉酶、天然和修饰的纤维素、聚丙烯酰胺,辉长石以及磁石。
本领域技术人员会知道许多其它结合抗体或抗原的合适载体,并能改变这种支持物以应用于本发明。例如,子宫颈细胞中分离的蛋白质可以在聚丙烯酰胺凝胶上进行电泳并固定于诸如硝酸纤维的固相支持物上。然后可以用合适的缓冲液洗涤支持物,接着用可检测标记的抗体处理。然后第二次用缓冲液洗涤支持物以去除未结合的抗体。然后通过常规的方法检测固体支持物上结合的标记的量。
本发明也包括检测生物样本(如子宫颈涂片)中蛋白或核酸存在的试剂盒。可以用所述试剂盒测定患者是否正患有或有极大危险发展成为子宫颈癌。例如,所述试剂盒可包含一种能检测生物样本中蛋白或核酸标记物的化合物或试剂以及测定样本中蛋白或mRNA数量的装置(如,结合蛋白或其片段的抗体,或结合编码蛋白质的DNA或mRNA的寡核苷酸探针)。试剂盒也可包括用于解释用试剂盒得到结果的说明书。
对于基于抗体的试剂盒,所述试剂盒可包含,如:(1)结合蛋白标记物的第一抗体(如,附着在固体支持物上的);和,可选地,(2)不同的第二抗体,其结合蛋白或第一抗体并与可检测标记连接。
对于基于寡核苷酸的试剂盒,所述试剂盒可包含,如:(1)寡核苷酸,如,可检测标记的寡核苷酸,其与编码蛋白标记物的核酸序列杂交,或(2)用于扩增核酸分子标记物的引物对。所述试剂盒也可包含,如,缓冲剂、防腐剂或蛋白稳定剂。所述试剂盒可进一步包含对于检测可检测标记所必需的成分(如酶或底物)。所述试剂盒也可包含一个对照样本或一系列对照样本,其可被检测并与测试样本相比较。所述试剂盒的每个成分可以与用于解释用试剂盒进行试验所得的结果的说明书一起包装在单个容器中,而且各种容器都可以装置在一个包装物中。
B.药物基因组学
本发明的标记物也可用作药物基因组学的标记物。这里所用的“药物基因组学的标记物”指客观的生化标记物,其表达水平与患者的特异临床药物反应或易感性相关(如参见McLeod等.(1999)Eur.J.Cancer 35(12):1650-1652)。药物基因组学的标记物表达的存在或数量与用特定药物或药物种类治疗的患者的预测反应有关,更具体地是与患者的肿瘤的预测反应有关。通过评估患者中的一或多个药物基因组学的标记物表达的存在或数量,可以选出最适合于患者的或预计有更大成功程度的药物疗法。例如,对于治疗患者可能存在的特异肿瘤,根据患者中特异肿瘤标记物编码的RNA或蛋白的存在或数量,可以选出最优化的药物或治疗流程。因此应用药物基因组学的标记物可以在不用尝试不同药物或疗法的情况下,对每个癌症患者选出或设计出最合适的疗法。
药物基因组学的另一方面涉及改变身体对药物作用的遗传状况。这些药物遗传状况可以以罕见的缺陷或多态性而出现。例如,葡萄糖-6-磷酸脱氢酶(G6PD)缺乏是常见的遗传性先天性代谢病,其中主要临床并发症是在摄取氧化药物(抗疟疾药、磺胺药、镇痛药、硝基呋喃)和食用蚕豆后出现溶血。
作为一种说明性实施方案,药物代谢酶的活性是药物作用强度和持久性的主要决定因素。药物代谢酶(如,N-乙酰转移酶2(NAT 2)和细胞色素P450酶CYP2D6和CYP2C19)遗传多态性的发现给出了解释,即为什么有些患者在服用药物的标准和安全剂量后没有获得预期的药效或者显示出过大的药物反应和严重的毒性。这些多态性在人群中表现为两种表型,即充分代谢型(EM)和不良代谢型(PM)。不同群体中PM的倾向不同。例如,编码CYP2D6的基因是高度多态性,而且已经在PM中鉴定出数个突变,其均导致功能性CYP2D6缺失。CYP2D6和CYP2C19的不良代谢型在其接受标准剂量后通常会出现过大的药物反应和副作用。假如代谢物是活性治疗成分的话,则PM将不显示治疗反应,正如通过其CYP2D6形成的代谢物吗啡介导的可待因的镇痛效果所证实的。其它极端情况是所谓的超快代谢型,其对标准剂量没有反应。近来,已确定出超快代谢的分子基础是由于CYP2D6基因扩增。
因此,可以测定本发明标记物在个体中的表达水平从而选出治疗或预防个体的合适试剂。另外,可以利用药物基因组学研究运用编码药物代谢酶的多态性等位基因的基因型来鉴定个体的药物反应表型。该知识,当应用于剂量或药物选择时,能够避免不良反应或治疗失败,因而在用本发明标记物表达的调节剂治疗患者时,可增强治疗或预防功效。
C.监测临床试验
监测试剂(如,药物化合物)对本发明标记物表达水平的影响不仅可以用在基础药物筛选中,而且可用在临床试验中。例如,在接受子宫颈癌治疗的患者的临床试验中能检测试剂影响标记物表达的效力。在优选的实施方案中,本发明提供了一种用试剂(如,激动剂、拮抗剂、模拟肽、蛋白、肽、核酸、小分子、或其它候选药物)监测患者治疗有效性的方法,包括如下步骤(i)在施用试剂前从患者中获取用药前的样本;(ii)检测用药前样本中一个或多个所选的本发明标记物的表达水平;(iii)从患者中获取一个或多个用药后样本;(iv)检测用药后样本中的标记物的表达水平;(v)把用药前样本中的标记物表达水平同用药后样本或样本群中的标记物表达水平相比较;和(vi)据此改变向患者施用的试剂。例如,在治疗过程中标记物的增加表达可以显示出无效的剂量和增加剂量的需求。相反地,标记物的减少表达可以显示出有效的治疗并且不需要改变剂量。
D.电子设备可读介质和阵列
这也提供了包括本发明标记物的电子设备可读介质。在本文中所用的“电子设备可读介质”是指任何用于储存、保持或容纳数据或信息的介质,其可用电子设备直接读出和访问。这种介质包括,但不仅限于:磁储存介质,如软盘、硬盘储存介质、和磁盘;光储存介质,如光盘;电储存介质,如RAM、ROM、EPROM、EEPROM以及类似物;一般的硬盘和这些种类的混合产品,如磁/光储存介质。改变或配置介质使其上记录本发明的标记物。
在本文中使用时,术语“电子设备”其意在包括为存储数据或信息而配置或改变的任何合适的计算或处理设备或其它装置。适合用于本发明的电子设备的例子包括独立计算设备;网络,包括局域网(LAN)、广域网(WAN)因特网、企业内部互联网以及外部互联网;电器,如个人数字助理(PDA)、手机、寻呼机及类似物;和本地或分布式处理系统。
在本文中使用时,“记录”是指用于在电子设备可读介质上储存或编码信息的过程。本领域技术人员能够容易地采用当前已知的任何方法在已知的介质上记录信息来生产包括本发明标记物的产品。
可用各种软件和格式在电子设备可读介质上储存本发明标记物信息。例如,核酸序列标记物可以用字处理文本文件来表示,其可用商业化软件的格式,如WordPerfect和MicroSoft Word,或者用ASCII文件的形式来表示,其储存于数据库应用程序中,如DB2、Sybase、Oracle或类似程序,以及用其它形式。为了获得或创建其上记录有本发明标记物的介质,可以用许多数据处理结构格式(如文本文件或数据库)。
通过以可读形式提供本发明标记物,技术人员可以为各种目的定期地访问标记物序列信息。例如,所属领域技术人员可以用本发明可读形式的核苷酸或氨基酸序列来把靶序列或靶结构基序同储存在数据储存装置中的序列信息相比较。利用检索方法来鉴定本发明序列中符合特定靶序列或靶结构基序的片段或区域。
因此本发明提供了一种为执行确定患者是否患子宫颈癌或易患子宫颈癌的方法而保存指令的介质,其中所述方法包括确定标记物存在或不存在的步骤,并基于标记物的存在或不存在,确定患者是否患子宫颈癌或易患子宫颈癌和/或推荐特定的治疗子宫颈癌或子宫颈癌前状态的方法。
本发明进一步在电子系统和/或网络中提供一种确定患者是否患子宫颈癌或易患与标记物相关的子宫颈癌的方法,其中所述方法包括确定标记物存在或不存在的步骤,并基于标记物的存在或不存在,确定患者是否患子宫颈癌或易患子宫颈癌,和/或推荐特定的治疗子宫颈癌或子宫颈癌前状态的方法。该方法可以进一步包括接受同患者相关的表型信息和/或从网络中获得同患者相关的表型信息的步骤。
本发明也在网络中提供了一种确定患者是否患子宫颈癌或易患与标记物相关的子宫颈癌的方法,所述方法包括接受同标记物相关信息、接受同患者相关的表型信息、从网络中获得相应的标记物和/或子宫颈癌信息的步骤,并基于一个或多个表型信息、标记物、和所获得的信息,确定患者是否患子宫颈癌或易患子宫颈癌。该方法可以进一步包括推荐特定的治疗子宫颈癌或子宫颈癌前状态的的步骤。
本发明也提供了一种确定患者是否患子宫颈癌或易患子宫颈癌的商业方法,所述方法包括接受同患者相关的表型信息、从网络中获得相应的标记物和/或子宫颈癌信息的步骤,并基于一个或多个表型信息、标记物、和所获得的信息,确定患者是否患子宫颈癌或易患子宫颈癌。该方法可以进一步包括推荐特定的治疗子宫颈癌或子宫颈癌前状态的的步骤。
本发明也包括一种包含本发明标记物的阵列。所述阵列可用于检测阵列中一个或多个基因的表达。在一个实施方案中,阵列可用于检测组织中的基因表达以确定阵列中基因的组织特异性。用这种方式,可同时测试多至7600个基因的表达。这可以开发特征图谱以显示在一个或多个组织中特异表达的一组基因。
除了这些定性测定方法,本发明可以定量基因表达的情况。因此,不仅是组织特异性的,而且组织中一组基因的表达水平也是能确定的。因此,基因可以基于其组织表达本身和该组织中表达水平来分组。例如,这可用在确定组织之间的基因表达的关系中。因此,可以干扰一个组织并且测定对第二个组织中的基因表达的影响。在本文中,可以测定一种细胞类型对另一种细胞类型响应生物刺激的影响。例如,这种测定方法可用于了解在基因表达水平上的细胞-细胞相互作用的影响。如果治疗性地施用试剂以处理一种细胞类型,但其具有对另一种细胞类型的不良影响,则本发明提供了一种测试以确定不良影响的分子基础并据此提供联用中和试剂或其它处理不良影响的时机。相似地,即使在单一细胞类型中,也可以在分子水平上测定不良生物影响。因此,可以确定并抵消试剂对于除靶基因之外的基因表达的影响。
在另一个实施方案中,所述阵列可被用于监测阵列中一个或多个基因表达的时间过程。如此所述,这可以发生在各种生物关系中,例如子宫颈癌的发展、子宫颈癌的进程、以及过程,如与子宫颈癌相关的细胞转化。
所述阵列也可用于确定在相同细胞中或在不同细胞中一个基因表达对另外的基因表达的影响。这提供了,如在不能调节最终或下游靶位时,可以选择用于介入治疗的替代的分子靶位。
所述阵列也可用于确定在正常或异常的细胞中一个或多个基因不同的表达模式。这提供了一组基因,其能用作介入诊断或治疗的分子靶位。
E.替代标记物
本发明的标记物可以用作一种或多种失调或疾病状态或者导致病态状态的替代标记物,尤其是子宫颈癌的。这里所用的“替代标记物”是一个客观的生化标记物,其与疾病或失调的缺失或存在、或与疾病或失调的进程相关(如,与肿瘤的存在或不存在)。所述标记物的存在或数量不依赖于疾病。因而,这些标记物用来显示特定治疗过程是否能有效减轻病态或失调。当病态或失调难以用标准方法来评估时(如早期阶段的肿瘤),或在达到潜在危险的临床点前已需要评估疾病进程时(如,在心肌梗塞或完全发展成AIDS的不良临床结果显现前,用胆固醇水平作为替代标记物进行评估心血管疾病,和用HIV RNA水平作为替代标记物进行分析HIV感染),替代标记物尤其有用。现有的替代标记物应用的例子包括:Koomen等.(2000)J.Mass.Spectrom.35:258-264;和James(1994)AIDS Treatment News Archive 209。
本发明的标记物也可用作药效学标记物。这里所用的“药效学标记物”是一个客观的生化标记物,其特异地与药物效果相关。药效学标记物的存在或数量并不与药物所施用的病态或失调相关;因此,药效学标记物的存在或数量可作为患者的药物存在或活性的指试标准。例如,药效学标记物可作为生物组织中药物浓度的指试标准,其中标记物在与药物水平相关的组织中可以是被表达的或转录的,或是未被表达或转录的。以这种方式,用药效学标记物监测药物的分布或吸收。相似地,药效学标记物的存在或数量与药物代谢产物的存在或数量相关,如药效学标记物的存在或数量可作为体内的药物相对衰减率的指试标准。药效学标记物尤其可应用于增加检测药物效果的灵敏度,尤其在以低剂量施用药物的时候。由于即使是少量的药物也足以活化大量标记物的转录或表达,因此扩增的标记物在量上比药物本身更容易检测。而且,由于标记物本身的性质使得标记物更容易检测;例如,利用在此所述的方法,在基于免疫的监测系统中用抗体做蛋白标记物,或用标记物特异性放射性标记探针来检测mRNA标记物。另外,对于可能超出直接观察范围之外的药物治疗,应用药效学标记物可以提供以机理为基础的风险预测。现有应用药效学标记物的例子包括:Matsuda等的US 6,033,862;Hattis等.(1991)Env.Health Perspect.90:229-238;Schentag(1999)Am.J.Health-Syst.Pharm.56 Suppl.3:S21-S24;和Nicolau(1999)Am,J.Health-Syst.Pharm.56 Suppl.3:S16-S20。
实施例1:用cDNA和组织微阵列鉴定子宫颈癌标记物
I.材料和方法
样本收集和RNA制备
收集子宫颈组织并速冻于液氮中。在进行提取RNA前先确认组织的组织结构和细胞成分。利用Trizol试剂(Life Technologies)从冷冻的组织中提取总RNA,接着用Qiagen的Rneasy试剂盒进行二次洗涤步骤以增加RNA探针标记的效率(Qiagen,Valencia CA)。利用AgilentTechnologies 2100型生物分析仪计算28S/18S核糖体RNA比率,比率至少为1.0的RNA才应用于本研究中。
cDNA微阵列杂交
包括得自Research Genetics(Hunstville,AL)的30,732个单基因克隆的cDNA微阵列点样在尼龙滤膜上。通过反转录方法使用33P-dCTP、寡dT-30引物以及Superscript II反转录酶(Life Technologies),把总共4-6μg的总RNA用作模板以制备放射性标记的cDNA。用cot-1DNA和聚dA 40-60(Pharmacia,Peapack,NJ)预退火33P标记的第一链cDNA以减少非特异性杂交。用约6×106个计数单位的标记的引物在缓冲液中在65℃下杂交每块滤膜16小时,缓冲液包含7%十二烷基磺酸钠(SDS)、250mM Na3PO4(pH 7.2)、1mM EDTA、0.5%酪蛋白-Hammerstein和0.1mg/ml鲑鱼精子DNA。用4%和1%SDS洗涤缓冲液(20mM Na3PO4(pH 7.2),1mM EDTA和4%或1%SDS)洗滤膜后,将其置于Fuji磷光成像仪屏幕下并用BAS 2500型扫描仪扫描。用由Millennium Pharmaceuticals公司开发的自动分析程序GridGuru v1.0定量这些点。
标记物得分算法和数据处理
为纠正杂交效率的差异,用滤膜上所有点的中值强度来标准化每个阵列滤膜上的数字化数据。进行基于阵列和基于基因的分级分类并用Stanford的基因簇和树可视软件使之可视化。通过计算每个基因的标记物得分使差异表达的基因分级。
为计算标记物得分,把样本分成对照和试验组。标记物得分的起始点是试验样本高于对照样本的平均变化倍(率)。设计得分使之反映出差异表达的变化程度(表达率)和试验样本数,而不被少部分有很高数值的测试样本所支配。为减少该“逸出值”效应,把大于10的表达率故意当作表达率为10的来处理。在得出试验样本平均变化倍数前,用渐近压缩函数通过改变试验:对照表达率来完成所需的标记物得分运算。当试验组并不比对照更高表达时,标记物得分记为1,反之则值大于1。任何基因的标记物得分不会超过10。
因此,基因g的标记物得分Sg计算作为试验:对照的压缩比率平均值:
Sg=(∑Sgs)/N试验
Sgs=C(xgs/(k+xgQ)),其中Sgs代表基因g和样本s的标记物得分,
C(r)是压缩函数,当r≥1时C(r)=A(1-e-r/A),且当r<1时C(r)=1,
A是变化倍数的上渐近数(我们用10),
xgs是样本s中基因g的表达值,
xgQ是样本表达值的百分之Q;通常,Q=50,
k是反映数据中外加噪声的常数,如,重复测量中变量的固定分量。该参数从用微阵列技术的校准试验中得到0.25的值。
N试验试验样本的数量。
组织微阵列的原位杂交
这里提供一种福尔马林固定的、石蜡包埋的子宫颈组织微阵列,其包含从正常、低度鳞状上皮内病变(LSIL)、高度鳞状上皮内病变(HSIL)、鳞状细胞癌(SCC)和腺癌(ACA)中获得的中心组织。用自动组织-Tek DRS 2000型滑动染色仪(Sakura,Torrance,CA)根据前述方法(Duncan,L.M.,等,2001,J.Clin.Oncol.19(2):568-576)来进行预杂交处理。用含4%多聚甲醛的PBS对子宫颈组织脱蜡、再水化,之后固定15分钟。用PBS洗后,用2μg/ml蛋白酶K于37℃消化组织微阵列15分钟,再用4%多聚甲醛/PBS温育10分钟。接着用0.2N HCl温育组织切片10分钟,用0.25%醋酸酐/0.1mol/L三羟乙基胺温育10分钟,并用乙醇梯度脱水。利用源自IMAGE克隆的500ng线性化质粒DNA,用体外转录反应中的35S-UTP(RiboprobeCombination System,Promega,Madison,WI)标记反义探针。利用含5×107cpm/ml的标记探针的10mM Tris-HCl(pH 7.6)缓冲液在50℃下杂交18小时,其中缓冲液包含50%甲酰胺、10%葡聚糖硫酸酯、1x Denhardt氏溶液、0.6M NaCl、10mM DTT、0.25%SDS和200μg/mltRNA。杂交后,用5x标准柠檬酸盐液(SSC)在50℃下洗玻片10分钟,用50%甲酰胺/2X SSC在50℃下洗30分钟,用10mM Tris-HCl(pH 7.6)/500mM NaCl/1mM EDTA(TNE)在37℃下洗10分钟,在含10μg/ml RNA酶的TNE中在37℃下温育30分钟,用TNE在37℃下洗板10分钟,在2x SSC中在50℃下一次温育20分钟,在0.2xSSC中在50℃下二次温育20分钟,并用乙醇梯度脱水。在Kodak NTB2型照相乳胶(Eastman Kodak,Rochester,NY)中浸泡玻片并在4℃下曝光14-21天,以此测定mRNA转录产物的位置。玻片用Myers苏木精和乙醇曙红Y复染。
II.结果
子宫颈组织cDNA微阵列的转录图谱
在包含30,732个克隆的cDNA微阵列(30K微阵列)上测定12个正常子宫颈组织(9个来自子宫颈阴道部,3个来自子宫颈内膜)、5个LSIL、5个HSIL、9个SCC和3个ACA的图谱。为评估数据集合区分疾病和正常组织的能力,基于基因表达模式的整体相似性来进行34个样本数据集合的分级分组(图1)。树状图显示12个正常子宫颈组织中的10个和所有的LSIL样本集中在一组中(定为“对照组”),而12个肿瘤样本中的11个和5个HSIL样本中的3个集中在另一组中(定为“疾病组”)。该分离显示正常子宫颈阴道部上皮、正常子宫颈内膜上皮和LSIL的总体基因表达图谱非常相似,然而3/5HSIL样本更像子宫颈癌。这些发现显示尽管从不同年龄的患者和不同临床位置取样,但健全的数据集合能够从疾病组织中区分出对照组织。
标记物筛选
为了鉴定能区分对照组与疾病组的基因标记物,在30K cDNA微阵列上从三个标记物筛选示例中计算出每个克隆的标记物得分:9个SCC比对照组(9个子宫颈阴道部,3个子宫颈内膜和5个LSIL)、5个HSIL比对照组和3个ACA比对照组。为了揭示与子宫颈细胞转化相关的新标记物,在标记物筛选中排除与免疫应答相关的上调基因(如免疫球蛋白、MHC)。SCC或ACA示例中标记物得分前50位的克隆和在50至100位之间的在SCC和ACA样本中过表达的克隆选为顶级标记物。HSIL示例中的得分并不独立于选择标记物而使用,因为考虑到肿瘤中增加的表达对于好的标记物的表现来说是至关重要的。选择标记物,它们在SCC、ACA和HSIL示例中的得分如表4所示。发现SCC样本中的大多数上调基因也在ACA中提高。当许多从SCC和/或ACA示例中筛选出的标记物得分≥3.0时,而仅有一些HSIL标记物得分超过2.0,这显示增加表达可看作从发育异常至扩散性肿瘤的损伤发展。图2显示表4的两个基因,它们在正常、LSIL、HSIL、SCC和ACA组织中表现出典型而又明显不同的表达模式类型。在HSIL、鳞状细胞瘤和腺瘤中过表达了MCM 6,而仅有鳞状细胞瘤过表达了Claudin 1。
为了解这些上调基因的特征,基于所有临床样本的表达图谱进行分级分类。这些过表达的基因分成两个主要的组别。一个组主要由编码细胞外基质(ECM)蛋白(胶原蛋白、层蛋白、粘连蛋白)或者起着细胞-ECM相互作用或ECM降解和重塑作用的蛋白(如成骨蛋白、基质金属蛋白酶、尿激酶)的基因组成。另一组包括许多涉及细胞复制和增殖的基因。实例包括DNA复制许可因子(MCM 6)、拓扑异构酶2A以及肿瘤基因B-Myb。
标记物的原位杂交(ISH)确认
也可用ISH评估临床组织样本中的标记物。利用组织微阵列进行ISH实验以确认转录图谱结果并测定起着增加mRNA表达作用的细胞类型。根据石蜡切片的水平检测26-87个正常子宫颈中心组织(来自子宫颈阴道部和子宫颈内膜)、2-10个LSIL、5-33个HSIL和10-21个癌中心组织(包括SCC、ACA和低分化肿瘤)。一般的,检测子宫颈上皮细胞中的ISH信号(表5)。上皮细胞中过表达的基因起着细胞生长和细胞-ECM相互作用。上皮细胞差异表达多种基因。该发现暗示了癌发展期间在子宫颈上皮和其微环境之间等价的基因调节。
对代表基因claudin 1进行显微照相。正常的子宫颈和子宫颈内/外膜组织和LSIL中只有很少的或没有来自Claudin 1探针的信号。基因表达在HSIL中提高了并在子宫颈肿瘤中进一步提高。Claudin 1的表达仅限于上皮,而在cDNA微阵列上测定的5个HSIL和3个ACA样本中没有明显的升高(图2)。不受理论所限,该例中ISH增加的灵敏度可能是由于信号的焦点性质造成的。通过ISH,这种焦点信号是很显见的,但是其可能在RNA制备时的全组织匀浆中丢失。
由于子宫颈筛选评估了子宫颈上皮脱落的细胞的形态变化,因此基质细胞不可能在Pap测试样本中出现。因此标记物筛选集中于那些能在子宫颈发育异常和扩散性肿瘤的上皮细胞中差异表达的候选标记物。为了解不同类型的子宫颈损伤和肿瘤中每种标记物升高的频率,用所有微阵列上的中心组织进行频率计算。计算基于半定量随机评分法。信号的计分范围是从0至3:0-无信号;1-弱而模糊的信号;2-确定的弱至中等的信号;3-强至非常强的信号。表6显示本发明标记物的评分结果。要认为是阳性的,则中心组织必须具有≥2的信号分值。在微阵列包含一个病人的超过一个中心组织的情况下,阳性认定必须是至少50%的中心组织≥2。为了更好地使结果可视化,以正常子宫颈组织阳性中心增加的频率为顺序来提供选出的标记物。发现标记物升高的频率与临床异常状态高度相关,并在一个从标记物至特定临床状态标记物的大范围内变化。例如,IFI27具有相对较高(>20%)的正常子宫颈组织的阳性中心,而诸如ITGB6和CLDN1的标记物在正常组织中相对较低并在LSIL和HSIL中开始升高。BST2阳性中心出现在肿瘤进程的较晚阶段,在从高度癌变前病变至扩散性疾病的转变之中。这些发现证实了在子宫颈癌发展期间存在能鉴别连续分子变化的标记物。
实施例2:基因表达分析
RNA制备
按照厂商的说明书(Invitrogen)利用TRIZOL试剂,用单步法从各种人体组织中提取总RNA。用DNA酶I(Ambion)在37℃下处理每个要制备的RNA 1小时。利用β-2微小球蛋白作为内部扩增对照,样本如果需要至少38个PCR扩增循环以达到荧光阈值水平(或18s核糖体基因进行35个PCR扩增循环),则确定DNA酶I处理已完成。DNA酶I处理后,通过琼脂糖凝胶电泳和溴化乙锭染色来确认RNA样本的完整性。用酚抽提后,根据厂商的说明书(Applied Biosytems)利用Taqman反转录试剂从样本中制备cDNA。未加反转录酶的RNA负对照也模仿对每个RNA样本进行反转录。
TAQMAN
用TAQMAN定量PCR(Applied Biosytems)测定各种正常和疾病(如,癌的)人体组织或细胞系中制得的cDNA中的基因表达。
探针的制备
基于特定基因及其相关转录产物序列,用Primer Express软件(Applied Biosystems)设计探针。每个靶基因探针用FAM(6-羧基荧光素)标记,而18s对照探针用不同的荧光染料VIC来标记。因此靶基因和内部对照基因不一样的标记能使测定在同一个孔中进行。检测引物和探针对特定基因的每个转录产物的灵敏度和特异性。把18s和靶基因的正向或反向引物和探针加入到TAQMAN通用PCR主要混合液(Applied Biosystems)中。尽管引物和探针的终浓度可能发生变化,但是每个在特定实验中都是内在一致的。典型的实验包含18s的100nM正向和反向引物加上200nM探针和靶基因的900nM正向或反向引物加上250nM探针。在ABI PRISM 7700型序列检测系统(AppliedBiosystems)上进行TAQMAN基质实验。热循环条件如下:50℃下维持2分钟并在95℃下维持10分钟,接着两步95℃下15秒40个循环的PCR,接着60℃下1分钟。
相对于相同组织中的18s表达,应用以下方法定量计算各种组织中的基因表达。阈循环(Ct)值定义为检测到的统计上荧光明显增加的循环。较低的Ct值指示了较高的mRNA浓度。应用以下公式:ΔCt=Ct(靶转录产物)-Ct(18s),扣除18s核糖体基因的Ct值使基因的Ct值标准化从而获得ΔCt值。然后用2-ΔCt给出的算术公式计算相对表达。然后用数字表示每个所测的组织中的靶基因的表达(表9-13)。表9-13鉴定了样本(样本#)、组织病期和靶基因的表达。假如可行,被测试的标记物(列于表1)也可用变体、引物和探针(列于表7)来鉴定。例如在表12中,与M30A[1]相应的数据用表7中所鉴定的正向引物1(F1)、反向引物1(R1)和探针1(P1)鉴定出标记物M30A。
用末端PCR进行的基因表达分析
集中不同组织的总RNA以用作产生第一链cDNA的模板。子宫颈栏由子宫颈肿瘤库、子宫颈正常组织库、“其它正常组织”库和“其它肿瘤”库组成。库由等量的每个样本组成。
  库的类型   组成成分
  子宫颈肿瘤库   4个肿瘤样本(鳞状细胞癌)
  子宫颈正常组织库   3个正常子宫颈样本
  其它肿瘤库   子宫颈癌-4个鳞状细胞癌样本结肠癌-5个腺癌样本肺肿瘤-3个鳞状细胞癌、3个腺癌、1个支气管癌和1个巨大细胞未分化癌卵巢肿瘤-2个浆液性癌和2个透明细胞癌前瘤腺肿瘤-5个腺癌
  其它正常组织库   样本各自来自正常的心脏、肾脏、小肠、脾、WBC、肺、肝脏、脑、骨髓、和结肠组织
应用ThermoScript RT-PCR系统(Invitrogen,San Diego,CA)获取cDNA。按照厂商的说明书,1μgRNA和1μl 50μM寡(dT)20引物以10μl体积在65℃下变性5分钟。在85℃下温育5分钟从而终止反应。最终产物用水稀释成最终体积100μl。
就在开放阅读框起始点或外面设计出基因特异性引物(表7)。根据引物和期望产物的大小优化PCR的条件。通过降低的循环条件把2μl cDNA用于20μl反应体系中。在包含琼脂糖凝胶的溴化乙啶中处理产物。然后对凝胶图片进行半定量分析并评分。
对组织栏中的末端PCR的溴化乙啶琼脂糖凝胶图片在0-5的范围内进行评分(表8)。由3人独立对每个图片评分并汇编其结果。比较结果以证实在条带的相对强度上是一致的并在需要的地方进行修饰。然后把3个得分的中值记为最终得分。
表中提供的数据概述
表1鉴定了本发明的标记物(SEQ ID NO:1-44),它们表示成名称(“标记物”),如果可行的话,则表示成该基因所众所周知的名称(“基因名称”),由标记物编码或相应于标记物的核苷酸转录产物cDNA序列的序列表标识(“SEQ ID NO(nts)”)、由核苷酸转录产物编码的蛋白的氨基酸序列的序列表标识(“SEQ ID NO(AAs)”)、以及cDNA序列中的蛋白编码序列的位置(“CDS”)。
表2和3列出了新鉴定的核苷酸和氨基酸序列,它们表示成名称(“标记物”),如果可行的话,则表示成该基因所众所周知的名称(“基因名称”)、由标记物编码或相应于标记物的核苷酸转录产物cDNA序列的序列表标识(“SEQ ID NO(nts)”)、由核苷酸转录产物编码的蛋白的氨基酸序列的序列表标识(“SEQ ID NO(AAs)”)、以及cDNA序列中的蛋白编码序列的位置(“CDS”)。
表4鉴定了本发明的标记物及其在SCC、ACA和HSIL中的标记物得分。表4的标记物表示成名称(“标记物”),如果可行的话,则表示成该基因所众所周知的名称(“基因名称”)、鳞状细胞癌范例的标记物得分(“SCC得分”)、腺癌示例的标记物得分(“ACA得分”)、以及高度鳞状上皮内病变范例的标记物得分(“HSIL得分”)。
表5列出了子宫颈癌中用原位杂交鉴定出过表达的标记物并指出了标记物表达的位置。表5的标记物表示成名称(“标记物”),如果可行的话,则表示成该基因所众所周知的名称(“基因名称”)、子宫颈上皮细胞中检测到的原位杂交信号(“信号定位”)。
表6列出了子宫颈发育异常的上皮细胞和扩散性肿瘤中的标记物的差异表达。表6的标记物表示成名称(“标记物”),如果可行的话,则表示成该基因所众所周知的名称(“基因名称”),并对每一个标记物,则列出表示为标记物升高频率(“频率”)和子宫颈阴道部和子宫颈内膜细胞(“正常(EC+END)”)中的阳性数比患者数的比值(“#阳性/#患者”)、标记物升高频率(“频率”)和低度鳞状上皮内病变(“LSIL”)中的阳性数比患者数的比值(“#阳性/#患者”)、标记物升高频率(“频率”)和高度鳞状上皮内病变(“HSIL”)中的阳性数比患者数的比值(″#阳性/#患者″)、以及标记物升高频率(“频率”)和鳞状细胞癌和腺癌(“肿瘤(SCC+ACA)”)中的阳性数比患者数的比值(“#阳性/#患者”)。
表7列出了基因特异性引物。表7鉴定了标记物,它们表示成名称(“标记物”)、对应于Taqman引物1匹配位置的基因特异性引物(“匹配位置:Taqman引物1”)、对应于Taqman引物2匹配位置的基因特异性引物(“匹配位置:Taqman引物2”)、对应于Taqman探针匹配位置的基因特异性引物(“匹配位置:Taqman探针”)、对应于末端PCR引物1匹配位置的基因特异性引物(“匹配位置:末端PCR引物1”)、以及对应于末端PCR引物1匹配位置的基因特异性引物(“匹配位置:末端PCR引物1”)。表7鉴定了正向1的(“F1”);正向2的(“F2”);反向1的(“R1”);反向2的(“R2”)引物,以及探针(“P1”表示探针1;以及“P2”表示探针2)。
表8列出了组织栏的末端PCR溴化乙锭琼脂糖凝胶图片中范围在0-5的得分。表8鉴定了标记物,它们表示成名称(“标记物”)、以及所用的样本(“正常子宫颈”和“子宫颈肿瘤”)。
表9-13鉴定了每个所测组织中靶基因的表达。表9-13鉴定了样本,它们表示成数量(“样本#”)、样本的组织病期(“组织病期”)、和靶基因的表达(“基因名称”)。表9-13也鉴定了与表1中所列的标记物名称相对应的标记物名称、引物和探针(列于表7),如果可行的话,则是经过检测的。例如,在表12中,与“M30A[1]”相对应的数据利用表7所述的正向引物1(F1)、反向引物1(R1)和探针1(P1)鉴定了标记物。
利用前述方法获得的标记物不应被解释作为限制。本申请全文中引用的所有参考文献、数据库、专利和公开的专利申请都明确地并入作为参考。
其它实施方案
在使用不超过常规实验技术的条件下,本领域技术人员会知道或能确认本文中描述的本发明具体实施方案的许多等价实施方案。所述等价实施方案规定为被如下权利要求所涵盖。
表1
  序列相关信息
  标记物   基因名称  SEQ ID NO(nts)  SEQ ID NO(AAs)   CDS
  M1A   APOL1:载脂蛋白L1   1   2   162..1358
  M718   APOL2:载脂蛋白L2   3   4   337..1350
  OV3A   AQP5:水通道蛋白5,变体1   5   6   517..1314
  M719   AQP5:水通道蛋白5,变体2   7   8   517..1149
  M720   AQP5:水通道蛋白5,变体3   9   10   517..1185
  M5A   BST2:骨髓基质细胞抗原2   11   12   78..620
  M10A   CLDN1:claudin-1,衰老相关的上皮膜蛋白1   13   14   221..856
  M29A   COTL1:cocatosin-样1(网柱原虫属)   15   16   150..576
  M30A   IFI27:干扰素,α-诱导蛋白27,变体1   17   18   120..488
  M721   IFI27:干扰素,α-诱导蛋白27,变体2   19   20   120..479
  M488A   ITGA3:整联蛋白,α3(抗原CD49C,VLA-3受体的α3亚基)   21   22   240..3353
  M35   ITGB6:整联蛋白,β6,变体1   23   24   195..2561
  M722   ITGB6:整联蛋白,β6,变体2   25   26   241..2388
  M723   ITGB6:整联蛋白,β6,变体3   27   28   195..2240
  M666   KCNAB1:钾电压控制通道,颤抖(shaker)相关亚科,β分子   29   30   89..1315
  M489A   MCM6:微型染色体蛋白维持缺陷型(mis5,S.pombe)6   31   32   56..2521
  OV43A   MSLN:mesothelin,巨核细胞强化因子   33   34   88..1956
  M51A   MYBL2:B-MYB,转录因子(v-myb成髓细胞血症病毒性癌基因同系物)   35   36   128..2230
  M58   PLAU:纤溶酶原激活剂,尿激酶   37   38   77..1372
  M22A   RTP801:组织缺氧诱导因子(HIF-1)响应基因   39   40   198..896
  M74A   TPO2A:DNA拓扑异构酶II,α同工酶   41   42   127..4722
  M78   ZNF-P66:C2H2型锌指蛋白(66kD)   43   44   45..1343
表2
  序列相关信息
  标记物   基因名称  SEQ ID NO(nts)  SEQ ID NO(AAs)   CDS
  M1A   APOL1:载脂蛋白L1   1   2   162..1358
  M719   AQP5:水通道蛋白5,变体2   7   8   517..1149
  M720   AQP5:水通道蛋白5,变体3   9   10   517..1185
  M721   IFI27:干扰素,α-诱导蛋白27,变体2   19   20   120..479
  M488A   ITGA3:整联蛋白,α3(抗原CD49C,VLA-3受体的α3亚基)   21   22   240..3353
  M722   ITGB6:整联蛋白,β6,变体2   25   26   241..2388
  M723   ITGB6:整联蛋白,β6,变体3   27   28   195..2240
  M78   ZNF-P66:C2H2型锌指蛋白(66kD)   43   44   45..1343
表3
  序列相关信息标记物基因名称SEQ ID NO
 SEQ ID NO   CDS  (nts)
 (AAs)   M5A   BST2:骨髓基质细胞抗原2   11
  12   78..620   M30A   IFI27:干扰素,α-诱导蛋白27,变体1   17
  18   120..488   M35   ITGB6:整联蛋白,β6,变体1   23
表4
  标记物   基因名称   SCC得分   ACA得分   HSIL得分
  M666   KCNAB1:钾电压控制通道,颤抖(shaker)相关亚科,β分子   3.6   3.9   1.4
  M10A   CLDN1:claudin-1,衰老相关的上皮膜蛋白1   3.3   1.0   1.3
  M29A   COTL1:cocatosin-样1(网柱原虫属)   3.2   1.9   1.0
  M5A   BST2:骨髓基质细胞抗原2   3.1   3.5   1.7
  M78   ZNF-P66:C2H2型锌指蛋白(66kD)   3.0   3.1   1.4
  M22A   RTP801:组织缺氧诱导因子(HIF-1)响应基因   2.9   3.0   1.4
  M30AM721   IFI27:干扰素,α-诱导蛋白27,变体1和2   2.9   2.5   1.2
  M1A   APOL1:载脂蛋白L1   2.8   3.1   1.9
  M488A   ITGA3:整联蛋白,α3(抗原CD49C,VLA-3受体的α3亚基)   2.7   3.7   1.1
  M35M722M723   ITGB6:整联蛋白,β6,变体1,2和3   2.4   3.9   1.0
  M51A   MYBL2:B-MYB,转录因子(v-myb成髓细胞血症病毒性癌基因同系物)   2.3   4.2   1.8
  M489A   MCM6:微型染色体蛋白维持缺陷型(mis5,S.pombe)6   2.3   3.2   1.5
  M74A   TPO2A:DNA拓扑异构酶II,α同工酶   1.7   3.2   1.6
  OV3AM719M720   AQP5:水通道蛋白5,变体1,2和3   1.0   3.2   1.6
表5
  标记物   基因名称   信号定位
  M666   KCNAB1:钾电压控制通道,颤抖(shaker)相关亚科,β分子   上皮细胞
  M29A   COTL1:cocatosin-样1(网柱原虫属)   上皮细胞
  M74A   TPO2A:DNA拓扑异构酶II,α同工酶   上皮细胞
  M30AM721   IFI27:干扰素,α-诱导蛋白27,变体1和2   上皮细胞
  M78   ZNF-P66:C2H2型锌指蛋白(66kD)   上皮细胞
  M488A   ITGA3:整联蛋白,α3(抗原CD49C,VLA-3受体的α3亚基)   上皮细胞
  OV3AM719M720   AQP5:水通道蛋白5,变体1,2和3   上皮细胞
  M5A   BST2:骨髓基质细胞抗原2   上皮细胞
  M22A   RTP801:组织缺氧诱导因子(HIF-1)响应基因   上皮细胞
  M51A   MYBL2:B-MYB,转录因子(v-myb成髓细胞血症病毒性癌基因同系物)   上皮细胞
  M35M722M723   ITGB6:整联蛋白,β6,变体1,2和3   上皮细胞
  M16   CRIP1:富含半胱氨酸蛋白1(肠内的)   上皮细胞
  M489A   MCM6:微型染色体蛋白维持缺陷型(mis5,S.pombe)6   上皮细胞
  M10A   CLDN1:claudin-1,衰老相关的上皮膜蛋白1   上皮细胞
  M1A   APOL1:载脂蛋白L1   上皮细胞
表6
Figure A0382445600901
a:中心组织阳性是那些具有ISH得分≥2的。
b:正常子宫颈阴道部和子宫颈内膜细胞。
c:在某些受限于基底/旁基底(parabasal)细胞的正常鳞状上皮中表达。
阴影格表示在至少20%患者中ISH得分≥2。
表7
  Taqman/PCR引物相关信息
  标记物   匹配位置:Taqman引物1   匹配位置:Taqman引物2   匹配位置:Taqman探针   匹配位置:末端PCR引物1   匹配位置:末端PCR引物2
  M1A   99-121   238-218   186-160   82-103   1673-1693
  M718   166-188   251-231   190-217   143-164   1680-1700
  OV3A   914-935   980-964   938-961   512-534   1432-1449
  M719   842-857   912-895   869-894   512-534   1267-1284
  M720   1097-1116   1174-1155   1154-1133   512-534   1512-1529
  M5A   1-23;34-56   628-647
  M10A   164-182   888-908
  M29A   123-139   592-610
  M30A   (F1)208-228//(F2)257-275   (R1)315-298//(R2)336-316   (P1)260-242//(P2)277-296   7-26   510-529
  M721   (F1)208-228//(F2)248-266   (R1)306-289//(R2)327-307   (P1)258-234)//P2)268-287   7-26   501-520
  M488A   187-209   3412-3434
  M35   (F1)1900-1920//(F2)628-648   (R1)1970-1950//(R2)698-672   (P1)1923-1945//(P2)670-650   188-208   2592-2616
  M722   (F1)1727-1747//(F2)318-337//(F3)455-475   (R1)1797-1777//(R2)409-391//(R3)525-499   (P1)1750-1772//(P2)377-360//(P3)497-477   188-208   2419-2443
  M723   (F1)1796-1818//(F2)628-648   (R1)1891-1870//(R2)698-672   (P1)1869-1843//(P2)670-650   188-208   2271-2295
  M666   89-108   1288-1312
  M489A   21-39   2563-2580
  OV43A   1198-1215   1272-1290
  M51A   216-233   2291-2315
  M58   52-70   1396-1415
  M22A   139-159   997-1017
  M74A
  M78   6-25   1393-1418
表8
  标记物   正常子宫颈   子宫颈肿瘤
  M1A   1   5
  M718   1   3
  OV3A   1   4
  M719   1   4
  M720   1   4
  M5A   3   3
  M10A   3   5
  M29A   2   5
  M30A   4   5
  M721   4   5
  M488A   2   5
  M35   0   5
  M722   0   5
  M723   0   5
  M666   0   5
  M489A   2   5
  OV43A   0   4
  M51A   0   5
  M58   2   2
  M22A   1   5
  M74A
  M78   0   2
表9:水通道蛋白5的表达
  样本#   组织病期   OV3A   M719   M720
  1   正常   0.37   0.01   0.00
  2   正常   0.02   0.00   0.00
  3   正常   0.98   0.01   0.02
  4   正常   0.01   0.00   0.00
  5   正常   0.39   0.01   0.01
  6   正常   0.00   0.00   0.00
  7   正常   1.59   0.07   0.01
  8   正常   0.12   0.00   0.00
  9   正常   0.00   0.00   0.00
  10   正常   0.00   0.00   0.00
  11   SCC   0.79   0.05   0.01
  12   SCC   0.23   0.01   0.00
  13   SCC   0.17   0.00   0.01
  14   SCC   0.66   0.03   0.01
  15   SCC   1.37   0.03   0.00
  16   SCC   3.22   0.33   0.02
  17   SCC   0.00   0.00   0.00
  18   SCC/AIS   0.12   0.00   0.00
  19   SSC   0.02   0.00   0.00
  20   低分化腺鳞状   0.18   0.01   0.00
  21   SSC   0.01   0.00   0.00
  22   腺癌   0.02   0.00   0.00
  23   腺癌   0.78   0.03   0.01
  24   SCC   0.12   0.01   0.00
  25   SSC   0.00   0.00   0.00
  26   SSC   0.00   0.00   0.00
  27   SSC   0.00   0.00   0.00
  28   SSC   0.08   0.01   0.00
  29   SSC   1.59   0.06   0.02
  30   SSC   0.07   0.00   0.00
  31   腺癌   0.27   0.01   0.00
  32   腺癌   1.29   0.03   0.03
  33   SCC   0.03   0.00   0.00
  34   SSC   0.01   0.00   0.00
  35   SSC   6.92   0.11   0.05
  36   SSC   0.03   0.00   0.00
  37   SSC   0.15   0.00   0.00
  38   SSC   0.00   0.00   0.00
  39   SSC   0.01   0.00   0.00
  40   SSC   0.06   0.00   0.00
  41   SSC   0.02   0.00   0.00
  42   肿瘤   0.13   0.00   0.00
表10:载脂蛋白L1的表达
  样本#   组织病期   M1A
  1   正常   0.60
  2   正常   0.14
  3   正常   0.60
  4   正常   0.48
  5   正常   0.44
  6   正常   0.24
  7   正常   0.18
  8   正常   0.34
  9   正常   0.52
  10   正常   0.62
  11   SCC   1.56
  12   SCC   2.02
  13   SCC   2.50
  14   SCC   3.15
  15   SCC   1.14
  16   SCC   3.42
  17   SCC   2.51
  18   SCC/AIS   17.88
  19   SSC   1.18
  20   低分化腺鳞状   1.32
  21   SSC   1.38
  22   腺癌   6.61
  23   腺癌   0.08
  24   SCC   1.37
  25   SSC   6.28
  26   SSC   1.91
  27   SSC   5.14
  28   SSC   0.59
  29   SSC   0.30
  30   SSC   5.30
  31   腺癌   2.10
  32   腺癌   1.51
  33   SCC   8.09
  34   SSC   0.35
  35   SSC   0.38
  36   SSC   4.11
  37   SSC   1.83
  38   SSC   3.99
  39   SSC   4.48
  40   SSC   3.77
  41   SSC   10.08
  42   肿瘤   0.12
表11:载脂蛋白L2的表达
  样本#   组织病期   M718
  1   正常   0.20
  2   正常   0.06
  3   正常   0.19
  4   正常   0.15
  5   正常   0.20
  6   正常   0.15
  7   正常   0.13
  8   正常   0.26
  9   正常   0.32
  10   正常   0.34
  11   SCC   1.15
  12   SCC   0.42
  13   SCC   0.67
  14   SCC   0.93
  15   SCC   0.51
  16   SCC   0.69
  17   SCC   0.54
  18   SCC/AIS   0.75
  19   SSC   0.36
  20   低分化腺鳞状   0.67
  21   SSC   0.30
  22   腺癌   0.82
  23   腺癌   0.11
  24   SCC   0.52
  25   SSC   2.68
  26   SSC   0.51
  27   SSC   1.82
  28   SSC   0.51
  29   SSC   0.17
  30   SSC   1.90
  31   腺癌   0.34
  32   腺癌   0.49
  33   SCC   1.82
  34   SSC   0.11
  35   SSC   0.28
  36   SSC   0.62
  37   SSC   0.55
  38   SSC   0.68
  39   SSC   0.72
  40   SSC   0.38
  41   SSC   0.87
  42   肿瘤   0.34
表12:干扰素,α-诱导蛋白27的表达
  样本#   组织病期   M30A[1]   M721[1]   M30A[2]M721[2]
  1   正常   1.75   1.77   3.84
  2   正常   0.21   1.25   1.44
  3   正常   2.73   4.15   9.46
  4   正常   0.00   39.85   17.37
  5   正常   14.62   29.54   62.89
  6   正常   14.47   20.68   32.12
  7   正常   1.04   12.95   8.31
  8   正常   4.56   8.96   15.70
  9   正常   18.02   23.27   46.52
  10   正常   5.83   39.68   32.94
  11   SCC   6.66   7.60   15.26
  12   SCC   0.98   5.48   5.08
  13   SCC   0.00   24.93   14.39
  14   SCC   3.58   26.17   19.23
  15   SCC   12.51   8.70   37.53
  16   SCC   0.00   366.10   244.10
  17   SCC   23.94   78.32   127.98
  18   SCC/AIS   32.25   287.87   251.55
  19   SSC   4.24   3.31   15.21
  20   低分化腺鳞状   6.88   6.04   24.17
  21   SSC   6.51   5.44   17.83
  22   腺癌   14.72   74.02   110.70
  23   腺癌   0.06   0.05   0.25
  24   SCC   11.61   7.58   32.57
  25   SSC   0.00   117.40   71.70
  26   SSC   0.00   73.80   35.81
  27   SSC   11.76   6.31   31.11
  28   SSC   14.72   9.34   31.94
  29   SSC   0.67   0.42   2.69
  30   SSC   34.47   33.49   107.11
  31   腺癌   0.00   10.66   5.03
  32   腺癌   6.97   5.66   16.30
  33   SCC   17.92   97.36   101.33
  34   SSC   11.51   7.52   22.49
  35   SSC   6.89   42.12   38.96
  36   SSC   2.73   35.04   25.04
  37   SSC   13.85   7.68   34.26
  38   SSC   0.00   28.34   18.79
  39   SSC   20.60   15.88   94.41
  40   SSC   0.00   13.33   9.11
  41   SSC   10.09   12.91   40.59
  42   肿瘤   0.41   0.68   2.13
表13:整联蛋白,β6的表达
  样本#   组织病期   M35[1]/M722[1]   M722[2]   M723[1]   M35[2]/M722[3]/M723[2]
  1   正常   0.45   0.0005   0.019   0.57
  2   正常   0.21   0.0002   0.006   0.32
  3   正常   0.09   0.0001   0.001   0.17
  4   正常   0.13   0.0002   0.003   0.27
  5   正常   0.11   0.0002   0.012   0.18
  6   正常   0.55   0.0004   0.014   0.72
  7   正常   0.11   0.0001   0.003   0.13
  8   正常   0.08   0.0000   0.003   0.09
  9   正常   0.27   0.0002   0.006   0.26
  10   正常   0.56   0.0005   0.016   0.77
  11   SCC   1.42   0.0016   0.058   1.90
  12   SCC   0.25   0.0004   0.007   0.56
  13   SCC   8.24   0.0033   0.333   10.81
  14   SCC   0.26   0.0001   0.003   0.29
  15   SCC   0.55   0.0003   0.014   0.62
  16   SCC   1.22   0.0008   0.032   1.57
  17   SCC   3.46   0.0048   0.181   5.36
  18   SCC/AIS   1.58   0.0004   0.107   2.45
  19   SSC   0.39   0.0004   0.023   0.66
  20   低分化腺鳞状   0.56   0.0005   0.022   0.91
  21   SSC   2.92   0.0013   0.092   3.95
  22   腺癌   0.48   0.0002   0.012   0.68
  23   腺癌   0.30   0.0003   0.002   0.56
  24   SCC   1.75   0.0010   0.083   3.34
  25   SSC   0.43   0.0003   0.029   0.79
  26   SSC   0.31   00004   0.018   0.46
  27   SSC   0.60   0.0009   0.026   0.89
  28   SSC   3.30   0.0025   0.131   4.45
  29   SSC   2.28   0.0037   0124   4.37
  30   SSC   0.54   0.0007   0.021   0.87
  31   腺癌   0.27   0.0002   0.007   0.58
  32   腺癌   0.27   0.0003   0.012   0.35
  33   SCC   3.46   0.0036   0.127   4.77
  34   SSC   0.67   0.0004   0.036   1.19
  35   SSC   0.94   0.0003   0.047   1.06
  36   SSC   1.66   0.0004   0.057   1.74
  37   SSC   2.20   0.0016   0.086   3.34
  38   SSC   0.46   0.0002   0.008   0.41
  39   SSC   0.82   0.0004   0.030   0.74
  40   SSC   0.41   0.0002   0.013   0.29
  41   SSC   3.04   0.0021   0.076   2.69
  42   肿瘤   0.07   0.0000   0.001   0.06
                            序列表
<110>Millennium Pharmaceuticals,Inc.et al.
<120>用于鉴定,评估,预防和治疗宫颈癌的组合物,试剂盒和方法
<130>MRI-062PC
<150>60/404770
<151>2002-08-20
<160>44
<170>FastSEQ for Windows Version 4.0
<210>1
<211>2848
<212>DNA
<213>人
<400>1
actttccctt tcgaattcct cggtatatct tggggactgg aggacctgtc tggttattat  60
acagacgcat aactggaggt gggatccaca cagctcagaa cagctggatc ttgctcagtc  120
tctgccaggg gaagattcct tggaggaggc cctgcagcga catggaggga gctgctttgc  180
tgagagtctc tgtcctctgc atctggatga gtgcactttt ccttggtgtg ggagtgaggg  240
cagaggaagc tggagcgagg gtgcaacaaa acgttccaag tgggacagat actggagatc  300
ctcaaagtaa gcccctcggt gactgggctg ctggcaccat ggacccagag agcagtatct  360
ttattgagga tgccattaag tatttcaagg aaaaagtgag cacacagaat ctgctactcc  420
tgctgactga taatgaggcc tggaacggat tcgtggctgc tgctgaactg cccaggaatg  480
aggcagatga gctccgtaaa gctctggaca accttgcaag acaaatgatc atgaaagaca  540
aaaactggca cgataaaggc cagcagtaca gaaactggtt tctgaaagag tttcctcggt  600
tgaaaagtaa gcttgaggat aacataagaa ggctccgtgc ccttgcagat ggggttcaga  660
aggtccacaa aggcaccacc atcgccaatg tggtgtctgg ctctctcagc atttcctctg  720
gcatcctgac cctcgtcggc atgggtctgg cacccttcac agagggaggc agccttgtac  780
tcttggaacc tgggatggag ttgggaatca cagcagcttt gaccgggatt accagcagta  840
ccatagacta cggaaagaag tggtggacac aagcccaagc ccacgacctg gtcatcaaaa  900
gccttgacaa attgaaggag gtgaaggagt ttttgggtga gaacatatcc aactttcttt  960
ccttagctgg caatacttac caactcacac gaggcattgg gaaggacatc cgtgccctca  1020
gacgagccag agccaatctt cagtcagtac cgcatgcctc agcctcacgc ccccgggtca  1080
ctgagccaat ctcagctgaa agcggtgaac aggtggagag agttaatgaa cccagcatcc  1140
tggaaatgag cagaggagtc aagctcacgg atgtggcccc tgtaagcttc tttcttgtgc  1200
tggatgtagt ctacctcgtg tacgaatcaa agcacttaca tgagggggca aagtcagaga  1260
cagctgagga gctgaagaag gtggctcagg agctggagga gaagctaaac attctcaaca  1320
ataattataa gattctgcag gcggaccaag aactgtgacc acagggcagg gcagccacca  1380
ggagagatat gcctggcagg ggccaggaca aaatgcaaac tttttttttt ttctgagaca  1440
gagtcttgct ctgtcgccaa gttggagtgc aatggtgcga tctcagctca ctgcaagctc  1500
tgcctcccgt gttcaagcga ttctcctgcc ttggcctccc aagtagctgg gactacaggc  1560
gcctaccacc atgcccagct aatttttgta tttttaatag agatggggtt tcaccatgtt  1620
ggccaggatg gtctcgatct cctgacctct tgatctgccc accttggcct cccaaagtgc  1680
tgggattaca ggcgtgagcc atcgcttttg acccaaatgc aaacatttta ttagggggat  1740
aaagagggtg aggtaaagtt tatggaactg agtgttaggg actttggcat ttccatagct  1800
gagcacagca ggggaggggt taatgcagat ggcagtgcag caaggagaag gcaggaacat  1860
tggagcctgc aataagggaa aaatgggaac tggagagtgt ggggaatggg aagaagcagt  1920
ttactttaga ctaaagaata tattgggggg ccgggtgtag tggctcatgc ctgtaatccg  1980
agcactttgg gaggccaagg cgggcggatc acgaggtcag gagatcaaga ccatcctggc  2040
taacacagtg aaaccccgtc tctactaaaa atacaaaaaa ttagccgggc atggtggcgg  2100
gcgcctgtag ttccagctaa ctgggcggct gaggcaggag aatggcgtga acctgggagg  2160
tggagcttgc agtgagccga gatatcgcca ctgcactcca gcctgggtga cagagcgaga  2220
ctccatctca aaaaaaaaaa aaaaaagaat atattgacgg aagaatagag aggaggcttg  2280
aaggaaccag caatgagaag gccaggaaaa gaaagagctg aaaatggaga aagcccaaga  2340
gttagaacag ttggatacag gagaagaaac agcggctcca ctacagaccc agccccaggt  2400
tcaatgtcct ccgaagaatg aagtctttcc ctggtgatgg tcccctgccc tgtctttcca  2460
gcatccactc tcccttgtcc tcctgggggc atatctcagt caggcagcgg cttcctgatg  2520
atggtcgttg gggtggttgt catgtgatgg gtcccctcca ggttactaaa gggtgcatgt  2580
cccctgcttg aacactgaag ggcaggtggt gggccatggc catggtcccc agctgaggag  2640
caggtgtccc tgagaaccca aacttcccag agagtatgtg agaaccaacc aatgaaaaca  2700
gtcccatcgc tcttacccgg taagtaaaca gtcagaaaat tagcatgaaa gcagtttagc  2760
attgggagga agctcagatc tctagagctg tcttgtcgcc gcccaggatt gacctgtgtg  2820
taagtcccaa taaactcacc tactcatc                                     2848
<210>2
<211>398
<212>PRT
<213>人
<400>2
Met Glu Gly Ala Ala Leu Leu Arg Val Ser Val Leu Cys Ile Trp Met
 1               5                  10                  15
Ser Ala Leu Phe Leu Gly Val Gly Val Arg Ala Glu Glu Ala Gly Ala
            20                  25                  30
Arg Val Gln Gln Asn Val Pro Ser Gly Thr Asp Thr Gly Asp Pro Gln
        35                  40                  45
Ser Lys Pro Leu Gly Asp Trp Ala Ala Gly Thr Met Asp Pro Glu Ser
    50                  55                  60
Ser Ile Phe Ile Glu Asp Ala Ile Lys Tyr Phe Lys Glu Lys Val Ser
65                  70                  75                  80
Thr Gln Asn Leu Leu Leu Leu Leu Thr Asp Asn Glu Ala Trp Asn Gly
                85                  90                  95
Phe Val Ala Ala Ala Glu Leu Pro Arg Asn Glu Ala Asp Glu Leu Arg
            100                 105                 110
Lys Ala Leu Asp Asn Leu Ala Arg Gln Met Ile Met Lys Asp Lys Asn
        115                 120                 125
Trp His Asp Lys Gly Gln Gln Tyr Arg Asn Trp Phe Leu Lys Glu Phe
    130                 135                 140
Pro Arg Leu Lys Ser Lys Leu Glu Asp Asn Ile Arg Arg Leu Arg Ala
145                 150                 155                 160
Leu Ala Asp Gly Val Gln Lys Val His Lys Gly Thr Thr Ile Ala Asn
                165                 170                 175
Val Val Ser Gly Ser Leu Ser Ile Ser Ser Gly Ile Leu Thr Leu Val
            180                 185                 190
Gly Met Gly Leu Ala Pro Phe Thr Glu Gly Gly Ser Leu Val Leu Leu
        195                 200                 205
Glu Pro Gly Met Glu Leu Gly Ile Thr Ala Ala Leu Thr Gly Ile Thr
    210                 215                 220
Ser Ser Thr Ile Asp Tyr Gly Lys Lys Trp Trp Thr Gln Ala Gln Ala
225                 230                 235                 240
His Asp Leu Val Ile Lys Ser Leu Asp Lys Leu Lys Glu Val Lys Glu
                245                 250                 255
Phe Leu Gly Glu Asn Ile Ser Asn Phe Leu Ser Leu Ala Gly Asn Thr
            260                 265                 270
Tyr Gln Leu Thr Arg Gly Ile Gly Lys Asp Ile Arg Ala Leu Arg Arg
        275                 280                 285
Ala Arg Ala Asn Leu Gln Ser Val Pro His Ala Ser Ala Ser Arg Pro
    290                 295                 300
Arg Val Thr Glu Pro Ile Ser Ala Glu Ser Gly Glu Gln Val Glu Arg
305                 310                 315                 320
Val Asn Glu Pro Ser Ile Leu Glu Met Ser Arg Gly Val Lys Leu Thr
                325                 330                 335
Asp Val Ala Pro Val Ser Phe Phe Leu Val Leu Asp Val Val Tyr Leu
            340                 345                 350
Val Tyr Glu Ser Lys His Leu His Glu Gly Ala Lys Ser Glu Thr Ala
        355                 360                 365
Glu Glu Leu Lys Lys Val Ala Gln Glu Leu Glu Glu Lys Leu Asn Ile
    370                 375                 380
Leu Asn Asn Asn Tyr Lys Ile Leu Gln Ala Asp Gln Glu Leu
385                 390                 395
<210>3
<211>2545
<212>DNA
<213>人
<400>3
gtgctgggga gcagcgtgtt tactgtgctt ggtcatgagc tgctgggaag ttgtgacttt  60
cactttccct ttcgaattcc agggtatatc tgggaggccg gaggacgtgt ctggttatta  120
cacagatgca cagctggacg tgggatccac acagctcaga acagttggat cttgctcagt  180
ctctgtcaga ggaagatccc ttggacaaga ggaccctgcc ttggtgtgag agtgagggaa  240
gaggaagctg gaacgagggt taaggaaaac cttccagtct ggacagtgac tggagagctc  300
caaggaaagc ccctcggtaa cccagccgct ggcaccatga acccagagag cagtatcttt  360
attgaggatt accttaagta tttccaggac caagtgagca gagagaatct gctacaactg  420
ctgactgatg atgaagcctg gaatggattc gtggctgctg ctgaactgcc cagggatgag  480
gcagatgagc tccgtaaagc tctgaacaag cttgcaagtc acatggtcat gaaggacaaa  540
aaccgccacg ataaagacca gcagcacagg cagtggtttt tgaaagagtt tcctcggttg  600
aaaagggagc ttgaggatca cataaggaag ctccgtgccc ttgcagagga ggttgagcag  660
gtccacagag gcaccaccat tgccaatgtg gtgtccaact ctgttggcac tacctctggc  720
atcctgaccc tcctcggcct gggtctggca cccttcacag aaggaatcag ttttgtgctc  780
ttggacactg gcatgggtct gggagcagca gctgctgtgg ctgggattac ctgcagtgtg  840
gtagaactag taaacaaatt gcgggcacga gcccaagccc gcaacttgga ccaaagcggc  900
accaatgtag caaaggtgat gaaggagttt gtgggtggga acacacccaa tgttcttacc  960
ttagttgaca attggtacca agtcacacaa gggattggga ggaacatccg tgccatcaga  1020
cgagccagag ccaaccctca gttaggagcg tatgccccac ccccgcatat cattgggcga  1080
atctcagctg aaggcggtga acaggttgag agggttgttg aaggccccgc ccaggcaatg  1140
agcagaggaa ccatgatcgt gggtgcagcc actggaggca tcttgcttct gctggatgtg  1200
gtcagccttg catatgagtc aaagcacttg cttgaggggg caaagtcaga gtcagctgag  1260
gagctgaaga agcgggctca ggagctggag gggaagctca actttctcac caagatccat  1320
gagatgctgc agccaggcca agaccaatga ccccagagca gtgcagccac cagggcagaa  1380
atgccgggca caggccagga caaaatgcag actttttttt tttttttttt ttttttttga  1440
gatggagtct cgctctatcg cccaggatgg agtgcagtgg ctcaatctcg gctcactgca  1500
aactccgcct cccgggttca caccattctc cggcctcagt ctcccgagta gctgggacta  1560
caggcacctg ccaccacgcc cggctaattt ttttgtattt tcactggaga cggggtttca  1620
ctgtgttagc cacgatggtc tccatctcct gacctcgtga tctgcccacc tcggcctccc  1680
aaagtgctgg gattacaggc gtgagccacc gcgcctggcc aaaatgcaga cattttatta  1740
gggggataag gagggcaagg taaagcttat ggaactgagt gttagtgact ttggcatttg  1800
tgtagctgag cacagcaagg gaggggttaa tgcagatggc aagtgcacca aggagaaggc  1860
aggaacactg gagcctgcaa taagggagga gagaggactg gagagtgtgg ggaatgggaa  1920
gaagtagttt actttggact aaagaatata ttgggcgaag aatagagggg gagcttgcag  1980
gaaccagcaa tgagaaggcc aggaaaagaa agagctgaaa atggagaaaa ccagagttag  2040
aactgttgga tacaggagaa gaaacagcag ctccactacc gacccccccc caggtttgat  2100
gtccttccaa gaataaagtc tttccctggt gatggtctct cgctctgtct ttccagcatc  2160
cactctccct tgtccttctg ggggtgtatc acagtcagcc agtggcttct tcatgatggt  2220
ggttggggtg gttgtcatgt gacgggtccc ctccaggtta ctaaagggtg catgtcccct  2280
gcttgaaccc tgagaggcag gtggtaggcc atggccacaa tccccagctg aggagcaggt  2340
gtccctgaga acccaaactt cccagagagt atctgagaac caaccaatga aaacagtccc  2400
atcgctctta gccggtaagt aaacagtcag aagattagca tgaaagcagt ttagcattgg  2460
gaggaagcac agatctctag agctgtcctg tcgctgccca ggattgacct gtgtgtaagt  2520
cccaataaac tcacctactc accaa                                        2545
<210>4
<211>337
<212>PRT
<213>人
<400>4
Met Asn Pro Glu Ser Ser Ile Phe Ile Glu Asp Tyr Leu Lys Tyr Phe
 1               5                  10                  15
Gln Asp Gln Val Ser Arg Glu Asn Leu Leu Gln Leu Leu Thr Asp Asp
            20                  25                  30
Glu Ala Trp Asn Gly Phe Val Ala Ala Ala Glu Leu Pro Arg Asp Glu
        35                  40                  45
Ala Asp Glu Leu Arg Lys Ala Leu Asn Lys Leu Ala Ser His Met Val
    50                  55                  60
Met Lys Asp Lys Asn Arg His Asp Lys Asp Gln Gln His Arg Gln Trp
65                  70                  75                  80
Phe Leu Lys Glu Phe Pro Arg Leu Lys Arg Glu Leu Glu Asp His Ile
                85                  90                  95
Arg Lys Leu Arg Ala Leu Ala Glu Glu Val Glu Gln Val His Arg Gly
            100                 105                 110
Thr Thr Ile Ala Asn Val Val Ser Asn Ser Val Gly Thr Thr Ser Gly
        115                 120                 125
Ile Leu Thr Leu Leu Gly Leu Gly Leu Ala Pro Phe Thr Glu Gly Ile
    130                 135                 140
Ser Phe Val Leu Leu Asp Thr Gly Met Gly Leu Gly Ala Ala Ala Ala
145                 150                 155                 160
Val Ala Gly Ile Thr Cys Ser Val Val Glu Leu Val Asn Lys Leu Arg
                165                 170                 175
Ala Arg Ala Gln Ala Arg Asn Leu Asp Gln Ser Gly Thr Asn Val Ala
            180                 185                 190
Lys Val Met Lys Glu Phe Val Gly Gly Asn Thr Pro Asn Val Leu Thr
        195                 200                 205
Leu Val Asp Asn Trp Tyr Gln Val Thr Gln Gly Ile Gly Arg Asn Ile
    210                 215                 220
Arg Ala Ile Arg Arg Ala Arg Ala Asn Pro Gln Leu Gly Ala Tyr Ala
225                 230                 235                 240
Pro Pro Pro His Ile Ile Gly Arg Ile Ser Ala Glu Gly Gly Glu Gln
                245                 250                 255
Val Glu Arg Val Val Glu Gly Pro Ala Gln Ala Met Ser Arg Gly Thr
            260                 265                 270
Met Ile Val Gly Ala Ala Thr Gly Gly Ile Leu Leu Leu Leu Asp Val
        275                 280                 285
Val Ser Leu Ala Tyr Glu Ser Lys His Leu Leu Glu Gly Ala Lys Ser
    290                 295                 300
Glu Ser Ala Glu Glu Leu Lys Lys Arg Ala Gln Glu Leu Glu Gly Lys
305                 310                 315                 320
Leu Asn Phe Leu Thr Lys Ile His Glu Met Leu Gln Pro Gly Gln Asp
                325                 330                 335
Gln
<210>5
<211>2100
<212>DNA
<213>人
<400>5
agacgccccg aggtcggagt gaagcgccgg gaccgagccc cgtctcccag ggagtccggg   60
gcgcacggca ccgaggagag cgcgggagcc aacctgggcg catcatgcgc agggcccggg   120
acgctgggcc ggtctacacc gccgcctggg tcacgtggcc cggacgggcc ggcggctgcc   180
ccggccgggg ggcgggggtc gcgccggggt tgcgctggac gacggagagc ggcgggcccg   240
cagcggcctg gagcctccca acccgcgccg cgctggccct cgagcgtagg agccgccccc   300
tgcccccccg cgccggcccc gcgcccggcc gcccgccccc tatatagcgc gccccagcag  360
ggcccgcgcc aggccgccag cctcggagtg ggcgcgggac agtgcgcggc gccccgcagc  420
caggcccccg cccccgccgc atccacctcc tccgccgcct gcgacccaac gggcgccccc  480
cgccgcggca gctgccgccg ggcccccgcg gccaccatga agaaggaggt gtgctccgtg  540
gccttcctca aggccgtgtt cgcagagttc ttggccaccc tcatcttcgt cttctttggc  600
ctgggctcgg ccctcaagtg gccgtcggcg ctgcctacca tcctgcagat cgcgctggcg  660
tttggcctgg ccataggcac gctggcccag gccctgggac ccgtgagcgg cggccacatc  720
aaccccgcca tcaccctggc cctcttggtg ggcaaccaga tctcgctgct ccgggctttc  780
ttctacgtgg cggcccagct ggtgggcgcc attgccgggg ctggcatcct ctacggtgtg  840
gcaccgctca atgcccgggg caatctggcc gtcaacgcgc tcaacaacaa cacaacgcag  900
ggccaggcca tggtggtgga gctgattctg accttccagc tggcactctg catcttcgcc  960
tccactgact cccgccgcac cagccctgtg ggctccccag ccctgtccat tggcctgtct  1020
gtcaccctgg gccaccttgt cggaatctac ttcactggct gctccatgaa cccagcccgc  1080
tcttttggcc ctgcggtggt catgaatcgg ttcagccccg ctcactgggt tttctgggta  1140
gggcccatcg tgggggcggt cctggctgcc atcctttact tctacctgct cttccccaac  1200
tccctgagcc tgagtgagcg tgtggccatc atcaaaggca cgtatgagcc tgacgaggac  1260
tgggaggagc agcgggaaga gcggaagaag accatggagc tgaccacccg ctgaccagtg  1320
tcaggcaggg gccagcccct cagcccctga gccaaggggg aaaagaagaa aaagtaccta  1380
acacaagctt cctttttgca caaccggtcc tcttggctga ggaggaggag ctggtcaccc  1440
tggctgcaca gttagagagg ggagaaggaa cccatgatgg gactcctggg gtaggggcca  1500
ggggctgggg tctgctgggg acaggtctct ctgggacaga cctcagagat tgtgaatgca  1560
gtgccaagct cacaggctgc aagggccagg ccagaaaagg gtgggcctgc agcctgcacc  1620
ccccaccttc cccaaccctt cctcaagagc tgaagggatc ccagccccta ggtgggcaga  1680
ggcagaccct ccccagagct ccttaggaag aagacagact ggttcattga atgccgcctt  1740
atttatttct ggtgaggatg catgcgtggg gctgctggtg tttagagtgg gggctaccca  1800
ataaatcact gatactcaaa acaccagcag accctcccca gagctcctta ggaagaagac  1860
agactggttc attgaatgcc gccttattta tttctggtga ggatgcatgc gtggggctgc  1920
tggtgtttag agtgggggct acccaataaa tcactgatac tcacattccg cctctgtctc  1980
tcctcagagt gccttgagac actctggccc attgcctctc ctctttgtca tcccacatcc  2040
tccaccacga tctccacagg gtaccagggg accccaggac aagtgctctg tgggaagaaa  2100
<210>6
<211>265
<212>PRT
<213>人
<400>6
Met Lys Lys Glu Val Cys Ser Val Ala Phe Leu Lys Ala Val Phe Ala
 1               5                  10                  15
Glu Phe Leu Ala Thr Leu Ile Phe Val Phe Phe Gly Leu Gly Ser Ala
            20                  25                  30
Leu Lys Trp Pro Ser Ala Leu Pro Thr Ile Leu Gln Ile Ala Leu Ala
        35                  40                  45
Phe Gly Leu Ala Ile Gly Thr Leu Ala Gln Ala Leu Gly Pro Val Ser
    50                  55                  60
Gly Gly His Ile Asn Pro Ala Ile Thr Leu Ala Leu Leu Val Gly Asn
65                  70                  75                  80
Gln Ile Ser Leu Leu Arg Ala Phe Phe Tyr Val Ala Ala Gln Leu Val
                85                  90                  95
Gly Ala Ile Ala Gly Ala Gly Ile Leu Tyr Gly Val Ala Pro Leu Asn
            100                 105                 110
Ala Arg Gly Asn Leu Ala Val Asn Ala Leu Asn Asn Asn Thr Thr Gln
        115                 120                 125
Gly Gln Ala Met Val Val Glu Leu Ile Leu Thr Phe Gln Leu Ala Leu
    130                 135                 140
Cys Ile Phe Ala Ser Thr Asp Ser Arg Arg Thr Ser Pro Val Gly Ser
145                 150                 155                 160
Pro Ala Leu Ser Ile Gly Leu Ser Val Thr Leu Gly His Leu Val Gly
                165                 170                 175
Ile Tyr Phe Thr Gly Cys Ser Met Asn Pro Ala Arg Ser Phe Gly Pro
            180                 185                 190
Ala Val Val Met Asn Arg Phe Ser Pro Ala His Trp Val Phe Trp Val
        195                 200                 205
Gly Pro Ile Val Gly Ala Val Leu Ala Ala Ile Leu Tyr Phe Tyr Leu
    210                 215                 220
Leu Phe Pro Asn Ser Leu Ser Leu Ser Glu Arg Val Ala Ile Ile Lys
225                 230                 235                 240
Gly Thr Tyr Glu Pro Asp Glu Asp Trp Glu Glu Gln Arg Glu Glu Arg
                245                 250                 255
Lys Lys Thr Met Glu Leu Thr Thr Arg
            260                 265
<210>7
<211>1935
<212>DNA
<213>人
<400>7
agacgccccg aggtcggagt gaagcgccgg gaccgagccc cgtctcccag ggagtccggg  60
gcgcacggca ccgaggagag cgcgggagcc aacctgggcg catcatgcgc agggcccggg  120
acgctgggcc ggtctacacc gccgcctggg tcacgtggcc cggacgggcc ggcggctgcc  180
ccggccgggg ggcgggggtc gcgccggggt tgcgctggac gacggagagc ggcgggcccg  240
cagcggcctg gagcctccca acccgcgccg cgctggccct cgagcgtagg agccgccccc  300
tgcccccccg cgccggcccc gcgcccggcc gcccgccccc tatatagcgc gccccagcag  360
ggcccgcgcc aggccgccag cctcggagtg ggcgcgggac agtgcgcggc gccccgcagc  420
caggcccccg cccccgccgc atccacctcc tccgccgcct gcgacccaac gggcgccccc  480
cgccgcggca gctgccgccg ggcccccgcg gccaccatga agaaggaggt gtgctccgtg  540
gccttcctca aggccgtgtt cgcagagttc ttggccaccc tcatcttcgt cttctttggc  600
ctgggctcgg ccctcaagtg gccgtcggcg ctgcctacca tcctgcagat cgcgctggcg  660
tttggcctgg ccataggcac gctggcccag gccctgggac ccgtgagcgg cggccacatc  720
aaccccgcca tcaccctggc cctcttggtg ggcaaccaga tctcgctgct ccgggctttc  780
ttctacgtgg cggcccagct ggtgggcgcc attgccgggg ctggcatcct ctacggtgtg  840
gcaccgctca atgcccgggg caatctggcc gtcaacgcga tctacttcac tggctgctcc  900
atgaacccag cccgctcttt tggccctgcg gtggtcatga atcggttcag ccccgctcac  960
tgggttttct gggtagggcc catcgtgggg gcggtcctgg ctgccatcct ttacttctac  1020
ctgctcttcc ccaactccct gagcctgagt gagcgtgtgg ccatcatcaa aggcacgtat  1080
gagcctgacg aggactggga ggagcagcgg gaagagcgga agaagaccat ggagctgacc  1140
acccgctgac cagtgtcagg caggggccag cccctcagcc cctgagccaa gggggaaaag  1200
aagaaaaagt acctaacaca agcttccttt ttgcacaacc ggtcctcttg gctgaggagg  1260
aggagctggt caccctggct gcacagttag agaggggaga aggaacccat gatgggactc  1320
ctggggtagg ggccaggggc tggggtctgc tggggacagg tctctctggg acagacctca  1380
gagattgtga atgcagtgcc aagctcacag gctgcaaggg ccaggccaga aaagggtggg  1440
cctgcagcct gcacccccca ccttccccaa cccttcctca agagctgaag ggatcccagc  1500
ccctaggtgg gcagaggcag accctcccca gagctcctta ggaagaagac agactggttc  1560
attgaatgcc gccttattta tttctggtga ggatgcatgc gtggggctgc tggtgtttag  1620
agtgggggct acccaataaa tcactgatac tcaaaacacc agcagaccct ccccagagct  1680
ccttaggaag aagacagact ggttcattga atgccgcctt atttatttct ggtgaggatg  1740
catgcgtggg gctgctggtg tttagagtgg gggctaccca ataaatcact gatactcaca  1800
ttccgcctct gtctctcctc agagtgcctt gagacactct ggcccattgc ctctcctctt  1860
tgtcatccca catcctccac cacgatctcc acagggtacc aggggacccc aggacaagtg  1920
ctctgtggga agaaa                                                   1935
<210>8
<211>210
<212>PRT
<213>人
<400>8
Met Lys Lys Glu Val Cys Ser Val Ala Phe Leu Lys Ala Val Phe Ala
 1               5                  10                  15
Glu Phe Leu Ala Thr Leu Ile Phe Val Phe Phe Gly Leu Gly Ser Ala
            20                  25                  30
Leu Lys Trp Pro Ser Ala Leu Pro Thr Ile Leu Gln Ile Ala Leu Ala
        35                  40                  45
Phe Gly Leu Ala Ile Gly Thr Leu Ala Gln Ala Leu Gly Pro Val Ser
    50                  55                  60
Gly Gly His Ile Asn Pro Ala Ile Thr Leu Ala Leu Leu Val Gly Asn
65                  70                  75                  80
Gln Ile Ser Leu Leu Arg Ala Phe Phe Tyr Val Ala Ala Gln Leu Val
                85                  90                  95
Gly Ala Ile Ala Gly Ala Gly Ile Leu Tyr Gly Val Ala Pro Leu Asn
            100                 105                 110
Ala Arg Gly Asn Leu Ala Val Asn Ala Ile Tyr Phe Thr Gly Cys Ser
        115                 120                 125
Met Asn Pro Ala Arg Ser Phe Gly Pro Ala Val Val Met Asn Arg Phe
    130                 135                 140
Ser Pro Ala His Trp Val Phe Trp Val Gly Pro Ile Val Gly Ala Val
145                 150                 155                 160
Leu Ala Ala Ile Leu Tyr Phe Tyr Leu Leu Phe Pro Asn Ser Leu Ser
                165                 170                 175
Leu Ser Glu Arg Val Ala Ile Ile Lys Gly Thr Tyr Glu Pro Asp Glu
            180                 185                 190
Asp Trp Glu Glu Gln Arg Glu Glu Arg Lys Lys Thr Met Glu Leu Thr
        195                 200                 205
Thr Arg
    210
<210>9
<211>2180
<212>DNA
<213>人
<400>9
agacgccccg aggtcggagt gaagcgccgg gaccgagccc cgtctcccag ggagtccggg  60
gcgcacggca ccgaggagag cgcgggagcc aacctgggcg catcatgcgc agggcccggg  120
acgctgggcc ggtctacacc gccgcctggg tcacgtggcc cggacgggcc ggcggctgcc  180
ccggccgggg ggcgggggtc gcgccggggt tgcgctggac gacggagagc ggcgggcccg  240
cagcggcctg gagcctccca acccgcgccg cgctggccct cgagcgtagg agccgccccc  300
tgcccccccg cgccggcccc gcgcccggcc gcccgccccc tatatagcgc gccccagcag  360
ggcccgcgcc aggccgccag cctcggagtg ggcgcgggac agtgcgcggc gccccgcagc  420
caggcccccg cccccgccgc atccacctcc tccgccgcct gcgacccaac gggcgccccc  480
cgccgcggca gctgccgccg ggcccccgcg gccaccatga agaaggaggt gtgctccgtg  540
gccttcctca aggccgtgtt cgcagagttc ttggccaccc tcatcttcgt cttctttggc  600
ctgggctcgg ccctcaagtg gccgtcggcg ctgcctacca tcctgcagat cgcgctggcg  660
tttggcctgg ccataggcac gctggcccag gccctgggac ccgtgagcgg cggccacatc  720
aaccccgcca tcaccctggc cctcttggtg ggcaaccaga tctcgctgct ccgggctttc  780
ttctacgtgg cggcccagct ggtgggcgcc attgccgggg ctggcatcct ctacggtgtg  840
gcaccgctca atgcccgggg caatctggcc gtcaacgcgc tcaacaacaa cacaacgcag  900
ggccaggcca tggtggtgga gctgattctg accttccagc tggcactctg catcttcgcc  960
tccactgact cccgccgcac cagccctgtg ggctccccag ccctgtccat tggcctgtct  1020
gtcaccctgg gccaccttgt cggaatctac ttcactggct gctccatgaa cccagcccgc  1080
tcttttggcc ctgcggtggt catgaatcgg ttcagccccg ctcactgggg tctgcttcta  1140
tccctgcgtg gaggggacac gcgctctgtt catccgtctc tctgaggacc cacgtgtccc  1200
ctctgaaggt tttctgggta gggcccatcg tgggggcggt cctggctgcc atcctttact  1260
tctacctgct cttccccaac tccctgagcc tgagtgagcg tgtggccatc atcaaaggca  1320
cgtatgagcc tgacgaggac tgggaggagc agcgggaaga gcggaagaag accatggagc  1380
tgaccacccg ctgaccagtg tcaggcaggg gccagcccct cagcccctga gccaaggggg  1440
aaaagaagaa aaagtaccta acacaagctt cctttttgca caaccggtcc tcttggctga  1500
ggaggaggag ctggtcaccc tggctgcaca gttagagagg ggagaaggaa cccatgatgg  1560
gactcctggg gtaggggcca ggggctgggg tctgctgggg acaggtctct ctgggacaga  1620
cctcagagat tgtgaatgca gtgccaagct cacaggctgc aagggccagg ccagaaaagg  1680
gtgggcctgc agcctgcacc ccccaccttc cccaaccctt cctcaagagc tgaagggatc  1740
ccagccccta ggtgggcaga ggcagaccct ccccagagct ccttaggaag aagacagact  1800
ggttcattga atgccgcctt atttatttct ggtgaggatg catgcgtggg gctgctggtg  1860
tttagagtgg gggctaccca ataaatcact gatactcaaa acaccagcag accctcccca  1920
gagctcctta ggaagaagac agactggttc attgaatgcc gccttattta tttctggtga  1980
ggatgcatgc gtggggctgc tggtgtttag agtgggggct acccaataaa tcactgatac  2040
tcacattccg cctctgtctc tcctcagagt gccttgagac actctggccc attgcctctc  2100
ctctttgtca tcccacatcc tccaccacga tctccacagg gtaccagggg accccaggac  2160
aagtgctctg tgggaagaaa                                              2180
<210>10
<211>222
<212>PRT
<213>人
<400>10
Met Lys Lys Glu Val Cys Ser Val Ala Phe Leu Lys Ala Val Phe Ala
 1               5                  10                  15
Glu Phe Leu Ala Thr Leu Ile Phe Val Phe Phe Gly Leu Gly Ser Ala
            20                  25                  30
Leu Lvs Trp Pro Ser Ala Leu Pro Thr Ile Leu Gln Ile Ala Leu Ala
        35                  40                  45
Phe Gly Leu Ala Ile Gly Thr Leu Ala Gln Ala Leu Gly Pro Val Ser
    50                  55                  60
Gly Gly His Ile Asn Pro Ala Ile Thr Leu Ala Leu Leu Val Gly Asn
65                  70                  75                  80
Gln Ile Ser Leu Leu Arg Ala Phe Phe Tyr Val Ala Ala Gln Leu Val
                85                  90                  95
Gly Ala Ile Ala Gly Ala Gly Ile Leu Tyr Gly Val Ala Pro Leu Asn
            100                 105                 110
Ala Arg Gly Asn Leu Ala Val Asn Ala Leu Asn Asn Asn Thr Thr Gln
        115                 120                 125
Gly Gln Ala Met Val Val Glu Leu Ile Leu Thr Phe Gln Leu Ala Leu
    130                 135                 140
Cys Ile Phe Ala Ser Thr Asp Ser Arg Arg Thr Ser Pro Val Gly Ser
145                 150                 155                 160
Pro Ala Leu Ser Ile Gly Leu Ser Val Thr Leu Gly His Leu Val Gly
                165                 170                 175
Ile Tyr Phe Thr Gly Cys Ser Met Asn Pro Ala Arg Ser Phe Gly Pro
            180                 185                 190
Ala Val Val Met Asn Arg Phe Ser Pro Ala His Trp Gly Leu Leu Leu
        195                 200                 205
Ser Leu Arg Gly Gly Asp Thr Arg Ser Val His Pro Ser Leu
    210                 215                 220
<210>11
<211>1051
<212>DNA
<213>人
<400>11
cctaactcca ggccagactc cttagcaccc tcccctaact ccaggccaga ctcctttcag  60
ctaaaggggt ggaattcatg gcatctactt cgtatgacta ttgcagagtg cccatggaag  120
acggggataa gcgctgtaag cttctgctgg ggataggaat tctggtgctc ctgatcatcg  180
tgattctggg ggtgcccttg attatcttca ccatcaaggc caacagcgag gcctgccggg  240
acggccttcg ggcagtgatg gagtgtcgca atgtcaccca tctcctgcaa caagagctga  300
ccgaggccca gaagggcttt caggatgtgg aggcccaggc cgccacctgc aaccacactg  360
tgatggccct aatggcttcc ctggatgcag agaaggccca aggacaaaag aaagtggagg  420
agcttgaggg agagatcact acattaaacc ataagcttca ggacgcgtct gcagaggtgg  480
agcgactgag aagagaaaac caggtcttaa gcgtgagaat cgcggacaag aagtactacc  540
ccagctccca ggactccagc tccgctgcgg cgccccagct gctgattgtg ctgctgggcc  600
tcagcgctct gctgcagtga gatcccagga agctggcaca tcttggaagg tccgtcctgc  660
tcggcttttc gcttgaacat tcccttgatc tcatcagttc tgagcgggtc atggggcaac  720
acggttagcg gggagagcac ggggtagccg gagaagggcc tctggagcag gtctggaggg  780
gccatggggc agtcctgggt gtggggacac agtcgggttg acccagggct gtctccctcc  840
agagcctccc tccggacaat gagtcccccc tcttgtctcc caccctgaga ttgggcatgg  900
ggtgcggtgt ggggggcatg tgctgcctgt tgttatgggt tttttttgcg gggggggttg  960
cttttttctg gggtctttga gctccaaaaa ataaacactt cctttgaggg agagcaaaaa  1020
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a                                 1051
<210>12
<211>180
<212>PRT
<213>人
<400>12
Met Ala Ser Thr Ser Tyr Asp Tyr Cys Arg Val Pro Met Glu Asp Gly
 1               5                  10                  15
Asp Lys Arg Cys Lys Leu Leu Leu Gly Ile Gly Ile Leu Val Leu Leu
            20                  25                  30
Ile Ile Val Ile Leu Gly Val Pro Leu Ile Ile Phe Thr Ile Lys Ala
        35                  40                  45
Asn Ser Glu Ala Cys Arg Asp Gly Leu Arg Ala Val Met Glu Cys Arg
    50                  55                  60
Asn Val Thr His Leu Leu Gln Gln Glu Leu Thr Glu Ala Gln Lys Gly
65                  70                  75                  80
Phe Gln Asp Val Glu Ala Gln Ala Ala Thr Cys Asn His Thr Val Met
                85                  90                  95
Ala Leu Met Ala Ser Leu Asp Ala Glu Lys Ala Gln Gly Gln Lys Lys
            100                 105                 110
Val Glu Glu Leu Glu Gly Glu Ile Thr Thr Leu Asn His Lys Leu Gln
        115                 120                 125
Asp Ala Ser Ala Glu Val Glu Arg Leu Arg Arg Glu Asn Gln Val Leu
    130                 135                 140
Ser Val Arg Ile Ala Asp Lys Lys Tyr Tyr Pro Ser Ser Gln Asp Ser
145                 150                 155                 160
Ser Ser Ala Ala Ala Pro Gln Leu Leu Ile Val Leu Leu Gly Leu Ser
                165                 170                 175
Ala Leu Leu Gln
            180
<210>13
<211>3445
<212>DNA
<213>人
<400>13
gagcaaccgc agcttctagt atccagactc cagcgccgcc ccgggcgcgg accccaaccc  60
cgacccagag cttctccagc ggcggcgcag cgagcagggc tccccgcctt aacttcctcc  120
gcggggccca gccaccttcg ggagtccggg ttgcccacct gcaaactctc cgccttctgc  180
acctgccacc cctgagccag cgcgggcgcc cgagcgagtc atggccaacg cggggctgca  240
gctgttgggc ttcattctcg ccttcctggg atggatcggc gccatcgtca gcactgccct  300
gccccagtgg aggatttact cctatgccgg cgacaacatc gtgaccgccc aggccatgta  360
cgaggggctg tggatgtcct gcgtgtcgca gagcaccggg cagatccagt gcaaagtctt  420
tgactccttg ctgaatctga gcagcacatt gcaagcaacc cgtgccttga tggtggttgg  480
catcctcctg ggagtgatag caatctttgt ggccaccgtt ggcatgaagt gtatgaagtg  540
cttggaagac gatgaggtgc agaagatgag gatggctgtc attgggggtg cgatatttct  600
tcttgcaggt ctggctattt tagttgccac agcatggtat ggcaatagaa tcgttcaaga  660
attctatgac cctatgaccc cagtcaatgc caggtacgaa tttggtcagg ctctcttcac  720
tggctgggct gctgcttctc tctgccttct gggaggtgcc ctactttgct gttcctgtcc  780
ccgaaaaaca acctcttacc caacaccaag gccctatcca aaacctgcac cttccagcgg  840
gaaagactac gtgtgacaca gaggcaaaag gagaaaatca tgttgaaaca aaccgaaaat  900
ggacattgag atactatcat taacattagg accttagaat tttgggtatt gtaatctgaa  960
gtatggtatt acaaaacaaa caaacaaaca aaaaacccat gtgttaaaat actcagtgct  1020
aaacatggct taatcttatt ttatcttctt tcctcaatat aggagggaag atttttccat  1080
ttgtattact gcttcccatt gagtaatcat actcaattgg gggaaggggt gctccttaaa  1140
tatatataga tatgtatata tacatgtttt tctattaaaa atagacagta aaatactatt  1200
ctcattatgt tgatactagc atacttaaaa tatctctaaa ataggtaaat gtatttaatt  1260
ccatattgat gaagatgttt attggtatat tttctttttc gtctatatat acatatgtaa  1320
cagtcaaata tcatttactc ttcttcatta gctttgggtg cctttgccac aagacctagc  1380
ctaatttacc aaggatgaat tctttcaatt cttcatgcgt gcccttttca tatacttatt  1440
ttatttttta ccataatctt atagcacttg catcgttatt aagcccttat ttgttttgtg  1500
tttcattggt ctctatctcc tgaatctaac acatttcata gcctacattt tagtttctaa  1560
agccaagaag aatttattac aaatcagaac tttggaggca aatctttctg catgaccaaa  1620
gtgataaatt cctgttgacc ttcccacaca atccctgtac tctgacccat agcactcttg  1680
tttgctttga aaatatttgt ccaattgagt agctgcatgc tgttccccca ggtgttgtaa  1740
cacaacttta ttgattgaat ttttaagcta cttattcata gttttatatc cccctaaact  1800
acctttttgt tccccattcc ttaattgtat tgttttccca agtgtaatta tcatgcgttt  1860
tatatcttcc taataaggtg tggtctgttt gtctgaacaa agtgctagac tttctggagt  1920
gataatctgg tgacaaatat tctctctgta gctgtaagca agtcacttaa tctttctacc  1980
tcttttttct atctgccaaa ttgagataat gatacttaac cagttagaag aggtagtgtg  2040
aatattaatt agtttatatt actctcattc tttgaacatg aactatgcct atgtagtgtc  2100
tttatttgct cagctggctg agacactgaa gaagtcactg aacaaaacct acacacgtac  2160
cttcatgtga ttcactgcct tcctctctct accagtctat ttccactgaa caaaacctac  2220
acacatacct tcatgtggtt cagtgccttc ctctctctac cagtctattt ccactgaaca  2280
aaacctacgc acataccttc atgtggctca gtgccttcct ctctctacca gtctatttcc  2340
attctttcag ctgtgtctga catgtttgtg ctctgttcca ttttaacaac tgctcttact  2400
tttccagtct gtacagaatg ctatttcact tgagcaagat gatgtaatgg aaagggtgtt  2460
ggcattggtg tctggagacc tggatttgag tcttggtgct atcaatcacc gtctgtgttt  2520
gagcaaggca tttggctgct gtaagcttat tgcttcatct gtaagcggtg gtttgtaatt  2580
cctgatcttc ccacctcaca gtgatgttgt ggggatccag tgagatagaa tacatgtaag  2640
tgtggttttg taatttaaaa agtgctatac taagggaaag aattgaggaa ttaactgcat  2700
acgttttggt gttgcttttc aaatgtttga aaacaaaaaa aatgttaaga aatgggtttc  2760
ttgccttaac cagtctctca agtgatgaga cagtgaagta aaattgagtg cactaaacaa  2820
ataagattct gaggaagtct tatcttctgc agtgagtatg gcccgatgct ttctgtggct  2880
aaacagatgt aatgggaaga aataaaagcc tacgtgttgg taaatccaac agcaagggag  2940
atttttgaat cataataact cataaggtgc tatctgttca gtgatgccct cagagctctt  3000
gctgttagct ggcagctgac gctgctagga tagttagttt ggaaatggta cttcataata  3060
aactacacaa ggaaagtcag ccactgtgtc ttatgaggaa ttggacctaa taaattttag  3120
tgtgccttcc aaacctgaga atatatgctt ttggaagtta aaatttaaat ggcttttgcc  3180
acatacatag atcttcatga tgtgtgagtg taattccatg tggatatcag ttaccaaaca  3240
ttacaaaaaa attttatggc ccaaaatgac caacgaaatt gttacaatag aatttatcca  3300
attttgatct ttttatattc ttctaccaca cctggaaaca gaccaataga cattttgggg  3360
ttttataata ggaatttgta taaagcatta ctctttttca ataaattgtt ttttaattta  3420
aaaaaaggaa aaaaaaaaaa aaaaa                                        3445
<210>14
<211>211
<212>PRT
<213>人
<400>14
Met Ala Asn Ala Gly Leu Gln Leu Leu Gly Phe Ile Leu Ala Phe Leu
 1               5                  10                  15
Gly Trp Ile Gly Ala Ile Val Ser Thr Ala Leu Pro Gln Trp Arg Ile
            20                  25                  30
Tyr Ser Tyr Ala Gly Asp Asn Ile Val Thr Ala Gln Ala Met Tyr Glu
        35                  40                  45
Gly Leu Trp Met Ser Cys Val Ser Gln Ser Thr Gly Gln Ile Gln Cys
    50                  55                  60
Lys Val Phe Asp Ser Leu Leu Asn Leu Ser Ser Thr Leu Gln Ala Thr
65                  70                  75                  80
Arg Ala Leu Met Val Val Gly Ile Leu Leu Gly Val Ile Ala Ile Phe
                85                  90                  95
Val Ala Thr Val Gly Met Lys Cys Met Lys Cys Leu Glu Asp Asp Glu
            100                 105                 110
Val Gln Lys Met Arg Met Ala Val Ile Gly Gly Ala Ile Phe Leu Leu
        115                 120                 125
Ala Gly Leu Ala Ile Leu Val Ala Thr Ala Trp Tyr Gly Asn Arg Ile
    130                 135                 140
Val Gln Glu Phe Tyr Asp Pro Met Thr Pro Val Asn Ala Arg Tyr Glu
145                 150                 155                 160
Phe Gly Gln Ala Leu Phe Thr Gly Trp Ala Ala Ala Ser Leu Cys Leu
                165                 170                 175
Leu Gly Gly Ala Leu Leu Cys Cys Ser Cys Pro Arg Lys Thr Thr Ser
            180                 185                 190
Tyr Pro Thr Pro Arg Pro Tyr Pro Lys Pro Ala Pro Ser Ser Gly Lys
        195                 200                 205
Asp Tyr Val
    210
<210>15
<211>1850
<212>DNA
<213>人
<400>15
cgcgctcgca gctcgcaggc gccgcgtagc cgtcgccacc gccgccagcc cgtgcgccct  60
cggcgcgtac ccgccgcgct cccatccccg ccgccggcca ggggcgcgct cggccgcccc  120
ggacagtgtc ccgctgcggc tccgcggcga tggccaccaa gatcgacaaa gaggcttgcc  180
gggcggcgta caacctggtg cgcgacgacg gctcggccgt catctgggtg acttttaaat  240
atgacggctc caccatcgtc cccggcgagc agggagcgga gtaccagcac ttcatccagc  300
agtgcacaga tgacgtccgg ttgtttgcct tcgtgcgctt caccaccggg gatgccatga  360
gcaagaggtc caagtttgcc ctcatcacgt ggatcggtga gaacgtcagc gggctgcagc  420
gcgccaaaac cgggacggac aagaccctgg tgaaggaggt cgtacagaat ttcgctaagg  480
agtttgtgat cagtgatcgg aaggagctgg aggaagattt catcaagagc gagctgaaga  540
aggcgggggg agccaattac gacgcccaga cggagtaacc ccagcccccg ccacaccacc  600
ccttgccaaa gtcatctgcc tgctccccgg gggagaggac cgccggcctc agctactagc  660
ccaccagccc accagggaga aaagaagcca tgagaggcag cgcccgccac cctgtgtcca  720
cagcccccac cttcccgctt cccttagaac cctgccgtgt cctatctcat gacgctcatg  780
gaacctcttt ctttgatctt ctttttcttt tctccccctc ttttttgttc taaagaaaag  840
tcattttgat gcaaggtcct gcctgccatc agatccgagg tgcctcctgc agtgacccct  900
tttcctggca tttctcttcc acgcgacgag gtctgcctag tgagatctgc atgacctcac  960
gttgctttcc agagcccggg cctattttgc catctcagtt ttcctggacc ctgcttcctg  1020
tgtaccactg aggggcagct gggccaggag ctgtgcccgg tgcctgcagc cttcataagc  1080
acacacgtcc attccctact aaggcccaga cctcctggta tctgccccgg gctccctcat  1140
cccacctcca tccggagttg cctaagatgc atgtccagca taggcaggat tgctcggtgg  1200
tgagaaggtt aggtccggct cagactgaat aagaagagat aaaatttgcc ttaaaactta  1260
cctggcagtg gctttgctgc acggtctgaa accacctgtt cccaccctct tgaccgaaat  1320
ttccttgtga cacagagaag ggcaaaggtc tgagcccaga gttgacggag ggagtatttc  1380
agggttcact tcaggggctc ccaaagcgac aagatcgtta gggagagagg cccagggtgg  1440
ggactgggaa tttaaggaga gctgggaacg gatcccttag gttcaggaag cttctgtgta  1500
agctgcgagg atggcttggg ccgaagggtt gctctgcccg ccgcgctagc tgtgagctga  1560
gcaaagccct gggctcacag caccccaaaa gcctgtggct tcagtcctgc gtctgcacca  1620
cacattcaaa aggatcgttt tgttttgttt ttaaagaaag gtgagattgg cttggttctt  1680
catgagcaca tttgatatag ctctttttct gtttttcctt gctcatttcg ttttggggaa  1740
gaaatctgta ctgtattggg attgtaaaga acatctctgc actcagacag tttacagaaa  1800
taaatgtttt ttttgttttt cagaaaaaaa aaaaaaaaaa aaaaaaaaaa             1850
<210>16
<211>142
<212>PRT
<213>人
<400>16
Met Ala Thr Lys Ile Asp Lys Glu Ala Cys Arg Ala Ala Tyr Asn Leu
 1               5                  10                  15
Val Arg Asp Asp Gly Ser Ala Val Ile Trp Val Thr Phe Lys Tyr Asp
            20                  25                  30
Gly Ser Thr Ile Val Pro Gly Glu Gln Gly Ala Glu Tyr Gln His Phe
        35                  40                  45
Ile Gln Gln Cys Thr Asp Asp Val Arg Leu Phe Ala Phe Val Arg Phe
    50                  55                  60
Thr Thr Gly Asp Ala Met Ser Lys Arg Ser Lys Phe Ala Leu Ile Thr
65                  70                  75                  80
Trp Ile Gly Glu Asn Val Ser Gly Leu Gln Arg Ala Lys Thr Gly Thr
                85                  90                  95
Asp Lys Thr Leu Val Lys Glu Val Val Gln Asn Phe Ala Lys Glu Phe
            100                 105                 110
Val Ile Ser Asp Arg Lys Glu Leu Glu Glu Asp Phe Ile Lys Ser Glu
        115                 120                 125
Leu Lys Lys Ala Gly Gly Ala Asn Tyr Asp Ala Gln Thr Glu
    130                 135                 140
<210>17
<211>662
<212>DNA
<213>人
<400>17
acacatccaa gcttaagacg gtgaggtcag cttcacattc tcaggaactc tccttctttg  60
ggtctagctg aagttgagga tctcttactc tctaagccac ggaattaacc cgagcaggca  120
tggaggcctc tgctctcacc tcatcagcag tgaccagtgt ggccaaagtg gtcagggtgg  180
cctctggctc tgccgtagtt ttgcccctgg ccaggattgc tacagttgtg attggaggag  240
ttgtggccat ggcggctgtg cccatggtgc tcagtgccat gggcttcact gcggcgggaa  300
tcgcctcgtc ctccatagca gccaagatga tgtccgcggc ggccattgcc aatgggggtg  360
gagttgcctc gggcagcctt gtgggtactc tgcagtcact gggagcaact ggactctccg  420
gattgaccaa gttcatcctg ggctccattg ggtctgccat tgcggctgtc attgcgaggt  480
tctactagct ccctgcccct cgccctgcag agaagagaac catgccaggg gagaaggcac  540
ccagccatcc tgacccagcg aggagccaac tatcccaaat atacctgggt gaaatatacc  600
aaattctgca tctccagagg aaaataagaa ataaagatga attgttgcaa ctcttaaaaa  660
aa                                                                 662
<210>18
<211>122
<212>PRT
<213>人
<400>18
Met Glu Ala Ser Ala Leu Thr Ser Ser Ala Val Thr Ser Val Ala Lys
 1               5                  10                  15
Val Val Arg Val Ala Ser Gly Ser Ala Val Val Leu Pro Leu Ala Arg
            20                  25                  30
Ile Ala Thr Val Val Ile Gly Gly Val Val Ala Met Ala Ala Val Pro
        35                  40                  45
Met Val Leu Ser Ala Met Gly Phe Thr Ala Ala Gly Ile Ala Ser Ser
    50                  55                  60
Ser Ile Ala Ala Lys Met Met Ser Ala Ala Ala Ile Ala Asn Gly Gly
65                  70                  75                  80
Gly Val Ala Ser Gly Ser Leu Val Gly Thr Leu Gln Ser Leu Gly Ala
                85                  90                  95
Thr Gly Leu Ser Gly Leu Thr Lys Phe Ile Leu Gly Ser Ile Gly Ser
            100                 105                 110
Ala Ile Ala Ala Val Ile Ala Arg Phe Tyr
        115                 120
<210>19
<211>653
<212>DNA
<213>人
<400>19
acacatccaa gcttaagacg gtgaggtcag cttcacattc tcaggaactc tccttctttg  60
ggtctagctg aagttgagga tctcttactc tctaagccac ggaattaacc cgagcaggca  120
tggaggcctc tgctctcacc tcatcagcag tgaccagtgt ggccaaagtg gtcagggtgg  180
cctctggctc tgccgtagtt ttgcccctgg ccaggattgc tacagttgtg attggaggag  240
ttgtggctgt gcccatggtg ctcagtgcca tgggcttcac tgcggcggga atcgcctcgt  300
cctccatagc agccaagatg atgtccgcgg cggccattgc caatgggggt ggagttgcct  360
cgggcagcct tgtggctact ctgcagtcac tgggagcaac tggactctcc ggattgacca  420
agttcatcct gggctccatt gggtctgcca ttgcggctgt cattgcgagg ttctactagc  480
tccctgcccc tcgccctgca gagaagagaa ccatgccagg ggagaaggca cccagccatc  540
ctgacccagc gaggagccaa ctatcccaaa tatacctggg tgaaatatac caaattctgc  600
atctccagag gaaaataaga aataaagatg aattgttgca actcttaaaa aaa         653
<210>20
<211>119
<212>PRT
<213>人
<400>20
Met Glu Ala Ser Ala Leu Thr Ser Ser Ala Val Thr Ser Val Ala Lys
 1               5                  10                  15
Val Val Arg Val Ala Ser Gly Ser Ala Val Val Leu Pro Leu Ala Arg
            20                  25                  30
Ile Ala Thr Val Val Ile Gly Gly Val Val Ala Val Pro Met Val Leu
        35                  40                  45
Ser Ala Met Gly Phe Thr Ala Ala Gly Ile Ala Ser Ser Ser Ile Ala
    50                  55                  60
Ala Lys Met Met Ser Ala Ala Ala Ile Ala Asn Gly Gly Gly Val Ala
65                  70                  75                  80
Ser Gly Ser Leu Val Ala Thr Leu Gln Ser Leu Gly Ala Thr Gly Leu
                85                  90                  95
Ser Gly Leu Thr Lys Phe Ile Leu Gly Ser Ile Gly Ser Ala Ile Ala
            100                 105                 110
Ala Val Ile Ala Arg Phe Tyr
        115
<210>21
<211>4755
<212>DNA
<213>人
<400>21
gccgggggac ccctccctcc tgtcctcctt gcggtcgacc ggtgcgcttg ccagatccgc  60
cgcgaagccg ggatcgaagg cgacagcgcg gccaaggggg cgcggccggg acaagctggg  120
ggccggttgc ccggggcagg gacggcggcg acccggccgc tggggaggca ggaagataga  180
cccacggatc ttaggaaggg atccgagagc gcagccgcgc gccccgcgcc ccacgcctga  240
tgctctgtgc gctcgccttg atggtggcgg ccggcggctg cgtcgtctcc gccttcaacc  300
tggatacccg attcctggta gtgaaggagg ccgggaaccc gggcagcctc ttcggctact  360
cggtcgccct ccatcggcag acagagcggc agcagcgcta cctgctcctg gctggtgccc  420
cccgggagct cgctgtgccc gatggctaca ccaaccggac tggtgctgtg tacctgtgcc  480
cactcactgc ccacaaggat gactgtgagc ggatgaacat cacagtgaaa aatgaccctg  540
gccatcacat tattgaggac atgtggcttg gagtgactgt ggccagccag ggccctgcag  600
gcagagttct ggtctgtgcc caccgctaca cccaggtgct gtggtcaggg tcagaagacc  660
agcggcgcat ggtgggcaag tgctacgtgc gaggcaatga cctagagctg gactccagtg  720
atgactggca gacctaccac aacgagatgt gcaatagcaa cacagactac ctggagacgg  780
gcatgtgcca gctgggcacc agcggtggct tcacccagaa cactgtgtac ttcggcgccc  840
ccggtgccta caactggaaa ggaaacagct acatgattca gcgcaaggag tgggacttat  900
ctgagtatag ttacaaggac ccagaggacc aaggaaacct ctatattggg tacacgatgc  960
aggtaggcag cttcatcctg caccccaaaa acatcaccat tgtgacaggt gccccacggc  1020
accgacatat gggcgcggtg ttcttgctga gccaggaggc aggcggagac ctgcggagga  1080
ggcaggtgct ggagggctcg caggtgggcg cctattttgg cagcgccatt gccctggcag  1140
acctgaacaa tgatgggtgg caggacctcc tggtgggcgc cccctactac ttcgagagga  1200
aagaggaagt agggggtgcc atctatgtct tcatgaacca ggcgggaacc tccttccctg  1260
ctcacccctc actccttctt catggcccca gtggctctgc ctttggttta tctgtggcca  1320
gcattggtga catcaaccag gatggatttc aggatattgc tgtgggagct ccgtttgaag  1380
gcttgggcaa agtgtacatc tatcacagta gctctaaggg gctccttaga cagccccagc  1440
aggtaatcca tggagagaag ctgggactgc ctgggttggc caccttcggc tattccctca  1500
gtgggcagat ggatgtggat gagaacttct acccagacct tctagtggga agcctgtcag  1560
accacattgt gctgctgcgg gcccggcccg tcatcaacat cgtccacaag accttggtgc  1620
ccaggccagc tgtgctggac cctgcacttt gcacggccac ctcttgtgtg caagtggagc  1680
tgtgctttgc ttacaaccag agtgccggga accccaacta caggcgaaac atcaccctgg  1740
cctacactct ggaggctgac agggaccgcc ggccgccccg gctccgcttt gccggcagtg  1800
agtccgctgt cttccacggc ttcttctcca tgcccgagat gcgctgccag aagctggagc  1860
tgctcctgat ggacaacctc cgtgacaaac tccgccccat catcatctcc atgaactact  1920
ctttaccttt gcggatgccc gatcgccccc ggctggggct gcggtccctg gacgcctacc  1980
cgatcctcaa ccaggcacag gctctggaga accacactga ggtccagttc cagaaggagt  2040
gcgggcctga caacaagtgt gagagcaact tgcagatgcg ggcagccttc gtgtcagagc  2100
agcagcagaa gctgagcagg ctccagtaca gcagagacgt ccggaaattg ctcctgagca  2160
tcaacgtgac gaacacccgg acctcggagc gctccgggga ggacgcccac gaggcgctgc  2220
tcaccctggt ggtgcctccc gccctgctgc tgtcctcagt gcgccccccc ggggcctgcc  2280
aagctaatga gaccatcttt tgcgagctgg ggaacccctt caaacggaac cagaggatgg  2340
agctgctcat cgcctttgag gtcatcgggg tgaccctgca cacaagggac cttcaggtgc  2400
agctgcagct ctccacgtcg agtcaccagg acaacctgtg gcccatgatc ctcactctgc  2460
tggtggacta tacactccag acctcgctta gcatggtaaa tcaccggcta caaagcttct  2520
ttggggggac agtgatgggt gagtctggca tgaaaactgt ggaggatgta ggaagccccc  2580
tcaagtatga attccaggtg ggcccaatgg gggaggggct ggtgggcctg gggaccctgg  2640
tcctaggtct ggagtggccc tacgaagtca gcaatggcaa gtggctgctg tatcccacgg  2700
agatcaccgt ccatggcaat gggtcctggc cctgccgacc acctggagac cttatcaacc  2760
ctctcaacct cactctttct gaccctgggg acaggccatc atccccacag cgcaggcggc  2820
gacagctgga tccaggggga ggccagggcc ccccacctgt cactctggct gctgccaaaa  2880
aagccaagtc tgagactgtg ctgacctgtg ccacagggcg tgcccactgt gtgtggctag  2940
agtgccccat ccctgatgcc cccgttgtca ccaacgtgac tgtgaaggca cgagtgtgga  3000
acagcacctt catcgaggat tacagagact ttgaccgagt ccgggtaaat ggctgggcta  3060
ccctattcct ccgaaccagc atccccacca tcaacatgga gaacaagacc acgtggttct  3120
ctgtggacat tgactcggag ctggtggagg agctgccggc cgaaatcgag ctgtggctgg  3180
tgctggtggc cgtgggtgca gggctgctgc tgctggggct gatcatcctc ctgctgtgga  3240
agtgcggctt cttcaagcga gcccgcactc gcgccctgta tgaagctaag aggcagaagg  3300
cggagatgaa gagccagccg tcagagacag agaggctgac cgacgactac tgagggggca  3360
gccccccgcc cccggcccac ctggtgtgac ttctttaagc ggacccgcta ttatcagatc  3420
atgcccaagt accacgcagt gcggatccgg gaggaggagc gctacccacc tccagggagc  3480
accctgccca ccaagaagca ctgggtgacc agctggcaga ctcgggacca atactactga  3540
cgtcctccct gatcccaccc cctcctcccc cagtgtcccc tttcttccta tttatcataa  3600
gttatgcctc tgacagtcca caggggccac cacctttggc tggtagcagc aggctcaggc  3660
acatacacct cgtcaagagc atgcacatgc tgtctggccc tggggatctt cccacaggag  3720
ggccagcgct gtggacctta caacgccgag tgcactgcat tcctgtgccc tagatgcacg  3780
tggggcccac tgctcgtgga ctgtgctggt gcatcacgga tggtgcatgg gctcgccgtg  3840
tctcagcctc tgccagcgcc aaaacaagcc aaagagcctc ccaccagagc cgggaggaaa  3900
aggcccctgc aatgtggtga cacctccccc tttcacactg gatccatctt gagccacagt  3960
cactggattg actttgctgt caaaactact gacagggagc agcccccggg ccgctggctg  4020
gtgggccccc aatgacaccc atgccagaga ggtggggatc ctgcctaagg ttgtctacgg  4080
gggcacttgg aggacctggc gtgctcagac ccaacagcaa aggaactaga aagaaggacc  4140
cagaacggct tgctttcctg catctctgtg aagcctctct ccttggccac agactgaact  4200
cgcagggaat gcagcaggaa ggaacaaaga caggcaaacg gcaacgtagc ctgggctcac  4260
tgtgctgggg cacggcggga tcctccacag agaggagggg accaattctg gacagacaga  4320
tgttgggagg atacagagga gatgccactt ctcactcacc actaccagcc agcctcagaa  4380
ggccccagag agaccctgca agaccacgga gggagcgaca cttgaatgta gaataggcag  4440
ggggccctgc cccaccccat ccagccagac cccacgctga ccatgcgtca ggggcctaga  4500
ggtggagttc ttagctatcc ttggctttca gagccagcct ggctctgccc cctcccccat  4560
gggctgtgtc ctaaggccca tttgagaagc tgaggctagt tccagaaaac ctctcctgac  4620
ccctgcctgt tggcaggccc actccccagc cccagcccct tccatggtac tgtagcaggg  4680
gaattccctc cccctccttg tgccttcttt gtatataggc ttctcacggc gaccaataaa  4740
cagctcccag tttgt                                                   4755
<210>22
<211>1037
<212>PRT
<213>人
<400>22
Met Leu Cvs Ala Leu Ala Leu Met Val Ala Ala Gly Gly Cys Val Val
 1               5                  10                  15
Ser Ala Phe Asn Leu Asp Thr Arg Phe Leu Val Val Lys Glu Ala Gly
            20                  25                  30
Asn Pro Gly Ser Leu Phe Gly Tyr Ser Val Ala Leu His Arg Gln Thr
        35                  40                  45
Glu Arg Gln Gln Arg Tyr Leu Leu Leu Ala Gly Ala Pro Arg Glu Leu
    50                  55                  60
Ala Val Pro Asp Gly Tyr Thr Asn Arg Thr Gly Ala Val Tyr Leu Cys
65                  70                  75                  80
Pro Leu Thr Ala His Lys Asp Asp Cys Glu Arg Met Asn Ile Thr Val
                85                  90                  95
Lys Asn Asp Pro Gly His His Ile Ile Glu Asp Met Trp Leu Gly Val
            100                 105                 110
Thr Val Ala Ser Gln Gly Pro Ala Gly Arg Val Leu Val Cys Ala His
        115                 120                 125
Arg Tyr Thr Gln Val Leu Trp Ser Gly Ser Glu Asp Gln Arg Arg Met
    130                 135                 140
Val Gly Lys Cys Tyr Val Arg Gly Asn Asp Leu Glu Leu Asp Ser Ser
145                 150                 155                 160
Asp Asp Trp Gln Thr Tyr His Asn Glu Met Cys Asn Ser Asn Thr Asp
                165                 170                 175
Tyr Leu Glu Thr Gly Met Cys Gln Leu Gly Thr Ser Gly Gly Phe Thr
            180                 185                 190
Gln Asn Thr Val Tyr Phe Gly Ala Pro Gly Ala Tyr Asn Trp Lys Gly
        195                 200                 205
Asn Ser Tyr Met Ile Gln Arg Lys Glu Trp Asp Leu Ser Glu Tyr Ser
    210                 215                 220
Tyr Lys Asp Pro Glu Asp Gln Gly Asn Leu Tyr Ile Gly Tyr Thr Met
225                 230                 235                 240
Gln Val Gly Ser Phe Ile Leu His Pro Lys Asn Ile Thr Ile Val Thr
                245                 250                 255
Gly Ala Pro Arg His Arg His Met Gly Ala Val Phe Leu Leu Ser Gln
            260                 265                 270
Glu Ala Gly Gly Asp Leu Arg Arg Arg Gln Val Leu Glu Gly Ser Gln
        275                 280                 285
Val Gly Ala Tyr Phe Gly Ser Ala Ile Ala Leu Ala Asp Leu Asn Asn
    290                 295                 300
Asp Gly Trp Gln Asp Leu Leu Val Gly Ala Pro Tyr Tyr Phe Glu Arg
305                 310                 315                 320
Lys Glu Glu Val Gly Gly Ala Ile Tyr Val Phe Met Asn Gln Ala Gly
                325                 330                 335
Thr Ser Phe Pro Ala His Pro Ser Leu Leu Leu His Gly Pro Ser Gly
            340                 345                 350
Ser Ala Phe Gly Leu Ser Val Ala Ser Ile Gly Asp Ile Asn Gln Asp
        355                 360                 365
Gly Phe Gln Asp Ile Ala Val Gly Ala Pro Phe Glu Gly Leu Gly Lys
    370                 375                 380
Val Tyr Ile Tyr His Ser Ser Ser Lys Gly Leu Leu Arg Gln Pro Gln
385                 390                 395                 400
Gln Val Ile His Gly Glu Lys Leu Gly Leu Pro Gly Leu Ala Thr Phe
                405                 410                 415
Gly Tyr Ser Leu Ser Gly Gln Met Asp Val Asp Glu Asn Phe Tyr Pro
            420                 425                 430
Asp Leu Leu Val Gly Ser Leu Ser Asp His Ile Val Leu Leu Arg Ala
        435                 440                 445
Arg Pro Val Ile Asn Ile Val His Lys Thr Leu Val Pro Arg Pro Ala
    450                 455                 460
Val Leu Asp Pro Ala Leu Cys Thr Ala Thr Ser Cys Val Gln Val Glu
465                 470                 475                 480
Leu Cys Phe Ala Tyr Asn Gln Ser Ala Gly Asn Pro Asn Tyr Arg Arg
                485                 490                 495
Asn Ile Thr Leu Ala Tyr Thr Leu Glu Ala Asp Arg Asp Arg Arg Pro
            500                 505                 510
Pro Arg Leu Arg Phe Ala Gly Ser Glu Ser Ala Val Phe His Gly Phe
        515                 520                 525
Phe Ser Met Pro Glu Met Arg Cys Gln Lys Leu Glu Leu Leu Leu Met
    530                 535                 540
Asp Asn Leu Arg Asp Lys Leu Arg Pro Ile Ile Ile Ser Met Asn Tyr
545                 550                 555                 560
Ser Leu Pro Leu Arg Met Pro Asp Arg Pro Arg Leu Gly Leu Arg Ser
                565                 570                 575
Leu Asp Ala Tyr Pro Ile Leu Asn Gln Ala Gln Ala Leu Glu Asn His
            580                 585                 590
Thr Glu Val Gln Phe Gln Lys Glu Cys Gly Pro Asp Asn Lys Cys Glu
        595                 600                 605
Ser Asn Leu Gln Met Arg Ala Ala Phe Val Ser Glu Gln Gln Gln Lys
    610                 615                 620
Leu Ser Arg Leu Gln Tyr Ser Arg Asp Val Arg Lys Leu Leu Leu Ser
625                 630                 635                 640
Ile Asn Val Thr Asn Thr Arg Thr Ser Glu Arg Ser Gly Glu Asp Ala
                645                 650                 655
His Glu Ala Leu Leu Thr Leu Val Val Pro Pro Ala Leu Leu Leu Ser
            660                 665                 670
Ser Val Arg Pro Pro Gly Ala Cys Gln Ala Asn Glu Thr Ile Phe Cys
        675                 680                 685
Glu Leu Gly Asn Pro Phe Lys Arg Asn Gln Arg Met Glu Leu Leu Ile
    690                 695                 700
Ala Phe Glu Val Ile Gly Val Thr Leu His Thr Arg Asp Leu Gln Val
705                 710                 715                 720
Gln Leu Gln Leu Ser Thr Ser Ser His Gln Asp Asn Leu Trp Pro Met
                725                 730                 735
Ile  Leu Thr Leu Lau Val Asp Tyr Thr Leu Gln Thr Ser Leu Ser Met
             740                 745                 750
Val Asn His Arg Leu Gln Ser Phe Phe Gly Gly Thr Val Met Gly Glu
        755                 760                 765
Ser Gly Met Lys Thr Val Glu Asp Val Gly Ser Pro Leu Lys Tyr Glu
    770                 775                 780
Phe Gln Val Gly Pro Met Gly Glu Gly Leu Val Gly Leu Gly Thr Leu
785                 790                 795                 800
Val Leu Gly Leu Glu Trp Pro Tyr Glu Val Ser Asn Gly Lys Trp Leu
                805                 810                 815
Leu Tyr Pro Thr Glu Ile Thr Val His Gly Asn Gly Ser Trp Pro Cys
            820                 825                 830
Arg Pro Pro Gly Asp Leu Ile Asn Pro Leu Asn Leu Thr Leu Ser Asp
        835                 840                 845
Pro Gly Asp Arg Pro Ser Ser Pro Gln Arg Arg Arg Arg Gln Leu Asp
    850                 855                 860
Pro Gly Gly Gly Gln Gly Pro Pro Pro Val Thr Leu Ala Ala Ala Lys
865                 870                 875                 880
Lys Ala Lys Ser Glu Thr Val Leu Thr Cys Ala Thr Gly Arg Ala His
                885                 890                 895
Cys Val Trp Leu Glu Cys Pro Ile Pro Asp Ala Pro Val Val Thr Asn
            900                 905                 910
Val Thr Val Lys Ala Arg Val Trp Asn Ser Thr Phe Ile Glu Asp Tyr
        915                 920                 925
Arg Asp Phe Asp Arg Val Arg Val Asn Gly Trp Ala Thr Leu Phe Leu
    930                 935                 940
Arg Thr Ser Ile Pro Thr Ile Asn Met Glu Asn Lys Thr Thr Trp Phe
945                 950                 955                 960
Ser Val Asp Ile Asp Ser Glu Leu Val Glu Glu Leu Pro Ala Glu Ile
                965                 970                 975
Glu Leu Trp Leu Val Leu Val Ala Val Gly Ala Gly Leu Leu Leu Leu
            980                 985                 990
Gly Leu Ile Ile Leu Leu Leu Trp Lys Cys Gly Phe Phe Lys Arg Ala
        995                 1000                 1005
Arg Thr Arg Ala Leu Tyr Glu Ala Lys Arg Gln Lys Ala Glu Met Lys
    1010                1015                1020
Ser Gln Pro Ser Glu Thr Glu Arg Leu Thr Asp Asp Tyr
1025                1030                1035
<210>23
<211>4647
<212>DNA
<213>人
<400>23
gtagcctctg ttttcatttc agtcttaatg aaaactttct aacttatatc tcaagtttct  60
tttcaaagca gtgtaagtag tatttaaaat gttatacttc aagaaagaaa gactttaacg  120
atattcagcg ttggtcttgt aacgctgaag gtaattcatt ttttaatcgg tctgcacagc  180
aagaactgaa acgaatgggg attgaactgc tttgcctgtt ctttctattt ctaggaagga  240
atgatcacgt acaaggtggc tgtgccctgg gaggtgcaga aacctgtgaa gactgcctgc  300
ttattggacc tcagtgtgcc tggtgtgctc aggagaattt tactcatcca tctggagttg  360
gcgaaaggtg tgatacccca gcaaaccttt tagctaaagg atgtcaatta aacttcatcg  420
aaaaccctgt ctcccaagta gaaatactta aaaataagcc tctcagtgta ggcagacaga  480
aaaatagttc tgacattgtt cagattgcgc ctcaaagctt gatccttaag ttgagaccag  540
gtggtgcgca gactctgcag gtgcatgtcc gccagactga ggactacccg gtggatttgt  600
attacctcat ggacctctcc gcctccatgg atgacgacct caacacaata aaggagctgg  660
gctcccggct ttccaaagag atgtctaaat taaccagcaa ctttagactg ggcttcggat  720
cttttgtgga aaaacctgta tcccctttcg tgaaaacaac accagaagaa attgccaacc  780
cttgcagtag tattccatac ttctgtttac ctacatttgg attcaagcac attttgccat  840
tgacaaatga tgctgaaaga ttcaatgaaa ttgtgaagaa tcagaaaatt tctgctaata  900
ttgacacacc cgaaggtgga tttgatgcaa ttatgcaagc tgctgtgtgt aaggaaaaaa  960
ttggctggcg gaatgactcc ctccacctcc tggtctttgt gagtgatgct gattctcatt  1020
ttggaatgga cagcaaacta gcaggcatcg tcattcctaa tgacgggctc tgtcacttgg  1080
acagcaagaa tgaatactcc atgtcaactg tcttggaata tccaacaatt ggacaactca  1140
ttgataaact ggtacaaaac aacgtgttat tgatcttcgc tgtaacccaa gaacaagttc  1200
atttatatga gaattacgca aaacttattc ctggagctac agtaggtcta cttcagaagg  1260
actccggaaa cattctccag ctgatcatct cagcttatga agaactgcgg tctgaggtgg  1320
aactggaagt attaggagac actgaaggac tcaacttgtc atttacagcc atctgtaaca  1380
acggtaccct cttccaacac caaaagaaat gctctcacat gaaagtggga gacacagctt  1440
ccttcagcgt gactgtgaat atcccacact gcgagagaag aagcaggcac attatcataa  1500
agcctgtggg gctgggggat gccctggaat tacttgtcag cccagaatgc aactgcgact  1560
gtcagaaaga agtggaagtg aacagctcca aatgtcacca cgggaacggc tctttccagt  1620
gtggggtgtg tgcctgccac cctggccaca tggggcctcg ctgtgagtgt ggcgaggaca  1680
tgctgagcac agattcctgc aaggaggccc cagatcatcc ctcctgcagc ggaaggggtg  1740
actgctactg tgggcagtgt atctgccact tgtctcccta tggaaacatt tatgggcctt  1800
attgccagtg tgacaatttc tcctgcgtga gacacaaagg gctgctctgc ggaggtaacg  1860
gcgactgtga ctgtggtgaa tgtgtgtgca ggagcggctg gactggcgag tactgcaact  1920
gcaccaccag cacggactcc tgcgtctctg aagatggagt gctctgcagc gggcgcgggg  1980
actgtgtttg tggcaagtgt gtttgcacaa accctggagc ctcaggacca acctgtgaac  2040
gatgtcctac ctgtggtgac ccctgtaact ctaaacggag ctgcattgag tgccacctgt  2100
cagcagctgg ccaagcccga gaagaatgtg tggacaagtg caaactagct ggtgcgacca  2160
tcagtgaaga agaagatttc tcaaaggatg gttctgtttc ctgctctctg caaggagaaa  2220
atgaatgtct tattacattc ctaataacta cagataatga ggggaaaacc atcattcaca  2280
gcatcaatga aaaagattgt ccgaagcctc caaacattcc catgatcatg ttaggggttt  2340
ccctggctat tcttctcatc ggggttgtcc tactgtgcat ctggaagcta ctggtgtcat  2400
ttcatgatcg taaagaagtt gccaaatttg aagcagaacg atcaaaagcc aagtggcaaa  2460
cgggaaccaa tccactctac agaggatcca caagtacttt taaaaatgta acttataaac  2520
acagggaaaa acaaaaggta gacctttcca cagattgcta gaactacttt atgcatgaaa  2580
aaagtctgtt tcactgatat gaaatgttaa tgcactattt aatttttttc tctttgttgc  2640
ttcaaaatga ggttggttta agataataat aggacatctg cagataagtc atcctctaca  2700
tgaaggtgac agactgttgg cagtttcaaa ataatcaaga agagaaatat ccttagcaaa  2760
gagatgactt tggggatcat ttgaggaata ctaactctgt tgcattaatg cttcaaaaaa  2820
tcatcaaatg attcatgggg gcctgatttg catttgaaaa atgtttgaaa ttagagtctc  2880
atttgtttca ggaatgcagc tacctgagtt ttttgtctcg gcaaagtcac aaagcccata  2940
tactcacatt gtgtgtctat acttgccaat taattctaaa cttgtaggaa atatgccctc  3000
tcttaaagga gaattttttt taaatctctg agaaatgaga ttctgagttt atttcagcta  3060
aaaggttgca attcttctga agatatctca aatataaggt tgaaagttaa gtgttaataa  3120
tttttgtgaa tttatacaca cctaaacgtt aagtacacaa atattttatt tgttttacaa  3180
ataaggaata agtaatttat aaattaagaa gttacctata aaaataaaaa gataacaacc  3240
ctatcatata gcttattttt aaattacctg aaaaacgata ttctacactg tttccttttt  3300
gactctgagt tttcaaactg ttacttctcc catatttctc aatccatttc actcagttgc  3360
acagtctttt aaaccctgta attgtcatac caaagtttct ttttaaaaaa aaattacttt  3420
aaatgcttag tttattcaaa gagcgatcca ataatataaa aggaacatgt gttaaacaca  3480
ataaaatttt aaatggctct aaatcaagca catcaagagt atacaagtct taaaggcttt  3540
ttaatacata ctcttttccc atctatgtaa cccaacttgc acatttcagc tgcatgtggt  3600
gaatatgcat catatattta ctttaagagg taagatttta cttgcaaaat acatgtgcaa  3660
attaggatcc atcagttgat ggaagagatg gactctagaa tattatttct tgtggttatt  3720
actcctttac aaagcacttt cgtctcactt gatcctcata aggaaactaa ggctcagaat  3780
gagtagagct gggttcagaa tctagctctt ctaactccaa gccatctcct ctttccactg  3840
caggaaactg cctcttttgt cagtgaaata atagaaagat tgtgttagtt aagtgataac  3900
tgtcatttgt ttgaaaatgt tcgagactga acaaatagca tttaaactgc tggcatatag  3960
atgagatatt gtacttttgt gcaatgttta ttacctttga ttaaattgta atgtgaagct  4020
tttactaggt gaatagttca ttatgtagtg gaggcttcgt ggttgtccat tgaattgtca  4080
cagcaaaatc tataagtttc ttcaattcta caagatagat ccatatacct ttgatcactt  4140
ggagactctt tttttgctgg tttctagata actcaggtaa atcagacctt tacagagtac  4200
agggctaggt gaaagaatta ctgaaaaatc accttgaaaa tccgaagggc tgatataccc  4260
tttatgttcc tgactgatgc gcagaacctg ggggaaatct acagcaatat acaggttgca  4320
atgctgataa cacaacagca atcctctcct ctacgtggac ttactgttgt ttttttaatt  4380
attattggaa tgggatttta gaaaatagaa gttacctttg tgtgtgtttt agggaaggta  4440
gagaagaatc tgctctttct ctgaatactg ttttgacccc aggcaggacc ttggaaaggc  4500
caaaacatta acagtagtac ttctgttcac tgaagagtta tgttacatga agataaaatg  4560
gttttgtcgt gtttattatt gtattttgtg ttgatataaa taaacatggt aatttaaaca  4620
atgaaaaaaa aaaaaaaaaa aaaaaaa                                      4647
<210>24
<211>788
<212>PRT
<213>人
<400>24
Met Gly Ile Glu Leu Leu Cys Leu Phe Phe Leu Phe Leu Gly Arg Asn
 1               5                  10                  15
Asp His Val Gln Gly Gly Cys Ala Leu Gly Gly Ala Glu Thr Cys Glu
            20                  25                  30
Asp Cys Leu Leu Ile Gly Pro Gln Cys Ala Trp Cys Ala Gln Glu Asn
        35                  40                  45
Phe Thr His Pro Ser Gly Val Gly Glu Arg Cys Asp Thr Pro Ala Asn
    50                  55                  60
Leu Leu Ala Lys Gly Cys Gln Leu Asn Phe Ile Glu Asn Pro Val Ser
65                  70                  75                  80
Gln Val Glu Ile Leu Lys Asn Lys Pro Leu Ser Val Gly Arg Gln Lys
                85                  90                  95
Asn Ser Ser Asp Ile Val Gln Ile Ala Pro Gln Ser Leu Ile Leu Lys
            100                 105                 110
Leu Arg Pro Gly Gly Ala Gln Thr Leu Gln Val His Val Arg Gln Thr
        115                 120                 125
Glu Asp Tyr Pro Val Asp Leu Tyr Tyr Leu Met Asp Leu Ser Ala Ser
    130                 135                 140
Met Asp Asp Asp Leu Asn Thr Ile Lys Glu Leu Gly Ser Arg Leu Ser
145                 150                 155                 160
Lys Glu Met Ser Lys Leu Thr Ser Asn Phe Arg Leu Gly Phe Gly Ser
                165                 170                 175
Phe Val Glu Lys Pro Val Ser Pro Phe Val Lys Thr Thr Pro Glu Glu
            180                 185                 190
Ile Ala Asn Pro Cys Ser Ser Ile Pro Tyr Phe Cys Leu Pro Thr Phe
        195                 200                 205
Gly Phe Lys His Ile Leu Pro Leu Thr Asn Asp Ala Glu Arg Phe Asn
    210                 215                 220
Glu Ile Val Lys Asn Gln Lys Ile Ser Ala Asn Ile Asp Thr Pro Glu
225                 230                 235                 240
Gly Gly Phe Asp Ala Ile Met Gln Ala Ala Val Cys Lys Glu Lys Ile
                245                 250                 255
Gly Trp Arg Asn Asp Ser Leu His Leu Leu Val Phe Val Ser Asp Ala
            260                 265                 270
Asp Ser His Phe Gly Met Asp Ser Lys Leu Ala Gly Ile Val Ile Pro
        275                 280                 285
Asn Asp Gly Leu Cys His Leu Asp Ser Lys Asn Glu Tyr Ser Met Ser
    290                 295                 300
Thr Val Leu Glu Tyr Pro Thr Ile Gly Gln Leu Ile Asp Lys Leu Val
305                 310                 315                 320
Gln Asn Asn Val Leu Leu Ile Phe Ala Val Thr Gln Glu Gln Val His
                325                 330                 335
Leu Tyr Glu Asn Tyr Ala Lys Leu Ile Pro Gly Ala Thr Val Gly Leu
            340                 345                 350
Leu Gln Lys Asp Ser Gly Asn Ile Leu Gln Leu Ile Ile Ser Ala Tyr
        355                 360                 365
Glu Glu Leu Arg Ser Glu Val Glu Leu Glu Val Leu Gly Asp Thr Glu
    370                 375                 380
Gly Leu Asn Leu Ser Phe Thr Ala Ile Cys Asn Asn Gly Thr Leu Phe
385                 390                 395                 400
Gln His Gln Lys Lys Cys Ser His Met Lys Val Gly Asp Thr Ala Ser
                405                 410                 415
Phe Ser Val Thr Val Asn Ile Pro His Cys Glu Arg Arg Ser Arg His
            420                 425                 430
Ile Ile Ile Lys Pro Val Gly Leu Gly Asp Ala Leu Glu Leu Leu Val
        435                 440                 445
Ser Pro Glu Cys Asn Cys Asp Cys Gln Lys Glu Val Glu Val Asn Ser
    450                 455                 460
Ser Lys Cys His His Gly Asn Gly Ser Phe Gln Cys Gly Val Cys Ala
465                 470                 475                 480
Cys His Pro Gly His Met Gly Pro Arg Cys Glu Cys Gly Glu Asp Met
                485                 490                 495
Leu Ser Thr Asp Ser Cys Lys Glu Ala Pro Asp His Pro Ser Cys Ser
            500                 505                 510
Gly Arg Gly Asp Cys Tyr Cys Gly Gln Cys Ile Cys His Leu Ser Pro
        515                 520                 525
Tyr Gly Asn Ile Tyr Gly Pro Tyr Cys Gln Cys Asp Asn Phe Ser Cys
    530                 535                 540
Val Arg His Lys Gly Leu Leu Cys Gly Gly Asn Gly Asp Cys Asp Cys
545                 550                 555                 560
Gly Glu Cys Val Cys Arg Ser Gly Trp Thr Gly Glu Tyr Cys Asn Cys
                565                 570                 575
Thr Thr Ser Thr Asp Ser Cys Val Ser Glu Asp Gly Val Leu Cys Ser
            580                 585                 590
Gly Arg Gly Asp Cys Val Cys Gly Lys Cys Val Cys Thr Asn Pro Gly
        595                 600                 605
Ala Ser Gly Pro Thr Cys Glu Arg Cys Pro Thr Cys Gly Asp Pro Cys
    610                 615                 620
Asn Ser Lys Arg Ser Cys Ile Glu Cys His Leu Ser Ala Ala Gly Gln
625                 630                 635                 640
Ala Arg Glu Glu Cys Val Asp Lys Cys Lys Leu Ala Gly Ala Thr Ile
                645                 650                 655
Ser Glu Glu Glu Asp Phe Ser Lys Asp Gly Ser Val Ser Cys Ser Leu
            660                 665                 670
Gln Gly Glu Asn Glu Cys Leu Ile Thr Phe Leu Ile Thr Thr Asp Asn
        675                 680                 685
Glu Gly Lys Thr Ile Ile His Ser Ile Asn Glu Lys Asp Cys Pro Lys
    690                 695                 700
Pro Pro Asn Ile Pro Met Ile Met Leu Gly Val Ser Leu Ala Ile Leu
705                 710                 715                 720
Leu Ile Gly Val Val Leu Leu Cys Ile Trp Lys Leu Leu Val Ser Phe
                725                 730                 735
His Asp Arg Lys Glu Val Ala Lys Phe Glu Ala Glu Arg Ser Lys Ala
            740                 745                 750
Lys Trp Gln Thr Gly Thr Asn Pro Leu Tyr Arg Gly Ser Thr Ser Thr
        755                 760                 765
Phe Lys Asn Val Thr Tyr Lys His Arg Glu Lys Gln Lys Val Asp Leu
    770                 775                 780
Ser Thr Asp Cys
785
<210>25
<211>4474
<212>DNA
<213>人
<400>25
gtagcctctg ttttcatttc agtcttaatg aaaactttct aacttatatc tcaagtttct  60
tttcaaagca gtgtaagtag tatttaaaat gttatacttc aagaaagaaa gactttaacg  120
atattcagcg ttggtcttgt aacgctgaag gtaattcatt ttttaatcgg tctgcacagc  180
aagaactgaa acgaatgggg attgaactgc tttgcctgtt ctttctattt ctaggaagga  240
atgatcacgt acaaggtggc tgtgccctgg gaggtgcaga aacctgtgaa gactgcctgc  300
ttattggacc tcagtgtgcc tggtgtgctc aggagaattt tactcatcca tctggagttg  360
gcgaaaggtg gtgcgcagac tctgcaggtg catgtccgcc agactgagga ctacccggtg  420
gatttgtatt acctcatgga cctctccgcc tccatggatg acgacctcaa cacaataaag  480
gagctgggct cccggctttc caaagagatg tctaaattaa ccagcaactt tagactgggc  540
ttcggatctt ttgtggaaaa acctgtatcc cctttygtga aaacaacacc agaagaaatt  600
gccaaccctt gcagtagtat tccatacttc tgtttaccta catttggatt caagcacatt  660
ttgccattga caaatgatgc tgaaagattc aatgaaattg tgaagaatca gaaaatttct  720
gctaatattg acacacccga aggtggattt gatgcaatta tgcaagctgc tgtgtgtaag  780
gaaaaaattg gctggcggaa tgactccctc cacctcctgg tctttgtgag tgatgctgat  840
tctcattttg gaatggacag caaactagca ggcatcgtca ttcctaatga cgggctctgt  900
cacttggaca gcaagaatga atactccatg tcaactgtct tggaatatcc aacaattgga  960
caactcattg ataaactggt acaaaacaac gtgttattga tcttcgctgt aacccaagaa  1020
caagttcatt tatatgagaa ttacgcaaaa cttattcctg gagctacagt aggtctactt  1080
cagaaggact ccggaaacat tctccagctg atcatctcag cttatgaaga actgcggtct  1140
gaggtggaac tggaagtatt aggagacact gaaggactca acttgtcatt tacagccatc  1200
tgtaacaacg gtaccctctt ccaacaccaa aagaaatgct ctcacatgaa agtgggagac  1260
acagcttcct tcagcgtgac tgtgaatatc ccacactgcg agagaagaag caggcacatt  1320
atcataaagc ctgtggggct gggggatgcc ctggaattac ttgtcagccc agaatgcaac  1380
tgcgactgtc agaaagaagt ggaagtgaac agctccaaat gtcaccacgg gaacggctct  1440
ttccagtgtg gggtgtgtgc ctgccaccct ggccacatgg ggcctcgctg tgagtgtggc  1500
gaggacatgc tgagcacaga ttcctgcaag gaggccccag atcatccctc ctgcagcgga  1560
aggggtgact gctactgtgg gcagtgtatc tgccacttgt ctccctatgg aaacatttat  1620
gggccttatt gccagtgtga caatttctcc tgcgtgagac acaaagggct gctctgcgga  1680
ggtaacggcg actgtgactg tggtgaatgt gtgtgcagga gcggctggac tggcgagtac  1740
tgcaactgca ccaccagcac ggactcctgc gtctctgaag atggagtgct ctgcagcggg  1800
cgcggggact gtgtttgtgg caagtgtgtt tgcacaaacc ctggagcctc aggaccaacc  1860
tgtgaacgat gtcctacctg tggtgacccc tgtaactcta aacggagctg cattgagtgc  1920
cacctgtcag cagctggcca agcccgagaa gaatgtgtgg acaagtgcaa actagctggt  1980
gcgaccatca gtgaagaaga agatttctca aaggatggtt ctgtttcctg ctctctgcaa  2040
ggagaaaatg aatgtcttat tacattccta ataactacag ataatgaggg gaaaaccatc  2100
attcacagca tcaatgaaaa agattgtccg aagcctccaa acattcccat gatcatgtta  2160
ggggtttccc tggctattct tctcatcggg gttgtcctac tgtgcatctg gaagctactg  2220
gtgtcatttc atgatcgtaa agaagttgcc aaatttgaag cagaacgatc aaaagccaag  2280
tggcaaacgg gaaccaatcc actctacaga ggatccacaa gtacttttaa aaatgtaact  2340
tataaacaca gggaaaaaca aaaggtagac ctttccacag attgctagaa ctactttatg  2400
catgaaaaaa gtctgtttca ctgatatgaa atgttaatgc actatttaat ttttttctct  2460
ttgttgcttc aaaatgaggt tggtttaaga taataatagg acatctgcag ataagtcatc  2520
ctctacatga aggtgacaga ctgttggcag tttcaaaata atcaagaaga gaaatatcct  2580
tagcaaagag atgactttgg ggatcatttg aggaatacta actctgttgc attaatgctt  2640
caaaaaatca tcaaatgatt catgggggcc tgatttgcat ttgaaaaatg tttgaaatta  2700
gagtctcatt tgtttcagga atgcagctac ctgagttttt tgtctcggca aagtcacaaa  2760
gcccatatac tcacattgtg tgtctatact tgccaattaa ttctaaactt gtaggaaata  2820
tgccctctct taaaggagaa ttttttttaa atctctgaga aatgagattc tgagtttatt  2880
tcagctaaaa ggttgcaatt cttctgaaga tatctcaaat ataaggttga aagttaagtg  2940
ttaataattt ttgtgaattt atacacacct aaacgttaag tacacaaata ttttatttgt  3000
tttacaaata aggaataagt aatttataaa ttaagaagtt acctataaaa ataaaaagat  3060
aacaacccta tcatatagct tatttttaaa ttacctgaaa aacgatattc tacactgttt  3120
cctttttgac tctgagtttt caaactgtta cttctcccat atttctcaat ccatttcact  3180
cagttgcaca gtcttttaaa ccctgtaatt gtcataccaa agtttctttt taaaaaaaaa  3240
ttactttaaa tgcttagttt attcaaagag cgatccaata atataaaagg aacatgtgtt  3300
aaacacaata aaattttaaa tggctctaaa tcaagcacat caagagtata caagtcttaa  3360
aggcttttta atacatactc ttttcccatc tatgtaaccc aacttgcaca tttcagctgc  3420
atgtggtgaa tatgcatcat atatttactt taagaggtaa gattttactt gcaaaataca  3480
tgtgcaaatt aggatccatc agttgatgga agagatggac tctagaatat tatttcttgt  3540
ggttattact cctttacaaa gcactttcgt ctcacttgat cctcataagg aaactaaggc  3600
tcagaatgag tagagctggg ttcagaatct agctcttcta actccaagcc atctcctctt  3660
tccactgcag gaaactgcct cttttgtcag tgaaataata gaaagattgt gttagttaag  3720
tgataactgt catttgtttg aaaatgttcg agactgaaca aatagcattt aaactgctgg  3780
catatagatg agatattgta cttttgtgca atgtttatta cctttgatta aattgtaatg  3840
tgaagctttt actaggtgaa tagttcatta tgtagtggag gcttcgtggt tgtccattga  3900
attgtcacag caaaatctat aagtttcttc aattctacaa gatagatcca tatacctttg  3960
atcacttgga gactcttttt ttgctggttt ctagataact caggtaaatc agacctttac  4020
agagtacagg gctaggtgaa agaattactg aaaaatcacc ttgaaaatcc gaagggctga  4080
tatacccttt atgttcctga ctgatgcgca gaacctgggg gaaatctaca gcaatataca  4140
ggttgcaatg ctgataacac aacagcaatc ctctcctcta cgtggactta ctgttgtttt  4200
tttaattatt attggaatgg gattttagaa aatagaagtt acctttgtgt gtgttttagg  4260
gaaggtagag aagaatctgc tctttctctg aatactgttt tgaccccagg caggaccttg  4320
gaaaggccaa aacattaaca gtagtacttc tgttcactga agagttatgt tacatgaaga  4380
taaaatggtt ttgtcgtgtt tattattgta ttttgtgttg atataaataa acatggtaat  4440
ttaaacaatg aaaaaaaaaa aaaaaaaaaa aaaa                              4474
<210>26
<211>715
<212>PRT
<213>人
<400>26
Met Ile Thr Tyr Lys Val Ala Val Pro Trp Glu Val Gln Lys Pro Val
 1               5                  10                  15
Lys Thr Ala Cys Leu Leu Asp Leu Ser Val Pro Gly Val Leu Arg Arg
            20                  25                  30
Ile Leu Leu Ile His Leu Glu Leu Ala Lys Gly Gly Ala Gln Thr Leu
    35                      40                  45
Gln Val His Val Arg Gln Thr Glu Asp Tyr Pro Val Asp Leu Tyr Tyr
    50                  55                  60
Leu Met Asp Leu Ser Ala Ser Met Asp Asp Asp Leu Asn Thr Ile Lys
65                  70                  75                  80
Glu Leu Gly Ser Arg Leu Ser Lys Glu Met Ser Lys Leu Thr Ser Asn
                85                  90                  95
Phe Arg Leu Gly Phe Gly Ser Phe Val Glu Lys Pro Val Ser Pro Phe
            100                 105                 110
Val Lys Thr Thr Pro Glu Glu Ile Ala Asn Pro Cys Ser Ser Ile Pro
        115                 120                 125
Tyr Phe Cys Leu Pro Thr Phe Gly Phe Lys His Ile Leu Pro Leu Thr
    130                 135                 140
Asn Asp Ala Glu Arg Phe Asn Glu Ile Val Lys Asn Gln Lys Ile Ser
145                 150                 155                 160
Ala Asn Ile Asp Thr Pro Glu Gly Gly Phe Asp Ala Ile Met Gln Ala
                165                 170                 175
Ala Val Cys Lys Glu Lys Ile Gly Trp Arg Asn Asp Ser Leu His Leu
            180                 185                 190
Leu Val Phe Val Ser Asp Ala Asp Ser His Phe Gly Met Asp Ser Lys
        195                 200                 205
Leu Ala Gly Ile Val Ile Pro Asn Asp Gly Leu Cys His Leu Asp Ser
    210                 215                 220
Lys Asn Glu Tyr Ser Met Ser Thr Val Leu Glu Tyr Pro Thr Ile Gly
225                 230                 235                 240
Gln Leu Ile Asp Lys Leu Val Gln Asn Asn Val Leu Leu Ile Phe Ala
                245                 250                 255
Val Thr Gln Glu Gln Val His Leu Tyr Glu Asn Tyr Ala Lys Leu Ile
            260                 265                 270
Pro Gly Ala Thr Val Gly Leu Leu Gln Lys Asp Ser Gly Asn Ile Leu
        275                 280                 285
Gln Leu Ile Ile Ser Ala Tyr Glu Glu Leu Arg Ser Glu Val Glu Leu
    290                 295                 300
Glu Val Leu Gly Asp Thr Glu Gly Leu Asn Leu Ser Phe Thr Ala Ile
305                 310                 315                 320
Cys Asn Asn Gly Thr Leu Phe Gln His Gln Lys Lys Cys Ser His Met
                325                 330                 335
Lys Val Gly Asp Thr Ala Ser Phe Ser Val Thr Val Asn Ile Pro His
            340                 345                 350
Cys Glu Arg Arg Ser Arg His Ile Ile Ile Lys Pro Val Gly Leu Gly
        355                 360                 365
Asp Ala Leu Glu Leu Leu Val Ser Pro Glu Cys Asn Cys Asp Cys Gln
    370                 375                 380
Lys Glu Val Glu Val Asn Ser Ser Lys Cys His His Gly Asn Gly Ser
385                 390                 395                 400
Phe Gln Cys Gly Val Cys Ala Cys His Pro Gly His Met Gly Pro Arg
                405                 410                 415
Cys Glu Cys Gly Glu Asp Met Leu Ser Thr Asp Ser Cys Lys Glu Ala
            420                 425                 430
Pro Asp His Pro Ser Cys Ser Gly Arg Gly Asp Cys Tyr Cys Gly Gln
        435                 440                 445
Cys Ile Cys His Leu Ser Pro Tyr Gly Asn Ile Tyr Gly Pro Tyr Cys
    450                 455                 460
Gln Cys Asp Asn Phe Ser Cys Val Arg His Lys Gly Leu Leu Cys Gly
465                 470                 475                 480
Gly Asn Gly Asp Cys Asp Cys Gly Glu Cys Val Cys Arg Ser Gly Trp
                485                 490                 495
Thr Gly Glu Tyr Cys Asn Cys Thr Thr Ser Thr Asp Ser Cys Val Ser
            500                 505                 510
Glu Asp Gly Val Leu Cys Ser Gly Arg Gly Asp Cys Val Cys Gly Lys
        515                 520                 525
Cys Val Cys Thr Asn Pro Gly Ala Ser Gly Pro Thr Cys Glu Arg Cys
    530                 535                 540
Pro Thr Cys Gly Asp Pro Cys Asn Ser Lys Arg Ser Cys Ile Glu Cys
5455                 50                 555                 560
His Leu Ser Ala Ala Gly Gln Ala Arg Glu Glu Cys Val Asp Lys Cys
                565                 570                 575
Lys Leu Ala Gly Ala Thr Ile Ser Glu Glu Glu Asp Phe Ser Lys Asp
            580                 585                 590
Gly Ser Val Ser Cys Ser Leu Gln Gly Glu Asn Glu Cys Leu Ile Thr
        595                 600                 605
Phe Leu Ile Thr Thr Asp Asn Glu Gly Lys Thr Ile Ile His Ser Ile
    610                 615                 620
Asn Glu Lys Asp Cys Pro Lys Pro Pro Asn Ile Pro Met Ile Met Leu
625                 630                 635                 640
Gly Val Ser Leu Ala Ile Leu Leu Ile Gly Val Val Leu Leu Cys Ile
                645                 650                 655
Trp Lys Leu Leu Val Ser Phe His Asp Arg Lys Glu Val Ala Lys Phe
            660                 665                 670
Glu Ala Glu Arg Ser Lys Ala Lys Trp Gln Thr Gly Thr Asn Pro Leu
        675                 680                 685
Tyr Arg Gly Ser Thr Ser Thr Phe Lys Asn Val Thr Tyr Lys His Arg
    690                 695                 700
Glu Lys Gln Lys Val Asp Leu Ser Thr Asp Cys
705                 710                 715
<210>27
<211>4327
<212>DNA
<213>人
<400>27
gtagcctctg ttttcatttc agtcttaatg aaaactttct aacttatatc tcaagtttct  60
tttcaaagca gtgtaagtag tatttaaaat gttatacttc aagaaagaaa gactttaacg  120
atattcagcg ttggtcttgt aacgctgaag gtaattcatt ttttaatcgg tctgcacagc  180
aagaactgaa acgaatgggg attgaactgc tttgcctgtt ctttctattt ctaggaagga  240
atgatcacgt acaaggtggc tgtgccctgg gaggtgcaga aacctgtgaa gactgcctgc  300
ttattggacc tcagtgtgcc tggtgtgctc aggagaattt tactcatcca tctggagttg  360
gcgaaaggtg tgatacccca gcaaaccttt tagctaaagg atgtcaatta aacttcatcg  420
aaaaccctgt ctcccaagta gaaatactta aaaataagcc tctcagtgta ggcagacaga  480
aaaatagttc tgacattgtt cagattgcgc ctcaaagctt gatccttaag ttgagaccag  540
gtggtgcgca gactctgcag gtgcatgtcc gccagactga ggactacccg gtggatttgt  600
attacctcat ggacctctcc gcctccatgg atgacgacct caacacaata aaggagctgg  660
gctcccggct ttccaaagag atgtctaaat taaccagcaa ctttagactg ggcttcggat  720
cttttgtgga aaaacctgta tccccttttg tgaaaacaac accagaagaa attgccaacc  780
cttgcagtag tattccatac ttctgtttac ctacatttgg attcaagcac attttgccat  840
tgacaaatga tgctgaaaga ttcaatgaaa ttgtgaagaa tcagaaaatt tctgctaata  900
ttgacacacc cgaaggtgga tttgatgcaa ttatgcaagc tgctgtgtgt aaggaaaaaa  960
ttggctggcg gaatgactcc ctccacctcc tggtctttgt gagtgatgct gattctcatt  1020
ttggaatgga cagcaaacta gcaggcatcg tcattcctaa tgacgggctc tgtcacttgg  1080
acagcaagaa tgaatactcc atgtcaactg tcttggaata tccaacaatt ggacaactca  1140
ttgataaact ggtacaaaac aacgtgttat tgatcttcgc tgtaacccaa gaacaagttc  1200
atttatatga gaattacgca aaacttattc ctggagctac agtaggtcta cttcagaagg  1260
actccggaaa cattctccag ctgatcatct cagcttatga agaactgcgg tctgaggtgg  1320
aactggaagt attaggagac actgaaggac tcaacttgtc atttacagcc atctgtaaca  1380
acggtaccct cttccaacac caaaagaaat gctctcacat gaaagtggga gacacagctt  1440
ccttcagcgt gactgtgaat atcccacact gcgagagaag aagcaggcac attatcataa  1500
agcctgtggg gctgggggat gccctggaat tacttgtcag cccagaatgc aactgcgact  1560
gtcagaaaga agtggaagtg aacagctcca aatgtcacca cgggaacggc tctttccagt  1620
gtggggtgtg tgcctgccac cctggccaca tggggcctcg ctgtgagtgt ggcgaggaca  1680
tgctgagcac agattcctgc aaggaggccc cagatcatcc ctcctgcagc ggaaggggtg  1740
actgctactg tgggcagtgt atctgccact tgtctcccta tggaaacatt tatgggcctt  1800
attgccagtg tgacaatttc tcctgcgtga gacacaaagg gctgctctgc ggagatttct  1860
caaaggatgg ttctgtttcc tgctctctgc aaggagaaaa tgaatgtctt attacattcc  1920
taataactac agataatgag gggaaaacca tcattcacag catcaatgaa aaagattgtc  1980
cgaagcctcc aaacattccc atgatcatgt taggggtttc cctggctatt cttctcatcg  2040
gggttgtcct actgtgcatc tggaagctac tggtgtcatt tcatgatcgt aaagaagttg  2100
ccaaatttga agcagaacga tcaaaagcca agtggcaaac gggaaccaat ccactctaca  2160
gaggatccac aagtactttt aaaaatgtaa cttataaaca cagggaaaaa caaaaggtag  2220
acctttccac agattgctag aactacttta tgcatgaaaa aagtctgttt cactgatatg  2280
aaatgttaat gcactattta atttttttct ctttgttgct tcaaaatgag gttggtttaa  2340
gataataata ggacatctgc agataagtca tcctctacat gaaggtgaca gactgttggc  2400
agtttcaaaa taatcaagaa gagaaatatc cttagcaaag agatgacttt ggggatcatt  2460
tgaggaatac taactctgtt gcattaatgc ttcaaaaaat catcaaatga ttcatggggg  2520
cctgatttgc atttgaaaaa tgtttgaaat tagagtctca tttgtttcag gaatgcagct  2580
acctgagttt tttgtctcgg caaagtcaca aagcccatat actcacattg tgtgtctata  2640
cttgccaatt aattctaaac ttgtaggaaa tatgccctct cttaaaagga gaattttttt  2700
taaatctctg agaaatgaga ttctgagttt atttcagcta aaaggttgca attcttctga  2760
agatatctca aatataaggt tgaaagttaa gtgttaataa tttttgtgaa tttatacaca  2820
cctaaacgtt aagtacacaa atattttatt tgttttacaa ataaggaata agtaatttat  2880
aaattaagaa gttacctata aaaataaaaa gataacaacc ctatcatata gcttattttt  2940
aaattacctg aaaaacgata ttctacactg tttccttttt gactctgagt tttcaaactg  3000
ttacttctcc catatttctc aatccatttc actcagttgc acagtctttt aaaccctgta  3060
attgtcatac caaagtttct ttttaaaaaa aaattacttt aaatgcttag tttattcaaa  3120
gagcgatcca ataatataaa aggaacatgt gttaaacaca ataaaatttt aaatggctct  3180
aaatcaagca catcaagagt atacaagtct taaaggcttt ttaatacata ctcttttccc  3240
atctatgtaa cccaacttgc acatttcagc tgcatgtggt gaatatgcat catatattta  3300
ctttaagagg taagatttta cttgcaaaat acatgtgcaa attaggatcc atcagttgat  3360
ggaagagatg gactctagaa tattatttct tgtggttatt actcctttac aaagcacttt  3420
cgtctcactt gatcctcata aggaaactaa ggctcagaat gagtagagct gggttcagaa  3480
tctagctctt ctaactccaa gccatctcct ctttccactg caggaaactg cctcttttgt  3540
cagtgaaata atagaaagat tgtgttagtt aagtgataac tgtcatttgt ttgaaaatgt  3600
tcgagactga acaaatagca tttaaactgc tggcatatag atgagatatt gtacttttgt  3660
gcaatgttta ttacctttga ttaaattgta atgtgaagct tttactaggt gaatagttca  3720
ttatgtagtg gaggcttcgt ggttgtccat tgaattgtca cagcaaaatc tataagtttc  3780
ttcaattcta caagatagat ccatatacct ttgatcactt ggagactctt tttttgctgg  3840
tttctagata actcaggtaa atcagacctt tacagagtac agggctaggt gaaagaatta  3900
ctgaaaaatc accttgaaaa tccgaagggc tgatataccc tttatgttcc tgactgatgc  3960
gcagaacctg ggggaaatct acagcaatat acaggttgca atgctgataa cacaacagca  4020
atcctctcct ctacgtggac ttactgttgt ttttttaatt attattggaa tgggatttta  4080
gaaaatagaa gttacctttg tgtgtgtttt agggaaggta gagaagaatc tgctctttct  4140
ctgaatactg ttttgacccc aggcaggacc ttggaaaggc caaaacatta acagtagtac  4200
ttctgttcac tgaagagtta tgttacatga agataaaatg gttttgtcgt gtttattatt  4260
gtattttgtg ttgatataaa taaacatggt aatttaaaca atgaaaaaaa aaaaaaaaaa  4320
aaaaaaa                                                            4327
<210>28
<211>681
<212>PRT
<213>人
<400>28
Met Gly Ile Glu Leu Leu Cys Leu Phe Phe Leu Phe Leu Gly Arg Asn
 1               5                  10                  15
Asp His Val Gln Gly Gly Cys Ala Leu Gly Gly Ala Glu Thr Cys Glu
            20                  25                  30
Asp Cys Leu Leu Ile Gly Pro Gln Cys Ala Trp Cys Ala Gln Glu Asn
        35                  40                  45
Phe Thr His Pro Ser Gly Val Gly Glu Arg Cys Asp Thr Pro Ala Asn
    50                  55                  60
Leu Leu Ala Lys Gly Cys Gln Leu Asn Phe Ile Glu Asn Pro Val Ser
65                  70                  75                  80
Gln Val Glu Ile Leu Lys Asn Lys Pro Leu Ser Val Gly Arg Gln Lys
                85                  90                  95
Asn Ser Ser Asp Ile Val Gln Ile Ala Pro Gln Ser Leu Ile Leu Lys
            100                 105                 110
Leu Arg Pro Gly Gly Ala Gln Thr Leu Gln Val His Val Arg Gln Thr
        115                 120                 125
Glu Asp Tyr Pro Val Asp Leu Tyr Tyr Leu Met Asp Leu Ser Ala Ser
    130                 135                 140
Met Asp Asp Asp Leu Asn Thr Ile Lys Glu Leu Gly Ser Arg Leu Ser
145                 150                 155                 160
Lys Glu Met Ser Lys Leu Thr Ser Asn Phe Arg Leu Gly Phe Gly Ser
                165                 170                 175
Phe Val Glu Lys Pro Val Ser Pro Phe Val Lys Thr Thr Pro Glu Glu
            180                 185                 190
Ile Ala Asn Pro Cys Ser Ser Ile Pro Tyr Phe Cys Leu Pro Thr Phe
        195                 200                 205
Gly Phe Lys His Ile Leu Pro Leu Thr Asn Asp Ala Glu Arg Phe Asn
    210                 215                 220
Glu Ile Val Lys Asn Gln Lys Ile Ser Ala Asn Ile Asp Thr Pro Glu
225                 230                 235                 240
Gly Gly Phe Asp Ala Ile Met Gln Ala Ala Val Cys Lys Glu Lys Ile
                245                 250                 255
Gly Trp Arg Asn Asp Ser Leu His Leu Leu Val Phe Val Ser Asp Ala
            260                 265                 270
Asp Ser His Phe Gly Met Asp Ser Lys Leu Ala Gly Ile Val Ile Pro
        275                 280                 285
Asn Asp Gly Leu Cys His Leu Asp Ser Lys Asn Glu Tyr Ser Met Ser
    290                 295                 300
Thr Val Leu Glu Tyr Pro Thr Ile Gly Gln Leu Ile Asp Lys Leu Val
305                 310                 315                 320
Gln Asn Asn Val Leu Leu Ile Phe Ala Val Thr Gln Glu Gln Val His
                325                 330                 335
Leu Tyr Glu Asn Tyr Ala Lys Leu Ile Pro Gly Ala Thr Val Gly Leu
            340                 345                 350
Leu Gln Lys Asp Ser Gly Asn Ile Leu Gln Leu Ile Ile Ser Ala Tyr
        355                 360                 365
Glu Glu Leu Arg Ser Glu Val Glu Leu Glu Val Leu Gly Asp Thr Glu
    370                 375                 380
Gly Leu Asn Leu Ser Phe Thr Ala Ile Cys Asn Asn Gly Thr Leu Phe
385                 390                 395                 400
Gln His Gln Lys Lys Cys Ser His Met Lys Val Gly Asp Thr Ala Ser
                405                 410                 415
Phe Ser Val Thr Val Asn Ile Pro His Cys Glu Arg Arg Ser Arg His
            420                 425                 430
Ile Ile Ile Lys Pro Val Gly Leu Gly Asp Ala Leu Glu Leu Leu Val
        435                 440                 445
Ser Pro Glu Cys Asn Cys Asp Cys Gln Lys Glu Val Glu Val Asn Ser
    450                 455                 460
Ser Lys Cys His His Gly Asn Gly Ser Phe Gln Cys Gly Val Cys Ala
465                 470                 475                 480
Cys His Pro Gly His Met Gly Pro Arg Cys Glu Cys Gly Glu Asp Met
                485                 490                 495
Leu Ser Thr Asp Ser Cys Lys Glu Ala Pro Asp His Pro Ser Cys Ser
            500                 505                 510
Gly Arg Gly Asp Cys Tyr Cys Gly Gln Cys Ile Cys His Leu Ser Pro
        515                 520                 525
Tyr Gly Asn Ile Tyr Gly Pro Tyr Cys Gln Cys Asp Asn Phe Ser Cys
    530                 535                 540
Val Arg His Lys Gly Leu Leu Cys Gly Asp Phe Ser Lys Asp Gly Ser
545                 550                 555                 560
Val Ser Cys Ser Leu Gln Gly Glu Asn Glu Cys Leu Ile Thr Phe Leu
                565                 570                 575
Ile Thr Thr Asp Asn Glu Gly Lys Thr Ile Ile His Ser Ile Asn Glu
            580                 585                 590
Lys Asp Cys Pro Lys Pro Pro Asn Ile Pro Met Ile Met Leu Gly Val
        595                 600                 605
Ser Leu Ala Ile Leu Leu Ile Gly Val Val Leu Leu Cys Ile Trp Lys
    610                 615                 620
Leu Leu Val Ser Phe His Asp Arg Lys Glu Val Ala Lys Phe Glu Ala
625                 630                 635                 640
Glu Arg Ser Lys Ala Lys Trp Gln Thr Gly Thr Asn Pro Leu Tyr Arg
                645                 650                 655
Gly Ser Thr Ser Thr Phe Lys Asn Val Thr Tyr Lys His Arg Glu Lys
            660                 665                 670
Gln Lys Val Asp Leu Ser Thr Asp Cys
        675                 680
<210>29
<211>3176
<212>DNA
<213>人
<400>29
tgataaccca aggtattcac agcaagatac agtgagtctt aaagttaagc accgtgcaat  60
tagctttgct tccttgggtt tttgaaacat gcatctgtat aaacctgcct gtgcagacat  120
cccgagcccc aagctgggtc tgccaaaatc cagtgaatcg gctctaaaat gtagatggca  180
cctagcagtg accaagactc agcctcaggc ggcctgcaaa cctgtgaggc ccagtggagc  240
agccgaacag aaatatgtgg aaaagtttct acgtgttcat ggaatttcgt tgcaggaaac  300
caccagagca gagacgggca tggcatacag gaatcttgga aaatcaggac tcagagtttc  360
ttgcttgggt cttggaacat gggtgacatt tggaggtcaa atttcagatg aggttgctga  420
acggctgatg accatcgcct atgaaagtgg tgttaacctc tttgatactg ccgaagtcta  480
tgctgctgga aaggctgaag tgattctggg gagcatcatc aagaagaaag gctggaggag  540
gtccagtctg gtcataacaa ccaaactcta ctggggtgga aaagctgaaa cagaaagagg  600
gctgtcaaga aagcatatta ttgaaggatt gaagggctcc ctccagaggc tgcagctcga  660
gtatgtggat gtggtctttg caaatcgacc ggacagtaac actcccatgg aagaaattgt  720
ccgagccatg acacatgtga taaaccaagg catggcgatg tactggggca cctcgagatg  780
gagtgctatg gagatcatgg aagcctattc tgtagcaaga cagttcaata tgatcccacc  840
ggtctgtgaa caagctgagt accatctttt ccagagagag aaagtggagg tccagctgcc  900
agagctctac cacaaaatag gtgttggcgc aatgacatgg tctccacttg cctgtggaat  960
catctcagga aaatacggaa acggggtgcc tgaaagttcc agggcttcac tgaagtgcta  1020
ccagtggttg aaagaaagaa ttgtaagtga agaagggaga aaacagcaaa acaagctaaa  1080
agacctttcc ccaattgcgg agcgtctggg atgcacacta cctcagctag ctgttgcgtg  1140
gtgcctgaga aatgaaggtg tgagttctgt gctcctggga tcatccactc ctgaacaact  1200
cattgaaaac cttggtgcca ttcaggttct cccaaagatg acatcacatg tggtaaatga  1260
gattgataac atactgcgca acaagcccta cagcaagaag gactatagat cataaggcaa  1320
tgcatgaacc acagaagctg catggttaaa atagcggcct gtgcccagta cagaaaggtg  1380
ttactaacca gtcttttgaa tcacttagca gcttgctcgt caacctctag tgtccctccc  1440
tggattcttt gaggtgtctg ctgtcgctac cactgtgcac atctgaaaac tcacaaccaa  1500
gaaaatccat tctattttct tatcttggac tggagtcacc tattcttgca ttgctgtata  1560
cacctcatgc ttatgcaatg ggaagaatat gggggccagg gggtgtggta ctaccttcag  1620
gcatttggta actcaaagaa ggctgtacag atatattttt tcaaaaagaa caaaatccac  1680
agatgcaatg tgagttgcgt aagaaacaga gtagatagac taaattcagt gaaggaaagg  1740
aattgagaga tttttcttag taaatagatt attgttaagt aaatagttat taaaaatata  1800
tctcactgca aaaaaaaaaa aagcagtatc ttcactcaaa agtcttgctt ggaagaataa  1860
gcagaaagaa ttttatatat tttttttcta ttttcacatt catactaaca agttttgttc  1920
catttgttat tcaataaaac aaaaatttct aggtatttgc tttattacct ttcaaatatt  1980
tactgttgct tggccccaag aatggccttg tacaacttat ccagaatgtc tattaggatt  2040
ctaatgttat gtccacttac aagtagagac agtaaaagga tgaataccca atctttagtg  2100
acaatgcagc tgatttatga aagagagggc tacactgcta tggaaactta gcttcaaaga  2160
aaatgcaatg tatctgcaat taggtgttca ttttttacta cattttatta aaacctgctt  2220
tatactttca actgcttgta ggcacaactt ctgcaagttt aaatatttga gctttacaaa  2280
taaacataca catgctcagt ttttttaagt aaacctgtaa aatacccagg aaggcaaatg  2340
ttcattgttt aattagcact gggattttat aatataatgt ttggtatttt tgaggcattg  2400
ttaacatgaa agtcaaccac tggctttgtg aaaaatgcta tgtcactatt cagaatatgc  2460
tgggtaaatt aacttgccta gtgaaaagca aaatgttaaa gaaagaactt ctggttctat  2520
aatcatatta tatgcactaa actatatgca tgaaagttct ttgcatggat taatggggct  2580
tacccttgtt gcactcgaaa tctgaggtgt atctagccct gccactattg gctacttacc  2640
ctcattaata tcccacttga gaaaaattgt gagactatac tgtgtcaata tctgtaaaaa  2700
gagagaaaac atgttttttt ttttttgaag ggggtggtgt gggagtggcc ctttaactcc  2760
tatttggcta tctgaggatg tacaaaattc tcatttaatt ttctggtcag caagttcccc  2820
acacagaaat cactctgagg tttacagaag aactgtaata ttattttaaa atgcgatttt  2880
ctgtcattag ttctagatat gtacttcatg gttaaattct aaatctgaaa atgctagtgg  2940
gagatatcaa gaaattttct ttttgattac tagtacctgt attctaacag agagtttgaa  3000
ttttttgccc gtgttatcag aatgatggaa attgatcatt ttcagttgtt cattgtgtat  3060
tcaatccagc tgaactgctg tatgtataga ggagcttgag gtgctgtcta atgggaaatg  3120
tgatttgatt gatttatttg cttagagtaa taaaagcatt ttgtgcattc aatctt      3176
<210>30
<211>408
<212>PRT
<213>人
<400>30
Met His Leu Tyr Lys Pro Ala Cys Ala Asp Ile Pro Ser Pro Lys Leu
 1               5                  10                  15
Gly Leu Pro Lys Ser Ser Glu Ser Ala Leu Lys Cys Arg Trp His Leu
            20                  25                  30
Ala Val Thr Lys Thr Gln Pro Gln Ala Ala Cys Lys Pro Val Arg Pro
        35                  40                  45
Ser Gly Ala Ala Glu Gln Lys Tyr Val Glu Lys Phe Leu Arg Val His
    50                  55                  60
Gly Ile Ser Leu Gln Glu Thr Thr Arg Ala Glu Thr Gly Met Ala Tyr
65                  70                  75                  80
Arg Asn Leu Gly Lys Ser Gly Leu Arg Val Ser Cys Leu Gly Leu Gly
                85                  90                  95
Thr Trp Val Thr Phe Gly Gly Gln Ile Ser Asp Glu Val Ala Glu Arg
            100                 105                 110
Leu Met Thr Ile Ala Tyr Glu Ser Gly Val Asn Leu Phe Asp Thr Ala
        115                 120                 125
Glu Val Tyr Ala Ala Gly Lys Ala Glu Val Ile Leu Gly Ser Ile Ile
    130                 135                 140
Lys Lys Lys Gly Trp Arg Arg Ser Ser Leu Val Ile Thr Thr Lys Leu
145                 150                 155                 160
Tyr Trp Gly Gly Lys Ala Glu Thr Glu Arg Gly Leu Ser Arg Lys His
                165                 170                 175
Ile Ile Glu Gly Leu Lys Gly Ser Leu Gln Arg Leu Gln Leu Glu Tyr
            180                 185                 190
Val Asp Val Val Phe Ala Asn Arg Pro Asp Ser Asn Thr Pro Met Glu
        195                 200                 205
Glu Ile Val Arg Ala Met Thr His Val Ile Asn Gln Gly Met Ala Met
    210                 215                 220
Tyr Trp Gly Thr Ser Arg Trp Ser Ala Met Glu Ile Met Glu Ala Tyr
225                 230                 235                 240
Ser Val Ala Arg Gln Phe Asn Met Ile Pro Pro Val Cys Glu Gln Ala
                245                 250                 255
Glu Tyr His Leu Phe Gln Arg Glu Lys Val Glu Val Gln Leu Pro Glu
            260                 265                 270
Leu Tyr His Lys Ile Gly Val Gly Ala Met Thr Trp Ser Pro Leu Ala
        275                 280                 285
Cys Gly Ile Ile Ser Gly Lys Tyr Gly Asn Gly Val Pro Glu Ser Ser
    290                 295                 300
Arg Ala Ser Leu Lys Cys Tyr Gln Trp Leu Lys Glu Arg Ile Val Ser
305                 310                 315                 320
Glu Glu Gly Arg Lys Gln Gln Asn Lys Leu Lys Asp Leu Ser Pro Ile
                325                 330                 335
Ala Glu Arg Leu Gly Cys Thr Leu Pro Gln Leu Ala Val Ala Trp Cys
            340                 345                 350
Leu Arg Asn Glu Gly Val Ser Ser Val Leu Leu Gly Ser Ser Thr Pro
        355                 360                 365
Glu Gln Leu Ile Glu Asn Leu Gly Ala Ile Gln Val Leu Pro Lys Met
    370                 375                 380
Thr Ser His Val Val Asn Glu Ile Asp Asn Ile Leu Arg Asn Lys Pro
385                 390                 395                 400
Tyr Ser Lys Lys Asp Tyr Arg Ser
                405
<210>31
<211>3744
<212>DNA
<213>人
<400>31
ccacgcgtcc ggtggcggtc gagcgtggcg taggcgaatc ctcggcacta agcatatgga  60
cctcgcggcg gcagcggagc cgggcgccgg cagccagcac ctggaggtcc gcgacgaggt  120
ggccgagaag tgccagaaac tgttcctgga cttcttggag gagtttcaga gcagcgatgg  180
agaaattaaa tacttgcaat tagcagagga actgattcgt cctgagagaa acacattggt  240
tgtgagtttt gtggacctgg aacaatttaa ccagcaactt tccaccacca ttcaagagga  300
gttctataga gtttaccctt acctgtgtcg ggccttgaaa acattcgtca aagaccgtaa  360
agagatccct cttgccaagg atttttatgt tgcattccaa gacctgccta ccagacacaa  420
gattcgagag ctcacctcat ccagaattgg tttgctcact cgcatcagtg ggcaggtggt  480
gcggactcac ccagttcacc cagagcttgt gagcggaact tttctgtgct tggactgtca  540
gacagtgatc agggatgtag aacagcagtt caaatacaca cagccaaaca tctgccgaaa  600
tccagtttgt gccaacagga ggagattctt actggataca aataaatcaa gatttgttga  660
ttttcaaaag gttcgtattc aagagaccca agctgagctt cctcgaggga gtatcccccg  720
cagtttagaa gtaattttaa gggctgaagc tgtggaatca gctcaagctg gtgacaagtg  780
tgactttaca gggacactga ttgttgtgcc tgacgtctcc aagcttagca caccaggagc  840
acgtgcagaa actaattccc gtgtcagtgg tgttgatgga tatgagacag aaggcattcg  900
aggactccgg gcccttggtg ttagggacct ttcttatagg ctggtctttc ttgcctgctg  960
tgttgcgcca accaacccaa ggtttggggg gaaagagctc agagatgagg aacagacagc  1020
tgagagcatt aagaaccaaa tgactgtgaa agaatgggag aaagtgtttg agatgagtca  1080
agataaaaat ctataccaca atctttgtac cagcctgttc cctactatac atggcaatga  1140
tgaagtaaaa cggggtgtcc tgctgatgct ctttggtggc gttccaaaga caacaggaga  1200
agggacctct cttcgagggg acataaatgt ttgcattgtt ggtgacccaa gtacagctaa  1260
gagccaattt ctcaagcacg tggaggagtt cagccccaga gctgtctaca ccagtggtaa  1320
agcgtccagt gctgctggct taacagcagc tgttgtgaga gatgaagaat ctcatgagtt  1380
tgtcattgag gctggagctt tgatgttggc tgataatggt gtgtgttgta ttgatgaatt  1440
tgataagatg gacgtgcggg atcaagttgc tattcatgaa gctatggaac agcagaccat  1500
atccatcact aaagcaggag tgaaggctac tctgaacgcc cggacgtcca ttttggcagc  1560
agcaaaccca atcagtggac actatgacag atcaaaatca ttgaaacaga atataaattt  1620
gtcagctccc atcatgtccc gattcgatct cttctttatc cttgtggatg aatgtaatga  1680
ggttacagat tatgccattg ccaggcgcat agtagatttg cattcaagaa ttgaggaatc  1740
aattgatcgt gtctattccc tcgatgatat cagaagatat cttctctttg caagacagtt  1800
taaacccaag atttccaaag agtcagagga cttcattgtg gagcaatata aacatctccg  1860
ccagagagat ggttctggag tgaccaagtc ttcatggagg attacagtgc gacagcttga  1920
gagcatgatt cgtctctctg aagctatggc tcggatgcac tgctgtgatg aggtccaacc  1980
taaacatgtg aaggaagctt tccggttact gaataaatca atcatccgtg tggaaacacc  2040
tgatgtcaat ctagatcaag aggaagagat ccagatggag gtagatgagg gtgccggtgg  2100
catcaatggt catgctgaca gccctgctcc tgtgaacggg atcaatggct acaatgaaga  2160
cataaatcaa gagtctgctc ccaaagcctc cttaaggctg ggcttctctg agtactgccg  2220
aatctctaac cttattgtgc ttcacctcag aaaggtggaa gaagaagagg acgagtcagc  2280
attaaagagg agcgagcttg ttaactggta cttgaaggaa atcgaatcag agatagactc  2340
tgaagaagaa cttataaata aaaaaagaat catagagaaa gttattcatc gactcacaca  2400
ctatgatcat gttctaattg agctcaccca ggctggattg aaaggctcca cagagggaag  2460
tgagagctat gaagaagatc cctacttggt agttaaccct aactacttgc tcgaagattg  2520
agatagtgaa agtaactgac cagagctgag gaactgtggc acagcacctc gtggcctgga  2580
gcctggctgg agctctgcta gggacagaag tgtttctgga agtgatgctt ccaggatttg  2640
ttttcagaaa caagaattga gttgatggtc ctatgtgtca cattcatcac aggtttcata  2700
ccaacacagg cttcagcact tcctttggtg tgtttcctgt cccagtgaag ttggaaccaa  2760
ataatgtgta gtctctataa ccaatacctt tgttttcatg tgtaagaaaa ggcccattac  2820
ttttaaggta tgtgctgtcc tattgagcaa ataacttttt ttcaattgcc agctactgct  2880
tttattcatc aaaataaaat aacttgttct gaagttgtct attggatttc tttctactgt  2940
accctgatta ttacttccat ctacttctga atgtgagact ttcccttttt gcttaacctg  3000
gagtgaagag gtagaactgt ggtattatgg atgaggtttc tatgagaagg agtcattaga  3060
gaactcatat gaaagctaga ggccttagag atgactttcc aaggttaatt ccagtttttt  3120
ttttttttaa gtttataaaa gtttattata cttttttaaa attactcttt agtaatttat  3180
tttacttctg tgtcctaagg gtaatttctc aggattgttt tcaaattgct tttttagggg  3240
aaataggtca tttgctatat tacaagcaat ccccaaattt tatggtcttc caggaaaagt  3300
tattaccgtt tatgatacta acagttcctg agacttagct atgatcagta tgttcatgag  3360
gtggagcagt tcctgtgttg cagcttttaa caacagatgg cattcattaa atcacaaagt  3420
atgttaaagg tcacaaaagc aaaataactg tctgaggcta aggcccacgt gggacagtct  3480
aatacccatg agtactcaac ttgccttgat gtctgagctt tccagtgcaa tgtgaatttg  3540
agcagccaga aatctattag tagaaagcaa gacagattaa tataggttaa aacaatgatt  3600
taaatatgtt tctcccaata attatctctt tccctggaat caacttgtat gaaaccttgt  3660
caaaatgtac tccacaagta tgtacaatta agtattttaa aaataaatgg caaacattaa  3720
aaaaaaaaaa aaaaaaaaaa aaaa                                         3744
<210>32
<211>821
<212>PRT
<213>人
<400>32
Met Asp Leu Ala Ala Ala Ala Glu Pro Gly Ala Gly Ser Gln His Leu
 1               5                  10                  15
Glu Val Arg Asp Glu Val Ala Glu Lys Cys Gln Lys Leu Phe Leu Asp
            20                  25                  30
Phe Leu Glu Glu Phe Gln Ser Ser Asp Gly Glu Ile Lys Tyr Leu Gln
        35                  40                  45
Leu Ala Glu Glu Leu Ile Arg Pro Glu Arg Asn Thr Leu Val Val Ser
    50                  55                  60
Phe Val Asp Leu Glu Gln Phe Asn Gln Gln Leu Ser Thr Thr Ile Gln
65                  70                  75                  80
Glu Glu Phe Tyr Arg Val Tyr Pro Tyr Leu Cys Arg Ala Leu Lys Thr
                85                  90                  95
Phe Val Lys Asp Arg Lys Glu Ile Pro Leu Ala Lys Asp Phe Tyr Val
            100                 105                 110
Ala Phe Gln Asp Leu Pro Thr Arg His Lys Ile Arg Glu Leu Thr Ser
        115                 120                 125
Ser Arg Ile Gly Leu Leu Thr Arg Ile Ser Gly Gln Val Val Arg Thr
    130                 135                 140
His Pro Val His Pro Glu Leu Val Ser Gly Thr Phe Leu Cys Leu Asp
145                 150                 155                 160
Cys Gln Thr Val Ile Arg Asp Val Glu Gln Gln Phe Lys Tyr Thr Gln
                165                 170                 175
Pro Asn Ile Cys Arg Asn Pro Val Cys Ala Asn Arg Arg Arg Phe Leu
            180                 185                 190
Leu Asp Thr Asn Lys Ser Arg Phe Val Asp Phe Gln Lys Val Arg Ile
        195                 200                 205
Gln Glu Thr Gln Ala Glu Leu Pro Arg Gly Ser Ile Pro Arg Ser Leu
    210                 215                 220
Glu Val Ile Leu Arg Ala Glu Ala Val Glu Ser Ala Gln Ala Gly Asp
225                 230                 235                 240
Lys Cys Asp Phe Thr Gly Thr Leu Ile Val Val Pro Asp Val Ser Lys
                245                 250                 255
Leu Ser Thr Pro Gly Ala Arg Ala Glu Thr Asn Ser Arg Val Ser Gly
            260                 265                 270
Val Asp Gly Tyr Glu Thr Glu Gly Ile Arg Gly Leu Arg Ala Leu Gly
        275                 280                 285
Val Arg Asp Leu Ser Tyr Arg Leu Val Phe Leu Ala Cys Cys Val Ala
    290                 295                 300
Pro Thr Asn Pro Arg Phe Gly Gly Lys Glu Leu Arg Asp Glu Glu Gln
305                 310                 315                 320
Thr Ala Glu Ser Ile Lys Asn Gln Met Thr Val Lys Glu Trp Glu Lys
                325                 330                 335
Val Phe Glu Met Ser Gln Asp Lys Asn Leu Tyr His Asn Leu Cys Thr
            340                 345                 350
Ser Leu Phe Pro Thr Ile His Gly Asn Asp Glu Val Lys Arg Gly Val
        355                 360                 365
Leu Leu Met Leu Phe Gly Gly Val Pro Lys Thr Thr Gly Glu Gly Thr
    370                 375                 380
Ser Leu Arg Gly Asp Ile Asn Val Cys Ile Val Gly Asp Pro Ser Thr
385                 390                 395                 400
Ala Lys Ser Gln Phe Leu Lys His Val Glu Glu Phe Ser Pro Arg Ala
                405                 410                 415
Val Tyr Thr Ser Gly Lys Ala Ser Ser Ala Ala Gly Leu Thr Ala Ala
            420                 425                 430
Val Val Arg Asp Glu Glu Ser His Glu Phe Val Ile Glu Ala Gly Ala
        435                 440                 445
Leu Met Leu Ala Asp Asn Gly Val Cys Cys Ile Asp Glu Phe Asp Lys
    450                 455                 460
Met Asp Val Arg Asp Gln Val Ala Ile His Glu Ala Met Glu Gln Gln
465                 470                 475                 480
Thr Ile Ser Ile Thr Lys Ala Gly Val Lys Ala Thr Leu Asn Ala Arg
                485                 490                 495
Thr Ser Ile Leu Ala Ala Ala Asn Pro Ile Ser Gly His Tyr Asp Arg
    500                 505                 510
Ser Lys Ser Leu Lys Gln Asn Ile Asn Leu Ser Ala Pro Ile Met Ser
        515                 520                 525
Arg Phe Asp Leu Phe Phe Ile Leu Val Asp Glu Cys Asn Glu Val Thr
    530                 535                 540
Asp Tyr Ala Ile Ala Arg Arg Ile Val Asp Leu His Ser Arg Ile Glu
545                 550                 555                 560
Glu Ser Ile Asp Arg Val Tyr Ser Leu Asp Asp Ile Arg Arg Tyr Leu
                565                 570                 575
Leu Phe Ala Arg Gln Phe Lys Pro Lys Ile Ser Lys Glu Ser Glu Asp
            580                 585                 590
Phe Ile Val Glu Gln Tyr Lys His Leu Arg Gln Arg Asp Gly Ser Gly
        595                 600                 605
Val Thr Lys Ser Ser Trp Arg Ile Thr Val Arg Gln Leu Glu Ser Met
    610                 615                 620
Ile Arg Leu Ser Glu Ala Met Ala Arg Met His Cys Cys Asp Glu Val
625                 630                 635                 640
Gln Pro Lys His Val Lys Glu Ala Phe Arg Leu Leu Asn Lys Ser Ile
                645                 650                 655
Ile Arg Val Glu Thr Pro Asp Val Asn Leu Asp Gln Glu Glu Glu Ile
            660                 665                 670
Gln Met Glu Val Asp Glu Gly Ala Gly Gly Ile Asn Gly His Ala Asp
        675                 680                 685
Ser Pro Ala Pro Val Asn Gly Ile Asn Gly Tyr Asn Glu Asp Ile Asn
    690                 695                 700
Gln Glu Ser Ala Pro Lys Ala Ser Leu Arg Leu Gly Phe Ser Glu Tyr
705                 710                 715                 720
Cys Arg Ile Ser Asn Leu Ile Val Leu His Leu Arg Lys Val Glu Glu
                725                 730                 735
Glu Glu Asp Glu Ser Ala Leu Lys Arg Ser Glu Leu Val Asn Trp Tyr
            740                 745                 750
Leu Lys Glu Ile Glu Ser Glu Ile Asp Ser Glu Glu Glu Leu Ile Asn
        755                 760                 765
Lys Lys Arg Ile Ile Glu Lys Val Ile His Arg Leu Thr His Tyr Asp
    770                 775                 780
His Val Leu Ile Glu Leu Thr Gln Ala Gly Leu Lys Gly Ser Thr Glu
785                 790                 795                 800
Gly Ser Glu Ser Tyr Glu Glu Asp Pro Tyr Leu Val Val Asn Pro Asn
                805                 810                 815
Tyr Leu Leu Glu Asp
            820
<210>33
<211>2111
<212>DNA
<213>人
<400>33
ggccggccac tcccgtctgc tgtgacgcgc ggacagagag ctaccggtgg acccacggtg  60
cctccctccc tgggatctac acagaccatg gccttgccaa cggctcgacc cctgttgggg  120
tcctgtggga cccccgccct cggcagcctc ctgttcctgc tcttcagcct cggatgggtg  180
cagccctcga ggaccctggc tggagagaca gggcaggagg ctgcacccct ggacggagtc  240
ctggccaacc cacctaacat ttccagcctc tcccctcgcc aactccttgg cttcccgtgt  300
gcggaggtgt ccggcctgag cacggagcgt gtccgggagc tggctgtggc cttggcacag  360
aagaatgtca agctctcaac agagcagctg cgctgtctgg ctcaccggct ctctgagccc  420
cccgaggacc tggacgccct cccattggac ctgctgctat tcctcaaccc agatgcgttc  480
tcggggcccc aggcctgcac ccgtttcttc tcccgcatca cgaaggccaa tgtggacctg  540
ctcccgaggg gggctcccga gcgacagcgg ctgctgcctg cggctctggc ctgctggggt  600
gtgcgggggt ctctgctgag cgaggctgat gtgcgggctc tgggaggcct ggcttgcgac  660
ctgcctgggc gctttgtggc cgagtcggcc gaagtgctgc taccccggct ggtgagctgc  720
ccgggacccc tggaccagga ccagcaggag gcagccaggg cggctctgca gggcggggga  780
cccccctacg gccccccgtc gacatggtct gtctccacga tggacgctct gcggggcctg  840
ctgcccgtgc tgggccagcc catcatccgc agcatcccgc agggcatcgt ggccgcgtgg  900
cggcaacgct cctctcggga cccatcctgg cggcagcctg aacggaccat cctccggccg  960
cggttccggc gggaagtgga gaagacagcc tgtccttcag gcaagaaggc ccgcgagata  1020
gacgagagcc tcatcttcta caagaagtgg gagctggaag cctgcgtgga tgcggccctg  1080
ctggccaccc agatggaccg cgtgaacgcc atccccttca cctacgagca gctggacgtc  1140
ctaaagcata aactggatga gctctaccca caaggttacc ccgagtctgt gatccagcac  1200
ctgggctacc tcttcctcaa gatgagccct gaggacattc gcaagtggaa tgtgacgtcc  1260
ctggagaccc tgaaggcttt gcttgaagtc aacaaagggc acgaaatgag tcctcaggtg  1320
gccaccctga tcgaccgctt tgtgaaggga aggggccagc tagacaaaga caccctagac  1380
accctgaccg ccttctaccc tgggtacctg tgctccctca gccccgagga gctgagctcc  1440
gtgcccccca gcagcatctg ggcggtcagg ccccaggacc tggacacgtg tgacccaagg  1500
cagctggacg tcctctatcc caaggcccgc cttgctttcc agaacatgaa cgggtccgaa  1560
tacttcgtga agatccagtc cttcctgggt ggggccccca cggaggattt gaaggcgctc  1620
agtcagcaga atgtgagcat ggacttggcc acgttcatga agctgcggac ggatgcggtg  1680
ctgccgttga ctgtggctga ggtgcagaaa cttctgggac cccacgtgga gggcctgaag  1740
gcggaggagc ggcaccgccc ggtgcgggac tggatcctac ggcagcggca ggacgacctg  1800
gacacgctgg ggctggggct acagggcggc atccccaacg gctacctggt cctagacctc  1860
agcgtgcaag aggccctctc ggggacgccc tgcctcctag gacctggacc tgttctcacc  1920
gtcctggcac tgctcctagc ctccaccctg gcctgagggc cccactccct tgctggcccc  1980
agccctgctg gggatccccg cctggccagg agcaggcacg ggtgatcccc gttccacccc  2040
aagagaactc gcgctcagta aacgggaaca tgccccctgc agacacgtaa aaaaaaaaaa  2100
aaaaaaaaaa a                                                       2111
<210>34
<211>622
<212>PRT
<213>人
<400>34
Met Ala Leu Pro Thr Ala Arg Pro Leu Leu Gly Ser Cys Gly Thr Pro
 1               5                  10                  15
Ala Leu Gly Ser Leu Leu Phe Leu Leu Phe Ser Leu Gly Trp Val Gln
            20                  25                  30
Pro Ser Arg Thr Leu Ala Gly Glu Thr Gly Gln Glu Ala Ala Pro Leu
        35                  40                  45
Asp Gly Val Leu Ala Asn Pro Pro Asn Ile Ser Ser Leu Ser Pro Arg
    50                  55                  60
Gln Leu Leu Gly Phe Pro Cys Ala Glu Val Ser Gly Leu Ser Thr Glu
65                  70                  75                  80
Arg Val Arg Glu Leu Ala Val Ala Leu Ala Gln Lys Asn Val Lys Leu
                85                  90                  95
Ser Thr Glu Gln Leu Arg Cys Leu Ala His Arg Leu Ser Glu Pro Pro
            100                 105                 110
Glu Asp Leu Asp Ala Leu Pro Leu Asp Leu Leu Leu Phe Leu Asn Pro
        115                 120                 125
Asp Ala Phe Ser Gly Pro Gln Ala Cys Thr Arg Phe Phe Ser Arg Ile
    130                 135                 140
Thr Lys Ala Asn Val Asp Leu Leu Pro Arg Gly Ala Pro Glu Arg Gln
145                 150                 155                 160
Arg Leu Leu Pro Ala Ala Leu Ala Cys Trp Gly Val Arg Gly Ser Leu
                165                 170                 175
Leu Ser Glu Ala Asp Val Arg Ala Leu Gly Gly Leu Ala Cys Asp Leu
            180                 185                 190
Pro Gly Arg Phe Val Ala Glu Ser Ala Glu Val Leu Leu Pro Arg Leu
        195                 200                 205
Val Ser Cys Pro Gly Pro Leu Asp Gln Asp Gln Gln Glu Ala Ala Arg
    210                 215                 220
Ala Ala Leu Gln Gly Gly Gly Pro Pro Tyr Gly Pro Pro Ser Thr Trp
225                 230                 235                 240
Ser Val Ser Thr Met Asp Ala Leu Arg Gly Leu Leu Pro Val Leu Gly
                245                 250                 255
Gln Pro Ile Ile Arg Ser Ile Pro Gln Gly Ile Val Ala Ala Trp Arg
            260                 265                 270
Gln Arg Ser Ser Arg Asp Pro Ser Trp Arg Gln Pro Glu Arg Thr Ile
        275                 280                 285
Leu Arg Pro Arg Phe Arg Arg Glu Val Glu Lys Thr Ala Cys Pro Ser
    290                 295                 300
Gly Lys Lys Ala Arg Glu Ile Asp Glu Ser Leu Ile Phe Tyr Lys Lys
305                 310                 315                 320
Trp Glu Leu Glu Ala Cys Val Asp Ala Ala Leu Leu Ala Thr Gln Met
                325                 330                 335
Asp Arg Val Asn Ala Ile Pro Phe Thr Tyr Glu Gln Leu Asp Val Leu
            340                 345                 350
Lys His Lys Leu Asp Glu Leu Tyr Pro Gln Gly Tyr Pro Glu Ser Val
        355                 360                 365
Ile Gln His Leu Gly Tyr Leu Phe Leu Lys Met Ser Pro Glu Asp Ile
    370                 375                 380
Arg Lys Trp Asn Val Thr Ser Leu Glu Thr Leu Lys Ala Leu Leu Glu
385                 390                 395                 400
Val Asn Lys Gly His Glu Met Ser Pro Gln Val Ala Thr Leu Ile Asp
                405                 410                 415
Arg Phe Val Lys Gly Arg Gly Gln Leu Asp Lys Asp Thr Leu Asp Thr
            420                 425                 430
Leu Thr Ala Phe Tyr Pro Gly Tyr Leu Cys Ser Leu Ser Pro Glu Glu
        435                 440                 445
Leu Ser Ser Val Pro Pro Ser Ser Ile Trp Ala Val Arg Pro Gln Asp
    450                 455                 460
Leu Asp Thr Cys Asp Pro Arg Gln Leu Asp Val Leu Tyr Pro Lys Ala
465                 470                 475                 480
Arg Leu Ala Phe Gln Asn Met Asn Gly Ser Glu Tyr Phe Val Lys Ile
                485                 490                 495
Gln Ser Phe Leu Gly Gly Ala Pro Thr Glu Asp Leu Lys Ala Leu Ser
            500                 505                 510
Gln Gln Asn Val Ser Met Asp Leu Ala Thr Phe Met Lys Leu Arg Thr
        515                 520                 525
Asp Ala Val Leu Pro Leu Thr Val Ala Glu Val Gln Lys Leu Leu Gly
    530                 535                 540
Pro His Val Glu Gly Leu Lys Ala Glu Glu Arg His Arg Pro Val Arg
545                 550                 555                 560
Asp Trp Ile Leu Arg Gln Arg Gln Asp Asp Leu Asp Thr Leu Gly Leu
                565                 570                 575
Gly Leu Gln Gly Gly Ile Pro Asn Gly Tyr Leu Val Leu Asp Leu Ser
            580                 585                 590
Val Gln Glu Ala Leu Ser Gly Thr Pro Cys Leu Leu Gly Pro Gly Pro
        595                 600                 605
Val Leu Thr Val Leu Ala Lau Leu Leu Ala Ser Thr Leu Ala
    610                 615                 620
<210>35
<211>2731
<212>DNA
<213>人
<400>35
gcgcttggcg ggagatagaa aagtgcttca acccgcgccg gcggcgactg cagttcctgc  60
gagcgaggag cgcgggacct gctgacacgc tgacgccttc gagcgcggcc cggggcccgg  120
agcggccgga gcagcccggg tcctgacccc ggcccggctc ccgctccggg ctctgccggc  180
gggcgggcga gcgcggcgcg gtccgggccg gggggatgtc tcggcggacg cgctgcgagg  240
atctggatga gctgcactac caggacacag attcagatgt gccggagcag agggatagca  300
agtgcaaggt caaatggacc catgaggagg acgagcagct gagggccctg gtgaggcagt  360
ttggacagca ggactggaag ttcctggcca gccacttccc taaccgcact gaccagcaat  420
gccagtacag gtggctgaga gttttgaatc cagaccttgt caaggggcca tggaccaaag  480
aggaagacca aaaagtcatc gagctggtta agaagtatgg cacaaagcag tggacactga  540
ttgccaagca cctgaagggc cggctgggga agcagtgccg tgaacgctgg cacaaccacc  600
tcaaccctga ggtgaagaag tcttgctgga ccgaggagga ggaccgcatc atctgcgagg  660
cccacaaggt gctgggcaac cgctgggccg agatcgccaa gatgttgcca gggaggacag  720
acaatgctgt gaagaatcac tggaactcta ccatcaaaag gaaggtggac acaggaggct  780
tcttgagcga gtccaaagac tgcaagcccc cagtgtactt gctgctggag ctcgaggaca  840
aggacggcct ccagagtgcc cagcccacgg aaggccaggg aagtcttctg accaactggc  900
cctccgtccc tcctaccata aaggaggagg aaaacagtga ggaggaactt gcagcagcca  960
ccacatcgaa ggaacaggag cccatcggta cagatctgga cgcagtgcga acaccagagc  1020
ccttggagga attcccgaag cgtgaggacc aggaaggctc cccaccagaa acgagcctgc  1080
cttacaagtg ggtggtggag gcagctaacc tcctcatccc cgctgtgggt tctagcctct  1140
ctgaagccct ggacttgatc gagtcggacc ctgatgcttg gtgtgacctg agtaaatttg  1200
acctccctga ggaaccatct gcagaggaca gtatcaacaa cagcctagtg cagctgcaag  1260
cgtcacatca gcagcaagtc ctgccacccc gccagccttc cgccctggtg cccagtgtga  1320
ccgagtaccg cctggatggc cacaccatct cagacctgag ccggagcagc cggggcgagc  1380
tgatccccat ctcccccagc actgaagtcg ggggctctgg cattggcaca ccgccctctg  1440
tgctcaagcg gcagaggaag aggcgtgtgg ctctgtcccc tgtcactgag aatagcacca  1500
gtctgtcctt cctggattcc tgtaacagcc tcacgcccaa gagcacacct gttaagaccc  1560
tgcccttctc gccctcccag tttctgaact tctggaacaa acaggacaca ttggagctgg  1620
agagcccctc gctgacatcc accccagtgt gcagccagaa ggtggtggtc accacaccac  1680
tgcaccggga caagacaccc ctgcaccaga aacatgctgc gtttgtaacc ccagatcaga  1740
agtactccat ggacaacact ccccacacgc caaccccgtt caagaacgcc ctggagaagt  1800
acggacccct gaagcccctg ccacagaccc cgcacctgga ggaggacttg aaggaggtgc  1860
tgcgttctga ggctggcatc gaactcatca tcgaggacga catcaggccc gagaagcaga  1920
agaggaagcc tgggctgcgg cggagcccca tcaagaaagt ccggaagtct ctggctcttg  1980
acattgtgga tgaggatgtg aagctgatga tgtccacact gcccaagtct ctatccttgc  2040
cgacaactgc cccttcaaac tcttccagcc tcaccctgtc aggtatcaaa gaagacaaca  2100
gcttgctcaa ccagggcttc ttgcaggcca agcccgagaa ggcagcagtg gcccagaagc  2160
cccgaagcca cttcacgaca cctgccccta tgtccagtgc ctggaagacg gtggcctgcg  2220
gggggaccag ggaccagctt ttcatgcagg agaaagcccg gcagctcctg ggccgcctga  2280
agcccagcca cacatctcgg accctcatct tgtcctgagg tgttgagggt gtcacgagcc  2340
cattctcatg tttacagggg ttgtgggggc agagggggtc tgtgaatctg agagtcattc  2400
aggtgacctc ctgcagggag ccttctgcca ccagcccctc cccagactct caggtggagg  2460
caacagggcc atgtgctgcc ctgttgccga gcccagctgt gggcggctcc tggtgctaac  2520
aacaaagttc cacttccagg tctgcctggt tccctcccca aggccacagg gagctccgtc  2580
agcttctccc aagcccacgt caggcctggc ctcatctcag accctgctta ggatggggga  2640
tgtggccagg ggtgctcctg tgctcaccct ctcttggtgc atttttttgg aagaataaaa  2700
ttgcctctct cttaaaaaaa aaaaaaaaaa a                                 2731
<210>36
<211>700
<212>PRT
<213>人
<400>36
Met Ser Arg Arg Thr Arg Cys Glu Asp Leu Asp Glu Leu His Tyr Gln
 1               5                  10                  15
Asp Thr Asp Ser Asp Val Pro Glu Gln Arg Asp Ser Lys Cys Lys Val
            20                  25                  30
Lys Trp Thr His Glu Glu Asp Glu Gln Leu Arg Ala Leu Val Arg Gln
        35                  40                  45
Phe Gly Gln Gln Asp Trp Lys Phe Leu Ala Ser His Phe Pro Asn Arg
    50                  55                  60
Thr Asp Gln Gln Cys Gln Tyr Arg Trp Leu Arg Val Leu Asn Pro Asp
65                  70                  75                  80
Leu Val Lys Gly Pro Trp Thr Lys Glu Glu Asp Gln Lys Val Ile Glu
                85                  90                  95
Leu Val Lys Lys Tyr Gly Thr Lys Gln Trp Thr Leu Ile Ala Lys His
            100                 105                 110
Leu Lys Gly Arg Leu Gly Lys Gln Cys Arg Glu Arg Trp His Asn His
        115                 120                 125
Leu Asu Pro Glu Val Lys Lys Ser Cys Trp Thr Glu Glu Glu Asp Arg
    130                 135                 140
Ile Ile Cys Glu Ala His Lys Val Leu Gly Asn Arg Trp Ala Glu Ile
145                 150                 155                 160
Ala Lys Met Leu Pro Gly Arg Thr Asp Asn Ala Val Lys Asn His Trp
                165                 170                 175
Asn Ser Thr Ile Lys Arg Lys Val Asp Thr Gly Gly Phe Leu Ser Glu
            180                 185                 190
Ser Lys Asp Cys Lys Pro Pro Val Tyr Leu Leu Leu Glu Leu Glu Asp
        195                 200                 205
Lys Asp Gly Leu Gln Ser Ala Gln Pro Thr Glu Gly Gln Gly Ser Leu
    210                 215                 220
Leu Thr Asn Trp Pro Ser Val Pro Pro Thr Ile Lys Glu Glu Glu Asn
225                 230                 235                 240
Ser Glu Glu Glu Leu Ala Ala Ala Thr Thr Ser Lys Glu Gln Glu Pro
                245                 250                 255
Ile Gly Thr Asp Leu Asp Ala Val Arg Thr Pro Glu Pro Leu Glu Glu
            260                 265                 270
Phe Pro Lys Arg Glu Asp Gln Glu Gly Ser Pro Pro Glu Thr Ser Leu
        275                 280                 285
Pro Tyr Lys Trp Val Val Glu Ala Ala Asn Leu Leu Ile Pro Ala Val
    290                 295                 300
Gly Ser Ser Leu Ser Glu Ala Leu Asp Leu Ile Glu Ser Asp Pro Asp
305                 310                 315                 320
Ala Trp Cys Asp Leu Ser Lys Phe Asp Leu Pro Glu Glu Pro Ser Ala
                325                 330                 335
Glu Asp Ser Ile Asn Asn Ser Leu Val Gln Leu Gln Ala Ser His Gln
            340                 345                 350
Gln Gln Val Leu Pro Pro Arg Gln Pro Ser Ala Leu Val Pro Ser Val
        355                 360                 365
Thr Glu Tyr Arg Leu Asp Gly His Thr Ile Ser Asp Leu Ser Arg Ser
    370                 375                 380
Ser Arg Gly Glu Leu Ile Pro Ile Ser Pro Ser Thr Glu Val Gly Gly
385                 390                 395                 400
Ser Gly Ile Gly Thr Pro Pro Ser Val Leu Lys Arg Gln Arg Lys Arg
                405                 410                 415
Arg Val Ala Leu Ser Pro Val Thr Glu Asn Ser Thr Ser Leu Ser Phe
            420                 425                 430
Leu Asp Ser Cys Asn Ser Leu Thr Pro Lys Ser Thr Pro Val Lys Thr
        435                 440                 445
Leu Pro Phe Ser Pro Ser Gln Phe Leu Asn Phe Trp Asn Lys Gln Asp
    450                 455                 460
Thr Leu Glu Leu Glu Ser Pro Ser Leu Thr Ser Thr Pro Val Cys Ser
465                 470                 475                 480
Gln Lys Val Val Val Thr Thr Pro Leu His Arg Asp Lys Thr Pro Leu
                485                 490                 495
His Gln Lys His Ala Ala Phe Val Thr Pro Asp Gln Lys Tyr Ser Met
            500                 505                 510
Asp Asn Thr Pro His Thr Pro Thr Pro Phe Lys Asn Ala Leu Glu Lys
        515                 520                 525
Tyr Gly Pro Leu Lys Pro Leu Pro Gln Thr Pro His Leu Glu Glu Asp
    530                 535                 540
Leu Lys Glu Val Leu Arg Ser Glu Ala Gly Ile Glu Leu Ile Ile Glu
545                 550                 555                 560
Asp Asp Ile Arg Pro Glu Lys Gln Lys Arg Lys Pro Gly Leu Arg Arg
                565                 570                 575
Ser Pro Ile Lys Lys Val Arg Lys Ser Leu Ala Leu Asp Ile Val Asp
            580                 585                 590
Glu Asp Val Lys Leu Met Met Ser Thr Leu Pro Lys Ser Leu Ser Leu
        595                 600                 605
Pro Thr Thr Ala Pro Ser Asn Ser Ser Ser Leu Thr Leu Ser Gly Ile
    610                 615                 620
Lys Glu Asp Asn Ser Leu Leu Asn Gln Gly Phe Leu Gln Ala Lys Pro
625                 630                 635                 640
Glu Lys Ala Ala Val Ala Gln Lys Pro Arg Ser His Phe Thr Thr Pro
                645                 650                 655
Ala Pro Met Ser Ser Ala Trp Lys Thr Val Ala Cys Gly Gly Thr Arg
            660                 665                 670
Asp Gln Leu Phe Met Gln Glu Lys Ala Arg Gln Leu Leu Gly Arg Leu
        675                 680                 685
Lys Pro Ser His Thr Ser Arg Thr Leu Ile Leu Ser
    690                 695                 700
<210>37
<211>2304
<212>DNA
<213>人
<400>37
gtccccgcag cgccgtcgcg ccctcctgcc gcaggccacc gaggccgccg ccgtctagcg  60
ccccgacctc gccaccatga gagccctgct ggcgcgcctg cttctctgcg tcctggtcgt  120
gagcgactcc aaaggcagca atgaacttca tcaagttcca tcgaactgtg actgtctaaa  180
tggaggaaca tgtgtgtcca acaagtactt ctccaacatt cactggtgca actgcccaaa  240
gaaattcgga gggcagcact gtgaaataga taagtcaaaa acctgctatg aggggaatgg  300
tcacttttac cgaggaaagg ccagcactga caccatgggc cggccctgcc tgccctggaa  360
ctctgccact gtccttcagc aaacgtacca tgcccacaga tctgatgctc ttcagctggg  420
cctggggaaa cataattact gcaggaaccc agacaaccgg aggcgaccct ggtgctatgt  480
gcaggtgggc ctaaagccgc ttgtccaaga gtgcatggtg catgactgcg cagatggaaa  540
aaagccctcc tctcctccag aagaattaaa atttcagtgt ggccaaaaga ctctgaggcc  600
ccgctttaag attattgggg gagaattcac caccatcgag aaccagccct ggtttgcggc  660
catctacagg aggcaccggg ggggctctgt cacctacgtg tgtggaggca gcctcatcag  720
cccttgctgg gtgatcagcg ccacacactg cttcattgat tacccaaaga aggaggacta  780
catcgtctac ctgggtcgct caaggcttaa ctccaacacg caaggggaga tgaagtttga  840
ggtggaaaac ctcatcctac acaaggacta cagcgctgac acgcttgctc accacaacga  900
cattgccttg ctgaagatcc gttccaagga gggcaggtgt gcgcagccat cccggactat  960
acagaccatc tgcctgccct cgatgtataa cgatccccag tttggcacaa gctgtgagat  1020
cactggcttt ggaaaagaga attctaccga ctatctctat ccggagcagc tgaaaatgac  1080
tgttgtgaag ctgatttccc accgggagtg tcagcagccc cactactacg gctctgaagt  1140
caccaccaaa atgctatgtg ctgctgaccc ccaatggaaa acagattcct gccagggaga  1200
ctcaggggga cccctcgtct gttccctcca aggccgcatg actttgactg gaattgtgag  1260
ctggggccgt ggatgtgccc tgaaggacaa gccaggcgtc tacacgagag tctcacactt  1320
cttaccctgg atccgcagtc acaccaagga agagaatggc ctggccctct gagggtcccc  1380
agggaggaaa cgggcaccac ccgctttctt gctggttgtc atttttgcag tagagtcatc  1440
tccatcagct gtaagaagag actgggaaga taggctctgc acagatggat ttgcctgtgg  1500
caccaccagg gtgaacgaca atagctttac cctcacggat aggcctgggt gctggctgcc  1560
cagaccctct ggccaggatg gaggggtggt cctgactcaa catgttactg accagcaact  1620
tgtctttttc tggactgaag cctgcaggag ttaaaaaggg cagggcatct cctgtgcatg  1680
ggctcgaagg gagagccagc tcccccgacc ggtgggcatt tgtgaggccc atggttgaga  1740
aatgaataat ttcccaatta ggaagtgtaa gcagctgagg tctcttgagg gagcttagcc  1800
aatgtgggag cagcggtttg gggagcagag acactaacga cttcagggca gggctctgat  1860
attccatgaa tgtatcagga aatatatatg tgtgtgtatg tttgcacact tgttgtgtgg  1920
gctgtgagtg taagtgtgag taagagctgg tgtctgattg ttaagtctaa atatttcctt  1980
aaactgtgtg gactgtgatg ccacacagag tggtctttct ggagaggtta taggtcactc  2040
ctggggcctc ttgggtcccc cacgtgacag tgcctgggaa tgtacttatt ctgcagcatg  2100
acctgtgacc agcactgtct cagtttcact ttcacataga tgtccctttc ttggccagtt  2160
atcccttcct tttagcctag ttcatccaat cctcactggg tggggtgagg accactcctt  2220
acactgaata tttatatttc actattttta tttatatttt tgtaatttta aataaaagtg  2280
atcaataaaa tgtgattttt ctga                                         2304
<210>38
<211>431
<212>PRT
<213>人
<400>38
Met Arg Ala Leu Leu Ala Arg Leu Leu Leu Cys Val Leu Val Val Ser
 1               5                  10                  15
Asp Ser Lys Gly Ser Asn Glu Leu His Gln Val Pro Ser Asn Cys Asp
            20                  25                  30
Cys Leu Asn Gly Gly Thr Cys Val Ser Asn Lys Tyr Phe Ser Asn Ile
        35                  40                  45
His Trp Cys Asn Cys Pro Lys Lys Phe Gly Gly Gln His Cys Glu Ile
    50                  55                  60
Asp Lys Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly
65                  70                  75                  80
Lys Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser
                85                  90                  95
Ala Thr Val Leu Gln Gln Thr Tyr His Ala His Arg Ser Asp Ala Leu
            100                 105                 110
Gln Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg
        115                 120                 125
Arg Arg Pro Trp Cys Tyr Val Gln Val Gly Leu Lys Pro Leu Val Gln
    130                 135                 140
Glu Cys Met Val His Asp Cys Ala Asp Gly Lys Lys Pro Ser Ser Pro
145                 150                 155                 160
Pro Glu Glu Leu Lys Phe Gln Cys Gly Gln Lys Thr Leu Arg Pro Arg
                165                 170                 175
Phe Lys Ile Ile Gly Gly Glu Phe Thr Thr Ile Glu Asn Gln Pro Trp
            180                 185                 190
Phe Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Val Thr Tyr Val
        195                 200                 205
Cys Gly Gly Ser Leu Ile Ser Pro Cys Trp Val Ile Ser Ala Thr His
    210                 215                 220
Cys Phe Ile Asp Tyr Pro Lys Lys Glu Asp Tyr Ile Val Tyr Leu Gly
225                 230                 235                 240
Arg Ser Arg Leu Asn Ser Asn Thr Gln Gly Glu Met Lys Phe Glu Val
                245                 250                 255
Glu Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp Thr Leu Ala His
            260                 265                 270
His Asn Asp Ile Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys
        275                 280                 285
Ala Gln Pro Ser Arg Thr Ile Gln Thr Ile Cys Leu Pro Ser Met Tyr
    290                 295                 300
Asn Asp Pro Gln Phe Gly Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys
305                 310                 315                 320
Glu Asn Ser Thr Asp Tyr Leu Tyr Pro Glu Gln Leu Lys Met Thr Val
                325                 330                 335
Val Lys Leu Ile Ser His Arg Glu Cys Gln Gln Pro His Tyr Tyr Gly
            340                 345                 350
Ser Glu Val Thr Thr Lys Met Leu Cys Ala Ala Asp Pro Gln Trp Lys
        355                 360                 365
Thr Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Cys Ser Leu
    370                 375                 380
Gln Gly Arg Met Thr Leu Thr Gly Ile Val Ser Trp Gly Arg Gly Cys
385                 390                 395                 400
Ala Leu Lys Asp Lys Pro Gly Val Tyr Thr Arg Val Ser His Phe Leu
                405                 410                 415
Pro Trp Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu
            420                 425                 430
<210>39
<211>1760
<212>DNA
<213>人
<400>39
gcagcaggcc aagggggagg tgcgagcgtg gacctgggac gggtctgggc ggctctcggt  60
ggttggcacg ggttcgcaca cccattcaag cggcaggacg cacttgtctt agcagttctc  120
gctgaccgcg ctagctgcgg cttctacgct ccggcactct gagttcatca gcaaacgccc  180
tggcgtctgt cctcaccatg cctagccttt gggaccgctt ctcgtcgtcg tccacctcct  240
cttcgccctc gtccttgccc cgaactccca ccccagatcg gccgccgcgc tcagcctggg  300
ggtcggcgac ccgggaggag gggtttgacc gctccacgag cctggagagc tcggactgcg  360
agtccctgga cagcagcaac agtggcttcg ggccggagga agacacggct tacctggatg  420
gggtgtcgtt gcccgacttc gagctgctca gtgaccctga ggatgaacac ttgtgtgcca  480
acctgatgca gctgctgcag gagagcctgg cccaggcgcg gctgggctct cgacgccctg  540
cgcgcctgct gatgcctagc cagttggtaa gccaggtggg caaagaacta ctgcgcctgg  600
cctacagcga gccgtgcggc ctgcgggggg cgctgctgga cgtctgcgtg gagcagggca  660
agagctgcca cagcgtgggc cagctggcac tcgaccccag cctggtgccc accttccagc  720
tgaccctcgt gctgcgcctg gactcacgac tctggcccaa gatccagggg ctgtttagct  780
ccgccaactc tcccttcctc cctggcttca gccagtccct gacgctgagc actggcttcc  840
gagtcatcaa gaagaagctg tacagctcgg aacagctgct cattgaggag tgttgaactt  900
caacctgagg gggccgacag tgccctccaa gacagagacg actgaacttt tggggtggag  960
actagaggca ggagctgagg gactgattcc agtggttgga aaactgaggc agccacctaa  1020
ggtggaggtg ggggaatagt gtttcccagg aagctcattg agttgtgtgc gggtggctgt  1080
gcattgggga cacatacccc tcagtactgt agcatggaac aaaggcttag gggccaacaa  1140
ggcttccagc tggatgtgtg tgtagcatgt accttattat ttttgttact gacagttaac  1200
agtggtgtga catccagaga gcagctgggc tgctcccgcc ccagcctggc ccagggtgaa  1260
ggaagaggca cgtgctcctc agagcagccg gagggagggg ggaggtcgga ggtcgtggag  1320
gtggtttgtg tatcttactg gtctgaaggg accaagtgtg tttgttgttt gttttgtatc  1380
ttgtttttct gatcggagca tcactactga cctgttgtag gcagctatct tacagacgca  1440
tgaatgtaag agtaggaagg ggtgggtgtc agggatcact tgggatcttt gacacttgaa  1500
aaattacacc tggcagctgc gtttaagcct tcccccatcg tgtactgcag agttgagctg  1560
gcaggggagg ggctgagagg gtgggggctg gaacccctcc ccgggaggag tgccatctgg  1620
gtcttccatc tagaactgtt tacatgaaga taagatactc actgttcatg aatacacttg  1680
atgttcaagt attaagacct atgcaatatt ttttactttt ctaataaaca tgtttgttaa  1740
aacaaaaaaa aaaaaaaaaa                                              1760
<210>40
<211>232
<212>PRT
<213>人
<400>40
Met Pro Ser Leu Trp Asp Arg Phe Ser Ser Ser Ser Thr Ser Ser Ser
 1               5                  10                  15
Pro Ser Ser Leu Pro Arg Thr Pro Thr Pro Asp Arg Pro Pro Arg Ser
            20                  25                  30
Ala Trp Gly Ser Ala Thr Arg Glu Glu Gly Phe Asp Arg Ser Thr Ser
        35                  40                  45
Leu Glu Ser Ser Asp Cys Glu Ser Leu Asp Ser Ser Asn Ser Gly Phe
    50                  55                  60
Gly Pro Glu Glu Asp Thr Ala Tyr Leu Asp Gly Val Ser Leu Pro Asp
65                  70                  75                  80
Phe Glu Leu Leu Ser Asp Pro Glu Asp Glu His Leu Cys Ala Asn Leu
                85                  90                  95
Met Gln Leu Leu Gln Glu Ser Leu Ala Gln Ala Arg Leu Gly Ser Arg
            100                 105                 110
Arg Pro Ala Arg Leu Leu Met Pro Ser Gln Leu Val Ser Gln Val Gly
        115                 120                 125
Lys Glu Leu Leu Arg Leu Ala Tyr Ser Glu Pro Cys Gly Leu Arg Gly
    130                 135                 140
Ala Leu Leu Asp Val Cys Val Glu Gln Gly Lys Ser Cys His Ser Val
145                 150                 155                 160
Gly Gln Leu Ala Leu Asp Pro Ser Leu Val Pro Thr Phe Gln Leu Thr
                165                 170                 175
Leu Val Leu Arg Leu Asp Ser Arg Leu Trp Pro Lys Ile Gln Gly Leu
            180                 185                 190
Phe Ser Ser Ala Asn Ser Pro Phe Leu Pro Gly Phe Ser Gln Ser Leu
        195                 200                 205
Thr Leu Ser Thr Gly Phe Arg Val Ile Lys Lys Lys Leu Tyr Ser Ser
    210                 215                 220
Glu Gln Leu Leu Ile Glu Glu Cys
225                 230
<210>41
<211>5698
<212>DNA
<213>人
<400>41
aggttcaagt ggagctctcc taaccgacgc gcgtctgtgg agaagcggct tggtcggggg  60
tggtctcgtg gggtcctgcc tgtttagtcg ctttcagggt tcttgagccc cttcacgacc  120
gtcaccatgg aagtgtcacc attgcagcct gtaaatgaaa atatgcaagt caacaaaata  180
aagaaaaatg aagatgctaa gaaaagactg tctgttgaaa gaatctatca aaagaaaaca  240
caattggaac atattttgct ccgcccagac acctacattg gttctgtgga attagtgacc  300
cagcaaatgt gggtttacga tgaagatgtt ggcattaact atagggaagt cacttttgtt  360
cctggtttgt acaaaatctt tgatgagatt ctagttaatg ctgcggacaa caaacaaagg  420
gacccaaaaa tgtcttgtat tagagtcaca attgatccgg aaaacaattt aattagtata  480
tggaataatg gaaaaggtat tcctgttgtt gaacacaaag ttgaaaagat gtatgtccca  540
gctctcatat ttggacagct cctaacttct agtaactatg atgatgatga aaagaaagtg  600
acaggtggtc gaaatggcta tggagccaaa ttgtgtaaca tattcagtac caaatttact  660
gtggaaacag ccagtagaga atacaagaaa atgttcaaac agacatggat ggataatatg  720
ggaagagctg gtgagatgga actcaagccc ttcaatggag aagattatac atgtatcacc  780
tttcagcctg atttgtctaa gtttaaaatg caaagcctgg acaaagatat tgttgcacta  840
atggtcagaa gagcatatga tattgctgga tccaccaaag atgtcaaagt ctttcttaat  900
ggaaataaac tgccagtaaa aggatttcgt agttatgtgg acatgtattt gaaggacaag  960
ttggatgaaa ctggtaactc cttgaaagta atacatgaac aagtaaacca caggtgggaa  1020
gtgtgtttaa ctatgagtga aaaaggcttt cagcaaatta gctttgtcaa cagcattgct  1080
acatccaagg gtggcagaca tgttgattat gtagctgatc agattgtgac taaacttgtt  1140
gatgttgtga agaagaagaa caagggtggt gttgcagtaa aagcacatca ggtgaaaaat  1200
cacatgtgga tttttgtaaa tgccttaatt gaaaacccaa cctttgactc tcagacaaaa  1260
gaaaacatga ctttacaacc caagagcttt ggatcaacat gccaattgag tgaaaaattt  1320
atcaaagctg ccattggctg tggtattgta gaaagcatac taaactgggt gaagtttaag  1380
gcccaagtcc agttaaacaa gaagtgttca gctgtaaaac ataatagaat caagggaatt  1440
cccaaactcg atgatgccaa tgatgcaggg ggccgaaact ccactgagtg tacgcttatc  1500
ctgactgagg gagattcagc caaaactttg gctgtttcag gccttggtgt ggttgggaga  1560
gacaaatatg gggttttccc tcttagagga aaaatactca atgttcgaga agcttctcat  1620
aagcagatca tggaaaatgc tgagattaac aatatcatca agattgtggg tcttcagtac  1680
aagaaaaact atgaagatga agattcattg aagacgcttc gttatgggaa gataatgatt  1740
atgacagatc aggaccaaga tggttcccac atcaaaggct tgctgattaa ttttatccat  1800
cacaactggc cctctcttct gcgacatcgt tttctggagg aatttatcac tcccattgta  1860
aaggtatcta aaaacaagca agaaatggca ttttacagcc ttcctgaatt tgaagagtgg  1920
aagagttcta ctccaaatca taaaaaatgg aaagtcaaat attacaaagg tttgggcacc  1980
agcacatcaa aggaagctaa agaatacttt gcagatatga aaagacatcg tatccagttc  2040
aaatattctg gtcctgaaga tgatgctgct atcagcctgg cctttagcaa aaaacagata  2100
gatgatcgaa aggaatggtt aactaatttc atggaggata gaagacaacg aaagttactt  2160
gggcttcctg aggattactt gtatggacaa actaccacat atctgacata taatgacttc  2220
atcaacaagg aacttatctt gttctcaaat tctgataacg agagatctat cccttctatg  2280
gtggatggtt tgaaaccagg tcagagaaag gttttgttta cttgcttcaa acggaatgac  2340
aagcgagaag taaaggttgc ccaattagct ggatcagtgg ctgaaatgtc ttcttatcat  2400
catggtgaga tgtcactaat gatgaccatt atcaatttgg ctcagaattt tgtgggtagc  2460
aataatctaa acctcttgca gcccattggt cagtttggta ccaggctaca tggtggcaag  2520
gattctgcta gtccacgata catctttaca atgctcagct ctttggctcg attgttattt  2580
ccaccaaaag atgatcacac gttgaagttt ttatatgatg acaaccagcg tgttgagcct  2640
gaatggtaca ttcctattat tcccatggtg ctgataaatg gtgctgaagg aatcggtact  2700
gggtggtcct gcaaaatccc caactttgat gtgcgtgaaa ttgtaaataa catcaggcgt  2760
ttgatggatg gagaagaacc tttgccaatg cttccaagtt acaagaactt caagggtact  2820
attgaagaac tggctccaaa tcaatatgtg attagtggtg aagtagctat tcttaattct  2880
acaaccattg aaatctcaga gcttcccgtc agaacatgga cccagacata caaagaacaa  2940
gttctagaac ccatgttgaa tggcaccgag aagacacctc ctctcataac agactatagg  3000
gaataccata cagataccac tgtgaaattt gttgtgaaga tgactgaaga aaaactggca  3060
gaggcagaga gagttggact acacaaagtc ttcaaactcc aaactagtct cacatgcaac  3120
tctatggtgc tttttgacca cgtaggctgt ttaaagaaat atgacacggt gttggatatt  3180
ctaagagact tttttgaact cagacttaaa tattatggat taagaaaaga atggctccta  3240
ggaatgcttg gtgctgaatc tgctaaactg aataatcagg ctcgctttat cttagagaaa  3300
atagatggca aaataatcat tgaaaataag cctaagaaag aattaattaa agttctgatt  3360
cagaggggat atgattcgga tcctgtgaag gcctggaaag aagcccagca aaaggttcca  3420
gatgaagaag aaaatgaaga gagtgacaac gaaaaggaaa ctgaaaagag tgactccgta  3480
acagattctg gaccaacctt caactatctt cttgatatgc ccctttggta tttaaccaag  3540
gaaaagaaag atgaactctg caggctaaga aatgaaaaag aacaagagct ggacacatta  3600
aaaagaaaga gtccatcaga tttgtggaaa gaagacttgg ctacatttat tgaagaattg  3660
gaggctgttg aagccaagga aaaacaagat gaacaagtcg gacttcctgg gaaagggggg  3720
aaggccaagg ggaaaaaaac acaaatggct gaagttttgc cttctccgcg tggtcaaaga  3780
gtcattccac gaataaccat agaaatgaaa gcagaggcag aaaagaaaaa taaaaagaaa  3840
attaagaatg aaaatactga aggaagccct caagaagatg gtgtggaact agaaggccta  3900
aaacaaagat tagaaaagaa acagaaaaga gaaccaggta caaagacaaa gaaacaaact  3960
acattggcat ttaagccaat caaaaaagga aagaagagaa atccctggtc tgattcagaa  4020
tcagatagga gcagtgacga aagtaatttt gatgtccctc cacgagaaac agagccacgg  4080
agagcagcaa caaaaacaaa attcacaatg gatttggatt cagatgaaga tttctcagat  4140
tttgatgaaa aaactgatga tgaagatttt gtcccatcag atgctagtcc acctaagacc  4200
aaaacttccc caaaacttag taacaaagaa ctgaaaccac agaaaagtgt cgtgtcagac  4260
cttgaagctg atgatgttaa gggcagtgta ccactgtctt caagccctcc tgctacacat  4320
ttcccagatg aaactgaaat tacaaaccca gttcctaaaa agaatgtgac agtgaagaag  4380
acagcagcaa aaagtcagtc ttccacctcc actaccggtg ccaaaaaaag ggctgcccca  4440
aaaggaacta aaagggatcc agctttgaat tctggtgtct ctcaaaagcc tgatcctgcc  4500
aaaaccaaga atcgccgcaa aaggaagcca tccacttctg atgattctga ctctaatttt  4560
gagaaaattg tttcgaaagc agtcacaagc aagaaatcca agggggagag tgatgacttc  4620
catatggact ttgactcagc tgtggctcct cgggcaaaat ctgtacgggc aaagaaacct  4680
ataaagtacc tggaagagtc agatgaagat gatctgtttt aaaatgtgag gcgattattt  4740
taagtaatta tcttaccaag cccaagactg gttttaaagt tacctgaagc tcttaacttc  4800
ctcccctctg aatttagttt ggggaaggtg tttttagtac aagacatcaa agtgaagtaa  4860
agcccaagtg ttctttagct ttttataata ctgtctaaat agtgaccatc tcatgggcat  4920
tgttttcttc tctgctttgt ctgtgttttg agtctgcttt cttttgtctt taaaacctga  4980
tttttaagtt cttctgaact gtagaaatag ctatctgatc acttcagcgt aaagcagtgt  5040
gtttattaac catccactaa gctaaaacta gagcagtttg atttaaaagt gtcactcttc  5100
ctccttttct actttcagta gatatgagat agagcataat tatctgtttt atcttagttt  5160
tatacataat ttaccatcag atagaacttt atggttctag tacagatact ctactacact  5220
cagcctctta tgtgccaagt ttttctttaa gcaatgagaa attgctcatg ttcttcatct  5280
tctcaaatca tcagaggcca aagaaaaaca ctttggctgt gtctataact tgacacagtc  5340
aatagaatga agaaaattag agtagttatg tgattatttc agctcttgac ctgtcccctc  5400
tggctgcctc tgagtctgaa tctcccaaag agagaaacca atttctaaga ggactggatt  5460
gcagaagact cggggacaac atttgatcca agatcttaaa tgttatattg ataaccatgc  5520
tcagcaatga gctattagat tcattttggg aaatctccat aatttcaatt tgtaaacttt  5580
gttaagacct gtctacattg ttatatgtgt gtgacttgag taatgttatc aacgtttttg  5640
taaatattta ctatgttttt ctattagcta aattccaaca attttgtact ttaataaa    5698
<210>42
<211>1531
<212>PRT
<213>人
<400>42
Met Glu Val Ser Pro Leu Gln Pro Val Asn Glu Asn Met Gln Val Asn
 1               5                  10                  15
Lys Ile Lys Lys Asn Glu Asp Ala Lys Lys Arg Leu Ser Val Glu Arg
            20                  25                  30
Ile Tyr Gln Lys Lys Thr Gln Leu Glu His Ile Leu Leu Arg Pro Asp
        35                  40                  45
Thr Tyr Ile Gly Ser Val Glu Leu Val Thr Gln Gln Met Trp Val Tyr
    50                  55                  60
Asp Glu Asp Val Gly Ile Asn Tyr Arg Glu Val Thr Phe Val Pro Gly
65                  70                  75                  80
Leu Tyr Lys Ile Phe Asp Glu Ile Leu Val Asn Ala Ala Asp Asn Lys
                85                  90                  95
Gln Arg Asp Pro Lys Met Ser Cys Ile Arg Val Thr Ile Asp Pro Glu
            100                 105                 110
Asn Asn Leu Ile Ser Ile Trp Asn Asn Gly Lys Gly Ile Pro Val Val
        115                 120                 125
Glu His Lys Val Glu Lys Met Tyr Val Pro Ala Leu Ile Phe Gly Gln
    130                 135                 140
Leu Leu Thr Ser Ser Asn Tyr Asp Asp Asp Glu Lys Lys Val Thr Gly
145                 150                 155                 160
Gly Arg Asn Gly Tyr Gly Ala Lys Leu Cys Asn Ile Phe Ser Thr Lys
                165                 170                 175
Phe Thr Val Glu Thr Ala Ser Arg Glu Tyr Lys Lys Met Phe Lys Gln
            180                 185                 190
Thr Trp Met Asp Asn Met Gly Arg Ala Gly Glu Met Glu Leu Lys Pro
        195                 200                 205
Phe Asn Gly Glu Asp Tyr Thr Cys Ile Thr Phe Gln Pro Asp Leu Ser
    210                 215                 220
Lys Phe Lys Met Gln Ser Leu Asp Lys Asp Ile Val Ala Leu Met Val
225                 230                 235                 240
Arg Arg Ala Tyr Asp Ile Ala Gly Ser Thr Lys Asp Val Lys Val Phe
                245                 250                 255
Leu Asn Gly Asn Lys Leu Pro Val Lys Gly Phe Arg Ser Tyr Val Asp
            260                 265                 270
Met Tyr Leu Lys Asp Lys Leu Asp Glu Thr Gly Asn Ser Leu Lys Val
        275                 280                 285
Ile His Glu Gln Val Asn His Arg Trp Glu Val Cys Leu Thr Met Ser
    290                 295                 300
Glu Lys Gly Phe Gln Gln Ile Ser Phe Val Asn Ser Ile Ala Thr Ser
305                 310                 315                 320
Lys Gly Gly Arg His Val Asp Tyr Val Ala Asp Gln Ile Val Thr Lys
                325                 330                 335
Leu Val Asp Val Val Lys Lys Lys Asn Lys Gly Gly Val Ala Val Lys
            340                 345                 350
Ala His Gln Val Lys Asn His Met Trp Ile Phe Val Asn Ala Leu Ile
        355                 360                 365
Glu Asn Pro Thr Phe Asp Ser Gln Thr Lys Glu Asn Met Thr Leu Gln
    370                 375                 380
Pro Lys Ser Phe Gly Ser Thr Cys Gln Leu Ser Glu Lys Phe Ile Lys
385                 390                 395                 400
Ala Ala Ile Gly Cys Gly Ile Val Glu Ser Ile Leu Asn Trp Val Lys
                405                 410                 415
Phe Lys Ala Gln Val Gln Leu Asn Lys Lys Cys Ser Ala Val Lys His
            420                 425                 430
Asn Arg Ile Lys Gly Ile Pro Lys Leu Asp Asp Ala Asn Asp Ala Gly
        435                 440                 445
Gly Arg Asn Ser Thr Glu Cys Thr Leu Ile Leu Thr Glu Gly Asp Ser
    450                 455                 460
Ala Lys Thr Leu Ala Val Ser Gly Leu Gly Val Val Gly Arg Asp Lys
465                 470                 475                 480
Tyr Gly Val Phe Pro Leu Arg Gly Lys Ile Leu Asn Val Arg Glu Ala
                485                 490                 495
Ser His Lys Gln Ile Met Glu Asn Ala Glu Ile Asn Asn Ile Ile Lys
            500                 505                 510
Ile Val Gly Leu Gln Tyr Lys Lys Asn Tyr Glu Asp Glu Asp Ser Leu
        515                 520                 525
Lys Thr Leu Arg Tyr Gly Lys Ile Met Ile Met Thr Asp Gln Asp Gln
    530                 535                 540
Asp Gly Ser His Ile Lys Gly Leu Leu Ile Asn Phe Ile His His Asn
545                 550                 555                 560
Trp Pro Ser Leu Leu Arg His Arg Phe Leu Glu Glu Phe Ile Thr Pro
                565                 570                 575
Ile Val Lys Val Ser Lys Asn Lys Gln Glu Met Ala Phe Tyr Ser Leu
            580                 585                 590
Pro Glu Phe Glu Glu Trp Lys Ser Ser Thr Pro Asn His Lys Lys Trp
        595                 600                 605
Lys Val Lys Tyr Tyr Lys Gly Leu Gly Thr Ser Thr Ser Lys Glu Ala
    610                 615                 620
Lys Glu Tyr Phe Ala Asp Met Lys Arg His Arg Ile Gln Phe Lys Tyr
625                 630                 635                 640
Ser Gly Pro Glu Asp Asp Ala Ala Ile Ser Leu Ala Phe Ser Lys Lys
                645                 650                 655
Gln Ile Asp Asp Arg Lys Glu Trp Leu Thr Asn Phe Met Glu Asp Arg
            660                 665                 670
Arg Gln Arg Lys Leu Leu Gly Leu Pro Glu Asp Tyr Leu Tyr Gly Gln
        675                 680                 685
Thr Thr Thr Tyr Leu Thr Tyr Asn Asp Phe Ile Asn Lys Glu Leu Ile
    690                 695                 700
Leu Phe Ser Asn Ser Asp Asn Glu Arg Ser Ile Pro Ser Met Val Asp
705                 710                 715                 720
Gly Leu Lys Pro Gly Gln Arg Lys Val Leu Phe Thr Cys Phe Lys Arg
                725                 730                 735
Asn Asp Lys Arg Glu Val Lys Val Ala Gln Leu Ala Gly Ser Val Ala
            740                 745                 750
Glu Met Ser Ser Tyr His His Gly Glu Met Ser Leu Met Met Thr Ile
        755                 760                 765
Ile Asn Leu Ala Gln Asn Phe Val Gly Ser Asn Asn Leu Asn Leu Leu
    770                 775                 780
Gln Pro Ile Gly Gln Phe Gly Thr Arg Leu His Gly Gly Lys Asp Ser
785                 790                 795                 800
Ala Ser Pro Arg Tyr Ile Phe Thr Met Leu Ser Ser Leu Ala Arg Leu
                805                 810                 815
Leu Phe Pro Pro Lys Asp Asp His Thr Leu Lys Phe Leu Tyr Asp Asp
            820                 825                 830
Asn Gln Arg Val Glu Pro Glu Trp Tyr Ile Pro Ile Ile Pro Met Val
        835                 840                 845
Leu Ile Asn Gly Ala Glu Gly Ile Gly Thr Gly Trp Ser Cys Lys Ile
    850                 855                 860
Pro Asn Phe Asp Val Arg Glu Ile Val Asn Asn Ile Arg Arg Leu Met
865                 870                 875                 880
Asp Gly Glu Glu Pro Leu Pro Met Leu Pro Ser Tyr Lys Asn Phe Lys
                885                 890                 895
Gly Thr Ile Glu Glu Leu Ala Pro Asn Gln Tyr Val Ile Ser Gly Glu
            900                 905                 910
Val Ala Ile Leu Asn Ser Thr Thr Ile Glu Ile Ser Glu Leu Pro Val
        915                 920                 925
Arg Thr Trp Thr Gln Thr Tyr Lys Glu Gln Val Leu Glu Pro Met Leu
    930                 935                 940
Asn Gly Thr Glu Lys Thr Pro Pro Leu Ile Thr Asp Tyr Arg Glu Tyr
945                 950                 955                 960
His Thr Asp Thr Thr Val Lys Phe Val Val Lys Met Thr Glu Glu Lys
                965                 970                 975
Leu Ala Glu Ala Glu Arg Val Gly Leu His Lys Val Phe Lys Leu Gln
            980                 985                 990
Thr Ser Leu Thr Cys Asn Ser Met Val Leu Phe Asp His Val Gly Cys
        995                 1000                1005
Leu Lys Lys Tyr Asp Thr Val Leu Asp Ile Leu Arg Asp Phe Phe Glu
    1010                1015                1020
Leu Arg Leu Lys Tyr Tyr Gly Leu Arg Lys Glu Trp Leu Leu Gly Met
1025                1030                1035                1040
Leu Gly Ala Glu Ser Ala Lys Leu Asn Asn Gln Ala Arg Phe Ile Leu
                1045                1050                1055
Glu Lys Ile Asp Gly Lys Ile Ile Ile Glu Asn Lys Pro Lys Lys Glu
            1060                1065                1070
Leu Ile Lys Val Leu Ile Gln Arg Gly Tyr Asp Ser Asp Pro Val Lys
        1075                1080                1085
Ala Trp Lys Glu Ala Gln Gln Lys Val Pro Asp Glu Glu Glu Asn Glu
    1090                1095                1100
Glu Ser Asp Asn Glu Lys Glu Thr Glu Lys Ser Asp Ser Val Thr Asp
1105                1110                1115                1120
Ser Gly Pro Thr Phe Asn Tyr Leu Leu Asp Met Pro Leu Trp Tyr Leu
                1125                1130                1135
Thr Lys Glu Lys Lys Asp Glu Leu Cys Arg Leu Arg Asn Glu Lys Glu
            1140                1145                1150
Gln Glu Leu Asp Thr Leu Lys Arg Lys Ser Pro Ser Asp Leu Trp Lys
        1155                1160                1165
Glu Asp Leu Ala Thr Phe Ile Glu Glu Leu Glu Ala Val Glu Ala Lys
    1170                1175                1180
Glu Lys Gln Asp Glu Gln Val Gly Leu Pro Gly Lys Gly Gly Lys Ala
1185                1190                1195                1200
Lys Gly Lys Lys Thr Gln Met Ala Glu Val Leu Pro Ser Pro Arg Gly
                1205                1210                1215
Gln Arg Val Ile Pro Arg Ile Thr Ile Glu Met Lys Ala Glu Ala Glu
            1220                1225                1230
Lys Lys Asn Lys Lys Lys Ile Lys Asn Glu Asn Thr Glu Gly Ser Pro
        1235                1240                1245
Gln Glu Asp Gly Val Glu Leu Glu Gly Leu Lys Gln Arg Leu Glu Lys
    1250                1255                1260
Lys Gln Lys Arg Glu Pro Gly Thr Lys Thr Lys Lys Gln Thr Thr Leu
1265                1270                1275                1280
Ala Phe Lys Pro Ile Lys Lys Gly Lys Lys Arg Asn Pro Trp Ser Asp
                1285                1290                1295
Ser Glu Ser Asp Arg Ser Ser Asp Glu Ser Asn Phe Asp Val Pro Pro
            1300                1305                1310
Arg Glu Thr Glu Pro Arg Arg Ala Ala Thr Lys Thr Lys Phe Thr Met
        1315                1320                1325
Asp Leu Asp Ser Asp Glu Asp Phe Ser Asp Phe Asp Glu Lys Thr Asp
    1330                1335                1340
Asp Glu Asp Phe Val Pro Ser Asp Ala Ser Pro Pro Lys Thr Lys Thr
1345                1350                1355                1360
Ser Pro Lys Leu Ser Asn Lys Glu Leu Lys Pro Gln Lys Ser Val Val
                1365                1370                1375
Ser Asp Leu Glu Ala Asp Asp Val Lys Gly Ser Val Pro Leu Ser Ser
            1380                1385                1390
Ser Pro Pro Ala Thr His Phe Pro Asp Glu Thr Glu Ile Thr Asn Pro
        1395                1400                1405
Val Pro Lys Lys Asn Val Thr Val Lys Lys Thr Ala Ala Lys Ser Gln
    1410                1415                1420
Ser Ser Thr Ser Thr Thr Gly Ala Lys Lys Arg Ala Ala Pro Lys Gly
1425                1430                1435                1440
Thr Lys Arg Asp Pro Ala Lau Asn Ser Gly Val Ser Gln Lys Pro Asp
                1445                1450                1455
Pro Ala Lys Thr Lys Asn Arg Arg Lys Arg Lys Pro Ser Thr Ser Asp
            1460                1465                1470
Asp Ser Asp Ser Asn Phe Glu Lys Ile Val Ser Lys Ala Val Thr Ser
        1475                1480                1485
Lys Lys Ser Lys Gly Glu Ser Asp Asp Phe His Met Asp Phe Asp Ser
    1490                1495                1500
Ala Val Ala Pro Arg Ala Lys Ser Val Arg Ala Lys Lys Pro Ile Lys
1505                1510                1515                1520
Tyr Leu Glu Glu Ser Asp Glu Asp Asp Leu Phe
                1525                1530
<210>43
<211>4797
<212>DNA
<213>人
<400>43
gcagtgaaca caacctttcc cctgagccac tggaattgga cagaatgccc cattctcctc  60
tgatctccat tcctcatgtg tggtgtcacc cagaagagga ggaaagaatg catgatgaac  120
ttctacaagc agtatccaag gggccggtga tgttcaggga tgtttccata gacttctctc  180
aagaggaatg ggaatgcctg gacgctgatc agatgaattt atacaaagaa gtgatgttgg  240
agaatttcag caacctggtt tcagtgggac tttccaattc taagccagct gtgatctcct  300
tattggaaca aggaaaagag ccctggatgg ttgatagaga gctgactaga ggcctgtgtt  360
cagatctgga atcaatgtgt gagaccaaaa tattatctct aaagaagaga catttcagtc  420
aagtaataat tacccgtgaa gacatgtcta cttttattca gcccacattt cttattccac  480
ctcaaaaaac tatgagtgaa gagaaaccat gggaatgtaa gatatgtgga aagaccttta  540
atcaaaactc acaatttatc caacatcaga gaattcattt tggtgaaaaa cactatgaat  600
ctaaggagta tgggaagtcc tttagtcgtg gctcactcgt tactcgacat cagaggattc  660
acactggtaa aaaaccctat gaatgtaagg aatgtggcaa ggcttttagt tgtagttcat  720
atttttctca acatcagagg attcacactg gtgagaaacc ctatgaatgt aaggaatgtg  780
gaaaagcctt taagtattgc tcaaacctta atgatcatca gagaattcac actggtgaga  840
aaccctatga atgtaaagta tgtggaaaag cctttactaa aagttcacaa ctttttctac  900
atctgagaat tcatactggt gagaaacctt atgaatgtaa agaatgtggg aaagccttta  960
ctcaacactc aaggcttatt cagcatcaga gaatgcatac tggtgagaaa ccttatgaat  1020
gtaagcagtg tgggaaggcc tttaatagtg cctcaacact tactaaccat cacagaattc  1080
atgctggtga gaagctctat gaatgtgaag aatgtagaaa ggcctttatt cagagctcag  1140
aacttattca acatcagaga atccatacag atgaaaaacc atatgaatgt aatgaatgtg  1200
ggaaggcctt taataaaggc tcaaatctta ctcgacatca gagaattcac actggtgaga  1260
aaccctatga ctgtaaggaa tgtggaaagg cttttggtag tcgctctgac ctcattcgcc  1320
atgagggaat tcatactggt tgaatgacag taaagtaaga ccattttgtt aacctttata  1380
ataatttttt taaaacaggt aaggagaaca aattaggata catattatca aaggttctcc  1440
tatgtattcg tttttaaacg atacgataac aaagtaccaa gtaccaaaac cttggtggct  1500
taaaacaaga gaaatttatt ctctcatagt ttagagcctg gaaatctaaa ctcaagggtg  1560
ctgatcgttt tggttccttc tgaggactct gaggatctgt tctatgcctt tttcctaacc  1620
tctgttaaca gctggcagtc cttggcattc catggctttt acatacacca ttccaatctc  1680
tgcctccatc ttcacattgc attctcgctg tgtatctctg tgtatgtctt ttatttggac  1740
accagtcagg ttagattggg gctacctggt gacctcatct taacttgatt atatctgcca  1800
agaccctgtt tccaagtaag gtcacattta ccggtaccag gggttaggac ttcagcatat  1860
ctttttaggg gatacagttc aacccataat accctgttag aatgattttg tctaatatat  1920
ttgtaatttc cttttataca taagttgtta gtcaaattta ttttatttta ttttattttg  1980
agacagagtc tcgctctgtt gcccaggctg gagtgcagtg gtgtgatctc agctcactgc  2040
aacctccagc tcctgagttc aagcgattct tgtgcctcag cctctcaagt agttgggatt  2100
acaggcatgc gccaccatgc ccggctaatt tttttttttt tttttttgta tttttagtag  2160
cgacggggtt tcaccatgtt ggccaggctg gtcttgaact cctgacttca agtgatctgc  2220
ccgcctcagc ctcccaaagt gctgggatta cagacgtgag ccaccgtgat ggccaaaaca  2280
gactttatac caacaaaaat taaaaaggac aaagaaggtc atttataatg ataaaggata  2340
aattcaacaa gaagataaaa caatcctaaa tatgtatgca cccaacactg caacacccag  2400
atccataaca cagatactac tagacctaag aaaagagata gacagcaata caacaatagc  2460
aggggacttc accactccat tgacagcact agacagatca ctgggacaga aatcaacaaa  2520
gaaactctgg acttaaattg gactctacac caaatggacc caacagacat ctgaagaaca  2580
ttctacccaa caaccacaga atatatactc ttctcttctg tgcatggaac attctcaaaa  2640
ataggtcata tactggacca caaagcaagt atcaataaat tttaaaaaaa caaaatcata  2700
tctaacatct tctctgacca tagtggaata aaactagata tcaataccaa gaggaactct  2760
caaaacagat acatggaatt taaacagctt gctcctgaat gatttttgga tcaatgatga  2820
aactaaggtg gaaatttaaa attttttgaa ataaatgaaa atagagacaa aacacatgaa  2880
aacatctgag atacagcaaa agcagtgcta agagaggatt ttatagcatt aaatgcctac  2940
accaaaaaga tagaaaaatc tcaaatgaat agcctaacgt cacatctcaa ggaactagga  3000
aaaaacaaaa caaactcaac ccaaagctgg cagaagaaaa gcaataacaa atatcagagc  3060
aggcaaaaat gagactgaga acaaaggaat gcaaaagatc aataaaagaa aaagttggtt  3120
ctttgtaaag ataaaactga cagaccacta gctagattaa ccaagaaaaa aagaagattc  3180
aaataaatac aatcagaaat gataaggtga tattataact gataacacag acatataaaa  3240
tatcagcaga aactatatgc acatattaga aaacctagag gaagtggata aattcctaga  3300
aacacataac cttccaagat tgaaccaggg agaaatagga atcctcaaca gactactgag  3360
tattgaaatt gaatcagtaa tagaaaaaaa tcttgcaaaa acaaaaagcc caggaccaga  3420
cagattcaca gctgaattct actagacatg caaggaagaa ctagtaacag cactattgaa  3480
actattccaa aaattatagg agggaatcct ccctaactca ttctacaaag ccagtatcat  3540
cctgatactg aagccaggca aggataaaac acacaaaaaa actacaagcc aatatccctg  3600
atgaaaatag acacaaaaat cttcagcaaa atactagcaa accaaatcaa acagtacata  3660
aaaaagatag taacagcaca gtcaagtgga ttttattcct ggggtgtaag gatggctcaa  3720
catatgcaac tcaatacatg attcatcaca tacacagaat taaaaataag ccaggcactc  3780
acacctgtaa tcccagcact ttgcaaggcc aaggcgggca gatcacatga tgtcaagagt  3840
ttgagaccag tctggctgac atggcgaaac cctgtctcta ctaaaaatag aaaaattggc  3900
tgggcatggt ggcaggcact gtagtcccag ctacttggga ggctgaggca ggagaattac  3960
ttgaacctga gaagcggagg ttgcagtgag ctgagatagt gccattgcac tccagcctgg  4020
gcaacagagc aaattgcttg aatgtgggag gtggaggttg cagtgagccg agattatgcc  4080
attgcactcc agccggggga gcaacaaagc cagactccat ctcaaaaaaa aaccaaaaaa  4140
aatcctattt agtacaaggt acattattta ggtaatgagt ccattaaaag ccaacacttt  4200
ccccactaca ctatatgtgt atgtaacaca actgcccttg taacttccta aacctataat  4260
taagaaacaa taaaaggcaa attaagaatg cttttttaaa aggtgggggc attatgctaa  4320
taagttactg tggatttcag agtgcagagt agaaagatca caagaattta gtgtggtagg  4380
tgggaacaga aaatgggtgt ataaatttta ttgacgtggg agtactggat attgtagaga  4440
cagatatcat cagggcaagg agattaaaga tttttgcatt gacggtttga cactatattg  4500
tggtaataac actgtatgtg ttgggagata gaacaggaaa catcttccct ggaatatgta  4560
tactattaaa tgttttatca aacttttgat caaacaagac agcacaattt ataatttcat  4620
ttctatttct atgttatgag aaactgatca tttattcaaa tgtttaacag gcatgttcat  4680
gttactataa actcttctgt ttctccatca cgttgttggt catctttact gattacaaat  4740
ttctttacat atttaagaaa tatatatatt tctttatata ttaaaaaaaa aaaaaaa     4797
<210>44
<211>432
<212>PRT
<213>人
<400>44
Met Pro His Ser Pro Leu Ile Ser Ile Pro His Val Trp Cys His Pro
 1               5                  10                  15
Glu Glu Glu Glu Arg Met His Asp Glu Leu Leu Gln Ala Val Ser Lys
            20                  25                  30
Gly Pro Val Met Phe Arg Asp Val Ser Ile Asp Phe Ser Gln Glu Glu
        35                  40                  45
Trp Glu Cys Leu Asp Ala Asp Gln Met Asn Leu Tyr Lys Glu Val Met
    50                  55                  60
Leu Glu Asn Phe Ser Asn Leu Val Ser Val Gly Leu Ser Asn Ser Lys
65                  70                  75                  80
Pro Ala Val Ile Ser Leu Leu Glu Gln Gly Lys Glu Pro Trp Met Val
                85                  90                  95
Asp Arg Glu Leu Thr Arg Gly Leu Cys Ser Asp Leu Glu Ser Met Cys
            100                 105                 110
Glu Thr Lys Ile Leu Ser Leu Lys Lys Arg His Phe Ser Gln Val Ile
        115                 120                 125
Ile Thr Arg Glu Asp Met Ser Thr Phe Ile Gln Pro Thr Phe Leu Ile
    130                 135                 140
Pro Pro Gln Lys Thr Met Ser Glu Glu Lys Pro Trp Glu Cys Lys Ile
145                 150                 155                 160
Cys Gly Lys Thr Phe Asn Gln Asn Ser Gln Phe Ile Gln His Gln Arg
                165                 170                 175
Ile His Phe Gly Glu Lys His Tyr Glu Ser Lys Glu Tyr Gly Lys Ser
            180                 185                 190
Phe Ser Arg Gly Ser Leu Val Thr Arg His Gln Arg Ile His Thr Gly
        195                 200                 205
Lys Lys Pro Tyr Glu Cys Lys Glu Cys Gly Lys Ala Phe Ser Cys Ser
    210                 215                 220
Ser Tyr Phe Ser Gln His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr
225                 230                 235                 240
Glu Cys Lys Glu Cys Gly Lys Ala Phe Lys Tyr Cys Ser Asn Leu Asn
                245                 250                 255
Asp His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Lys Val
            260                 265                 270
Cys Gly Lys Ala Phe Thr Lys Ser Ser Gln Leu Phe Leu His Leu Arg
        275                 280                 285
Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Lys Glu Cys Gly Lys Ala
    290                 295                 300
Phe Thr Gln His Ser Arg Leu Ile Gln His Gln Arg Met His Thr Gly
305                 310                 315                 320
Glu Lys Pro Tyr Glu Cys Lys Gln Cys Gly Lys Ala Phe Asn Ser Ala
                325                 330                 335
Ser Thr Leu Thr Asn His His Arg Ile His Ala Gly Glu Lys Leu Tyr
            340                 345                 350
Glu Cys Glu Glu Cys Arg Lys Ala Phe Ile Gln Ser Ser Glu Leu Ile
        355                 360                 365
Gln His Gln Arg Ile His Thr Asp Glu Lys Pro Tyr Glu Cys Asn Glu
    370                 375                 380
Cys Gly Lys Ala Phe Asn Lys Gly Ser Asn Leu Thr Arg His Gln Arg
385                 390                 395                 400
Ile His Thr Gly Glu Lys Pro Tyr Asp Cys Lys Glu Cys Gly Lys Ala
                405                 410                 415
Phe Gly Ser Arg Ser Asp Leu Ile Arg His Glu Gly Ile His Thr Gly
            420                 425                 430

Claims (48)

1.一种评估是否患者患子宫颈癌或具有癌变前状态的方法,所述方法包含比较:
a)患者样本中标记物的表达水平,其中所述标记物选自列于表1的标记物,和
b)在正常对照组子宫颈癌样本中所述标记物的表达水平,
其中在患者样本中所述标记物的表达水平和正常水平之间的明显差异表明患者患子宫颈癌或具有癌变前状态。
2.权利要求1的方法,其中所述患者具有CIN或SIL。
3.权利要求1的方法,其中所述标记物相应于分泌蛋白。
4.权利要求1的方法,其中所述标记物相应于转录的多核苷酸或其部分,其中所述多核苷酸包含所述标记物。
5.权利要求1的方法,其中所述样本包含获得自患者的细胞。
6.权利要求5的方法,其中所述样本是子宫颈涂片。
7.权利要求5的方法,其中所述细胞位于液体中,所述液体选自:通过腹膜冲洗收集的液体,通过子宫冲洗收集的液体,子宫液,子宫渗出液,胸膜液,胆囊液和子宫颈渗出液(exudate)。
8.权利要求1的方法,其中通过检测样本中相应于标记物的蛋白的存在评估样本中标记物的表达水平。
9.权利要求8的方法,其中使用与蛋白特异性结合的试剂检测蛋白的存在。
10.权利要求9的方法,其中所述试剂选自:抗体,抗体衍生物和抗体片段。
11.权利要求1的方法,其中通过检测样本中转录的多核苷酸或其部分的存在评估样本中标记物的表达水平,其中所述转录多核苷酸包含所述标记物。
12.权利要求11的方法,其中所述转录的多核苷酸是mRNA。
13.权利要求11的方法,其中所述转录的多核苷酸是cDNA。
14.权利要求11的方法,其中检测步骤进一步包含扩增转录的多核苷酸。
15.权利要求1的方法,其中通过检测样本中转录的多核苷酸的存在评估样本中所述标记物的表达水平,在严谨杂交条件下,转录的多核苷酸与标记物或多核苷酸的部分退火,其中所述多核苷酸包含物标记物。
16.权利要求1的方法,其中样本中所述标记物的表达水平与不患有子宫颈癌患者中所述标记物的正常表达水平相差至少约2倍。
17.权利要求1的方法,其中样本中所述标记物的表达水平与不患有子宫颈癌患者中所述标记物的正常表达水平相差至少约5倍。
18.权利要求的方法1,包含比较:
a)样本中多种(plurality)标记物的每一个标记物的表达水平,所述标记物独立地选自列于表1的标记物,和
b)获得自正常对照组人子宫颈样本的同类型多种标记物的每一个标记物的表达水平,
其中相对于相应的标记物正常表达水平,超过一个标记物的表达水平明显改变,表明患者患子宫颈癌或具癌变前状态。
19.权利要求18的方法,其中相对于相应的标记物正常表达水平,每一个标记物的表达水平明显改变,表明患者患子宫颈癌。
20.权利要求18的方法,其中所述多种标记物包含至少3个标记物。
21.权利要求18的方法,其中所述多种标记物包含至少5个标记物。
22.一种用于检测患者中子宫颈癌或癌变前状态的进展的方法,所述方法包含:
a)在第一时间点检测患者样本中标记物的表达,其中所述标记物选自列于表1的标记物;
b)在随后的时间点按时重复步骤a);和
c)比较步骤a)和b)中检测到的表达水平,以及由此监测患者中子宫颈癌或癌变前状态的进展。
23.权利要求22的方法,其中所述标记物相应于分泌蛋白。
24.权利要求22的方法,其中所述标记物相应于转录的多核苷酸或其部分,其中所述多核苷酸包含所述标记物。
25.权利要求22的方法,其中所述样本包含获得自患者的细胞。
26.权利要求25的方法,其中所述患者样本是子宫颈涂片。
27.权利要求22的方法,其中在第一时间点和随后时间点之间,患者进行外科手术摘除肿瘤。
28.一种评估用于抑制患者子宫颈癌的受试化合物的效力的方法,所述方法包含比较:
a)获得自患者并暴露于受试化合物的第一样本中标记物的表达,其中所述标记物选自列于表1的标记物,和
b)获得自患者的第二样本中所述标记物的表达,其中所述样本不暴露于受试化合物,
其中相对于第二样本,第一样本中标记物明显更低的表达水平表明所述受试化合物对于抑制患者的子宫颈癌是有效的。
29.权利要求28的方法,其中所述第一和第二样本是获得自患者的一次抽样样本的部分。
30.权利要求28的方法,其中所述第一和第二样本是获得自患者的混合样本的部分。
31.一种评估用于抑制患者子宫颈癌的治疗的有效性的方法,所述方法包含比较:
a)在提供给患者至少部分治疗前获得自患者的第一样本中标记物的表达,其中所述标记物选自列于表1的标记物,和
b)在提供部分治疗后获得自患者的第二样本中标记物的表达,
其中相对于第一样本,第二样本中标记物明显更低的表达水平表明所述用于抑制患者子宫颈癌的治疗是有效的。
32.一种选择用于抑制患者子宫颈癌的组合物的方法,所述方法包含:
a)从患者处获得包含癌细胞的样本;
b)将样本的等分试样分别暴露于存在多种测试组合物的条件下;
c)比较每个等分试样中标记物的表达,其中所述标记物选自列于表1的标记物;和
d)相对于其它测试组合物,选择一种能导致含有所述测试组合物的等分试样中标记物明显更低的表达水平的测试组合物。
33.一种抑制患者子宫颈癌的方法,所述方法包含:
a)从患者处获得包含癌细胞的样本;
b)将样本的等分试样分别保持在存在多种测试组合物的条件下;
c)比较每个等分试样中标记物的表达,其中所述标记物选自列于表1的标记物;和
d)相对于其它测试组合物,给予患者至少一种能导致含有所述测试组合物的等分试样中标记物明显更低的表达水平的测试组合物。
34.一种用于评估是否患者患子宫颈癌或具癌变前状态的试剂盒,所述试剂盒包含用于评估标记物表达的试剂,所述标记物选自列于表1的标记物。
35.一种用于评估子宫颈癌细胞或癌变前子宫颈细胞或病变存在的试剂盒,所述试剂盒包含核酸探针,其中所述探针与相应于标记物的转录的多核苷酸特异性结合,所述标记物选自列于表1的标记物。
36.一种用于评估用于抑制患者子宫颈癌的多种化合物的每一种化合物的适用性的试剂盒,所述试剂盒包含:
a)多种化合物;和
b)用于评估标记物表达的试剂,所述标记物选自列于表1的标记物。
37.一种用于评估人子宫颈癌细胞或癌变前子宫颈细胞或病变存在的试剂盒,所述试剂盒包含抗体,其中所述抗体与相应于标记物的蛋白特异性结合,所述标记物选自列于表1的标记物。
38.一种评估受试化合物子宫颈细胞致癌潜力的方法,所述方法包含:
a)将子宫颈细胞的等分试样分别保持在存在和不存在所述受试化合物的条件下;和
b)比较每一个等分试样中标记物的表达,其中所述标记物选自列于表1的标记物,
其中相对于在不存在所述受试化合物的条件下所保持的等分试样,在存在所述受试化合物的条件下所保持的等分试样中的标记物明显增加的表达水平表明所述受试化合物具有人子宫颈细胞致癌潜力。
39.一种用于评估受试化合物子宫颈细胞致癌潜力的试剂盒,所述试剂盒包含子宫颈细胞和用于评估标记物表达的试剂,其中所述标记物选自列于表1的标记物。
40.一种治疗患有子宫颈癌的患者的方法,所述方法包含向患者细胞提供一种与相应于一种标记物的多核苷酸互补的反义寡核苷酸,所述标记物选自列于表1的标记物。
41.一种在处于子宫颈癌发展的危险中的患者中抑制子宫颈癌的方法,所述方法包含抑制基因的表达,所述基因相应于一种标记物,所述标记物选自列于表1的标记物。
42.一种分离的核酸分子,其包含一种核苷酸序列,所述核苷酸序列选自表2和3中所列的核苷酸序列。
43.一种载体,其含有权利要求42的核酸分子。
44.一种宿主细胞,其含有权利要求42的核酸分子。
45.一种分离的多肽,其由一种核酸分子编码,所述核酸分子包含一种核苷酸序列,所述核苷酸序列选自SEQ ID NOs:1,7,9,11,17,19,21,23,25,27,33和43的核苷酸序列。
46.一种抗体,其选择性结合权利要求45的多肽。
47.一种分离的多肽,其包含一种氨基酸序列,所述氨基酸序列选自SEQ ID NOs:2,8,10,20,22,26,28和44的氨基酸序列。
48.一种抗体,其选择性结合权利要求47的多肽。
CN03824456XA 2002-08-20 2003-08-20 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法 Expired - Fee Related CN101044247B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US40477002P 2002-08-20 2002-08-20
US60/404,770 2002-08-20
PCT/US2003/026184 WO2004018999A2 (en) 2002-08-20 2003-08-20 Compositions, kits, and methods for identification, assessment, prevention, and therapy of cervical cancer

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2011101186127A Division CN102220423A (zh) 2002-08-20 2003-08-20 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法

Publications (2)

Publication Number Publication Date
CN101044247A true CN101044247A (zh) 2007-09-26
CN101044247B CN101044247B (zh) 2011-06-22

Family

ID=31946760

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2011101186127A Pending CN102220423A (zh) 2002-08-20 2003-08-20 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法
CN03824456XA Expired - Fee Related CN101044247B (zh) 2002-08-20 2003-08-20 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2011101186127A Pending CN102220423A (zh) 2002-08-20 2003-08-20 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法

Country Status (9)

Country Link
US (3) US7361511B2 (zh)
EP (6) EP2311980A1 (zh)
JP (2) JP2006514823A (zh)
KR (1) KR20050058407A (zh)
CN (2) CN102220423A (zh)
AT (1) ATE519862T1 (zh)
AU (1) AU2003265556A1 (zh)
CA (1) CA2496272A1 (zh)
WO (1) WO2004018999A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109198732A (zh) * 2018-08-20 2019-01-15 苏州晞光生物科技有限公司 一种智能化可穿戴检测人体分泌物的服装及测试方法
CN113474659A (zh) * 2018-12-20 2021-10-01 阿奎尔诊断有限公司 Mcm5作为妇科癌症标记物的用途

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7579160B2 (en) * 1998-03-18 2009-08-25 Corixa Corporation Methods for the detection of cervical cancer
US7125663B2 (en) * 2001-06-13 2006-10-24 Millenium Pharmaceuticals, Inc. Genes, compositions, kits and methods for identification, assessment, prevention, and therapy of cervical cancer
US7482116B2 (en) 2002-06-07 2009-01-27 Dna Genotek Inc. Compositions and methods for obtaining nucleic acids from sputum
JP2006514823A (ja) * 2002-08-20 2006-05-18 ミレニアム ファーマスーティカルズ インク 子宮頸癌の同定、評価、予防および治療を行うための組成物、キットおよび方法
EP2072619A1 (en) * 2002-10-18 2009-06-24 Silence Therapeutics Aktiengesellschaft Factor involved in metastasis and uses thereof
WO2006007980A2 (en) * 2004-07-16 2006-01-26 Oncomethylome Sciences S. A. Esr1 and cervical cancer
CA2577423C (en) 2004-08-16 2012-11-06 Quark Biotech, Inc. Therapeutic uses of inhibitors of rtp801
ES2525545T3 (es) 2005-09-19 2014-12-26 Janssen Diagnostics, Llc Métodos y usos para identificar el origen de un carcinoma de origen primario desconocido
AT502722B8 (de) * 2005-10-31 2009-08-15 Bmt Medizinische Forschung Und Verwendung des interferon induzierten gens 12 (isg 12, ifi 27) zur modulation transkriptioneller aktivitäten von nuklearen rezeptoren
JP4960972B2 (ja) * 2005-12-30 2012-06-27 ベンタナ・メデイカル・システムズ・インコーポレーテツド 子宮頸部異形成および子宮頸癌におけるNa+、K+−ATPアーゼの発現
NL2000439C2 (nl) 2006-01-20 2009-03-16 Quark Biotech Therapeutische toepassingen van inhibitoren van RTP801.
US7723052B2 (en) 2006-05-11 2010-05-25 Quark Pharmaceuticals, Inc. Screening systems utilizing RTP801
EP2026843A4 (en) 2006-06-09 2011-06-22 Quark Pharmaceuticals Inc THERAPEUTIC USES OF RTP801L INHIBITORS
US7872119B2 (en) 2007-02-26 2011-01-18 Quark Pharmaceuticals, Inc. Inhibitors of RTP801 and their use in disease treatment
US8614311B2 (en) 2007-12-12 2013-12-24 Quark Pharmaceuticals, Inc. RTP801L siRNA compounds and methods of use thereof
JP5526378B2 (ja) * 2009-03-05 2014-06-18 国立大学法人山口大学 子宮頸癌の検出方法
US20120053080A1 (en) * 2009-03-09 2012-03-01 Juan Cui Protein markers identification for gastric cancer diagnosis
WO2010138171A2 (en) * 2009-05-23 2010-12-02 Incube Labs, Llc Methods for cancer treatment using stem cells
US9144586B2 (en) 2010-04-07 2015-09-29 Incube Labs, Llc Method for treating glucose related disorders using stem cell-derived gastro-intestinal cells
CN102372773B (zh) 2010-08-11 2013-06-05 中国科学院生物物理研究所 人膀胱癌肿瘤标志物及其抗体和应用
MX347611B (es) * 2011-06-19 2017-05-04 Abogen Inc Dispositivos, soluciones y metodos para recoleccion de muestras.
US9804160B2 (en) 2011-09-28 2017-10-31 H. Lee Moffitt Cancer Center And Research Institute, Inc. Protein-protein interaction as biomarkers
EP2816500A4 (en) 2011-12-23 2015-01-21 Yudigar S L U DEVICE AND METHOD FOR SEPARATION
JP5876359B2 (ja) * 2012-03-30 2016-03-02 シスメックス株式会社 癌化情報提供方法および癌化情報提供装置
CN110527728A (zh) * 2013-08-08 2019-12-03 纽约州州立大学研究基金会 作为子宫颈癌和存活期的生物标记物的角蛋白
AU2016247894A1 (en) 2015-04-13 2017-10-26 Aduro Biotech, Inc. Immunogenic fusion proteins for the treatment of cancer
BR112017022076A2 (pt) 2015-04-13 2018-08-14 Aduro Biotech, Inc. fusões de mesotelina-variante iii de receptor de fator de crescimento epidérmico e métodos de uso das mesmas
US10487365B2 (en) 2016-09-20 2019-11-26 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Methods for detecting expression of lnc-FANCI-2 in cervical cells

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4873191A (en) 1981-06-12 1989-10-10 Ohio University Genetic transformation of zygotes
US4522811A (en) 1982-07-08 1985-06-11 Syntex (U.S.A.) Inc. Serial injection of muramyldipeptides and liposomes enhances the anti-infective activity of muramyldipeptides
US4870009A (en) 1982-11-22 1989-09-26 The Salk Institute For Biological Studies Method of obtaining gene product through the generation of transgenic animals
GB8308235D0 (en) 1983-03-25 1983-05-05 Celltech Ltd Polypeptides
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US4736866A (en) 1984-06-22 1988-04-12 President And Fellows Of Harvard College Transgenic non-human mammals
JPS6147500A (ja) 1984-08-15 1986-03-07 Res Dev Corp Of Japan キメラモノクロ−ナル抗体及びその製造法
EP0173494A3 (en) 1984-08-27 1987-11-25 The Board Of Trustees Of The Leland Stanford Junior University Chimeric receptors by dna splicing and expression
GB8422238D0 (en) 1984-09-03 1984-10-10 Neuberger M S Chimeric proteins
JPS61134325A (ja) 1984-12-04 1986-06-21 Teijin Ltd ハイブリツド抗体遺伝子の発現方法
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4676980A (en) 1985-09-23 1987-06-30 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Target specific cross-linked heteroantibodies
AU606320B2 (en) 1985-11-01 1991-02-07 International Genetic Engineering, Inc. Modular assembly of antibody genes, antibodies prepared thereby and use
US4868103A (en) 1986-02-19 1989-09-19 Enzo Biochem, Inc. Analyte detection by means of energy transfer
US5225539A (en) 1986-03-27 1993-07-06 Medical Research Council Recombinant altered antibodies and methods of making altered antibodies
DE122007000007I2 (de) 1986-04-09 2010-12-30 Genzyme Corp Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern
US4902505A (en) 1986-07-30 1990-02-20 Alkermes Chimeric peptides for neuropeptide delivery through the blood-brain barrier
US6121424A (en) 1991-11-25 2000-09-19 Enzon, Inc. Multivalent antigen-binding proteins
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US4904582A (en) 1987-06-11 1990-02-27 Synthetic Genetics Novel amphiphilic nucleic acid conjugates
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5080891A (en) 1987-08-03 1992-01-14 Ddi Pharmaceuticals, Inc. Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols
US4843155A (en) 1987-11-19 1989-06-27 Piotr Chomczynski Product and process for isolating RNA
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
DE68927933T2 (de) 1988-09-02 1997-08-14 Dyax Corp Herstellung und auswahl von rekombinantproteinen mit verschiedenen bindestellen
US5530101A (en) 1988-12-28 1996-06-25 Protein Design Labs, Inc. Humanized immunoglobulins
FR2646438B1 (fr) 1989-03-20 2007-11-02 Pasteur Institut Procede de remplacement specifique d'une copie d'un gene present dans le genome receveur par l'integration d'un gene different de celui ou se fait l'integration
US5328470A (en) 1989-03-31 1994-07-12 The Regents Of The University Of Michigan Treatment of diseases by site-specific instillation of cells or site-specific transformation of cells and kits therefor
KR100226158B1 (ko) 1989-07-25 1999-10-15 스티븐 에이. 서윈. 엠.디. 만능공급세포 및 잡종 포유동물 숙주를 위한 동종 재조합
US5427908A (en) 1990-05-01 1995-06-27 Affymax Technologies N.V. Recombinant library screening methods
GB9015198D0 (en) 1990-07-10 1990-08-29 Brien Caroline J O Binding substance
MA22668A1 (fr) 1990-07-10 1993-07-01 Smithkline Beecham Corp Procede de preparation d'oxamides .
ATE185601T1 (de) 1990-07-10 1999-10-15 Cambridge Antibody Tech Verfahren zur herstellung von spezifischen bindungspaargliedern
US5625126A (en) 1990-08-29 1997-04-29 Genpharm International, Inc. Transgenic non-human animals for producing heterologous antibodies
KR100272077B1 (ko) 1990-08-29 2000-11-15 젠팜인터내셔날,인코포레이티드 이종 항체를 생산할 수 있는 전이유전자를 가진 인간이외의 동물
US5661016A (en) 1990-08-29 1997-08-26 Genpharm International Inc. Transgenic non-human animals capable of producing heterologous antibodies of various isotypes
US5633425A (en) 1990-08-29 1997-05-27 Genpharm International, Inc. Transgenic non-human animals capable of producing heterologous antibodies
US5545806A (en) 1990-08-29 1996-08-13 Genpharm International, Inc. Ransgenic non-human animals for producing heterologous antibodies
ATE164395T1 (de) 1990-12-03 1998-04-15 Genentech Inc Verfahren zur anreicherung von proteinvarianten mit geänderten bindungseigenschaften
CA2100352A1 (en) * 1991-01-11 1992-07-12 Dean Sheppard Integrin .beta. subunit and uses thereof
EP0575485A1 (en) 1991-03-01 1993-12-29 Dyax Corp. Process for the development of binding mini-proteins
WO1992018619A1 (en) 1991-04-10 1992-10-29 The Scripps Research Institute Heterodimeric receptor libraries using phagemids
DE4122599C2 (de) 1991-07-08 1993-11-11 Deutsches Krebsforsch Phagemid zum Screenen von Antikörpern
US5962643A (en) * 1991-07-11 1999-10-05 The Regents Of The University Of California Integrin β subunit and uses thereof
AU2515992A (en) 1991-08-20 1993-03-16 Genpharm International, Inc. Gene targeting in animal cells using isogenic dna constructs
US5621083A (en) 1991-11-04 1997-04-15 Xoma Corporation Immunotoxins comprising ribosome-inactivating proteins
EP0552108B1 (en) 1992-01-17 1999-11-10 Lakowicz, Joseph R. Energy transfer phase-modulation fluoro-immunoassay
EP0672131B1 (en) 1992-10-30 2003-12-17 The General Hospital Corporation A novel cell cycle control protein
US5538848A (en) 1994-11-16 1996-07-23 Applied Biosystems Division, Perkin-Elmer Corp. Method for detecting nucleic acid amplification using self-quenching fluorescence probe
GB9517780D0 (en) 1995-08-31 1995-11-01 Roslin Inst Edinburgh Biological manipulation
GB9517779D0 (en) 1995-08-31 1995-11-01 Roslin Inst Edinburgh Biological manipulation
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US6033862A (en) 1996-10-30 2000-03-07 Tokuyama Corporation Marker and immunological reagent for dialysis-related amyloidosis, diabetes mellitus and diabetes mellitus complications
AU8901198A (en) * 1997-08-06 1999-03-01 Millennium Pharmaceuticals, Inc. Tango-71, tango-73, tango-74, tango-76, and tango-83 nucleic acid molecules and polypeptides
AU751754B2 (en) * 1997-10-21 2002-08-29 Cancer Research Technology Limited Determination of cellular growth abnormality
WO2001042467A2 (en) * 1999-12-08 2001-06-14 Millennium Pharmaceuticals, Inc. Genes, compositions, kits, and methods for identification, assessment, prevention, and therapy of cervical cancer
US20020009724A1 (en) * 1999-12-08 2002-01-24 Robert Schlegel Compositions, kits, and methods for identification, assessment, prevention, and therapy of cervical cancer
AU750296B2 (en) * 2000-06-23 2002-07-11 F. Hoffmann-La Roche Ag Antibodies against SEMP1, methods for their production and uses thereof
GB2364921A (en) * 2000-07-18 2002-02-13 Collinson Jones Anthony Golf ball cleaning apparatus
GB0018140D0 (en) * 2000-07-24 2000-09-13 Medical Res Council Screening for abnormalities
AUPQ901700A0 (en) * 2000-07-26 2000-08-17 National Cancer Centre Of Singapore Pte Ltd Molecular markers
JP2004509629A (ja) * 2000-09-19 2004-04-02 ホワイトヘッド インスチチュート フォアー バイオメディカル リサーチ 腫瘍に対する遺伝子マーカー
US20030138792A1 (en) 2001-05-31 2003-07-24 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention and therapy of cervical cancer
US7125663B2 (en) * 2001-06-13 2006-10-24 Millenium Pharmaceuticals, Inc. Genes, compositions, kits and methods for identification, assessment, prevention, and therapy of cervical cancer
DE10211088A1 (de) * 2002-03-13 2003-09-25 Ugur Sahin Differentiell in Tumoren exprimierte Genprodukte und deren Verwendung
JP2006514823A (ja) 2002-08-20 2006-05-18 ミレニアム ファーマスーティカルズ インク 子宮頸癌の同定、評価、予防および治療を行うための組成物、キットおよび方法
MXPA06011020A (es) * 2004-03-24 2007-08-14 Tripath Imaging Inc Metodos y composiciones para la deteccion de una enfermedad cervical.

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109198732A (zh) * 2018-08-20 2019-01-15 苏州晞光生物科技有限公司 一种智能化可穿戴检测人体分泌物的服装及测试方法
CN113474659A (zh) * 2018-12-20 2021-10-01 阿奎尔诊断有限公司 Mcm5作为妇科癌症标记物的用途

Also Published As

Publication number Publication date
JP2006514823A (ja) 2006-05-18
ATE519862T1 (de) 2011-08-15
AU2003265556A1 (en) 2004-03-11
EP2311978A1 (en) 2011-04-20
JP2011036247A (ja) 2011-02-24
AU2003265556A8 (en) 2004-03-11
EP1565581A2 (en) 2005-08-24
US20080286781A1 (en) 2008-11-20
EP2311979A1 (en) 2011-04-20
US7361511B2 (en) 2008-04-22
WO2004018999A2 (en) 2004-03-04
US20120264625A1 (en) 2012-10-18
EP1565581A4 (en) 2008-01-02
WO2004018999A3 (en) 2005-06-30
EP1565581B1 (en) 2011-08-10
EP2311980A1 (en) 2011-04-20
KR20050058407A (ko) 2005-06-16
CN102220423A (zh) 2011-10-19
CA2496272A1 (en) 2004-03-04
EP2314716A1 (en) 2011-04-27
EP2305836A1 (en) 2011-04-06
CN101044247B (zh) 2011-06-22
US20050037010A1 (en) 2005-02-17

Similar Documents

Publication Publication Date Title
CN101044247A (zh) 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法
CN1839205A (zh) 用于鉴定、评估、预防和治疗乳腺癌的组合物、试剂盒及方法
US20030108963A1 (en) Novel genes, compositions, kit, and methods for identification, assessment, prevention and therapy of prostate cancer
US20060068425A1 (en) Genes, compositions, kits, and methods for identification, assessment, prevention, and therapy of prostate cancer
US20030087250A1 (en) Nucleic acid molecules and proteins for the identification, assessment, prevention, and therapy of ovarian cancer
WO2001060860A2 (en) Genes differentially expressed in human prostate cancer and their use
WO2001053836A9 (en) Identification, assessment, prevention, and therapy of prostate cancer
WO2002101075A2 (en) Novel genes, compositions, kits, and methods for identification, assessment, prevention, and therapy of cervical cancer
WO2003004989A2 (en) Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
WO2001070979A9 (en) Genes, compositions, kits, and method for identification, assessment, prevention and therapy of ovarian cancer
CN1890381A (zh) 诊断乳腺癌的方法
CN1745299A (zh) 针对以活化素βc水平的调节为特征的病症的诊断、治疗方法和有用试剂
CN1653080A (zh) 淋巴管和血管的内皮细胞基因
CN1526025A (zh) 作为预后和治疗靶标的乳腺癌中表达的基因
WO2003050243A2 (en) Novel genes encoding colon cancer antigens
CN1367830A (zh) 癌症相关抗原及其应用
CN1680441A (zh) 新型化合物
CN1646692A (zh) 在肿瘤中差异表达的基因产物及其用途
CN1592793A (zh) 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法
CN1609616A (zh) 糖尿病的特异性标记
CN101065393A (zh) 用于结肠直肠癌早期检测的药物筛选和分子诊断检测:试剂、方法及其试剂盒
WO2005015236A2 (en) A method for predicting the progression of adenocarcinoma
CN1619312A (zh) 代谢综合征的特异标记
CN101039956A (zh) 细胞表面糖蛋白
CN1229386C (zh) 具有抑癌功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110622

Termination date: 20130820