CN1259998A - 修饰的成视网膜细胞瘤肿瘤抑制蛋白 - Google Patents

修饰的成视网膜细胞瘤肿瘤抑制蛋白 Download PDF

Info

Publication number
CN1259998A
CN1259998A CN98802742A CN98802742A CN1259998A CN 1259998 A CN1259998 A CN 1259998A CN 98802742 A CN98802742 A CN 98802742A CN 98802742 A CN98802742 A CN 98802742A CN 1259998 A CN1259998 A CN 1259998A
Authority
CN
China
Prior art keywords
amino acid
cell
dna fragmentation
approximately
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN98802742A
Other languages
English (en)
Inventor
H·J·徐
S·X·胡
W·F·贝内迪特
Y·L·周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baylor College of Medicine
University of Texas System
Original Assignee
Baylor College of Medicine
University of Texas System
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baylor College of Medicine, University of Texas System filed Critical Baylor College of Medicine
Publication of CN1259998A publication Critical patent/CN1259998A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4736Retinoblastoma protein
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2799/00Uses of viruses
    • C12N2799/02Uses of viruses as vector
    • C12N2799/021Uses of viruses as vector for the expression of a heterologous nucleic acid
    • C12N2799/022Uses of viruses as vector for the expression of a heterologous nucleic acid where the vector is derived from an adenovirus

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Toxicology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明公开了修饰的广谱的成视网膜细胞瘤肿瘤抑制剂蛋白质,其具有至少相同的,在大多数情况下比相应的野生型成视网膜细胞瘤肿瘤抑制剂蛋白质高的生物活性。例示的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质具有修饰的N-末端区,特别是包括一个或多个缺失和/或突变。也公开了制备和使用修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质的方法,特别是在其中期望抑制细胞生长的环境下。因此本发明公开提供治疗疾病的方法,例如但不限于特征在于不正常细胞增殖的癌症。

Description

修饰的成视网膜细胞瘤肿瘤抑制蛋白
发明背景
本申请要求在此全文被引作参考未放弃的1997年2月20日提出的悬而未决的美国临时专利申请系列号60/038,118的优先权。按照全国健康协会的拨款号R01-CA 67274和R01-05195以及得克萨斯州高等教育联合会的拨款号ATP004949018,政府享有本发明的权利。
1.发明领域
本发明通常涉及分子和细胞生物学领域。更具体地说,它涉及成视网膜细胞瘤肿瘤抑制剂。本发明进一步涉及本申请修饰的成视网膜细胞瘤肿瘤抑制剂在需要提供肿瘤抑制剂或正常细胞生长抑制剂的情况中的应用。
2.相关现有技术的说明
在美国癌症和肿瘤是导致死亡的第二大最普遍的原因,每年导致约450,000例的死亡。三个美国人中有一个可患有癌症,五个中的一个就死于癌症(科学美国药物,第12部分,I,I,节,注明日期为1987)。虽然在确定癌症的一些可能的环境以及遗传原因方面已取得了实质性的进展,但对癌症死亡速率的统计数据表明在治疗癌症和相关疾病和疾症方面需要实质性的进展。
许多基因与癌症的病因学相关。这些基因被确定与癌症的遗传类型以及大量的被透彻研究的肿瘤细胞相关。癌症基因的研究有助于提供对肿瘤发生的过程的一些了解。虽然仍需了解大量有关癌症基因的情况,但目前已知的癌症基因起着了解肿瘤发生的有用的模型的作用。癌症基因广义的被分为当被活化时促进肿瘤发生的“癌基因”和在被损伤时不能抑制肿瘤发生的“肿瘤抑制基因”。虽然这些分类提供了有利的用于概念化肿瘤发生的方法,但取决于该基因特定的等位基因、其调节成分、遗传背景和它在其中操作的组织环境,特定的基因也可能起不同的作用。
癌基因为从其野生型等位基因(现有技术将这些野生型等位基因称为原癌基因)突变成在某些情况下能诱导肿瘤发生的形式的体细胞基因。目前有许多关于已知和推测的癌基因和这些癌基因的各种等位基因的文献。例如,癌基因ras和myc被认为用于一般性了解癌基因过程的模型。ras癌基因被编码细胞质蛋白和myc癌基因被认为编码核蛋白。ras癌基因和myc癌基因单独不能诱导正常细胞完全转化为肿瘤细胞,但当ras和myc癌细胞在相同细胞中共同存在并表达时通常发生完全的肿瘤发生(Weinberg,1989)。在许多其它研究的癌基因中已观察到这种协同作用。
癌基因的肿瘤发生的协同作用的模型必须通过被正常细胞围绕的表达ras癌基因的细胞不进行完全转化的观察来确定。然而,如果大多数围绕的细胞也表达ras,那么仅ras癌基因就足以诱导表达ras细胞中的肿瘤发生。由于拥有癌基因的细胞的组织环境的变化可能被认为是第二个标的,因此这种观察结果证实了肿瘤发生的多个标的理论。另一个和同样合理的假设是与癌基因,如ras或myc的活化协同作用的事件可能包括负调节因子或因子,即肿瘤抑制蛋白的失活(Weinberg,1989;Goodrich等,1992a)。
肿瘤抑制基因为其野生型等位基因的表达抑制异常细胞增殖的蛋白的基因。当编码肿瘤抑制蛋白的基因被突变或缺失时,产生的突变的蛋白或肿瘤抑制蛋白的完全缺乏可能不能正确地调节细胞增殖。这导致异常的细胞增殖,尤其是如果已存在细胞调节机理的损伤时。细胞增殖的控制的缺乏已被与各种人类癌症的发生联系在一起(Weinberg,1991)。许多透彻研究的人类肿瘤和肿瘤细胞系已显示丧失或肿瘤抑制基因异常。
肿瘤抑制基因和代表性肿瘤抑制基因的实例包括,但不局限于成视网膜细胞瘤(RB)基因(Friend等,1986;Fung等,1987;Lee等1987a)、野生型p53基因(Finlay等,1989;Baker等,1990)、缺失的结肠癌(DCC)基因(Fearon等,1990a;1990b)、神经纤维瘤1型(NF-1)基因(Wallace等,1990;Viskochi等,1990;Cawthon等,1990)、维耳姆斯氏瘤(WT-1)基因Call等,1990;Gessler等,1990;Pritchard-Jones等,1990)、von Hippel-Lindau(VHL)疾病肿瘤抑制基因(Daun等,1995)、Maspin(Zou等,1994)、Brush-1(Schott等,1994)和乳腺癌BRCA 1基因(Miki等,1994;Futreal等,1994)和多发性肿瘤抑制因子(MTS)或p16基因(Serrano等,1993;Kamb等,1994)。推测的肿瘤因子基因的目录非常大并正在增加,肿瘤抑制基因的总的数量被预期远远超过50个(Knudson,1993)。
确定的第一个肿瘤抑制基因为导致遗传成视网膜细胞瘤的成视网膜细胞瘤(RB)基因(Knudson,1971;Murphree和Benedict,1984;Knudson,1985)。于二十世纪八十年代中期被克隆的成视网膜细胞瘤(RB)基因是一个研究得最透彻的肿瘤抑制基因。RB基因互补DNA(cDNA)的约4.71kb的大小使得能很容易地进行基因操作,并导致RB基因插入到许多细胞系中。在大多数成视网膜细胞瘤、软组织和骨肉瘤以及约20%-40%乳腺、肺、前列腺和膀胱癌中RB基因显示为失去或缺失(Lee等,WO90/05180;Bookstein等,1991;Benedict等,1990)。
克隆的RB基因的确是肿瘤抑制剂基因的最直接的证据是在来自RB基因的被克隆的完整拷贝的导入的RB-负型肿瘤细胞中的肿瘤抑制功能的所观察的发现。许多报道表明在来自不同类型的人类癌症的RB缺损肿瘤细胞中的正常RB基因的取代可抑制其在裸鼠中的肿瘤发生活性(Huzamg等,1988;Goodrich和Lee,1993;Zhou等,1994b)。研究的肿瘤细胞系来源于各种不同类型的人类癌症,如成视网膜细胞瘤、骨肉瘤、膀胱、前列腺、乳腺和肺癌。
虽然观察到功能性的野生型全长成视网膜细胞瘤基因(RB110)导入RB负型肿瘤细胞使细胞“正常化”,但未预测到已经具有正常RB110基因表达(“RB+”)的肿瘤细胞将对RB110基因治疗产生应答,因为推测加入的另外的RB的表达不能校正非RB遗传缺损。这事实上已显示了RB+骨肉瘤细胞系U-2OS的情况,其中额外的p110RB编码基因的导入未改变瘤性表型(Huang等,1988)。因此,仍需要用于治疗具有任何类型的遗传缺陷的异常增殖细胞的广谱治疗肿瘤抑制基因。
RB110cDNA开放读框序列(McGee等,1989)包含位于核苷酸355-357的外显子3中的第二个框内AUG密码子。从该第二个AUG密码子起始的蛋白缺乏全长RB蛋白的N-末端112个氨基酸残基,并被称为pRB94(Xu等,1994b)。在美国专利5,496,731(被本文引作参考)中,发明人指出如通过其未将[3h]胸苷掺入DNA所证实的,表达外源pRB94的RB缺损肿瘤细胞在细胞周期中不发展。相反,在产生外源pRB110(野生型pRB蛋白)的细胞中的进行DNA复制的肿瘤细胞的百分数仅略低于RB-细胞。甚至更令人惊奇的是pRB94的表达还显著降低检测的两个RB+(具有正常的RB等位基因)肿瘤细胞系的菌落的形成,即纤维肉瘤细胞系,HT1080和子宫癌细胞系,Hela(Xu等,1994b),同时当通过使用质粒载体的转染(Fung等,1993)或通过微细胞融合(Anderson等,1994)导入另外的pRB110编码基因时未观察到这种效果。
然而,现有技术中有少量具有易于其用于治疗疾病,尤其是癌症的所必需的所有性质的肿瘤抑制蛋白。
发明概述
本发明的修饰的成视网膜细胞瘤肿瘤抑制剂克服了现有技术中描述的那些缺点,提供具有出乎意料的有利效果的广谱肿瘤抑制剂。
本发明提供在抑制细胞生长方面出乎意外地至少作为有效,在大多数情况下比相应的野生型成视网膜细胞瘤肿瘤抑制蛋白更有效的广谱修饰的成视网膜细胞瘤肿瘤抑制蛋白。在具体的实施方案中,本发明提供具有修饰的N-末端区的成视网膜细胞瘤肿瘤抑制蛋白。本发明进一步提供制备和使用修饰的成视网膜细胞瘤肿瘤抑制蛋白的方法,尤其是在其中希望细胞生长抑制的环境中。因此,本发明提供治疗特征在于异常的细胞增殖的疾病,例如,但不局限于癌症的方法。
广谱肿瘤抑制基因为当被插入并在异常增殖宿主细胞,例如肿瘤细胞中表达时,不管异常增殖的原因而抑制该细胞异常增殖的编码蛋白的基因序列。
因此,本发明提供包含编码非pRB94或pRB56的修饰的成视网膜细胞瘤肿瘤抑制蛋白的分离基因的分离DNA片段,其中修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端修饰。术语“pRB94”和“pRB56”指分别具有94kD和56kD分子量的成视网膜细胞瘤蛋白。如现有技术中指出的,pRB94或pRB56成视网膜细胞瘤蛋白为从N-末端分别缺失112和379个连续氨基酸的全长野生型成视网膜细胞瘤蛋白的片段。
如本文所采用的,术语“N-末端”或“N-末端区”被理解为指对应于氨基酸序列的开始约40%的蛋白区。因此,这些术语被理解为包括高达约蛋白质氨基酸序列开始的5%,开始的10%,开始的15%,开始的20%,开始的25%,开始的30%,或开始的35%。然而,这些值仅为近似值,因此被理解为包括中间值,如2%、3%、6%、7%、11%、13%、17%、18%、22%、26%、33%、37%、38%、41%、42%等。
如本文所采用的,术语“修饰的”指野生型蛋白序列的缺失和/或突变。在一些具体实施方案中,它还可指将一个或多个异源氨基酸插入到野生型蛋白序列中。在其它方面,该术语可指野生型氨基酸序列的翻译后改变。
在本发明的另一个具体实施方案中,基因编码修饰的成视网膜细胞瘤肿瘤抑制蛋白,其中该蛋白包含含有至少一个氨基酸从中缺失的开始的序列区的N-末端区。缺失可产生具有与相应的野生型成视网膜细胞瘤肿瘤抑制蛋白的生物活性相同或在一些具体实施方案中大于它的修饰的成视网膜细胞瘤肿瘤抑制蛋白。
在本发明的一个具体的实施方案中,基因编码修饰的成视网膜细胞瘤肿瘤抑制蛋白,其中至少两个氨基酸从开始的序列区缺失。在本发明的另一个具体实施方案中,至少约5个氨基酸,至少约10个氨基酸,至少约25个氨基酸,至少约50个氨基酸,至少约75个氨基酸或至少约100个氨基酸从开始的序列区缺失。应理解也可设计中间值大小的缺失,但不局限于
3,4,6,7,8,9,11,12,13,14,15,16,17,18,19,20,21,22,23,24,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95, 96,97,98或99氨基酸等。
在本发明的另一个方面,基因编码修饰的成视网膜细胞瘤肿瘤抑制蛋白,其中至少约150个氨基酸,至少约200个氨基酸,至少约250个氨基酸,至少约300个氨基酸,或至少约370个氨基酸从开始的序列区缺失。然而,还提供了中间值大小的缺失,例如,但不局限于
                         101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,119,120,121,122,123,124,125,126,127,128,129,130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146,147,148,149,151,152,153,154,155,156,157,158,159,160,161,162,163,164,165,166,167,168,169,170,171,172,173,174,175,176,177,178,179,180,181,182,183,184,185,186,187,188,189,190,191,192,193,194,195,196,197,198,199,200,201,202,203,204,205,206,207,208,209,210,211,212,213,214,215,216,217,218,219,220,221,222,223,224,225,226,227,228,229,230,231,232,233,234,235,236,237,238,239,240,241,242,243,244,245,246,247,248,249,251,252,253,254,255,256,257,258,259,260,261,262,263,264,265,266,267,268,269,270,271,272,273,274,275,276,277,278,279,280,281,282,283,284,285,286,287,288,289,290,291,292,293,294,295,296,297,298,299,301,302,303,304,305,306,307,308,309,310,311,312,313,314,315,316,317,318,319,320,321,322,323,324,325,326,327,328,329,330,331,332,333,334,335,336,337,338,339,340,341,342,343,344,345,346,347,348,349,350,351,352,353,354,355,356,357,358,359,360,361,362,363,364,365,366,367,368,369,371,372,373,374,375,376,377或378氨基酸缺失。其它中间值被公开在说明书中。
在本发明的一个具体实施方案中,基因编码修饰的成视网膜细胞瘤肿瘤抑制蛋白,其中该蛋白包含含有至少一个位于从中至少一个氨基酸被缺失的约氨基酸1和约氨基酸50之间的开始序列区的N-末端区。应理解“约氨基酸1和约氨基酸50之间”包括氨基酸1和氨基酸50,对于本文描述的其它缺失也是如此。氨基酸1为N-末端氨基酸,朝C-末端数目增加。
在本发明的另一个具体实施方案中,开始的序列区位于大约氨基酸51与大约氨基酸100之间,大约氨基酸101与大约氨基酸150之间,大约氨基酸151与大约氨基酸200之间,大约氨基酸201与大约氨基酸250之间或大约氨基酸251与大约氨基酸300之间。
在本发明的其它具体实施方案中,基因编码修饰的成视网膜细胞瘤肿瘤抑制蛋白,其中开始的序列区位于大约氨基酸1与大约氨基酸100之间,大约氨基酸51与大约氨基酸150之间,大约氨基酸101与大约氨基酸200之间,大约氨基酸151与大约氨基酸250之间或大约氨基酸201与大约氨基酸300之间。
在本发明一个具体的方面,基因编码修饰的成视网膜细胞瘤肿瘤抑制蛋白,其中开始的序列区位于大约氨基酸1与大约氨基酸150之间。在本发明其它的方面,开始的序列区位于大约氨基酸51与大约氨基酸200之间,大约氨基酸101与大约氨基酸250之间或大约氨基酸151与大约氨基酸300之间。
在本发明的另外的具体实施方案中,基因编码修饰的成视网膜细胞瘤肿瘤抑制蛋白,其中开始的序列区位于大约氨基酸1与大约氨基酸200之间,大约氨基酸51与大约氨基酸250之间,大约氨基酸101与大约氨基酸300之间,大约氨基酸1与大约氨基酸250之间,大约氨基酸51与大约氨基酸300之间,大约氨基酸1与大约氨基酸300之间或大约氨基酸1与大约氨基酸370之间。
在本发明其它方面,修饰的成视网膜细胞瘤肿瘤抑制蛋白为修饰的成视网膜细胞瘤蛋白,其中大约氨基酸2至大约氨基酸34被从开始的序列区中缺失。这些具体的氨基酸的位置参考人野生型成视网膜细胞瘤蛋白,但应被理解为对应于同源成视网膜细胞瘤蛋白的类似区。在本发明其它具体实施方案中,大约氨基酸2至大约氨基酸55从开始的序列区中缺失。在本发明其它具体实施方案中,大约氨基酸2至大约氨基酸78从开始的序列区中缺失。在本发明一个特定的方面,大约氨基酸2至大约氨基酸97从开始的序列区中缺失。在本发明一个其它的方面,大约氨基酸2至大约氨基酸148从开始的序列区中缺失。
在本发明其它的方面,修饰的成视网膜细胞瘤肿瘤抑制蛋白为修饰的成视网膜细胞瘤蛋白,其中大约氨基酸31至大约氨基酸107从开始的序列区中缺失。在本发明其它的具体实施方案中,大约氨基酸77至大约氨基酸107从开始的序列区中缺失。在本发明另一个具体实施方案中,大约氨基酸111至大约氨基酸181从开始的序列区中缺失。在本发明其它的具体实施方案中,大约氨基酸111至大约氨基酸241从开始的序列区中缺失。在本发明其它的具体实施方案中,大约氨基酸181至大约氨基酸241从开始的序列区中缺失。在本发明一个特别的具体实施方案中,大约氨基酸242至大约氨基酸300从开始的序列区中缺失。
在本发明的一个方面,修饰的成视网膜细胞瘤蛋白的N-末端区进一步包含至少一个氨基酸从中缺失的至少一个第二个序列区。在本发明的一个特定的方面,大约氨基酸2至大约氨基酸34,大约氨基酸76至大约氨基酸112缺失。在本发明另一个方面,大约氨基酸2至大约氨基酸55,和大约氨基酸76至大约氨基酸112缺失。
本发明的另一个具体实施方案提供了包含编码非pRB94的修饰的成视网膜细胞瘤肿瘤抑制蛋白的分离基因的DNA片段,其中修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端修饰,其中基因编码包含至少第一个N末端突变的修饰的成视网膜细胞瘤肿瘤抑制蛋白,并且其中与相应的野生型成视网膜细胞瘤肿瘤抑制蛋白的生物活性相比,该成视网膜细胞瘤肿瘤抑制蛋白具有增加的生物活性。在本发明的一个具体实施方案中,基因编码在位置111包含一个突变的修饰的成视网膜细胞瘤蛋白。在本发明另一个具体实施方案中,修饰的成视网膜细胞瘤蛋白在位置111含有甘氨酸代替天冬氨酸。
在本发明另一个具体实施方案中,修饰的成视网膜细胞瘤肿瘤抑制蛋白包含至少一个第二个N-末端突变。在本发明其它的具体实施方案中,基因编码包含位置111突变和位置112突变的修饰的成视网膜细胞瘤蛋白。在本发明的其它具体实施方案中,修饰的成视网膜细胞瘤蛋白在位置111包含甘氨酸代替天冬氨酸和112位天冬氨酸代替谷氨酸。在本发明的一个具体的实施方案中,基因编码包含至少一个氨基酸从中缺失的N-末端区并包含至少一个氨基酸突变的修饰的成视网膜细胞瘤肿瘤抑制蛋白。
在本发明的一个方面,基因编码包含从至少大约SEQ ID NO:2的位置370至约位置928的连续的氨基酸序列的修饰的成视网膜细胞瘤肿瘤抑制蛋白。在本发明另一个方面,基因编码包含从至少大约SEQ ID NO:2的位置3至约位置928的连续的氨基酸序列的修饰的成视网膜细胞瘤肿瘤抑制蛋白。当用于本文中时,“连续的氨基酸序列”被理解为至少大约8,大约10,大约12,大约15,大约20,大约25,大约50或大约100个氨基酸至全长氨基酸序列的连续氨基酸序列。
在本发明的另一个方面,基因编码包含SEQ ID NO:29的连续的氨基酸序列的修饰的成视网膜细胞瘤肿瘤抑制蛋白。在本发明另一个方面,基因包含SEQ IDNO:28的位置7至位置2691的连续的核酸序列。当用于本文中时,“连续的核酸序列”被理解为至少大约8,大约10,大约12,大约15,大约17,大约20,大约25,大约50或大约100个核苷酸至全长核苷酸序列的连续核酸序列。
在本发明的另一个方面,基因编码包含SEQ ID NO:31的连续的氨基酸序列的修饰的成视网膜细胞瘤肿瘤抑制蛋白。在本发明另一个方面,基因包含SEQ IDNO:30的位置7至位置2628的连续的核酸序列。在本发明其它的方面,基因编码包含SEQ ID NO:33的连续的氨基酸序列的修饰的成视网膜细胞瘤肿瘤抑制蛋白。
在本发明的其它具体实施方案中,基因包含从SEQ ID NO:32的位置7至约位置2559的连续的核酸序列。在本发明另一个具体实施方案中,基因编码包含SEQID NO:35的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。在本发明的其它具体实施方案中,基因包含SEQ ID NO:34的位置7至位置2502的连续的核酸序列。在本发明另一个具体实施方案中,基因编码包含SEQ ID NO:37的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。在本发明另一个具体实施方案中,基因包含从SEQ ID NO:36的位置7至位置2349的连续核酸序列。在本发明的其它具体实施方案中,基因编码包含SEQ ID NO:39的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。
在本发明的一个方面,基因包含从SEQ ID NO:38的位置7至位置2559的连续的核酸序列。在本发明另一个方面,基因编码包含SEQ ID NO:41的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。在本发明的另一个方面,基因包含SEQ IDNO:40的位置7至位置2697的连续的核酸序列。在本发明另一个方面,基因编码包含SEQ ID NO:43的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。在本发明另一个方面,基因包含SEQ ID NO:42的从位置7至位置2583的连续核酸序列。在本发明的一个具体方面,基因编码包含SEQ ID NO:45的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。在本发明的另一个方面,基因包含SEQ ID NO:44的从位置7至位置2397的连续核酸序列。
在本发明的一个具体实施方案中,基因编码包含SEQ ID NO:47的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。在本发明的其它具体实施方案中,基因包含来自SEQ ID NO:46的从位置7至位置2613之间的连续的核酸序列。在本发明另一个具体实施方案中,基因编码包含SEQ ID NO:49的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。在本发明的另一个方面,基因包含SEQ ID NO:48的位置7至位置2619的连续的核酸序列。在本发明另一个具体实施方案中,基因编码包含SEQ ID NO:51的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白。在本发明另一个具体实施方案中,基因包含SEQ ID NO:50的从位置7至位置2790的连续核酸序列。
因此,本发明提供编码包含SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQID NO:45,SEQ ID NO:47,SEQ ID NO:49或SEQ ID NO:51的连续氨基酸序列的修饰的成视网膜细胞瘤蛋白的基因。在本发明的一个方面,该基因包含来自SEQ IDNO:28的位置7与位置2691之间,来自SEQIDNO:30的位置7与位置2628之间,来自SEQ ID NO:32的位置7与位置2559之间,来自SEQ ID NO:34的位置7与位置2502之间,来自SEQ ID NO:36的位置7与位置2349之间,来自SEQ ID NO:38的位置7与位置2559之间,来自SEQ ID NO:40的位置7与位置2697之间,来自SEQID NO:42的位置7与位置2583之间,来自SEQ ID NO:44的位置7与位置2397之间,来自SEQ ID NO:46的位置7与位置2613之间,来自SEQ ID NO:48的位置7与位置2619之间或来自SEQ ID NO:50的位置7与位置2790之间的连续的核酸序列。
本发明另一个具体实施方案提供了包含编码非pRB94或pRB56的修饰的成视网膜细胞瘤肿瘤抑制蛋白的分离基因的DNA片段,该修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端修饰,其中DNA片段在启动子的控制下被操作性地定位。在本发明一个具体实施方案中,在重组启动子的控制下该DNA片段被操作性地定位。在本发明的另一个具体实施方案中,该DNA片段进一步被定义为重组载体。在本发明的一个具体的方面,该重组载体为腺病毒载体。在另一个方面,重组载体为逆转录病毒载体。
在本发明的另一个具体实施方案中,DNA片段进一步被定义四环素应答表达体系的一部分。在本发明的另一个具体实施方案中,DNA片段被操作性地定位于包含四环素操纵子核酸序列的启动子的下游;四环素应答表达体系进一步包含第二个含有编码包含操纵性地与四环素阻抑物蛋白相连的转录反式激活域的融合蛋白的分离基因的序列区,其中第二个序列区操作性地定位于最小启动子的下游。
在本发明的另一个具体实施方案中,四环素应答表达体系包含在腺病毒载体中。在本发明另一个具体实施方案中,腺病毒载体包含在重组的腺病毒中。
本发明还提供包含在宿主细胞中的包含编码非pRB94的修饰的成视网膜细胞瘤肿瘤抑制蛋白的分离基因的DNA片段,其中该修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端的修饰。在本发明的一个具体实施方案中,宿主细胞为原核细胞。在本发明的另一个具体实施方案中,宿主细胞为真核细胞。在本发明的另一个具体实施方案中,宿主细胞为人细胞。在本发明的另一个具体实施方案中,宿主细胞为肿瘤细胞。在本发明的另一个具体实施方案中,宿主细胞包含在动物中。在本发明的一个特定的具体实施方案中,动物为人。
本发明的另一个具体实施方案提供分散在药物可接受的赋形剂中的包含编码非pRB94的修饰的成视网膜细胞瘤肿瘤抑制蛋白的分离基因的DNA片段,其中该修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端的修饰。
本发明的另一个具体实施方案提供包含编码非pRB94的修饰的成视网膜细胞瘤肿瘤抑制蛋白的分离基因的DNA片段,该修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端的修饰,其中修饰的成视网膜细胞瘤肿瘤抑制蛋白特征在于:包含至少一个其中缺失至少一个氨基酸的第一序列区的N-末端区,并且其中修饰的成视网膜细胞瘤肿瘤抑制蛋白具有至少大约等于相应野生型成视网膜细胞瘤肿瘤抑制蛋白的生物活性;或包含含有至少一个突变的第一序列区的N-末端区,并且其中修饰的成视网膜细胞瘤肿瘤抑制蛋白与相应的野生型成视网膜细胞瘤肿瘤抑制蛋白的生物活性相比,具有增加的生物活性。
在本发明的一些方面,如上所述的DNA片段被设计用于例如在宿主细胞中表达修饰的成视网膜细胞瘤肿瘤抑制蛋白。在其它方面,DNA片段被设计用于抑制细胞增殖,或用于制备用于抑制例如病人中的细胞增殖或治疗癌症的药物中。因此,提供该DNA片段在制备修饰的成视网膜细胞瘤肿瘤抑制蛋白,在抑制细胞增殖,和制备用于抑制细胞增殖或治疗癌症的药物中的用途。在某些用途中,药物被打算用于对病人给药,或配制用于胃肠外给药。
本发明进一步提供非pRB94的修饰的成视网膜细胞瘤肿瘤抑制蛋白,其中该修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端的修饰。
本发明还提供含有包编码非pRB94的修饰的成视网膜细胞瘤肿瘤抑制蛋白的分离基因的DNA片段的宿主细胞,该修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端的修饰。在本发明的一个方面,宿主细胞为原核细胞。在本发明的另一个方面,宿主细胞为大肠杆菌。在本发明的另一个方面,宿主细胞为真核宿主细胞。在本发明的另一个方面,宿主细胞为肿瘤细胞。在本发明的另一个方面,通过重组载体将DNA片段导入细胞中。
本发明进一步提供一种抑制细胞增殖的方法,包括将细胞与抑制有效量的非pRB94的第一修饰的成视网膜细胞瘤肿瘤抑制蛋白接触,其中该修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端的修饰。在本发明的一个具体实施方案中,第一修饰的成视网膜细胞瘤肿瘤抑制蛋白包含缺失了氨基酸111至241的修饰的成视网膜细胞瘤蛋白。在本发明的另一个具体实施方案中,第一修饰的成视网膜细胞瘤肿瘤抑制蛋白包含在位置111和位置112含有突变的修饰的成视网膜细胞瘤蛋白。在本发明的另一个具体实施方案中,通过在重组宿主细胞中表达编码修饰的成视网膜细胞瘤肿瘤抑制蛋白,收集由细胞表达的修饰的成视网膜细胞瘤肿瘤抑制蛋白来制备第一修饰的成视网膜细胞瘤肿瘤抑制蛋白。在本发明的另一个具体实施方案中,将细胞与第一修饰的成视网膜细胞瘤肿瘤抑制蛋白接触从而为在细胞中表达第一修饰的成视网膜细胞瘤肿瘤抑制蛋白的细胞提供DNA片段。在本发明的另一个具体实施方案中,对细胞提供在细胞中表达第一修饰的成视网膜细胞瘤肿瘤抑制蛋白的四环素应答表达载体体系。在本发明的一个具体实施方案中,载体体系为腺病毒载体体系。
本发明的另一个方面提供抑制细胞增殖的方法,包括将肿瘤细胞与抑制有效量的非pRB94的第一修饰的成视网膜细胞瘤肿瘤抑制蛋白接触,其中该修饰的成视网膜细胞瘤肿瘤抑制蛋白包含N-末端的修饰。在本发明的另一个方面,细胞被定位于动物中,并在药物可接受的赋形剂中将第一修饰的成视网膜细胞瘤肿瘤抑制蛋白或编码修饰的成视网膜细胞瘤肿瘤抑制蛋白的基因给药至动物中。如本文所采用的,术语“基因”被定义为包括蛋白编码区或其一部分的分离DNA片段。因此,术语“基因”包括编码蛋白的基因组DNA、cDNA或RNA。
在本发明的另一个方面,动物为人。在本发明的另一个方面,进一步将细胞与第二肿瘤抑制蛋白接触。在本发明的另一个方面,将细胞与修饰的成视网膜细胞瘤蛋白和野生型成视网膜细胞瘤,p53或其它肿瘤抑制蛋白接触。
本发明进一步提供一种抑制细胞增殖的方法,包括将细胞与有效抑制细胞中的细胞增殖的混合量的成视网膜细胞瘤蛋白和p53蛋白接触。
本发明还提供一种治疗癌症的方法,包括对患有癌症的动物给药药物可接受的组合物,其中该组合物包含生物有效抑制量的包含N-末端修饰的非pRB94的第一修饰的成视网膜细胞瘤肿瘤抑制蛋白。
术语“癌症”或“肿瘤”为临床描述性术语,它包括特征在于显示未检测和异常细胞增殖的细胞的数量极多的疾病。术语“肿瘤”当用于组织时,通常指任何异常的组织生长,即过度和异常的细胞增殖。肿瘤可能是“良性的”并不能从其原始病灶扩展,或“恶性的”并能经宿主身体扩展超出其解剖位点至其它区域。术语“癌症”为通常用来描述恶性肿瘤或从其产生的疾病状态的旧的术语。另一方面,现有技术指异常生长,如肿瘤和恶性异常生长,如恶性肿瘤。
不管生长是否被分为恶性或良性,肿瘤或癌症细胞的过度或异常细胞增殖的原因还不完全清楚。然而,存在具有说服力的证据表明异常的细胞增殖是一种或多种调控细胞生长和分化的机理失常的结果。目前还认为调控细胞生长和分化的机理包括细胞生长、有丝分裂和分化的基因和组织介导的调节。这些机理被认为在各细胞的细胞核、细胞质、细胞膜和组织特异性的环境中起作用。细胞从正常状态转化为过度或异常细胞增殖的状态的过程被称为肿瘤发生。
已观察到肿瘤发生通常是在一些情况下从正常细胞状态变化为完全恶性肿瘤的多步骤过程。因此,认为完全恶性肿瘤发生需要细胞调节机理的多个“标的”。因此,在大多数情况下,认为没有单个的过度增殖的原因,但是这些疾病是一系列累积事件的最终结果。
虽然能不被检测和迅速扩展至全身的恶性肿瘤或癌症是最令人忧虑的并通常是导致死亡的肿瘤类型,但甚至所谓的良性肿瘤或生长可通过它们不适宜的生长导致显著的发病率和死亡率。良性肿瘤可通过在化妆敏感区中的不适宜的生长,或通过对中枢或外周神经组织、血管和其它关键的解剖结果产生压力而导致显著的损伤和外形损伤。
附图的简要说明
下面的附图组成本说明书的一部分,并被包括以进一步说明本发明的一些方面。通过参考一个或多个这些附图,结合本文提供的具体的实施方案的详细描述可更好地理解本发明。附图1:修饰的hCMV启动子的相对活性。5637膀胱癌细胞(泳道1-5)和Saos2骨肉瘤细胞(泳道6-10)被中CAT基因表达由各种修饰的(mhCMVp3,泳道2和7;mhCMVp2,泳道3和8;mhCMVp1,泳道4和9)或全长hCMV启动子(泳道5和10)驱动的报道质粒转染。CAT活性的百分数示于纵轴。被带有全长hCMV启动子的质粒转染的细胞的CAT活性(泳道5和10)被定义为100%。附图2:来自修饰的mCMVp-tTA盒的TA的表达对5637细胞生长没有抑制作用。将细胞用结晶紫染色,接着测定OD550的方法被用来定量相对细胞数目(OD550示于纵轴;Gillies等,1986)。显示含(实心△)和不含(□)四环素的生长亲代细胞,和含有(◆)和不含(○)四环素的mCMVp-tTA转染细胞。转染后的天数在横坐标中显示。附图3A,附图3B和附图3C:四环素可调节的pRB表达对肿瘤细胞生长的影响(OD550;纵轴)。附图3A:来自RB重组骨肉瘤细胞系的代表性的长期克隆(Saos-2,克隆11)。附图3B:来自RB重组乳腺癌细胞系的代表性的长期克隆(MDA-MB-468,克隆19-4)。附图3C:来自RB重组膀胱癌细胞系的代表性的长期克隆(5637,克隆34-6)。在存在0.5ug/mlTc(□)和不存在Tc(○)时培养细胞。在pRB表达后1至2天被终止的肿瘤细胞的细胞生长在无Tc培养基中恢复(天数示于横轴)。在用含有15%血清(Saos-2),10%血清加上2ug/ml植物凝集素(PHA;MDA-468)或10%血清加上4ug/ml伴刀豆凝集素A(Con A;5637)的新鲜培养基刺激后第4天(箭头)生长终止是不可逆的。附图4A,附图4B和附图4C:四环素可调节的pRB表达对软琼脂菌落形成的影响。附图4A:三个独立Saos2骨肉瘤细胞系克隆(RB110 C14,泳道2;RB110C111,泳道3;RB110 C113,泳道4)和Saos2亲代菌株(泳道1)的菌落形成百分数(纵轴)。附图4B:两个独立MDA-MB-468乳腺癌细胞系克隆(Rb110 C119-4,泳道2;Rb110C120-1,泳道3)和MDA-MB-468亲代菌株(泳道1)的菌落形成百分数(纵轴)。附图4C:两个独立5637膀胱癌细胞系克隆(Rb110 C134-6,泳道2;Rb110C136-9,泳道3)和5637亲代菌株(泳道1)的菌落形成百分数(纵轴)。具有四环素可调节pRB表达的肿瘤细胞的软琼脂菌落形成通过在无四环素培养基中的pRB诱导而完全消除。显示存在(空白条)和不存在(阴影条)四环素时菌落的形成。附图5:使用3H-胸苷掺入分析,对在无Tc培养基中的代表性,Tc-可调节Saos-2细胞克隆的pRB94和pRB110表达的时间过程分析。如通过未掺入胸苷的肿瘤细胞确定的DNA合成的缺乏说明生长停止。非同步亲代Saos-2细胞群(.)保持稳定的DNA合成;显示了代表性pRB110重组(实心□)和pRB94重组(◆)Saos-2克隆。3H-标记的细胞的百分数示于纵轴,除去四环素后小时数示于横轴。
说明性的具体实施方案的说明A.肿瘤抑制蛋白1.成视网膜细胞瘤
基于对分离RB cDNA克隆的研究,推测的RB基因产物具有928个氨基酸和预测的106kDA的分子量(Lee等,1987a;1987b)。对应于推测的RB基因表达产物的天然因素已被确定为具有105-114kDA表观相对分子量(Mr)的核磷蛋白(Lee等,1987b;Xu等,1989b;Yokota等,1988;Whyte等,1988)。文献通常涉及由RB基因,如p11RB编码的蛋白。在SDS-PAGE中,正常的人细胞显示由具有110KDMr的较不清楚的带和在该带上面具有Mr分子量范围为110KD-116KD的宽的更为可变的区组成的RB蛋白图谱。110KD带为未磷酸化的RB蛋白,而宽的区代表磷酸化的RB蛋白。分子量的异质性来自变化的磷酸化程度(Xu等,1989b)。
在数年的集中的详细研究后,RB基因的生物功能开始被了解(综述在Cooper和Whyte,1989;Hamel等,1993;Horowitz,1993;Riley等,1994;Wang,等,1994;Weinberg,1995)。RB蛋白在细胞周期中的磷酸化中显示周期性变化。在G1期大多数RB蛋白未被磷酸化,但大多数(也许所有)RB分子在S和G2期被磷酸化(Xu等,1989b;DeCaprio等,1989,Buchkovich等,1989;Chen等,1989;Mihara等,1989)。pRB途径的已确定的成分包括E2F转录因子,它参与负责细胞周期中的细胞进程的许多细胞基因的转录调控(Nevins,1992;La Thangue,1994)。pRB还与一些G1期细胞周期蛋白相互作用(Koff等,1992;Resnitzky和Reed,1995;Geng等,1996)。因此,RB基因显然在参与控制细胞增殖、静止和分化的细胞周期的G1期中的主要决定的细胞生长调节中起关键的作用(Weinberg,1995)。而且,仅磷酸化不足的RB蛋白与SV40大T抗原结合。假设由大T抗原结合的RB蛋白可能对于大T抗原的生长启动作用非常重要的条件下,这表明磷酸化不足的RB蛋白是RB蛋白的活性形式,并且S和G2期的磷酸化的RB蛋白无活性(Ludlow等,1989)。
据报道在正常的指数生长的成纤维细胞与停滞在G1期的那些之间的磷酸化不足与磷酸化pRB形式的比例存在明显的不同。在G1期停滞细胞中观察到更多的磷酸化不足的pRB,表明磷酸化与磷酸化不足RB蛋白的比例的变化与细胞周期的波动相关(Xu等,1989b)。四篇后来的文献详细描述了RB蛋白的细胞周期依赖的磷酸化(DeCaprio等,1989;Buchkovich等,1989;Chen等,1989;Mihara等,1989)。目前RB基因的产物在细胞周期的控制中具有关键的作用已被广泛接受。
细胞增殖取决于负责DNA合成启动以及细胞周期G1期中的其它关键事件的基因的转录活化。如Pardee所证实的,通过S期启动之前数小时处的特殊点,即R(限制)点(Pardee,1989),分离从血清促有丝分裂原依赖性转化为血清有丝分裂原独立状态的细胞。通过经过R点,细胞将其本身定向经过M期完成细胞周期的其余阶段。因此,细胞周期的中G1和晚G1期之间的R点代表与G1/S分界一样重要的细胞周期中的一个转换。
在接近和可能与细胞周期的R点转转换同时的时间点,pRB的磷酸化状态经历了一个容易识别的改变(Weinberg,1995)。在中G1期期间,检测的唯一的pRB种类为未磷酸化的形式。当细胞经历细胞周期时,RB含量逐渐增加。然而,中G1期后合成的大多数pRB是过磷酸化的。换句话说,pRB过磷酸化发生在后G1期,位于G1/S界面之前(Xu等,1991a;Mittnacht等,1994)。pRB在细胞周期的其余阶段保持该过磷酸化状态,仅在从M/早G1发展时变为去磷酸化(Ludlow等,1990a;Xu等,1991a;Mittnacht等,1994)。
pRB的磷酸化不足的形式能与转录因子E2Fs形成复合物或直接与E2F位点相互作用,将E2F位点从转录控制中的阳性成分转换成阴性。E2F位点存在于负责经历细胞周期的细胞发展的各种细胞基因的启动子中,包括c-myc,B-myb,cdc2,二氢叶酸还原酶、胸苷激酶和RB以及E2F-1基因本身(Chellapan等,1991;Nevins,1992;Weintraub等,1992;La Thangue,1994;shan等,1994;Sardet等,1995;Shan等,1996)。由于过磷酸化的pRB看来已失去了与E2Fs相互作用的能力,pRB对细胞生长的抑制功能可通过过磷酸化取消。
pRB磷酸化的定时导致令人感兴趣的功能性模型(Weinberg,1995)。该模型表明pRB为R点保护。pRB在G1期的第一个三分之二处产生其大部分的生长抑制作用。发展经过早和中G1期的细胞遭遇R点大门。如果条件便于进入细胞周期的其余阶段,pRB将进行磷酸化和功能性失活,导致它打开大门并允许细胞进入后G1期。由于各种原因缺乏正常pRB功能的细胞将自由地进入后G1期。如果没有pRB,调节pRB磷酸化的细胞周期钟的上游部分,如细胞周期蛋白D、细胞周期蛋白E和其相应的细胞周期蛋白依赖性激酶(CDKs)(Kato等,1993;Ewen等,1993)丧失大部分它们在决定细胞经过R点大门中的影响。总之,pRB使得细胞周期钟控制参与与R点转换一致的主要决定的介导细胞生长经过其生长周期的关键期的许多基因的表达。pRB的功能性丧失使得细胞失去该钟并因此失去阻滞细胞增殖的重要的机理。
业已知各种RB基因的突变,并且这些通常是无活性的。实质上RB中的突变可见于成视网膜细胞瘤的所有情况中;另外RB基因产物可能由过磷酸化和通过病毒癌基因蛋白样蛋白的结合而失活。虽然由于基因中的缺失或突变导致罕见的幼儿眼肿瘤,成视网膜细胞瘤,RB基因最初被命名,但pRB功能的丧失不仅因果关系地与成视网膜细胞瘤相关,而且还与许多常见的人癌症相连。此外,日益增多的证据表明RB蛋白的状态可能是尿道癌、非小细胞肺癌以及可能还是一些其它类型的人肿瘤的前兆性标志(Xu,1995)。
此外,借助于革命性的抗原逆转录病毒技术和可获得的特定的抗pRB抗体,免疫组织化学最近成为一种高灵敏度和可信赖的检测常规处理的病理学样品中pRB失活的方法(Xu,1995)。通过免疫组织化学分析确定的改变的pRB的表达看来表明人恶性肿瘤亚型的不良前兆。起初报道功能性pRB的丧失是高级成人软组织肿瘤中的统计显著的阴性前兆性因素(Cance等,1990)。随后,两个同时进行的独立研究总结出改变的pRB表达是患有转移性膀胱细胞癌的病人中的前兆性因素(Cordon-Cardo等,1992;Logothetis等,1992)。
对于肺癌病人,最初的辅助性研究也是有希望的,意味着改变的RB和p53蛋白的状态可为早期非小细胞肺癌中的协同前兆性因素(Xu等,1994a)。同样对于在其外周血白细胞中具有低水平或缺乏pRB蛋白的患有急性骨髓白血病的病人也报道了极不良的的存活类型(Komblau等,1994)。由于已回顾了目前进行的调查人癌症中的pRB状态与病人的临床结果之间的关系的所有研究,并且在各种同龄组中的情况的数目相当小,具有用于统计计算的足够的样品规模的确定的回顾性和展望性研究目前正在进行以确定是否pRB功能的丧失可被认为是临床实践中的前兆性因素。
克隆的RB基因的确是肿瘤抑制基因的最直接的证据来自将基因克隆的完整拷贝导入具有观察的肿瘤抑制功能的癌细胞中。许多报道表明在裸鼠中,在来自人不同类型的人癌症的RB缺陷肿瘤细胞中正常RB基因的取代可抑制它们的致癌活性(Huang等,1988;Goodrich和Lee,1993;Zhou等,1994b)。研究的肿瘤细胞系来自各种不同的人癌症,如成视网膜细胞瘤、骨肉瘤、膀胱癌、前列腺癌、乳腺癌和肺癌(表2)。
值得注意的是,文献中存在一种将在RB缺陷肿瘤细胞中的RB的取代产生的细胞生长的抑制与其肿瘤抑制功能分开的趋势(Takahashi等,1991;Chen等,1992;Goodrich等,1992b;Zhou等,1994b)。如在一些早期的研究1中所公开的,在用野生型pRB表达逆转录或质粒进行的暂时转导后,培养基中RB缺陷成视网膜细胞瘤和骨肉瘤质粒细胞显示令人惊奇的变化,包括细胞增大、衰老的表型和较低的生长速率(Huanng等,1988;Templeton等,1991)。后来,发现可分离与亲代或配对的RB回复体克隆一样生长迅速的RB重组的肿瘤细胞的长期稳定的克隆。然而,在裸鼠中获得的大多数RB+克隆为非致癌性的或具有显著降低的致癌性。裸鼠中致癌性的抑制与培养基中RB取代导致的肿瘤细胞生长的抑制的相关的机理不清楚。当裸鼠中进行致癌性分析时,RB取代恢复对可能存在于并提供给细胞的各种生理生长抑制信号的敏感性当然是可能的。在常规细胞培养条件下,这些外在的生长抑制剂是不存在的,导致迅速的细胞生长(Chen等,1992)。
虽然RB介导的肿瘤抑制的分子机理仍不清楚,但在体内通过再表达野生型pRB导致的对RB肿瘤细胞的致癌性的抑制表明RB基因可能是用于人类癌症治疗的潜在的治疗剂。此外,最近的报道表明RB还可在肿瘤细胞的免疫原性的引发(Lu等,1994;Lu等,1996)、抗血管发生(Dawson等,1995)和肿瘤侵染的抑制(Li等,1996)中起作用,这使得出现的RB基因治疗甚至更吸引人。在这方面,临床前研究最近已证实通过表达野生型或N末端平截的成视网膜细胞瘤蛋自的重组腺病毒载体治疗已发生的裸鼠内人异种移植肿瘤治疗导致被治疗的肿瘤的退化(Xu等,1996)。此外,在球状血管成形术后抑制血管增殖疾病的restenosis的大鼠动脉模型中已检测了pRB蛋白的组成型活性形式(Chang等,1995)。
表达第一个框内AUG密码子起始的RB蛋白的RB基因在本文还被称为完整的RB基因,RB110基因或p110RB编码基因。还观察到在免疫沉淀和蛋白质印迹中可检测对各种抗RB抗体发生免疫反应的未知起源的较低分子量(<100kD,98kD,或98-104kD)的带(Xu等,1989b;Furukawa等,1990;Stein等,1990)。
RB110cDA开放读框的序列(Mcgee等,1989)包含位于外显子3中的核苷酸355-357的第二个框内AUG密码子。推测的第二个AUG密码子起始的RB蛋白为98kD或比p110RB蛋白小12kD。已提出较低分子量的带为从RBmRNA的第二个AUG密码子翻译的磷酸化不足(98kD)和磷酸化(98-104kD)RB蛋白(Xu等,1989b),和后来这表明是令人信眼的(Xu等,美国专利5,496,731)。该蛋白被称为p94RB蛋白。
已提出将功能性的RB110基因导入RB负型肿瘤细胞中可能使细胞“正常化”。当然,不期望已具有正常RB110基因表达(“RB+”)的肿瘤细胞对RB110基因治疗产生反应,因为推测加入另外的RB表达不能校正非RB遗传缺陷。事实上,已表明在RB+肿瘤细胞系的情况下,如表达正常p94RB的骨肉瘤细胞系U-2OS,额外的p94RB编码基因的导入不改变该肿瘤细胞系的致瘤性表型(Huang等,1988)。
在报道的唯一一个例外中,将p11RB编码载体导入不具有已知的RB或任何其它遗传缺陷的正常的人成纤维细胞WS1中导致细胞生长的停止(Fung等,WO91/15580,1991)。然而,认为这些发现是错误的解释,因为对宿主细胞具有熟知的生长促进作用的SV40 T抗的质粒ppVUO-Neo被不恰当地用来提供与RB110的表达对转染的WS1成纤维细胞的细胞生长的作用的比较(Fung等,WO91/15580,1991)。这种观点通过许多文献而得以证实,清楚地将表明RB+肿瘤细胞表征为通过用野生型RB110基因治疗为“可治愈的”。此外,值得注意的是,WS1细胞系本身是通常公认的在培养物中有有限的分裂能力的具有非致瘤的人二倍体成纤维细胞系。因此,WO91/15580简单地没有提供任何用RB110基因有效地治疗RB+肿瘤的方法。因此,仍需要用于治疗具有任何类型的遗传缺陷的异常增殖细胞的广谱肿瘤抑制剂基因。2.p53
据说p53基因的体细胞突变是人癌症中最常突变的基因(Weinberg,1991)。正常或野生型p53基因是细胞生长的阴性调节物,当被损伤时,其有利于细胞的转化(Weinberg,1991)。如对于RB蛋白所述的,在核中发现p53表达产物,其中它可同时或协同地与p110RB作用。许多观察提示它,例如,p53和p110RB蛋白被靶定用于SV40、腺病毒和人乳头瘤病毒的癌蛋白质的结合或破坏。缺失p53的肿瘤细胞系被成功地用野生型p53载体处理以降低致瘤性(Baker等,1990)。然而,将p53或RB110导入在这些位点未进行损伤的细胞中不影响细胞增殖(Marshall,1991;Baker等,1990;Huang等,1988)。这些实验表明细胞对肿瘤抑制基因对其生长的抑制的敏感性取决于在细胞中发生的遗传改变。该依赖性进一步被某些癌症中的观察结果复杂化,即p53肿瘤抑制物或基因位置中的改变在ras癌基因的突变活化之后出现(Marshall,1991;Fearon等,1990a)。因此,仍需要不依赖于导致异常细胞增殖的各种突变基因的具体鉴定的广谱肿瘤抑制基因。3.类型1神经纤维瘤
类型1神经纤维瘤或多发性神经纤维瘤来自诱病突变等位基因的遗传或来自经新的生殖系突变产生的等位基因(Marshall,1991)。被称为NF1基因的类型1神经纤维瘤基因是一个显示10-4左右的突变速率的相对大的位置。NF1基因的缺陷导致从cafe-au-lait点至皮肤的神经纤维瘤和外周神经至施万细胞神经瘤和神经纤维瘤的各种临床综合症。NF1基因编码与ras原癌基因的产物相互作用的三种蛋白具有结构相似性的约2485个氨基酸的蛋白(Weinberg,1991)。例如,NF1氨基酸序列与p21 ras的GTPase活化蛋白的ras GAP的催化区显示同源性(Marshall,1991)。
NF1在细胞周期调节中的作用显然是一个仍不能清楚阐明的复杂过程。例如,已假设它是在酵母中原癌性活化p21 ras的抑制物(Marshall,1991,引用Ballester等,1990)。另一方面,可获得的数据提示了NF1相互作用的其它可能的途径(Marshall,1991;Weinberg,1991)。目前,由于NF1位点的大小和复杂性,未进行用野生型NF1基因处理F1细胞的尝试。因此极希望具有能治疗NF1和任何其它类型的癌症或肿瘤的广谱肿瘤抑制基因。4.DCC
可很容易地通过结肠镜在发展期监测结肠癌的肿瘤发生中的多个步骤。结肠镜与涉及的组织的活组织检查的结合揭示了许多导致恶性肿瘤结果的退化性遗传途径。一个透彻研究的途径从大息肉开始,其中60%的细胞携带突变、活化的K-ras等位基因。接着这些肿瘤大多数开始被称之为结肠癌(DCC)基因中的缺失基因的灭活-突变,接着灭活p53肿瘤抑制基因。
DCC基因为编码被假设为受体的190-KD跨膜磷蛋白的超过约1百万碱基对的基因(Weinberg,1991),它的丧失使得受影响的细胞具有生长的优点。还报道DCC与可能表明DCC原基因在调节细胞与细胞相互作用中起作用的神经细胞粘附分子具有部分序列同源性(Marshall,1991)。如可被理解的,DCC基因的大的大小和复杂性与K-ras的复杂性,p53和涉及结肠癌肿瘤发生的可能的其它基因证实需要广谱肿瘤抑制基因和不依赖于DCC基因的操作或结肠癌细胞中其它特定的受损基因的确定的治疗结肠癌细胞的方法。5.其它肿瘤抑制蛋白
其它肿瘤抑制基因和代表性肿瘤抑制基因的实例被设想用与本发明的肿瘤抑制基因结合使用,包括,但不局限于Wilms肿瘤(WT-1)基因(Call等,1990;Gessler等,1990;Pritchard-Jones等,1990)、von Hippel-Lindau(VHL)疾病肿瘤抑制基因(Duan等,1995)、Maspin(Zou等,1994)、Brush-1(Schott等,1994)和乳腺癌的BRCA 1基因(Miki等,1994;Futreal等,1994)和多发性肿瘤抑制剂(MTS)或p16基因(Serrano等,1993;Kamb等,1994)。B.借助于病毒的载体感染的DNA送递
在本发明的一些具体实施方案中,肿瘤抑制基因可被稳定地整合至细胞的基因组中。在其它具体实施方案中,基因可以DNA的分离游离型片段被稳定地保留在细胞中。这些核酸片段或“游离片段”编码足以使得独立地或与宿主细胞周期同步地保留或复制的序列。肿瘤抑制基因如何被送递至细胞中,并且在细胞中核酸被保留在何处取决于采用的病毒载体的类型。1.腺病毒载体
优选用于本发明的是腺病毒载体,尤其是四环素控制的腺病毒载体。这些载体可被用来送递和表达各种基因,包括,但不局限于肿瘤抑制基因,如成视网膜细胞瘤和p53基因,外加细胞因子基因,如肿瘤坏死因子α、干扰素基因家族和白介素基因家族。
优选的用于送递表达构建物的方法包括使用腺病毒表达载体。虽然腺病毒载体被已知具有低的整合至基因组DNA中的能力,但该特征通过由这些载体提供的高效率的基因转移得以补偿。“腺病毒表达载体”指包括包含足以(a)支持具有互补包装功能的宿主细胞中的构建物的包装和(b)最终表达感兴趣的被克隆在其中的异源基因的腺病毒序列的那些构建物。
表达载体包含遗传操作形式的腺病毒。有关腺病毒的遗传结构的知识,36kD的线性双链DNA病毒使得用外来序列置换大片段的腺病毒DNA(Grunhaus和Horwitz,1992)。与腺病毒相反,宿主细胞的腺病毒感染不导致染色体的整合,因为野生型腺病毒DNA可以游离的方式复制而无潜在的基因毒性。而且,腺病毒为结构稳定性的,并且在广泛扩增后没有检测到基因重排。
由于其中等大小的基因组、操作的简易、高效价、宽的靶细胞范围以及高感染性,腺病毒尤其适宜于用作基因转移载体。病毒基因组的两个末端包含100-200个碱基对反向重复序列(TTRs),其中它为病毒DNA复制和包装必需的顺式部分。基因组的早期(E)和后(L)区包含被病毒DNA复制的起始分开的不同的转录单元。E1区(E1A和E1B)编码负责病毒基因组和一此细胞基因的转录的调节的蛋白。E2区(E2A和E2B)的表达导致病毒DNA复制的蛋白的合成。这些蛋白参与DNA复制,后期的基因表达和宿主细胞的关闭(Renan,1990)。后期基因的产物,包括主要的病毒壳体蛋白仅在由主要后期启动子(MLP)产生的单个初级转录物的重要加工后表达。在感染的后期,MLP(位于16.8m.u.)尤其有效,从该启动子产生的所有mRNA具有使得它们成翻译优选的mRNA的5’-三联前导序列(TPL)序列。
在本系统中,重组腺病毒从穿梭载体与包含腺病毒基因组骨架的主质粒之间的同源重组产生。由于腺病毒基因组骨架与包含表达基因组缺失部分的辅助细胞的细胞DNA之间的可能的重组,野生型腺病毒可从该方法产生。因此,从各嗜菌斑分离病毒的单个克隆并检测其基因组结构是非常重要的。
复制缺陷的大多数腺病毒载体的产生和繁殖取决于称为293的独特的辅助细胞系,其中它被Ad5 DNA片段从人胚胎肾细胞转化而来并组成型地表达E1蛋白(E1A和E1B;Grzaham等,1977)。由于E3区对于腺病毒基因组是非必需的(Jones和Shenk,1978),借助于293细胞的帮助,该腺病毒载体在E1、E3或这两个区中携带外源DNA(Graham和Prevec,1991)。在自然界,腺病毒可包装约105%的野生型基因组(Ghosh-Choudhury等,1987),提供约2extra kb的DNA的能力。结合可在E1和E3区替代的约5.5kb DNA,腺病毒载体最大的能力至少为7.5kb或载体全长的大约15%。大于80%的腺病毒基因组保留在载体骨架中。
使用重组E1-缺陷的腺病毒在体内的基因转移导致可引发宿主免疫应答的早期和后期病毒基因表达,从而,局限转基因的表达的持续时间和腺病毒在基因治疗中的应用。为了克服这些潜在的问题,原核Cre-loxP重组系统已被修改来产生在表达基因组中具有扩展的缺失的重组腺病毒以最小化免疫原和/或细胞毒性病毒蛋白的表达(Lieber等,1996)。
辅助细胞系可来自人细胞,如人胚肾细胞、肌肉细胞、造血细胞或其它人胚间充质或上皮细胞。另一方面,辅助细胞可来自人腺病毒允许的其它哺乳动物种类的细胞。这些细胞包括例如Vero细胞或其它胚胎充质或上皮细胞。如上所述,优选的辅助细胞为293。
最近,Racher等(1995)公开了培养293细胞和繁殖腺病毒的改进方法。在一个方案中,通过将单个细胞接种至含有100-200ml培养基的1升硅化旋转烧瓶(Techne,Cambridge,UK)中培养天然细胞聚集物。以40rpm搅拌后,用锥虫蓝检测细胞存活力。在另一个方案中,如下采用Fibra-Cel微载体(Bibby Sterlin,Stone,UK)(5g/l)。将分散于5ml培养基中的细胞接种物加入到250ml Erlenmeyer烧瓶中的载体(50ml)中,偶尔搅拌下,静置1至4小时。接着将培养基用50ml新鲜培养基替代并开始振荡。为了产生病毒,让细胞生长至约80%铺满度,此后,置换增养基(至25%的终体积),并以0.05MOI加入腺病毒。将培养物静置过夜,此后,将体积增至100%并开始振荡72小时。
在一些情况下,与上皮来源的细胞相比,介导基因送递至多种细胞类型的腺病毒被发现不甚有效。新的腺病毒AdPK被构建来克服该不足(Wickham等,1996)。AdPK包含将病毒靶定于在许多细胞类型中广泛表达的包含类肝素的细胞受体的肝素结合区。因此,AdPK以比未修饰的腺病毒更高的效率将基因送递至多种细胞类型中,从而提高基因转移的效率和扩展适宜于有效的腺病毒介导的基因治疗的组织。
除了腺病毒载体需要为复制缺陷型的,或至少为条件缺陷型外,认为腺病毒载体的特性对于本发明的成功实践不是关键。腺病毒可为42种不同的已知血清型或亚组A-F中的任一种。为了获得用于本发明的条件复制缺陷腺病毒载体,亚组C的类型5腺病毒是优选的起始物。这是由于腺病毒类型5是已知其大量生化和遗传信息的人腺病毒,它传统上被用于大多数采用腺病毒作为载体的构建。
如上所述,根据本发明的通常的载体为复制缺陷型的并不具有腺病毒E1区。因此,最便于在E1编码序列被去除的位置引入外源基因表达盒。然而,腺病毒序列中的构建物的插入位置对于本发明不是关键。如Karlsson等(1986)所描述的,编码感兴趣的基因的多核苷酸还可被插入至E3置换载体中的缺失的E3区的位点或其中辅助细胞系或辅助病毒补充E4缺陷的E4区(Brough等,1996)。
本领域技术人员已知腺病毒生长和操作,并且其在体外和体内显示广泛的宿主范围。可高效价地获得这组病毒,例如109至1011嗜菌斑形成单位/ml,目前它们极其有效。腺病毒的生命周期不需要整合至宿主细胞基因组中。通过腺病毒载体送递的外源基因为游离的,因此对宿主细胞具有低的基因毒性。在用野生型腺病毒接种的研究中未报道严重的副作用(Couch等,1963;Top等,1971),表明其作为体内基因转移载体的安全性和治疗潜力。
腺病毒载体被用于真核细胞基因的表达中(Levrero等,1991;Gomez-Foix等,1992)和疫苗开发(Grunhaus和Horwitz,1992;Graham和Prevec,1992)。最近,动物实验表明重组腺病毒可被用于基因治疗(Stratford-Perricaudet和Perricaudet,1991;Stratford-Perricaudet等,1991;Rich等,1993)。对将重组腺病毒施用于不同的组织的研究包括气管滴入法(Rosenfeld等,1991;1992)、肌肉注射(Ragot等,1993)、外周静脉内注射(Herz和Gerard,1993)和定向接种至脑(Le Gal La Salle等,1993)。重组腺病毒和与腺相关的病毒(见下文)可感染和转导不分裂的人初级细胞。2.AAV载体
与腺相关的病毒(AAV)还为用于构建送递和表达肿瘤抑制基因的载体的构建的吸引人的体系,因为它具有高频率的整合,并且它可感染不分裂的细胞,因此使得它可用于将基因送递至哺乳动物细胞中,例如组织培养物(Muzyczka,1992)或体内。AAV具有广泛的感染性宿主范围(Traschin等,1984;Laughlin等,1986;Lebkowski等,1988;Mclaughlin等,1988)。关于rAAV载体的产生和使用的详细情况描述在被本文引作参考的美国专利号5,139,941和美国专利号4,797,368。
证明AAV在基因送递中的使用的研究包括LaFace等(1988);zhou等(1993);Flotte等(1993);和Walsh等(1994)。重组AAV载体被成功地用于标记基因的体外和体内转导(Kaplitt等,1994;Lebkowski等,1988;Samulski等,1989;Yoder等,1994;Zhou等,1994a;Hermonat和Muzyczka,1984;Tratschin等,1985;McLaughlin等,1988)和涉及人疾病的基因(Flotte等,1992;Luo等,1994;Ohi等,1990;Walsh等,1994;Wei等,1994)。最近,AAV载体被批准用于治疗胆囊纤维样变性的I期人试验中。
由于其需要与其它病毒(腺病毒或疱疹病毒家族)共感染以在培养的细胞中进行生产性感染,因此AAV为依赖性小病毒(Muzyczka,1992)。在缺乏与辅助病毒的共感染中,野生型AAV基因组经其末端整合至人染色体19中,其中其以原病毒的潜在的状态存在(Kotin等,1990;Samulski等,1991)。然而,对于整合rAAV不局限于染色体19,除非AAVRep蛋白也表达(Shelling和Smith,1994)。当携带AAV原病毒的细胞被辅助病毒超感染时,AAV基因组从染色体或从重组质粒中释放,产生正常的生产性感染(Samulski等,1989;McLaughlin等,1988;Kotin等,1990;Muzyczka,1992)。
通常,重组AAV(rAAV)病毒通过共转染在两个AAV末端重复区旁侧包含感兴趣的基因的质粒(Mclaughlin等,1988;Samulski等,1989;均被本文引作参考)和包含无末端重复区的野生型AAV编码序列的表达质粒,例如pIM45(McCarty等,1991;被本文引作参考)来制备。细胞还被携带AAV辅助功能所需的腺病毒基因的腺病毒或质粒感染或转染。用该方法制备的rAAV病毒原液被必须通过热激灭活或物理性地从rAAV颗粒分离的(例如通过氯化铯密度梯度离心)腺病毒污染。另一方面,可使用包含AAV编码区的腺病毒载体或包含AAV编码区的细胞系和一些或所有腺病毒辅助基因(Yang等,1994;Clark等,1995)。还可使用携带rAAV DNA的细胞系作为整合的原病毒(Flotte等,1995)。3.逆转录病毒载体
在本发明的具体方面,通过使用逆转录病毒感染将选择的基因送递至靶细胞中是所希望的。逆转录病毒为一组单链RNA病毒,特征在于在感染细胞中通过逆转录将其RNA转化为双链DNA(Coffin,1990)。接着产生的DNA以原病毒的形式稳定地整合至细胞染色体中并指导病毒蛋白的合成。整合导致受体细胞和其后代中的病毒基因序列的保留。逆转录病毒基因组包含分别编码壳体蛋白、聚合酶和包膜部分的三个基因gag,po和env。在gag基因上游发现的序列包含将基因组包装至病毒体中的信号。两个长的末端重复(LTR)序列存在于病毒基因组的5’和3’末端。这些包含强的启动子和增强子序列并也为整合在宿主细胞基因组中所需要(Coffin,1990)。
为了构建逆转录病毒载体,编码感兴趣基因的核酸被插入到病毒基因组中取代病毒序列以产生复制缺陷的病毒。为了产生病毒体,构建包含gag,pol和env基因但不含LTR和包装成分的包装细胞系(Mann等,1983)。当包含cDNA的重组质粒与逆转录LTR和包装序列一起被导入该细胞系时(通过例如磷酸钙沉淀),包装序列使得重组质粒的RNA转录物被包装至病毒颗粒中,接着它被分泌至培养基中(Nicolas和Rubenstein,1988;Temin,1986;Mann等,1983)。接着收集包含重组逆转录病毒的培养基、优选地浓缩,并用于基因转移。逆转录病毒载体能感染多种多样细胞类型。但是整合和稳定的表达需要宿主细胞的分裂(Paskind等,1975)。
与缺陷型逆转录病毒载体的使用相关的是在包装细胞中的可能的野生型复制活性病毒的出现。这可来自其中来自gag,pol,env序列上游的重组病毒插入物的完整的序列整合在宿主细胞基因组中的重组事件。然而,目前可获得将大大降低重组可能性的新的包装细胞系(Markowitz等,1988;Hersdorffer等,1990)。
在一些情况下,限制性的宿主细胞范围和逆转录载体的低效阶可限制它们用于真核细胞中的稳定的基因转移。为了克服这些可能的困难,开发了小鼠白血病病毒来源载体,其中逆转录被膜糖蛋白完全被疱疹性口腔炎病毒的G糖蛋白替代(Bums等,1993)。可将这些载体浓缩至极高的效价(109菌落形成单位/ml),并可感染通常抗包含逆转录病毒被膜蛋白的载体感染的细胞。这些载体可易于基因治疗的模型研究和在体内需要载体的直接送递的其它基因转移研究。4.杆状病毒载体
杆状病毒表达载体是产生各种用途的蛋白质的有用的工具(Summer和Smith,1987;O’Reilly等,1992;还有美国专利号4,745,051)(Smith和Summer),4,879,236(Smith和Summer),5,077,214(Guarino和Jarvis),5,155,037(Summer),5,162,222(Guarino和Uarvis),5,169,784(Summer和OKer-Blom)和5,278,050(Summer),均被本文引作参考)。本发明人设想了杆状病毒表达载体的构建,其中基因表达被四环素调节。这些载体可能是特别有用的,例如所需蛋白对昆虫细胞具有毒性。在这些情况下,蛋白的产生可被关闭直至细胞达到极高的密度,从而仍允许所需蛋白的大量的产生。
杆状病毒表达载体为重组昆虫载体,其中感兴趣的特定的基因的编码区被置于启动子后以代替非必需的杆状病毒基因。用来分离重组杆状病毒表达载体的传统的方法是构建其中感兴趣的外源基因被定位于多角体蛋白启动子的下游的质粒。接着借助于同源重组,质粒可被用来将新的基因转移至表达基因组中以代替野生型多角体蛋白基因(Summer和Smith,1987;O’Reilly等,1992)。
产生的重组病毒可感染培养的鳞翅目昆虫细胞或幼虫并在多角体启动子控制下表达外源基因,其中该启动子为强的并在感染的最后期提供极高水平的转录。多角体启动子的强度为使用重组杆状病毒作为表达载体的优点,因为它通常导致感染期的大量外源基因产物的合成。5.其它病毒载体
其它病毒载体可用于本发明的病毒载体的构建。来自病毒的载体,如牛痘病毒(Ridgevay,1988;Baichwal和Sugden,1986;Coupar等,1988),新培斯病毒和疱疹病毒。它们为各种哺乳动物细胞提供一些吸引人的特性(Friedmann,1989;Ridgevay,1988;baichwal和Sugden,1986;Coupar等,1988;Horwich等,1990)。
随着最近对缺陷型乙型肝炎病毒的认识,获得了不同病毒序列的结构功能的相互关系的新的认识。体外研究表明病毒可保持复制-依赖性包装和逆转录的能力,尽管缺失高达其基因组的80%(Horwich等,1990)。这表明大部分的基因组可被外源遗传物质替代。Chang等(1991)最近将氯霉素乙酰转移酶(CAT)基因导入鸭乙型肝炎病毒基因组替代聚合酶,表面和前表面编码序列。它被用野生型病毒共转染至禽类肝癌细胞系。包含高效价的重组病毒的培养基被用来感染初级鸭肝细胞。转染后至少24小时检测稳定的CAT基因的表达(Chang等,1991)。6.修饰的表达
在本发明的另一个具体实施方案中,尤其是其中希望将选择的基因送递至特定的细胞类型中时,送递的表达构建物被包含在也被改造来表达特定结合配体的感染性的病毒中。因此表达颗粒特异性地与靶细胞的同源受体结合并将内含物送递至细胞中。最近,基于通过将乳糖残基化学加入至病毒被膜中的逆转录病毒的化学修饰,开发了设计用来允许特异性靶定逆转录病毒的新的方法。该修饰可借助于唾液酸糖蛋白受体允许肝细胞的特异性的感染。
设计了其中使用抗逆转录病毒被膜蛋白和抗特异性的细胞受体的生物素标记的抗体的另一种靶定重组逆转录病毒的方法。通过链霉抗生物素借助于生物素成分偶联抗体(Roux等,1989)。使用抗主要组织相容性复合物类型I和类型II抗原的抗体,他们证实了在体外用亲嗜性病毒感染具有那些表面抗原的各种人细胞。C.DNA送递的其它方法
如借助于上述细胞感染的DNA送递的病毒介导的方法,设想了其它将本发明的肿瘤抑制基因导入原核和真核细胞中的方法。1.转染和转化
为了进行基因构建物的表达,必须将表达构建物送递至细胞中。如本文所描述的,一个优选的送递机理为借助于病毒感染,其中表达构建物被包壳在感染性的病毒颗粒中。然而,本发明还设想了一些将表达构建物转移至真核和原核细胞中的非病毒方法。在本发明的一个具体实施方案中,表达构建物可仅由裸重组DNA或质粒组成。可通过任何所述的物理或化学透化细胞膜的方法来进行构建物的转移。a.脂质体介导的转染和转化
在本发明的另一个具体实施方案中,可将表达构建物包裹在脂质体中。脂质体为特征在于磷脂双层膜和内部含水介质的小囊结构。多层脂质体具有由含水介质分开的多层脂质层。当磷脂分散在过量的水溶液中时,它们自发地形成。在密封结构形成之前,脂质成分进行自我重排并捕获水,溶解在脂双层之间的溶质中(Ghosh和Bachhqwat,1991)。还设想与Lipofectamine复合形成的表达构建物(GibcoBRL)。
体外脂质体介导的核酸和外源DNA的表达是成功的(Nicolau和Sene,1982;Fraley等,1979;Nicolau等,1987)。Wong等(1980)证实脂质体介导的送递的可能性和在培养的鸡胚、Hela和肝癌细胞中的外源DNA的表达。
在本发明的一些具体实施方案中,脂质体可以与血凝病毒(HVJ)复合。这显示便于与细胞膜的融合以及促进脂质体包被的DNA的细胞的进入(Kaneda等,1989)。在其它具体实施方案中,脂质体与核非组蛋白染色体蛋白(HmG-1)形成复合物或结合使用(Kato等,1991)。在另一个具体实施方案中,脂质体可与HVJ和HMG-1形成复合物或结合使用。b.电穿孔
在本发明的一些具体实施方案中,借助于电穿孔表达构建物被导入细胞中。电穿孔包括将细胞或DNA的悬浮液暴露于高压放电中。
使用电穿孔对真核细胞的转染是相当成功的。以这种方式将小鼠pre-B淋巴细胞用人kappa免疫球蛋白基因转染(Potter等,1984),大鼠肝细胞用氯霉素乙酰转移酶基因转染(Tur-Kaspa等,1986)。c.磷酸钙沉淀或DEAE葡聚糖处理
在本发明的其它具体实施方案中,使用磷酸钙沉淀将表达构建物导入细胞中。使用该方法将人KB细胞用腺病毒5 DNA转染(Graham和Van Der Eb,1973)。还使用该方法将小鼠L(A9)、小鼠C127、CHO、CV-1、BHK、NIH3T3和Hela细胞用新霉素标记基因转染(Chen和Okayama,1987),和将大鼠肝细胞用各种标记基因转染(Ripp等,1990)。
在另一个具体实施方案中,使用DEAE葡聚糖,接着通过聚乙二醇将表达构建物送递至细胞中。在该方法中,受体质粒被导入小鼠骨髓瘤和红白血病细胞中(Gopal,1985)。d.粒子轰击
用于将裸DNA表达构建物转移至细胞中的本发明另一种具体实施方案可包括粒子轰击。该方法基础在于将DNA包被的微粒加速至高速度使得它们在不杀死它们的情况下,穿过细胞膜进入细胞(Klein等,1987)的能力。已开发了一些用于加速小颗粒的设备。一种设备依赖于高压放电以产生电流,其反过来提供动力(Yang等,1990)。使用的微粒由生物惰性物质,如钨或金珠组成。e.直接显微注射或超声充填
本发明的另一个具体实施方案包括通过直接显微注射或超声充填导入表达构建物。直接显微注射被用来将核酸构建物导入非洲爪蛙卵细胞中(Harland和Weintraub,1985),和通过超声充填将LTK-成纤维细胞用胸苷激酶基因转染(Fechheimer等,1987)。f.腺病毒辅助转染
在本发明的一些具体实施方案中,使用腺病毒辅助转染将表达构建物导入细胞中。报道了在使用腺病毒偶联体系的细胞体系中的增加的转染效率(Kelleher和Vos,1994;Cotten等,1992;Curiel,1994)。g.受体介导的转染
可用来将构建物送递至靶细胞中的另一种表达构建物为受体介导的送递载体。这利用了将在靶细胞中存在的大分子被受体介导的胞吞作用选择性摄取的优点。根据各种受体的细胞类型特异性分布,该送递方法给本发明增添了一定程度的特异性。Wu和Wu(1993;被本文引作参考)描述了在另一种哺乳动物细胞类型中的具体的送递。
一些受体介导的基因靶定载体包含细胞受体特异性配体和DNA结合剂。其它包含送递的DNA构建物被操作性地与其相连的细胞受体特异性配体。一些配体被用于受体介导的基因转移(Wu和Wu,1987;Wager,1990;Perales等,1994;MyersEPO0273085),其建立了该技术的可操作性。在本发明中,选择配体与神经内分泌靶细胞群中特异性表达的受体一致。
在其它具体实施方案中,细胞特异性基因靶定载体的DNA送递载体成分可包含与脂质体结合的特异性结合配体。送递的核酸被包含在脂质体中,特异性结合配体被功能性地掺入脂质体膜中。因此,脂质体特异性地与靶细胞的受体结合并将内含物送递至细胞。使用其中例如上皮生长因子(EGF)被用于将核酸受体介导地送递至显示EGF受体正调节的细胞中的体系,这些体系被显示为功能性的。
在另一些具体实施方案中,被靶定的送递载体的DNA送递载体部分可为脂质体本身,它优选包含一种或多种脂质或指导细胞特异性结合的糖蛋白。例如Nicolau等(1987)采用乳糖苷神经酰胺、半乳糖末端脱唾液酸神经节苷脂掺入至脂质体中并观察到肝细胞摄取胰岛素基因的增加。设想本发明的组织特异性转化构建物可以类似方式被特异性送递至靶细胞中。D.标记基因
在本发明的优选方面,特定的细胞被用特异性基因标记所标记以提供关于标记细胞命运的信息。因此,本发明还提供基于完整细胞分析和优选采用报道基因的重组候选者筛选和选择方法,其中报道基因将仅在位于报道基因上游常用DNA启动子为功能性的条件下出现的可容易检测的表型传给其重组宿主。通常,报道基因编码不能以其它方式由宿主细胞产生的可通过例如对细胞培养物进行荧光、放射性同位素或分光光度分析来检测细胞培养物检测的多肽(标记蛋白)。
在本发明的其它方面,提供可通过标准的基因分析方法检测的基因标记,如通过PCRTM的DNA或RNA扩增或使用荧光、放射性同位素或分光光度探针的杂交。1.筛选
作为实例的酶包括酯酶、磷酸酶、蛋白酶(组织纤溶酶原激活物或尿激酶)以及其它本领域技术人员已知的能通过其活性被检测的酶。设计用于本发明的是作为用于转基因表达的标记的绿色荧光蛋白(GFP)(Chalfie等,1994)。GFP的使用不需要外源添加的底物,仅通过近紫外或兰光照射,因此具有用于监测活细胞中的基因表达的极大的可能。
其它特定的实例为可与放射标记的底物、果蝇和细菌荧光素酶和细菌酶β-半乳糖苷酶和β葡糖醛酸糖苷酶一起使用的氯霉素乙酰转移酶(CAT)。这一类型中的其它标记基因为本领域技术人员所熟知并适用于本发明中。2.选择
使宿主细胞具有可检测的特性的另一类报道基因为编码多肽,通常为酶的那些,这使得其转化体具有针对毒素的抗性。这类报道基因的实例为保护宿主细胞抗毒性水平的抗生素G418的neo基因(Colberre-Garapin等,1981)、传递链霉素抗性的基因(美国专利4,430,434)、传递潮霉素B抗性的基因(Santerre等,1984;美国专利4,727,028,4,960,704和4,559,302)、编码二氢叶酸还原酶的基因和传递氨甲喋呤的基因(Alt等,1978)、酶HPRT以及许多其它本领域熟知的基因(Kaufman,1990)。E.生物功能等同物
虽然本发明设想使用实例为成视网膜细胞瘤蛋白的包含使产生的蛋白具有相同或更大的肿瘤抑制活性的N末端区修饰的肿瘤抑制蛋白,但保持其生物活性的蛋白未修饰的C末端部分的改变也落在本发明的范围内。
如上所述,可在例如成视网膜细胞瘤的结构中进行修饰和改变,并仍获得具有类似或其它所需特性的分子。例如,在蛋白结构中一些氨基酸可被其它氨基酸取代而不显著丧失肿瘤抑制活性。由于它是确定蛋白生物功能活性的蛋白的活性能力和特性,因此在蛋白序列中可进行一些氨基酸序列的置换(或当然是其潜在的DNA编码序列),而获得具有类似(对抗)性质的蛋白。同样,相同的考虑可被采用来产生具有抵消作用(例如拮抗作用)的蛋白或多肽。因此,本发明人设想可在肿瘤抑制蛋白或多肽(或潜在的DNA)中进行各种变化而不显著丧失其生物利用率或活性。
在功能性等同物方面,技术人员还熟知生物功能性等同蛋白或肽定义的含义为局限于许多可在分子的确定部分中进行并仍产生具有可接受水平的相同的生物活性的分子的改变。生物功能性等同物肽因此在本文被定义为其中一些但不是大多数或全部氨基酸可被置换的那些肽。当然,可容易地制备具有不同置换的多种不同蛋白/或肽并按造本发明使用。
还熟知其中一些残基被显示对于蛋白或肽的生物或结构特性特别重要,例如活性位点的残基,这些残基通常不能改变。
本领域熟知的保守置换包括例如:将丙氨酸改变为丝氨酸;精氨酸改变为赖氨酸;天冬酰胺改变为谷氨酰胺或组氨酸;天冬氨酸改变为谷氨酸;半胱氨酸改变为丝氨酸;谷氨酰胺改变为天冬酰胺;谷氨酸改变为天冬氨酸;甘氨酸改变为脯氨酸;组氨酸改变为天冬酰氨或谷氨酰胺;异亮氨酸改变为亮氨酸或颉氨酸;亮氨酸改变为颉氨酸或异亮氨酸;赖氨酸改变为精氨酸,谷氨酰胺或谷氨酸;甲硫氨酸改变为亮氨酸或异亮氨酸;苯丙氨酸改变为酪氨酸,亮氨酸或甲硫氨酸;丝氨酸改变为苏氨酸;苏氨酸改变为丝氨酸;色氨酸改变为酪氨酸;酪氨酸改变为色氨酸或苯丙氨酸;以及颉氨酸改变为异亮氨酸或亮氨酸。
在进行这些改变中,可考虑氨基酸的亲水性指数。根据其疏水性和电荷特性各种氨基酸被给定了一个亲水性指数,为异亮氨酸(+4.5);颉氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和精氨酸(-4.5)。
本领域通常了解亲水性氨基酸指数在将活性生物功能授予蛋白重要性(kyte和Doolittle,1982,被本文引作参考)。已知一些氨基酸可被具有类似亲水性指数或数值的其它氨基酸置换并仍保持类似的生物活性。在基于亲水性指数进行改变时,优选其亲水性指数在±2以内氨基酸的置换,尤其优选在±1以内的那些,更特别优选在±0.5以内的那些。
本领域还理解可根据亲水性有效地进行类似氨基酸的置换。被本文引作参考的美国专利4,554,101指出由其附近的氨基酸的亲水性决定的蛋白的最大局部平均亲水性与其免疫原性和抗原性,即与蛋白的生物特性相互关系。对于非免疫部分使用该较短的部分。应理解一个氨基酸可被具有类似亲水性值的另一个氨基酸置换并仍然获得生物等同,尤其是免疫等同蛋白。
如美国专利4,554,101所详细描述的,氨基酸残基被给予了下面的亲水性值:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(1.3);颉氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5)和色氨酸(-3.4)。
在根据类似的亲水性值进行改变时,优选其亲水性指数在±2以内氨基酸的置换,尤其优选在±1以内的那些,更特别优选在±0.5以内的那些。
虽然讨论集中在来自氨基酸改变的功能性等同物上,应理解可通过改变编码DNA进行这些改变;还考虑的是遗传密码是简并性的,两个或多个密码子可能编码相同的氨基酸。下面提供了两个表的氨基酸和其密码子以用于这些具体实施方案以及其它用途中,如设计探针和引物等。
表1  优选的人DNA克隆氨基酸                密码子丙氨酸    Ala    A    GCC  GCT  GCA  GCG半胱氨酸  Cys    C    TGC  TGT天冬氨酸  Asp    D    GAC  GAT谷氨酸    Glu    E    GAG  GAA苯丙氨酸  Phe    F    TTC  TTT甘氨酸    Gly    G    GGC  GGG  GGA  GGT组氨酸    His    H    CAC  CAT异壳氨酸  He     I    ATC  ATT  ATA赖氨酸    Lys    K    AAG  AAA亮氨酸    Leu    L    CTG  CTC  TTG  CTT  CTA  TTA甲硫氨酸  Met    M    ATG天冬酰胺  Asn    N    AAC  AAT脯氨酸    Pro    P    CCC  CCT  CCA  CCG谷氨酰胺  Gln    Q    CAG  CAA精氨酸    Arg    R    CGC  AGG  CGG  AGA  CGA  CGT丝氨酸    Ser    S    AGC  TCC  TCT  AGT  TCA  TCG苏亮酸    Thr    T    ACC  ACA  ACT  ACG缬氨酸    Val    V    GTG  GTC  GTT  GTA色氨酸    Trp    W    TGG酪氨酸    Tyr    Y    TAC  TAT从左(最流行)至右(最不流行)降低的密码子流行率下划线的密码子为1000个密码子被使用少于5次的那些。
表2  优选的人DNA克隆氨基酸                密码子丙氨酸    Ala    A    GCC  GCU  GCA  GCG光胱氨酸  Cys    C    UGC  UGU天冬氨酸  Asp    D    GAC  GAU谷氨酸    Glu    E    GAG  GAA苯丙氨酸  Phe    F    UUC  UUU甘氨酸    Gly    G    GGC  GGG  GGA  GGU组氨酸    His    H    CAC  CAU异壳氨酸  He     I    AUC  AUU  AUA赖氨酸    Lys    K    AAG  AAA亮氨酸    Leu    L    CUG  CUC  UUG  CUU  CUA  UUA甲硫氨酸  Met    M    AUG天冬酰胺  Asn    N    AAC  AAU脯氨酸    Pro    P    CCC  CCU  CCA  CCG谷氨酰胺  Gln    Q    CAG  CAA精氨酸    Arg    R    CGC  AGG  CGG  AGA  CGA  CGU丝氨酸    Ser    S    AGC  UCC  TCU  AGU  UCA  UCG苏亮酸    Thr    T    ACC  ACA  ACU  ACG缬氨酸    Val    V    GUG  GUC  GUU  GUA色氨酸    Trp    W    UGG酪氨酸    Tyr    Y    UAC  UAU从左(最流行)至右(最不流行)降低的密码子流行率下划线的密码子为1000个密码子被使用少于5次的那些。F.突变
根据现有技术已知的任何技术进行突变,例如,但不局限于合成在特定的肿瘤抑制蛋白或细胞因子蛋白的序列中具有一个或多个突变的寡核苷酸。尤其是定点诱变是可通过潜在DNA的特定的诱变而用于制备单个肽或生物功能等同蛋白或肽中的技术。该技术进一步提供容易的制备和检测序列突变体的能力,例如通过将一个或多个核苷酸序列的改变导入DNA中而掺入一个或多个前面的情况。
定点诱变允许通过使用编码所需突变的DNA序列的特定的寡核苷酸序列以及足够数量的邻近核苷酸来提供足够大小和序列复杂性的引物序列以在被横跨的缺失接头的两端形成稳定的双螺旋而产生突变体。通常,优选长度为约17至约75核苷酸或更多的引物,其中在改变的序列的接头的两侧具有约10至约25或更多残基。
通常,如各种公开物所例举的,现有技术熟知定点诱变技术。如所理解的,技术通常采用以单链和双链形式存在的噬菌体载体。可用于定点诱变的常用载体包括载体,如M13噬菌体。这些噬菌体可很容易商购,本领域技术人员通常熟知其使用。双链质粒还通常用于去除将感兴趣的基因从质粒转移至噬菌体的步骤的定点诱变中。
通常,通过首先获得单链载体或将在其序列中包括编码所需肽的DNA序列的双链载体的双链溶解分开来进行根据本文的定点诱变。通常合成制备具有所需突变序列的寡核苷酸引物。为了完成含有突变的链的合成,接着用单链载体将该引物退火,置于DNA合成酶,如大肠杆菌聚合酶IKlenow片段。因此,形成其中一条链编码初始的非突变序列,第二条链含有所需的突变的异源双链。接着该异源双链载体被用来转化或转染适宜的细胞,如大肠杆菌细胞,选择包括含有突变序列排列的重组载体的克隆。Kunkel(1987)建议基因选择方法以富集掺入突变寡核苷酸的克隆。
另一方面,使用商购热稳定的酶进行的PCRTM,如Taq聚合酶可被用来将突变寡核苷酸引物掺入到可接着被克隆至适宜克隆或表达载体中的扩增的DNA片段。Tomic等(1990)和Upender(1995)等的PCRTM-介导的突变方法提供了两个该方法的实例。除热稳定聚合酶外还采用热稳定连接酶的PCRTM也可用来将磷酸化的突变寡核苷酸掺入至可接着被克隆至适宜克隆或表达载体中的扩增的DNA片段。Michael(1994)描述的突变方法提供了该方法的一个实例。
使用定点诱变制备选择的肽编码DNA片段的序列突变体被提供作为有效地产生有用种类的方法,并不是限制性的,因为存在其它可获得肽的序列突变体和编码它们的DNA序列的方法。例如可用诱变剂,如羟基胺处理编码所需肽序列的重组载体以获得序列突变体。
如本文所采用的,术语“寡核苷酸定点诱变方法”指导致相对于其初始浓度,特异性核酸分子的浓度增加,或如扩增的可检测信号浓度的增加模板依赖过程和载体介导的增殖。如本文所采用的,术语“寡核苷酸定点诱变方法”指包括引物分子的模板依赖性延伸的方法。术语模板依赖性过程指其中新合成的核酸链由熟知的互补碱基对法则控制的RNA或DNA分子的核酸合成(参见例如Watson,1987)。通常,载体介导的方法包括将核酸片段导入DNA或RNA载体中,克隆扩增载体,并回收扩增的核酸片段。该方法的实例由全文被本文引作参考的美国专利4,237,224提供。G.药物可接受的组合物和给药途径
当设想临床应用时,必须制备适宜于预想用途形式的蛋白、核酸,包括载体,如四环素调节载体,重组病毒和细胞的药物组合物。通常,这要求制备基本上无致热原以及其它可对人或动物有害的杂质的组合物。
通常希望采用适宜的盐和缓冲液以使得组合物适宜于引入病人中。本发明的含水组合物包含有效量的溶解或分散在药物可接受载体或含水介质中的治疗剂,优选其被包被。短语“药物或药物可接受”指当施用与动物或人时,不产生不利、变应原性或其它不恰当反应的分子体和组合物。如本文所采用的,“药物可接受载体”包括任何和所有溶剂、分散介质、涂料、抗菌剂和抗真菌剂、等渗剂和吸收延迟剂等。现有技术中熟知用于药物活性物质的这些介质和试剂的使用。除开与本发明载体或细胞不相容的任何常规介质或试剂这一点,设想其治疗组合物中的用途。辅助性的活性成分,如其它抗癌剂也可被掺入至组合物中。
可在水中适当地与表面活性剂,如羟基丙基纤维素混合制备活性成分的游离碱或药物可接受盐的溶液。可制备在甘油、液体聚乙二醇、其混合物和油中的分散液。在普通的贮存和使用条件下,这些制备物包含防腐剂以防止微生物的生长。静脉内赋形剂包括液体和营养补充物。防腐剂包括抗菌剂、抗氧化剂、螯合剂和惰性气体。根据熟知的参数调节药物组合物的PH和各种成分的确切的浓度。
根据预想的目的确定病毒或细胞的有效量。术语“单位剂量”指适用于个体的物理单个单位,每个单位包含与其给药,即适宜的途径和治疗方案相结合的被计算产生所需应答的预定量的治疗组合物。根据治疗次数和单位剂量的给药量取决于治疗个体、个体的状态和所需的保护。治疗组合物的准确量还取决于医生的判断并为各个个体所特有的。1.胃肠外给药
本发明的活性组合物通常被配制用于胃肠外给药,例如配制成用于经静脉、肌肉内、皮下、肿瘤内、环肿瘤或甚至是腹腔内途径注射。根据本文公开,本领域技术人员已知包含第二种物质作为活性成分的组合物水溶液的制备。通常,该组合物可被制备成如液体溶液剂或悬浮剂的可注射的形式;还可制备适用于在注射前加入液体来制备溶液剂或悬浮剂的固体形式;和还可将制备物乳化。
可在水中适当地与表面活性剂,如羟基丙基纤维素混合制备活性成分的游离碱或药物可接受盐的溶液。可制备在甘油、液体聚乙二醇、其混合物和油中的分散液。在普通的贮存和使用条件下,这些制备物包含防腐剂以防止微生物的生长。
适用于可注射用途的药物形式包括无菌水溶液剂或分散液剂;包含芝麻油、花生油或含水丙二醇的制剂;和用于无菌可注射溶液剂或分散剂的暂时制备的无菌粉剂。在所有情况下,形式必须是无菌的并被液体化至可容易注射的程度。在制造和贮存条件下必须是稳定的,并必须保存抗微生物,如细菌和真菌的污染作用。
可将活性化合物以中性或盐形式配制成组合物中。药物可接受的盐包括酸加成盐(与蛋白的游离氨基形成的)和与无机酸形成的盐,例如盐酸或磷酸,或有机酸,乙酸、草酸、酒石酸、扁桃酸等。与游离羧基形成的盐也可被衍生自无机碱,如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁,有机碱如异丙基胺、三甲基胺、组氨酸、普鲁卡因等。
载体还可为包含例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)、其适宜混合物和植物油的溶剂或分散介质。例如可通过使用涂料,如卵磷脂,在分散的情况下保持所需颗粒大小以及使用表面活性剂保持适当的流动性。微生物作用的防止可通过各种抗菌剂和抗真菌剂来进行,例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞等。在许多情况下,优选包括等渗剂,例如糖或氯化钠。可通过在组合物中使用延长吸收的物质,例如一硬脂酸铝和明胶来实现可注射组合物的延长的吸收。
如所需的,通过将活性化合物以所需量与上述各种其它成分掺入适宜溶剂中,如果需要,接着通过过滤灭菌来制备无菌可注射溶液剂。通常,通过将各种无菌活性成分掺入至包含碱性分散介质和来自上述的那些的所需的其它成分的无菌赋形剂中来制备分散剂。在用于制备无菌可注射溶液剂的无菌粉末的情况下,具体的制备方法为产生活性成分粉末加上来自前面无菌过滤的溶液剂的任何附加的所需成分的真空干燥和冷冻干燥技术。
为了水溶液的胃肠外给药,例如如果需要,溶液应适宜地缓冲,并且液体稀释液首先用足够的盐或葡萄糖保持等渗。这些具体的水溶液为适宜于静脉内、肌肉内、皮下、肿瘤内、环肿瘤和腹膜内给药。在本文中,根据本文公开可采用的无菌水溶液介质对于本领域技术人员是熟知的。例如,可将单剂量溶解在1ml等渗NaCl溶液中并加入到1000ml皮下输液液体中或在建议的灌注部位注射(参见例如“Remington’s药物科学”15版,P.1035-1038和1570-1580)。剂量的一些变化必需取决于治疗个体的情况。在所有情况下负责给药的人将确定各个个体的适宜剂量。2.其它给药途径
除开配制用于如静脉内或肌肉内注射的胃肠外给药的化合物外,其它药物可接受的形式包括例如用于口服的片剂或其它固体剂;缓释胶囊剂;和目前采用的任何其它形式,包括乳油、洗剂、漱口剂,吸入剂等。
本发明的表达载体和送递赋形剂可包括传统的药物制剂。根据本发明的这些组合物的给药将借助于任何常规途径。只要借助于该途径可到达靶组织。这包括口服、鼻、口、直肠、阴道或局部。另一方面,可通过正位、真皮内、皮下、肌肉内、腹膜内或静脉内注射给药。注射可例如为肿瘤的常规、区域、局部或直接注射。还设想借助于导管的对切除的肿瘤床的注射和连续灌注。如上文描述的,这些组合物通常被以药物可接受组合物的形式给药。
本发明的载体被有利地以为液体溶液或悬浮液的形式的可注射组合物的形式给药;还可制备在注射前适用于在液体中的溶液剂或悬浮剂的固体形式。还可将这些制剂乳化。用于此目的的典型的组合物包含50mg或高达约100mg人血清白蛋白/ml磷酸盐缓冲液。其它药物可接受的载体包括水溶液、无毒赋形剂,包括盐、防腐剂、缓冲液等。无水溶剂的实例为丙二醇、聚乙二醇、植物油和可注射有机酯,如油酸甲酯。含水载体包括水、醇/水溶液、盐溶液、胃肠外赋形剂,如氯化钠、Ringer氏葡萄糖等。静脉内赋形剂包括液体和营养补充物。防腐剂包括抗菌剂、抗氧化剂、螯合剂和惰性气体。根据熟知的参数调节药物的pH以及各种成分的浓度。
其它制剂适宜于口服给药。口服制剂包括常规赋形剂,例如药物级甘露糖醇、乳糖、淀粉、硬脂酸镁、糖精钠、纤维素、碳酸镁等。组合物采用溶液剂、悬浮剂、片剂、丸剂、胶囊剂、缓释剂或粉末剂。当给药途径是常规的时,形式可为霜剂、软膏、油膏或喷雾剂。
根据预计的目标确定治疗剂的有效量。术语“单位剂量”指适用于个体的物理准确单位,每一单位包含与其给药,即适宜途径和治疗方案结合被计算产生所需应答的治疗组合物的预定量。根据治疗次数和单位剂量确定的量取决于治疗个体、个体的状态和所需的保护。治疗组合物的准确量还取决于医生的判断,并为各个体所特有。
在一些情况下,本发明的治疗剂还可制备适用于局部给药的形式,如乳膏和洗剂。这些形式可被用于治疗与皮肤相关的疾病,如各种肉瘤。
在配制时,溶液剂以与剂量配制相容的方式和治疗有效量给药。制剂被容易地以各种剂型给药,如上述的可注射溶液剂的类型,甚至可采用药物缓释胶囊剂等。H.化疗剂
本发明的方法可与任何其它常用于治疗病人患有的具体疾病或紊乱的方法结合。例如,与实体瘤治疗结合,本发明的方法可与传统方法结合,例如外科手术、放疗等。只要未知具体的治疗方法其本身有害,或抵消肿瘤抑制治疗的有效性,则设想其与本发明结合。当一种或多种物质与细胞因子基因治疗和/或肿瘤抑制基因治疗结合时,当分别进行各个治疗时,不需要结合的结果是观察到的效果的加和。虽然这是显然是希望的,并且对结合治疗没有特殊要求显示协同作用,虽然其当然是可能和有利的。
在外科手术方面,任何外科手术的干涉可与本发明结合使用。与放疗结合,设想了所有用于在肿瘤细胞中局部诱导DN损伤的机理,如γ-照射、X-射线、UV-照射、微波和甚至电子发射等。还设想放射性同位素直接送递至肿瘤细胞中,这可与靶定抗体或其它靶定方法结合使用。细胞因子治疗还证实是结合治疗方案的有效的配对物。各种细胞因子可用于这些结合方法中。细胞因子的实例包括IL-1α、IL-1β、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、TGF-β、GM-CSF、M-CSF、G-CSF、TNFα、TNFβ、LAF、TCGF、BCGF、TRF、BAF、BDG、MP、LIF、OSM、TMF、PDGF、IFN-α、IFN-β和IFN-γ。根据标准方法给药细胞因子,与临床适应症一致,如病人的情况和细胞因子的相对毒性。下面是作为实例,但并非限制性的被设想用于本发明一些具体实施方案的细胞因子基因的表格。
表3细胞因子                      参考文献人IL-1α          March等自然(nature),315:641,1985小鼠IL-1α        Lomedico等自然(nature),312:458,1984人IL-1β      March等自然(nature),315:641,1985;Auron等
               Proc.Natl.Acad.Sci.USA,81:7907,1984小鼠IL-1β  Gray,免疫学杂志(J.Immunol.,),137:3644,1986;Telford,
           核酸研究,(Nucl. Acids Res.,)14:9955,1986人Ilra          Eisenberg等,自然(nature),343:341,1990人IL-2       Taniguchi等,自然(nature),302:305,1983;Maeda等,生物
             化学与生物物理研究通讯(Biochem Biophys.Res.Commun.,)人IL-2               Taniguchi等,自然(nature),302:305,1983人IL-2                     Yang等.,细胞(Celt),47:3,1986小鼠IL-3          Yokota等.,Proc.Natl.Acad.Sci,USA,81:1070,1984;Fung
                    等,自然(nature),307:233,1984;Miyatake
                    等.,Proc.Natl.Acad. Sci USA,82:316,1985人IL-4              Yokota等.,Proc.Natl.Acad. Sci.USA,83:5894,1986小鼠IL-4                Norma等.,自然(nature),319:640,1986;Lee
                    等.,Proc.Natl.Acad.Sci.USA,83:2061,1986人IL-5           Azuma et al.,核酸研究(Nucl.Acids Res).,14:9149,1986小鼠IL-5        Kinashi等.,自然(nature),324:70,1986;Mizuta等.,生长因子
                          (Growth Factors),1:51,1988人IL-6                  Hirano等.,自然(nature),324:73,1986小鼠IL-6                Van Snick等.,欧洲免疫杂志(Eur.J.Immunol).,
                                    18:193.1988人IL-7             Goodwin等.,Proc.Narl.Acad Sci.USA,86:302,1989小鼠IL-7                  Namen等.,自然(nature),333:571,1988人IL-8                            Schmid等.,免疫学杂志
            (J.Immunol).,139:250,1987;Matsushima等.,欧洲医池杂
                  志,167:1883,1988;Lindley等.,Proc.Natl.Acad.
                                Sci.USA,85:9199.1988   细胞因子                          参考文献人IL-9                  Renauld等.,免疫杂志(J.Immunol).,小鼠IL-9       Renauid等.,免疫学杂志(J.Immunol).,144:4235,1990人血管生成素              Kurachi等.,EMBO J.,7:2025,1988人GROα       Richmond等.,J.实验医学杂志(EmBO J).,7:2025,1988小鼠MIP-1α           Davatelis等.,实验医学杂志,167:1939,1988小鼠MIP-1β     Sherry等,实验医学杂志(J.Exp>Med).,168:2251,1988人MIF           Weiser等.,Proc.Natl. Acad.Sci,USA,86:7522,1989人G-CSF        Nagata等.,自然(nature),319:415,1986;Souza等.,科学
                            (Science),232:61,1986人GM-CSF     Cantrell等.,Proc.Natl.Acad.Sci.USA,82:6250,1985;Lee
           等,Proc.Natl.Acad.Sdi.USA,82:4360,1985;Wong等.,科学
                            (Science),228:810,1985小鼠GM-CSF                   Gough等.,EMBO J.,4:645,1985人M-CSF          Wong,科学(Science),235:1504,1987;Kawasaki,科学
             (Science),230;291,1985;Ladner,EMBO J.,6:2693,1987人EGF       Smith等,核酸研究(Nucl.Acids Res).,10:4467,1982;Bell等,
                    核酸研究(Nucl.Acids Res).,14:8427,1986人TGF-α                 Derynckt等.,细胞(Cell),38:287,1984人FGF acidic   Jaye等.,科学,233:541,1986;Gimenez-Gallego等.,生物化学与
               生物物理研究通讯(Biochem. Biophys.Res.Commun.,)
          138:611,1986;Harper等.,生物化学(Biochem.,)25:4097,1986人β-ECGF                 Jaye等.,科学(Scieence),233:541,1986人FGF basic        Abraham等.,EMBO J.,5:2523,1986;Sommer等.,生物化学
                    (Biochem Biophys.Res.Comm).,144:543,1987小鼠IFN-α                        Higashi等.,生物化学研究
              (J.Biol.Chem).,258:9522,1983;Kuga,核酸研究(Nucl.Acids
                                Res.,17:3291,1989)
表3(续)细胞因子                                参考人IGF-γ      Gray等.,自然(Nature),295:503,1982;Devos等.,核酸研究
            (Nucl.Acids Res).,10:2487,1982;Rinderknecht,生物化学
                        (J,Biol.Chem).,259:6790,1984人IGF-I       Jansen等.,自然(Nature),306:609,1983;Rotwein等.,生物
                      化学(J.Biol.Chem).,261:4828,1986人IGF-II                Bell等.,自然(Nature),310:775,1984人β-NGF链             Ullrich等.,自然(Nature),303:821,1983人PDGF A链            Betsholtz等.,自然(Nature),320:695,1986人PDGF B链        Johnsson等.,EMBO J.,3:921,1984;Collins等.,自然
                             (Nature),316:748,1985人TGF-β1               Derynck等.,自然(Nature),316:701,1985人TNF-α      Pennica等.,自然(Nature),312:724,1984;Fransen等.,核酸
                     研究(Nucl.Acids Res).,13:4417,1985人TNF-β                Gray等.,自然(Nature),312:721,1984鼠TNF-β          Gray等.,核酸研究(Nucl.Acids Res).,15:3937,1987
本发明组合物可以含有与有效量的下文所例示的为化学治疗剂的化合物(第二试剂)结合的用于治疗给药的基因工程病毒或细胞。这样的组合物一般溶解于或分散于药学可接受载体或含水基质中。很多种化学治疗剂可以与本发明治疗剂结合使用。这些可以是例如直接交联的DNA,插入到DNA中的试剂,和通过影响核酸合成导致染色体和有丝分裂的畸变的试剂。
不考虑实现提高的肿瘤破坏作用的机理,本发明结合治疗方面在有效治疗疾病中具有明显的用途。为了与化学治疗剂的给药结合使用本发明组合物,人们可以简单地以有效导致它们在动物体内的结合的抗肿瘤作用的方式与化学治疗剂结合对动物给药至少一种这里所公开的第一种修饰的成视网膜细胞瘤肿瘤抑制剂。以有效量提供和有效导致其在肿瘤环境下结合存在和其结合作用的时间提供这些制剂。为了实现这一目的,可以使用不同的给药途径,以单一组合物或者两种不同的组合物的形式同时对动物给药修饰的成视网膜细胞瘤肿瘤抑制剂和化学治疗剂。
或者,修饰的成视网膜细胞瘤肿瘤抑制剂治疗可以数分钟至数星期的间隔在化学治疗剂治疗之前或之后进行。在分开对动物施用化学治疗因子和修饰的成视网膜细胞瘤肿瘤抑制剂的实施方案中,人们一般确保明显时间周期在每一次送递时间之间不终止,这样化学治疗剂和修饰的成视网膜细胞瘤肿瘤抑制剂将仍然能对肿瘤产生有利的结合作用。在这样的例子中,设想在大约5分钟至大约一星期内将肿瘤与两种试剂接触,更优选在大约12-72小时之内,只有大约12-48小时的延迟时间是最优选的。在某些情况下,可能期望明显延长治疗时间,在各给药之间间隔几天(2,3,4,5,6或7)或者甚至几星期(1,2,3,4,5,6,7或8)时。也设想希望一次以上给药修饰的成视网膜细胞瘤肿瘤抑制剂或化学治疗剂。为了实现肿瘤的消退,不考虑给药时间,以有效抑制肿瘤生长的结合量送递两种试剂。
各种各样的化学治疗剂被打算用于这里所公开的结合治疗方法中。设想作为例示的化学治疗剂包括,例如依托泊甙(VP-16),阿霉素,5-氟尿嘧啶(5FU),喜树碱,放线菌素-D,丝裂霉素C,顺铂(CDDP)还有过氧化氢。
如本领域技术人员所理解的,化学治疗剂合适的剂量一般在已经在临床治疗中使用的那些左右,其中化疗剂单独或者与其它化学治疗剂结合给药。只是为了举例,可以使用例如顺铂和其它DNA烷基化试剂。顺铂被以每三星期每5天以临床施用20mg/m2总共三个疗程使用的剂量广泛用来治疗癌症。顺铂不是口服吸收而必须是通过静脉内,皮下,肿瘤内或者腹膜内注射送递。
设想在这里给出并直接交联核酸特别是DNA以发生导致协同的抗肿瘤结合作用的DNA损伤的试剂。可以使用例如顺铂和其它DNA烷基化试剂的试剂。
其它有用的试剂包括干扰DNA复制,有丝分裂和染色体分离的化合物。这样的化学治疗化合物包括阿霉素(adriamycin,也称之为doxorubicin),依托泊甙,维拉帕米,鬼臼素(podophyllotoxin)等等。临床上广泛用来治疗肿瘤,这些化合物通过对阿霉素以21天间隔,25-75mg/m2范围的剂量经浓缩药团静脉内注射,对于依托泊甙为35-50mg/m2静脉内给药或者以双倍剂量口服给药。
也可以使用破坏多核苷酸前体的合成和重现精度的试剂。特别有用的是经大量试验并且容易获得的试剂。例如肿瘤组织优选使用例如5-氟尿嘧啶(5-FU)试剂,使得该试剂对于瞄准肿瘤细胞特别有用。尽管毒性很大,5-FU,可在宽范围的载体中使用,包活表面给药,但是一般使用3-15mg/kg/天剂量范围静脉内给药。
植物生物碱例如紫杉醇也设想在本发明的某些方面使用。紫杉醇是试验抗有丝分裂试剂,其从白蜡树,Taxus brevifolia的树皮分离。其结合微管蛋白(在与长春花生物碱所使用的不同的位点)并且促进微管的装配。紫杉醇目前正在进行临床评价;其具有抗恶性黑素瘤和卵巢癌的活性。最大剂量是5天每天30mg/m2或者每3星期给药210-250mg/m2。当然,所有这些剂量都是举例的,预期这些点之间的任何剂量也都可以在本发明中使用。
可用于与结合治疗相关的有用的例示的化学治疗剂列在表4中。这里所列出的每一种试剂都是例示而不意味着限定。本领域技术人员可参照“Remington’s药物科学”(Remington’s Pharmaceutical Sciences)15版,33章,特别是p.624-652。根据要治疗的被试者的症状必须进行剂量的一些变化。负责给药的人员最终确定各个受试者的合适的剂量。此外,对于对人给药制剂应该符合如FDA Office ofBiologics standards所要求的无菌,热原性,一般安全性和纯度标准。
表4
                    肿瘤疾病中有用的化学治疗剂种类:烷基化试剂试剂类型:氮芥类
非专有名称(其它名称):氮芥(HN2)
疾病:
霍奇森病,非霍奇森淋巴瘤,急性和慢性淋巴细胞白血病,
非专有名称(其它名称):环磷酰胺
疾病:
霍奇森病,非霍奇森淋巴瘤,多发性骨髓瘤,神经瘤,乳腺癌,卵巢癌
非专有名称(其它名称):异环磷酰胺
肺癌,Wilms肿瘤,宫颈肉瘤,睾丸肉瘤,软组织肉瘤
非专有名称(其它名称):美法仑(L-sarcolysin)
疾病:
多发性骨髓瘤,乳腺癌,卵巢癌
非专有名称(其它名称):苯丁酸氮芥
疾病:
急性和慢性淋巴细胞白血病,初级巨球蛋白白血症,霍奇森病,非霍奇森淋巴瘤,
试剂类型:氮丙啶和甲基蜜胺
非专有名称(其它名称):六甲基蜜胺
疾病:卵巢癌
非专有名称(其它名称):噻替派
疾病:膀胱癌,乳腺癌卵巢癌
试剂类型:烷基磺酸盐
非专有名称(其它名称):白消安
疾病:慢性粒细胞白血病,霍奇森病,非霍奇森淋巴瘤,
非专有名称(其它名称):卡莫司汀(BCNU)
疾病:初级脑瘤,多发性骨髓瘤,恶性骨髓瘤,霍奇森病,非霍奇森淋巴瘤,
试剂类型:亚硝基脲
非专有名称(其它名称):洛莫司汀(CCNU)
疾病:初级脑瘤,胃癌,结肠癌,
非专有名称(其它名称):链佐星(streptozotocin)
疾病:恶性胰腺胰岛瘤,恶性类癌瘤,
类别:抗代谢物
试剂类型:三嗪
非专有名称(其它名称):达卡巴嗪(DTIC;dimethyltriazenoimidaz olecarboxamide)
疾病:恶性黑素瘤,霍奇森病,软组织肉瘤,
试剂类型:叶酸类似物
非专有名称(其它名称):甲氨蝶呤(amethopterin),Fluouracil(5-Fluouracil;5-FU)
疾病:蕈样真菌病,乳腺癌,头颈肉瘤,肺癌,成骨肉瘤
试剂类型:嘧啶类似物
非专有名称(其它名称):氟尿苷(Fluorode-oxyuriding;FUdR)
疾病:乳腺癌,结肠癌,胃癌,胰腺癌,卵巢癌,头颈肉瘤,泌尿膀胱癌,恶性前皮肤损伤(表皮)
类别:抗代谢物,连续
试剂类型:嘧啶类似物
非专有名称(其它名称):阿糖胞苷(Cytosine arabinoside)
疾病:急性巨细胞和急性淋巴细胞白血病
非专有名称(其它名称):巯嘌呤(6-巯嘌呤;6-MP)
疾病:急性淋巴细胞,急性巨细胞和慢性巨细胞白血病
试剂类型:嘌呤类似物和相关的抑制剂
非专有名称(其它名称):硫鸟嘌呤(6-硫鸟嘌呤;TG)
疾病:急性巨细胞和急性淋巴细胞和慢性巨细胞白血病
非专有名称(其它名称):喷司他丁(2-deoxycoformycin)
疾病:毛状细胞白血病,蕈样真菌病,慢性淋巴细胞白血病
非专有名称(其它名称):长春碱(VLB)
疾病:霍奇森病,非霍奇森淋巴瘤,乳腺癌,睾丸癌
试剂类型:长春花生物碱
非专有名称(其它名称):长春新碱
疾病:急性淋巴细胞白血病,神经瘤,Wilms肿瘤,横纹肌肉瘤,霍奇森病,非霍奇森淋巴瘤,小细胞肺癌
试剂类型:长春花生物碱
非专有名称(其它名称):依托泊甙(VPl6);Tertiposide
疾病:霍奇森病,非霍奇森淋巴瘤,急性巨细胞白血病,Kaposi肉瘤
类别:自然产物
试剂类型:抗生素
非专有名称(其它名称):放线菌素D(actinomycinD)
疾病:绒毛膜癌,Wilms肿瘤,横纹肌肉瘤,睾丸癌,Kaposi肉瘤
非专有名称(其它名称):柔红霉素(daunomycin;rubidomycin)
疾病:急性巨细胞和急性淋巴细胞白血病
非专有名称(其它名称):阿霉素
疾病:急性白血病,乳腺癌,生殖泌尿器癌,甲状腺癌,肺癌,胃癌,神经瘤
非专有名称(其它名称):博来霉素
疾病:生殖泌尿器道癌,霍奇森病,非霍奇森淋巴瘤,
试剂类型抗生素,连续
非专有名称(其它名称):普卡霉素(mithramycin)
疾病:睾丸癌,恶性高钙血
非专有名称(其它名称):丝裂霉素(mitomycin)
疾病:胃癌,子宫颈癌,结肠癌,乳腺癌,胰腺癌,膀胱癌,头颈癌
试剂类型:
非专有名称(其它名称):L-天冬胺酰酶
疾病:急性淋巴细胞白血病,毛状细胞白血病,Kaposi肉瘤,
试剂类型:生物反应修饰剂
非专有名称(其它名称):α-干扰素
疾病:黑素瘤,类癌瘤,肾细胞癌,卵巢癌,膀胱癌,非霍奇森淋巴瘤,  蕈样真菌病,多发性肉瘤,慢性巨细胞白血病,
试剂类型:铂-配位复合物
非专有名称(其它名称):顺铂(cis-DOP);卡铂
疾病:类癌瘤,子宫颈癌,子宫内膜癌,神经瘤,成骨肉瘤
试剂类型:蒽二酮
非专有名称(其它名称):米托蒽醌
疾病:急性巨细胞白血病,乳腺癌
类别:Miscellaneous试剂
试剂类型:取代的脲
非专有名称(其它名称):羟基脲
疾病:慢性巨细胞白血病,红细胞增多症,vera,基础血小板增多症,恶性黑素瘤
试剂类型:甲基肼衍生物
非专有名称(其它名称):丙卡巴肼衍生物(N-甲基肼,MIH)
疾病:霍奇森病
类别:激素和拮抗剂
试剂类型:促肾上腺抑制剂
非专有名称(其它名称):米托坦(o,p’-DDD)
疾病:肾上腺皮质癌
非专有名称(其它名称):氨鲁米特
疾病:乳腺癌
试剂类型:促肾上腺甾类化合物
非专有名称(其它名称):泼尼松(几种其它可获得等价制剂);羟孕柄己酸酯
疾病:急性和慢性淋巴细胞白血病,非霍奇森淋巴瘤,霍奇森病,乳腺癌
试剂类型:孕甾酮
非专有名称(其它名称):醋酸甲羟孕酮;醋酸甲地孕酮;二乙基己烯雌酚
疾病:子宫内膜癌,乳腺癌
试剂类型:雌激素
非专有名称(其它名称):乙炔基甾二醇(可获得的其它制剂)
疾病:乳腺癌,前列腺癌
试剂类型:抗雌激素
非专有名称(其它名称):他莫昔芬丙酸膏酮
疾病:乳腺癌
试剂类型:雄性激素
非专有名称(其它名称):氟甲膏酮(可获得的其它制剂)
疾病:乳腺癌,
试剂类型:抗雄性激素
非专有名称(其它名称):氟他胺
疾病:前列腺癌
试剂类型:促性腺激素释放激素类似物
非专有名称(其它名称):Leuprolide
疾病:前列腺癌
I.蛋白质纯化
本发明的一些方面涉及编码的蛋白质或肽的纯化,和在特别的实施方案中的大量纯化。这里所使用的术语“纯化的蛋白质或肽”意指可从其它成分分离的一种组分,其中蛋白质或肽被纯化成相对于其天然可获得状态的任何程度。因此纯化的蛋白质或肽也指从其可能天然存在的环境中游离出来的蛋白质或肽。
一般情况下,“纯化的”指已经进行了分级去除了各种各样的其它成分的蛋白质或肽组分,并且该组分基本上保留其表达的生物活性。使用术语“基本上纯化的”时,其意思指其中蛋白质或肽组成该组合物的主要成分,例如构成组合物中大约50%或更多的蛋白质。
根据本文的公开,确定蛋白质或肽的纯度的各种方法是本领域技术人员所公知的。这些包括例如测定活性级分的比活,或者通过SDS/PAGE分析评价各级分中多肽的量。评价级分的纯度的优选方法是计算级分的比活,将其与初始提取物的比活相比较来计算纯度,这里通过“-成倍纯度数”评价。用来代表活性量的实际单位当然取决于纯化后选择的具体分析方法和表达的蛋白质或肽是否表现出可检测活性。
适用于蛋白质纯化的各种技术是本领域技术人员公知的。这些包括例如用硫酸铵沉淀,PEG,抗体等或者通过热变性,接着离心;色谱方法例如离子交换,凝胶过滤,反相羟基磷石灰和亲和层析;等电聚焦;凝胶电泳;和这些和其它技术的结合。正如本领域所一般公知的,认为可以变化进行各种纯化步骤的顺序,或者可以省略一些步骤,仍然得到制备基本上纯的蛋白质或肽的合适的方法。
就蛋白质或肽总是以它们最纯化的状态提供这一点没有一般的要求。事实上,设想到基本上较不纯的产物在某些方案中具有实用性。可以通过在组合中使用较少的纯化步骤,或者通过使用相同的一般纯化方法的不同形式来实现部分纯化。例如,设想利用HPLC仪器进行的阳离子交换柱色谱一般导致比利用低压色谱系统的相同技术大几倍的纯化。显示较低相对纯度的方法可能在蛋白质产物的总回收中或者在保持被表达的蛋白质的活性中具有优势。
已知多肽的迁移有时明显地随着SDS/PAGE的不同条件而变化(Capaldi等,1977)。因此意识到在不同的电泳条件下,纯化的或部分纯化的表达产物的表观分子量可以变化。
高效液相色谱(HPLC)的特征在于有特别峰分辨的非常快的分离。通过利用特别细的颗粒和高压来保持和使流速适当来完成。分离可以在几分钟内或者最多一小时完成。而且只需要非常小体积的样品,因为颗粒是如此之小和装填密实,使得孔隙容积是床体积的非常小的部分。还有,样品的浓度不需要非常大,因为泳带非常窄以致有非常小的样品修稀释度。
凝胶色谱,或者分子筛色谱是以分子大小为基础的一种特殊类型色谱。理论的凝胶色谱是当它们通过或者绕过孔时用包含小的孔隙的惰性物质的小颗粒制备的柱子根据它们的大小从较小分子分离较大分子。只要制成颗粒的材料不吸附该分子,则决定流速的关键因素是大小,只要其形状相对不变。因此,分子以减小的大小从柱子中洗脱出来。凝胶色谱对于分离不同大小的分子是最佳的,因为分离不依赖于所有其它的因素,例如pH,离子强度,温度等。重要的是还没有吸附作用,并且洗脱体积以简单的方式与分子量相关联。
亲和层析是一种色谱方法,其以要分离的物质和其可以特异性结合的分子之间的特异亲和性为基础。这是一种受体-配体型相互作用。柱材料通过将结合配对物中的一个与不溶性基质共价偶联来合成。然后柱材料能特异性从溶液中吸附物质。通过将条件变成不发生结合的条件(改变pH,离子强度,温度等)来洗脱。
可用于含有化合物的碳氢化合物的纯化中的特殊类型的亲和层析是凝集素亲和层析。凝集素是一类结合多糖和糖蛋白的物质。凝集素通常通过溴化氰偶联琼脂糖。与琼脂糖凝胶偶联的ConconavalinA是要使用的第一类该物质,并且被广泛用于包括晶壮体凝集素,在纯化N-乙酰基葡糖氨基残基中有用的麦胚凝集素和法国蜗牛凝集素的非凝集素的多糖和糖蛋白的分离。凝集素本身用带有碳水化合物配体的亲和层析纯化。乳糖被用来从蓖麻子和花生中纯化凝集素;麦芽糖在从小扁豆和刀豆中提取凝集素是有用的;N-乙酰基-D半乳糖胺被用来从大豆纯化凝集素;N-乙酰基葡糖胺结合来自小麦胚的凝集素;D半乳糖胺被用来从蛤肉中获得凝集素,而L-岩藻糖将与来自莲的凝集素结合。
基质应该是一种物质,其自身不在任何明显的程度上吸附分子并且具有宽范围的化学,物理和热稳定性。该配体应该以不影响其结合性能的方式偶联。该配体还应该提供相对紧密的结合。并且应该能够洗脱物质而不破坏样品或配体。亲和层析的最常用的一种形式是免疫亲和层析。
L.在生物反应器中使用细胞
产生生物活性多肽的能力对于药学工业越来越重要。本发明公开了有效调节例如细胞中肿瘤抑制剂基因的表达,使得从先前难治的细胞类型中体外产生这些蛋白质的组合物和方法。
在过去的10年中,生物技术的进步已经导致从细菌,酵母,昆虫细胞和从哺乳动物细胞培养物产生重要的蛋白质和因子。哺乳动物培养物在它们翻译后形成的复杂蛋白质结构例如二硫化物依赖性折叠和糖基化能力方面具有超过从低等生物产生的培养物的优点。实际上,哺乳动物细胞培养物现在是优选的在人和动物药物中使用的多种重要蛋白质的来源,特别是相对大的,复杂的或糖基化的那些。
通过设计和构建哺乳动物细胞培养物中高效载体系统,一套有用的选择标记物,基因扩增方法和参与从引进的载体获得最终的生物活性分子的生物化学和细胞机理的更加深刻的理解大大促进了用于生产药物的哺乳动物细胞培养物的开发。
但是,用于表达异源蛋白质的细胞类型的传统的选择通常局限于较“普通”的细胞类型例如CHO细胞,BHK细胞,C127细胞和骨髓瘤细胞。在很多种情况下,选择这些细胞类型是因为关于这些细胞类型先前大量存在文献或者在进行表达肽产物时,这种细胞在实验室中容易操作。常常地,在选择细胞系作为表达系统的宿主之前没有考虑影响大规模生产的下游(例如T-75瓶状细胞之外)侧的因素。
本发明的方面吸取了哺乳动物细胞生物化学和细胞能力以及最近可获得的生物反应器技术的优点。根据本发明在生物反应器中培养细胞允许大规模产生并且将复杂的完全生物活性的多肽分泌到生长培养基中。在特别的实施方案中,通过用低含量的复杂蛋白质的设计培养基和为了提高的效价使用对而分泌到培养基中的定时刺激作用方案,纯化方法可以大大简化,从而降低生产成本。
1.贴壁依赖性和非贴壁依赖性培养物
动物和人细胞可以以两种方式体外增殖:作为在大量培养物中在悬浮液中自由生长的非贴壁依赖性细胞;或者为其增殖需要附着固体底物的贴壁依赖性细胞(即单层类型细胞生长)。
非贴壁依赖性或者来自连续建立的细胞系的悬浮培养物是最广泛用于大规模产生细胞和细胞产物的物质。以微生物(细菌或酵母)发酵技术为基础的大规模悬浮培养物对于产生哺乳动物细胞产物具有明显的优点。该方法相对来说操作简单和规模较大。可以在反应器中提供均匀条件以精确监测和控制温度,溶解的氧和pH,并且保证可以取到代表性样品。
但是,悬浮培养细胞不总是可用于生产生物材料中。悬浮培养物仍被认为具有肿瘤原潜在性,因此其作为生产底物的应用限制了得到的产物在人和兽医应用中的使用(Petricciani,1985;Larsson and Litwin,1987)。在悬浮培养物中增殖的病毒与贴壁依赖性培养物相反有时可能会引起病毒标记物的快速变化,导致减少的免疫原性(Bahnemann,1980)。最后,当作为贴壁依赖性培养物增殖与相同细胞系在悬浮液中增殖相比时,重组细胞系有时甚至可以分泌相当大量的分泌产物(Nilsson and Mosbach,1987)。由于这些原因,在产生不同生物产物中广泛使用不同类型的贴壁依赖性细胞。
本发明包括具有为贴壁依赖性性质的细胞。贴壁依赖性细胞当在悬浮液中生长时,将相互附着并且成团生长,甚至当其达到使中心细胞在培养条件下不能维持的大小时,窒息了各个团中心细胞。因此,为了有效利用细胞分泌异源蛋白质能力的优点,还提供了一种大规模培养贴壁依赖性细胞的有效方法。
2.悬浮培养的反应器和方法。
设想了在搅拌的容器中哺乳动物培养物的大规模悬浮培养。采用了对于生物反应器的使用设备和控制,以及来自相关的微生物应用的发酵罐的设计。但是,由于对于减缓哺乳动物培养物生长的污染的控制的提高的要求,提供了改进的无菌设计,提高了这些反应器的可靠性。方法和控制包括搅拌,温度,溶解的氧和pH控制。用于浊度(存在的颗粒的函数),容量(存在的成活细胞的函数),葡萄糖/乳酸盐,碳酸盐/碳酸氢盐和二氧化碳的联机和离机测定的更先进的探针和自动分析仪也可得到。悬浮培养物中可得的最大细胞密度是相对低的,大约每毫升培养基2-4×106个细胞(比每毫升1mg干细胞重量低),远远低于微生物发酵中得到的数目。
两种悬浮培养反应器设计由于其操作的简单性和健全性而最广泛地在工业上使用-搅拌的反应器和气升式反应器。搅拌的反应器设计已经在8000升容量规模生产干扰素中成功地使用(Phillips等,1985;Mizrahi,1983)。在高度与直径之比是1∶1至3∶1的不锈钢罐中培养细胞。培养物通常用一个或多个以叶片盘式或船螺旋桨式为基础的搅拌器混合。已经描述过搅拌器系统比叶片提供较小的剪切力。搅拌作用可以通过磁偶动力直接或间接驱动。间接驱动减少了通过搅拌器杆密封层的微生物的污染。
气升式反应器,开始对微生物发酵已经描述过并且后面对于哺乳动物培养也要描述,依靠气流来混合培养物和给培养物供氧。气流进入反应器较高部分并且驱动循环。气体在培养物表面释放,引起没有气泡的浓的液体,并在反应器在向下部分下向行驶。该设计的主要优点是简单和不需要机械搅拌。典型地,高与直径之比是10∶1。相对容易大规模生产的气升式反应器,具有好的气体质量转移并产生相对低的剪切力。
最大规模悬浮培养以间歇式或间歇式加料方法操作,因为它们操作和规模化最简单。但是,以恒化器或灌注法原理为基础的连续方法也是可行的。
间歇式方法是一种密闭系统,其中可见典型的生长曲线。对数期后接着是指数期,稳定期和衰亡期。在这样的一个系统内,环境随着营养物的减少和代谢产物的积累而连续变化。这使得分析影响细胞生长和生产力的因素,从而优化方法,这是一项复杂的工作。间歇式方法的生产力可以通过控制关键营养物的加料来延长生长周期来提高。这样的一种间歇式方法仍然是密闭系统,因为没有去除细胞,产物和废产物。
在这样一个仍然是密闭系统中,可以通过用细筛旋转过滤器截留细胞并且旋转过滤以防止阻塞来实现新鲜培养基进入培养物的灌注。旋转过滤器培养物可以产生大约5×107个细胞/ml的细胞密度。一个真正的开发系统和最基础的灌注方法是恒化器,其中有培养基的流入和细胞和产物的流出。以预测的恒定的速度向反应器中加入培养基,这样的速度保持培养物的稀释速度在小于细胞最大特异生长速度的数值(以防止细胞质从反应器中洗出)。以相同的速度取出含有细胞,细胞产物和副产物的培养液。这些灌注系统没有在从哺乳动物细胞培养物的生产中商业上使用。
3.非灌注的附着系统
传统地,贴壁依赖性细胞培养在小的玻璃或塑料容器的底部增殖。通过常规和传统技术提供的适合实验室规模的严格的表面与体积比,产生了大规模生产细胞和细胞产物中的防碍生产流程的一环。为了提供对于细胞在小的培养体积中生长提供大的可能的表面的系统,已经提出了多种技术滚瓶系统,组套板增殖器,螺旋膜瓶,中空纤维系统,填充床,片板交换器系统,和膜丝管筛。因为这些系统本质上是非均质的,并且有时以多种方法为基础,它们有时可能会有限制的规模化的可能性,在摄取样品时有困难的限制,测定和控制系统的限制的可能性和培养物中保持均匀的环境条件中的困难。
这些系统中常用的方法是滚瓶。作为比大的稍小的不同形状的T-瓶,该方法的简单性使得它非常可靠,因此引人注目。可获得完全自动的自动机,其能每天操作成千上万滚瓶,因此减少了污染的危险和与其它的需要认真的人的操作相关的不一致性。常常变化培养基,摇瓶培养能实现接近于05×106细胞/cm2的细胞密度(相应于109细胞/瓶或107细胞/毫升培养基)。
4.在微载体上培养
Van Wezel(1967)提出了微载体培养系统的概念。在这个系统中,细胞通过缓慢的搅拌在悬浮于生长培养基中的小的固体颗粒的表面上增殖。细胞附着于微载体并且逐渐生长至铺满于微载体表面。事实上,该大规模培养系统将附着依赖性培养物从单皿方法上升到单元方法的级别,其中一起利用了单层和悬浮培养两者。因此,将细胞生长的必需的表面和均相悬浮培养的好处结合提高了生产。
微载体培养的优点超过了大多数其它贴壁依赖性大规模培养方法几倍。首先,微载体培养提供了高的表面与体积比(通过改变载体的浓度而变化),这导致高的细胞密度产率和获得高浓度细胞产物的可能性。当培养物在灌注反应器方式中增殖时,细胞产率最大达1-2×107细胞/ml。第二,细胞可以在一个单元方法容器中增殖而不是使用很多小的低生产力的容器(即烧瓶或皿)。这导致好得多的使用并且可观地节约培养基。此外,在单一反应器中增殖导致对于所需利用有利空间的减少和对于每个细胞操作步骤数目的减少,因此减少了劳动成本和污染的危险。
第三,混合得非常好的均相微载体悬浮培养使可能监测和控制环境条件(例如pH,pO2,和培养成分的浓度),从而导致更大的可重复生产的细胞增殖和产物回收。第四,可能摄取有代表性的样品用于显微镜观察,化学测试或计数。第五,因为微载体容易从悬浮物中沉积出,所以相对容易地做到使用间歇式加料方法或收集细胞。第六,微载体上的贴壁依赖性培养物增殖方式使得可能使用该系统用于其它细胞操作,例如不使用蛋白质水解酶的细胞转移,细胞的共培养,移植至动物体中,和使用倾析器,柱,流化床或中空纤维的用于微载体截留的培养物灌注。第七,微载体培养相对容易地使用用于微生物和动物细胞在悬浮液中培养的常规设备规模化。
5.哺乳动物细胞微胶囊作用
表现出对于培养哺乳动物细胞特别有用的一种方法是微胶囊作用。哺乳动物细胞截留在半渗透水凝胶膜中。细胞周围形成大孔膜,允许营养物,气体和代谢产物的交换,胶囊周围有培养基团。已经开发出几种方法,其温和,快速并且无毒,并且其中得到的膜足够多孔和强来保持生长的细胞质通过培养物。这些方法全部以通过与含钙的溶液滴加接触而凝胶化的可溶性藻酸盐为基础。Lim(美国专利4321883)描述了浓缩在大约1%藻酸钠溶液中的细胞,其在力的驱使下通过小的口,形成滴液,并且自由进入大约1%氯化钙溶液中。滴液然后落在与表面藻酸盐离子键结合的多氨基酸层上。最后,通过在螯合剂中处理滴液以去除钙离子而将藻酸盐重新液化。其它方法使用要滴加到藻酸盐溶液中的钙溶液中的细胞,从而产生中空的藻酸盐球体。类似的方法包括滴加到藻酸盐中的脱乙酰壳多糖溶液中的细胞,也产生中空的球体。
微胶囊化细胞容易在搅拌的罐反应器中增殖,并且球大小在直径是150-1500mm范围内,容易保持在使用细目筛的灌注反应器中。胶囊体积与总的培养基体积之比可以保持在1∶2至1∶10这样的密度。胶囊内细胞密度最大108情况下,培养物中有效细胞密度是1-5×107
微胶囊作用超过其它方法的好处包括保护不受喷射和搅拌产生的剪切力的不利的影响,容易将球保持用于使用灌注系统的目的的能力,规模化相对简单和使用球体植入的能力。
6.灌注的吸附系统
灌注指以稳定的速度连续流经或流过细胞群(生理营养溶液的细胞群)。这意味着与用回收的培养基将细胞洗出的连续流动培养(例如恒化器)相反的培养单元中细胞的滞留。在本世纪初期已经知道灌注的方法,并且已经应用来使少量的组织成活以进行显微镜观察。该项技术开始是为了模拟体内细胞环境,其中血液,淋巴或其它体液源源不断地供给细胞。不用灌注,培养物中的细胞经历有营养和无营养的交替态,从而限制了它们生长和代谢潜力的完全表达。现在使用的灌注培养是以高密度生长细胞(即0.1-5×108细胞/ml)。为了将密度提高到超过2-4×106细胞/ml(或2×105细/cm2),不断用新鲜供应的培养基置换培养基,以造成营养缺乏和去除有毒产物。灌注使好得多地控制培养环境(pH,pO2,营养水平等),并且是明显提高培养物中为了细胞附着的表面积的使用率的一种方法。
微载体和微胶囊培养容易适于灌注反应器,但是如上所述,这些培养方法没有满足细胞密度高于108细胞/ml要求的能力。这样的密度将提供培养基中高产物效阶的优点(有利于下游处理),较小的培养系统(降低设备需要),和更好的培养基利用率(获得节省血清和其它昂贵的添加剂)。高密度的支持细胞需要有效的灌注技术来防止非同质性的发生。
不考虑选择的培养方法,本发明细胞可以在蛋白质生产中使用并且可以作为体外细胞测试的细胞和筛选成药物开发方案的一部分。
J.药盒
本发明各方面所需要的所有基本的材料和试剂可以一起装在药盒里。当在一种或多种液体溶液中提供药盒的成分时,液体溶液优选是水溶液,无菌水溶液是最优选的。
对于体内使用,本发明组合物可以配制成单一的或分开的药学可接受的可注射组合物。在这种情况下,容器本身可以是吸入剂,注射器,移液管,滴眼管或其它类似器具,从中制剂可以施用于身体的感染区,例如肺,注射给动物,或者甚至用于并且与药盒的其它成分混合。
也可以以干燥的或冻干的形式提供药盒的成分。当以干燥形式提供试剂或成分时,一般通过加入合适的溶剂重配。预想溶剂也可以以另一种容器方式提供。本发明药盒也可以包括说明施用基因治疗和/或化疗药物的说明书。
本发明药盒一般也包括包含用于商售的密闭范围中的管形瓶,例如注塑或吹塑容器,其中装有期望的管形瓶。不考虑容器的数目或类型,本发明药盒也可以包括,或者包装有用有助于注射/给药或者放置动物体内最终复杂组合物的器具。这样的器具可以是吸入剂,注射器,移液管,钳,计量勺,滴眼管或者任何这样的药学上证实的送递赋形剂。另外,一般包括药盒成分的使用说明。
包括下面的实施例以证明本发明优选的实施方案。本领域技术人员应该理解遵循本发明人所发现的代表性技术的实施例中所公开的技术在实施本发明中很好地发挥作用,因此可被认为构成其实施的优选方式。但是,本领域技术人员根据本发明的公开应该意识到,不脱离本发明精神和范围可以在所公开的具体实施方案中进行变化且仍然获得类似的或近似的结果。
                    实施例1
                 RB蛋白质的修饰
A.构建表达N-末端平截的pRB蛋白质的RB cDNAs
为了构建带有各种N-末端缺失的修饰的RB cDNAs,根据RB cDNA的序列设计并合成一系列PCRTM引物。通过在缺失的N-末端序列下游的RB cDNA序列确定有义引物。所有的引物包含5’-末端处的HindIII限制性酶切位点(下划线)和后面接着ATG(下划单横线)的共有Kozak盒(GCCGCC)。该有义引物的完全核苷酸序列如下:
5′-CCC AAGCTTGCCGCCATGGAGCAGGACAGCGGCCCGGAC-3′  (OMRbSd2-34;SEQ ID NO:14);
5′-CCC AAGCTTGCCGCCATGGATTTTACTGCATTATGTCAG-3′  (OMRbSd2-55;SEQ ID NO:15);
5′-CCC AAGCTTGCCGCCATGGAGAAAGTTTCATCTTGTGAT-3′  (OMRbSd2-78;SEQ ID NO:16);
5′-CCC AAGCTTGCCGCCATGCTGTGGGGAATCTGTATCTTT-3′  (OMRbSd2-97;SEQ ID NO:17);
5′-CCC AAGCTTGCCGCCATGTCAAGACTGTTGAAGAAG-3′(OMRbSd1-147,SEQID NO:18)。
反义引物5’-GTCCAAGA GAATTCATAAAAGG-3’(OMRbAS300;SEQ IDNO:13)与RB cDNA的核苷酸+900处的EcoRI位点(下划线)重叠(第一个ATG框中的A称为+1位置)。反义引物与上面设计的各个有义引物配对,以使用质粒F7为模板(其包含全长RB cDNA)扩增各种修饰的5’-RB cDNA片段。
通过PCRTM用每一对引物扩增后,DNA片段用HindIII和EcoRI消化并且亚克隆到质粒pCMVRB110,其用相同的酶切割。得到的表达质粒携带有相应于氨基酸2-34(SEQ ID NO:28(核酸序列)和(SEQ ID NO:29(氨基酸序列)),2-55(SEQ IDNO:30(核酸序列)和(SEQ ID NO:31(氨基酸序列)),2-78(SEQ ID NO:32(核酸序列)和(SEQ ID NO:33(氨基酸序列)),2-97(SEQ ID NO:34(核酸序列)和(SEQ IDNO:35(氨基酸序列)),和1-147(SEQ ID NO:36(核酸序列)和(SEQ ID NO:37(氨基酸序列))的N-末端缺失的修饰的RB cDNAs,并且分别命名为pCMVRBd2-34(缺失野生型RB蛋白质的氨基酸2-34),pCMVRBd2-55(缺失野生型RB蛋白质的氨基酸2-55),pCMVRBd2-78(缺失野生型RB蛋白质的氨基酸2-78),pCMVRBd2-97(缺失野生型RB蛋白质的氨基酸2-97)和pCMVRBd1-147(缺失野生型RB蛋白质的氨基酸1-147;氨基酸148是蛋氨酸)。
B.构建带有内部缺失或突变的RB cDNAs
已经构建出共7种携带有具有各种内部缺失或突变的RB cDNAs的pRB表达载体,命名为pCMVRBd31-107(缺失野生型RB蛋白质的氨基酸31-107),pCMVRBd77-107(缺失野生型RB蛋白质的氨基酸77-107 pCMVRBd111/112(野生型RB蛋白质的氨基酸111从天冬氨酸突变为甘氨酸和氨基酸112从谷氨酸突变为天冬氨酸),pCMVRBd111-181(缺失野生型RB蛋白质的氨基酸111-181),pCMVRBd111- 241(缺失野生型RB蛋白质的氨基酸111-241),pCMVRBd181-241(缺失野生型RB蛋白质的氨基酸181-241)和pCMVRBd242-300(缺失野生型RB蛋白质的氨基42-300)。
为了构建pCMVRBd31-107,使用引物5’-GCG CCTGAGGACCTAGATGAGATGTCGTTC-3’(SEQ ID NO:19)和OMRbAS300(SEQ ID NO:13)通过PCRTM从质粒F7扩增来自核苷酸位置+325至+910的RB cDNA片段。该RB cDNA片段用Bsu36I(下划线)和EcoRI(来自OMRbAS300)消化,并且插入到用相同酶消化的质粒pCMVRB110中以取代来自核苷酸+91-+900的最初RB cDNA片段。pRBΔ31-107的核酸序列是SEQ IDNO:38,并且相应的氨基酸序列是SEQ ID NO:39。
为了构建pCMVRBd77-107,使用寡核苷酸5’-GCG GTTAACCCTAGATGAGATGTCGTTCACT-3’(SEQ ID NO:20)和OMRbAS300(SEQ ID NO:13)通过PCRTM从质粒F7扩增RB cDNA片段(核苷酸+328至+910),接着用HpaI(下划线)和EcoRI消化。扩增消化的片段插入到用相同酶消化的质粒pCMVRB110中,取代来自核苷酸+230-+900的RB cDNA片段。pRBΔ77-107的核酸序列是SEQ ID NO:40,并且相应的氨基酸序列是SEQ IDNO:41。
为了构建pCMVRBm111/112,使用两对引物将核苷酸A(野生型RBcDNA的位置+332)变为G,以将天冬氨酸的密码子(GAT)变为甘氨酸的密码子(GGT),从而产生一个新的限制性内切酶位点,AvrII,并且为了将谷氨酸的密码子(GAG)变为天冬氨酸的密码子(GAT),将核苷酸G(野生型RBcDNA的位置+336)变为T。第一对引物是5’-CCC AAGCTTGCCGTCATGCCGCCCAAAACCCCCGGA-3’(OMRBS1;SEQ ID NO:21)和5’-CTCA CCTAGGTCAACTGCTGCAAT-3’(OMRbAS332;SEQ ID NO:22;突变的碱基用粗体表示)。第二对碱基是5’-GTTGA CCTAGGTGATATGTCGTTC-3’(OMRbS332;SEQ ID NO:23;突变的碱基用粗体表示)和OMRbAS300;SEQ ID NO:13)。用OMRBS1和OMRbAS332扩增的PCRTM引物用HindIII和AvrII(下划线)消化,和用OMRbS332和OMRbAS300扩增的那些用AvrII和EcoRI消化。这些片段连接在一起进入用HindIII和EcoRI消化的质粒pCMVRB110来置换相应的野生型RB cDNA序列。pRBml11/112的核酸序列是SEQ ID NO:50,和相应的氨基酸序列是SEQ ID NO:51。
为了构建pCMVRBd111-181,使用寡核苷酸5’-GCG CCTAGGATCTACTGAAATAAATTCTGCA-3’(SEQ ID NO:24)和OMRbAS300(SEQ ID NO:13),通过PCRTM从质粒F7扩增RB cDNA片段(核苷酸+543至+910),接着用AvrII(下划线)和EcoRI消化。然后将该片段连接在一起进入用相同的酶消化pCMVRBm111/112来置换自核苷酸+331-+900的RB cDNA片段。pRBΔ111-181的核酸序列是SEQ ID NO:42,和相应的氨基酸序列是SEQ IDNO:43。
为了构建pCMVRBd111-241,通过用HindIII和AvrII消化pCMVRBm111获得包含核苷酸+1至+331的5’RBcDNA片段。从用PvuII和BamHI消化的相同质粒中分离自+722开始的3’RBcDNA片段。然后两个DNA片段(框内)连接在一起进入用HindIII和BamHI消化的pCMV-G中。pRBΔ111-241的核酸序列是SEQ ID NO:44,和相应的氨基酸序列是SEQ ID NO:45。
为了构建pCMVRBd181-241,使用质粒F7为模板,用引物OMRBS1(SEQ IDNO:21)和5’-CCC GATATCAACTGCTGGGTTGTGTCAAATA-3’(SEQ ID NO:25)通过PCRTM从F7扩增包含核苷酸+1至+538的5’-RBcDNA片段。得到的RBcDNA片段用HindIII和EcoRV(下划线)切割并且插入到pCMVRB110中来置换HindIII和PvuII位点之间的最初5’-RBcDNA片段。pRBΔ181-241的核酸序列是SEQ IDNO:46,和相应的氨基酸序列是SEQ ID NO:47。
为了构建pCMVRBd242-300,使用质粒F7为模板,用引物OMRBS1(SEQ IDNO:21)和5’-CCC GAATTCGTTTATATGGTTCTTTGAGCAA-3’(SEQ ID NO:26)扩增包含核苷酸+1至+722的5’RBcDNA片段。扩增的产物用HmdIII和EcoRI(下划线)切割并且插入到用相同酶消化的pCMVRB110中以置换核苷酸+1至+900的最初5’RBcDNA片段。pRBΔ242-300的核酸序列是SEQ ID NO:48,和相应的氨基酸序列是SEQ ID NO:49。
C.N-末端修饰的RB蛋白质的表征
用携带有修饰的RBcDNA的用CMV引物引发的表达质粒转染RB-缺损膀胱癌细胞系5637。突变体pRBs的生物功能通过涉及免疫细胞化学染色和转染后肿瘤细胞的[3H]-胸苷原位标记的结合技术来评价(Xu等,1994a;1994b)。
肿瘤细胞接种到盖玻片上含有四环素的培养基中并且用表达pRB94,pRB110,或其它突变体RB蛋白质的质粒转染。在从培养基中去除四环素后的特殊时间点,将细胞与含有10μCi[3H]-甲基胸苷(Amersham,Arlington Heights,IL)的1ml新鲜培养基在37℃培养2小时,然后如上所述固定并对表RB蛋白质进行免疫化学染色(Xu等,1991a;1991b)。染色载玻片接着覆盖一薄层凝胶并在37℃下干燥过夜。然后载玻片上覆盖一层放射自显影乳液(Type NTB2,Eastman Kodak,Rochester,NY)并且曝光2天。显影后,载玻片在光显微镜下检查。转染后24小时,如上所述将细胞处理用于RB蛋白质的免疫化学染色和[3H]-胸苷掺入测定。
结果列在表5中。当最多55个氨基酸残基从pRB的N-末端缺失时,与表达全长RB蛋白质的细胞相比,用突变体pRB表达质粒转染的细胞中没有明显减少的DNA合成。但是,当另外23个氨基酸从N-末端去除时,细胞DNA合成被平截的pRB的表达显著抑制。
表5RB构建          %细胞掺入[3H]-胸苷
                   RB±                        RB野生型                  14                          41d2-34                   12                          42d2-55                   11                          43d2-78                   3                           41d2-97                   3                           42d1-112                  2                           42d1-147                  4                           42d31-107                 3                           41d77-107                 2                           40d111-112                6                           40d111-181                3                           38d111-241                2                           40d111-414                24                          42d181-241                8                           43d242-300                17                          43
如表5中所证明的,带有氨基酸55和181之间的任何缺失的pRB突变体在被导入肿瘤细胞后明显抑制DNA合成。值得注意的是,用包含只在氨基酸181和241之间缺失的pRBs转染的细胞与用表达携带有氨基酸55和181之间缺失的pRBs的质粒转染的那些相比表现出更弱的DNA合成的抑制,虽然这些仍然比用全长pRB表达质粒转染的细胞更有效。因此,根据这一数据,结合几种上述缺失例如氨基酸1和氨基酸241之间的缺失的修饰预期具有类似的明显DNSA合成抑制活性。
此外带有两种缺失,在氨基酸2和34之间和在氨基酸76和112之间,或者在氨基酸2和55之间和在氨基酸76和112之间的两种pRB突变体与野生型RB相比明显抑制DNA合成。结果表明推断的N-末端区的界限可能位于氨基酸182和300之间,最可能在氨基酸182和241之间。另外,携带在氨基酸位置111处将天冬氨酸转化为甘氨酸的点突变的pRB明显抑制DNA合成,进一步表明该区对于调节pRB功能是极其重要的。
                    实施例2
          控制VP16的CMV启动子/增强子的修饰
         四环素应答基因表达系统中的反式激活区
上面描述的修饰的成生物膜细胞瘤基因和蛋白质具有多种实际应用性,包括但不限于基因治疗。对于这些方面,需要表达系统。当例如上面所描述的那些系统对于某些实施方案是合适的时,其具有与使用细胞毒性构建物的基因治疗相关的一些缺点。最初Gossen和Bujard(1992)的四环素应答基因表达系统是令人注意的系统,但是具有一些缺点,例如对细胞生长的抑制作用(Gill和Ptashne,1988)。为了克服这些和其它缺点,本发明人改进了四环素应答基因表达系统。
最初以四环素阻抑蛋白/操纵基因为基础的调节系统由两种质粒,pUHD15-1和pUHC13-3(美国专利5464758,这里全文引作参考;Gossen和Bujard 1992)组成。pUHC13-3是一种四环素(Tc;tet)敏感性表达载体,包含杂种最小的人CMV启动子,其中tet操纵基因序列插入了TATA序列盒的上游。pUHD15-1包含编码四环素应答反式激活蛋白(tTA)的序列,表达由野生型CMV启动子驱动。在使用该系统的瞬时试验中,发明人发现在所研究的很多肿瘤细胞系中发现有效的可逆的转基因表达。但是,分离以四环素应答方式分离表达报告基因的长期克隆的尝试没有成功。这最有可能是高细胞内水平的tTA反式激活蛋白引起的,其表达由质粒pUHD15-1中强CMV启动子/增强子启动。tTA反式激活蛋白包含VP-16激活区,其已知对细胞生长有抑制作用(Gill and Ptashne,1988)。
因此,为了解决这个问题并进一步改进该系统,首先通过用一对19bp不完全直接重复序列(CMVp增强子的一部分,SEQ ID NO:5)置换原pUHD15-1质粒中的强CMVp增强子(Boshart等,1985)来修饰TA表达盒。通过从hCMV启动子去除5’增强子序列的一部分进行hCMV启动子/增强子的修饰。
以公开的hCMV启动子的序列(Boshart等,1985)为基础设计三对寡核苷酸引物。分别向各个有义和反义寡聚物的5’末端加XhoI和EcoRI限制性酶切位点(下划线)。有义寡聚物分别是
             5’-CCG CTCGAGCAATGGGCGTGATAGCGG-3’(OMCMVsl;SEQ IDNO:6);5’-CCG CTCGAGCACCAAAATCAACGGGA-3’(OMCMVs2;SEQ ID NO:7)and 5’-CCG CTCGAGCAACTCCGCCCCATTGAC-3’(OMCMVs3;SEQ ID NO:8),
它们共有相同的反义引物,5’-TAGACATAT GATTCGCGGCC-3’(OMCMVas;SEQ ID NO:9)。
在PCRTM扩增中使用的模板是质粒pUHD15-1。用引物对OMCMVsl+OMCMVas;OMCMVs2+OMCMVas和OMCMVs3+OMCMVas进行PCRTM扩增,产生长度分别是282bp(即mhCMVp1),203bp(即mhCMVp2)和168bp(即mhCMVp3)的三个较短版本的CMV启动子。纯化的平截的CMV启动子/增强子片段用XhoI和EcoRI消化两次,并插入到pUHD15-1中以置换最初hCMV启动子。这产生三个新的tTA表达质粒,即pmCMV1-tTA,pmCMV2-tTA和pmCMV3-tTA。
为了测定这些启动子的相对强度,这些新建质粒中的tTA,以及质粒pUHD15-1,被来自质粒pRc/CMV-CAT(Invitrogen,SanDiego,CA)的氯霉素乙酰转移酶(CAT)基因取代,这样产生4个CAT表达质粒,pmCMV1-CAT,pmCMV2-CAT,pmCMV3-CAT和pCMV-CAT。在这些质粒中,CAT表达分别由mhCMV1,mhCMV2,mhCMV3和全长hCMVp启动。为了评价修饰的CMV启动子的相对活性,通过Lipofectin方法(Life Technologies,Gaithersburg,MD)将CAT表达质粒引入到三个细胞系中,肿瘤细胞系5637和Saos2和胚胎肾脏细胞系293。转染48小时后,制备细胞裂解物,并且通过来自Stratagene(Stratagene,LaJolla,CA)的CAT FLASH测试试剂盒测定CAT活性。
如图1所示,增强子序列被部分去除后,在所有三个转染细胞系中,启动子的活性大大降低。图1是5637和Saos-2细胞系中CAT活性的图示。缺失的增强子序列越多,保留的增强子越弱。启动子活性由最强至最弱的顺序是hCMV,mhCMVp1,mhCMVp2和mhCMVp3。mhCMVp1的活性是全长hCMV启动子的17.7%,而mhCMVp3活性只是5637细胞中hCMV启动子的3.3%(图1)。比较修饰过的启动子的相对启动子活性后,选择mhCMVp1(SEQ ID NO:5)用于修饰的四环素可调节基因表达系统。mhCMVp1表现出最佳四环素控制的反式激活蛋白(tTA)表达作用,对宿主细胞生长没有抑制作用(图2),这是人基因治疗潜在应用的一个重要的特征。
                    实施例3
         构建单质粒,四环素调控的载体的构建
构建命名为EC1214A的单质粒载体。该质粒含有:1)减小tTA对宿主细胞生长的抑制作用的修饰的四环素-应答反式激活蛋白(tTA)表达盒;2)来自质粒pUHC13-3的tTA-依赖性动子;3)种属内含子序列;4)启动子和内含子下游的多克隆位点;和5)选择G418的neoR表达盒。该系统中的表达作用通过四环素或四环素类似物调控。“四环素类似物”被理解是与四环素紧密相关的多种化合物的任何一种,其以至少亲和性(Ka)是至少106/M,优选Ka是109/M,更优选Ka是1011/M的亲和性结合tet抑制剂。这样的四环素类似物例如但不限于Hlavka and Boothe(1985),Mitschef(1978),Noyee Development Corporation(1969),Evans(1968)和Dowling(1955)公开的那些,这些文献全文在这里引作参考。
质粒pMLSIS.CAT(Choi等,1991)包含种属内含子序列,其由包含部分三联体的第一外显子和第一间插序列的来自腺病毒-主要-延迟区的5’-未翻译前导序列的一部分,以及从IgG可变区衍生的合成的剪接供体/受体序列组成。合成了位于质粒pMISIS.CAT中内含子序列的旁侧并且分别包含EcoRI和XbaI位点的一对寡核苷酸,5’-CTA GAATTCGCTCTGCG-3’(SEQ ID NO:10)和5’-GC TCTAGATGCAGTTGGACCTGGGAG-3’(SEQ ID NO:11)。通过PCRTM扩增后,内含子片段用EcoRI和XbaI消化,并且插入到质粒pUHD15-1中相应的酶位点。
接着,将包含ClaI,HindIII,EcoRV,EcoRI,PstI,SmaI和BamHI克隆位点(从质粒pBluescriptSK获得)的小DNA片段插入到内含子下游的新的质粒来产生包含hCMV启动子,种属内含子,多克隆位点和来自SV40病毒的聚腺苷酸化信号的表达载体。该中间体载体称之为pCMV-G。然后用HSV胸苷激酶(TK)基因聚腺苷酸化信号序列置换pCMV-G的SV40聚腺苷酸化信号来产生质粒,即pCMV*-G-TKpA。
质粒pRc/CMV(Invitrogen,San Diego,CA)用限制性内切酶NruI和BbaI消化两次。来自XbaI消化的5’突出端通过DNA聚合酶的克列诺片段(Life Technologies,Gaithersburg,MD)补平,并且将平端的插入物与包含从质粒pmCMV1-tTA(实施例2)获得的mhCMV1-tTA的DNA片段连接。新的质粒称之为pmCMV1-tTAneo。
最后,包含tTA-依赖性启动子,种属内含子和TK聚腺苷酸化信号的DNA片段从质粒pCMV*-G-TKpA分离,并且插入到质粒pmCMV1-tTA.neo的BgIII位点来产生命名为EC1214A的载体,其载有tTA表达盒和tTA依赖性启动子以及选择标记,新霉素抗性基因。
                    实施例4
       构建单质粒四环素阳性-诱导的(Tet-on)载体
以最初四环素阻抑蛋白/操纵基因为基础的tet-on系统也由两个质粒,pUHD17-1neo(或pUHD172-lneo)和pUHD13-3(Gossen等,1995)组成。pUHD13-3是包含杂种最小人CMV启动子的四环素敏感表达载体,其中tet操纵基因序列已经插入TATA盒的上游。pUHD17-lneo或pUHD172-lneo包含用通过野生型CMV启动子启动的表达作用的编码反相四环素应答反式激活蛋白(rtTA)的序列。在使用该系统的短暂试验中发现在很多研究的肿瘤细胞系中观察到有效可逆转基因表达作用。与最初四环素系统相反,表达作用在四环素或四环素类似物例如多西环素存在下开始,同时没有四环素时表达作用即停止。但是,rtTA反式激活蛋白包含VP-16激活区,其已知对细胞生长有抑制作用(Gill and Ptashne,1988)。
因此,为了解决该问题和进一步改善该系统,首先通过用一对19bp不完全直接重复序列(SEQ ID NO:5)置换pUHD17-lneo或pUHD172-lneo质粒中的强CMVp增强子(Boshart等,1985)来修饰rtTA表达盒。通过从hCMV启动子(实施例2)去除5’增强子序列的一部分进行hCMV启动子/增强子的修饰。新的rtTA表达质粒称之为pmCMV1-rtTA。
使用pmCMV1-rtTA构建称之为EC1214B的单一质粒载体。该质粒包含:1)减小对宿主细胞生长的抑制作用的修饰的反相四环素应答反式激活蛋白(rtTA)表达盒;2)来自质粒pUHD13-3的rtTA-依赖性启动子;3)种属内含子序列;4)启动子和内含子下游的多克隆位点;和5)使选择G418的neoR表达盒。根据实施例3提出的进行构建。
                    实施例5
      构建成视网膜细胞瘤(RB)和p53四环素控制的载体
A.构建可诱导的pRB110表达载体
为了构建可诱导的pRB110表达质粒,用限制性内切酶AcyI在核苷酸-322和ScaI在+3230(第二个框内的ATG起始密码子的A指定为核苷酸+19)消化包含全长RB110基因cDNA的质粒F7(Takahashi等,1991)或p4.95BT(Friend等,1087)。通过AcyI消化产生的5’突出端在所有4个dNTPs存在下用大肠杆菌DNA聚合酶处理产生平端。BamHI接头连接到该片段上,然后用BamHI消化该片段以去除过量的接头并产生BamHI末端(Maniatis等,1989;Ausubel等,1992)。得到的3552bpRBcDNA片段插入到EC1214特有的BamHI位点,产生pCMV*-tTA-RB110
B.构建可诱导的pRB94表达载体
已知AUG密码子GCC(AG)CCAUGG附近的初级序列(SEQ ID NO:27)对于引发高等级动物中的翻译是最佳的文本(Kozak,1991)。令人吃惊的现实是尽管几乎所有的脊椎动物mRNAs具有保证引发的精确性的特征,但是很多编码重要的调节蛋白的mRNAs不表现出是为有效翻译设计的(Kozak,1991)。回顾RB cDNA序列,发现全长pRB110和N-末端平截的pRB94两者的AUG起始密码子对于引发高等级动物中的翻译是次最佳文本。例如在核苷酸-5位置有一读框外AUG密码子(对于pRB94 cDNA的ATG起始密码子的A指定为+1),而且与上述共有起始密码子文本相比,pRB94的ATG密码子的前导序列是次佳的。为了提高pRB94 cDNA的翻译效率,使用定点突变来优化用于最佳翻译引发pRB94的第二内部框内ATG密码子上游的DNA序列。
使用携带有全长pRB110 cDNA作为模板的质粒F7,通过PCRTM获得修饰的5’-RB94 cDNA。用于PCRTM反应的有义引物(5’-CCC AAGCTTGCCGCCATGTCGTTCACTTTTAC-3’;SEQ ID NO:12)包含HindIII限制性酶切位点(下划线)和Kozak盒(italics;Kozak,1987)。反义引物5’-GTCCAAGA GAATTCATAAAAGG-3’(OMRbAS300;SEQ ID NO:13)在RB cDNA的核苷酸+900处与EcoRI位点(下划线)重叠(第一框内ATG的A定为+1)。PCRTM产物用HindIII和EcoRI消化,然后与包含从质粒F7分离的EcoRI(位置+900)和BamHI(+3548)之间的3-RBcDNA片段的DNA片段连接。整个RB94 cDNA片段插入到EC1214A的HindIII和BamHI位点,产生可诱导的pRB94表达质粒,pCMV*-tTA-RB94
C.构建可诱导的p53表达载体
用BamHI消化包含全长p53基因cDNA的质粒pC53-SN3(Baker等,1990),并且将包含全长p53基因的片段插入到EC1214A唯一的BamHI位点产生pCMV*-tTA-p53。
                    实施例6
具有四环素调节pRB110,pRB94或p53表达作用的长期肿瘤细胞克隆的制备
使用修饰的单一-质粒四环素-应答哺乳动物基因表达载体获得各种稳定的肿瘤细胞系,其中野生型或N-末端平截的成视网膜细胞瘤肿瘤(RB)抑制剂基因或者p53肿瘤抑制剂基因的表达可以可逆地启动和结束而没有可检测的泄漏。
A.细胞培养
从ATCC获得乳腺癌细胞系MDA-468(HTB132)并且在含有10%FBS(LifeTechnologies,Gaithersburg,MD)的Leibovitz’s L-15(Life Technologies,Gaithersburg,MD)中培养。将骨肉瘤细胞系,Saos2在含有15%FBS(Zhou等1994b)的培养基McCoy’s5A(Life Technologies,Gaithersburg,MD)中培养。将从ATCC获得膀胱癌细胞系5637(HTB9)用含有10%FBS的RPMI1640培养基(LifeTechnologies,Gaithersburg,MD)培养。所有细胞培养基补加有0.5%青霉素/链霉素。将Saos2和5367细胞在37℃在5%CO2培养箱中培养,同时MDA-468细胞在37℃没有CO2下培养。
B.稳定转染
根据生产商说明操作指南(Life Technologies,Gaithersburg,MD)通过Lipofectin方法,用pRB110和pRB94表达质粒,pCMV*-tTA-RB110和pCMV*-tTA-RB94转染肿瘤细胞。在转染和接下来的程序中,除具体说明,向转染和培养基中加入0.5μg/ml四环素(Sigma,St.Louis,MO)。转染后48小时,以300μg/l的浓度向培养基中加入G418(Life Technologies,Gaithersburg,MD)。2-3星期后,通过克隆圈分离单一菌落。对于每一个分离的菌落进行重复培养。原克隆保持在含有0.5μg/ml四环素的培养基中的同时,重复克隆在没有四环素下培养。后者用特异性抗-RB抗体,RB-WL-1(Xu等,1989a)进行免疫化学染色。匹配的RB-阳性克隆接着保持在含有四环素和G418的培养基中并扩增用于进一步分析。
C.瞬时转染
以第二天要到达约40%铺满的浓度将肿瘤细胞接种到60-mm培养皿中或者无菌载玻片上。20小时后,根据生产商说明操作指南(Life Technologies,Gaithersburg,MD),将适量质粒DNA与opti-MEM增养基中的Lipofectin试剂混合。细胞上覆盖DNA-Lipofectin复合物并且在CO2培养箱中在37℃下培养过夜。第二天,加入新鲜培养基代替DNA-Lipofectin。24小时或48小时后,细胞固定用于免疫化学染色或者细胞裂解用于制备细胞溶胞产物。
D.RB蛋白的免疫化学染色
根据先前描述(Xu等,1989a)进行免疫化学染色。为了检测RB表达,生长在载玻片上的细胞在45%(v/v)丙酮/10%(wt/vol)甲醛/0.1M磷酸盐缓冲液中固定5分钟。用磷酸盐缓冲盐水洗涤6次后,细胞用1%脱脂奶/1.5%山羊血清或马血清的磷酸盐缓冲液在室温下封闭4小时。RB-WL-1抗-RB抗体或Canji’s单克隆抗-RB抗体(QED,SanDiego,CA)在加有0.02%TritonX-100的相同溶液中分别稀释至2μg/ml或0.5μg/ml并且与细胞培养过夜。洗涤后,根据技术操作指南(VectorLaboratories,Burlingame,CA),用抗生物素生物素化过氧化物酶复合物(ABC)方法对载玻片进行免疫染色。
E.对pRB免疫印迹
根据先前描述(Xu等,1991a;1991b)制备细胞溶胞产物。简要地说,用含有100mM氯化钠,0.2%NP-40,0.2%脱氧胆酸钠,0.1%SDS和Tris-HCl(pH8.0)和50μg/m抑酶肽和1mM PMSF的0.6ml冰冷的裂解缓冲液裂解60mm培养皿中的培养细胞。细胞溶胞产物通过21规格针几次并通过离心澄清。
根据先前描述(Xu等,1991a;1991b)进行直接蛋白质免疫印迹。根据Bradford蛋白质测试(BioRad,Richmond,CA)所测定的60微克总的细胞蛋白质在8%SDS/聚酰胺凝胶中电泳并且电印迹到Immobilon聚偏二氟乙烯膜(PVDF)(Millipore,Bedford,MA)。用Tris-缓冲的盐水中4%牛血清白蛋白/1%正常山羊血清封闭后,膜与终浓度是0.4μg/ml的RB-WL-1抗体培养过夜用于RB检测。然后通过ProtoBlot蛋白质印迹碱性磷酸酶系统(Promega,Madison,WI)探测印迹。
F.生长曲线测定
用结晶紫染色测定在存在或不存在四环素(Gillies等,1986)下细胞生长变化。简要地说,细胞重复接种到24-孔平板中。在一套平板中,细胞在含有0.5μg/ml四环素的培养基中生长,同时在重复的平板中,在没有四环素的培养基中培养相同的细胞。在每一个时间点,细胞用PBS中1%戊二醛固定并且用0.5%的结晶紫染色。收集在所有期望的时间点的细胞后,通过将细胞和含有0.9%柠檬酸三钠,0.002N盐酸和45%乙醇(v/v)的Sorenson’s溶液一起保温从染色的细胞提取结晶紫染料。提取的染料适当地用Sorenson’s溶液稀释并测定λ550处的光吸收度。通过OD550时间作图获得生长曲线。
G.软琼脂测定
为了进行软琼脂测定,合适数量的细胞与含有15%FBS的完全培养基中的0.3%琼脂糖混合并且覆盖到35mm组织培养皿中0.7%基础琼脂上。对于各个细胞克隆制备重复培养皿。一个培养皿中的细胞在含有0.5μg/ml四环素的培养基中培养,另一个在没有四环素的培养基中培养。培养基每3天更新,3星期后计数菌落数(>50个细胞)。以每一个细胞克隆三个培养皿的平均值计算结果。
H.裸鼠中的肿瘤发生能力试验
先前描述过肿瘤发生能力试验(Takahashi等,1991)。对于每一个要测试的细胞克隆建立两组无胸腺裸鼠一组鼠经常给与水,而另一组给与含有5mg/ml四环素的水。来自RB110-或RB94-重组克隆的共5×106个细胞在0.2ml磷酸盐缓冲盐水中皮下注射到裸鼠的右胁中。包括Saos2,5637h MDA-468细胞的RB-阴性亲本对照以相同的浓度注射到相同鼠的左胁中。注射后4星期计数肿瘤。
I.[3H]-胸苷掺入的时间函数研究
来自可诱导RB-重组克隆的细胞在无菌盖玻片上在含有四环素的培养基中生长。从培养基中去除四环素后具体时间点,细胞与含有10μCi[3H]-甲基胸苷的1ml培养基(Amersham,Arlington Heights,IL)在37℃培养2小时,然后如上所述,固定并对表达RB蛋白进行免疫化学染色(Xu等,1991a;1991b)。然后载玻片上覆盖放射自显影乳液(Type NTB2,Eastman Kodak,Rochester,NY)并且暴露2天。展开后,在光学显微镜下检查载玻片。
J.瞬时转染的细胞培养物的[3H]-胸苷掺入
肿瘤接种到盖玻片上并且用表达pRB94,pRB100,或其它突变体RB蛋白质的质粒转染。转染后24小时,如上所述,对细胞进行RB蛋白质的免疫化学染色(Xu等,1991b;1991c)并进行[3H]-胸苷掺入测定。
K.长期可诱导RB表达克隆的表征
文献中所报道的RB置换后细胞生长抑制作用和形态变化是不一致的。发明人和其它人进行的研究表明正常RB基因导入到RB-缺陷肿瘤细胞中将抑制其在裸鼠中的肿瘤发生能力活性(Goodrich和Lee 1993,Bookstein等,1990a;1990b;Chen等,1992;Goodrich等1992b;Huang等,1988;Kratzke等,1993;Madreperla等,1991;Muncaster等,1992;Ookawa等,1993;Sumegi等,1990;Takahashi等,1991;Wang等,1993;Xu等,1991c;Zhou等,1994b;Xu,1996;Xu,1995;Li等,1996;Xu等,1994b)。所研究的肿瘤细胞系从各种根本不同类型的人类癌症产生,例如成视网膜细胞瘤肿瘤,骨肉瘤,膀胱癌,前列腺癌,乳腺癌和肺癌(Goodrich and Lee,1993;Xu,1996,Xu,1995,综述)。尽管文献中充分报道过单独的RB基因缺陷在带有多个遗传变化的肿瘤细胞中的校正足以回复其恶性表型,但是与其第一眼所观察的相比(Klein,1990),其更令人困惑。
正如在几项早期研究中所示,用pRB表达质粒瞬时转染后,培养基中RB-缺陷肿瘤细胞的一些类型表现出显著的变化,包括细胞变大,类衰老表型和生长停止(Templeton等,1991;Qin等,1992)。但是接着发现可以分离出生长和亲本细胞系一样快的RB-重组肿瘤细胞的长期稳定克隆。因此,文献的趋势是通过在RB-缺陷肿瘤细胞中从其肿瘤抑制功能进行RB置换来分别细胞生长的抑制作用(Chen等,1992;Goodrich等,1992b;Takahashi等,1991;Xu等,1991b;Zhou等,1994b;Li等,1996)。
使用三种RB-缺陷肿瘤细胞系建立长期可诱导RB表达克隆。它们是骨肉瘤细胞系,Saos2,膀胱癌细胞系,5637和乳腺癌细胞系,MDA-468。选择Saos2,5637和MDA-468作为受体细胞的理论基础是它们是最常用于RB-置换研究的RB-缺陷肿瘤细胞。肿瘤细胞被可诱导RB110表达质粒,pCMV*-tTA-RB110和pRB94表达质粒,pCMV*-tTA-RB94在四环素存在下转染。在400μg/ml中选择大约2-4星期后,分离充分分离的单一菌落并且保持在含有四环素的培养基中。在没有四环素(Tc)下将一小部分分离的克隆分开培养24-48小时并且用抗-RB抗体,RB-WL-1染色。可见Tc-应答RB-重组5637膀胱癌和MDA-MB-468乳腺癌细胞的稳定克隆中pRB蛋白质表达的紧密控制。
在0.5μg/ml Tc存在下在培养基中生长的RB-重组5637细胞是通过免疫细胞化学染色的RB-,而去除Tc后,如RB+免疫细胞化学染色所示pRB表达在RB-重组5637细胞中启动。MDA-MB-468乳腺癌肿瘤细胞在0.5μg/ml Tc存在下在培养基中通过免疫细胞化学染色也是RB-,而去除Tc后,如RB+免疫细胞化学染色所示pRB表达在RB-重组MDA-MB-468乳腺癌肿瘤细胞中。注意四环素在这种四环素应答表达系统中是一种抑制剂,而不是诱导物。
也试验了结束RB表达所需要的四环素的最小浓度。发现象0.1μg/ml这样小的四环素浓度可以将RB表达抑制到免疫检测检测不到的水平,表明四环素调控的表达系统对四环素是非常敏感的。
另外,出人意料地发现与先前所报道的非可调节的,长期的RB-重组肿瘤细胞系不同,在Tc的培养基中pRB表达后,检测到所有长期肿瘤细胞克隆不可逆地停止生长(图3A,图3B,和图3C)。文献中已知pRB在正常和肿瘤细胞中的半寿期只有4-6小时(Mihara等,1989;Xu等,1994b;Xu等,1989a),而且如图2所示,使用修饰的四环素可调控系统,tTA反式激活蛋白本身在存在或不存在低浓度Tc下的表达对细胞生长没有影响。
Saos2和5637克隆不能合成DNA,其后是大的形态变化,最后细胞死亡。在无Tc培养基中诱导pRB表达后,细胞形态学明显改变,包括细胞变大,变平和比周期G1/S细胞更低的核细胞质比例。在膀胱癌细胞系5637情况下,用不可调控系统的瞬时或稳定RB-置换后形态学和生长速度的变化在文献中没有充分描述(Goodrich等,1992b;Takahashi等,1991;Zhou等,1994b)。
一般情况下,没有Tc的培养基中已经建立的Tc-可调控RB+肿瘤系的表型与先前文献对于RB-质粒转染的(或RB反录病毒感染的)肿瘤细胞质培养物所描述的那些极其相似(Huang等,1988;Templeton等,1991;Qin等,1992)。允许pRB表达的条件下,所有肿瘤细胞克隆在软琼脂中不能形成菌落(图4A,图4B和图4C),并且在裸鼠中没有肿瘤发生能力。
为了将RB与另一种常见肿瘤抑制剂p53相比较,已经从骨肉瘤细胞系Saos-2建立了具有Tc-可调控野生型p53表达的几种长期稳定肿瘤细胞克隆。使用如上所述的类似方法建立p53重组Saos-2肿瘤细胞克隆。简要地说,亲本Saos-2肿瘤细胞被用野生型p53表达质粒,pCMV*-tTA-p53(实施例5)转染,并且在含有遗传霉素的培养基中选择。为了获得稳定野生型p53重组克隆,将初始G418-抗性质增养物进行至少两轮亚克隆。因为完全缺失p53基因,亲本Saos-2细胞没有内源p53。
用该模型系统,发现在p53重组Saos-2克隆中诱导野生型p53表达不导致RB-/p53null肿瘤细胞的生长抑制。当Tc-调节的p53重组Saos-2克隆在不存在Tc下生长时,很多肿瘤细胞减少和脱落。此外,根据DNA片段测试所测定的,丰富的低分子量DNA只有在允许p53表达的条下从p53重组Saos-2肿瘤细胞中提取的样品中检测到。这些发现表明,野生型p53-诱导的RB-/p53null肿瘤细胞的生长抑制是编程性细胞死亡的结果而不是复制衰老的结果。
Dimri等最近报道了一种鉴定培养物或体内老化皮肤中衰老人细胞的生物标记物。其表明几种衰老细胞表达在pH6可组织化学检测到的β-半乳糖苷酶(Dimri等,1995)。称之为与衰老相关的β-半乳糖苷酶(SA-β-gal)的该标记由衰老的而不是衰老之前的成纤维细胞表达。无限增殖细胞中不存在SA-β-gal,而是由反向无限增殖性的基因操作诱导(Dimri等,1995)。注意,一些细胞例如成人黑素细胞,表达不依赖于衰老或老化细胞的SA-β-gal。因此,SA-β-gal(pH 6活性)是复制衰老的通用标记物这一点不以为奇。
不管怎样,使用本发明四环素可诱导的pRB或p53表达的长期肿瘤细胞克隆,SA-β-gal(pH6活性)提供一种使得能进一步表征RB-介导的肿瘤细胞生长停止简单方法。大多数(>99.9%)的幼小的(早期传代细胞)人WI-38成纤维细胞是SA-β-gal阴性的。相反,衰老的(数目是大于52的两倍水平)WI-38细胞是强的SA-β-gal阳性的。迄今为止所检验的所有四环素应答肿瘤细胞克隆在四环素存在下是SA-β-gal阴性的(RB-),并且在没有四环素的培养基中是SA-β-gal阳性的(RB+)。但是RB+状态中肿瘤细胞的SA-β-gal染色的强度根据肿瘤细胞类型是可变的。
注意,尽管不可诱导(Chen等,1990;Li等,1996)或可诱导系统的Saos-2(RB-,p53null)肿瘤细胞中的p53重组作用不抑制其肿瘤化转化表型,带有四环素可诱导启动子的p53重组Saos-2克隆在存在或不存在四环素下是SA-β-gal阴性的。最令人感兴趣的是,当在没有Tc增养基中p53重组Saos-2细胞被表达野生pRB110的重组腺病毒载体在没有Tc的培养基中感染时,具有野生型p53和pRB110表达的肿瘤细胞与只表达pRB110的肿瘤胞相比表现出更强的SA-β-gal阳性染色。结果暗示pRB和p53对肿瘤抑制的机理相互不同,但是pRB和p53的表达一起对RB-介导的肿瘤细胞衰老有协同作用。
考虑到其潜在的治疗用途,另一个重要的发现是pRB-介导的复制衰老(不可逆生长停止)是肿瘤特异性的事实。早期传代的幼小的WI-38成纤维细胞被重组腺病毒载体AdCMVpRB110以100的感染度(MOI)感染仍为SA-β-gal阴性,并且其恢复正常生长模式大于1星期后感染。因此pRB是相对安全的抗癌基因治疗试剂。除了恶化的肿瘤的治疗外,形成的RB基因治疗在治疗术后残留肿瘤,浅层癌症,或者前恶性肿瘤,以及非恶性肿瘤,某些环境下的过增殖疾病中也是有益的(Chang等,1995;Xu等,1996)。
L.RB-介导的肿瘤抑制作用的广泛生物基础
除了肿瘤细胞特异性衰老和公知的抗增生作用外,pRB还可以在血管发生抑制作用和引发肿瘤细胞免疫原性中起作用。本发明人发现,从四环素应答,RB-重组骨肉瘤和非小细胞肺癌细胞系收集的无血清各种培养基(CM)在从细胞培养物中去除Tc后由血管发生变为抗血管发生。根据蛋白质印迹和免疫组织化学测定(Dawson,等),这种转化与启动pRB表达有关。发明人还报道过RB-缺陷非小细胞肺癌细胞系,H2009中的IFN-γ引起的HLAII类诱导需要野生型RB-基因表达的重组(Lu等,1996)。这种II类蛋白质代表作为免疫应答一部分的CD4+T淋巴细胞的蛋白酶解处理过的抗原衍生的肽。因此pRB还可能在介导肿瘤免疫原性中起作用。
为了测定成视网膜细胞瘤(RB)肿瘤抑制剂的置换是否能抑制RB-缺陷肿瘤细胞的侵染使用Boyden chamber测试进行研究(Li等,1996)。在多种稳定RB-重组人肿瘤细胞系组中进行该项研究,包括来自骨肉瘤,膀胱癌,乳腺癌和肺癌的那些细胞。异源野生型RB蛋白质在这些肿瘤细胞系中的表达由构成型激活启动子或可诱导启动子启动。明显发现,来自亲本RB-缺陷细胞系和RB-回复体的肿瘤细胞比来自穿过Boyden chamber测试中Matrigel的RB-重组RB+细胞系的肿瘤细胞多(p<0.001,二尾试验)。注意到各种RB-置换引起的各种RB-缺陷肿瘤细胞的侵袭抑制作用与其体内肿瘤发生能力的抑制明显充分相关。相反,尽管功能性RB或p53重表达有效抑制裸鼠RB-/p53null骨肉瘤细胞系,Saos-2的肿瘤形成,与RB基因相比,野生型p53基因的置换对其侵袭力具有小得多的影响。
在有限次数的细胞分裂后,正常的人二倍体细胞在体外和体内衰老。已知为细胞衰老的该过程是老化的潜在的原因并且是人癌症恶化的关键屏障。还已经证明了通过修饰的四环素调控基因表达系统的仅表达功能性pRB的RB/p53-缺陷肿瘤细胞在细胞周期的G0/G1期是不可逆生长抑制的。这些细胞显示出与细胞衰老相一致的多种形态学变化并且还表达与衰老相关的β-半乳糖苷酶生物标记物。
进一步研究表明,推测对于肿瘤细胞延长的增殖寿限是基本的端粒酶活性在诱导pRB(而不是p53)表达之后在肿瘤细胞系中被抑制。这些发现表明pRB在体内的细胞衰老程序中起着关键作用。从实际的角度出发,发现意味着使用RB(或RB和p53一起)的抑制细胞的基因疗法可以导致通过细胞衰老和脱落导致的肿瘤细胞的不同程度的减少。同时,体内正常细胞的复制寿期可以不受影响。这可以为肿瘤特异性肿瘤抑制剂基因和抗端粒酶基因治疗的设计提供潜在的基础。
综合这些发现,可以提示RB-介导的肿瘤抑制作用具有广泛的生物基础,其当然使得出现的对于人癌症的RB肿瘤抑制剂基因治疗更有效。
MN-末端平截的pRB的增强的肿瘤抑制作用
RB-重组肿瘤细胞的长期稳定克隆可以用不可诱导的基因表达系统分离,而且这些克隆的大多数和亲本细胞系生长一样快。发明人发现尽管RB-介导的肿瘤抑制作用是基本的并且有广泛的生物基础,但是其常常是不完全的,并且一部分RB-重组肿瘤细胞能够存活,并且在延长的潜伏期后在裸鼠中形成RB+异种移植肿瘤(Takahashi等,1991;Xu等,1991b;Zou等,1994b;Li等,1996)。其它研究者报道过类似的发现(Bookstein等,1990b;Goodrich等,1992b;Kratzke等,1993;Ookawa等,1993;Wang等,1993)。这种现象被发明人称之为肿瘤抑制剂抗性(TSR;Zhou等,1994b),其是化疗中多药物抗性(MDR)的等价物。在稍后的方案中,低剂量化疗由于其经常性的内生较高的对细胞毒性试剂的抗性而可能冒着选择转移肿瘤细胞的危险。
发明人接着报道-94kDa(pRB94)的N-末端平截的RB蛋白质出人意料地在所检查的多种肿瘤细胞系包括具有正常内源RB基因的那些细胞中具有比全pRB蛋白质更有潜力的细胞生长抑制作用。用pRB94表达质粒转染的肿瘤细胞常常表现出与细胞衰老相关的多种形态学变化。它们不能进入S期并且快速死亡(Xu等,1994b;Resnitzky和Reed,1995)。
发明人最近在异位动物模型中的研究证明通过AdCMVpRB94,一种表达N-末端平截的RB蛋白质的复制缺陷腺病毒载体治疗已确定的人RB-和RB+膀胱异种移植癌症导致被治疗肿瘤的消退(Xu等,1996)。值得注意的是,尽管当通过腺病毒载体在肿瘤细胞中过度表达时全长和平截形式的RB蛋白质能够抑制肿瘤生长,但是pRB94比全长RB蛋白质更有潜力。N-末端平截的RB蛋白质对增强的肿瘤抑制作用的机理还不十分清楚。
为了更好地理解N-末端平截的pRB94和全长pRB110之间的功能差别,发明人还建立了具有Tc-应答pRB94表达的稳定肿瘤细胞系。通过时间函数分析发现早在从细胞培养基中去除四环素之后6小时时,pRB94重组肿瘤细胞蓄积最大量的磷酸化不足的和磷酸化pRB94,接着大多数肿瘤细胞停止掺入生长停止指示剂3H-胸苷。pRB94蛋白质在~18-24小时之内完全脱磷酸化。但是大多数pRB110重组肿瘤细胞在6或8小时处仍为免疫组织化学RB-,并且具有正常的DNA合成(图5)。根据蛋白质印迹测定,pRB110在24小时时间点达到最高水平,并且在去除四环素后24-48小时大多数变成未磷酸化,在这期间,pRB110重组肿瘤细胞最后停止DNA合成(图5)。使用用于人衰老细胞的SA-β-gal生物标记物测定,发现具有pRB94表达的Saos-2细胞比去除Tc后48小时的pRB110表达细胞表现出更强的SA-β-gal阳性染色。因为pRB94具有比pRB110更长的半寿期并且仍为活性磷酸化不足形式(美国专利5496731;Xu等,1994b),肿瘤细胞中快速蓄积大部分的RB蛋白活性形式(磷酸化不足形式)可以计数pRB94引起的增强的肿瘤细胞生长抑制。关于这一点,也曾经报道过从氨基酸379开始的命名为pRB56的另一种平截的pRB版本为与全长pRB相比更有潜力的细胞周期进程的抑制剂(Wills等,1995)。
修饰过的系统的优点有三方面:1)由于较低的tTA肽的组成性表达,适宜地建立带有可诱导的基因表达的长期稳定细胞系;2)该系统目前包含在单一质粒中,这样只需要一轮转染和选择;3)重要的是,单一-质粒四环素应答哺乳动物基因表达系统易于快速转化为四环素控制的病毒载体(下面的实施例7-12)。
                    实施例7
            构建四环素控制腺病毒载体
期望的感兴趣的基因的cDNA片段首先被插入到单一-质粒四环素可调控质粒载体EC1214A(实施例3)或EC1214B(实施例4)中。然后四环素应答外来基因表达盒和来自相应的EC1214A或EC1214B质粒载体的修饰的tTA(或rtTA)表达盒用本领域对于DNA操作的标准技术回收(Maniatis等,1989;Ausube1等,1992),并且插入到穿梭质粒pΔE11A(Microbix Biosystems,Inc.)中。得到的重组穿梭质粒然后用主腺病毒5型(Ad5)质粒pBHG11共转染,pBHG11包含腺病毒Ad5d1309基因组的骨架,并且使用LIPOFECTIN试剂(GIBCO/BRL Life Technologies)将E1/E3缺失突变(Microbix Biosystems,Inc.)引入293细胞。293细胞的共转染在存在(对于tet-off系统)或不存在(对于tet-on系统)0.5μg/ml四环素下进行。
或者,包含感兴趣的基因的片段首先被插入到单一-质粒四环素可调控质粒载体EC1214A或EC1214B中。然后四环素应答外来基因表达盒和来自相应的EC1214A或EC1214EB质粒载体的修饰的tTA(或rtTA)表达盒被回收,并且分别插入到穿梭质粒pΔE11A和主腺病毒质粒pBHG11。得到的重组穿梭质粒和主腺病毒质粒共转染到293细胞中。
用重组穿梭质粒和主腺病毒质粒共转染的293细胞通过体内重组产生感染的毒粒,其中表达感兴趣基因的最小基因盒和修饰的tTA(或rtTa)表达盒分别置换Ad5d1309基因组的ΔE1区或ΔE1和ΔE3区。转染的293细胞中存在重组腺病毒最初通过致细胞病变效应(CPE)鉴定。从其中发生CPE的转染的293细胞中收集细胞培养上清液。然后在从用病毒上清液感染后,通过从293细胞单层中筛选腺病毒斑而分离重组病毒,并且通过限制性酶切消化制图,PCRTM,或者通过以四环素可调控方式在感染病毒的宿主细胞中表达感兴趣的基因来进一步表征。包含期望的外来基因以及修饰的tTA(或rtTA)表达盒的重组腺病毒使进行至少三轮噬斑纯化。
通过由Graham和Prevec(1991)改进的方法制备四环素调控重组腺病毒的高效价贮液。根据260nm处所测定的OD(1OD260=1×1012病毒颗粒/ml)CsCl超离心纯化的腺病毒含有~1013病毒颗粒/ml。通过经SephadexG50的凝胶过滤将浓缩的病毒悬浮液脱盐,以在每毫升PBS中产生大约1011噬斑形成单位(pfu)的最终纯化的病毒贮液。
                    实施例8
          四环素应答RB腺病毒载体的制备
在人癌症基因治疗的动物体内研究中(Xu等,1996)使用表达N-末端平截的pRB94蛋白质的复制缺陷腺病毒载体(美国专利5496731)。遗憾的是,AdCMVpRB94病毒上清液的病毒颗粒与噬斑形成单位之比随着培育而大大提高,使得其难以大规模制备AdCMVpRB94病毒的高滴定度原种用于人癌症基因治疗临床试验。这可能是pRB94蛋白质对293病毒产生细胞系的过度生长抑制作用引起的。
如上所述,以类似的方法使用修饰的四环素应答哺乳动物基因表达系统来产生包含四环素控制的pRB94的腺病毒载体,AdVtTARB94,该载体是为送递高剂量pRB94基因治疗而设计。整个四环素调控盒可以插入到腺病毒基因组的E1区,或者RB94表达盒可以插入到腺病毒基因组的E1区,而转录反式激活融合蛋白质表达盒可以插入到腺病毒基因组的E3区。pRB94在肿瘤细胞中的过度表达将引起肿瘤细胞特异性衰老和细胞死亡。pRB94cDNA具有修饰的最佳引发剂文本序列。pRB94蛋白质在AdVtTA.RB94转导的人肿瘤细胞中的表达可以可逆地结束和开始。新的AdVtTARB94重组腺病毒载体可以以提高的产率和质量在293细胞中有效地增殖。
                    实施例9
        制备四环素应答RB/p53共表达载体
如上文实施例6所述,尽管具有不可诱导(Chen等,1990;Li等,1996)或可诱导系统的Saos-2(RB-,p53null)肿瘤细胞中的p53重组不抑制它们的肿瘤表型,但是在存在或不存在四环素下,四环素可调控启动子的p53重组Saos-2克隆是SA-β-gal阴性的。但是,当用表达野生型pRB110的重组腺病毒载体在没有Tc的培养基中感染p53重组Saos-2细胞时,具有野生型p53和pRB110表达的肿瘤细胞与只表达pRB110的肿瘤细胞相比,表现出更强的SA-β-gal阳性。结果提示pRB和p53对肿瘤抑制的机理各自不同,但是pRB和p53的表达一起对RB-介导的肿瘤细胞衰老有协同作用。
因为pRB和p53的共表达对RB-介导的肿瘤特异性衰老有协同作用(实施例6),并且提出改变的RB和p53蛋白质状况可能是非小细胞肺癌以及其它人恶性肿瘤的亚组,包括膀胱转移细胞癌中具有协同作用的先兆因素,结合的pRB和p53基因治疗也被认为是克服可能的肿瘤抑制剂抗性的可替代的策略。
将修饰的四环素应答反式激活蛋白(tTA)表达盒和tTA依赖性pRB110表达盒两者插入到Ad5基因组的E1区有利于构建同时表达两种肿瘤抑制剂基因的腺病毒载体,其被命名为AdVtTARB110/p53。在该载体中,较小的p53表达盒通过连接反应插入到34kb主质粒pBHG11的E3区中。因为在相同细胞中置换RB和p53基因的努力从未成功过(Wanger等,1993),发明人提出同时表达两种肿瘤抑制剂基因的腺病毒载体应该建立在可调控基因表达系统中。
                    实施例10
          构建四环素控制的逆转录病毒载体
kat逆转录病毒产生能够有效转导难以进行常规逆转录病毒转导的造血细胞类型的高效价逆转录病毒上清液(Finer等,1994)。将带有杂种LTR的kat逆转录病毒载体将与EC1214A(实施例3)结合产生具有Tc-可调控表达的逆转录病毒。由于文献报道了使用标准逆转录病毒载体在一些成功,因此,Tc-控制的逆转录病毒载体可以比用于转导某些细胞类型例如造血细胞干细胞的Tc-控制腺病毒载体工作得更好。
                   实施例11
           修饰的RB构建体的治疗给药
A.人膀胱癌的体内治疗
人膀胱癌代表一种通过将本发明修饰的RB蛋白表达逆转录病毒载体灌注到膀胱中对实体肿瘤进行肿瘤抑制剂基因治疗的理想模型。原人膀胱癌试验模型是由Jones和其同事建立的(Ahlering等,1987)。已经公开了从表面乳头状肿瘤建立RT细胞系人膀胱癌细胞,其通常不转移,当通过22-规格导管注入到雌性裸鼠的膀胱中时只是定位产生肿瘤。相反,最初从更具有侵染性的膀胱癌分离的EJ膀胱癌细胞在裸鼠膀胱中产生侵害肿瘤,其自发转移到肺。因此该模型可以用来通过用逆转录病毒载体体内基因转移治疗试验性膀胱癌。
根据最初Jone及其同事所报道的(Ahlering等,1987),来自RB小人膀胱癌细胞系,5637(ATCC HTB9)和RB+人膀胱癌细胞系的肿瘤,SCaBER(ATCC HTB3),通过导管直接注射到雌性无胸腺(nu/nu)裸鼠(6-8周龄)的膀胱中。使用连接TV检测器的纤维-光学系统检测裸鼠膀胱肿瘤的发生和进展。接着用表达本发明修饰的RB蛋白质的逆转录病毒载体处理试验肿瘤。
将从表达高水平人修饰的RB蛋白质的选择的克隆的组织培养基中获得具有高病毒效价的上清液,并且证实在使用前没有复制活性病毒。然而,范围自4×104至大于1×107菌落形成单位(cfu)/ml高效价,更优选大于1×106cfu/ml高效价的逆转录病毒载体悬浮液通过导管直接灌注到小鼠膀胱中来治疗肿瘤。技术人员将理解这样的治疗可以通过将导管插入到膀胱中根据需要重复很多次。
通过上述纤维-光学系统经常检测转移修饰的RB基因后的肿瘤消退。可以使用如上所述的同样的方法治疗人膀胱癌,除了将逆转录病毒载体悬浮液灌注到患有癌症的人的膀胱中。
B.使用同位肺癌细胞模型的体内研究
将正常pRB110表达的人大细胞肺癌NCI-H460(ATCC HTB177)细胞注入到无胸腺(nu/nu)裸鼠的右主支气管中(每只小鼠105个细胞)。三天后,用来自修饰的RB或野生型RB逆转录病毒产生细胞的上清液支气管内接种小鼠连续三天每天一次。用修饰的RB逆转录病毒上清液治疗的一组小鼠中的肿瘤形成抑制,与用野生型RB逆转录病毒上清液治疗的组相反,显示修饰的RB-表达逆转录病毒抑制RB+非小细胞肺癌(NSCLC)细胞的生长,而野生型RB-表达逆转录病毒不抑制。
C.体内治疗人非小细胞肺癌
具有易于进行支气管镜检查的支气管内肿瘤,并还具有支气管阻塞的非小细胞肺癌患者最初被挑选进行修饰的RB基因治疗。通过在局部或全身麻醉下通过支气管镜进行治疗。为了开始该程序,尽可能地通过内窥镜切除肉眼可见的肿瘤。经支气管的吸引针将通过支气管镜的活组织检查通道。然后,残存的肿瘤位点然后将用合适的修饰的RB逆转录病毒载体上清液,修饰的RB腺病毒悬浮液或修饰的RB-表达质粒载体-脂质体复合物以5ml-10ml体积注射。加入鱼精蛋白至5μg/ml。含有一种或多种载体的治疗性病毒或质粒上清液的注射将在肿瘤周围或肿瘤内部进行或者注射进毗邻肿瘤的粘膜下层。连续5天每天重复注射,然后是每月注射一次。只要没有肿瘤恶化就可以连续治疗。一年以后对患者评价检查是否适合继续治疗。
另外,作为预防措施,在注射病毒上清液后患者将戴外科面罩24小时。所有医药人员在支气管镜检查和注射病毒上清液期间都要戴面罩。根据需要规定抗咳。
D.用脂质体包被的纯化的修饰的RB蛋白治疗或预防人肺癌
另一个方面,靶肿瘤或癌细胞将通过将本发明修饰的RB蛋白质通过任何已知方法引入到需要这样治疗的细胞中进行治疗。例如脂质体是人工具膜小泡,其作为药物,蛋白质和质粒载体在体内或体外的送递载体的用途已经充分地研究过(Mannino等,1988)。蛋白质例如血红细胞阴离子转运蛋白(Newton等,1988),超氧化物歧化酶和过氧化氢酶(Tanswell等,1990),和UV-DNA修复酶(Ceccoli等,1989)已经以高效率地用脂小泡制成胶囊并且体外或体内送递到哺乳动物细胞中。此外,小颗粒气溶胶提供一种送递药物用于治疗呼吸道疾病的方法。例如,据报道可以通过使用脂质体作为载体以小颗粒气溶胶形式给药。通过气溶胶给药,药物十分均匀地分布在鼻咽,气管支气管树突和肺区的表面(Knight等,1988)。
为了治疗或预防肺癌,将例如通过免疫亲和性色谱或任何其它常规来源从重组杆状病毒AcMNPV-修饰的RB感染的昆虫细胞纯化治疗性修饰的RB蛋白质。然后将修饰的RB蛋白质然后与脂质体混合并且以高效率掺入到脂小泡中。制成胶囊的修饰的RB仍然是具活性的。因为气溶胶送递方法是温和的并且为正常志愿者和患者所很好耐受,所以含有修饰的RB的脂质体可以给药来治疗患任何阶段肺癌和/或预防高危种群肺癌的患者。含有修饰的RB蛋白质的脂质体可以通过鼻吸入或者通过经小颗粒气溶胶的气管内试管以足以抑制不正常细胞增殖的剂量给药。气溶胶治疗可以对患者给药30分钟,每天三次达两个星期,根据需要重复。修饰的RB蛋白质因此通过呼吸道和区送递。只要需要可以连续治疗。一年以后,对患者总的状况进行评价以检查是否适合继续治疗。
                    实施例12
       再表达RB对衰老和端粒酶抑制作用的诱导
限制次数的细胞分裂后,在体外和体内正常人二倍体细胞衰老。已知为细胞衰老的该过程是老化的结果并且是人类癌症发生的主要屏障。该实施例代表了这一研究,即证明RB/p53-缺陷肿瘤细胞通过修饰的四环素调控的基因表达系统的功能性pRB单独的重表达导致在细胞周期G0/G1期的稳定生长抑制,防止肿瘤细胞进入应答于多种促有丝分裂刺激的S期。这些细胞表现出与细胞衰老相一致的多态变化并且表达与衰老相关的β-半乳糖苷酶生物标记。
另外,确信对于新生质细胞的延时增殖半寿期为必需的端粒酶活性在诱导pRB(而不是p53)表达之后在肿瘤细胞系中消除或抑制。引人注意的是,当回到用于pRB表达的非允许的培养基中时,pRB-诱导的衰老肿瘤细胞恢复DNA合成并且试图分裂。但是,大多数细胞在该过程中死亡,这是一种类似于晚期培育中SV40T-抗原转化的人二倍体成纤维细胞的衰老后骤退现象。这些发现提供了pRB单独在RB/p53-缺陷肿瘤细胞中过度表达足以逆转它们的无限增殖,并且引起一种根据所有常规接受的标准与复制衰老不可区分的表型的直接证明。该结果表明pRB可以在体内细胞衰老程序中起着构成原因的作用。
A.材料和方法
建立具有Tc-可调节pRB表达的肿瘤细胞系
根据上文详细描述改进最初多质粒四环素阻抑蛋白/操纵基因为基础的调控系统。在该实施例中使用的所有RB-重组肿瘤细胞系在初始质粒转染之后进行至少两轮亚克隆,并且被认为是纯的克隆。这些克隆的同质性通过pRB核染色证实。另外,使用一系列测试(Zhou等,1994)保证功能pRB在允许条件下稳定表达。RB-重组肿瘤细胞在存在0.5μg/mlTc下在培养基中全部是RB-;而绝大多数(>99%)的细胞如通过免疫细胞化学染色所示在去除Tc之后24小时时变为RB+
流式细胞术分析
在碘化丙(Sigma)染色之前,将在各个时间点收集的单一细胞悬浮液用低聚甲醛和乙醇固定。使用FACScan流式细胞器(Becton-Dickinson)产生所有曲线。第一个峰(M1)含有为G0/G1的二倍体DNA的细胞,具有二倍PI-荧光强度的第二个峰(M3)包含四倍体G2/M细胞,两个峰之间的面积(M2)代表S期中细胞的总数(Nicoletti等,1991)。
SA-β-gal测定
基本上根据先前描述(Dimri等,1995)进行该项测定。简要地说,细胞在2%甲醛/0.2%戊二醛中固定5分钟并且用pH6.0的5-溴-4-氯-3-吲哚基β-D半乳糖苷(X-Gal)染色6小时。该染色溶液含有1mg/ml X-Gal,40mM柠檬酸/磷酸钠,pH6.0,5mM氰亚铁酸钾,5mM氰铁酸钾,150mM氯化钠和2mM二氯化镁。
端粒重复扩增方案(TRAP)测定
根据技术操作指南,该方法从Kim等(Kim等,1994)描述的原TRAP测定的改进而来。简要地说,收获100mm培养皿中生长的~106个细胞并且在200μl冰冷裂解缓冲液中,在冰上重新裂解30分钟,接着在4℃以100000×g离心30分钟。上清液稀释到0.5μg蛋白质/μl,其中2μl用于各TRAP测定。端粒酶反应在30℃进行30分钟,接着是2-步PCRTM扩增,使用[γ-32P]-标记的TS引物(90℃,30s和60℃,30s,循环33次)。PCRTM扩增的端粒酶扩大产物在12.5%聚丙烯酰胺凝胶上进行电泳。
B.结论
肿瘤细胞的pRB-介导的不可逆生长停止
如上所述使用修饰的四环素(Tc)-可调控基因表达系统,建立了十二个长期稳定肿瘤细胞克隆,其中野生型pRb的表达可以可逆地开始和结束而没有明显的渗漏。分别从乳腺癌细胞系,MDA-MB-468,骨肉瘤细胞系Saos-2和膀胱癌细胞系,5637获得RB-重组肿瘤细胞克隆。因为已知它们含有RB和p53基因突变,选择这些肿瘤细胞系作为宿主细胞(Wang等,1993;Chen等,1990;Berry等,1996;Masuda等,1987)。
如蛋白质印迹所测定的,肿瘤细胞中诱导的pRB蛋白质在从细胞培养基中去除四环素后大约24小时达到最高水平,然后在24-40小时之内变得完全脱磷酸化。接着在代表性克隆中通过测定生长曲线和(3H)胸苷掺入(Xu等,1994b),以及通过流式细胞器分析(Nicoletti等,1991)监测pRB表达的诱导对肿瘤细胞生长的影响。pRB表达诱导后24-48小时所研究的所有长期肿瘤细胞克隆的细胞生长和DNA合成停止。大多数肿瘤细胞在细胞周期的G0/G1期被抑制。
没有Tc培养基中将pRB表达诱导4天后,通过用各种各样的促细胞分裂原例如血清生长因子,植物凝集素(PHA)和伴刀豆凝集素A(ConA)刺激,肿瘤细胞的生长停止是不可逆的。这通过如图3A,图3B和图3C所示的连续平面生长曲线和应答于促细胞分裂原刺激的肿瘤细胞不掺入(3H)胸苷而测定。同时,肿瘤细胞表现出与细胞衰老相一致的显著的形态学变化,包括细胞变大,变平和比圆细胞低的细胞核质比。
此外,根据DNA断裂测试所测定的,经常在从在对于pRB表达是非允许的而不是允许的条件下生长的RB-重组Soas-2肿瘤细胞制备的DNA样品中发现少量低分子量DNA。该发现表明低水平的RB-缺陷肿瘤细胞培养物的自发编程性细胞死亡,其通过pRB表达的诱导作用抑制。另外,接通在RB-重组5637和MDA-MB-468肿瘤细胞系中的pRB表达也抑制IFN-γ-诱导的编程性细胞死亡。
与衰老相关的β-半乳糖苷酶的表达
最近报道过了培养物中和在体内老化皮肤中鉴别衰老人细胞的生物标记物。称之为与衰老相关的β-半乳糖苷酶(SA-β-gal)的该标记物由衰老的而不是衰老前的成纤维细胞表达。无限增殖细胞中没有SA-β-gal,而是由恢复无限增殖的基因操作诱导(Dimri等,1995)。幼小(早期)的人WI-38成纤维细胞是SA-β-gal阴性的,而衰老的(大于52的种群双倍水平)WI-38细胞是强SA-β-gal阳性的,其提供用于SA-β-gal测定的有效对照。Tc-应答RB-重组肿瘤细胞克隆在Tc存在下(即在RB-状态)全部是SA-β-gal阴性的,而大多数肿瘤细胞在无Tc培养基中诱导pRB表达4-5天后变为SA-β-gal阳性。对肿瘤细胞中与衰老相关的生物标记物的检测与肿瘤细胞种群的不可逆生长停止一致(图3A,图3B和图3C)。但是诱导的RB+肿瘤细胞的SA-β-gal染色的强度根据肿瘤细胞类型而变化。
肿瘤细胞中pRB(而不是p53)的再表达抑制端粒酶活性
因为端粒酶最近被视为细胞衰老调控剂的引人注目的候选者(Linskens等,1995:Klingelhutz等,1996),测定了pRB和p53置换对宿主肿瘤细胞端粒酶活性的影响。与此方面,建立了来自骨肉瘤细胞系,Saos-2的Tc-可调控野生型p53表达的几个长期稳定肿瘤细胞克隆。使用先前描述的端粒重复扩增方案(TRAP)测定(Kim等,1994)测定诱导pRB(或p53)表达之前和之后肿瘤细胞中的端粒酶活性。
诱导pRB表达之前,来自所检查的所有三种RB/p53-缺陷肿瘤类型的RB-重组肿瘤细胞克隆对于端粒酶活性是阳性的,而相对端粒酶活性比开始pRB表达后肿瘤细胞中的低~15至大于100倍,这是根据数字成象测密度术估计的。事实上,在pRB表达MDA-MB-468和Saos-2肿瘤细胞中几乎检测不到端粒酶活性。相反,尽管在Saos-2中诱导野生型p53表达不导致RB-/p53null肿瘤细胞的生长抑制,p53-重组Saos-2肿瘤克隆持久表现出阳性端粒酶活性,这不被其p53状态影响的。因此端粒酶活性之间的不同不能简单地解释为细胞增殖中的不同。
pRB退缩后pRB-诱导的衰老肿瘤细胞的衰老后骤退
pRB-诱导的肿瘤细胞衰老严格依赖功能pRB的持续表达。如上所述,在没有Tc的培养基中诱导pRB表达后4天或更多天,RB-重组的MDA-MB-468,Saos-2和5637肿瘤细胞变得衰老。但是,当这些肿瘤细胞返回对pRB表达是非允许培养基时,发现大量肿瘤细胞失去细胞-细胞附着而从培养皿中脱落并死亡。为了进一步表征这一现象,使用包括pRB免疫细胞化学染色和(3H)胸苷原位标记肿瘤细胞的结合方法。
发现将0.5μg/mlTc加回到在没有Tc的培养基中保持4-5天的RB-重组的Saos-2肿瘤细胞培养物中后,几乎所有的肿瘤细胞恢复了外源pRB而在第6天变为RB-。接着在第9-10天,肿瘤细胞抑制DNA合成,但是其大多数明显具有异常的核。它们试图分裂但是大多数在该过程中死亡。这些肿瘤细胞表现出表明类似于T-抗原-转化的人细胞在晚期培育中的衰老后骤退(Stein,1985)的抑制表型。
总之,功能pRB在RB-缺陷肿瘤细胞中的再表达诱导的生长停止并同时抑制端粒酶活性。肿瘤细胞不可逆失去促细胞分裂原应答,进入存活的G1-抑制状态。它们也表现出pRB-依赖性SA-β-gal阳性(与衰老相关的生物标记)和对编程性细胞死亡的抗性。值得注意的是,在RB-/p53nullSaos-2中野生型pRB或p53的置换能以种群水平阻断肿瘤细胞生长,但是只是pRB诱导的端粒酶的抑制。此外,pRB诱导的衰老肿瘤细胞中pRB的排除导致类骤退表型。这些发现结合在一起表明pRB起因性参与细胞衰老过程。这些结果是pRB单独在各种RB缺陷肿瘤细胞中的超表达足以恢复它们的无限增殖和引起bona fide复制衰老的第一直接证据。因为检查的所有三种RB缺陷肿瘤细胞系也具有p53突变,所以pRB介导的肿瘤细胞衰老明显不需要野生型p53功能。
因此,表明了pRB和端粒酶之间的新的联系。通过端粒重复扩增方案(TRAP)测定证明pRB在RB缺陷肿瘤细胞中的再表达抑制端粒酶活性。由于聚合酶链反应(PCRTM)为基础的TRAP测定的高度敏感性,检测了非常小数目端粒酶活性阳性细胞中的酶活性,以及获得绝对纯RB-重组细胞克隆中的困难,因此,pRB重表达对RB缺陷肿瘤细胞中端粒酶活性的抑制的效力可能甚至大于通过体外测试所检测到的。
值得注意的还有,当保持在对于pRB(或p53)表达是非允许条件下,pRB-重组Saos-2克隆明显具有比p53-重组Saos-2克隆低得多的端粒酶活性。该差别提示甚至在开通没有Tc培养基中pRB表达之前一定有来自Saos-2细胞中Tc-应答启动子的pRB的低基础表达作用(Gossen和Bujard,1995)。非允许条件下pRB-重组肿瘤细胞中pRB汇漏程度低于pRB蛋白质的免疫检测阈(Xu等,1991b),但是可能足以抑制大部分端粒酶活性。因为没有端粒酶活性的肿瘤细胞可能恢复端粒衰退,如果完整保留在肿瘤细胞中,则其最后可能引发固有的细胞衰老程序。
参照本发明公开,不经过度的试验可以进行和实施这里所公开的和要求的所有组合物和方法。尽管以优选实施方案描述了本发明组合物和方法,但是对于本领域技术人员来说,很明显可以不脱离本发明概念,精神和范围对这里所描述的组合物和方法和方法的步骤或步骤的顺序进行改变。更具体地说,很明显一些化学和生理相关的试剂可以取代这里所描述的试剂,同时获得相同或相似的结果。对于本领域技术人员来说显然所有这些类似的取代和修饰被认为落在后面的权利要求书所定义的精神,范围和概念中。
                        序列表(1)一般信息:
(i)申请人:(A)姓名Board of Regents,The University of Texas System(B)街道:201W.7th街(C)城市:Austin(D)州:Texas(E)国家:USA(F)邮编(ZIP):78701(G)电话:(512)418-3000(H)电传:(512)474-7577
(ii)发明题目:修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质
(iii)序列数:51
(iv)计算机可读形式:
(A)介质类型:Floppy盘
(B)计算机:IBM PC兼容
(C)操作系统:PC-DOS/MS-DOS
(D)软盘:Patent In Release#1.0,Version#1.30(EPO)
(vi)先前申请数据:
(A)申请号:US60/038118
(B)申请日:02-2-1997(2)SEQ ID NO:1的信息:
(i)序列特征:
  (A)长度:3555个碱基对
  (B)类型:核酸
  (C)链数:单链
  (D)拓扑学:线性(ix)特征:(A)名称/关键词:CDS(B)位置:7..2790(xi)序列描述SEQ ID NO:1:CGCGTC ATG CCG CCC AAA ACC CCC CGA AAA ACG GCC GCC ACC GCC GCC           48
   Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala
     1               5                  10GCT GCC GCC GCG GAA CCC CCG GCA CCG CCG CCG CCG CCC CCT CCT GAG          96Ala Ala Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu15                  20                  25                  30GAG GAC CCA GAG CAG GAC AGC GGC CCG GAG GAC CTG CCT CTC GTC AGG         144Glu Asp Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg
             35                  40                  45CTT GAG TTT GAA GAA ACA GAA GAA CCT GAT TTT ACT GCA TTA TGT CAG         192Leu Glu Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln
         50                  55                  60AAA TTA AAG ATA CCA GAT CAT GTC AGA GAG AGA GCT TGG TTA ACT TGG         240Lys Leu Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp
     65                  70                  75GAG AAA GTT TCA TCT GTG GAT GGA GTA TTG GGA GGT TAT ATT CAA AAG         288Glu Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys
 80                  85                  90AAA AAG GAA CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA         336Lys Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu95                 100                 105                 110GAT GAG ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC ATA GAA ATC         384Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile
            115                 120                 125AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT ACC AGT ACC         432Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr
        130                 135                 140AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG         480Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu
    145                 150                 155TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG         528Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu
160                 165                 170ACA CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT GCA TTG GTG         576Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val175                 180                 185                 190CTA AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA         624Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu
            195                 200                 205CAA ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC         672Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val
        210                 215                 220CTT GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA          720Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro
    225                 230                 235TAT AAA ACA GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG          768Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg
240                 245                 250CGA GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT          816Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp255                 260                 265                 270ACA AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT          864Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp
            275                 280                 285GAG GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT          912Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser
        290                 295                 300CTT GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT          960Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser
    305                 310                 315AAA CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA         1008Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg
320                 325                 330TTA TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT         1056Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser335                 340                 345                 350TTT GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG         1104Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val
            355                 360                 365AAT GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC         1152Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile
        370                  375                380CAA CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA         1200Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu
    385                 390                 395AAT CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT         1248Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser
400                 405                 410ATA CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT         1296Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe415                 420                 425                 430GCT AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC         1344Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr
            435                 440                 445AAA CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA        1392Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys
        450                 455                 460TCA GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT        1440Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn
    465                 470                 475GAC AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA        1488Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val
480                 485                 490ATG GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA        1536Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr495                 500                 505                 510GAT TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT        1584Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe
            515                 520                 525GAT TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG        1632Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu
        530                 535                 540ACA AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG        1680Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met
    545                 550                 555GAA TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA        1728Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys
560                 565                 570CAA TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT        1776Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys575                 580                 585                 590CCT CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT        1824Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr
            595                 600                 605CTT TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA        1872Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val
        610                 615                 620AAT TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC        1920Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr
    625                 630                 635CAG AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG        1968Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val
640                 645                 650TAT CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG        2016Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu655                 660                 665                 670TCT GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC        2064Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His
            675                 680                 685ACC CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA        2112Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln
        690                 695                 700ATT ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC        2160Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp
    705                 710                 715CTT AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT        2208Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala
720                 725                 730GTT CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT        2256Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp735                 740                 745                 750TCT ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA        2304Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr
            755                 760                 765AAT ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA        2352Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile
        770                 775                 780CCT CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG        2400Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg
    785                 790                 795ATT CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA        2448Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys
800                 805                 810ATT TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA        2496Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg815                 820                 825                 830ATC TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG        2544Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln
            835                 840                 845AAA ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT        2592Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser
        850                 855                 860GCT GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT        2640Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp
    865                 870                 875ATT GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG        2688Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu
880                 885                 890TCC AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA        2736Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg895                 900                 905                 910ATG CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA        2784Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu
            915                 920                 925GAG AAA TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG         2840Glu LysTCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC      2908TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC      2960ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA      3020TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT      3080AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT      3140TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAAITTATAT GTATATTTTT      3200TTAATTTAAC ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA      3260TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA      3320ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT      3380ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT      3440AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG TAAAAGAACT      3500TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA TAGTC           3555(2)SEQ ID NO:2的信息:
(i)序列特征
(A)长度:928个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:2:Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala Ala Ala1               5                  10                  15Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Glu Asp
         20                  25                  30Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu
     35                  40                  45Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu
 50                  55                  60Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys65                  70                  75                  80Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys
             85                  90                  95Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Asp Glu
        100                 105                 110Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val
    115                 120                 125His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val
130                 135                 140Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala145                 150                 155                 160Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln
            165                 170                 175Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys
        180                 185                 190Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met
    195                 200                 205Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp
210                 215                 220Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys225                 230                 235                 240Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly
            245                 250                 255Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg
        260                 265                 270Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val
    275                 280                 285Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly
290                 295                 300Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg305                 310                 315                 320Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe
            325                 330                 335Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu
        340                 345                 350Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val
    355                 360                 365Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln
370                 375                 380Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu385                 390                  395                400Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu
            405                 410                 415Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys
        420                 425                 430Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu
    435                 440                 445Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu
450                 455                 460Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn465                 470                 475                 480Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala
            485                 490                 495Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu
        500                 505                 510Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe
    515                 520                 525Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg
530                 535                 540Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser545                 550                 555                 560Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser
            565                 570                 575Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu
        580                 585                 590Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser
    595                 600                 605Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser
610                 615                 620Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys625                 630                 635                 640Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg
            645                 650                 655Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu
        660                 665                 670His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu
    675                 680                 685Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met
690                 695                 700Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys705                 710                  715                720Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln
            725                 730                 735Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile
        740                 745                 750Ile Val Phe Tyr Asn Ser Val Phe Mat Gln Arg Leu Lys Thr Asn Ile
    755                 760                 765Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His
770                 775                 780Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro785                 790                 795                 800Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser
            805                 810                 815Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu
        820                 825                 830Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile
    835                 840                 845Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu
850                 855                 860Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu865                 870                 875                 880Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys
            885                 890                 895Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln
        900                 905                 910Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
    915                 920                 925(2)SEQ ID NO:3的信息:
(i)序列特征:
(A)长度:3218个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(ix)特征:(A)名称/关键词:CDS(B)位置:7..2454(xi)序列描述SEQ ID NO:3:GCCGTC ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC ATA GAA ATC           48
   Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile
     1               5                  10AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT ACC AGT ACC          96Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr15                  20                  25                  30AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG         144Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu
             35                  40                  45TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG         192Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu
         50                  55                  60ACA CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT GCA TTG GTG         240Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val
     65                  70                  75CTA AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA         288Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu
 80                  85                  90CAA ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC         336Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val95                 100                 105                 110CTT GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA         384Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro
            115                 120                 125TAT AAA ACA GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG         432Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg
        130                 135                 140CGA GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT         480Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp
    145                 150                 155ACA AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT         528Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp
160                 165                 170GAG GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT         576Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser175                 180                 185                 190CTT GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT         624Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser
            195                 200                 205AAA CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA         672Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg
        210                 215                 220TTA TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT         720Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser
    225                 230                 235TTT GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG         768Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val
240                 245                 250AAT GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC         816Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile255                 260                 265                 270CAA CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA         864Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu
            275                 280                 285AAT CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT         912Asn Leu Ile Ser Tyr Phe ASn Asn Cys Thr Val Asn Pro Lys Glu Ser
        290                 295                 300ATA CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT         960Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe
    305                 310                 315GCT AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC        1008Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr
320                 325                 330AAA CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA        1056Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys335                 340                 345                 350TCA GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT        1104Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn
            355                 360                 365GAC AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA        1152Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val
        370                 375                 380ATG GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA        1200Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr
    385                 390                 395GAT TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT        1248Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe
400                 405                 410GAT TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG        1296Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu415                 420                 425                 430ACA AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG        1344Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met
            435                 440                 445GAA TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA        1392Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys
        450                 455                 460CAA TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT        1440Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys
    465                 470                 475CCT CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT        1488Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr
480                 485                 490CTT TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA        1536Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val495                 500                 505                 510AAT TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC        1584Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr
            515                 520                 525CAG AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG        1632Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val
        530                 535                 540TAT CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG        1680Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu
    545                 550                 555TCT GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC        1728Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His
560                 565                 570ACC CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA        1776Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln575                 580                 585                 590ATT ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC        1824Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp
            595                 600                 605CTT AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT        1872Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala
        610                 615                 620GTT CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT        1920Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp
    625                 630                 635TCT ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA        1968Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr
640                 645                 650AAT ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA        2016Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile655                 660                 665                 670CCT CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG        2064Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg
            675                 680                 685ATT CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA        2112Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys
        690                 695                 700ATT TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA        2160Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg
    705                 710                 715ATC TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG        2208Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln
720                 725                 730AAA ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT        2256Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser735                 740                 745                 750GCT GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT        2304Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp
            755                 760                 765ATT GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG        2352Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu
        770                 775                 780TCC AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA        2400Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg
    785                 790                 795ATG CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA        2448Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu
800                 805                 810GAG AAA TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG         2504Glu Lys815TCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC      2564TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC      2624ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA      2684TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT      2744AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT      2804TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT GTATATTTTT      2864TTAATTTAAC ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA      2924TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA      2984ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT      3044ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT      3104AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG TAAAAGAACT      3164TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA TAGT            3218(2)SEQ ID NO:4的信息:
(i)序列特征:
(A)长度:816个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述SEQ ID NO:4:Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val1               5                  10                  15His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val
         20                  25                  30Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala
     35                  40                  45Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln
 50                  55                  60Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys65                  70                  75                  80Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met
             85                  90                  95Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp
        100                 105                 110Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys
    115                 120                 125Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly
130                 135                 140Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg145                 150                 155                 160Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val
            165                 170                 175Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly
        180                 185                 190Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg
    195                 200                 205Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe
210                 215                 220Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu225                 230                 235                 240Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val
            245                 250                 255Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln
        260                 265                 270Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu
    275                 280                 285Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu
290                 295                 300Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys305                 310                 315                 320Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu
            325                 330                 335Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu
        340                 345                 350Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn
    355                 360                 365Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala
370                 375                 380Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu385                 390                 395                 400Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe
            405                 410                 415Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg
        420                 425                 430Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser
    435                 440                 445Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser
450                 455                 460Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu465                 470                 475                 480Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser
            485                 490                 495Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser
        500                 505                 510Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys
    515                 520                 525Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg
530                 535                 540Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu545                 550                 555                 560His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu
            565                  570                575Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met
        580                 585                 590Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys
    595                 600                 605Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln
610                 615                 620Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile625                 630                 635                 640Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile
            645                 650                 655Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His
        660                 665                 670Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro
    675                 680                 685Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser
690                 695                 700Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu705                 710                 715                 720Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile
            725                 730                 735Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu
        740                 745                 750Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu
    755                 760                 765Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys
770                 775                 780Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln785                 790                 795                 800Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
            805                 810                 815(2)SEQ ID NO:5的信息:
(i)序列特征
(A)长度:285个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:5:CTCGAGCAAT GGGCGTGATA GCGGTTTGAC TCACGGGGAT TTCCAAGTCT CCACCCCATT                  60GACGTCAATG GGAGTTTGTT TTGGCACCAA AATCAACGGG ACTTTCCAAA ATGTCGTAAC                 120AACTCCGCCC CATTGACGCA AATGGGCGGT AGGCGTGTAC GGTGGGAGGT CTATATAAGC                 180AGAGCTCGTT TAGTGAACCG TCAGATCGCC TGGAGACGCC ATCCACGCTG TTTTGACCTC                 240CATAGAAGAC ACCGGGACCG ATCCAGCCTC CGCGGCCGCG AATTC                                 285(2)SEQ ID NO:6的信息:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述SEQ ID NO:6:CCGCTCGAGC AATGGGCGTG GATAGCGG(2)SEQ ID NO:7的信息:(i)序列特征:
(A)长度:26个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:7:CCGCTCGAGCACCAAAATCA ACGGGA(2)SEQ ID NO:8的信息:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:8:CCGCTCGAGC AACTCCGCCC CATTGAC(2)SEQ ID NO:9的信息:
(i)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:9:TAGACATATG AATTCGCGGC C(2)SEQ ID NO:10的信息:
(i)序列特征
(A)长度:19个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述SEQ ID NO:10:CTAGAATTCG CTGTCTGCG(2)SEQ ID NO:11的信息:
(i)序列特征:
(A)长度:26个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:11:GCTCTAGATG CAGTTGGACC TGGGAG(2)SEQ ID NO:12的信息:
(i)序列特征
(A)长度:32个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:12:CCCAAGCTTG CCGCCATGTC GTTCACTTTT AC(2)SEQ ID NO:13的信息:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:13:GTCCAAGAGA ATTCATAAAA GG(2)SEQ ID NO:14的信息:
(i)序列特征:
(A)长度:39个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:14:CCCAAGCTTG CCGCCATGGA GCAGGACAGC GGCCCGGAC(2)SEQ ID NO:15的信息:
(i)序列特征
(A)长度:39个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:15:CCCAAGCTTG CCGCCATGGA TTTTACTGCA TTATGTCAG(2)SEQ ID NO:16的信息:
(i)序列特征
(A)长度:39个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:16:CCCAAGCTTG CCGCCATGGA GAAAGTTTCA TCTTGTGAT(2)SEQ IDNO:17的信息:
(i)序列特征:
(A)长度:39个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:17:CCCAAGCTTG CCGCCATGCT GTGGGGAATC TGTATCTTT(2)SEQ ID NO:18的信息:
(i)序列特征
(A)长度:36个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:18:CCCAAGCTTG CCGCCATGTC AAGACTGTTG AAGAAG(2)SEQ ID NO:19的信息:
(i)序列特征:
(A)长度:30个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:19:GCGCCTGAGG ACCTAGATGA GATGTCGTTC(2)SEQ ID NO:20的信息:
(i)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:20:GCGGTTAACC CTAGATGAGA TGTCGTTCAC T(2)SEQ ID NO:21的信息:
(i)序列特征:
(A)长度:36个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:21:CCCAAGCTTG CCGTCATGCC GCCCAAAACC CCCCGA(2)SEQ ID NO:22的信息:
(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:22:CTCACCTAGG TCAACTGCTG CAAT(2)SEQ ID NO:23的信息
(i)序列特征
(A)长度:24个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:23:GTTGACCTAG GTGATATGTC GTTC(2)SEQ ID NO:24的信息:
(i)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:24:GCGCCTAGGA TCTACTGAAA TAAATTCTGCA(2)SEQ ID NO:25的信息:
(i)序列特征
(A)长度:31个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:25:CCCGATATCA ACTGCTGGGT TGTGTCAAAT A(2)SEQ ID NO:26的信息:
(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(xi)序列描述:SEQ ID NO:26:CCCGAATTCG TTTTATATGG TTTCTTTGAGC AA(2)SEQ ID NO:27的信息:
(i)序列特征:
(A)长度:10个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(ix)特征:(A)名称/关键词:修饰的碱基(B)位置:4..5(D)其它信息:/注=“R=A或G”(xi)序列描述:SEQ ID NO:27:GCCRCCAUGG(2)SEQ ID NO:28的信息:
(i)序列特征:
(A)长度:3455个碱基对
(B)类型:核酸
(C)链数:单链
(D)拓扑学:线性(ix)特征:(A)名称/关键词:CDS(B)位置:7..2691(xi)序列描述:SEQ ID NO:28:GCCGTC ATG CAG GAC AGC GGC CCG GAG GAC CTG CCT CTC GTC AGG CTT
   Met Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu
     1               5                  10GAG TTT GAA GAA ACA GAA GAA CCT GAT TTT ACT GCA TTA TGT CAG AAAGlu Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys15                  20                  25                  30TTA AAG ATA CCA GAT CAT GTC AGA GAG AGA GCT TGG TTA ACT TGG GAG         144Leu Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu
             35                  40                  45AAA GTT TCA TCT GTG GAT GGA GTA TTG GGA GGT TAT ATT CAA AAG AAA         192Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys
         50                  55                  60AAG GAA CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA GAT         240Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Asp
     65                  70                  75GAG ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC ATA GAA ATC AGT         288Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser
 80                  85                  90GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT ACC AGT ACC AAA         336Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys95                 100                 105                 110GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG TTT         384Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe
            115                 120                 125GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG ACA         432Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr
        130                 135                 140CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT GCA TTG GTG CTA         480Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu
    145                 150                 155AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA CAA         528Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln
160                 165                 170ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC CTT         576Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu175                 180                 185                 190GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA TAT         624Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr
            195                 200                 205AAA ACA GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG CGA         672Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg
        210                 215                 220GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT ACA         720Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr
    225                 230                 235AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT GAG         768Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu
240                 245                 250GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT CTT         816Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu255                 260                 265                 270GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT AAA         864Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys
            275                 280                 285CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA TTA         912Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu
        290                 295                 300TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT TTT         960Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe
    305                 310                 315GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG AAT        1008Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn
320                 325                 330GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC CAA        1056Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln335                 340                 345                 350CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA AAT        1104Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn
            355                 360                 365CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT ATA        1152Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile
        370                 375                 380CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT GCT        1200Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala
    385                 390                 395AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC AAA        1248Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys
400                 405                 410CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA TCA        1296Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser415                 420                 425                 430GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT GAC        1344Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp
            435                 440                 445AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA ATG        1392Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met
        450                 455                 460GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA GAT        1440Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp
    465                 470                 475TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT GAT        1488Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp
480                 485                 490TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG ACA        1536Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr495                 500                 505                 510AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG GAA        1584Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu
            515                 520                 525TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA CAA        1632Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln
        530                 535                 540TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT CCT        1680Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro
    545                 550                 555CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT CTT        1728Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu
560                 565                 570TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA AAT        1776Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn575                 580                 585                 590TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC CAG        1824Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln
            595                 600                 605AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG TAT        1872Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr
        610                 615                 620CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG TCT        1920Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser
    625                 630                 635GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC ACC        1968Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr
640                 645                 650CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA ATT        2016Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile655                 660                 665                 670ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC CTT        2064Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu
            675                 680                 685AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT GTT        2112Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val
        690                 695                 700CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT TCT       2160Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser
    705                 710                 715ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA AAT       2208Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn
720                 725                 730ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA CCT       2256Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro735                 740                 745                 750CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG ATT       2304His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile
            755                 760                 765CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA ATT       2352Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile
        770                 775                 780TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA ATC       2400Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile
    785                 790                 795TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG AAA       2448Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys
800                 805                 810ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT GCT       2496Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala815                 820                 825                 830GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT ATT       2544Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile
            835                 840                 845GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG TCC       2592Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser
        850                 855                 860AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA ATG       2640Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met
    865                 870                 875CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA GAG       2688Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu
880                 885                 890AAA TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG             2741Lys895TCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC      2801TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC      2861ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA      2921TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT  2981AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT  3041TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT GTATATTTTT  3101TTAATTTAAC ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA  3161TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA  3221ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT  3281ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT  3341AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG TAAAAGAACT  3401TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA TAGT        3455(2)SEQ ID NO:29的信息:
(i)序列特征:
(A)长度:895个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:29:Met Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu Phe1               5                  10                  15Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu Lys
         20                  25                  30Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys Val
     35                  40                  45Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys Glu
 50                  55                  60Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Asp Glu Met65                  70                  75                  80Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val His
             85                  90                  95Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val Asp
        100                 105                 110Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala Leu
    115                 120                 125Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln Pro
130                 135                 140Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys Val145                 150                 155                 160Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met Glu
            165                 170                 175Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp Tyr
        180                 185                 190Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys Thr
    195                 200                 205Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln
210                 215                 220Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile225                 230                 235                 240Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val Lys
            245                 250                 255Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu
        260                 265                 270Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr
    275                 280                 285Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu
290                 295                 300Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr305                 310                 315                 320Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile
            325                 330                 335Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu
        340                 345                 350Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile
    355                 360                 365Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys
370                 375                 380Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala385                 390                 395                 400Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly
            405                 410                 415Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu
        420                 425                 430Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile
    435                 440                 445Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr
450                 455                 460Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser465                 470                 475                 480Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr
            485                 490                 495Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu
        500                 505                 510Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu
    515                 520                 525Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys
530                 535                 540Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn545                 550                 555                 560Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro
            565                 570                 575Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr
        580                 585                 590Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro
    595                 600                 605Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu
610                 615                 620Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His625                 630                 635                 640Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln
            645                 650                 655Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met Met
        660                 665                 670Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe
    675                 680                 685Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu
690                 695                 700Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile705                 710                 715                 720Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu
            725                 730                 735Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile
        740                 745                 750Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly
    755                 760                 765Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu
770                 775                 780Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu Val785                 790                 795                 800Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn
            805                 810                 815Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly
        820                 825                 830Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly
    835                 840                 845Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys Phe
850                 855                 860Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys865                 870                 875                 880Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
            885                 890                 895(2)INFORMATION  FOR SEQ ID NO:30:信息:
(i)序列特征:
(A)长度:3392个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2628
(xi)序列描述:SEQ ID NO:30:GCCATC ATG GAT TTT ACT GCA TTA TGT CAG AAA TTA AAG ATA CCA GAT     48
   Met Asp Phe Thr Ala Leu Cys Gln Lys Leu Lys Ile Pro Asp
     1               5                  10CAT GTC AGA GAG AGA GCT TGG TTA ACT TGG GAG AAA GTT TCA TCT GTG    96His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys Val Ser Ser Val15                  20                  25                  30GAT GGA GTA TTG GGA GGT TAT ATT CAA AAG AAA AAG GAA CTG TGG GGA   144Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys Glu Leu Trp Gly
             35                  40                  45ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA GAT GAG ATG TCG TTC ACT         192Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Asp Glu Met Ser Phe Thr
         50                  55                  60TTT ACT GAG CTA CAG AAA AAC ATA GAA ATC AGT GTC CAT AAA TTC TTT         240Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val His Lys Phe Phe
     65                  70                  75AAC TTA CTA AAA GAA ATT GAT ACC AGT ACC AAA GTT GAT AAT GCT ATG         288Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val Asp Asn Ala Met
 80                  85                  90TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG TTT GCA CTC TTC AGC AAA         336Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala Leu Phe Ser Lys95                 100                 105                 110TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG ACA CAA CCC AGC AGT TCG         384Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln Pro Ser Ser Ser
            115                 120                 125ATA TCT ACT GAA ATA AAT TCT GCA TTG GTG CTA AAA GTT TCT TGG ATC         432Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys Val Ser Trp Ile
        130                 135                 140ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA CAA ATG GAA GAT GAT CTG         480Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met Glu Asp Asp Leu
    145                 150                 155GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC CTT GAC TAT TTT ATT AAA         528Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp Tyr Phe Ile Lys
160                 165                 170CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA TAT AAA ACA GCT GTT ATA         576Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys Thr Ala Val Ile175                 180                 185                 190CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG CGA GGT CAG AAC AGG AGT         624Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln Asn Arg Ser
            195                 200                 205GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT ACA AGA ATT ATT GAA GTT         672Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile Ile Glu Val
        210                 215                 220CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT GAG GTG AAA AAT GTT TAT         720Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val Lys Asn Val Tyr
    225                 230                 235TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT CTT GGA CTT GTA ACA TCT         768Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu Val Thr Ser
240                 245                 250AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT AAA CGA TAC GAA GAA ATT         816Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu Ile255                 260                 265                 270TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA TTA TTT TTG GAT CAT GAT         864Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu Asp His Asp
            275                 280                 285AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT TTT GAA ACA CAG AGA ACA         912Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg Thr
        290                 295                 300CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG AAT GTA ATT CCT CCA CAC         960Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile Pro Pro His
    305                 310                 315ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC CAA CAA TTA ATG ATG ATT        1008Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu Met Met Ile
320                 325                 330TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA AAT CTG ATT TCC TAT TTT        1056Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr Phe335                 340                 345                 350AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT ATA CTG AAA AGA GTG AAG        1104Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys Arg Val Lys
            355                 360                 365GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT GCT AAA GCT GTG GGA CAG        1152Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala Val Gly Gln
        370                 375                 380GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC AAA CTT GGA GTT CGC TTG        1200Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg Leu
    385                 390                 395TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA TCA GAA GAA GAA CGA TTA        1248Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu Glu Arg Leu
400                 405                 410TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT GAC AAC ATT TTT CAT ATG        1296Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile Phe His Met415                 420                 425                 430TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA ATG GCC ACA TAT AGC AGA        1344Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr Tyr Ser Arg
            435                 440                 445AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA GAT TTG TCT TTC CCA TGG        1392Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro Trp
        450                 455                 460ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT GAT TTT TAC AAA GTG ATC        1440Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val Ile
    465                 470                 475GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG ACA AGA GAA ATG ATA AAA        1488Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu Met Ile Lys
480                 485                 490CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG GAA TCC CTT GCA TGG CTC        1536His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu Ala Trp Leu495                 500                 505                 510TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA CAA TCA AAG GAC CGA GAA       1584Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg Glu
            515                 520                 525GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT CCT CTT AAT CTT CCT CTC       1632Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro Leu
        530                 535                 540CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT CTT TCT CCT GTA AGA TCT       1680Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro Val Arg Ser
    545                 550                 555CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA AAT TCT ACT GCA AAT GCA       1728Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr Ala Asn Ala
560                 565                 570GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC CAG AAG CCA TTG AAA TCT       1776Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro Leu Lys Ser575                 580                 585                 590ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG TAT CGG CTA GCC TAT CTC       1824Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr Leu
            595                 600                 605CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG TCT GAG CAC CCA GAA TTA       1872Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His Pro Glu Leu
        610                 615                 620GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC ACC CTG CAG AAT GAG TAT       1920Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln Asn Glu Tyr
    625                 630                 635GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA ATT ATG ATG TGT TCC ATG       1968Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met Met Cys Ser Met
640                 645                 650TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC CTT AAA TTC AAA ATC ATT       2016Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe Lys Ile Ile655                 660                 665                 670GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT GTT CAG GAG ACA TTC AAA       2064Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu Thr Phe Lys
            675                 680                 685CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT TCT ATT ATA GTA TTC TAT       2112Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe Tyr
        690                 695                 700AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA AAT ATT TTG CAG TAT GCT       2160Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr Ala
    705                 710                 715TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA CCT CAC ATT CCT CGA AGC       2208Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile Pro Arg Ser
720                 725                 730CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG ATT CCT GGA GGG AAC ATC              2256Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn Ile735                 740                 745                 750TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA ATT TCA GAA GGT CTG CCA              2304Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu Pro
            755                 760                 765ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA ATC TTA GTA TCA ATT GGT              2352Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu Val Ser Ile Gly
        770                 775                 780GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG AAA ATA AAT CAG ATG GTA              2400Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn Gln Met Val
    785                 790                 795TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT GCT GAA GGA AGC AAC CCT              2448Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly Ser Asn Pro
800                 805                 810CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT ATT GAA GGA TCA GAT GAA              2496Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp Glu815                 820                 825                 830GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG TCC AAA TTT CAG CAG AAA              2544Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys Phe Gln Gln Lys
            835                 840                 845CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA ATG CAA AAG CAG AAA ATG               2592Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys Gln Lys Met
        850                 855                 860AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA GAG AAA TGAGGATCTC                    2638Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
    865                 870AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG TCTCTCACAG ATGTGACTGT             2698ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC TTCAGCTCTT TTTGTGGATA             2758TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC ACTTGAAATG TTAGTCATTG             2818TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA TTTAAAAAGT TGTAGCAGAT             2878TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT AGTAAGAATG GCCCTAGAGT             2938GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT TCTTTTGTAG CATATAGGTG             2998ATGTTTGCTC TTGTTTTTAT TAATTTATAT GTATATTTTT TTAATTTAAC ATGAACACCC             3058TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA TTGACTGCCC ATTCACCAAA             3118ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA ATTAGAAAAA AATTACTAAT             3178TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT ACTGTGTGCT TGTTTTATAA             3238AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT AACCATATGA TACTATCATA             3298
                          155(2)INFORMATION FOR SEQ ID NO:31:信息:
(i)序列特征:
(A)长度:874个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:31:Met Asp Phe Thr Ala Leu Cys Gln Lys Leu Lys Ile Pro Asp His Val1               5                  10                  15Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys Val Ser Ser Val Asp Gly
         20                  25                  30Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys Glu Leu Trp Gly Ile Cys
     35                  40                  45Ile Phe Ile Ala Ala Val Asp Leu Asp Glu Met Ser Phe Thr Phe Thr
 50                  55                  60Glu Leu Gln Lys Asn Ile Glu Ile Ser Val His Lys Phe Phe Asn Leu65                  70                  75                  80Leu Lys Glu Ile Asp Thr Ser Thr Lys Val Asp Asn Ala Met Ser Arg
             85                  90                  95Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala Leu Phe Ser Lys Leu Glu
        100                 105                 110Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln Pro Ser Ser Ser Ile Ser
    115                 120                 125Thr Glu Ile Asn Ser Ala Leu Val Leu Lys Val Ser Trp Ile Thr Phe
130                 135                 140Leu Leu Ala Lys Gly Glu Val Leu Gln Met Glu Asp Asp Leu Val Ile145                 150                 155                 160Ser Phe Gln Leu Met Leu Cys Val Leu Asp Tyr Phe Ile Lys Leu Ser
            165                 170                 175Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys Thr Ala Val Ile Pro Ile
        180                 185                 190Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln Asn Arg Ser Ala Arg
    195                 200                 205Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile Ile Glu Val Leu Cys
210                 215                 220Lys Glu His Glu Cys Asn Ile Asp Glu Val Lys Asn Val Tyr Phe Lys225                 230                 235                 240Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu Val Thr Ser Asn Gly
            245                 250                 255Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu Ile Tyr Leu
        260                 265                 270Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu Asp His Asp Lys Thr
    275                 280                 285Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg Thr Pro Arg
290                 295                 300Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile Pro Pro His Thr Pro305                 310                 315                 320Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu Met Met Ile Leu Asn
            325                 330                 335Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr Phe Asn Asn
        340                 345                 350Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys Arg Val Lys Asp Ile
    355                 360                 365Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala Val Gly Gln Gly Cys
370                 375                 380Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg Leu Tyr Tyr385                 390                 395                 400Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu Glu Arg Leu Ser Ile
            405                 410                 415Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile Phe His Met Ser Leu
        420                 425                 430Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr Tyr Ser Arg Ser Thr
    435                 440                 445Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro Trp Ile Leu
450                 455                 460Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val Ile Glu Ser465                 470                 475                 480Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu Met Ile Lys His Leu
            485                 490                 495Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu Ala Trp Leu Ser Asp
        500                 505                 510Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg Glu Gly Pro
    515                 520                 525Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro Leu Gln Asn
530                 535                 540Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro Val Arg Ser Pro Lys545                 550                 555                 560Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr Ala Asn Ala Glu Thr
            565                 570                 575Gln Ala Thr Ser Ala Pha Gln Thr Gln Lys Pro Leu Lys Ser Thr Ser
        580                 585                 590Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr Leu Arg Leu
    595                 600                 605Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His Pro Glu Leu Glu His
610                 615                 620Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln Asn Glu Tyr Glu Leu625                 630                 635                 640Met Arg Asp Arg His Leu Asp Gln Ile Met Met Cys Ser Met Tyr Gly
            645                 650                 655Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe Lys Ile Ile Val Thr
        660                 665                 670Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu Thr Phe Lys Arg Val
    675                 680                 685Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe Tyr Asn Ser
690                 695                 700Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr Ala Ser Thr705                 710                 715                 720Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile Pro Arg Ser Pro Tyr
            725                 730                 735Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn Ile Tyr Ile
        740                 745                 750Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu Pro Thr Pro
    755                 760                 765Thr Lys Met Thr Pro Arg Ser Arg Ile Leu Val Ser Ile Gly Glu Ser
770                 775                 780Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn Gln Met Val Cys Asn785                 790                 795                 800Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly Ser Asn Pro Pro Lys
            805                 810                 815Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp Glu Ala Asp
        820                 825                 830Gly Ser Lys His Leu Pro Gly Glu Ser Lys Phe Gln Gln Lys Leu Ala
    835                 840                 845Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys Gln Lys Met Asn Asp
850                 855                 860Ser Met Asp Thr Ser Asn Lys Glu Glu Lys865                 870(2)INFORMATION FOR SEQ ID NO:32:信息:
(i)序列特征:
(A)长度:3323个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2559
(xi)序列描述:SEQ ID NO:32:GCCATC ATG GAG AAA GTT TCA TCT GTG GAT GGA GTA TTG GGA GGT TAT           48
   Met Glu Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr
     1               5                  10ATT CAA AAG AAA AAG GAA CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA          96Ile Gln Lys Lys Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala15                  20                  25                  30GTT GAC CTA GAT GAG ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC         144Val Asp Leu Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn
             35                  40                  45ATA GAA ATC AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT         192Ile Glu Ile Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp
         50                  55                  60ACC AGT ACC AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT         240Thr Ser Thr Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr
     65                  70                  75GAT GTA TTG TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT         288Asp Val Leu Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu
 80                  85                  90ATA TAT TTG ACA CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT         336Ile Tyr Leu Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser95                 100                 105                 110GCA TTG GTG CTA AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG         384Ala Leu Val Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly
            115                 120                 125GAA GTA TTA CAA ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG         432Glu Val Leu Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met
        130                 135                 140CTA TGT GTC CTT GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC         480Leu Cys Val Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu
    145                 150                 155AAA GAA CCA TAT AAA ACA GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA         528Lys Glu Pro Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg
160                 165                 170ACA CCC AGG CGA GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA         576Thr Pro Arg Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu175                 180                 185                 190GAA AAT GAT ACA AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT         624Glu Asn Asp Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys
            195                 200                 205AAT ATA GAT GAG GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT         672Asn Ile Asp Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe
        210                 215                 220ATG AAT TCT CTT GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA         720Met Asn Ser Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu
    225                 230                 235AAT CTT TCT AAA CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA         768Asn Leu Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu
240                 245                 250GAT GCA AGA TTA TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT         816Asp Ala Arg Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser255                 260                 265                 270ATA GAC AGT TTT GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT         864Ile Asp Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp
            275                 280                 285GAA GAG GTG AAT GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG         912Glu Glu Val Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met
        290                 295                 300AAC ACT ATC CAA CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA         960Asn Thr Ile Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln
    305                 310                 315CCT TCA GAA AAT CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA        1008Pro Ser Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro
320                 325                 330AAA GAA AGT ATA CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA        1056Lys Glu Ser Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys335                 340                 345                 350GAG AAA TTT GCT AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA       1104Glu Lys Phe Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser
            355                 360                 365CAG CGA TAC AAA CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC       1152Gln Arg Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser
        370                 375                 380ATG CTT AAA TCA GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA       1200Met Leu Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys
    385                 390                 395CTT CTG AAT GAC AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT       1248Leu Leu Asn Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu
400                 405                 410GAG GTT GTA ATG GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT       1296Glu Val Val Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp415                 420                 425                 430TCT GGA ACA GAT TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA       1344Ser Gly Thr Asp Leu Ser Phe Pro Trp Ile Leu Asn Vel Leu Asn Leu
            435                 440                 445AAA GCC TTT GAT TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA       1392Lys Ala Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu
        450                 455                 460GGC AAC TTG ACA AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT       1440Gly Asn Leu Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His
    465                 470                 475CGA ATC ATG GAA TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT       1488Arg Ile Met Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp
480                 485                 490CTT ATT AAA CAA TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA       1536Leu Ile Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu495                 500                 505                 510TCT GCT TGT CCT CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA       1584Ser Ala Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ale Ale
            515                 520                 525GAT ATG TAT CTT TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT       1632Asp Met Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr
        530                 535                 540ACG CGT GTA AAT TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC       1680Thr Arg Val Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala
    545                 550                 555TTC CAG ACC CAG AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT       1728Phe Gln Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr
560                 565                 570AAA AAA GTG TAT CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA         1776Lys Lys Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu575                 580                 585                 590CGC CTT CTG TCT GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT         1824Arg Leu Leu Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu
            595                 600                 605TTC CAG CAC ACC CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT         1872Phe Gln His Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His
        610                 615                 620TTG GAC CAA ATT ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG         1920Leu Asp Gln Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys
    625                 630                 635AAT ATA GAC CTT AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT         1968Asn Ile Asp Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu
640                 645                 650CCT CAT GCT GTT CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG         2016Pro His Ala Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu655                 660                 665                 670GAG TAT GAT TCT ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA         2064Glu Tyr Asp Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg
            675                 680                 685CTG AAA ACA AAT ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG         2112Leu Lys Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu
        690                 695                 700TCA CCA ATA CCT CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA         2160Ser Pro Ile Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser
    705                 710                 715CCc TTA CGG ATT CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT         2208Pro Leu Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser
720                 725                 730CCA TAT AAA ATT TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA         2256Pro Tyr Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro735                 740                 745                 750AGA TCA AGA ATC TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG         2304Arg Ser Arg Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu
            755                 760                 765AAG TTC CAG AAA ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC         2352Lys Phe Gln Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu
        770                 775                 780AAA AGA AGT GCT GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA         2400Lys Arg Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu
    785                 790                 795CGC TTT GAT ATT GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC      2448Arg Phe Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu
800                 805                 810CCA GGA GAG TCC AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT      2496Pro Gly Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr815                 820                 825                 830CGA ACA CGA ATG CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA      2544Arg Thr Arg Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser
            835                 840                 845AAC AAG GAA GAG AAA TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT      2599Asn Lys Glu Glu Lys
        850GGATTCATTG TCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC    2659ATTTAATATC TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA    2719TTCCTAAGCC ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA    2779AATCCTGCCA TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG    2839CTTTATGGAT AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC    2899TACTTTGCCT TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT    2959GTATATTTTT TTAATTTAAC ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA    3019TGCAATTTGA TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT    3079ATTATTAGAA ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG    3139AATCTGATAT ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA    3199AGCAAAGTAT AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG    3259TAAAAGAACT TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA    3319TAGT                                                                 3323(2)INFORMATION FOR SEQ ID NO:33:信息:
(i)序列特征:
(A)长度:851个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:33:Met Glu Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln1               5                  10                  15Lys Lys Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp
         20                  25                  30Leu Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu
     35                  40                  45Ile Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser
 50                  55                  60Thr Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val65                  70                  75                  80Leu Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr
             85                  90                  95Leu Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu
        100                 105                 110Val Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val
    115                 120                 125Leu Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys
130                 135                 140Val Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu145                 150                 155                 160Pro Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro
            165                 170                 175Arg Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn
        180                 185                 190Asp Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile
    195                 200                 205Asp Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn
210                 215                 220Ser Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu225                 230                 235                 240Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala
            245                 250                 255Arg Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp
        260                 265                 270Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu
    275                 280                 285Val Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr
290                 295                 300Ile Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser305                 310                 315                 320Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu
            325                 330                 335Ser Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys
        340                 345                 350Phe Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg
    355                 360                 365Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu
370                 375                 380Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu385                 390                 395                 400Asn Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val
            405                 410                 415Val Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly
        420                 425                 430Thr Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala
    435                 440                 445Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn
450                 455                 460Leu Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile465                 470                 475                 480Met Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile
            485                 490                 495Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala
        500                 505                 510Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met
    515                 520                 525Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg
530                 535                 540Val Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln545                 550                 555                 560Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys
            565                 570                 575Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu
        580                 585                 590Leu Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln
    595                 600                 605His Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp
610                 615                 620Gln Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile625                 630                 635                 640Asp Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His
            645                 650                 655Ala Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr
        660                 665                 670Asp Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys
    675                 680                 685Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro
690                 695                 700Ile Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu705                 710                 715                 720Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr
            725                 730                 735Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser
        740                 745                 750Arg Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe
    755                 760                 765Gln Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg
770                 775                 780Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe785                 790                 795                 800Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly
            805                 810                 815Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr
        820                 825                 830Arg Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys
    835                 840                 845Glu Glu Lys
850(2)INFORMATION FOR SEQ ID NO:34:信息:
(i)序列特征:
(A)长度:3266个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2502
(xi)序列描述:SEQ ID NO:34:GCCATC ATG CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA          48
   Met Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu
     1               5                  10GAT GAG ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC ATA GAA ATC         96Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile15                  20                  25                  30AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT ACC AGT ACC        144Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr
             35                  40                  45AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG        192Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu
         50                  55                  60TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG        240Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu
     65                  70                  75ACA CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT GCA TTG GTG        288Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val
 80                  85                  90CTA AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA        336Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu95                 100                 105                 110CAA ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC        384Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val
            115                 120                 125CTT GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA        432Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro
        130                 135                 140TAT AAA ACA GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG        480Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg
    145                 150                 155CGA GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT        528Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp
160                 165                 170ACA AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT        576Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp175                 180                 185                 190GAG GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT        624Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser
            195                 200                 205CTT GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT        672Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser
        210                 215                 220AAA CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA        720Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg
    225                 230                 235TTA TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT        768Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser
240                 245                 250TTT GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG        816Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val255                 260                 265                 270AAT GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC        864Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile
            275                 280                 285CAA CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA        912Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu
        290                 295                 300AAT CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT        960Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser
    305                 310                 315ATA CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT       1008Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe
320                 325                 330GCT AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC       1056Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr335                 340                 345                 350AAA CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA       1104Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys
            355                 360                 365TCA GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT       1152Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn
        370                 375                 380GAC AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA       1200Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val
    385                 390                 395ATG GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA         1248Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr
400                 405                 410GAT TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT         1296Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe415                 420                 425                 430GAT TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG         1344Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu
            435                 440                 445ACA AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG         1392Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met
        450                 455                 460GAA TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA         1440Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys
    465                 470                 475CAA TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT         1488Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys
480                 485                 490CCT CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT         1536Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Mer Tyr495                 500                 505                 510CTT TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA         1584Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val
            515                 520                 525AAT TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC         1632Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr
        530                 535                 540CAG AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG         1680Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val
    545                 550                 555TAT CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG         1728Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu
560                 565                  570TCT GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC         1776Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His575                 580                 585                 590ACC CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA         1824Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln
            595                 600                 605ATT ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC         1872Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp
        610                 615                 620CTT AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT        1920Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala
    625                 630                 635GTT CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT        1968Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp
640                 645                 650TCT ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA        2016Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr655                 660                 665                 670AAT ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA        2064Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile
            675                 680                 685CCT CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG        2112Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg
        690                 695                 700ATT CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA        2160Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys
    705                 710                 715ATT TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA        2208Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg
720                 725                 730ATC TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG        2256Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln735                 740                 745                 750AAA ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT        2304Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser
            755                 760                 765GCT GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT        2352Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp
        770                 775                 780ATT GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG        2400Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu
    785                 790                 795TCC AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA        2448Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg
800                 805                 810ATG CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA        2496Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu815                 820                 825                 830GAG AAA TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG         2552Glu LysTCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC             2612TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC             2672ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA             2732TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT             2792AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT             2852TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT GTATATTTTT             2912TTAATTTAAC ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA             2972TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA             3032ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT             3092ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT             3152AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG TAAAAGAACT             3212TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA TAGT                   3266(2) INFORMATION FOR SEQ ID NO:35:信息:
(i)序列特征:
(A)长度:832个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:35:Met Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Asp Glu1               5                  10                  15Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val
         20                  25                  30His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val
     35                  40                  45Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala
 50                  55                  60Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln65                  70                  75                  80Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys
             85                  90                  95Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met
        100                 105                 110Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp
    115                 120                 125Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys
130                 135                 140Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly145                 150                 155                 160Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg
            165                 170                 175Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val
        180                 185                 190Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly
    195                 200                 205Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg
210                 215                 220Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe225                 230                 235                 240Leu Asp His Asp Lys Thr Leu Gln Tnr Asp Ser Ile Asp Ser Phe Glu
            245                 250                 255Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val
        260                 265                 270Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln
    275                 280                 285Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu
290                 295                 300Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu305                 310                 315                 320Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys
            325                 330                 335Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu
        340                 345                 350Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu
    355                 360                 365Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn
    370             375                 380Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala385                 390                 395                 400Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu
             405                410                 415Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe
        420                 425                 430Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg
    435                 440                 445Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser
450                 455                 460Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser465                 470                 475                 480Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu
            485                 490                 495Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser
        500                 505                 510Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser
    515                 520                 525Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys
530                 535                 540Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg545                 550                 555                 560Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu
            565                 570                 575His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu
        580                 585                 590Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met
    595                 600                 605Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys
610                 615                 620Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln625                 630                 635                 640Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile
            645                 650                 655Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile
        660                 665                 670Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His
    675                 680                 685Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro
690                 695                 700Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser705                 710                 715                 720Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu
            725                 730                 735Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile
        740                 745                 750Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu
    755                 760                 765Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu
770                 775                 780Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys785                 790                 795                 800Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln
            805                 810                 815Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
        820                 825                 830(2)INFORMATION FOR SEQ ID NO:36:信息:
(i)序列特征:
(A)长度:3113个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2349
(xi)序列描述:SEQ ID NO:36:GCCGTC ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG TTT GCA CTC           48
   Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala Leu
     1               5                  10TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG ACA CAA CCC          96Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln Pro15                  20                  25                  30AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT GCA TTG GTG CTA AAA GTT         144Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys Val
             35                  40                  45TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA CAA ATG GAA         192Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met Glu
         50                  55                  60GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC CTT GAC TAT         240Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp Tyr
     65                  70                  75TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA TAT AAA ACA          288Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys Thr
 80                  85                  90GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG CGA GGT CAG          336Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln95                 100                 105                 110AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT ACA AGA ATT          384Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile
            115                 120                 125ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT GAG GTG AAA          432Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val Lys
        130                 135                 140AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT CTT GGA CTT          480Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu
    145                 150                 155GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT AAA CGA TAC          528Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr
160                 165                 170GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA TTA TTT TTG          576Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu175                 180                 185                 190GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT TTT GAA ACA          624Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr
            195                 200                 205CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG AAT GTA ATT          672Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile
        210                 215                 220CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC CAA CAA TTA          720Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu
    225                 230                 235ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA AAT CTG ATT          768Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile
240                 245                 250TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT ATA CTG AAA          816Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys255                 260                 265                 270AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT GCT AAA GCT          864Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala
            275                 280                 285GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC AAA CTT GGA         912Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly
        290                 295                 300GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA TCA GAA GAA         960Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu
    305                 310                 315GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT GAC AAC ATT        1008Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile
320                 325                 330TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA ATG GCC ACA        1056Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr335                 340                 345                 350TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA GAT TTG TCT        1104Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser
            355                 360                 365TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT GAT TTT TAC        1152Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr
        370                 375                 380AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG ACA AGA GAA        1200Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu
    385                 390                 395ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG GAA TCC CTT        1248Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu
400                 405                 410GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA CAA TCA AAG        1296Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys415                 420                 425                 430GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT CCT CTT AAT        1344Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn
            435                 440                 445CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT CTT TCT CCT        1392Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro
        450                 455                 460GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA AAT TCT ACT        1440Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr
    465                 470                 475GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC CAG AAG CCA        1488Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro
480                 485                 490TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG TAT CGG CTA        1536Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu495                 500                 505                 510GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG TCT GAG CAC        1584Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His
            515                 520                 525CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC ACC CTG CAG         1632Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln
        530                 535                 540AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA ATT ATG ATG         1680Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met Met
    545                 550                 555TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC CTT AAA TTC         1728Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe
560                 565                 570AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT GTT CAG GAG         1776Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu575                 580                 585                 590ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT TCT ATT ATA         1824Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile
            595                 600                 605GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA AAT ATT TTG         1872Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu
        610                 615                 620CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA CCT CAC ATT         1920Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile
    625                 630                 635CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG ATT CCT GGA         1968Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly
640                 645                 650GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA ATT TCA GAA         2016Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu655                 660                 665                 670GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA ATC TTA GTA         2064Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu Val
            675                 680                 685TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG AAA ATA AAT         2112Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn
        690                 695                 700CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT GCT GAA GGA         2160Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly
    705                 710                 715AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT ATT GAA GGA         2208Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly
720                 725                 730TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG TCC AAA TTT         2256Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu ser Lys Phe735                 740                 745                 750CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA ATG CAA AAG               2304Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys
            755                 760                 765CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA GAG AAA                   2349Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
        770                 775                 780TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG TCTCTCACAG             2409ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC TTCAGCTCTT             2469TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC ACTTGAAATG             2529TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA TTTAAAAAGT             2589TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT AGTAAGAATG             2649GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT TCTTTTGTAG             2709CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT GTATATTTTT TTAATTTAAC             2769ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA TTGACTGCCC             2829ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA ATTAGAAAAA             2889AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT ACTGTGTGCT             2949TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT AACCATATGA             3009TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG TAAAAGAACT TACTGATTAT             3069TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA TAGT                              3113(2)INFORMATION FOR SEQ ID NO:37:信息:
(i)序列特征:
(A)长度:781个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:37:Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala Leu phe Ser1               5                  10                  15Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln Pro Ser Ser
         20                  25                  30Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys Val Ser Trp
     35                  40                  45Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met Glu Asp Asp
 50                  55                  60Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp Tyr Phe Ile65                  70                  75                  80Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys Thr Ala Val
             85                  90                  95Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln Asn Arg
        100                 105                 110Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile Ile Glu
    115                 120                 125Val Leu Cys Lys Glu H1s Glu Cys Asn Ile Asp Glu Val Lys Asn Val
130                 135                 140Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu Val Thr145                 150                 155                 160Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu
            165                 170                 175Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu Asp His
        180                 185                 190Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg
    195                 200                 205Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile Pro Pro
210                 215                 220His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu Met Met225                 230                 235                 240Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr
            245                 250                 255Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys Arg Val
        260                 265                 270Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala Val Gly
    275                 280                 285Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg
290                 295                 300Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu Glu Arg305                 310                 315                 320Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile Phe His
            325                 330                 335Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr Tyr Ser
        340                 345                 350Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro
    355                 360                 365Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val
370                 375                 380Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu Met Ile385                 390                 395                 400Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu Ala Trp
            405                 410                 415Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg
        420                 425                 430Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro
    435                 440                 445Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro Val Arg
450                 455                 460Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr Ala Asn465                 470                 475                 480Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro Leu Lys
            485                 490                 495Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr
        500                 505                 510Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His Pro Glu
    515                 520                 525Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln Asn Glu
530                 535                 540Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met Met Cys Ser545                 550                 555                 560Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe Lys Ile
            565                 570                 575Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu Thr Phe
        580                 585                 590Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe
    595                 600                 605Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr
610                 615                 620Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile Pro Arg625                 630                 635                 640Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn
            645                 650                 655Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu
        660                 665                 670Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu Val Ser Ile
    675                 680                 685Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn Gln Met
690                 695                 700Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly Ser Asn705                 710                 715                 720Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp
            725                 730                 735Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys Phe Gln Gln
        740                 745                 750Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys Gln Lys
    755                 760                 765Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
770                 775                 780(2)INFORMATION FOR SEQ ID NO:38:信息:
(i)序列特征:
(A)长度:3323个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2559
(xi)序列描述:SEQ ID NO:38:CGCGTC ATG CCG CCC AAA ACC CCC CGA AAA ACG GCC GCC ACC GCC GCC     48
   Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala
     1               5                  10GCT GCC GCC GCG GAA CCC CCG GCA CCG CCG CCG CCG CCC CCT CCT GAG    96Ala Ala Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu15                  20                  25                  30GTC GAC CTA GAT GAG ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC         144Val Asp Leu Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn
             35                  40                  45ATA GAA ATC AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT         192Ile Glu Ile Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp
         50                  55                  60ACC AGT ACC AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT         240Thr Ser Thr Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr
     65                  70                  75GAT GTA TTG TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT         288Asp Val Leu Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu
 80                  85                  90ATA TAT TTG ACA CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT         336Ile Tyr Leu Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser95                 100                 105                 110GCA TTG GTG CTA AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG         384Ala Leu Val Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly
            115                 120                 125GAA GTA TTA CAA ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG         432Glu Val Leu Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met
        130                 135                 140CTA TGT GTC CTT GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC         480Leu Cys Val Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu
    145                 150                 155AAA GAA CCA TAT AAA ACA GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA         528Lys Glu Pro Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg
160                 165                 170ACA CCC AGG CGA GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA         576Thr Pro Arg Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu175                 180                 185                 190GAA AAT GAT ACA AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT         624Glu Asn Asp Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys
            195                 200                 205AAT ATA GAT GAG GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT         672Asn Ile Asp Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe
        210                 215                 220ATG AAT TCT CTT GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA         720Met Asn Ser Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu
    225                 230                 235AAT CTT TCT AAA CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA         768Asn Leu Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu
240                 245                 250GAT GCA AGA TTA TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT          816Asp Ala Arg Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser255                 260                 265                 270ATA GAC AGT TTT GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT          864Ile Asp Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp
            275                  280                285GAA GAG GTG AAT GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG          912Glu Glu Val Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met
        290                 295                 300AAC ACT ATC CAA CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA          960Asn Thr Ile Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln
    305                 310                 315CCT TCA GAA AAT CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA         1008Pro Ser Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro
320                 325                 330AAA GAA AGT ATA CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA         1056Lys Glu Ser Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys335                 340                 345                 350GAG AAA TTT GCT AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA         1104Glu Lys Phe Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser
            355                 360                 365CAG CGA TAC AAA CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC         1152Gln Arg Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser
        370                 375                 380ATG CTT AAA TCA GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA         1200Met Leu Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys
    385                 390                 395CTT CTG AAT GAC AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT         1248Leu Leu Asn Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu
400                 405                 410GAG GTT GTA ATG GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT         1296Glu Val Val Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp415                 420                 425                 430TCT GGA ACA GAT TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA         1344Ser Gly Thr Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu
            435                 440                 445AAA GCC TTT GAT TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA         1392Lys Ala Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu
        450                 455                 460GGC AAC TTG ACA AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT         1440Gly Asn Leu Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His
    465                 470                 475CGA ATC ATG GAA TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT        1488Arg Ile Met Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp
480                 485                 490CTT ATT AAA CAA TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA        1536Leu Ile Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu495                 500                 505                 510TCT GCT TGT CCT CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA        1584Ser Ala Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala
            515                 520                 525GAT ATG TAT CTT TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT        1632Asp Met Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr
        530                 535                 540ACG CGT GTA AAT TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC        1680Thr Arg Val Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala
    545                 550                 555TTC CAG ACC CAG AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT        1728Phe Gln Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr
560                 565                 570AAA AAA GTG TAT CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA        1776Lys Lys Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu575                 580                 585                 590CGC CTT CTG TCT GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT        1824Arg Leu Leu Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu
            595                 600                 605TTC CAG CAC ACC CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT        1872Phe Gln His Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His
        610                 615                 620TTG GAC CAA ATT ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG        1920Leu Asp Gln Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys
    625                 630                 635AAT ATA GAC CTT AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT        1968Asn Ile Asp Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu
640                 645                 650CCT CAT GCT GTT CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG        2016Pro His Ala Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu655                 660                 665                 670GAG TAT GAT TCT ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA        2064Glu Tyr Asp Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg
            675                 680                 685CTG AAA ACA AAT ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG        2112Leu Lys Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu
        690                 695                 700TCA CCA ATA CCT CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA        2160Ser Pro Ile Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser
    705                 710                 715CCC TTA CGG ATT CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT         2208Pro Leu Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser
720                 725                 730CCA TAT AAA ATT TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA         2256Pro Tyr Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro735                 740                 745                 750AGA TCA AGA ATC TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG         2304Arg Ser Arg Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu
            755                 760                 765AAG TTC CAG AAA ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC         2352Lys Phe Gln Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu
        770                 775                 780AAA AGA AGT GCT GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA         2400Lys Arg Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu
    785                 790                 795CGC TTT GAT ATT GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC         2448Arg Phe Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu
800                 805                 810CCA GGA GAG TCC AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT         2496Pro Gly Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr815                 820                 825                 830CGA ACA CGA ATG CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA         2544Arg Thr Arg Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser
            835                 840                 845AAC AAG GAA GAG AAA TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT         2599Asn Lys Glu Glu Lys
        850GGATTCATTG TCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC       2659ATTTAATATC TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA       2719TTCCTAAGCC ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA       2779AATCCTGCCA TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG       2839CTTTATGGAT AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC       2899TACTTTGCCT TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT       2959GTATATTTTT TTAATTTAAC ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA       3019TGCAATTTGA TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT       3079ATTATTAGAA ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG             3139AATCTGATAT ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA             3199AGCAAAGTAT AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG             3259TAAAAGAACT TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA             3319TAGT                                                                          3323(2)INFORMATION FOR SEQ ID NO:39:信息:
(i)序列特征:
(A)长度:851个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:39:Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala Ala Ala1               5                  10                  15Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Val Asp
         20                  25                  30Leu Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu
     35                  40                  45Ile Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser
 50                  55                  60Thr Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val65                  70                  75                  80Leu Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr
             85                  90                  95Leu Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu
        100                 105                 110Val Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val
    115                 120                 125Leu Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys
130                 135                 140Val Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu145                 150                 155                 160Pro Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro
            165                 170                 175Arg Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn
        180                 185                 190Asp Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile
    195                 200                 205Asp Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn
210                 215                 220Ser Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu225                 230                 235                 240Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala
            245                 250                 255Arg Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp
        260                 265                 270Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu
    275                 280                 285Val Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr
290                 295                 300Ile Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser305                 310                 315                 320Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu
            325                 330                 335Ser Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys
        340                 345                 350Phe Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg
    355                 360                 365Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu
370                 375                 380Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu385                 390                 395                 400Asn Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val
            405                 410                 415Val Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly
        420                 425                 430Thr Asp Leu Ser Phe Pro Trp Ile Leu ASn Val Leu Asn Leu Lys Ala
    435                 440                 445Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn
450                 455                 460Leu Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile465                 470                 475                 480Met Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile
            485                 490                 495Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala
        500                 505                 510Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met
    515                 520                 525Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg
530                 535                 540Val Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln545                 550                 555                 560Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys
            565                 570                 575Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu
        580                 585                 590Leu Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln
    595                 600                 605His Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp
610                 615                  620Gln Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile625                 630                 635                 640Asp Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His
            645                 650                 655Ala Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr
        660                 665                 670Asp Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys
    675                 680                 685Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro
690                 695                 700Ile Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu705                 710                 715                 720Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr
            725                 730                 735Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser
        740                 745                 750Arg Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe
    755                 760                 765Gln Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg
770                 775                 780Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe785                 790                 795                 800Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly
            805                 810                 815Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr
        820                 825                 830Arg Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys
    835                 840                 845Glu Glu Lys
850(2)INFORMATION FOR SEQ ID NO:40:信息:
(i)序列特征:
(A)长度:3461个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2697
(xi)序列描述:SEQ ID NO:40:CGCGTC ATG CCG CCC AAA ACC CCC CGA AAA ACG GCC GCC ACC GCC GCC           48
   Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala
     1               5                  10GCT GCC GCC GCG GAA CCC CCG GCA CCG CCG CCG CCG CCC CCT CCT GAG          96Ala Ala Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu15                  20                  25                  30GAG GAC CCA GAG CAG GAC AGC GGC CCG GAG GAC CTG CCT CTC GTC AGG         144Glu Asp Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg
             35                  40                  45CTT GAG TTT GAA GAA ACA GAA GAA CCT GAT TTT ACT GCA TTA TGT CAG         192Leu Glu Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln
         50                  55                  60AAA TTA AAG ATA CCA GAT CAT GTC AGA GAG AGA GCT TGG TTG GTC GAC         240Lys Leu Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Val Asp
     65                  70                  75CTA GAT GAG ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC ATA GAA         288Leu Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu
 80                  85                  90ATC AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT ACC AGT         336Ile Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser95                 100                 105                 110ACC AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA         384Thr Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val
            115                 120                 125TTG TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT         432Leu Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr
        130                 135                 140TTG ACA CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT GCA TTG         480Leu Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu
        145                 150                 155GTG CTA AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA         528Val Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val
160                 165                 170TTA CAA ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT         576Leu Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys175                 180                 185                 190GTC CTT GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA         624Val Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu
            195                 200                 205CCA TAT AAA ACA GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC         672Pro Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro
        210                 215                 220AGG CGA GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT         720Arg Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn
    225                 230                 235GAT ACA AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA         768Asp Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile
240                 245                 250GAT GAG GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT         816Asp Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn255                 260                 265                 270TCT CTT GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT         864Ser Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu
            275                 280                 285TCT AAA CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA         912Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala
        290                 295                 300AGA TTA TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC         960Arg Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp
    305                 310                 315AGT TTT GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG        1008Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu
320                 325                 330GTG AAT GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT        1056Val Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr335                 340                 345                 350ATC CAA CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA        1104Ile Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser
            355                 360                 365GAA AAT CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA        1152Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu
        370                 375                 380AGT ATA CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA        1200Ser Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys
    385                 390                 395TTT GCT AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA        1248Phe Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg
400                 405                 410TAC AAA CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT        1296Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu415                 420                 425                 430AAA TCA GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG        1344Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu
            435                 440                 445AAT GAC AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT        1392Asn Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val
        450                 455                 460GTA ATG GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA        1440Val Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly
    465                 470                 475ACA GAT TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC        1488Thr Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala
480                 485                 490TTT GAT TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC        1536Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn495                 500                 505                 510TTG ACA AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC        1584Leu Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile
            515                 520                 525ATG GAA TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT        1632Met Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile
        530                 535                 540AAA CAA TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT        1680Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala
    545                 550                 555TGT CCT CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG       1728Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met
560                 565                 570TAT CTT TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT       1776Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg575                 580                 585                 590GTA AAT TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG       1824Val Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln
            595                 600                 605ACC CAG AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA       1872Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys
        610                 615                 620GTG TAT CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT       1920Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu
    625                 630                 635CTG TCT GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG       1968Leu Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln
640                 645                 650CAC ACC CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC       2016His Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp655                 660                 665                 670CAA ATT ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA       2064Gln Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile
            675                 680                 685GAC CTT AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT       2112Asp Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His
        690                 695                 700GCT GTT CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT       2160Ala Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr
    705                 710                 715GAT TCT ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA       2208Asp Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys
720                 725                 730ACA AAT ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA       2256Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro735                 740                 745                 750ATA CCT CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA       2304Ile Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu
            755                 760                 765CGG ATT CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT       2352Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr
        770                 775                 780AAA ATT TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA      2400Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser
    785                 790                 795AGA ATC TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC      2448Arg Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe
800                 805                 810CAG AAA ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA      2496Gln Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg815                 820                 825                 830AGT GCT GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT      2544Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe
            835                 840                 845GAT ATT GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA      2592Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly
        850                 855                 860GAG TCC AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA      2640Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr
    865                 870                 875CGA ATG CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG      2688Arg Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys
880                 885                 890GAA GAG AAA TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT              2737Glu Glu Lys895GGATTCATTG TCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC    2797ATTTAATATC TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA    2857TTCCTAAGCC ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA    2917AATCCTGCCA TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG    2977CTTTATGGAT AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC    3037TACTTTGCCT TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT    3097GTATATTTTT TTAATTTAAC ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA    3157TGCAATTTGA TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT    3217ATTATTAGAA ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG    3277AATCTGATAT ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA    3337AGCAAAGTAT AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG    3397TAAAAGAACT TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA    3457TAGT                                                                 3461(2)INFORMATION FOR SEQ ID NO:41:信息:
(i)序列特征:
(A)长度:897个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:41:Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala Ala Ala1               5                  10                  15Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Glu Asp
         20                  25                  30Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu
     35                  40                  45Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu
 50                  55                  60Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Val Asp Leu Asp65                  70                  75                  80Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser
             85                  90                   95Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys
        100                 105                 110Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe
    115                 120                 125Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr
130                 135                 140Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu145                 150                 155                 160Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln
            165                 170                 175Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu
        180                 185                 190Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr
    195                 200                 205Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg
210                 215                 220Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr225                 230                 235                 240Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu
            245                 250                  255Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu
        260                 265                 270Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys
    275                 280                 285Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu
290                 295                 300Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe305                 310                 315                 320Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn
            325                 330                 335Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln
        340                 345                 350Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn
    355                 360                 365Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile
370                 375                 380Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala385                 390                 395                 400Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys
            405                 410                 415Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser
        420                 425                 430Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp
    435                 440                 445Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met
450                 455                 460Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp465                 470                 475                 480Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp
            485                 490                 495Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr
        500                 505                 510Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu
    515                 520                 525Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln
530                 535                 540Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro545                 550                 555                 560Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu
            565                 570                 575Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn
        580                 585                 590Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln
    595                 600                 605Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr
610                 615                 620Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser625                 630                 635                 640Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr
            645                 650                 655Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile
        660                 665                 670Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu
    675                 680                 685Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val
690                 695                 700Gln Glu Tnr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser705                 710                 715                 720Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn
            725                 730                 735Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro
        740                 745                 750His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile
    755                 760                 765Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile
770                 775                 780Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile785                 790                 795                 800Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys
            805                 810                 815Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala
        820                 825                 830Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile
    835                 840                 845Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser
850                 855                 860Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met865                 870                 875                 880Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu
            885                 890                 895Lys(2)INFORMATION FOR SEQ ID NO:42:信息:
(i)序列特征:
(A)长度:3347个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2583
(xi)序列描述:SEQ ID NO:42:CGCGTC ATG CCG CCC AAA ACC CCC CGA AAA ACG GCC GCC ACC GCC GCC           48
   Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala
     1               5                  10GCT GCC GCC GCG GAA CCC CCG GCA CCG CCG CCG CCG CCC CCT CCT GAG          96Ala Ala Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu15                  20                  25                  30GAG GAC CCA GAG CAG GAC AGC GGC CCG GAG GAC CTG CCT CTC GTC AGG         144Glu Asp Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg
             35                  40                  45CTT GAG TTT GAA GAA ACA GAA GAA CCT GAT TTT ACT GCA TTA TGT CAG         192Leu Glu Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln
         50                  55                  60AAA TTA AAG ATA CCA GAT CAT GTC AGA GAG AGA GCT TGG TTA ACT TGG         240Lys Leu Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp
     65                  70                  75GAG AAA GTT TCA TCT GTG GAT GGA GTA TTG GGA GGT TAT ATT  CAA AAG        288Glu Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys
 80                  85                  90AAA AAG GAA CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA         336Lys Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu95                 100                 105                 110GTC GAA TCT ACT GAA ATA AAT TCT GCA TTG GTG CTA AAA GTT TCT TGG         384Val Glu Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys Val Ser Trp
            115                 120                 125ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA CAA ATG GAA GAT GAT         432Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met Glu Asp Asp
        130                 135                 140CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC CTT GAC TAT TTT ATT         480Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp Tyr Phe Ile
    145                 150                 155AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA TAT AAA ACA GCT GTT         528Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys Thr Ala Val
160                 165                 170ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG CGA GGT CAG AAC AGG         576Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln Asn Arg175                 180                 185                 190AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT ACA AGA ATT ATT GAA         624Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile Ile Glu
            195                 200                 205GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT GAG GTG AAA AAT GTT         672Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val Lys Asn Val
        210                 215                 220TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT CTT GGA CTT GTA ACA          720Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu Val Thr
    225                 230                 235TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT AAA CGA TAC GAA GAA          768Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu
240                 245                 250ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA TTA TTT TTG GAT CAT          816Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu Asp His255                 260                 265                 270GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT TTT GAA ACA CAG AGA          864Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg
            275                 280                 285ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG AAT GTA ATT CCT CCA          912Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile Pro Pro
        290                 295                 300CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC CAA CAA TTA ATG ATG          960His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu Met Met
    305                 310                 315ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA AAT CTG ATT TCC TAT         1008Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr
320                 325                 330TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT ATA CTG AAA AGA GTG         1056Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys Arg Val335                 340                 345                 350AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT GCT AAA GCT GTG GGA         1104Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala Val Gly
            355                 360                 365CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC AAA CTT GGA GTT CGC         1152Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg
        370                 375                 380TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA TCA GAA GAA GAA CGA         1200Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu Glu Arg
    385                 390                 395TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT GAC AAC ATT TTT CAT         1248Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile Phe H1s
400                 405                 410ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA ATG GCC ACA TAT AGC         1296Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr Tyr Ser415                 420                 425                 430AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA GAT TTG TCT TTC CCA         1344Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro
            435                 440                 445TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT GAT TTT TAC AAA GTG        1392Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val
        450                 455                 460ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG ACA AGA GAA ATG ATA        1440Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu Met Ile
    465                 470                 475AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG GAA TCC CTT GCA TGG        1488Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu Ala Trp
480                 485                 490CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA CAA TCA AAG GAC CGA        1536Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg495                 500                 505                 510GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT CCT CTT AAT CTT CCT        1584Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro
            515                 520                 525CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT CTT TCT CCT GTA AGA        1632Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro Val Arg
        530                 535                 540TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA AAT TCT ACT GCA AAT        1680Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr Ala Asn
    545                 550                 555GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC CAG AAG CCA TTG AAA        1728Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro Leu Lys
560                 565                 570TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG TAT CGG CTA GCC TAT        1776Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr575                 580                 585                  590CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG TCT GAG CAC CCA GAA        1824Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His Pro Glu
            595                 600                 605TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC ACC CTG CAG AAT GAG        1872Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln Asn Glu
        610                 615                 620TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA ATT ATG ATG TGT TCC        1920Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met Met Cys Ser
    625                 630                 635ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC CTT AAA TTC AAA ATC        1968Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe Lys Ile
640                 645                 650ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT GTT CAG GAG ACA TTC        2016Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu Thr Phe655                 660                 665                 670AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT TCT ATT ATA GTA TTC        2064Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe
            675                 680                 685TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA AAT ATT TTG CAG TAT        2112Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr
        690                 695                 700GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA CCT CAC ATT CCT CGA        2160Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile Pro Arg
    705                 710                 715AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG ATT CCT GGA GGG AAC        2208Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn
720                 725                 730ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA ATT TCA GAA GGT CTG        2256Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu735                 740                 745                 750CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA ATC TTA GTA TCA ATT        2304Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu Val Ser Ile
            755                 760                 765GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG AAA ATA AAT CAG ATG        2352Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn Gln Met
        770                 775                 780GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT GCT GAA GGA AGC AAC        2400Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly Ser Asn
    785                 790                 795CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT ATT GAA GGA TCA GAT        2448Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp
800                 805                 810GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG TCC AAA TTT CAG CAG        2496Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys Phe Gln Gln815                 820                 825                 830AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA ATG CAA AAG CAG AAA        2544Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys Gln Lys
            835                 840                 845ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA GAG AAA TGAGGATCTC         2593Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
        850                 855AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG TCTCTCACAG ATGTGACTGT      2653ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC TTCAGCTCTT TTTGTGGATA      2713TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC ACTTGAAATG TTAGTCATTG      2773TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA TTTAAAAAGT TGTAGCAGAT      2833TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT AGTAAGAATG GCCCTAGAGT      2893GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT TCTTTTGTAG CATATAGGTG            2953ATGTTTGCTC TTGTTTTTAT TAATTTATAT GTATATTTTT TTAATTTAAC ATGAACACCC            3013TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA TTGACTGCCC ATTCACCAAA            3073ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA ATTAGAAAAA AATTACTAAT            3133TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT ACTGTGTGCT TGTTTTATAA            3193AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT AACCATATGA TACTATCATA            3253CTACTGAAAC AGATTTCATA CCTCAGAATG TAAAAGAACT TACTGATTAT TTTCTTCATC            3313CAACTTATGT TTTTAAATGA GGATTATTGA TAGT                                        3347(2)INFORMATION FOR SEQ ID NO:43:信息:
(i)序列特征:
(A)长度:859个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:43:Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala Ala Ala1               5                  10                  15Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Glu Asp
         20                  25                  30Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu
     35                  40                  45Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu
 50                  55                  60Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys65                  70                  75                  80Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys
             85                  90                  95Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Val Glu
        100                 105                 110Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys Val Ser Trp Ile Thr
    115                 120                 125Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met Glu Asp Asp Leu Val
130                 135                 140Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp Tyr Phe Ile Lys Leu145                 150                 155                 160Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys Thr Ala Val Ile Pro
            165                 170                 175Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln Asn Arg Ser Ala
        180                 185                 190Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile Ile Glu Val Leu
    195                 200                 205Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val Lys Asn Val Tyr Phe
210                 215                 220Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu Val Thr Ser Asn225                 230                 235                 240Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu Ile Tyr
            245                 250                 255Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu Asp His Asp Lys
        260                 265                 270Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg Thr Pro
    275                 280                 285Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile Pro Pro His Thr
290                 295                 300Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu Met Met Ile Leu305                 310                 315                 320Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr Phe Asn
            325                 330                 335Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys Arg Val Lys Asp
        340                 345                 350Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala Val Gly Gln Gly
    355                 360                 365Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg Leu Tyr
370                 375                 380Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu Glu Arg Leu Ser385                 390                 395                 400Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile Phe His Met Ser
            405                 410                 415Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr Tyr Ser Arg Ser
        420                 425                 430Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro Trp Ile
    435                 440                 445Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val Ile Glu
450                 455                 460Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu Met Ile Lys His465                 470                 475                 480Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu Ala Trp Leu Ser
            485                 490                 495Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg Glu Gly
        500                 505                 510Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro Leu Gln
    515                 520                 525Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro Val Arg Ser Pro
530                 535                 540Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr Ala Asn Ala Glu545                 550                 555                 560Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro Leu Lys Ser Thr
            565                 570                 575Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr Leu Arg
        580                 585                 590Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His Pro Glu Leu Glu
    595                 600                 605His Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln Asn Glu Tyr Glu
610                 615                 620Leu Met Arg Asp Arg His Leu Asp Gln Ile Met Met Cys Ser Met Tyr625                 630                 635                 640Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe Lys Ile Ile Val
            645                 650                 655Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu Thr Phe Lys Arg
        660                 665                 670Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe Tyr Asn
    675                 680                 685Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr Ala Ser
690                 695                 700Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile Pro Arg Ser Pro705                 710                 715                 720Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn Ile Tyr
            725                 730                 735Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu Pro Thr
        740                 745                 750Pro Thr Lys Mer Thr Pro Arg Ser Arg Ile Leu Val Ser Ile Gly Glu
    755                 760                 765Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn Gln Met Val Cys
770                 775                 780Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly Ser Asn Pro Pro785                 790                 795                 800Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp Glu Ala
            805                 810                 815Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys Phe Gln Gln Lys Leu
        820                 825                 830Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys Gln Lys Met Asn
    835                 840                 845Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
850                 855(2)INFORMATION FOR SEQ ID NO:44:信息:
(i)序列特征:
(A)长度:3161个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2397
 (xi)序列描述:SEQ ID NO:44:CGCGTC ATG CCG CCC AAA ACC CCC CGA AAA ACG GCC GCC ACC GCC GCC           48
   Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala
     1               5                  10GCT GCC GCC GCG GAA CCC CCG GCA CCG CCG CCG CCG CCC CCT CCT GAG          96Ala Ala Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu15                  20                  25                  30GAG GAC CCA GAG CAG GAC AGC GGC CCG GAG GAC CTG CCT CTC GTC AGG         144Glu Asp Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg
             35                  40                  45CTT GAG TTT GAA GAA ACA GAA GAA CCT GAT TTT ACT GCA TTA TGT CAG         192Leu Glu Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln
         50                  55                  60AAA TTA AAG ATA CCA GAT CAT GTC AGA GAG AGA GCT TGG TTA ACT TGG         240Lys Leu Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp
     65                  70                  75GAG AAA GTT TCA TCT GTG GAT GGA GTA TTG GGA GGT TAT ATT CAA AAG         288Glu Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys
 80                  85                  90AAA AAG GAA CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA        336Lys Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu95                 100                 105                 110GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG CGA GGT CAG        384Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln
            115                 120                 125AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT ACA AGA ATT        432Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile
        130                 135                 140ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT GAG GTG AAA        480Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val Lys
    145                 150                 155AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT CTT GGA CTT        528Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu
160                 165                 170GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT AAA CGA TAC        576Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr175                 180                 185                 190GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA TTA TTT TTG        624Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu
            195                 200                 205GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT TTT GAA ACA        672Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr
        210                 215                 220CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG AAT GTA ATT        720Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile
    225                 230                 235CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC CAA CAA TTA        768Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu
240                 245                 250ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA AAT CTG ATT        816Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile255                 260                 265                 270TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT ATA CTG AAA        864Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys
            275                 280                 285AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT GCT AAA GCT        912Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala
        290                 295                 300GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC AAA CTT GGA        960Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly
    305                 310                 315GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA TCA GAA GAA       1008Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu
320                 325                 330GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT GAC AAC ATT       1056Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile335                 340                 345                 350TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA ATG GCC ACA       1104Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr
            355                 360                 365TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA GAT TTG TCT       1152Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser
        370                 375                 380TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT GAT TTT TAC       1200Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr
    385                 390                 395AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG ACA AGA GAA       1248Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu
400                 405                 410ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG GAA TCC CTT       1296Mer Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu415                 420                 425                 430GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA CAA TCA AAG       1344Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys
            435                 440                 445GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT CCT CTT AAT       1392Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn
        450                 455                 460CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT CTT TCT CCT       1440Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro
    465                 470                 475GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA AAT TCT ACT       1488Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr
480                 485                 490GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC CAG AAG CCA       1536Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro495                 500                 505                 510TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG TAT CGG CTA       1584Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu
            515                 520                 525GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG TCT GAG CAC       1632Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His
        530                 535                 540CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC ACC CTG CAG        1680Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln
    545                 550                 555AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA ATT ATG ATG        1728Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met Met
560                 565                 570TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC CTT AAA TTC        1776Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe575                 580                 585                 590AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT GTT CAG GAG        1824Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu
            595                 600                 605ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT TCT ATT ATA        1872Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile
        610                 615                 620GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA AAT ATT TTG        1920Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu
    625                 630                 635CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA CCT CAC ATT        1968Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile
640                 645                 650CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG ATT CCT GGA        2016Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly655                 660                 665                 670GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA ATT TCA GAA        2064Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu
            675                 680                 685GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA ATC TTA GTA        2112Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu Val
        690                 695                 700TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG AAA ATA AAT        2160Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn
    705                 710                 715CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT GCT GAA GGA        2208Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly
720                 725                 730AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT ATT GAA GGA        2256Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly735                 740                 745                 750TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG TCC AAA TTT        2304Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys Phe
            755                 760                 765CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA ATG CAA AAG        2352Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys
        770                 775                 780CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA GAG AAA            2397Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
    785                 790                 795TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG TCTCTCACAG      2457ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC TTCAGCTCTT      2517TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC ACTTGAAATG      2577TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA TTTAAAAAGT      2637TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT AGTAAGAATG      2697GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT TCTTTTGTAG      2757CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT GTATATTTTT TTAATTTAAC      2817ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA TTGACTGCCC      2877ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA ATTAGAAAAA      2937AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT ACTGTGTGCT      2997TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT AACCATATGA      3057TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG TAAAAGAACT TACTGATTAT      3117TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA TAGT                       3161(2)INFORMATION FOR SEQ ID NO:45:信息:
(i)序列特征:
(A)长度:797个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:45:Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala Ala Ala1               5                  10                  15Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Glu Asp
         20                  25                  30Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu
     35                  40                  45Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu
 50                  55                  60Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys65                 70                   75                  80Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys
             85                  90                 95Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Ala Val
        100                 105                 110Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly Gln Asn Arg
    115                 120                 125Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg Ile Ile Glu
130                 135                 140Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val Lys Asn Val145                 150                 155                 160Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly Leu Val Thr
            165                 170                 175Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu
        180                 185                 190Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu Asp His
    195                 200                 205Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg
210                 215                 220Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val Ile Pro Pro225                 230                 235                 240His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln Leu Met Met
            245                 250                 255Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr
        260                 265                 270Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu Lys Arg Val
    275                 280                 285Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala Val Gly
290                 295                 300Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg305                 310                 315                 320Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu Glu Glu Arg
            325                 330                 335Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile Phe His
        340                 345                 350Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala Thr Tyr Ser
    355                 360                 365Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro
370                 375                 380Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val385                 390                 395                 400Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu Met Ile
            405                 410                 415Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser Leu Ala Trp
        420                 425                 430Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg
    435                 440                 445Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro
450                 455                 460Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser Pro Val Arg465                 470                 475                 480Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser Thr Ala Asn
            485                 490                 495Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro Leu Lys
        500                 505                 510Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr
    515                 520                 525Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu His Pro Glu
530                 535                 540Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu Gln Asn Glu545                 550                 555                 560Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met Met Cys Ser
            565                 570                 575Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys Phe Lys Ile
        580                 585                 590Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln Glu Thr Phe
    595                 600                 605Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe
610                 615                 620Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr625                 630                 635                 640Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His Ile Pro Arg
            645                 650                 655Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn
        660                 665                 670Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu
    675                 680                 685Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu Val Ser Ile
690                 695                 700Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn Gln Met705                 710                 715                 720Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu Gly Ser Asn
            725                 730                 735Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp
        740                 745                 750Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys Phe Gln Gln
    755                 760                 765Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln Lys Gln Lys
770                 775                 780Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys785                 790                 795(2)INFORMATION FOR SEQ ID NO:46:信息:
(i)序列特征:
(A)长度:3377个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2613
(xi)序列描述:SEQ ID NO:46:CGCGTC ATG CCG CCC AAA ACC CCC CGA AAA ACG GCC GCC ACC GCC GCC    48
   Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala
     1               5                  10GCT GCC GCC GCG GAA CCC CCG GCA CCG CCG CCG CCG CCC CCT CCT GAG          96Ala Ala Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu15                  20                  25                  30GAG GAC CCA GAG CAG GAC AGC GGC CCG GAG GAC CTG CCT CTC GTC AGG         144Glu Asp Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg
             35                  40                  45CTT GAG TTT GAA GAA ACA GAA GAA CCT GAT TTT ACT GCA TTA TGT CAG         192Leu Glu Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln
         50                  55                  60AAA TTA AAG ATA CCA GAT CAT GTC AGA GAG AGA GCT TGG TTA ACT TGG         240Lys Leu Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp
     65                  70                  75GAG AAA GTT TCA TCT GTG GAT GGA GTA TTG GGA GGT TAT ATT CAA AAG         288Glu Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys
 80                  85                  90AAA AAG GAA CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA         336Lys Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu95                 100                 105                 110GAT GAG ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC ATA GAA ATC         384Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile
            115                 120                 125AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT ACC AGT ACC         432Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr
        130                 135                 140AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG         480Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu
    145                 150                 155TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG         528Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu
160                 165                 170ACA CAA CCC AGC AGT TCG ATG GTC GCT GTT ATA CCC ATT AAT GGT TCA         576Thr Gln Pro Ser Ser Ser Met Val Ala Val Ile Pro Ile Asn Gly Ser175                 180                 185                 190CCT CGA ACA CCC AGG CGA GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA         624Pro Arg Thr Pro Arg Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys
            195                 200                 205CAA CTA GAA AAT GAT ACA AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT         672Gln Leu Glu Asn Asp Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His
        210                 215                 220GAA TGT AAT ATA GAT GAG GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA         720Glu Cys Asn Ile Asp Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile
    225                 230                 235CCT TTT ATG AAT TCT CTT GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG         768Pro Phe Met Asn Ser Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu
240                 245                 250GTT GAA AAT CTT TCT AAA CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA         816Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys255                 260                 265                 270GAT CTA GAT GCA AGA TTA TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT         864Asp Leu Asp Ala Arg Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr
            275                 280                 285GAT TCT ATA GAC AGT TTT GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC         912Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn
        290                 295                 300CTT GAT GAA GAG GTG AAT GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT         960Leu Asp Glu Glu Val Asn Val Ile Pro Pro His Thr Pro Val Arg Thr
    305                 310                 315GTT ATG AAC ACT ATC CAA CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT        1008Val Met Asn Thr Ile Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser
320                 325                 330GAT CAA CCT TCA GAA AAT CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG        1056Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val335                 340                 345                 350AAT CCA AAA GAA AGT ATA CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC        1104Asn Pro Lys Glu Ser Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile
            355                 360                 365TTT AAA GAG AAA TTT GCT AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT        1152Phe Lys Glu Lys Phe Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile
        370                 375                 380GGA TCA CAG CGA TAC AAA CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG        1200Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met
    385                 390                 395GAA TCC ATG CTT AAA TCA GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT        1248Glu Ser Met Leu Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe
400                 405                 410AGC AAA CTT CTG AAT GAC AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC        1296Ser Lys Leu Leu Asn Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys415                 420                 425                 430GCT CTT GAG GTT GTA ATG GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT        1344Ala Leu Glu Val Val Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn
            435                 440                 445CTT GAT TCT GGA ACA GAT TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT        1392Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu
        450                 455                460AAT TTA AAA GCC TTT GAT TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA       1440Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys
    465                 470                 475GCA GAA GGC AAC TTG ACA AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT       1488Ala Glu Gly Asn Leu Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys
480                 485                 490GAA CAT CGA ATC ATG GAA TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA       1536Glu His Arg Ile Met Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu495                 500                 505                 510TTT GAT CTT ATT AAA CAA TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC       1584Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His
            515                 520                 525CTT GAA TCT GCT TGT CCT CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT       1632Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr
        530                 535                 540GCA GCA GAT ATG TAT CTT TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT       1680Ala Ala Asp Met Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly
    545                 550                 555TCA ACT ACG CGT GTA AAT TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC       1728Ser Thr Thr Arg Val Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr
560                 565                 570TCA GCC TTC CAG ACC CAG AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG       1776Ser Ala Phe Gln Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu575                 580                 585                 590TTT TAT AAA AAA GTG TAT CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT       1824Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu
            595                 600                 605TGT GAA CGC CTT CTG TCT GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG       1872Cys Glu Arg Leu Leu Ser Glu His Pro Glu Leu Glu His Ile Ile Trp
        610                 615                 620ACC CTT TTC CAG CAC ACC CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC       1920Thr Leu Phe Gln His Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp
    625                 630                 635AGG CAT TTG GAC CAA ATT ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA       1968Arg His Leu Asp Gln Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys
640                 645                 650GTG AAG AAT ATA GAC CTT AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG       2016Val Lys Asn Ile Asp Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys655                 660                 665                 670GAT CTT CCT CAT GCT GTT CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA        2064Asp Leu Pro His Ala Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys
            675                 680                 685GAA GAG GAG TAT GAT TCT ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG        2112Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met
        690                 695                 700CAG AGA CTG AAA ACA AAT ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT        2160Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro
    705                 710                 715ACC TTG TCA CCA ATA CCT CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT        2208Thr Leu Ser Pro Ile Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro
720                 725                 730AGT TCA CCC TTA CGG ATT CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG        2256Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu735                 740                 745                 750AAG AGT CCA TAT AAA ATT TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG        2304Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met
            755                 760                 765ACT CCA AGA TCA AGA ATC TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT        2352Thr Pro Arg Ser Arg Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr
        770                 775                 780TCT GAG AAG TTC CAG AAA ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT        2400Ser Glu Lys Phe Gln Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg
    785                 790                 795GTG CTC AAA AGA AGT GCT GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA        2448Val Leu Lys Arg Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys
800                 805                 810AAA CTA CGC TTT GAT ATT GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA        2496Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys815                 820                 825                 830CAT CTC CCA GGA GAG TCC AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT        2544His Leu Pro Gly Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr
            835                 840                 845TCT ACT CGA ACA CGA ATG CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT        2592Ser Thr Arg Thr Arg Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp
        850                 855                 860ACC TCA AAC AAG GAA GAG AAA TGAGGATCTC AGGACCTTGG TGGACACTGT           2643Thr Ser Asn Lys Glu Glu Lys
    865GTACACCTCT GGATTCATTG TCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT      2703TTATGGCCAC ATTTAATATC TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT      2763GTTTGGGTGA TTCCTAAGCC ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA           2823ATCTTGTGTA AATCCTGCCA TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA           2883AATTGCTGTG CTTTATGGAT AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG           2943CCTGTCTGAC TACTTTGCCT TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT           3003TAATTTATAT GTATATTTTT TTAATTTAAC ATGAACACCC TTAGAAAATG GTCCTATCT            3063ATCTTCCAAA TGCAATTTGA TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC           3123AAAAATGGAT ATTATTAGAA ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT           3183TTACTATTGG AATCTGATAT ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT           3243AAAAGCTGGA AGCAAAGTAT AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA           3303CCTCAGAATG TAAAAGAACT TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA           3363GGATTATTGA TAGT                                                             3377(2)INFORMATION FOR SEQ ID NO:47:信息:
(i)序列特征:
(A)长度:869个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:47:Met Pro Pro Lys Thr Pro Arg Lys Tnr Ala Ala Thr Ala Ala Ala Ala1               5                  10                  15Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Glu Asp
         20                  25                  30Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu
     35                  40                  45Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu
 50                  55                  60Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys65                  70                  75                  80Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys
             85                  90                  95Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Asp Glu
        100                 105                 110Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val
    115                 120                 125His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val
130                 135                 140Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala145                 150                 155                 160Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln
            165                 170                 175Pro Ser Ser Ser Met Val Ala Val Ile Pro Ile Asn Gly Ser Pro Arg
        180                 185                 190Thr Pro Arg Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu
    195                 200                 205Glu Asn Asp Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys
210                 215                 220Asn Ile Asp Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe225                 230                 235                 240Met Asn Ser Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu
            245                 250                 255Asn Leu Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu
        260                 265                 270Asp Ala Arg Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser
    275                 280                 285Ile Asp Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp
290                 295                 300Glu Glu Val Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met305                 310                 315                 320Asn Thr Ile Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln
            325                 330                 335Pro Ser Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro
        340                 345                 350Lys Glu Ser Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys
    355                 360                 365Glu Lys Phe Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser
370                 375                 380Gln Arg Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser385                 390                 395                 400Met Leu Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys
            405                 410                 415Leu Leu Asn Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu
        420                 425                 430Glu Val Val Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp
    435                 440                 445Ser Gly Thr Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu
450                 455                 460Lys Ala Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu465                 470                 475                 480Gly Asn Leu Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His
            485                 490                 495Arg Ile Met Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp
        500                 505                 510Leu Ile Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu
    515                 520                 525Ser Ala Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala
530                 535                 540Asp Met Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr545                 550                 555                 560Thr Arg Val Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala
            565                 570                 575Phe Gln Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr
        580                 585                 590Lys Lys Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu
    595                 600                 605Arg Leu Leu Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu
610                 615                 620Phe Gln His Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His625                 630                 635                 640Leu Asp Gln Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys
            645                 650                 655Asn Ile Asp Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu
        660                 665                 670Pro His Ala Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu
    675                 680                 685Glu Tyr Asp Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg
690                 695                 700Leu Lys Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu705                 710                 715                 720Ser Pro Ile Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser
            725                 730                 735Pro Leu Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser
        740                 745                 750Pro Tyr Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro
    755                 760                 765Arg Ser Arg Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu
770                 775                 780Lys Phe Gln Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu785                 790                 795                 800Lys Arg Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu
            805                 810                 815Arg Phe Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu
        820                 825                 830Pro Gly Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr
    835                 840                  845Arg Thr Arg Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser
850                 855                 860Asn Lys Glu Glu Lys865(2)INFORMATION FOR SEQ ID NO:48:信息:
(i)序列特征:
(A)长度:3383个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2619
(xi)序列描述:SEQ ID NO:48:CGCGTC ATG CCG CCC AAA ACC CCC CGA AAA ACG GCC GCC ACC GCC GCC            48
   Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala
     1               5                  10GCT GCC GCC GCG GAA CCC CCG GCA CCG CCG CCG CCG CCC CCT CCT GAG           96Ala Ala Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu15                  20                  25                  30GAG GAC CCA GAG CAG GAC AGC GGC CCG GAG GAC CTG CCT CTC GTC AGG          144Glu Asp Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg
             35                  40                  45CTT GAG TTT GAA GAA ACA GAA GAA CCT GAT TTT ACT GCA TTA TGT CAG          192Leu Glu Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln
         50                  55                  60AAA TTA AAG ATA CCA GAT CAT GTC AGA GAG AGA GCT TGG TTA ACT TGG          240Lys Leu Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp
     65                  70                  75GAG AAA GTT TCA TCT GTG GAT GGA GTA TTG GGA GGT TAT ATT CAA AAG          288Glu Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys
 80                  85                  90AAA AAG GAA CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA          336Lys Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu95                 100                 105                 110GAT GAG ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC ATA GAA ATC          384Asp Glu Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile
            115                 120                 125AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT ACC AGT ACC         432Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr
        130                 135                 140AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG         480Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu
    145                 150                 155TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG         528Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu
160                 165                 170ACA CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT GCA TTG GTG         576Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val175                 180                 185                 190CTA AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA         624Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu
            195                 200                 205CAA ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC         672Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val
        210                 215                 220CTT GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA         720Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro
    225                 230                 235TAT AAA ACA GGG TCG AAT TCT CTT GGA CTT GTA ACA TCT AAT GGA CTT         768Tyr Lys Thr Gly Ser Asn Ser Leu Gly Leu Val Thr Ser Asn Gly Leu
240                 245                 250CCA GAG GTT GAA AAT CTT TCT AAA CGA TAC GAA GAA ATT TAT CTT AAA         816Pro Glu Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys255                 260                 265                 270AAT AAA GAT CTA GAT GCA AGA TTA TTT TTG GAT CAT GAT AAA ACT CTT         864Asn Lys Asp Leu Asp Ala Arg Leu Phe Leu Asp His Asp Lys Thr Leu
            275                 280                 285CAG ACT GAT TCT ATA GAC AGT TTT GAA ACA CAG AGA ACA CCA CGA AAA         912Gln Thr Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys
        290                 295                 300AGT AAC CTT GAT GAA GAG GTG AAT GTA ATT CCT CCA CAC ACT CCA GTT         960Ser Asn Leu Asp Glu Glu Val Asn Val Ile Pro Pro His Thr Pro Val
    305                 310                 315AGG ACT GTT ATG AAC ACT ATC CAA CAA TTA ATG ATG ATT TTA AAT TCA        1008Arg Thr Val Met Asn Thr Ile Gln Gln Leu Met Met Ile Leu Asn Ser
320                 325                 330GCA AGT GAT CAA CCT TCA GAA AAT CTG ATT TCC TAT TTT AAC AAC TGC        1056Ala Ser Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys335                 340                 345                 350ACA GTG AAT CCA AAA GAA AGT ATA CTG AAA AGA GTG AAG GAT ATA GGA        1104Thr Val Asn Pro Lys Glu Ser Ile Leu Lys Arg Val Lys Asp Ile Gly
            355                 360                 365TAC ATC TTT AAA GAG AAA TTT GCT AAA GCT GTG GGA CAG GGT TGT GTC        1152Tyr Ile Phe Lys Glu Lys Phe Ala Lys Ala Val Gly Gln Gly Cys Val
        370                 375                 380GAA ATT GGA TCA CAG CGA TAC AAA CTT GGA GTT CGC TTG TAT TAC CGA        1200Glu Ile Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg
    385                 390                 395GTA ATG GAA TCC ATG CTT AAA TCA GAA GAA GAA CGA TTA TCC ATT CAA        1248Val Met Glu Ser Met Leu Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln
400                 405                 410AAT TTT AGC AAA CTT CTG AAT GAC AAC ATT TTT CAT ATG TCT TTA TTG        1296Asn Phe Ser Lys Leu Leu Asn Asp Asn Ile Phe His Met Ser Leu Leu415                 420                 425                 430GCG TGC GCT CTT GAG GTT GTA ATG GCC ACA TAT AGC AGA AGT ACA TCT        1344Ala Cys Ala Leu Glu Val Val Met Ala Thr Tyr Ser Arg Ser Thr Ser
            435                 440                 445CAG AAT CTT GAT TCT GGA ACA GAT TTG TCT TTC CCA TGG ATT CTG AAT        1392Gln Asn Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro Trp Ile Leu Asn
        450                 455                 460GTG CTT AAT TTA AAA GCC TTT GAT TTT TAC AAA GTG ATC GAA AGT TTT        1440Val Leu Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe
    465                 470                 475ATC AAA GCA GAA GGC AAC TTG ACA AGA GAA ATG ATA AAA CAT TTA GAA        1488Ile Lys Ala Glu Gly Asn Leu Thr Arg Glu Met Ile Lys His Leu Glu
480                 485                 490CGA TGT GAA CAT CGA ATC ATG GAA TCC CTT GCA TGG CTC TCA GAT TCA        1536Arg Cys Glu His Arg Ile Met Glu Ser Leu Ala Trp Leu Ser Asp Ser495                 500                 505                 510CCT TTA TTT GAT CTT ATT AAA CAA TCA AAG GAC CGA GAA GGA CCA ACT        1584Pro Leu Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr
            515                 520                 525GAT CAC CTT GAA TCT GCT TGT CCT CTT AAT CTT CCT CTC CAG AAT AAT        1632Asp His Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn
        530                 535                 540CAC ACT GCA GCA GAT ATG TAT CTT TCT CCT GTA AGA TCT CCA AAG AAA        1680His Thr Ala Ala Asp Met Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys
    545                 550                 555AAA GGT TCA ACT ACG CGT GTA AAT TCT ACT GCA AAT GCA GAG ACA CAA        1728Lys Gly Ser Thr Thr Arg Val Asn Ser Thr Ala Asn Ala Glu Thr Gln
560                 565                 570GCA ACC TCA GCC TTC CAG ACC CAG AAG CCA TTG AAA TCT ACC TCT CTT        1776Ala Thr Ser Ala Phe Gln Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu575                 580                 585                 590TCA CTG TTT TAT AAA AAA GTG TAT CGG CTA GCC TAT CTC CGG CTA AAT        1824Ser Leu Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn
            595                 600                 605ACA CTT TGT GAA CGC CTT CTG TCT GAG CAC CCA GAA TTA GAA CAT ATC        1872Thr Leu Cys Glu Arg Leu Leu Ser Glu His Pro Glu Leu Glu His Ile
        610                 615                 620ATC TGG ACC CTT TTC CAG CAC ACC CTG CAG AAT GAG TAT GAA CTC ATG        1920Ile Trp Thr Leu Phe Gln His Thr Leu Gln Asn Glu Tyr Glu Leu Met
    625                 630                 635AGA GAC AGG CAT TTG GAC CAA ATT ATG ATG TGT TCC ATG TAT GGC ATA        1968Arg Asp Arg His Leu Asp Gln Ile Met Met Cys Ser Met Tyr Gly Ile
640                 645                 650TGC AAA GTG AAG AAT ATA GAC CTT AAA TTC AAA ATC ATT GTA ACA GCA        2016Cys Lys Val Lys Asn Ile Asp Leu Lys Phe Lys Ile Ile Val Thr Ala655                 660                 665                 670TAC AAG GAT CTT CCT CAT GCT GTT CAG GAG ACA TTC AAA CGT GTT TTG        2064Tyr Lys Asp Leu Pro His Ala Val Gln Glu Thr Phe Lys Arg Val Leu
            675                 680                 685ATC AAA GAA GAG GAG TAT GAT TCT ATT ATA GTA TTC TAT AAC TCG GTC        2112Ile Lys Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe Tyr Asn Ser Val
        690                 695                 700TTC ATG CAG AGA CTG AAA ACA AAT ATT TTG CAG TAT GCT TCC ACC AGG        2160Phe Met Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg
    705                 710                 715CCC CCT ACC TTG TCA CCA ATA CCT CAC ATT CCT CGA AGC CCT TAC AAG        2208Pro Pro Thr Leu Ser Pro Ile Pro His Ile Pro Arg Ser Pro Tyr Lys
720                 725                 730TTT CCT AGT TCA CCC TTA CGG ATT CCT GGA GGG AAC ATC TAT ATT TCA        2256Phe Pro Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser735                 740                 745                 750CCC CTG AAG AGT CCA TAT AAA ATT TCA GAA GGT CTG CCA ACA CCA ACA        2304Pro Leu Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr
            755                 760                 765AAA ATG ACT CCA AGA TCA AGA ATC TTA GTA TCA ATT GGT GAA TCA TTC        2352Lys Met Thr Pro Arg Ser Arg Ile Leu Val Ser Ile Gly Glu Ser Phe
        770                 775                 780GGG ACT TCT GAG AAG TTC CAG AAA ATA AAT CAG ATG GTA TGT AAC AGC        2400Gly Thr Ser Glu Lys Phe Gln Lys Ile Asn Gln Met Val Cys Asn Ser
    785                 790                 795GAC CGT GTG CTC AAA AGA AGT GCT GAA GGA AGC AAC CCT CCT AAA CCA        2448Asp Arg Val Leu Lys Arg Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro
800                 805                 810CTG AAA AAA CTA CGC TTT GAT ATT GAA GGA TCA GAT GAA GCA GAT GGA        2496Leu Lys Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly815                 820                 825                 830AGT AAA CAT CTC CCA GGA GAG TCC AAA TTT CAG CAG AAA CTG GCA GAA        2544Ser Lys His Leu Pro Gly Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu
            835                 840                 845ATG ACT TCT ACT CGA ACA CGA ATG CAA AAG CAG AAA ATG AAT GAT AGC        2592Met Thr Ser Thr Arg Thr Arg Met Gln Lys Gln Lys Met Asn Asp Ser
        850                 855                 860ATG GAT ACC TCA AAC AAG GAA GAG AAA TGAGGATCTC AGGACCTTGG              2639Met Asp Thr Ser Asn Lys Glu Glu Lys
    865                 870TGGACACTGT GTACACCTCT GGATTCATTG TCTCTCACAG ATGTGACTGT ATAACTTTCC      2699CAGGTTCTGT TTATGGCCAC ATTTAATATC TTCAGCTCTT TTTGTGGATA TAAAATGTGC      2759AGATGCAATT GTTTGGGTGA TTCCTAAGCC ACTTGAAATG TTAGTCATTG TTATTTATAC      2819AAGATTGAAA ATCTTGTGTA AATCCTGCCA TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT      2879TCCAAAGTAA AATTGCTGTG CTTTATGGAT AGTAAGAATG GCCCTAGAGT GGGAGTCCTG      2939ATAACCCAGG CCTGTCTGAC TACTTTGCCT TCTTTTGTAG CATATAGGTG ATGTTTGCTC      2999TTGTTTTTAT TAATTTATAT GTATATTTTT TTAATTTAAC ATGAACACCC TTAGAAAATG      3059TGTCCTATCT ATCTTCCAAA TGCAATTTGA TTGACTGCCC ATTCACCAAA ATTATCCTGA      3119ACTCTTCTGC AAAAATGGAT ATTATTAGAA ATTAGAAAAA AATTACTAAT TTTACACATT      3179AGATTTTATT TTACTATTGG AATCTGATAT ACTGTGTGCT TGTTTTATAA AATTTTGCTT      3239TTAATTAAAT AAAAGCTGGA AGCAAAGTAT AACCATATGA TACTATCATA CTACTGAAAC      3299AGATTTCATA CCTCAGAATG TAAAAGAACT TACTGATTAT TTTCTTCATC CAACTTATGT      3359TTTTAAATGA GGATTATTGA TAGT                                             3383(2)INFORMATION FOR SEQ ID NO:49:信息:
(i)序列特征:
(A)长度:871个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:49:Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala Ala Ala1               5                  10                  15Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Glu Asp
         20                  25                  30Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu
     35                  40                  45Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu
 50                  55                  60Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys65                  70                  75                  80Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys
             85                  90                  95Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Asp Glu
        100                 105                 110Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val
    115                 120                 125His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val
130                 135                 140Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala145                 150                 155                 160Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln
            165                 170                 175Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys
        180                 185                 190Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met
    195                 200                 205Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp
210                 215                 220Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys225                 230                 235                 240Thr Gly Ser Asn Ser Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu
            245                 250                 255Val Glu Asn Leu Ser Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys
        260                 265                 270Asp Leu Asp Ala Arg Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr
    275                 280                 285Asp Ser Ile Asp Ser Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn
290                 295                 300Leu Asp Glu Glu Val Asn Val Ile Pro Pro His Thr Pro Val Arg Thr305                 310                 315                 320Val Met Asn Thr Ile Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser
            325                 330                 335Asp Gln Pro Ser Glu Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val
        340                 345                 350Asn Pro Lys Glu Ser Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile
    355                 360                 365Phe Lys Glu Lys Phe Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile
370                 375                 380Gly Ser Gln Arg Tyr Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met385                 390                 395                 400Glu Ser Met Leu Lys Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe
            405                 410                 415Ser Lys Leu Leu Asn Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys
        420                 425                 430Ala Leu Glu Val Val Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn
    435                 440                 445Leu Asp Ser Gly Thr Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu
450                 455                 460Asn Leu Lys Ala Phe Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys465                 470                 475                 480Ala Glu Gly Asn Leu Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys
            485                 490                 495Glu His Arg Ile Met Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu
        500                 505                 510Phe Asp Leu Ile Lys Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His
    515                 520                 525Leu Glu Ser Ala Cys Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr
530                 535                 540Ala Ala Asp Met Tyr Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly545                 550                 555                 560Ser Thr Thr Arg Val Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr
            565                 570                 575Ser Ala Phe Gln Thr Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu
        580                 585                 590Phe Tyr Lys Lys Val Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu
    595                 600                 605Cys Glu Arg Leu Leu Ser Glu His Pro Glu Leu Glu His Ile Ile Trp
610                 615                 620Thr Leu Phe Gln His Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp625                 630                 635                 640Arg His Leu Asp Gln Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys
            645                 650                 655Val Lys Asn Ile Asp Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys
        660                 665                 670Asp Leu Pro His Ala Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys
    675                 680                 685Glu Glu Glu Tyr Asp Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met
690                 695                 700Gln Arg Leu Lys Thr Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro705                 710                 715                 720Thr Leu Ser Pro Ile Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro
            725                 730                 735Ser Ser Pro Leu Arg Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu
        740                 745                 750Lys Ser Pro Tyr Lys Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met
    755                 760                 765Thr Pro Arg Ser Arg Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr
770                 775                 780Ser Glu Lys Phe Gln Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg785                 790                 795                 800Val Leu Lys Arg Ser Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys
            805                 810                 815Lys Leu Arg Phe Asp Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys
        820                 825                 830His Leu Pro Gly Glu Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr
    835                 840                 845Ser Thr Arg Thr Arg Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp
850                 855                 860Thr Ser Asn Lys Glu Glu Lys865                 870(2)INFORMATION FOR SEQ ID NO:50:信息:
(i)序列特征:
(A)长度:3554个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线性
(ix)特性:
(A)名称/关键词:CDS
(B)位置:7..2790
(xi)序列描述:SEQ ID NO:50:CGCGTC ATG CCG CCC AAA ACC CCC CGA AAA ACG GCC GCC ACC GCC GCC           48
   Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala
     1               5                  10GCT GCC GCC GCG GAA CCC CCG GCA CCG CCG CCG CCG CCC CCT CCT GAG          96Ala Ala Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu15                  20                  25                  30GAG GAC CCA GAG CAG GAC AGC GGC CCG GAG GAC CTG CCT CTC GTC AGG         144Glu Asp Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg
             35                  40                  45CTT GAG TTT GAA GAA ACA GAA GAA CCT GAT TTT ACT GCA TTA TGT CAG         192Leu Glu Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln
         50                  55                  60AAA TTA AAG ATA CCA GAT CAT GTC AGA GAG AGA GCT TGG TTA ACT TGG         240Lys Leu Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp
     65                  70                  75GAG AAA GTT TCA TCT GTG GAT GGA GTA TTG GGA GGT TAT ATT CAA AAG         288Glu Lys Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys
 80                  85                  90AAA AAG GAA CTG TGG GGA ATC TGT ATC TTT ATT GCA GCA GTT GAC CTA         336Lys Lys Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu95                 100                 105                 110GGT GAT ATG TCG TTC ACT TTT ACT GAG CTA CAG AAA AAC ATA GAA ATC         384Gly Asp Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile
            115                 120                 125AGT GTC CAT AAA TTC TTT AAC TTA CTA AAA GAA ATT GAT ACC AGT ACC         432Ser Val His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr
        130                 135                 140AAA GTT GAT AAT GCT ATG TCA AGA CTG TTG AAG AAG TAT GAT GTA TTG         480Lys Val Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu
    145                 150                 155TTT GCA CTC TTC AGC AAA TTG GAA AGG ACA TGT GAA CTT ATA TAT TTG         528Phe Ala Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu
160                 165                 170ACA CAA CCC AGC AGT TCG ATA TCT ACT GAA ATA AAT TCT GCA TTG GTG         576Thr Gln Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val175                 180                 185                 190CTA AAA GTT TCT TGG ATC ACA TTT TTA TTA GCT AAA GGG GAA GTA TTA          624Leu Lys Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu
            195                 200                 205CAA ATG GAA GAT GAT CTG GTG ATT TCA TTT CAG TTA ATG CTA TGT GTC          672Gln Met Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val
        210                 215                 220CTT GAC TAT TTT ATT AAA CTC TCA CCT CCC ATG TTG CTC AAA GAA CCA          720Leu Asp Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro
    225                 230                 235TAT AAA ACA GCT GTT ATA CCC ATT AAT GGT TCA CCT CGA ACA CCC AGG          768Tyr Lys Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg
240                 245                 250CGA GGT CAG AAC AGG AGT GCA CGG ATA GCA AAA CAA CTA GAA AAT GAT          816Arg Gly Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp255                 260                 265                 270ACA AGA ATT ATT GAA GTT CTC TGT AAA GAA CAT GAA TGT AAT ATA GAT          864Thr Arg Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp
            275                 280                 285GAG GTG AAA AAT GTT TAT TTC AAA AAT TTT ATA CCT TTT ATG AAT TCT          912Glu Val Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser
        290                 295                 300CTT GGA CTT GTA ACA TCT AAT GGA CTT CCA GAG GTT GAA AAT CTT TCT          960Leu Gly Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser
    305                 310                 315AAA CGA TAC GAA GAA ATT TAT CTT AAA AAT AAA GAT CTA GAT GCA AGA         1008Lys Arg Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg
320                 325                 330TTA TTT TTG GAT CAT GAT AAA ACT CTT CAG ACT GAT TCT ATA GAC AGT         1056Leu Phe Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser335                 340                 345                 350TTT GAA ACA CAG AGA ACA CCA CGA AAA AGT AAC CTT GAT GAA GAG GTG         1104Phe Glu Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val
            355                 360                 365AAT GTA ATT CCT CCA CAC ACT CCA GTT AGG ACT GTT ATG AAC ACT ATC         1152Asn Val Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile
        370                 375                 380CAA CAA TTA ATG ATG ATT TTA AAT TCA GCA AGT GAT CAA CCT TCA GAA         1200Gln Gln Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu
    385                 390                 395AAT CTG ATT TCC TAT TTT AAC AAC TGC ACA GTG AAT CCA AAA GAA AGT         1248Asn Leu Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser
400                 405                 410ATA CTG AAA AGA GTG AAG GAT ATA GGA TAC ATC TTT AAA GAG AAA TTT        1296Ile Leu Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe415                 420                 425                 430GCT AAA GCT GTG GGA CAG GGT TGT GTC GAA ATT GGA TCA CAG CGA TAC        1344Ala Lys Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr
            435                 440                 445AAA CTT GGA GTT CGC TTG TAT TAC CGA GTA ATG GAA TCC ATG CTT AAA        1392Lys Leu Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys
        450                 455                 460TCA GAA GAA GAA CGA TTA TCC ATT CAA AAT TTT AGC AAA CTT CTG AAT        1440Ser Glu Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn
    465                 470                 475GAC AAC ATT TTT CAT ATG TCT TTA TTG GCG TGC GCT CTT GAG GTT GTA        1488Asp Asn Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val
480                 485                 490ATG GCC ACA TAT AGC AGA AGT ACA TCT CAG AAT CTT GAT TCT GGA ACA        1536Met Ala Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr495                 500                 505                 510GAT TTG TCT TTC CCA TGG ATT CTG AAT GTG CTT AAT TTA AAA GCC TTT        1584Asp Leu Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe
            515                 520                 525GAT TTT TAC AAA GTG ATC GAA AGT TTT ATC AAA GCA GAA GGC AAC TTG        1632Asp Phe Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu
        530                 535                 540ACA AGA GAA ATG ATA AAA CAT TTA GAA CGA TGT GAA CAT CGA ATC ATG        1680Thr Arg Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met
    545                 550                 555GAA TCC CTT GCA TGG CTC TCA GAT TCA CCT TTA TTT GAT CTT ATT AAA        1728Glu Ser Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys
560                 565                 570CAA TCA AAG GAC CGA GAA GGA CCA ACT GAT CAC CTT GAA TCT GCT TGT        1776Gln Ser Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys575                 580                 585                 590CCT CTT AAT CTT CCT CTC CAG AAT AAT CAC ACT GCA GCA GAT ATG TAT        1824Pro Leu Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr
            595                 600                 605CTT TCT CCT GTA AGA TCT CCA AAG AAA AAA GGT TCA ACT ACG CGT GTA        1872Leu Ser Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val
        610                 615                 620AAT TCT ACT GCA AAT GCA GAG ACA CAA GCA ACC TCA GCC TTC CAG ACC        1920Asn Ser Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr
    625                 630                 635CAG AAG CCA TTG AAA TCT ACC TCT CTT TCA CTG TTT TAT AAA AAA GTG       1968Gln Lys Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val
640                 645                 650TAT CGG CTA GCC TAT CTC CGG CTA AAT ACA CTT TGT GAA CGC CTT CTG       2016Tyr Arg Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu655                 660                 665                 670TCT GAG CAC CCA GAA TTA GAA CAT ATC ATC TGG ACC CTT TTC CAG CAC       2064Ser Glu His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His
            675                 680                 685ACC CTG CAG AAT GAG TAT GAA CTC ATG AGA GAC AGG CAT TTG GAC CAA       2112Thr Leu Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln
        690                 695                 700ATT ATG ATG TGT TCC ATG TAT GGC ATA TGC AAA GTG AAG AAT ATA GAC       2160Ile Met Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp
    705                 710                 715CTT AAA TTC AAA ATC ATT GTA ACA GCA TAC AAG GAT CTT CCT CAT GCT       2208Leu Lys Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala
720                 725                 730GTT CAG GAG ACA TTC AAA CGT GTT TTG ATC AAA GAA GAG GAG TAT GAT       2256Val Gln Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp735                 740                 745                 750TCT ATT ATA GTA TTC TAT AAC TCG GTC TTC ATG CAG AGA CTG AAA ACA       2304Ser Ile Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr
            755                 760                 765AAT ATT TTG CAG TAT GCT TCC ACC AGG CCC CCT ACC TTG TCA CCA ATA       2352Asn Ile Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile
        770                 775                 780CCT CAC ATT CCT CGA AGC CCT TAC AAG TTT CCT AGT TCA CCC TTA CGG       2400Pro His Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg
    785                 790                 795ATT CCT GGA GGG AAC ATC TAT ATT TCA CCC CTG AAG AGT CCA TAT AAA       2448Ile Pro Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys
800                 805                 810ATT TCA GAA GGT CTG CCA ACA CCA ACA AAA ATG ACT CCA AGA TCA AGA       2496Ile Ser Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg815                 820                 825                 830ATC TTA GTA TCA ATT GGT GAA TCA TTC GGG ACT TCT GAG AAG TTC CAG       2544Ile Leu Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln
            835                 840                 845AAA ATA AAT CAG ATG GTA TGT AAC AGC GAC CGT GTG CTC AAA AGA AGT       2592Lys Ile Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser
        850                 855                 860GCT GAA GGA AGC AAC CCT CCT AAA CCA CTG AAA AAA CTA CGC TTT GAT       2640Ala Glu Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp
    865                 870                 875ATT GAA GGA TCA GAT GAA GCA GAT GGA AGT AAA CAT CTC CCA GGA GAG       2688Ile Glu Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu
880                 885                 890TCC AAA TTT CAG CAG AAA CTG GCA GAA ATG ACT TCT ACT CGA ACA CGA       2736Ser Lys Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg895                 900                 905                 910ATG CAA AAG CAG AAA ATG AAT GAT AGC ATG GAT ACC TCA AAC AAG GAA       2784Met Gln Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu
            915                 920                 925GAG AAA TGAGGATCTC AGGACCTTGG TGGACACTGT GTACACCTCT GGATTCATTG        2840Glu LysTCTCTCACAG ATGTGACTGT ATAACTTTCC CAGGTTCTGT TTATGGCCAC ATTTAATATC      2900TTCAGCTCTT TTTGTGGATA TAAAATGTGC AGATGCAATT GTTTGGGTGA TTCCTAAGCC      2960ACTTGAAATG TTAGTCATTG TTATTTATAC AAGATTGAAA ATCTTGTGTA AATCCTGCCA      3020TTTAAAAAGT TGTAGCAGAT TGTTTCCTCT TCCAAAGTAA AATTGCTGTG CTTTATGGAT      3080AGTAAGAATG GCCCTAGAGT GGGAGTCCTG ATAACCCAGG CCTGTCTGAC TACTTTGCCT      3140TCTTTTGTAG CATATAGGTG ATGTTTGCTC TTGTTTTTAT TAATTTATAT GTATATTTTT      3200TTAATTTAAC ATGAACACCC TTAGAAAATG TGTCCTATCT ATCTTCCAAA TGCAATTTGA      3260TTGACTGCCC ATTCACCAAA ATTATCCTGA ACTCTTCTGC AAAAATGGAT ATTATTAGAA      3320ATTAGAAAAA AATTACTAAT TTTACACATT AGATTTTATT TTACTATTGG AATCTGATAT      3380ACTGTGTGCT TGTTTTATAA AATTTTGCTT TTAATTAAAT AAAAGCTGGA AGCAAAGTAT      3440AACCATATGA TACTATCATA CTACTGAAAC AGATTTCATA CCTCAGAATG TAAAAGAACT      3500TACTGATTAT TTTCTTCATC CAACTTATGT TTTTAAATGA GGATTATTGA TAGT            3554(2)INFORMATION FOR SEQ ID NO:51:信息:
(i)序列特征:
(A)长度:928个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:51:Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala Ala Ala1               5                  10                  15Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Glu Asp
         20                  25                  30Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu
     35                  40                  45Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu
 50                  55                  60Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys65                  70                  75                  80Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys
             85                  90                  95Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Gly Asp
        100                 105                 110Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val
    115                 120                 125His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val
130                 135                 140Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala145                 150                 155                 160Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln
            165                 170                 175Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys
        180                 l85                 190Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met
    195                 200                 205Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp
210                 215                 220Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys225                 230                 235                 240Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly
            245                 250                 255Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg
        260                 265                 270Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val
    275                 280                 285Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly
290                 295                 300Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg305                 310                 315                 320Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe
            325                 330                 335Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu
        340                 345                 350Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val
    355                 360                 365Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln
370                 375                 380Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu385                 390                 395                 400Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu
            405                 410                 415Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys
        420                 425                 430Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu
    435                 440                 445Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu
450                 455                 460Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn465                 470                 475                 480Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala
            485                 490                 495Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu
        500                 505                 510Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe
    515                 520                 525Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg
530                 535                 540Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser545                 550                 555                 560Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser
            565                 570                 575Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu
        580                 585                 590Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser
    595                 600                 605Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser
610                 615                 620Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys625                 630                  635                640Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg
            645                 650                 655Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu
        660                 665                 670His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu
    675                 680                 685Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met
690                 695                 700Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys705                 710                 715                 720Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln
            725                 730                 735Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile
        740                 745                 750Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile
    755                 760                 765Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His
770                 775                 780Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro785                 790                 795                 800Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser
            805                 810                 815Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu
        820                 825                 830Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile
    835                 840                 845Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu
850                 855                 860Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu865                 870                 875                 880Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys
            885                 890                 895Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln
        900                 905                 910Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys
    915                 920                 925
参考文献:
下列参考文献补充了本文给出的示例性方法和细节,在此特别引入作为参考。U.S.Patent 4,237,224U.S.Patent 4,321,883U.S.Patent 4,430,434U.S.Patent 4,554,101U.S.Patent 4,559,302U.S.Patent 4,727,028U.S.Patent 4,745,051U.S.Patent 4,797,368U.S.Patent 4,879,236U.S.Patent 4,960,704U.S.Patent 5,077,214U.S.Patent 5,139,941U.S.Patent 5,155,037U S.Patent 5,162,222U.S.Patent 5,169,784U S.Patent 5,278,050U.S.Patent 5,464,758U.S.Patent 5,496,731EPO 0273085WO  90/05180WO  91/15580Ahlering et al.,Cancer Res.,47:6660-6665,1987.Alt et al.,J.Biol.Chem.,253:1357,1978Anderson et al.,Genes Chromosom.Cancer,9:251-260,l994.Ausubel et al.,In:Short Protocols in Molecular Biology,Current Protocols in Molecular
Biology,John Wiley and Jones,New York,1992.Bahnemann et al.,Abs.Pap.ACS,180:5,1980.Baichwal and Sugden,In:Gene Transfer.R.Kucherlapati(ed.),New York,Plenum Press,pp.
117-148,1986.Baker et al.,Science,249:912-915,1990.Ballester et al.,Cell,63:851-859,1990.Benedict et al.,J.Clin.Invest.,85:988-993,1990.Berry et al.,Oncogene,12:1809-1819,1996.Bookstein et al.,Crit.Rev.Oncog.,2(3):211-227,1991.Bookstein et al.,Proc.Natl.Acad.Sci.USA,87:7762-7766,1990a.Bookstein et al.,Science,247:712-715,1990b.Boshart,et al.,Cell,41:521-530,1985.Brouckaert et al.,Lymph.Cyt.Res.,11:193-196,1992.Brough et al.,J.Virol.,70:6497-6501,1996.Buchkovich et al.,Cell,58:1097-1105,1989.Burns et al.,Proc.Natl.Acad.Sci.USA,90:8033-8037,1993.Call et al.,Cell,60:509-520,1990.Cance et al.,New Engl.J.Med.,323:1457-1462,1990.Capaldi et al.,Biochem.Biophys.Res.Comm.,76:425,1977.Cawthon et al.,Cell,62:193-201,1990.Ceccoli et al.,Journal of Investigative Dermatology,93:190-194,1989.Chalfie et al.,Science,263:802-805,1994.Chang et al.,Science,267:518-522,1995.Chang et al.,Hepatology,14:134A,1991.Chellappan et al,Cell,65:1053-1061,1991.Chen and Okayama,Mol.Cell.Biol.,7:2745-2752,1987.Chen et al.,Cell,58:1193-1198,1989.Chen et al.,Cell Growth Differ.,3:119-125,1992.Chen et al.,Science,250:1576-1580,1990.Choi et al.,Mol.Cell.Biol.,11:3070-4,1991.Clark et al.,Human Gene Therapy,6:1329-1341,1995.Coffin,In:Virology,Fields et al.(eds.),New York,Raven Press,pp.1437-1500,1990.Colberre-Garapin et al.,J.Mol.Biol.,150:1,1981.Cooper and Whyte,Cell,58:1009-1011,1989.Cordon-Cardo et al.,J.Natl.Cancer Inst.,84:1251-1256,1992.Cotten et al.,Proc.Natl.Acad.Sci.USA,89:6094-6098,1992.Couch et al.,Am.Rev.Resp.Dis.,88:394-403,1963.Coupar et al.,Gene,68:1-10,1988.Curiel,In:Viruses in Human Gene Therapy,Vos(Ed.),Carolina Academic Press,Durham,
pp.179-212,1994.Dawson et al.,Proc.Am.Assoc.Cancer Res.,36:88,Abstract,1995.Dawson et al.,Special AACR Conference:Cancer Susceptibility Genes and Molecular Carcino-
genesis,Keystone,CO,February 19-25,1996.DeCaprio et al.,Cell,58:1085-1095,1989.Diller et al.,Mol.Cell Biol.,10(11):5772-5781,1990.Dimri et al.,Proc.Natl.Acad. Sci USA,92:9363-9367,1995.Dowling,In:Antibiotics Monographs,No.3,Medical Encyclopedia,New York,1955.Duan et al.,Science,269:1402-1406,1995Evans,In:Biochemical Reference Series J,Quadrangle Press,New York,1968.Ewen et al.,Cell,73:487-497,1993.Fearon et al.,Cell,61:759-767,1990a.Fearon et al.,Science,247:49-56,1990b.Fechheimer et al.,Proc.Natl.Acad.Sci.USA,84:8463-8467,1987Finer et al.,Blood,83:43-50,1994.Finlay et al.,Cell,57:1083-1093,1989.Flotte et al.,Gene Therapy,2:29-37,1995.Flotte et al.,Am.J.Respir.Cell Mol.Biol.,7:349-356,1992.Flotte et al.,Proc.Natl.Acad Sci USA,90:10613-10617,1993.Fraley et al.,Proc.Natl.Acad.Sci.USA,76:3348-3352,1979Friedmann,Science,244:1275-1281,1989.Friend et al.,Nature,323:643-646,1986.Friend et al.,Proc.Natl.Acad.Sci.USA,84:9059-9063,1987.Fung et al.,Science,236:1657-1660,1987.Fung et al.,Oncogene,8:2659-2672,1993.Furukawa et al.,Proc.Natl.Acad.Sci.USA,87:2770-2774,1990.Futreal et al.,Science,266:120-122,1994.Geng et al.,Oncogene,12:1173-1180,1996.Gessler et al.,Nature,343:774-778,1990.Ghosh-Choudhury et al.,EMBO J.,6:1733-1739,1987.Ghosh and Bachhawat,In:Liver diseases,targeted diagnosis and therapy using specific
receptors and ligands.Wu and Wu(eds.),New York,Marcel Dekker,pp.87-104,1991.Gill and Ptashne,Nature,334:721-724,1988.Gillies et al.,Analytical Biochemistry 159:109-113,l986.Gomez-Foix et al.,J.Biol.Chem.,267:25129-25134,1992.Goodrich and Lee,Biochimica et Biophysica Acta,1155:43-61,1993.Goodrich et al.,Nature,360:177-179,1992a.Goodrich et al.,Cancer Res.,52:1968-1973,1992b.Gopal,Mol.Cell.Biol.,5:1188-1190,1985.Gossen and Bujard,Proc.Natl.Acad.Sci.U.S.A.89:5547-5551,1992.Gossen M and Bujard,Biotechniques,19:213-216,1995.Gossen et al.,Science,268:1766-1769,1995.Graham and Prevec,Biotechnology,20:363-390,1992.Graham and Prevec,In:Methods in Molecular Biology,Vol.7: Gene Transfer and Expression
Protocols,Murray(ed.),Clifton:the Humana Press Inc.,pp.109-128,1991.Graham and Van Der Eb,Virology 52:456-467,1973.Graham et al.,J.Gen.Virol.,36:59-72,1977.Grunhaus and Horwitz,Seminar in Virology,3:237-252,1992.Hamel et al.,FASEB J.7:846-854,1993.Harland and Weintraub,J.Cell Biol.,101:1094-1099,1985.Hermonat and Muzyczka,Proc.Natl.Acad.Sci.USA,81:6466-6470,1984.Hersdorffer et al.,DNA Cell Biol.,9:713-723,1990.Herz and Gerard,Proc.Natl.Acad.Sci.USA,90:2812-2816,1993.Hlavka and Boothe,In:Handbook of Experimental Pharmacology,78,Blackwood et al.(eds.),
Springsr-Verlag,Berlin-New York,1985.Horowitz,Genes Chromosom.Cancer,6:124-131,1993.Horwich et al.J.Virol.,64:642-650,1990.Huang et al.,Science,242:1563-1566,1988.Jones and Shenk,Cell,13:181-188,1978.Kamb et al.,Science,264:436-440,1994.Kaneda et al.,Science,243:375-378,1989.Kaplitt et al.,Nature Genetics,8:148-154,1994.Karlsson et al.,EMBO J.,5:2377-2385,1986.Kato et al.,Genes Dev,7:331-342,1993.Kato et al.,J.Biol.Chem.,266:3361-3364,1991.Kaufman,Methods in Enzymology,185:537-566,1990.Kelleher and Vos,Biotechniques,17(6):1110-1117,1994.Kim et al.,Science,266:2011-2015,1994.Klein et al.,Nature,327:70-73,1987.Klein,Bioessays,12:347-350,1990.Klingelhutz et al.,Nature,380:79-82,1996.Knight et al,Eur.J.Clin.Micro.Infect.Dis.,7(6):721-731,1988.Knudson,Proc.Natl.Acad.Sci.US4,90:10914-10921,1993.Knudson,Cancer Res.,45:1437-1443,1985.Knudson,Proc.Natl.Acad.Sci.USA,68:820-823,1971.Koff et al.,Science,257:1689-1694,1992.Kornblau et al.,Blood,84:256-261,1994.Kotinet al.,Proc.Natl.Acad.Sci.USA,87:2211-2215,1990.Kozak,Nucl.Acids Res.,15(20):8125-8148,1987.Kozak,J.Biol.Chem.,266:19867-19870,1991.Kratzke et al.,Cell Growth Differ.,4:629-635,1993.Kunkel et al.,Methods Enzymol.,154:367-382,1987.Kyte and Doolittle,J.Mol.Biol.,157:105-132,1982.La Thangue,Trends in Biochemical Sciences,19:108-114,1994.LaFace,Viology,162:483-486,1988.Larsson and Litwin,Dev.Biol. Standard.,66:385-390,1987.Laughlin et al.,J.Virol.,60:515-524,1986.Le Gal La Salle et al.,Science,259:988-990,1993.Lebkowski et al.,Mol.Cell.Biol.,8:3988-3996,1988.Lee et al.,Nature,329:642-645,1987b.Lee et al.,Science,235:1394-1399,1987a.Levrero et al.,Gene,101:195-202,1991.Li et al.,Oncogene,13:2379-2386,1996.Lieber et al.,J.Virol.70:8944-8960,1996.Linskens et al.,Science,267:17,1995.Logothetis et al.,J.Natl.Cancer Inst.,84:1256-1261,1992.Lu et al.,Journal of Immunology,156:2495-2502,1996.Lu et al.,Oncogene,9:1015-1019,1994.Ludlow et al.,Cell,56:57-65,1989.Ludlow et al.,Cell,60:387-396,1990.Luo et al.,Blood,82(Supp.):1,303A,1994.Madreperla et al.,Cancer Res.,51:6381-6384,1991.Maniatis et al.,"Molecular Cloning:A Laboratory Manual,"Cold Spring Harbor Laboratory,
Cold Spring Harbor,New York,1989.Mann et al.,Cell,33:153-159,1983.Mannino et al.,Biotechniques,6(7):682-690,1988.Markowitz et al.,J.Virol.,62:1120-1124,1988.Marshall,Cell,64:313-326,1991.Masuda et al.,Proc.Natl.Acad.Sci.USA,84:7716-7719,1987.McCarty et al.,J.Virol.,65:2936-2945,1991.McGee et al.,Gene,80:119-128,1989.McLaughlin et al.,J.Virol.,62:1963-1973,1988.Michael,Biotechniques,16:410-412,1994.Mihara et al.,Science,246:1300-1303,1989.Miki et al.,Science,266:66-71,1994.Mitschef.,In:Medicinal Research,9,Dekker,New York,1978.Mittnacht et al.,EMBO J.,13:118-127,1994.Mizrahi,Process Biochem.,(August):9-12,1983.Muncaster et al.,Cancer Res.,52:654-661,1992.Murphree and Benedict,Science,223:1028-1033,1984.Muzyczka,Curr.Top.Microbiol.Immunol.,158:97-129,1992.Nevins,Science,258:424-429,1992.Newton et al.,Biochemistry,27:4655-4659,1988.Nicolas and Rubinstein,In:Vectors:A survey of molecular cloning vectors and their uses,
Rodriguez and Denhardt(eds.),Stoneham:Butterworth,pp.494-513,1988.Nicolau and Sene,Biochim.Biophys.Acta,721:185-190,1982Nicolau et al.,Methods Enzymol.,149:157-176,1987.Nicoletti et al.,J.Immunol.Methods,139:271-279,1991.Nilsson and Mosbach,Dev.Biol.Standard.,66:183-193,1987.Noyee Development Corporation,In:Chemical Process Reviews,Park Ridge,2 volurnes,1969.O′Reilly et al.,In Baculovirus expression vectors,W.H.Freeman and Company,N.Y,1992.Ohi et al.,Gene,89L:279-282,1990.Ookawa et al.,Oncogene,8:2175-2181,1993.Orita et al.,Proc.Natl.Acad.Sci.USA,86:2766-2770,1989.Pardee,Science,246:603-608,1989.Paskind et al.,Virology,67:242-248,1975.Perales et al.,Proc.Natl.Acad.Sci. USA,91:4086-4090,1994.Petricciani,Dev.Biol.Standard.,66:3-12,1985.Phillips et al.,In:Large Scale Mammalian Cell Culture,Feder and Tolbert(eds.),Academic
Ptess,Orlando,FL,1985.Potter et al.,Proc.Natl.Acad.Sci.USA,81:7161-7165,1984.Pritchard-Jones et al.,Nature,346:194-197,1990.Qin et al.,Genes Dev.,6:953-964,1992.Racher et al.,Biotechnology Techniques,9:169-174,1995.Ragot et al,Nature,361:647-650,1993.Renan,Radiother.Oncol.,19:197-218,1990.Resnitzky and Reed,Mol.Cell Biol.,15:3463-3469,1995.Rich et al.,Hum.Gene Ther.,4:461-476,1993.Ridgeway,In:Vectors:A survey of molecular cloning vectors and their uses.Rodriguez and
Denhardt(eds.)Stoneham:Butterworth,pp.467-492,1988.Riley et al.,Annual Review of Cell Biology,10:1-29,1994.Rippe et al.,Mol.Cell Biol.,10:689-695,1990.Rosenfeld et al.,Science,252:431-434,1991.Rosenfeld et al.,Cell,68:143-155,1992.Roux et al.,Proc.Natl.Acad.Sci.USA,86:9079-9083,1989.Samulski et al.,J.Virol.,63:3822-3828,1989.Samulski et al.,EMBO J.,10:3941-3950,1991.Santerre,et al.,Gene,30:147,1984.Sardet et al.,Proc.Natl.Acad.Sci.USA,92:2403-2407,1995.Schott et al.,Cancer Res.,54:1393-1396,1994.Serrano et al.,Nature,366:704-707,1993.Shan et al.,Proc.Natl.Acad.Sci.USA,93:679-684,1996.Shan et al.,Mol.Cell Biol.,14:299-309,1994.Shelling and Smith,Gene Therapy,1:165-169,1994.Stein et al.,Science,249:666-669,1990.Stein,J. Cell Physiol.,125:36-44,1985.Stratford-Perricaudetand Perricaudetp.In:Human Gene Transfer,Cohen-Haguenauer and Boiron,
(eds.),Editions John Libbey Eurotext,France,P 51-61,1991.Stratford-Perricaudetet al.,Hum.Gene.Ther.,1:241-256,1991.Sumegi et al.,Cell Growth Differ.,1:247-250,1990.Summers and Smith,Tex.Agric.Exp.Stn.Bull.No.1555,1987.Takahashi et al.,Proc.Natl.Acad.Sci.USA,88:5257-5261,1991.Tanswell et al.,Biochemica et Biophysica Acta,1044:269-274,1990.Temin,In:Gene Transfer,Kucherlapati(ed.),New York:Plenum Press,pp.149-188,1986.Templeton et al.,Proc.Natl.Acad.Sci.USA,88:3033-3037,1991.Tomic et al.,Nucl. Acids Res.,12:1656,1990.Top et al.,J.Infect.Dis.,124:155-160,1971.Tratschin et al.,Mol.Cell.Biol.,4:2072-2081,1984.Tratschin et al.,Mol.Cell.Biol.,5:32581-3260,1985.Tur-Kaspa et al.,Mol.Cell Biol.,6:716-718,1986.Upender et al.,Biotechniques,18:29-31,1995.van Wezel,Nature,216:64-65,1967.Viskochil et al.,Cell,62:187-192,1990.Wagner et al.,Science,260:1510-1513,1990.Wallace et al.,Science,249:181-186,1990.Walsh et al.,J.Clin.Invest.,94:1440-1448,1994.Wang et al,Advances in Cancer Res.,64:25-85,1994.Wang et al.,Oncogene,8:279-288,1993.Watson et al.,Molecular Biology of the Gene,4th Ed.,Benjamin,Inc,Menlo Park,CA,1987.Wei et al,Gene Therapy,1:261-268,1994.Weinberg.Cancer Res.,49:3713-3721,1989.Weinberg,Cell,81:323-330,1995.Weinberg,Science,254:1138-1146,1991.Weintraub et al.,Nature,358:259-261,1992.Weiss et al.,RNA Tumor Viruses,Cold Spring Harbor,New York,1985.Whyte et al.,Nature,334:124-129,1988.Wickham et al.,Nature Biotechnology 14:1570-1573,1996.Wills et al.,Cancer Gene Therapy,Abstract,2:339.1995.Wong et al.,Gene,10:87-94,1980.Wu and Wu,J.Biol Chem.,262:4429-4432,1987.Wu and Wu,Adv.Drug Delivery Rev.,12:159-167,1993.Xu et al.,Cancer Res.,51:2735-2739,1991a.Xu et al,J.Natl.Cancer Inst.,86:695-699,1994a.Xu et al.,Proc.Natl.Acad.Sci.USA,91:9837-9841,1994b.Xu et al.,Cancer Res.,51:4481-4485,1991c.Xu et al.,Oncogene,6:1139-1146,1991b.Xu et al.,Oncogene,4:807-812,1989b.Xu et al.,Virology,171:331-341,1989a.Xu,Advances in Anatomic Pathology,2:213-226,1995.Xu,in Advances in Pharmacology,Gene Therapy,Volume I,Thomas August.ed.,1996.Xu,et al.,Cancer Res.(Advances in Brief),56:2245-2249,1996.Yaug et al.,J.Virol.,68:4847-4856,1994.Yang et al.,Proc.Natl.Acad.Sci.USA,87:9568-9572,1990.Yoder et al.,Blood,82(Supp.):1:347A,1994.Yokota et al.,Oncogene,3:471-475,1988.Zhou et al.,Exp.Hematol.(NY),21:928-933,1993.Zhou et al.,J.Exp.Med.,179:1867-1875,1994a.Zhou et al.,Proc.Natl.Acad.Sci.USA,91:4165-4169,1994b.Zou et al.,Science,263:526-529,1994.

Claims (51)

1.包含编码非pRB94的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质的分离基因的DNA片段,所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质包括一个N-末端修饰。
2.权利要求1的DNA片段,其中所述基因编码包括一个N-末端区的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质,所述N-末端区包括第一序列区,其中至少缺失了一个氨基酸。
3.权利要求2的DNA片段,其中至少两个氨基酸从所述第一序列区缺失。
4.权利要求3的DNA片段,其中至少25个氨基酸从所述第一序列区缺失。
5.权利要求4的DNA片段,其中至少100个氨基酸从所述第一序列区缺失。
6.权利要求5的DNA片段,其中至少150个氨基酸从所述第一序列区缺失。
7权利要求6的DNA片段,其中至少300个氨基酸从所述第一序列区缺失。
8.权利要求2的DNA片段,其中所述第一序列区位于
a)大约氨基酸1和大约氨基酸50之间;
b)大约氨基酸51和大约氨基酸100之间;
c)大约氨基酸101和大约氨基酸150之间;
d)大约氨基酸151和大约氨基酸200之间;
e)大约氨基酸201和大约氨基酸250之间;
f)大约氨基酸251和大约氨基酸300之间;
g)大约氨基酸1和大约氨基酸100之间;
h)大约氨基酸51和大约氨基酸150之间;
i)大约氨基酸101和大约氨基酸200之间;
j)大约氨基酸151和大约氨基酸250之间;
k)大约氨基酸201和大约氨基酸300之间;
l)大约氨基酸1和大约氨基酸150之间;
m)大约氨基酸51和大约氨基酸200之间;
n)大约氨基酸101和大约氨基酸250之间;
o)大约氨基酸151和大约氨基酸300之间;
p)大约氨基酸1和大约氨基酸200之间;
q)大约氨基酸51和大约氨基酸250之间;
r)大约氨基酸101和大约氨基酸300之间;
s)大约氨基酸1和大约氨基酸250之间;
t)大约氨基酸51和大约氨基酸300之间;或
u)大约氨基酸1和大约氨基酸300之间。
9.权利要求2的DNA片段,其中
a)大约氨基酸2至大约氨基酸34从所述第一序列区缺失;
b)大约氨基酸2至大约氨基酸55从所述第一序列区缺失;
c)大约氨基酸2至大约氨基酸78从所述第一序列区缺失;
d)大约氨基酸2至大约氨基酸97从所述第一序列区缺失;
e)大约氨基酸2至大约氨基酸148从所述第一序列区缺失;
f)大约氨基酸31至大约氨基酸107从所述第一序列区缺失;
g)大约氨基酸77至大约氨基酸107从所述第一序列区缺失;
h)大约氨基酸111至大约氨基酸181从所述第一序列区缺失;
i)大约氨基酸111至大约氨基酸241从所述第一序列区缺失;
j)大约氨基酸181至大约氨基酸241从所述第一序列区缺失;或者
k)大约氨基酸242至大约氨基酸300从所述第一序列区缺失。
10.权利要求2的DNA片段,其中所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质的所述N-末端区进一步包括其中至少缺失一个氨基酸的第二序列区。
11.权利要求10的DNA片段,其中大约氨基酸2至大约氨基酸34和大约氨基酸76至大约氨基酸112缺失。
12.权利要求10的DNA片段,其中大约氨基酸2至大约氨基酸55和大约氨基酸76至大约氨基酸112缺失。
13.权利要求1的DNA片段,其中所述基因编码包括至少一个第一N-末端突变的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质,并且其中修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质与相应的野生型成视网膜细胞瘤肿瘤抑制剂蛋白质的生物活性相比具有提高的生物活性。
14.权利要求13的DNA片段,其中所述基因编码包括位置111处突变的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质。
15.权利要求14的DNA片段,其中所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质包括在位置111处替代天冬氨酸的甘氨酸。
16.权利要求13的DNA片段,其中所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质包括至少一个第二N-末端突变。
17.权利要求16的DNA片段,其中所述基因编码包括位置111处突变和位置112处突变的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质。
18.权利要求17的DNA片段,其中所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质包括在位置111处替代天冬氨酸的甘氨酸和在位置112处替代谷氨酸的天冬氨酸。
19.权利要求1的DNA片段,其中所述基因编码其中至少一个氨基酸缺失并且包含至少一个氨基酸突变的N-末端区的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质。
20.权利要求2的DNA片段,其中所述基因编码至少包括SEQ ID NO:2的大约位置370至大约位置928的至少C-末端氨基酸序列的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质。
21.权利要求2的DNA片段,其中所述基因编码包括SEQ ID NO:29,SEQ IDNO:31;SEQ ID NO:33;SEQ ID NO:35;SEQ ID NO:37;SEQ ID NO:39;SEQ IDNO:41;SEQ ID NO:43;SEQ ID NO:45;SEQ ID NO:47;SEQ ID NO:49;或SEQ IDNO:51的连续氨基酸序列的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质。
22.权利要求2的DNA片段,其中所述基因包括SEQ ID NO:28的位置7和位置2691之间;SEQ ID NO:30位置7和位置2628之间;SEQ ID NO:32位置7和位置2559之间;SEQ ID NO:34位置7和位置2502之间;SEQ ID NO:36位置7和位置2349之间;SEQ ID NO:38位置7和位置2559之间;SEQ ID NO:40位置7和位置2697之间;SEQID NO:42位置7和位置2583之间;SEQ ID NO:44位置7和位置2397之间;SEQ IDNO:46位置7和位置2613之间;SEQ ID NO:48位置7和位置2619之间;或SEQ IDNO:50位置7和位置2790之间的连续核酸序列。
23.权利要求1的DNA片段,可操作地位于启动子控制之下。
24.权利要求23的DNA片段,进一步限定为重组载体。
25.权利要求24的DNA片段,其中所述重组载体包括在腺病毒载体之内。
26.权利要求25的DNA片段,其中所述腺病毒载体包括在重组腺病毒之内。
27.权利要求1的DNA片段,包括在宿主细胞中。
28.权利要求27的DNA片段,其中所述宿主细胞是真核细胞。
29.权利要求28的DNA片段,其中所述宿主细胞是人细胞。
30.权利要求28的DNA片段,其中所述宿主细胞是肿瘤细胞。
31.权利要求28的DNA片段,其中所述宿主细胞包括在动物内。
32.权利要求31的DNA片段,其中所述动物是人个体。
33.权利要求1的DNA片段,分散在药学可接受赋形剂中。
34.权利要求1的DNA片段,其中所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质特征在于:
a)包含包括从中至少缺失一个氨基酸的至少一个第一序列区的N-末端区,并且其中所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质具有至少大约与相应的野生型成视网膜细胞瘤肿瘤抑制剂蛋白质的生物活性相当的生物活性;或者
b)包含包括至少一个突变的第一序列区的N-末端区,其中所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质具有比相应的野生型成视网膜细胞瘤肿瘤抑制剂蛋白质的生物活性提高的生物活性。
35.用于表达修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质的任一项前面权利要求的DNA片段。
36.根据权利要求1-34任一项的DNA片段在表达修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质中的用途。
37.用于抑制细胞增殖的权利要求1-34任一项的DNA片段。
38.根据权利要求1-34任一项的DNA片段在抑制细胞增殖中的用途。
39.用于制备抑制细胞增殖的药物的权利要求1-34任一项的DNA片段。
40.根据权利要求1-34任一项的DNA片段在制备抑制细胞增殖的药物中的用途。
41.用于制备治疗癌症的药物的权利要求1-34任一项的DNA片段。
42.根据权利要求1-34任一项的DNA片段在制备治疗癌症的药物中的用途。
43.非pRB94的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质,所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质包括一个N-末端修饰,其中所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质具有至少大约与相应的野生型成视网膜细胞瘤肿瘤抑制剂蛋白质的生物活性相当的生物活性。
44.包含编码非pRB94的修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质的分离基因的DNA片段的重组宿主细胞,所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质包括一个N-末端修饰。
45.权利要求44的重组宿主细胞,其中所述宿主细胞是肿瘤细胞。
46.一种抑制细胞增殖的方法,包括使细胞接触抑制有效量的非pRB94的第一修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质,所述修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质包括一个N-末端修饰。
47.权利要求46的方法,其中通过向所述细胞提供在所述细胞中表达所述第一修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质的DNA片段使所述细胞与所述第一修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质接触。
48.权利要求46的方法,其中所述细胞位于动物体内,并且将药学可接受载体中的所述第一修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质,或者编码所述第一修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质的基因对所述动物给药。
49.权利要求46的方法,其中所述细胞以有效抑制所述细胞中细胞增殖的结合量与修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质和p53肿瘤抑制剂蛋白质接触。
50.一种抑制细胞增殖的方法,包括以有效抑制所述细胞中细胞增殖的结合量使细胞与成视网膜细胞瘤蛋白质和p53蛋白质接触。
51.治疗癌症的方法,包括对患有癌症的动物施用含有生物有效抑制量的非pRB94的包括N-末端修饰的第一修饰的成视网膜细胞瘤肿瘤抑制剂蛋白质的药学可接受组合物。
CN98802742A 1997-02-20 1998-02-19 修饰的成视网膜细胞瘤肿瘤抑制蛋白 Pending CN1259998A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US3811897P 1997-02-20 1997-02-20
US60/038,118 1997-02-20

Publications (1)

Publication Number Publication Date
CN1259998A true CN1259998A (zh) 2000-07-12

Family

ID=21898180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98802742A Pending CN1259998A (zh) 1997-02-20 1998-02-19 修饰的成视网膜细胞瘤肿瘤抑制蛋白

Country Status (8)

Country Link
EP (1) EP0975750A2 (zh)
JP (1) JP2001512325A (zh)
KR (1) KR20000075501A (zh)
CN (1) CN1259998A (zh)
AU (1) AU6657398A (zh)
CA (1) CA2281899A1 (zh)
IL (1) IL131496A0 (zh)
WO (1) WO1998037091A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110484623A (zh) * 2019-08-27 2019-11-22 深圳市宝安区妇幼保健院 一种rb1突变基因、引物、检测方法、试剂盒及应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021062389A2 (en) * 2019-09-27 2021-04-01 Saint Leo University Peptide for treating cancer
WO2023173105A2 (en) * 2022-03-10 2023-09-14 Saliogen Therapeutics, Inc. Tetracycline inducer/repressor system and simplified viral particle production

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5496731A (en) * 1993-03-25 1996-03-05 Xu; Hong-Ji Broad-spectrum tumor suppressor genes, gene products and methods for tumor suppressor gene therapy
US5969120A (en) * 1993-09-03 1999-10-19 Research Development Foundation Mutants of the RB and P53 genes
AU7834994A (en) * 1993-09-13 1995-04-03 Canji, Inc. Therapeutic use of the retinoblastoma susceptibility gene product

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110484623A (zh) * 2019-08-27 2019-11-22 深圳市宝安区妇幼保健院 一种rb1突变基因、引物、检测方法、试剂盒及应用

Also Published As

Publication number Publication date
WO1998037091A2 (en) 1998-08-27
KR20000075501A (ko) 2000-12-15
IL131496A0 (en) 2001-01-28
EP0975750A2 (en) 2000-02-02
WO1998037091A3 (en) 1998-11-05
JP2001512325A (ja) 2001-08-21
CA2281899A1 (en) 1998-08-27
AU6657398A (en) 1998-09-09

Similar Documents

Publication Publication Date Title
CN1308450C (zh) 诊断和治疗肿瘤的方法及组合物
CN1197966C (zh) 肿瘤坏死因子受体相关因子的调节剂、及其制备和用途
CN1744913A (zh) Cathelicidin ll-37及其衍生物在伤口愈合中的用途
CN1214050A (zh) 人肿瘤坏死因子δ和ε
CN1446227A (zh) 新型成纤维细胞生长因子(fgf23)及其使用方法
CN1649895A (zh) 有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽
CN1272884A (zh) 脂肪细胞特异性蛋白质同系物
CN1253565A (zh) 能调节对细胞因子的细胞反应性的治疗和诊断制剂
CN1141059A (zh) P53-结合多肽和编码该多肽的多核苷酸
CN1203632A (zh) P16表达构建物及其在癌治疗中的应用
CN1219967A (zh) 神经胶质细胞系源性的神经营养因子受体
CN1529753A (zh) 疾病相关蛋白质
CN1723284A (zh) 调节性锌指蛋白
CN1259998A (zh) 修饰的成视网膜细胞瘤肿瘤抑制蛋白
CN1620466A (zh) 胱氨酸结折迭蛋白质
CN1436236A (zh) Gasci基因
CN1771259A (zh) 突变型Bik的抗肿瘤效果
CN1195853C (zh) 神经营养因子nnt-1
CN1649897A (zh) Falp蛋白
CN1192751A (zh) 单核细胞趋化蛋白-4
US20040081972A1 (en) Novel physiologically active peptide and use thereof
CN100340665C (zh) 人p51基因及其基因产物
CN1993048A (zh) 包含促滤泡素抑制素结构域的蛋白质
CN1436239A (zh) 新酶基因及其表达产物
CN1244375C (zh) 人肝再生相关蛋白及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication