CN1286728A - 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法 - Google Patents

抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法 Download PDF

Info

Publication number
CN1286728A
CN1286728A CN98813713.5A CN98813713A CN1286728A CN 1286728 A CN1286728 A CN 1286728A CN 98813713 A CN98813713 A CN 98813713A CN 1286728 A CN1286728 A CN 1286728A
Authority
CN
China
Prior art keywords
sequence numbering
nrrl
sequence
substituted
numbering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98813713.5A
Other languages
English (en)
Other versions
CN100340666C (zh
Inventor
L·恩格利斯
S·M·布鲁索克
T·M·马尔瓦
J·W·布赖森
C·A·库勒斯扎
F·S·瓦尔特斯
S·L·斯拉廷
M·A·冯特尔施
C·罗马诺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Monsanto Technology LLC
Original Assignee
Ecogen Inc
Monsanto Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/993,170 external-priority patent/US6063597A/en
Priority claimed from US08/993,775 external-priority patent/US6077824A/en
Priority claimed from US08/993,722 external-priority patent/US6060594A/en
Priority claimed from US08/996,441 external-priority patent/US6023013A/en
Application filed by Ecogen Inc, Monsanto Co filed Critical Ecogen Inc
Publication of CN1286728A publication Critical patent/CN1286728A/zh
Application granted granted Critical
Publication of CN100340666C publication Critical patent/CN100340666C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

公开了一种增加苏云金标菌δ-内毒素抗鞘翅目昆虫的活力的方法,同时还公开了突变编码该多肽的核酸以及在表达该基因的转基因植物中提高昆虫抗性的方法。

Description

抗昆虫的转基因植物以及用于改善 δ-内毒素抵抗目标昆虫活性的方法
1.0发明背景
1.1发明领域
本发明涉及的是用于生产通过基因工程方法获得的重组δ-内毒素的方法,其中所述的内毒素来源于苏云金芽胞杆菌(Bacillusthuringiensis),在控制南部谷类食根昆虫(Diabroticaundecimpunctata howardi Barber)以及西部食根昆虫(Diabroticavirgifera virgifera LeConte)中有用。1.2相关工艺的描述
几乎所有的田间作物、植物、以及商业性耕种区域都很容易受到一种或多种有害昆虫的攻击。特别成问题的是鞘翅类和鳞翅类昆虫。例如,蔬菜和海甘蓝作物,如朝鲜蕨、大头菜、芝麻菜、韭菜、芦笋、扁豆、豆子、莴苣(如头、叶子、长叶莴苣)、甜菜根、球状驱虫苋、暗绿叶黄体芋、绿花椰菜、甜瓜(如香瓜、西瓜、crenshaw、蜜瓜、哈密瓜)、牙甘蓝、卷心菜、朝鲜蕨cardoni、胡萝卜、napa、花椰菜、环秋葵、洋葱、芹菜、欧芹、鸡豌豆、荷兰防风草、菊苣、豌豆、大白菜、胡椒、羽衣甘蓝、土豆、黄瓜、南瓜、葫芦、萝卜、干的球茎洋葱、芜菁甘蓝、茄子、婆罗门参、escarole、青葱、菊苣、大豆、大蒜、菠菜、绿色洋葱、南瓜、绿色食品、制糖甜菜、甜土豆、芜菁、唐莴苣、山奎、番茄、橄榄类蔬菜、芜菁、以及对一种或多种以下有害昆虫的群袭敏感的各种不同的种类:紫花苜蓿尺蠖、粘虫、甜菜粘虫、朝鲜蓟羽蛾、甘蓝蚜虫、甘蓝尺蠖、甘蓝结网毛虫、谷类earworm、芹菜啃叶虫、交叉条纹的甘蓝蠕虫、欧洲玉米蛀虫、菱形斑纹蛾、绿cloverworm、进口甘蓝蠕虫、甜瓜蠕虫、杂食卷叶虫(leafroller)、pickleworm、rindworm复合物、盐碱地毛虫、大豆圈环虫、烟草蚜虫、番茄果虫、番茄天蛾幼虫、番茄寸白虫、藜豆毛虫、以及黄条纹粘虫。类似地,牧草以及干草作物,如苜蓿、牧草以及青贮的饲料通常都会受到如粘虫、牛肉粘虫、苜蓿毛虫、欧洲酷蝇幼虫(skipper)、各种不同的尺蠖和织网毛虫、以及黄条纹粘虫等害虫的攻击。
水果以及爬藤类作物,如苹果、杏树、樱桃、油桃、桃树、梨树、李树、梅子树、温柏杏树、栗子树、榛子树、大胡桃、阿月浑子树、核桃、柑橘、黑莓、越橘、杂交草莓博伊森树莓、酸果蔓、黑加仑、罗甘莓、覆盆子、草莓、drapes、鳄梨、香蕉、猕猴桃、柿子、石榴、菠萝、热带水果,经常容易受到以下害虫的攻击并落叶:achema天蛾、amorbia、粘虫、柑橘夜蛾、香蕉酷蝇幼虫、黑头萤火虫、越橘卷叶虫、尺蠖、樱桃果虫、柑橘夜蛾、酸果蔓girdler、东部帐篷毛虫、秋季织网毛虫、秋季织网毛虫、榛树卷叶虫、榛树织网毛虫、果树卷叶虫、葡萄果蛾、葡萄叶蝉(leaffolder)、葡萄啃叶虫(grapeleafskeletonizer)、绿色果虫、gummosos-batrachedra commosae、吉普赛蛀虫、山胡桃shuckworm、天蛾幼虫、卷叶虫、navel柑橘毛虫、斜条纹卷叶虫、杂食性卷叶虫、柑橘卷叶蛾、orangedog、东方果蛾、流行性卷叶虫、桃树小枝蛀虫、大胡桃坚果鞘蛾幼虫、红条纹卷叶虫、红色隆背毛虫、粗皮夜蛾、盐碱地毛虫、尺蠖、帐篷毛虫、thecla-thecia basillides、烟草蚜虫、卷叶蛾、成蔟状的苹果蚜蛾、杂色卷叶蛾、胡桃毛虫、西部帐篷毛虫、以及黄条纹粘虫。
田间作物,如芸薹/油菜籽、月见草、牧场草、玉米(田地、甜的、爆米花)、棉花、蛇麻草、加州希蒙得木(jojoba)、花生、稻谷、红花、细粮(大麦、燕麦、黑麦、小麦等)、高粱、大豆、向日葵、以及烟草通常都是以下昆虫侵染的目标,包括:粘虫、亚洲以及其它的玉米蛀虫、条纹向日葵蛾、甜菜粘虫、棉铃虫、甘蓝圈环虫、玉米食根虫(包括南部和西部的种类)、棉叶穿孔虫、菱形斑纹蛾、欧洲玉米蛀虫、绿色cloverworm、headmoth、headworm、进口的甘蓝毛虫、圈环虫(包括Anacamptodes种属)、斜条纹卷叶虫、杂食性leaftier、podworm、podworm、盐碱地毛虫、西南部玉米蛀虫、大豆尺蠖、斑点夜蛾、向日葵蛾、烟草蚜虫、烟草天蛾幼虫、藜豆毛虫。
苗床植物(bedding plants)、花、观赏植物、蔬菜、以及盆栽经常是许多害虫的食物,例如粘虫、杜鹃花蛾、甜菜粘虫、菱形花纹蛾、ellomoth(天蛾幼虫),佛罗里达蕨类毛虫、caterpillar、Iomoth、尺蠖、夹竹桃蛾、杂食性叶蝉(leafroller)、杂食性尺蠖以及烟草蚜虫。
森林、水果、观赏植物、结坚果的树以及灌木和其它的园圃树种通常容易受到各种不同的昆虫的攻击,如结草虫、黑头蚜虫、棕尾蛾、加州橡树蛾、道格拉斯杉树蛾、榆树、尺蠖、秋季织网毛虫、果树叶蝉、绿色条纹枫树毛虫(mapleworm)、舞度蛾、短叶松芽卷蛾、含羞草结网毛虫、松树蝶、红色隆背毛虫、鞍背次蛾、鞍突(saddleprominent)次蛾、春秋尺蠖、云杉卷叶蛾、天幕毛虫、卷叶蛾、以及西部丛蛾。同样地,草皮通常会受到诸如粘虫、草坪织网毛虫、以及热带草皮织网毛虫的攻击。
因为具有商业利益的作物通常会受到昆虫的攻击,所以在许多情况中需要有对环境敏感的方法来控制或根除昆虫的侵袭。对于那些寻求通过使用生态友好的组合物来控制昆虫种群的农民、园丁、栽培者、以及商业和住宅区域而言,情况更是如此。
近几年发展的使用最为广泛的环境敏感杀虫配方是由来源于苏云金芽孢杆菌的微生物农药组成的。苏云金芽孢杆菌是一种格兰氏阳性细菌,它产生的结晶态蛋白或包含体对特定的昆虫目和种属具有特定的毒性。已经发现有许多不同的苏云金芽胞杆菌菌株可以产生杀虫的结晶态蛋白。一些组合物,包括可以产生杀虫蛋白的苏云金芽胞杆菌,已经可以通过商业途径获得并用作环境可接受的杀虫剂,因为它们对特定的目标昆虫具有相当的毒性而对植物以及其它的非目标生物体是无害的。1.2.1δ-内毒素
δ-内毒素被用于控制范围广泛的吃叶毛虫和甲虫,以及蚊子。这些蛋白样的准孢子(parasporal)晶体(也称为杀虫晶体蛋白、晶体蛋白、Bt包含体、晶状包含体、包含体、以及Bt毒素)是由苏云金芽胞杆菌生产的杀虫蛋白的一个很大的集合,它们在被易受感染的昆虫宿主摄取之后产生毒性。在过去的十年间,对苏云金芽胞杆菌毒素的结构和功能的研究涵盖了所有的主要毒素类别。虽然这些毒素在具体的结构和功能上存在区别,但是它们被认为在结构和功能上具有普遍的类似性。基于对苏云金芽胞杆菌毒素的知识的积累,已经建立了苏云金芽胞杆菌毒素的普遍性的作用模式,包括:由昆虫摄取、在中肠(包括胃和小肠)溶解、由于对于消化酶的抗性而导致的有时候部分消化实际上“激活”了毒素,结合到中肠细胞,在昆虫细胞中形成一个孢子,以及细胞动态平衡的瓦解(English和Slatin,1992)。1.2.2编码晶体蛋白的基因
许多δ-内毒素在它们的氨基酸序列上有不同程度的类似性。历史上,这些蛋白和编码它们的基因很大程度上是根据它们杀虫活性谱进行分类的。Hofte和Whiteley(1989)的综述讨论了1990年以前在苏云金芽胞杆菌中所鉴定的基因和蛋白,并提出了传统上所使用的针对苏云金芽胞杆菌基因和蛋白的命名法和分类方案。cryI基因编码对鳞翅类昆虫有毒的CryI蛋白。cryII基因编码对鳞翅类和双翅类昆虫均有毒的CryII蛋白。cryIII基因编码对鞘翅类昆虫有毒的CryIII蛋白,而cryIV基因编码对双翅类昆虫有毒的CryIV蛋白。
基于序列相似的程度,将这些蛋白进一步分为不同的亚群;给每个亚群中更为高度关联的蛋白赋予小组性的字母如CryIA、CryIB、CryIC等。给在每小组中更为紧密关联的蛋白赋予名称,如CryICl、CryIC2等。
最近发展了一种新的命名法,其依据氨基酸序列的同源性胜于依据昆虫目标的特异性来系统地划分Cry蛋白。对许多已知毒素的划分方案,不包括个体蛋白中等位基因的变化,简要地列于表1。
最近发展了一种新的命名法,它把Cry蛋白根据氨基酸序列的同源性(而不是根据昆虫目标的特异性)系统地进行分类。表1概括了对许多种已知毒素(不包括对个体蛋白的等位基因变型)的分类方案。
                           表1
已知的苏云金芽胞杆菌δ-内毒素、基因库编号、以及修正的命名法A
      新                旧         基因库编号#
      Cry1Aa1        CryIA(a)         M11250
      Cry1Aa2        CryIA(a)         M10917
      Cry1Aa3        CryIA(a)         D00348
      Cry1Aa4        CryIA(a)         X13535
      Cry1Aa5        CryIA(a)         D175182
      Cry1Aa6        CryIA(a)         U43605
      Cry1Ab1        CryIA(b)         M13898
      Cry1Ab2        CryIA(b)         M12661
      Cry1Ab3         CryIA(b)         M15271
      Cry1Ab4         CryIA(b)         D00117
      Cry1Ab5         CryIA(b)         X04698
      Cry1Ab6         CryIA(b)         M37263
      Cry1Ab7         CryIA(b)         X13233
      Cry1Ab8         CryIA(b)         M16463
      Cry1Ab9         CryIA(b)         X54939
      Cry1Ab10        CryIA(b)         A29125
      Cry1Ac1         CryIA(c)         M11068
      Cry1Ac2         CryIA(c)         M35524
      Cry1Ac3         CryIA(c)         X54159
      Cry1Ac4         CryIA(c)         M73249
      Cry1Ac5         CryIA(c)         M73248
      Cry1Ac6         CryIA(c)         U43606
      Cry1Ac7         CryIA(c)         U87793
      Cry1Ac8         CryIA(c)         U87397
      Cry1Ac9         CryIA(c)         U89872
      Cry1Ac10        CryIA(c)         AJ002514
      Cry1Ad1         CryIA(d)         M73250
      Cry1Ae1         CryIA(e)         M65252
      Cry1Ba1         CryIB            X06711
      Cry1Ba-7                         X95704
      Cry1Bb1         ET5              L32020
      Cry1Bc1         CryIb(c)         Z46442
      Cry1Bd1         CryE1            U70726
      Cry1Ca1         CryIC            X07518
      Cry1Ca2         CryIC            X13620
      Cry1Ca3         CryIC            M73251
      Cry1Ca4         CryIC            A27642
      Cry1Ca5         CryIC            X96682
      Cry1Ca6         CryIC            X96683
      Cry1Ca7         CryIC            X96684
      Cry1Cb1           CryiC(b)        M97880
      Cry1Da1           CryID           X54160
      Cry1Db1           PrtB            Z22511
      Cry1Ea1           CryIE           X53985
      Cry1Ea2           CryIE           X56144
      Cry1Ea3           CryIE           M73252
      Cry1Ea4                           U94323
      Cry1Eb1           CryIE(b)        M73253
      Cry1Fa1           CryIF           M63897
      Cry1Fa2           CryIF           M63897
      Cry1Fb1           PrtD            Z22512
      Cry1Ga1           PrtA            Z22510
      Cry1Ga2           CryIM           Y09326
      Cry1Gb1           CryH2           U70725
      Cry1Ha1           Prtc            Z22513
      Cry1Hb1                           U35780
      Cry1Ia1           CryV            X62821
      Cry1Ia2           CryV            M98544
      Cry1Ia3           CryV            L36338
      Cry1Ia4           CryV            L49391
      Cry1Ia5           CryV            Y08920
      Cry1Ib1           CryV            U07642
      Cry1Ja1           ET4             L32019
      Cry1Jb1           ET1             U31527
      Cry1Ka1                           U28801
      Cry2Aa1           CryIIA          M31738
      Cry2Aa2           CryIIA          M23723
      Cry2Aa3                           D86084
      Cry2Ab1           CryIIB          M23724
      Cry2Ab2           CryIIB          X55416
      Cry2Ac1           CryIIC          X57252
      Cry3Aa1           CryIIIA         M22472
      Cry3Aa2           CryIIIA          J02978
      Cry3Aa3           CryIIIA          Y00420
      Cry3Aa4           CryIIIA          M30503
      Cry3Aa5           CryIIIA          M37207
      Cry3Aa6           CryIIIA          U10985
      Cry3Ba1           CryIIIB          X17123
      Cry3Ba2           CryIIIB          A07234
      Cry3Bb1           CryIIIB2         M89794
      Cry3Bb2           CryIIIC(b)       U31633
      Cry3Ca1           CryIIID          X59797
      Cry4Aa1           CryIVA           Y00423
      Cry4Aa2           CryIVA           D00248
      Cry4Ba1           CryIVB           X07423
      Cry4Ba2           CryIVB           X07082
      Cry4Ba3           CryIVB           M20242
      Cry4Ba4           CryIVB           D00247
      Cry5Aa1           CryVA(a)         L07025
      Cry5Ab1           CryVA(b)         L07026
      Cry5Ba1           PS86Q3           U19725
      Cry6Aa1           CryVIA           L07022
      Cry6Ba1           CryVIB           L07024
      Cry7Aa1           CIYIIIC          M64478
      Cry7Ab1           CryIIICb         U04367
      Cry8Aa1           CryIIIE          U04364
      Cry8Ba1           CryIIIG          U04365
      Cry8Ca1           CryIIIF          U04366
      Cry9Aa1           CryIG            X58120
      Cry9Aa2           CryIG            X58534
      Cry9Ba1           CryIX            X75019
      Cry9Ca1           CryIH            Z37527
      Cry9Da1           N141             D85560
      Cry10Aa1          CryIVC           M12662
      Cry11Aa1              CryIVD             M31737
      Cry11Aa2              CryIVD             M22860
      Cry11Ba1              Jeg80              X86902
      Cry12Aa1              CryVB              L07027
      Cry13Aa1              CryVC              L07023
      Cry14Aa1              CryVD              U13955
      Cry15Aa1              34kDa              M76442
      Cry16Aa1              cbm71              X94146
      Cry17Aa1              cbm71              X99478
      Cry18Aa1              CryBP1             X99049
      Cry19Aa1              Jeg65              Y08920
      Cry20Aa1                                 U82518
      Cry21Aa1                                 132932
      Cry22Aa1                                 134547
      Cyt1Aa1               CytA               X03182
      Cyt1Aa2               CytA               X04338
      Cyt1Aa3               CytA               Y00135
      Cyt1Aa4               CytA               M35968
      Cyt1Ab1               CytM               X98793
      Cyt1Ba1                                  U37196
      Cyt2Aa1               CytB               Z14147
      Cyt2Ba1              “CytB”            U52043
      Cyt2Ba2              “CytB”            AF020789
      Cyt2Ba3              “CytB”            AF022884
      Cyt2Ba4              “CytB”            AF022885
      Cyt2Ba5              “CytB”            AF022886
      Cyt2Bb1                                  U82519
a改编自:
http://epunix.biols.susx.ac.uk/Home/Neil-Crickmore/Bt/index.html1.2.3生物杀虫剂多肽复合物
当首次分离对鞘翅类昆虫有毒的苏云金芽胞杆菌菌株的报道出现时(Krieg等,1983;1984),作为杀虫剂的细菌结晶蛋白的用途扩展到鳞翅类和双翅类幼虫之外。据报道,被命名为苏云金芽胞杆菌tenebrionis变种的该种菌株(如美国专利4,766,203号,作为参考结合于本说明书中)对鞘翅类昆虫Agelastica alni(蓝色alder叶甲虫)以及Leptinotarsa decemlineata(科罗拉多薯虫)的幼虫有毒。
美国专利5,024,837也描述了杂交的苏云金芽胞杆菌kurstaki变种菌株,它们对鳞翅类昆虫有活性。美国专利4,797,279(对应于EP0221024)公开了一种杂交的苏云金芽胞杆菌,它含有一个来源于苏云金芽胞杆菌变种kurstaki的质粒(它编码一个编码对鳞翅类有毒的晶体蛋白的基因)以及一个来源于苏云金芽胞杆菌tenebrionis的质粒(它编码一个编码对鞘翅类有毒的晶体蛋白的基因)。这一杂交的苏云金芽胞杆菌菌株产生的晶体蛋白具有由苏云金芽胞杆菌kurstaki和苏云金芽胞杆菌tenebrionis所产生的晶体蛋白的特征。美国专利4,910,016(对应于EP 0303379)公开了一种苏云金芽胞杆菌的分离物,称为苏云金芽胞杆菌MT104,它对鞘翅类和鳞翅类具有活性。1.2.4分子遗传学技术促进了蛋白质工程
分子遗传学在过去十年间的革命促进了可以用合理的、有序的方法对蛋白进行过程改造以使其具有改善的特性。定位以及随机突变的方法、聚合酶链式反应(PCRTM)技术、以及在这一领域的相关进展使得人们拥有诸多的工具来改变氨基酸序列,以及在遗传序列背后的各种不同的具有商业、医药、以及农业利益的蛋白质。
随着在过去的十年间所鉴定的晶体蛋白的数目和类型的快速增加,研究者们开始对使用这些技术来改善各种不同的晶体蛋白的杀虫活性进行理论化。理论上,使用本工艺中蛋白质工程师所具有的方法可以对δ-内毒素进行改善,而且也可以合理地设想分离到现在已经分离出来的野生型晶体蛋白的改善的变体。通过增强上述的毒素作用模式*的一个或多个步骤,改进后的分子应具有增强的活性,从而代表了这一领域的突破。如果蛋白中的特定的氨基酸残基被鉴定为是形成作用模式中的一个特定步骤的原因,那么可以以这些残基为目标进行突变以改善性能。1.2.5晶体蛋白的结构分析
苏云金芽胞杆菌毒素的结构分析和随后对这类结构、基元等的功能进行的研究表明晶体蛋白内毒素的特定的区域通常负责特定的功能。
例如,已经发现Cry3Bb和Cry1Ac的结构域1是负责离子通道活性的,这是形成孢子的起始步骤(Walters等,1993;Von Tersch等,1994)。已经发现结构域2和3是负责受体结合和杀虫活性的(Aronson等,1995;Caramori等,1991;Chen等1993;de Maagd等,1996;Ge等,1991;Lee等,1992;Lee等,1995;Lu等,1994;Smedley和Ellar,1996;Smith和Ellar,1994;Rajamohan等,1995;Rajamohan等,1996;Wu和Dean,1996)。结构域2和3中的一些区域也可以影响一些毒素的离子通道活性(Chen等,1993,Wolfersberger等,1996;Von Tersch等,1994)。1.3已有工艺的缺陷
不幸的是,虽然有许多实验室已经尝试过制造突变的晶体蛋白,但是几乎没有人已经制造出对鳞翅类的毒性改善的突变晶体蛋白。在见于文献中的几乎所有的通过基因工程获得的苏云金芽胞杆菌毒素的例子中,突变的晶体蛋白的生物活性并不比野生型的蛋白好,而且在许多情形中,活性反而减少或甚至被破坏了(Almond和Dean,1993;Aronson等,1995;Chen等,1993,Chen等,1995;Ge等,1991;Kwak等,1995;Lu等,1994;Rajamohan等,1995;Rajamohan等,1996;Smedley和Ellar,1996;Smith和Ellar,1994;Wolfersberger等,1996;Wu和Aronson,1992)。
对于一个在其活性毒素中含有大约650个氨基酸的晶体蛋白而言,虽然在这一序列中的每一个位置都可能存在20中不同的氨基酸,任意创造一个成功的新结构的可能性是很渺茫的,即便是一个250-300个氨基酸的链段被指定具有一个一般的功能。实际上,上述的针对晶体蛋白基因突变的已有工艺中的首要关注点是通过使用突变来扰乱作用模式下的一些步骤来研究这些晶体蛋白的结构和功能,而不是通过基因工程来改善这些毒素。
总而言之,在这一工艺中发展杀虫活性提高的合成毒素所取得的有限的成功已经阻滞了这一领域的进步并挫败了对改善的内毒素或晶体蛋白的寻找。不同于遵守简单的、可预测的规则,对一种改善的晶体蛋白的成功的工程改造应该包括不同的策略,这取决于被改善的晶体蛋白以及所针对的害虫。因此,整个过程完全依赖于经验。
因此,传统的重组DNA技术显然不是改善杀虫晶体蛋白的常规的实验手段。在已有的工艺中缺乏的是用于通过基因过程获得杀虫活性提高的,特别是对广谱地鳞翅类害虫的毒性提高的苏云金芽胞杆菌晶体蛋白的合理的方法。2.0本发明的综述
本发明寻求通过提供由基因工程修饰的苏云金芽胞杆菌δ-内毒素(Cry*),特别是经过修饰的Cry3δ-内毒素(称为Cry3*内毒素),来克服在已有的工艺中固有的上述的以及其它的缺点。本发明同时还提供包含一个或多个编码此类修饰蛋白的基因的核苷酸序列。特别优选的基因包括cry3*(如cry3A*、cry3B*、cry3C*基因),特别是cry3B*基因,更为优选的是cry3Bb*基因,这些基因所编码的经过修饰的晶体蛋白对目标害虫的杀虫活性提高了。
同时公开的是用于构建合成的Cry3*蛋白、经过合成的方法修饰的编码这些蛋白的核苷酸序列、以及它们的组合物的新颖的方法。同时提供的还有合成的cry3*表达载体以及使用这些改善的基因和载体的多种不同的方法。在一个优选实施例中,本发明公开并要求保护了Cry3B*蛋白以及编码改善的杀虫多肽的cry3B*。
在一个优选实施例中公开了形成通道的毒素的设计方法,它已经被用于生产特定的一套经过设计的生物活性提高的Cry3Bb*毒素。在表2中列出了这些改进的Cry3Bb*蛋白,以及它们相应的对应于野生型(WT)Cry3Bb的氨基酸变化、在编码蛋白的改变的cry3Bb*基因中存在的核苷变化、相对野生型Cry3Bb的生物活性的级数增加、改变的结构位点、以及用于创造新毒素的设计方法。
相应地,总体上本发明提供了经过突变的编码Cry3蛋白的基因以及制造和使用这些基因的方法。此处所用的术语“经过突变的cry3基因”指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核苷序列,它们所编码的突变体Cry3晶体蛋白(Cry3*)的杀虫活性提高。这些经过突变的cry3基因在详细说明书中已经被称为cry3*基因。cry3*基因的例子包括cry3A*、cry3B*、以及cry3C*基因。
经过突变的编码Cry3蛋白的基因的例子包括cry3B基因。此处所用的术语“经过突变的cry3B基因”指的是一种或多种基因,它们已经被突变或改变成含有一个或多个在野生型序列中所不存在的核苷序列,它们所编码的突变体Cry3B晶体蛋白(Cry3B*)的杀虫活性提高了。这类基因已经被称为cry3B*基因。cry3B*基因的例子包括cry3Ba*、cry3Bb*基因,它们分别编码Cry3Ba*和Cry3Bb*蛋白。
相应地,本发明提供了经过突变的编码Cry3A蛋白的基因以及制造和使用这些基因的方法。此处所用的术语“经过突变的cry3A基因”指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核苷序列,它们所编码的突变体Cry3A晶体蛋白(Cry3A*)的杀虫活性提高。这些经过突变的基因已经被称为cry3A*基因。
相应地,本发明提供了经过突变的编码Cry3C蛋白的基因以及制造和使用这些基因的方法。此处所用的术语“经过突变的cry3C基因”指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核苷序列,它们所编码的突变体Cry3C晶体蛋白(Cry3C*)的杀虫活性提高。这些经过突变的基因已经被称为cry3C*基因。
优选地,新颖的序列包括核苷酸序列,其中至少一个,优选的一个以上,最优选的,相当数量的,野生型的cry3核苷已经被替换为一个或多个核苷,或者一个或多个核苷已经被加入到天然的核苷序列中,或者已经从该序列中删除,以便改变、增加、或删除由如此突变的核苷酸序列所编码的相应的氨基酸。因此,想得到的结果是,相比于未经修饰的晶体蛋白,改变被编码的晶体蛋白的氨基酸序列以提供具有提高或改变的活性以及/或者特异性的毒素。
优选的编码Cry2Bb*的基因包括cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,c?y3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.1 1048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095,以及cry3Bb.11098。
                          表2CRY3Bb*蛋白,显示对抗SCRW幼虫的活力改善了
  Cry-3Bb*蛋白名称   cry3Bb*质粒名称   cry3Bb*核苷序列变化   Cry3Bb*氨基酸序列变化 变化的结构位置 WT活性的级数增加   所使用的设计方法
 Cry3Bb.60Cry3Bb.11221Cry3Bb.11222Cry3Bb.11223Cry3Bb.11224Cry3Bb.11225Cry3Bb.11226Cry3Bb.11227  -pEG1707pEG1708pEG1709pEG1710pEG17llpEG1712pEG1713     -A460T,C461T,A462T,C464A,T465C,T466C,T467A,A468T,A469T,G470C,T472C,T473G,G474T,A477T,A478T,G479CT687C,11688C,A689T,C691A,A692GT667C,T687C,T688A,A689G,C691A,A692GT687C,A692GT687C,C691AT687C,C691A,A692C,T693CC868A,G869A,G870T     Δ1-159T154F,P155R,L156H,L158RY230L,H231SS223P,Y230SH231RH231N.T241SH231TR290N     Δα1-α31α3,4α6α6α6α6α61α7,β1   3.6×6.4×4.0×2.8×5.0×3.6×3.0×1.9×     1,6,81,83,737,877,82.3,46
                              表2(续)
  Cry3Bb*蛋白名称   cry3Bb*质粒名称 cry3Bb*核苷序列变化  Cry3Bb*氨基酸序列变化 变化的结构位置   WT活性的级数增加   所使用的设计方法
 Cry3Bb.11228Cry3Bb.11229Cry3Bb.11230Cry3Bb.11231Cry3Bb.11232Cry3Bb.11233  pEG1714pEG1715pEG1716pEG1717pEG1718pEG1719  C932T,A938C,T942G,G949A,T954CT931A,A933C,T942A,T945A,G949A,A953G,T954CT931G,A933C,C934G,T945G,C946T,A947G,G951A,T954CT687C,A692G,C932T,A938C,T942G,G949A,T954CT931A,A933G,T935C,T936A,A938C,T939C,T942C,T945A,G951T,T954CT931G,A933C,T936G,T942C,C943T,T945A,C946G,G948C,T954C     S311L,N313T,E317KS311T,E317K,Y318CS311A,L312V,Q316WH231R,S311L,N313T,E317KS311T,L312P,N313T,E317NS311A,Q316D   1β1,α81β1,α81β1,α8α6;1β1,α81β1,α81β1,α8   4.1×2 5×4.7×7.9×5.1×2.2×     2,42,42,482,4,7,8,1042,4
                              表2(续)
  Cry3Bb*蛋白名称   cry3Bb*质粒名称   cry3Bb*核苷序列变化   Cry3Bb*氨基酸序列变化 变化的结构位置   WT活性的级数增加   所使用的设计方法
 Cry3Bb.11234Cry3Bb.11235Cry3Bb.11236Cry3Bb.11237Cry3Bb.11238  pEG1720pEG1721pEG1722pEG1723pEG1724  T861C,T866C,C868A,T871C,T872G,A875T,T877A,C878G,A882GT687C,A692G,C932TT931A,C932T,A933C,T936C,T942G,T945A,T954CT931A,C932T,A933C,T936C,A937G,A938T,C941A,T942C,T945A,C946A,A947T,A950T,T954CA933C,T936C,A937G,A938T,C941A,T942C,T945A,C946A,A947T,A950T,T954C   I289T,L291R,Y292F,S293RH231R,S311LS311IS311I,N313HN313V,T314N,Q316M,E317V     1α7,β1α6;1β1,α81β1,α81β1,α81β1,α8   4.1×3.2×3.1×5.4×2.6×     42,4,7,8,102,42,42,4
                              表2(续)
  Cry3Bb*蛋白名称     cry3Bb*质粒名称     cry3Bb*核苷序列变化  Cry3Bb*氨基酸序列变化 变化的结构位置 WT活性的级数增加 所使用的设计方法
 Cry3Bb.11239Cry3Bb.11241Cry3Bb.11242Cry3Bb.11032Cry3Bb.11035Cry3Bb.11036Cry3Bb.11046  pEG1725pEG1726pEG1727pEG1041pEG1046pEG1047pEG1052  A933T,A938G,T939G,T942A,T944C,T945A,A947T,G948T,A950C,T954CA860T,T861C,G862A,C868T,G869T,T871C,A873T,T877A,C878G,A879TC868G,G869TA494GG479A,A481C,A482C,A484C,G485A,A486C,A494GA865G,T877CG479A,A481C,A482C,A484C,G485A,A486C,A494G,A865G,T877C   N313R,L315P,Q316L,E317AY287F,D288N,R290LR290VD165GS160N,K161P,P162H,D165GI289V,S293PS160N,K161P,P162H,D165G,I289V,S293P     1β1,α81α7,β11α7,β1α4α41α7,β1α4;1α7,β1   2.8×2.6×2.5×3.1×2.7×4.3×2.6×   2,42,3,4,62,3,4,6,82,4,8842,4,8,10
                         表2(续)
  Cry3Bb*蛋白名称   cry3Bb*质粒名称     cry3Bb*核苷序列变化   Cry3Bb*氨基酸序列变化 变化的结构位置 WT活性的级数增加   所使用的设计方法
 Cry3Bb.11048Cry3Bb.11051Cry3Bb.11057Cry3Bb.11058Cry3Bb.11081  pEG1054pEG1057pEG1062pEG1063pEG1084     T309A,Δ310,Δ311,Δ312A565G,A566GT309A,Δ310,Δ311,Δ312,G479A,A481C,A482C,A484C,G485A,A486C,A494GT309A,Δ310,Δ311,Δ312,A460T,C461T,A462T,C464A,T465C,T466C,T467A,A468T,A469T,G470C,T472C,T473G,G474T,A477T,A478T,G479CA494G,T931A,A933C,T942A,T945A,G949A,T954C   D103E,ΔA104K189GD103E,ΔA104,S160N,K161P,P162H,D165GD103E,ΔA104,T154F,P155H,L156H,L158RD165G,S311T,E317K  1α2a,2b1α4,51α2a,2b;α41α2a,2b;1α3,4α4,1β1,α8   4.3×3.0×3.4×3.5×6.1×     82,3,42,4,8,101,8,102,4,8,10
                             表2(续)
  Cry3Bb*蛋白名称   cry3Bb*质粒名称   cry3Bb*核苷序列变化 Cry3Bb*氨基酸序列变化 变化的结构位置 WT活性的级数增加   所使用的设计方法
 Cry3Bb.11082Cry3Bb.11083Cry3Bb.11084Cry3Bb.11095Cry3Bb.11098 pEG1085pEG1086pEG1087pEG1095pEG1098   A494G,A865G,T877C,T914C,T931G,A933C,C934G,T945G,C946T,A947G,G951A,T954C,A1043G,T1094CA865G,T877C,A1043GA494G,C932TA1043GA494G,T687C,A692G,C932T,A938C,T942G,G949A,T954C   D165G,I289V,S293P,F305S,S311A,L312V,Q316W,Q348R,V365AI289V,S293P,Q348RD165G,S311LQ348RD165G,H231R,S311L,N313T,E317K  α4;1α7,β1;β1;1β1,α8;β2;β3b1α7,β1;β2α4;1β1,α8β2α4;α6,1β1,α8   4.9×7.4×7.2×4.6×7.9×     2,4,5,8,9,104,5,9,102,4,8,105,92,4,7,8
在许多个说明性的实施例中,本发明者已经显示了用这些方法成功地产生杀虫活性提高的毒素。具体地,本发明者已经鉴定了分析和设计在体内和体外其杀虫活性都得以提高或增强的毒素的独特的方法。
除了对Cry3Bb肽进行修饰以外,受益于本发明教导的人士现在可以对许多种形成通道的毒素,特别是与CTy3Bb在功能上或结构上有关联的蛋白进行突变。实际上,本发明者设想任何苏云金芽胞杆菌晶体蛋白或肽都可以用本发明所公开的方法进行研究,并可以用本发明所公开的方法进行改变以产生杀虫特异性或活性提高的晶体蛋白。或者,本发明者设想受益于本发明教导的本工艺的熟练人士不仅可以制备活性提高的Cry3毒素,还可以制备其它的晶体蛋白,包括在本文中的表1所描述的所有的那些。具体地,本发明者设想可以通过使用本发明中所公开的一种或多种方法来产生活性提高的Cry3*变体毒素。例如,本发明者注意到Cry3A、Cry3B、以及Cry3C晶体蛋白(它们都是本工艺中所熟知的)可以通过使用此处所采用的一种或多种设计策略进行修改以制备通过合成的方法进行修改的活性提高的晶体蛋白。类似地,本工艺的熟练人士甚至可以利用本发明的教导对其它的形成通道的晶体蛋白进行修饰,包括除了苏云金芽胞杆菌晶体蛋白以外的形成通道的毒素,甚至可以对尚未被介绍或定性的蛋白和通道毒素进行修饰。
因为杀虫晶体蛋白的结构显示了明显的蛋白的三级结构保守性(Grochulski等,1995),而且许多晶体蛋白的氨基酸序列与Cry3Bb的氨基酸序列在结构域1中具有显著的同一性,这些蛋白包括Cry1,Cry2,Cry3,Cry4,Cry5,Cry7,Cry8,Cry9,Cry10,Cry11,Cry12,Cry13,Cry14,以及Cry16类别的蛋白(表1)。。现在,在本发明者的令人吃惊的发现的指导下,受益于本发明教导的本工艺的熟练人士第一次可以把本发明的方法广泛地应用于对诸多晶体蛋白进行修饰以改善其活性或改变其特异性。这些方法不应该被局限于表1中所公开的杀虫晶体蛋白,它们可以被用于任何其它的相关的晶体蛋白,包括未被鉴定的那些。
具体地,Cry3A、Cry3B、以及Cry3C蛋白之间的高度同源性可以从这三个蛋白的一级氨基酸序列的对仗中看出(图17A、图17B、以及图17C)。
照这样,采用一种或多种本说明书中所描述的突变设计方法,现在即可将所公布的方法用于制备引入了一种或多种改变的经修饰的晶体蛋白。本发明者们进一步考虑到可以在晶体蛋白或者是其它可通过位点特异性或随机突变进行类似的修饰以产生具有改良活性的毒素,或者可选择的,具有改变的特异性毒素形成通道的一个或多个结构域,内确定区域。
在具体的实施例中,制造活性增强的经改变的毒素以抵抗一种或多种昆虫是合乎需求的。可选择地,利用此处所描述的方法来制造及鉴定已改变的杀虫晶体蛋白,上述的蛋白具有较广谱的抗敏感昆虫活性,也将是合乎需求的。本发明者们进一步考虑到制造含有一个或多个突变的嵌合杀虫晶体蛋白对于预备“超级”毒素将是合乎需求的,该毒素同时具有杀虫活性增强及伴随有广谱活性这两个优点。
按照所公布的内容,在毒素序列内一个或多个密码子的诱变可以导致产生一系列活性增强的相关的杀虫蛋白。虽然本发明针对包括于本发明中的每一个设计策略已经描述了一些突变实施例,但是本发明者们考虑到可以在杀虫晶体蛋白上制造突变,包括在环区域、螺旋区域、毒素的活性位点区域、参与蛋白寡聚化作用的区域等等上进行突变,由此可以形成功能性的生物杀虫晶体蛋白。所有这类突变均被认为包括在本公布的范围之内。
在一个示例性的实施例中,获得了诱变的cry3Bb*基因,它所编码的Cry3Bb*变体大体上是以野生型Cry3Bb序列为基础的,但在该蛋白的氨基酸序列中同时还含有通过使用此处所描述并要求保护的一种或多种设计策略而结合进去的一种或多种变化。
在这些及其它的实施例中,可以对这些编码晶体蛋白的突变基因进行修饰以便在所编码的多肽的一级序列上改变约一个、两个、三个、四个、或五个左右的氨基酸。可选择地,也可引入更多的改变(相对天然序列而言),以便使所编码的蛋白质可以有至少约1%或2%、或者可选择地约3%或约4%、或者甚至约5%至约10%、或者约10%至约15%、或者甚至约15%至约20%或者更多的密码子被改变、删除或被以其它的形式进行修饰。在特定情况下,甚至希望在本质上改变更多的一级氨基酸序列以获得理想的修饰蛋白。在这些情形中,本发明者们预期有从大约25%到大约50%、或者从大约50%到大约75%、或者更多的天然(或野生型)密码子被改变、删除、或以其它的形式进行修饰。可选择地,在氨基酸序列或编码它的DNA基因下的突变,将导致在晶体蛋白或肽类的一个或多个区域内产生一个或多个氨基酸的插入或删除。
为了在编码多肽的一级序列上完成这些突变,希望从编码这些多肽的基因的核苷酸序列中突变或删除一个或多个核苷,或者可选择地,在特定的环境下,在一级核苷酸序列的一个或多个位点上加入一个或多个核苷。经常地,需改变几个核苷残基以获得所需的多肽。因此,本发明者们企图在具体的实施例中,希望在一级序列中改变仅一个、两个、三个、四个、或大约五个核苷。在需要有更多改变的另一些实施例中,诱变可以包括在基因序列上改变、删除、或插入6、7、8、9、10、11、12、13、14、15、16、17、18、19、或者甚至20个左右的核苷残基。在又一些实施例中,可能会希望在基因的序列中突变、删除、或插入21、22、23、24、25、26、27、28、29、30-40、40-50、50-60、60-70、70-80、80-90、或者甚至90-100、150、200、250、300、350、400、450个或更多的核苷,目的是制备产生具有理想特性的Cry3*多肽的cry3*基因。实际上,任何数目的突变、删除、和/或插入都可以在基因的一级序列上进行,只要所编码的蛋白具有提高的杀虫活性或此处所描述的特异性的特征。
在编码内毒素基因的核苷序列上改变很多密码子可能是特别理想的,而且经常是获得理想效果所必需的,尤其是在“植物化”一段DNA序列以使非植物来源的DNA在经转化的植物细胞中表达的情形下。这些方法对于植物遗传学工艺的技术人员来说是常规的,而且经常会改变初级基因序列上的许多残基以帮助该基因在植物细胞中表达。优选的,这些基因序列上的改变没有在氨基酸序列上引入变化,或者仅在氨基酸序列上引入了保守的替换,以使在植物细胞中从“植物化”的核苷序列上所生产的多肽依然具有完全的功能,以及当在植物细胞中表达时仍具有所希望的性质。
以本发明中的方式突变的基因和所编码的蛋白也可有效地与编码其它蛋白的核苷酸序列相连,或者作为融合蛋白表达。N端和C端的融合蛋白均是合乎需求的。事实上,任何编码蛋白或多肽的DNA序列、或者它们的组合,均可与突变的cry3*序列融合以编码一种融合蛋白。这包括一系列编码以下物质的DNA序列:引导肽、用于重组体表达的蛋白、一种或多种引导肽所附着的蛋白、蛋白亚基、来源于一种或多种晶体蛋白的区域,等等。对初级核苷酸序列所进行的这类修饰(其目的是增强、定向、或优化在特定宿主细胞,组织,或细胞定位中的基因序列的表达)是蛋白质工程和分子生物学工艺中的技术人员所熟知的,而且对于受益于本发明详细说明的技工而言,如何便利在核苷序列中进行这些变化以生产此处所公布的多肽和多聚核苷酸也将显而易见。
在一方面,本发明公开了并要求保护含有一种或多种此处所公布的经过修饰的晶体蛋白的宿主细胞,特别是以下苏云金芽胞杆菌株系的细胞:EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098,它们包含编码通过合成进行修饰的杀虫活性提高的Cry3Bb*晶体蛋白的重组DNA片段。
同样地,本发明也公开并要求保护了以下苏云金芽胞杆菌菌株的细胞培养物:EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098。
这类细胞培养物可以是包括单一株系的具生物学纯度的培养物,或者可选地,可以是包括一种或多种株系的共培养的细胞。这种细胞培养物可以在一定的条件下培养,在这种条件下,一种或多种另外的苏云金芽胞杆菌或其它细菌的菌株与一种或多种公开的培养物同时进行共培养,或者可选地,一种或多种本发明中的细胞培养物可以与一种或多种另外的苏云金芽胞杆菌或其它细菌菌株在各自的独立培养之后再组合。当悬浮的细胞中含有两种或更多不同的所需要的晶体蛋白时,这种操作将是有用的。
本发明的培养物已经被保藏在特定的条件下,这个条件确保这些培养物在本发明悬而未决期间可以提供给由Commissioner ofPatents and Trademarks 17 C.F.R.第1.14节以及35 U.S.C.第122节所确定的人士,并根据外国专利法的要求,这些保藏物在提交有本发明等同发现或其派生发明的国家可以获得。然而应该理解的是,可以得到保藏物并不等于被准许可以在损害由政府行为所核权的专利权的情形下实施本发明。
进而,本发明的培养物保藏将根据《微生物存贮布达佩斯公约》的规定进行保藏并对公众公开,即,将根据需要对其进行足够的照顾以使其在最近一次要求完成样品保藏之后的至少5年内、以及在任何情形中,在保藏日期之后的至少30年间或者在任何可能公开该培养物的发明的有效期限之内保持其存活并不受污染。当保藏处在被要求时因为保藏条件的原因无法提供培养物时,保藏者承担替换保藏物的责任。任何针对本发明培养物对公众公开的限制在对它们进行公开的发明被接受之后即永久性地被消除。
表3中列出的培养物根据布达佩斯公约的条款被保藏在Agricultural Research Service Culture Collection,NorthernRegional Research Laboratory(NRRL)的永久性保藏库中。
                            表3
根据布达佩斯公约的条款储存的本发明的菌株
  菌株     储存日期     蛋白   访问号
(NRRL号码)
 EG11032     5/27/97     Cry3Bb.11032   B-21744
 EG11035     5/27/97     Cry3Bb.11035   B-21745
 EG11036     5/27/97     Cry3Bb.11036   B-21746
 EG11037     5/27/97     Cry3Bb.11037   B-21747
 EG11046     5/27/97     Cry3Bb.11046   B-21748
 EG11048     5/27/97     Cry3Bb.11048   B-21749
 EG11051     5/27/97     Cry3Bb.11051   B-21750
 EG11057     5/27/97     Cry3Bb.11057   B-21751
 EG11058     5/27/97     Cry3Bb.11058   B-21752
 EG11081     5/27/97     Cry3Bb.11081   B-21753
表3(续)
 EG11082     5/27/97     Cry3Bb.11082   B-21754
 EG11083     5/27/97     Cry3Bb.11083   B-21755
 EG11084     5/27/97     Cry3Bb.11084   B-21756
 EG11095     5/27/97     Cry3Bb.11095   B-21757
 EG11204     5/27/97     Cry3Bb.11204   B-21758
 EG11221     5/27/97     Cry3Bb.11221   B-21759
 EG11222     5/27/97     Cry3Bb.11222   B-21760
 EG11223     5/27/97     Cry3Bb.11223   B-21761
 EG11224     5/27/97     Cry3Bb.11224   B-21762
 EG11225     5/27/97     Cry3Bb.11225   B-21763
 EG11226     5/27/97     Cry3Bb.11226   B-21764
 EG11227     5/27/97     Cry3Bb.11227   B-12765
 EG11228     5/27/97     Cry3Bb.11228   B-12766
 EG11229     5/27/97     Cry3Bb.11229   B-21767
 EG11230     5/27/97     Cry3Bb.11230   B-21768
 EG11231     5/27/97     Cry3Bb.11231   B-21769
 EG11232     5/27/97     Cry3Bb.11232   B-12770
 EG11233     5/27/97     Cry3Bb.11233   B-21771
 EG11234     5/27/97     Cry3Bb.11234   B-21772
 EG11235     5/27/97     Cry3Bb.11235   B-21773
 EG11236     5/27/97     Cry3Bb.11236   B-21774
 EG11237     5/27/97     Cry3Bb.11237   B-21775
 EG11238     5/27/97     Cry3Bb.11238   B-21776
 EG11239     5/27/97     Cry3Bb.11239   B-21777
 EG11241     5/27/97     Cry3Bb.11241   B-21778
 EG11242     5/27/97     Cry3Bb.11242   B-21779
同时公布的是从环境中控制或根除一种昆虫种群的方法。这种方法大致包括将所要控制或根除的昆虫种群与一种杀虫有效剂量的Cry3*晶体蛋白复合物联系起来。优选的Cry3*复合物包括Cry3A*、Cry3B*和Cry3C*多肽复合物,其中Cry3B*复合物尤其优选。这些多肽的例子包括选自含有以下蛋白的群体:Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095,以及Cry3Bb.11098。
在优选的实施例中,这些Cry3B*晶体蛋白复合物包括以下任一氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。2.1产生修饰的Cry*蛋白的方法
本发明中经过修饰的Cry*多肽可以通过一个特定的程序进行制备,该程序通常包括以下步骤:获得一段编码Cry*多肽的核苷酸;分析该多肽的结构以鉴定特定的对该基因序列进行突变的“目标”位点;在该核苷酸序列中引入一个或多个突变以改变所编码的多肽序列中的一个或多个氨基酸残基;以及在一个经过转化的宿主细胞中,在一个能够有效获得由该cry*基因编码的经过修饰的Cry*蛋白的条件下表达经过突变的核苷酸序列。
用于获得本发明多肽的晶体结构的方法是公知的,在本发明的第9节中给出了几套示范性的高分辨率晶体结构,其中包括本发明所描述的Cry3A和Cry3b多肽的晶体结构。第9节中所提供的信息使得可以进行本发明中每一方法中所描述的分析,这些分析依赖这些三维晶体结构信息来把多肽的突变定位到这些δ-内毒素的一级氨基酸序列的特定区域,从而获得杀虫活性提高或杀虫特异性增强的突变体。
用于获得如本发明所述的杀虫活性或杀虫特异性提高的经过修饰的苏云金芽胞杆菌Cry3Bb δ-内毒素的第一种方法通常包括:获得该内毒素的高分辨率三维晶体结构;在该晶体结构中定位一个或多个结合水区域,其中的结合水形成了一个连续的亲水性表面,这些亲水表面分隔不超过16_;通过增加该蛋白在该区域的一个或多个氨基酸的疏水性来增加该表面上的水分子数目;获得如此生产的经过修饰的δ-内毒素。示例性的δ-内毒素包括Cry3Bb.11032、Cry3Bb.11227、Cry3Bb.11241、Cry3Bb.11051、Cry3Bb.11242、以及Cry3Bb.11098。
用于获得杀虫活性杀虫特异性提高的经过修饰的苏云金芽胞杆菌Cry3Bbδ-内毒素的另一种方法通常包括:在δ-内毒素中确定一个loop区;对该loop区的一个或多个氨基酸进行修饰以增加氨基酸的疏水性;获得如此生产的经过修饰的δ-内毒素。优选的通过这一方法生产的δ-内毒素包括Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11233,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,以及Cry3Bb.11239。
本发明同时还提供了一种用于增加苏云金芽胞杆菌Cry3bδ-内毒素的形成通道的螺旋的运动性的方法。该方法通常包括打断在一个或多个在形成通道的螺旋中的一个氨基酸以及δ-内毒素的另一个氨基酸之间所形成的氢键。氢键可以形成于分子间或分子内,但是氢键的打断应该包括用第三个氨基酸替代第一个或第二个氨基酸,上述第三个氨基酸的空间距离应大于3_,或者它的相对于第一个或第二个氨基酸的氢结合位点空间取向键角不等于180+/-60°。用此种方法生产的并在本发明种描述的δ-内毒素包括:Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11231,Cry3Bb.11241,Cry3Bb.11242,以及Cry3Bb.11098。
同时公开的还有一种增加在苏云金芽胞杆菌Cry3Bb δ-内毒素的形成通道的结构域的环区的柔韧性的方法。这一方法包括:获得具有一个或多个环区的Cry3Bb δ-内毒素的晶体结构;鉴定组成环区的氨基酸;以及改变一个或多个氨基酸以减少环区的立体障碍,其中这一改变增加了δ-内毒素环区的柔韧性。采用这一方法生产的δ-内毒素包括:Cry3Bb.11032,Cry3Bb.11051,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11227,Cry3Bb.11234,Cry3Bb.11241,Cry3Bb.11243,Cry3Bb.11036,以及Cry3Bb.11098。
本发明的另外一个方面是一种用于增强δ-内毒素活性的方法,包括减少或消除δ-内毒素对目标昆虫肠道中碳水化合物的结合。这种减少和消除可以通过除去δ-内毒素结构域1中的一个或多个α螺旋来实现,例如除去α螺旋α1,α2a/b,以及α3。用这种方法生产的一种示例性的δ-内毒素是Cry3Bb.60。
可选地,这种减少和消除可以通过把环区β1,α8中的一个或多个氨基酸替换为一个或多个疏水性增强的氨基酸来实现。这种方法可以产生如Cry3Bb.11228,Cry3 Bb.11230,Cry3B.11231,Cry3Bb.11237,以及Cry3Bb.11098等δ-内毒素,这些δ-内毒素在本发明中都有详细的描述。
可选地,这种减少和消除可以通过把特定的一个或多个氨基酸替换为任何一种别的氨基酸来实现。这些替换描述于表2和本发明的实施例中。一个实施例是此处称为Cry3 Bb.11221的δ-内毒素。
一种确定Cry3Bb δ-内毒素中用于定点突变的区域的方法包括:获得δ-内毒素的一个晶体结构;从晶体结构中确定该蛋白中一个或多个暴露于表面的氨基酸;对这些暴露于表面的一个或多个氨基酸进行随机替换以获得许多突变的多肽,其中至少50%的突变多肽丧失杀虫活性;以及从这些诸多的突变多肽中鉴定一个或多个Cry3Bb δ-内毒素的区域用于定点突变。这一方法可以进一步包括确定这些诸多的杀虫活性丧失的突变多肽的氨基酸序列,以及鉴定杀虫活性所必需的一个或多个氨基酸。
在一个实施例中,本发明提供了一个用于生产一种杀虫活性改善的Cry3Bb δ-内毒素的工序。这一工序通常包括以下步骤:获得该蛋白的高分辨率晶体结构;确定该蛋白的静电表面分布;鉴定一个或多个静电差异大的区域;通过改变该区域的一个或多个氨基酸来改变该区域的静电差异;以及获得一个杀虫活性改善的Cry3Bb δ-内毒素。在一个实施例中,可以减少静电差异(相对天然的Cry3Bb δ-内毒素的静电差异而言)。静电差异减少的δ-内毒素的例子包括Cry3Bb.11227,Cry3Bb.11241.以及Cry3Bb.1124212。可选地,可以增加静电差异(相对天然的Cry3Bbδ-内毒素的静电差异而言)。静电差异增加的δ-内毒素的一个例子是Cry3Bb.11234。
另外,本发明还提供了一种生产杀虫活性提高的Cry3Bb δ-内毒素的方法,包括:获得一个高分辨率的晶体结构;鉴定该蛋白中一个或多个金属结合位点的存在;改变该结合位点的一个或多个氨基酸;以及获得一个经过改变的杀虫活性改善的蛋白。这种改变可以包括去除一个或多个金属结合位点。这种δ-内毒素的例子包括Cry3Bb.11222,Cry3Bb.11224,Cry3Bb.11225,以及Cry3Bb.11226。
本发明的另外一个方面涉及一种鉴定一种通道活性改善的苏云金芽胞杆菌Cry3Bb δ-内毒素的方法。这一方法总体上包括:获得一种被怀疑通道活性改善的Cry3Bb δ-内毒素;确定该δ-内毒素的一个或多个以下的特征;以及把这些特征与野生型的未经修饰的δ-内毒素的进行比较:(1)通道形成速率,(2)通道导率的生长速率,或(3)通道开启状态的持续时间。从这一比较可以选择一种通道形成速率提高(相对于野生型δ-内毒素)的δ-内毒素。用这一方法制备的Cry3Bb δ-内毒素包括Cry3Bb.60,Cry3Bb.11035,Cry3Bb.11048,Cry3Bb.11032,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11226,Cry3Bb.11221,Cry3Bb.11242,Cry3Bb.11230,以及Cry3Bb.11098。
本发明同时还提供了一种用于生产一种经过修饰的、杀虫活性改善的Cry3Bb δ-内毒素的方法,包括:改变一个或多个定位于两个或多个Cry3Bb δ-内毒素环区的收敛最大的位置或其附近的非表面氨基酸以便减弱这些环区中的一个或多个的运动性。运动性可以便利地通过比较经过修饰的蛋白和野生型的Cry3Bb δ-内毒素的热变性的区别来确定用这种方法产生的晶体蛋白的例子有Cry3Bb.11095。
本发明的另外一个方面涉及一种用于制备一种经过修饰的、杀虫活性改善的苏云金芽胞杆菌Cry3Bb δ-内毒素的方法,包括:修饰环区的一个或多个氨基酸以增加上述氨基酸的疏水性;改变上述氨基酸中的一个或多个以减少环区的立体障碍,其中这种改变增加了该内毒素环区的柔韧性。由此生产的Cry3Bb δ-内毒素的例子有Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11231,Cry3Bb.11235,以及Cry3Bb.11098。
本发明还提供了一种改善苏云金芽胞杆菌Cry3Bb δ-内毒素的杀虫活性的方法,通常包括在δ-内毒素的结构域1中的一个或多个环区中插入一个或多个对蛋白酶敏感的位置。优选地,这一环区是α3,4。如此生产的一个δ-内毒素的例子是Cry3Bb.11221。2.2多肽组合物
用此处所描述的各种方法所生产的晶体蛋白也代表了本发明的一些重要的方面。这些晶体蛋白优选地包括选自以下群体的一种蛋白或肽:Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236.Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry’3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095,以及Cry3Bb.11098。
在优选的实施例中,蛋白含有选自以下群体的一种连续的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,以及序列编号:108。
特别优选的是那些由以下核苷酸序列编码的晶体蛋白:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107,或者是一种在中等严格的条件下与以下的核苷酸序列杂交的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。
包括在本发明范围之内的氨基酸、肽和蛋白序列包括但不局限于以下序列编号中所述的序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,以及序列编号:108。在氨基酸序列上所作的改变包括变更、删除、突变以及同系物。
本发明提供了含有大约0.5%至大约99%(重量比)之间、或者更优选地大约5%至75%之间、或者大约25%至50%之间的晶体蛋白的组合物。这些组合物可以通过使用技术人员所熟知的蛋白质生产和纯化技术以及本发明所描述的方法容易地进行制备。这种用来制备一种Cry3Bb*晶体蛋白的步骤通常包括以下步骤:在能够有效地生产晶体蛋白的条件下培养一种能够表达Cry3Bb*蛋白的宿主细胞(如苏云金芽胞杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,或EG11098细胞);以及随后获得如此生产的晶体蛋白。
蛋白可以存在于完整的细胞中,这样随后就不需要任何蛋白分离和纯化的步骤。可选地,可以把细胞打破、超声处理、裂解、断裂、或使其质壁分离以便从遗留的细胞碎片中释放晶体蛋白。在这种情形中,可能会希望在使用之前,如在配制杀虫组合物之前,分离、浓缩、或进一步纯化由此获得的含有蛋白的晶体。可以把蛋白纯化到最后几乎仅含有纯的蛋白,或者可选地,可以把其纯化或分离到一个程度,使得该组合物含有大约0.5%至大约99%(重量比)之间、或者在大约5%至大约95%之间、或者在大约15%至大约85%之间、或者在大约25%至大约75%之间、或者在大约40%至大约60%之间等的晶体蛋白。2.3表达cry3*基因的重组载体
本发明的一个重要的实施例是一种重组载体,它含有一个编码一个或多个此处所述的新颖的苏云金芽胞杆菌晶体蛋白的核苷酸片段。这种载体可以被转移到一个原核或真核宿主中并在其中复制,其中特别优选的原核细胞是细菌细胞、而特别优选的真核细胞是植物细胞。
在优选的实施例中,重组载体含有一个编码以下氨基酸序列的核苷酸片段:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。特别优选的是那些含有以下序列的核苷酸片段:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。
本发明的另外一个重要的实施例是一个经过转化的宿主细胞,它可以表达这些重组载体中的一个或多个。宿主细胞可以是真核的,也可以是原核的,而且特别优选的宿主细胞是那些表达含有重组载体载体的核苷酸片段,其中的重组载体编码一个或多个苏云金芽胞杆菌晶体蛋白,其中的晶体蛋白在结构域1的一个或多个环区,或者在结构域1的α螺旋7和结构域2的β链1(β strand 1)之间,含有经过改变的氨基酸序列。细菌细胞是特别优选的原核细胞,而植物细胞是特别优选的真核细胞。
在一个重要的实施例中,本发明公开了一种宿主细胞并对其提出了权利要求,其中经过修饰的氨基酸序列在结构域1中的α螺旋1和2之间、α螺旋2和3之间、α螺旋3和4之间、α螺旋4和5之间、α螺旋5和6之间、α螺旋6和7之间,或者在结构域1的α螺旋7与结构域2的β线1之间,含有一个或多个环区。一个特别优选的宿主细胞是一个含有以下氨基酸序列的宿主细胞:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,以及更为优选的,一个含有以下核苷酸序列的宿主细胞:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。
本发明描述了用编码根据本发明的经过修饰的Cry3Bb晶体蛋白的核苷酸序列转化的细菌宿主细胞并对其提出了权利要求,具体是那些被称为EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EC11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,或EG11098的一种苏云金芽胞杆菌细胞。
在另一个实施例中,本发明包括了一种使用本发明的编码cry3Bb*基因的核苷酸片段的方法。这一方法总体上包括以下步骤:(a)制备一个重组载体,在这个载体中cry3Bb*基因被定位成可以受到启动子的控制;(b)把重组载体导入宿主细胞;(c)在可以有效表达由上述的cry3Bb*基因编码的Cry3Bb*晶体蛋白的条件下培养宿主细胞;以及(d)获得所表达的Cry3Bb*蛋白或肽。
有许多种方法可以被用于在可以稳定保持和表达一个表达毒素的苏云金芽胞杆菌基因的条件下把这一基因导入到微生物宿主中。可以供给DNA构建物,这些DNA构建物应包括用于表达这一毒素基因的转录和翻译调控信号;受它们调控的毒素基因;以及一个与宿主生物体中的一个序列同源的DNA序列,通过这一序列来实现整合;以及/或者一个在宿主中可以发挥功能的复制系统,通过这一系统来实现整合或稳定保持。
转录起始信号将包括一个启动子和一个转录起始位点。在一些情形中,为毒素提供调节性的表达是合乎需求的,其中毒素的表达只有在被放入外部环境之后才会发生。这可以用启动子、或一个结合到一个激活因子上的区域、或增强子来实现,它们可以在微生物的物理和或化学环境发生变化的时候进行诱导。例如,可以使用对温度敏感的调节区域,其中生物体可以在实验室中进行培养,但并不表达毒素,但是一旦被释放到环境中,就开始表达。其它的技术可以在实验室中应用一种特定的营养介质,这种培养基抑制毒素的表达,但是环境中的营养介质可以使毒素表达。可以用一个核糖体结合位点和一个起始位点来启动转录。
可以用各种不同的操作来增强信使RNA的表达,特别是通过使用一个具有活性的启动子,以及通过使用一些增加信使RNA稳定性的序列。转录和翻译终止区域将包括一个或多个终止密码,一个终止子区域,以及一个可选的多聚腺苷化作用信号。可以在被翻译的多肽序列的氨基端采用一个疏水的“引导”序列以便增强蛋白跨内膜分泌。
沿着转录的方向,即从编码或有义序列的5’端到3’端,构建物将包括转录调控区(如果有的话);启动子,其中调节区域可以是启动子的5’端或3’端;核糖体结合位点;起始密码子;含有一个开读框的结构基因,该结构基因协调地具有起始密码、终止密码、多聚腺苷酰化作用信号序列(如果有的话)、以及终止区域。双链形式的这个序列可以被自身用于微生物宿主的转化,但是通常都包含有一段含有标记物的DNA序列,其中第二个DNA序列可以在把DNA引入宿主时被连接到毒素表达构建物上。
借助于一个标记物,使得结构基因能够选择已被修饰或转化的宿主。标志物通常可以提供选择性的优点,例如,提供对生物杀伤剂,例如抵抗抗生物素或重金属的抗性;互补作用,以便为营养缺陷型的宿主提供原养,等等。优选地使用互补作用,以便不仅对经过修饰的宿主进行选择,同时还可使其在田间具有竞争力。可以在建立构建物时使用一个或多个标记物,也可以用它们来修饰宿主。可以通过提供相对于田间野生型的微生物的竞争性优点来进一步对生物体进行修饰。例如,可以把表达金属螯合剂(如siderophores)的基因与表达毒素的结构基因同时导入宿主中。这样,siderophores表达的增强可以为生产毒素的宿主提供一个竞争性的优点,这样它就可以与野生型的微生物有效地进行竞争并在环境中占领一片活动范围。
在没有功能性复制系统存在的情况下,构建物将同时包括一个序列,该序列至少有50碱基对(bp)的序列,优选的至少有100bp,更优选的有1000bp,而且通常不多于2000bp的序列与宿主中的一个序列是同源的。这样,正确重组的可能性就得到了增加,这样基因将被整合到宿主中并由宿主稳定地保存。合乎需要的是,毒素基因将和提供互补作用的基因以及提供竞争性优点的基因非常靠近。这样,当毒素基因丢失时,如此获得的生物体也将丢失起互补作用的基因以及/或者提供竞争性优点的基因,这样宿主将无法在环境中参与竞争,只是基因仍保留在原封不动的构建物中。
从范围广泛的微生物宿主如细菌、噬菌体、蓝藻、藻类、真菌、等等中可以获得数量众多的转录调节区域。各种不同的转录调节区域包括与以下相关联的区域:trp基因、lac基因、gal基因、λL和λR启动子、tac启动子、与δ-内毒素基因相关联的天然启动子,它们在宿主中都具有活性。参照美国专利4,332,898;4,342,832;和4,356,270,它们都被特定地作为参照结合于本发明中。终止区域可以是通常与转录起始区域相关的终止区域,或者也可以是一个不同的转录终止区域,只要这两个区域是可兼容的而且在宿主中是具有活性的。
如果需要稳定的游离基因维持或整合,可以采用一种其复制系统可以在宿主中发挥功能的质粒。复制系统可以来源于染色体、通常存在于宿主或另一个宿主中的游离基因元件、或者来源于病毒的在宿主中可以稳定存在的复制系统。由许多质粒可供选择,如pBR322、pACYCI84、RSF1010、pR01614、等等。可参考,例如Olson等(1982);Bagdasarian等(1981);Baum等(1990);以及美国专利4,356,270;4,362,817;4,371,625;以及5,441,884,以上都特定地作为参照结合于本发明中。
可以在转录和翻译起始区域以及转录和翻译终止区域之间导入苏云金芽胞杆菌基因以便可以让其受到起始区域的调控。可以把这一构建物包括于一个质粒中,这个质粒应包括至少一个复制系统,但是可以包括一个以上,其中一个复制系统是用于在质粒的发育过程中进行克隆的,第二个复制系统则是它在最终的宿主中发挥功能所必需的。另外,可以由一个或多个标记物,标记物已经在上面描述了。当需要整合时,质粒包括一个与宿主基因组同源的序列是合乎需求的。
可以根据传统的方法来分离转化体,通常使用的是一种可以把想要的生物体从未经修饰的生物体或转化(fransferring)生物体(如果有的话)中筛选出来的筛选技术。然后可以试验转化体的杀虫活性。如果需要,可以通过定点重组系统选择性地把不需要的或者辅助性的DNA序列从重组细菌中除去,如在美国专利5,441,884中所描述的(该专利特定地作为参照结合于本发明中)。2.4cry3 DNA片段
一种编码一种在其肽中的一个或多个区域含有一个或多个突变的晶体蛋白的苏云金芽胞杆菌cry3*基因构成了本发明的一个重要的方面。优选的是那些编码一个氨基酸序列的cry3*基因,其中上述的氨基酸序列中的一个或多个氨基酸已经被根据本发明中所述的方法进行了改变,特别是那些以改变晶体蛋白的杀虫活性或特异性未目的的变化。
根据本发明,核苷酸序列包括但不局限于DNA,包括但不局限于cDNA和基因组DNA、基因;RNA,包括但不局限于mRNA和tRNA;反义序列、核苷酸、以及如下所述的合适的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107,以及包括能够表达本发明的经过修饰的苏云金芽胞杆菌毒素的变更、删除、突变、以及同源物的核苷酸序列中的改变。
因此,本发明同时还涉及DNA片段,它们独立于总的基因组DNA并编码如本发明中所述的新颖的通过合成的方法进行修饰的晶体蛋白。编码这些蛋白种类的DNA片段可能能够编码与晶体蛋白相关的或无关的基因产品的蛋白、多肽、亚基、功能性结构域,等等。另外,可能能够使用本工艺熟练人士所公知的方法完全地在体外合成这些DNA片段。
如此处所述,术语“DNA片段”指的是已经被从特定物种的总基因组DNA中分离出来的DNA分子。因此,一个编码一种晶体蛋白或肽的DNA片段指的是一个DNA片段,它含有晶体蛋白编码序列而且已经被从该DNA片段所取自的物种的总基因组DNA中分离或纯化出来,在实施例中,上述的总基因组DNA指的是一种格兰氏阳性细菌种属,即杆菌,具体的是被称为苏云金芽胞杆菌的杆菌种属,的基因组。术语“DNA片段”所包括的有:DNA片段以及这类DNA片段的更小的片段;以及重组载体,包括例如质粒、粘粒、噬菌粒、噬菌体、病毒、等等。
类似地,一个含有经过分离或提纯的编码晶体蛋白的基因的DNA片段指的是一个DNA片段,它除了含有编码肽的序列以外,还含有特定的其它一些的元件,如调控序列,这些序列是从其它的天然的基因或编码蛋白的序列中分离出来的。考虑到这种情况,简单地用术语“基因”来指代一个编码功能性蛋白、多肽或肽的单位。如行内人士所可以理解的,这一功能性的术语同时包括基因组序列、启动子序列以及更小的通过基因工程制备的基因片段,它们可以表达或者适合于表达蛋白、多肽或肽。
“从其它的编码序列中分离出来”指的是所感兴趣的基因(在本发明中指的是编码细菌晶体蛋白的基因)构成了该DNA片段编码区域的主要部分,而且该DNA片段不含有很大部分的天然的编码DNA,如大的染色体片段或其它的功能性基因或操纵子编码区域。当然,这一术语指的是开始时所提取的DNA片段,并不排除随后人工地加入到该片段中的基因、重组基因、合成连接物、或者编码区域。
特别优选的DNA序列是那些编码以下晶体蛋白的序列:Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095以及Cry3Bb.11098。特别是如以下的3Bb*基因:cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cry3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095以及cry3Bb.11098。在特别的实施例中,本发明涉及分离的DNA片段以及整合了编码Cry肽种类的重组载体,上述的肽种类在其氨基酸序列中包含有如以下序列编号中所述的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。
术语“一个基本如在以下序列编号中所述的序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108”指的是这一序列对应于以下序列的一部分:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,而且与这些序列的氨基酸差异相对较少,或者是这些序列的氨基酸的功能性等同物。术语“生物学功能等同物”在本工艺中是众所周知的,而且在本发明中有更进一步的定义(例如,见实施例)。
相应地,与以下氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102或序列编号:108,或这些序列的功能性等同物有大约70%至大约75%、或大约75%至大约80%、或更优选地大约81%至大约90%、或甚至更优选地大约91%或大约92%或大约93%或大约97%或大约98%至大约99%同一性的序列或功能等同物即为“基本如以下序列中所提供的序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。”
同时还应该理解的是:氨基酸和核苷酸序列可以包括另加的残基,如另加的N-端或C-端的氨基酸或5’端或3’端的序列,但同时还是与如本发明中所述的其中一个序列基本相同,只要该序列符合上述的标准,包括在涉及蛋白表达时蛋白生物学活性的保持。特别地核苷酸序列的末端序列的添加可以适用于,例如,包括编码区5’端和3’端的侧翼的多种非编码序列或包括各种不同的内部序列,即内含子,已知其存在于基因内部。
本发明的核苷酸片段,不管其编码序列本身的长度如何,可以与其它的DNA序列,如启动子、多聚腺苷酰化作用信号、另加的限制性酶切位点、多重克隆位点、其它的编码片段,等等相结合,以使其整体长度可以有很大的差别。因此设想可以使用几乎任意长度的核苷酸片段,其总长度优选地被限制以便利制备和所需要的重组DNA协议的操作。
例如,可以制备一个包括一个编码以下所述的肽序列的短的连续序列的核苷酸片段:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,或者制备一个与编码以下序列中所公开的肽的DNA序列同一或是互补的核苷酸片段:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,特别是那些在以下序列编号中所公开的DNA片段:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。
本发明特别优选的核苷酸序列含有一个或多个本发明的cry基因,或者含有一个或多个本发明的cry基因的一部分。在特定的应用中,相对教小的连续的核苷酸序列是优选的,例如那些长度为大约14或15或16或17或18或19或20或30-50、51-80、81-100等等个核苷的核苷酸序列。可选地,在某些实施例中,特别是在涉及重组载体制备的实施例中,对宿主细胞进行转化、制备转基因植物细胞、制备更长的核苷酸片段是优选的,特别是那些包括一个或多个cry基因的全部编码区域的核苷酸片段。因此,优选的片段包括那些长度为大约20,000左右个碱基对的片段,可选地,包括较短的大约为19,000,大约为18,000,大约为17,000,大约为16,000,大约为15,000,大约为14,000,大约为13,000,大约为12,000,大约为11,000,大约为10,000,大约为9,000,大约为8,000,大约为7,000,大约为6,000,大约为5,000,大约为4,500,大约为4,000,大约为3,500,大约为3,000,大约为2,500,大约为2,000,大约为1,500,大约为1,000,大约为500,或大约为200左右个碱基对的片段。当然,这些数目并没有覆盖所有可能的介于20,000至15个核苷的中等长度的片段,所有这些中等长度的片段也被认为是有用的,同时也归属于本发明的范围之中。很容易理解“中等长度”指的是介于所述范围的任何长度,如14,15,16,17,18,19,20,等;21,22,23,24,25,26,27,28,29,等;30,31,32,33,34,35,36.....等;40,41,42,43,44等,50,51,52,53等;60,61,62,63....等,70,80,90,100,110,120,130等;200,210,220,230,240,250等,包括介于14-10,000之间的任何一个整数,包括那些介于200-500;500-1,000;1,000-2,000;2,000-3,000;3,000-5,000之间等的整数。
在一个优选实施例中,核苷酸片段包括一个介于1800至18,000个碱基对之间的序列,并包括一个或多个如本发明中所述的编码经过修饰的Cry3Bb*多肽的基因,其中所述的多肽对抗鞘翅类害虫的活性增强了。
同时应该理解的是,本发明并不局限于编码本发明中所述的肽的、或者编码以下氨基酸序列的特定的核苷酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,包括在以下序列编号中特别公开的DNA序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。因此,重组载体和经过分离的DNA片段可以以不同的方式包含有编码肽的区域本身、在基本编码区域含有选定的变更或修饰的编码区域,或者它们可以编码更大的多肽,但是这些多肽仍含有这些编码肽的区域;或者编码生物学功能等同的蛋白或肽,这些肽可以含有不同的氨基酸序列。
本发明的DNA片段包括具有生物学功能的等同的肽。这种序列可以是密码子冗余度以及功能等同性的结果,已经知道这两种情况在核苷酸序列和由其编码的蛋白中是天然存在的。可选地,功能等同蛋白或肽可以通过应用重组DNA技术来产生,其中可以用基因工程根据所要交换的氨基酸的性质对蛋白进行改变。可以用定点突变技术来引入由人设计的变化,例如,引入蛋白抗原性的改善或者对突变体进行试验以检验其分子水平的活性。
如果需要也可以制备融合体蛋白和肽,例如,把编码肽的区域与其它的具有所要功能的蛋白或肽连接在同一表达单位中,以用于纯化或免疫鉴定目的(例如,蛋白可以分别通过亲和层析和酶标编码区域进行纯化)。
重组载体构成本发明的另一个方面。特别有用的载体被认为是那些载体,其中DNA片段的编码部分,不管编码全长的蛋白或者是教小的肽,都被定位于启动子的控制之下。启动子可以是与编码本发明肽的基因天然地联合在一起的那种启动子,也可以通过分离位于编码片段或外显子上游的5’端的非编码序列来获得,例如,使用重组克隆技术以及/或者PCRTM技术并结合本发明种所述的组合物。2.5载体、宿主细胞以及蛋白表达
在其它的实施例中,设想通过把编码DNA片段定位于接受重组或异源启动子的控制之下可以获得一些特定的长处。此处所用的重组的或异源的启动子指的是一种在其天然环境下并不于编码晶体蛋白或肽的DNA片段相关联的启动子。这类启动子可以包括正常与其它基因相关联的启动子,以及/或者从任何细菌、病毒、真核生物、或植物细胞中提取的启动子。自然地,使用一种可以有效地引导DNA片段在被选择用于表达的细胞类型、生物体、或者甚至动物中进行表达的启动子是很重要的。在蛋白表达时使用启动子和细胞类型联合对是精通分子生物学领域的人士所普遍知晓的,例如可以参照Sambrook等,1989。所使用的启动子可以是组成型的、或者是诱导型的,而且可以在合适的条件下被用于引导所引入的DNA片段的高水平表达,这在,例如重组蛋白或肽的大规模生产中是有利的。设想被用于高水平表达的合适的启动子系统包括但不局限于Pichia表达载体系统(Pharmacia LKB Biotechnology)。
联系用于制备重组蛋白和肽的表达实施例,设想可以最频繁地使用较长的DNA片段,编码整条肽序列的DNA片段是最优选的。然而,应该理解的是,使用较短的DNA片段来引导晶体肽或肽核心区域的表达,例如用于产生抗晶体蛋白抗体,也同样归属于本发明的范围之内。编码以下长度的肽抗原的DNA片段被设想是特别有用的,这些长度包括:大约8,9,10或11个左右氨基酸,达到并包括大约30,40或50个左右的氨基酸,或者更优选的,大约8至大约30个氨基酸,或者甚至更优选的,大约8至20个氨基酸。这些肽抗原决定簇可以是包含由以下连续的氨基酸序列的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。2.6    经过转化的宿主细胞以及转基因植物
在一个实施例中,本发明提供了一种转基因植物,它在其基因组中整合有一个编码选自以下集合中的连续氨基酸序列的转基因:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,以及序列编号:108。
本发明的另外一个方面是一种转基因植物,它在其基因组中整合了一个Cry3Bb*转基因,该转基因包含有一个选自以下集合的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:40,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,以及序列编号:107。本发明同时还公开了这类转基因植物的子代及其种子,以及这类种子的子代,以及从这类转基因植物的第二代及以后各代的植物中长出的种子,并对其提出了权利要求。
本发明还公开了天然的和通过遗传过程改造的宿主细胞并对其提出了权利要求,这些宿主细胞表达新颖的Cry3Bb*基因,生产Cry3Bb*多肽。细菌宿主细胞的优选实施例包括苏云金芽孢杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11338,EG11339,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098。
本发明同时公开了用此类细胞来生产Cry3*晶体蛋白的方法。这类方法通常包括在可以有效地生产Cry3*晶体蛋白的条件下培养宿主细胞(如苏云金芽孢杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,或EG11095,或EG11098)并从上述细胞中获得Cry3*晶体蛋白。
在另一方面,本发明提供了用于生产转基因植物的方法,上述的转基因植物表达一个编码本发明的新颖重组晶体蛋白的核苷酸片段。生产转基因植物的工序是在本工艺中众所周知的。总体上,该方法包括用一个或多个DNA片段来转化一个合适的宿主细胞,上述的DNA片段含有一个或多个启动子,这些启动子都以可操作的形式连接到一个编码一个或多个本发明中所公开的苏云金芽孢杆菌晶体蛋白的编码区域上。这类编码区域通常是以可操作的形式连接到一个转录终止区域,这样启动子就可以使该编码区域在细胞中进行转录,由此为细胞提供了在体内生产重组蛋白的能力。可选地,在需要控制、调节、或减少在特定的转基因细胞中所表达的特定的重组晶体蛋白的情形中,本发明也提供了晶体蛋白反义mRNA的表达方法。用反义mRNA作为一种用于控制或减少细胞中某种既定的感兴趣的蛋白的数量的手段是本工艺中众所周知的。
本发明的另外一个方面包括一种转基因植物,它表达一个编码一个或多个本发明中所述的新颖的多肽组合物的基因或基因片段。此处所用的术语“转基因植物”指的是已经整合了DNA序列的植物,其中的DNA序列包括但不局限于正常情况下可能不存在的基因、正常情况下并不被转录为RNA或翻译为蛋白(“表达”)的DNA序列、或者任何希望被引入未经转化的植物中去的其它的基因或DNA序列,例如一些在正常情况下在未经转化的植物中并不存在的,但是又希望能够进行遗传工程改造或改变其表达的基因。
设想在一些情形中,本发明的转基因植物的基因组已经通过稳定地导入一个或多个编码Cry3Bb*的转基因(天然的、通过合成进行修饰的、或者突变的)得到了扩充。在一些情形中,在转化的宿主植物细胞的基因组中已经整合了一个以上的转基因。例如在一种情形中,在此类植物的基因组中整合了一个以上的转基因。在一些特定的情形中,可能希望在转化的转基因植物中整合一个、两个、三个、四个、或者甚至更多的苏云金芽孢杆菌晶体蛋白(天然的或者是通过重组工程改造的)并使其稳定地表达。
一个优选的导入基因包括,例如,一个来源于细菌的编码晶体蛋白的DNA序列,特别是此处所述的来源于芽孢杆菌种属的DNA序列中的一个或多个序列。极为优选的是那些来源于苏云金芽孢杆菌的核苷酸序列,或者是那些已经通过遗传工程改造的序列中的任何一种,其中这些序列被改造以便减少或增加在此类转化的宿主细胞中晶体蛋白的杀虫活性。
用于转化植物细胞以及制备转基因细胞株的方法在本工艺中是众所周知的,在本发明中也给予了描述。当然,用于转化此类细胞的载体、质粒、粘粒、酵母人工染色体(YAC)以及DNA片段将包括操纵子、基因、或者本发明的来源于基因的序列(天然的、或者是通过合成方法获得的),特别是编码本发明中所公开的晶体蛋白的那一些序列。这些DNA构建物可以进而包括诸如启动子、增强子、多接头(polylinker)、或者甚至那些可以根据需要对感兴趣的特定的基因进行正或负调节的基因序列。DNA序列或基因可以编码一个天然的、或者经过修饰的晶体蛋白,上述蛋白将在所获得的重组细胞中得以表达,而且/或者将赋予再生的植物一个改良的表现型。
这类转基因植物对于通过在这样一株植物中整合一个编码对鞘翅类昆虫具毒性的Cry3Bb*晶体蛋白的转基因DNA片段来增加单子叶植物或双子叶植物的杀虫抗性可能是合乎需求的。特别优选的植物包括谷物,如玉米、小麦、黑麦、谷物、大麦、以及燕麦;豆类,如大豆;块茎,如土豆;纤维作物,如亚麻和棉花;草地和牧场草,观赏植物;灌木、树木、蔬菜、浆果、柑橘、水果、仙人掌、肉质植物,以及其它的具有商业重要性的作物,包括花园和家养植物。
在一个相关的方面,本发明同时还包括了由这种转化植物所产生的种子,这类种子的子代,以及由原先的转基因植物的子代所产生的种子,它们都是根据上述的步骤产生的。这类子代或种子将在其基因组中整合由一个或多个晶体蛋白转基因,而且这类子代植物将以孟德尔遗传方式遗传由导入的稳定的转基因所提供的性状。所有的这类已经在其基因组中整合有转基因DNA片段(这些片段编码一个或多个的转基因植物Cry3Bb*晶体蛋白或多肽)的转基因植物构成了本发明的一些方面。用于本发明的特别优选的转基因包括含有一个或多个Cry3Bb*基因的核苷酸片段。2.7  生物学功能等同物
可以对本发明的肽以及编码它们的DNA片段的结构进行修饰和变化并仍然获得一个编码具有所需特征的蛋白或肽的功能性分子。以下讨论的基础是对一个蛋白的氨基酸进行改变以获得一个等同物,或者甚至获得一个改善的第二代的分子。在本发明特定的实施例中,突变的晶体蛋白被设想对于增加蛋白的杀虫活性是有用的,并由此增加了在植物细胞中的重组转基因的生产活性和/或表达。氨基酸的变化可以通过改变DNA序列的密码子(根据表4中所示的密码子)来实现。
                           表4
        氨基酸                    密码
丙氨酸        A1a A       GCA  GCC  GCG  GCU
半胱氨酸      Cys C       UGC  UGU
天冬氨酸      Asp D       GAC  GAU
谷氨酸        Glu E       GAA  GAG
苯丙胺酸      Phe F       UUC  UUU
甘氨酸        Gly G       GGA  GGC  GGG  GGU
组氨酸        His H       CAC  CAU
异亮氨酸      Ile I       AUA  AUC  AUU
赖氨酸        Lys K       AAA  AAG
亮氨酸        Leu L       UUA  UUG  CUA  CUC  CUG CUU
甲硫氨酸      Met M       AUG
天冬氨酸      Asn N       AAC  AAU
脯氨酸        Pro P       CCA  CCC  CCC  CCU
谷氨酰胺      Gln Q       CAA  CAG
精氨酸        Arg R       AGA  AGG  CGA  CGC  CGG CGU
丝氨酸        Ser S       AGC  AGU  UCA  UCC  UCG UCU
苏氨酸        Thr T       ACA  ACC  ACG  ACU
缬氨酸        Val V       GUA  GUC  GUG  GUU
色氨酸        Trp W       UGG
酪氨酸        Tyr Y       UAC  UAU
例如,在一些结构,例如抗体的抗原结合区域或者底物分子的结合位点中,可以把这个蛋白结构中的特定的氨基酸替代为其它的氨基酸而并不明显地丧失相互作用的结合能力。由于一个蛋白的生物学活性是由其相互作用的能力以及蛋白的特性来定义的,所以可以对蛋白序列中的特定的氨基酸进行替换,而且,当然可以对与其相应的DNA编码序列进行替换,而且仍然获得一个具有类似特性的蛋白。因此,本发明者设想可以对本发明所公开的组合物,或与其相对应的编码上述肽的DNA序列进行各种不同的变化,而却并不明显地丧失它们的生物学效用和活性。
在进行这类改变时,应该考虑氨基酸的亲水性指标。氨基酸的亲水性指标在赋予蛋白的相互作用功能中的重要性在本工艺中是普遍公知的(Kyte和Doolittle,1982,作为参照结合于本文中)。氨基酸的相对亲水性特征被公认对由此获得的蛋白的二级结构起作用,而二级结构则决定了蛋白与其它的分子,例如,酶、底物、受体、DNA、抗体、抗原、等等之间的相互作用。
每一种氨基酸都被根据它的疏水性和带电特征分配了一个亲水性指标(Kyte和Doolittle,1982),分别为:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);以及精氨酸(-4.5)。
在本工艺中公知的是:可以把特定的氨基酸替换为具有相似的亲水性指标或得分的其它的氨基酸而且仍然可以获得一个具有相似生物学功能的蛋白,即,仍然获得了一个蛋白的生物学功能等同物。在进行此类变化时,对亲水性指标相差±2的氨基酸进行替换是优选的,相差±1的是特别优选的,相差±0.5的是更为优选的。
同时在本工艺中也是公知的是:可以根据亲水性来有效地对相似的氨基酸进行替换。美国专利4,554,101(特定地作为参照结合于本发明中)中的描述指出蛋白中的最大的局部平均亲水性,这种亲水性是由其周围的氨基酸的亲水性所支配的,这与蛋白的生物学特性相关。
如美国专利4,554,101中所详细描述的,对氨基酸已经指定了以下的亲水性值:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。
应该理解的是:可以把氨基酸替换为具有相似的亲水性值的其它的氨基酸而且仍然可以获得一个生物学等同物,以及特定地,获得一个免疫学等同物蛋白。在进行此类变化时,对亲水性值相差±2的氨基酸进行替换是优选的,相差±1的是特别优选的,相差±0.5的是更为优选的。
如上面所概述的,因此氨基酸替换通常是以氨基酸侧链的取代基团的相对相似性,例如,它们的疏水性、亲水性、带电特性、尺寸等等为基础的。以上述的各种不同的特征为根据而进行的示范性的替换是行内人士所公知的:精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;以及缬氨酸、亮氨酸和异亮氨酸。3.0  附图的简要描述
附图构成了本发明说明书的一部分并被包括进来以进一步示范本发明的特定的一些方面。通过参照一个或多个附图并结合此处所述的具体实施例的详细描述可以更好地理解本发明。
图1 Cry3Bb单体结构的示意图。
图2 Cry3Bb单体结构的立体图,结合有水分子(以点表示)。
图3A  Cry3Bb的结构域1的示意图。
图3B  组成结构域1的7个螺旋的位置示意图。
图4Cry3Bb的结构域1被组织成7个如图3A(示意图)和图3B(简图)中所示的α螺旋。示出了α螺旋和氨基酸。
图5A Cry3Bb结构域2的示意图。
图5B  图示了组成结构域2的3个β片的11个β链。
图6 Cry3Bb的结构域2是3个如图5所示的反平行β片的集合。定义了这些β片的氨基酸列于下面(α8,氨基酸322-328,同时也包括于结构域2中)。
图7A  Cry3Bb结构域3的示意图。
图7B  组成结构域3的β链的位置简图。
图8结构域3(图7)是一个组织松散的β链和环区的集合;不存在β片。β链含有以下所列的氨基酸:
图9A  Cry3Bb二体结构的侧面观。在分子的中部可以看到结构域1的螺旋束。
图9B  Cry3Bb二体结构的顶视图。在分子的中部可以看到结构域1的螺旋束。
图10  由Cry3A和Cry3Bb在平面脂双层中形成的通道随着时间其导率生长的图示图。Cry3A形成的通道的导率比Cry3Bb所形成的通道的导率要快出许多。
图11  pEG1701图谱,它含有Cry3Bb基因和cry1F终止子。
图12  在1B2,3区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复1-剂量鉴定法的结果。
图13  在1B6,7区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复1-剂量鉴定法的结果。
图14  在1B10,11区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复1-剂量鉴定法的结果。
图15  由Cry3Bb.11230和野生型Cry3Bb在脂双层中形成的通道的单通道记录。由Cry3Bb.11230形成的通道具有界限分明的开启和关闭状态,而由Cry3Bb所形成的则很少。
图16  由Cry3Bb和Cry3Bb.60(Cry3Bb的一种截短的形式)所形成的通道的单通道记录。Cry3Bb.60形成通道的速度比Cry3Bb更快,而且不同于Cry3Bb的是,它所产生的通道具有界限分明的开启和关闭状态。
图17A  Cry3A、Cry3B、和Cry3C氨基酸序列的序列对齐。
图17B  示出了图17A中所示的Cry3A、Cry3B、和Cry3C的氨基酸序列的对齐的继续。
图17C  示出了图17A中所示的Cry3A、Cry3B、和Cry3C的氨基酸序列的对齐的继续。4.0  示范性实施例的描述
本发明定义了新颖的苏云金芽孢杆菌(Bt)杀虫δ-内毒素蛋白以及被用于设计这些新颖蛋白的生物化学和生物物理学策略。δ-内毒素是一类由苏云金芽孢杆菌生产的杀虫蛋白,它们在平面脂双层上形成阳离子选择性的通道(English和Slatin,1992)。新的δ-内毒素是以对鞘翅类具有活性的δ-内毒素Cry3Bb的母体结构为基础的。与具有鞘翅类活性的δ-内毒素种类的其它成员(包括Cry3A和Cry3B)相似,Cry3Bb显示了出色的对抗可罗拉多薯虫(Leptinotarsa de-cemlineata)的杀虫活性。然而,不同于Cry3A和Cry3B的是,Cry3Bb对南部玉米食根虫或SCRW(Diabrolica undecimpunctata howardiBarber)西部玉米食根虫或WCRW(Diabrotica virgifera virgiferaLeConte)同样具有活性。此处所描述的新颖的杀虫蛋白是被特定地设计用于改善其母体Cry3Bb的生物学活性的。另外,设计策略本身就是新颖的发明,它们可以被应用于一般的苏云金芽孢杆菌δ-内毒素并对其进行改善。苏云金芽孢杆菌δ-内毒素同时也是一个形成离子通道的更大的细菌毒素种类中的成员(见English和Slatin,1992年的综述)。因此,本发明者相信这些设计策略同样可以被用于任何具有生物学活性的形成通道的蛋白以对其生物学特性进行改善。
经过设计的Cry3Bb蛋白可以用以下的策略中的一个或多个进行工程构造(1)鉴定并改变对蛋白酶敏感的位点,并进行蛋白水解;(2)对结合水进行分析和操作;(3)对运动区周围的氢键进行操作;(4)分析具有柔性的螺旋周围的环区并对其重新进行设计;(5)β链(Strand)以及β片周围的环区的设计;(6)鉴定复合的静电表面并对其进行设计;(7)金属结合位点的鉴定和去除;(8)四级结构的改变;(9)结构性残基的鉴定和设计;以及(10)由策略1-9所定义的任何位点以及所有位点的结合。这些策略使得可以对Cry3Bb的特定的位点进行鉴定和重新设计并最终创造出杀虫活性改善的新蛋白。这些新蛋白被标识为经过设计的Cry3Bb蛋白并被命名为Cry3Bb加一个句点再加上一个后缀(例如Cry3Bb.60、Cry3Bb.11231)。表2列出了新的蛋白以及分子上被修饰的特定的位点、氨基酸在这些位点的序列改变(这种改变改善了它的生物学活性)、经过改善的杀虫活性、以及被用于鉴定特定位点的设计方法。4.1  本发明的一些优点
对cry基因所进行的突变研究无能鉴定出显著数量的具有改善的广谱的杀虫活性(即对一个范围的害虫的毒性改善了)的突变的晶体蛋白。由于农作物在任何时间都典型地受到不止一种的害虫的侵袭,所以合乎需求的突变晶体蛋白优选地是那些对多种害虫的毒性都得到改善的突变的晶体蛋白。先前未能鉴定出这类突变体可能是因为所选定的用以突变的位点不合适。例如,对于相关的蛋白Cry1C,结构域2和结构域3中的位点是以前突变所努力的主要目标,这主要是因为这些结构域被认为在受体结合和杀虫活性的确定上具有重要的作用(Aronson等,1995;Chen等1993;de Maagd等.1996,Lee等,1992;Lee等,1995,Lu等,1994;Smedley和Ellar,1996;Smith和Ellar,1994;Rajamohan等,1995;Rajamohan等,1996)。
不同的是,本发明者推论认为Cry3蛋白的毒性,特定地Cry3Bb蛋白的毒性,可以通过靶定参与离子通道功能的区域,而不是分子中直接参与受体相互作用的区域(即结构域2和3)来改善,这种改善针对广泛范围的目标害虫。据此,本发明选择了Cry3Bb的结构域1中的目标区域进行突变以便分离具有改善的广谱毒性的Cry3Bb突变体。实际上,在本发明中描述了对几种鞘翅类害虫都具有改善的毒性的Cry3Bb突变体。
结构域1中的至少一个(可能是多个)α螺旋参与了离子通道和孔在昆虫中肠上皮的形成(Gazit和Shai,1993,Gazit和Shai,1995)。不同于他人对准编码结构域1的α螺旋的序列进行突变的做法(Wu和Aronson,1992;Aronson等,1995,Chen等,1995),本发明者选择了专有地对准编码毗邻或者预测的位于Cry3Bb的环区(这些环区分隔了α螺旋)中的氨基酸残基的序列。位于这些环区中的氨基酸或者加盖于(cap)α螺旋末端并毗邻这些环区的氨基酸残基可能会影响这些α螺旋之间的空间相互关系。因此,这些氨基酸残基的替换可能会导致三级结构、甚至是四级结构的微妙的变化,这些变化可能正面地影响离子通道的功能。位于结构域1环区的氨基酸残基暴露于溶剂中并因此可以与各种不同的分子进行相互作用。通过消除或封闭对蛋白酶敏感的位点来改变这些氨基酸可能会使蛋白更为稳定。改变结构域1的表面电荷的氨基酸替换可以改变离子通道的效率或者改变其与刷状缘膜或者毒素分子的其它部分之间的相互作用,从而使结合或插入更为有效。
根据本发明,对编码的Cry3Bb核苷酸残基进行碱基替换以便改变相应的多肽,特别是,在α螺旋之间的那些环区的特定的密码子。晶体蛋白的杀虫活性最终体现出用以有效控制昆虫所需的水平。应该尽可能地增强一种杀虫蛋白的效力以使其在田间具有经济和效率效能。可以期望在生物杀虫剂配方中的杀虫蛋白的效力的提高可以改善生物杀虫产品的田间性能。可选地,在生物杀虫剂配方中的杀虫蛋白的效力的提高可以促进在单位面积的接受处理的作物上使用较少数量的生物杀虫剂,从而使生物杀虫产品的使用更为经济。当杀虫活性提高的晶体蛋白在植物中表达时,它的生产可以被指望能够提高植物对容易侵袭的害虫的抗性。4.2  培养苏云金芽孢杆菌以生产晶体蛋白的方法
此处所述的苏云金芽孢杆菌菌株可以用标准的已知的介质和发酵技术进行培养。在发酵周期结束之后,首先用本工艺中公知的方法从发酵液中分离出苏云金芽孢杆菌孢子和晶体,这样就获得细菌。可以通过加入表面活性剂、分散剂、惰性载体、以及其它的成分把回收的苏云金芽孢杆菌孢子和晶体配置成可湿性粉末、浓缩液、微粒、或者其它的制剂,这样就方便了处理和应用于特定的目标害虫。配制和应用步骤都是本工艺中公知的。4.3  用于表达cry*基因的重组宿主细胞
本发明的核苷酸序列可以被导入范围广泛的各种不同的微生物宿主中。毒素基因的表达直接或间接地导致胞内生产和杀虫剂的保持。在合适的宿主,例如在假单胞菌属中,细菌可以被应用于鞘翅类昆虫的位置,在该位置,微生物将增殖并被昆虫所摄取。这样就可以对不需要的昆虫进行控制。可选地,可以在能够延长在细胞中生产的毒素的活性的条件下对拥有毒素基因的宿主微生物进行处理。然后可以把经过如此处理的细胞施用于目标害虫的环境中。如此获得的产品保留了苏云金芽孢杆菌毒素的毒性。
合适的宿主细胞,其中含有杀虫剂的细胞可以被处理以延长毒素在经过如此处理的细胞被施用于目标害虫的环境中时在细胞中的活性,可以包括真核或者原核细胞,通常局限于不产生对高等生物体(如哺乳动物)具有毒性的物质的那些细胞。然而,也可以使用那些产生对高等生物体具有毒性的物质的生物体,其中这种毒素是不稳定的,或者其应用的水平足够的低,不足对哺乳动物产生任何毒性。特别感兴趣的宿主是原核生物和低等的真核生物,如真菌。示例性的原核生物(包括格兰氏阴性和格兰氏阳性)包括肠杆菌科,如埃希氏菌属、欧文菌属、志贺菌属、沙门菌属、以及变性菌属;芽孢杆菌科;根瘤菌科,如根瘤菌;螺菌科,如发光菌、Zymomonas、沙雷菌属、气单胞菌属、弧菌属、去磺弧菌属、螺菌属;乳酸菌;极毛杆菌科,如假单胞菌属和醋酸杆菌属;固氮菌属;放线菌属;以及硝化菌属。真核宿主有真菌,如藻菌纲和子囊菌,包括酵母菌,如酵母属和人体酵母菌;以及担子菌酵母,如红酵母菌、短梗霉菌、掷孢酵母属,等等。
在筛选一个用于生产目的的宿主细胞时特别感兴趣的宿主的特征包括:易于把苏云金芽孢杆菌导入到宿主中;有可用的表达系统;表达的效率;杀虫剂在宿主中的稳定性;以及存在辅助的遗传能力。用作杀虫剂微胶囊的感兴趣的特征包括杀虫剂的保护性特质,例如具有厚的细胞壁、色素形成、以及在细胞内包装积或形成包含体;叶子亲和性;对哺乳动物不具有毒性;能够诱惑害虫摄食;容易杀灭和固定,同时又不损害毒性,等等。其它的考虑包括易于配制和处理、经济效益、保藏的稳定性,等等。
特别感兴趣的宿主生物体包括,例如红酵母菌属种类、短梗霉菌种类、酵母属种类、以及掷孢酵母属种类;植形(phylloplane)生物体,例如假单胞菌属种类、欧文菌属种类、以及产黄菌属种类;或者其它的生物体,如埃希氏杆菌、乳杆菌种类、杆菌种类、链霉菌种类、等等。特定的生物体包括Pseudomonas acruginosa,、荧光假单孢菌(Pseudomonas fluorescens)、啤酒酵母(Saccharomycescerevisiae)、苏云金芽孢杆菌(B.Thuringiensis)、大肠杆菌(Escherichia coli)、枯草芽孢杆菌(B.subtilis)、B.Megaterium、B.Cereus、浅青紫链霉菌(Streptomyces lividans)、等等。
可以用化学的或物理的方法,或者结合化学和/或物理方法对微生物细胞,例如含有苏云金芽孢杆菌毒素基因的微生物进行处理,只要这种技术对毒素的特质不产生有害的影响,也不消除细胞对这一毒素的保护能力。化学剂的离子有卤化剂,特别是原子系数为17-80的卤化剂。更特定地,可以在温和的条件下使用碘,让其作用足够长的时间以获得预期的结果。其它合适的技术包括用醛类,例如甲醛和戊二醛;抗感染剂,如氯化苄烷铵以及氯化十六烷吡啶盐;醇类,如异丙醇和乙醇;各种不同的组织固定剂,如Lugol氏碘、Bouin氏固定剂、Helly氏固定剂(见,例如Humason,1967);或者是结合使用在细胞被施用到宿主动物中时能够保存并延长在细胞中所生产的毒素的活性的物理学方法(热)和化学试剂。物理学方法的例子有短波长辐射,例如γ射线辐射以及X射线-辐射、冷冻、紫外线辐射、冻干法、等等。被处理的细胞通常可以保持完整并且在处理的过程中基本上处于增殖形态,而不是处于孢子形态,虽然在一些情形中也可以采用孢子形态。
当用一个合适的载体把苏云金芽孢杆菌毒素基因导入一个微生物宿主中,而且上述的宿主是以活的形态被施用于环境中时,施用特定的宿主微生物是关键的。选择那些已知能够占领一种或多种感兴趣的作物的“植物圈”(叶面(phylloplane)叶隙(phyllosphere),根际(rhizosphere),以及/或者根面(rhizoplane))的微生物宿主。对这些微生物进行筛选以便使其能够在特定的环境(作物和其它昆虫的栖息地)中与野生型的微生物进行竞争,能够为那些表达多肽杀虫剂的基因提供稳定的保持和表达,以及,可望地,为环境对杀虫剂的降解和灭活提供改善的保护。
已知有数量众多的微生物可以栖息在诸多重要作物的叶面(叶子的表面)以及/或者在根围(植物根周围的土壤)上。这些微生物包括细菌、藻类已经真菌。特别感兴趣的是微生物,例如细菌,如杆菌属(包括苏云金芽孢杆菌种属和亚种:B.thuringiensis kurstaki HD-1,B.thuringiensis kurstaki HD-73,B.thuringiensis sotto,B.thuringiensis berliner,B.thuringiensis thuringiensis,B.thuringiensis folworthi,B.thuringiensis dendrolimus,B.thuringiensis alesti,B.thuringiensis galleriae,B.thuringiensis aizawai,B.thuringiensis subtoxicus,B.thuringiensis entomocidus,B.thuringiensis tenebrionis以及B.thuringiensis san diego);假单胞菌属、欧文菌属、沙雷菌属、克雷泊氏菌属、Zanthomonas、链霉菌属、根瘤菌、红假单胞菌属、Methylophilius、农杆菌、醋酸杆菌属、乳杆菌属、节杆菌属、Azorobacter、明串珠菌属、以及产碱菌属;真菌,特别是酵母,例如Saccharomyces、隐球菌属、克鲁维酵母属、掷孢酵母属、红酵母属、以及短梗霉属。特别感兴趣的是如下的植物圈细菌种类:Pseudomonas syringae,Pseudomonas fluorescens,Serratiamarcescens,Acetobacter xylinum,Agrobacterium lumefaciens,Rhodobacter sphaeroides,Xanthomonas campestris,Rhizobiummelioli,Alcaligenes eutrophus,和Azotobacter vinlandii;以及植物圈酵母种类,如Rhodotorula rubra,R.glutinis,R.marina,R.aurantiaca,Cryptococciis albidus,C.diffluens,C.lazirentii,Saccharontvces rosei,S.preloriensis,S.Cerevisicie,Sporobolomyces roseus,S.Odorus,Kluyveromycesveronae,以及Aureobasidiuni pollulans。4.4定义
根据本发明,核苷酸序列包括但不局限于DNA(包括但不局限于基因组或非基因组DNA)、基因、RNA(包括但不局限于mRNA和tRNA)、核苷、以及来源于天然来源的、化学合成的、经过修饰的、或者以其它的方法人工制备的合适的核苷酸片段。以下词语和短语的意义如下定义。
一个/一种:根据长效的专利法协定,当词语“一个”和“一种”用于申请(包括权利要求)中时,指的是“一个(种)或多个(种)”。
广谱:指的是范围广泛的昆虫种类。
广谱活性:针对广泛范围的昆虫的毒性。
表达:多个胞内过程的组合,包括一个编码的DNA分子,如一个结构基因,为了生产多肽所进行的转录和翻译。
杀虫活性:对昆虫的毒性。
杀虫特异性:由晶体蛋白或蛋白、微生物或植物所表现出来的对多种昆虫种类的毒性。
目内(Intraorder)特异性:一种特定的晶体蛋白对一个目范围内的昆虫(例如鞘翅目)的毒性。
目间(Interorder)特异性:一种特定的晶体蛋白对不同目的昆虫(例如鞘翅目和双翅目)的毒性。
LC50:导致被处理的昆虫的50%致死的晶体蛋白的致死浓度。
LC95:导致被处理的昆虫的95%致死的晶体蛋白的致死浓度。
启动子:在DNA序列或一组DNA序列种的一个识别位置,它为一个结构基因提供了一个表达控制元件,而且RNA聚合酶特定地结合于其上并启动该基因的RNA合成(转录)。
再生:从一个植物细胞(例如一个植物原生质体或外植体)生长一株植物的过程。
结构基因:一个被表达以生产多肽的基因。
转化:把一个外源DNA序列(例如一个载体、一个重组DNA分子)导入一个细胞或原生质体中的过程,其中外源基因被整合到染色体中或者能够自主复制。
转化细胞:一个其DNA已经通过在该细胞中导入一个外源DNA分子而被改变的细胞。
转基因细胞:任何来源于或者再生于转化细胞或来源于转基因细胞的细胞。转基因细胞的例子包括来源于转化植物细胞以及特定的细胞,如叶子、根、茎细胞的植物愈伤组织,例如体细胞,或者是来源于转基因植物的生殖细胞。
转基因植物:来源于转化植物细胞或原生质体的植物或其子代,其中的植物DNA含有一个被导入的外源DNA分子,这一分子并不存在于天然的非转基因的同种株系的植物中。术语“转基因植物”以及“转化植物”有时候在本工艺中被用于同义地定义一种其DNA中含有一个外源DNA分子的植物。然而,应该认为更科学的是应该用“转基因植物”来指代一种来源于转化植物细胞或原生质体的再生的植物或愈伤组织。本文将遵从这种用法。
载体:一个能够在宿主细胞复制,而且/或者另一个DNA片段可以以可操作的形式与其相连以使附加的片段得以表达的DNA分子。质粒就是载体的一个例子。
此处所用的标识“CryIII”以及“Cry3”是同义的,,同样“CryIIIB2”和“Cry3Bb”也是同义的。类似地,本发明者已经用一般的术语“Cry3Bb*”来标识任何以及所有的Cry3Bb变体,这些变体在蛋白中含有被修饰的氨基酸序列。类似地,Cry3Bb*被用于标识任何以及所有的编码Cry3Bb*蛋白的核苷酸片段和/或基因,等等。4.5 cry3Bb*多聚核苷酸的制备
一旦已经使用本发明所公开的设计策略对所要突变的肽的结构进行了分析,合乎需求的是在蛋白中,或者可选地,在编码该蛋白的DNA序列中导入一个或多个突变以便生产一个生物杀虫特质改变的突变蛋白。
为此,本发明同时包含了以本发明中所述的方式对一个编码一个晶体蛋白的核苷酸片段进行定点突变和随机突变的方法。具体地,,本发明公开了用此处所述的一种或多种设计策略对编码该氨基酸序列的核苷酸片段进行突变的方法。然后可以使用此处所描述的鉴定方法来鉴定由这些步骤所获得的突变体哪一个具有改善的杀虫特质或者改变的特异性,包括目内和目间的。
用于对一个编码一个晶体蛋白的DNA片段进行突变的方法是行内人士所公知的。可以用随机的或者定点的突变步骤来进行修饰。可以通过在该序列上添加或删除一个或多个核苷来改变其结构,从而对该核苷酸进行修饰。
可以根据本工艺中已知的任何一项技术进行突变,例如,但不局限于合成一个在一个特定的晶体蛋白中含有一个或多个突变的低聚核苷酸。一个“合适的宿主”可以是任何表达Cry3Bb的宿主,例如,但不局限于苏云金芽孢杆菌和大肠杆菌。对杀虫活性,在Cry3Bb的情形中包括但不局限于对鞘翅类的毒性,的筛选可以用本工艺中公知的技术来进行。
具体地,定点突变,通过对作为基础的DNA进行特定的突变,是一个在个体肽、或者蛋白或肽的生物学功能等同物的制备中有用的技术。进而可以用这一技术来制备和试验序列变体,例如,结合上述的一个或多个考虑,通过在该DNA上导入一个或多个核苷序列来实现。定点突变使得可以通过使用编码所需突变的特定的低聚核苷酸序列以及足够数目的毗邻的核苷来产生一个引物序列,这个引物序列所具有的尺寸和序列复杂度足以在删除接合的两端形成一个稳定的双链。典型地,优选的引物的长度是大约17至大约75个核苷,或更长,其中在序列接合处的两端有大约10至大约25个或更多的残基被改变。
大体上,定点突变技术是本工艺中众所周知的,它们在各种不同的出版物中已经被例举了。应该理解的是,该技术典型地采用一种可以以单链和双链两种形式存在的噬菌体载体。在定点突变中有用的典型的载体包括如M13噬菌体之类的载体。这些载体是商品化的,它们的使用方法通常是行内人士所公知的。双链质粒也是在定点突变中所常规使用的,它省略了把目标基因从质粒转移到噬菌体这一过程。
大体上,根据本发明的定点突变是这样来实施的:首先获得一个单链载体或者双链载体熔化开的两条链,上述的载体在其序列中包含有一个编码目标肽的DNA序列。制备一个含有所需突变序列的低聚核苷酸引物,通常用合成的方法来制备。然后把引物和单链载体一起退火,然后用DNA聚合酶,如大肠杆菌聚合酶I的Klenow片段,进行处理以便合成含有突变的链。这样就形成一个异源双链,其中一条链编码初始的未经突变的序列,另一条链含有所需的突变。然后用这种异源双链载体对合适的细胞,例如大肠杆菌细胞,进行转化或转染。把含有具有突变序列的重组载体的克隆筛选出来。Kunkel等(1987)设计了一个遗传选择方案,用于富集结合有突变低聚核苷酸的克隆。可选地,可以结合使用PCRTM和商业化的热稳定的酶,如Taq聚合酶来把突变的低聚核苷酸引物整合到一个经过扩增的DNA片段中,然后再克隆到一个合适的克隆或表达载体中去。Tomic等(1990)和Upender等(1995)的PCRTM介导的突变步骤就是这类协议的两个例子。也可以使用一个采用温度稳定的连接酶和温度稳定的聚合酶的PCRTM来把一个磷酸化的突变低聚核苷酸整合到一个经过扩增的DNA片段中,然后再克隆到合适的克隆或表达载体中。由Michael(1994)所描述的突变步骤提供了一个此类协议的例子。
本发明提供了通过定点突变来制备所选定的编码肽的DNA片段的序列变体的方法,用于生产潜在有用的种类,但这并不具有局限性,因为还有许多种途径可以被用来获得肽的序列变体以及编码它们的DNA序列。例如,可以用诱变剂,例如羟胺,对编码所需肽序列的重组载体进行处理以获得序列变体。
此处所用的术语“低聚核苷酸指导的突变步骤”指的是依赖于模板的过程以及由载体介导的增殖,例如扩增,这导致一种特定的核苷酸分子浓度提高(相对于初始浓度而言),或者使一个可检测信号的浓度提高。此处所用的术语“低聚核苷酸指导的突变步骤”指的是一个涉及一个引物分子依赖于模板进行延伸的过程。术语“依赖于模板的过程”指的是一个RNA或一个DNA分子的核苷酸合成,其中新合成的核酸链的序列是由著名的碱基互补配对原则所指挥的(参照,例如,Watson,1987)。
典型地,载体介导的方法学涉及在核苷酸片段中导入一个DNA或RNA载体、载体的克隆性扩增、以及经过扩增的核酸片段的回收。这类方法学的例子见于美国专利4,237,224,该专利的全部内容作为参照结合于本发明中。
现有一些依赖于模板的步骤可以被用于对存在于样品中的感兴趣的目标序列进行扩增。最著名的扩增方法之一是聚合酶链式反应(PCRTM),描述于美国专利4,683,195、4,683,202、以及4,800,159中(上述的每一专利的全部内容都作为参照特定地结合于本发明中)。简要地说,在PCRTM中,应制备两条引物,它们与目标序列的相对的互补链上的区域是互补的。在一个反应混合物中加入过量的脱氧核糖核苷三磷酸以及DNA聚合酶(例如Taq聚合酶)。如果在样品中存在目标序列,引物将和目标结合,聚合酶将通过添加核苷来使引物沿着目标序列延伸。通过提高和降低反应混合物的温度可以使经过延伸的引物与目标解离,形成反应产物,过量的引物将结合到目标以及反应的产物之上,重复进行扩增过程。优选地,可以采用一种逆转录酶PCRTM扩增步骤以便对经过扩增的mRNA进行定量。聚合酶链式反应是本工艺中众所周知的。
另外一种扩增方法是连接酶链式反应(称为LCR),描述于欧洲专利申请出版No.320,308,该专利的全部内容都作为参照特定地结合于本发明中。在LCR中,制备两个互补探针对,而且当有目标序列存在时,每一对探针将结合到相对的靶互补链之上由此它们毗邻。在有连接酶存在的情况下,两个探针对将连接形成一个单一的单位。通过类似于PCRTM的温度循环,结合的经过连接的单位从目标上解离下来,然后充当过量的探针对连接的“目标序列”。美国专利4,883,750,该专利的全部内容都作为参照特定地结合于本发明中,描述了一种类似于LCR的替代的扩增方法,用于使探针对结合到目标序列上。
在国际专利申请出版No.PC17US87/00880中所描述的QbetaReplicaseTM也可以被用为本发明的另一种扩增方法,该发明的全部内容都作为参照结合于本发明中。在这种方法中,在有RNA聚合酶存在的情况下把一个可复制的并且含有与目标互补的区域的RNA序列加入到样品中。这样聚合酶就可以复制上述的可复制的序列。
一种等温扩增方法,其中限制性核酸内切酶以及连接酶被用于扩增在其中的一条含有限制性位点的链上含有核苷5’-[α-硫代]三磷酸的目标分子(见Walker等,1992,该文献的全部内容都作为参照结合于本发明中),在本发明的核酸的扩增中可能也是有用的。
链位移扩增(Strand Displacement Amplification,SDA)是另外一种进行等温核酸扩增的方法,它涉及多轮的链位移和合成,即缺口翻译。一种类似的方法,称为修复链反应(Repair Chain Reaction,RCR),是另外一种在本发明中可能有用的扩增方法,它涉及对遍及目标扩增区域中的几个探针进行退火,然后再进行修复反应,在上述的修复反应中只存在四种碱基中的两种碱基。为了检测的方便,可以加入另外两种碱基的生物素标记的衍生物。SDA也使用类似的方法。
也可以用一种循环式探针反应(cyclic probe reaction,CPR)来检测序列。在CPR中,把一个含有非Cry特异性的DNA的3’和5’端序列以及一个Cry特异性的RNA的内在序列的探针与样品中存在的DNA进行杂交。杂交之后立即用RNaseH对反应进行处理,被探针鉴定为与众不同的那些产物在酶解之后释放一个信号。初始的模板被退火成为另一个循环探针,反应重复进行。这样,CPR涉及扩增一个由探针和一个Cry特异性表达核酸杂交所产生的信号。
另外也可以根据本发明使用在英国专利申请No.2,202,328以及国际专利申请出版No.PCT/US89/01025中所述的扩增方法,这两个专利的全部内容都作为参照结合于本发明中。在前一个申请中,把“经过修饰的”引物用于类似于PCRTM的依赖于模板和酶的合成中。可以通过给引物标记一个捕抓部分(如生物素)以及/或者一个检测部分(如酶)来对引物进行修饰。在后一个申请中,在一个样品中加入过量的经过标记的探针。在有目标序列存在的情况下,探针发生结合并被酶切。在酶切之后,目标序列被完整地释放以供过量的探针结合。对经过标记的探针进行酶切反映了目标序列的存在。
其它的核酸扩增步骤,包括基于转录的扩增系统(transcription-based amplification systems,TAS)(Kwoh等,1989;国际专利申请出版No.WO 88/10315,其全部内容作为参照结合于本发明中),包括基于核酸序列的扩增(nucleic acid sequencebased amplification,NASBA)以及3SR。在NASBA中,可以通过以下步骤来制备用于扩增的核酸:标准的酚/氯仿提取、样品的热变性、用裂解缓冲液以及minispin来分离DNA和RNA,或者用盐酸胍来提取RNA。
这些扩增技术涉及对一个具有晶体蛋白特异性的序列的引物进行退火。在聚合以后,用RNaseH对DNA/RNA杂合体进行酶解,双链DNA分子则再次进行热变性。在每一种情形中,通过加入第二个晶体蛋白特异性的引物然后再聚合来把单链DNA制备成完全的双链DNA。然后用聚合酶(如T7或SP6)对双链的DNA分子进行多重转录。在一个等温循环式反应中,RNA被反转录为双链DNA,然后再用聚合酶(如T7或SP6)进行转录。如此获得的产物,不管是截短的还是完整的,都显示晶体蛋白特异性的序列。
欧洲专利申请出版No.329,822(该申请的全部内容作为参照结合于本发明中)公开了一种核酸扩增工序,它涉及循环地合成单链RNA(“ssRNA”)、ssDNA、以及双链DNA(dsDNA),这一工序可以根据本发明进行使用。ssRNA是提供给第一个引物低聚核苷酸的第一个模板,它可以用逆转录酶(依赖于RNA的DNA聚合酶)来延长。然后用核糖核酸酶H(RNaseH,一种对与DNA或RNA形成双螺旋的RNA具特异性的RNase)作用以便从如此获得的DNA:RNA双螺旋中除去RNA。如此获得的ssDNA为第二个引物提供了第二个模板,上述的第二个引物也包括一个RNA聚合酶启动子(如T7 RNA聚合酶)的序列,这个序列与模板的5’端具有同源性。然后用DNA聚合酶(如大肠杆菌DNA聚合酶I的″Klenow″大片段)进行延伸,形成双链DNA(“dsDNA”)分子,这个分子所含的序列与介于引物之间的初始的RNA的序列是一样的,而且在一端含有一个另加的启动子序列。这一启动子可以被合适的RNA聚合酶用于制造许多DNA的RNA拷贝。随后这些拷贝可以重新进入循环,导致扩增非常迅速地进行。只要选择合适的酶,这一扩增可以在等温的条件下进行,不需要在每一个循环添加酶。因为这一工序具有循环的本质,所以起始的序列可以选择DNA或RNA任意一种形式。
国际专利申请出版No.WO 89/06700,该申请的全部内容作为参照结合于本发明中,公开了一种核酸序列扩增方案,这一方案是基于启动子/引物序列与一个目标单链DNA(“ssDNA”)进行杂交,然后再由该序列转录出许多RNA拷贝这样一个基础的。这一方案不是循环式的,即,并没有从所得的RNA转录产物制造出新的模板。其它的扩增方法包括″RACE″(Frohman,1990),以及“单侧PCRTM”(″one-sidedPCRTIA″(Onara,1989),它们都是行内人士所公知的。
以以下为基础的方法也可以被用于本发明的DNA序列的扩增:在有含有所得的“二聚-低聚核苷酸”的核苷酸的存在下,两个或更多个多聚核苷酸发生连接,从而对上述的二聚-多聚核苷酸进行扩增(Wu和Dean,1996,该文献的全部内容作为参照结合于本发明中)。4.6    噬菌体抗性变体
在特定的实施例中,可能需要制备一种或多种用本发明方法制备的苏云金芽胞杆菌突变体的噬菌体抗性的变体。为此,在营养琼脂上涂布噬菌体裂解液的等份液体并让它干燥。然后在上述的经过干燥的裂解液上直接接种对噬菌体敏感的细菌菌株的等份液体并让它干燥。平板在30℃温育。给平板温育2天,此时可以观察到已经有许多菌落生长在琼脂上。把其中的一些菌落挑出来并传代培养于营养琼脂平板上。通过与噬菌体裂解液交叉画平板来试验这些显然具有抗性的培养物的抗性。在平板上画一条噬菌体裂解液的线并让它干燥。然后把假定具有抗性的培养物与噬菌体的线交叉画于平板上。经过30℃过夜温育,具有抗性的细菌培养物在与噬菌体线交叉的任何地方都无裂解。随后,对噬菌体的抗性通过在营养琼脂平板上接种抗性培养物的菌苔来确证。同时还以同样的方式接种敏感的菌株以充当阳性对照。在干燥以后,在平板的中心接种一滴噬菌体的裂解液并让它干燥。经过30℃24小时温育,具有抗性的细菌培养物在接种有噬菌体裂解液的地方都没有裂解。4.7  作为杀虫剂的晶体蛋白组合物及其使用方法
鞘翅目昆虫含有数量众多的甲虫种类,包括土鳖虫、网状甲虫、皮蠹和红带皮蠹、长角甲虫、叶甲虫、象鼻虫、树皮甲虫、瓢虫、soldierbeetle、鹿角虫、水体食腐甲虫、以及各种各样的其它的甲虫。在以下网站有鞘翅目的简要的分类法:http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html.
在鞘翅目中特别重要的是农业害虫,包括Chrysomeliformia和Cucujiformia亚目下的昆虫。Chrysomeliformia亚目下的昆虫,包括叶甲虫(Chrysomelidae)和象鼻虫(Curculionidae),对于农业是特别成问题的,它们造成了作物和植物的各种各样的昆虫损害。Cu-cujiformia亚目包括以下的科:Coccinellidae,Cucujidae。Lagridae,Meloidae,Rhipiphoridae,和Tenebrionidae。公知的,在这一亚目中,Chrysomelidae科的一些昆虫(包括以下种类:Exema,Chrysomela,Oreina,Chrysolina,Leptinotarsa,Gonioctena,Oulema,Monozia,Ophraella,Cerotoma,Diabrotica,和Lachnaia)具有毁坏农作物的潜能。
由于本发明的毒素已经显示可以有效地对抗多种鞘翅目的昆虫,所以本发明者设想可以使用本发明中所述的组合物来控制或者根除许多鞘翅类昆虫。类似地,本发明中所述的用于产生经过修饰的昆虫特异性提高的多肽的方法可以被用于在把经过修饰的多肽的杀虫活性范围扩展到鞘翅目之内或之外的其它昆虫种类。
因此,本发明者设想本发明中所公开的晶体蛋白组合物将在田间作物的局部和/或系统杀虫应用中发挥特定的杀虫剂用途,这些田间作物包括但不局限于稻谷、小麦、紫花苜蓿、玉米、大豆、烟草、土豆、大麦、芸薹(油菜籽)、甜菜、甘蔗、亚麻、黑麦、燕麦、棉花、向日葵、草地(如牧场草和草地草)、果实、柑橘、坚果、树木、灌木、以及蔬菜;以及观赏植物、仙人掌、肉质植物、等等。
本发明描述并要求权项的是含有一种杀虫有效数量的Cry3Bb*晶体蛋白组合物的组合物。该组合物优选地含有以下的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,或序列编号:108,或其生物学功能相当的序列。
杀虫剂组合物也可以含有一种由具有以下序列的核苷酸序列编码的Cry3Bb*晶体蛋白:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号,55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,或序列编号:108,或者可选地,一种在中等严格程度的条件下与以下核苷酸序列杂交的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,或序列编号:107。
杀虫组合物可以包括一种或多种类型的苏云金芽胞杆菌细胞,或者一种或多种此类细胞的培养物,或者可选地,一种或多种表达一种或多种表达本发明的新颖的晶体蛋白的苏云金芽胞杆菌细胞与另一种杀虫组合物的混合物。在特定的方面可能需要制备含有许多晶体蛋白的组合物,其中所述的晶体蛋白可以是天然的或者是经过修饰的,用于抵抗一种或多种类型的易感昆虫。在配制之前,可以对本发明的苏云金芽胞杆菌细胞进行处理以便延长其在细胞被施用于目标昆虫的环境中时的杀虫活性。这类处理可以是化学的或物理的方法,或者是化学和/或物理方法相结合,只要这种技术不对杀虫剂的性质产生有害的影响,也不消除细胞对杀虫剂的保护能力。化学剂的例子有卤化剂,特别是原子系数为17-80的卤素。更为特定地,可以在温和的条件下用碘作用足够长的时间以达到所要的结果。其它合适的技术包括用醛类,例如甲醛和戊二醛;抗感染剂,如抗感染剂,如氯化苄烷铵;醇类,如异丙醇和乙醇;各种不同的组织固定剂,如Bouin氏固定剂和Helly氏固定剂(见Humason,1967);或者是结合使用在细胞被施用到宿主动物中时能够保存并延长在细胞中所生产的δ-内毒素的活性的物理学方法(热)和化学试剂。物理学方法的例子有短波长辐射,例如γ射线辐射以及X射线-辐射、冷冻、紫外线辐射、冻干法、等等。
本发明者设想可以用本工艺的熟练人士所公知的任何配制方法用本发明中所述的蛋白来制备此类生物杀虫剂组合物。配制一种表达一种或多种Cry3Bb*DNA片段、产生被编码的Cry3Bb*蛋白或肽的细胞培养物(优选的是细菌细胞培养物,如在表3中所列的苏云金芽胞杆菌细胞)的全细胞制剂、细胞提取液、细胞悬浮液、细胞匀浆液、细胞裂解液、细胞上清液、细胞过滤液(filtrates)、或者细胞沉淀物可能是合乎需求的。用于配制此类制剂的方法是本工艺的熟练人士所公知的,而且可以包括对一种或多种表达所感兴趣的Cry3Bb*肽的细菌细胞(如在表3中所列的苏云金芽胞杆菌细胞)的培养物进行干燥、冻干、匀浆、提取、过滤、离心、沉淀、或浓缩。
在一个优选实施例中,生物杀虫剂组合物包括一种油可以流动(oil flowable)的悬浮液,上述的悬浮液包含含有一种或多种本发明中所述的新颖的晶体蛋白的经过裂解或未经裂解的细菌细胞、孢子、或者晶体。优选地,上述的细胞是苏云金芽胞杆菌细胞,但是,任何此类表达本发明所述的新颖的核酸片段并生产晶体蛋白的细菌宿主细胞都被认为是有用的,例如杆菌种类,例如B.megaterium、B.sublilis、B.cereus;埃希氏杆菌种类,包括大肠杆菌;以及/或者假单胞杆菌种类,包括P.cepacia、P.aeruginosa、以及P.fluorescens。可选地,油可以流动的悬浮剂可以是由一种或多种下列组合物所组成:经过裂解或未经过裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白。
在本发明的另一个优选实施例中,生物杀虫剂组合物含有一种可以在水中分散的微粒或者粉末。这一微粒或粉末可以包含经过裂解或未经过裂解的细菌细胞、孢子、或者晶体蛋白,它们含有一种或多种本发明中所述的新颖的晶体蛋白。这些组合物的优选的来源包括诸如苏云金芽胞杆菌细胞的细菌细胞,然而那些用本发明中所述的DNA片段进行转化并表达晶体蛋白的杆菌、埃希氏杆菌、以及假单胞杆菌细胞也被设想是有用的。可选地,微粒或粉末可以是以下一种或多种组合物的结合:裂解或未经裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白。
在第三个重要的实施例中,生物杀虫剂组合物含有一种可湿性粉末、喷雾剂、乳剂、胶体、水溶液或有机溶液、粉尘、小药丸、或者棉胶浓缩液。这类组合物可以含有如上所述的经过裂解的和未经裂解的细菌细胞、孢子、晶体、或者细胞提取物,它们含有一种或多种本发明中所述的新颖的晶体蛋白。优选的细菌细胞是苏云金芽胞杆菌细胞,然而,那些用本发明中所述的DNA片段进行转化并表达晶体蛋白的B.megaterium、B.subtilis、B.cereus、大肠杆菌、或者假单胞菌细胞也被设想是有用的。这类干形式的杀虫剂组合物可以被配制成在被湿润时立即溶解,或者可选地,以控释的或缓释的、或者其它的依赖于时间的形式溶解。可选地,这类组合物可以是以下一种或多种组合物的结合:裂解或未经裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白。
在第四个重要实施例中,生物杀虫剂组合物含有一种经过裂解的和未经裂解的细菌细胞、孢子、晶体、以及/或者一种含有经过裂解的和未经裂解的细菌细胞、孢子、以及或者晶体的混合物(如上述的含有本发明中所述的新颖的晶体蛋白的那一些)的水溶液、悬浮液、或者细胞培养物。此类水溶液或悬浮液可以被制备为浓缩的保藏液,可以在施用前把它稀释,或者可选地,也可以制备为可以现用的稀释液。
对于那些涉及使用细菌细胞的方法,含有晶体蛋白基因的细胞宿主可以在任何合适的营养介质中培养,其中DNA构建物提供了选择性的优点,提供了一个选择性的介质,使得几乎全部或者全部的细胞都含有苏云金芽胞杆菌基因。随后可以根据合适的方法收获这些细胞。可选地,也可以在收获之前对细胞进行处理。
当杀虫剂组合物包括含有所感兴趣的经过修饰的晶体蛋白的苏云金芽胞杆菌细胞、孢子、以及/或者晶体时,这种组合物可以以各种不同的方式进行配制。可以通过把其和各种不同的惰性材料,如无机矿物质(叶状硅酸盐、碳酸盐、硫酸盐、磷酸盐、等等)或者植物材料(粉末状的玉米的穗轴、稻谷的壳、胡桃的壳、等等)混合在一起来配制成可湿性粉末、微粒或粉尘。配方可以包括spreader-sticker佐剂、稳定剂、其它的杀虫添加剂、或者表面活性剂。液体配方可以是水基的,或者是非水基的并可以采用例如泡沫、悬浮剂、可乳化的浓缩液等形式。成分中可以包括流变学药剂、表面活性剂、乳化剂、分散剂、或者聚合体。
可选地,新颖的来源于Cry3Bb的突变的晶体蛋白可以用天然的或重组的细菌表达系统在体外进行制备并被分离出来供随后的田间施用。这类蛋白可以是存在于粗的细胞裂解液、悬浮液、胶体、等等中,或者可选地可以在被配制于活性生物杀虫剂配方中之前被纯化、精化、用缓冲液处理、以及/或者被进一步加工。类似地,在特定的环境中,从表达晶体蛋白的细菌培养液中分离晶体以及/或者孢子并把这类晶体以及/或者孢子的溶液、悬浮液、或者棉胶制剂用作活性生物杀虫剂组合物可能是合乎需求的。
本发明的另外一个重要的方面是一种用于控制容易受本发明中所述的新颖的组合物影响的鞘翅类昆虫的方法。这类方法通常包括让昆虫或者昆虫种群、群落等接触杀虫有效数量的Cry3Bb*晶体蛋白组合物。该方法可以使用如在以下序列中所述的Cry3Bb*晶体蛋白:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,或序列编号:108,或其生物学功能相当的序列。
可选地,本发明的方法可以使用一种或多种由以下核酸序列编码的Cry3Bb*晶体蛋白:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107,或者由一种或多种在中等严格或者更高严格程度下与以下序列杂交的核酸序列编码的Cry3Bb*晶体蛋白:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。用于鉴定在中等严格程度或者更高严格程度下与本发明所述的序列杂交杂交的序列的方法是本工艺的熟练认识所公知的,而且也在本发明中进行了描述。
不管使用的是哪种方法,所用的活性成分的使用数量是杀虫有效数量,这根据一些因子的情况而存在差异,这些因子包括,例如所要控制的特定的鞘翅类昆虫、所要治疗的特定的植物或作物、环境条件、以及所用的方法、比率、以及所施用的具有杀虫活性的组合物的数量。
本发明中所述的杀虫组合物可以通过把细菌细胞、晶体以及/或者孢子悬浮液、或者分离的蛋白成分与所要的农业上可接受的载体配制在一起来制造。组合物可以在施用以前被以合适的方式,例如冻干、冷冻干燥、干燥等,进行配制,也可以被配制在水性载体、介质或者合适的稀释液,如盐水或其它的缓冲液中。组合物可以被配制成粉尘或者微粒材料、或者一种油(植物或矿物油)的悬浮液、或者油/水乳剂,或者可湿性粉末、或者与任何适合农业应用的任何其它的载体材料相结合。合适的农业载体可以是固体或者液体,它们都是本工艺中公知的。术语“农业上可接受的载体”涵盖了所有的佐剂,例如惰性成分、分散剂、表面活性剂、增粘剂、粘合剂等等,它们都是在杀虫剂配制技术中通常使用的,是精通杀虫剂配制的人士所公知的。这些配方可以和一种或多种固体或液体佐剂混合在一起并用各种不同的方法,如用常规的配制技术把杀虫剂组合物与合适的佐剂进行匀浆混合、混合以及/或者研磨来制备。
用常规的方法,优选地用喷雾的方法把本发明的杀虫剂组合物使用到目标鞘翅类昆虫的环境中,典型的是喷雾在所要保护的植物或作物的叶片上。可以根据所要治疗的特定的昆虫和作物的特定的情况以及特定的环境条件来设置杀虫剂施用的强度和持续时间。活性成分与载体的百分比率将依赖于杀虫剂组合物的化学性质、溶解性、以及稳定性,也依赖于所使用的特定的配方。
同时也可以使用其它的施用技术,例如涂粉、撒水、浸泡、土壤注射、土壤耕种、种子涂覆、喷雾、爆气、撒雾、喷成雾状、等等,这些技术可能是在特定的状况下所需要的,例如当有昆虫对根或茎进行侵袭时,同时它们也可以被应用于精致的植物或观赏性植物。这些施用步骤也是本工艺的熟练人士所公知的。
本发明的杀虫剂组合物可以被单独应用于本发明的方法中,或者它们也可以与其它的化合物,包括但不局限于其它的杀虫剂,结合使用。同时本发明的方法也可以被用于与其它的处理方式,例如表面活性剂、去污剂、聚合体或者缓释制剂结合使用。本发明的杀虫剂组合物可以被配制用于系统性或局部性的用途。
用于环境的、系统性的、或者叶面施用的杀虫剂组合物的浓度将根据特定配方的本质、施用的方法、环境条件、以及生物杀虫活性的程度而大有差异。典型地,生物杀虫剂组合物在所使用的配方中的浓度至少为大约1%(重量比),而且可以达到并包括重量比的99%。组合物的干配方中组合物的组成可以达到大约1%至大约99%(重量比),而液体配方中的活性成分则通常占重量比的大约1%至大约99%或者更大的比重。含有完整的细菌细胞的配方通常含有大约104至1012个细胞/毫克。
可以根据需要给特定的植物或目标地区一次或多次施用杀虫剂配方,典型的田间施用率的范围为每公顷施用大约1克至大约1千克、2千克、5千克,或者甚至更多的活性成分。4.8  作为杂交探针和引物的核酸片段
此处所设想的核酸序列除了被用于指导本发明的晶体蛋白或肽的表达以外还具有许多其它的用途。例如,它们在核酸杂交的实施例中被用为探针或引物。因此,具有以下特征的核酸片段被设想具有特别的用途,即它们含有一个长度为至少14个核苷的连续序列,这些序列与以下的长度为14个核苷的连续的DNA序列相同,或者互补:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。在一些特定的实施例中也可以使用更长的、连续的相同的或互补的序列,如那些长度为大约20,30,40,50,100,200,500,1000,2000,5000,10000等(包括所有的中间长度直至包括全长)的序列。
这类核酸探针特定地与编码晶体蛋白的序列进行杂交的能力将使它们能够被用于检测在一个给定的样品中是否存在互补序列。然而,它们也被设想具有其它的用途,包括使用其序列信息来制备突变种类的引物,或者制备用于制备其它遗传构建物的引物。
特别地设想具有以下特征的核酸分子可以被用作在例如Southern和Northern印迹中使用的杂交探针,即它们含有一个序列区域,该序列区域含有长度为10-14,15-20,30,50,或者甚至100-200左右个核酸的连续的核酸序列,其中这些序列与以下的DNA序列相同或者互补:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。更小的片段通常可被应用于杂交实施例中,其中连续互补区域的长度可以有所差异,例如介于大约10-14以及大约100或200个核苷之间,但是也可以使用更长的连续互补片段,这可以根据所要检测的互补序列的长度来定。
使用一个长度为14个核苷的探针可以形成一个既稳定又具有选择性的双链分子。但是,含有长度大于14个核苷的连续互补序列的分子通常是优选的,以便增加杂合体的稳定性和选择性并从而改善所获得的特定的杂合体分子的质量和程度。通常优选的是设计含有其长度为15-20个连续核苷,甚至更长的基因互补片段的核酸分子。
当然,可以用其它的技术,例如使用机械剪切或者限制性酶解,来获得这些片段。更短的核酸片段可以通过,例如用化学方法直接合成该片段来容易地制备,这通常都是用自动化的低聚核苷合成仪来实现的。另外,也可以使用核酸复制技术,例如使用美国专利4,683,195和4,683,202(两个申请的全部内容作为参照结合于本发明中)的PCRTM技术,通过在重组载体中导入选定的序列用于重组生产来获得这些片段,也可以用通常为分子生物学工艺的熟练人士所公知的重组DNA技术来获得。
相应地,本发明的核酸序列可以被用于选择性地与DNA片段的互补片段形成双链分子。根据所设想的应用,可能会想要使用各种不同的杂交条件来获得探针对目标序列的不同程度的选择性。当在应用中需要高度的选择性时,典型地需要使用相对严格的条件来形成杂合体,例如,需要选择相对低盐和/或高温条件,例如在大约50℃至大约70℃之间的温度提供大约0.02M至0.15M的NaCl。此类选择性条件仅容忍在探针和模板或目标链之间发生少量的(如果有的话)错配,特别适用于分离编码晶体蛋白的DNA片段。通过杂交来检测DNA片段是业内人士所公知的,杂交分析的的方法的例子见于美国专利4,965,188和5,176,995(作为参照结合于本发明中)。具体相关的教导见于Maloy等,1994;Segal,1976;Prokop,1991;以及Kuby,1994的文献。
当然,对于一些应用,例如,当需要用一个杂交到编码模板上的突变引物来制备突变体,或者探索从相关的种类、功能性等同体等等分离编码晶体蛋白的序列时,通常需要严格程度较低的杂交条件,以便形成杂交双链。在这些情形中,可能需要使用如大约0.15M至大约0.9M的盐以及介于大约20℃至大约55℃的温度。这样,就可以把交叉杂交的种类鉴定为阳性杂交信号(相对于对照杂交而言)。在任何情形中,通常应该理解的是通过增加甲酰胺的数量可以使条件变得更为严格,其中甲酰胺是用于稳定异型双链,其作用方式与提高温度相同。这样,可以对杂交的条件随意进行操作,因此通常是首选的方法,这取决于所希望得到的结果。
在特定的实施例中,有利的是把本发明的核酸序列与合适的方法,例如标记物,结合使用,用于确定杂交。有范围广泛的合适的指示物在本工艺中是已知的,包括荧光剂、放射性物质、酶配体或其它的配体,例如抗生物素蛋白/生物素,它们都可以提供一个可被检测的信号。在优选实施例中,可能希望使用一种荧光标记物或者一个酶标记物,如脲酶、碱性磷酸酶或者过氧化物酶,而不是使用放射性物质或其它对环境不利的试剂。在酶标记物的情形中,已知可以用比色指示底物来提供一种人眼或分光光度计可以检测到的方法,用于鉴定与含有互补核酸的样品的杂交。
总体上,本发明中所述的杂交探针被设想可以被用作溶液杂交试剂,同时也可以被用于使用固相的实施例中。在设计固相的实施例中,试验的DNA(或RNA)被吸收或者以其它的方式粘附到选定的基质或表面上。然后让这一经过固定的单链核酸与选定的探针在所要的条件下特定地进行杂交。所选定的条件将依赖于特定的环境,上述的环境是基于所需的特定的标准的,例如依赖于G+C的含量、目标核酸的类型、核酸的来源、杂交探针的尺寸等等。在清洗杂交表面以便除去非特异性结合的探针分子之后,通过标记物对特定的杂交进行检测,或者甚至进行定量。4.9  经过修饰的Cry3δ-内毒素的特征
本发明提供了新颖的多肽,这些多肽定义了由以下苏云金芽胞杆菌核酸序列编码的晶体蛋白的全部或者一部分:cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cry3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095以及cry3Bb.11098。4.10晶体蛋白命名法
本发明已经任意地给本发明的新颖的蛋白指定了以下的名称:Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095以及Cry3Bb.11098。
类似地,本发明也给编码上述多肽的新颖的核酸序列分别随意地指定了以下的名称:cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cry3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11043,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095以及cry3Bb.11098。虽然苏云金芽胞杆菌命名法委员会可以根据经过修订的晶体蛋白内毒素命名法(表1)对这些基因和蛋白进行正式的命名,但是对本发明的组合物进行的任何重新命名同时也被设想是完全属于本发明的范围之内的。4.11转基因宿主细胞和转基因植物
本发明也设想了用本发明的表达载体进行转化的一种细菌、酵母细胞、或者一种植物细胞或者植物。一种转基因细菌、酵母细胞、植物细胞或者来源于此类经过转化或转基因的细胞的植物也构成了本发明的一个方面。
经常需要把这类经过转化的宿主细胞用于内毒素的生产以及本发明中所述的各种不同的DNA基因构建物的表达中。在本发明的一些方面,经常需要对本发明中所述的基因片段的表达进行调制、调节或者其它方式的控制。这类方法对于分子遗传学工艺的熟练人士是常规的。典型地,当需要增加或者过量表达一种特定的基因时,可以进行各种不同的操作以便增加信使RNA的表达,特别是通过在使用序列的同时使用一种活性启动子,这种启动子增强了信使RNA在特定的经过转化的宿主细胞中的稳定性。
典型地,起始和转录终止区域将含有终止密码子、一个终止区域、以及可选地一个多聚腺苷酰化作用信号。沿着转录的方向,即从编码或阅读序列的5’端到3’端的方向,构建物将包括转录调控区域(如果有的话)、以及启动子,其中调控区域可以在启动子的5’端或3’端、核糖体结合位点、起始密码子、含有与起始密码子相连的开读框的结构基因、终止密码子、多聚腺苷酰化作用信号序列(如果有的话)、以及终止子区域。这一双链形式的序列可以被自身用于转化微生物宿主,但通常被与一个含有标记物的DNA序列包括在一起,其中第二个DNA序列可以在DNA被导入宿主中时被接合到表达δ-内毒素的构建物上。
为结构基因设置一个标记物是为了给这些已经被修饰或转化的宿主提供选择。标记物通常将提供选择性的优点,例如提供生物杀伤剂抗性,例如对抗生素或重金属的抗性;互补作用,以便给营养缺陷型的宿主提供原养,等等。优选地使用互补作用,这样经过修饰地宿主不仅得到了选择,而且在田间还具有竞争力。在发展构建物以及对宿主进行修饰时可以使用一个或多个标记物。可以通过提供一种相对田间其它野生型微生物的竞争性优点来对生物体进行进一步的修饰。例如,可以在把表达金属螯合剂(如含铁细胞(siderophore))的基因和表达δ-内毒素的结构基因同时导入宿主中。这样,含铁细胞表达的增强可以为生产δ-内毒素的宿主提供一个竞争性的优点以便使它可以有效地与野生型的微生物竞争并在环境中稳定地占领一个活动的范围。
当不存在功能性复制系统时,构建物的序列中还将包括一个至少为50碱基对(bp),优选地为100bp,通常不超过大约1000bp的序列,该序列与宿主中的序列是同源的。这样,正当重组的可能性就得以增强,使得基因可以被整合到宿主中并被宿主稳定地保持。优选地,δ-内毒素基因应与提供互补作用的基因以及提供竞争性优点的基因非常接近。因此,当δ-内毒素基因丢失时,由此获得的生物体很可能也丢失了互补作用基因以及/或者提供竞争性优点的基因,这样该生物体就无法与那些基因还完整地保留在构建物中的生物体竞争了。
编码晶体蛋白的基因可以被插入于转录和翻译起始区域与转录和翻译终止区域之间,以便接受起始区域的调控。这一构建物可以被包括在质粒中,上述的质粒将包括至少一个复制系统,但可以包括一个以上,其中的一个复制系统被用于在质粒发展的过程中进行克隆,另一个复制系统是在最终的宿主中发挥功能所必需的。另外,可以存在一个或多个标记物,这在以前已经被描述了。当需要进行整合时,质粒包括一个与宿主基因组同源的序列是合乎需求的。
可以根据常规的方法来分离转化体,通常使用的是筛选技术,通过这一技术可以把想要的生物体与未经修饰的生物体或用于转移的生物体(如果有的话)分离筛选出来。随后可以测试转化体的杀虫活性。
合适的宿主细胞,其中含有杀虫剂的细胞将被处理以便延长细胞中的δ-内毒素在经过如此处理的细胞被施用于目标害虫的环境中时的活性,可以包括原核或真核细胞,通常局限于那些不产生对高等生物体(如哺乳动物)具有毒性的物质的细胞。然而,也可以使用那些可以产生对高等生物体具有毒性的物质的生物体,其中在上述生物体中的δ-内毒素是不稳定的,或者其施用的水平足够的低,不足以对哺乳动物宿主产生任何毒性。对于宿主而言,特别感兴趣的是原核生物和较低等的真核生物,例如真菌。示例性的原核生物(包括格兰氏阴性和格兰氏阳性)包括肠杆菌科,例如埃希氏菌属、欧文菌属、志贺菌属、沙门菌属、以及变性菌属;芽孢杆菌科;根瘤菌科,如根瘤菌;螺菌科,如发光菌、Zymomonas、沙雷菌属、气单胞菌属、弧菌属、去磺弧菌属、螺菌属;乳酸菌;植形(phylloplane)生物体,例如极毛杆菌科的成员(包括假单胞菌属和醋酸杆菌属);固氮菌属和硝化菌属;产黄菌属;芽孢杆菌属的一些成员,如乳杆菌种类、双歧杆菌属以及杆菌种类等等。特别优选的宿主细胞包括Pseudomonasacruginosa、Pseudomonas fluorescens、Bacillus thuringiensis、Escherichia coli、Bacillus subtilis等等。
真核细胞中优选的是真菌,例如藻菌类植物以及子囊菌类,这包括酵母,例如人体酵母菌以及担子菌类、圆酵母、短梗霉属、掷孢酵母属、酵母属、以及掷孢酵母属种类。
在筛选一个用于生产目的的宿主细胞时特别感兴趣的特征包括:易于把δ-内毒素的基因导入到宿主中;有可用的表达系统;表达的效率;杀虫剂在宿主中的稳定性;以及存在辅助的遗传能力。用作杀虫剂微胶囊的感兴趣的特征包括杀虫剂的保护性特质,例如具有厚的细胞壁、色素形成、以及在细胞内包装或形成包含体;叶子亲和性;对哺乳动物不具有毒性;能够诱惑害虫撮食;容易杀灭和固定同时又不损害δ-内毒素的毒性,等等。其它的考虑包括易于配制和处理、经济效益、保藏的稳定性,等等。
在处理时,细胞通常是完整的或者处于增殖的形式,而不是处于孢子的形式,虽然在某些情形中可以使用孢子。可以用以下所述的方法对重组的微生物细胞进行处理。经过处理的细胞通常结构稳定性增强,这将增强其对环境条件的抵抗力。
可以使用各种不同的技术把本发明中所述的基因或其它的核酸片段插入到宿主细胞中,这些技术在本工艺中都是公知的。例如,有大量的含有在大肠杆菌中复制的系统以及一个允许对转化细胞进行筛选的标记物的克隆载体可以被用于把外源基因插入到高等生物体(包括植物)中。这些载体包括例如,pBR322、pUC系列、M13mp系列、PACYC184等。相应地,编码δ-内毒素的序列可以被插入到载体中合适的限制性位点上。由此获得的质粒被用于转化到大肠杆菌中。在合适的营养介质中培养大肠杆菌,然后收获并裂解。回收质粒并进行序列分析、限制性分析、电泳以及其它的生物化学、分子生物学方法分析,这些都是通常所进行的分析步骤。在每个操作之后,可以把所使用的DNA序列剪切下来并连接到下一个DNA序列上。可以把每一个质粒序列克隆到同一个或者不同的质粒中。根据把所要的基因插入到植物中时所用的方法,可能需要其它的DNA序列。
用于植物细胞DNA转化的方法包括农杆菌介导的植物转化、原生质体转化、基因转移进入花粉、注射进入生殖器官、注射进入未成熟的胚胎、以及粒子轰击法。上述的每一种方法都有其显著的优点和缺点。因此,把基因导入一个特定的植物植株中的特定的方法并不一定是对另一个植物植株最有效的方法,但是已经清楚地知道对于一种特定的植物植株哪一种方法是有用的。
合适的方法被认为包括能够把DNA导入细胞中的任何方法,如农杆菌感染;DNA的直接输送,例如pEG介导的原生质体转化(Omirulleh等,1993)、干燥/抑制介导的DNA摄取、电击穿、金刚砂激动作用、涂覆有DNA的粒子的加速;等等。在特定的实施例中,加速方法是优选的,包括,例如微粒轰击等等。
用于把DNA导入细胞中的技术是业内人士所公知的。已经有人描述了四种用于把基因素输送到细胞中的一般的方法:(1)化学方法(Graham和van der Eb,1973,Zatloukal等,science 1992);(2)物理学方法,如微粒轰击(Capecchi,1980)、电穿孔(Wong和Neumann,1982;Fromm等,1985)以及基因枪(Johnston和Tang,1994;Fynan等。1993);(3)病毒载体(Clapp,1993;Lu等,1993;Eglitis和Anderson,1988;Eglitis等,1988);以及(4)受体介导的机制(Curiel等,1991;1992;Wagner等1992)。
有大量的技术可以被用于把DNA插入到植物宿主细胞中。这些技术包括使用根癌土壤杆菌或者Agrobacterium rhizogenes作为转化剂用T-DNA进行转化、融合、注射、或者电击穿、以及其它的可能的方法。当把农杆菌用于转化时,所要插入的DNA必须被克隆到特定的载体中,即克隆到一个中间载体或者二元载体中。中间载体可以用同源重组整合到Ti或Ri质粒中,因为它们含有与T-DNA序列同源的序列。Ti或Ri质粒同时还包含有T-DNA转移所需的vir区域。
中间载体在农杆菌中无法进行自身复制。可以通过一种帮助质粒(结合)把中间载体转移到根癌农杆菌中。二元载体可以在大肠杆菌和农杆菌中进行自身复制。它们含有一个筛选标记基因以及一个连接物或者低聚连接物,这些连接物的左右两侧连接着T-DNA的边界区域。它们可以被直接转化到农杆菌中(Holsters等,1978)。被用作宿主细胞的农杆菌将含有一个含有一个vir区域的质粒。vir区域是把T-DNA转移到植物细胞中所必需的。可以含有另加的t-DNA。经过如此转化的细菌被用于植物细胞的转化。植物外植体可以被有利地与根癌农杆菌和Agrobacterium rhizogenes一起培养,以便把DNA转移到植物细胞中。然后可以在合适的介质,该介质可能含有用于筛选的抗生素或者生物杀伤剂,中从受感染的植物材料(如叶片、茎的段、根、但也包括原生质体或者悬浮培养的细胞)再生出完整的植物。然后可以检测如此获得的植物是否存在插入的基因。当进行注射和电击穿时,对质粒没有特殊的要求。可以使用通常的质粒,例如使用pUC衍生物。如果,例如,用Ti或Ri质粒来转化植物细胞,那么Ti或Ri质粒T-DNA的至少右边界,但通常是左右两个边界必须被连接成所要插入的基因的边界区域。用T-DNA来转化植物细胞已经被详细地研究并充分地描述于欧洲专利申请No.EP 120 516;Hockema(1985);An等,1985;Herrera-Estrella等,(1983);Bevan等,(1983);以及Klee等,(1985)中。
用于双子叶植物转化的一个特别有用的含有增强的Ti质粒盒式载体CaMV35S启动子(EN35S)以及含有多聚腺苷酰化作用信号的末端,上述的多聚腺苷酰化作用信号来源于一个编码β-conglycinin的α亚基的大豆基因。在上述的两个元件之间是一个多元连接物,它含有多个可以供目标基因插入的限制性位点。
载体优选地含有一个pBR322的片段,它提供了在大肠杆菌中表达的复制起点以及一个用于与所要的农杆菌菌株ACO的T-DNA进行同源重组的区域;来源于具有广泛的宿主范围的质粒PKI的oriV区域;来源于Tn7的链霉素/放线菌素抗性基因;以及一个嵌合的NPTII基因,该基因含有CaMV35S启动子以及胭脂碱合成酶(NOS)的3’端,它为经过转化的植物细胞提供了卡那霉素抗性。
可选地,可以用15kb的mannopine合成酶(MAS)启动子(Velten等,1984)来替代经过增强的CaMV35S启动子。在把一个DNA构建物结合到载体中之后,把它导入一个含有解毒的(disarmed)Ti质粒的根癌农杆菌菌株ACO中。对共整合的Ti质粒载体进行筛选,随后可以把它用于转化双子叶植物。
根癌农杆菌ACO是一种解毒的菌株,它与Fraley等(1985)所描述的pTiB6SE类似。在构建ACO时,起始的农杆菌菌株是菌株A208,它含有一个胭脂碱类型的Ti质粒。上述的Ti质粒被以与Fraley等(1985)所述的类似的方法解了毒,使得几乎所有的天然的T-DNA都被除去,除了左边界以及在左边界内的几百个碱基对T-DNA以外。延伸到右边界后的一个点的剩余的T-DNA被替换为一个新颖的DNA片段,该片段从左到右包括一个pBR322的片段、来源于质粒RK2的oriV区域、以及来源于Tn601的卡那霉素抗性基因。pBR322和oriV片段与这些片段是类似的,提供了一个用于共整合的同源区域。
一旦被插入的DNA已经被整合到基因组中,它在那里将会相对稳定,而且根据经验,不会再出来了。它通常含有一个筛选标记物,这个标记物存在于经过转化的对生物杀伤剂或抗生素,如卡那霉素、G418、博来霉素、潮霉素、或者氯霉素等等具有抗性的植物细胞中。个别使用的标记物应该相应地允许对经过转化的细胞,而不是那些不含有插入的DNA的细胞进行筛选。4.11.1电穿孔
把短暂的高电压电脉冲作用于各种不同的动物和植物细胞导致在质膜中形成纳米大小的孔。DNA被从这些孔直接撮入细胞质中,或者作为膜成分重新分配的结果伴随着孔的关闭被摄入细胞。电穿孔可以具有极高的效率,它可以被用于克隆基因的瞬时表达以及整合有感兴趣的基因拷贝的细胞株的确立。电穿孔不同于磷酸钙介导的转染和原生质体融合的是,它经常产生整合有一个,或者最多少数几个,外源DNA拷贝的细胞株。
通过电穿孔导入DNA的方法是本工艺的熟练人士所公知的。在这种方法中,使用特定的细胞壁降解酶,如胶质降解酶来使目标受体细胞变得比未经处理的细胞更容易受电击穿转化的影响。可选地,也可以通过机械创伤来使受体细胞更容易受转化的影响。为了实现电击穿转化,可以使用脆弱的组织,如细胞的悬浮培养物或者胚胎发生愈伤组织,或者可选地,可以对未成熟的胚胎或者其它的组织直接进行转化。可以通过把细胞壁暴露于胶质降解酶(pectolyases)或者通过以受控的方式进行机械创伤来部分降解细胞壁。这时可以进行电击穿DNA转移并把这些细胞当作电击穿DNA转移的受体,然后根据新整合进来的DNA的性质用合适的筛选协议鉴定被转化的细胞。4.11.2微粒轰击
用于把转化用的DNA片段输送到植物细胞中的另外一个有利的方法是微弹轰击法。在这一方法中,可以在微粒上涂覆核酸并用一个推进力把微粒输送到细胞中。示例性的微粒包括那些包含钨、金、铂等的微粒。
微弹轰击法作为一种能够可繁殖地、稳定地转化单子叶植物的有效的方法,它的一个优点是既不需要分离原生质体(Cristou等,1988),又不需要对农杆菌感染具有感受性。通过加速度把DNA输送到玉米细胞中的方法的一个示例性的实施例是Biolistics ParticleDelivery System,它可以被用于把涂覆有DNA或细胞的微粒推进通过一个屏幕,如一个不锈钢或Nytex屏幕,到达一个涂覆有培养在悬浮液中的玉米细胞的滤器表面上。屏幕分散了微粒,使它们不被以大的聚集物的形式输送给受体细胞。在微粒装置和所要轰击的细胞之间设置一个屏幕被认为可以减小微粒聚集物的尺寸并且可以通过减少太大的微粒对受体细胞的损伤来提高转化的频率。
在进行轰击时,悬浮液中的细胞优选地被浓缩在滤器或者固体培养介质上。可选地,也可以把未成熟的胚胎或者其它的目标细胞准备在固体培养介质上。把所要轰击的细胞定位在微粒挡板下一个合适距离的位置。如果需要,也可以在加速装置和所要轰击的细胞之间设置一个或多个屏幕。通过使用本发明中所描述的技术可以获得1000个或更多的短暂地表达标记基因的细胞焦点(foci)。每一个在轰击后48小时表达外源基因产物的焦点的细胞数目通常介于1至10个之间,平均为1至3个。
在微粒轰击转化中,可以通过优化轰击前的培养条件以及轰击参数来获得最多数目的稳定转化体。在这一技术中,轰击的物理学和生物学参数都很重要。物理学因素是那些涉及DNA/微粒沉淀物或者影响大的颗粒或微粒的飞行和速度的因素。生物学因素包括在轰击前以及紧跟其后对细胞进行操纵的所有步骤、为了帮助减轻轰击所伴随的外伤而对目标细胞进行的渗透性调节、以及转化用的DNA(如线性化的DNA或完整的超螺旋质粒)的性质。轰击前的操纵被认为对未成熟胚胎的成功转化是特别重要的。
相应地,本发明者设想有人会希望在小规模的研究中调整各种不同的轰击参数以便对条件进行充分的优化。有人可能会特别希望对一些物理学参数,如间隙的距离、飞行的距离、组织的距离以及氦气的压力,进行调整。也可以通过对影响受体细胞生理学状态并可能从而影响转化和整合效率的条件进行修饰来优化外伤减少因子(traumareduction factors,TRFS)。例如,可以对受体细胞的渗透状态、组织的水合作用以及所代培养物状态或细胞周期进行调整以实现最优转化。在本发明所公开的内容的指导下,其它的常规性调整对于本工艺的熟练人士将是以知的。4.11.3农杆菌介导的转移
农杆菌介导的转化是一个可以被广泛应用的用于把基因导入到植物细胞中的系统,因为DNA可以被导入到整个植物组织中,从而无须从一个原生质体再生出完整的植株。用农杆菌介导的植物整合载体把DNA导入到植物细胞中的方法在本工艺中是公知的。参照,例如,已经被描述的方法(Fraley等,1985;Rogers等,1987)。另外,Ti-DNA的整合是一个相对精确的过程,它所产生的重排很少。所要转移的DNA区域是由边界序列来定义的,所要插入的DNA通常如前述的方法(Spielmann等,1986;Jorgensen等,1987)被插入于植物基因组中。
现代的农杆菌转化载体能够在大肠杆菌和农杆菌中复制,从而便利了操纵,如前述(Klee等,1985)。另外,最近在用于农杆菌介导的基因转移的载体上的技术进步已经改善了载体中基因和限制性位点的安排以便利构建能够表达各种不同多肽编码基因的载体。前述的载体(Rogers等,1987)含有便利的多连接序列区域,这些区域两端分别连接着一个启动子和一个多聚腺苷酰化作用位点,用于直接表达插入的多肽编码基因。这些载体适合于本发明的目的。另外,可以用同时含有毒性和非毒性Ti基因的农杆菌进行转化。在农杆菌介导的转化能够发挥效率的植物植株中,因为基因转移所具有的容易的、规定的性质,这是首选的方法。
农杆菌介导的叶片以及其它组织,例如子叶和下胚轴,的转化仅局限于农杆菌天然感染的那些植物。农杆菌介导的转化在双子叶植物中是最有效率的。极少数的单子叶植物是农杆菌的天然宿主。虽然已经用农杆菌载体在芦笋中制造了转基因植物,如前述(Bytebler等,1987)。因此,具有商业重要性的谷类,如大米、玉米和小麦通常必须用替代的方法进行转化。然而,如上所述,芦笋仍然可以用农杆菌进行转化(见,例如,Bytebier等,1987)。
用农杆菌转化方法形成的转基因植物典型地在一个染色体上含有一个单一的基因。此类转基因植物可以被称为所添加的基因的杂合体。然而,因为词语“杂合体”通常意味着在一对染色体的另一条染色体的同一位点上含有一个互补的基因,但是在如此处所述的含有一个添加的基因的植物中并不存在这样一个基因,所以认为此类植物的更为准确的名称应该是“一种独立的分离系”,因为所添加的外源性的基因在有丝分裂和减数分裂期间独立地分离。
更为优选的是一种所添加的结构基因的纯合的转基因植物,即该转基因植物含有两个添加的基因,在一对染色体的两条染色体上的同一位点上分别含有一个基因。纯合的转基因植物可以通过以下步骤来获得:交配一个含有一个单一的添加基因的独立的分离系转基因植物(自体受精);让由此获得的种子萌芽并分析如此获得的植物,该植物被生产用以增强羧肽酶活性(相对于对照(天然的、未经转基因的)或者一个独立的分离系转基因植物)。
应该理解的是,也可以让两种不同的转基因植物交配以产生含有两个独立分离的添加的外源基因的子代。合适子代的自体受精可以产生两个添加的编码感兴趣的肽的外源基因的纯合的植物。同时本发明还设想了与父代植物的回交以及与非转基因植物的异型杂交。
植物原生质体的转化也可以通过使用基于磷酸钙沉淀、聚乙二醇处理、电穿孔、以及这些处理的结合的方法来实现(见,例如,Potrykus等,1985;Lorz等,1985;Fromm等,1985;Uchimiya等,1986;Callis等,1987;Marcotte等,1988)。
这些系统在不同植物株系的应用取决于从原生质体再生具有特定功能的植物株系的能力。用于从原生质体再生谷类作物的示范性的方法已有描述(Fujimura等,1985;Toriyama等,1986;Yamada等,1986;Abdullah等,1986)
为了对不能成功地从原生质体再生的植物株系进行转化,可以使用其它的把DNA导入到完整的细胞或组织中的方法。
例如,可以根据前述的方法(Vasil,1988)从未成熟的胚胎或者外植体再生谷类植株。另外,也可以使用“基因枪”或者高速微粒轰击技术(Vasil,1992)。
当使用后一种技术时,存在于细小金属颗粒上的DNA被携带通过细胞壁进入细胞质中,如前述(Klein等,1987;Klein等,1988;McCabe等,1988)。金属颗粒穿透好几层细胞,因而使得可以在组织外植体中的转化细胞。4.11.4植物中基因的表达
虽然最近几年在表达细菌蛋白,如苏云金芽胞杆菌晶体蛋白,的转基因植物的制备上已经取得了很大的进步,但是在植物中表达天然的细菌基因通常却是令人失望的。不同于微生物遗传学的是,早期的植物遗传学家对影响外来基因在植物中异源表达的因素的了解很少。然而,在最近几年,有好几种潜在的因素已经被示明在不同的程度上负责特定编码序列的蛋白表达水平。例如,现在科学家们知道在细胞中维持一种特定的mRNA的显著水平是一个关键的因素。不幸的是,造成编码外来蛋白的mRNA的低稳定性的原因却有好多。首先,全长RNA合成发生的频率不高。这可能是因为在转录时RNA过早地终止了,或者是因为在转录时发生意料之外的mRNA加工。第二,全长RNA可能是在植物细胞中产生的,但是随后却在核中被以某种形式加工(剪切、添加多聚A),使得所产生的mRNA不具有功能。如果RNA没有被适当地合成、终止和多聚腺苷酰化,它就无法转移到细胞质中进行翻译。类似地,在细胞质中,如果mRNA的半寿期(这是由它们的初级和二级序列所决定的)截短了,那么就无法生产足量的蛋白。另外,翻译效率对mRNA的半寿期有影响,程度未确。另外,每一个RNA分子折叠成特定的结构,或者可能会折叠成一族结构,这是由它的序列所确定的。任何RNA的特定的结构导致其在细胞质中的稳定性更强或更弱。结构本身也可能是mRNA在核中加工的一个决定因素。不幸的是,不可能预测,几乎也不可能在体外和体内确定任何RNA(tRNA除外)的结构。然而,戏剧性地改变一个RNA的序列有可能能够对它的折叠结构产生很大的影响。结构本身或者一些特定的结构特征也可能在RNA稳定性的确定中发挥作用。
为了克服这些在外来基因表达上的局限性,研究者们已经鉴定出RNA中特定的序列和信号,它们具有对RNA稳定性产生特定影响的潜力。因此,在本发明的特定实施例中,需要优化植物中已打开的核酸片段的表达。这样做的一种特定方法,是通过改变细菌的基因,以除去降低在某一已转化的植物细胞中表达的序列或基序。为在植物中最优表达的编码序列,其操纵过程优选的常常是对一段DNA序列进行“植物化”。
尤其有疑问的是富含A+T的序列。不幸的是,由于苏云金芽胞杆菌具有富含A+T的基因组,因此为了使其在植物中达到最优表达,常常必须修饰天然晶体蛋白的基因序列。序列基序ATTTA(或者当其出现在RNA中为AUUUA)已经作为一种破坏稳定性的序列牵涉到哺乳动物细胞的mRNA中(Shaw和Kamen,1986)。许多短期存在的mRNA具有富含A+T的3’端非翻译区,这些区域常常含有ATTTA序列,有时是以多拷贝或多聚体(如ATTTATTTA…)的形式存在。Shaw和Kamen指出不稳定的mRNA 3’末端向稳定的RNA(球蛋白或VA1)的转移显著地降低了稳定的RNA的半衰期。他们进一步指出ATTTA的五聚体对一段稳定的信息具有深刻的破坏稳定性的作用,而且这种信号在位于3’末端或编码区内时均可发挥作用。然而,ATTTA序列的数目和/或它们所存在的序列背景在确定它们是否作为破坏稳定性的序列发挥作用时也显示出重要性。Shaw和Kamen指出ATTTA的三聚体对mRNA稳定性的影响大大低于五聚体,二聚体或单体对稳定性没有影响(Shaw和Kamen,1987)。注意到ATTTA的多聚体(如五聚体)自动产生富含A+T的区域。这显示为细胞质的影响,而不是核。在其它一些不稳定的mRNA中,ATTTA序列可能以仅单拷贝的形式存在,但它经常包含在富含A+T的区域中。从迄今为止所收集的动物细胞数据中显示,ATTTA至少在一些背景下对于稳定性是重要的,但是也不可能预测ATTTA的哪些出现是破坏稳定的因素,或者任何这些影响是否可能在植物中见到。
一些关于mRNA在动物细胞中的降解的研究也显示,在某些情况下RNA的降解开始于核酸酵素对富含A+T区域的攻击。这些裂解是否发生在ATTTA序列尚不清楚。也有一些mRNA的例子,它们依赖于其所表达的细胞类型或其所表达的细胞周期的阶段而具有不同的稳定性。例如,组蛋白mRNA在DNA合成阶段稳定,但当DNA合成被打断时即不稳定。一些组蛋白的mRNA的3’末端似乎是形成这一结果的原因(Pandey和Marzluff,1987)。其没有显示出受ATTTA介导,同时也不清楚是什么在控制这段mRNA的不同的稳定性。另一个例子是在B细胞成熟的过程中,IgG的mRNA在B淋巴细胞中稳定性不同(Genovese和Milcarek,1988)。最后一个例子是一种突变的β-thallesemic*球蛋白mRNA的不稳定性。在骨髓细胞中,其中这种基因正常表达,突变的mRNA不稳定,而野生型的mRNA稳定。当在体外突变基因在HeLa或L细胞中表达时,突变的mRNA不显示不稳定性(Lim等,1988)。这些例子均提供了证据,即mRNA的稳定性可以受细胞类型或细胞周期特定因素的调节。此外,这种类型的不稳定性不与特定的序列相关。假如存在这些不确定性,就不可能预测在一种特定的细胞中哪些RNA可能不稳定。另外,甚至ATTTA基序也可能依赖于RNA所表达的细胞的本性而作用不同。Shaw和Kamen(1987)已经报道蛋白激酶C的活化可以阻断由ATTTA介导的降解。
多聚腺苷酸链加入到3’末端在植物和动物的绝大多数真核mRNA中都是普遍的。目前所接受的关于多聚A加入的观点是初期转录的延伸越过了成熟的3’末端。包含在这一转录中的是关于多聚腺苷酰作用和正确的3’末端信息的信号。这种在3’末端的加工包括裂解mRNA和在成熟的3’末端加入多聚A。通过寻找植物及动物mRNA中多聚A区域附近的共有序列,已经有可能确定明显参与多聚A加入及3’末端切除的共有序列。同一种共有序列似乎对这两种过程都很重要。这些信号典型是序列AATAAA的变体。在动物细胞中,这段序列的一些变体已经被确定是有功能的;在植物细胞中,似乎存在范围扩大的功能序列(Wickens和Stephenson,1984;Dean等,1986)。由于所有这些共有序列均为AATAAA的变体,因此它们都为富含A+T的序列。在成熟的mRNA中,发现这段序列代表性地是位于多聚A区域之前的15到20个碱基。对动物细胞的研究显示这段序列参与多聚A的加入以及3’端的成熟。在这段序列中的位点定向诱变可以破坏这些功能。(Conway和Wickens,1988;Wickens等,1987)。然而,同时也观察到推定的多聚A信号的3’端上游一直到50到100个碱基的序列也是必需的;即,一个基因含有正常的AATAAA,但具有被取代或被破坏的下游序列,该基因没有得到正确的多聚腺苷酸(Gil和Proudfoot,1984;Sadofsky和Alwine,1984;McDevitt等,1984)。简而言之,多聚A信号本身对于完整和恰当的加工不是足够的。然而尚不知道除多聚A信号之外,还有什么特殊的下游序列是必需的,或者是否存在具有这种功能的特殊序列。因此,序列分析只能鉴定潜在的多聚A信号。
在正常多聚腺苷酸化的天然存在的mRNA中,已经观察到这一过程的瓦解(通过改变多聚A信号或mRNA中其它的序列)在功能mRNA水平上可以观察到深刻的影响。这一现象已经在几种天然存在的mRNA中发现,其结果到目前为止是基因特异性的。
已经显示在天然的mRNA中,正确的多聚腺苷酰作用在mRNA积聚中很重要,这一过程的瓦解可以明显影响mRNA水平。然而,对于预测正常基因改变的影响的知识存在不足。在异源基因中,预测该结果甚至更为困难。然而,可能存在所鉴定的推定位点是功能紊乱的。简而言之,这些位点可能无法作为正常多聚A位点发挥作用,但是可替代为引起不稳定的mRNA的变体位点发挥功能。
在动物细胞系统中,AATAAA是mRNA中多聚A上游所鉴定出的最为普遍的信号,但至少也已经发现了四种变体(Wickens和Stephenson,1984)。在植物中,几乎没有进行如此多的分析,但清楚的是可以使用类似于AATAAA的多聚序列。表5中所称的主要或次要的植物位点仅指Dean等(1986)的研究,其仅分析了三种类型的植物基因。指定多聚腺苷酰作用位点为主要的或次要的,仅仅是指它们在天然存在并且已经分析过的基因中作为功能位点所出现的频率。对于植物而言,这是一个十分有限的数据库。很难带有任何肯定性地预测当发现其在异源基因(如编码本发明中的晶体蛋白的基因)中时,所指定为主要或次要的位点将可能或多或少地部分或完全地发挥作用。
表5植物基因中多聚腺苷酰化作用位点
PA AATAAA    主要的共有位点
PIA          AATAAT          主要的植物位点
P2A          AACCAA          次要的植物位点
P3A          ATATAA          ‘’
P4A          AATCAA          ‘’
P5A          ATACTA          ‘’
P6A          ATAAAA          ‘’
P7A          ATGAAA          ‘’
P8A          AAGCAT          ‘’
P9A          ATTAAT          ‘’
P10A           ATACAT           ‘’
P11A           AAAATA           ‘’
P12A           ATTAAA            次要的动物位点
P13A           AATTAA           ‘’
P14A           AATACA           ‘’
P15A           CATAAA           ‘’
本发明提供了制备人造植物基因的方法,这些基因表达其蛋白产物的水平明显高于野生型基因,迄今为止这些基因通常包括在植物转化中。在另一方面,本发明也提供了编码非植物蛋白的异常人造植物基因。
如以上所描述的,天然苏云金芽胞杆菌基因在植物中的表达是存在问题的。如同许多其它在植物中表达的异源基因一样,苏云金芽胞杆菌基因编码序列的本性将其与植物基因区别开来。特别地,苏云金芽胞杆菌基因富含很多(~62%)的腺嘌呤(A)和胸腺嘧啶(T),而植物基因和大多数已经在植物中表达的其它细菌的基因含A+T大约为45-55%。
由于遗传密码的退化和密码子对任何氨基酸选择的数目有限,在一些杆状菌种中,发现结构编码序列上大多数的“多余”A+T位于密码子的第三位上。简而言之,一些杆状菌种的基因在许多密码子上以A或T作为第三位的核苷。因此,A+T的含量可以部分决定密码子选择的偏好。另外,很明显,基因在它们所进化的有机体中向最大功能进化。这意味着从一种有机体的某一基因中所发现的独特的核苷序列(其中它们除了编码一段独特延伸的氨基酸外可能不起作用)在另一种有机体中具有被认作基因控制元件的可能性(如转录起始子或终止子、多聚A附加位点、内含子接合位点、或特异性mRNA降解信号)。可能会令人惊奇的是这种读错的信号不是异源基因表达的一个更位普遍的特征,但是它可以部分通过许多有机体中相对同源的A+T的含量(~50%)来解释。该A+T的含量以及遗传密码的本性明显限制了任何独特的低聚核苷酸序列出现的可能性。因此,来源于大肠杆菌、A+T含量为50%的基因与来源于苏云金芽胞杆菌的基因相比,其含有任何独特的富含A+T的片段的可能性更小。
典型地,为获得S-内毒素基因在植物中高水平的表达,将编码S-内毒素的现有的结构编码序列(“结构基因”)进行修饰,该修饰是通过对含有结构基因的DNA进行位点定向突变以除去ATTTA序列和推定的多腺苷酸化信号。最为优选的是实质上所有的多腺苷酸化信号和ATTTA序列均被除去,虽然仅部分除去以上所确定的序列中的一种将观察到表达水平增强。可选择地,如果是制备编码主体蛋白表达的人造基因,选择密码子要避免ATTTA序列和推定的多聚腺苷酰作用位点。对于本发明来说,推定的多腺苷酸化信号包括(但不是必需局限于):AATAAA、AATAAT、AACCAA、ATATAA、AATCAA、ATACTA、ATAAAA、ATGAAA、AAGCAT、ATTAAT、ATACAT、AAAATA、ATTAAA、AATTAA、AATACA和CATAAA。在取代ATTTA序列和多腺苷酸化信号时,优先选用的密码子须避免很少在植物基因组中发现的密码子。
筛选所选择的DNA序列以鉴定含有大于四个连续的腺嘌呤(A)或胸腺嘧啶(T)核苷的区域。筛选A+T区域以寻找潜在的植物多腺苷酸化信号。虽然缺乏五个或更多的连续的A或T核苷会排除大多数的植物多腺苷酸化信号,但是如果在彼此相距十个核苷以内含有一个以上已确定的次要的多腺苷酸化信号,则优选的是改变这段区域的核苷序列以除去这些信号,同时保持最初所编码的氨基酸序列。
第二步是考虑围绕在步骤一中已经确定的富含A+T的区域中的约15至约30左右的核苷残基。如果周围区域的A+T的含量低于80%,须在该区域检测多腺苷酸化信号的存在。基于多腺苷酸化信号,该区域的改变依赖于(1)存在的多腺苷酸化信号的数目以及(2)主要的植物多腺苷酸化信号的存在。
检测延伸区域中植物多腺苷酸化信号的存在。通过对DNA序列的位点定向突变除去多腺苷酸化信号。也检测延伸区域中多拷贝的ATTTA序列的存在,该序列也被突变除去。
同样优选的是瓦解含有许多连续的A+T碱基或G+C碱基的区域,因为预测这些区域由于自身配对而有较高的可能性形成发夹结构。因此,插入异源的碱基对将降低自身配对的二级结构形成的可能性,已知该信息在一些有机体中可以抑制转录和/或翻译。在大多数情况下,可以通过使用不含超过五个连续的A+T或G+C的序列来将不利效应降至最小。4.11.5用于突变的人造低聚核苷酸
当低聚核苷酸用于突变时,理想的是维持正确的氨基酸序列和阅读框,没有在修饰过的基因中引入通常的限制酶切位点如BglII、HindIII、SacI、KpnI、EcoRI、NcoI、PstI和SalI。这些限制酶切位点在许多克隆载体的多接头插入位点中有发现。当然,应该也要避免引入新的多腺苷酸化信号(ATTTA序列或连续的超过五个的A+T或G+C伸展片段)。低聚核苷酸优选的大小是约40到50个碱基对,但已经使用的片段变化为约18到约100个碱基。在大多数情况下,维持合成片段两端最小约5到约8个碱基对与模板DNA同源,以确保引物与模板的正确杂交。低聚核苷酸需要避免长于五个碱基对A+T或G+C的序列。用于取代野生型密码子的密码子无论在何种可能性下,优选地应该避免TA或CG偶对。从一种植物优选的密码子表格(如以下表6)中选择密码子,以避免很少在植物基因组中发现的密码子,须尽力选择密码子以优先调整其G+C含量为约50%。
                    表6
         植物中优选的密码子的使用氨基酸         密码子        在植物中使用
                           的百分比ARG             CGA                7
            CGC                11
            CGG                5
            CGU                25
            AGA                29
            AGG                23LEU             CUA                8
            CUC                20
            CUG                10
            CUU                28
            UUA                5
            UUG                30SER             UCA                14
            UCC                26
            UCG                3
            UCU                21
            AGC                21
            AGU                15THR             ACA                21
            ACC                41
            ACG                7
            ACU                31PRO             CCA                45
            CCC                19
            CCG                9
            CCU                26ALA             GCA                23
            GCC                32
            GCG                3
            GCU                41GLY             GGA                32
            GGC                20
            GGG                11
            GGU                37ILE             AUA                12
            AUC                45
            AUU                43VAL             GUA                9
            GUC                20
            GUG                28
            GUU                43LYS             AAA                36
            AAG                64ASN             AAC                72
            AAU                28GLN             CAA                64
            CAG                36HIS                CAC                65
               CAU                35GLU                GAA                48
               GAG                52ASP                GAC                48
               GAU                52TYR                UAC                68
               UAU                32CYS                UGC                78
               UGU                22PHE                UUC                56
               UUU                44MET                AUG                100TRP                UGG                100
含有许多连续的A+T碱基或G+C碱基的区域由于自身互补,因而预测其具有较高的可能性形成发夹结构。优选的是通过插入异源碱基对以瓦解这些区域,这些区域的瓦解将降低形成自身互补的二级结构(如发夹结构)的可能性,在一些有机体中,已知发夹结构能够阻断转录(转录终止子)和翻译(衰减子)。
可选择地,可以制备编码一段给定的氨基酸序列的完整的合成基因,同时避免五个或更多的连续的A+T或G+C核苷的区域。只要可能时,选择密码子以避免密码子中TA和CG的双联。根据植物优选的密码子使用表格(如表6)和优先调整到约50%G+C含量,可以将密码子的使用标准化。须对所得到的序列进行检查以确保推定的植物多腺苷酸化信号和ATTTA序列为最小限度。在通常使用的克隆载体中发现的限制位点也是须优选避免的。然而,在基因各处配置几个独立的限制位点对于分析基因表达或构建基因变体是有用的。4.11.6“植物化”基因的构建
存在于双链DNA形式中的植物基因的表达包括信使RNA(mRNA)从DNA的一条链中通过核糖核苷聚合酶进行转录,以及后来的在核内mRNA初步转录的加工。这种加工包括一段3’端的非翻译区将多聚腺苷酸核苷加入到RNA的3’末端。从DNA到mRNA的转录受一段通常称之为“启动子”的DNA区域调节。该启动子区域含有一段序列的碱基,该序列向核糖核酸聚合酶提供信号,使其与DNA结合及利用DNA的一条链作为模板起始mRNA的转录以得到相应的RNA链。
在文献中已经描述出许多在植物细胞中活跃的启动子。这些包括胭脂碱合酶(nopaline synthase,NOS)和章鱼碱合酶(octopinesynthase,OCS)启动子(它们由诱导肿瘤的根癌农杆菌的质粒携带)、花椰菜花叶病毒(Cauliflower Mosaic Virus,CAMV)19S和35S启动子、来源于核酮糖二磷酸盐羧基酶(ssRUBISCO,一种十分丰富的植物多肽)小亚基的启动子以及mannopine合酶(MAS)的启动子(Velten等,1984及Velten核Schell,1985)。所有这些启动子已被用于建造已经在植物中表达的不同类型的DNA构造物(见例如,国际专利申请出版编号WO84/02913)。
已知或已发现可以在植物细胞中引起RNA转录的启动子可以用于本发明中。这种启动子可以从植物或植物病毒中获取,其包括但不局限于CaMV35S启动子及独立于植物基因(如ssRUBISCO基因)的启动子。如以下所描述的,优选的是所选择的特定的启动子应该能够引起充分表达以导致产生有效数量的蛋白质。
如果需要的话,可以对用于本发明的DNA构建物(也就是嵌合植物基因)中的启动子进行修饰,以影响它们的控制特性。例如,CaMV 35S启动子可以连接到ssRUBISCO基因部分,它在缺乏光线时可抑制ssRUBISCO的表达,从而构建了一种在叶部活跃但在根部不活跃的启动子。所得到的嵌合启动子可以依据本说明书中所描述的进行使用。为了这一描述,短语″CaMV35S″启动子因此包括CaMV35S启动子的变体,例如,通过与操纵子区域连接、随机或控制地诱变等得到的启动子。此外,可以改变启动子使其含有多个“增强子序列”以辅助提高基因表达。
通过本发明中的一段DNA构建物产生的RNA也含有一段5’端非翻译前导序列。这段序列可以来源于选作表达基因的启动子,而且可以经过特定修饰以提高mRNA的翻译。该5’端非翻译区域也可以从病毒的RNA中、从合适的真核基因中、或者从一段合成的基因序列中获得。本发明并不局限以下实施例中所出现的构造物。相反地,对于病毒的衣壳蛋白,非翻译前导序列可以是编码序列的非翻译区的5’末端的一部分、或者是启动子序列的一部分、或者可以来源于一段不相关的启动子或编码序列。在任何情况下,优选的是位于起始位点旁侧的序列与Kozak(1984)所报道的增强的翻译起始的翻译共有序列规则一致。
本发明中的cry DNA的构造物可能也含有一个或多个经修饰的或完全合成的结构编码序列,已经对该结构进行了修改以增强cry基因在植物中的表现。本发明中的结构基因可以选择性地编码一种含有一段氨基末端叶绿体转运肽或分泌信号序列的融合蛋白。
该DNA构建物也含有一段3’端非翻译区。该3’端非翻译区含有多腺苷酸化信号,该信号在植物中发挥作用以引起多聚腺苷酸核苷加入到病毒RNA的3’末端。合适的3’区域的例子是(1)3’端已转录、非翻译区含有土壤杆菌属肿瘤诱导(Ti)质粒多腺苷酸化信号的基因,如胭脂碱合成酶(NOS)基因,以及(2)类似于大豆储存蛋白(7S)基因和RUBP碳酸酵素(E9)小亚基基因的植物基因。4.12用于生产抗虫转基因植物的方法
通过用含有重组的cry*基因的片段转化一种合适的宿主细胞,如植物细胞,所编码的晶体蛋白(也就是,具有抗鞘翅类昆虫的杀虫活性的一种细菌的晶体蛋白或多肽)的表达可以导致抗虫植物的形成。
作为实施例,可以利用一种含有苏云金芽胞杆菌晶体蛋白的编码区的表达载体和一种适当的可选标记来转化胚胎植物细胞(如小麦或谷类细胞)的悬浮物,使用的方法如微粒轰击法(Maddock等,1991;Vasil等,1992),目的是将包裹在微发射粒中的DNA呈递到易感细胞内。转基因植物即从表达杀虫蛋白的已转化的胚胎愈伤组织中再生出来。
转基因植物的形成也可以通过其它细胞转化的方法来完成,这些方法在诸如土壤杆菌介导的DNA转移(Fraley等,1983)的技术中已知。可选择的,将DNA引入植物中可以通过直接将DNA转入花粉中(Zhou等,1983;Hess,1987;Luo等,1988)、通过将DNA注射入一种植物的生殖器官(Pena等,1987)、或者通过直接将DNA注射到来成熟胚胎的细胞中,接着再水合干燥的胚胎(Neuhaus等,1987;Benbrook等,1986)。
从单一的植物原生质体转化物或者从各种已转化的外植体中再生、发育和培养植物在技术上是熟知的(Weissbach和Weissbach,1988)。这种再生和生长的过程代表性地包括的步骤为挑选已转化的细胞、培养这些个体细胞完成贯穿有根幼苗阶段的胚胎发育通常的各阶段。转基因胚胎和种子的再生类似。然后将所得到的转基因有根的幼芽种入一种合适的植物生长培养基中,如土壤。
将外来的、双子叶植物中编码所感兴趣的多肽的基因从叶片外植体中通过土壤杆菌引入到植物中,含有该基因的植物的发育或再生可以通过如所描述的(Horsch等,1985)技术上熟知的方法来完成。在这一过程中,转化体的培养是在一种选择试剂的存在下,在一种诱导植株中的芽再生的培养基中培养,该植株已经通过所描述的方法被转化(Fraley等,1983)。
这一操作代表性地是在2到4个月内即生出芽,然后将这些芽转到一种合适的根诱导的培养基中,该培养基包括一种选择性的试剂和一种抗细菌生长的抗生素。然后将在该选择性试剂的存在下已生根并将形成幼苗的芽移植到土壤或其它培养基中,以允许根的产生。这些操作依赖于所使用的特定植株的不同而不同,这种变化在技术上是熟知的。
优选地,如以前所讨论的,再生的植物是自花授粉以提供纯合的转基因植物。另外,从再生植物中得到的花粉与农业经济上重要的种子生长的植物异种交配,优选的是近交系。相反地,从那些重要株系的植物中得到的花粉被用于对再生植物进行授粉。对于本发明中含有一种理想的多肽的转基因植物,其培养方法是在对本技术熟练的人员所熟知的。
这种植物可以形成生殖细胞及将所转化的性状传给子代。同样地,转基因植物可以以正常方式生长以及与具有相同的转化遗传因子或其它遗传因子的植物异种交配。所得到的杂交个体具有相应的表型。因此本发明中的异种转基因植物含有数目增加的编码区(如一种突变的cry基因),该区域编码感兴趣的突变的Cry多肽。一种优选的转基因植物是一种独立的隔离体,可以将该基因合其活性传递给子代。一种更为优选的转基因植物是该基因的纯合子,在有性繁殖过程中将该基因传递给其所有的子代。
从一种转基因植物中得到的种子可以在田地或温室中生长,所得到的性成熟的转基因植物进行自花授粉,以产生真正繁殖的植物。这些植物的子代变为真正的繁殖株系,通过实施例,估计它们在一定范围的环境条件下的抗鞘翅目昆虫的杀虫能力增强。发明者们预计本发明在商业上感兴趣的转基因植物的发明中将发现特别的用途,包括各种草类、谷类、纤维、块茎、豆类、装饰植物、仙人掌、多汁植物、水果、草莓和蔬菜,以及许多具有坚果和水果的树木和植物。4.13 用于生产重组Cry3*变体的方法
在一个或多个结构域含有取代物的晶体蛋白突变体可以通过许多技术构建。例如,使用Stemmer(1994)所描述的基于PCRTM的技术,很容易蒙混一系列高度相关的基因。可选择地,如果存在合适的限制位点,一种cry基因的突变体可以与第二种cry基因的突变体通过常规的亚克隆方法结合。如果不存在合适的限制位点,可以通过低聚核苷酸定向突变来产生突变体,该突变使用的是许多对于本技术熟练的人员了解的方法。可选择的,可以应用接合重叠*延伸PCRTM(Horton等,1989)来连接一种晶体蛋白不同区域的突变体。在这一过程中,通过PCRTM产生并且在其单一序列内含有不同突变的重叠DNA片段可以被退火并且作为扩增的模板,扩增使用附近的引物,以产生一段杂合的基因序列。最后,cry*突变体可以简单地通过使用一种cry突变体作为低聚核苷酸定向突变的模板来连接,该突变使用了许多如本说明书中所描述的协议。4.14分离同源基因和基因片段
依照本发明的基因和δ-内毒素不仅包括本说明书中所公布的全长序列,而且包括这些序列的片段、或融合蛋白,它们保留了此处特定例证的序列的特征杀虫活性。
对于本技术熟练的人员应该很明显的是杀虫的δ-内毒素可以通过几种方式鉴定和获得。它们的特定基因或片段可以从培养罐中获得,或者合成构建,例如,通过使用一种基因仪器。使用标准的制造点突变的技术可以很容易地构建这些基因的变体。而且,这些基因的片段可以通过使用商业上可提供的核酸外切酶或核酸内切酶,依据常规的程序制得。举例来说,可以利用如Bal31的酶或定向位点诱变从这些基因的末端有条理地切掉核苷。而且,编码活性片段的基因可以通过使用许多种其它的限制酶来获得。可以使用蛋白酶直接获得这些δ-内毒素的活性片段。
使用本说明书中提供的讲授,也可以将等价的δ-内毒素和/或编码这些等价δ-内毒素的基因从杆菌株系和/或DNA文库中分离出来。例如,此处所公布并要求的抗δ-内毒素的抗体可以被用来从蛋白的混合物中鉴定并分离其它δ-内毒素。特定的,所出现的抗体可以是抗δ-内毒素中最恒定和与其它苏云金芽胞杆菌δ-内毒素最不同的那一部分δ-内毒素。然后通过免疫沉淀、酶联免疫吸附测定(ELISA)、或Western印迹,可以将这些抗体用于特定地鉴定具有特征杀虫活性的等价δ-内毒素。
鉴定本发明中的δ-内毒素和基因的的另一种方法是通过使用低聚核苷酸探针。这些探针是含有一种可测标志的核苷序列。如技术上所熟知的,如果探针分子和核苷酸样品通过在两个分子间形成强键而产生杂交,可以合理地假定该探针和样品本质上是等同的。探针的可测标志提供了在已知方式上确定杂交是否发生的方法。这种探针分析提供了鉴定本发明的杀蚁剂δ-内毒素基因的快速方法。
作为依据本发明的探针的核苷片段可以通过使用DNA合成仪,采用常规的程序合成。在使用核苷片段作为探针时,用对本技术熟练的人员已知的任何合适的标志来标记特定的探针,包括放射性的和非放射性的探针。典型的放射性探针包括32P、125I、35S、或其类似物。用放射性同位素标记的探针可以从一段与DNA样品互补的核苷序列中通过常规的切口平移反应来构建,使用了一种DNA酶和DNA聚合酶。然后可将探针和样品在杂交缓冲液中结合,并在适当的温度下保存直到退火发生。此后,在无外来物质的条件下清洗薄膜,留下样品和其接合的探针,其检测和定量代表性地是通过放射自显影术和液体闪烁计数。
非放射性标记包括,例如,配基(如生物素或甲状腺素)、以及酶(如水解酶或过氧化物酶)、或者是各种化学发光素(如荧光素)、或者是类似于荧光素和其衍生物的荧光混合物。为了便于分离,也可以在探针的两端作不同类型的标记,就像,例如,在以上提及的一端使用同位素标记,在另一端用生物素标记。
双螺旋形成和稳定性依赖于杂交物两条链之间的本质互补,而且,如以上所注释的,可以允许一定程度的错配。因此,本发明中的探针包括突变(单个及多个)、删除、插入所描述的序列、以及它们的组合,其中上述突变、插入和删除允许含有所感兴趣的目标多聚核苷酸的稳定杂交物的形成。可以通过目前普通熟练的技工已知的方法,以及通过其他在将来可能会被了解的方法,以在许多方面在一段给定的多聚核苷酸序列上产生突变、插入和删除。
所列出的探针上潜在的变体部分是由于遗传密码的冗余。由于遗传密码的冗余,也就是,不止一种的核苷三联体(密码子)可以用于用作形成蛋白质的大多数氨基酸。因而不同的核苷序列可以编码一种特定的氨基酸。因此,苏云金芽胞杆菌δ-内毒素和多肽的氨基酸序列可以通过等价核苷序列来制备,该序列编码蛋白质或肽相同的氨基酸序列。因此,本发明包括这种等价的核苷序列。并且,反向或互补的序列是本发明的一方面,它们很容易被对本技术熟练的人员所应用。另外,已经显示已鉴定结构和功能的蛋白质可以通过改变氨基酸序列来构建,如果这种变化不改变蛋白质的二级结构(Kaiser和Kezdy,1984)。因此,本发明包括此处所描述的氨基酸序列的变体,它们不改变蛋白质的二级结构,或者如果结构被改变,其生物活性在本质上保持不变。此外,本发明也包括生物体的突变体,它们容宿有本发明中编码一种全部或部分δ-内毒素的基因。这些突变体可以通过对本技术熟练的人员熟知的技术来进行制备。例如,可以利用紫外辐射来制备宿主有机体的突变体。同样地,这些突变体可以包括不产孢子的宿主细胞,该细胞也可以通过技术上熟知的程序来制备。4.15 核糖酶
核糖酶是具酶促活性的RNA分子,它裂解特殊种类的mRNA。在特定的实施例中,发明者们期待挑选和利用可以裂解本发明中的RNA片段的核糖酶,以及在特定的细胞类型或组织中将它们用于降低目标mRNA的活性。
自然产生的核糖酶RNA的六种变体在目前是已知的。在生理条件下,每种均可催化RNA反式磷酸二酯键的水解(以及因此可以裂解其他RNA分子)。通常,核酸酶的作用首先是通过结合目标RNA。这种结合的发生是经过一种核酸酶的目标结合片段,该片段保持接近分子中作为裂解目标RNA的酶片段。因此,核酸酶首先识别,然后通过互补的碱基对与靶RNA结合,一旦结合到正确的位点上即开始作为酶起作用切断靶RNA。在战略上裂解这种靶RNA将会破坏其直接合成编码蛋白质的能力。在核酸酶结合并裂解其目标RNA之后,它即从该RNA上释放下来以寻找另一个目标,它可以重复地结合和裂解新的目标。
由于必然会影响治疗的核糖酶的浓度低于反义低聚核苷酸的浓度,故核糖酶的酶本性在许多技术上都是有利的,如反义技术(其中一种核酸酶分子简单地结合到核酸目标上以阻断其翻译)。这一优点反映在核糖酶的酶作用上。因此,一个单一的核糖酶分子可以裂解目标RNA的许多分子。另外,核糖酶是一种高度特异的抑制剂,其抑制的特异性不仅依赖于碱基对结合目标RNA的机制,而且依赖于目标RNA裂解的机制。靠近裂解位点的单一错配或碱基替换可以彻底消除核糖酶的催化活性。在反义分子中的类似错配不会阻碍其作用(Woolf等,1992)。因此,一种核糖酶作用的特异性大于结合在相同的RNA位点上的翻译低聚核苷酸的作用的特异性。
核酸酶分子可以在一种锤头、发夹、一种肝炎δ病毒、内含子组I或RNA酶P RNA(伴随着一段RNA辅助序列)或链孢菌VS RNA基序中形成。锤头基序的例子如Rossi等(1992)所描述;发夹基序的例子如Hampel等(欧洲专利EP 0360257)、Hampel和Tritz(1989),Hampel等(1990)和Cech等(美国专利5,631,359)所描述;肝炎δ病毒基序的例子如Perrotta和Been(1992)所描述;一种RNA酶P基序的例子如Guerrier-Takada等(1983)所描述;链孢菌VS RNA核糖酶基序如Collins(Saville和Collins,1990;Saville和Collins,1991;Collins和Olive,1993)所描述;一种内含子组I的例子如Cech等(美国专利4,987,071)所描述。在本发明的核酸分子中,所有重要的是它具有特异的底物结合位点,该位点与一个或多个目标基因RNA区域互补,以及它在底物结合位点内部或周围有核苷序列,该序列将RNA的裂解活性传递给该分子。因此核糖酶的构建不需要局限在本说明书中所提及的特定基序中。
本发明提供了产生一族酶裂解试剂的方法,这些试剂对所希望的目标呈现出高度的特异性。核酸酶分子优选的是用来瞄准靶mRNA的一段高度保守的序列区域,以至疾病或状况的特殊治疗可以配备一种或几种核酸酶。这种核酸酶分子可以如要求向外传送到特定的细胞。可选择的,核糖酶可以从被传递到特定细胞的DNA或RNA载体中表达。
小核酸酶基序(如,锤头或发夹结构)可以被用于向外传递。这些分析的简单的结构增加了核酸酶侵mRNA结构中靶区域的能力。可选择的,催化的RNA分子可以在细胞内从真核启动子中表达(如,Scanlon等;1991,Kashani-Sabet等,1992;Dropulic等,1992;Weerasinghe等,1991;Ojwang等,1992;Chen等,1992;Sarver等,1990)。对本技术熟练的人员了解任何核糖酶均可以在真核细胞内从适当的DNA载体中表达。这种核糖酶的活性可以通过借助于另一种核糖酶使其从初级转录中释放下来以达到增强(Draper等,国际专利申请出版No.WO 93/23569,和Sullivan等,国际专利申请出版No.Wo 94/02595,二者的全体均作为参照结合在本说明书中;Ohkawa等,1992;Taira等,1991;Ventura等,1993)。
核糖酶可以直接加入,或者可以与阳离子脂类、脂类复合物结合、包装在脂质体中,或者以其他的方式传递到靶细胞。该RNA或RNA复合物来自体内,或在体内可以局部施用于相关组织,或者在体内通过注射、气溶胶吸入、注入泵或支架,它们结合或不结合在生物高聚物中。
核糖酶可以如Draper等(国际专利申请出版No.WO 93/23569)或者如Sullivan等(国际专利申请出版No.WO 94/02595)所述进行设计,以及如所描述的,合成以在体外和体内进行测试。这种核糖酶也可以被优化以进行传递。当提供了特定的例子时,本技术领域的人员将认识到如果需要可以使用其他物种中等价的目标RNA。
锤头或发夹核糖酶可以通过电脑折叠单独进行分析(Jaeger等,1989),以估定核糖酶的序列是否折叠成正确的二级结构。将在结合臂和催化中心之间具有不利的分子内相互作用的核糖酶排除考虑范围之外。可以选择不同的结合臂的长度以优化活性。通常,每条臂至少5个碱基才能够与目标RNA结合、或者相互作用。
可以设计锤头或发夹基序的核糖酶在mRNA信息的不同位点退火,也可以通过化学方法进行合成。用于合成的方法遵循的是Usman等(1987)和Scaringe等(1990)所描述的常规RNA合成的程序,利用了普通的核苷酸保护和耦合组群,如在5’末端为二甲氧基三苯甲基(dimethoxytrityl),在3’末端为phosphoramidites。平均每步的耦合产量代表性地>98%。发夹核糖酶可以在两步内合成并可以退火重建一种有活性的核糖酶(Chowrira和Burke,1992)。可以对核糖酶进行广泛的修饰以增强其稳定性,其修饰是通过抗核酸酶的组群,例如,2’-氨基、2’-C-烯丙基、2’-氟、2’-o-甲基、2’-H(为了回顾,见Usman和Cedergren,1992)。核糖酶可以通过凝胶电泳采用普通的方法进行纯化,或者通过高压液相层析及在水中重悬。
核糖酶的活性可以通过改变核糖酶结合臂的长度进行优化、或者通过化学*合成经过修饰可以阻止其被血清核糖核酸酶降解的核糖酶(见例如,国际专利申请出版No.WO 92/07065;Perrault等,1990;Pieken等,1991;Usman和Cedergren,1992;国际专利申请出版No.WO 93/15187;国际专利申请出版No.WO 91/03162;欧洲专利申请出版No.92110298.4;美国专利5,334,711;以及国际专利申请出版No.WO 94/13688,它们描述了在酶RNA分子的糖基部分所进行的不同的化学修饰)、增强它们在细胞内功效的修饰、以及除去茎区II的碱基以截短RNA合成的时间及降低化学要求。
Sullivan等(国际专利申请出版No.WO 94/02595)描述了传递酶RNA分子的常规方法。核糖酶可以通过许多对于本技术熟悉的人员所了解的方法施用到细胞中,包括但不局限于,包装在脂质体中、通过离子电渗疗法、或者通过与其它微粒结合,如水凝胶、环糊精、生物可分解的微胶囊和生体附着性小球体。在一些例子中,核糖酶在体外,可以在有或没有上述微粒的情况下直接传递到细胞或阻止中。可选择的,该RNA/微粒复合体可以局部传递,通过直接吸入、通过直接注射、或者通过使用一种导管、注入泵或支架。其他传递的途径包括但不局限于血管内、肌肉内、皮下或结合注射、气溶胶吸如、口服(药片或药丸形式)、局部、组织、眼部、腹膜内和/或膜内传递。关于核糖酶传递和施用更为详细的描述由Sullivan等(国际专利申请出版No.WO 94/02595)和Draper等(国际专利申请出版No.WO 9-3/23569)提供,它们已经作为参照结合在本说明书中。
另一种在细胞内积累高浓度的核糖酶的方法是将编码核糖酶的序列结合到DNA表达载体上。核糖酶序列转录的驱动是从真核RNA聚合酶I(pol I)、RNA聚合酶II(pol II)、或RNA聚合酶III(pol III)的启动子开始。从pol II或pol III启动子开始的转录将在所有细胞中以高水平表达;在一种给定的细胞类型中,一种给定的pol II启动子的水平将依赖于位于附近的基因调控序列(增强子、沉默子等)的本性。也可以使用原核RNA聚合酶启动子,倘若该原核RNA聚合酶是在适当的细胞中表达(Elroy-Stein和Moss,1990;Gao和Huang,1993;Lieber等,1993;Zhou等,1990)。从这些启动子开始表达的核糖酶可以在哺乳动物细胞中起作用(如Kashani-Saber等,1992;Ojwang等,1992;Chen等,1992;Yu等,1993;L’Huillier等,1992;Liszlewicz等,1993)。为了引入到哺乳动物细胞中,可以将这种转录单元结合到许多载体上,包括但不局限于,质粒DNA载体、病毒DNA载体(如腺病毒或腺结合载体)、或病毒RNA载体(如逆转录酶病毒、塞姆利基森林病毒、辛德毕斯病毒载体)。
本发明中的核糖酶可以用作诊断工具,检测细胞株或细胞类型中的遗传漂变和突变。它们也可以用作估定目标RNA分子的水平。核糖酶活性与目标RNA结构之间的紧密关系使得可以在分子的任何区域检测突变,这些突变改变了目标RNA的碱基对和三级结构。通过使用本发明中所描述的多种核糖酶,人们可以绘制核苷的变化,它与在细胞和组织中一样,在体外对于RNA的结构和功能很重要。在特定的细胞或细胞类型中,用核糖酶裂解目标RNA可以被用来阻止基因表达和(本质上)限定特定基因产物的作用。5.0  实施例
以下包括的实施例是用来示范本发明中优选的具体例子。需要本技术的熟练人员理解是,以下实施例中所公布的技术代表了由发明者发现在本发明实践中发挥良好作用的技术,因此可以认为这些技术构成了其实践的优选模式。然而,依据当前所公布的,本技术的熟练人员需要理解在已公布的特定的具体例子中可以产生许多变化,而且没有离开本发明的精神和范围并仍然得到相同或类似的结果。5.1  实施例1-Cry3Bb的三维结构
Cry3Bb的三维结构通过X-射线晶体学确定。Cry3Bb的结晶和X-射线衍射数据的收集是如Cody等(1992)所描述进行的。Cry3Bb的晶体结构使用所收集达到2.4_分辨率的数据,精确到残差R因子为18.0%。该晶体属于C2221空间群,晶胞参数为a=122.44、b=131.81、c=105.37_,不对称单位中含一个分子。Cry3Bb的原子坐标如实施例31所描述并列于第9节。
Cry3Bb的结构类似于Cry3A的结构(Li等,1991)。它包括来自588个残基(64-652位氨基酸)的5825个蛋白质原子,形成三个不连续的结构域(图1)。在Cry3Bb的结构中总共确定出251个水分子(图2)。结构域1(64-294位残基)是由六个螺旋扭转围绕中心螺旋(α5)形成的一个七螺旋束(图5)。形成每个螺旋的氨基酸列于图4。结构域2(295-502位残基)含有三个反平行的β-片层(图5A和图5B)。片层1和2,各由4条β链组成,形成了独特的“Greek key”基序。片层3的外表面由3条β链组成,与结构域1中的螺旋α7相互联系。图6列出了包含结构域2中每条β链的氨基酸。跟在β链1之后的一段小的α螺旋(α8)也包含在结构域2中。结构域3(503-652位残基)含有一个“冻胶辊”状的β-圆柱体,该圆柱体具有一个疏水中心并且几乎与晶格的a轴平行、与c轴垂直(图7A和图7B)。包括结构域3中每条β链的氨基酸列于图8。
在晶体中Cry3Bb的单体沿着平行于a轴的二次轴形成了二聚的四维结构(图9A和图9B)。螺旋α6位于结构域1和其对称相关分子的结构域1和3之间的接触面形成的裂口处。沿着该接触面有许多紧密的氢键相互作用,确保了该二聚体的结构稳定性。5.2  实施例2-Cry3Bb.60的制备
苏云金芽胞杆菌EG7231通过芽孢形成在C2培养基中生长,经氯霉素(Cml)选择。该培养物中的固体物质通过离心和用水洗涤复原。毒素通过从4.0 M NaBr中重结晶进行纯化(Cody等,1992)。将纯化过的Cry3Bb溶于10毫升50mM的KOH/100毫克Cry3Bb,并用100mM的CAPS(pH9.0)缓冲至pH9.0。用胰岛素处理溶解的毒素,质量比为50毫克毒素比1毫克胰岛素。在胰岛素消化的20分钟以后,通过SDS-聚丙酰胺凝胶电泳(SDS-PAGE)见到的优势蛋白为60kDa。没有发现60kDa的毒素进一步被降解。图4显示在SDS-PAGE之后经考马斯-染色的Cry3Bb和Cry3Bb.60。5.3  实施例3-Cry3Bb.60的纯化和序列测定
Cry3Bb.60通过SDS-PAGE进行电泳纯化,并在15V下持续30分钟通过半干*传递以电印迹到Immobilon-P_(微孔过滤器)膜上。然后将薄膜用水冲洗两次并用0.025% R-250,40%的甲醇染色。为了降低背景,将印迹用50%的甲醇再次染色,直到可以看见被染色的蛋白条带。然后将印迹风干,将已染色的Cry3Bb.60条带从薄膜上剪下来。该条带被送至the Tufts University Sequencing Laboratory(Boston,MA)进行N-端序列分析。实验确定的N-末端的氨基酸序列如表7所示,除了从160位氨基酸残基开始的已知的氨基酸序列。
                        表7
Cry3Bb.60 N-末端的氨基酸序列及其与已知的Cry3Bb序列的比较
推断序列 已知序列 残基#
    S     S  160
    K     K  161
    R     R  162
    S     S  163
    Q     Q  164
    D     D  165
    R     R  166
5.4  实施例4-Cry3Bb.60的生物学活性
制备Cry3Bb用于生物鉴定,鉴定是通过将其溶于极微量的50mMKOH、每10ml含100mg毒素,用100mM CAPS(pH9.0)缓冲至pH9.0.如实施例1中所描述的制备Cry3Bb.60。两种制备均在生物鉴定之前、在室温下保持12到16小时。七天之后测种群的死亡率,并对其进行分析以确定每种毒素的死亡百分比。结果用数据表示在表8中。
                    表8
Cry3Bb和Cry3Bb.60抗南部玉米食根虫(Diabioticaundecimpunctata)的生物学活性
  LC50mg/孔   95% C.I.
  Cry3Bb    24.09     15-39
  Cry3Bb.60    6.72     5.25-8.4
5.5  实施例5-通过Cry3Bb和CryB2.60的离子通道形成
在平面脂双层中估定Cry3Bb.60和Cry3Bb形成离子通道的能力。磷脂酰胆碱的双分子层的形成是在0.7毫米孔洞之上的Teflon_支持物上。在Teflon_的分区任一侧放置3.5ml 100mM KOH、10mM CaCl、100mM CAPS(pH9.5)的浸浴溶液。在分区的一侧加入毒素,跨过磷脂酰胆碱双分子层加上60mM的电压。任何通过薄膜的离子渗出均可以被扩大和记录。对由Cry3Bb或Cry3Bb.60产生的电导频率的分析的图解在图5A和图5B中。Cry3Bb.60容易形成离子通道,而Cry3Bb很少形成通道。5.6  实施例6-高分子量低聚物的形成
个别的Cry3Bb或Cry3Bb.60的分子与另一种相似的分子形成一个复合物。Cry3Bb形成低聚物的能力是非显见地可重复性的。在非变性的条件下,不能重复观察到该复合物的形成。Cry3Bb.60与另一种Cry3Bb.60分子形成明显较大量的较高分子量的复合物(>120kDa)。Cry3Bb的低聚物通过考马斯-染色的SDS聚丙烯酰胺凝胶的亮度进行确证。寡聚化作用在SDS-PAGE中可以见到,在上样之前不加热样品以保留一些非变性的毒素。这些数据暗示Cry3Bb。60相对于单独的Cry3Bb,更容易形成较有序的复合物。寡聚化作用也可以通过研究由这些分子产生的电导以及依赖于时间的电导的增加来观察到。这种在电导上的变化可以归因于毒素的寡聚化作用。5.7  实施例7一设计方法1:蛋白酶敏感位点的鉴定和变更以及蛋白水解步骤
在文献中已经有报道用胰岛素(一种在可利用的赖氨酸和精氨酸残基的羧基端裂解蛋白质的酶)处理Cry3A毒素蛋白,从67kDa的天然蛋白中获得稳定的55kDa的裂解产物(Carroll等1989)。该55kDa产物的N-末端序列分析显示裂解发生在氨基酸残基R158。据发现,该截短了的Cry3A蛋白保留了与天然蛋白相同水平的杀虫活性。Cry3Bb毒素蛋白也可以用胰岛素处理。消化之后,蛋白大小从68kDa(天然Cry3Bb毒素的分子量)降至60kDa。没有发现进一步的消化。N-末端序列分析解释胰岛素对截短了的毒素(Cry3Bb.60)的裂解位点为Cry3Bb中1α3,4上的氨基酸R159。出乎意料的是,发现截短了的Cry3Bb毒素的生物活性有所增加。
使用该方法,即用蛋白酶消化一种苏云金芽胞杆菌毒素蛋白,在Cry3Bb上鉴定了一个蛋白水解的敏感位点,以及鉴定了该蛋白(Cry3Bb.60)的一种更有活性的形式。通过引入一个附加的蛋白水解的识别位点来对该蛋白水解敏感的位点进行修饰,结果也导致一种生物学上更有活性的蛋白质的分离。也有可能去掉其他的蛋白水解敏感位点可以提高活性。蛋白水解的敏感区域一旦被确定,则可以被修饰或用于产生生物学上更有活性的毒素。5.7.1 Cry3Bb.60
用胰岛素处理增溶的Cry3Bb毒素蛋白,结果导致分离出一种分子量为60kDa(Cry3Bb.60)的稳定的、截短了的Cry3Bb毒素蛋白。Cry3Bb.60的N-末端序列分析显示胰岛素敏感位点为天然毒素的1α3,4上的R159。胰岛素消化导致了螺旋1-3从天然Cry3Bb上除去,而且约为四倍地增加了毒素抗SCRW幼虫的活性。
Cry3Bb.60是一种独特的毒素,其杀虫作用强于亲代Cry3Bb。杀虫活性的提高是判别它为一种新的毒素的唯一参数。除了其大小的减少,Cry3Bb.60也是一种更可溶的蛋白。Cry3Bb在pH6.5时从溶液中沉淀出来,而Cry3Bb.60从pH4.5到pH12都保持在溶液中。并且Cry3Bb.60形成的离子通道比Cry3Bb具有更高的频率。
Cry3Bb.60的产生是通过蛋白水解除去前159位氨基酸残基,或者是通过在体内产生这种毒素,通过细菌或植物表达Cry3Bb.60的基因,简而言之,不含有前483位核苷的Cry3Bb基因。
总之,Cry3Bb.60在几个重要的方面与Cry3Bb不同:杀虫活性增强;可溶范围增大;形成通道的能力增强;以及大小降低。5.7.2 EG11221
在Cry3Bb的胰岛素敏感1α3,4区域上的半随机诱变导致Cry3Bb.11221的分离,Cry3Bb.11221为一种设计的Cry3Bb蛋白,它于野生型相比,表现出提高超过六倍的抗SCRW幼虫的活性。Cry3Bb.11221在1α3,4区域存在4个氨基酸的变化。其中一种变化,L158R,在邻近R159(用于产生Cry3Bb.60(实施例4.1.1)的蛋白水解敏感位点)引入了一个另外的胰岛素位点。Cry3Bb.11221由苏云金芽胞杆菌作为一种全长的毒素蛋白产生,但推测其被昆虫内脏的蛋白酶消化为与Cry3Bb.60相同的大小(见由Carroll等产生的Cry3A,1989)。附加的蛋白酶识别位点可以使1α3,4区域对消化更为敏感,因此活性提高。5.8  实施例--设计方法2:结合水的确定和操作
水分子与蛋白质结合的途径有几种,包括容易被除去的表面水和更难提取出来的结合水(Dunitz,1994;Zhang和Matthews,1994)。结合水的功能已经成为重要学术推断的主题,但是精确的功能很少有实验确证。一些最引起关注的结合或结构水是从蛋白质本身内部参与蛋白结构的水。
某一位点被一个水分子占据,可以预示蛋白质内部的一个稳定的穴或者是由水介导的盐桥和氢结合水产生的折叠松弛。它可以降低氨基酸之间的结合程度,可能使该区域更具柔性。围绕相同位点的一种不同氨基酸序列可以导致较好的折叠、围绕极面或带电氨基酸的穴的瓦解。这可以导致柔性的提高。因此,一种蛋白某一区域的水合程度可以决定该区域的柔性或流动性,对水合的操作可以改变柔性。提高暴露于水中的区域的水合作用的方法包括沿着其表面增加疏水残基的数目。文献中指出暴露的疏水残基相对于亲水残基需要明显较多的水(CRC Handbook of Chemistry and Physics,CRC Press,Inc.)。然而没有指出通过这样做,可以达到提高蛋白质的生物学活性。
结构水以前在苏云金芽胞杆菌δ-内毒素(包括Cry3Bb)中没有被鉴定。此外,没有报道这种结构水在δ-内毒素或细菌毒素中的功能。在对Cry3Bb的分析中,据观察收集到的水分子位于1α3,4(一种由本发明者定义在提高生物活性中很重要的位点)周围。环α3,4区域是暴露的表面,它限定了蛋白质内的一个枢纽,容许结构域1上前三个螺旋的去除或运动。在该区域周围发现的水合作用可以将柔性和流动性传给该环。对1α3,4上结构水的观察提供了进一步结构分析的分析工具。如果这一重要的位点被水包围,则其它重要的位点也会完全或部分被水包围。借此观察结果,则可以鉴定围绕螺旋5和6的结构水。这些结构水形成了一个穿过蛋白质的圆柱,有效地将螺旋5和6从分子的其它部分分隔开来。Cry3A和Cry3Bb的结构暗示螺旋5和6是紧密关联的,通过范德华力的相互作用连接在一起。单独的,来自Cry3A的螺旋5,虽然不足以具有生物活性,但它已经被证实在人造的薄膜上具有形成离子通道的能力(Gazit和Shai,1993)。由螺旋5形成的离子通道小于全长毒素离子通道10倍,暗示着实际大小的离子通道需要明显较大的毒素结构。在Cry3Bb中,作为α螺旋(结构域1)簇的一部分的螺旋5已经被发现可形成离子通道(Von Tersch等,1994)。由本发明者们进行的未发表的实验观察证实螺旋6也穿过了该生物膜。因此,螺旋5和6是推断中的对毒性必须的通道形成螺旋。
围绕这些螺旋的水合作用可以预示该区域的柔性对于毒性的必需的。因此,可以想象如果有可能提高围绕螺旋5和6的水合作用,则可以产生较好的毒素蛋白。然而,必须注意的是,要避免在螺旋5-6和蛋白的任何其它部分之间产生连续的疏水表面,它可以,通过疏水相互作用,限制可变螺旋的运动。螺旋5和6的流动性可能也依赖于依附于它们的环的柔性,以及Cry3Bb分子的其它区域,尤其在结构域1,其可能经历结构上的变化以允许两个螺旋插入到膜上。改变该蛋白中这些区域的水合作用也可以影响它的生物活性。5.8.1 Cry3Bb.11032
结合水残基的集中显示出1α3,4区域的相对柔性。该环柔性的提高可以通过提高该区域的水合作用,水合作用的提高是通过替换相关疏水残基为暴露的亲水残基。一种经改良设计、具有这种类型替换的蛋白质的例子是Cry3Bb.11032。Cry3Bb.11032具有氨基酸改变D165G;甘氨酸比天冬氨酸更具疏水性(Kyte和Doolittle疏水得分为-0.4比天冬氨酸-3.5)。Cry3Bb.11032的活性大约成倍地高于野生型Cry3Bb。5.8.2 Cry3Bb.11051
为了提高Cry3Bb中1α4,5的水合作用,将甘氨酸替换暴露于表面的残基K189。甘氨酸比赖氨酸的疏水性更强性(Kyte和Doolittle疏水得分为-0.4比天冬氨酸-3.9),可以导致结合水的增加。结合水的增加可以将更高的柔性传给在通道形成螺旋(α5)之前的环区域。经设计具有K189G变化的Cry3Bb蛋白,Cry3Bb.11051,相对于野生型Cry3Bb表现出活性增加三倍。5.8.3变更为Lα7,β1(Cry3Bb.11241以及11242)
在暴露于表面的连接α螺旋7和β-链1的环(1α7,β1)上进行氨基酸改变,结果导致鉴定出2种被改变的、生物活性提高的Cry3Bb蛋白质,Cry3Bb.11241和Cry3Bb.11242。对这两种蛋白质中超过20个的氨基酸序列281-300(包含1α7,β1区域)进行水性索引的分析,显示在这些蛋白质中的氨基酸替换使1α7,β1区域更具疏水性。对每种蛋白的水性值(GRAVY)的总平均的确定是通过使用PC\GENE_(intelligenetics,Inc.,Mountain View,CA,版本6.85)序列分析计算机程序、SOAP、和一段7个氨基酸的间隔。SOAP程序是基于Kyte和Doolittle(1982)的方法。对每种蛋白1α7,β1区域疏水性的提高可以提高环的水合作用以及,因此,柔性。被改变的蛋白质、它们各自的氨基酸变化、相对于野生型生物活性倍数的增加、以及GRAVY值均列于表9。
表9 Cry3Bb以及两个设计的SCRW生物学活性提高的Cry3Bb蛋白中Lα7,β1区域的水性值
Cry3Bb*蛋白 氨基酸变化 相对野生型生物活性的倍数增加 GRAVY(氨基酸281-300)
野生型 - - 4.50
 Cry3Bb.11241 Y287F,D288N,R290L 2.6x 10.70
 Cry3Bb.11242 R290V 2.5x 8.85
5.8.4  变更为Lβ1,α8(Cry3Bb.11228、Cry3Bb.11229、Cry3Bb.11230,Cry3Bb.11233、Cry3Bb.11236、Cry3Bb.11237、Cry3Bb.11238以及Cry3Bb.11239)
暴露于表面、在β-链1和α-链8之间的环(1β1,α8)定义为Cry3Bb中结构域1和2之间的分界。在该区域引入半随机的氨基酸变化,结果导致确定出几种生物活性提高的被改变的Cry3Bb蛋白。对在这些改变的蛋白内发现的氨基酸替换的水性索引分析显示,这些变化使暴露的区域更具疏水性,其可导致水合作用和柔性的增加。表10列出了被改变的蛋白质,它们各自的氨基酸改变和相对域野生型Cry3Bb的倍数增加,以及使用PC\GENE_(intelligenetics,Inc.,Mountain View,CA,版本6.85)序列分析计算机程序、SOAP、超过20个氨基酸的序列305-324(包括1β1,α8)确定的水性值的总平均(GRAVY),使用了一段7个氨基酸的间隔。
表10  Cry3Bb和八个设计的SCRW生物学活性提高的Cry3Bb*蛋白Lβ,α8区域的水性值Cry3Bb*蛋白        氨基酸变化       相对野生型生物活       GRAVY
                                  性的倍数增加        (氨基酸
                                                     305-324)野生型             -                    -                0.85Cry3Bb.11228       S311L,N313T,      4.1x              4.35
               E317KCry3Bb.11229       S311T,E317K,      2.5x              2.60
               Y318CCry3Bb.11230       S311A,L312V,      4.7x              3.65
               Q316WCry3Bb.11233       S311A,Q316D        2.2x              2.15Cry3Bb.11236       S3111               3.1x              3.50Cry3Bb.11237       S3111,N313H        5.4x              3.65Cry3Bb.11238       N313V,T314N,      2.6x              9.85
               Q316M,E317VCry3Bb.11239       N313R,L315P,      2.8x              3.95
               Q316L,E317A5.8.5 Cry3Bb.11227、Cry3Bb.11241以及Cry3Bb.11242
位于Cry3Bb螺旋6的氨基酸Q238,已经被确定为是一个通过其大尺寸和与R290的氢键连接来阻断螺旋6和螺旋4之间表面完全的水合作用的残基。用另一种氨基酸替换R290(该氨基酸不形成氢键或其所具有侧链不能横越与Q238形成氢键的物理距离)可以导致Q238周围水合作用。Q238,不能与R290形成氢键,才可结合水。这可以增加通道形成区域的柔性。设计的蛋白质Cry3Bb.11227(R290N)、Cry3Bb.11241(R290L)和Cry3Bb.11242.(R290V)相对于野生型,抗SCRW幼虫的活性分别提高约2倍、2.6倍和2.5倍。5.9  实施例9-设计方法3:流动性区域周围的氢键的操作
某一蛋白质具有活性可能需要其区域的流动性。α5,6区域(Cry3Bb的推定通道形成区域)流动性的增加可以通过减少氢键的数目,包括盐桥(带有相反电荷的氨基酸侧链之间的氢键)、螺旋5-6和分子或二聚物结构中的任何其它部分之间。这些氢键可以阻碍这两个螺旋的运动。减少氢键和盐桥的数目可以提高生物活性。为了避免在螺旋5-6和二聚物的任何其它部分之间产生连续的疏水表面,必须用疏水残基取代氢键结合的氨基酸。5.9.1 Cry3Bb.11222和Cry3Bb.11223
Tyr230位于螺旋6并且在Cry3Bb的四元二聚结构中,该氨基酸与来自邻近分子的Tyr230并列。正是由于这个氨基酸,在两个单体中的两个螺旋6之间形成了三个氢键。为了提高螺旋5-6(理论上可以插入膜内形成离子通道的螺旋)的柔性,通过改变该氨基酸以去掉横跨二聚体的氢键,观察到生物活性有相应的增加。设计的Cry3Bb蛋白,Cry3Bb.11222和Cry3Bb.EG11223相对于野生型,其SCRW活性的增加分别为4倍和2.8倍。5.9.2 Cry3Bb.11051
设计的Cry3Bb蛋白Cry3Bb.11051在结构域1的1α4,5上有氨基酸变化K189G。在野生型的Cry3Bb结构中,K189暴露的侧链与E123(位于1α2b,3中)的暴露的侧链的改变很靠近,足以形成氢键。用甘氨酸替换K189,如同在Cry3A的该位点所发现的,排除了在该位点形成氢键的可能性,形成了一种生物活性高于野生型Cry3Bb三倍的细胞。5.9.3 Cry3Bb.11227、Cry3Bb.11241、以及Cry3Bb.11242
位于Cry3Bb的螺旋6中的氨基酸238,已经被鉴定为是一种通过其大尺寸和与R239的氢键连接,从而阻断螺旋6和螺旋4之间空间的完全水合的残基。用另一种氨基酸替换R290(该氨基酸不形成氢键或其所具有侧链不能横越与Q238形成氢键的物理距离)可以增加通道形成区域的柔性。设计的蛋白质Cry3Bb.11227(R290N)、Cry3Bb.11241(R290L)和Cry3Bb.11242.(R290V)相对于野生型,抗SCRW幼虫的活性分别提高约2倍、2.6倍和2.5倍。5.10  实施例10-设计方法4:螺旋周围的环的分析及其设计
某一蛋白质的环区可能涉及该蛋白的许多功能,包括但不局限于,通道形成、四级结构的形成和维持、以及受体结合。Cry3Bb是一种通道形成蛋白。δ-内毒素的离子通道形成螺旋进入双分子层的有效性依赖于没有阻碍该过程的力。可能限制该过程的其中一种力是围绕关键螺旋的环区中氨基酸侧链的空间阻碍。文献中指出在至少一种另外的细菌毒素中,不是一种苏云金芽胞杆菌毒素,毒素分子打开,或者用科学术语来说,失去四级结构以暴露出膜活跃的区域(Cramer等,1990)。该文献没有讲述如何提高这一事件的可能性,而且不知道苏云金芽胞杆菌毒素是否利用相同的过程插入膜内。通过降低侧链大小或改变其取向从而使相应的生物活性增加,以降低氨基酸侧链在这些关键区域的空间阻碍是本发明的步骤。5.10.1  在螺旋3和4之间的环的分析(Cry3Bb.11032)
本发明者们已经发现结构域1的前三个螺旋可以通过蛋白水解消化螺旋α3和α4之间的环,从该毒素的剩余部分被切除(Cry3Bb.60)。最初尝试截短Cry3Bb基因以产生这种截短的、但更有活性的Cry3Bb分子,结果失败。由于未知的原因,苏云金芽胞杆菌未能合成这种60kDa的分子。后来被解释为可能是结构域1的前三个螺旋不是必须被蛋白水解除掉,或者相当的,该蛋白不是必须以这种截短了的形式合成来运用Cry3Bb.60设计。据观察,蛋白Cry3A在1α3,4附近有一个小氨基酸,它可能传递较高的柔性给环区,从而允许结构域1的前三个螺旋让开,暴露出膜活性区域。通过设计一种在该环附近有一个甘氨酸残基的Cry3Bb分子,有可能减少该环中残基的空间阻碍。重新设计的蛋白,Cry3Bb.11032,具有氨基酸变化D165G,它用最小的氨基酸,甘氨酸(平均质量57.05)取代较大的天冬氨酸残基(平均质量115.09)。Cry3Bb.11032的活性大约高于野生型蛋白的三倍。以这种方式,合理地重新设计螺旋α3和α4之间的环,在生物活性上有相应的提高。5.10.2  Cry3Bb.11051
在Cry3Bb中连接螺旋α4和α5的环区必须具有柔性,这样通道形成螺旋α5-α6才可以插入膜内。注意的是Cry3A在该环的中间具有一个甘氨酸残基,它可以传递更高的柔性。在Cry3Bb中制造相应的变化K189G,结果得到的设计蛋白,Cry3Bb.11051,与野生型Cry3Bb相比,其抗SCRW幼虫的活性提高三倍。5.10.3  β-链1和螺旋8之间的环的分析(Cry3Bb.11228、Cry3Bb.11229、Cry3Bb.11230、Cry3Bb.11232、Cry3Bb.11233、Cry3Bb.11236、Cry3Bb.11237、Cry3Bb.11238、以及Cry3Bb.11239)
位于结构域2中β链1和结构域2中α螺旋8之间的环区与结构域1中α螺旋6和7之间的环十分靠近。在1β1,α8氨基酸侧链显示出似乎它们会在空间上阻碍1α6,7的运动。由于为使通道形成螺旋α5-α6插入到膜内,1α6,7必须是柔性的,据认为,重新操作该环可以改变侧链的定位,结果引起较小的空间阻碍。已经完成创造了生物活性高于野生型变化从2.2到5.4倍的蛋白。这些设计的毒素蛋白和它们的氨基酸变化作为Cry3Bb.11228、Cry3Bb.11229、Cry3Bb.11230、Cry3Bb.11232、Cry3Bb.11233、Cry3Bb-11236、Cry3Bb.11237、Cry3Bb.11238、和Cry3Bb.11239列于表2。5.10.4  螺旋7和β链1之间的环的分析(Cry3Bb.11227,Cry3Bb.11234,Cry3Bb.11241,Cry3Bb.11242,以及Cry3Bb.11036)
如果Cry3Bb类似于一种为发挥毒性必须打开以暴露出膜活性区域的细菌毒素,有可能除了通道形成螺旋之外还必须改变其它螺旋的位置。据推论,如果螺旋α5-α6插入膜内,则螺旋α7可能必须也改变位置。如实施例4.4.3中所示的,螺旋α6和α7之间柔性的提高可以提高活性,在螺旋α7之后的环,1α7,β1较高的柔性也可以提高生物活性。改变Cry3Bb的1α7,β1区导致了几种活性提高的蛋白的分离,它们高于野生型变化从1.9到4.3倍。这些设计的蛋白作为Cry3Bb.11227、Cry3Bb.11234、Cry3Bb.11241、Cry3Bb.11242、和Cry3Bb.11036列于表7。5.11  实施例11--设计方法5:β链和β片层周围的环的设计
某一蛋白质结构的环区可能涉及该蛋白的许多功能,包括但不局限于,通道形成、四级结构的形成和维持、以及受体结合。某一结合表面常常是由许多环限定的,如同免疫球蛋白G(IgG)的例子(为回顾,见Branden和Tooze,1991)。然而,仅仅通过看在讨论中的蛋白的结构,在这一点上不能确定的是什么环对受体的相互作用是重要的。由于没有确定一种Cry3Bb的受体,甚至没有可能将Cry3Bb与其它具有相同受体的蛋白质进行比较以确定结构上的相似性。为了确定促成受体相互作用的Cry3Bb环,在暴露于表面的环上进行随机突变。
当每个环均被改变时,检测和比较所得到的蛋白的所以生物活性的轮廓。环,尤其是在结构域2(其显示出对通道活性不必要)中的,归为两类:(1)可以被改变、没有引起所得到的蛋白生物活性水平大变化的环以及(2)在其上的改变引起所得到的蛋白生物活性完全丢失的环。使用这种设计方法,有可能鉴定出几种对于活性重要的环。5.11.1  环β2,3的分析
在β链2和3之间的环区上的半随机突变导致产生结构上稳定的毒素蛋白,其抗SCRW幼虫的活性明显降低。该1β2,3区域对氨基酸变化高度敏感,暗示着特定的氨基酸或氨基酸序列对于毒素蛋白的活性是必需的。因此,可以想象在1β2,3区域特定的变化将降低结合以及,因此降低重新设计的毒素蛋白的活性。5.11.2  环β6,7的分析
在β链6和7之间的环区上引入半随机突变导致产生SCRW生物活性完全丧失的结构上稳定的蛋白。该1β6,7区域对氨基酸变化高度敏感,暗示着特定的氨基酸或氨基酸序列对于毒素蛋白的活性是必需的。因此,可以想象在1β6,7区域特定的变化将降低结合以及,因此降低重新设计的毒素蛋白的活性。5.11.3  环β10,11的分析
对β链10和11之间的环区的随机突变导致产生的蛋白SCRW生物活性完全丧失。环β10,11与环β2,3及β6,7在结构上靠近并相互作用。对1β10,11区中特定残基的改变也导致与昆虫膜的相互作用增加,毒素蛋白的生物活性提高。5.11.4 Cry3Bb.11095
环β2,3、β6,7和β10,11已经被确定为对Cry3Bb的生物活性很重要。这三个环是暴露于表面并且在结构上靠在一起。野生型结构中的氨基酸Q348,位于β-链2上并恰好在1β2,3之前,不形成任何分子内的相互联系。然而,用精氨酸取代Q348(Q348R)导致在R348和R487及R488的主链羰基之间形成两个新的氢键,二者均位于1β10,11上。新的氢键可以稳定由三个环形成的结构。设计的带有这一变化的蛋白质,Cry3Bb.11095,比野生型Cry3Bb活跃4.6倍。5.12  实施例12-设计方法6:复合静电表面的鉴定和重新设计
蛋白之间的相互作用包括疏水作用(如范德华力)、亲水相互作用(包括在氨基酸侧链的相反电荷之间的作用(盐桥))、以及氢键。关于δ-内毒素和受体的相互作用知之甚少。目前,没有文献报道鉴定苏云金芽胞杆菌毒素和受体之间主要相互作用的类型。
然而,在实验上,提高苏云金芽胞杆菌毒素-受体相互作用的强度是重要的,而在提高它的过程中不能够精确地确定化学相互作用。为了达到这一点,通过解决分子周围的Poisson-Boltzman分布来限定Cry3Bb的静电表面。一旦该电限制的表面被解决,就可以预见到最大差异的区域。据推论,这些静电相反的区域将有最大的可能性参与苏云金芽胞杆菌毒素蛋白和其受体之间特定的相互作用,而不是更普遍和非特异性的相互作用。因此,选择这些区域进行重新设计,继续提高区域的静电差异。另外,检查毒素中推定的通道形成区域周围的静电相互作用创造了重新设计的见解。这包括在另外带有负电荷的通道内鉴定带有正电荷的残基(见实施例4.6.1)。5.12.1 R290(Cry3Bb.11227、Cry3Bb.11241、以及Cry3Bb.11242)
检查沿着结构域1轴的Cry3Bb二聚物接触面,暗示在单体之间可能形成了阳离子的小孔或通道。对该轴的静电检查为这一意见增添了附加的可信性。事实上,假设的通道主要是带负电荷的,这是一项与关于阳离子选择的、δ-内毒素通道的生物物理分析一致的观测。如果某一阳离子通道是沿着二聚物的轴形成的,在该阳离子可以相对容易地在单体之间运动,只有一个明显的障碍。一个带正电的精氨酸残基(R290)位于另一个带负电的通道内。该残基可以阻碍阳离子通过该通道的运动。基于这一分析,将R290变换为不带电荷的残基。重新设计的蛋白Cry3Bb.11227(R290N)、Cry3Bb.11241(R290L)和Cry3Bb.11242(R290V)的生物活性分别提高大约2倍、2.6倍和2.5倍。5.12.2 Cry3Bb.60
对于增溶的Cry3Bb的胰岛素消化产生了一种稳定的、截短了的蛋白,其分子量为60 kDa(Cry3Bb.60)。胰岛素消化发生在残基R159的羧基端,有效地将螺旋1至3从天然Cry3Bb结构中去除。前3个螺旋的切除暴露出与在天然结构中发现的不同的静电表面。这一新的表面具有疏水、极性和带电特征的组合,这些特征在膜内相互作用中可能扮演重要角色。Cry3Bb.60的生物活性高于野生型Cry3Bb 3.6倍。5.13  实施例13:设计方法7:金属结合位点的鉴定和去除
文献中指出苏云金芽胞杆菌毒素在体外的行为可以通过从实验系统中螯合二价阳离子来达到增强(Crawford和Harvey 1988)。然而,不知道的是这些二价阳离子是如何阻碍体外活性的。Crawford和Harvey(1988)证实在EDTA(一种二价离子的螯合剂)的存在下,相对于没有该试剂的情况下,穿过中肠的短路电流更严重地被苏云金芽胞杆菌阻断,因此暗示着在苏云金芽胞杆菌的作用模式中,这一步可以通过去除二价离子而成为可能。使用黑色油脂膜进行类似观察,测定在EDTA存在以螯合二价离子的情况下,由δ-内毒素产生的电流的增加。对于这些观察结果至少有三种可能的解释。第一种解释可以是二价离子太大,以至无法穿过更适于单价离子的离子通道,因此阻塞了该通道。第二种,二价离子可能十分普遍地覆盖在蛋白质上,因此阻碍了毒素膜相互作用所需要的电荷相互作用,以及限制了离子通道的活性。第三种可能性是在蛋白中存在一种特殊的金属结合位点以及,当该位点被二价离子占据时,离子通道的性能即受到损害。虽然文献无法区分一种可能性高于另一种的评估,但第三种可能性引起对Cry3Bb结构进行分析以寻找一个特定的金属结合位点,该位点可能会改变某一毒素可以形成一个离子通道的可能性。5.13.1 H231(Cry3Bb.11222、Cry3Bb.11224、Cry3Bb.11225、以及Cry3Bb.11226)
在Cry3Bb二聚体中,一个推定的金属结合位点是由各单体上的H231残基形成的。H231残基位于螺旋α6中,它们彼此邻近而且靠近二聚体的对称轴。通过用其它氨基酸替代组氨酸来去掉该位点,这可以通过EDTA-依赖的离子通道活性的缺乏来进行评估。设计的毒素蛋白Cry3Bb.11222、Cry3Bb.11224、Cry3Bb.11225和Cry3Bb.11226的生物活性相对于野生型,分别提高4、5、3.6和3倍。它们各自的氨基酸变化列于表2。5.14  实施例14-设计方法8:四级结构的变更
Cry3Bb与一种相关的蛋白Cry3A类似,能以二聚体的形式存在与溶液中(Walters等,1992)。然而,二聚体对于生物活性的重要性尚不知晓,原因是没有认真地评估以单体或高度有序结构的形式存在的毒素。据猜测是特定的氨基酸残基促成四级结构的形成和稳定性。一旦鉴定出该起作用的残基,则可进行改变以减小或加大该残基的影响,从而影响单体之间的相互作用。通道活性是估定Cry3Bb及其衍生物的四级结构的一条有用的途径,但决不是唯一的途径。已经观察到Cry3Bb在膜内形成闸门控制的电导,其随时间而增大,最终导致在膜上形成大的孔径(野生型Cry3Bb的通道活性的描述在12.1节中)。也观察到Cry3A形成比Cry3Bb更稳定的二聚体,以及更快地相应形成更高水平的电导(图10)。该发现引导本发明者们设想寡聚化和离子通道的形成(电导大小和通道形成的速度)是相关的。基于这一发现,将Cry3Bb重新设计以形成速度更快的更大、更稳定的低聚物。在这一分析中设想离子通道形成和增长的速度反映了该过程。也有可能四级结构的改变不独自影响通道活性或完全不影响。改变四级结构也可能影响受体相互作用、在昆虫内脏环境中的蛋白加工、以及生物活性的其它未知方面。5.14.1 Cry3Bb.11048
对Cry3A和Cry3Bb比较性的结构分析导致鉴定出两种毒素之间在离子通道形成结构域的结构上的不同点;特定地,在Cry3Bb上的螺旋2a和螺旋2b之间插入一个氨基酸。去掉在Cry3B2,A104上附加的该氨基酸以及Cry3A中的D103E替换点,导致通道闸门的丧失和对称孔径的形成。一旦这些孔径形成,它们将保持开放和允许一个稳定的电导,变化为25-130pS。该设计的蛋白,Cry3Bb.11048,抗SCRW幼虫的活性高于野生型Cry3Bb 4.3倍。5.14.2 Cry3Bb.60的寡聚化作用
单独的Cry3Bb或Cry3Bb.60分子可以形成彼此类似的复合物。Cry3Bb的寡聚化作用是由SDS-PAGE证实的,其中上胶之前样品在样品缓冲液中不被加热。没有热处理允许了一些非变性的毒素的维持。在考马斯染色之后,通过出现一条分子量为单体的两倍的条带可以看到寡聚化作用。较高分子量条带的亮度反映了寡聚化作用的程度。Cry3Bb形成低聚物的能力不是明显可再生的。该复合物可能重复观察到它的形成。然而,Cry3Bb.60形成明显较大量的较高分子量的复合物(120kDa)。这些数据暗示Cry3Bb.60比单独的Cry3Bb更容易形成高度有序的复合物。Cry3Bb.60也形成比野生型Cry3Bb具有更高频率的离子通道(见5.12.9节)。5.14.3 Cry3Bb.11035
在Cry3Bb上制造变化以反映Cry3A在1α3,4和螺旋4的起始部分的氨基酸序列。这些变化形成了设计蛋白Cry3Bb.11035,它与野生型Cry3Bb不同,形成具有高电导的自发通道。Cry3Bb.11035的抗SCRW幼虫的活性也大约高于野生型Cry3Bb三倍。Cry3Bb.11035及其氨基酸变化列于表10。5.14.4 Cry3Bb.11032
改变Cry3Bb.11032在螺旋α4中165位上的残基,如Cry3A中所见的,将天冬酰胺变为甘氨酸。Cry3Bb.11032的活性高于野生型Cry3Bb三倍。Cry3Bb.11032的通道活性十分类似于Cry3Bb,除了当将该设计蛋白人为地组合到膜内时。观察到与野生型Cry3Bb相比,初始的通道电导有16倍的增加(见5.12.2节)。猜想这种初始电导的增加是由于增强了的四级结构、稳定或较有序的结构。5.14.5 EG11224
在野生型Cry3Bb二聚物结构中,位于结构域1中231位上的组氨酸与D288(结构域1)、Y230(结构域1)产生氢键联系,以及,通过一个水分子网络,也与D610(结构域3)、所有相对的单体产生联系。D610和K235(结构域1)也产生联系。用精氨酸取代组氨酸,H231R,在一个方向上导致与邻近单体上的D610形成一个盐桥。在第二个方向上,如同在野生型结构中所出现的,与邻近单体上的D288保持联系。在任一方向上,R231不与相对单体上的Y230形成氢键,但的确与K235产生联系,K235保持其与K610的联系(V.Cody,研究交流researchcommunication)。移动的氢键改变了四级结构内蛋白的不同结构域之间的相互作用。大体上,在邻近单体的结构域1之间存在的氢键较少,在结构域1和3之间已经形成了一个更强的键。发现通道活性已经被改变。Cry3 Bb.11224类似于Cry3 Bb产生小的、快速闸门控制的通道。然而,与野生型Cry3 Bb不同,Cry3 Bb.11224不表现出β-巯基乙醇依赖的活性。用精氨酸取代H231导致一种设计Cry3 Bb蛋白Cry3 Bb.11224的产生,其生物活性提高5倍。5.14.6 Cry3Bb.11226
如4.8.5节所讨论的,Cry3Bb.11226类似于Cry3Bb.11224,在231位的组氨酸被取代。氨基酸的变化,H231T,导致在野生型Cry3Bb中所见到的β-巯基乙醇依赖的活性的丢失(见5.12.1节)。H231(一个推定的金属结合位点)的取代改变了四级结构中区域之间的相互作用,导致产生不同类型的通道活性。Cry3Bb.11226的活性高于Cry3Bb三倍。5.14.7  Cry3Bb.11221
Cry3Bb.11221已经在Cry3Bb的1α3,4区进行重新设计。由Cry3Bb.1122形成的通道比由野生型Cry3Bb形成的电导更好地解决(见5.12.6节)。Cry3Bb.1122的生物活性比野生型Cry3Bb高出6.4倍。Cry3Bb.1122中发现的氨基酸变化列于表2。5.14.8  Cry3Bb.11242
设计的蛋白,Cry3Bb.11242,带有变化R290V,迅速地形成小电导,它在约3分钟内迅速及稳定地增长位大的电导(见5.12.7节)。这与野生型Cry3Bb通道是相反的,它需要30-45分钟出现,在数小时内缓慢增长成大的电导。Cry3Bb.11242与野生型Cry3Bb相比,其生物活性也增加2.5倍。5.14.9  Cry3Bb.11230
Cry3Bb.11130,与野生型Cry3Bb不同,形成长期处于开启状态的形成良好的通道。这些通道达到最高为3000pS的电导,但不随时间继续增大。Cry3Bb.11230已经在Cry3Bb的1β1,α8区域进行了重新设计,表现出与野生型Cry3Bb相比,抗SCRW幼虫的活性几乎提高5倍(表9)和抗WCRW(表10)幼虫提高5.4倍。在Cry3Bb.11230中发现的氨基酸变化列于表2。5.15  实施例15-设计方法9:结构残基的设计
某一蛋白特定三维结构是通过被埋藏或被从蛋白的表面移开的氨基酸固定就位的。这些结构的决定物可以通过检验促成表面结构定位的力来进行鉴定。然后可以增强这些结构残基的影响以限制分子移动,或者降低其影响以增强分子柔性。5.15.1  Cry3Bb.11095
环β2,3、β6,7和β10,11位于Cry3Bb的结构域2上,已经被鉴定为对生物活性是重要的。这三个环是暴露于表面并且在结构上靠在一起。野生型结构中的氨基酸Q348位于β-链2上并恰好在1β2,3之前,不形成任何分子内的联系。然而,用精氨酸取代Q348(Q348R)导致在R348和R487及R488的主链羰基之间形成两个新的氢键,二者均位于1β10,11上。新的氢键可以稳定由三个环形成的结构。确定地,如通过X-射线晶体学所确定的,围绕R348的结构被更紧密地折叠。设计带有这一变化的蛋白Cry3Bb.11095,其活性高于野生型Cry3Bb 4.6倍。5.16  实施例16一设计方法10:组合分析以及突变形成
设计的Cry3Bb分子中单独的位点可以被一起用来形成一个新的Cry3Bb分子,其活性高于任何一个位点的活性。该方法没有被精确地用于任何δ-内毒素。也不明显的是在两个位点的改善可以通力合作以提高蛋白的生物活性。事实上,数据证明当将两个位点的改善合在一个单一的构建物中时,Cry3Bb的生物活性被没有必然地进一步提高。在一些情况下,该结合导致蛋白稳定性和/或活性的降低。具有位点组合、结果导致比野生型Cry3Bb活性提高但比“母体”蛋白中的一种或多种活性降低的蛋白的例子是Cry3Bb.11235、11046、11057和11058。Cry3Bb.11082,含有来自4个母体蛋白的设计区域,保持了来自最有活性的母体株(Cry3Bb.11230)的活性水平,但没有显示出活性的增加。这些蛋白列于表7。以下是例证的实施例,其中被结合的突变具有明显提高的生物活性。5.16.1  Cry3Bb.11231
设计蛋白Cry3Bb.11231含有在Cry3Bb.11224(H231R)和Cry3Bb.11228(在1β1,α8发生变化)。表现在Cry3Bb.11231中的氨基酸变化的组合,导致抗SCRW幼虫的生物活性提高为大约超过野生型Cry3Bb的8倍(表2)。这一增加比单独的Cry3Bb.11224(5.0x)或Cry3Bb.11228(4.1x)所表现出来的都大。Cry3Bb.11231与野生型相比,抗WCRW幼虫的活性也表现出12.9倍的增加(表10)。5.16.2  Cry3Bb.11081
设计的Cry3Bb蛋白Cry3Bb.11081通过结合Cry3Bb.11032和Cry3Bb.11229(除了Y318C)所表现出来的变化来构建。Cry3Bb.11081比野生型Cry3Bb的活性增加6.1倍;其活性提高超过任一单独的母体蛋白,Cry3Bb.11032(3.1-倍)以及Cry3 Bb.11229(2.5-倍)。5.16.3  Cry3Bb.11083
设计的Cry3Bb蛋白Cry3Bb.11083是通过结合Cry3Bb.11036和Cry3Bb.11095所表现的变化来构建的。Cry3Bb.11083与野生型Cry3Bb相比,表现出抗SCRW幼虫的活性增加7.4倍;比Cry3Bb.11036(4.3x)或Cry3Bb.11095(4.6x)均大。Cry3Bb.11083与野生型Cry3Bb相比,也表现出抗WCRW幼虫的活性增加5.4倍(表10)。5.16.4  Cry3Bb.11084
设计的Cry3Bb蛋白Cry3Bb.11084是通过结合Cry3Bb.11032的变化和Cry3Bb.11228所表现的变化S311L来构建的。Cry3Bb.11084与野生型Cry3Bb相比,活性增加7.2倍;比Cry3Bb.11032(3.1x)或Cry3Bb.11228(4.1x)均大。5.16.5  Cry3Bb.11098
设计的Cry3Bb蛋白Cry3Bb.11098的构建是通过含有以下氨基酸变化:D165G、H231R、S311L、N313T、以及E317K。核苷酸序列如序列编号:107中给出,所编码的氨基酸序列如序列编号:108所给出。5.17  实施例17-设计方案11:对糖蛋白以及WCRW刷状缘膜的结合改变
虽然不知道Cry3Bb的受体的身份,但重要的是提高毒素与其受体的相互作用。一种提高毒素、受体相互作用(受体的身份已知)的方法是降低或排除对其它生物分子非生产性的结合。本发明者们已经观察到Cry3Bb非特异性地结合已经被许多种糖糖基化的牛血清蛋白(BSA),但不结合非糖基化的BSA。Cry3A,在Diabrotica种类中不活跃,显示出对糖基化的BSA相似甚至更强的结合。类似地,Cry3A相对与野生型的Cry3Bb,显示出对固定的WCRW刷状缘膜(BBM)更强的结合,意味着许多观察到的结合是非生产性的。据推论,对WCRW BBM幼虫非特异性结合的发生是通过使蛋白糖基化,以及在产生毒性的反映过程中,对糖基化的BSA和WCRW BBM的结合均是非生产性的。因此降低或消除这种结合可以导致对多产的受体增强以及毒性增强。对准潜在的糖类群结合位点进行重新设计,以降低Cry3Bb对糖蛋白以及固定的WCRW BBM的非特异性结合。5.17.1 Cry3Bb.60
Cry3Bb.60,其中Cry3Bb已经在1α3,4的R159被裂解,显示出对糖基化的BSA的结合降低,以及对固定的WCRW BBM的结合降低。Cry3Bb.60显示出相对于Cry3Bb的生物活性提高3.6倍。5.17.2  改变为1α3,4(Cry3Bb.11221)
已经在结构域1的1α3,4区对Cry3Bb.11221进行重新设计,Cry3Bb在结构域1被裂解以形成Cry3Bb.60。Cry3Bb.11221也显示出对糖基化的BSA和固定的WCRW BBM的结合降低,以及其生物活性超过野生型Cry3Bb的6.4倍。与Cry3Bb.60的数据(5.17.1节)一起,这些数据暗示该环区实质上促成了毒素的非生产性结合。5.17.3  改变为1β1,α8(Cry3Bb.11228、11230、11237以及11231)
Cry3Bb的1β1,α8区域已经被重新设计以提高水合作用(4.2.4节)和增加柔性(4.4.3节)。几种在该区域被改变的蛋白,Cry3Bb.11228、11230、和11237,展示出明显的对糖基化的BSA和固定的WCRW BBM较低水平的结合,同时也其生物活性相对于野生型的Cry3Bb增加4.1和4.5倍之间。5.17.4  结合活性
Cry3Bb和它的一些衍生物结合糖基化的BSA和WCRW BBM的倾向的确定是通过一种BIAcoreTM表面胞质团共振生物传感器来进行的。对于糖基化的BSA结合,使用标准的NHS化学作用将糖基化的蛋白固定在CM5芯片(BIAcore)上,将溶解的毒素注入糖基化的BSA表面上。为了测定对WCRW BBM的结合,将从WCRW的中肠中纯化出来(English等,1991)的刷状缘膜小囊泡(BBMV)固定在一个HPA芯片(BIAcore)上,然后用10mM KOH或40mM β-辛基葡萄糖方甙清洗。然后将溶解的毒素注入所得到的混合双分子层表面以检测结合。通过用蛋白质染色试剂分析Protein Dye Reagent assay*(BioRad)或BCA蛋白分析BCAProtein Assay*(Pierce)来确定蛋白的浓度。
也可以使用其它方法以确定相同结合的形成。这些包括,但不局限于,使用标记的毒素、标记的糖基化蛋白或抗毒素抗体进行的配基印迹实验,亲和层析,以及毒素在体外与完整BBMV的结合。5.18  实施例18-构建含有野生型Cry3Bb序列的质粒
标准的重组DNA操作实质上如Sambrook等(1989)所描述的进行。5.18.1 pEG1701
pEG1701(图11),包含EG11204和EG11037,其构建是通过将含有Cry3Bb基因的SphI-PstI片段和来自pEG911(Baum,1994)的ctyl F终止子插入到pEG854.9(Baum等,1996)(一种高拷贝数的苏云金芽胞杆菌-大肠杆菌穿梭载体)的SphI-PstI位点上。5.18.2 pEG1028
pEG1028含有来自pEG1701的Cry3Bb上的HindIII片段,该片段在HindIII被克隆到pTZ 18U的多克隆位点上。5.19  实施例19-含有变更的Cry3Bb基因的质粒的构建
来自大肠杆菌的质粒DNA的制备是通过碱性溶解方法(Maniatis等,1982),或者是通过商品化的质粒制备试剂盒(例子:PERFECTprepTMkit,5 Prime-3 Prime,Inc.,Boulder CO;QIAGEN plasmid prepkit,QIAGEN Inc.)。从
从在脑心浸液加上0.5%甘油(BHIG)中生长达到中央对数期的培养物中通过碱性溶解方法制备苏云金芽胞杆菌的质粒。当需要纯化时,在电泳之后从琼脂糖凝胶中切除DNA片段,然后使用一种Geneclean 11_试剂盒(BIO 101 Inc.,La Jolla,CA)通过玻璃*奶*复原。使用几种技术达到对Cry3Bb基因的改变,这些技术包括定位诱变、三重*PCRTM、拟随机的PCRTM诱变、DNA滑移和标准的重组技术。这些技术分别在6.1、6.2、6.3、6.4和6.5节中有描述。所使用引物的DNA序列列于7节。5.20  实施例20-定位诱变
定位诱变是由Kunkle(1985)和Kunkle等(1987)所建立的协议所指导的,在体外使用Muta-GeneTM M13诱变试剂盒(Bio-Rad,Richmond,CA)。通过使用Muta-GeneTM试剂盒和多个诱导突变的低聚核苷酸引物来达到结合Cry3Bb的变更。5.20.1 pEG1041
pEG1041,包含在EG11032中,其构建是通过使用Muta-GeneTM试剂盒、引物C、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.2 pEG1046
pEG1046,包含在EG11035中,其构建是通过使用Muta-GeneTM试剂盒、引物D、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.3 pEG1047
pEG1047,包含在EG11036中,的构建是通过使用Muta-GeneTM试剂盒、引物E、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.4 pEG1052
pEG1052,包含在EG11046中,的构建是通过使用Muta-GeneTM试剂盒、引物D和E、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3Bb DNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.5 pEG1054
pEG1054,包含在EG11048中,的构建是通过使用Muta-GeneTM试剂盒、引物F、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.6 pEG1057
pEG1057,包含在EG11051中,的构建是通过使用Muta-GeneTM试剂盒、引物G、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.21  实施例21-三重PCRTM
三重PCRTM是由Michael(1994)所描述的。该方法利用了一种热稳定连接酶,在PCRTM过程中,将磷酸化的诱变引物合并到一段扩增的DNA片段中。PCRTM在Perkin E1mer Cetus DNA Thermal Cycler(Perkin-Elmer,Norwalk,CT)中进行,使用一种AmpliTaqTM DNA聚合酶试剂盒(Perkin-Elmer)和SphI-线性化的pEG1701作为模板DNA。PCRTM的产物的清洗是通过使用化学试剂盒,如WizardTM PCRTMPreps(Promega,Madison,WI)和QlAquick PCRTM Purification kit(QIAGEN Inc.,Chatsworth,CA)。5.21.1 pEG1708和pEG1709
pEG1708和pEG1709,分别包含在EG11222和EG11223中,其构建是通过用另一个片段取代pEG1701中cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在cry3Bb核苷位点688-690(编码氨基酸Y230)上发生改变。通过三重PCRTM在Y230密码子上引入随机突变。诱变引物MVT095被磷酸化并与外来的引物对FW001和FW006一起使用。引物MVT095在687位也包括一个沉寂突变,T变为C,其在结合之后紧接着将一个附加的EcoRI位点引入pEG1701。5.21.2 pEG1710、pEG1711以及pEG1712
质粒pEG1710、pEG1711以及pEG1712,分别包含在EG11224、EG11225和EG11226中,其构建是通过用另一个片段取代pEG1701中cry3Bb基因上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点690-692(编码氨基酸H231)上发生改变。通过三重PCRTM在H231密码子上引入随机突变。诱变引物MVT097被磷酸化并与外来的引物对FW001和FW006一起使用。引物MVT097在687位也包括一个T变为C的序列改变,其在结合之后紧接着通过沉寂突变导致一个附加的EcoRI位点。5.21.3 pEG1713和pEG1727
pEG1713和pEG1727,分别包含在EG11217和EG11242中。其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点868-870(编码氨基酸R290)上发生改变。使用三重PCRTM在R290密码子上引入随机突变。设计诱变引物MVT091,以至核苷的替换可以导致大约36%的序列编码氨基酸D或E。MVT091被磷酸化并与外来的引物对FW001和FW006一起使用。5.22  实施例22-准随机PCRTM突变
准随机PCRM突变结合诱变的PCRTM技术是由Vallette等(1989)、Tomic等(1990)以及LaBean和Kauffman(1993)描述的。诱变引物,有时其长度超过70个核苷,被设计在编码一个完整的结构区域(如一个环)的核苷位置上引入变化。退化的密码子代表性地包括比率为82%的野生型核苷加上另外3种核苷,各为6%,在靶区域的每个位置上半随机地引入变化*(LaBean和Kauffman,1993)。当可能时,利用天然的限制性位点;当天然位点不适宜时,使用2s酶类(Stemmer和Morris,1992,列出对本技术有用的另外的限制酶)。PCRTM在一种Perkin ElmerCetus DNA Thermal Cycler(Perkin-Elmer,Norwalk,CT)中进行,使用一种AmpliTaqTM DNA聚合酶试剂盒(Perkin-Elmer)和SphI-线性化的pEG1701作为模板DNA。采用以下条件进行拟随机的PCRTM扩增:在94℃下变性1.5分钟,在50℃下退火2分钟,以及在72℃下延伸3分钟,循环30次。最后的14个延伸循环中每个循环加25秒延伸。底物浓度为20微升,或者对于长的诱变底物为40微升。使用如WizardTM PCRTMPreps(Promega,Madison,WI)和QlAquick PCRTM Purification kit(QIAGEN Inc.,Chatsworth,CA)的商品化的试剂盒来清洗PCRTM的产物。在一些实例中,PCRTM的产物在限制消化之前,用Klenow Fragment(Promega)依照厂家指导进行处理,填满任何单个碱基的突出部分。5.22.1 pEG1707
EG1707,包含在EG11221中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的Pf1MI-PflMI片段,前者为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点460-480(编码1α3,4的氨基酸154-160)上发生改变。引物MVT075,其包括2s类的限制酶BsaI的识别位点,以及引物FW006被用于通过拟随机诱变在该区域引入变化。引物MVT076,也含有一个BsaI位点,和引物FW001用于PCRTM扩增一段“连接”片段。在PCRTM扩增之后,两个产物均被清洗、末端填充、用BsaI消化并彼此连接。凝胶纯化连接的片段并使用引物对FW001和FW006将其作为PCRTM扩增的引物。将PCRTM产物进行清洗、末端填充、用PflMI消化、凝胶纯化及连接到经PflMI消化并纯化过的pEG1701载体DNA上。5.22.2 pEG1720和pEG1726
pEG1720和pEG1726,分别包含在EG11234和EG11241中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点859-885(编码1α7,8的氨基酸287-295)上发生改变。使用拟随机PCRTM诱变在该区域中引入变化。诱变引物MVT111,设计含有一个BsaI位点,以及引物FW006被用于引入变化。引物对MVT094,也含有BsaI位点,和FW001被用于扩增连接片段。将PCRTM产物用BsaI消化、凝胶纯化及彼此连接。将连接的产物使用引物对FW001和FW006进行PCRTM扩增,用PflMI消化。5.22.3     pEG1714、pEG1715、pEG1716、pEG1718、pEG1719、pEG1722、pEG1723、pEG1724以及pEG1725
pEG1714、pEG1715、pEG1716、pEG1718、pEG1719、pEG1722、pEG1723、pEG1724以及pEG1725,分别包含在EG11228、EG11229、EG11230、EG11232、EG11233、EG11236、EG11237、EG11238和EG11239中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点931-954(编码1β1,α8的氨基酸311-318)上发生改变。使用拟随机PCRTM诱变在该区域中引入变化,使用诱变引物MVT003和引物FW006。引物MVT003和FW006用来扩增一段连接片段。将PCRTM产物用Klenow和进行末端填充并用BamHI消化。将从FW001-FW006消化的较大片段进行凝胶纯化,然后与消化的MVT103-FW006片段连接。将连接的产物进行凝胶纯化,并通过使用引物FW001和FW006的PCRTM进行扩增。将扩增的产物用PflMI消化,并在连接到经PflMI消化并纯化的pEG1701载体DNA上之前进行凝胶纯化。5.22.4 pEG1701.Lβ2,3
带有cry3Bb野生型序列1051-1065位核苷(编码Cry3Bb的结构区域1β2,3)变体的质粒,其构建是通过用独立的MluI-和SpeI-消化的PCRTM产物取代pEG1701的MluI-SpeI片段。该PCRTM产物的产生是通过拟随机PCRTM诱变,其中诱变引物MVT081与FW006配对。这些质粒作为一个群体命名为pEG1701.1β2,3。5.22.5 pEG1701.Lβ6,7
含有cry3Bb野生型在1234-1248位核苷上的序列(编码Cry3Bb的结构区域1β6,7)变体的质粒,其构建是通过用独立的MluI-和SpeI-消化的PCRTM产物取代pEG1701的MluI-SpeI片段。该PCRTM产物的产生是通过拟随机PCRTM诱变,其中诱变引物MVT085与WD115配对。配对引物MVT089和WD112被用来扩增一段连接片段。两种PCRTM产物均被TaqI消化并相互连接。将连接的产物进行凝胶纯化,并通过使用配对引物MVT089和FW006的PCRTM进行扩增。将扩增的产物用MluI和SpeI进行消化,并连接到经MluI和SpeI消化并纯化的pEG1701载体DNA上。这些质粒作为一个群体命名为pEG1701.1β6,7。5.22.6 pEG1701.Lβ10,11
含有突变的cry3Bb 1450-1467位核苷上的序列(编码Cry3Bb的结构区域1β10,11)质粒,其构建是通过用分离的SpeI-和PstI消化的PCRTM产物取代pEG1701的SpeI-PstI片段。该PCRTM产物的产生是通过拟随机PCRTM诱变,其中诱变引物MVT105与引物MVT070配对。配对引物MVT092和MVT083被用来形成一段连接片段。(MVT083是一段为另一个区域设计的诱变低聚物。由MVT083引入的序列变化在限制消化之后被消除,不会影响cry3Bb在1β10,11区域的变化。)
两种PCRTM产物均被BsaI消化并与通过配对引物MVT083和MVT070进行的PCRTM扩增的连接产物相互连接。用SpeI和PstI消化所得到的PCRTM产物,以及对其进行凝胶纯化。这些质粒作为一个群体命名为pEG1701.1β10,11。5.23  实施例23-DNA滑移
DNA-滑移,如Stemmer(1994)所描述,被用于联合cry3Bb基因的个别变更。5.23.1 pEG1084、pEG1085、pEG1086以及pEG1087
pEG1084、pEG1085、pEG1086、以及pEG1087,分别包含在EG11081、EG11082、EG11083、以及EG11084中,从DNA滑移中恢复。简单地,PflMI DNA片段的产生是通过使用引物集合A和B以及pEG1707、pEG1714、pEG1715、pEG1716、pEG1041、pEG1046、pEG1047、和pEG1054各自的质粒作为DNA模板。将所得到的DNA片段以等质量汇聚,并用DNA酶I进行消化,通过三个成功的冻结融化循环将50-100bp的DNA片段从琼脂糖凝胶中回收出来:在干冰乙醇浴池中三分钟,接着在50℃下完全溶解。回收的DNA片段通过无引物的PCRTM和使用Stemmer(1994)描述的引物组合A和B的PCRTM-扩增进行组合。最后的PCRTM-扩增的DNA片段用PflMI切除并被用于取代pEG1701中相应的Cry3Bb PflMI DNA片段。5.24  实施例24-重组DNA技术
标准的重组DNA步骤大致根据Sambrook等(1989)的描述来进行。5.24.1 pEG1717
pEG1717包含于EG11231中,是通过把pEG1710中的小BglII片段替代为来源于pEG1714的小BglII片段来构建的。5.24.2 pEG1721
pEG1721包含于EG11235中,是通过把pEG1710中的小BglII片段替代为来源于pEG1087的小BglII片段来构建的。5.24.3 pEG1063
pEG1063包含于EG11057中,是通过把来源于pEG1054的含有ori43的NcoI DNA片段替代为来源于pEG1046的经过分离的含有ori 43以及在Cry3Bb中的变更的NcoI DNA片段来构建的。5.24.4 pEG1063
pEG1063包含于EG11058中,是通过把来源于pEG1054的含有ori43的NcoI DNA片段替代为来源于pEG1707的经过分离的含有ori 43以及在Cry3Bb中的变更的NcoI DNA片段来构建的。5.24.5 pEG1095
pEG1095包含于EG11095中,是通过把pEG1701中的MluI-SpeI DNA片段替代为来源于pEG1086的相应的MluI-SpeI DNA片段来构建的。5.25 实施例25--在构建Cry3Bb*变体的过程中使用的引物
以下所示的是在通过定点突变、三重PCRTM(triplex PCR)以及准随机PCRTM(quasi-random PCR)来获得cry3Bb*变体时所用的引物。引物得自Ransom Hill Bioscience,Inc.(Ramona,CA)以及Integrated DNA Technologies,Inc.(Coralville,IA)。在一个或多个残基上含有特定退化的引物的特定的组合物示于第5.30节,实施例30。5.25.1  引物FW001(序列编号:71):5’AGACAACTCI’ACAGTAAAAGATG-3’5.25.2  引物FW006(序列编号:72):5’-GGTAATTGGTCAATAGAATC-3’5.25.3  引物MVT095(序列编号:73):5’-CAGAAGATGTTGCTGAATTCNNNCATAGACAATTAAAAC-3’5.25.4  引物MVT097(序列编号:74):5’-GATGTTGCTGAATTCTATNNNAGACAATTAAAAC-3’5.25.5  引物MYT091(序列编号:75):5’-CCCATTTTATGATATTBDNTTATACTCAAAAGG-3’5.25.6  引物MVT075(序列编号:76):5’-GCTATGCTGGTCTCGGAAGAAAEFNFFNFJNJFJFJNFINJFJAAAAGAAGCCAAGATCGAAT-3’5.25.7  引物MVT076(序列编号:77):5’-GGTCACCTAGGTCTCTCTTCCAGGAATTTAACGCATTAAC-3’5.25.8  引物MVT111(序列编号:78):5’-AGCTATGCTGGTCTCCCATTTJEHIEJEJJEIIKRRJEHEIJEENIIIGTTAAAACAGAACTAAC-3’5.25.9 引物MVT094(序列编号:79):5’-ATCCAGTGGGGTCTCAAATGGGAAAAGTACAATTAG-’3’5.25.10 引物MVT103(序列编号:80):5’-CATTTTTACGGATCCAATTTTTJFFFJNEEJEFNFJNFEILEIJEOGGACCAACTTTTTTGAG-3’5.25.11 引物MVT081(序列编号:8”:5’-GAATTTCATACGCGTCTTCAACCTGGTJEHJJJIINMEEIEJTCTTTCAATTATTGGTCTGG-3’5.25.12 引物MVT085(序列编号:82):5’-AAAAGTTTATCGAACTATAGCTAATACAGACGTAGCGGCTJQQFFNEEJIIJEEIGTATATTTAGGTGTTACG-3’5.25.13 引物A(序列编号:83)3B2PFLM I:5’-GGAGTTCCATTTGCTGGGGC-3’5.25.14 引物B(序列编号:84)3B2PFLM2:5’-ATCTCCATAAAATGGGG-3’5.25.15 引物C(序列编号:85)3B2165DG:5’-GCGAAGTAAAAGAAGCCAAGGTCGAATAAGGG-3’5.25.16 引物D(序列编号:86)3B2160SKRD:5’-CCTTTAAGTTTGCGAAATCCACACAGCCAAGGTCGAATAAGGG-3’5.25.17 引物E(序列编号:87)3B2290VP:5’-CCCATTTTATGATGTTCGGTTATACCCAAAAGGGG-3’5.25.18 引物F(序列编号:88)3B2EDA104:5’-GGCCAAGTGAAGACCCATGGAAGGC-3’5.25.19 引物G(序列编号:89)3B2KG189:5’-GCAGTTTCCGGATTCGAAGTGC-3’5.25.20 引物WD112(序列编号:90):5’-CCGCTACGTCTGTATTA-3’5.25.21 引物WD115(序列编号:91):5’-ATAATGGAAGCACCTGA-3’5.25.22 引物MVT105(序列编号:92):5’-AGCTATGCTGGTCTCTTCTTAEJIFEIIEFFIJFIJIINACAATTCCATTTTTTACTTGG-3’5.25.23 引物MVT092(序列编号:93):5’-ATCCAGTTGGGTCTCTAAGAAACAAACCGCGTAATTAAGC-3’5.25.24 引物MVT070(序列编号:94):5’-CCTCAAGGGTTATAACATCC-3’5.25.25 引物MVT083(序列编号:95):5’-GTACAAAAGCTAAGCTTTIEJIINPEEMEEIJNJESCGAACTATAGCTAATACAG-3’5.26 实施例26--经过改变的cry3Bb基因的序列分析
有时候使用大肠杆菌DH5αTM(GIBCO BRL,Gaithersburg,MD),JM110以及SureTM(Stratagene,La Jolla,CA)细胞来扩增测序用的质粒DNA。根据生产商的步骤把质粒转化到这些细胞中。DNA序列是用购自U.S.Biochemical Corporation(Cleveland,Ohio)的Sequenase_2.0 DNA测序试剂盒测定的。表11列出了在第6节中所描述的质粒、它们各自与野生型cry3Bb序列的差异、所获得的氨基酸变化、以及变化的结构位置。
                            表11
      cry3Bb*基因的DNA序列变化以及由此造成的Cry3Bb*蛋白的氨基酸替代质粒                    cry3Bd*DNA序列                      Cry3Bb*的氨基酸序列           改变的结构位置pEG1707  A460T,C461T,A462T,C464A,T465C,T466C,T467A,    T154F,P155H,L156H,L158R       1α3,4
       A468T,A469T,G470C,T472C,T473G,G474T,
                  A477T,A478T,G479CpEG1708      T687C,T688C,A689T,C691A,A692G                   Y230L,H231S                  α6pEG1709    T667C,T687C,T688A,A689G,C691A,A692G              S223P,Y230S                  α6pEG1710                   T687C,A692G                               H231R                     α6pEG1711                   T687C,C691A                           H231N,T241S                  α6pEG1712          T687C,C691A,A692C,T693C                           H231T                    α6pEG1713             C868A,G869A,G870T                               R290N                 1α7,β1pEG1714        C932T,A938C,T942G,G949A,T954C              S311L,N313T,E317K           1β1,α8pEG1715    T931A,A933C,T942A,T945A,G949A,A953G,         S311T,E317K,Y318C           1β1,α8
                         T954CpEG1716    T931G,A933C,C934G,T945G,C946T,A947G,         S311A,L312V,Q316W           1β1,α8
                      G951A,T954C
                                               表11(续)质粒               cry3Bb*DNA序列                        Cry3Bb*的氨基酸序列         改变的结构位置pEG1717    T687C,A692α,C932T,A938C,T942G,G949A,    H231R,S311L,N313T,E317K     α6,1β1,α8
                    T954CpEG1718    T931A,A933G,T935C,T936A,A938C,T939C,     S311T,L312P,N313T,E317N     1β1,α8
              T942C,T945A,G951T,T954CpEG1719    T931G,A933C,T936G,T942C,C943T,T945A,          S311A,Q316D              1β1,α8
                  C946G,G948C,T954CPEG1720    T861C,T866C,C868A,T871C,T872G,A875T,     1289T,L291R,Y292F,S293R     1α7,β1
                  T877A,C878G,A882GpEG1721               T687C,A692G,C932T                      H231R,S311L             α6,1β1,α8pEG1722   T931A,C932T,A933C,T936C,T942G,T945A,T954C          S3111                1β1,α8pEG1723     T931A,C932T,A933C,T936C,A937G,A938T,         S3111,N313H             1β1,α8
        C941A,T942C,T945A,C946A,A947T,A950T,
                          T954CpEG1724    A933C,T936C,A937G,A938T,C941A,T942C,     N313V,T314N,Q316M,E317V    1β1,α8
          T945A,C946A,A947T,A950T,T954C
                                                  表11(续)质粒             cry3Bb*DNA序列                         Cry3Bb*的氨基酸序列               改变的结构位置pEG1725    A933T,A938G,T939G,T942A,T944C,T945A,   N-313R,L315P,Q316L,E317A           1β1,α8
              A947T,G948T,A950C,T954CpEG1726    A860T,T861C,G862A,C868T,G869T,T°71C,     Y287F,D288N,R290L                1α7,β1
              A873T,T877A,C878G,A879TpEG1727                C868G,G869T                                R290V                      1α7,β1pEG1041                    A494G                                   D165G                       α4pEG1046       G479A,A481C,A482C,A484C,G485A,      S160N,K161P,P162H,D165G             α4
                    A486C,A494GpEG1047                 A865G,T877C                            1289V,S293P                  1α7,β1pEG1052    G479A,A481C,A482C,A484C,G485A,A486C,    S160N,K161P,P162H,D165G,         α4,1α7,β1
                 A494G,A865G,T877C                        I289V,S293PpEG1054           T309A,Δ310,Δ311,Δ312                    D103E,ΔA104                 1α2a,2bpEG1057                  A565G,A566G                               K189G                     1α4,5pEG1062    T309A,Δ310,Δ311,Δ312,G479A,A481C,A482C,    D103E,ΔA104,S160N,K161P, 1α2a,2bα4
                 A484C,G485A,A486C,A494G                   P162H,D165G
                                        表11(续)质粒                 cry3Bb*DNA序列                            Cry3Bb*的氨基酸序列              改变的结构位置pEG1063    T309A,Δ310,Δ311,Δ312,A460T,C461T,A462T,    D103E,ΔA104,T154F,P155H,     1α2a,2b1α3,4
       C464A,T465C,T466C,T467A,A468T,A469T,                 L156H,L158R
       G470C,T472C,T473G,G474T,A477T,A478T,
                         G479CpEG1084    A494G,T931A,A933C,T942A,T945A,G949A,              D165G,S311T,E317K           α4,1β1,α8
                          T954CpEG1085    A494G,A865G,T877C,T914C,T931G,A933C,           D165G,I289V,S293P,F305S,    α4,1α7,β1β1,1β1,α8
       C934G,T945G,C946T,A947G,G951A,T954C,           S311A,L312V,Q3 16W,Q348R,        β2,β3b
                     A1043G,T1094C                                    V365ApEG1086               A865G,T877C,A1043G                          I289V,S293P,Q348R               1α7,β1,β2pEG1087                  A494G,C932T                                   D165G,S311L                 α4,1β1,α8pEG1095                     A1043G                                          Q348R                       β25.27 实施例27--Cry3Bb*蛋白的表达5.27.1 培养条件
用标准配方制备LB琼脂(Maniatis等,1982)。淀粉琼脂得自DifcoLaboratories(Detroit,MI)并另外补充有5g/l的琼脂。C2液体培养基如Donovan等人所描述的(1988)。C2液体培养基有时候不含有磷酸缓冲液(C2-P)。所有的培养基均在25至30℃温育,同时给液体培养基振荡(150rpm)直到形成孢子并发生裂解。5.27.2 转化条件
通过Macaluso以及Mettus(1991)的电穿孔方法把pEG1701及其衍生物引入一种结晶晶体的(acrystalliferious*)的苏云金芽胞杆菌变种kurstaki EG7566(Baum,1994)或EG10368(美国专利5,322,687)中。在一些情形中对这种方法进行如下的修改以获得最大数量的转化体。让接受体苏云金芽胞杆菌菌株在30℃于LB琼脂过夜生长之后把它接种到加有0.5%甘油的心脑培养液中,生长到光密度值(600mm)大约为0.5,于冰上冷冻10分钟,用EB洗2次,然后重悬为1/50体积的EB。经过转化的细胞在LB琼脂或淀粉琼脂(加有5ug/ml的氯霉素)中筛选。通过视觉对菌落进行筛选以鉴定能够产生晶态蛋白的转化体;这些菌落通常都比不产生晶态蛋白的菌落更不透明。5.27.3 菌株和蛋白设计
把含有一个编码经过改变的Cry3Bb*蛋白的经过改变的cry3Bb*基因用一个“EG”号码标示,如EG11231。把经过改变的Cry3Bb*蛋白称为Cry3Bb再加上菌株号码,如Cry3Bb.11231。把在某一个结构位置有改变的蛋白的集合称为Cry3Bb再加上结构位点,如Cry3Bb.1β2,3。在表12中列出与本发明相关的质粒、含有这些质粒的新的苏云金芽胞杆菌菌株、所使用的生结晶体的苏云金芽胞杆菌接受者菌株、以及这些新菌株所生产的蛋白。5.28  实施例28--Cry3Bb-60的产生和性质鉴定5.28.1 Cry3Bb-60的产生
让生产Cry3Bb的菌株EG7231(美国专利5,187,091)在加有3mg/ml的氯霉素的C2培养基中生长。在产生孢子并发生裂解之后,把培养基用水清洗,用Cody等(1992)的NaBr增溶及重结晶方法纯化Cry3Bb蛋白。用BCA Protein Assay(Pierce,Rockford,IL)确定蛋白的浓度。把重结晶的蛋白每100mg溶解在10ml 50mM的KOH中,并用100mM的CAPS(3-[环己胺]-1-丙磺酸,pH9.0)把pH值缓冲在9.0。用胰蛋白酶处理可溶毒素,重量比为每50mg毒素用1mg的胰蛋白酶,在室温下作用20分钟至过夜。胰蛋白酶在蛋白中存在的精氨酸和赖氨酸残基的羧基端剪切蛋白。对于8剂量生物学鉴定法,稍微改变溶解的条件以增加蛋白的浓度:在12.77mg/ml的经过纯化的Cry3Bb*悬浮液中逐滴加入2.7ml的50mM的KOH直到晶体溶解。然后用100mM的CAPS(pH9.0)把体积调节到7ml。
                         表12
带有改变的cry3Bb*基因的质粒被转化到苏云金芽胞杆菌中
用于表达被改变的Cry3Bb*蛋白
质粒设计 新的BT菌株 表达的蛋白
pEG1701  EG11204  WT Cry3Bb
pEG1701  EG11037  WT Cry3Bb
pEG1707  EG11221  Cry3Bb.11221
pEG1708  EG11222  Cry3Bb.11222
pEG1709  EG11223  Cry3Bb.11223
pEG1710  EG11224  Cry3Bb.11224
pEG1711  EG11225  Cry3Bb.11225
pEG1712  EG11226  Cry3Bb.11226
pEG1713  EG11227  Cry3Bb.11227
pEG1714  EG11228  Cry3Bb.11228
pEG1715  EG11229  Cry3Bb.11229
pEG1716  EG11230  Cry3Bb.11230
pEG1717  EG11231  Cry3Bb.11231
pEG1718  EG11232  Cry3Bb.11232
pEG1719  EG11233  Cry3Bb.11233
pEG1720  EG11234  Cry3Bb.11234
pEG1721  EG11235  Cry3Bb.11235
pEG1722  EG11236  Cry3Bb.11236
pEG1723  EG11237  Cry3Bb.11237
表12(续)
 pEG1724  EG11238  Cry3Bb.11238
 pEG1725  EG11239  Cry3Bb.11239
 pEG1726  EG11241  Cry3Bb.11241
 pEG1727  EG11242  Cry3Bb.11242
 pEG1041  EG11032  Cry3Bb.11032
 pEG1046  EG11035  Cry3Bb.11035
 pEG1047  EG11036  Cry3Bb.11036
 pEG1052  EG11046  Cry3Bb.11046
 pEG1054  EG11048  Cry3Bb.11048
 pEG1057  EG11051  Cry3Bb.11051
 pEG1062  EG11057  Cry3Bb.11057
 pEG1063  EG11058  Cry3Bb.11058
 pEG1084  EG11081  Cry3Bb.11081
 pEG1085  EG11082  Cry3Bb.11082
 pEG1086  EG11083  Cry3Bb.11083
 pEG1087  EG11084  Cry3Bb.11084
 pEG1095  EG11095  Cry3Bb.11095
 pEG1098  EG11098  Cry3Bb.11098
 pEG1701.1β2,3 未命名菌株的集合 Cry3Bb.1β2,3
 pEG1701.1β6,7 未命名菌株的集合 Cry3Bb.1β6,7
 pEG1701.1β10,11 未命名菌株的集合 Cry3Bb.1β10,11
5.28.2  Cry3Bb-60的分子量的确定
通过SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析,使用商业性的分子量标记来确定占主要的、胰蛋白酶降解的Cry3Bb片段的分子量。把降解的片段称为Cry3Bb-60。没有观察到这个60kD降解产物有发生进一步的降解。5.28.3  Cry3Bb-60的N-末端的确定
为了确定Cry3Bb-60的氨基端序列,通过SDS-PAGE分步收集胰蛋白酶的降解产物并在常规的western免疫印迹步骤之后把其转移到ImmoobilonTM-P膜(Millipore Corporation,Bedford,MA)上。转移之后,用水清洗膜2次,然后用0.025%的考马氏亮蓝R-250加40%甲醇染色5分钟。用剃须刃片切下Cry3Bb.60条带。在Tufts MedicalSchool,Department of Physiology(Boston,MA),使用标准的Edman降解步骤测定氨基端的序列。确定其氨基端的序列为SKRSQDR(序列编号:96),对应于Cry3Bb的第160-166位氨基酸。胰蛋白酶在氨基酸R159的羧基端产生降解,从而除去了螺旋1-3。5.29 实施例29--Cry3Bb*蛋白的生物活性5.29.1 培养条件和蛋白浓度的确定
用于1剂量生物学鉴定法的培养物在加有5ug/ml氯霉素的C2-P(C2-P/cm5)中生长,然后用3倍体积的0.005% Triton X-100_稀释。没有确定这些培养物的蛋白浓度。用于8剂量生物学鉴定法的培养物在C2/cm5中生长,用1-2倍体积的无菌水清洗1-2次并重悬于1/10体积的无菌的0.005% Triton X-100_中。根据Brussock以及Currier(1990)的方法确定每种浓缩液的毒素蛋白的浓度,其中省略了用3M的HEPES进行处理的步骤。用0.005% Triton X-100_把蛋白的浓度调节到3.2mg/ml以供最高剂量化验使用。用如9.1节中所述的方法生产并定量用于8剂量生物学鉴定法的Cry3Bb.60。5.29.2 昆虫的生物学鉴定法
根据Staney等(1992)的方法培养Diabrotica undecimpunctatahowardi Barber(南部谷物食根虫或SCRW)以及Diabroticavirgifera virgifiera LeConte(西部谷物食根虫或SCRW)幼虫。根据Slaney等(1992)的方法进行8剂量化验和probit*分析。每个剂量(50ul样品/食物的孔,表面积175mm2)试验32只幼虫。阳性对照是野生型的生产Cry3Bb的菌株EG 11037或EG 11204。所有的生物学鉴定法都是用128孔板进行的,每一孔中含有大约1ml的食物,盖有穿孔的聚脂薄膜(C-D International Inc.,Pitman,NJ)。1剂量的鉴定法以大致相同的方法进行,只是对每一菌株只进行一次剂量的试验。所有的试验至少重复2次。5.29.3 昆虫生物学鉴定法的结果:对抗SCRW的单剂量化验
把1-剂量化验的结果表达为试验菌株与野生型相比的相对死亡率(RM,实验培养物的死亡率(%)/野生型培养物的死亡率(%))。通过反复的对抗SCRW幼虫的1剂量化验可以把来源于通过PCRTM方法构建的质粒(在cry3Bb基因序列中引入随机或半随机变化)的改变的和改善的Cry3Bb蛋白与其它的改变了的但是没有改善的Cry3Bb蛋白区分开来。那些与野生型Cry3Bb比较(或者对于含有多个改变位点的蛋白,与“父代”的经过改变的Cry3Bb蛋白比较)活性提高的蛋白(定义为RM≥1.5),则通过8剂量化验进一步进行鉴定。由1-剂量化验的结果(来源于在一个单一的结构区域,如1β2,3,中含有随机或半随机改变的蛋白)产生的总体的RM“样式”可以被用于确定这些结构区域是否具有重要的生物学活性。野生型活性(RM~1)的保持表明改变在该区域得到了容忍。活性的全部丧失(RM<1)表明该区域对于生物学活性具有重要作用。5.29.4 Cry3Bb.1β2,3:对抗SCRW的单剂量化验的结果
Cry3Bb.1β2,3蛋白是一个在Cry3Bb的1β2,3区域(见5.3.4节)改变了的蛋白的集合。这些改变的蛋白的1-剂量化验的典型的结果示于图12中。Cry3Bb.1β2,3蛋白的RM值小于1,少数几个接近1,这表明这一区域对于毒性是很重要的。5.29.5 Cry3Bb.1β6,7:对抗SCRW的单剂量化验的结果
Cry3Bb.1β6,7蛋白是一个在Cry3Bb的1β6,7区域(见5.3.5节)改变了的蛋白的集合。这些改变的蛋白的1-剂量化验的典型的结果示于图13中。Cry3Bb。1β6,7蛋白的RM值除了少数几个接近1以外,其它的都小于1,这表明这一区域对于毒性是很重要的。5.29.6 Cry3Bb.1β10,11:对抗SCRW的单剂量化验的结果
Cry3Bb.1β10,11蛋白是一个在Cry3Bb的1β10,11区域(见5.3.6节)改变了的蛋白的集合。这些改变的蛋白的1-剂量化验的典型的结果示于图14中。Cry3Bb.1β10,11蛋白的RM值除了少数几个接近1以外,其它的都小于1,这表明这一区域对于生物活性是很重要的。5.29.7 昆虫生物学鉴定法结果:对抗SCRW的8-剂量化验的结果
8-剂量化验的结果表示为LC50值(导致50%死亡率的蛋白浓度),置信区间(confidence interval)为95%。显示对抗SCRW幼虫的活性提高的改变的Cry3Bb蛋白的置信区间为95%的LC50值以及同时确定的野生型Cry3Bb对照的LC50值在表13中列出,表13还列出了每种改善的蛋白相对野生型的活性的级数增加。
                        表13
用重复的8-剂量化验对被设计的Cry3Bb蛋白对抗SCRW幼虫的能力进行试验以确定LC50值
LC50 ug/孔(95%C.I.)
改善的蛋白 改善的蛋白 野生型Cry3Bb对照 相对野生型活性的级数增加
 Cry3Bb.60  6.7(5.3-8.4) 24.1(15-39) 3.6x
 Cry3Bb.11221  3.2(2.5-4) 20.5(14.5-29) 6.4x
 Cry3Bb.11222  7.3(6-9) 29.4(23-37) 4.0x
 Cry3Bb.11223  10.5(9-12) 29.4(23-37) 2.8x
 Cry3Bb.11224  6.5(5.1-9.2) 32.5(25-43) 5.0x
 Cry3Bb.11225  13.7(11-16.8) 49.5(39-65) 3.6x
 Cry3Bb.11226  16.7(10.6-24.2) 49.5(39-65) 3.0x
 Cry3Bb.11227  11.1(9.1-13.5) 21.3(16-28) 1.9x
 Cry3Bb.11228  8.0(6.6-9.8) 32.9(25-45) 4.1x
 Cry3Bb.11229  7.2(5.8-8.8) 18.2(15-22) 2.5x
 Cry3Bb.11230  7.0(5.8-8.6) 32.9(25-45) 4.7x
 Cry3Bb.11331  3.3(3.0-3.7) 26.1(22-31) 7.9x
 Cry3Bb.11132  6.4(5.4-7.7) 32.9(25-45) 5.1x
 Cry3Bb.11233  15.7(12-20) 32.9(25-45) 3.2x
 Cry3Bb.11234  7(6-9) 29(22-39) 4.1x
 Cry3Bb.11235  4.2(3.6-4.9) 13.3(10-17) 3.2x
 Cry3Bb.11236  11.6(9-15) 36.4(27-49) 3.1x
 Cry3Bb.11237  6.8(4-11) 36.4(2749) 5.4x
 Cry3Bb.11238  13.9(11-17) 36.4(27-49) 2.6x
 Cry3Bb.11239  13.0(10-16) 36.4(27-49) 2.8x
 Cry3Bb.11241  11(7-16) 29(22-39) 2.6x
 Cry3Bb.11242  11.9(9.2-16) 30(23-38) 2.5x
 Cry3Bb.11032  4.2(3.6-4.9) 13.3(10-17) 3.1x
表13(续)
 Cry3Bb.11035  10.3(8-13)  27.9(23-34)  2.7x
 Cry3Bb.11036  6.5(5.1-7.9)  27.9(23-34)  4.3X
 Cry3Bb.11046  12.1(8-19)  31.2(25-39)  2.6x
 Cry3Bb.11048  8.3(6-11)  35.4(24-53)  4.3x
 Cry3Bb.11051  11.8(8-16)  35.4(24-53)  3.0x
 Cry3Bb.11057  8.8(7-11)  29.5(24-36)  3.4x
 Cry3Bb.11058  9.6(6-14)  33.4(27-43)  3.5x
 Cry3Bb.11081  8.5(7-11)  51.5(37-79)  6.1x
 Cry3Bb.11082  10.6(8-13)  51.5(37-79)  4.9x
 Cry3Bb.11083  7.0(5-10)  51.5(37-79)  7.4x
 Cry3Bb.11084  7.2(4-12)  51.5(37-79)  7.2x
 Cry3Bb.11095  11.1(9-14)  51.5(37-79)  4.6x
 Cry3Bb.11098
5.29.8 昆虫生物学鉴定法的结果:对抗WCRW的8-剂量化验
WCRW幼虫非常细小,不容易处理。因此在8-剂量化验中,只有对一些显示对抗SCRW幼虫的活性有改善的设计的Cry3Bb试验了其对抗WCRW幼虫的活性。在表14中示出了设计的Cry3Bb蛋白的LC50值以及同时确定的野生型Cry3Bb对照的LC50
                       表14
对抗SCRW幼虫的活力改善了的Cry3Bb蛋白其对抗WCRW幼虫的活力同时也改善了
LC50 ug/孔(95% C.I.)
改善的蛋白 改善的蛋白 Cry3Bb野生型对照 相对野生型活性的级数增加
 EG11083  6.3(4.7-8.2)  63.5(46-91)  10.1x
 EG11230  24.2(13-40)  4.5(2.1-7.4)  5.4x
 EG11231  32.2(14-67)  2.5(1.7-3.6)  12.9x
5.30 实施例30-通道的活性
用Slatin等(1990)描述的方法测量了由Cry3Bb以及它的一些衍生物产生的离子通道。在一些情况中,脂双层是用磷脂酰乙醇胺(PE)∶磷脂酰胆碱(PC)4∶1的混合物制备的。毒素蛋白是用12mM KOH从经过清洗的C2培养基中的苏云金芽胞杆菌培养物溶解的。离心除去孢子和其它的碎片,把10ug的溶解的毒素蛋白加入到膜小室的cis小室(4.5ml)中。用BCA Protein Assay(Pierce)确定蛋白的浓度。5.30.1 野生型Cry3Bb的通道活性
当暴露于黑脂膜时,Cry3Bb形成了导率状态各不相同的离子通道。由Cry3Bb形成的通道很少是不连续的通道,它们开启和关闭状态界限分明,通常需要把毒素与膜一起温育30-45分钟才能观察到类似于通道的事件。在形成初始的导率之后,尺寸在2小时内从大约200pS增加到大约10,000pS。只有那些小的导率(≤200pS)是电压依赖性的。在200pS以上,导率是完全均衡的。Cry3Bb通道同时还表现出依赖于β-巯基乙醇的激活,在膜小室的cis小室中加入β-巯基乙醇2分钟之后从大约为200pS的小的导率生长到几千pS。5.30.2Cry3Bb.11032
当增溶的毒素蛋白被加入到膜小室的cis小室中时,Cry3Bb.11032的通道活性更象野生型的Cry3Bb。然而,当通过在有Cry3Bb.11032蛋白存在的情况下形成或“绘制”膜时,把该蛋白人工地结合到膜中时,可以观察到通道的初始导率增加了16倍(~4000pS)。这一现象在野生型的Cry3Bb中没有观察到。5.30.3 Cry3Bb.11035
当暴露于人工膜时,Cry3Bb.11035蛋白自发地形成通道,这些通道在相对较短的时间内(~5分钟)生长为大的导率。导率介于3000-6000pS之间,而且类似于野生型的Cry3Bb,在低导率值时是电压依赖性的。5.30.4 Cry3Bb.11048
Cry3Bb.11048蛋白并不形成通道,但却形成均匀的孢子(相对电压而言),就这一点而言,它与野生型Cry3Bb很不一样。一旦形成孢子,它仍保持开启并允许一个稳定的导率(介于25-130pS之间)。5.30.5 Cry3Bb.11224以及Cry3Bb.11226
在Cry3Bb.11224和Cry3Bb.11226蛋白中,由H231形成的野生型Cry3Bb的金属结合位置在二体结构中被除去。由两种设计的蛋白所形成的导率与野生型Cry3Bb的是一样的,只是两种设计的蛋白都不具有依赖于β-巯基乙醇的激活。5.30.6 Cry3Bb.11221
已经发现Cry3Bb.11221蛋白可以迅速地形成100-200pS的小的通道,它的电压依赖性有限。在负电位观察到更高的导率。在其它研究中,活性的产生被延迟27分钟,这在野生型Cry3Bb中更为典型。然而,不同于野生型Cry3Bb的是,Cry3Bb.11221形成了高分辨的、600pS的通道,通道的开启状态很长。该蛋白最终达到7000pS的导率。5.30.7 Cry3Bb.11242
Cry3Bb.11242蛋白在暴露于人工膜之后立即形成小的导率。导率在大约3分钟内稳定、迅速地生长到6000pS。观察到一些电压依赖性,特别偏爱反向电位。5.30.8 Cry3Bb.11230
不同于野生型Cry3Bb,Cry3Bb.11230形成界限分明的通道,它的开启状态长,而且其导率不随时间生长。观测到的最大的导率达到3000pS。图15图解了由Cry3Bb和Cry3Bb.11230所形成的通道的区别。5.30.9 Cry3Bb.60
Cry3Bb.60在暴露于人工膜20分钟内形成界限分明的通道。这些通道的导率和频率随着时间生长。Cry3Bb.60在平面脂双层中的行为在两方面不同于Cry3Bb。Cry3Bb.60所创造的导率形成得比Cry3Bb更为迅速,而且不同于Cry3Bb的是,这个导率是稳定的,具有稳定的离子通道典型的界限分明的开启和关闭状态(图16)。5.31 实施例31--引物组合物
                    表15
序列编号:83     核苷混合物的百分比(%)
    密码     A     T     G     C
    N     25     25     25     25
                       表16
序列编号:84     核苷混合物的百分比(%)
    密码     A     T     G     C
    N     25     25     25     25
                      表17
序列编号:85     核苷混合物的百分比(%)
    密码     A     T     G     C
    B     16     16     52     16
    D     70     10     10     10
    N     25     25     25     25
                      表18
序列编号:86     核苷混合物的百分比(%)
    密码     A     T     G     C
    E     82     6     6     6
    F     6     6     6     82
    J     6     82     6     6
    I     6     6     82     6
    N     25     25     25     25
                     表19
序列编号:88     核苷混合物的百分比(%)
    密码     A     T     G     C
    J     6     82     6     6
    E     82     6     6     6
    H     1     1     1     97
    I     6     6     82     6
    K     15     15     15     55
    R     15     55     15     15
                    表20
序列编号:90     核苷混合物的百分比(%)
    密码     A     T     G     C
    J     6     82     6     6
    F     6     6     6     82
    N     25     25     25     25
    E     82     6     6     6
    I     6     6     82     6
    L     8     1     83     8
    O     1     1     1     97
                      表21
序列编号:91     核苷混合物的百分比(%)
    密码     A     T     G     C
    J     6     82     6     6
    E     82     6     6     6
    H     1     1     1     97
    I     6     6     82     6
    N     25     25     25     25
    M     82     2     8     8
                    表22
                 序列编号:92
    核苷混合物的百分比(%)
    密码     A     T     G     C
    J     6     82     6     6
    Q     0     9     82     9
    F     6     6     6     82
    N     25     25     25     25
    E     82     6     6     6
    I     6     6     82     6
                  表23
              序列编号:92
    核苷混合物的百分比(%)
    密码     A     T     G     C
    J     6     82     6     6
    F     6     6     6     82
    N     25     25     25     25
    E     82     6     6     6
    I     6     6     82     6
                   表24
                序列编号:95
    核苷混合物的百分比(%)
    密码     A     T     G     C
    J     6     82     6     6
    E     82     6     6     6
    H     1     1     1     97
    I     6     6     82     6
    K     15     15     15     55
    R     15     55     15     15
5.32 实施例32--Cry3Bb的原子坐标
Cry3Bb蛋白的原子坐标在9.1节的附录中给出。5.33 实施例33--Cry3A的原子坐标
Cry3A蛋白的原子坐标在9.2节的附录中给出。5.34 实施例34-修饰Cry基因以便在植物中表达
已知野生型的cry基因(全长或截短的)在植物中表达很差。典型地,cry基因中的G+C含量少(37%)而且通常含有许多富含A+T的区域、潜在的多聚腺苷酰化作用位点和许多ATTTA序列。表25示出了潜在的腺苷酰化作用的序列清单,这些序列在制备“植物化”基因构建物时可以被避免。
                表25
   潜在的多聚腺苷酰化信号的序列清单
      AATAAA*            AAGCAT
      AATAAT*            ATTAAT
      AACCAA             ATACAT
      ATATAA             AAAATA
      AATCAA             ATTAAA**
      ATACTA             AATTAA**
      ATAAAA             AATACA**
      ATGAAA             CATAAA**
*表示一个潜在的主要植物多聚腺苷酰化作用位点。
**表示一个潜在的次要的动物多聚腺苷酰化作用位点。
所有其它的表示的是潜在的次要的植物多聚腺苷酰化作用位点。
突变区域可以如下进行选择。鉴定cry基因的DNA序列中的含有5个以上连续的A或T碱基对的所有区域。根据它们的长度和在多于20-30碱基对区域的周围序列中A+T百分最高含量情况排出次序。对DNA进行分析以确定那些可能含有多聚腺苷酰化作用位置或ATTTA序列的区域。然后设计一些低聚核苷酸,使其最大可能地消除含有多聚腺苷酰化作用位点或ATTTA序列的A+T连续区域。根据已发表的报道,有两个植物多聚腺苷酰化作用位点显示出具有更重要的作用。选择可以增加G+C含量、但是不产生适合那些对克隆和经过修饰的基因的组装有用的酶(如BamHI,BglII,SacI,NcoI,EcoRV等)的限制性酶切位点的密码子。类似地,避免使用含有两个碱基TA或GC的密码子,据报道它们是在植物中不频繁出现的密码子。
虽然CaMV35S启动子在大多数植物组织中通常是一个高度组成型的启动子,但是由CaMV35S启动子启动的基因表达的水平在花组织中比在叶组织中所观察到的要低。因为给一些昆虫损害的具有经济重要性的目标是花部分或来源于花部分;如cotton square和棉铃、烟草花蕾、番茄花蕾和果实,所以增加晶体蛋白在这些组织中的表达(较之于由CaMV35S启动子所获得的表达)通常是有利的。
玄参花叶病毒(FMV)的35S启动子是CaMV35S启动子的类似物。这一启动子已经被分离出来并设计在一个植物转化载体中。与CAMV启动子相比,FMV 35S启动子在花组织中高度表达,同时在其它的组织,如叶子,中也提供了类似的高水平的基因表达。可以设计一个植物转化载体,在这个载体中全部长度的cry基因由FMV 35S启动子来启动。烟草植株可以用这一载体进行转化,并用Western印迹或ELISA免疫测定法来比较晶体蛋白在叶和花组织中的表达情况。FMV启动子已经被用于在花组织中生产相对高水平的晶体蛋白(相对于CAMV启动子)。5.35 实施例35-合成的cry基因和ssRUBISCO启动子以及叶绿体转运肽的表达
植物中编码RUBISCO小亚基(SSU)的基因通常是高效表达的,它是由光调控的,有时候显示组织特异性。这些表达特性很大程度上是由这些基因的启动子序列造成的。已经可以用SSU启动子在经过转化的植物中表达异源的基因。典型地,一种植物会含有多个SSU基因,而且对于不同的SSU基因,其表达的水平和组织特异性是不同的。SSU蛋白在核中编码,在细胞质中以前体的形式合成,该前体含有一个被称为叶绿体转运肽(CTP)的N末端延伸。CTP引导前体进入叶绿体并促进SSU蛋白被摄取进入叶绿体。在这个过程中,CTP被从SSU蛋白中剪切下来。这些CTP序列已经被用于引导异源代表进入经过转化的植物的叶绿体。
SSU启动子由有许多在植物中表达异源基因的优点。有一些SSU启动子是高效表达的,其表达的水平与CAMV 35S的一样高,甚至更高。SSU启动子表达的组织分布与CAMV 35S启动子的有所不同,所以当要控制一些害虫时,可以有利地把晶体蛋白的表达指向那些SSU得到最高效表达的细胞。例如,虽然CAMV 35S启动子是相对具构成性的,但是在叶子中,它在导管组织中的表达效率比在叶子的其它部位中的都要高,而大部分SSU启动子在叶子的叶肉细胞中有最高效的表达。一些SSU启动子也是更具有组织特异性。所以可以利用一个特定的SSU启动子来仅仅在一个植物组织的子集中表达本发明中的蛋白,如果例如发现这一蛋白在某种特定的细胞中的表达对这些细胞是有害的。例如,为了控制马铃薯中的科罗拉多薯虫,有利地可以使用SSU启动子来把晶体蛋白的表达指向叶子,而不是指向可以食用的块茎。
使用SSU CTP序列把晶体蛋白定位到叶绿体中可能是有利的。把苏云金芽胞杆菌晶体蛋白定位到叶绿体可以可以保护这些叶绿体不受那些发现于细胞质中的蛋白水解酶的作用。这可以稳定蛋白并导致活性毒素的高水平聚集。Cry基因可以与SSU启动子或其它的启动子(如CAMV 35S)结合使用。5.36 实施例36-用信号肽把Cry*蛋白导向细胞外空间或液泡
此处所描述的用合成基因生产的苏云金芽胞杆菌蛋白被定位到植物细胞的细胞质中,这一细胞质定位导致植物具有杀虫效力。为了某种目的,把苏云金芽胞杆菌蛋白指向植物细胞的其它隔室是有利的。把苏云金芽胞杆菌蛋白定位于细胞质以外的其它隔室将导致苏云金芽胞杆菌蛋白更少暴露于细胞质蛋白水解酶,从而使得蛋白更多地积累,使杀虫活性增强。细胞外定位会导致某些昆虫更有效地暴露于苏云金芽胞杆菌蛋白中,从而使效力更高。如果发现苏云金芽胞杆菌蛋白对植物细胞功能有害,那么把它定位到一个非细胞质隔室就可以保护这些细胞免受这些蛋白的破坏。
在植物和其它的真核生物中,注定要定位于细胞外或几个特定的隔室中的蛋白典型地都被合成带有一个称为信号肽的N末端氨基酸区段。这一信号肽引导蛋白进入隔室化途径(compartmentalizationpathway),而且典型地在隔室化的一个早期步骤中即被从成熟的蛋白中剪切下来。对于一个细胞外蛋白而言,分泌途径典型地包括共转录插入到内质网中,此时信号肽被剪切。接着成熟的蛋白通过高尔基体进入与质膜融合在一起的小泡,从而把蛋白释放进入细胞外空间。定位到其它隔室的蛋白也遵从类似的途径。例如,定位于内质网或高尔基体的蛋白遵从这一方案,但是它们特定地保留在合适的隔室中。在植物中,有一些蛋白也定位到液泡中,液泡是存在于许多植物细胞的细胞质中的另外一个结合于膜上的隔室。定位于液泡的蛋白在高尔基体处与上述的途径分叉开来,在高尔基体,它们进入与液泡融合在一起的小泡中。
蛋白定位的一个共同的特征是启动隔室化过程的信号肽。在许多情形中,把信号肽融合到蛋白中将导致该蛋白定位到内质网。这一步骤的效率同时也将取决于成熟蛋白本身的序列。把一个蛋白引入一个特定的隔室,而不是引入细胞外空间的信号没有很清楚的定义。看起来许多引导蛋白到达特定隔室的信号是包含于成熟蛋白的氨基酸序列中的。一些定位于液泡的蛋白就是这样的,但是仍无法精确地定义这些序列。看起来分泌到细胞外空间是那些含有一个信号序列而不是区分信号的蛋白的“缺省”途径。因此,把苏云金芽胞杆菌蛋白导出细胞质的一个策略是把合成的苏云金芽胞杆菌基因融合到编码已知植物信号肽的DNA序列中。这些融合基因将产生进入分泌途径的苏云金芽胞杆菌蛋白,并导致细胞外分泌或定位到液泡或其它的隔室。
几种植物基因的信号肽已经被描述。其中的一个序列是针对烟草致病相关蛋白PR 1b,这个蛋白已经被描述(Comelissen等,1986)。PR 1b蛋白正常是定位于细胞外空间的。另外一种类型的信号肽包含于豆类的种子储存蛋白中。这些蛋白定位于种子的蛋白体中,蛋白体是一种存在于种子中的类似于液泡的隔室。刀豆(Phaseolitsvulgaris)7S储存蛋白的β亚基的一个信号肽DNA序列-PuvB-已经被描述(Doyle等,1986)。根据这些发表的序列可以用编码PR1b和PuvB的信号肽的低聚核苷酸来化学合成基因。在一些希望分泌或隔室化异源蛋白的情形中,必需包括在信号肽正常剪切位点之外的一些氨基酸序列。这是确保信号肽能被正确剪切所必需的。5.37 实施例37-用Cry3Bb变体分离Diabrotica种类抗性的转基因玉米5.37.1 植物基因构建
以双链DNA的形式存在的植物基因的表达包括信使RNA(mRNA)用RNA聚合酶从一条DNA链进行转录,以及随后mRNA的初始转录产物在核中的加工。这一加工过程包括一个3’端没有被转录的区域,它给RNA的3’端添加了多聚腺苷酸。DNA转录为mRNA是由一个通常被称为“启动子“的DNA区域调控的。启动子区域含有一个碱基序列,它给RNA聚合酶发送信号让其与DNA联合并启动mRNA转录,用其中的一条DNA链作为模板制造一条相应的RNA链。
已有文献报道了一些在植物细胞中有活性的启动子。这些启动子可以从植物或植物病毒中获得,包括但不局限于胭脂碱合酶(NOS)以及章鱼碱合酶(OCS)启动子(它们带有Agrobacteriumtumefaciens的诱导肿瘤的质粒)、花椰菜花叶病毒(CAMV)19S和35S启动子、来源于核酮糖1,5-二磷酸羟化酶小亚基((ssRUBISCO,一种丰富的植物多肽)的光诱导启动子、以及玄参花叶病毒(FMV)35S启动子。所有这些启动子已经被用于创造不同类型的DNA构建物,这些构建物已经在植物中表达(见,例如美国专利No.5,463,175,该专利被特定地作为参照结合于此文中)。
所选择的特定的启动子应是能够导致编码酶的序列充分表达以生产有效数量的蛋白。优选的一套启动子是组成型的启动子,如能够在大部分植物器官中高水平表达的CaMV 35S或FMV 35S启动子(美国专利No.5,378,619,该专利被特定地作为参照结合于此文中)。另外一套优选的启动子是根增强的或特异的启动子,如来源于CAMV的4as-1启动子或小麦POX1启动子(美国专利No.5,023,179,该专利被特定地作为参照结合于此文中;Hertig等,1991)。根增强的或特异的启动子对于控制转基因谷物中的谷物食根虫(Diabrolicus种类)是特别优选的。
在本发明的DNA构建物(即嵌合植物基因)中所使用的启动子如果需要,可以被修饰以影响它们的控制特征。例如,CaMV 35S启动子可以被连接到ssRUBISCO基因中在无光时抑制ssRUBISCO表达的那一部分上,以创造一个在叶子上有活性而在根上无活性的启动子。如此获得的嵌合体启动子可以被如此处所述进行使用。在本发明的描述中,短语“CaMV 35S”启动子因此包括CaMV 35S启动子的变体,如通过与启动子区域连接、随机或受控突变等而获得的启动子。进而,这些启动子可以被改变以含有多个“增强子序列”来协助提高基因的表达。
由本发明的DNA构建物产生的RNA也含有一个5’端非翻译引导序列。这一序列可以来源于被选择来表达基因的启动子,而且可以被特定地进行修饰以便增加mRNA的翻译。5’端非翻译区域可以得自病毒RNA、合适得真核细胞基因、或者合成的基因序列。本发明并不局限于那些非翻译区域是来源于伴随着启动子序列的5’端非翻译序列的构建物。
为了优化在单子叶植物(如玉米)中的表达,必需在DNA表达构建物中包括一个内含子。这一内含子必需典型地被设置于靠近mRNA 5’端非翻译序列中。这一内含子可以得自(但不局限于)含有玉米hps70的一套内含子(美国专利No.5,424,412;该专利被特定地作为参照结合于此文中)或稻谷Act1内含子(McElroy等,1990)。如下所示,玉米hps70内含子在本发明中是有用的。
如上所注释的,本发明的嵌合植物基因中非翻译区域含有一个多聚腺苷酰化作用信号,这个信号在植物中的功能是导致在RNA的3’端添加腺苷酸。优选的3’区的例子有:(1)含有致瘤农杆菌(Ti)的质粒基因(如胭脂碱合酶(NOS)基因)的多聚腺苷酰化作用信号的3’端转录、非翻译区域;以及(2)植物基因,如豌豆ssRUBISCO E9基因(Fischhoff等,1987)。5.37.2 植物转化和表达
含有本发明结构编码序列的嵌合植物基因可以被以合适的方法插入到植物的基因组中。合适的植物转化载体包括那些来源于Agrobacteritim lumefaciens Ti质粒的载体,以及那些由,例如Herrera-Estrella(1983)、Bevan(1983)、Klee(1985)以及欧洲专利申请出版No.EP0120516所公开的载体。除了来源于农杆菌Ti或根诱导(Ri)质粒的植物转化载体以外,可以用可选的方法把本发明的DNA构建物插入到植物细胞中。这类方法可以包括,例如使用脂质体、电穿孔、增加游离DNA摄取的化学剂、通过微粒抛射轰击游离传递DNA、以及使用病毒或花粉进行转化(Fromm等,1986;Armstrong等,1990;Fromm等,1990)。5.37.3 构建用于cry3Bb变体的单子叶植物表达载体5.37.3.1 设计用于植物表达的Cry3Bb基因变体
为了有效地在转基因植物中表达cry3Bb变体,那些编码变体的基因必需含有合适的序列组合物(Diehn等,1996)。这类序列的一个例子是v11231基因(序列编号:99),它编码具有Diabrotica活性的Cry3Bb 11231变体蛋白(序列编号:100)。这一基因是通过cry3Bb合成基因(序列编号:101)的突变(Kunkel,1985)获得的,上述的cry3Bb合成基因所编码的蛋白与天然cry3Bb基因(GenBank访问号码m89794,序列编号:102)所编码的蛋白是同源的。下列的多聚核苷酸被用于突变初始的cry3Bb合成基因(序列编号:101)以创造v11231基因((序列编号:99)。低聚#1:
5’-TAGGCCTCCATCCATGGCAAACCCTAACAATC-3’(序列编号:103)低聚#2:
5’-TCCCATCTTCCTACTTACGACCCTGCAGAAATACGGTCCAAC-3’(序列编号:104)低聚#3:
5’-GACCTCACCTACCAAACATTCGATCTTG-3’(序列编号:105)低聚#4:
5’-CGAGTTCTACCGTAGGCAGCTCAAG-3’(序列编号:106)5.37.3.2 构建Cry3Bb单子叶植物表达载体
为了把cry3Bb变体基因v11231放置在一个适合在单子叶植物中表达的载体中(即接受经过增强的花椰菜花叶病毒35S启动子的控制并连接到hsp70内含子上,再接一个胭脂碱合成酶多聚腺苷酰化作用位点,如美国专利No.5,424,412中所述,该专利被特定地作为参照结合于此文中),用NcoI和EcoRI酶解载体pMON19469。电泳分离、纯化大约为4.6kb的的较大的载体条带并把它用T4 DNA合成酶连接到含有v11231基因(序列编号:99)的大约为2kb的NcoI-EcoRI片段上。把连接混合物转化到大肠杆菌中,回收具有羧苄青霉素抗性的菌落并用DNA miniprep步骤回收质粒DNA。用例如NcoI和EcoRI(同时)、NotI、以及PstI对这一DNA进行限制性内切酶分析以鉴定含有pMON33708的菌落,pMON33708是通过v11231编码序列在经过增强的CaMV35S启动子的控制下融合到hsp70内含子中获得的。
为了把v11231设置在一个适于回收经过稳定转化的抗虫植物的载体中,通过电泳和纯化把来源于pMON33708的含有赖氨酸氧化酶编码序列(后者在经过增强的CaMV35S启动子的控制下融合到hsp70内含子中)分离出来。把这一片段连接到经过NotI以及小牛肠碱性磷酸酶处理的pMON30460中,其中pMON30460含有受控于CAMV 35S启动子的新霉素磷酸转移酶编码基因。通过把这一转化混合物转化到大肠杆菌中来获得卡那霉素抗性菌落,通过对质粒miniprep DNA进行限制性内切酶酶解来鉴定含有pMON33710的菌落。可以用限制性内切酶,如NotI、EcoRV、HindIII、ArcoI、EcoRI、以及BglII来鉴定在pMON30460的NotI位点含有pMON33708的NotI片段的合适的菌落(即PMON33710),其取向是使得两个基因是前后相连的(即v11231表达盒的3’端连接到nptII表达盒的5’端)。在谷物原生质体中pMON33710对v11231蛋白的表达可以通过以电穿孔的方法把pMON33710 DNA导入原生质体中然后再进行蛋白印迹和ELISA分析来得以验证。这一载体可以通过基因枪轰击导入谷物胚胎的基因组DNA中,然后再通过巴龙霉素选择来获得表达v11231基因的谷物,如美国专利No.5,424,412所述,该专利被特定地作为参照结合于此文中)。
在一个实施例中,通过共同轰击把载体和潮霉素抗性赋予质粒一起引入玉米未成熟的胚胎角质鳞片(immature embryo scutella,IES)中,然后用潮霉素进行选择和再生。用ELISA分析来鉴定表达v11231蛋白的转基因玉米株系。随后测试这些事件所获得的子代种子抵抗Diabrotica喂食的效果。5.37.3.3 Cry3Bb.11231在植物中的表现
在幼苗和10英尺盆鉴定法同时测验表达Cry3Bb.11231蛋白的经过转化的谷物植株抵抗西部谷物食根虫(WCR)幼虫的能力。经过转化的基因型是A634,其中对R0和A634杂交的子代进行了评估。观察包括对幼虫发育(体重)的影响、根损伤速率(RDR)、以及蛋白的表达。含有cry3Bb基因的转化载体是pMON33710。处理包括积极和消极的同种群(isopopulation)处理以及A634检查。
幼苗的鉴定法包括以下步骤:(i)在含有盆土的1盎司的杯子中放置单个的种子;(ii)抽穗(spiking)时,每株幼苗用4只幼虫进行侵袭;以及(iii)在侵袭之后,幼苗在25℃、50%湿度以及14∶10(L∶D)的条件下保温7天。在保温的时间内,给盆土添加足够的水分以维持幼苗的活力。
10英尺鉴定法包括以下步骤:(i)把单个的种子放置在含有盆土的10英尺盆中;(ii)在栽种14天后,每一盆用800个虫卵进行侵袭,其中虫卵已经预先进行温育以便在侵袭后第5天能够孵化;以及(iii)在侵袭之后,在与幼苗鉴定法一样的条件下把植物保温4天。每天从盆顶和盆面给盆浇水。
在幼苗鉴定法中,在第7天计算根的损伤速率并称量存活的幼虫的重量。与此同时,用ELISA确定根部Cry3Bb蛋白的浓度。在幼苗鉴定法中用于评估根损伤的衡量如下:RDR(根损伤速率)0=没有可见的摄食;RDR 1=很轻的摄食;RDR 2=轻的摄食;RDR 3=中等摄食;RDR 4=严重摄食;RDR 5=非常严重的摄食。
表26示出了幼苗鉴定法的结果。表达Cry3Bb蛋白的植物可以完全地杜绝WCR的摄食,其中存活的幼虫在处理期间并没有生长。没有表达的处理中,平均幼虫的重量介于2.03-2.73mg之间,而表达cry3Bb的处理中存活的幼虫的平均重量为0.11mg。没有表达和有表达的同种群的根损伤速率分别为3.86和0.33。在消极的、对照性的处理中幼虫的存活率介于75-85%之间,而在Cry3Bb处理中幼虫只有25%存活。
                    表26
在一个幼苗化验中,表达Cry3Bb的植物对WCR幼虫的影响
         Plants               Larvae事件   处理  N   根      RDR+/-      存  活  重量(mg)平均
                              N
            (ppm)       SD       率(%)  值+/-标准偏
                                         差16     阴性  7   0.0     3.86+/   21   75    2.73+/-1.67
                     -0.6516     阳性  3   29.01  0.33+/    3    25    0.11+/-0.07
                     -0.45A634   核对  4   0.0      --      13   81    2.03+/-0.83
对于10英尺盆鉴定法,在昆虫侵袭的4周之后记录植物的高度并计算根损伤的速率(Iowa 1-6 scale;Hills和Peters,1971)。
10英尺盆鉴定法的结果示于表27中。表达Cry3Bb蛋白的的植物的喂食损伤显著减少,并且比没有表达的植物更高。在事件16中,两个表达事件的较高者几乎称为完全的对照。消极的处理导致根的损伤速率很高,表明受昆虫的侵害很严重。积极处理的平均根损伤速率在事件6和16中分别为3.4和2.2.消极处理的平均根损伤速率相应地为5.0和5.6。表27在一个10英寸盆的化验中,表达Cry3Bb的玉米对控制WCR幼虫进食的影响事件   治疗  N   Root   RDR+/-平均偏差  植物高度(cm)
             (ppm)6      阴性  7    0.0     5.0+/-1.41     49.7+/-18.726      阳性  5    7.0     3.4+/-1.14     73.9+/-8.6716     阴性  5    0.0     5.6+/-0.89     61.2+/-7.7516     阳性  5    55.0    2.2+/-0.84     83.8+/-7.15
总之,从幼苗化验可以看出,表达Cry3Bb蛋白的谷物对WCR幼虫的发育具有显著的生物学影响。当面对厉害的昆虫群袭时,表达Cry3Bb蛋白的植物不受WCR幼虫喂食的损害,如10英尺盆化验所示。6.0 序列编号的简要描述
序列编号:1cry3Bb.11221基因的DNA序列。
序列编号:2Cry3Bb.11221多肽的氨基酸序列。
序列编号:3cry3Bb.11222基因的DNA序列。
序列编号:4Cry3Bb.11222多肽的氨基酸序列。
序列编号:5cry3Bb.11223基因的DNA序列。
序列编号:6Cry3Bb.11223多肽的氨基酸序列。
序列编号:7cry3Bb.11224基因的DNA序列。
序列编号:8Cry3Bb.11224多肽的氨基酸序列。
序列编号:9cry3Bb.11225基因的DNA序列。
序列编号:10Cry3Bb.11225多肽的氨基酸序列。
序列编号:11cry3Bb.11226基因的DNA序列。
序列编号:12Cry3Bb.11226多肽的氨基酸序列。
序列编号:13cry3Bb.11227基因的DNA序列。
序列编号:14Cry3Bb.11227多肽的氨基酸序列。
序列编号:15cry3Bb.11228基因的DNA序列。
序列编号:16Cry3Bb.11228多肽的氨基酸序列。
序列编号:17cry3Bb.11229基因的DNA序列。
序列编号:18Cry3Bb.11229多肽的氨基酸序列。
序列编号:19cry3Bb.11230基因的DNA序列。
序列编号:20Cry3Bb.11230多肽的氨基酸序列。
序列编号:21cry3Bb.11231基因的DNA序列。
序列编号:22Cry3Bb.11231多肽的氨基酸序列。
序列编号:23cry3Bb.11232基因的DNA序列。
序列编号:24Cry3Bb.11232多肽的氨基酸序列。
序列编号:25cry3Bb.11233基因的DNA序列。
序列编号:26Cry3Bb.11233多肽的氨基酸序列。
序列编号:27cry3Bb.11234基因的DNA序列。
序列编号:28Cry3Bb.11234多肽的氨基酸序列。
序列编号:29cry3Bb.11235基因的DNA序列。
序列编号:30Cry3Bb.11235多肽的氨基酸序列。
序列编号:31cry3Bb.11236基因的DNA序列。
序列编号:32Cry3Bb.11236多肽的氨基酸序列。
序列编号:33cry3Bb.11237基因的DNA序列。
序列编号:34Cry3Bb.11237多肽的氨基酸序列。
序列编号:35cry3Bb.11238基因的DNA序列。
序列编号:36Cry3Bb.11238多肽的氨基酸序列。
序列编号:37cry3Bb.11239基因的DNA序列。
序列编号:38Cry3Bb.11239多肽的氨基酸序列。
序列编号:39cry3Bb.11241基因的DNA序列。
序列编号:40Cry3Bb.11241多肽的氨基酸序列。
序列编号:41cry3Bb.11242基因的DNA序列。
序列编号:42Cry3Bb.11242多肽的氨基酸序列。
序列编号:43cry3Bb.11032基因的DNA序列。
序列编号:44Cry3Bb.11032多肽的氨基酸序列。
序列编号:45cry3Bb.11035基因的DNA序列。
序列编号:46Cry3Bb.11035多肽的氨基酸序列。
序列编号:47cry3Bb.11036基因的DNA序列。
序列编号:48Cry3Bb.11036多肽的氨基酸序列。
序列编号:49cry3Bb.11046基因的DNA序列。
序列编号:50Cry3Bb.11046多肽的氨基酸序列。
序列编号:51cry3Bb.11048基因的DNA序列。
序列编号:52Cry3Bb.11048多肽的氨基酸序列。
序列编号:53cry3Bb.11051基因的DNA序列。
序列编号:54Cry3Bb.11051多肽的氨基酸序列。
序列编号:55cry3Bb.11057基因的DNA序列。
序列编号:56Cry3Bb.11057多肽的氨基酸序列。
序列编号:57cry3Bb.11058基因的DNA序列。
序列编号:58Cry3Bb.11058多肽的氨基酸序列。
序列编号:59cry3Bb.11081基因的DNA序列。
序列编号:60Cry3Bb.11081多肽的氨基酸序列。
序列编号:61cry3Bb.11082基因的DNA序列。
序列编号:62Cry3Bb.11082多肽的氨基酸序列。
序列编号:63cry3Bb.11083基因的DNA序列。
序列编号:64Cry3Bb.11083多肽的氨基酸序列。
序列编号:65cry3Bb.11084基因的DNA序列。
序列编号:66Cry3Bb.11084多肽的氨基酸序列。
序列编号:67cry3Bb.11095基因的DNA序列。
序列编号:68Cry3Bb.11095多肽的氨基酸序列。
序列编号:69cry3Bb.60基因的DNA序列。
序列编号:70Cry3Bb.60多肽的氨基酸序列。
序列编号:71引物FW001
序列编号:72引物FW006
序列编号:73引物MVT095
序列编号:74引物MVT097
序列编号:75引物MVT091
序列编号:76引物MVT075
序列编号:77引物MVT076
序列编号:78引物MVT111
序列编号:79引物MVT094
序列编号:80引物MVT103
序列编号:81引物MVT081
序列编号:82引物MVT085
序列编号:83引物A
序列编号:84引物B
序列编号:85引物C
序列编号:86引物D
序列编号:87引物E
序列编号:88引物F
序列编号:89引物G
序列编号:90引物WD112
序列编号:91引物WD115
序列编号:92引物MVT105
序列编号:93引物MVT092
序列编号:94引物MVT070
序列编号:95引物MVT083
序列编号:96Cry3Bb.多肽的N端氨基酸序列。
序列编号:97野生型cry3Bb.基因的DNA序列。
序列编号:98野生型Cry3Bb.多肽的氨基酸序列。
序列编号:99cry3Bb.11231基因的植物化DNA序列。
序列编号:100植物化Cry3Bb.11231多肽的氨基酸序列。
序列编号:101用于制备序列编号:99的cry3Bb.基因的DNA序列。
序列编号:102野生型Cry3Bb.基因的氨基酸序列,Genbank第#M89794.
序列编号:103低聚物#1的DNA序列。
序列编号:104低聚物#2的DNA序列。
序列编号:105低聚物#3的DNA序列。
序列编号:106低聚物#4的DNA序列。
序列编号:107cry3Bb.11098基因的DNA序列。
序列编号:108Cry3Bb.11098多肽的氨基酸序列。7.0参考文献
以下参考文献提供了对本发明中所描述的进行补充的示范性的程序或其它的细节。把它们作为参照结合于本发明中。
美国专利4,237,224,出版日期:12/02/1980.
美国专利4,332,898,出版日期:6/01/1982.
美国专利4,342,832,出版日期:8/03/1982.
美国专利4,356,270,出版日期:10/26/1982.
美国专利4,362,817,出版日期:12/07/1982.
美国专利4,371,625,出版日期:2/01/1983.
美国专利4,448,885,出版日期:5/15/1984.
美国专利4,467,036,出版日期:8/21/1984.
美国专利4,554,101,出版日期:11/19/1985.
美国专利4,683,195,出版日期:7/28/1987.
美国专利4,683,202,出版日期:7/28/1987.
美国专利4,757,011,出版日期:7/12/1988.
美国专利4,766,203,出版日期:8/23/1988.
美国专利4,769,061,出版日期:9/06/1988.
美国专利4,797,279,出版日期:1/10/1989.
美国专利4,800,159,出版日期:1/24/1989.
美国专利4,883,750,出版日期:11/28/1989.
美国专利4,910,016,出版日期:3/20/1990
美国专利4,940,835,出版日期:2/23/1990.
美国专利4,965,188,出版日期:10/23/1990.
美国专利4,971,908,出版日期:11/20/1990.
美国专利4,987,071,出版日期:1/22/1991.
美国专利5,380,831,出版日期:1/10/1995.
美国专利5,023,179,出版日期:6/11/1991.
美国专利5,024,837,出版日期:6/18/1991.
美国专利5,126,133,出版日期:6/30/1992.
美国专利5,176,995,出版日期:10/15/1991,
美国专利5,187,091,出版日期:XXXXX,1993.
美国专利5,322,687,出版日期:7/21/1994.
美国专利5,334,711,出版日期:8/02/1994.
美国专利5,378,619,出版日期:1/3/1995.
美国专利5,424,412,出版日期:6/13/1995.
美国专利5,441,884,出版日期:8/15/1995.
美国专利5,463,175,出版日期:10/01/1995.
美国专利5,500,365,出版日期:3/19/1996.
美国专利5,591,616,出版日期:1/07/1997.
美国专利  5,631,359,出版日期:5/20/1997.
美国专利  5,659,123,出版日期:8/19/1997.
欧洲专利  No.EP 0120516.
欧洲专利  No.EP 0360257.
欧洲专利申请  No.92110298.4.
欧洲专利申请  No.295156AI.
英国专利  2202328.
国际专利申请出版  No.WO 91/03162.
国际专利申请出版  No.WO 92/07065.
国际专利申请出版  No.WO 93/15187.
国际专利申请出版  No.WO 93/23569.
国际专利申请出版  No.WO 94/02595.
国际专利申请出版  No.WO 94/13688.
国际专利申请出版  No.PCT/US87/00880.
国际专利申请出版  No.PCT/US89/01025.
国际专利申请出版  No.WO 88/09812.
国际专利申请出版  No.WO 88/10315.
国际专利申请出版  No.WO 89/06700.
国际专利申请出版  No.WO 93/07278.Abbott,″A method for computing the effectiveness of an insecticide,″J. Econ. Ento-
    mol.,18:265-267,1925.Abdullah et al.,Biotechnology,4:1087,1986.Almond and Dean,Biochemistry,32:1040-1046,1993.An et al.,EMBO J.,4:277-287,1985.Angsuthanasamnbat et al.,FEMS Microbiol. Lett.,111:255-262,1993.Armstrong et al.,Plant Cell Rep.,9:335-339,1990.Aronson,Wu,Zhang,“Mutagenesis of specificity and toxicity regions of a Bacillus
 thuringiensis protoxin gene.” J. Bacteriol.,177:4059-4065,1995.Bagdasarian et al.,Gene,16:237,1981.Baum et al.,Appl.Environ. Microbiol.,56:3420-3428,1990.Baum,″Tn5401,a new class II transposable element from Bacillus thuringiensis,″J.
   Bacteriol.,176:2835-2845,1994.Baum,J.Bacteriol.,177:4036-4042,1995.Baum,Kakefuda,Gawron-Burke,″Engineering Bacillus thuringiensis Bioinsecticides
  with an Indigenous Site-Specific Recombination System,″Appl.Environ.Mi-
  crobiol..62:XXX-XXX,1996.Benbrook et al,In:Proceedings Bio Expo 1986,Butterworth,Stoneham,MA,pp.27-
   54,1986.Bevan et al.,Nature,304:184,1983.Bolivar et al.,Gene,2:95,1977.Branden and Tooze,″Introduction to Protein Structure,″Garland Publishing,Inc.
  ,New York,NY,1991.Brussock and Currier,″Use of sodium dodeeyl sulfate-polacryamide gel electropho-
   resis to quantify Bacillus thuringiensisδ-endotoxins,″In:“Analytical Chemis-
   try of Bacillus thuringiensis,” L.A. Hickle and W.L. Fitch,(Eds),American
   Chemical Society,Washington D.C.,pp.78-87,1990.Capecchi,″High efficiency transformation by direct microinjection of DNA into cul-
  tured mammalian cells,″Cell.22(2):479-488,1980.Caramori,Albertini,Galizzi,″In vivo generation of hybrids between two Bacillus
  thuringiensis insect-toxin-encoding genes,″Gene,98:37-44,1991.Cashmore et al.,Gen.Eng.of Planls,Plenum Press,New York,29-38,1983.Chambers et al.,Appl.Environ. Microbiol.,173:3966-3976,1991.Chau et al.,Science,244:174-181,1989.Chen et al.,Nucl.Acids Res,20:4581-9,1992.Chen,Curtiss,Alcantara,Dean,″Mutations in domain I of Bacillus thuringiensis δ-
   endotoxin CryIAb reduce the irreversible binding of toxin to Manduca sexta
   brush border membrane vesicles,″J.Biol.Chem.,270:6412-6419,1995.Chen,Lee,Dean,″Site-directed mutations in a highly conserved region of Bacilhus
  thuringiensis δ-endotoxin affect inhibition of short circuit current across Bom-
  byx mori midguts,″Proc.Natl.Acad Sci.USA,90:9041-9045,1993.Chowrira and Burke,Nucl.Acids Res.,20:2835-2840,1992.Clapp,″Somatic gene therapy into hematopoietic cells.Current status and future im-
  plications,″Clin.Perinatol.,20(1):155-168,1993.Cody,Luft,Jensen,Pangborn English,″Purification and crystallization of insecticidal
  δ-endotoxin CryIIIB2 from Bacillus thuringiensis,″Proteins:Struct.Funct.
  Genet.,14:324,1992.Collins and Olive,Biochem.,32:2795-2799,1993.Conway and Wickens,In:RNA Processing.p.40,Cold Spring Harbor Laboratory,
  Cold Spring Harbor,NY,1988.Cornelissen et al.,″A tobacco mosaic virus-induced tobacco protein is homologous to
  the sweet-tasting protein thaumatin,″Nature,321(6069):531-532,1986.Cramer,Cohen,Merrill,Song,″Structure and dynamics of the colicin E1 channel,″
  Molec.Microbiol.,4:519-526,1990.CRC Handbook of Chemistry and Physics,58th edition,CRC Press,Inc..Cleveland,
  Ohio,p-C769,1977.Cristou et al,Plant Physiol,87:671-674,1988.Curiel,Agarwal,Wagner,Cotten,″Adenovirus enhancement of transferrin-
  polylysine-mediated gene delivery,″Proc.Natl.Acad.Sci.USA,88(19):8850-
  8854,1991.Curiel,Wagner,Cotten,Birnstiel,Agarwal,Li,Loechel,Hu,″High-efficiency gene
  transfer mediated by adenovirus coupled to DNA-polylysine complexes,″
  Hum.Gen.Ther.,3(2):147-154,1992.Daum,″Revision of two computer programs for probit analysis,″Bull. Entomol.Soc.
  Amer.,16:10-15,1970.De Maagd,Kwa,van der Klei,Yamamoto,Schipper,Vlak,Stiekema,Bosch,
  ″Domain III substitution in Bacillus thuringiensis delta-endotoxin CryIA(b)
  results in superior toxicity for Spodoptera exigua and altered membrane pro-
  tein recognition,″Appl.Environ.Microbiol.,62:1537-1543,1996.Dean et al.,Nucl. Acids Res.,14(5):2229,1986.Dhir et al.,Plant Cell Reports,10:97,1991.Diehn et al.,Genet.Engineer.,18:83-99,1996.Donovan,Dankocsik,Gilbert,Groat,Gawron-Burke,Carlton,″The P2 protein of
  Bacillus thuringiensis var. kurstaki:nucleotide sequence and entomocidal ac-
  tivity,″J.Biol.Chem.,263:561-567,1988.Doyle et al.,J.Biol.Chem.,261(20):9228-9236,1986.Dropulic et al.,J.Virol.,66:1432-41,1992.Dunitz,″The entropic cost of bound water in crystals and biomolecules,″Science,
  264:670-68x,1994.Earp and Ellar,Nucl.Acids Res.,15:3619,1987.Eglitis and Anderson,″Retroviral vectors for introduction of genes into mammalian
  cells,″Biotechniques,6(7):608-614,1988.Eglitis,Kantoff,Kohn,Karson,Moen,Lothrop.Blaese,Anderson,″Retroviral-
  mediated gene transfer into hemopoietic cells,″Adv.Exp.Med.Biol.,241:19-
  27,1988.Elroy-Stein and Moss,Proc.Natl.Acad.Sci.USA.87:6743-7,1990.English and Slatin,Insect Biochem.Mol.Biol.,22:1-7,1992.English,Readdy,Bastian,″Delta-endotoxin-induced leakage of 86Rb+-K+ and H2O
   from phospholipid vesicles is catalyzed by reconstituted midgut membrane,″
   Insect Biochem.,21:177-184,1991.Fischhoff et al.,Bio/Technology,5:807-813,1987.Fraley et al.,Bio/Technology,3:629-635,1985.Fraley et al.,Proc.Natl.Acad.Sci.USA,80:4803,1983.Frohman,PCRTM Protocols,a Guide to Methods and Applications XVIII Ed.,Aca-
   demic Press,New York,1990.Fromm et al.,Bio/Technology,8:833-839,1990.Fromm et al.,Nature,319:791-793,1986.Fromm,Taylor,Walbot,″Expression of genes transferred into monocot and dicot
   plant cells by electroporation,″Proc.Natl.Acad.Sci.USA,82(17):5824-5828,
   1985.Fujimura et al.,Plant Tissue Cult. Lett.,2:74,1985.Fynan,Webster,Fuller,Haynes,Santoro,Robinson,″DNA vaccines:protective im-
   munizations by parenteral,mucosal,and gene gun inoculations,″Proc.Natl.
   Acad.Sci.USA,90(24):11478-11482,1993.Galitsky,Cody,Wojtczak,Ghosh,Luft,Pangborn,Wawrzak,English,″Crystal and
   Molecular Structure of the Insecticidal Bacterial δ-Endotoxin CryIIIB2 of
   Bacillus thuringiensis,″Research Communication to Ecogen Inc.,Langhome,
   PA,1993.Gao and Huang,Nucl.Acids Res.,21:2867-72,1993.Gazit and Shai,″Structural and Functional Characterization of the α-5 segment of
   Bacillus thuringiensis δ-endotoxin,″Biochemistry.32:3429-3436,1993.Gazit and Shai,″The assembly and organization of the α5 and α7 helices from the
   pore-forming domain of Bacillus thuringiensis δ-endotoxin,″J.Biol.Chem.,
   270:2571-2578,1995.Ge,Rivers,Milne,Dean,″Functional domains of Bacilhus thuringiensis insecticidal
   crystal proteins:refinement of Heliothis virescens and Trichoplusia ni speci-
   ficity domains on CryIA(c),″J.Biol.Chem,266:17954-17958.1991.Genovese and Milcarek,In.RNA Processing,p.62,Cold Spring Harbor Laboratory.
  Cold Spring Harbor,NY,1988.Gil and Proudfoot,Nature,312:473,1984.Gonzalez Jr.et al.,Proc.Natl.Acad.Sci USA,79:6951-6955,1982.Graham and van der Eb,″Transformation of rat cells by DNA of human adenovirus
  5,″Virology,54(2):536-539,1973.Grochulski,Masson,Borisova,Pusztai-Carey,Schwartz,Brousseau,Cygler,″Bacillus
  thuringiensis CryIA(a) insecticidal toxin:crystal structure and channel forma-
  tion,″J.Mol.Biol.,254:447-464,1995.Guerrier-Takada et al.,Cell,35:849,1983.Hampel and Tritz,Biochem.,28:4929,1989.Hampel et al.,Nucl.Acids Res.,18:299,1990.Harlow and Lane,″Antibodies:A Laboratory Manual,″Cold Spring Harbor Labora-
  tory,Cold Spring Harbor,NY,1988.Herrera-Estrella et al.,Nature,303:209,1983.Hertel et al.,Nucl.Acids Res.,20:3252,1992.Hertig et al.,Plant Mol.Biol.,16:171-174,1991.Hess,Intern Rev.Cytol.,107:367,1987.Hills and Peters,J.Econ.Entomol.,64:764-765,1971.Hockema,In:The Binary Plant Vector System,Offset-durkkerij,Kanters B.V.,Al-
  blasserdam,Chapter 5.H_fte and Whitely,Microbiol.Rev.,53:242-255,1989.Holland et al.,Biochemistry,17:4900,1978.Holsters et al,Mol.Gen.Genet.,163:181-187,1978.Honee,van der Salm,Visser,Nucl.Acids Res.,16:6240,1988.Horsch et al.,Science,227:1229-1231,1985.Humason,In:Animal Tissue Techniques,W.H.Freeman and Company,1967.Jaeger et al.,Proc.Natl.Acad.Sci.USA,86:7706-7710,1989.Johnston and Tang,″Gene gun transfection of animal cells and genetic immuniza-
  tion,″Methods Cell.Biol.,43(A):353-365,1994.Jorgensen et al.,Mol.Gen.Genet.,207:471,1987.Kaiser and Kezdy,Science,223:249-255,1984.Kashani-Saber et al.,Antisense Res.Dev.,2:3-15,1992.Keller et al.,EMBO J,8:1309-14,1989.Klee et al.,Bio/Technology,3:637-642,1985.Klein et al.,Nature,327:70,1987.Klein et al.,Proc Natl.Acad Sci.USA,85:8502-8505,1988.Kozak,Nature,308:241-246,1984.Krieg et al.,Anzeiger fur Schadlingskunde Pflanzenschutz Umweltschutz,57:145-150,
   1984.Krieg et al.,Z.ang Ent.,96:500-508,1983.Kuby,Immunology 2nd Edition,W.H.Freeman & Company,NY,1994Kunkle,″Rapid and efficient site-specific mutagenesis without phenotypic selection.″
   Proc.Natl.Acad.Sci.USA,82:488-492,1985.Kunkle,Roberts,Zabour,Methods Enzymol.,154:367-382,1987.Kwak,Lu,Dean,″Exploration of receptor binding of Bacillus thuringiensis toxins,″
   Mem.Inst.Oswaldo,90:75-79,1995.Kwoh et al.,Proc.Natl.Acad.Sci.USA,86(4):1173-1177,1989.Kyte and Doolittle,J.Mol.Biol.,157:105-132,1982.L′Huillier et al.,EMBO J,11:4411-8,1992.LaBean and Kauffman,″Design of synthetic gene libraries encoding random sequence
   proteins with desired ensemble characteristics,″Prot. Sci.,2:1249-1254,1993.Lambert,Buysse,Decock,Jansens,Piens,Saey,Seurinck,Van Audenhove,Van Rie,
   Van Vliet,Peferoen,″A Bacillus thuringiensis insecticidal crystal protein with
   a high activity against members of the family Noctuidae,″Appl.Environ.Mi-
   crobiol.,62:80-86,1996.Lee,Milne,Ge,Dean,″Location of a Bombyx mori receptor binding region on a Ba-
   cillus thuringiensis δ-endotoxin,″J.Biol.Chem.,267:3115-3121,1992.Lee,Young,Dean,″Domain III exchanges of Bacillus thuringiersis CrylA toxins af-
   fect binding to different gypsy moth midgut receptors,″Biochem.Biophys.
   Res.Commun.,216:306-312,1995.Li,Carroll,Ellar,″Crystal structure of insecticidal δ-endotoxin from Bacillus
  thuringiensis at 2.5_ resolution,″Nature (London),353:815-821,1991.Lieber et al.,Methods Enzymol.,217:47-66,1993.Lindstrom et al.,Developmental Genetics,11:160,1990.Lisziewicz et al.,Proc.Natl.Acad.Sci.U.S.A.,90:8000-4,1993.Lorz et al.,Mol.Gen.Genet.,199:178,1985.Lu,Rajamohan,Dean,″Identification of amino acid residues of Bacillus thuringiensis
  δ-endotoxin CryIAa associated with membrane binding and toxicity to Bom-
   byx mori,″J.Bacteriol.,176:5554-5559,1994.Lu,Xiao,Clapp,Li,Broxmeyer,″High efficiency retroviral mediated gene transduc-
   tion into single isolated immature and replatable CD34(3+) hematopoietic
   stem/progenitor cells from human umbilical cord blood,″J.Exp.Med.,
   178(6):2089-2096,1993.Macaluso and Mettus,J.Bacteriol.,173:1353-1356,1991.Maddock et al.,Third International Congress of Plant Molecular Biology,Abstract
   372,1991.Maloy et al.,″Microbial Genetics″2nd Edition.Jones and Bartlett Publishers,Boston,
   MA,1994.Maloy,″Experimental Techniques in Bacterial Genetics″Jones and Bartlett Publish-
   ers,Boston,MA,1990.Maniatis,Fritsch,Sambrook,In:Molecular Cloning:A Laboratory Manual,Cold
   Spring Harbor Laboratory,Cold Spring Harbor,NY,1982.Marcotte et al.,Nature,335:454,1988.McDevitt et al.,Cell,37:993-999,1984.McElroy et al.,Plant Cell,2:163-171,1990.Mettus and Macaluso,Appl.Environ.Microbiol.,56:1128-1134,1990.Michael,″Mutagenesis by Incorporation of a Phosphorylated Oligo During PCRTM
   Amplification,″BioTechniques,16(3):410-412,1994.Neuhaus et al.,Theor.Appl.Genet.,75:30,1987.Odell et al.,Nature,313:810,1985.Ohara et al,Proc.Natl.Acad.Sci.USA,86(15):5673-5677,1989.Ohkawa et al.,Nucl.Acids Symp.Ser.,27:15-6,1992.Ojwang et al.,Proc.Natl.Acad.Sci.USA,89:10802-6,1992.Olson et al.,J.Bacteriol.,150:6069,1982.Omirulleh et al.,Plant Molecular Biology,21:415-428.1993.Pandey and Marzluff,In″RNA Processing,″p.133,Cold Spring Harbor Laboratory,
   Cold Spring Harbor,NY,1987.Pena et al.,Nature,325:274,1987.Perrault et al,Nature,344:565,1990.Perrotta and Been,Biochem.,31:16,1992.Pieken et al.,Science,253:314,1991.Poszkowski el al.,EMBO J.,3:2719,1989.Potrykus et al.,Mol.Gen.Genet.,199:183,1985.Poulsen et al.,Mol.Gen.Genet.,205:193-200,1986.Prokop and Bajpai,″Recombinant DNA Technology I,″Ann.N.Y.Acad.Sci.,
  646:xxx-xxx,1991.Rajamohan,Alcantara,Lee,Chen,Curtiss,Dean,″Single amino acid changes in do-
  main II of Bacillus thuringiensis CryIAb δ-endotoxin affect irreversible bind-
  ing to Manduca sexta midgut membrane vesicles,″J.Bacteriol.,177:2276-
  2282,1995.Rajamohan,Cotrill,Gould,Dean,″Role of domain II,loop 2 residues of Bacillus
  thuringiensis CryIAb δ-endotoxin in reversible and irreversible binding to
  Manduca sexta and Heliothis virescens,”J.Biol.Chem.,271:2390-2397,
  1996.Rogers et al.,In:Methods For Plant Molecular Biology,A.Weissbach and H.Weiss-
  bach,eds.,Academic Press Inc.,San Diego,CA 1988.Rogers et al.,Methods Enzymol.,153:253-277,1987.Rossi et al.,Aids Res.Hum.Retrovir.,8:183,1992.Sadofsky and Alwine,Molec.Cell.Biol.,4(8):1460-1468,1984.Sambrook et al.,“Molecular Cloning:A Laboratory Manual,”Cold Spring Harbor
  Laboratory,Cold Spring Harbor,NY,1989.Sanchis,Lereclus,Menou,Chaufaux,Guo,Lecadet,Mol.Microbiol.,3:229-238,
   1989.Sanchis,Lereclus,Menou,Chaufaux,Lecadet,Mol.Microbiol..2:393-404,1988.Sarver et al.,Science,247:1222-1225,1990.Saville and Collins,Cell,61:685-696,1990.Saville and Collins,Proc. Natl.Acad.Sci.USA,88:8826-8830,1991.Scanlon et al.,Proc.Natl.Acad.Sci.USA,88:10591-5,1991.Scaringe et al.,Nucl.Acids Res.,18:5433-5441,1990.Schnepf and Whitely,Proc.Natl.Acad Sci.USA,78:2893-2897,1981.Schnepf et al.,J.Biol.Chem.,260:6264-6272,1985.Segal,″Biochemical Calculations″2nd Edition,John Wiley & Sons,New York,1976.Shaw and Kamen,Cell,46:659-667,1986.Shaw and Kamen,In.“RNA Processing”,p.220,Cold Spring Harbor Laboratory,
  Cold Spring Harbor,NY,1987.Simpson,Science,233:34,1986.Slaney,Robbins,English,″Mode of action of Bacillus thuringiensis toxin CryIIIA:
  An analysis of toxicity in Leptinotarsa decemlineata (Say) and Diabrotica un-
  decimpunctata howardi Barber,″Insect Biochem.Molec.Biol.,22:9-18,1992.Slatin,Abrams,English,″Delta-endotoxins form cation-selectivc channels in planar
  lipid bilayers,″Biochem.Biophys.Res.Comm.,169(2):765-772,1990.Smedley and Ellar,″Mutagenesis of three surface-exposed loops of a Bacillus
  thuringiensis insecticidal toxin reveals residues important for toxicity,receptor
  recognition and possibly membrane insertion,″Microbiology,142:1617-1624,
  1996.Smith and Ellar,″Mutagenesis of two surface-exposed loops of the Bacillus
  thuringiensis CrylC δ-endotoxin affects insecticidal specificity,″Biochem.J.,
  302:611-616,1994.Smith,Merrick,Bone,Ellar,Appl.Environ Microbiol.,62:680-684,1996.Spielmann et al.,Mol.Gen.Genet.,205:34,1986.Stemmer and Morris,″Enzymatic Inverse PCRTM:A Restriction Site Independent,
  SingIe-Fragment Method for High-Efficiency,Site-Directed Mutagenesis,″
  BioTechniques,13(2):214-220,1992.Stemmer,Proc.Natl.Acad.Sci.USA,91:10747-1075,1994.Taira et al.,Nucl.Acids Res.,19:5125-30,1991.Tomic et al.,Nucl.Acids Res.,12:1656,1990.Tomic,Sunjevaric,Savtchenko,Blumenberg,″A rapid and simple method for intro-
  ducing specific mutations into any position of DNA leaving all other positions
  unaltered,″Nucleic Acids Res.,18(6):1656,1990.Toriyama et al.,Theor Appl.Genet.,73:16,1986.Uchimiya et al. Mol.Gen.Genet.,204:204,1986.Upender et al.,Biotechniques,18:29-31,1995.Usman and Cedergren,TIBS,17:34,1992.Usman and Cedergren,Trends in Biochem.Sci.,17:334,1992.Usman et al.,J.Am.Chem.Soc.,109:7845-7854,1987.Vallette,Merge,Reiss,Adesnik,″Construction of mutant and chimeric genes using
  the polymerase chain reaction,″Nucl.Acids Res.,17:723-733,1989.Vasil et al.,″Herbicide-resistant fertile transgenic wheat plants obtained by micropro-
  jectile bombardment of regenerable embryogenic callus,″Biotechnology,
  10:667-674,1992.Vasil,Biotechnology,6:397,1988.Velten and Schell,Nucl.Acids Res.,13:6981-6998,1985.Velten et al.,EMBO J.,3:2723-2730,1984.Ventura et al.,Nucl.Acids Res.,21:3249-55,1993.Vodkin et al.,Cell,34:1023,1983.Vogel et al.,J.Cell Biochem.,Suppl.13D:312,1989,Von Tersch,Slatin,Kulesza,English,″Membrane permeabilizing activity of Bacillus
  thuringiensis Coleopteran-active toxins CryIIIB2 and CryIIIB2 domain 1 pep-
  tides,″Appl.Env Microbiol.,60:3711-3717,1994.Wagner,Zatloukal,Cotten,Kirlappos,Mechtler.Curiel,Bimstiel,″Coupling of ade-
  novirus to transferrin-polylysine/DNA complexes greatly enhances receptor-
   mediated gene delivery and expression of transfected genes,″Proc.Natl. Acad.
   Sci.USA,89(13):6099-6103,1992.Walker et al.,Proc.Natl.Acad Sci.USA.89(1):392-396,1992.Walters et al.,Biochem.Biophys.Res.Commun.,196:921-926,1993.Watson et al.,Molecular Biology of the Gene,4th Ed.,W.A.Benjamin,Inc.,Menlo
   Park,CA,1987.Weerasinghe et al.,J.Virol.,65:5531-4,1991.Weissbach and Weissbach,Methods for Plant Molecular Biology,(eds.),Academic
  Press,Inc.,San Diego,CA,1988.Wenzler et al.,Plant Mol. Biol.,12:41-50,1989.Wickens and Stephenson,Science,226:1045,1984.Wickens et al.,In:“RNA Processing,”p.9,Cold Spring Harbor Laboratory,Cold
  Spring Harbor,NY,1987.Wolfersberger et al.,Appl.Environ.Microbiol.,62:279-282,1996.Wong and Neurnarnn,″Electric field mediated gene transfer,″Biochim.Biophys.Res.
  Commun.,107(2):584-587,1982.Woolf et al.,Proc.Natl.Acad.Sci.USA,89:7305-7309,1992.Wu and Aronson,″Localized mutagenesis defines regions of the Bacillus thuringien-
  sis δ-endotoxin involved in toxicity and specificity,″J.Biol.Chem.,267:2311-
  2317,1992.Wu and Dean,″Functional significance of loops in the receptor binding domain of
  Bacillus thuringiensis CryIIIA δ-endotoxin,″J.Mol.Biol.,255:628-640,1996.Yamada et al.,Plant Cell Rep.,4:85,1986.Yang et al.,Proc.Natl.Acad.Sci.USA,87:4144-48,1990.Yu et al.,Proc.Natl.Acad.Sci.USA.90:6340-4,1993.Zatloukal,Wagner,Cotten,Phillips,Plank,Steinlein,Curiel,Bimstiel,
  ″Transferrinfeetion:a highly efficient way to express gene constructs in eu-
  karyotic cells,″Ann.N.Y.Acad.Sci.,660:136-153,1992.Zhang and Matthews,″Conservations of solvent-binding sites in 10 crystal forms of
  T4 lysozyme,″Prot.Sci.,3:1031-1039,1994.Zhou et al.,Mol.Cell Biol.,10:4529-37,1990.
在本发明的指导下,本发明中所公开和要求权限的所有的组合物可以被正确地制造和执行。虽然已经通过优选实施例对本发明的组合物和方法进行了描述,但是显而易见,本工艺的熟练人士可以对本发明的组合物和方法按照本发明中所述的步骤或步骤的顺序作各种变更而不脱离本发明的概念、精神和范围。更具体地,显然本发明中所述的试剂可以用它们的化学和物理相关的试剂代替而能够获得相同或相似的结果。本工艺的熟练人士所熟知的所有的这些类似的替代和修改被认为是属于如增补的权利要求所定义的本发明的精神、范围和概念之内的。
                               序列清单(1)一般信息:
(i)申请者:
    (A)名称:ECOGEN,INC./MONSANTO COMPANY
    (B)街道:2005 CABOT BLVD W/700 CHESTERFIELD VILLAGE
             PKY N
    (C)城市:LANGHORE/ST.LOUIS
    (D)州:PA/MO
    (E)国家:美国
    (F)邮政编码:819047/63198
    (A)名称:LEIGH H.ENGLISH
    (B)街道:120 CHAPEL DR
    (C)城市:CHRUCHVILLE
    (D)州:PA
    (E)国家:美国
    (F)邮政编码:18966
    (A)名称:SUSAN M.BRUSSOCK
    (B)街道:7 HILLSIDE LN
    (C)城市:NEW HOPE
    (D)州:PA
    (E)国家:美国
    (F)邮政编码:18938
    (A)名称:THOMAS M.MALVAR
    (B)街道:12046 CHARTER HOUSE LN
    (C)城市:ST.LOUIS
    (D)州:MO
    (E)国家:美国
    (F)邮政编码:63146
    (A)名称:JAMES W.BRYSON
    (B)街道:87 WOOD STREAM DR
    (C)城市:LANGHORNE
    (D)州:PA
    (E)国家:美国
    (F)邮政编码:19053
    (A)名称:CAROLINE A.KULESZA
    (B)街道:301 OLD LYNCHBURG RD
    (C)城市:CHARLOTTESVILLE
    (D)州:VA
    (E)国家:美国
    (F)邮政编码:22903
    (A)名称:FREDERICK S.WALTERS
    (B)街道:3413 6TH AVE
    (C)城市:BEAVER FALLS
    (D)州:PA
    (E)国家:美国
    (F)邮政编码:15010
      (A)名称:STEPHEN L.SLATIN
      (B)街道:3823 LESLIE PL
      (C)城市:FAIR LAWN
      (D)州:NJ
      (E)国家:美国
      (F)邮政编码:07410
      (A)名称:MICHAEL A.VON TERSCH
      (B)街道:14 RUTLEDGE AVE
      (C)城市:TRENTON
      (D)州:NJ
      (E)国家:美国
      (F)邮政编码:08618
      (A)名称:CHARLES ROMANO
      (B)街道:2402 MAPLE CROSSING DR
      (C)城市:WILDWOOD
      (D)州:MO
      (E)国家:美国
      (F)邮政编码:63011
(ii)发明的题目:INSECT-RESISTANT TRANSGENIC PLANTS AND
    METHODS FOR IMPROVING DELTA-ENDOTOXIN ACTIVITY AGAINST
    TARGET INSECTS
(iii)序列的数目:113
(iv)计算机可读形式:
      (A)介质形式:软盘
      (B)计算机:IBM PC兼容机
      (C)操作系统:PC-DOS/MS-DOS
      (D)软件:PatentIn Release #1.0,Version #1.30(EPO)
(v)此次申请的数据:
      申请号码:未知
(vi)上次申请日期:
      (A)申请号码:US 08/993,170
      (B)存当日期:18-DEC-1997
(vi)上次申请日期:
      (A)申请号码:US 08/993,722
      (B)存当日期:18-DEC-1997
(vi)上次申请日期:
      (A)申请号码:US 08/993,775
      (B)存当日期:18-DEC-1997
(vi)上次申请日期:
      (A)申请号码:US 08/996,441
      (B)存当日期:18-DEC-1997(2)序列编号1的信息:
(i)序列特征:
      (A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性(ix)特性:
(A)名称/关键词:CDS
(B)定位:1..1956(xi)序列描述:序列编号:1:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT          48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT          96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG          144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT          192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA          240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT          288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA          336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT          384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT          432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA TTT CAC CAT TCT CGT CGT TCT          480Val Asn Ala Leu Asn Ser Trp Lys Lys Phe His His Ser Arg Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT          528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG         576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA         624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA         672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC         720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA         768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA         816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT         864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT         912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA         960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT        1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT        1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA        1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT        1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT        1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lye Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号2的信息:
(i)序列特征:
   (A)长度:652个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:2Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Phe His His Ser Arg Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                235                  240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350G1y Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号3的信息:
(i)序列特征:
   (A)长度:1959碱基对
   (B)类型:核苷酸
   (C)链的性质:单链
   (D)拓扑学:线性
(ix)特征:
   (A)名称/关键词:CDS
   (B)定位:1..1956
(xi)序列描述:序列编号:3:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT        48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT        96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser ThrVal Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTC CTT AGT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Leu Ser Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG        1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT        1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC        1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA        1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA        1680Glu Ser Ser Ash Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT        1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC        1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA        1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG        1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
510                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC        1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                    1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号4的信息:
(i)序列特征:
  (A)长度:652个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:4:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro  1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Leu Ser Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号5的信息:
(i)序列特征:
  (A)长度:1959碱基对
  (B)类型:核苷酸
  (C)链的性质:单链
  (D)拓扑学:线性(ix)特征:
  (A)名称/关键词:CDS
  (B)定位:1..1956(xi)序列描述:序列编号:5:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT       48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT       96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG       144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT       192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA       240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT       288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA       336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT       384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT CCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Pro Glu
210                 215                 220GAT GTT GCT GAA TTC AGT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Ser His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号6的信息:
(i)序列特征:
  (A)长度:652个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:6:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Ash His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Pro Glu
210                 215                 220Asp Val Ala Glu Phe Ser His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Cln Leu
            645                650(2)序列编号7的信息:
(i)序列特征:
  (A)长度:1959碱基对
  (B)类型:核苷酸
  (C)链的性质:单链
  (D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956(xi)序列描述:序列编号:7ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT      48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT      96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG      144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT      192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA      240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT      288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA      336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT      384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT      432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT      480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT      528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG      576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA      624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA       672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTC TAT CGT AGA CAA TTA AAA CTT ACA CAA CAA TAC       720Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA       768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA       816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT       864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT       912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA       960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
             645                          650(2)序列编号8的信息:
(i)序列特征:
  (A)长度:652个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:8:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号9的信息:
(i)序列特征:
  (A)长度:1959碱基对
  (B)类型:核苷酸
  (C)链的性质:单链
  (D)拓扑学:线性(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956(xi)SEQUENCE DESCRIPTION:SEQ ID NO:9:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT       48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT       96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG       144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT       192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Als Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTC TAT AAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr Asn Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240TCT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Ser Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号10的信息:
(i)序列特征:
  (A)长度:652个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:10Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe ArG Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr Asn Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Ser Asp His Cys Val ASn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号11的信息:
(i)序列特征:
   (A)长度:1959碱基对
   (B)类型:核苷酸
   (C)链的性质:单链
   (D)拓扑学:线性
(ix)特征:
   (A)名称/关键词:CDS
   (B)定位:1..1956
(xi)序列描述:序列编号:11:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT       48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT       96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG      144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT      192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA      240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT      288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA      336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT      384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT      432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTC TAT ACC AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr Thr Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn G1y
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC     TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号12的信息:
  (i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
  (ii)分子类型:蛋白质
  (xi)序列描述:序列编号:12:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        160                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr Thr Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号13的信息:
  (i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
  (ix)特征:
    (A)名称/关键词:CDS
    (B)定位:    1..1956
  (xi)SEQUENCE DESCRIPTION:SEQ ID NO:13:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT          96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG         144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT         192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA         240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT         288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA         336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT         384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT         432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT         480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT         528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG         576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA         624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA         672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC         720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT AAT TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Asn Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号14的信息:
  (i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
  (ii)分子类型:蛋白质
  (xi)序列描述:序列编号:14:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Asn Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号15的信息:
  (i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
  (ix)特征:
    (A)名称/关键词:CDS
    (B)定位:    1..1956
  (xi)SEQUENCE DESCRIPTION:SEQ ID NO:15:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT     48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT     96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG    144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT    192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA    240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT    288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TTA CTT ACT ACG CTT CAG AAG TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA    1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT    1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC    1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号16的信息:
  (i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
  (ii)分子类型:蛋白质
  (xi)序列描述:序列编号:16Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号17的信息:
  (i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
  (ix)特征:
    (A)名称/关键词:CDS
    (B)定位:    1..1956
  (xi)序列描述:序列编号:17:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT          48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT          96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG         144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT         192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA         240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT         288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA         336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT         384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT         432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT         480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT         528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG         576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA         624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA         672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC         720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA         768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA         816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT         864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT         912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT ACC CTT AAT ACA CTA CAG AAG TGC GGA CCA         960Phe Thr Asp Pro Ile Phe Thr Leu Asn Thr Leu Gln Lys Cys Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT        1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT        1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA        1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT        1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT        1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号18的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:18:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Thr Leu Asn Thr Leu Gln Lys Cys Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号19的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:19ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT    48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT    96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT GCC GTT AAT ACT CTG TGG GAA TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Ala Val Asn Thr Leu Trp Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT TTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号20的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:20Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro  1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ala Val Asn Thr Leu Trp Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号21的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:21ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT     48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT     96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA ACA ATG    144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT    192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA    240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT    288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA    336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT    384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTC TAT CGT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TTA CTT ACT ACG CTT CAG AAG TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC    1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号22的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:22:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser His Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
   435                  440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号23的信息:
    (i)序列特征:
      (A)长度:195g碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
  (A)名称/关键词:CDS
  (B)定位:    1.1956
(xi)序列描述:序列编号:23:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro ASn ASn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT ACG CCA ACC ACC CTA CAG GAT TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Thr Pro Thr Thr Leu Gln Asp Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
                    645              650
(2)序列编号24的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:24:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Thr Pro Thr Thr Leu Gln Asp Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Lau Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号25的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:25:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT     48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT     96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG    144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT    192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT GCC CTG AAT ACC TTA GAC GAG TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Ala Leu Asn Thr Leu Asp Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC    1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA    1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA    1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT    1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC    1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                600                  605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
6l0                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号26的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:26:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ala Leu Asn Thr Leu Asp Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号27的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1.1956
    (xi)序列描述:序列编号:27:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT     48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT     96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG    144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT    192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA    240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT    288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA    336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT    384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT    432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAC GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ACT AGG CGA TTC AGA AAG GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Thr Arg Arg Phe Arg Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号28的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:28:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Thr Arg Arg Phe Arg Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号29的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:29:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT    48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTC TAT CGT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TTA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Leu Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA        1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG        1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT        1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC        1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA        1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA        1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT        1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC        1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA        1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG        1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC        1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                    1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号30的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:30:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Leu Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Tle Pro Val Gln Leu
            645                 650
(2)序列编号31的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:31:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT     48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT     96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG    144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT    192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA    240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT    288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT ATC CTC AAT ACG CTA CAG GAG TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Ile Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA    1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT    1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC    1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号32的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:32:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ile Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
     355                360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号33的信息:
    (i)序列特征:
      (A)长度:1959碱基对
  (B)类型:核苷酸
  (C)链的性质:单链
  (D)拓扑学:线性
(ix)特征:
  (A)名称/关键词:CDS
  (B)定位:    1..1956
(xi)序列描述:序列编号:33ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT ATC CTA CAT ACG CTG CAG GAG TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Ile Leu His Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Sar Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号34的信息
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:34:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ile Leu His Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号35的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:35:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT    48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT    96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCC CTC GTT AAC CTA ATG GTG TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Val Asn Leu Met Val Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG        1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT        1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC        1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA        1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA        1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT        1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC        1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA        1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG        1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC        1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                    1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号36的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:36:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro  1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Val Asn Leu Met Val Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号37的信息:
    (i)序列特征:
      (A)长度: 1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:37:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT    48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT    96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG   144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT   192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA   240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT   288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA   336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT   384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCT CTT AGG ACA CCA CTT GCG TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Arg Thr Pro Leu Ala Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC    1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Clu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号38的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:38:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Arg Thr Pro Leu Ala Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Pne Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号39的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
  (A)名称/关键词:CDS
  (B)定位:    1..1956
(xi)序列描述:序列编号:39:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TTC AAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Phe Asn
    275                 280                 285ATT TTG CTT TAC AGT AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Leu Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
                  645                 650
(2)序列编号40的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:40Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Phe Asn
    275                 280                 285Ile Leu Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe rle Pro Val Gln Leu
            645                 650
(2)序列编号41的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1.1956
    (xi)序列描述:序列编号:41:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT    48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT    96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG   144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG GTA GAC AAC TCT ACA GTA AAA GAT   192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT GTG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Val Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC    1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA    1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA    1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT    1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC    1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号42的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:42:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                155                  160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Val Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号43的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:43:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT     48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT     96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG    144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT    192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA    240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT    288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA    336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT    384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT    432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CrT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号44的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:44:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号45的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1.1956
    (xi)序列描述:序列编号:45:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT       48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AAT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn145                 150                 155                 160CCA CAC AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Pro His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号46的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:46:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn145                 150                 155                 160Pro His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号47的信息:
    (i)序列特征:
      (A)长度:1959碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1956
    (xi)序列描述:序列编号:47:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT     48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT     96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG    144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT    192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA    240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT    288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285GTT CGG TTA TAC CCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA    1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT    1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC    1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA    1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG    1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号48的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:48:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号49的信息:
    (i)序列特征:
        (A)长度:1959碱基对
        (B)类型:核苷酸
        (C)链的性质:单链
        (D)拓扑学:线性
    (ix)特征:
        (A)名称/关键词:CDS
        (B)定位:    1..1956
    (xi)序列描述:序列编号:49:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGA GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AAT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn145                 150                 155                 160CCA CAC AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Pro His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285GTT CGG TTA TAC CCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC    1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号50的信息:
    (i)序列特征:
      (A)长度:652个氨基酸
      (B)类型:氨基酸
      (D)拓扑学:线性
    (ii)分子类型:蛋白质
    (xi)序列描述:序列编号:50:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
          20                 25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn145                 150                 155                 160Pro His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650
(2)序列编号51的信息:
    (i)序列特征:
      (A)长度:1956碱基对
      (B)类型:核苷酸
      (C)链的性质:单链
      (D)拓扑学:线性
    (ix)特征:
      (A)名称/关键词:CDS
      (B)定位:    1..1953
    (xi)序列描述:序列编号:51:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT    48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT    96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAA GAC CCA TGG AAG GCT TTT ATG GCA CAA        336Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
        100                 105                 110GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT AAA        384Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
    115                 120                 125GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT GTT        432Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130                 135                 140AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT AAA        480Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys145                 150                 155                 160AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT CAT        528Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
            165                 170                 175TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG CTG        576Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
        180                 185                 190TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA TTA        624Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
    195                 200                 205AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA GAT        672Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210                 215                 220GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC ACT        720Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225                 230                 235                 240GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA GGT        768Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
            245                 250                 255TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA ATG        816Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
        260                 265                 270ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT ATT        864Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
    275                 280                 285CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT TTT        912Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290                 295                 300ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA ACT        960Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305                 310                 315                 320TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT TAT       1008Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
            325                 330                 335TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT GGG       1056Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
        340                 345                 350AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA CCT       1104Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
    355                 360                 365AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT AAA       1152Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370                 375                 380TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT TAT       1200Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385                 390                 395                 400CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG GTA       1248Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
            405                 410                     415TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA AAA       1296Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
        420                 425                 430AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC CAT       1344Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
    435                 440                 445GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA GAT       1392Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450                 455                 460GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA TGT       1440Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465                 470                 475                 480TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG ACA       1488Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
            485                 490                     495CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT ACT       1536His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
        500                 505                     510CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC ATT       1584Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
    515                 520                     525ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA GAA       1632Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530                 535                     540TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA GCC       1680Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545                 550                     555             560TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT AAC       1728Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
            565                 570                 575TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC TAC       1776Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
        580                 585                 590ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA TTT       1824Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
    595                 600                 605GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG AAT       1872Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610                 615                 620GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC TAT       1920Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625                 630                 635             640ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                       1956Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号52的信息:
(i)序列特征:
   (A)长度:651个氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:52:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro  1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
        100                 105                 110Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
    115                 120                 125Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130                 135                 140Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys145                 150                 155                 160Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
            165                 170                 175Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
        180                 185                 190Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
    195                 200                 205Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210                 215                 220Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225                 230                 235                 240Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
            245                 250                 255Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
        260                 265                 270Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
    275                 280                 285Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290                 295                 300Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305                 310                 315                 320Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
            325                 330                 335Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
        340                 345                 350Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
    355                 360                 365Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370                 375                 380Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385                 390                 395                 400Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
            405                 410                 415Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
        420                 425                 430Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
    435                 440                 445Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450                 455                 460Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465                 470                 475                 480Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
            485                 490                 495His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
        500                 505                 510Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
    515                 520                 525Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530                 535                 540Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545                 550                 555                 560Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
            565                 570                 575Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
        580                 585                 590Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
    595                 600                 605Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610                 615                 620Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625                 630                 635                 640Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号53的信息:
(i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1956(xi)序列描述:序列编号:53:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT         432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT         480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT         528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC GGA TTC GAA GTG         576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Gly Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA         624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA         672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC         720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA         768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA         816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT         864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT         912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA         960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT         1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT         1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号54的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:54:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
 130                135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Gly Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号55的信息:
(i)序列特征:
    (A)长度:1956碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1953
    (xi)序列描述:序列编号:55:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG         144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT         192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA         240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT         288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAA GAC CCA TGG AAG GCT TTT ATG GCA CAA         336Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
        100                 105                 110GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT AAA         384Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
    115                 120                 125GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT GTT         432Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130                 135                 140AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AAT CCA         480Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn Pro145                 150                 155                 160CAC AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT CAT         528His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
            165                 170                 175TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG CTG         576Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
        180                 185                 190TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA TTA         624Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
    195                 200                 205AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA GAT        672Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210                 215                 220GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC ACT        720Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225                 230                 235                 240GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA GGT        768Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
            245                 250                 255TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA ATG        816Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
        260                 265                 270ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT ATT        864Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
    275                 280                 285CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT TTT        912Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290                 295                 300ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA ACT        960Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305                 310                 315                 320TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT TAT        1008Phe Leu Ser Ile Glu Arg Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
            325                 330                 335TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT GGG        1056Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
        340                 345                 350AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA CCT        1104Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
    355                 360                 365AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT AAA        1152Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370                 375                 380TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT TAT        1200Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385                 390                 395                 400CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG GTA        1248Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
            405                 410                 415TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA AAA        1296Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
        420                 425                 430AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC CAT       1344Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
    435                 440                 445GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA GAT       1392Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450                 455                 460GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA TGT       1440Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465                 470                 475                 480TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG ACA       1488Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
            485                 490                 495CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT ACT       1536His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
        500                 505                 510CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC ATT       1584Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
    515                 520                 525ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA GAA       1632Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530                 535                 540TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA GCC       1680Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545                 550                 555                 560TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT AAC       1728Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
            565                 570                 575TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC TAC       1776Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
        580                 585                 590ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA TTT       1824Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
    595                 600                 605GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG AAT       1872Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610                 615                 620GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC TAT       1920Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625                 630                 635                 640ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                       1956Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
              645                   650(2)序列编号56的信息:
(i)序列特征:
    (A)长度:651个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:56:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Glu Asn Pro Trp Lys Ala Phe Met Ala Gln
        100                 105                 110Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
    115                 120                 125Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130                 135                 140Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn Pro145                 150                 155                 160His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
            165                 170                 175Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
        180                 185                 190Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
    195                 200                 205Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210                 215                 220Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225                 230                 235                 240Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
            245                  250                255Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
        260                 265                 270Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
    275                 280                 285Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290                 295                 300Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305                 310                 315                 320Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
             325                330                 335Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
        340                  345                350Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
    355                 360                 365Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370                 375                 380Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385                 390                 395                 400Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
            405                 410                 415Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
        420                 425                 430Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
    435                 440                 445Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450                 455                 460Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465                 470                 475                 480Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
            485                 490                 495His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
        500                 505                 510Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
    515                 520                 525Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530                 535                 540Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545                 550                 555                 560Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Sar Thr Thr Asn
            565                 570                 575Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
        580                 585                 590Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
    595                 600                 605Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610                 615                 620Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625                 630                 635                 640Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号57的信息:
(i)序列特征:
    (A)长度:1956碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1953
(xi)序列描述:序列编号:57:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT          48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT          96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                   25                 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG         144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT         192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAA GAC CCA TGG AAG GCT TTT ATG GCA CAA        336Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
        100                 105                 110GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT AAA        384Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
    115                 120                 125GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT GTT        432Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130                 135                 140AAT GCG TTA AAT TCC TGG AAG AAA TTT CAC CAT TCT CGT CGT TCT AAA        480Asn Ala Leu Asn Ser Trp Lys Lys Phe His His Ser Arg Arg Ser Lys145                 150                 155                 160AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT CAT        528Arg Ser Gln Asp Arg Ils Arg Glu Leu Phe Ser Gln Ala Glu Ser His
            165                 170                 175TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG CTG        576Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
        180                 185                 190TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA TTA        624Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
    195                 200                 205AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA GAT        672Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210                 215                 220GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC ACT        720Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225                 230                 235                 240GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA GGT        768Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
            245                 250                 255TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA ATG        816Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
        260                 265                 270ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT ATT        864Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
    275                 280                 285CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT TTT        912Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290                 295                 300ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA ACT        960Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305                 310                 315                 320TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT TAT       1008Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
            325                 330                 335TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT GGG       1056Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
        340                 345                 350AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA CCT       1104Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
    355                 360                 365AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT AAA       1152Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370                 375                 380TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT TAT       1200Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385                 390                 395                 400CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG GTA       1248Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
            405                 410                 415TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA AAA       1296Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
        420                 425                 430AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC CAT       1344Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
    435                 440                 445GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA GAT       1392Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450                 455                 460GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA TGT       1440Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465                 470                 475                 480TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG ACA       1488Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
            485                 490                 495CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT ACT       1536His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
        500                 505                 510CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC ATT       1584Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
    515                 520                 525ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA GAA       1632Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530                 535                 540TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA GCC       1680Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545                 550                 555                 560TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT AAC       1728Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
            565                 570                 575TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC TAC       1776Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
        580                 585                 590ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA TTT       1824Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
    595                 600                 605GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG AAT       1872Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610                 615                 620GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC TAT       1920Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625                 630                 635                 640ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                       1956Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号58的信息:
(i)序列特征:
    (A)长度:651个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:58:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
        100                 105                     110Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
    115                 120                     125Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130                 135                 140Asn Ala Leu Asn Ser Trp Lys Lys Phe His His Ser Arg Arg Ser Lys145                 150                 155                 160Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
            165                 170                 175Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
        180                 185                 190Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
    195                 200                 205Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210                 215                 220Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225                 230                 235                 240Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
            245                 250                 255Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
        260                 265                 270Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
    275                 280                 285Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290                 295                 300Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305                 310                 315                 320Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
            325                 330                 335Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
        340                 345                 350Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
    355                 360                 365Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370                 375                 380Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385                 390                 395                 400Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
            405                 410                 415Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
        420                 425                 430Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
    435                 440                 445Val Sar Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450                 455                 460Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465                 470                 475                 480Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
            485                 490                 495His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
        500                 505                 510Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
    515                 520                 525Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530                 535                 540Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545                 550                 555                 560Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
            565                 570                 575Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
        580                 585                 590Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
    595                 600                 605Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610                 615                 620Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625                 630                 635                 640Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号59的信息;
(i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1956
(xi)序列描述:序列编号:59:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Glu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Ash Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA        768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT ACC CTT AAT ACA CTA CAG AAG TAC GGA CCA        960Phe Thr Asp Pro Ile Phe Thr Leu Asn Thr Leu Gln Lys Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1l04Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT        1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT        1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG        1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA        1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC        1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA        1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA        1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG        1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT        1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC        1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA        1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA        1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT        1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC        1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 65n(2)序列编号60的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:60:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                 90                   95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                135                  140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Thr Leu Asn Thr Leu Gln Lys Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu ASn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号61的信息:
(i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1956
(xi)序列描述:序列编号:61:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ArA AAG GTT ACA CCT    48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA         768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA         816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT         864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285GTT CGG TTA TAC CCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT         912Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TCT ACG GAT CCA ATT TTT GCC GTT AAT ACT CTG TGG GAA TAC GGA CCA         960Ser Thr Asp Pro Ile Phe Ala Val Asn Thr Leu Trp Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT         1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CGA CCT GGT TAC TTT         1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GCA GAA ACT AGA         1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Ala Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT         1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT         1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG         1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA         1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC         1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA         1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            488                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Ash Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号62的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:序列编号:62:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Ser Thr Asp Pro Ile Phe Ala Val Asn Thr Leu Trp Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Ala Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 4l5Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号63的信息;
(i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1956
(xi)序列描述:序列编号:63:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG         144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT         192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA         240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT         288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA         336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT         384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT         432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT         480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT         528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG         576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA         624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA         672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC         720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA         768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA         816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT         864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285GTT CGG TTA TAC CCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT         912Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA         960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT        1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CGA CCT GGT TAC TTT        1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA        1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT        1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT        1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG        1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA        1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC        1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA        1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA        1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG        1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT        1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC        1584TAr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA        1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                  535                540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号64的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
    (ii)分子类型:蛋白质
(xi)序列描述:序列编号:64:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号65的信息:
(i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性(ix)特征:
    (A)名称/关键词:CDS
    (B)定位1..1956(xi)序列描述:序列编号:65:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG         144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT         192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA         240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT         288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA         336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT         384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                  125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT         432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT         480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT         528Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG         576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA         624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA         672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC         720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA         768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA         816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT         864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT         912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TTA CTT AAT ACT CTT CAG GAG TAT GGA CCA         960Phe Thr Asp Pro Ile Phe Leu Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT         1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT         1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA         1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT         1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT         1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC             1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                         1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号66的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:66:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Lau Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Leu Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号67的信息:
(i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1956
(xi)序列描述:序列编号:67:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT         48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT         96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG        144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT        192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA        240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT        288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA        336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT        384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT        432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT        480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT        528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG        576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA        624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA        672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC        720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GCA TTA AAT GGT TTA AGA        760Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA        816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT        864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT        912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA        960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT        1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CGA CCT GGT TAC TTT        1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA        1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT        1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA C   AAG CTA AGC TTT GAT GGA CAA AAA GTT        1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG        1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA        1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC        1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA        1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA        l440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA       1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT       1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC       1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA       1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG       1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC       1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                   1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号68的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:68:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro  1               5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号69的信息:
(i)序列特征:
    (A)长度:1482碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1479
(xi)序列描述:序列编号:69:AGT AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA            48Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu1               5                  10                  15AGT CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA            96Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
         20                  25                  30GTG CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG            144Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
     35                  40                  45CTA TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA            192Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
 50                  55                  60GAA GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA            240Glu Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln65                  70                  75                  80TAC ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA            288Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
             85                  90                  95AGA GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA            336Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
        100                 105                 110GAA ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT         384Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
    115                 120                 125GAT ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC         432Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
130                 135                 140ATT TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA         480Ile Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly145                 150                 155                 160CCA ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT         528Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
            165                 170                 175GAT TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC         576Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
        180                 185                 190TTT GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT         624Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
    195                 200                 205AGA CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA         672Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
210                 215                 220GAT AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA         720Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys225                 230                 235                 240GTT TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT         768Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
            245                 250                 255AAG GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT         816Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
        260                 265                 270CAA AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT         864Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
    275                 280                 285GGC CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA         912Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
290                 295                 300ACA GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG         960Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala305                 310                 315                 320GAA TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT         1008Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
            325                 330                 335TGG ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG       1056Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
        340                 345                 350ATT ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TrG TCT TCA GGT GCT       1104Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
    355                 360                 365TCC ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA       1152Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
370                 375                 380AAA GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA       1200Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser385                390                 395                 400GCA GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC       1248Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile ArG Tyr Ala Ser Thr
            405                 410                 415ACT AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC       1296Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
        420                 425                 430ATC TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA       1344Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
    435                 440                 445ACA TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT       1392Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
450                 455                 460AAG AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA       1440Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys465                 470                 475                 480ATC TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA               1482Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            485                 490(2)序列编号70的信息:
(i)序列特征:
    (A)长度:493个氨基酸
    (B)类型:氨基酸
    (D)拓扑学:线性:
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:70:Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu1               5                  10                  15Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
         20                  25                  30Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
     35                  40                  45Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
 50                  55                  60Glu Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln65                  70                  75                  80Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
             85                  90                  95Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
        100                 105                 110Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
    115                 120                 125Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
130                 135                 140Ile Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly145                 150                 155                 160Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
            165                 170                 175Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
        180                 185                 190Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
    195                 200                 205Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
210                 215                 220Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys225                 230                 235                 240Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
            245                 250                 255Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
        260                 265                 270Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
    275                 280                 285Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
290                 295                 300Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala305                 310                 315                 320Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
            325                 330                 335Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
        340                 345                 350Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
    355                 360                 365Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
370                 375                 380Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser385                 390                 395                 400Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
            405                 410                 415Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
        420                 425                 430Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
    435                 440                 445Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
450                 455                 460Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys465                 470                 475                 480Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            485                 490(2)序列编号71的信息:
(i)序列特征:
    (A)长度:23碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:71:AGACAACTCT ACAGTAAAAG ATG                                                  23(2)序列编号72的信息:
(i)序列特征:
    (A)长度:20碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:72:GGTAATTGGT CAATAGAATC                                                      20(2)序列编号73的信息:
(i)序列特征:
    (A)长度:39碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:21..23
    (D)其它的信息:/注释=“N=A,T,G,或C”
(xi)序列描述:序列编号:73:CAGAAGATGT TGCTGAATTC NNNCATAGAC AATTAAAAC                                 39(2)序列编号74的信息:
(i)序列特征:
    (A)长度:34碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:19..21
    (D)其它的信息:/注释=“N=A,T,G,或C”
(xi)序列描述:序列编号:74:GATGTTGCTG AATTCTATNN NAGACAATTA AAAC                                      34(2)序列编号75的信息:
(i)序列特征:
    (A)长度:33碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:17
    (D)其它的信息:/注释=“N=A,T,C,或G”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:18
    (D)其它的信息:/注释=“N=T,G,C,或A”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:1g
    (D)其它的信息:/注释=“N=A,T,G,或C”
(xi)序列描述:序列编号:75:CCCATTTTAT GATATTNNNT TATACTCAAA AGG                                       33(2)序列编号76的信息:
(i)序列特征:
    (A)长度:64碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:24
    (D)其它的信息:/注释:“N=T,G,C,或A”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:(25,27,28,30,34,36,39,43)的其中之一
    (D)其它的信息:/注释:“N=A,T,G,或C”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:(31,33,35,37,42,44)的其中之一
    (D)其它的信息:/注释:“N=A,G,C,或T”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:40
    (D)其它的信息:/注释:“N=A,T,C,或G”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:(26,29,32,38,41)的其中之一
    (D)其它的信息:/注释:“N=A,T,G,或C”
(xi)序列描述:序列编号:76:AGCTATGCTG GTCTCGGAAG AAANNNNNNN NNNNNNNNNN NATNAAAAGA AGCCAAGATC          60GAAT                                                                       64(2)序列编号77的信息:
(i)序列特征:
    (A)长度:40碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:77:GGTCACCTAG GTCTCTCTTC CAGGAATTTA ACGCATTAAC                                40(2)序列编号78的信息:
(i)序列特征:
    (A)长度:65碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:(22,27,29,30,37,42)的其中之一
    (D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:(23,26,28,31,38,40,43,44)的其中之一
    (D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:(24,39)的其中之一
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:(25,32,33,41,46,47,48)的其中之一
    (D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
(B)定位:34
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:45
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修饰的碱基
    (B)定位:35..36
    (D)其它的信息:/注释=“N=A,G,C或T”
(xi)序列描述:序列编号:78:AGCTATGCTG GTCTCCCATT TNNNNNNNNN NNNNNNNNNN NNNNNNNNGT TAAAACAGAA          60CTAAC                                                                      65(2)序列编号79的信息:
(i)序列特征:
    (A)长度:36碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:79:ATCCAGTGGG GTCTCAAATG GGAAAAGTAC AATTAG                                    36(2)序列编号80的信息:
(i)序列特征:
    (A)长度:63碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(23,27,31,36,44)的其中之一
    (D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(24,25,26,33,3 5,38)的其中之一
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(28,34,37)的其中之一
    (D)其它的信息:/注释=“N=A,T,G或C”
(i)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(29,30,32,39,42,45)的其中之一
    (D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(40,43)的其中之一
    (D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:41
    (D)其它的信息:/注释=“N=A,C,T或G”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:46
    (D)其它的信息:/注释=“N=A,T,G或C”
    (xi)序列描述:序列编号:80:CATTTTTACG GATCCAATTT TTNNNNNNNN NNNNNNNNNN NNNNNNGGAC CAACTTTTTT          60GAG                                                                        63(2)序列编号81的信息:
(i)序列特征:
    (A)长度:62碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(28,31,32,33,42)的其中之一
    (D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(29,38,39,41)的其中之一
    (D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:30
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(34,35,40)的其中之一
    (D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:36
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:37
    (D)其它的信息:/注释=“N=A,T,G或C”
(xi)序列描述:序列编号:81:GAATTTCATA CGCGTCTTCA ACCTGGTNNN NNNNNNNNNN NNTCTTTCAA TTATTGGTCT          60GG                                                                         62(2)序列编号82的信息:
(i)序列特征:
    (A)长度:73碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(41,49,52)的其中之一
    (D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:42..43
    (D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:44..45
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:46
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(47,48,53,54)的其中之一
    (D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(50,51,55)的其中之一
    (D)其它的信息:/注释=“N=A,T,C或G”
(xi)序列描述:序列编号:82:AAAAGTTTAT CGAACTATAG CTAATACAGA CGTAGCGGCT NNNNNNNNNN NNNNNGTATA          60TTTAGGTGTT ACG                                                             73(2)序列编号83的信息:
(i)序列特征:
    (A)长度:20碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:83:GGAGTTCCAT TTGCTGGGGC                                                      20(2)序列编号84的信息:
(i)序列特征:
    (A)长度:17碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:84:ATCTCCATAA AATGGGG                                                         17(2)序列编号85的信息:
(i)序列特征:
    (A)长度:32碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:85:GCGAAGTAAA AGAAGCCAAG GTCGAATAAG GG                                        32(2)序列编号86的信息:
(i)序列特征:
    (A)长度:43碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:86:CCTTTAAGTT TGCGAAATCC ACACAGCCAA GGTCGAATAA GGG                            43(2)序列编号87的信息:
(i)序列特征:
    (A)长度:35碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:87:CCCATTTTAT GATGTTCGGT TATACCCAAA AGGGG                                     35(2)序列编号88的信息:
(i)序列特征:
    (A)长度:25碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:88:GGCCAAGTGA AGACCCATGG AAGGC                                                25(2)序列编号89的信息:
(i)序列特征:
    (A)长度:22碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:89:GCAGTTTCCG GATTCGAAGT GC                                                    22(2)序列编号90的信息:
(i)序列特征:
    (A)长度:17碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:90:CCGCTACGTC TGTATTA                                                          17(2)序列编号91的信息:
(i)序列特征:
    (A)长度:17碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:91:ATAATGGAAG CACCTGA                                                          17(2)序列编号92的信息:
(i)序列特征:
    (A)长度:60碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
                                                                208
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(22,26,29)的其中之一
    (D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(23,33,36)的其中之一
    (D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(24,27,28,32,35,37,38)的其中之一
    (D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(25,30,31,34)的其中之一
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:39
    (D)其它的信息:/注释=“N=A,T,G或C”
(xi)序列描述:序列编号:92:AGCTATGCTG GTCTCTTCTT ANNNNNNNNN NNNNNNNNNA CAATTCCATT TTTTACTTGG    60(2)序列编号93的信息:
(i)序列特征:
    (A)长度:40碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:93:ATCCAGTTGG GTCTCTAAGA AACAAACCGC GTAATTAAGC                          40(2)序列编号94的信息:
(i)序列特征:
    (A)长度:20碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:94:CCTCAAGGGT TATAACATCC                                                       20(2)序列编号95的信息:
(i)序列特征:
    (A)长度:55碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:链状
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(19,22,23,31)的其中之一
    (D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(20,26,27,29,30,35)的其中之一
    (D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(21,32,34)的其中之一
    (D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:(24,33)的其中之一
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:25
    (D)其它的信息:/注释=“N=A,G,T或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:28
    (D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
    (A)名称/关键词:经过修改的碱基
    (B)定位:36
    (D)其它的信息:/注释=“N=A,G,C或T”
(xi)序列描述:序列编号:95:GTACAAAAGC TAAGCTTTNN NNNNNNNNN NNNNNNCGAA CTATAGCTAA TACAG            55(2)序列编号96的信息:
(i)序列特征:
    (A)长度:7个氨基酸
    (B)类型:氨基酸
    (C)链的性质:单链
    (D)拓扑学:链状
(xi)序列描述:序列编号:96:
Ser Lys Arg Ser Gln Asp Arg
1               5(2)序列编号97的信息:
(i)序列特征:
    (A)长度:1959个氨基酸
    (B)类型:氨基酸
    (C)链的性质:单链
    (D)拓扑学:链状
(ix)特征:
    (A)名称/关键词:CDS
    (B)定位:1..1956
(xi)序列描述:序列编号:97:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT            48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                  10                  15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT            96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG            144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT            192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA            240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT            288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA          336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT          384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT          432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT          480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT          528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG          576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA          624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA          672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC          720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA          768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                     255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA          816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                     270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT          864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                     285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT          912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                     300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA          960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT       1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT       1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA       1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT       1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT       1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                390                 395                 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG       1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA       1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC       1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA       1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA       1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG       1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT       1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC       1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA       1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA             1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT             1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC             1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA             1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG             1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC             1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA                         1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号98的信息:
(i)序列特征:
  (A)长度:652个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:98:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Prol                5                  10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
         20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
     35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
 50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
             85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        l80                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Lau Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号99的信息:
(i)序列特征:
(A)长度:2000碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性(xi)序列描述:序列编号:99:CCATCCATGG   CAAACCCTAA   CAATCGTTCC   GAACACGACA   CCATCAAGGT   TACTCCAAAC        60TCTGAGTTGC   AAACTAATCA   CAACCAGTAC   CCATTGGCTG   ACAATCCTAA   CAGTACTCTT       120GAGGAACTTA   ACTACAAGGA   GTTTCTCCGG   ATGACCGAAG   ATAGCTCCAC   TGAGGTTCTC       180GATAACTCTA   CAGTGAAGGA   CGCTGTTGGA   ACTGGCATTA   GCGTTGTGGG   ACAGATTCTT       240GGAGTGGTTG   GTGTTCCATT   CGCTGGAGCT   TTGACCAGCT   TCTACCAGTC   CTTTCTCAAC       300ACCATCTGGC   CTTCAGATGC   TGATCCCTGG   AAGGCTTTCA   TGGCCCAAGT   GGAAGTCTTG       360ATCGATAAGA   AGATCGAAGA   GTATGCCAAG   TCTAAAGCCT   TGGCTGAGTT   GCAAGGTTTG       420CAGAACAACT   TCGAGGATTA   CGTCAACGCA   CTCAACAGCT   GGAAGAAAAC   TCCCTTGAGT       480CTCAGGTCTA   AGCGTTCCCA   GGACCGTATT   CGTGAACTTT   TCAGCCAAGC   CGAATCCCAC       540TTCAGAAACT   CCATGCCTAG   CTTTGCCGTT   TCTAAGTTCG   AGGTGCTCTT   CTTGCCAACA       600TACGCACAAG   CTGCCAACAC   TCATCTCTTG   CTTCTCAAAG   ACGCTCAGGT   GTTTGGTGAG       660GAATGGGGTT   ACTCCAGTGA   AGATGTTGCC   GAGTTCTACC   GTAGGCAGCT   CAAGTTGACT       720CAACAGTACA   CAGACCACTG   CGTCAACTGG   TACAACGTTG   GGCTCAATGG   TCTTAGAGGA       780TCTACCTACG   ACGCATGGGT   GAAGTTCAAC   AGGTTTCGTA   GAGAGATGAC   CTTGACTGTG       840CTCGATCTTA   TCGTTCTCTT   TCCATTCTAC   GACATTCGTC   TTTACTCCAA   AGGCGTTAAG       900ACAGAGCTGA   CCAGAGACAT   CTTCACCGAT   CCCATCTTCC   TACTTACGAC   CCTGCAGAAA       960TACGGTCCAA   CTTTTCTCTC   CATTGAGAAC   AGCATCAGGA   AGCCTCACCT   CTTCGACTAT      1020CTGCAAGGCA   TTGAGTTTCA   CACCAGGTTG   CAACCTGGTT   ACTTCGGTAA   GGATTCCTTC      1080AACTACTGGA   GCGGAAACTA   CGTTGAAACC   AGACCATCCA   TCGGATCTAG   CAAGACCATC      1140ACTTCTCCAT   TCTACGGTGA   CAAGAGCACT   GAGCCAGTGC   AGAAGTTGAG   CTTCGATGGG      1200CAGAAGGTGT   ATAGAACCAT   CGCCAATACC   GATGTTGCAG   CTTGGCCTAA   TGGCAAGGTC      1260TACCTTGGAG   TTACTAAAGT   GGACTTCTCC   CAATACGACG   ATCAGAAGAA   CGAGACATCT      1320ACTCAAACCT   ACGATAGTAA   GAGGAACAAT   GGCCATGTTT   CCGCACAAGA   CTCCATTGAC      1380CAACTTCCAC   CTGAAACCAC   TGATGAACCA   TTGGAGAAGG   CTTACAGTCA   CCAACTTAAC     1440TACGCCGAAT   GCTTTCTCAT   GCAAGACAGG   CGTGGCACCA   TTCCGTTCTT   TACATGGACT     1500CACAGGTCTG   TCGACTTCTT   TAACACTATC   GACGCTGAGA   AGATTACCCA   ACTTCCCGTG     1560GTCAAGGCTT   ATGCCTTGTC   CAGCGGAGCT   TCCATCATTG   AAGGTCCAGG   CTTCACCGGT     1620GGCAACTTGC   TCTTCCTTAA   GGAGTCCAGC   AACTCCATCG   CCAAGTTCAA   AGTGACACTT     1680AACTCAGCAG   CCTTGCTCCA   ACGTTACAGG   GTTCGTATCA   GATACGCAAG   CACTACCAAT     1740CTTCGCCTCT   TTGTCCAGAA   CAGCAACAAT   GATTTCCTTG   TCATCTACAT   CAACAAGACT     1800ATGAACAAAG   ACGATGACCT   CACCTACCAA   ACATTCGATC   TTGCCACTAC   CAATAGTAAC     1860ATGGGATTCT   CTGGTGACAA   GAACGAGCTG   ATCATAGGTG   CTGAGAGCTT   TGTCTCTAAT     1920GAGAAGATTT   ACATAGACAA   GATCGAGTTC   ATTCCAGTTC   AACTCTAATA   GATCCCCCGG     1980GCTGCAGGAA   TTCGATATCA                                                         2000(2)序列编号100的信息:
(i)序列特征:
    (A)长度:653个氨基酸
    (B)类型:氨基酸
    (C)链的性质:
    (D)拓扑学:线性
(xi)序列描述:序列编号:100:Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thrl                   5               10                  15Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
            20              25                  30Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
        35              40                  45Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
    50              55                  60Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val65                  70                  75                  80Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
            85                  90                  95Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
        100                 105                 110Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
    115                 120                 125Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130                 135                 140Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg145                 150                 155                 160Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
            165                 170                 175Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
        180                 185                 190Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
    195                 200                 205Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210                 215                 220Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln225                 230                 235                 240Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
            245                 250                 255Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
        260                 265                 270Glu Met Thr Leu Thr Val Leu . p Leu Ile Val Leu Phe Pro Phe Tyr
    275                 280                 285Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290                 295                 300Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly305                 310                 315                 320Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
            325                 330                 335Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
        340                 345                 350Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
    355                 360                 365Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370                 375                 380Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys385                 390                 395                 400Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
            405                 410                 415Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
        420                 425                 430Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
    435                 440                 445Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450                 455                 460Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala465                 470                 475                 480Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
            485                 490                 495Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
        500                 505                 510Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
    515                 520                 525Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530                 535                 540Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser545                 550                 555                 560Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
            565                 570                 575Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
        580                 585                 590Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
    595                 600                 605Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610                 615                 620Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys625                 630                 635                 640Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号101的信息:
(i)序列特征:
  (A)长度:2050碱基对
  (B)类型:核苷酸
  (C)链的性质:单链
  (D)拓扑学:线性
(xi)序列描述:序列编号:10TGGAGCTCCA   CCGCGGTGGC   GGCCGCTCTA   GAACTAGTGG   ATCTAGGCCT   CCATATGAAC         60CCTAACAATC   GTTCCGAACA   CGACACCATC   AAGGTTACTC   CAAACTCTGA   GTTGCAAACT        120AATCACAACC   AGTACCCATT   GGCTGACAAT   CCTAACAGTA   CTCTTGAGGA   ACTTAACTAC        180AAGGAGTTTC   TCCGGATGAC   CGAAGATAGC   TCCACTGAGG   TTCTCGATAA   CTCTACAGTG        240AAGGACGCTG   TTGGAACTGG   CATTAGCGTT   GTGGGACAGA   TTCTTGGAGT   GGTTGGTGTT        300CCATTCGCTG   GAGCTTTGAC   CAGCTTCTAC   CAGTCCTTTC   TCAACACCAT   CTGGCCTTCA        360GATGCTGATC   CCTGGAAGGC   TTTCATGGCC   CAAGTGGAAG   TCTTGATCGA   TAAGAAGATC        420GAAGAGTATG   CCAAGTCTAA   AGCCTTGGCT   GAGTTGCAAG   GTTTGCAGAA   CAACTTCGAG        480GATTACGTCA   ACGCACTCAA   CAGCTGGAAG   AAAACTCCCT   TGAGTCTCAG   GTCTAAGCGT        540TCCCAGGACC   GTATTCGTGA   ACTTTTCAGC   CAAGCCGAAT   CCCACTTCAG   AAACTCCATG        600CCTAGCTTTG   CCGTTTCTAA   GTTCGAGGTG   CTCTTCTTGC   CAACATACGC   ACAAGCTGCC        660AACACTCATC   TCTTGCTTCT   CAAAGACGCT   CAGGTGTTTG   GTGAGGAATG   GGGTTACTCC        720AGTGAAGATG   TTGCCGAGTT   CTACCATAGG   CAGCTCAAGT   TGACTCAACA   GTACACAGAC        780CACTGCGTCA   ACTGGTACAA   CGTTGGGCTC   AATGGTCTTA   GAGGATCTAC   CTACGACGCA        840TGGGTGAAGT   TCAACAGGTT   TCGTAGAGAG   ATGACCTTGA   CTGTGCTCGA   TCTTATCGTT        900CTCTTTCCAT   TCTACGACAT   TCGTCTTTAC   TCCAAAGGCG   TTAAGACAGA   GCTGACCAGA        960GACATCTTCA   CCGATCCCAT   CTTCTCACTT   AACACCCTGC   AGGAATACGG   TCCAACTTTT       1020CTCTCCATTG   AGAACAGCAT   CAGGAAGCCT   CACCTCTTCG   ACTATCTGCA   AGGCATTGAG       1080TTTCACACCA   GGTTGCAACC   TGGTTACTTC   GGTAAGGATT   CCTTCAACTA   CTGGAGCGGA       1140AACTACGTTG   AAACCAGACC   ATCCATCGGA   TCTAGCAAGA   CCATCACTTC   TCCATTCTAC       1200GGTGACAAGA   GCACTGAGCC   AGTGCAGAAG   TTGAGCTTCG   ATGGGCAGAA   GGTGTATAGA       1260ACCATCGCCA   ATACCGATGT   TGCAGCTTGG   CCTAATGGCA   AGGTCTACCT   TGGAGTTACT       1320AAAGTGGACT   TCTCCCAATA   CGACGATCAG   AAGAACGAGA   CATCTACTCA   AACCTACGAT       1380AGTAAGAGGA   ACAATGGCCA   TGTTTCCGCA   CAAGACTCCA   TTGACCAACT   TCCACCTGAA       1440ACCACTGATG   AACCATTGGA   GAAGGCTTAC   AGTCACCAAC   TTAACTACGC   CGAATGCTTT       1500CTCATGCAAG   ACAGGCGTGG   CACCATTCCG   TTCTTTACAT   GGACTCACAG   GTCTGTCGAC      1560TTCTTTAACA   CTATCGACGC   TGAGAAGATT   ACCCAACTTC   CCGTGGTCAA   GGCTTATGCC      1620TTGTCCAGCG   GAGCTTCCAT   CATTGAAGGT   CCAGGCTTCA   CCGGTGGCAA   CTTGCTCTTC      1680CTTAAGGAGT   CCAGCAACTC   CATCGCCAAG   TTCAAAGTGA   CACTTAACTC   AGCAGCCTTG      1740CTCCAACGTT   ACAGGGTTCG   TATCAGATAC   GCAAGCACTA   CCAATCTTCG   CCTCTTTGTC      1800CAGAACAGCA   ACAATGATTT   CCTTGTCATC   TACATCAACA   AGACTATGAA   CAAAGACGAT      1860GACCTCACCT   ACAACACATT   CGATCTTGCC   ACTACCAATA   GTAACATGGG   ATTCTCTGGT      1920GACAAGAACG   AGCTGATCAT   AGGTGCTGAG   AGCTTTGTCT   CTAATGAGAA   GATTTACATA      1980GACAAGATCG   AGTTCATTCC   AGTTCAACTC   TAATAGATCC   CCCGGGCTGC   AGGAATTCGA      2040TATCAAGCTT                                                                       2050(2)序列编号102的信息:
(i)序列特征:
  (A)长度:2280碱基对
  (B)类型:核苷酸
  (C)链的性质:单链
  (D)拓扑学:线性
(xi)序列描述:序列编号:102:TTAAAATTAA   TTTTGTATAC   TTTTCATTGT   AATAATATGA   TTTTAAAAAC   GAAAAAGTGC        60ATATACAACT   TATCAGGAGG   GGGGGGATGC   ACAAAGAAGA   AAAGAATAAG   AAGTGAATGT       120TTATAATGTT   CAATAGTTTT   ATGGGAAGGC   ATTTTATCAG   GTAGAAAGTT   ATGTATTATG       180ATAAGAATGG   GAGGAAGAAA   AATGAATCCA   AACAATCGAA   GTGAACATGA   TACGATAAAG       240GTTACACCTA   ACAGTGAATT   GCAAACTAAC   CATAATCAAT   ATCCTTTAGC   TGACAATCCA       300AATTCAACAC   TAGAAGAATT   AAATTATAAA   GAATTTTTAA   GAATGACTGA   AGACAGTTCT       360ACGGAAGTGC   TAGACAACTC   TACAGTAAAA   GATGCAGTTG   GGACAGGAAT   TTCTGTTGTA       420GGGCAGATTT   TAGGTGTTGT   AGGAGTTCCA   TTTGCTGGGG   CACTCACTTC   ATTTTATCAA       480TCATTTCTTA   ACACTATATG   GCCAAGTGAT   GCTGACCCAT   GGAAGGCTTT   TATGGCACAA       540GTTGAAGTAC   TGATAGATAA   GAAAATAGAG   GAGTATGCTA   AAAGTAAAGC   TCTTGCAGAG       600TTACAGGGTC   TTCAAAATAA   TTTCGAAGAT   TATGTTAATG   CGTTAAATTC   CTGGAAGAAA       660ACACCTTTAA   GTTTGCGAAG   TAAAAGAAGC   CAAGATCGAA   TAAGGGAACT   TTTTTCTCAA        720GCAGAAAGTC   ATTTTCGTAA   TTCCATGCCG   TCATTTGCAG   TTTCCAAATT   CGAAGTGCTG        780TTTCTACCAA   CATATGCACA   AGCTGCAAAT   ACACATTTAT   TGCTATTAAA   AGATGCTCAA        840GTTTTTGGAG   AAGAATGGGG   ATATTCTTCA   GAAGATGTTG   CTGAATTTTA   TCATAGACAA        900TTAAAACTTA   CACAACAATA   CACTGACCAT   TGTGTTAATT   GGTATAATGT   TGGATTAAAT        960GGTTTAAGAG   GTTCAACTTA   TGATGCATGG   GTCAAATTTA   ACCGTTTTCG   CAGAGAAATG       1020ACTTTAACTG   TATTAGATCT   AATTGTACTT   TTCCCATTTT   ATGATATTCG   GTTATACTCA       1080AAAGGGGTTA   AAACAGAACT   AACAAGAGAC   ATTTTTACGG   ATCCAATTTT   TTCACTTAAT       1140ACTCTTCAGG   AGTATGGACC   AACTTTTTTG   AGTATAGAAA   ACTCTATTCG   AAAACCTCAT       1200TTATTTGATT   ATTTACAGGG   GATTGAATTT   CATACGCGTC   TTCAACCTGG   TTACTTTGGG       1260AAAGATTCTT   TCAATTATTG   GTCTGGTAAT   TATGTAGAAA   CTAGACCTAG   TATAGGATCT       1320AGTAAGACAA   TTACTTCCCC   ATTTTATGGA   GATAAATCTA   CTGAACCTGT   ACAAAAGCTA       1380AGCTTTGATG   GACAAAAAGT   TTATCGAACT   ATAGCTAATA   CAGACGTAGC   GGCTTGGCCG       1440AATGGTAAGG   TATATTTAGG   TGTTACGAAA   GTTGATTTTA   GTCAATATGA   TGATCAAAAA       1500AATGAAACTA   GTACACAAAC   ATATGATTCA   AAAAGAAACA   ATGGCCATGT   AAGTGCACAG       1560GATTCTATTG   ACCAATTACC   GCCAGAAACA   ACAGATGAAC   CACTTGAAAA   AGCATATAGT       1620CATCAGCTTA   ATTACGCGGA   ATGTTTCTTA   ATGCAGGACC   GTCGTGGAAC   AATTCCATTT       1680TTTACTTGGA   CACATAGAAG   TGTAGACTTT   TTTAATACAA   TTGATGCTGA   AAAGATTACT       1740CAACTTCCAG   TAGTGAAAGC   ATATGCCTTG   TCTTCAGGTG   CTTCCATTAT   TGAAGGTCCA       1800GGATTCACAG   GAGGAAATTT   ACTATTCCTA   AAAGAATCTA   GTAATTCAAT   TGCTAAATTT       1860AAAGTTACAT   TAAATTCAGC   AGCCTTGTTA   CAACGATATC   GTGTAAGAAT   ACGCTATGCT       1920TCTACCACTA   ACTTACGACT   TTTTGTGCAA   AATTCAAACA   ATGATTTTCT   TGTCATCTAC       1980ATTAATAAAA   CTATGAATAA   AGATGATGAT   TTAACATATC   AAACATTTGA   TCTCGCAACT       2040ACTAATTCTA   ATATGGGGTT   CTCGGGTGAT   AAGAATGAAC   TTATAATAGG   AGCAGAATCT       2100TTCGTTTCTA   ATGAAAAAAT   CTATATAGAT   AAGATAGAAT   TTATCCCAGT   ACAATTGTAA       2160GGAGATTTTA   AAATGTTGGG   TGATGGTCAA   AATGAAAGAA   TAGGAAGGTG   AATTTTGATG       2220GTTAGGAAAG   ATTCTTTTAA   CAAAAGCAAC   ATGGAAAAGT   ATACAGTACA   AATATTAACC       2280(2)序列编号103的信息:
(i)序列特征:
    (A)长度:32碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:103:TAGGCCTCCA TCCATGGCAA ACCCTAACAA TC                                               32(2)序列编号104的信息:
(i)序列特征:
    (A)长度:42碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:104:TCCCATCTTC CTACTTACGA CCCTGCAGAA ATACGGTCCA AC                                    42(2)序列编号105的信息:
(i)序列特征:
    (A)长度:28碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:105:GACCTCACCT ACCAAACATT CGATCTTG                                                    28(2)序列编号106的信息:
(i)序列特征:
    (A)长度:25碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:106:CGAGTTCTAC CGTAGGCAGC TCAAG                                                        25(2)序列编号107的信息:
(i)序列特征:
    (A)长度:1959碱基对
    (B)类型:核苷酸
    (C)链的性质:单链
    (D)拓扑学:线性
(xi)序列描述:序列编号:107:ATGAATCCAA   ACAATCGAAG   TGAACATGAT   ACGATAAAGG   TTACACCTAA   CAGTGAATTG        60CAAACTAACC   ATAATCAATA   TCCTTTAGCT   GACAATCCAA   ATTCAACACT   AGAAGAATTA       120AATTATAAAG   AATTTTTAAG   AATGACTGAA   GACAGTTCTA   CGGAAGTGCT   AGACAACTCT       180ACAGTAAAAG   ATGCAGTTGG   GACAGGAATT   TCTGTTGTAG   GGCAGATTTT   AGGTGTTGTA       240GGAGTTCCAT   TTGCTGGGGC   ACTCACTTCA   TTTTATCAAT   CATTTCTTAA   CACTATATGG       300CCAAGTGATG   CTGACCCATG   GAAGGCTTTT   ATGGCACAAG   TTGAAGTACT   GATAGATAAG       360AAAATAGAGG   AGTATGCTAA   AAGTAAAGCT   CTTGCAGAGT   TACAGGGTCT   TCAAAATAAT       420TTCGAAGATT   ATGTTAATGC   GTTAAATTCC   TGGAAGAAAA   CACCTTTAAG   TTTGCGAAGT       480AAAAGAAGCC   AAGGTCGAAT   AAGGGAACTT   TTTTCTCAAG   CAGAAAGTCA   TTTTCGTAAT       540TCCATGCCGT   CATTTGCAGT   TTCCAAATTC   GAAGTGCTGT   TTCTACCAAC   ATATGCACAA       600GCTGCAAATA   CACATTTATT   GCTATTAAAA   GATGCTCAAG   TTTTTGGAGA   AGAATGGGGA       660TATTCTTCAG   AAGATGTTGC   TGAATTCTAT   CGTAGACAAT   TAAAACTTAC   ACAACAATAC       720ACTGACCATT   GTGTTAATTG   GTATAATGTT   GGATTAAATG   GTTTAAGAGG   TTCAACTTAT       780GATGCATGGG   TCAAATTTAA   CCGTTTTCGC   AGAGAAATGA   CTTTAACTGT   ATTAGATCTA       840ATTGTACTTT   TCCCATTTTA   TGATATTCGG   TTATACTCAA   AAGGGGTTAA   AACAGAACTA       900ACAAGAGACA   TTTTTACGGA   TCCAATTTTT   TTACTTACTA   CGCTTCAGAA   GTACGGACCA       960ACTTTTTTGA   GTATAGAAAA   CTCTATTCGA   AAACCTCATT   TATTTGATTA   TTTACAGGGG      1020ATTGAATTTC   ATACGCGTCT   TCAACCTGGT   TACTTTGGGA   AAGATTCTTT   CAATTATTGG      1080TCTGGTAATT ATGTAGAAAC TAGACCTAGT ATAGGATCTA GTAAGACAAT TACTTCCCCA     1140TTTTATGGAG ATAAATCTAC TGAACCTGTA CAAAAGCTAA GCTTTGATGG ACAAAAAGTT     1200TATCGAACTA TAGCTAATAC AGACGTAGCG GCTTGGCCGA ATGGTAAGGT ATATTTAGGT     1260GTTACGAAAG TTGATTTTAG TCAATATGAT GATCAAAAAA ATGAAACTAG TACACAAACA     1320TATGATTCAA AAAGAAACAA TGGCCATGTA AGTGCACAGG ATTCTATTGA CCAATTACCG     1380CCAGAAACAA CAGATGAACC ACTTGAAAAA GCATATAGTC ATCAGCTTAA TTACGCGGAA     1440TGTTTCTTAA TGCAGGACCG TCGTGGAACA ATTCCATTTT TTACTTGGAC ACATAGAAGT     1500GTAGACTTTT TTAATACAAT TGATGCTGAA AAGATTACTC AACTTCCAGT AGTGAAAGCA     1560TATGCCTTGT CTTCAGGTGC TTCCATTATT GAAGGTCCAG GATTCACAGG AGGAAATTTA     1620CTATTCCTAA AAGAATCTAG TAATTCAATT GCTAAATTTA AAGTTACATT AAATTCAGCA     1680GCCTTGTTAC AACGATATCG TGTAAGAATA CGCTATGCTT CTACCACTAA CTTACGACTT     1740TTTGTGCAAA ATTCAAACAA TGATTTTCTT GTCATCTACA TTAATAAAAC TATGAATAAA     1800GATGATGATT TAACATATCA AACATTTGAT CTCGCAACTA CTAATTCTAA TATGGGGTTC     1860TCGGGTGATA AGAATGAACT TATAATAGGA GCAGAATCTT TCGTTTCTAA TGAAAAAATC     1920TATATAGATA AGATAGAATT TATCCCAGTA CAATTGTAA                            1959(2)序列编号108的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (C)链的性质:
    (D)拓扑学:线性(xi)序列描述:序列编号: 108:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                   10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
        20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
    35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
            85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号109的信息:
(i)序列特征:
    (A)长度:649个氨基酸
    (B)类型:氨基酸
    (C)链的性质:
    (D)拓扑学:线性(xi)  序列描述: 序列编号: 109:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Ala Thr Glu1               5                   10                  15Asn Asn Glu Val Ser Asn Asn His Ala Gln Tyr Pro Leu Ala Asp Thr
        20                  25                  30Pro Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Arg Thr Thr
    35                  40                  45Asp Asn Asn Val Glu Ala Leu Asp Ser Ser Thr Thr Lys Asp Ala Ile
50                  55                  60Gln Lys Gly Ile Ser Ile Ile Gly Asp Leu Leu Gly Val Val Gly Phe65                  70                  75                  80Pro Tyr Gly Gly Ala Leu Val Ser Phe Tyr Thr Asn Leu Leu Asn Thr
            85                  90                  95Ile Trp Pro Gly Glu Asp Pro Leu Lys Ala Phe Met Gln Gln Val Glu
        100                 105                 110Ala Leu Ile Asp Gln Lys Ile Ala Asp Tyr Ala Lys Asp Lys Ala Thr
    115                 120                 125Ala Glu Leu Gln Gly Leu Lys Asn Val Phe Lys Asp Tyr Val Ser Ala
l30                 135                 140Leu Asp Ser Trp Asp Lys Thr Pro Leu Thr Leu Arg Asp Gly Arg Ser145                 150                 155                 160Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg
            165                 170                 175Arg Ser Met Pro Ser Phe Ala Val Ser Gly Tyr Glu Val Leu Phe Leu
        180                 185                 190Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp
    195                 200                 205Ala Gln Ile Tyr Gly Thr Asp Trp Gly Tyr Ser Thr Asp Asp Leu Asn
210                 215                 220Glu Phe His Thr Lys Gln Lys Asp Leu Thr Ile Glu Tyr Thr Asn His225                 230                 235                 240Cys Ala Lys Trp Tyr Lys Ala Gly Leu Asp Lys Leu Arg Gly Ser Thr
            245                 250                 255Tyr Glu Glu Trp Val Lys Phe Asn Arg Tyr Arg Arg Glu Met Thr Leu
        260                 265                 270Thr Val Leu Asp Leu Ile Thr Leu Phe Pro Leu Tyr Asp Val Arg Thr
    275                 280                 285Tyr Thr Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Val Leu Thr Asp
290                 295                 300Pro Ile Val Ala Val Asn Asn Met Asn Gly Tyr Gly Thr Thr Phe Ser305                 310                 315                 320Asn Ile Glu Asn Tyr Ile Arg Lys Pro His Leu Phe Asp Tyr Leu His
            325                 330                 335Ala Ile Gln Phe His Ser Arg Leu Gln Pro Gly Tyr Phe Gly Thr Asp
        340                 345                 350Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Ser Thr Arg Ser Ser Ile
    355                 360                 365Gly Ser Asp Glu Ile Ile Arg Ser Pro Phe Tyr Gly Asn Lys Ser Thr
370                 375                 380Leu Asp Val Gln Asn Leu Glu Phe Asn Gly Glu Lys Val Phe Arg Ala385                 390                 395                 400Val Ala Asn Gly Asn Leu Ala Val Trp Pro Val Gly Thr Gly Gly Thr
            405                 410                 415Lys Ile His Ser Gly Val Thr Lys Val Gln Phe Ser Gln Tyr Asn Asp
        420                 425                 430Arg Lys Asp Glu Val Arg Thr Gln Thr Tyr Asp Ser Lys Arg Asn Val
    435                 440                 445Gly Gly Ile Val Phe Asp Ser Ile Asp Gln Leu Pro Pro Ile Thr Thr
450                 455                 460Asp Glu Ser Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Val Arg465                 470                 475                 480Cys Phe Leu Leu Gln Gly Gly Arg Gly Ile Ile Pro Val Phe Thr Trp
            485                 490                 495Thr His Lys Ser Val Asp Phe Tyr Asn Thr Leu Asp Ser Glu Lys Ile
        500                 505                 510Thr Gln Ile Pro Phe Val Lys Ala Phe Ile Leu Val Asn Ser Thr Ser
    515                 520                 525Val Val Ala Gly Pro Gly Phe Thr Gly Gly Asp Ile Ile Lys Cys Thr
530                 535                 540Asn Gly Ser Gly Leu Thr Leu Tyr Val Thr Pro Ala Pro Asp Leu Thr545                 550                 555                 560Tyr Ser Lys Thr Tyr Lys Ile Arg Ile Arg Tyr Ala Ser Thr Ser Gln
            565                 570                 575Val Arg Phe Gly Ile Asp Leu Gly Ser Tyr Thr His Ser Ile Ser Tyr
        580                 585                 590Phe Asp Lys Thr Met Asp Lys Gly Asn Thr Leu Thr Tyr Asn Ser Phe
    595                 600                 605Asn Leu Ser Ser Val Ser Arg Pro Ile Glu Ile Ser Gly Gly Asn Lys
610                 615                 620Ile Gly Val Ser Val Gly Gly Ile Gly Ser Gly Asp Glu Val Tyr Ile625                 630                 635                 640Asp Lys Ile Glu Phe Ile Pro Met Asp
            645(2)序列编号110的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (C)链的性质:
    (D)拓扑学:线性(xi) 序列描述: 序列编号: 110:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                   10                  15Asn Ser Glu Leu Pro Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
        20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
    35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
            85                  90                 95Asp Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Val Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Ser
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Ile Tyr Phe Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Gly Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Ile Val Ile
        580                 585                 590Tyr IIe Asn Lys Thr Met Asn Ile Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Thr
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                650(2)序列编号111的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (C)链的性质:
(D)拓扑学:线性(xi) SEQUENCE DESCRIPTION:SEQ ID NO:111:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1               5                   10                  15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
        20                  25                  30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
    35                  40                  45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50                  55                  60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65                  70                  75                  80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
            85                  90                  95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
        100                 105                 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
    115                 120                 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130                 135                 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145                 150                 155                 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
            165                 170                 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
        180                 185                 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
    195                 200                 205Leu Lys Asp ALa Gln Val Phe Gly Glu Glu Trp Gly Tyr 5er Ser Glu
210                 215                 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225                 230                 235                 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
            245                 250                 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
        260                 265                 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
    275                 280                 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290                 295                 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305                 310                 315                 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
            325                 330                 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
        340                 345                 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
    355                 360                 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370                 375                 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385                 390                 395                 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
            405                 410                 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
        420                 425                 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
    435                 440                 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450                 455                 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465                 470                 475                 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
            485                 490                 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
        500                 505                 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
    515                 520                525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530                 535                 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545                 550                 555                 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
            565                 570                 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
        580                 585                 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
    595                 600                 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610                 615                 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625                 630                 635                 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
            645                 650(2)序列编号112的信息:
(i)序列特征:
    (A)长度:659个氨基酸
    (B)类型:氨基酸
    (C)链的性质:
    (D)拓扑学:线性(xi)序列描述:序列编号:112Met Ile Arg Met Gly Gly Arg Lys Met Asn Pro Asn Asn Arg Ser Glu1               5                   10                  15Tyr Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu Pro Thr Asn His
        20                  25                  30Asn Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr Leu Glu Glu Leu
    35                  40                  45Asn Tyr Lys Glu Phe Leu Arg Met Thr Ala Asp Asn Ser Thr Glu Val
50                  55                  60Leu Asp Ser Ser Thr Val Lys Asp Ala Val Gly Thr Gly Ile Ser Val65                  70                  75                   80Val Gly Gln Ile Leu Gly Val Val Gly Val Pro Phe Ala Gly Ala Leu
            85                  90                  95Thr Ser Phe Tyr Gln Ser Phe Leu Asn Ala Ile Trp Pro Ser Asp Ala
        100                 l05                 110Asp Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val Leu Ile Asp Lys
    115                 120                 125Lys Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala Glu Leu Gln Gly
130                 135                 140Leu Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu Asp Ser Trp Lys145                 150                 155                 160Lys Ala Pro Val Asn Leu Arg Ser Arg Arg Ser Gln Asp Arg Ile Arg
            165                 170                 175Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro Ser
        180                 185                 190Phe Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro Thr Tyr Ala Gln
    195                 200                 205Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala Gln Val Phe Gly
210                 215                 220Glu Glu Trp Gly Tyr Ser Ser Glu Asp Ile Ala Glu Phe Tyr Gln Arg225                 230                 235                 240Gln Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys Val Asn Trp Tyr
            245                 250                 255Asn Val Gly Leu Asn Ser Leu Arg Gly Ser Thr Tyr Asp Ala Trp Val
        260                 265                 270Lys Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu
    275                 280                 285Ile Val Leu Phe Pro Phe Tyr Asp Val Arg Leu Tyr Ser Lys Gly Val
290                 295                 300Lys Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro Ile Phe Thr Leu305                 310                 315                 320Asn Ala Leu Gln Glu Tyr Gly Pro Thr Phe Ser Ser Ile Glu Asn Ser
            325                 330                 335Ile Arg Lys Pro His Leu Phe Asp Tyr Leu Arg Gly Ile Glu Phe His
        340                 345                 350Thr Arg Leu Arg Pro Gly Tyr Ser Gly Lys Asp Ser Phe Asn Tyr Trp
    355                 360                365Ser Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly Ser Asn Asp Thr
370                 375                 380Ile Thr Ser Pro Phe Tyr Gly Asp Lys Ser Ile Glu Pro Ile Gln Lys385                 390                 395                 400Leu Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile Ala Asn Thr Asp
            405                 410                 415Ile Ala Ala Phe Pro Asp Gly Lys Ile Tyr Phe Gly Val Thr Lys Val
        420                 425                 430Asp Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr Ser Thr Gln Thr
    435                 440                 445Tyr Asp Ser Lys Arg Tyr Asn Gly Tyr Leu Gly Ala Gln Asp Ser Ile
450                 455                 460Asp Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Ala Tyr465                 470                 475                 480Ser His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met Gln Asp Arg Arg
            485                 490                 495Gly Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser Val Asp Phe Phe
        500                 505                 510Asn Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro Val Val Lys Ala
    515                 520                 525Tyr Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly Pro Gly Phe Thr
530                 535                 540Gly Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn Ser Ile Ala Lys545                 550                 555                 560Phe Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln Arg Tyr Arg Val
            565                 570                 575Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu Phe Val Gln Asn
        580                 585                 590Ser Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys Thr Met Asn Ile
    595                 600                 605Asp Gly Asp Leu Thr Tyr Gln Thr Phe Asp Phe Ala Thr Ser Asn Ser
610                 615                 620Asn Met Gly Phe Ser Gly Asp Thr Asn Asp Phe Ile Ile Gly Ala Glu625                 630                 635                 640Ser Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys Ile Glu Phe Ile
            645                 650                 655Pro Val Gln(2)序列编号113的信息:
(i)序列特征:
    (A)长度:652个氨基酸
    (B)类型:氨基酸
    (C)链的性质:
    (D)拓扑学:线性(xi)序列描述:序列编号:113:Met Ile Arg Lys Gly Gly Arg Lys Met Asn Pro Asn Asn Arg Ser Glu1               5                   10                  15His Asp Thr Ile Lys Thr Thr Glu Asn Asn Glu Val Pro Thr Asn His
        20                  25                  30Val Gln Tyr Pro Leu Ala Glu Thr Pro Asn Pro Thr Leu Glu Asp Leu
    35                  40                 45Asn Tyr Lys Glu Phe Leu Arg Met Thr Ala Asp Asn Asn Thr Glu Ala
50                  55                  60Leu Asp Ser Ser Thr Thr Lys Asp Val Ile Gln Lys Gly Ile Ser Val65                  70                  75                  80Val Gly Asp Leu Leu Gly Val Val Gly Phe Pro Phe Gly Gly Ala Leu
            85                  90                  95Val Ser Phe Tyr Thr Asn Phe Leu Asn Thr Ile Trp Pro Ser Glu Asp
        100                 105                110Pro Trp Lys Ala Phe Met Glu Gln Val Glu Ala Leu Met Asp Gln Lys
    115                 120                 125Ile Ala Asp Tyr Ala Lys Asn Lys Ala Leu Ala Glu Leu Gln Gly Leu
130                 135                 140Gln Asn Asn Val Glu Asp Tyr Val Ser Ala Leu Ser Ser Trp Gln Lys145                 150                 155                 160Asn Pro Val Ser Ser Arg Asn Pro His Ser Gln Gly Arg Ile Arg Glu
            165                 170                175Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro Ser Phe
        180                 185                 190Ala Ile Ser Gly Tyr Glu Val Leu Phe Leu Thr Thr Tyr Ala Gln Ala
    195                 200                 205Ala Asn Thr His Leu Phe Leu Leu Lys Asp Ala Gln Ile Tyr Gly Glu
210                 215                 220Glu Trp Gly Tyr Glu Lys Glu Asp Ile Ala Glu Phe Tyr Lys Arg Gln225                 230                 235                 240Leu Lys Leu Thr Gln Glu Tyr Thr Asp His Cys Val Lys Trp Tyr Asn
            245                 250                 255Val Gly Leu Asp Lys Leu Arg Gly Ser Ser Tyr Glu Ser Trp Val Asn
        260                 265                 270Phe Asn Arg Tyr Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile
    275                 280                 285Ala Leu Phe Pro Leu Tyr Asp Val Arg Leu Tyr Pro Lys Glu Val Lys
290                 295                 300Thr Glu Leu Thr Arg Asp Val Leu Thr Asp Pro Ile Val Gly Val Asn305                 310                 315                 320Asn Leu Arg Gly Tyr Gly Thr Thr Phe Ser Asn Ile Glu Asn Tyr Ile
            325                 330                 335Arg Lys Pro His Leu Phe Asp Tyr Leu His Arg Ile Gln Phe His Thr
        340                 345                 350Arg Phe Gln Pro Gly Tyr Tyr Gly Asn Asp Ser Phe Asn Tyr Trp Ser
    355                 360                 365Gly Asn Tyr Val Ser Thr Arg Pro Ser Ile Gly Ser Asn Asp Ile Ile
370                 375                 380Thr Ser Pro Phe Tyr Gly Asn Lys Ser Ser Glu Pro Val Gln Asn Leu385                 390                 395                 400Glu Phe Asn Gly Glu Lys Val Tyr Arg Ala Val Ala Asn Thr Asn Leu
            405                 410                 415Ala Val Trp Pro Ser Ala Val Tyr Ser Gly Val Thr Lys Val Glu Phe
        420                 425                 430Ser Gln Tyr Asn Asp Gln Thr Asp Glu Ala Ser Thr Gln Thr Tyr Asp
    435                 440                 445Ser Lys Arg Asn Val Gly Ala Val Ser Trp Asp Ser Ile Asp Gln Leu
450                 455                 460Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Gly Tyr Ser His Gln465                 470                 475                 480Leu Asn Tyr Val Met Cys Phe Leu Met Gln Gly Ser Arg Gly Thr Ile
            485                 490                 495Pro Val Leu Thr Trp Thr His Lys Ser Val Asp Phe Phe Asn Met Ile
        500                 505                 510Asp Ser Lys Lys Ile Thr Gln Leu Pro Leu Val Lys Ala Tyr Lys Leu
    515                 520                 525Gln Ser Gly Ala Ser Val Val Ala Gly Pro Arg Phe Thr Gly Gly Asp
530                 535                 540Ile Ile Gln Cys Thr Glu Asn Gly Ser Ala Ala Thr Ile Tyr Val Thr545                 550                 555                 560Pro Asp Val Ser Tyr Ser Gln Lys Tyr Arg Ala Arg Ile His Tyr Ala
            565                 570                 575Ser Thr Ser Gln Ile Thr Phe Thr Leu Ser Leu Asp Gly Ala Pro Phe
        580                 585                 590Asn Gln Tyr Tyr Phe Asp Lys Thr Ile Asn Lys Gly Asp Thr Leu Thr
    595                 600                 605Tyr Asn Ser phe Asn Leu Ala Ser Phe Ser Thr Pro Phe Glu Leu Ser
610                 615                 620Gly Asn Asn Leu Gln Ile Gly Val Thr Gly Leu Ser Ala Gly Asp Lys625                 630                 635                 640Val Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Asn
            645                 650

Claims (116)

1.一种苏云金芽胞杆菌Cry3Bb多肽,被修饰以具有改善的杀虫活性或增强的针对目标害虫的杀虫特异性,上述的多肽含有的序列是对天然的或没有被修饰的Cry3Bb多肽的一级序列进行了至少一个氨基酸替代,一个氨基酸添加,或者一个氨基酸删除后获得的,其中上述的取代或删除发生的位置是对应于未经修饰的多肽氨基酸序列的大约第1至大约365位氨基酸之间。
2.如权利要求1中所述的多肽,其中Asp103由谷氨酸替代;Ala104删除;Thr154被甘氨酸或苯丙氨酸替代;Pro155被组氨酸替代;Leu156被组氨酸替代;Leu158被精氨酸替代;Ser160被天冬酰胺替代;Lys161被脯氨酸替代;Pro162被组氨酸替代;Asp165被甘氨酸替代;Lys189被甘氨酸替代;Ser223被脯氨酸替代;Tyr230被亮氨酸或丝氨酸替代;His231被精氨酸、天冬酰胺、丝氨酸、或苏氨酸替代;Thr241被丝氨酸替代;Tyr287被苯丙氨酸替代;Asp288被天冬酰胺替代;Ile289被苏氨酸或缬氨酸替代;Arg290被天冬酰胺、亮氨酸或缬氨酸替代;Leu291被精氨酸替代;Tyr292被苯丙氨酸替代;Ser293被精氨酸或脯氨酸替代;Phe305被丝氨酸替代;Ser311被丙氨酸、异亮氨酸、亮氨酸、或苏氨酸替代;Leu312被脯氨酸或缬氨酸替代;Asn313被精氨酸、组氨酸、苏氨酸或缬氨酸替代;Thr314被天冬酰胺替代;Leu315被脯氨酸替代;Gln316被天冬氨酸、亮氨酸、甲硫氨酸、或色氨酸替代;Glu317被丙氨酸、天冬酰胺、赖氨酸或缬氨酸替代;Tyr318被半胱氨酸替代;Gln348被精氨酸替代;或Val365被丙氨酸替代。
3.如权利要求1或2中所述的多肽,其中Thr154被苯丙氨酸替代、Pro155被组氨酸替代、Leu156被组氨酸替代、以及Leu158被精氨酸替代。
4.如权利要求1或2中所述的多肽,其中Tyr230被亮氨酸替代、His231由丝氨酸替代。
5.如权利要求1或2中所述的多肽,其中Ser223被脯氨酸替代、Tyr230被丝氨酸替代。
6.如权利要求1或2中所述的多肽,其中His231被精氨酸替代。
7.如权利要求1或2中所述的多肽,其中His231被天冬酰胺替代、Thr241被丝氨酸替代。
8.如权利要求1或2中所述的多肽,其中的His231被苏氨酸替代。
9.如权利要求1或2中所述的多肽,其中Arg290被天冬酰胺替代。
10.如权利要求1或2中所述的多肽,其中Ser311被亮氨酸替代,Asn313被苏氨酸替代,而且Glu317被赖氨酸替代。
11.如权利要求1或2中所述的多肽,其中Ser311被苏氨酸替代,Glu317被赖氨酸替代,而且Tyr-318被半胱氨酸替代。
12.如权利要求1或2中所述的多肽,其中Ser311被丙氨酸替代,Leu312被缬氨酸替代,而且Gln316被色氨酸替代。
13.如权利要求1或2中所述的多肽,其中His231被精氨酸替代,Ser311被亮氨酸替代,Asn313被苏氨酸替代,而且Glu317被赖氨酸替代。
14.如权利要求1或2中所述的多肽,其中Ser311被苏氨酸替代,Leu312被脯氨酸替代,Asn313被苏氨酸替代,而且Glu317被天冬酰胺替代。
15.如权利要求1或2中所述的多肽,其中Ser311被丙氨酸替代,而且Gln316被天冬氨酸替代。
16.如权利要求1或2中所述的多肽,其中Ile289被苏氨酸替代,Leu291被精氨酸替代,Tyr292被苯丙氨酸替代,而且Ser293被精氨酸替代。
17.如权利要求1或2中所述的多肽,其中His231被精氨酸替代,而且Ser311被亮氨酸替代。
18.如权利要求1或2中所述的多肽,其中Ser311被异亮氨酸替代。
19.如权利要求1或2中所述的多肽,其中Ser311被异亮氨酸替代,而且Asn313被组氨酸替代。
20.如权利要求1或2中所述的多肽,其中Asn313被缬氨酸替代,Thr314被天冬酰胺替代,Gln316被甲硫氨酸替代,而且Glu317被缬氨酸替代。
21.如权利要求1或2中所述的多肽,其中Asn313被精氨酸替代,Leu315被脯氨酸替代,Gln316被亮氨酸替代,而且Glu317被丙氨酸替代。
22.如权利要求1或2中所述的多肽,其中Tyr287被苯丙氨酸替代,Asp288被天冬酰胺替代,而且Arg290被亮氨酸替代。
23.如权利要求1或2中所述的多肽,其中Arg290被缬氨酸替代。
24.如权利要求1或2中所述的多肽,其中Asp165被甘氨酸替代。
25.如权利要求1或2中所述的多肽,其中Ser160被天冬酰胺替代,Lys161被脯氨酸替代,Pro162被组氨酸替代,而且Thr154被甘氨酸替代。
26.如权利要求1或2中所述的多肽,其中Ile289被缬氨酸替代,而且Ser293被脯氨酸替代。
27.如权利要求1或2中所述的多肽,其中Ser160被天冬酰胺替代,Lys161被脯氨酸替代,Pro162被组氨酸替代,Asp165被甘氨酸替代,Ile289被缬氨酸替代,而且Ser293被脯氨酸替代。
28.如权利要求1或2中所述的多肽,其中Asp103被谷氨酸替代,而且Ala104被删除。
29.如权利要求1或2中所述的多肽,其中Lys189被甘氨酸替代。
30.如权利要求1或2中所述的多肽,,其中Asp103被谷氨酸替代,Ala104被删除,Ser160被天冬酰胺替代,Lys161被脯氨酸替代,Pro162被组氨酸替代,而且Asp165被甘氨酸替代。
31.如权利要求1或2中所述的多肽,其中Asp103被谷氨酸替代,Ala104被删除,Thr154被苯丙氨酸替代,Pro155被组氨酸替代,Leu156被组氨酸替代,而且Leu158被精氨酸替代。
32.如权利要求1或2中所述的多肽,其中Asp165被甘氨酸替代,Ser311被苏氨酸替代,而且Glu317被赖氨酸替代。
33.如权利要求1或2中所述的多肽,其中Asp165被甘氨酸替代,Ile289被缬氨酸替代,Ser293被脯氨酸替代,Phe305被丝氨酸替代,Ser311被丙氨酸替代,Leu312被缬氨酸替代,Gln316被色氨酸替代,Gin348被精氨酸替代,而且Val365被丙氨酸替代。
34.如权利要求1或2中所述的多肽,其中Ile289被缬氨酸替代,Ser293被脯氨酸替代,而且Gln348被精氨酸替代。
35.如权利要求1或2中所述的多肽,其中Asp165被甘氨酸替代,而且Ser311被亮氨酸替代。
36.如权利要求1或2中所述的多肽,其中的前159个氨基酸被删除。
37.如权利要求1或2中所述的多肽,其中Gln348被精氨酸替代。
38.如权利要求1或2中所述的多肽,其中Asp165被甘氨酸替代,His231被精氨酸替代,Ser311被亮氨酸替代,Asn313被苏氨酸替代,而且Glu317被赖氨酸替代。
39.如上面的任何一条权利要求中所述的多肽,其中上述的多肽含有选自以下群体的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,以及序列编号:108。
40.如上面的任何一条权利要求中所述的多肽,其中上述的多肽是由选自以下群体的连续的核苷酸序列编码的:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,以及序列编号:107。
41.一种包含杀虫有效量的如权利要求1中所述的Cry3Bb多肽的组合物。
42.如权利要求41中所述的组合物,包含大约0.5%至99%(重量比)的如权利要求1中所述的多肽。
43.如权利要求41或42中所述的组合物,其中上述的多肽含有选自以下群体的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:72,序列编号:100,以及序列编号:108。
44.如权利要求41至43中任一所述的组合物,其中上述的多肽是由具有以下序列的核苷酸编码的:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:71,序列编号:99,或序列编号:107。
45.如权利要求41至44中任一所述的组合物,通过以下步骤进行制备:
(a)在能够有效产生杀虫多肽的条件下培养一种苏云金芽胞杆菌NRRL B-21744,NRRL B-21745,NRRL B-21746,NRRL B-21747,NRRLB-21748,NRRL B-21749,NRRL B-21750,NRRL B-21751,NRRL B-21752,NRRL B-21753,NRRL B-21754,NRRL B-21755,NRRL B-21756,NRRL B-21757,NRRL B-21758,NRRL B21759,NRRL B-21760,NRRLB-21761,NRRL B-21762,NRRL B-21763,NRRL B-21764,NRRL B-21765,NRRL B-21766,NRRL B-21767,NRRL B-21768,NRRL B-21769,NRRL B-21770,NRRL B-21771,NRRL B-21772,NRRL B-21773,NRRLB-21774,NRRL B-21775,NRRL B-21776,NRRL B-21777,NRRL B-21778,NRPLB-21779,或EG11098细胞,以及
(b)从上述细胞中获得上述的杀虫多肽。
46.如权利要求41至45中任一所述的组合物,包含一种苏云金芽胞杆菌NRRL B-21744,NRRL B-21745,NRRL B-21746,NRRL B21747,NRRL B-21748,NRRL B-21749,NRRL B-21750,NRRL B-21751,NRRLB-21752,NRRL B-21753,NRRL B-21754,NRRL B-21755,NRRL B-21756,NRRL B-21757,NRRL B-21758,NRRL B-21759,NRRL B-21760,NRRL B-21761,NRRL B-21762,NRRL B-21763,NRPLB-21764,NRRLB-21765,NRRL B-21766,NRRL B-21767,NRPLB-21768,NRRL B-21769,NRRL B-21770,NRRL B-21771,NRRL B-21772,NRRL B-21773,NRRL B-21774,NRRL B-21775,NRRL B-21776,NRRL B-21777,NRRLB-21778,或NRRL B-21779细胞。
47.如权利要求41至46中任一所述的组合物,其中上述的组合物含有一种苏云金芽胞杆菌NRRL B-21744,NRRL B-21745,NRR.LB-21746,NRRL B-21747,NRRL B-21748,NRRL B-21749,NRRL B-21750,NRRL B-21751,NRRL B-21752,NRRL B-21753,NRRL B-21754,NRRLB-21755,NRRL B-21756,NRRL B-21757,NRRL B-21758,NRPLB-21759,NRRL B-21760,NRRL B-21761,NRPLB-21762,NRRL B-21763,NRRL B-21764,NRRL B-21765,NRRL B-21766,NRPLB-21767,NRRLB-21768,NRRL B-21769,NRRL B-21770,NRRL B-21771,NRRL B-21772,NRRL B-21773,NRRL B-21774,NRRL B-21775,NRR-LB-21776,NRRL B-21777,NRRL B-21778,NRRL B-21779,或EG11098细胞的细胞提取物、细胞悬浮液、蛋白部分、晶体部分、细胞培养物、细胞匀浆物、细胞裂解物、细胞上清液、细胞过滤液(filtrate)、或细胞沉淀物。
48.如权利要求41至47中任一所述的组合物,配制成粉末、颗粒、喷雾剂、乳剂、胶体、或溶液。
49.如权利要求41至48中任一所述的组合物,其中上述的组合物是通过干燥、冻干、匀浆、冷冻干燥、乳化作用、蒸发、分离、提取、过滤、离心、沉降、稀释、结晶、或浓缩进行制备的。
50.一种多聚核苷酸,含有一个独立的编码如权利要求1至40中所述的多肽的序列区域。
51.如权利要求50中所述的多聚核苷酸,包含一个编码含有选自以下群体的氨基酸序列的多肽的分离的序列区域:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:72,序列编号:100,以及序列编号:108。
52.如权利要求50或51中所述的多聚核苷酸,含有选自以下群体的连续的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:99,以及序列编号:107。
53.如权利要求50至53中任一权利要求所述的多聚核苷酸,其特征是DNA,cDNA,rRNA,或mRNA.
54.如权利要求50至53中任一所述的多聚核苷酸,其中上述的多聚核苷酸的长度是介于大约2000至大约10,000个核苷酸之间。
55.如权利要求50至54中任一所述的多聚核苷酸,其中上述的核苷酸片段的长度是介于大约3,000至大约8,000个核苷酸之间。
56.如权利要求50至55中任一所述的多聚核苷酸,其中上述的分离的序列区域以可操作的形式与一个启动子相连接,上述的启动子表达上述的序列区域。
57.如权利要求50至56中任一所述的多聚核苷酸,其中上述的分离的序列区域以可操作的形式与一个异源启动子相连接。
58.如权利要求50至57中任一所述的多聚核苷酸,其中上述的分离的序列区域以可操作的形式与一个可以在植物中表达的启动子相连接。
59.如权利要求50至58中任一所述的多聚核苷酸,其中上述的分离的序列区域以可操作的形式与一个组成型、诱导型、或组织特异性的启动子相连接。
60.含有如权利要求50至59中任一所述的多聚核苷酸、或编码如权利要求1至40中任一所述的多肽的多聚核苷酸的载体。
61.如权利要求60中所述的载体,定义为质粒、粘粒、噬粒、噬菌体、病毒、或杆状病毒群。
62.如权利要求60或61中所述的载体,是在原核或真核宿主中转化和复制的。
63.一种含有如权利要求1至40中任一所述多肽,或者如权利要求50至59中任一所述的多肽的病毒。
64.一种含有如权利要求1至40中任一所述多肽、如权利要求50至59中任一所述的多核苷酸、如权利要求60至62中任一所述的载体、或者如权利要求63中所述的病毒的经过转化的宿主细胞。
65.如权利要求64中所述的经过转化的宿主细胞,进一步被定义为原核或真核细胞。
66.如权利要求64或65中所述的经过转化的宿主细胞,其中上述的原核细胞是一种真细菌类的、古细菌类的或蓝细菌类的细胞,或者其中上述的真核细胞是一种动物、真菌、或植物细胞。
67.如权利要求64至66中任一所述的经过转化的宿主细胞,其中上述的细胞是大肠杆菌、苏云金芽胞杆菌、A.Tumefaciens、B.Subtilis、B.Megaterium、B.Cereus、沙门氏菌属或假单胞杆菌属细胞。
68.如权利要求64至67中任一所述的经过转化的宿主细胞,其中上述的细胞是选自以下群体的:苏云金芽胞杆菌NRRL B-21744,NRRLB-21745,NRRL B-21746,NRRL B-21747,NRRL B-21748,NRRL B-21749,NRRL B-21750,NP-RL B-21751,NRRL B-21752,NRRL B-21753,NRRL B-21754,NRRL B-21755,NRRL B-21756,NRRL B-21757,NRRLB-21758,NRRL B-21759,NRRL B-21760,NRRL B-21761,NRRL B-21762,NRRL B21763,NRRL B-21764,NRRL B-21765,NRRL B-21766,NRRL B-21767,NRRL B-21768,NRRL B-21769,NRRL B-21770,NRRLB-21771,NRRL B21772,NRRL B-21773,NRRL B-21774,NRRL B-21775,NRRL B-21776,NRRL B-21777,NRRL B-21778,以及NRRL B-21779。
69.如权利要求66中所述的经过转化的宿主细胞,其中上述的植物细胞是一种谷物、树木、豆类、纤维、蔬菜、水果、浆果、坚果、柑橘、草、仙人掌、肉质植物、或者观赏植物的细胞。
70.如权利要求69中所述的经过转化的宿主细胞,其中上述的植物细胞是一种谷物、稻谷、烟草、苜蓿、大豆、高粱、土豆、番茄、亚麻、芸薹、向日葵、棉花、亚麻、木棉花、小麦、燕麦、大麦、或黑麦细胞。
71.如权利要求64至70中任一所述的经过转化的宿主细胞,其中上述的多聚核苷酸是通过一种载体、病毒、粘粒、噬菌粒、噬菌体、质粒、或通过电穿孔、转化、接合、微粒轰击、直接DNA注射、裸DNA转移、转化、或转染引入上述细胞中的。
72.含有如权利要求1至40中任一所述的多肽、如权利要求50至59中任一所述的多聚核苷酸、如权利要求60至62中任一所述的载体、如权利要求63中所述的病毒、或者如权利要求64至71中任一所述的宿主细胞的转基因植物。
73.如权利要求72中所述的转基因植物,在其基因组中结合有一个选定的编码如权利要求1至40中任一所述的多肽的多聚核苷酸。
74.如权利要求72或73中所述的转基因植物,其中上述的多肽含有一个选自以下群体的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,以及序列编号:108。
75.如权利要求72至74中任一所述的转基因植物,其中上述的植物是一种谷物、树木、豆类、纤维、蔬菜、水果、浆果、坚果、柑橘、草、仙人掌、肉质植物、或者观赏植物。
76.如权利要求62至75中任一所述的转基因植物,其中上述的植物是一种谷物、稻谷、烟草、苜蓿、大豆、高粱、土豆、番茄、亚麻、芸薹、向日葵、棉花、亚麻、木棉花、小麦、燕麦、大麦、或黑麦。
77.如权利要求72至76中任一所述的转基因植物的任何一代的子代。
78.如权利要求72至76中任一所述的转基因植物的任何一代的种子。
79.权利要求77中所述的任何一代子代的种子。
80.一种从权利要求78或79中所述的种子生长出来的植物。
81.一种用于杀死鞘翅类昆虫的方法,上述的方法包括以下步骤:使上述的昆虫接触杀虫有效数量的权利要求1中所述的多肽。
82.一种用于控制鞘翅类昆虫种群的方法,上述的方法包括以下步骤:给上述昆虫种群的环境提供杀虫有效数量的权利要求1中所述的多肽。
83.如权利要求81或82中所述的方法,其中上述的多肽是得自以下苏云金芽胞杆菌种类的细胞的细胞提取物、细胞悬浮液、蛋白部分、晶体部分、细胞培养物、细胞匀浆物、细胞裂解物、细胞上清液、细胞过滤液、或细胞沉淀物:NRRL B-21744,NRRL B-21745,NRRLB-21746,NRRL B21747,NRRL B-21748,NRRL B-21749,NRRL B-21750,NRRL B-21751,NRRL B-21752,NRRL B-21753,NRRL B-21754,NRRLB-21755,NRRL B21756,NRRL B-21757,NRRL B-21758,NRRL B-21759,NRRL B-21760,NRRL B-21761,NRRL B-21762,NRRL B-21763,NRPLB-21764,NRRL B21765,NRRL B-21766,NRRL B-21767,NRRLB-21768,NRRL B-21769,NRRL B-21770,NRRL B-21771,NRRL B-21772,NRRL B-21773,NRRL B-21774,NRRL B-21775,NRRL B-21776,NRRL B-21777,NRRL B-21778,或NRRL B-21779细胞。
84.如权利要求81至83中任一所述的方法,其中上述的多肽是通过喷雾、沾尘(dusting)、喷洒、浸泡、充气、撒雾(misting)、喷雾(atomizing)、土壤注射、土壤耕种、种子涂覆、或幼苗涂覆来提供给上述环境的。
85.如权利要求81至84中任一所述的方法,其中上述的多肽是被配制成粉末、颗粒、喷剂、乳剂、胶体、或溶液。
86.如权利要求81至85中任一所述的方法,其中上述的多肽是通过干燥、冻干、匀浆、冷冻干燥、乳化作用、蒸发、分离、提取、过滤、离心、沉淀、稀释、结晶、或浓缩进行制备的。
87.一种制备能够抵抗鞘翅类的转基因植物的方法,包括以下步骤:
(a)用一种含有一个选定的编码权利要求1中所述多肽的序列区域的多聚核苷酸转化一种植物细胞,其中上述的序列区域是以可操作的形式与一个表达上述序列区域的启动子相连接;以及
(b)从上述的植物细胞产生一个含有上述选定的序列区域并表达上述多肽的转基因植物。
88.如权利要求87中所述的方法,其中上述的序列区域编码一个含有一个选自以下群体的氨基酸序列的多肽:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,以及序列编号:108。
89.一种杀死鞘翅类昆虫的方法,包括给上述的昆虫喂食一种经一种多聚核苷酸转化的植物细胞,上述的多聚核苷酸编码一种选自以下群体的氨基酸:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,以及序列编号:108。
90.如权利要求89中所述的方法,其中上述的昆虫通过摄取含有上述经过转化的细胞的转基因植物的一部分而被杀死。
91.一种制备能抵抗鞘翅类昆虫攻击的植物种子的方法,上述的方法包括以下步骤:
(a)用一个核苷酸片段转化植物的细胞以获得一个经过转化的植物细胞,上述的核苷酸片段含有一个编码一个选自以下群体的氨基酸序列的多聚核苷酸:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10.序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,以及序列编号:108。
(b)在可以有效地从上述的细胞生产转基因植物的条件下生长上述的转基因植物;以及
(c)从上述的转基因植物获得可以抵抗上述鞘翅类昆虫攻击的种子。
92.如权利要求91中所述的方法,其中步骤(a)包括通过电穿孔、转化、裸DNA摄入、原生质体产生、DNA直接转移进入花粉、胚胎或多能植物细胞、土壤杆菌介导的转化、粒子轰击、或者微粒轰击对上述的植物进行转化。
93.如权利要求91或92中所述的方法,其中步骤(b)包括从上述的经过转化的植物细胞产生多能植物细胞。
94.一种用于生产一种经过修饰的、杀虫活性或特异性提高的CryBb多肽的方法,包括:
(a)获得上述多肽的高分辨率三维晶体结构;
(b)在上述多肽的上述晶体结构中对一个或多个结合水的区域进行定位,其中上述的结合水形成了连续的含水表面,这些表面分隔不超过16_。
(c)增加上述多肽在上述区域的一个或多个氨基酸的疏水性;以及
(d)获得如此生产的经过修饰的Cry3Bb多肽。
95.一种用于生产一种经过修饰的、杀虫活性或特异性提高的Cry3Bb多肽的方法,包括:
(a)获得上述多肽的高分辨率三维晶体结构;
(b)识别上述多肽中的一个环区域;
(c)修饰上述环区域的一个或多个氨基酸以增加上述的一个或多个氨基酸的疏水性;以及
(d)获得如此生产的经过修饰的Cry3Bb多肽。
96.一种增加Cry3Bb多肽中形成通道的螺旋的流动性的方法,包括打断在一个或多个上述的形成通道的螺旋中的第一个氨基酸和所述多肽的第二个氨基酸之间所形成的一个或多个氢键。
97.如权利要求96中所述的方法,其中上述的氢键形成于分子之间或分子内部。
98.如权利要求96中所述的方法,其中上述的打断包括把上述的第一个氨基酸或第二个氨基酸替换成第三个氨基酸,后者的空间距离键角大于3_,或者空间定向相对于上述的第一个或第二个氨基酸的氢结合位置不是180+/-60度角。
99.一种增加Cry3Bb多肽中位于形成通道的结构域的环区域的柔韧性的方法,包括:
(a)获得一种在毗邻的α-螺旋之间有一个或多个环区域的Cry3Bb多肽的晶体结构。
(b)鉴定包含上述环区域的氨基酸;以及
(c)改变在上述环区域中的一个或多个上述的氨基酸以减少在上述区域的空间位阻,其中上述的改变增加了上述多肽中的上述环区域的柔性。
100.一种增加Cry3Bb多肽的杀虫活性的方法,包括减少或消除上述多肽对目标昆虫肠道中的碳水化合物的结合。
101.如权利要求100中所述的方法,其中上述的减少或消除是通过除去上述多肽的结构域1中的一个或多个α-螺旋来实现的。
102.如权利要求100中所述的方法,其中上述的减少或消除是通过除去α-螺旋α1、α2a/b、或α3来实现的。
103.如权利要求102中所述的方法,其中上述的减少或消除是通过把环区域β1,α8中的一个或多个氨基酸替换为一个或多个疏水性提高的氨基酸来实现的。
104.如权利要求103中所述的方法,其中上述的减少或消除是通过把苏氨酸154、脯氨酸155、亮氨酸156、以及亮氨酸158中的一个或多个氨基酸替换成其它的氨基酸来实现的。
105.一种用于制备一种经过修饰的、杀虫活性或特异性提高(与未经修饰的Cry3Bb多肽相比)的CryBb多肽的方法,包括以下步骤:
(a)获得上述多肽的晶体结构;
(b)在上述的晶体结构中鉴定出上述多肽中的一个或多个暴露于表面的氨基酸。
(c)对上述的暴露于表面的一个或多个氨基酸进行随机的替换以获得许多突变的多肽,其中至少50%的上述的突变多肽其杀虫活性减少或减弱。
(d)从上述的许多突变多肽中确定一个上述Cry3Bb多肽的区域用于定位突变;以及
(e)突变上述的区域以获得上述的杀虫活性或特异性提高的Cry3Bb多肽。
106.如权利要求105中所述的方法,进而包括确定上述的多个杀虫活性或特异性减少的突变多肽的氨基酸,以及鉴定上述活性或特异性所需的一个或多个氨基酸残基。
107.一种用于制备一种杀虫活性提高的Cry3Bb多肽的方法,包括:
(a)获得上述多肽的高分辨率三维晶体结构;
(b)确定上述多肽的静电表面分布;
(c)确定一个或多个静电差异大的区域;
(d)对上述区域中的一个或多个氨基酸进行改变以修饰上述区域的静电差异;以及
(e)获得上述的杀虫活性提高的Cry3Bb多肽。
108.如权利要求107中所述的方法,其中上述的静电差异相对于天然的Cry3Bb多肽的静电差异被减少了。
109.如权利要求107中所述的方法,其中上述的静电差异相对于天然的Cry3Bb多肽的静电差异被增加了。
110.一种用于制备一种杀虫活性提高的Cry3Bb多肽的方法,包括:
(a)获得上述多肽的高分辨率三维晶体结构;
(b)确定在上述多肽中的一个或多个金属结合位置;
(c)改变上述结合位置中的一个或多个氨基酸;以及
(d)获得上述的经过改变的多肽,其中上述的多肽的杀虫活性提高了。
111.如权利要求110中所述的方法,其中上述的改变消除了金属的结合。
112.一种用于鉴定一种通道活性提高的Cry3Bb多肽的方法,包括:
(a)获得一种被怀疑通道活性提高的Cry3Bb多肽;
(b)确定上述多肽以及一个野生型多肽的以下一个或多个特征:通道形成的速率、通道导率的生长速率或者通道开启状态的持续时间;
(c)比较上述突变型和上述野生型的上述特征;以及
(d)确定上述多肽相比于野生型多肽,其通道形成速率提高。
113.一种用于制备一种经过修饰的、杀虫活性提高的Cry3Bb多肽的方法,包括改变一个或多个位于或邻近上述Cry3Bb多肽的两个或多个环区域最集中的点的非表面氨基酸,其中上述的改变减少了上述的一个或多个环区域的流动性。
114.如权利要求113中所述的方法,其中上述的流动性是通过比较上述经过修饰的蛋白与野生型Cry3Bb多肽的热变性来确定的。
115.一种改善Cry3Bb多肽的杀虫活性的方法,上述的方法包括在上述多肽的结构域1的一个或多个环区域中插入一个或多个蛋白酶敏感位置。
116.如权利要求115中所述的方法,其中上述的环区域是α3,4。
CNB988137135A 1997-12-18 1998-12-17 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法 Expired - Lifetime CN100340666C (zh)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
US08/996,441 1997-12-18
US08/993,722 1997-12-18
US08/993170 1997-12-18
US08/993,170 US6063597A (en) 1997-12-18 1997-12-18 Polypeptide compositions toxic to coleopteran insects
US08/993775 1997-12-18
US08/993,775 US6077824A (en) 1997-12-18 1997-12-18 Methods for improving the activity of δ-endotoxins against insect pests
US08/993,775 1997-12-18
US08/993,722 US6060594A (en) 1997-12-18 1997-12-18 Nucleic acid segments encoding modified bacillus thuringiensis coleopteran-toxic crystal proteins
US08/996441 1997-12-18
US08/996,441 US6023013A (en) 1997-12-18 1997-12-18 Insect-resistant transgenic plants
US08/993,170 1997-12-18
US08/993722 1997-12-18

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CNA2007101419722A Division CN101172999A (zh) 1997-12-18 1998-12-17 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法
CNA2007101419737A Division CN101220087A (zh) 1997-12-18 1998-12-17 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法

Publications (2)

Publication Number Publication Date
CN1286728A true CN1286728A (zh) 2001-03-07
CN100340666C CN100340666C (zh) 2007-10-03

Family

ID=27506051

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB988137135A Expired - Lifetime CN100340666C (zh) 1997-12-18 1998-12-17 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法

Country Status (13)

Country Link
EP (3) EP1801220B1 (zh)
CN (1) CN100340666C (zh)
AR (3) AR014144A1 (zh)
AT (3) ATE544857T1 (zh)
AU (1) AU2001399A (zh)
BR (1) BR9814294B1 (zh)
CA (1) CA2314429C (zh)
CY (1) CY1106323T1 (zh)
DE (1) DE69835538T2 (zh)
DK (1) DK1040192T3 (zh)
ES (1) ES2273447T3 (zh)
PT (1) PT1040192E (zh)
WO (1) WO1999031248A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102369286B (zh) * 2009-02-05 2014-12-10 阿森尼克斯公司 变体axmi-r1δ-内毒素基因和使用它们的方法
WO2015070780A1 (zh) * 2013-11-18 2015-05-21 北京大北农科技集团股份有限公司 控制害虫的方法
CN106413381A (zh) * 2014-06-06 2017-02-15 康奈尔大学 用于阻止木虱进食的组合物和方法

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6060594A (en) 1997-12-18 2000-05-09 Ecogen, Inc. Nucleic acid segments encoding modified bacillus thuringiensis coleopteran-toxic crystal proteins
AU5571699A (en) * 1998-08-19 2000-03-14 Monsanto Company An antifungal protein from tall fescue and its use in plant disease control
US6501009B1 (en) 1999-08-19 2002-12-31 Monsanto Technology Llc Expression of Cry3B insecticidal protein in plants
ES2638112T3 (es) 1999-12-16 2017-10-18 Monsanto Technology, Llc Nuevas construcciones de expresión en plantas
WO2002022662A2 (en) * 2000-09-12 2002-03-21 Monsanto Technology Llc Insect inhibitory bacillus thuringiensis proteins, fusions, and methods of use therefor
US6586365B2 (en) 2000-10-06 2003-07-01 Monsanto Technology, Llc Method for reducing pest damage to corn by treating transgenic corn seeds with clothianidin pesticide
US8080496B2 (en) * 2000-10-06 2011-12-20 Syngenta Crop Protection, Inc. Method for reducing pest damage to corn by treating transgenic corn seeds with thiamethoxam pesticide
US9816104B2 (en) 2000-10-06 2017-11-14 Monsanto Technology Llc Compositions and methods for deploying a transgenic refuge as a seed blend
US6593273B2 (en) 2000-10-06 2003-07-15 Monsanto Technology Llc Method for reducing pest damage to corn by treating transgenic corn seeds with pesticide
FR2822157B1 (fr) * 2001-03-19 2003-10-31 Aventis Cropscience Sa Toxine insecticide de bacillus thuringiensis modifiee sensible a la pepsine
AU2002315526A1 (en) 2001-07-06 2003-01-21 Monsanto Technology Llc Methods for enhancing segregation of transgenes in plants and compositions thereof
US7230167B2 (en) 2001-08-31 2007-06-12 Syngenta Participations Ag Modified Cry3A toxins and nucleic acid sequences coding therefor
US7462760B2 (en) 2002-06-26 2008-12-09 Pioneer Hi-Bred International, Inc. Genes encoding plant protease-resistant pesticidal proteins and method of their use
CA2490548A1 (en) * 2002-06-26 2004-01-08 E.I. Du Pont De Nemours And Company Genes encoding proteins with pesticidal activity
AU2003254099A1 (en) * 2002-07-29 2004-02-16 Monsanto Technology, Llc Corn event pv-zmir13 (mon863) plants and compositions and methods for detection thereof
US7309785B1 (en) 2003-10-03 2007-12-18 Dow Agrosciences Llc Modified chimeric Cry35 proteins
US7524810B1 (en) 2003-10-03 2009-04-28 Dow Agrosciences Llc Modified Cry34 proteins
JP4903051B2 (ja) 2003-12-15 2012-03-21 モンサント テクノロジー エルエルシー トウモロコシ植物mon88017および組成物ならびにその検出方法
UA94893C2 (ru) 2004-03-25 2011-06-25 Сингента Партисипейшнс Аг Трансгенное растение кукурузы mir604
WO2008049071A2 (en) 2006-10-18 2008-04-24 Seminis Vegetable Seeds, Inc. Carrots having increased lycopene content
US10036036B1 (en) * 2007-03-15 2018-07-31 Monsanto Technology Llc Compositions and methods for deploying a transgenic refuge as a seed blend
US9522937B2 (en) 2007-03-28 2016-12-20 Syngenta Participations Ag Insecticidal proteins
ES2601577T3 (es) 2007-03-28 2017-02-15 Syngenta Participations Ag Proteínas insecticidas
BRPI1013946B1 (pt) 2009-05-03 2021-05-18 Monsanto Technology Llc Sistemas e processos para combinar tipos diferentes de sementes
CA2765034A1 (en) 2009-06-09 2010-12-23 Pioneer Hi-Bred International, Inc. Early endosperm promoter and methods of use
EP2494056A1 (en) 2009-10-26 2012-09-05 Pioneer Hi-Bred International Inc. Somatic ovule specific promoter and methods of use
WO2011133679A1 (en) 2010-04-20 2011-10-27 Seminis Vegetables Seeds, Inc. White-stem trait containing plants
US8735662B2 (en) 2011-05-16 2014-05-27 Nunhems B.V. Lettuce variety salmon
US9204603B2 (en) 2011-12-21 2015-12-08 The Curators Of The University Of Missouri Soybean variety S05-11482
US20130167262A1 (en) 2011-12-21 2013-06-27 The Curators Of The University Of Missouri Soybean variety s05-11268
BR112014016791A2 (pt) 2012-01-06 2019-09-24 Pioneer Hi Bred Int molécula de ácido nucléico isolada, cassete de expressão, vetor, célula vegetal, planta, semente transgénica, método para expressão de um polinucleotídeo em uma planta ou célula vegetal, método para expressão de um polinucleotídeo, preferencialmente em tecidos de óvulo de uma planta
US9006515B2 (en) 2012-01-06 2015-04-14 Pioneer Hi Bred International Inc Pollen preferred promoters and methods of use
WO2013116750A1 (en) 2012-02-02 2013-08-08 Conicet HaHB11 PROVIDES IMPROVED PLANT YIELD AND TOLERANCE TO ABIOTIC STRESS
WO2013136274A1 (en) 2012-03-13 2013-09-19 University Of Guelph Myb55 promoter and use thereof
NZ615094A (en) 2012-09-13 2015-05-29 Seminis Vegetable Seeds Inc Brassica oleracea plants with improved nutritional value
AU2013224684B2 (en) 2012-09-13 2017-07-06 Plant Bioscience Limited GENETIC MARKERS FOR Myb28
WO2014059155A1 (en) 2012-10-11 2014-04-17 Pioneer Hi-Bred International, Inc. Guard cell promoters and uses thereof
AU2014241045B2 (en) 2013-03-13 2017-08-31 Pioneer Hi-Bred International, Inc. Glyphosate application for weed control in brassica
CN105339380A (zh) 2013-03-14 2016-02-17 先锋国际良种公司 用以防治昆虫害虫的组合物和方法
US10023877B2 (en) 2013-03-15 2018-07-17 Pioneer Hi-Bred International, Inc. PHI-4 polypeptides and methods for their use
WO2014182473A1 (en) 2013-05-08 2014-11-13 Monsanto Technology Llc Compositions and methods for deploying a transgenic refuge seed blend
EA030896B1 (ru) 2013-08-16 2018-10-31 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные белки и способы их применения
BR122021005579B1 (pt) 2013-09-13 2022-11-29 Pioneer Hi-Bred International, Inc Construto de dna, método de obtenção de planta transgênica, proteína de fusão, método para controlar uma população de praga de inseto, método para inibir o crescimento ou matar uma praga de inseto
BR112016018103B1 (pt) 2014-02-07 2024-01-16 E.I. Du Pont De Nemours And Company Polipeptídeo e seu uso, polinucleotídeo, composição, proteína de fusão, método para controlar uma população, método para inibir o crescimento, método para controlar a infestação, método para obtenção de uma planta ou célula vegetal, construto
CA2939156A1 (en) 2014-02-07 2015-08-13 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US20170218384A1 (en) 2014-08-08 2017-08-03 Pioneer Hi-Bred International, Inc. Ubiquitin promoters and introns and methods of use
US20170247719A1 (en) 2014-09-17 2017-08-31 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
BR112017007932A2 (pt) 2014-10-16 2018-01-23 Du Pont proteínas inseticidas e métodos para uso das mesmas
EP3224371B1 (en) 2014-11-04 2024-10-09 Ball Horticultural Company Altered pigment deposition in tagetes patula
WO2016099916A1 (en) 2014-12-19 2016-06-23 E. I. Du Pont De Nemours And Company Polylactic acid compositions with accelerated degradation rate and increased heat stability
CN116333064A (zh) 2015-05-19 2023-06-27 先锋国际良种公司 杀昆虫蛋白及其使用方法
CA2986265A1 (en) 2015-06-16 2016-12-22 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
WO2017023486A1 (en) 2015-08-06 2017-02-09 Pioneer Hi-Bred International, Inc. Plant derived insecticidal proteins and methods for their use
CN108513584A (zh) 2015-08-28 2018-09-07 先锋国际良种公司 苍白杆菌介导的植物转化
EP3337923B2 (en) 2015-09-21 2023-01-04 Modern Meadow, Inc. Fiber reinforced tissue composites
US11104911B2 (en) 2015-12-22 2021-08-31 Pioneer Hi-Bred International, Inc. Embryo-preferred Zea mays promoters and methods of use
EP3205667B1 (en) 2016-02-15 2020-04-29 Modern Meadow, Inc. Biofabricated material containing collagen fibrils
EP3445861B1 (en) 2016-04-19 2021-12-08 Pioneer Hi-Bred International, Inc. Insecticidal combinations of polypeptides having improved activity spectrum and uses thereof
EP3451837B1 (en) 2016-05-04 2021-08-25 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN105753951A (zh) * 2016-05-18 2016-07-13 中国农业科学院生物技术研究所 一种Bt抗虫基因及其编码的蛋白质和应用
CA3022858A1 (en) 2016-06-16 2017-12-21 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
BR112018076816A2 (pt) 2016-06-24 2019-09-03 Pioneer Hi Bred Int elemento regulador híbrido, promotor híbrido, construto de dna, cassete de expressão, célula hospedeira, planta transgênica, método para criar um elemento regulador híbrido e método para expressão direcionada de uma sequência de polinucleotídeos em uma planta ou célula vegetal
EP3954202A1 (en) 2016-07-01 2022-02-16 Pioneer Hi-Bred International, Inc. Insecticidal proteins from plants and methods for their use
WO2018013333A1 (en) 2016-07-12 2018-01-18 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
EP3535285B1 (en) 2016-11-01 2022-04-06 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
BR112019012339A2 (pt) 2016-12-14 2019-11-26 Pioneer Hi Bred Int polipeptídeo inseticida recombinante, composição, construto de dna, célula hospedeira, planta transgênica, método para inibir o crescimento ou extermínio de uma praga de inseto ou população de praga, polipeptídeo ipd093 quimérico e proteína de fusão
EP3558004A1 (en) 2016-12-22 2019-10-30 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
WO2018140214A1 (en) 2017-01-24 2018-08-02 Pioneer Hi-Bred International, Inc. Nematicidal protein from pseudomonas
MX2019009371A (es) 2017-02-08 2019-09-23 Pionner Hi Bred Int Inc Combinaciones insecticidas de proteinas insecticidas derivadas de plantas y metodos para su uso.
EP3596220A4 (en) 2017-03-13 2020-11-18 Ball Horticultural Company MILDEW RESISTANT IMPATIENS
WO2018170436A1 (en) 2017-03-16 2018-09-20 Jacobs Farm Del Cabo Basil with high tolerance to downy mildew
MX2019013321A (es) 2017-05-11 2020-02-10 Pioneer Hi Bred Int Proteinas insecticidas y metodos para su uso.
CA3008850A1 (en) 2017-06-29 2018-12-29 Modern Meadow, Inc. Yeast strains and methods for producing collagen
WO2019060383A1 (en) 2017-09-25 2019-03-28 Pioneer Hi-Bred, International, Inc. PROMOTERS HAVING PREFERENCE FOR FABRICS AND METHODS OF USE
WO2019074598A1 (en) 2017-10-13 2019-04-18 Pioneer Hi-Bred International, Inc. VIRUS-INDUCED GENETIC SILENCING TECHNOLOGY FOR THE CONTROL OF INSECTS IN MAIZE
AU2018253595A1 (en) 2017-11-13 2019-05-30 Modern Meadow, Inc. Biofabricated leather articles having zonal properties
CA3087861A1 (en) 2018-03-02 2019-09-06 Pioneer Hi-Bred International, Inc. Plant health assay
CN111867377B (zh) 2018-03-14 2023-05-23 先锋国际良种公司 来自植物的杀昆虫蛋白及其使用方法
CN115850420A (zh) 2018-03-14 2023-03-28 先锋国际良种公司 来自植物的杀昆虫蛋白及其使用方法
WO2019226508A1 (en) 2018-05-22 2019-11-28 Pioneer Hi-Bred International, Inc. Plant regulatory elements and methods of use thereof
WO2020005933A1 (en) 2018-06-28 2020-01-02 Pioneer Hi-Bred International, Inc. Methods for selecting transformed plants
CA3106444A1 (en) 2018-08-29 2020-03-05 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for conferring pesticidal activity to plants
JP2022512817A (ja) 2018-10-31 2022-02-07 パイオニア ハイ-ブレッド インターナショナル, インコーポレイテッド オクロバクテリウム(Ochrobactrum)媒介植物形質転換のための組成物及び方法
CN113286864A (zh) 2019-01-17 2021-08-20 现代牧场股份有限公司 层状胶原材料及其制备方法
TW202142114A (zh) 2020-02-04 2021-11-16 美商陶氏農業科學公司 具有殺有害生物效用之組成物及與其相關之方法
WO2022015619A2 (en) 2020-07-14 2022-01-20 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
BR112023002603A2 (pt) 2020-08-10 2023-04-04 Pioneer Hi Bred Int Elementos reguladores de plantas e métodos de uso dos mesmos
US11944063B2 (en) 2020-09-30 2024-04-02 Spring Meadow Nursery, Inc. Hydrangea ‘SMNHPH’
EP3984355B1 (en) 2020-10-16 2024-05-15 Klemm & Sohn GmbH & Co. KG Double-flowering dwarf calibrachoa
US11155884B1 (en) 2020-10-16 2021-10-26 Klemm & Sohn Gmbh & Co. Kg Double-flowering dwarf Calibrachoa
TW202345696A (zh) 2022-05-18 2023-12-01 美商科迪華農業科技有限責任公司 具有殺有害生物效用之組成物及與其相關的方法
WO2024020360A1 (en) 2022-07-18 2024-01-25 Pairwise Plants Services, Inc. Mustard green plants named 'pwrg-1', 'pwrg-2,' and 'pwsgc'

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US837A (en) 1838-07-12 samuel carson
US5024A (en) 1847-03-20 Steam-cylindee
US4237224A (en) 1974-11-04 1980-12-02 Board Of Trustees Of The Leland Stanford Jr. University Process for producing biologically functional molecular chimeras
US4356270A (en) 1977-11-08 1982-10-26 Genentech, Inc. Recombinant DNA cloning vehicle
FR2440957A1 (fr) 1978-11-13 1980-06-06 Pasteur Institut Vecteurs appropries a l'insertion dans leurs genomes de fragments d'adn etrangers, selon l'une quelconque des phases de traduction possibles, et moyens pour leur fabrication
US4342832A (en) 1979-07-05 1982-08-03 Genentech, Inc. Method of constructing a replicable cloning vehicle having quasi-synthetic genes
US4332898A (en) 1980-05-22 1982-06-01 The Upjohn Company Hybrid plasmid and process of making same
US4554101A (en) 1981-01-09 1985-11-19 New York Blood Center, Inc. Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity
US4362817A (en) 1981-03-02 1982-12-07 The Upjohn Company Hybrid plasmid and process of making same
US4448885A (en) 1981-04-27 1984-05-15 Board Of The Regents Of The University Of Washington Bacillus thuringiensis crystal protein in Escherichia coli
US4467036A (en) 1981-11-12 1984-08-21 The Board Of Regents Of The University Of Washington Bacillus thuringiensis crystal protein in Escherichia coli
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
US4757011A (en) 1983-09-30 1988-07-12 E. I. Du Pont De Nemours And Company Herbicide resistant tobacco
DE3346138A1 (de) 1983-12-21 1985-07-11 Boehringer Mannheim Gmbh, 6800 Mannheim Bacillus thuringiensis var. tenebrionis sowie ein insektizid wirkendes, hieraus erhaeltliches praeparat bzw. toxin sowie deren verwendung zur bekaempfung von coleoptera
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5176995A (en) 1985-03-28 1993-01-05 Hoffmann-La Roche Inc. Detection of viruses by amplification and hybridization
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
GB8526774D0 (en) 1985-10-30 1985-12-04 Sandoz Ltd Bacillus thuringiensis hybrids
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
AU622104B2 (en) 1987-03-11 1992-04-02 Sangtec Molecular Diagnostics Ab Method of assaying of nucleic acids, a reagent combination and kit therefore
US4971908A (en) 1987-05-26 1990-11-20 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthase
IL86724A (en) 1987-06-19 1995-01-24 Siska Diagnostics Inc Methods and kits for amplification and testing of nucleic acid sequences
US4910016A (en) 1987-08-03 1990-03-20 Mycogen Corporation Novel Bacillus thuringiensis isolate
JP2846018B2 (ja) 1988-01-21 1999-01-13 ジェネンテク,インコーポレイテッド 核酸配列の増幅および検出
CA1340807C (en) 1988-02-24 1999-11-02 Lawrence T. Malek Nucleic acid amplification process
US5023179A (en) 1988-11-14 1991-06-11 Eric Lam Promoter enhancer element for gene expression in plant roots
US5683691A (en) * 1989-02-15 1997-11-04 Plant Genetic Systems, N.V. Bacillus thuringiensis insecticidal toxins
EP0382990A1 (en) * 1989-02-15 1990-08-22 Plant Genetic Systems, N.V. Strains of bacillus thuringiensis
ES2150900T3 (es) 1989-10-31 2000-12-16 Monsanto Co Promotor para plantas transgenicas.
US5187091A (en) * 1990-03-20 1993-02-16 Ecogen Inc. Bacillus thuringiensis cryiiic gene encoding toxic to coleopteran insects
CA2083948C (en) 1990-06-25 2001-05-15 Ganesh M. Kishore Glyphosate tolerant plants
EP0569438A1 (en) * 1991-01-31 1993-11-18 Ecogen Inc BACILLUS THURINGIENSIS CRYIIIC(b) TOXIN GENE AND PROTEIN TOXIC TO COLEOPTERAN INSECTS
US5185148A (en) * 1991-12-16 1993-02-09 Mycogen Corporation Process for controlling scarab pests with Bacillus thuringiensis isolates
US5593874A (en) 1992-03-19 1997-01-14 Monsanto Company Enhanced expression in plants
CA2135646A1 (en) 1992-05-11 1993-11-25 Kenneth G. Draper Method and reagent for inhibiting viral replication
EP1251170A3 (en) 1992-07-17 2002-10-30 Ribozyme Pharmaceuticals, Inc. Method and reagent for treatment of NF-kappaB dependent animal diseases
US5441884A (en) 1993-07-08 1995-08-15 Ecogen Inc. Bacillus thuringiensis transposon TN5401
CN1360632A (zh) * 1999-05-04 2002-07-24 孟山都技术有限公司 鞘翅目毒性多肽组合物和抗虫转基因植物
US8312249B1 (en) 2008-10-10 2012-11-13 Apple Inc. Dynamic trampoline and structured code generation in a signed code environment
FR2957821B1 (fr) 2010-03-24 2014-08-29 Inst Francais Du Petrole Nouvelle zone de regeneration du catalyseur divisee en secteurs pour unites catalytiques regeneratives

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102369286B (zh) * 2009-02-05 2014-12-10 阿森尼克斯公司 变体axmi-r1δ-内毒素基因和使用它们的方法
WO2015070780A1 (zh) * 2013-11-18 2015-05-21 北京大北农科技集团股份有限公司 控制害虫的方法
CN106413381A (zh) * 2014-06-06 2017-02-15 康奈尔大学 用于阻止木虱进食的组合物和方法

Also Published As

Publication number Publication date
ATE335822T1 (de) 2006-09-15
EP1801220A2 (en) 2007-06-27
ATE555123T1 (de) 2012-05-15
PT1040192E (pt) 2006-12-29
CA2314429A1 (en) 1999-06-24
EP1040192A1 (en) 2000-10-04
AU2001399A (en) 1999-07-05
WO1999031248A9 (en) 1999-09-16
DK1040192T3 (da) 2006-12-18
EP1040192B1 (en) 2006-08-09
ES2273447T3 (es) 2007-05-01
AR023762A2 (es) 2002-09-04
CN100340666C (zh) 2007-10-03
DE69835538D1 (de) 2006-09-21
BR9814294A (pt) 2001-10-23
WO1999031248A1 (en) 1999-06-24
EP1749834B1 (en) 2012-04-25
CY1106323T1 (el) 2011-10-12
EP1749834A1 (en) 2007-02-07
EP1801220A3 (en) 2007-08-22
AR014144A1 (es) 2001-02-07
CA2314429C (en) 2010-03-02
AR064767A2 (es) 2009-04-22
BR9814294B1 (pt) 2011-10-18
ATE544857T1 (de) 2012-02-15
DE69835538T2 (de) 2008-01-03
EP1801220B1 (en) 2012-02-08

Similar Documents

Publication Publication Date Title
CN100340666C (zh) 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法
CN1210402C (zh) 广谱δ-内毒素
US6809078B2 (en) Compositions encoding lepidopteran-toxic polypeptides and methods of use
CN101172999A (zh) 抗昆虫的转基因植物以及用于改善δ-内毒素抵抗目标昆虫活性的方法
US6063597A (en) Polypeptide compositions toxic to coleopteran insects
US6642030B1 (en) Nucleic acid compositions encoding modified Bacillus thuringiensis coleopteran-toxic crystal proteins
CN1360632A (zh) 鞘翅目毒性多肽组合物和抗虫转基因植物

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: American Missouri

Applicant after: Pharmacia Corp.

Co-applicant after: Ecogen, Inc.

Address before: American Missouri

Applicant before: Monsanto, Co.

Co-applicant before: Ecogen, Inc.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: MONSANTO CO. TO: PHARMACIA CORP.; CO-APPLICANT; FROM: ECOGEN, INC. TO: ECOGEN, INC.

C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: American Missouri

Applicant after: Monsanto Technology Co., Ltd.

Co-applicant after: Ecogen, Inc.

Address before: American Missouri

Applicant before: Monsanto, Co.

Co-applicant before: Ecogen, Inc.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: MONSANTO CO. TO: MONSANTO TECHNOLOGY LLC; CO-APPLICANT; FROM: ECOGEN, INC. TO: ECOGEN, INC.

ASS Succession or assignment of patent right

Owner name: MONSANTO TECHNOLOGY LLC

Free format text: FORMER OWNER: MONSANTO TECHNOLOGY LLC; APPLICANT

Effective date: 20061222

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20061222

Address after: American Missouri

Applicant after: Monsanto Technology Co., Ltd.

Address before: American Missouri

Applicant before: Monsanto Technology Co., Ltd.

Co-applicant before: Ecogen, Inc.

C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20071003

CX01 Expiry of patent term