抗昆虫的转基因植物以及用于改善 δ-内毒素抵抗目标昆虫活性的方法
1.0发明背景
1.1发明领域
本发明涉及的是用于生产通过基因工程方法获得的重组δ-内毒素的方法,其中所述的内毒素来源于苏云金芽胞杆菌(Bacillusthuringiensis),在控制南部谷类食根昆虫(Diabroticaundecimpunctata howardi Barber)以及西部食根昆虫(Diabroticavirgifera virgifera LeConte)中有用。1.2相关工艺的描述
几乎所有的田间作物、植物、以及商业性耕种区域都很容易受到一种或多种有害昆虫的攻击。特别成问题的是鞘翅类和鳞翅类昆虫。例如,蔬菜和海甘蓝作物,如朝鲜蕨、大头菜、芝麻菜、韭菜、芦笋、扁豆、豆子、莴苣(如头、叶子、长叶莴苣)、甜菜根、球状驱虫苋、暗绿叶黄体芋、绿花椰菜、甜瓜(如香瓜、西瓜、crenshaw、蜜瓜、哈密瓜)、牙甘蓝、卷心菜、朝鲜蕨cardoni、胡萝卜、napa、花椰菜、环秋葵、洋葱、芹菜、欧芹、鸡豌豆、荷兰防风草、菊苣、豌豆、大白菜、胡椒、羽衣甘蓝、土豆、黄瓜、南瓜、葫芦、萝卜、干的球茎洋葱、芜菁甘蓝、茄子、婆罗门参、escarole、青葱、菊苣、大豆、大蒜、菠菜、绿色洋葱、南瓜、绿色食品、制糖甜菜、甜土豆、芜菁、唐莴苣、山奎、番茄、橄榄类蔬菜、芜菁、以及对一种或多种以下有害昆虫的群袭敏感的各种不同的种类:紫花苜蓿尺蠖、粘虫、甜菜粘虫、朝鲜蓟羽蛾、甘蓝蚜虫、甘蓝尺蠖、甘蓝结网毛虫、谷类earworm、芹菜啃叶虫、交叉条纹的甘蓝蠕虫、欧洲玉米蛀虫、菱形斑纹蛾、绿cloverworm、进口甘蓝蠕虫、甜瓜蠕虫、杂食卷叶虫(leafroller)、pickleworm、rindworm复合物、盐碱地毛虫、大豆圈环虫、烟草蚜虫、番茄果虫、番茄天蛾幼虫、番茄寸白虫、藜豆毛虫、以及黄条纹粘虫。类似地,牧草以及干草作物,如苜蓿、牧草以及青贮的饲料通常都会受到如粘虫、牛肉粘虫、苜蓿毛虫、欧洲酷蝇幼虫(skipper)、各种不同的尺蠖和织网毛虫、以及黄条纹粘虫等害虫的攻击。
水果以及爬藤类作物,如苹果、杏树、樱桃、油桃、桃树、梨树、李树、梅子树、温柏杏树、栗子树、榛子树、大胡桃、阿月浑子树、核桃、柑橘、黑莓、越橘、杂交草莓博伊森树莓、酸果蔓、黑加仑、罗甘莓、覆盆子、草莓、drapes、鳄梨、香蕉、猕猴桃、柿子、石榴、菠萝、热带水果,经常容易受到以下害虫的攻击并落叶:achema天蛾、amorbia、粘虫、柑橘夜蛾、香蕉酷蝇幼虫、黑头萤火虫、越橘卷叶虫、尺蠖、樱桃果虫、柑橘夜蛾、酸果蔓girdler、东部帐篷毛虫、秋季织网毛虫、秋季织网毛虫、榛树卷叶虫、榛树织网毛虫、果树卷叶虫、葡萄果蛾、葡萄叶蝉(leaffolder)、葡萄啃叶虫(grapeleafskeletonizer)、绿色果虫、gummosos-batrachedra commosae、吉普赛蛀虫、山胡桃shuckworm、天蛾幼虫、卷叶虫、navel柑橘毛虫、斜条纹卷叶虫、杂食性卷叶虫、柑橘卷叶蛾、orangedog、东方果蛾、流行性卷叶虫、桃树小枝蛀虫、大胡桃坚果鞘蛾幼虫、红条纹卷叶虫、红色隆背毛虫、粗皮夜蛾、盐碱地毛虫、尺蠖、帐篷毛虫、thecla-thecia basillides、烟草蚜虫、卷叶蛾、成蔟状的苹果蚜蛾、杂色卷叶蛾、胡桃毛虫、西部帐篷毛虫、以及黄条纹粘虫。
田间作物,如芸薹/油菜籽、月见草、牧场草、玉米(田地、甜的、爆米花)、棉花、蛇麻草、加州希蒙得木(jojoba)、花生、稻谷、红花、细粮(大麦、燕麦、黑麦、小麦等)、高粱、大豆、向日葵、以及烟草通常都是以下昆虫侵染的目标,包括:粘虫、亚洲以及其它的玉米蛀虫、条纹向日葵蛾、甜菜粘虫、棉铃虫、甘蓝圈环虫、玉米食根虫(包括南部和西部的种类)、棉叶穿孔虫、菱形斑纹蛾、欧洲玉米蛀虫、绿色cloverworm、headmoth、headworm、进口的甘蓝毛虫、圈环虫(包括Anacamptodes种属)、斜条纹卷叶虫、杂食性leaftier、podworm、podworm、盐碱地毛虫、西南部玉米蛀虫、大豆尺蠖、斑点夜蛾、向日葵蛾、烟草蚜虫、烟草天蛾幼虫、藜豆毛虫。
苗床植物(bedding plants)、花、观赏植物、蔬菜、以及盆栽经常是许多害虫的食物,例如粘虫、杜鹃花蛾、甜菜粘虫、菱形花纹蛾、ellomoth(天蛾幼虫),佛罗里达蕨类毛虫、caterpillar、Iomoth、尺蠖、夹竹桃蛾、杂食性叶蝉(leafroller)、杂食性尺蠖以及烟草蚜虫。
森林、水果、观赏植物、结坚果的树以及灌木和其它的园圃树种通常容易受到各种不同的昆虫的攻击,如结草虫、黑头蚜虫、棕尾蛾、加州橡树蛾、道格拉斯杉树蛾、榆树、尺蠖、秋季织网毛虫、果树叶蝉、绿色条纹枫树毛虫(mapleworm)、舞度蛾、短叶松芽卷蛾、含羞草结网毛虫、松树蝶、红色隆背毛虫、鞍背次蛾、鞍突(saddleprominent)次蛾、春秋尺蠖、云杉卷叶蛾、天幕毛虫、卷叶蛾、以及西部丛蛾。同样地,草皮通常会受到诸如粘虫、草坪织网毛虫、以及热带草皮织网毛虫的攻击。
因为具有商业利益的作物通常会受到昆虫的攻击,所以在许多情况中需要有对环境敏感的方法来控制或根除昆虫的侵袭。对于那些寻求通过使用生态友好的组合物来控制昆虫种群的农民、园丁、栽培者、以及商业和住宅区域而言,情况更是如此。
近几年发展的使用最为广泛的环境敏感杀虫配方是由来源于苏云金芽孢杆菌的微生物农药组成的。苏云金芽孢杆菌是一种格兰氏阳性细菌,它产生的结晶态蛋白或包含体对特定的昆虫目和种属具有特定的毒性。已经发现有许多不同的苏云金芽胞杆菌菌株可以产生杀虫的结晶态蛋白。一些组合物,包括可以产生杀虫蛋白的苏云金芽胞杆菌,已经可以通过商业途径获得并用作环境可接受的杀虫剂,因为它们对特定的目标昆虫具有相当的毒性而对植物以及其它的非目标生物体是无害的。1.2.1δ-内毒素
δ-内毒素被用于控制范围广泛的吃叶毛虫和甲虫,以及蚊子。这些蛋白样的准孢子(parasporal)晶体(也称为杀虫晶体蛋白、晶体蛋白、Bt包含体、晶状包含体、包含体、以及Bt毒素)是由苏云金芽胞杆菌生产的杀虫蛋白的一个很大的集合,它们在被易受感染的昆虫宿主摄取之后产生毒性。在过去的十年间,对苏云金芽胞杆菌毒素的结构和功能的研究涵盖了所有的主要毒素类别。虽然这些毒素在具体的结构和功能上存在区别,但是它们被认为在结构和功能上具有普遍的类似性。基于对苏云金芽胞杆菌毒素的知识的积累,已经建立了苏云金芽胞杆菌毒素的普遍性的作用模式,包括:由昆虫摄取、在中肠(包括胃和小肠)溶解、由于对于消化酶的抗性而导致的有时候部分消化实际上“激活”了毒素,结合到中肠细胞,在昆虫细胞中形成一个孢子,以及细胞动态平衡的瓦解(English和Slatin,1992)。1.2.2编码晶体蛋白的基因
许多δ-内毒素在它们的氨基酸序列上有不同程度的类似性。历史上,这些蛋白和编码它们的基因很大程度上是根据它们杀虫活性谱进行分类的。Hofte和Whiteley(1989)的综述讨论了1990年以前在苏云金芽胞杆菌中所鉴定的基因和蛋白,并提出了传统上所使用的针对苏云金芽胞杆菌基因和蛋白的命名法和分类方案。cryI基因编码对鳞翅类昆虫有毒的CryI蛋白。cryII基因编码对鳞翅类和双翅类昆虫均有毒的CryII蛋白。cryIII基因编码对鞘翅类昆虫有毒的CryIII蛋白,而cryIV基因编码对双翅类昆虫有毒的CryIV蛋白。
基于序列相似的程度,将这些蛋白进一步分为不同的亚群;给每个亚群中更为高度关联的蛋白赋予小组性的字母如CryIA、CryIB、CryIC等。给在每小组中更为紧密关联的蛋白赋予名称,如CryICl、CryIC2等。
最近发展了一种新的命名法,其依据氨基酸序列的同源性胜于依据昆虫目标的特异性来系统地划分Cry蛋白。对许多已知毒素的划分方案,不包括个体蛋白中等位基因的变化,简要地列于表1。
最近发展了一种新的命名法,它把Cry蛋白根据氨基酸序列的同源性(而不是根据昆虫目标的特异性)系统地进行分类。表1概括了对许多种已知毒素(不包括对个体蛋白的等位基因变型)的分类方案。
表1
已知的苏云金芽胞杆菌δ-内毒素、基因库编号、以及修正的命名法A
新 旧 基因库编号#
Cry1Aa1 CryIA(a) M11250
Cry1Aa2 CryIA(a) M10917
Cry1Aa3 CryIA(a) D00348
Cry1Aa4 CryIA(a) X13535
Cry1Aa5 CryIA(a) D175182
Cry1Aa6 CryIA(a) U43605
Cry1Ab1 CryIA(b) M13898
Cry1Ab2 CryIA(b) M12661
Cry1Ab3 CryIA(b) M15271
Cry1Ab4 CryIA(b) D00117
Cry1Ab5 CryIA(b) X04698
Cry1Ab6 CryIA(b) M37263
Cry1Ab7 CryIA(b) X13233
Cry1Ab8 CryIA(b) M16463
Cry1Ab9 CryIA(b) X54939
Cry1Ab10 CryIA(b) A29125
Cry1Ac1 CryIA(c) M11068
Cry1Ac2 CryIA(c) M35524
Cry1Ac3 CryIA(c) X54159
Cry1Ac4 CryIA(c) M73249
Cry1Ac5 CryIA(c) M73248
Cry1Ac6 CryIA(c) U43606
Cry1Ac7 CryIA(c) U87793
Cry1Ac8 CryIA(c) U87397
Cry1Ac9 CryIA(c) U89872
Cry1Ac10 CryIA(c) AJ002514
Cry1Ad1 CryIA(d) M73250
Cry1Ae1 CryIA(e) M65252
Cry1Ba1 CryIB X06711
Cry1Ba-7 X95704
Cry1Bb1 ET5 L32020
Cry1Bc1 CryIb(c) Z46442
Cry1Bd1 CryE1 U70726
Cry1Ca1 CryIC X07518
Cry1Ca2 CryIC X13620
Cry1Ca3 CryIC M73251
Cry1Ca4 CryIC A27642
Cry1Ca5 CryIC X96682
Cry1Ca6 CryIC X96683
Cry1Ca7 CryIC X96684
Cry1Cb1 CryiC(b) M97880
Cry1Da1 CryID X54160
Cry1Db1 PrtB Z22511
Cry1Ea1 CryIE X53985
Cry1Ea2 CryIE X56144
Cry1Ea3 CryIE M73252
Cry1Ea4 U94323
Cry1Eb1 CryIE(b) M73253
Cry1Fa1 CryIF M63897
Cry1Fa2 CryIF M63897
Cry1Fb1 PrtD Z22512
Cry1Ga1 PrtA Z22510
Cry1Ga2 CryIM Y09326
Cry1Gb1 CryH2 U70725
Cry1Ha1 Prtc Z22513
Cry1Hb1 U35780
Cry1Ia1 CryV X62821
Cry1Ia2 CryV M98544
Cry1Ia3 CryV L36338
Cry1Ia4 CryV L49391
Cry1Ia5 CryV Y08920
Cry1Ib1 CryV U07642
Cry1Ja1 ET4 L32019
Cry1Jb1 ET1 U31527
Cry1Ka1 U28801
Cry2Aa1 CryIIA M31738
Cry2Aa2 CryIIA M23723
Cry2Aa3 D86084
Cry2Ab1 CryIIB M23724
Cry2Ab2 CryIIB X55416
Cry2Ac1 CryIIC X57252
Cry3Aa1 CryIIIA M22472
Cry3Aa2 CryIIIA J02978
Cry3Aa3 CryIIIA Y00420
Cry3Aa4 CryIIIA M30503
Cry3Aa5 CryIIIA M37207
Cry3Aa6 CryIIIA U10985
Cry3Ba1 CryIIIB X17123
Cry3Ba2 CryIIIB A07234
Cry3Bb1 CryIIIB2 M89794
Cry3Bb2 CryIIIC(b) U31633
Cry3Ca1 CryIIID X59797
Cry4Aa1 CryIVA Y00423
Cry4Aa2 CryIVA D00248
Cry4Ba1 CryIVB X07423
Cry4Ba2 CryIVB X07082
Cry4Ba3 CryIVB M20242
Cry4Ba4 CryIVB D00247
Cry5Aa1 CryVA(a) L07025
Cry5Ab1 CryVA(b) L07026
Cry5Ba1 PS86Q3 U19725
Cry6Aa1 CryVIA L07022
Cry6Ba1 CryVIB L07024
Cry7Aa1 CIYIIIC M64478
Cry7Ab1 CryIIICb U04367
Cry8Aa1 CryIIIE U04364
Cry8Ba1 CryIIIG U04365
Cry8Ca1 CryIIIF U04366
Cry9Aa1 CryIG X58120
Cry9Aa2 CryIG X58534
Cry9Ba1 CryIX X75019
Cry9Ca1 CryIH Z37527
Cry9Da1 N141 D85560
Cry10Aa1 CryIVC M12662
Cry11Aa1 CryIVD M31737
Cry11Aa2 CryIVD M22860
Cry11Ba1 Jeg80 X86902
Cry12Aa1 CryVB L07027
Cry13Aa1 CryVC L07023
Cry14Aa1 CryVD U13955
Cry15Aa1 34kDa M76442
Cry16Aa1 cbm71 X94146
Cry17Aa1 cbm71 X99478
Cry18Aa1 CryBP1 X99049
Cry19Aa1 Jeg65 Y08920
Cry20Aa1 U82518
Cry21Aa1 132932
Cry22Aa1 134547
Cyt1Aa1 CytA X03182
Cyt1Aa2 CytA X04338
Cyt1Aa3 CytA Y00135
Cyt1Aa4 CytA M35968
Cyt1Ab1 CytM X98793
Cyt1Ba1 U37196
Cyt2Aa1 CytB Z14147
Cyt2Ba1 “CytB” U52043
Cyt2Ba2 “CytB” AF020789
Cyt2Ba3 “CytB” AF022884
Cyt2Ba4 “CytB” AF022885
Cyt2Ba5 “CytB” AF022886
Cyt2Bb1 U82519
a改编自:
http://epunix.biols.susx.ac.uk/Home/Neil-Crickmore/Bt/index.html1.2.3生物杀虫剂多肽复合物
当首次分离对鞘翅类昆虫有毒的苏云金芽胞杆菌菌株的报道出现时(Krieg等,1983;1984),作为杀虫剂的细菌结晶蛋白的用途扩展到鳞翅类和双翅类幼虫之外。据报道,被命名为苏云金芽胞杆菌tenebrionis变种的该种菌株(如美国专利4,766,203号,作为参考结合于本说明书中)对鞘翅类昆虫Agelastica alni(蓝色alder叶甲虫)以及Leptinotarsa decemlineata(科罗拉多薯虫)的幼虫有毒。
美国专利5,024,837也描述了杂交的苏云金芽胞杆菌kurstaki变种菌株,它们对鳞翅类昆虫有活性。美国专利4,797,279(对应于EP0221024)公开了一种杂交的苏云金芽胞杆菌,它含有一个来源于苏云金芽胞杆菌变种kurstaki的质粒(它编码一个编码对鳞翅类有毒的晶体蛋白的基因)以及一个来源于苏云金芽胞杆菌tenebrionis的质粒(它编码一个编码对鞘翅类有毒的晶体蛋白的基因)。这一杂交的苏云金芽胞杆菌菌株产生的晶体蛋白具有由苏云金芽胞杆菌kurstaki和苏云金芽胞杆菌tenebrionis所产生的晶体蛋白的特征。美国专利4,910,016(对应于EP 0303379)公开了一种苏云金芽胞杆菌的分离物,称为苏云金芽胞杆菌MT104,它对鞘翅类和鳞翅类具有活性。1.2.4分子遗传学技术促进了蛋白质工程
分子遗传学在过去十年间的革命促进了可以用合理的、有序的方法对蛋白进行过程改造以使其具有改善的特性。定位以及随机突变的方法、聚合酶链式反应(PCRTM)技术、以及在这一领域的相关进展使得人们拥有诸多的工具来改变氨基酸序列,以及在遗传序列背后的各种不同的具有商业、医药、以及农业利益的蛋白质。
随着在过去的十年间所鉴定的晶体蛋白的数目和类型的快速增加,研究者们开始对使用这些技术来改善各种不同的晶体蛋白的杀虫活性进行理论化。理论上,使用本工艺中蛋白质工程师所具有的方法可以对δ-内毒素进行改善,而且也可以合理地设想分离到现在已经分离出来的野生型晶体蛋白的改善的变体。通过增强上述的毒素作用模式*的一个或多个步骤,改进后的分子应具有增强的活性,从而代表了这一领域的突破。如果蛋白中的特定的氨基酸残基被鉴定为是形成作用模式中的一个特定步骤的原因,那么可以以这些残基为目标进行突变以改善性能。1.2.5晶体蛋白的结构分析
苏云金芽胞杆菌毒素的结构分析和随后对这类结构、基元等的功能进行的研究表明晶体蛋白内毒素的特定的区域通常负责特定的功能。
例如,已经发现Cry3Bb和Cry1Ac的结构域1是负责离子通道活性的,这是形成孢子的起始步骤(Walters等,1993;Von Tersch等,1994)。已经发现结构域2和3是负责受体结合和杀虫活性的(Aronson等,1995;Caramori等,1991;Chen等1993;de Maagd等,1996;Ge等,1991;Lee等,1992;Lee等,1995;Lu等,1994;Smedley和Ellar,1996;Smith和Ellar,1994;Rajamohan等,1995;Rajamohan等,1996;Wu和Dean,1996)。结构域2和3中的一些区域也可以影响一些毒素的离子通道活性(Chen等,1993,Wolfersberger等,1996;Von Tersch等,1994)。1.3已有工艺的缺陷
不幸的是,虽然有许多实验室已经尝试过制造突变的晶体蛋白,但是几乎没有人已经制造出对鳞翅类的毒性改善的突变晶体蛋白。在见于文献中的几乎所有的通过基因工程获得的苏云金芽胞杆菌毒素的例子中,突变的晶体蛋白的生物活性并不比野生型的蛋白好,而且在许多情形中,活性反而减少或甚至被破坏了(Almond和Dean,1993;Aronson等,1995;Chen等,1993,Chen等,1995;Ge等,1991;Kwak等,1995;Lu等,1994;Rajamohan等,1995;Rajamohan等,1996;Smedley和Ellar,1996;Smith和Ellar,1994;Wolfersberger等,1996;Wu和Aronson,1992)。
对于一个在其活性毒素中含有大约650个氨基酸的晶体蛋白而言,虽然在这一序列中的每一个位置都可能存在20中不同的氨基酸,任意创造一个成功的新结构的可能性是很渺茫的,即便是一个250-300个氨基酸的链段被指定具有一个一般的功能。实际上,上述的针对晶体蛋白基因突变的已有工艺中的首要关注点是通过使用突变来扰乱作用模式下的一些步骤来研究这些晶体蛋白的结构和功能,而不是通过基因工程来改善这些毒素。
总而言之,在这一工艺中发展杀虫活性提高的合成毒素所取得的有限的成功已经阻滞了这一领域的进步并挫败了对改善的内毒素或晶体蛋白的寻找。不同于遵守简单的、可预测的规则,对一种改善的晶体蛋白的成功的工程改造应该包括不同的策略,这取决于被改善的晶体蛋白以及所针对的害虫。因此,整个过程完全依赖于经验。
因此,传统的重组DNA技术显然不是改善杀虫晶体蛋白的常规的实验手段。在已有的工艺中缺乏的是用于通过基因过程获得杀虫活性提高的,特别是对广谱地鳞翅类害虫的毒性提高的苏云金芽胞杆菌晶体蛋白的合理的方法。2.0本发明的综述
本发明寻求通过提供由基因工程修饰的苏云金芽胞杆菌δ-内毒素(Cry*),特别是经过修饰的Cry3δ-内毒素(称为Cry3*内毒素),来克服在已有的工艺中固有的上述的以及其它的缺点。本发明同时还提供包含一个或多个编码此类修饰蛋白的基因的核苷酸序列。特别优选的基因包括cry3*(如cry3A*、cry3B*、cry3C*基因),特别是cry3B*基因,更为优选的是cry3Bb*基因,这些基因所编码的经过修饰的晶体蛋白对目标害虫的杀虫活性提高了。
同时公开的是用于构建合成的Cry3*蛋白、经过合成的方法修饰的编码这些蛋白的核苷酸序列、以及它们的组合物的新颖的方法。同时提供的还有合成的cry3*表达载体以及使用这些改善的基因和载体的多种不同的方法。在一个优选实施例中,本发明公开并要求保护了Cry3B*蛋白以及编码改善的杀虫多肽的cry3B*。
在一个优选实施例中公开了形成通道的毒素的设计方法,它已经被用于生产特定的一套经过设计的生物活性提高的Cry3Bb*毒素。在表2中列出了这些改进的Cry3Bb*蛋白,以及它们相应的对应于野生型(WT)Cry3Bb的氨基酸变化、在编码蛋白的改变的cry3Bb*基因中存在的核苷变化、相对野生型Cry3Bb的生物活性的级数增加、改变的结构位点、以及用于创造新毒素的设计方法。
相应地,总体上本发明提供了经过突变的编码Cry3蛋白的基因以及制造和使用这些基因的方法。此处所用的术语“经过突变的cry3基因”指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核苷序列,它们所编码的突变体Cry3晶体蛋白(Cry3*)的杀虫活性提高。这些经过突变的cry3基因在详细说明书中已经被称为cry3*基因。cry3*基因的例子包括cry3A*、cry3B*、以及cry3C*基因。
经过突变的编码Cry3蛋白的基因的例子包括cry3B基因。此处所用的术语“经过突变的cry3B基因”指的是一种或多种基因,它们已经被突变或改变成含有一个或多个在野生型序列中所不存在的核苷序列,它们所编码的突变体Cry3B晶体蛋白(Cry3B*)的杀虫活性提高了。这类基因已经被称为cry3B*基因。cry3B*基因的例子包括cry3Ba*、cry3Bb*基因,它们分别编码Cry3Ba*和Cry3Bb*蛋白。
相应地,本发明提供了经过突变的编码Cry3A蛋白的基因以及制造和使用这些基因的方法。此处所用的术语“经过突变的cry3A基因”指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核苷序列,它们所编码的突变体Cry3A晶体蛋白(Cry3A*)的杀虫活性提高。这些经过突变的基因已经被称为cry3A*基因。
相应地,本发明提供了经过突变的编码Cry3C蛋白的基因以及制造和使用这些基因的方法。此处所用的术语“经过突变的cry3C基因”指的是一种或多种核苷序列,它们已经被突变或改变成含有一个或多个在野生型中不存在的核苷序列,它们所编码的突变体Cry3C晶体蛋白(Cry3C*)的杀虫活性提高。这些经过突变的基因已经被称为cry3C*基因。
优选地,新颖的序列包括核苷酸序列,其中至少一个,优选的一个以上,最优选的,相当数量的,野生型的cry3核苷已经被替换为一个或多个核苷,或者一个或多个核苷已经被加入到天然的核苷序列中,或者已经从该序列中删除,以便改变、增加、或删除由如此突变的核苷酸序列所编码的相应的氨基酸。因此,想得到的结果是,相比于未经修饰的晶体蛋白,改变被编码的晶体蛋白的氨基酸序列以提供具有提高或改变的活性以及/或者特异性的毒素。
优选的编码Cry2Bb*的基因包括cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,c?y3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.1 1048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095,以及cry3Bb.11098。
表2CRY3Bb
*蛋白,显示对抗SCRW幼虫的活力改善了
Cry-3Bb*蛋白名称 |
cry3Bb*质粒名称 |
cry3Bb*核苷序列变化 |
Cry3Bb*氨基酸序列变化 | 变化的结构位置 |
WT活性的级数增加 |
所使用的设计方法 |
Cry3Bb.60Cry3Bb.11221Cry3Bb.11222Cry3Bb.11223Cry3Bb.11224Cry3Bb.11225Cry3Bb.11226Cry3Bb.11227 |
-pEG1707pEG1708pEG1709pEG1710pEG17llpEG1712pEG1713 |
-A460T,C461T,A462T,C464A,T465C,T466C,T467A,A468T,A469T,G470C,T472C,T473G,G474T,A477T,A478T,G479CT687C,11688C,A689T,C691A,A692GT667C,T687C,T688A,A689G,C691A,A692GT687C,A692GT687C,C691AT687C,C691A,A692C,T693CC868A,G869A,G870T |
Δ1-159T154F,P155R,L156H,L158RY230L,H231SS223P,Y230SH231RH231N.T241SH231TR290N |
Δα1-α31α3,4α6α6α6α6α61α7,β1 |
3.6×6.4×4.0×2.8×5.0×3.6×3.0×1.9× |
1,6,81,83,737,877,82.3,46 |
表2(续)
Cry3Bb*蛋白名称 |
cry3Bb*质粒名称 |
cry3Bb*核苷序列变化 |
Cry3Bb*氨基酸序列变化 | 变化的结构位置 |
WT活性的级数增加 |
所使用的设计方法 |
Cry3Bb.11228Cry3Bb.11229Cry3Bb.11230Cry3Bb.11231Cry3Bb.11232Cry3Bb.11233 |
pEG1714pEG1715pEG1716pEG1717pEG1718pEG1719 |
C932T,A938C,T942G,G949A,T954CT931A,A933C,T942A,T945A,G949A,A953G,T954CT931G,A933C,C934G,T945G,C946T,A947G,G951A,T954CT687C,A692G,C932T,A938C,T942G,G949A,T954CT931A,A933G,T935C,T936A,A938C,T939C,T942C,T945A,G951T,T954CT931G,A933C,T936G,T942C,C943T,T945A,C946G,G948C,T954C |
S311L,N313T,E317KS311T,E317K,Y318CS311A,L312V,Q316WH231R,S311L,N313T,E317KS311T,L312P,N313T,E317NS311A,Q316D |
1β1,α81β1,α81β1,α8α6;1β1,α81β1,α81β1,α8 |
4.1×2 5×4.7×7.9×5.1×2.2× |
2,42,42,482,4,7,8,1042,4 |
表2(续)
Cry3Bb*蛋白名称 |
cry3Bb*质粒名称 |
cry3Bb*核苷序列变化 |
Cry3Bb*氨基酸序列变化 | 变化的结构位置 |
WT活性的级数增加 |
所使用的设计方法 |
Cry3Bb.11234Cry3Bb.11235Cry3Bb.11236Cry3Bb.11237Cry3Bb.11238 |
pEG1720pEG1721pEG1722pEG1723pEG1724 |
T861C,T866C,C868A,T871C,T872G,A875T,T877A,C878G,A882GT687C,A692G,C932TT931A,C932T,A933C,T936C,T942G,T945A,T954CT931A,C932T,A933C,T936C,A937G,A938T,C941A,T942C,T945A,C946A,A947T,A950T,T954CA933C,T936C,A937G,A938T,C941A,T942C,T945A,C946A,A947T,A950T,T954C |
I289T,L291R,Y292F,S293RH231R,S311LS311IS311I,N313HN313V,T314N,Q316M,E317V |
1α7,β1α6;1β1,α81β1,α81β1,α81β1,α8 |
4.1×3.2×3.1×5.4×2.6× |
42,4,7,8,102,42,42,4 |
表2(续)
Cry3Bb*蛋白名称 |
cry3Bb*质粒名称 |
cry3Bb*核苷序列变化 |
Cry3Bb*氨基酸序列变化 | 变化的结构位置 | WT活性的级数增加 | 所使用的设计方法 |
Cry3Bb.11239Cry3Bb.11241Cry3Bb.11242Cry3Bb.11032Cry3Bb.11035Cry3Bb.11036Cry3Bb.11046 |
pEG1725pEG1726pEG1727pEG1041pEG1046pEG1047pEG1052 |
A933T,A938G,T939G,T942A,T944C,T945A,A947T,G948T,A950C,T954CA860T,T861C,G862A,C868T,G869T,T871C,A873T,T877A,C878G,A879TC868G,G869TA494GG479A,A481C,A482C,A484C,G485A,A486C,A494GA865G,T877CG479A,A481C,A482C,A484C,G485A,A486C,A494G,A865G,T877C |
N313R,L315P,Q316L,E317AY287F,D288N,R290LR290VD165GS160N,K161P,P162H,D165GI289V,S293PS160N,K161P,P162H,D165G,I289V,S293P |
1β1,α81α7,β11α7,β1α4α41α7,β1α4;1α7,β1 |
2.8×2.6×2.5×3.1×2.7×4.3×2.6× |
2,42,3,4,62,3,4,6,82,4,8842,4,8,10 |
表2(续)
Cry3Bb*蛋白名称 |
cry3Bb*质粒名称 |
cry3Bb*核苷序列变化 |
Cry3Bb*氨基酸序列变化 | 变化的结构位置 |
WT活性的级数增加 |
所使用的设计方法 |
Cry3Bb.11048Cry3Bb.11051Cry3Bb.11057Cry3Bb.11058Cry3Bb.11081 |
pEG1054pEG1057pEG1062pEG1063pEG1084 |
T309A,Δ310,Δ311,Δ312A565G,A566GT309A,Δ310,Δ311,Δ312,G479A,A481C,A482C,A484C,G485A,A486C,A494GT309A,Δ310,Δ311,Δ312,A460T,C461T,A462T,C464A,T465C,T466C,T467A,A468T,A469T,G470C,T472C,T473G,G474T,A477T,A478T,G479CA494G,T931A,A933C,T942A,T945A,G949A,T954C |
D103E,ΔA104K189GD103E,ΔA104,S160N,K161P,P162H,D165GD103E,ΔA104,T154F,P155H,L156H,L158RD165G,S311T,E317K |
1α2a,2b1α4,51α2a,2b;α41α2a,2b;1α3,4α4,1β1,α8 |
4.3×3.0×3.4×3.5×6.1× |
82,3,42,4,8,101,8,102,4,8,10 |
表2(续)
Cry3Bb*蛋白名称 |
cry3Bb*质粒名称 |
cry3Bb*核苷序列变化 |
Cry3Bb*氨基酸序列变化 | 变化的结构位置 |
WT活性的级数增加 |
所使用的设计方法 |
Cry3Bb.11082Cry3Bb.11083Cry3Bb.11084Cry3Bb.11095Cry3Bb.11098 |
pEG1085pEG1086pEG1087pEG1095pEG1098 |
A494G,A865G,T877C,T914C,T931G,A933C,C934G,T945G,C946T,A947G,G951A,T954C,A1043G,T1094CA865G,T877C,A1043GA494G,C932TA1043GA494G,T687C,A692G,C932T,A938C,T942G,G949A,T954C |
D165G,I289V,S293P,F305S,S311A,L312V,Q316W,Q348R,V365AI289V,S293P,Q348RD165G,S311LQ348RD165G,H231R,S311L,N313T,E317K |
α4;1α7,β1;β1;1β1,α8;β2;β3b1α7,β1;β2α4;1β1,α8β2α4;α6,1β1,α8 |
4.9×7.4×7.2×4.6×7.9× |
2,4,5,8,9,104,5,9,102,4,8,105,92,4,7,8 |
在许多个说明性的实施例中,本发明者已经显示了用这些方法成功地产生杀虫活性提高的毒素。具体地,本发明者已经鉴定了分析和设计在体内和体外其杀虫活性都得以提高或增强的毒素的独特的方法。
除了对Cry3Bb肽进行修饰以外,受益于本发明教导的人士现在可以对许多种形成通道的毒素,特别是与CTy3Bb在功能上或结构上有关联的蛋白进行突变。实际上,本发明者设想任何苏云金芽胞杆菌晶体蛋白或肽都可以用本发明所公开的方法进行研究,并可以用本发明所公开的方法进行改变以产生杀虫特异性或活性提高的晶体蛋白。或者,本发明者设想受益于本发明教导的本工艺的熟练人士不仅可以制备活性提高的Cry3毒素,还可以制备其它的晶体蛋白,包括在本文中的表1所描述的所有的那些。具体地,本发明者设想可以通过使用本发明中所公开的一种或多种方法来产生活性提高的Cry3*变体毒素。例如,本发明者注意到Cry3A、Cry3B、以及Cry3C晶体蛋白(它们都是本工艺中所熟知的)可以通过使用此处所采用的一种或多种设计策略进行修改以制备通过合成的方法进行修改的活性提高的晶体蛋白。类似地,本工艺的熟练人士甚至可以利用本发明的教导对其它的形成通道的晶体蛋白进行修饰,包括除了苏云金芽胞杆菌晶体蛋白以外的形成通道的毒素,甚至可以对尚未被介绍或定性的蛋白和通道毒素进行修饰。
因为杀虫晶体蛋白的结构显示了明显的蛋白的三级结构保守性(Grochulski等,1995),而且许多晶体蛋白的氨基酸序列与Cry3Bb的氨基酸序列在结构域1中具有显著的同一性,这些蛋白包括Cry1,Cry2,Cry3,Cry4,Cry5,Cry7,Cry8,Cry9,Cry10,Cry11,Cry12,Cry13,Cry14,以及Cry16类别的蛋白(表1)。。现在,在本发明者的令人吃惊的发现的指导下,受益于本发明教导的本工艺的熟练人士第一次可以把本发明的方法广泛地应用于对诸多晶体蛋白进行修饰以改善其活性或改变其特异性。这些方法不应该被局限于表1中所公开的杀虫晶体蛋白,它们可以被用于任何其它的相关的晶体蛋白,包括未被鉴定的那些。
具体地,Cry3A、Cry3B、以及Cry3C蛋白之间的高度同源性可以从这三个蛋白的一级氨基酸序列的对仗中看出(图17A、图17B、以及图17C)。
照这样,采用一种或多种本说明书中所描述的突变设计方法,现在即可将所公布的方法用于制备引入了一种或多种改变的经修饰的晶体蛋白。本发明者们进一步考虑到可以在晶体蛋白或者是其它可通过位点特异性或随机突变进行类似的修饰以产生具有改良活性的毒素,或者可选择的,具有改变的特异性毒素形成通道的一个或多个结构域,内确定区域。
在具体的实施例中,制造活性增强的经改变的毒素以抵抗一种或多种昆虫是合乎需求的。可选择地,利用此处所描述的方法来制造及鉴定已改变的杀虫晶体蛋白,上述的蛋白具有较广谱的抗敏感昆虫活性,也将是合乎需求的。本发明者们进一步考虑到制造含有一个或多个突变的嵌合杀虫晶体蛋白对于预备“超级”毒素将是合乎需求的,该毒素同时具有杀虫活性增强及伴随有广谱活性这两个优点。
按照所公布的内容,在毒素序列内一个或多个密码子的诱变可以导致产生一系列活性增强的相关的杀虫蛋白。虽然本发明针对包括于本发明中的每一个设计策略已经描述了一些突变实施例,但是本发明者们考虑到可以在杀虫晶体蛋白上制造突变,包括在环区域、螺旋区域、毒素的活性位点区域、参与蛋白寡聚化作用的区域等等上进行突变,由此可以形成功能性的生物杀虫晶体蛋白。所有这类突变均被认为包括在本公布的范围之内。
在一个示例性的实施例中,获得了诱变的cry3Bb*基因,它所编码的Cry3Bb*变体大体上是以野生型Cry3Bb序列为基础的,但在该蛋白的氨基酸序列中同时还含有通过使用此处所描述并要求保护的一种或多种设计策略而结合进去的一种或多种变化。
在这些及其它的实施例中,可以对这些编码晶体蛋白的突变基因进行修饰以便在所编码的多肽的一级序列上改变约一个、两个、三个、四个、或五个左右的氨基酸。可选择地,也可引入更多的改变(相对天然序列而言),以便使所编码的蛋白质可以有至少约1%或2%、或者可选择地约3%或约4%、或者甚至约5%至约10%、或者约10%至约15%、或者甚至约15%至约20%或者更多的密码子被改变、删除或被以其它的形式进行修饰。在特定情况下,甚至希望在本质上改变更多的一级氨基酸序列以获得理想的修饰蛋白。在这些情形中,本发明者们预期有从大约25%到大约50%、或者从大约50%到大约75%、或者更多的天然(或野生型)密码子被改变、删除、或以其它的形式进行修饰。可选择地,在氨基酸序列或编码它的DNA基因下的突变,将导致在晶体蛋白或肽类的一个或多个区域内产生一个或多个氨基酸的插入或删除。
为了在编码多肽的一级序列上完成这些突变,希望从编码这些多肽的基因的核苷酸序列中突变或删除一个或多个核苷,或者可选择地,在特定的环境下,在一级核苷酸序列的一个或多个位点上加入一个或多个核苷。经常地,需改变几个核苷残基以获得所需的多肽。因此,本发明者们企图在具体的实施例中,希望在一级序列中改变仅一个、两个、三个、四个、或大约五个核苷。在需要有更多改变的另一些实施例中,诱变可以包括在基因序列上改变、删除、或插入6、7、8、9、10、11、12、13、14、15、16、17、18、19、或者甚至20个左右的核苷残基。在又一些实施例中,可能会希望在基因的序列中突变、删除、或插入21、22、23、24、25、26、27、28、29、30-40、40-50、50-60、60-70、70-80、80-90、或者甚至90-100、150、200、250、300、350、400、450个或更多的核苷,目的是制备产生具有理想特性的Cry3*多肽的cry3*基因。实际上,任何数目的突变、删除、和/或插入都可以在基因的一级序列上进行,只要所编码的蛋白具有提高的杀虫活性或此处所描述的特异性的特征。
在编码内毒素基因的核苷序列上改变很多密码子可能是特别理想的,而且经常是获得理想效果所必需的,尤其是在“植物化”一段DNA序列以使非植物来源的DNA在经转化的植物细胞中表达的情形下。这些方法对于植物遗传学工艺的技术人员来说是常规的,而且经常会改变初级基因序列上的许多残基以帮助该基因在植物细胞中表达。优选的,这些基因序列上的改变没有在氨基酸序列上引入变化,或者仅在氨基酸序列上引入了保守的替换,以使在植物细胞中从“植物化”的核苷序列上所生产的多肽依然具有完全的功能,以及当在植物细胞中表达时仍具有所希望的性质。
以本发明中的方式突变的基因和所编码的蛋白也可有效地与编码其它蛋白的核苷酸序列相连,或者作为融合蛋白表达。N端和C端的融合蛋白均是合乎需求的。事实上,任何编码蛋白或多肽的DNA序列、或者它们的组合,均可与突变的cry3*序列融合以编码一种融合蛋白。这包括一系列编码以下物质的DNA序列:引导肽、用于重组体表达的蛋白、一种或多种引导肽所附着的蛋白、蛋白亚基、来源于一种或多种晶体蛋白的区域,等等。对初级核苷酸序列所进行的这类修饰(其目的是增强、定向、或优化在特定宿主细胞,组织,或细胞定位中的基因序列的表达)是蛋白质工程和分子生物学工艺中的技术人员所熟知的,而且对于受益于本发明详细说明的技工而言,如何便利在核苷序列中进行这些变化以生产此处所公布的多肽和多聚核苷酸也将显而易见。
在一方面,本发明公开了并要求保护含有一种或多种此处所公布的经过修饰的晶体蛋白的宿主细胞,特别是以下苏云金芽胞杆菌株系的细胞:EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098,它们包含编码通过合成进行修饰的杀虫活性提高的Cry3Bb*晶体蛋白的重组DNA片段。
同样地,本发明也公开并要求保护了以下苏云金芽胞杆菌菌株的细胞培养物:EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098。
这类细胞培养物可以是包括单一株系的具生物学纯度的培养物,或者可选地,可以是包括一种或多种株系的共培养的细胞。这种细胞培养物可以在一定的条件下培养,在这种条件下,一种或多种另外的苏云金芽胞杆菌或其它细菌的菌株与一种或多种公开的培养物同时进行共培养,或者可选地,一种或多种本发明中的细胞培养物可以与一种或多种另外的苏云金芽胞杆菌或其它细菌菌株在各自的独立培养之后再组合。当悬浮的细胞中含有两种或更多不同的所需要的晶体蛋白时,这种操作将是有用的。
本发明的培养物已经被保藏在特定的条件下,这个条件确保这些培养物在本发明悬而未决期间可以提供给由Commissioner ofPatents and Trademarks 17 C.F.R.第1.14节以及35 U.S.C.第122节所确定的人士,并根据外国专利法的要求,这些保藏物在提交有本发明等同发现或其派生发明的国家可以获得。然而应该理解的是,可以得到保藏物并不等于被准许可以在损害由政府行为所核权的专利权的情形下实施本发明。
进而,本发明的培养物保藏将根据《微生物存贮布达佩斯公约》的规定进行保藏并对公众公开,即,将根据需要对其进行足够的照顾以使其在最近一次要求完成样品保藏之后的至少5年内、以及在任何情形中,在保藏日期之后的至少30年间或者在任何可能公开该培养物的发明的有效期限之内保持其存活并不受污染。当保藏处在被要求时因为保藏条件的原因无法提供培养物时,保藏者承担替换保藏物的责任。任何针对本发明培养物对公众公开的限制在对它们进行公开的发明被接受之后即永久性地被消除。
表3中列出的培养物根据布达佩斯公约的条款被保藏在Agricultural Research Service Culture Collection,NorthernRegional Research Laboratory(NRRL)的永久性保藏库中。
表3
根据布达佩斯公约的条款储存的本发明的菌株
菌株 |
储存日期 |
蛋白 |
访问号 |
| | |
(NRRL号码) |
EG11032 |
5/27/97 |
Cry3Bb.11032 |
B-21744 |
EG11035 |
5/27/97 |
Cry3Bb.11035 |
B-21745 |
EG11036 |
5/27/97 |
Cry3Bb.11036 |
B-21746 |
EG11037 |
5/27/97 |
Cry3Bb.11037 |
B-21747 |
EG11046 |
5/27/97 |
Cry3Bb.11046 |
B-21748 |
EG11048 |
5/27/97 |
Cry3Bb.11048 |
B-21749 |
EG11051 |
5/27/97 |
Cry3Bb.11051 |
B-21750 |
EG11057 |
5/27/97 |
Cry3Bb.11057 |
B-21751 |
EG11058 |
5/27/97 |
Cry3Bb.11058 |
B-21752 |
EG11081 |
5/27/97 |
Cry3Bb.11081 |
B-21753 |
表3(续)
EG11082 |
5/27/97 |
Cry3Bb.11082 |
B-21754 |
EG11083 |
5/27/97 |
Cry3Bb.11083 |
B-21755 |
EG11084 |
5/27/97 |
Cry3Bb.11084 |
B-21756 |
EG11095 |
5/27/97 |
Cry3Bb.11095 |
B-21757 |
EG11204 |
5/27/97 |
Cry3Bb.11204 |
B-21758 |
EG11221 |
5/27/97 |
Cry3Bb.11221 |
B-21759 |
EG11222 |
5/27/97 |
Cry3Bb.11222 |
B-21760 |
EG11223 |
5/27/97 |
Cry3Bb.11223 |
B-21761 |
EG11224 |
5/27/97 |
Cry3Bb.11224 |
B-21762 |
EG11225 |
5/27/97 |
Cry3Bb.11225 |
B-21763 |
EG11226 |
5/27/97 |
Cry3Bb.11226 |
B-21764 |
EG11227 |
5/27/97 |
Cry3Bb.11227 |
B-12765 |
EG11228 |
5/27/97 |
Cry3Bb.11228 |
B-12766 |
EG11229 |
5/27/97 |
Cry3Bb.11229 |
B-21767 |
EG11230 |
5/27/97 |
Cry3Bb.11230 |
B-21768 |
EG11231 |
5/27/97 |
Cry3Bb.11231 |
B-21769 |
EG11232 |
5/27/97 |
Cry3Bb.11232 |
B-12770 |
EG11233 |
5/27/97 |
Cry3Bb.11233 |
B-21771 |
EG11234 |
5/27/97 |
Cry3Bb.11234 |
B-21772 |
EG11235 |
5/27/97 |
Cry3Bb.11235 |
B-21773 |
EG11236 |
5/27/97 |
Cry3Bb.11236 |
B-21774 |
EG11237 |
5/27/97 |
Cry3Bb.11237 |
B-21775 |
EG11238 |
5/27/97 |
Cry3Bb.11238 |
B-21776 |
EG11239 |
5/27/97 |
Cry3Bb.11239 |
B-21777 |
EG11241 |
5/27/97 |
Cry3Bb.11241 |
B-21778 |
EG11242 |
5/27/97 |
Cry3Bb.11242 |
B-21779 |
同时公布的是从环境中控制或根除一种昆虫种群的方法。这种方法大致包括将所要控制或根除的昆虫种群与一种杀虫有效剂量的Cry3*晶体蛋白复合物联系起来。优选的Cry3*复合物包括Cry3A*、Cry3B*和Cry3C*多肽复合物,其中Cry3B*复合物尤其优选。这些多肽的例子包括选自含有以下蛋白的群体:Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095,以及Cry3Bb.11098。
在优选的实施例中,这些Cry3B*晶体蛋白复合物包括以下任一氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。2.1产生修饰的Cry*蛋白的方法
本发明中经过修饰的Cry*多肽可以通过一个特定的程序进行制备,该程序通常包括以下步骤:获得一段编码Cry*多肽的核苷酸;分析该多肽的结构以鉴定特定的对该基因序列进行突变的“目标”位点;在该核苷酸序列中引入一个或多个突变以改变所编码的多肽序列中的一个或多个氨基酸残基;以及在一个经过转化的宿主细胞中,在一个能够有效获得由该cry*基因编码的经过修饰的Cry*蛋白的条件下表达经过突变的核苷酸序列。
用于获得本发明多肽的晶体结构的方法是公知的,在本发明的第9节中给出了几套示范性的高分辨率晶体结构,其中包括本发明所描述的Cry3A和Cry3b多肽的晶体结构。第9节中所提供的信息使得可以进行本发明中每一方法中所描述的分析,这些分析依赖这些三维晶体结构信息来把多肽的突变定位到这些δ-内毒素的一级氨基酸序列的特定区域,从而获得杀虫活性提高或杀虫特异性增强的突变体。
用于获得如本发明所述的杀虫活性或杀虫特异性提高的经过修饰的苏云金芽胞杆菌Cry3Bb δ-内毒素的第一种方法通常包括:获得该内毒素的高分辨率三维晶体结构;在该晶体结构中定位一个或多个结合水区域,其中的结合水形成了一个连续的亲水性表面,这些亲水表面分隔不超过16_;通过增加该蛋白在该区域的一个或多个氨基酸的疏水性来增加该表面上的水分子数目;获得如此生产的经过修饰的δ-内毒素。示例性的δ-内毒素包括Cry3Bb.11032、Cry3Bb.11227、Cry3Bb.11241、Cry3Bb.11051、Cry3Bb.11242、以及Cry3Bb.11098。
用于获得杀虫活性杀虫特异性提高的经过修饰的苏云金芽胞杆菌Cry3Bbδ-内毒素的另一种方法通常包括:在δ-内毒素中确定一个loop区;对该loop区的一个或多个氨基酸进行修饰以增加氨基酸的疏水性;获得如此生产的经过修饰的δ-内毒素。优选的通过这一方法生产的δ-内毒素包括Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11233,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,以及Cry3Bb.11239。
本发明同时还提供了一种用于增加苏云金芽胞杆菌Cry3bδ-内毒素的形成通道的螺旋的运动性的方法。该方法通常包括打断在一个或多个在形成通道的螺旋中的一个氨基酸以及δ-内毒素的另一个氨基酸之间所形成的氢键。氢键可以形成于分子间或分子内,但是氢键的打断应该包括用第三个氨基酸替代第一个或第二个氨基酸,上述第三个氨基酸的空间距离应大于3_,或者它的相对于第一个或第二个氨基酸的氢结合位点空间取向键角不等于180+/-60°。用此种方法生产的并在本发明种描述的δ-内毒素包括:Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11231,Cry3Bb.11241,Cry3Bb.11242,以及Cry3Bb.11098。
同时公开的还有一种增加在苏云金芽胞杆菌Cry3Bb δ-内毒素的形成通道的结构域的环区的柔韧性的方法。这一方法包括:获得具有一个或多个环区的Cry3Bb δ-内毒素的晶体结构;鉴定组成环区的氨基酸;以及改变一个或多个氨基酸以减少环区的立体障碍,其中这一改变增加了δ-内毒素环区的柔韧性。采用这一方法生产的δ-内毒素包括:Cry3Bb.11032,Cry3Bb.11051,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11227,Cry3Bb.11234,Cry3Bb.11241,Cry3Bb.11243,Cry3Bb.11036,以及Cry3Bb.11098。
本发明的另外一个方面是一种用于增强δ-内毒素活性的方法,包括减少或消除δ-内毒素对目标昆虫肠道中碳水化合物的结合。这种减少和消除可以通过除去δ-内毒素结构域1中的一个或多个α螺旋来实现,例如除去α螺旋α1,α2a/b,以及α3。用这种方法生产的一种示例性的δ-内毒素是Cry3Bb.60。
可选地,这种减少和消除可以通过把环区β1,α8中的一个或多个氨基酸替换为一个或多个疏水性增强的氨基酸来实现。这种方法可以产生如Cry3Bb.11228,Cry3 Bb.11230,Cry3B.11231,Cry3Bb.11237,以及Cry3Bb.11098等δ-内毒素,这些δ-内毒素在本发明中都有详细的描述。
可选地,这种减少和消除可以通过把特定的一个或多个氨基酸替换为任何一种别的氨基酸来实现。这些替换描述于表2和本发明的实施例中。一个实施例是此处称为Cry3 Bb.11221的δ-内毒素。
一种确定Cry3Bb δ-内毒素中用于定点突变的区域的方法包括:获得δ-内毒素的一个晶体结构;从晶体结构中确定该蛋白中一个或多个暴露于表面的氨基酸;对这些暴露于表面的一个或多个氨基酸进行随机替换以获得许多突变的多肽,其中至少50%的突变多肽丧失杀虫活性;以及从这些诸多的突变多肽中鉴定一个或多个Cry3Bb δ-内毒素的区域用于定点突变。这一方法可以进一步包括确定这些诸多的杀虫活性丧失的突变多肽的氨基酸序列,以及鉴定杀虫活性所必需的一个或多个氨基酸。
在一个实施例中,本发明提供了一个用于生产一种杀虫活性改善的Cry3Bb δ-内毒素的工序。这一工序通常包括以下步骤:获得该蛋白的高分辨率晶体结构;确定该蛋白的静电表面分布;鉴定一个或多个静电差异大的区域;通过改变该区域的一个或多个氨基酸来改变该区域的静电差异;以及获得一个杀虫活性改善的Cry3Bb δ-内毒素。在一个实施例中,可以减少静电差异(相对天然的Cry3Bb δ-内毒素的静电差异而言)。静电差异减少的δ-内毒素的例子包括Cry3Bb.11227,Cry3Bb.11241.以及Cry3Bb.1124212。可选地,可以增加静电差异(相对天然的Cry3Bbδ-内毒素的静电差异而言)。静电差异增加的δ-内毒素的一个例子是Cry3Bb.11234。
另外,本发明还提供了一种生产杀虫活性提高的Cry3Bb δ-内毒素的方法,包括:获得一个高分辨率的晶体结构;鉴定该蛋白中一个或多个金属结合位点的存在;改变该结合位点的一个或多个氨基酸;以及获得一个经过改变的杀虫活性改善的蛋白。这种改变可以包括去除一个或多个金属结合位点。这种δ-内毒素的例子包括Cry3Bb.11222,Cry3Bb.11224,Cry3Bb.11225,以及Cry3Bb.11226。
本发明的另外一个方面涉及一种鉴定一种通道活性改善的苏云金芽胞杆菌Cry3Bb δ-内毒素的方法。这一方法总体上包括:获得一种被怀疑通道活性改善的Cry3Bb δ-内毒素;确定该δ-内毒素的一个或多个以下的特征;以及把这些特征与野生型的未经修饰的δ-内毒素的进行比较:(1)通道形成速率,(2)通道导率的生长速率,或(3)通道开启状态的持续时间。从这一比较可以选择一种通道形成速率提高(相对于野生型δ-内毒素)的δ-内毒素。用这一方法制备的Cry3Bb δ-内毒素包括Cry3Bb.60,Cry3Bb.11035,Cry3Bb.11048,Cry3Bb.11032,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11226,Cry3Bb.11221,Cry3Bb.11242,Cry3Bb.11230,以及Cry3Bb.11098。
本发明同时还提供了一种用于生产一种经过修饰的、杀虫活性改善的Cry3Bb δ-内毒素的方法,包括:改变一个或多个定位于两个或多个Cry3Bb δ-内毒素环区的收敛最大的位置或其附近的非表面氨基酸以便减弱这些环区中的一个或多个的运动性。运动性可以便利地通过比较经过修饰的蛋白和野生型的Cry3Bb δ-内毒素的热变性的区别来确定用这种方法产生的晶体蛋白的例子有Cry3Bb.11095。
本发明的另外一个方面涉及一种用于制备一种经过修饰的、杀虫活性改善的苏云金芽胞杆菌Cry3Bb δ-内毒素的方法,包括:修饰环区的一个或多个氨基酸以增加上述氨基酸的疏水性;改变上述氨基酸中的一个或多个以减少环区的立体障碍,其中这种改变增加了该内毒素环区的柔韧性。由此生产的Cry3Bb δ-内毒素的例子有Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11231,Cry3Bb.11235,以及Cry3Bb.11098。
本发明还提供了一种改善苏云金芽胞杆菌Cry3Bb δ-内毒素的杀虫活性的方法,通常包括在δ-内毒素的结构域1中的一个或多个环区中插入一个或多个对蛋白酶敏感的位置。优选地,这一环区是α3,4。如此生产的一个δ-内毒素的例子是Cry3Bb.11221。2.2多肽组合物
用此处所描述的各种方法所生产的晶体蛋白也代表了本发明的一些重要的方面。这些晶体蛋白优选地包括选自以下群体的一种蛋白或肽:Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236.Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry’3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095,以及Cry3Bb.11098。
在优选的实施例中,蛋白含有选自以下群体的一种连续的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,以及序列编号:108。
特别优选的是那些由以下核苷酸序列编码的晶体蛋白:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107,或者是一种在中等严格的条件下与以下的核苷酸序列杂交的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。
包括在本发明范围之内的氨基酸、肽和蛋白序列包括但不局限于以下序列编号中所述的序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,以及序列编号:108。在氨基酸序列上所作的改变包括变更、删除、突变以及同系物。
本发明提供了含有大约0.5%至大约99%(重量比)之间、或者更优选地大约5%至75%之间、或者大约25%至50%之间的晶体蛋白的组合物。这些组合物可以通过使用技术人员所熟知的蛋白质生产和纯化技术以及本发明所描述的方法容易地进行制备。这种用来制备一种Cry3Bb*晶体蛋白的步骤通常包括以下步骤:在能够有效地生产晶体蛋白的条件下培养一种能够表达Cry3Bb*蛋白的宿主细胞(如苏云金芽胞杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,或EG11098细胞);以及随后获得如此生产的晶体蛋白。
蛋白可以存在于完整的细胞中,这样随后就不需要任何蛋白分离和纯化的步骤。可选地,可以把细胞打破、超声处理、裂解、断裂、或使其质壁分离以便从遗留的细胞碎片中释放晶体蛋白。在这种情形中,可能会希望在使用之前,如在配制杀虫组合物之前,分离、浓缩、或进一步纯化由此获得的含有蛋白的晶体。可以把蛋白纯化到最后几乎仅含有纯的蛋白,或者可选地,可以把其纯化或分离到一个程度,使得该组合物含有大约0.5%至大约99%(重量比)之间、或者在大约5%至大约95%之间、或者在大约15%至大约85%之间、或者在大约25%至大约75%之间、或者在大约40%至大约60%之间等的晶体蛋白。2.3表达cry3*基因的重组载体
本发明的一个重要的实施例是一种重组载体,它含有一个编码一个或多个此处所述的新颖的苏云金芽胞杆菌晶体蛋白的核苷酸片段。这种载体可以被转移到一个原核或真核宿主中并在其中复制,其中特别优选的原核细胞是细菌细胞、而特别优选的真核细胞是植物细胞。
在优选的实施例中,重组载体含有一个编码以下氨基酸序列的核苷酸片段:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。特别优选的是那些含有以下序列的核苷酸片段:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。
本发明的另外一个重要的实施例是一个经过转化的宿主细胞,它可以表达这些重组载体中的一个或多个。宿主细胞可以是真核的,也可以是原核的,而且特别优选的宿主细胞是那些表达含有重组载体载体的核苷酸片段,其中的重组载体编码一个或多个苏云金芽胞杆菌晶体蛋白,其中的晶体蛋白在结构域1的一个或多个环区,或者在结构域1的α螺旋7和结构域2的β链1(β strand 1)之间,含有经过改变的氨基酸序列。细菌细胞是特别优选的原核细胞,而植物细胞是特别优选的真核细胞。
在一个重要的实施例中,本发明公开了一种宿主细胞并对其提出了权利要求,其中经过修饰的氨基酸序列在结构域1中的α螺旋1和2之间、α螺旋2和3之间、α螺旋3和4之间、α螺旋4和5之间、α螺旋5和6之间、α螺旋6和7之间,或者在结构域1的α螺旋7与结构域2的β线1之间,含有一个或多个环区。一个特别优选的宿主细胞是一个含有以下氨基酸序列的宿主细胞:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,以及更为优选的,一个含有以下核苷酸序列的宿主细胞:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。
本发明描述了用编码根据本发明的经过修饰的Cry3Bb晶体蛋白的核苷酸序列转化的细菌宿主细胞并对其提出了权利要求,具体是那些被称为EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EC11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,或EG11098的一种苏云金芽胞杆菌细胞。
在另一个实施例中,本发明包括了一种使用本发明的编码cry3Bb*基因的核苷酸片段的方法。这一方法总体上包括以下步骤:(a)制备一个重组载体,在这个载体中cry3Bb*基因被定位成可以受到启动子的控制;(b)把重组载体导入宿主细胞;(c)在可以有效表达由上述的cry3Bb*基因编码的Cry3Bb*晶体蛋白的条件下培养宿主细胞;以及(d)获得所表达的Cry3Bb*蛋白或肽。
有许多种方法可以被用于在可以稳定保持和表达一个表达毒素的苏云金芽胞杆菌基因的条件下把这一基因导入到微生物宿主中。可以供给DNA构建物,这些DNA构建物应包括用于表达这一毒素基因的转录和翻译调控信号;受它们调控的毒素基因;以及一个与宿主生物体中的一个序列同源的DNA序列,通过这一序列来实现整合;以及/或者一个在宿主中可以发挥功能的复制系统,通过这一系统来实现整合或稳定保持。
转录起始信号将包括一个启动子和一个转录起始位点。在一些情形中,为毒素提供调节性的表达是合乎需求的,其中毒素的表达只有在被放入外部环境之后才会发生。这可以用启动子、或一个结合到一个激活因子上的区域、或增强子来实现,它们可以在微生物的物理和或化学环境发生变化的时候进行诱导。例如,可以使用对温度敏感的调节区域,其中生物体可以在实验室中进行培养,但并不表达毒素,但是一旦被释放到环境中,就开始表达。其它的技术可以在实验室中应用一种特定的营养介质,这种培养基抑制毒素的表达,但是环境中的营养介质可以使毒素表达。可以用一个核糖体结合位点和一个起始位点来启动转录。
可以用各种不同的操作来增强信使RNA的表达,特别是通过使用一个具有活性的启动子,以及通过使用一些增加信使RNA稳定性的序列。转录和翻译终止区域将包括一个或多个终止密码,一个终止子区域,以及一个可选的多聚腺苷化作用信号。可以在被翻译的多肽序列的氨基端采用一个疏水的“引导”序列以便增强蛋白跨内膜分泌。
沿着转录的方向,即从编码或有义序列的5’端到3’端,构建物将包括转录调控区(如果有的话);启动子,其中调节区域可以是启动子的5’端或3’端;核糖体结合位点;起始密码子;含有一个开读框的结构基因,该结构基因协调地具有起始密码、终止密码、多聚腺苷酰化作用信号序列(如果有的话)、以及终止区域。双链形式的这个序列可以被自身用于微生物宿主的转化,但是通常都包含有一段含有标记物的DNA序列,其中第二个DNA序列可以在把DNA引入宿主时被连接到毒素表达构建物上。
借助于一个标记物,使得结构基因能够选择已被修饰或转化的宿主。标志物通常可以提供选择性的优点,例如,提供对生物杀伤剂,例如抵抗抗生物素或重金属的抗性;互补作用,以便为营养缺陷型的宿主提供原养,等等。优选地使用互补作用,以便不仅对经过修饰的宿主进行选择,同时还可使其在田间具有竞争力。可以在建立构建物时使用一个或多个标记物,也可以用它们来修饰宿主。可以通过提供相对于田间野生型的微生物的竞争性优点来进一步对生物体进行修饰。例如,可以把表达金属螯合剂(如siderophores)的基因与表达毒素的结构基因同时导入宿主中。这样,siderophores表达的增强可以为生产毒素的宿主提供一个竞争性的优点,这样它就可以与野生型的微生物有效地进行竞争并在环境中占领一片活动范围。
在没有功能性复制系统存在的情况下,构建物将同时包括一个序列,该序列至少有50碱基对(bp)的序列,优选的至少有100bp,更优选的有1000bp,而且通常不多于2000bp的序列与宿主中的一个序列是同源的。这样,正确重组的可能性就得到了增加,这样基因将被整合到宿主中并由宿主稳定地保存。合乎需要的是,毒素基因将和提供互补作用的基因以及提供竞争性优点的基因非常靠近。这样,当毒素基因丢失时,如此获得的生物体也将丢失起互补作用的基因以及/或者提供竞争性优点的基因,这样宿主将无法在环境中参与竞争,只是基因仍保留在原封不动的构建物中。
从范围广泛的微生物宿主如细菌、噬菌体、蓝藻、藻类、真菌、等等中可以获得数量众多的转录调节区域。各种不同的转录调节区域包括与以下相关联的区域:trp基因、lac基因、gal基因、λL和λR启动子、tac启动子、与δ-内毒素基因相关联的天然启动子,它们在宿主中都具有活性。参照美国专利4,332,898;4,342,832;和4,356,270,它们都被特定地作为参照结合于本发明中。终止区域可以是通常与转录起始区域相关的终止区域,或者也可以是一个不同的转录终止区域,只要这两个区域是可兼容的而且在宿主中是具有活性的。
如果需要稳定的游离基因维持或整合,可以采用一种其复制系统可以在宿主中发挥功能的质粒。复制系统可以来源于染色体、通常存在于宿主或另一个宿主中的游离基因元件、或者来源于病毒的在宿主中可以稳定存在的复制系统。由许多质粒可供选择,如pBR322、pACYCI84、RSF1010、pR01614、等等。可参考,例如Olson等(1982);Bagdasarian等(1981);Baum等(1990);以及美国专利4,356,270;4,362,817;4,371,625;以及5,441,884,以上都特定地作为参照结合于本发明中。
可以在转录和翻译起始区域以及转录和翻译终止区域之间导入苏云金芽胞杆菌基因以便可以让其受到起始区域的调控。可以把这一构建物包括于一个质粒中,这个质粒应包括至少一个复制系统,但是可以包括一个以上,其中一个复制系统是用于在质粒的发育过程中进行克隆的,第二个复制系统则是它在最终的宿主中发挥功能所必需的。另外,可以由一个或多个标记物,标记物已经在上面描述了。当需要整合时,质粒包括一个与宿主基因组同源的序列是合乎需求的。
可以根据传统的方法来分离转化体,通常使用的是一种可以把想要的生物体从未经修饰的生物体或转化(fransferring)生物体(如果有的话)中筛选出来的筛选技术。然后可以试验转化体的杀虫活性。如果需要,可以通过定点重组系统选择性地把不需要的或者辅助性的DNA序列从重组细菌中除去,如在美国专利5,441,884中所描述的(该专利特定地作为参照结合于本发明中)。2.4cry3 DNA片段
一种编码一种在其肽中的一个或多个区域含有一个或多个突变的晶体蛋白的苏云金芽胞杆菌cry3*基因构成了本发明的一个重要的方面。优选的是那些编码一个氨基酸序列的cry3*基因,其中上述的氨基酸序列中的一个或多个氨基酸已经被根据本发明中所述的方法进行了改变,特别是那些以改变晶体蛋白的杀虫活性或特异性未目的的变化。
根据本发明,核苷酸序列包括但不局限于DNA,包括但不局限于cDNA和基因组DNA、基因;RNA,包括但不局限于mRNA和tRNA;反义序列、核苷酸、以及如下所述的合适的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107,以及包括能够表达本发明的经过修饰的苏云金芽胞杆菌毒素的变更、删除、突变、以及同源物的核苷酸序列中的改变。
因此,本发明同时还涉及DNA片段,它们独立于总的基因组DNA并编码如本发明中所述的新颖的通过合成的方法进行修饰的晶体蛋白。编码这些蛋白种类的DNA片段可能能够编码与晶体蛋白相关的或无关的基因产品的蛋白、多肽、亚基、功能性结构域,等等。另外,可能能够使用本工艺熟练人士所公知的方法完全地在体外合成这些DNA片段。
如此处所述,术语“DNA片段”指的是已经被从特定物种的总基因组DNA中分离出来的DNA分子。因此,一个编码一种晶体蛋白或肽的DNA片段指的是一个DNA片段,它含有晶体蛋白编码序列而且已经被从该DNA片段所取自的物种的总基因组DNA中分离或纯化出来,在实施例中,上述的总基因组DNA指的是一种格兰氏阳性细菌种属,即杆菌,具体的是被称为苏云金芽胞杆菌的杆菌种属,的基因组。术语“DNA片段”所包括的有:DNA片段以及这类DNA片段的更小的片段;以及重组载体,包括例如质粒、粘粒、噬菌粒、噬菌体、病毒、等等。
类似地,一个含有经过分离或提纯的编码晶体蛋白的基因的DNA片段指的是一个DNA片段,它除了含有编码肽的序列以外,还含有特定的其它一些的元件,如调控序列,这些序列是从其它的天然的基因或编码蛋白的序列中分离出来的。考虑到这种情况,简单地用术语“基因”来指代一个编码功能性蛋白、多肽或肽的单位。如行内人士所可以理解的,这一功能性的术语同时包括基因组序列、启动子序列以及更小的通过基因工程制备的基因片段,它们可以表达或者适合于表达蛋白、多肽或肽。
“从其它的编码序列中分离出来”指的是所感兴趣的基因(在本发明中指的是编码细菌晶体蛋白的基因)构成了该DNA片段编码区域的主要部分,而且该DNA片段不含有很大部分的天然的编码DNA,如大的染色体片段或其它的功能性基因或操纵子编码区域。当然,这一术语指的是开始时所提取的DNA片段,并不排除随后人工地加入到该片段中的基因、重组基因、合成连接物、或者编码区域。
特别优选的DNA序列是那些编码以下晶体蛋白的序列:Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095以及Cry3Bb.11098。特别是如以下的3Bb*基因:cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cry3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095以及cry3Bb.11098。在特别的实施例中,本发明涉及分离的DNA片段以及整合了编码Cry肽种类的重组载体,上述的肽种类在其氨基酸序列中包含有如以下序列编号中所述的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。
术语“一个基本如在以下序列编号中所述的序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108”指的是这一序列对应于以下序列的一部分:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,而且与这些序列的氨基酸差异相对较少,或者是这些序列的氨基酸的功能性等同物。术语“生物学功能等同物”在本工艺中是众所周知的,而且在本发明中有更进一步的定义(例如,见实施例)。
相应地,与以下氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102或序列编号:108,或这些序列的功能性等同物有大约70%至大约75%、或大约75%至大约80%、或更优选地大约81%至大约90%、或甚至更优选地大约91%或大约92%或大约93%或大约97%或大约98%至大约99%同一性的序列或功能等同物即为“基本如以下序列中所提供的序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。”
同时还应该理解的是:氨基酸和核苷酸序列可以包括另加的残基,如另加的N-端或C-端的氨基酸或5’端或3’端的序列,但同时还是与如本发明中所述的其中一个序列基本相同,只要该序列符合上述的标准,包括在涉及蛋白表达时蛋白生物学活性的保持。特别地核苷酸序列的末端序列的添加可以适用于,例如,包括编码区5’端和3’端的侧翼的多种非编码序列或包括各种不同的内部序列,即内含子,已知其存在于基因内部。
本发明的核苷酸片段,不管其编码序列本身的长度如何,可以与其它的DNA序列,如启动子、多聚腺苷酰化作用信号、另加的限制性酶切位点、多重克隆位点、其它的编码片段,等等相结合,以使其整体长度可以有很大的差别。因此设想可以使用几乎任意长度的核苷酸片段,其总长度优选地被限制以便利制备和所需要的重组DNA协议的操作。
例如,可以制备一个包括一个编码以下所述的肽序列的短的连续序列的核苷酸片段:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,或者制备一个与编码以下序列中所公开的肽的DNA序列同一或是互补的核苷酸片段:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,特别是那些在以下序列编号中所公开的DNA片段:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。
本发明特别优选的核苷酸序列含有一个或多个本发明的cry基因,或者含有一个或多个本发明的cry基因的一部分。在特定的应用中,相对教小的连续的核苷酸序列是优选的,例如那些长度为大约14或15或16或17或18或19或20或30-50、51-80、81-100等等个核苷的核苷酸序列。可选地,在某些实施例中,特别是在涉及重组载体制备的实施例中,对宿主细胞进行转化、制备转基因植物细胞、制备更长的核苷酸片段是优选的,特别是那些包括一个或多个cry基因的全部编码区域的核苷酸片段。因此,优选的片段包括那些长度为大约20,000左右个碱基对的片段,可选地,包括较短的大约为19,000,大约为18,000,大约为17,000,大约为16,000,大约为15,000,大约为14,000,大约为13,000,大约为12,000,大约为11,000,大约为10,000,大约为9,000,大约为8,000,大约为7,000,大约为6,000,大约为5,000,大约为4,500,大约为4,000,大约为3,500,大约为3,000,大约为2,500,大约为2,000,大约为1,500,大约为1,000,大约为500,或大约为200左右个碱基对的片段。当然,这些数目并没有覆盖所有可能的介于20,000至15个核苷的中等长度的片段,所有这些中等长度的片段也被认为是有用的,同时也归属于本发明的范围之中。很容易理解“中等长度”指的是介于所述范围的任何长度,如14,15,16,17,18,19,20,等;21,22,23,24,25,26,27,28,29,等;30,31,32,33,34,35,36.....等;40,41,42,43,44等,50,51,52,53等;60,61,62,63....等,70,80,90,100,110,120,130等;200,210,220,230,240,250等,包括介于14-10,000之间的任何一个整数,包括那些介于200-500;500-1,000;1,000-2,000;2,000-3,000;3,000-5,000之间等的整数。
在一个优选实施例中,核苷酸片段包括一个介于1800至18,000个碱基对之间的序列,并包括一个或多个如本发明中所述的编码经过修饰的Cry3Bb*多肽的基因,其中所述的多肽对抗鞘翅类害虫的活性增强了。
同时应该理解的是,本发明并不局限于编码本发明中所述的肽的、或者编码以下氨基酸序列的特定的核苷酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108,包括在以下序列编号中特别公开的DNA序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。因此,重组载体和经过分离的DNA片段可以以不同的方式包含有编码肽的区域本身、在基本编码区域含有选定的变更或修饰的编码区域,或者它们可以编码更大的多肽,但是这些多肽仍含有这些编码肽的区域;或者编码生物学功能等同的蛋白或肽,这些肽可以含有不同的氨基酸序列。
本发明的DNA片段包括具有生物学功能的等同的肽。这种序列可以是密码子冗余度以及功能等同性的结果,已经知道这两种情况在核苷酸序列和由其编码的蛋白中是天然存在的。可选地,功能等同蛋白或肽可以通过应用重组DNA技术来产生,其中可以用基因工程根据所要交换的氨基酸的性质对蛋白进行改变。可以用定点突变技术来引入由人设计的变化,例如,引入蛋白抗原性的改善或者对突变体进行试验以检验其分子水平的活性。
如果需要也可以制备融合体蛋白和肽,例如,把编码肽的区域与其它的具有所要功能的蛋白或肽连接在同一表达单位中,以用于纯化或免疫鉴定目的(例如,蛋白可以分别通过亲和层析和酶标编码区域进行纯化)。
重组载体构成本发明的另一个方面。特别有用的载体被认为是那些载体,其中DNA片段的编码部分,不管编码全长的蛋白或者是教小的肽,都被定位于启动子的控制之下。启动子可以是与编码本发明肽的基因天然地联合在一起的那种启动子,也可以通过分离位于编码片段或外显子上游的5’端的非编码序列来获得,例如,使用重组克隆技术以及/或者PCRTM技术并结合本发明种所述的组合物。2.5载体、宿主细胞以及蛋白表达
在其它的实施例中,设想通过把编码DNA片段定位于接受重组或异源启动子的控制之下可以获得一些特定的长处。此处所用的重组的或异源的启动子指的是一种在其天然环境下并不于编码晶体蛋白或肽的DNA片段相关联的启动子。这类启动子可以包括正常与其它基因相关联的启动子,以及/或者从任何细菌、病毒、真核生物、或植物细胞中提取的启动子。自然地,使用一种可以有效地引导DNA片段在被选择用于表达的细胞类型、生物体、或者甚至动物中进行表达的启动子是很重要的。在蛋白表达时使用启动子和细胞类型联合对是精通分子生物学领域的人士所普遍知晓的,例如可以参照Sambrook等,1989。所使用的启动子可以是组成型的、或者是诱导型的,而且可以在合适的条件下被用于引导所引入的DNA片段的高水平表达,这在,例如重组蛋白或肽的大规模生产中是有利的。设想被用于高水平表达的合适的启动子系统包括但不局限于Pichia表达载体系统(Pharmacia LKB Biotechnology)。
联系用于制备重组蛋白和肽的表达实施例,设想可以最频繁地使用较长的DNA片段,编码整条肽序列的DNA片段是最优选的。然而,应该理解的是,使用较短的DNA片段来引导晶体肽或肽核心区域的表达,例如用于产生抗晶体蛋白抗体,也同样归属于本发明的范围之内。编码以下长度的肽抗原的DNA片段被设想是特别有用的,这些长度包括:大约8,9,10或11个左右氨基酸,达到并包括大约30,40或50个左右的氨基酸,或者更优选的,大约8至大约30个氨基酸,或者甚至更优选的,大约8至20个氨基酸。这些肽抗原决定簇可以是包含由以下连续的氨基酸序列的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,或序列编号:108。2.6 经过转化的宿主细胞以及转基因植物
在一个实施例中,本发明提供了一种转基因植物,它在其基因组中整合有一个编码选自以下集合中的连续氨基酸序列的转基因:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,序列编号:102,以及序列编号:108。
本发明的另外一个方面是一种转基因植物,它在其基因组中整合了一个Cry3Bb*转基因,该转基因包含有一个选自以下集合的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:40,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,以及序列编号:107。本发明同时还公开了这类转基因植物的子代及其种子,以及这类种子的子代,以及从这类转基因植物的第二代及以后各代的植物中长出的种子,并对其提出了权利要求。
本发明还公开了天然的和通过遗传过程改造的宿主细胞并对其提出了权利要求,这些宿主细胞表达新颖的Cry3Bb*基因,生产Cry3Bb*多肽。细菌宿主细胞的优选实施例包括苏云金芽孢杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11338,EG11339,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,EG11095,以及EG11098。
本发明同时公开了用此类细胞来生产Cry3*晶体蛋白的方法。这类方法通常包括在可以有效地生产Cry3*晶体蛋白的条件下培养宿主细胞(如苏云金芽孢杆菌EG11221,EG11222,EG11223,EG11224,EG11225,EG11226,EG11227,EG11228,EG11229,EG11230,EG11231,EG11232,EG11233,EG11234,EG11235,EG11236,EG11237,EG11238,EG11239,EG11241,EG11242,EG11032,EG11035,EG11036,EG11046,EG11048,EG11051,EG11057,EG11058,EG11081,EG11082,EG11083,EG11084,或EG11095,或EG11098)并从上述细胞中获得Cry3*晶体蛋白。
在另一方面,本发明提供了用于生产转基因植物的方法,上述的转基因植物表达一个编码本发明的新颖重组晶体蛋白的核苷酸片段。生产转基因植物的工序是在本工艺中众所周知的。总体上,该方法包括用一个或多个DNA片段来转化一个合适的宿主细胞,上述的DNA片段含有一个或多个启动子,这些启动子都以可操作的形式连接到一个编码一个或多个本发明中所公开的苏云金芽孢杆菌晶体蛋白的编码区域上。这类编码区域通常是以可操作的形式连接到一个转录终止区域,这样启动子就可以使该编码区域在细胞中进行转录,由此为细胞提供了在体内生产重组蛋白的能力。可选地,在需要控制、调节、或减少在特定的转基因细胞中所表达的特定的重组晶体蛋白的情形中,本发明也提供了晶体蛋白反义mRNA的表达方法。用反义mRNA作为一种用于控制或减少细胞中某种既定的感兴趣的蛋白的数量的手段是本工艺中众所周知的。
本发明的另外一个方面包括一种转基因植物,它表达一个编码一个或多个本发明中所述的新颖的多肽组合物的基因或基因片段。此处所用的术语“转基因植物”指的是已经整合了DNA序列的植物,其中的DNA序列包括但不局限于正常情况下可能不存在的基因、正常情况下并不被转录为RNA或翻译为蛋白(“表达”)的DNA序列、或者任何希望被引入未经转化的植物中去的其它的基因或DNA序列,例如一些在正常情况下在未经转化的植物中并不存在的,但是又希望能够进行遗传工程改造或改变其表达的基因。
设想在一些情形中,本发明的转基因植物的基因组已经通过稳定地导入一个或多个编码Cry3Bb*的转基因(天然的、通过合成进行修饰的、或者突变的)得到了扩充。在一些情形中,在转化的宿主植物细胞的基因组中已经整合了一个以上的转基因。例如在一种情形中,在此类植物的基因组中整合了一个以上的转基因。在一些特定的情形中,可能希望在转化的转基因植物中整合一个、两个、三个、四个、或者甚至更多的苏云金芽孢杆菌晶体蛋白(天然的或者是通过重组工程改造的)并使其稳定地表达。
一个优选的导入基因包括,例如,一个来源于细菌的编码晶体蛋白的DNA序列,特别是此处所述的来源于芽孢杆菌种属的DNA序列中的一个或多个序列。极为优选的是那些来源于苏云金芽孢杆菌的核苷酸序列,或者是那些已经通过遗传工程改造的序列中的任何一种,其中这些序列被改造以便减少或增加在此类转化的宿主细胞中晶体蛋白的杀虫活性。
用于转化植物细胞以及制备转基因细胞株的方法在本工艺中是众所周知的,在本发明中也给予了描述。当然,用于转化此类细胞的载体、质粒、粘粒、酵母人工染色体(YAC)以及DNA片段将包括操纵子、基因、或者本发明的来源于基因的序列(天然的、或者是通过合成方法获得的),特别是编码本发明中所公开的晶体蛋白的那一些序列。这些DNA构建物可以进而包括诸如启动子、增强子、多接头(polylinker)、或者甚至那些可以根据需要对感兴趣的特定的基因进行正或负调节的基因序列。DNA序列或基因可以编码一个天然的、或者经过修饰的晶体蛋白,上述蛋白将在所获得的重组细胞中得以表达,而且/或者将赋予再生的植物一个改良的表现型。
这类转基因植物对于通过在这样一株植物中整合一个编码对鞘翅类昆虫具毒性的Cry3Bb*晶体蛋白的转基因DNA片段来增加单子叶植物或双子叶植物的杀虫抗性可能是合乎需求的。特别优选的植物包括谷物,如玉米、小麦、黑麦、谷物、大麦、以及燕麦;豆类,如大豆;块茎,如土豆;纤维作物,如亚麻和棉花;草地和牧场草,观赏植物;灌木、树木、蔬菜、浆果、柑橘、水果、仙人掌、肉质植物,以及其它的具有商业重要性的作物,包括花园和家养植物。
在一个相关的方面,本发明同时还包括了由这种转化植物所产生的种子,这类种子的子代,以及由原先的转基因植物的子代所产生的种子,它们都是根据上述的步骤产生的。这类子代或种子将在其基因组中整合由一个或多个晶体蛋白转基因,而且这类子代植物将以孟德尔遗传方式遗传由导入的稳定的转基因所提供的性状。所有的这类已经在其基因组中整合有转基因DNA片段(这些片段编码一个或多个的转基因植物Cry3Bb*晶体蛋白或多肽)的转基因植物构成了本发明的一些方面。用于本发明的特别优选的转基因包括含有一个或多个Cry3Bb*基因的核苷酸片段。2.7 生物学功能等同物
可以对本发明的肽以及编码它们的DNA片段的结构进行修饰和变化并仍然获得一个编码具有所需特征的蛋白或肽的功能性分子。以下讨论的基础是对一个蛋白的氨基酸进行改变以获得一个等同物,或者甚至获得一个改善的第二代的分子。在本发明特定的实施例中,突变的晶体蛋白被设想对于增加蛋白的杀虫活性是有用的,并由此增加了在植物细胞中的重组转基因的生产活性和/或表达。氨基酸的变化可以通过改变DNA序列的密码子(根据表4中所示的密码子)来实现。
表4
氨基酸 密码
丙氨酸 A1a A GCA GCC GCG GCU
半胱氨酸 Cys C UGC UGU
天冬氨酸 Asp D GAC GAU
谷氨酸 Glu E GAA GAG
苯丙胺酸 Phe F UUC UUU
甘氨酸 Gly G GGA GGC GGG GGU
组氨酸 His H CAC CAU
异亮氨酸 Ile I AUA AUC AUU
赖氨酸 Lys K AAA AAG
亮氨酸 Leu L UUA UUG CUA CUC CUG CUU
甲硫氨酸 Met M AUG
天冬氨酸 Asn N AAC AAU
脯氨酸 Pro P CCA CCC CCC CCU
谷氨酰胺 Gln Q CAA CAG
精氨酸 Arg R AGA AGG CGA CGC CGG CGU
丝氨酸 Ser S AGC AGU UCA UCC UCG UCU
苏氨酸 Thr T ACA ACC ACG ACU
缬氨酸 Val V GUA GUC GUG GUU
色氨酸 Trp W UGG
酪氨酸 Tyr Y UAC UAU
例如,在一些结构,例如抗体的抗原结合区域或者底物分子的结合位点中,可以把这个蛋白结构中的特定的氨基酸替代为其它的氨基酸而并不明显地丧失相互作用的结合能力。由于一个蛋白的生物学活性是由其相互作用的能力以及蛋白的特性来定义的,所以可以对蛋白序列中的特定的氨基酸进行替换,而且,当然可以对与其相应的DNA编码序列进行替换,而且仍然获得一个具有类似特性的蛋白。因此,本发明者设想可以对本发明所公开的组合物,或与其相对应的编码上述肽的DNA序列进行各种不同的变化,而却并不明显地丧失它们的生物学效用和活性。
在进行这类改变时,应该考虑氨基酸的亲水性指标。氨基酸的亲水性指标在赋予蛋白的相互作用功能中的重要性在本工艺中是普遍公知的(Kyte和Doolittle,1982,作为参照结合于本文中)。氨基酸的相对亲水性特征被公认对由此获得的蛋白的二级结构起作用,而二级结构则决定了蛋白与其它的分子,例如,酶、底物、受体、DNA、抗体、抗原、等等之间的相互作用。
每一种氨基酸都被根据它的疏水性和带电特征分配了一个亲水性指标(Kyte和Doolittle,1982),分别为:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);以及精氨酸(-4.5)。
在本工艺中公知的是:可以把特定的氨基酸替换为具有相似的亲水性指标或得分的其它的氨基酸而且仍然可以获得一个具有相似生物学功能的蛋白,即,仍然获得了一个蛋白的生物学功能等同物。在进行此类变化时,对亲水性指标相差±2的氨基酸进行替换是优选的,相差±1的是特别优选的,相差±0.5的是更为优选的。
同时在本工艺中也是公知的是:可以根据亲水性来有效地对相似的氨基酸进行替换。美国专利4,554,101(特定地作为参照结合于本发明中)中的描述指出蛋白中的最大的局部平均亲水性,这种亲水性是由其周围的氨基酸的亲水性所支配的,这与蛋白的生物学特性相关。
如美国专利4,554,101中所详细描述的,对氨基酸已经指定了以下的亲水性值:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。
应该理解的是:可以把氨基酸替换为具有相似的亲水性值的其它的氨基酸而且仍然可以获得一个生物学等同物,以及特定地,获得一个免疫学等同物蛋白。在进行此类变化时,对亲水性值相差±2的氨基酸进行替换是优选的,相差±1的是特别优选的,相差±0.5的是更为优选的。
如上面所概述的,因此氨基酸替换通常是以氨基酸侧链的取代基团的相对相似性,例如,它们的疏水性、亲水性、带电特性、尺寸等等为基础的。以上述的各种不同的特征为根据而进行的示范性的替换是行内人士所公知的:精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;以及缬氨酸、亮氨酸和异亮氨酸。3.0 附图的简要描述
附图构成了本发明说明书的一部分并被包括进来以进一步示范本发明的特定的一些方面。通过参照一个或多个附图并结合此处所述的具体实施例的详细描述可以更好地理解本发明。
图1 Cry3Bb单体结构的示意图。
图2 Cry3Bb单体结构的立体图,结合有水分子(以点表示)。
图3A Cry3Bb的结构域1的示意图。
图3B 组成结构域1的7个螺旋的位置示意图。
图4Cry3Bb的结构域1被组织成7个如图3A(示意图)和图3B(简图)中所示的α螺旋。示出了α螺旋和氨基酸。
图5A Cry3Bb结构域2的示意图。
图5B 图示了组成结构域2的3个β片的11个β链。
图6 Cry3Bb的结构域2是3个如图5所示的反平行β片的集合。定义了这些β片的氨基酸列于下面(α8,氨基酸322-328,同时也包括于结构域2中)。
图7A Cry3Bb结构域3的示意图。
图7B 组成结构域3的β链的位置简图。
图8结构域3(图7)是一个组织松散的β链和环区的集合;不存在β片。β链含有以下所列的氨基酸:
图9A Cry3Bb二体结构的侧面观。在分子的中部可以看到结构域1的螺旋束。
图9B Cry3Bb二体结构的顶视图。在分子的中部可以看到结构域1的螺旋束。
图10 由Cry3A和Cry3Bb在平面脂双层中形成的通道随着时间其导率生长的图示图。Cry3A形成的通道的导率比Cry3Bb所形成的通道的导率要快出许多。
图11 pEG1701图谱,它含有Cry3Bb基因和cry1F终止子。
图12 在1B2,3区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复1-剂量鉴定法的结果。
图13 在1B6,7区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复1-剂量鉴定法的结果。
图14 在1B10,11区域有所改变的Cry3B蛋白对抗SCRW幼虫的重复1-剂量鉴定法的结果。
图15 由Cry3Bb.11230和野生型Cry3Bb在脂双层中形成的通道的单通道记录。由Cry3Bb.11230形成的通道具有界限分明的开启和关闭状态,而由Cry3Bb所形成的则很少。
图16 由Cry3Bb和Cry3Bb.60(Cry3Bb的一种截短的形式)所形成的通道的单通道记录。Cry3Bb.60形成通道的速度比Cry3Bb更快,而且不同于Cry3Bb的是,它所产生的通道具有界限分明的开启和关闭状态。
图17A Cry3A、Cry3B、和Cry3C氨基酸序列的序列对齐。
图17B 示出了图17A中所示的Cry3A、Cry3B、和Cry3C的氨基酸序列的对齐的继续。
图17C 示出了图17A中所示的Cry3A、Cry3B、和Cry3C的氨基酸序列的对齐的继续。4.0 示范性实施例的描述
本发明定义了新颖的苏云金芽孢杆菌(Bt)杀虫δ-内毒素蛋白以及被用于设计这些新颖蛋白的生物化学和生物物理学策略。δ-内毒素是一类由苏云金芽孢杆菌生产的杀虫蛋白,它们在平面脂双层上形成阳离子选择性的通道(English和Slatin,1992)。新的δ-内毒素是以对鞘翅类具有活性的δ-内毒素Cry3Bb的母体结构为基础的。与具有鞘翅类活性的δ-内毒素种类的其它成员(包括Cry3A和Cry3B)相似,Cry3Bb显示了出色的对抗可罗拉多薯虫(Leptinotarsa de-cemlineata)的杀虫活性。然而,不同于Cry3A和Cry3B的是,Cry3Bb对南部玉米食根虫或SCRW(Diabrolica undecimpunctata howardiBarber)西部玉米食根虫或WCRW(Diabrotica virgifera virgiferaLeConte)同样具有活性。此处所描述的新颖的杀虫蛋白是被特定地设计用于改善其母体Cry3Bb的生物学活性的。另外,设计策略本身就是新颖的发明,它们可以被应用于一般的苏云金芽孢杆菌δ-内毒素并对其进行改善。苏云金芽孢杆菌δ-内毒素同时也是一个形成离子通道的更大的细菌毒素种类中的成员(见English和Slatin,1992年的综述)。因此,本发明者相信这些设计策略同样可以被用于任何具有生物学活性的形成通道的蛋白以对其生物学特性进行改善。
经过设计的Cry3Bb蛋白可以用以下的策略中的一个或多个进行工程构造(1)鉴定并改变对蛋白酶敏感的位点,并进行蛋白水解;(2)对结合水进行分析和操作;(3)对运动区周围的氢键进行操作;(4)分析具有柔性的螺旋周围的环区并对其重新进行设计;(5)β链(Strand)以及β片周围的环区的设计;(6)鉴定复合的静电表面并对其进行设计;(7)金属结合位点的鉴定和去除;(8)四级结构的改变;(9)结构性残基的鉴定和设计;以及(10)由策略1-9所定义的任何位点以及所有位点的结合。这些策略使得可以对Cry3Bb的特定的位点进行鉴定和重新设计并最终创造出杀虫活性改善的新蛋白。这些新蛋白被标识为经过设计的Cry3Bb蛋白并被命名为Cry3Bb加一个句点再加上一个后缀(例如Cry3Bb.60、Cry3Bb.11231)。表2列出了新的蛋白以及分子上被修饰的特定的位点、氨基酸在这些位点的序列改变(这种改变改善了它的生物学活性)、经过改善的杀虫活性、以及被用于鉴定特定位点的设计方法。4.1 本发明的一些优点
对cry基因所进行的突变研究无能鉴定出显著数量的具有改善的广谱的杀虫活性(即对一个范围的害虫的毒性改善了)的突变的晶体蛋白。由于农作物在任何时间都典型地受到不止一种的害虫的侵袭,所以合乎需求的突变晶体蛋白优选地是那些对多种害虫的毒性都得到改善的突变的晶体蛋白。先前未能鉴定出这类突变体可能是因为所选定的用以突变的位点不合适。例如,对于相关的蛋白Cry1C,结构域2和结构域3中的位点是以前突变所努力的主要目标,这主要是因为这些结构域被认为在受体结合和杀虫活性的确定上具有重要的作用(Aronson等,1995;Chen等1993;de Maagd等.1996,Lee等,1992;Lee等,1995,Lu等,1994;Smedley和Ellar,1996;Smith和Ellar,1994;Rajamohan等,1995;Rajamohan等,1996)。
不同的是,本发明者推论认为Cry3蛋白的毒性,特定地Cry3Bb蛋白的毒性,可以通过靶定参与离子通道功能的区域,而不是分子中直接参与受体相互作用的区域(即结构域2和3)来改善,这种改善针对广泛范围的目标害虫。据此,本发明选择了Cry3Bb的结构域1中的目标区域进行突变以便分离具有改善的广谱毒性的Cry3Bb突变体。实际上,在本发明中描述了对几种鞘翅类害虫都具有改善的毒性的Cry3Bb突变体。
结构域1中的至少一个(可能是多个)α螺旋参与了离子通道和孔在昆虫中肠上皮的形成(Gazit和Shai,1993,Gazit和Shai,1995)。不同于他人对准编码结构域1的α螺旋的序列进行突变的做法(Wu和Aronson,1992;Aronson等,1995,Chen等,1995),本发明者选择了专有地对准编码毗邻或者预测的位于Cry3Bb的环区(这些环区分隔了α螺旋)中的氨基酸残基的序列。位于这些环区中的氨基酸或者加盖于(cap)α螺旋末端并毗邻这些环区的氨基酸残基可能会影响这些α螺旋之间的空间相互关系。因此,这些氨基酸残基的替换可能会导致三级结构、甚至是四级结构的微妙的变化,这些变化可能正面地影响离子通道的功能。位于结构域1环区的氨基酸残基暴露于溶剂中并因此可以与各种不同的分子进行相互作用。通过消除或封闭对蛋白酶敏感的位点来改变这些氨基酸可能会使蛋白更为稳定。改变结构域1的表面电荷的氨基酸替换可以改变离子通道的效率或者改变其与刷状缘膜或者毒素分子的其它部分之间的相互作用,从而使结合或插入更为有效。
根据本发明,对编码的Cry3Bb核苷酸残基进行碱基替换以便改变相应的多肽,特别是,在α螺旋之间的那些环区的特定的密码子。晶体蛋白的杀虫活性最终体现出用以有效控制昆虫所需的水平。应该尽可能地增强一种杀虫蛋白的效力以使其在田间具有经济和效率效能。可以期望在生物杀虫剂配方中的杀虫蛋白的效力的提高可以改善生物杀虫产品的田间性能。可选地,在生物杀虫剂配方中的杀虫蛋白的效力的提高可以促进在单位面积的接受处理的作物上使用较少数量的生物杀虫剂,从而使生物杀虫产品的使用更为经济。当杀虫活性提高的晶体蛋白在植物中表达时,它的生产可以被指望能够提高植物对容易侵袭的害虫的抗性。4.2 培养苏云金芽孢杆菌以生产晶体蛋白的方法
此处所述的苏云金芽孢杆菌菌株可以用标准的已知的介质和发酵技术进行培养。在发酵周期结束之后,首先用本工艺中公知的方法从发酵液中分离出苏云金芽孢杆菌孢子和晶体,这样就获得细菌。可以通过加入表面活性剂、分散剂、惰性载体、以及其它的成分把回收的苏云金芽孢杆菌孢子和晶体配置成可湿性粉末、浓缩液、微粒、或者其它的制剂,这样就方便了处理和应用于特定的目标害虫。配制和应用步骤都是本工艺中公知的。4.3 用于表达cry*基因的重组宿主细胞
本发明的核苷酸序列可以被导入范围广泛的各种不同的微生物宿主中。毒素基因的表达直接或间接地导致胞内生产和杀虫剂的保持。在合适的宿主,例如在假单胞菌属中,细菌可以被应用于鞘翅类昆虫的位置,在该位置,微生物将增殖并被昆虫所摄取。这样就可以对不需要的昆虫进行控制。可选地,可以在能够延长在细胞中生产的毒素的活性的条件下对拥有毒素基因的宿主微生物进行处理。然后可以把经过如此处理的细胞施用于目标害虫的环境中。如此获得的产品保留了苏云金芽孢杆菌毒素的毒性。
合适的宿主细胞,其中含有杀虫剂的细胞可以被处理以延长毒素在经过如此处理的细胞被施用于目标害虫的环境中时在细胞中的活性,可以包括真核或者原核细胞,通常局限于不产生对高等生物体(如哺乳动物)具有毒性的物质的那些细胞。然而,也可以使用那些产生对高等生物体具有毒性的物质的生物体,其中这种毒素是不稳定的,或者其应用的水平足够的低,不足对哺乳动物产生任何毒性。特别感兴趣的宿主是原核生物和低等的真核生物,如真菌。示例性的原核生物(包括格兰氏阴性和格兰氏阳性)包括肠杆菌科,如埃希氏菌属、欧文菌属、志贺菌属、沙门菌属、以及变性菌属;芽孢杆菌科;根瘤菌科,如根瘤菌;螺菌科,如发光菌、Zymomonas、沙雷菌属、气单胞菌属、弧菌属、去磺弧菌属、螺菌属;乳酸菌;极毛杆菌科,如假单胞菌属和醋酸杆菌属;固氮菌属;放线菌属;以及硝化菌属。真核宿主有真菌,如藻菌纲和子囊菌,包括酵母菌,如酵母属和人体酵母菌;以及担子菌酵母,如红酵母菌、短梗霉菌、掷孢酵母属,等等。
在筛选一个用于生产目的的宿主细胞时特别感兴趣的宿主的特征包括:易于把苏云金芽孢杆菌导入到宿主中;有可用的表达系统;表达的效率;杀虫剂在宿主中的稳定性;以及存在辅助的遗传能力。用作杀虫剂微胶囊的感兴趣的特征包括杀虫剂的保护性特质,例如具有厚的细胞壁、色素形成、以及在细胞内包装积或形成包含体;叶子亲和性;对哺乳动物不具有毒性;能够诱惑害虫摄食;容易杀灭和固定,同时又不损害毒性,等等。其它的考虑包括易于配制和处理、经济效益、保藏的稳定性,等等。
特别感兴趣的宿主生物体包括,例如红酵母菌属种类、短梗霉菌种类、酵母属种类、以及掷孢酵母属种类;植形(phylloplane)生物体,例如假单胞菌属种类、欧文菌属种类、以及产黄菌属种类;或者其它的生物体,如埃希氏杆菌、乳杆菌种类、杆菌种类、链霉菌种类、等等。特定的生物体包括Pseudomonas acruginosa,、荧光假单孢菌(Pseudomonas fluorescens)、啤酒酵母(Saccharomycescerevisiae)、苏云金芽孢杆菌(B.Thuringiensis)、大肠杆菌(Escherichia coli)、枯草芽孢杆菌(B.subtilis)、B.Megaterium、B.Cereus、浅青紫链霉菌(Streptomyces lividans)、等等。
可以用化学的或物理的方法,或者结合化学和/或物理方法对微生物细胞,例如含有苏云金芽孢杆菌毒素基因的微生物进行处理,只要这种技术对毒素的特质不产生有害的影响,也不消除细胞对这一毒素的保护能力。化学剂的离子有卤化剂,特别是原子系数为17-80的卤化剂。更特定地,可以在温和的条件下使用碘,让其作用足够长的时间以获得预期的结果。其它合适的技术包括用醛类,例如甲醛和戊二醛;抗感染剂,如氯化苄烷铵以及氯化十六烷吡啶盐;醇类,如异丙醇和乙醇;各种不同的组织固定剂,如Lugol氏碘、Bouin氏固定剂、Helly氏固定剂(见,例如Humason,1967);或者是结合使用在细胞被施用到宿主动物中时能够保存并延长在细胞中所生产的毒素的活性的物理学方法(热)和化学试剂。物理学方法的例子有短波长辐射,例如γ射线辐射以及X射线-辐射、冷冻、紫外线辐射、冻干法、等等。被处理的细胞通常可以保持完整并且在处理的过程中基本上处于增殖形态,而不是处于孢子形态,虽然在一些情形中也可以采用孢子形态。
当用一个合适的载体把苏云金芽孢杆菌毒素基因导入一个微生物宿主中,而且上述的宿主是以活的形态被施用于环境中时,施用特定的宿主微生物是关键的。选择那些已知能够占领一种或多种感兴趣的作物的“植物圈”(叶面(phylloplane)叶隙(phyllosphere),根际(rhizosphere),以及/或者根面(rhizoplane))的微生物宿主。对这些微生物进行筛选以便使其能够在特定的环境(作物和其它昆虫的栖息地)中与野生型的微生物进行竞争,能够为那些表达多肽杀虫剂的基因提供稳定的保持和表达,以及,可望地,为环境对杀虫剂的降解和灭活提供改善的保护。
已知有数量众多的微生物可以栖息在诸多重要作物的叶面(叶子的表面)以及/或者在根围(植物根周围的土壤)上。这些微生物包括细菌、藻类已经真菌。特别感兴趣的是微生物,例如细菌,如杆菌属(包括苏云金芽孢杆菌种属和亚种:B.thuringiensis kurstaki HD-1,B.thuringiensis kurstaki HD-73,B.thuringiensis sotto,B.thuringiensis berliner,B.thuringiensis thuringiensis,B.thuringiensis folworthi,B.thuringiensis dendrolimus,B.thuringiensis alesti,B.thuringiensis galleriae,B.thuringiensis aizawai,B.thuringiensis subtoxicus,B.thuringiensis entomocidus,B.thuringiensis tenebrionis以及B.thuringiensis san diego);假单胞菌属、欧文菌属、沙雷菌属、克雷泊氏菌属、Zanthomonas、链霉菌属、根瘤菌、红假单胞菌属、Methylophilius、农杆菌、醋酸杆菌属、乳杆菌属、节杆菌属、Azorobacter、明串珠菌属、以及产碱菌属;真菌,特别是酵母,例如Saccharomyces、隐球菌属、克鲁维酵母属、掷孢酵母属、红酵母属、以及短梗霉属。特别感兴趣的是如下的植物圈细菌种类:Pseudomonas syringae,Pseudomonas fluorescens,Serratiamarcescens,Acetobacter xylinum,Agrobacterium lumefaciens,Rhodobacter sphaeroides,Xanthomonas campestris,Rhizobiummelioli,Alcaligenes eutrophus,和Azotobacter vinlandii;以及植物圈酵母种类,如Rhodotorula rubra,R.glutinis,R.marina,R.aurantiaca,Cryptococciis albidus,C.diffluens,C.lazirentii,Saccharontvces rosei,S.preloriensis,S.Cerevisicie,Sporobolomyces roseus,S.Odorus,Kluyveromycesveronae,以及Aureobasidiuni pollulans。4.4定义
根据本发明,核苷酸序列包括但不局限于DNA(包括但不局限于基因组或非基因组DNA)、基因、RNA(包括但不局限于mRNA和tRNA)、核苷、以及来源于天然来源的、化学合成的、经过修饰的、或者以其它的方法人工制备的合适的核苷酸片段。以下词语和短语的意义如下定义。
一个/一种:根据长效的专利法协定,当词语“一个”和“一种”用于申请(包括权利要求)中时,指的是“一个(种)或多个(种)”。
广谱:指的是范围广泛的昆虫种类。
广谱活性:针对广泛范围的昆虫的毒性。
表达:多个胞内过程的组合,包括一个编码的DNA分子,如一个结构基因,为了生产多肽所进行的转录和翻译。
杀虫活性:对昆虫的毒性。
杀虫特异性:由晶体蛋白或蛋白、微生物或植物所表现出来的对多种昆虫种类的毒性。
目内(Intraorder)特异性:一种特定的晶体蛋白对一个目范围内的昆虫(例如鞘翅目)的毒性。
目间(Interorder)特异性:一种特定的晶体蛋白对不同目的昆虫(例如鞘翅目和双翅目)的毒性。
LC50:导致被处理的昆虫的50%致死的晶体蛋白的致死浓度。
LC95:导致被处理的昆虫的95%致死的晶体蛋白的致死浓度。
启动子:在DNA序列或一组DNA序列种的一个识别位置,它为一个结构基因提供了一个表达控制元件,而且RNA聚合酶特定地结合于其上并启动该基因的RNA合成(转录)。
再生:从一个植物细胞(例如一个植物原生质体或外植体)生长一株植物的过程。
结构基因:一个被表达以生产多肽的基因。
转化:把一个外源DNA序列(例如一个载体、一个重组DNA分子)导入一个细胞或原生质体中的过程,其中外源基因被整合到染色体中或者能够自主复制。
转化细胞:一个其DNA已经通过在该细胞中导入一个外源DNA分子而被改变的细胞。
转基因细胞:任何来源于或者再生于转化细胞或来源于转基因细胞的细胞。转基因细胞的例子包括来源于转化植物细胞以及特定的细胞,如叶子、根、茎细胞的植物愈伤组织,例如体细胞,或者是来源于转基因植物的生殖细胞。
转基因植物:来源于转化植物细胞或原生质体的植物或其子代,其中的植物DNA含有一个被导入的外源DNA分子,这一分子并不存在于天然的非转基因的同种株系的植物中。术语“转基因植物”以及“转化植物”有时候在本工艺中被用于同义地定义一种其DNA中含有一个外源DNA分子的植物。然而,应该认为更科学的是应该用“转基因植物”来指代一种来源于转化植物细胞或原生质体的再生的植物或愈伤组织。本文将遵从这种用法。
载体:一个能够在宿主细胞复制,而且/或者另一个DNA片段可以以可操作的形式与其相连以使附加的片段得以表达的DNA分子。质粒就是载体的一个例子。
此处所用的标识“CryIII”以及“Cry3”是同义的,,同样“CryIIIB2”和“Cry3Bb”也是同义的。类似地,本发明者已经用一般的术语“Cry3Bb*”来标识任何以及所有的Cry3Bb变体,这些变体在蛋白中含有被修饰的氨基酸序列。类似地,Cry3Bb*被用于标识任何以及所有的编码Cry3Bb*蛋白的核苷酸片段和/或基因,等等。4.5 cry3Bb*多聚核苷酸的制备
一旦已经使用本发明所公开的设计策略对所要突变的肽的结构进行了分析,合乎需求的是在蛋白中,或者可选地,在编码该蛋白的DNA序列中导入一个或多个突变以便生产一个生物杀虫特质改变的突变蛋白。
为此,本发明同时包含了以本发明中所述的方式对一个编码一个晶体蛋白的核苷酸片段进行定点突变和随机突变的方法。具体地,,本发明公开了用此处所述的一种或多种设计策略对编码该氨基酸序列的核苷酸片段进行突变的方法。然后可以使用此处所描述的鉴定方法来鉴定由这些步骤所获得的突变体哪一个具有改善的杀虫特质或者改变的特异性,包括目内和目间的。
用于对一个编码一个晶体蛋白的DNA片段进行突变的方法是行内人士所公知的。可以用随机的或者定点的突变步骤来进行修饰。可以通过在该序列上添加或删除一个或多个核苷来改变其结构,从而对该核苷酸进行修饰。
可以根据本工艺中已知的任何一项技术进行突变,例如,但不局限于合成一个在一个特定的晶体蛋白中含有一个或多个突变的低聚核苷酸。一个“合适的宿主”可以是任何表达Cry3Bb的宿主,例如,但不局限于苏云金芽孢杆菌和大肠杆菌。对杀虫活性,在Cry3Bb的情形中包括但不局限于对鞘翅类的毒性,的筛选可以用本工艺中公知的技术来进行。
具体地,定点突变,通过对作为基础的DNA进行特定的突变,是一个在个体肽、或者蛋白或肽的生物学功能等同物的制备中有用的技术。进而可以用这一技术来制备和试验序列变体,例如,结合上述的一个或多个考虑,通过在该DNA上导入一个或多个核苷序列来实现。定点突变使得可以通过使用编码所需突变的特定的低聚核苷酸序列以及足够数目的毗邻的核苷来产生一个引物序列,这个引物序列所具有的尺寸和序列复杂度足以在删除接合的两端形成一个稳定的双链。典型地,优选的引物的长度是大约17至大约75个核苷,或更长,其中在序列接合处的两端有大约10至大约25个或更多的残基被改变。
大体上,定点突变技术是本工艺中众所周知的,它们在各种不同的出版物中已经被例举了。应该理解的是,该技术典型地采用一种可以以单链和双链两种形式存在的噬菌体载体。在定点突变中有用的典型的载体包括如M13噬菌体之类的载体。这些载体是商品化的,它们的使用方法通常是行内人士所公知的。双链质粒也是在定点突变中所常规使用的,它省略了把目标基因从质粒转移到噬菌体这一过程。
大体上,根据本发明的定点突变是这样来实施的:首先获得一个单链载体或者双链载体熔化开的两条链,上述的载体在其序列中包含有一个编码目标肽的DNA序列。制备一个含有所需突变序列的低聚核苷酸引物,通常用合成的方法来制备。然后把引物和单链载体一起退火,然后用DNA聚合酶,如大肠杆菌聚合酶I的Klenow片段,进行处理以便合成含有突变的链。这样就形成一个异源双链,其中一条链编码初始的未经突变的序列,另一条链含有所需的突变。然后用这种异源双链载体对合适的细胞,例如大肠杆菌细胞,进行转化或转染。把含有具有突变序列的重组载体的克隆筛选出来。Kunkel等(1987)设计了一个遗传选择方案,用于富集结合有突变低聚核苷酸的克隆。可选地,可以结合使用PCRTM和商业化的热稳定的酶,如Taq聚合酶来把突变的低聚核苷酸引物整合到一个经过扩增的DNA片段中,然后再克隆到一个合适的克隆或表达载体中去。Tomic等(1990)和Upender等(1995)的PCRTM介导的突变步骤就是这类协议的两个例子。也可以使用一个采用温度稳定的连接酶和温度稳定的聚合酶的PCRTM来把一个磷酸化的突变低聚核苷酸整合到一个经过扩增的DNA片段中,然后再克隆到合适的克隆或表达载体中。由Michael(1994)所描述的突变步骤提供了一个此类协议的例子。
本发明提供了通过定点突变来制备所选定的编码肽的DNA片段的序列变体的方法,用于生产潜在有用的种类,但这并不具有局限性,因为还有许多种途径可以被用来获得肽的序列变体以及编码它们的DNA序列。例如,可以用诱变剂,例如羟胺,对编码所需肽序列的重组载体进行处理以获得序列变体。
此处所用的术语“低聚核苷酸指导的突变步骤”指的是依赖于模板的过程以及由载体介导的增殖,例如扩增,这导致一种特定的核苷酸分子浓度提高(相对于初始浓度而言),或者使一个可检测信号的浓度提高。此处所用的术语“低聚核苷酸指导的突变步骤”指的是一个涉及一个引物分子依赖于模板进行延伸的过程。术语“依赖于模板的过程”指的是一个RNA或一个DNA分子的核苷酸合成,其中新合成的核酸链的序列是由著名的碱基互补配对原则所指挥的(参照,例如,Watson,1987)。
典型地,载体介导的方法学涉及在核苷酸片段中导入一个DNA或RNA载体、载体的克隆性扩增、以及经过扩增的核酸片段的回收。这类方法学的例子见于美国专利4,237,224,该专利的全部内容作为参照结合于本发明中。
现有一些依赖于模板的步骤可以被用于对存在于样品中的感兴趣的目标序列进行扩增。最著名的扩增方法之一是聚合酶链式反应(PCRTM),描述于美国专利4,683,195、4,683,202、以及4,800,159中(上述的每一专利的全部内容都作为参照特定地结合于本发明中)。简要地说,在PCRTM中,应制备两条引物,它们与目标序列的相对的互补链上的区域是互补的。在一个反应混合物中加入过量的脱氧核糖核苷三磷酸以及DNA聚合酶(例如Taq聚合酶)。如果在样品中存在目标序列,引物将和目标结合,聚合酶将通过添加核苷来使引物沿着目标序列延伸。通过提高和降低反应混合物的温度可以使经过延伸的引物与目标解离,形成反应产物,过量的引物将结合到目标以及反应的产物之上,重复进行扩增过程。优选地,可以采用一种逆转录酶PCRTM扩增步骤以便对经过扩增的mRNA进行定量。聚合酶链式反应是本工艺中众所周知的。
另外一种扩增方法是连接酶链式反应(称为LCR),描述于欧洲专利申请出版No.320,308,该专利的全部内容都作为参照特定地结合于本发明中。在LCR中,制备两个互补探针对,而且当有目标序列存在时,每一对探针将结合到相对的靶互补链之上由此它们毗邻。在有连接酶存在的情况下,两个探针对将连接形成一个单一的单位。通过类似于PCRTM的温度循环,结合的经过连接的单位从目标上解离下来,然后充当过量的探针对连接的“目标序列”。美国专利4,883,750,该专利的全部内容都作为参照特定地结合于本发明中,描述了一种类似于LCR的替代的扩增方法,用于使探针对结合到目标序列上。
在国际专利申请出版No.PC17US87/00880中所描述的QbetaReplicaseTM也可以被用为本发明的另一种扩增方法,该发明的全部内容都作为参照结合于本发明中。在这种方法中,在有RNA聚合酶存在的情况下把一个可复制的并且含有与目标互补的区域的RNA序列加入到样品中。这样聚合酶就可以复制上述的可复制的序列。
一种等温扩增方法,其中限制性核酸内切酶以及连接酶被用于扩增在其中的一条含有限制性位点的链上含有核苷5’-[α-硫代]三磷酸的目标分子(见Walker等,1992,该文献的全部内容都作为参照结合于本发明中),在本发明的核酸的扩增中可能也是有用的。
链位移扩增(Strand Displacement Amplification,SDA)是另外一种进行等温核酸扩增的方法,它涉及多轮的链位移和合成,即缺口翻译。一种类似的方法,称为修复链反应(Repair Chain Reaction,RCR),是另外一种在本发明中可能有用的扩增方法,它涉及对遍及目标扩增区域中的几个探针进行退火,然后再进行修复反应,在上述的修复反应中只存在四种碱基中的两种碱基。为了检测的方便,可以加入另外两种碱基的生物素标记的衍生物。SDA也使用类似的方法。
也可以用一种循环式探针反应(cyclic probe reaction,CPR)来检测序列。在CPR中,把一个含有非Cry特异性的DNA的3’和5’端序列以及一个Cry特异性的RNA的内在序列的探针与样品中存在的DNA进行杂交。杂交之后立即用RNaseH对反应进行处理,被探针鉴定为与众不同的那些产物在酶解之后释放一个信号。初始的模板被退火成为另一个循环探针,反应重复进行。这样,CPR涉及扩增一个由探针和一个Cry特异性表达核酸杂交所产生的信号。
另外也可以根据本发明使用在英国专利申请No.2,202,328以及国际专利申请出版No.PCT/US89/01025中所述的扩增方法,这两个专利的全部内容都作为参照结合于本发明中。在前一个申请中,把“经过修饰的”引物用于类似于PCRTM的依赖于模板和酶的合成中。可以通过给引物标记一个捕抓部分(如生物素)以及/或者一个检测部分(如酶)来对引物进行修饰。在后一个申请中,在一个样品中加入过量的经过标记的探针。在有目标序列存在的情况下,探针发生结合并被酶切。在酶切之后,目标序列被完整地释放以供过量的探针结合。对经过标记的探针进行酶切反映了目标序列的存在。
其它的核酸扩增步骤,包括基于转录的扩增系统(transcription-based amplification systems,TAS)(Kwoh等,1989;国际专利申请出版No.WO 88/10315,其全部内容作为参照结合于本发明中),包括基于核酸序列的扩增(nucleic acid sequencebased amplification,NASBA)以及3SR。在NASBA中,可以通过以下步骤来制备用于扩增的核酸:标准的酚/氯仿提取、样品的热变性、用裂解缓冲液以及minispin来分离DNA和RNA,或者用盐酸胍来提取RNA。
这些扩增技术涉及对一个具有晶体蛋白特异性的序列的引物进行退火。在聚合以后,用RNaseH对DNA/RNA杂合体进行酶解,双链DNA分子则再次进行热变性。在每一种情形中,通过加入第二个晶体蛋白特异性的引物然后再聚合来把单链DNA制备成完全的双链DNA。然后用聚合酶(如T7或SP6)对双链的DNA分子进行多重转录。在一个等温循环式反应中,RNA被反转录为双链DNA,然后再用聚合酶(如T7或SP6)进行转录。如此获得的产物,不管是截短的还是完整的,都显示晶体蛋白特异性的序列。
欧洲专利申请出版No.329,822(该申请的全部内容作为参照结合于本发明中)公开了一种核酸扩增工序,它涉及循环地合成单链RNA(“ssRNA”)、ssDNA、以及双链DNA(dsDNA),这一工序可以根据本发明进行使用。ssRNA是提供给第一个引物低聚核苷酸的第一个模板,它可以用逆转录酶(依赖于RNA的DNA聚合酶)来延长。然后用核糖核酸酶H(RNaseH,一种对与DNA或RNA形成双螺旋的RNA具特异性的RNase)作用以便从如此获得的DNA:RNA双螺旋中除去RNA。如此获得的ssDNA为第二个引物提供了第二个模板,上述的第二个引物也包括一个RNA聚合酶启动子(如T7 RNA聚合酶)的序列,这个序列与模板的5’端具有同源性。然后用DNA聚合酶(如大肠杆菌DNA聚合酶I的″Klenow″大片段)进行延伸,形成双链DNA(“dsDNA”)分子,这个分子所含的序列与介于引物之间的初始的RNA的序列是一样的,而且在一端含有一个另加的启动子序列。这一启动子可以被合适的RNA聚合酶用于制造许多DNA的RNA拷贝。随后这些拷贝可以重新进入循环,导致扩增非常迅速地进行。只要选择合适的酶,这一扩增可以在等温的条件下进行,不需要在每一个循环添加酶。因为这一工序具有循环的本质,所以起始的序列可以选择DNA或RNA任意一种形式。
国际专利申请出版No.WO 89/06700,该申请的全部内容作为参照结合于本发明中,公开了一种核酸序列扩增方案,这一方案是基于启动子/引物序列与一个目标单链DNA(“ssDNA”)进行杂交,然后再由该序列转录出许多RNA拷贝这样一个基础的。这一方案不是循环式的,即,并没有从所得的RNA转录产物制造出新的模板。其它的扩增方法包括″RACE″(Frohman,1990),以及“单侧PCRTM”(″one-sidedPCRTIA″(Onara,1989),它们都是行内人士所公知的。
以以下为基础的方法也可以被用于本发明的DNA序列的扩增:在有含有所得的“二聚-低聚核苷酸”的核苷酸的存在下,两个或更多个多聚核苷酸发生连接,从而对上述的二聚-多聚核苷酸进行扩增(Wu和Dean,1996,该文献的全部内容作为参照结合于本发明中)。4.6 噬菌体抗性变体
在特定的实施例中,可能需要制备一种或多种用本发明方法制备的苏云金芽胞杆菌突变体的噬菌体抗性的变体。为此,在营养琼脂上涂布噬菌体裂解液的等份液体并让它干燥。然后在上述的经过干燥的裂解液上直接接种对噬菌体敏感的细菌菌株的等份液体并让它干燥。平板在30℃温育。给平板温育2天,此时可以观察到已经有许多菌落生长在琼脂上。把其中的一些菌落挑出来并传代培养于营养琼脂平板上。通过与噬菌体裂解液交叉画平板来试验这些显然具有抗性的培养物的抗性。在平板上画一条噬菌体裂解液的线并让它干燥。然后把假定具有抗性的培养物与噬菌体的线交叉画于平板上。经过30℃过夜温育,具有抗性的细菌培养物在与噬菌体线交叉的任何地方都无裂解。随后,对噬菌体的抗性通过在营养琼脂平板上接种抗性培养物的菌苔来确证。同时还以同样的方式接种敏感的菌株以充当阳性对照。在干燥以后,在平板的中心接种一滴噬菌体的裂解液并让它干燥。经过30℃24小时温育,具有抗性的细菌培养物在接种有噬菌体裂解液的地方都没有裂解。4.7 作为杀虫剂的晶体蛋白组合物及其使用方法
鞘翅目昆虫含有数量众多的甲虫种类,包括土鳖虫、网状甲虫、皮蠹和红带皮蠹、长角甲虫、叶甲虫、象鼻虫、树皮甲虫、瓢虫、soldierbeetle、鹿角虫、水体食腐甲虫、以及各种各样的其它的甲虫。在以下网站有鞘翅目的简要的分类法:http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html.
在鞘翅目中特别重要的是农业害虫,包括Chrysomeliformia和Cucujiformia亚目下的昆虫。Chrysomeliformia亚目下的昆虫,包括叶甲虫(Chrysomelidae)和象鼻虫(Curculionidae),对于农业是特别成问题的,它们造成了作物和植物的各种各样的昆虫损害。Cu-cujiformia亚目包括以下的科:Coccinellidae,Cucujidae。Lagridae,Meloidae,Rhipiphoridae,和Tenebrionidae。公知的,在这一亚目中,Chrysomelidae科的一些昆虫(包括以下种类:Exema,Chrysomela,Oreina,Chrysolina,Leptinotarsa,Gonioctena,Oulema,Monozia,Ophraella,Cerotoma,Diabrotica,和Lachnaia)具有毁坏农作物的潜能。
由于本发明的毒素已经显示可以有效地对抗多种鞘翅目的昆虫,所以本发明者设想可以使用本发明中所述的组合物来控制或者根除许多鞘翅类昆虫。类似地,本发明中所述的用于产生经过修饰的昆虫特异性提高的多肽的方法可以被用于在把经过修饰的多肽的杀虫活性范围扩展到鞘翅目之内或之外的其它昆虫种类。
因此,本发明者设想本发明中所公开的晶体蛋白组合物将在田间作物的局部和/或系统杀虫应用中发挥特定的杀虫剂用途,这些田间作物包括但不局限于稻谷、小麦、紫花苜蓿、玉米、大豆、烟草、土豆、大麦、芸薹(油菜籽)、甜菜、甘蔗、亚麻、黑麦、燕麦、棉花、向日葵、草地(如牧场草和草地草)、果实、柑橘、坚果、树木、灌木、以及蔬菜;以及观赏植物、仙人掌、肉质植物、等等。
本发明描述并要求权项的是含有一种杀虫有效数量的Cry3Bb*晶体蛋白组合物的组合物。该组合物优选地含有以下的氨基酸序列:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,或序列编号:108,或其生物学功能相当的序列。
杀虫剂组合物也可以含有一种由具有以下序列的核苷酸序列编码的Cry3Bb*晶体蛋白:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号,55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,或序列编号:108,或者可选地,一种在中等严格程度的条件下与以下核苷酸序列杂交的核苷酸序列:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,或序列编号:107。
杀虫组合物可以包括一种或多种类型的苏云金芽胞杆菌细胞,或者一种或多种此类细胞的培养物,或者可选地,一种或多种表达一种或多种表达本发明的新颖的晶体蛋白的苏云金芽胞杆菌细胞与另一种杀虫组合物的混合物。在特定的方面可能需要制备含有许多晶体蛋白的组合物,其中所述的晶体蛋白可以是天然的或者是经过修饰的,用于抵抗一种或多种类型的易感昆虫。在配制之前,可以对本发明的苏云金芽胞杆菌细胞进行处理以便延长其在细胞被施用于目标昆虫的环境中时的杀虫活性。这类处理可以是化学的或物理的方法,或者是化学和/或物理方法相结合,只要这种技术不对杀虫剂的性质产生有害的影响,也不消除细胞对杀虫剂的保护能力。化学剂的例子有卤化剂,特别是原子系数为17-80的卤素。更为特定地,可以在温和的条件下用碘作用足够长的时间以达到所要的结果。其它合适的技术包括用醛类,例如甲醛和戊二醛;抗感染剂,如抗感染剂,如氯化苄烷铵;醇类,如异丙醇和乙醇;各种不同的组织固定剂,如Bouin氏固定剂和Helly氏固定剂(见Humason,1967);或者是结合使用在细胞被施用到宿主动物中时能够保存并延长在细胞中所生产的δ-内毒素的活性的物理学方法(热)和化学试剂。物理学方法的例子有短波长辐射,例如γ射线辐射以及X射线-辐射、冷冻、紫外线辐射、冻干法、等等。
本发明者设想可以用本工艺的熟练人士所公知的任何配制方法用本发明中所述的蛋白来制备此类生物杀虫剂组合物。配制一种表达一种或多种Cry3Bb*DNA片段、产生被编码的Cry3Bb*蛋白或肽的细胞培养物(优选的是细菌细胞培养物,如在表3中所列的苏云金芽胞杆菌细胞)的全细胞制剂、细胞提取液、细胞悬浮液、细胞匀浆液、细胞裂解液、细胞上清液、细胞过滤液(filtrates)、或者细胞沉淀物可能是合乎需求的。用于配制此类制剂的方法是本工艺的熟练人士所公知的,而且可以包括对一种或多种表达所感兴趣的Cry3Bb*肽的细菌细胞(如在表3中所列的苏云金芽胞杆菌细胞)的培养物进行干燥、冻干、匀浆、提取、过滤、离心、沉淀、或浓缩。
在一个优选实施例中,生物杀虫剂组合物包括一种油可以流动(oil flowable)的悬浮液,上述的悬浮液包含含有一种或多种本发明中所述的新颖的晶体蛋白的经过裂解或未经裂解的细菌细胞、孢子、或者晶体。优选地,上述的细胞是苏云金芽胞杆菌细胞,但是,任何此类表达本发明所述的新颖的核酸片段并生产晶体蛋白的细菌宿主细胞都被认为是有用的,例如杆菌种类,例如B.megaterium、B.sublilis、B.cereus;埃希氏杆菌种类,包括大肠杆菌;以及/或者假单胞杆菌种类,包括P.cepacia、P.aeruginosa、以及P.fluorescens。可选地,油可以流动的悬浮剂可以是由一种或多种下列组合物所组成:经过裂解或未经过裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白。
在本发明的另一个优选实施例中,生物杀虫剂组合物含有一种可以在水中分散的微粒或者粉末。这一微粒或粉末可以包含经过裂解或未经过裂解的细菌细胞、孢子、或者晶体蛋白,它们含有一种或多种本发明中所述的新颖的晶体蛋白。这些组合物的优选的来源包括诸如苏云金芽胞杆菌细胞的细菌细胞,然而那些用本发明中所述的DNA片段进行转化并表达晶体蛋白的杆菌、埃希氏杆菌、以及假单胞杆菌细胞也被设想是有用的。可选地,微粒或粉末可以是以下一种或多种组合物的结合:裂解或未经裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白。
在第三个重要的实施例中,生物杀虫剂组合物含有一种可湿性粉末、喷雾剂、乳剂、胶体、水溶液或有机溶液、粉尘、小药丸、或者棉胶浓缩液。这类组合物可以含有如上所述的经过裂解的和未经裂解的细菌细胞、孢子、晶体、或者细胞提取物,它们含有一种或多种本发明中所述的新颖的晶体蛋白。优选的细菌细胞是苏云金芽胞杆菌细胞,然而,那些用本发明中所述的DNA片段进行转化并表达晶体蛋白的B.megaterium、B.subtilis、B.cereus、大肠杆菌、或者假单胞菌细胞也被设想是有用的。这类干形式的杀虫剂组合物可以被配制成在被湿润时立即溶解,或者可选地,以控释的或缓释的、或者其它的依赖于时间的形式溶解。可选地,这类组合物可以是以下一种或多种组合物的结合:裂解或未经裂解的细菌细胞、孢子、晶体、以及/或者经过纯化的晶体蛋白。
在第四个重要实施例中,生物杀虫剂组合物含有一种经过裂解的和未经裂解的细菌细胞、孢子、晶体、以及/或者一种含有经过裂解的和未经裂解的细菌细胞、孢子、以及或者晶体的混合物(如上述的含有本发明中所述的新颖的晶体蛋白的那一些)的水溶液、悬浮液、或者细胞培养物。此类水溶液或悬浮液可以被制备为浓缩的保藏液,可以在施用前把它稀释,或者可选地,也可以制备为可以现用的稀释液。
对于那些涉及使用细菌细胞的方法,含有晶体蛋白基因的细胞宿主可以在任何合适的营养介质中培养,其中DNA构建物提供了选择性的优点,提供了一个选择性的介质,使得几乎全部或者全部的细胞都含有苏云金芽胞杆菌基因。随后可以根据合适的方法收获这些细胞。可选地,也可以在收获之前对细胞进行处理。
当杀虫剂组合物包括含有所感兴趣的经过修饰的晶体蛋白的苏云金芽胞杆菌细胞、孢子、以及/或者晶体时,这种组合物可以以各种不同的方式进行配制。可以通过把其和各种不同的惰性材料,如无机矿物质(叶状硅酸盐、碳酸盐、硫酸盐、磷酸盐、等等)或者植物材料(粉末状的玉米的穗轴、稻谷的壳、胡桃的壳、等等)混合在一起来配制成可湿性粉末、微粒或粉尘。配方可以包括spreader-sticker佐剂、稳定剂、其它的杀虫添加剂、或者表面活性剂。液体配方可以是水基的,或者是非水基的并可以采用例如泡沫、悬浮剂、可乳化的浓缩液等形式。成分中可以包括流变学药剂、表面活性剂、乳化剂、分散剂、或者聚合体。
可选地,新颖的来源于Cry3Bb的突变的晶体蛋白可以用天然的或重组的细菌表达系统在体外进行制备并被分离出来供随后的田间施用。这类蛋白可以是存在于粗的细胞裂解液、悬浮液、胶体、等等中,或者可选地可以在被配制于活性生物杀虫剂配方中之前被纯化、精化、用缓冲液处理、以及/或者被进一步加工。类似地,在特定的环境中,从表达晶体蛋白的细菌培养液中分离晶体以及/或者孢子并把这类晶体以及/或者孢子的溶液、悬浮液、或者棉胶制剂用作活性生物杀虫剂组合物可能是合乎需求的。
本发明的另外一个重要的方面是一种用于控制容易受本发明中所述的新颖的组合物影响的鞘翅类昆虫的方法。这类方法通常包括让昆虫或者昆虫种群、群落等接触杀虫有效数量的Cry3Bb*晶体蛋白组合物。该方法可以使用如在以下序列中所述的Cry3Bb*晶体蛋白:序列编号:2,序列编号:4,序列编号:6,序列编号:8,序列编号:10,序列编号:12,序列编号:14,序列编号:16,序列编号:18,序列编号:20,序列编号:22,序列编号:24,序列编号:26,序列编号:28,序列编号:30,序列编号:32,序列编号:34,序列编号:36,序列编号:38,序列编号:40,序列编号:42,序列编号:44,序列编号:46,序列编号:48,序列编号:50,序列编号:52,序列编号:54,序列编号:56,序列编号:58,序列编号:60,序列编号:62,序列编号:64,序列编号:66,序列编号:68,序列编号:70,序列编号:100,或序列编号:108,或其生物学功能相当的序列。
可选地,本发明的方法可以使用一种或多种由以下核酸序列编码的Cry3Bb*晶体蛋白:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107,或者由一种或多种在中等严格或者更高严格程度下与以下序列杂交的核酸序列编码的Cry3Bb*晶体蛋白:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。用于鉴定在中等严格程度或者更高严格程度下与本发明所述的序列杂交杂交的序列的方法是本工艺的熟练认识所公知的,而且也在本发明中进行了描述。
不管使用的是哪种方法,所用的活性成分的使用数量是杀虫有效数量,这根据一些因子的情况而存在差异,这些因子包括,例如所要控制的特定的鞘翅类昆虫、所要治疗的特定的植物或作物、环境条件、以及所用的方法、比率、以及所施用的具有杀虫活性的组合物的数量。
本发明中所述的杀虫组合物可以通过把细菌细胞、晶体以及/或者孢子悬浮液、或者分离的蛋白成分与所要的农业上可接受的载体配制在一起来制造。组合物可以在施用以前被以合适的方式,例如冻干、冷冻干燥、干燥等,进行配制,也可以被配制在水性载体、介质或者合适的稀释液,如盐水或其它的缓冲液中。组合物可以被配制成粉尘或者微粒材料、或者一种油(植物或矿物油)的悬浮液、或者油/水乳剂,或者可湿性粉末、或者与任何适合农业应用的任何其它的载体材料相结合。合适的农业载体可以是固体或者液体,它们都是本工艺中公知的。术语“农业上可接受的载体”涵盖了所有的佐剂,例如惰性成分、分散剂、表面活性剂、增粘剂、粘合剂等等,它们都是在杀虫剂配制技术中通常使用的,是精通杀虫剂配制的人士所公知的。这些配方可以和一种或多种固体或液体佐剂混合在一起并用各种不同的方法,如用常规的配制技术把杀虫剂组合物与合适的佐剂进行匀浆混合、混合以及/或者研磨来制备。
用常规的方法,优选地用喷雾的方法把本发明的杀虫剂组合物使用到目标鞘翅类昆虫的环境中,典型的是喷雾在所要保护的植物或作物的叶片上。可以根据所要治疗的特定的昆虫和作物的特定的情况以及特定的环境条件来设置杀虫剂施用的强度和持续时间。活性成分与载体的百分比率将依赖于杀虫剂组合物的化学性质、溶解性、以及稳定性,也依赖于所使用的特定的配方。
同时也可以使用其它的施用技术,例如涂粉、撒水、浸泡、土壤注射、土壤耕种、种子涂覆、喷雾、爆气、撒雾、喷成雾状、等等,这些技术可能是在特定的状况下所需要的,例如当有昆虫对根或茎进行侵袭时,同时它们也可以被应用于精致的植物或观赏性植物。这些施用步骤也是本工艺的熟练人士所公知的。
本发明的杀虫剂组合物可以被单独应用于本发明的方法中,或者它们也可以与其它的化合物,包括但不局限于其它的杀虫剂,结合使用。同时本发明的方法也可以被用于与其它的处理方式,例如表面活性剂、去污剂、聚合体或者缓释制剂结合使用。本发明的杀虫剂组合物可以被配制用于系统性或局部性的用途。
用于环境的、系统性的、或者叶面施用的杀虫剂组合物的浓度将根据特定配方的本质、施用的方法、环境条件、以及生物杀虫活性的程度而大有差异。典型地,生物杀虫剂组合物在所使用的配方中的浓度至少为大约1%(重量比),而且可以达到并包括重量比的99%。组合物的干配方中组合物的组成可以达到大约1%至大约99%(重量比),而液体配方中的活性成分则通常占重量比的大约1%至大约99%或者更大的比重。含有完整的细菌细胞的配方通常含有大约104至1012个细胞/毫克。
可以根据需要给特定的植物或目标地区一次或多次施用杀虫剂配方,典型的田间施用率的范围为每公顷施用大约1克至大约1千克、2千克、5千克,或者甚至更多的活性成分。4.8 作为杂交探针和引物的核酸片段
此处所设想的核酸序列除了被用于指导本发明的晶体蛋白或肽的表达以外还具有许多其它的用途。例如,它们在核酸杂交的实施例中被用为探针或引物。因此,具有以下特征的核酸片段被设想具有特别的用途,即它们含有一个长度为至少14个核苷的连续序列,这些序列与以下的长度为14个核苷的连续的DNA序列相同,或者互补:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。在一些特定的实施例中也可以使用更长的、连续的相同的或互补的序列,如那些长度为大约20,30,40,50,100,200,500,1000,2000,5000,10000等(包括所有的中间长度直至包括全长)的序列。
这类核酸探针特定地与编码晶体蛋白的序列进行杂交的能力将使它们能够被用于检测在一个给定的样品中是否存在互补序列。然而,它们也被设想具有其它的用途,包括使用其序列信息来制备突变种类的引物,或者制备用于制备其它遗传构建物的引物。
特别地设想具有以下特征的核酸分子可以被用作在例如Southern和Northern印迹中使用的杂交探针,即它们含有一个序列区域,该序列区域含有长度为10-14,15-20,30,50,或者甚至100-200左右个核酸的连续的核酸序列,其中这些序列与以下的DNA序列相同或者互补:序列编号:1,序列编号:3,序列编号:5,序列编号:7,序列编号:9,序列编号:11,序列编号:13,序列编号:15,序列编号:17,序列编号:19,序列编号:21,序列编号:23,序列编号:25,序列编号:27,序列编号:29,序列编号:31,序列编号:33,序列编号:35,序列编号:37,序列编号:39,序列编号:41,序列编号:43,序列编号:45,序列编号:47,序列编号:49,序列编号:51,序列编号:53,序列编号:55,序列编号:57,序列编号:59,序列编号:61,序列编号:63,序列编号:65,序列编号:67,序列编号:69,序列编号:99,序列编号:101,或序列编号:107。更小的片段通常可被应用于杂交实施例中,其中连续互补区域的长度可以有所差异,例如介于大约10-14以及大约100或200个核苷之间,但是也可以使用更长的连续互补片段,这可以根据所要检测的互补序列的长度来定。
使用一个长度为14个核苷的探针可以形成一个既稳定又具有选择性的双链分子。但是,含有长度大于14个核苷的连续互补序列的分子通常是优选的,以便增加杂合体的稳定性和选择性并从而改善所获得的特定的杂合体分子的质量和程度。通常优选的是设计含有其长度为15-20个连续核苷,甚至更长的基因互补片段的核酸分子。
当然,可以用其它的技术,例如使用机械剪切或者限制性酶解,来获得这些片段。更短的核酸片段可以通过,例如用化学方法直接合成该片段来容易地制备,这通常都是用自动化的低聚核苷合成仪来实现的。另外,也可以使用核酸复制技术,例如使用美国专利4,683,195和4,683,202(两个申请的全部内容作为参照结合于本发明中)的PCRTM技术,通过在重组载体中导入选定的序列用于重组生产来获得这些片段,也可以用通常为分子生物学工艺的熟练人士所公知的重组DNA技术来获得。
相应地,本发明的核酸序列可以被用于选择性地与DNA片段的互补片段形成双链分子。根据所设想的应用,可能会想要使用各种不同的杂交条件来获得探针对目标序列的不同程度的选择性。当在应用中需要高度的选择性时,典型地需要使用相对严格的条件来形成杂合体,例如,需要选择相对低盐和/或高温条件,例如在大约50℃至大约70℃之间的温度提供大约0.02M至0.15M的NaCl。此类选择性条件仅容忍在探针和模板或目标链之间发生少量的(如果有的话)错配,特别适用于分离编码晶体蛋白的DNA片段。通过杂交来检测DNA片段是业内人士所公知的,杂交分析的的方法的例子见于美国专利4,965,188和5,176,995(作为参照结合于本发明中)。具体相关的教导见于Maloy等,1994;Segal,1976;Prokop,1991;以及Kuby,1994的文献。
当然,对于一些应用,例如,当需要用一个杂交到编码模板上的突变引物来制备突变体,或者探索从相关的种类、功能性等同体等等分离编码晶体蛋白的序列时,通常需要严格程度较低的杂交条件,以便形成杂交双链。在这些情形中,可能需要使用如大约0.15M至大约0.9M的盐以及介于大约20℃至大约55℃的温度。这样,就可以把交叉杂交的种类鉴定为阳性杂交信号(相对于对照杂交而言)。在任何情形中,通常应该理解的是通过增加甲酰胺的数量可以使条件变得更为严格,其中甲酰胺是用于稳定异型双链,其作用方式与提高温度相同。这样,可以对杂交的条件随意进行操作,因此通常是首选的方法,这取决于所希望得到的结果。
在特定的实施例中,有利的是把本发明的核酸序列与合适的方法,例如标记物,结合使用,用于确定杂交。有范围广泛的合适的指示物在本工艺中是已知的,包括荧光剂、放射性物质、酶配体或其它的配体,例如抗生物素蛋白/生物素,它们都可以提供一个可被检测的信号。在优选实施例中,可能希望使用一种荧光标记物或者一个酶标记物,如脲酶、碱性磷酸酶或者过氧化物酶,而不是使用放射性物质或其它对环境不利的试剂。在酶标记物的情形中,已知可以用比色指示底物来提供一种人眼或分光光度计可以检测到的方法,用于鉴定与含有互补核酸的样品的杂交。
总体上,本发明中所述的杂交探针被设想可以被用作溶液杂交试剂,同时也可以被用于使用固相的实施例中。在设计固相的实施例中,试验的DNA(或RNA)被吸收或者以其它的方式粘附到选定的基质或表面上。然后让这一经过固定的单链核酸与选定的探针在所要的条件下特定地进行杂交。所选定的条件将依赖于特定的环境,上述的环境是基于所需的特定的标准的,例如依赖于G+C的含量、目标核酸的类型、核酸的来源、杂交探针的尺寸等等。在清洗杂交表面以便除去非特异性结合的探针分子之后,通过标记物对特定的杂交进行检测,或者甚至进行定量。4.9 经过修饰的Cry3δ-内毒素的特征
本发明提供了新颖的多肽,这些多肽定义了由以下苏云金芽胞杆菌核酸序列编码的晶体蛋白的全部或者一部分:cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cry3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11032,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095以及cry3Bb.11098。4.10晶体蛋白命名法
本发明已经任意地给本发明的新颖的蛋白指定了以下的名称:Cry3Bb.60,Cry3Bb.11221,Cry3Bb.11222,Cry3Bb.11223,Cry3Bb.11224,Cry3Bb.11225,Cry3Bb.11226,Cry3Bb.11227,Cry3Bb.11228,Cry3Bb.11229,Cry3Bb.11230,Cry3Bb.11231,Cry3Bb.11232,Cry3Bb.11233,Cry3Bb.11234,Cry3Bb.11235,Cry3Bb.11236,Cry3Bb.11237,Cry3Bb.11238,Cry3Bb.11239,Cry3Bb.11241,Cry3Bb.11242,Cry3Bb.11032,Cry3Bb.11035,Cry3Bb.11036,Cry3Bb.11046,Cry3Bb.11048,Cry3Bb.11051,Cry3Bb.11057,Cry3Bb.11058,Cry3Bb.11081,Cry3Bb.11082,Cry3Bb.11083,Cry3Bb.11084,Cry3Bb.11095以及Cry3Bb.11098。
类似地,本发明也给编码上述多肽的新颖的核酸序列分别随意地指定了以下的名称:cry3Bb.60,cry3Bb.11221,cry3Bb.11222,cry3Bb.11223,cry3Bb.11224,cry3Bb.11225,cry3Bb.11226,cry3Bb.11227,cry3Bb.11228,cry3Bb.11229,cry3Bb.11230,cry3Bb.11231,cry3Bb.11232,cry3Bb.11233,cry3Bb.11234,cry3Bb.11235,cry3Bb.11236,cry3Bb.11237,cry3Bb.11238,cry3Bb.11239,cry3Bb.11241,cry3Bb.11242,cry3Bb.11043,cry3Bb.11035,cry3Bb.11036,cry3Bb.11046,cry3Bb.11048,cry3Bb.11051,cry3Bb.11057,cry3Bb.11058,cry3Bb.11081,cry3Bb.11082,cry3Bb.11083,cry3Bb.11084,cry3Bb.11095以及cry3Bb.11098。虽然苏云金芽胞杆菌命名法委员会可以根据经过修订的晶体蛋白内毒素命名法(表1)对这些基因和蛋白进行正式的命名,但是对本发明的组合物进行的任何重新命名同时也被设想是完全属于本发明的范围之内的。4.11转基因宿主细胞和转基因植物
本发明也设想了用本发明的表达载体进行转化的一种细菌、酵母细胞、或者一种植物细胞或者植物。一种转基因细菌、酵母细胞、植物细胞或者来源于此类经过转化或转基因的细胞的植物也构成了本发明的一个方面。
经常需要把这类经过转化的宿主细胞用于内毒素的生产以及本发明中所述的各种不同的DNA基因构建物的表达中。在本发明的一些方面,经常需要对本发明中所述的基因片段的表达进行调制、调节或者其它方式的控制。这类方法对于分子遗传学工艺的熟练人士是常规的。典型地,当需要增加或者过量表达一种特定的基因时,可以进行各种不同的操作以便增加信使RNA的表达,特别是通过在使用序列的同时使用一种活性启动子,这种启动子增强了信使RNA在特定的经过转化的宿主细胞中的稳定性。
典型地,起始和转录终止区域将含有终止密码子、一个终止区域、以及可选地一个多聚腺苷酰化作用信号。沿着转录的方向,即从编码或阅读序列的5’端到3’端的方向,构建物将包括转录调控区域(如果有的话)、以及启动子,其中调控区域可以在启动子的5’端或3’端、核糖体结合位点、起始密码子、含有与起始密码子相连的开读框的结构基因、终止密码子、多聚腺苷酰化作用信号序列(如果有的话)、以及终止子区域。这一双链形式的序列可以被自身用于转化微生物宿主,但通常被与一个含有标记物的DNA序列包括在一起,其中第二个DNA序列可以在DNA被导入宿主中时被接合到表达δ-内毒素的构建物上。
为结构基因设置一个标记物是为了给这些已经被修饰或转化的宿主提供选择。标记物通常将提供选择性的优点,例如提供生物杀伤剂抗性,例如对抗生素或重金属的抗性;互补作用,以便给营养缺陷型的宿主提供原养,等等。优选地使用互补作用,这样经过修饰地宿主不仅得到了选择,而且在田间还具有竞争力。在发展构建物以及对宿主进行修饰时可以使用一个或多个标记物。可以通过提供一种相对田间其它野生型微生物的竞争性优点来对生物体进行进一步的修饰。例如,可以在把表达金属螯合剂(如含铁细胞(siderophore))的基因和表达δ-内毒素的结构基因同时导入宿主中。这样,含铁细胞表达的增强可以为生产δ-内毒素的宿主提供一个竞争性的优点以便使它可以有效地与野生型的微生物竞争并在环境中稳定地占领一个活动的范围。
当不存在功能性复制系统时,构建物的序列中还将包括一个至少为50碱基对(bp),优选地为100bp,通常不超过大约1000bp的序列,该序列与宿主中的序列是同源的。这样,正当重组的可能性就得以增强,使得基因可以被整合到宿主中并被宿主稳定地保持。优选地,δ-内毒素基因应与提供互补作用的基因以及提供竞争性优点的基因非常接近。因此,当δ-内毒素基因丢失时,由此获得的生物体很可能也丢失了互补作用基因以及/或者提供竞争性优点的基因,这样该生物体就无法与那些基因还完整地保留在构建物中的生物体竞争了。
编码晶体蛋白的基因可以被插入于转录和翻译起始区域与转录和翻译终止区域之间,以便接受起始区域的调控。这一构建物可以被包括在质粒中,上述的质粒将包括至少一个复制系统,但可以包括一个以上,其中的一个复制系统被用于在质粒发展的过程中进行克隆,另一个复制系统是在最终的宿主中发挥功能所必需的。另外,可以存在一个或多个标记物,这在以前已经被描述了。当需要进行整合时,质粒包括一个与宿主基因组同源的序列是合乎需求的。
可以根据常规的方法来分离转化体,通常使用的是筛选技术,通过这一技术可以把想要的生物体与未经修饰的生物体或用于转移的生物体(如果有的话)分离筛选出来。随后可以测试转化体的杀虫活性。
合适的宿主细胞,其中含有杀虫剂的细胞将被处理以便延长细胞中的δ-内毒素在经过如此处理的细胞被施用于目标害虫的环境中时的活性,可以包括原核或真核细胞,通常局限于那些不产生对高等生物体(如哺乳动物)具有毒性的物质的细胞。然而,也可以使用那些可以产生对高等生物体具有毒性的物质的生物体,其中在上述生物体中的δ-内毒素是不稳定的,或者其施用的水平足够的低,不足以对哺乳动物宿主产生任何毒性。对于宿主而言,特别感兴趣的是原核生物和较低等的真核生物,例如真菌。示例性的原核生物(包括格兰氏阴性和格兰氏阳性)包括肠杆菌科,例如埃希氏菌属、欧文菌属、志贺菌属、沙门菌属、以及变性菌属;芽孢杆菌科;根瘤菌科,如根瘤菌;螺菌科,如发光菌、Zymomonas、沙雷菌属、气单胞菌属、弧菌属、去磺弧菌属、螺菌属;乳酸菌;植形(phylloplane)生物体,例如极毛杆菌科的成员(包括假单胞菌属和醋酸杆菌属);固氮菌属和硝化菌属;产黄菌属;芽孢杆菌属的一些成员,如乳杆菌种类、双歧杆菌属以及杆菌种类等等。特别优选的宿主细胞包括Pseudomonasacruginosa、Pseudomonas fluorescens、Bacillus thuringiensis、Escherichia coli、Bacillus subtilis等等。
真核细胞中优选的是真菌,例如藻菌类植物以及子囊菌类,这包括酵母,例如人体酵母菌以及担子菌类、圆酵母、短梗霉属、掷孢酵母属、酵母属、以及掷孢酵母属种类。
在筛选一个用于生产目的的宿主细胞时特别感兴趣的特征包括:易于把δ-内毒素的基因导入到宿主中;有可用的表达系统;表达的效率;杀虫剂在宿主中的稳定性;以及存在辅助的遗传能力。用作杀虫剂微胶囊的感兴趣的特征包括杀虫剂的保护性特质,例如具有厚的细胞壁、色素形成、以及在细胞内包装或形成包含体;叶子亲和性;对哺乳动物不具有毒性;能够诱惑害虫撮食;容易杀灭和固定同时又不损害δ-内毒素的毒性,等等。其它的考虑包括易于配制和处理、经济效益、保藏的稳定性,等等。
在处理时,细胞通常是完整的或者处于增殖的形式,而不是处于孢子的形式,虽然在某些情形中可以使用孢子。可以用以下所述的方法对重组的微生物细胞进行处理。经过处理的细胞通常结构稳定性增强,这将增强其对环境条件的抵抗力。
可以使用各种不同的技术把本发明中所述的基因或其它的核酸片段插入到宿主细胞中,这些技术在本工艺中都是公知的。例如,有大量的含有在大肠杆菌中复制的系统以及一个允许对转化细胞进行筛选的标记物的克隆载体可以被用于把外源基因插入到高等生物体(包括植物)中。这些载体包括例如,pBR322、pUC系列、M13mp系列、PACYC184等。相应地,编码δ-内毒素的序列可以被插入到载体中合适的限制性位点上。由此获得的质粒被用于转化到大肠杆菌中。在合适的营养介质中培养大肠杆菌,然后收获并裂解。回收质粒并进行序列分析、限制性分析、电泳以及其它的生物化学、分子生物学方法分析,这些都是通常所进行的分析步骤。在每个操作之后,可以把所使用的DNA序列剪切下来并连接到下一个DNA序列上。可以把每一个质粒序列克隆到同一个或者不同的质粒中。根据把所要的基因插入到植物中时所用的方法,可能需要其它的DNA序列。
用于植物细胞DNA转化的方法包括农杆菌介导的植物转化、原生质体转化、基因转移进入花粉、注射进入生殖器官、注射进入未成熟的胚胎、以及粒子轰击法。上述的每一种方法都有其显著的优点和缺点。因此,把基因导入一个特定的植物植株中的特定的方法并不一定是对另一个植物植株最有效的方法,但是已经清楚地知道对于一种特定的植物植株哪一种方法是有用的。
合适的方法被认为包括能够把DNA导入细胞中的任何方法,如农杆菌感染;DNA的直接输送,例如pEG介导的原生质体转化(Omirulleh等,1993)、干燥/抑制介导的DNA摄取、电击穿、金刚砂激动作用、涂覆有DNA的粒子的加速;等等。在特定的实施例中,加速方法是优选的,包括,例如微粒轰击等等。
用于把DNA导入细胞中的技术是业内人士所公知的。已经有人描述了四种用于把基因素输送到细胞中的一般的方法:(1)化学方法(Graham和van der Eb,1973,Zatloukal等,science 1992);(2)物理学方法,如微粒轰击(Capecchi,1980)、电穿孔(Wong和Neumann,1982;Fromm等,1985)以及基因枪(Johnston和Tang,1994;Fynan等。1993);(3)病毒载体(Clapp,1993;Lu等,1993;Eglitis和Anderson,1988;Eglitis等,1988);以及(4)受体介导的机制(Curiel等,1991;1992;Wagner等1992)。
有大量的技术可以被用于把DNA插入到植物宿主细胞中。这些技术包括使用根癌土壤杆菌或者Agrobacterium rhizogenes作为转化剂用T-DNA进行转化、融合、注射、或者电击穿、以及其它的可能的方法。当把农杆菌用于转化时,所要插入的DNA必须被克隆到特定的载体中,即克隆到一个中间载体或者二元载体中。中间载体可以用同源重组整合到Ti或Ri质粒中,因为它们含有与T-DNA序列同源的序列。Ti或Ri质粒同时还包含有T-DNA转移所需的vir区域。
中间载体在农杆菌中无法进行自身复制。可以通过一种帮助质粒(结合)把中间载体转移到根癌农杆菌中。二元载体可以在大肠杆菌和农杆菌中进行自身复制。它们含有一个筛选标记基因以及一个连接物或者低聚连接物,这些连接物的左右两侧连接着T-DNA的边界区域。它们可以被直接转化到农杆菌中(Holsters等,1978)。被用作宿主细胞的农杆菌将含有一个含有一个vir区域的质粒。vir区域是把T-DNA转移到植物细胞中所必需的。可以含有另加的t-DNA。经过如此转化的细菌被用于植物细胞的转化。植物外植体可以被有利地与根癌农杆菌和Agrobacterium rhizogenes一起培养,以便把DNA转移到植物细胞中。然后可以在合适的介质,该介质可能含有用于筛选的抗生素或者生物杀伤剂,中从受感染的植物材料(如叶片、茎的段、根、但也包括原生质体或者悬浮培养的细胞)再生出完整的植物。然后可以检测如此获得的植物是否存在插入的基因。当进行注射和电击穿时,对质粒没有特殊的要求。可以使用通常的质粒,例如使用pUC衍生物。如果,例如,用Ti或Ri质粒来转化植物细胞,那么Ti或Ri质粒T-DNA的至少右边界,但通常是左右两个边界必须被连接成所要插入的基因的边界区域。用T-DNA来转化植物细胞已经被详细地研究并充分地描述于欧洲专利申请No.EP 120 516;Hockema(1985);An等,1985;Herrera-Estrella等,(1983);Bevan等,(1983);以及Klee等,(1985)中。
用于双子叶植物转化的一个特别有用的含有增强的Ti质粒盒式载体CaMV35S启动子(EN35S)以及含有多聚腺苷酰化作用信号的末端,上述的多聚腺苷酰化作用信号来源于一个编码β-conglycinin的α亚基的大豆基因。在上述的两个元件之间是一个多元连接物,它含有多个可以供目标基因插入的限制性位点。
载体优选地含有一个pBR322的片段,它提供了在大肠杆菌中表达的复制起点以及一个用于与所要的农杆菌菌株ACO的T-DNA进行同源重组的区域;来源于具有广泛的宿主范围的质粒PKI的oriV区域;来源于Tn7的链霉素/放线菌素抗性基因;以及一个嵌合的NPTII基因,该基因含有CaMV35S启动子以及胭脂碱合成酶(NOS)的3’端,它为经过转化的植物细胞提供了卡那霉素抗性。
可选地,可以用15kb的mannopine合成酶(MAS)启动子(Velten等,1984)来替代经过增强的CaMV35S启动子。在把一个DNA构建物结合到载体中之后,把它导入一个含有解毒的(disarmed)Ti质粒的根癌农杆菌菌株ACO中。对共整合的Ti质粒载体进行筛选,随后可以把它用于转化双子叶植物。
根癌农杆菌ACO是一种解毒的菌株,它与Fraley等(1985)所描述的pTiB6SE类似。在构建ACO时,起始的农杆菌菌株是菌株A208,它含有一个胭脂碱类型的Ti质粒。上述的Ti质粒被以与Fraley等(1985)所述的类似的方法解了毒,使得几乎所有的天然的T-DNA都被除去,除了左边界以及在左边界内的几百个碱基对T-DNA以外。延伸到右边界后的一个点的剩余的T-DNA被替换为一个新颖的DNA片段,该片段从左到右包括一个pBR322的片段、来源于质粒RK2的oriV区域、以及来源于Tn601的卡那霉素抗性基因。pBR322和oriV片段与这些片段是类似的,提供了一个用于共整合的同源区域。
一旦被插入的DNA已经被整合到基因组中,它在那里将会相对稳定,而且根据经验,不会再出来了。它通常含有一个筛选标记物,这个标记物存在于经过转化的对生物杀伤剂或抗生素,如卡那霉素、G418、博来霉素、潮霉素、或者氯霉素等等具有抗性的植物细胞中。个别使用的标记物应该相应地允许对经过转化的细胞,而不是那些不含有插入的DNA的细胞进行筛选。4.11.1电穿孔
把短暂的高电压电脉冲作用于各种不同的动物和植物细胞导致在质膜中形成纳米大小的孔。DNA被从这些孔直接撮入细胞质中,或者作为膜成分重新分配的结果伴随着孔的关闭被摄入细胞。电穿孔可以具有极高的效率,它可以被用于克隆基因的瞬时表达以及整合有感兴趣的基因拷贝的细胞株的确立。电穿孔不同于磷酸钙介导的转染和原生质体融合的是,它经常产生整合有一个,或者最多少数几个,外源DNA拷贝的细胞株。
通过电穿孔导入DNA的方法是本工艺的熟练人士所公知的。在这种方法中,使用特定的细胞壁降解酶,如胶质降解酶来使目标受体细胞变得比未经处理的细胞更容易受电击穿转化的影响。可选地,也可以通过机械创伤来使受体细胞更容易受转化的影响。为了实现电击穿转化,可以使用脆弱的组织,如细胞的悬浮培养物或者胚胎发生愈伤组织,或者可选地,可以对未成熟的胚胎或者其它的组织直接进行转化。可以通过把细胞壁暴露于胶质降解酶(pectolyases)或者通过以受控的方式进行机械创伤来部分降解细胞壁。这时可以进行电击穿DNA转移并把这些细胞当作电击穿DNA转移的受体,然后根据新整合进来的DNA的性质用合适的筛选协议鉴定被转化的细胞。4.11.2微粒轰击
用于把转化用的DNA片段输送到植物细胞中的另外一个有利的方法是微弹轰击法。在这一方法中,可以在微粒上涂覆核酸并用一个推进力把微粒输送到细胞中。示例性的微粒包括那些包含钨、金、铂等的微粒。
微弹轰击法作为一种能够可繁殖地、稳定地转化单子叶植物的有效的方法,它的一个优点是既不需要分离原生质体(Cristou等,1988),又不需要对农杆菌感染具有感受性。通过加速度把DNA输送到玉米细胞中的方法的一个示例性的实施例是Biolistics ParticleDelivery System,它可以被用于把涂覆有DNA或细胞的微粒推进通过一个屏幕,如一个不锈钢或Nytex屏幕,到达一个涂覆有培养在悬浮液中的玉米细胞的滤器表面上。屏幕分散了微粒,使它们不被以大的聚集物的形式输送给受体细胞。在微粒装置和所要轰击的细胞之间设置一个屏幕被认为可以减小微粒聚集物的尺寸并且可以通过减少太大的微粒对受体细胞的损伤来提高转化的频率。
在进行轰击时,悬浮液中的细胞优选地被浓缩在滤器或者固体培养介质上。可选地,也可以把未成熟的胚胎或者其它的目标细胞准备在固体培养介质上。把所要轰击的细胞定位在微粒挡板下一个合适距离的位置。如果需要,也可以在加速装置和所要轰击的细胞之间设置一个或多个屏幕。通过使用本发明中所描述的技术可以获得1000个或更多的短暂地表达标记基因的细胞焦点(foci)。每一个在轰击后48小时表达外源基因产物的焦点的细胞数目通常介于1至10个之间,平均为1至3个。
在微粒轰击转化中,可以通过优化轰击前的培养条件以及轰击参数来获得最多数目的稳定转化体。在这一技术中,轰击的物理学和生物学参数都很重要。物理学因素是那些涉及DNA/微粒沉淀物或者影响大的颗粒或微粒的飞行和速度的因素。生物学因素包括在轰击前以及紧跟其后对细胞进行操纵的所有步骤、为了帮助减轻轰击所伴随的外伤而对目标细胞进行的渗透性调节、以及转化用的DNA(如线性化的DNA或完整的超螺旋质粒)的性质。轰击前的操纵被认为对未成熟胚胎的成功转化是特别重要的。
相应地,本发明者设想有人会希望在小规模的研究中调整各种不同的轰击参数以便对条件进行充分的优化。有人可能会特别希望对一些物理学参数,如间隙的距离、飞行的距离、组织的距离以及氦气的压力,进行调整。也可以通过对影响受体细胞生理学状态并可能从而影响转化和整合效率的条件进行修饰来优化外伤减少因子(traumareduction factors,TRFS)。例如,可以对受体细胞的渗透状态、组织的水合作用以及所代培养物状态或细胞周期进行调整以实现最优转化。在本发明所公开的内容的指导下,其它的常规性调整对于本工艺的熟练人士将是以知的。4.11.3农杆菌介导的转移
农杆菌介导的转化是一个可以被广泛应用的用于把基因导入到植物细胞中的系统,因为DNA可以被导入到整个植物组织中,从而无须从一个原生质体再生出完整的植株。用农杆菌介导的植物整合载体把DNA导入到植物细胞中的方法在本工艺中是公知的。参照,例如,已经被描述的方法(Fraley等,1985;Rogers等,1987)。另外,Ti-DNA的整合是一个相对精确的过程,它所产生的重排很少。所要转移的DNA区域是由边界序列来定义的,所要插入的DNA通常如前述的方法(Spielmann等,1986;Jorgensen等,1987)被插入于植物基因组中。
现代的农杆菌转化载体能够在大肠杆菌和农杆菌中复制,从而便利了操纵,如前述(Klee等,1985)。另外,最近在用于农杆菌介导的基因转移的载体上的技术进步已经改善了载体中基因和限制性位点的安排以便利构建能够表达各种不同多肽编码基因的载体。前述的载体(Rogers等,1987)含有便利的多连接序列区域,这些区域两端分别连接着一个启动子和一个多聚腺苷酰化作用位点,用于直接表达插入的多肽编码基因。这些载体适合于本发明的目的。另外,可以用同时含有毒性和非毒性Ti基因的农杆菌进行转化。在农杆菌介导的转化能够发挥效率的植物植株中,因为基因转移所具有的容易的、规定的性质,这是首选的方法。
农杆菌介导的叶片以及其它组织,例如子叶和下胚轴,的转化仅局限于农杆菌天然感染的那些植物。农杆菌介导的转化在双子叶植物中是最有效率的。极少数的单子叶植物是农杆菌的天然宿主。虽然已经用农杆菌载体在芦笋中制造了转基因植物,如前述(Bytebler等,1987)。因此,具有商业重要性的谷类,如大米、玉米和小麦通常必须用替代的方法进行转化。然而,如上所述,芦笋仍然可以用农杆菌进行转化(见,例如,Bytebier等,1987)。
用农杆菌转化方法形成的转基因植物典型地在一个染色体上含有一个单一的基因。此类转基因植物可以被称为所添加的基因的杂合体。然而,因为词语“杂合体”通常意味着在一对染色体的另一条染色体的同一位点上含有一个互补的基因,但是在如此处所述的含有一个添加的基因的植物中并不存在这样一个基因,所以认为此类植物的更为准确的名称应该是“一种独立的分离系”,因为所添加的外源性的基因在有丝分裂和减数分裂期间独立地分离。
更为优选的是一种所添加的结构基因的纯合的转基因植物,即该转基因植物含有两个添加的基因,在一对染色体的两条染色体上的同一位点上分别含有一个基因。纯合的转基因植物可以通过以下步骤来获得:交配一个含有一个单一的添加基因的独立的分离系转基因植物(自体受精);让由此获得的种子萌芽并分析如此获得的植物,该植物被生产用以增强羧肽酶活性(相对于对照(天然的、未经转基因的)或者一个独立的分离系转基因植物)。
应该理解的是,也可以让两种不同的转基因植物交配以产生含有两个独立分离的添加的外源基因的子代。合适子代的自体受精可以产生两个添加的编码感兴趣的肽的外源基因的纯合的植物。同时本发明还设想了与父代植物的回交以及与非转基因植物的异型杂交。
植物原生质体的转化也可以通过使用基于磷酸钙沉淀、聚乙二醇处理、电穿孔、以及这些处理的结合的方法来实现(见,例如,Potrykus等,1985;Lorz等,1985;Fromm等,1985;Uchimiya等,1986;Callis等,1987;Marcotte等,1988)。
这些系统在不同植物株系的应用取决于从原生质体再生具有特定功能的植物株系的能力。用于从原生质体再生谷类作物的示范性的方法已有描述(Fujimura等,1985;Toriyama等,1986;Yamada等,1986;Abdullah等,1986)
为了对不能成功地从原生质体再生的植物株系进行转化,可以使用其它的把DNA导入到完整的细胞或组织中的方法。
例如,可以根据前述的方法(Vasil,1988)从未成熟的胚胎或者外植体再生谷类植株。另外,也可以使用“基因枪”或者高速微粒轰击技术(Vasil,1992)。
当使用后一种技术时,存在于细小金属颗粒上的DNA被携带通过细胞壁进入细胞质中,如前述(Klein等,1987;Klein等,1988;McCabe等,1988)。金属颗粒穿透好几层细胞,因而使得可以在组织外植体中的转化细胞。4.11.4植物中基因的表达
虽然最近几年在表达细菌蛋白,如苏云金芽胞杆菌晶体蛋白,的转基因植物的制备上已经取得了很大的进步,但是在植物中表达天然的细菌基因通常却是令人失望的。不同于微生物遗传学的是,早期的植物遗传学家对影响外来基因在植物中异源表达的因素的了解很少。然而,在最近几年,有好几种潜在的因素已经被示明在不同的程度上负责特定编码序列的蛋白表达水平。例如,现在科学家们知道在细胞中维持一种特定的mRNA的显著水平是一个关键的因素。不幸的是,造成编码外来蛋白的mRNA的低稳定性的原因却有好多。首先,全长RNA合成发生的频率不高。这可能是因为在转录时RNA过早地终止了,或者是因为在转录时发生意料之外的mRNA加工。第二,全长RNA可能是在植物细胞中产生的,但是随后却在核中被以某种形式加工(剪切、添加多聚A),使得所产生的mRNA不具有功能。如果RNA没有被适当地合成、终止和多聚腺苷酰化,它就无法转移到细胞质中进行翻译。类似地,在细胞质中,如果mRNA的半寿期(这是由它们的初级和二级序列所决定的)截短了,那么就无法生产足量的蛋白。另外,翻译效率对mRNA的半寿期有影响,程度未确。另外,每一个RNA分子折叠成特定的结构,或者可能会折叠成一族结构,这是由它的序列所确定的。任何RNA的特定的结构导致其在细胞质中的稳定性更强或更弱。结构本身也可能是mRNA在核中加工的一个决定因素。不幸的是,不可能预测,几乎也不可能在体外和体内确定任何RNA(tRNA除外)的结构。然而,戏剧性地改变一个RNA的序列有可能能够对它的折叠结构产生很大的影响。结构本身或者一些特定的结构特征也可能在RNA稳定性的确定中发挥作用。
为了克服这些在外来基因表达上的局限性,研究者们已经鉴定出RNA中特定的序列和信号,它们具有对RNA稳定性产生特定影响的潜力。因此,在本发明的特定实施例中,需要优化植物中已打开的核酸片段的表达。这样做的一种特定方法,是通过改变细菌的基因,以除去降低在某一已转化的植物细胞中表达的序列或基序。为在植物中最优表达的编码序列,其操纵过程优选的常常是对一段DNA序列进行“植物化”。
尤其有疑问的是富含A+T的序列。不幸的是,由于苏云金芽胞杆菌具有富含A+T的基因组,因此为了使其在植物中达到最优表达,常常必须修饰天然晶体蛋白的基因序列。序列基序ATTTA(或者当其出现在RNA中为AUUUA)已经作为一种破坏稳定性的序列牵涉到哺乳动物细胞的mRNA中(Shaw和Kamen,1986)。许多短期存在的mRNA具有富含A+T的3’端非翻译区,这些区域常常含有ATTTA序列,有时是以多拷贝或多聚体(如ATTTATTTA…)的形式存在。Shaw和Kamen指出不稳定的mRNA 3’末端向稳定的RNA(球蛋白或VA1)的转移显著地降低了稳定的RNA的半衰期。他们进一步指出ATTTA的五聚体对一段稳定的信息具有深刻的破坏稳定性的作用,而且这种信号在位于3’末端或编码区内时均可发挥作用。然而,ATTTA序列的数目和/或它们所存在的序列背景在确定它们是否作为破坏稳定性的序列发挥作用时也显示出重要性。Shaw和Kamen指出ATTTA的三聚体对mRNA稳定性的影响大大低于五聚体,二聚体或单体对稳定性没有影响(Shaw和Kamen,1987)。注意到ATTTA的多聚体(如五聚体)自动产生富含A+T的区域。这显示为细胞质的影响,而不是核。在其它一些不稳定的mRNA中,ATTTA序列可能以仅单拷贝的形式存在,但它经常包含在富含A+T的区域中。从迄今为止所收集的动物细胞数据中显示,ATTTA至少在一些背景下对于稳定性是重要的,但是也不可能预测ATTTA的哪些出现是破坏稳定的因素,或者任何这些影响是否可能在植物中见到。
一些关于mRNA在动物细胞中的降解的研究也显示,在某些情况下RNA的降解开始于核酸酵素对富含A+T区域的攻击。这些裂解是否发生在ATTTA序列尚不清楚。也有一些mRNA的例子,它们依赖于其所表达的细胞类型或其所表达的细胞周期的阶段而具有不同的稳定性。例如,组蛋白mRNA在DNA合成阶段稳定,但当DNA合成被打断时即不稳定。一些组蛋白的mRNA的3’末端似乎是形成这一结果的原因(Pandey和Marzluff,1987)。其没有显示出受ATTTA介导,同时也不清楚是什么在控制这段mRNA的不同的稳定性。另一个例子是在B细胞成熟的过程中,IgG的mRNA在B淋巴细胞中稳定性不同(Genovese和Milcarek,1988)。最后一个例子是一种突变的β-thallesemic*球蛋白mRNA的不稳定性。在骨髓细胞中,其中这种基因正常表达,突变的mRNA不稳定,而野生型的mRNA稳定。当在体外突变基因在HeLa或L细胞中表达时,突变的mRNA不显示不稳定性(Lim等,1988)。这些例子均提供了证据,即mRNA的稳定性可以受细胞类型或细胞周期特定因素的调节。此外,这种类型的不稳定性不与特定的序列相关。假如存在这些不确定性,就不可能预测在一种特定的细胞中哪些RNA可能不稳定。另外,甚至ATTTA基序也可能依赖于RNA所表达的细胞的本性而作用不同。Shaw和Kamen(1987)已经报道蛋白激酶C的活化可以阻断由ATTTA介导的降解。
多聚腺苷酸链加入到3’末端在植物和动物的绝大多数真核mRNA中都是普遍的。目前所接受的关于多聚A加入的观点是初期转录的延伸越过了成熟的3’末端。包含在这一转录中的是关于多聚腺苷酰作用和正确的3’末端信息的信号。这种在3’末端的加工包括裂解mRNA和在成熟的3’末端加入多聚A。通过寻找植物及动物mRNA中多聚A区域附近的共有序列,已经有可能确定明显参与多聚A加入及3’末端切除的共有序列。同一种共有序列似乎对这两种过程都很重要。这些信号典型是序列AATAAA的变体。在动物细胞中,这段序列的一些变体已经被确定是有功能的;在植物细胞中,似乎存在范围扩大的功能序列(Wickens和Stephenson,1984;Dean等,1986)。由于所有这些共有序列均为AATAAA的变体,因此它们都为富含A+T的序列。在成熟的mRNA中,发现这段序列代表性地是位于多聚A区域之前的15到20个碱基。对动物细胞的研究显示这段序列参与多聚A的加入以及3’端的成熟。在这段序列中的位点定向诱变可以破坏这些功能。(Conway和Wickens,1988;Wickens等,1987)。然而,同时也观察到推定的多聚A信号的3’端上游一直到50到100个碱基的序列也是必需的;即,一个基因含有正常的AATAAA,但具有被取代或被破坏的下游序列,该基因没有得到正确的多聚腺苷酸(Gil和Proudfoot,1984;Sadofsky和Alwine,1984;McDevitt等,1984)。简而言之,多聚A信号本身对于完整和恰当的加工不是足够的。然而尚不知道除多聚A信号之外,还有什么特殊的下游序列是必需的,或者是否存在具有这种功能的特殊序列。因此,序列分析只能鉴定潜在的多聚A信号。
在正常多聚腺苷酸化的天然存在的mRNA中,已经观察到这一过程的瓦解(通过改变多聚A信号或mRNA中其它的序列)在功能mRNA水平上可以观察到深刻的影响。这一现象已经在几种天然存在的mRNA中发现,其结果到目前为止是基因特异性的。
已经显示在天然的mRNA中,正确的多聚腺苷酰作用在mRNA积聚中很重要,这一过程的瓦解可以明显影响mRNA水平。然而,对于预测正常基因改变的影响的知识存在不足。在异源基因中,预测该结果甚至更为困难。然而,可能存在所鉴定的推定位点是功能紊乱的。简而言之,这些位点可能无法作为正常多聚A位点发挥作用,但是可替代为引起不稳定的mRNA的变体位点发挥功能。
在动物细胞系统中,AATAAA是mRNA中多聚A上游所鉴定出的最为普遍的信号,但至少也已经发现了四种变体(Wickens和Stephenson,1984)。在植物中,几乎没有进行如此多的分析,但清楚的是可以使用类似于AATAAA的多聚序列。表5中所称的主要或次要的植物位点仅指Dean等(1986)的研究,其仅分析了三种类型的植物基因。指定多聚腺苷酰作用位点为主要的或次要的,仅仅是指它们在天然存在并且已经分析过的基因中作为功能位点所出现的频率。对于植物而言,这是一个十分有限的数据库。很难带有任何肯定性地预测当发现其在异源基因(如编码本发明中的晶体蛋白的基因)中时,所指定为主要或次要的位点将可能或多或少地部分或完全地发挥作用。
表5植物基因中多聚腺苷酰化作用位点
PA AATAAA 主要的共有位点
PIA AATAAT 主要的植物位点
P2A AACCAA 次要的植物位点
P3A ATATAA ‘’
P4A AATCAA ‘’
P5A ATACTA ‘’
P6A ATAAAA ‘’
P7A ATGAAA ‘’
P8A AAGCAT ‘’
P9A ATTAAT ‘’
P10A ATACAT ‘’
P11A AAAATA ‘’
P12A ATTAAA 次要的动物位点
P13A AATTAA ‘’
P14A AATACA ‘’
P15A CATAAA ‘’
本发明提供了制备人造植物基因的方法,这些基因表达其蛋白产物的水平明显高于野生型基因,迄今为止这些基因通常包括在植物转化中。在另一方面,本发明也提供了编码非植物蛋白的异常人造植物基因。
如以上所描述的,天然苏云金芽胞杆菌基因在植物中的表达是存在问题的。如同许多其它在植物中表达的异源基因一样,苏云金芽胞杆菌基因编码序列的本性将其与植物基因区别开来。特别地,苏云金芽胞杆菌基因富含很多(~62%)的腺嘌呤(A)和胸腺嘧啶(T),而植物基因和大多数已经在植物中表达的其它细菌的基因含A+T大约为45-55%。
由于遗传密码的退化和密码子对任何氨基酸选择的数目有限,在一些杆状菌种中,发现结构编码序列上大多数的“多余”A+T位于密码子的第三位上。简而言之,一些杆状菌种的基因在许多密码子上以A或T作为第三位的核苷。因此,A+T的含量可以部分决定密码子选择的偏好。另外,很明显,基因在它们所进化的有机体中向最大功能进化。这意味着从一种有机体的某一基因中所发现的独特的核苷序列(其中它们除了编码一段独特延伸的氨基酸外可能不起作用)在另一种有机体中具有被认作基因控制元件的可能性(如转录起始子或终止子、多聚A附加位点、内含子接合位点、或特异性mRNA降解信号)。可能会令人惊奇的是这种读错的信号不是异源基因表达的一个更位普遍的特征,但是它可以部分通过许多有机体中相对同源的A+T的含量(~50%)来解释。该A+T的含量以及遗传密码的本性明显限制了任何独特的低聚核苷酸序列出现的可能性。因此,来源于大肠杆菌、A+T含量为50%的基因与来源于苏云金芽胞杆菌的基因相比,其含有任何独特的富含A+T的片段的可能性更小。
典型地,为获得S-内毒素基因在植物中高水平的表达,将编码S-内毒素的现有的结构编码序列(“结构基因”)进行修饰,该修饰是通过对含有结构基因的DNA进行位点定向突变以除去ATTTA序列和推定的多腺苷酸化信号。最为优选的是实质上所有的多腺苷酸化信号和ATTTA序列均被除去,虽然仅部分除去以上所确定的序列中的一种将观察到表达水平增强。可选择地,如果是制备编码主体蛋白表达的人造基因,选择密码子要避免ATTTA序列和推定的多聚腺苷酰作用位点。对于本发明来说,推定的多腺苷酸化信号包括(但不是必需局限于):AATAAA、AATAAT、AACCAA、ATATAA、AATCAA、ATACTA、ATAAAA、ATGAAA、AAGCAT、ATTAAT、ATACAT、AAAATA、ATTAAA、AATTAA、AATACA和CATAAA。在取代ATTTA序列和多腺苷酸化信号时,优先选用的密码子须避免很少在植物基因组中发现的密码子。
筛选所选择的DNA序列以鉴定含有大于四个连续的腺嘌呤(A)或胸腺嘧啶(T)核苷的区域。筛选A+T区域以寻找潜在的植物多腺苷酸化信号。虽然缺乏五个或更多的连续的A或T核苷会排除大多数的植物多腺苷酸化信号,但是如果在彼此相距十个核苷以内含有一个以上已确定的次要的多腺苷酸化信号,则优选的是改变这段区域的核苷序列以除去这些信号,同时保持最初所编码的氨基酸序列。
第二步是考虑围绕在步骤一中已经确定的富含A+T的区域中的约15至约30左右的核苷残基。如果周围区域的A+T的含量低于80%,须在该区域检测多腺苷酸化信号的存在。基于多腺苷酸化信号,该区域的改变依赖于(1)存在的多腺苷酸化信号的数目以及(2)主要的植物多腺苷酸化信号的存在。
检测延伸区域中植物多腺苷酸化信号的存在。通过对DNA序列的位点定向突变除去多腺苷酸化信号。也检测延伸区域中多拷贝的ATTTA序列的存在,该序列也被突变除去。
同样优选的是瓦解含有许多连续的A+T碱基或G+C碱基的区域,因为预测这些区域由于自身配对而有较高的可能性形成发夹结构。因此,插入异源的碱基对将降低自身配对的二级结构形成的可能性,已知该信息在一些有机体中可以抑制转录和/或翻译。在大多数情况下,可以通过使用不含超过五个连续的A+T或G+C的序列来将不利效应降至最小。4.11.5用于突变的人造低聚核苷酸
当低聚核苷酸用于突变时,理想的是维持正确的氨基酸序列和阅读框,没有在修饰过的基因中引入通常的限制酶切位点如BglII、HindIII、SacI、KpnI、EcoRI、NcoI、PstI和SalI。这些限制酶切位点在许多克隆载体的多接头插入位点中有发现。当然,应该也要避免引入新的多腺苷酸化信号(ATTTA序列或连续的超过五个的A+T或G+C伸展片段)。低聚核苷酸优选的大小是约40到50个碱基对,但已经使用的片段变化为约18到约100个碱基。在大多数情况下,维持合成片段两端最小约5到约8个碱基对与模板DNA同源,以确保引物与模板的正确杂交。低聚核苷酸需要避免长于五个碱基对A+T或G+C的序列。用于取代野生型密码子的密码子无论在何种可能性下,优选地应该避免TA或CG偶对。从一种植物优选的密码子表格(如以下表6)中选择密码子,以避免很少在植物基因组中发现的密码子,须尽力选择密码子以优先调整其G+C含量为约50%。
表6
植物中优选的密码子的使用氨基酸 密码子 在植物中使用
的百分比ARG CGA 7
CGC 11
CGG 5
CGU 25
AGA 29
AGG 23LEU CUA 8
CUC 20
CUG 10
CUU 28
UUA 5
UUG 30SER UCA 14
UCC 26
UCG 3
UCU 21
AGC 21
AGU 15THR ACA 21
ACC 41
ACG 7
ACU 31PRO CCA 45
CCC 19
CCG 9
CCU 26ALA GCA 23
GCC 32
GCG 3
GCU 41GLY GGA 32
GGC 20
GGG 11
GGU 37ILE AUA 12
AUC 45
AUU 43VAL GUA 9
GUC 20
GUG 28
GUU 43LYS AAA 36
AAG 64ASN AAC 72
AAU 28GLN CAA 64
CAG 36HIS CAC 65
CAU 35GLU GAA 48
GAG 52ASP GAC 48
GAU 52TYR UAC 68
UAU 32CYS UGC 78
UGU 22PHE UUC 56
UUU 44MET AUG 100TRP UGG 100
含有许多连续的A+T碱基或G+C碱基的区域由于自身互补,因而预测其具有较高的可能性形成发夹结构。优选的是通过插入异源碱基对以瓦解这些区域,这些区域的瓦解将降低形成自身互补的二级结构(如发夹结构)的可能性,在一些有机体中,已知发夹结构能够阻断转录(转录终止子)和翻译(衰减子)。
可选择地,可以制备编码一段给定的氨基酸序列的完整的合成基因,同时避免五个或更多的连续的A+T或G+C核苷的区域。只要可能时,选择密码子以避免密码子中TA和CG的双联。根据植物优选的密码子使用表格(如表6)和优先调整到约50%G+C含量,可以将密码子的使用标准化。须对所得到的序列进行检查以确保推定的植物多腺苷酸化信号和ATTTA序列为最小限度。在通常使用的克隆载体中发现的限制位点也是须优选避免的。然而,在基因各处配置几个独立的限制位点对于分析基因表达或构建基因变体是有用的。4.11.6“植物化”基因的构建
存在于双链DNA形式中的植物基因的表达包括信使RNA(mRNA)从DNA的一条链中通过核糖核苷聚合酶进行转录,以及后来的在核内mRNA初步转录的加工。这种加工包括一段3’端的非翻译区将多聚腺苷酸核苷加入到RNA的3’末端。从DNA到mRNA的转录受一段通常称之为“启动子”的DNA区域调节。该启动子区域含有一段序列的碱基,该序列向核糖核酸聚合酶提供信号,使其与DNA结合及利用DNA的一条链作为模板起始mRNA的转录以得到相应的RNA链。
在文献中已经描述出许多在植物细胞中活跃的启动子。这些包括胭脂碱合酶(nopaline synthase,NOS)和章鱼碱合酶(octopinesynthase,OCS)启动子(它们由诱导肿瘤的根癌农杆菌的质粒携带)、花椰菜花叶病毒(Cauliflower Mosaic Virus,CAMV)19S和35S启动子、来源于核酮糖二磷酸盐羧基酶(ssRUBISCO,一种十分丰富的植物多肽)小亚基的启动子以及mannopine合酶(MAS)的启动子(Velten等,1984及Velten核Schell,1985)。所有这些启动子已被用于建造已经在植物中表达的不同类型的DNA构造物(见例如,国际专利申请出版编号WO84/02913)。
已知或已发现可以在植物细胞中引起RNA转录的启动子可以用于本发明中。这种启动子可以从植物或植物病毒中获取,其包括但不局限于CaMV35S启动子及独立于植物基因(如ssRUBISCO基因)的启动子。如以下所描述的,优选的是所选择的特定的启动子应该能够引起充分表达以导致产生有效数量的蛋白质。
如果需要的话,可以对用于本发明的DNA构建物(也就是嵌合植物基因)中的启动子进行修饰,以影响它们的控制特性。例如,CaMV 35S启动子可以连接到ssRUBISCO基因部分,它在缺乏光线时可抑制ssRUBISCO的表达,从而构建了一种在叶部活跃但在根部不活跃的启动子。所得到的嵌合启动子可以依据本说明书中所描述的进行使用。为了这一描述,短语″CaMV35S″启动子因此包括CaMV35S启动子的变体,例如,通过与操纵子区域连接、随机或控制地诱变等得到的启动子。此外,可以改变启动子使其含有多个“增强子序列”以辅助提高基因表达。
通过本发明中的一段DNA构建物产生的RNA也含有一段5’端非翻译前导序列。这段序列可以来源于选作表达基因的启动子,而且可以经过特定修饰以提高mRNA的翻译。该5’端非翻译区域也可以从病毒的RNA中、从合适的真核基因中、或者从一段合成的基因序列中获得。本发明并不局限以下实施例中所出现的构造物。相反地,对于病毒的衣壳蛋白,非翻译前导序列可以是编码序列的非翻译区的5’末端的一部分、或者是启动子序列的一部分、或者可以来源于一段不相关的启动子或编码序列。在任何情况下,优选的是位于起始位点旁侧的序列与Kozak(1984)所报道的增强的翻译起始的翻译共有序列规则一致。
本发明中的cry DNA的构造物可能也含有一个或多个经修饰的或完全合成的结构编码序列,已经对该结构进行了修改以增强cry基因在植物中的表现。本发明中的结构基因可以选择性地编码一种含有一段氨基末端叶绿体转运肽或分泌信号序列的融合蛋白。
该DNA构建物也含有一段3’端非翻译区。该3’端非翻译区含有多腺苷酸化信号,该信号在植物中发挥作用以引起多聚腺苷酸核苷加入到病毒RNA的3’末端。合适的3’区域的例子是(1)3’端已转录、非翻译区含有土壤杆菌属肿瘤诱导(Ti)质粒多腺苷酸化信号的基因,如胭脂碱合成酶(NOS)基因,以及(2)类似于大豆储存蛋白(7S)基因和RUBP碳酸酵素(E9)小亚基基因的植物基因。4.12用于生产抗虫转基因植物的方法
通过用含有重组的cry*基因的片段转化一种合适的宿主细胞,如植物细胞,所编码的晶体蛋白(也就是,具有抗鞘翅类昆虫的杀虫活性的一种细菌的晶体蛋白或多肽)的表达可以导致抗虫植物的形成。
作为实施例,可以利用一种含有苏云金芽胞杆菌晶体蛋白的编码区的表达载体和一种适当的可选标记来转化胚胎植物细胞(如小麦或谷类细胞)的悬浮物,使用的方法如微粒轰击法(Maddock等,1991;Vasil等,1992),目的是将包裹在微发射粒中的DNA呈递到易感细胞内。转基因植物即从表达杀虫蛋白的已转化的胚胎愈伤组织中再生出来。
转基因植物的形成也可以通过其它细胞转化的方法来完成,这些方法在诸如土壤杆菌介导的DNA转移(Fraley等,1983)的技术中已知。可选择的,将DNA引入植物中可以通过直接将DNA转入花粉中(Zhou等,1983;Hess,1987;Luo等,1988)、通过将DNA注射入一种植物的生殖器官(Pena等,1987)、或者通过直接将DNA注射到来成熟胚胎的细胞中,接着再水合干燥的胚胎(Neuhaus等,1987;Benbrook等,1986)。
从单一的植物原生质体转化物或者从各种已转化的外植体中再生、发育和培养植物在技术上是熟知的(Weissbach和Weissbach,1988)。这种再生和生长的过程代表性地包括的步骤为挑选已转化的细胞、培养这些个体细胞完成贯穿有根幼苗阶段的胚胎发育通常的各阶段。转基因胚胎和种子的再生类似。然后将所得到的转基因有根的幼芽种入一种合适的植物生长培养基中,如土壤。
将外来的、双子叶植物中编码所感兴趣的多肽的基因从叶片外植体中通过土壤杆菌引入到植物中,含有该基因的植物的发育或再生可以通过如所描述的(Horsch等,1985)技术上熟知的方法来完成。在这一过程中,转化体的培养是在一种选择试剂的存在下,在一种诱导植株中的芽再生的培养基中培养,该植株已经通过所描述的方法被转化(Fraley等,1983)。
这一操作代表性地是在2到4个月内即生出芽,然后将这些芽转到一种合适的根诱导的培养基中,该培养基包括一种选择性的试剂和一种抗细菌生长的抗生素。然后将在该选择性试剂的存在下已生根并将形成幼苗的芽移植到土壤或其它培养基中,以允许根的产生。这些操作依赖于所使用的特定植株的不同而不同,这种变化在技术上是熟知的。
优选地,如以前所讨论的,再生的植物是自花授粉以提供纯合的转基因植物。另外,从再生植物中得到的花粉与农业经济上重要的种子生长的植物异种交配,优选的是近交系。相反地,从那些重要株系的植物中得到的花粉被用于对再生植物进行授粉。对于本发明中含有一种理想的多肽的转基因植物,其培养方法是在对本技术熟练的人员所熟知的。
这种植物可以形成生殖细胞及将所转化的性状传给子代。同样地,转基因植物可以以正常方式生长以及与具有相同的转化遗传因子或其它遗传因子的植物异种交配。所得到的杂交个体具有相应的表型。因此本发明中的异种转基因植物含有数目增加的编码区(如一种突变的cry基因),该区域编码感兴趣的突变的Cry多肽。一种优选的转基因植物是一种独立的隔离体,可以将该基因合其活性传递给子代。一种更为优选的转基因植物是该基因的纯合子,在有性繁殖过程中将该基因传递给其所有的子代。
从一种转基因植物中得到的种子可以在田地或温室中生长,所得到的性成熟的转基因植物进行自花授粉,以产生真正繁殖的植物。这些植物的子代变为真正的繁殖株系,通过实施例,估计它们在一定范围的环境条件下的抗鞘翅目昆虫的杀虫能力增强。发明者们预计本发明在商业上感兴趣的转基因植物的发明中将发现特别的用途,包括各种草类、谷类、纤维、块茎、豆类、装饰植物、仙人掌、多汁植物、水果、草莓和蔬菜,以及许多具有坚果和水果的树木和植物。4.13 用于生产重组Cry3*变体的方法
在一个或多个结构域含有取代物的晶体蛋白突变体可以通过许多技术构建。例如,使用Stemmer(1994)所描述的基于PCRTM的技术,很容易蒙混一系列高度相关的基因。可选择地,如果存在合适的限制位点,一种cry基因的突变体可以与第二种cry基因的突变体通过常规的亚克隆方法结合。如果不存在合适的限制位点,可以通过低聚核苷酸定向突变来产生突变体,该突变使用的是许多对于本技术熟练的人员了解的方法。可选择的,可以应用接合重叠*延伸PCRTM(Horton等,1989)来连接一种晶体蛋白不同区域的突变体。在这一过程中,通过PCRTM产生并且在其单一序列内含有不同突变的重叠DNA片段可以被退火并且作为扩增的模板,扩增使用附近的引物,以产生一段杂合的基因序列。最后,cry*突变体可以简单地通过使用一种cry突变体作为低聚核苷酸定向突变的模板来连接,该突变使用了许多如本说明书中所描述的协议。4.14分离同源基因和基因片段
依照本发明的基因和δ-内毒素不仅包括本说明书中所公布的全长序列,而且包括这些序列的片段、或融合蛋白,它们保留了此处特定例证的序列的特征杀虫活性。
对于本技术熟练的人员应该很明显的是杀虫的δ-内毒素可以通过几种方式鉴定和获得。它们的特定基因或片段可以从培养罐中获得,或者合成构建,例如,通过使用一种基因仪器。使用标准的制造点突变的技术可以很容易地构建这些基因的变体。而且,这些基因的片段可以通过使用商业上可提供的核酸外切酶或核酸内切酶,依据常规的程序制得。举例来说,可以利用如Bal31的酶或定向位点诱变从这些基因的末端有条理地切掉核苷。而且,编码活性片段的基因可以通过使用许多种其它的限制酶来获得。可以使用蛋白酶直接获得这些δ-内毒素的活性片段。
使用本说明书中提供的讲授,也可以将等价的δ-内毒素和/或编码这些等价δ-内毒素的基因从杆菌株系和/或DNA文库中分离出来。例如,此处所公布并要求的抗δ-内毒素的抗体可以被用来从蛋白的混合物中鉴定并分离其它δ-内毒素。特定的,所出现的抗体可以是抗δ-内毒素中最恒定和与其它苏云金芽胞杆菌δ-内毒素最不同的那一部分δ-内毒素。然后通过免疫沉淀、酶联免疫吸附测定(ELISA)、或Western印迹,可以将这些抗体用于特定地鉴定具有特征杀虫活性的等价δ-内毒素。
鉴定本发明中的δ-内毒素和基因的的另一种方法是通过使用低聚核苷酸探针。这些探针是含有一种可测标志的核苷序列。如技术上所熟知的,如果探针分子和核苷酸样品通过在两个分子间形成强键而产生杂交,可以合理地假定该探针和样品本质上是等同的。探针的可测标志提供了在已知方式上确定杂交是否发生的方法。这种探针分析提供了鉴定本发明的杀蚁剂δ-内毒素基因的快速方法。
作为依据本发明的探针的核苷片段可以通过使用DNA合成仪,采用常规的程序合成。在使用核苷片段作为探针时,用对本技术熟练的人员已知的任何合适的标志来标记特定的探针,包括放射性的和非放射性的探针。典型的放射性探针包括32P、125I、35S、或其类似物。用放射性同位素标记的探针可以从一段与DNA样品互补的核苷序列中通过常规的切口平移反应来构建,使用了一种DNA酶和DNA聚合酶。然后可将探针和样品在杂交缓冲液中结合,并在适当的温度下保存直到退火发生。此后,在无外来物质的条件下清洗薄膜,留下样品和其接合的探针,其检测和定量代表性地是通过放射自显影术和液体闪烁计数。
非放射性标记包括,例如,配基(如生物素或甲状腺素)、以及酶(如水解酶或过氧化物酶)、或者是各种化学发光素(如荧光素)、或者是类似于荧光素和其衍生物的荧光混合物。为了便于分离,也可以在探针的两端作不同类型的标记,就像,例如,在以上提及的一端使用同位素标记,在另一端用生物素标记。
双螺旋形成和稳定性依赖于杂交物两条链之间的本质互补,而且,如以上所注释的,可以允许一定程度的错配。因此,本发明中的探针包括突变(单个及多个)、删除、插入所描述的序列、以及它们的组合,其中上述突变、插入和删除允许含有所感兴趣的目标多聚核苷酸的稳定杂交物的形成。可以通过目前普通熟练的技工已知的方法,以及通过其他在将来可能会被了解的方法,以在许多方面在一段给定的多聚核苷酸序列上产生突变、插入和删除。
所列出的探针上潜在的变体部分是由于遗传密码的冗余。由于遗传密码的冗余,也就是,不止一种的核苷三联体(密码子)可以用于用作形成蛋白质的大多数氨基酸。因而不同的核苷序列可以编码一种特定的氨基酸。因此,苏云金芽胞杆菌δ-内毒素和多肽的氨基酸序列可以通过等价核苷序列来制备,该序列编码蛋白质或肽相同的氨基酸序列。因此,本发明包括这种等价的核苷序列。并且,反向或互补的序列是本发明的一方面,它们很容易被对本技术熟练的人员所应用。另外,已经显示已鉴定结构和功能的蛋白质可以通过改变氨基酸序列来构建,如果这种变化不改变蛋白质的二级结构(Kaiser和Kezdy,1984)。因此,本发明包括此处所描述的氨基酸序列的变体,它们不改变蛋白质的二级结构,或者如果结构被改变,其生物活性在本质上保持不变。此外,本发明也包括生物体的突变体,它们容宿有本发明中编码一种全部或部分δ-内毒素的基因。这些突变体可以通过对本技术熟练的人员熟知的技术来进行制备。例如,可以利用紫外辐射来制备宿主有机体的突变体。同样地,这些突变体可以包括不产孢子的宿主细胞,该细胞也可以通过技术上熟知的程序来制备。4.15 核糖酶
核糖酶是具酶促活性的RNA分子,它裂解特殊种类的mRNA。在特定的实施例中,发明者们期待挑选和利用可以裂解本发明中的RNA片段的核糖酶,以及在特定的细胞类型或组织中将它们用于降低目标mRNA的活性。
自然产生的核糖酶RNA的六种变体在目前是已知的。在生理条件下,每种均可催化RNA反式磷酸二酯键的水解(以及因此可以裂解其他RNA分子)。通常,核酸酶的作用首先是通过结合目标RNA。这种结合的发生是经过一种核酸酶的目标结合片段,该片段保持接近分子中作为裂解目标RNA的酶片段。因此,核酸酶首先识别,然后通过互补的碱基对与靶RNA结合,一旦结合到正确的位点上即开始作为酶起作用切断靶RNA。在战略上裂解这种靶RNA将会破坏其直接合成编码蛋白质的能力。在核酸酶结合并裂解其目标RNA之后,它即从该RNA上释放下来以寻找另一个目标,它可以重复地结合和裂解新的目标。
由于必然会影响治疗的核糖酶的浓度低于反义低聚核苷酸的浓度,故核糖酶的酶本性在许多技术上都是有利的,如反义技术(其中一种核酸酶分子简单地结合到核酸目标上以阻断其翻译)。这一优点反映在核糖酶的酶作用上。因此,一个单一的核糖酶分子可以裂解目标RNA的许多分子。另外,核糖酶是一种高度特异的抑制剂,其抑制的特异性不仅依赖于碱基对结合目标RNA的机制,而且依赖于目标RNA裂解的机制。靠近裂解位点的单一错配或碱基替换可以彻底消除核糖酶的催化活性。在反义分子中的类似错配不会阻碍其作用(Woolf等,1992)。因此,一种核糖酶作用的特异性大于结合在相同的RNA位点上的翻译低聚核苷酸的作用的特异性。
核酸酶分子可以在一种锤头、发夹、一种肝炎δ病毒、内含子组I或RNA酶P RNA(伴随着一段RNA辅助序列)或链孢菌VS RNA基序中形成。锤头基序的例子如Rossi等(1992)所描述;发夹基序的例子如Hampel等(欧洲专利EP 0360257)、Hampel和Tritz(1989),Hampel等(1990)和Cech等(美国专利5,631,359)所描述;肝炎δ病毒基序的例子如Perrotta和Been(1992)所描述;一种RNA酶P基序的例子如Guerrier-Takada等(1983)所描述;链孢菌VS RNA核糖酶基序如Collins(Saville和Collins,1990;Saville和Collins,1991;Collins和Olive,1993)所描述;一种内含子组I的例子如Cech等(美国专利4,987,071)所描述。在本发明的核酸分子中,所有重要的是它具有特异的底物结合位点,该位点与一个或多个目标基因RNA区域互补,以及它在底物结合位点内部或周围有核苷序列,该序列将RNA的裂解活性传递给该分子。因此核糖酶的构建不需要局限在本说明书中所提及的特定基序中。
本发明提供了产生一族酶裂解试剂的方法,这些试剂对所希望的目标呈现出高度的特异性。核酸酶分子优选的是用来瞄准靶mRNA的一段高度保守的序列区域,以至疾病或状况的特殊治疗可以配备一种或几种核酸酶。这种核酸酶分子可以如要求向外传送到特定的细胞。可选择的,核糖酶可以从被传递到特定细胞的DNA或RNA载体中表达。
小核酸酶基序(如,锤头或发夹结构)可以被用于向外传递。这些分析的简单的结构增加了核酸酶侵mRNA结构中靶区域的能力。可选择的,催化的RNA分子可以在细胞内从真核启动子中表达(如,Scanlon等;1991,Kashani-Sabet等,1992;Dropulic等,1992;Weerasinghe等,1991;Ojwang等,1992;Chen等,1992;Sarver等,1990)。对本技术熟练的人员了解任何核糖酶均可以在真核细胞内从适当的DNA载体中表达。这种核糖酶的活性可以通过借助于另一种核糖酶使其从初级转录中释放下来以达到增强(Draper等,国际专利申请出版No.WO 93/23569,和Sullivan等,国际专利申请出版No.Wo 94/02595,二者的全体均作为参照结合在本说明书中;Ohkawa等,1992;Taira等,1991;Ventura等,1993)。
核糖酶可以直接加入,或者可以与阳离子脂类、脂类复合物结合、包装在脂质体中,或者以其他的方式传递到靶细胞。该RNA或RNA复合物来自体内,或在体内可以局部施用于相关组织,或者在体内通过注射、气溶胶吸入、注入泵或支架,它们结合或不结合在生物高聚物中。
核糖酶可以如Draper等(国际专利申请出版No.WO 93/23569)或者如Sullivan等(国际专利申请出版No.WO 94/02595)所述进行设计,以及如所描述的,合成以在体外和体内进行测试。这种核糖酶也可以被优化以进行传递。当提供了特定的例子时,本技术领域的人员将认识到如果需要可以使用其他物种中等价的目标RNA。
锤头或发夹核糖酶可以通过电脑折叠单独进行分析(Jaeger等,1989),以估定核糖酶的序列是否折叠成正确的二级结构。将在结合臂和催化中心之间具有不利的分子内相互作用的核糖酶排除考虑范围之外。可以选择不同的结合臂的长度以优化活性。通常,每条臂至少5个碱基才能够与目标RNA结合、或者相互作用。
可以设计锤头或发夹基序的核糖酶在mRNA信息的不同位点退火,也可以通过化学方法进行合成。用于合成的方法遵循的是Usman等(1987)和Scaringe等(1990)所描述的常规RNA合成的程序,利用了普通的核苷酸保护和耦合组群,如在5’末端为二甲氧基三苯甲基(dimethoxytrityl),在3’末端为phosphoramidites。平均每步的耦合产量代表性地>98%。发夹核糖酶可以在两步内合成并可以退火重建一种有活性的核糖酶(Chowrira和Burke,1992)。可以对核糖酶进行广泛的修饰以增强其稳定性,其修饰是通过抗核酸酶的组群,例如,2’-氨基、2’-C-烯丙基、2’-氟、2’-o-甲基、2’-H(为了回顾,见Usman和Cedergren,1992)。核糖酶可以通过凝胶电泳采用普通的方法进行纯化,或者通过高压液相层析及在水中重悬。
核糖酶的活性可以通过改变核糖酶结合臂的长度进行优化、或者通过化学*合成经过修饰可以阻止其被血清核糖核酸酶降解的核糖酶(见例如,国际专利申请出版No.WO 92/07065;Perrault等,1990;Pieken等,1991;Usman和Cedergren,1992;国际专利申请出版No.WO 93/15187;国际专利申请出版No.WO 91/03162;欧洲专利申请出版No.92110298.4;美国专利5,334,711;以及国际专利申请出版No.WO 94/13688,它们描述了在酶RNA分子的糖基部分所进行的不同的化学修饰)、增强它们在细胞内功效的修饰、以及除去茎区II的碱基以截短RNA合成的时间及降低化学要求。
Sullivan等(国际专利申请出版No.WO 94/02595)描述了传递酶RNA分子的常规方法。核糖酶可以通过许多对于本技术熟悉的人员所了解的方法施用到细胞中,包括但不局限于,包装在脂质体中、通过离子电渗疗法、或者通过与其它微粒结合,如水凝胶、环糊精、生物可分解的微胶囊和生体附着性小球体。在一些例子中,核糖酶在体外,可以在有或没有上述微粒的情况下直接传递到细胞或阻止中。可选择的,该RNA/微粒复合体可以局部传递,通过直接吸入、通过直接注射、或者通过使用一种导管、注入泵或支架。其他传递的途径包括但不局限于血管内、肌肉内、皮下或结合注射、气溶胶吸如、口服(药片或药丸形式)、局部、组织、眼部、腹膜内和/或膜内传递。关于核糖酶传递和施用更为详细的描述由Sullivan等(国际专利申请出版No.WO 94/02595)和Draper等(国际专利申请出版No.WO 9-3/23569)提供,它们已经作为参照结合在本说明书中。
另一种在细胞内积累高浓度的核糖酶的方法是将编码核糖酶的序列结合到DNA表达载体上。核糖酶序列转录的驱动是从真核RNA聚合酶I(pol I)、RNA聚合酶II(pol II)、或RNA聚合酶III(pol III)的启动子开始。从pol II或pol III启动子开始的转录将在所有细胞中以高水平表达;在一种给定的细胞类型中,一种给定的pol II启动子的水平将依赖于位于附近的基因调控序列(增强子、沉默子等)的本性。也可以使用原核RNA聚合酶启动子,倘若该原核RNA聚合酶是在适当的细胞中表达(Elroy-Stein和Moss,1990;Gao和Huang,1993;Lieber等,1993;Zhou等,1990)。从这些启动子开始表达的核糖酶可以在哺乳动物细胞中起作用(如Kashani-Saber等,1992;Ojwang等,1992;Chen等,1992;Yu等,1993;L’Huillier等,1992;Liszlewicz等,1993)。为了引入到哺乳动物细胞中,可以将这种转录单元结合到许多载体上,包括但不局限于,质粒DNA载体、病毒DNA载体(如腺病毒或腺结合载体)、或病毒RNA载体(如逆转录酶病毒、塞姆利基森林病毒、辛德毕斯病毒载体)。
本发明中的核糖酶可以用作诊断工具,检测细胞株或细胞类型中的遗传漂变和突变。它们也可以用作估定目标RNA分子的水平。核糖酶活性与目标RNA结构之间的紧密关系使得可以在分子的任何区域检测突变,这些突变改变了目标RNA的碱基对和三级结构。通过使用本发明中所描述的多种核糖酶,人们可以绘制核苷的变化,它与在细胞和组织中一样,在体外对于RNA的结构和功能很重要。在特定的细胞或细胞类型中,用核糖酶裂解目标RNA可以被用来阻止基因表达和(本质上)限定特定基因产物的作用。5.0 实施例
以下包括的实施例是用来示范本发明中优选的具体例子。需要本技术的熟练人员理解是,以下实施例中所公布的技术代表了由发明者发现在本发明实践中发挥良好作用的技术,因此可以认为这些技术构成了其实践的优选模式。然而,依据当前所公布的,本技术的熟练人员需要理解在已公布的特定的具体例子中可以产生许多变化,而且没有离开本发明的精神和范围并仍然得到相同或类似的结果。5.1 实施例1-Cry3Bb的三维结构
Cry3Bb的三维结构通过X-射线晶体学确定。Cry3Bb的结晶和X-射线衍射数据的收集是如Cody等(1992)所描述进行的。Cry3Bb的晶体结构使用所收集达到2.4_分辨率的数据,精确到残差R因子为18.0%。该晶体属于C2221空间群,晶胞参数为a=122.44、b=131.81、c=105.37_,不对称单位中含一个分子。Cry3Bb的原子坐标如实施例31所描述并列于第9节。
Cry3Bb的结构类似于Cry3A的结构(Li等,1991)。它包括来自588个残基(64-652位氨基酸)的5825个蛋白质原子,形成三个不连续的结构域(图1)。在Cry3Bb的结构中总共确定出251个水分子(图2)。结构域1(64-294位残基)是由六个螺旋扭转围绕中心螺旋(α5)形成的一个七螺旋束(图5)。形成每个螺旋的氨基酸列于图4。结构域2(295-502位残基)含有三个反平行的β-片层(图5A和图5B)。片层1和2,各由4条β链组成,形成了独特的“Greek key”基序。片层3的外表面由3条β链组成,与结构域1中的螺旋α7相互联系。图6列出了包含结构域2中每条β链的氨基酸。跟在β链1之后的一段小的α螺旋(α8)也包含在结构域2中。结构域3(503-652位残基)含有一个“冻胶辊”状的β-圆柱体,该圆柱体具有一个疏水中心并且几乎与晶格的a轴平行、与c轴垂直(图7A和图7B)。包括结构域3中每条β链的氨基酸列于图8。
在晶体中Cry3Bb的单体沿着平行于a轴的二次轴形成了二聚的四维结构(图9A和图9B)。螺旋α6位于结构域1和其对称相关分子的结构域1和3之间的接触面形成的裂口处。沿着该接触面有许多紧密的氢键相互作用,确保了该二聚体的结构稳定性。5.2 实施例2-Cry3Bb.60的制备
苏云金芽胞杆菌EG7231通过芽孢形成在C2培养基中生长,经氯霉素(Cml)选择。该培养物中的固体物质通过离心和用水洗涤复原。毒素通过从4.0 M NaBr中重结晶进行纯化(Cody等,1992)。将纯化过的Cry3Bb溶于10毫升50mM的KOH/100毫克Cry3Bb,并用100mM的CAPS(pH9.0)缓冲至pH9.0。用胰岛素处理溶解的毒素,质量比为50毫克毒素比1毫克胰岛素。在胰岛素消化的20分钟以后,通过SDS-聚丙酰胺凝胶电泳(SDS-PAGE)见到的优势蛋白为60kDa。没有发现60kDa的毒素进一步被降解。图4显示在SDS-PAGE之后经考马斯-染色的Cry3Bb和Cry3Bb.60。5.3 实施例3-Cry3Bb.60的纯化和序列测定
Cry3Bb.60通过SDS-PAGE进行电泳纯化,并在15V下持续30分钟通过半干*传递以电印迹到Immobilon-P_(微孔过滤器)膜上。然后将薄膜用水冲洗两次并用0.025% R-250,40%的甲醇染色。为了降低背景,将印迹用50%的甲醇再次染色,直到可以看见被染色的蛋白条带。然后将印迹风干,将已染色的Cry3Bb.60条带从薄膜上剪下来。该条带被送至the Tufts University Sequencing Laboratory(Boston,MA)进行N-端序列分析。实验确定的N-末端的氨基酸序列如表7所示,除了从160位氨基酸残基开始的已知的氨基酸序列。
表7
Cry3Bb.60 N-末端的氨基酸序列及其与已知的Cry3Bb序列的比较
推断序列 |
已知序列 |
残基# |
S |
S |
160 |
K |
K |
161 |
R |
R |
162 |
S |
S |
163 |
Q |
Q |
164 |
D |
D |
165 |
R |
R |
166 |
5.4 实施例4-Cry3Bb.60的生物学活性
制备Cry3Bb用于生物鉴定,鉴定是通过将其溶于极微量的50mMKOH、每10ml含100mg毒素,用100mM CAPS(pH9.0)缓冲至pH9.0.如实施例1中所描述的制备Cry3Bb.60。两种制备均在生物鉴定之前、在室温下保持12到16小时。七天之后测种群的死亡率,并对其进行分析以确定每种毒素的死亡百分比。结果用数据表示在表8中。
表8
Cry3Bb和Cry3Bb.60抗南部玉米食根虫(Diabioticaundecimpunctata)的生物学活性
|
LC50mg/孔 |
95% C.I. |
Cry3Bb |
24.09 |
15-39 |
Cry3Bb.60 |
6.72 |
5.25-8.4 |
5.5 实施例5-通过Cry3Bb和CryB2.60的离子通道形成
在平面脂双层中估定Cry3Bb.60和Cry3Bb形成离子通道的能力。磷脂酰胆碱的双分子层的形成是在0.7毫米孔洞之上的Teflon_支持物上。在Teflon_的分区任一侧放置3.5ml 100mM KOH、10mM CaCl、100mM CAPS(pH9.5)的浸浴溶液。在分区的一侧加入毒素,跨过磷脂酰胆碱双分子层加上60mM的电压。任何通过薄膜的离子渗出均可以被扩大和记录。对由Cry3Bb或Cry3Bb.60产生的电导频率的分析的图解在图5A和图5B中。Cry3Bb.60容易形成离子通道,而Cry3Bb很少形成通道。5.6 实施例6-高分子量低聚物的形成
个别的Cry3Bb或Cry3Bb.60的分子与另一种相似的分子形成一个复合物。Cry3Bb形成低聚物的能力是非显见地可重复性的。在非变性的条件下,不能重复观察到该复合物的形成。Cry3Bb.60与另一种Cry3Bb.60分子形成明显较大量的较高分子量的复合物(>120kDa)。Cry3Bb的低聚物通过考马斯-染色的SDS聚丙烯酰胺凝胶的亮度进行确证。寡聚化作用在SDS-PAGE中可以见到,在上样之前不加热样品以保留一些非变性的毒素。这些数据暗示Cry3Bb。60相对于单独的Cry3Bb,更容易形成较有序的复合物。寡聚化作用也可以通过研究由这些分子产生的电导以及依赖于时间的电导的增加来观察到。这种在电导上的变化可以归因于毒素的寡聚化作用。5.7 实施例7一设计方法1:蛋白酶敏感位点的鉴定和变更以及蛋白水解步骤
在文献中已经有报道用胰岛素(一种在可利用的赖氨酸和精氨酸残基的羧基端裂解蛋白质的酶)处理Cry3A毒素蛋白,从67kDa的天然蛋白中获得稳定的55kDa的裂解产物(Carroll等1989)。该55kDa产物的N-末端序列分析显示裂解发生在氨基酸残基R158。据发现,该截短了的Cry3A蛋白保留了与天然蛋白相同水平的杀虫活性。Cry3Bb毒素蛋白也可以用胰岛素处理。消化之后,蛋白大小从68kDa(天然Cry3Bb毒素的分子量)降至60kDa。没有发现进一步的消化。N-末端序列分析解释胰岛素对截短了的毒素(Cry3Bb.60)的裂解位点为Cry3Bb中1α3,4上的氨基酸R159。出乎意料的是,发现截短了的Cry3Bb毒素的生物活性有所增加。
使用该方法,即用蛋白酶消化一种苏云金芽胞杆菌毒素蛋白,在Cry3Bb上鉴定了一个蛋白水解的敏感位点,以及鉴定了该蛋白(Cry3Bb.60)的一种更有活性的形式。通过引入一个附加的蛋白水解的识别位点来对该蛋白水解敏感的位点进行修饰,结果也导致一种生物学上更有活性的蛋白质的分离。也有可能去掉其他的蛋白水解敏感位点可以提高活性。蛋白水解的敏感区域一旦被确定,则可以被修饰或用于产生生物学上更有活性的毒素。5.7.1 Cry3Bb.60
用胰岛素处理增溶的Cry3Bb毒素蛋白,结果导致分离出一种分子量为60kDa(Cry3Bb.60)的稳定的、截短了的Cry3Bb毒素蛋白。Cry3Bb.60的N-末端序列分析显示胰岛素敏感位点为天然毒素的1α3,4上的R159。胰岛素消化导致了螺旋1-3从天然Cry3Bb上除去,而且约为四倍地增加了毒素抗SCRW幼虫的活性。
Cry3Bb.60是一种独特的毒素,其杀虫作用强于亲代Cry3Bb。杀虫活性的提高是判别它为一种新的毒素的唯一参数。除了其大小的减少,Cry3Bb.60也是一种更可溶的蛋白。Cry3Bb在pH6.5时从溶液中沉淀出来,而Cry3Bb.60从pH4.5到pH12都保持在溶液中。并且Cry3Bb.60形成的离子通道比Cry3Bb具有更高的频率。
Cry3Bb.60的产生是通过蛋白水解除去前159位氨基酸残基,或者是通过在体内产生这种毒素,通过细菌或植物表达Cry3Bb.60的基因,简而言之,不含有前483位核苷的Cry3Bb基因。
总之,Cry3Bb.60在几个重要的方面与Cry3Bb不同:杀虫活性增强;可溶范围增大;形成通道的能力增强;以及大小降低。5.7.2 EG11221
在Cry3Bb的胰岛素敏感1α3,4区域上的半随机诱变导致Cry3Bb.11221的分离,Cry3Bb.11221为一种设计的Cry3Bb蛋白,它于野生型相比,表现出提高超过六倍的抗SCRW幼虫的活性。Cry3Bb.11221在1α3,4区域存在4个氨基酸的变化。其中一种变化,L158R,在邻近R159(用于产生Cry3Bb.60(实施例4.1.1)的蛋白水解敏感位点)引入了一个另外的胰岛素位点。Cry3Bb.11221由苏云金芽胞杆菌作为一种全长的毒素蛋白产生,但推测其被昆虫内脏的蛋白酶消化为与Cry3Bb.60相同的大小(见由Carroll等产生的Cry3A,1989)。附加的蛋白酶识别位点可以使1α3,4区域对消化更为敏感,因此活性提高。5.8 实施例--设计方法2:结合水的确定和操作
水分子与蛋白质结合的途径有几种,包括容易被除去的表面水和更难提取出来的结合水(Dunitz,1994;Zhang和Matthews,1994)。结合水的功能已经成为重要学术推断的主题,但是精确的功能很少有实验确证。一些最引起关注的结合或结构水是从蛋白质本身内部参与蛋白结构的水。
某一位点被一个水分子占据,可以预示蛋白质内部的一个稳定的穴或者是由水介导的盐桥和氢结合水产生的折叠松弛。它可以降低氨基酸之间的结合程度,可能使该区域更具柔性。围绕相同位点的一种不同氨基酸序列可以导致较好的折叠、围绕极面或带电氨基酸的穴的瓦解。这可以导致柔性的提高。因此,一种蛋白某一区域的水合程度可以决定该区域的柔性或流动性,对水合的操作可以改变柔性。提高暴露于水中的区域的水合作用的方法包括沿着其表面增加疏水残基的数目。文献中指出暴露的疏水残基相对于亲水残基需要明显较多的水(CRC Handbook of Chemistry and Physics,CRC Press,Inc.)。然而没有指出通过这样做,可以达到提高蛋白质的生物学活性。
结构水以前在苏云金芽胞杆菌δ-内毒素(包括Cry3Bb)中没有被鉴定。此外,没有报道这种结构水在δ-内毒素或细菌毒素中的功能。在对Cry3Bb的分析中,据观察收集到的水分子位于1α3,4(一种由本发明者定义在提高生物活性中很重要的位点)周围。环α3,4区域是暴露的表面,它限定了蛋白质内的一个枢纽,容许结构域1上前三个螺旋的去除或运动。在该区域周围发现的水合作用可以将柔性和流动性传给该环。对1α3,4上结构水的观察提供了进一步结构分析的分析工具。如果这一重要的位点被水包围,则其它重要的位点也会完全或部分被水包围。借此观察结果,则可以鉴定围绕螺旋5和6的结构水。这些结构水形成了一个穿过蛋白质的圆柱,有效地将螺旋5和6从分子的其它部分分隔开来。Cry3A和Cry3Bb的结构暗示螺旋5和6是紧密关联的,通过范德华力的相互作用连接在一起。单独的,来自Cry3A的螺旋5,虽然不足以具有生物活性,但它已经被证实在人造的薄膜上具有形成离子通道的能力(Gazit和Shai,1993)。由螺旋5形成的离子通道小于全长毒素离子通道10倍,暗示着实际大小的离子通道需要明显较大的毒素结构。在Cry3Bb中,作为α螺旋(结构域1)簇的一部分的螺旋5已经被发现可形成离子通道(Von Tersch等,1994)。由本发明者们进行的未发表的实验观察证实螺旋6也穿过了该生物膜。因此,螺旋5和6是推断中的对毒性必须的通道形成螺旋。
围绕这些螺旋的水合作用可以预示该区域的柔性对于毒性的必需的。因此,可以想象如果有可能提高围绕螺旋5和6的水合作用,则可以产生较好的毒素蛋白。然而,必须注意的是,要避免在螺旋5-6和蛋白的任何其它部分之间产生连续的疏水表面,它可以,通过疏水相互作用,限制可变螺旋的运动。螺旋5和6的流动性可能也依赖于依附于它们的环的柔性,以及Cry3Bb分子的其它区域,尤其在结构域1,其可能经历结构上的变化以允许两个螺旋插入到膜上。改变该蛋白中这些区域的水合作用也可以影响它的生物活性。5.8.1 Cry3Bb.11032
结合水残基的集中显示出1α3,4区域的相对柔性。该环柔性的提高可以通过提高该区域的水合作用,水合作用的提高是通过替换相关疏水残基为暴露的亲水残基。一种经改良设计、具有这种类型替换的蛋白质的例子是Cry3Bb.11032。Cry3Bb.11032具有氨基酸改变D165G;甘氨酸比天冬氨酸更具疏水性(Kyte和Doolittle疏水得分为-0.4比天冬氨酸-3.5)。Cry3Bb.11032的活性大约成倍地高于野生型Cry3Bb。5.8.2 Cry3Bb.11051
为了提高Cry3Bb中1α4,5的水合作用,将甘氨酸替换暴露于表面的残基K189。甘氨酸比赖氨酸的疏水性更强性(Kyte和Doolittle疏水得分为-0.4比天冬氨酸-3.9),可以导致结合水的增加。结合水的增加可以将更高的柔性传给在通道形成螺旋(α5)之前的环区域。经设计具有K189G变化的Cry3Bb蛋白,Cry3Bb.11051,相对于野生型Cry3Bb表现出活性增加三倍。5.8.3变更为Lα7,β1(Cry3Bb.11241以及11242)
在暴露于表面的连接α螺旋7和β-链1的环(1α7,β1)上进行氨基酸改变,结果导致鉴定出2种被改变的、生物活性提高的Cry3Bb蛋白质,Cry3Bb.11241和Cry3Bb.11242。对这两种蛋白质中超过20个的氨基酸序列281-300(包含1α7,β1区域)进行水性索引的分析,显示在这些蛋白质中的氨基酸替换使1α7,β1区域更具疏水性。对每种蛋白的水性值(GRAVY)的总平均的确定是通过使用PC\GENE_(intelligenetics,Inc.,Mountain View,CA,版本6.85)序列分析计算机程序、SOAP、和一段7个氨基酸的间隔。SOAP程序是基于Kyte和Doolittle(1982)的方法。对每种蛋白1α7,β1区域疏水性的提高可以提高环的水合作用以及,因此,柔性。被改变的蛋白质、它们各自的氨基酸变化、相对于野生型生物活性倍数的增加、以及GRAVY值均列于表9。
表9 Cry3Bb以及两个设计的SCRW生物学活性提高的Cry3Bb蛋白中Lα7,β1区域的水性值
Cry3Bb*蛋白 |
氨基酸变化 |
相对野生型生物活性的倍数增加 |
GRAVY(氨基酸281-300) |
野生型 |
- |
- |
4.50 |
Cry3Bb.11241 |
Y287F,D288N,R290L |
2.6x |
10.70 |
Cry3Bb.11242 |
R290V |
2.5x |
8.85 |
5.8.4 变更为Lβ1,α8(Cry3Bb.11228、Cry3Bb.11229、Cry3Bb.11230,Cry3Bb.11233、Cry3Bb.11236、Cry3Bb.11237、Cry3Bb.11238以及Cry3Bb.11239)
暴露于表面、在β-链1和α-链8之间的环(1β1,α8)定义为Cry3Bb中结构域1和2之间的分界。在该区域引入半随机的氨基酸变化,结果导致确定出几种生物活性提高的被改变的Cry3Bb蛋白。对在这些改变的蛋白内发现的氨基酸替换的水性索引分析显示,这些变化使暴露的区域更具疏水性,其可导致水合作用和柔性的增加。表10列出了被改变的蛋白质,它们各自的氨基酸改变和相对域野生型Cry3Bb的倍数增加,以及使用PC\GENE_(intelligenetics,Inc.,Mountain View,CA,版本6.85)序列分析计算机程序、SOAP、超过20个氨基酸的序列305-324(包括1β1,α8)确定的水性值的总平均(GRAVY),使用了一段7个氨基酸的间隔。
表10 Cry3Bb和八个设计的SCRW生物学活性提高的Cry3Bb*蛋白Lβ,α8区域的水性值Cry3Bb*蛋白 氨基酸变化 相对野生型生物活 GRAVY
性的倍数增加 (氨基酸
305-324)野生型 - - 0.85Cry3Bb.11228 S311L,N313T, 4.1x 4.35
E317KCry3Bb.11229 S311T,E317K, 2.5x 2.60
Y318CCry3Bb.11230 S311A,L312V, 4.7x 3.65
Q316WCry3Bb.11233 S311A,Q316D 2.2x 2.15Cry3Bb.11236 S3111 3.1x 3.50Cry3Bb.11237 S3111,N313H 5.4x 3.65Cry3Bb.11238 N313V,T314N, 2.6x 9.85
Q316M,E317VCry3Bb.11239 N313R,L315P, 2.8x 3.95
Q316L,E317A5.8.5 Cry3Bb.11227、Cry3Bb.11241以及Cry3Bb.11242
位于Cry3Bb螺旋6的氨基酸Q238,已经被确定为是一个通过其大尺寸和与R290的氢键连接来阻断螺旋6和螺旋4之间表面完全的水合作用的残基。用另一种氨基酸替换R290(该氨基酸不形成氢键或其所具有侧链不能横越与Q238形成氢键的物理距离)可以导致Q238周围水合作用。Q238,不能与R290形成氢键,才可结合水。这可以增加通道形成区域的柔性。设计的蛋白质Cry3Bb.11227(R290N)、Cry3Bb.11241(R290L)和Cry3Bb.11242.(R290V)相对于野生型,抗SCRW幼虫的活性分别提高约2倍、2.6倍和2.5倍。5.9 实施例9-设计方法3:流动性区域周围的氢键的操作
某一蛋白质具有活性可能需要其区域的流动性。α5,6区域(Cry3Bb的推定通道形成区域)流动性的增加可以通过减少氢键的数目,包括盐桥(带有相反电荷的氨基酸侧链之间的氢键)、螺旋5-6和分子或二聚物结构中的任何其它部分之间。这些氢键可以阻碍这两个螺旋的运动。减少氢键和盐桥的数目可以提高生物活性。为了避免在螺旋5-6和二聚物的任何其它部分之间产生连续的疏水表面,必须用疏水残基取代氢键结合的氨基酸。5.9.1 Cry3Bb.11222和Cry3Bb.11223
Tyr230位于螺旋6并且在Cry3Bb的四元二聚结构中,该氨基酸与来自邻近分子的Tyr230并列。正是由于这个氨基酸,在两个单体中的两个螺旋6之间形成了三个氢键。为了提高螺旋5-6(理论上可以插入膜内形成离子通道的螺旋)的柔性,通过改变该氨基酸以去掉横跨二聚体的氢键,观察到生物活性有相应的增加。设计的Cry3Bb蛋白,Cry3Bb.11222和Cry3Bb.EG11223相对于野生型,其SCRW活性的增加分别为4倍和2.8倍。5.9.2 Cry3Bb.11051
设计的Cry3Bb蛋白Cry3Bb.11051在结构域1的1α4,5上有氨基酸变化K189G。在野生型的Cry3Bb结构中,K189暴露的侧链与E123(位于1α2b,3中)的暴露的侧链的改变很靠近,足以形成氢键。用甘氨酸替换K189,如同在Cry3A的该位点所发现的,排除了在该位点形成氢键的可能性,形成了一种生物活性高于野生型Cry3Bb三倍的细胞。5.9.3 Cry3Bb.11227、Cry3Bb.11241、以及Cry3Bb.11242
位于Cry3Bb的螺旋6中的氨基酸238,已经被鉴定为是一种通过其大尺寸和与R239的氢键连接,从而阻断螺旋6和螺旋4之间空间的完全水合的残基。用另一种氨基酸替换R290(该氨基酸不形成氢键或其所具有侧链不能横越与Q238形成氢键的物理距离)可以增加通道形成区域的柔性。设计的蛋白质Cry3Bb.11227(R290N)、Cry3Bb.11241(R290L)和Cry3Bb.11242.(R290V)相对于野生型,抗SCRW幼虫的活性分别提高约2倍、2.6倍和2.5倍。5.10 实施例10-设计方法4:螺旋周围的环的分析及其设计
某一蛋白质的环区可能涉及该蛋白的许多功能,包括但不局限于,通道形成、四级结构的形成和维持、以及受体结合。Cry3Bb是一种通道形成蛋白。δ-内毒素的离子通道形成螺旋进入双分子层的有效性依赖于没有阻碍该过程的力。可能限制该过程的其中一种力是围绕关键螺旋的环区中氨基酸侧链的空间阻碍。文献中指出在至少一种另外的细菌毒素中,不是一种苏云金芽胞杆菌毒素,毒素分子打开,或者用科学术语来说,失去四级结构以暴露出膜活跃的区域(Cramer等,1990)。该文献没有讲述如何提高这一事件的可能性,而且不知道苏云金芽胞杆菌毒素是否利用相同的过程插入膜内。通过降低侧链大小或改变其取向从而使相应的生物活性增加,以降低氨基酸侧链在这些关键区域的空间阻碍是本发明的步骤。5.10.1 在螺旋3和4之间的环的分析(Cry3Bb.11032)
本发明者们已经发现结构域1的前三个螺旋可以通过蛋白水解消化螺旋α3和α4之间的环,从该毒素的剩余部分被切除(Cry3Bb.60)。最初尝试截短Cry3Bb基因以产生这种截短的、但更有活性的Cry3Bb分子,结果失败。由于未知的原因,苏云金芽胞杆菌未能合成这种60kDa的分子。后来被解释为可能是结构域1的前三个螺旋不是必须被蛋白水解除掉,或者相当的,该蛋白不是必须以这种截短了的形式合成来运用Cry3Bb.60设计。据观察,蛋白Cry3A在1α3,4附近有一个小氨基酸,它可能传递较高的柔性给环区,从而允许结构域1的前三个螺旋让开,暴露出膜活性区域。通过设计一种在该环附近有一个甘氨酸残基的Cry3Bb分子,有可能减少该环中残基的空间阻碍。重新设计的蛋白,Cry3Bb.11032,具有氨基酸变化D165G,它用最小的氨基酸,甘氨酸(平均质量57.05)取代较大的天冬氨酸残基(平均质量115.09)。Cry3Bb.11032的活性大约高于野生型蛋白的三倍。以这种方式,合理地重新设计螺旋α3和α4之间的环,在生物活性上有相应的提高。5.10.2 Cry3Bb.11051
在Cry3Bb中连接螺旋α4和α5的环区必须具有柔性,这样通道形成螺旋α5-α6才可以插入膜内。注意的是Cry3A在该环的中间具有一个甘氨酸残基,它可以传递更高的柔性。在Cry3Bb中制造相应的变化K189G,结果得到的设计蛋白,Cry3Bb.11051,与野生型Cry3Bb相比,其抗SCRW幼虫的活性提高三倍。5.10.3 β-链1和螺旋8之间的环的分析(Cry3Bb.11228、Cry3Bb.11229、Cry3Bb.11230、Cry3Bb.11232、Cry3Bb.11233、Cry3Bb.11236、Cry3Bb.11237、Cry3Bb.11238、以及Cry3Bb.11239)
位于结构域2中β链1和结构域2中α螺旋8之间的环区与结构域1中α螺旋6和7之间的环十分靠近。在1β1,α8氨基酸侧链显示出似乎它们会在空间上阻碍1α6,7的运动。由于为使通道形成螺旋α5-α6插入到膜内,1α6,7必须是柔性的,据认为,重新操作该环可以改变侧链的定位,结果引起较小的空间阻碍。已经完成创造了生物活性高于野生型变化从2.2到5.4倍的蛋白。这些设计的毒素蛋白和它们的氨基酸变化作为Cry3Bb.11228、Cry3Bb.11229、Cry3Bb.11230、Cry3Bb.11232、Cry3Bb.11233、Cry3Bb-11236、Cry3Bb.11237、Cry3Bb.11238、和Cry3Bb.11239列于表2。5.10.4 螺旋7和β链1之间的环的分析(Cry3Bb.11227,Cry3Bb.11234,Cry3Bb.11241,Cry3Bb.11242,以及Cry3Bb.11036)
如果Cry3Bb类似于一种为发挥毒性必须打开以暴露出膜活性区域的细菌毒素,有可能除了通道形成螺旋之外还必须改变其它螺旋的位置。据推论,如果螺旋α5-α6插入膜内,则螺旋α7可能必须也改变位置。如实施例4.4.3中所示的,螺旋α6和α7之间柔性的提高可以提高活性,在螺旋α7之后的环,1α7,β1较高的柔性也可以提高生物活性。改变Cry3Bb的1α7,β1区导致了几种活性提高的蛋白的分离,它们高于野生型变化从1.9到4.3倍。这些设计的蛋白作为Cry3Bb.11227、Cry3Bb.11234、Cry3Bb.11241、Cry3Bb.11242、和Cry3Bb.11036列于表7。5.11 实施例11--设计方法5:β链和β片层周围的环的设计
某一蛋白质结构的环区可能涉及该蛋白的许多功能,包括但不局限于,通道形成、四级结构的形成和维持、以及受体结合。某一结合表面常常是由许多环限定的,如同免疫球蛋白G(IgG)的例子(为回顾,见Branden和Tooze,1991)。然而,仅仅通过看在讨论中的蛋白的结构,在这一点上不能确定的是什么环对受体的相互作用是重要的。由于没有确定一种Cry3Bb的受体,甚至没有可能将Cry3Bb与其它具有相同受体的蛋白质进行比较以确定结构上的相似性。为了确定促成受体相互作用的Cry3Bb环,在暴露于表面的环上进行随机突变。
当每个环均被改变时,检测和比较所得到的蛋白的所以生物活性的轮廓。环,尤其是在结构域2(其显示出对通道活性不必要)中的,归为两类:(1)可以被改变、没有引起所得到的蛋白生物活性水平大变化的环以及(2)在其上的改变引起所得到的蛋白生物活性完全丢失的环。使用这种设计方法,有可能鉴定出几种对于活性重要的环。5.11.1 环β2,3的分析
在β链2和3之间的环区上的半随机突变导致产生结构上稳定的毒素蛋白,其抗SCRW幼虫的活性明显降低。该1β2,3区域对氨基酸变化高度敏感,暗示着特定的氨基酸或氨基酸序列对于毒素蛋白的活性是必需的。因此,可以想象在1β2,3区域特定的变化将降低结合以及,因此降低重新设计的毒素蛋白的活性。5.11.2 环β6,7的分析
在β链6和7之间的环区上引入半随机突变导致产生SCRW生物活性完全丧失的结构上稳定的蛋白。该1β6,7区域对氨基酸变化高度敏感,暗示着特定的氨基酸或氨基酸序列对于毒素蛋白的活性是必需的。因此,可以想象在1β6,7区域特定的变化将降低结合以及,因此降低重新设计的毒素蛋白的活性。5.11.3 环β10,11的分析
对β链10和11之间的环区的随机突变导致产生的蛋白SCRW生物活性完全丧失。环β10,11与环β2,3及β6,7在结构上靠近并相互作用。对1β10,11区中特定残基的改变也导致与昆虫膜的相互作用增加,毒素蛋白的生物活性提高。5.11.4 Cry3Bb.11095
环β2,3、β6,7和β10,11已经被确定为对Cry3Bb的生物活性很重要。这三个环是暴露于表面并且在结构上靠在一起。野生型结构中的氨基酸Q348,位于β-链2上并恰好在1β2,3之前,不形成任何分子内的相互联系。然而,用精氨酸取代Q348(Q348R)导致在R348和R487及R488的主链羰基之间形成两个新的氢键,二者均位于1β10,11上。新的氢键可以稳定由三个环形成的结构。设计的带有这一变化的蛋白质,Cry3Bb.11095,比野生型Cry3Bb活跃4.6倍。5.12 实施例12-设计方法6:复合静电表面的鉴定和重新设计
蛋白之间的相互作用包括疏水作用(如范德华力)、亲水相互作用(包括在氨基酸侧链的相反电荷之间的作用(盐桥))、以及氢键。关于δ-内毒素和受体的相互作用知之甚少。目前,没有文献报道鉴定苏云金芽胞杆菌毒素和受体之间主要相互作用的类型。
然而,在实验上,提高苏云金芽胞杆菌毒素-受体相互作用的强度是重要的,而在提高它的过程中不能够精确地确定化学相互作用。为了达到这一点,通过解决分子周围的Poisson-Boltzman分布来限定Cry3Bb的静电表面。一旦该电限制的表面被解决,就可以预见到最大差异的区域。据推论,这些静电相反的区域将有最大的可能性参与苏云金芽胞杆菌毒素蛋白和其受体之间特定的相互作用,而不是更普遍和非特异性的相互作用。因此,选择这些区域进行重新设计,继续提高区域的静电差异。另外,检查毒素中推定的通道形成区域周围的静电相互作用创造了重新设计的见解。这包括在另外带有负电荷的通道内鉴定带有正电荷的残基(见实施例4.6.1)。5.12.1 R290(Cry3Bb.11227、Cry3Bb.11241、以及Cry3Bb.11242)
检查沿着结构域1轴的Cry3Bb二聚物接触面,暗示在单体之间可能形成了阳离子的小孔或通道。对该轴的静电检查为这一意见增添了附加的可信性。事实上,假设的通道主要是带负电荷的,这是一项与关于阳离子选择的、δ-内毒素通道的生物物理分析一致的观测。如果某一阳离子通道是沿着二聚物的轴形成的,在该阳离子可以相对容易地在单体之间运动,只有一个明显的障碍。一个带正电的精氨酸残基(R290)位于另一个带负电的通道内。该残基可以阻碍阳离子通过该通道的运动。基于这一分析,将R290变换为不带电荷的残基。重新设计的蛋白Cry3Bb.11227(R290N)、Cry3Bb.11241(R290L)和Cry3Bb.11242(R290V)的生物活性分别提高大约2倍、2.6倍和2.5倍。5.12.2 Cry3Bb.60
对于增溶的Cry3Bb的胰岛素消化产生了一种稳定的、截短了的蛋白,其分子量为60 kDa(Cry3Bb.60)。胰岛素消化发生在残基R159的羧基端,有效地将螺旋1至3从天然Cry3Bb结构中去除。前3个螺旋的切除暴露出与在天然结构中发现的不同的静电表面。这一新的表面具有疏水、极性和带电特征的组合,这些特征在膜内相互作用中可能扮演重要角色。Cry3Bb.60的生物活性高于野生型Cry3Bb 3.6倍。5.13 实施例13:设计方法7:金属结合位点的鉴定和去除
文献中指出苏云金芽胞杆菌毒素在体外的行为可以通过从实验系统中螯合二价阳离子来达到增强(Crawford和Harvey 1988)。然而,不知道的是这些二价阳离子是如何阻碍体外活性的。Crawford和Harvey(1988)证实在EDTA(一种二价离子的螯合剂)的存在下,相对于没有该试剂的情况下,穿过中肠的短路电流更严重地被苏云金芽胞杆菌阻断,因此暗示着在苏云金芽胞杆菌的作用模式中,这一步可以通过去除二价离子而成为可能。使用黑色油脂膜进行类似观察,测定在EDTA存在以螯合二价离子的情况下,由δ-内毒素产生的电流的增加。对于这些观察结果至少有三种可能的解释。第一种解释可以是二价离子太大,以至无法穿过更适于单价离子的离子通道,因此阻塞了该通道。第二种,二价离子可能十分普遍地覆盖在蛋白质上,因此阻碍了毒素膜相互作用所需要的电荷相互作用,以及限制了离子通道的活性。第三种可能性是在蛋白中存在一种特殊的金属结合位点以及,当该位点被二价离子占据时,离子通道的性能即受到损害。虽然文献无法区分一种可能性高于另一种的评估,但第三种可能性引起对Cry3Bb结构进行分析以寻找一个特定的金属结合位点,该位点可能会改变某一毒素可以形成一个离子通道的可能性。5.13.1 H231(Cry3Bb.11222、Cry3Bb.11224、Cry3Bb.11225、以及Cry3Bb.11226)
在Cry3Bb二聚体中,一个推定的金属结合位点是由各单体上的H231残基形成的。H231残基位于螺旋α6中,它们彼此邻近而且靠近二聚体的对称轴。通过用其它氨基酸替代组氨酸来去掉该位点,这可以通过EDTA-依赖的离子通道活性的缺乏来进行评估。设计的毒素蛋白Cry3Bb.11222、Cry3Bb.11224、Cry3Bb.11225和Cry3Bb.11226的生物活性相对于野生型,分别提高4、5、3.6和3倍。它们各自的氨基酸变化列于表2。5.14 实施例14-设计方法8:四级结构的变更
Cry3Bb与一种相关的蛋白Cry3A类似,能以二聚体的形式存在与溶液中(Walters等,1992)。然而,二聚体对于生物活性的重要性尚不知晓,原因是没有认真地评估以单体或高度有序结构的形式存在的毒素。据猜测是特定的氨基酸残基促成四级结构的形成和稳定性。一旦鉴定出该起作用的残基,则可进行改变以减小或加大该残基的影响,从而影响单体之间的相互作用。通道活性是估定Cry3Bb及其衍生物的四级结构的一条有用的途径,但决不是唯一的途径。已经观察到Cry3Bb在膜内形成闸门控制的电导,其随时间而增大,最终导致在膜上形成大的孔径(野生型Cry3Bb的通道活性的描述在12.1节中)。也观察到Cry3A形成比Cry3Bb更稳定的二聚体,以及更快地相应形成更高水平的电导(图10)。该发现引导本发明者们设想寡聚化和离子通道的形成(电导大小和通道形成的速度)是相关的。基于这一发现,将Cry3Bb重新设计以形成速度更快的更大、更稳定的低聚物。在这一分析中设想离子通道形成和增长的速度反映了该过程。也有可能四级结构的改变不独自影响通道活性或完全不影响。改变四级结构也可能影响受体相互作用、在昆虫内脏环境中的蛋白加工、以及生物活性的其它未知方面。5.14.1 Cry3Bb.11048
对Cry3A和Cry3Bb比较性的结构分析导致鉴定出两种毒素之间在离子通道形成结构域的结构上的不同点;特定地,在Cry3Bb上的螺旋2a和螺旋2b之间插入一个氨基酸。去掉在Cry3B2,A104上附加的该氨基酸以及Cry3A中的D103E替换点,导致通道闸门的丧失和对称孔径的形成。一旦这些孔径形成,它们将保持开放和允许一个稳定的电导,变化为25-130pS。该设计的蛋白,Cry3Bb.11048,抗SCRW幼虫的活性高于野生型Cry3Bb 4.3倍。5.14.2 Cry3Bb.60的寡聚化作用
单独的Cry3Bb或Cry3Bb.60分子可以形成彼此类似的复合物。Cry3Bb的寡聚化作用是由SDS-PAGE证实的,其中上胶之前样品在样品缓冲液中不被加热。没有热处理允许了一些非变性的毒素的维持。在考马斯染色之后,通过出现一条分子量为单体的两倍的条带可以看到寡聚化作用。较高分子量条带的亮度反映了寡聚化作用的程度。Cry3Bb形成低聚物的能力不是明显可再生的。该复合物可能重复观察到它的形成。然而,Cry3Bb.60形成明显较大量的较高分子量的复合物(120kDa)。这些数据暗示Cry3Bb.60比单独的Cry3Bb更容易形成高度有序的复合物。Cry3Bb.60也形成比野生型Cry3Bb具有更高频率的离子通道(见5.12.9节)。5.14.3 Cry3Bb.11035
在Cry3Bb上制造变化以反映Cry3A在1α3,4和螺旋4的起始部分的氨基酸序列。这些变化形成了设计蛋白Cry3Bb.11035,它与野生型Cry3Bb不同,形成具有高电导的自发通道。Cry3Bb.11035的抗SCRW幼虫的活性也大约高于野生型Cry3Bb三倍。Cry3Bb.11035及其氨基酸变化列于表10。5.14.4 Cry3Bb.11032
改变Cry3Bb.11032在螺旋α4中165位上的残基,如Cry3A中所见的,将天冬酰胺变为甘氨酸。Cry3Bb.11032的活性高于野生型Cry3Bb三倍。Cry3Bb.11032的通道活性十分类似于Cry3Bb,除了当将该设计蛋白人为地组合到膜内时。观察到与野生型Cry3Bb相比,初始的通道电导有16倍的增加(见5.12.2节)。猜想这种初始电导的增加是由于增强了的四级结构、稳定或较有序的结构。5.14.5 EG11224
在野生型Cry3Bb二聚物结构中,位于结构域1中231位上的组氨酸与D288(结构域1)、Y230(结构域1)产生氢键联系,以及,通过一个水分子网络,也与D610(结构域3)、所有相对的单体产生联系。D610和K235(结构域1)也产生联系。用精氨酸取代组氨酸,H231R,在一个方向上导致与邻近单体上的D610形成一个盐桥。在第二个方向上,如同在野生型结构中所出现的,与邻近单体上的D288保持联系。在任一方向上,R231不与相对单体上的Y230形成氢键,但的确与K235产生联系,K235保持其与K610的联系(V.Cody,研究交流researchcommunication)。移动的氢键改变了四级结构内蛋白的不同结构域之间的相互作用。大体上,在邻近单体的结构域1之间存在的氢键较少,在结构域1和3之间已经形成了一个更强的键。发现通道活性已经被改变。Cry3 Bb.11224类似于Cry3 Bb产生小的、快速闸门控制的通道。然而,与野生型Cry3 Bb不同,Cry3 Bb.11224不表现出β-巯基乙醇依赖的活性。用精氨酸取代H231导致一种设计Cry3 Bb蛋白Cry3 Bb.11224的产生,其生物活性提高5倍。5.14.6 Cry3Bb.11226
如4.8.5节所讨论的,Cry3Bb.11226类似于Cry3Bb.11224,在231位的组氨酸被取代。氨基酸的变化,H231T,导致在野生型Cry3Bb中所见到的β-巯基乙醇依赖的活性的丢失(见5.12.1节)。H231(一个推定的金属结合位点)的取代改变了四级结构中区域之间的相互作用,导致产生不同类型的通道活性。Cry3Bb.11226的活性高于Cry3Bb三倍。5.14.7 Cry3Bb.11221
Cry3Bb.11221已经在Cry3Bb的1α3,4区进行重新设计。由Cry3Bb.1122形成的通道比由野生型Cry3Bb形成的电导更好地解决(见5.12.6节)。Cry3Bb.1122的生物活性比野生型Cry3Bb高出6.4倍。Cry3Bb.1122中发现的氨基酸变化列于表2。5.14.8 Cry3Bb.11242
设计的蛋白,Cry3Bb.11242,带有变化R290V,迅速地形成小电导,它在约3分钟内迅速及稳定地增长位大的电导(见5.12.7节)。这与野生型Cry3Bb通道是相反的,它需要30-45分钟出现,在数小时内缓慢增长成大的电导。Cry3Bb.11242与野生型Cry3Bb相比,其生物活性也增加2.5倍。5.14.9 Cry3Bb.11230
Cry3Bb.11130,与野生型Cry3Bb不同,形成长期处于开启状态的形成良好的通道。这些通道达到最高为3000pS的电导,但不随时间继续增大。Cry3Bb.11230已经在Cry3Bb的1β1,α8区域进行了重新设计,表现出与野生型Cry3Bb相比,抗SCRW幼虫的活性几乎提高5倍(表9)和抗WCRW(表10)幼虫提高5.4倍。在Cry3Bb.11230中发现的氨基酸变化列于表2。5.15 实施例15-设计方法9:结构残基的设计
某一蛋白特定三维结构是通过被埋藏或被从蛋白的表面移开的氨基酸固定就位的。这些结构的决定物可以通过检验促成表面结构定位的力来进行鉴定。然后可以增强这些结构残基的影响以限制分子移动,或者降低其影响以增强分子柔性。5.15.1 Cry3Bb.11095
环β2,3、β6,7和β10,11位于Cry3Bb的结构域2上,已经被鉴定为对生物活性是重要的。这三个环是暴露于表面并且在结构上靠在一起。野生型结构中的氨基酸Q348位于β-链2上并恰好在1β2,3之前,不形成任何分子内的联系。然而,用精氨酸取代Q348(Q348R)导致在R348和R487及R488的主链羰基之间形成两个新的氢键,二者均位于1β10,11上。新的氢键可以稳定由三个环形成的结构。确定地,如通过X-射线晶体学所确定的,围绕R348的结构被更紧密地折叠。设计带有这一变化的蛋白Cry3Bb.11095,其活性高于野生型Cry3Bb 4.6倍。5.16 实施例16一设计方法10:组合分析以及突变形成
设计的Cry3Bb分子中单独的位点可以被一起用来形成一个新的Cry3Bb分子,其活性高于任何一个位点的活性。该方法没有被精确地用于任何δ-内毒素。也不明显的是在两个位点的改善可以通力合作以提高蛋白的生物活性。事实上,数据证明当将两个位点的改善合在一个单一的构建物中时,Cry3Bb的生物活性被没有必然地进一步提高。在一些情况下,该结合导致蛋白稳定性和/或活性的降低。具有位点组合、结果导致比野生型Cry3Bb活性提高但比“母体”蛋白中的一种或多种活性降低的蛋白的例子是Cry3Bb.11235、11046、11057和11058。Cry3Bb.11082,含有来自4个母体蛋白的设计区域,保持了来自最有活性的母体株(Cry3Bb.11230)的活性水平,但没有显示出活性的增加。这些蛋白列于表7。以下是例证的实施例,其中被结合的突变具有明显提高的生物活性。5.16.1 Cry3Bb.11231
设计蛋白Cry3Bb.11231含有在Cry3Bb.11224(H231R)和Cry3Bb.11228(在1β1,α8发生变化)。表现在Cry3Bb.11231中的氨基酸变化的组合,导致抗SCRW幼虫的生物活性提高为大约超过野生型Cry3Bb的8倍(表2)。这一增加比单独的Cry3Bb.11224(5.0x)或Cry3Bb.11228(4.1x)所表现出来的都大。Cry3Bb.11231与野生型相比,抗WCRW幼虫的活性也表现出12.9倍的增加(表10)。5.16.2 Cry3Bb.11081
设计的Cry3Bb蛋白Cry3Bb.11081通过结合Cry3Bb.11032和Cry3Bb.11229(除了Y318C)所表现出来的变化来构建。Cry3Bb.11081比野生型Cry3Bb的活性增加6.1倍;其活性提高超过任一单独的母体蛋白,Cry3Bb.11032(3.1-倍)以及Cry3 Bb.11229(2.5-倍)。5.16.3 Cry3Bb.11083
设计的Cry3Bb蛋白Cry3Bb.11083是通过结合Cry3Bb.11036和Cry3Bb.11095所表现的变化来构建的。Cry3Bb.11083与野生型Cry3Bb相比,表现出抗SCRW幼虫的活性增加7.4倍;比Cry3Bb.11036(4.3x)或Cry3Bb.11095(4.6x)均大。Cry3Bb.11083与野生型Cry3Bb相比,也表现出抗WCRW幼虫的活性增加5.4倍(表10)。5.16.4 Cry3Bb.11084
设计的Cry3Bb蛋白Cry3Bb.11084是通过结合Cry3Bb.11032的变化和Cry3Bb.11228所表现的变化S311L来构建的。Cry3Bb.11084与野生型Cry3Bb相比,活性增加7.2倍;比Cry3Bb.11032(3.1x)或Cry3Bb.11228(4.1x)均大。5.16.5 Cry3Bb.11098
设计的Cry3Bb蛋白Cry3Bb.11098的构建是通过含有以下氨基酸变化:D165G、H231R、S311L、N313T、以及E317K。核苷酸序列如序列编号:107中给出,所编码的氨基酸序列如序列编号:108所给出。5.17 实施例17-设计方案11:对糖蛋白以及WCRW刷状缘膜的结合改变
虽然不知道Cry3Bb的受体的身份,但重要的是提高毒素与其受体的相互作用。一种提高毒素、受体相互作用(受体的身份已知)的方法是降低或排除对其它生物分子非生产性的结合。本发明者们已经观察到Cry3Bb非特异性地结合已经被许多种糖糖基化的牛血清蛋白(BSA),但不结合非糖基化的BSA。Cry3A,在Diabrotica种类中不活跃,显示出对糖基化的BSA相似甚至更强的结合。类似地,Cry3A相对与野生型的Cry3Bb,显示出对固定的WCRW刷状缘膜(BBM)更强的结合,意味着许多观察到的结合是非生产性的。据推论,对WCRW BBM幼虫非特异性结合的发生是通过使蛋白糖基化,以及在产生毒性的反映过程中,对糖基化的BSA和WCRW BBM的结合均是非生产性的。因此降低或消除这种结合可以导致对多产的受体增强以及毒性增强。对准潜在的糖类群结合位点进行重新设计,以降低Cry3Bb对糖蛋白以及固定的WCRW BBM的非特异性结合。5.17.1 Cry3Bb.60
Cry3Bb.60,其中Cry3Bb已经在1α3,4的R159被裂解,显示出对糖基化的BSA的结合降低,以及对固定的WCRW BBM的结合降低。Cry3Bb.60显示出相对于Cry3Bb的生物活性提高3.6倍。5.17.2 改变为1α3,4(Cry3Bb.11221)
已经在结构域1的1α3,4区对Cry3Bb.11221进行重新设计,Cry3Bb在结构域1被裂解以形成Cry3Bb.60。Cry3Bb.11221也显示出对糖基化的BSA和固定的WCRW BBM的结合降低,以及其生物活性超过野生型Cry3Bb的6.4倍。与Cry3Bb.60的数据(5.17.1节)一起,这些数据暗示该环区实质上促成了毒素的非生产性结合。5.17.3 改变为1β1,α8(Cry3Bb.11228、11230、11237以及11231)
Cry3Bb的1β1,α8区域已经被重新设计以提高水合作用(4.2.4节)和增加柔性(4.4.3节)。几种在该区域被改变的蛋白,Cry3Bb.11228、11230、和11237,展示出明显的对糖基化的BSA和固定的WCRW BBM较低水平的结合,同时也其生物活性相对于野生型的Cry3Bb增加4.1和4.5倍之间。5.17.4 结合活性
Cry3Bb和它的一些衍生物结合糖基化的BSA和WCRW BBM的倾向的确定是通过一种BIAcoreTM表面胞质团共振生物传感器来进行的。对于糖基化的BSA结合,使用标准的NHS化学作用将糖基化的蛋白固定在CM5芯片(BIAcore)上,将溶解的毒素注入糖基化的BSA表面上。为了测定对WCRW BBM的结合,将从WCRW的中肠中纯化出来(English等,1991)的刷状缘膜小囊泡(BBMV)固定在一个HPA芯片(BIAcore)上,然后用10mM KOH或40mM β-辛基葡萄糖方甙清洗。然后将溶解的毒素注入所得到的混合双分子层表面以检测结合。通过用蛋白质染色试剂分析Protein Dye Reagent assay*(BioRad)或BCA蛋白分析BCAProtein Assay*(Pierce)来确定蛋白的浓度。
也可以使用其它方法以确定相同结合的形成。这些包括,但不局限于,使用标记的毒素、标记的糖基化蛋白或抗毒素抗体进行的配基印迹实验,亲和层析,以及毒素在体外与完整BBMV的结合。5.18 实施例18-构建含有野生型Cry3Bb序列的质粒
标准的重组DNA操作实质上如Sambrook等(1989)所描述的进行。5.18.1 pEG1701
pEG1701(图11),包含EG11204和EG11037,其构建是通过将含有Cry3Bb基因的SphI-PstI片段和来自pEG911(Baum,1994)的ctyl F终止子插入到pEG854.9(Baum等,1996)(一种高拷贝数的苏云金芽胞杆菌-大肠杆菌穿梭载体)的SphI-PstI位点上。5.18.2 pEG1028
pEG1028含有来自pEG1701的Cry3Bb上的HindIII片段,该片段在HindIII被克隆到pTZ 18U的多克隆位点上。5.19 实施例19-含有变更的Cry3Bb基因的质粒的构建
来自大肠杆菌的质粒DNA的制备是通过碱性溶解方法(Maniatis等,1982),或者是通过商品化的质粒制备试剂盒(例子:PERFECTprepTMkit,5 Prime-3 Prime,Inc.,Boulder CO;QIAGEN plasmid prepkit,QIAGEN Inc.)。从
从在脑心浸液加上0.5%甘油(BHIG)中生长达到中央对数期的培养物中通过碱性溶解方法制备苏云金芽胞杆菌的质粒。当需要纯化时,在电泳之后从琼脂糖凝胶中切除DNA片段,然后使用一种Geneclean 11_试剂盒(BIO 101 Inc.,La Jolla,CA)通过玻璃*奶*复原。使用几种技术达到对Cry3Bb基因的改变,这些技术包括定位诱变、三重*PCRTM、拟随机的PCRTM诱变、DNA滑移和标准的重组技术。这些技术分别在6.1、6.2、6.3、6.4和6.5节中有描述。所使用引物的DNA序列列于7节。5.20 实施例20-定位诱变
定位诱变是由Kunkle(1985)和Kunkle等(1987)所建立的协议所指导的,在体外使用Muta-GeneTM M13诱变试剂盒(Bio-Rad,Richmond,CA)。通过使用Muta-GeneTM试剂盒和多个诱导突变的低聚核苷酸引物来达到结合Cry3Bb的变更。5.20.1 pEG1041
pEG1041,包含在EG11032中,其构建是通过使用Muta-GeneTM试剂盒、引物C、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.2 pEG1046
pEG1046,包含在EG11035中,其构建是通过使用Muta-GeneTM试剂盒、引物D、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.3 pEG1047
pEG1047,包含在EG11036中,的构建是通过使用Muta-GeneTM试剂盒、引物E、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.4 pEG1052
pEG1052,包含在EG11046中,的构建是通过使用Muta-GeneTM试剂盒、引物D和E、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3Bb DNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.5 pEG1054
pEG1054,包含在EG11048中,的构建是通过使用Muta-GeneTM试剂盒、引物F、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.20.6 pEG1057
pEG1057,包含在EG11051中,的构建是通过使用Muta-GeneTM试剂盒、引物G、以及单链的pEG1028作为DNA模板。所得到的改变的Cry3BbDNA序列作为一段PflMl DNA片段被切除,并被用来取代pEG1701中相应的DNA片段。5.21 实施例21-三重PCRTM
三重PCRTM是由Michael(1994)所描述的。该方法利用了一种热稳定连接酶,在PCRTM过程中,将磷酸化的诱变引物合并到一段扩增的DNA片段中。PCRTM在Perkin E1mer Cetus DNA Thermal Cycler(Perkin-Elmer,Norwalk,CT)中进行,使用一种AmpliTaqTM DNA聚合酶试剂盒(Perkin-Elmer)和SphI-线性化的pEG1701作为模板DNA。PCRTM的产物的清洗是通过使用化学试剂盒,如WizardTM PCRTMPreps(Promega,Madison,WI)和QlAquick PCRTM Purification kit(QIAGEN Inc.,Chatsworth,CA)。5.21.1 pEG1708和pEG1709
pEG1708和pEG1709,分别包含在EG11222和EG11223中,其构建是通过用另一个片段取代pEG1701中cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在cry3Bb核苷位点688-690(编码氨基酸Y230)上发生改变。通过三重PCRTM在Y230密码子上引入随机突变。诱变引物MVT095被磷酸化并与外来的引物对FW001和FW006一起使用。引物MVT095在687位也包括一个沉寂突变,T变为C,其在结合之后紧接着将一个附加的EcoRI位点引入pEG1701。5.21.2 pEG1710、pEG1711以及pEG1712
质粒pEG1710、pEG1711以及pEG1712,分别包含在EG11224、EG11225和EG11226中,其构建是通过用另一个片段取代pEG1701中cry3Bb基因上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点690-692(编码氨基酸H231)上发生改变。通过三重PCRTM在H231密码子上引入随机突变。诱变引物MVT097被磷酸化并与外来的引物对FW001和FW006一起使用。引物MVT097在687位也包括一个T变为C的序列改变,其在结合之后紧接着通过沉寂突变导致一个附加的EcoRI位点。5.21.3 pEG1713和pEG1727
pEG1713和pEG1727,分别包含在EG11217和EG11242中。其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点868-870(编码氨基酸R290)上发生改变。使用三重PCRTM在R290密码子上引入随机突变。设计诱变引物MVT091,以至核苷的替换可以导致大约36%的序列编码氨基酸D或E。MVT091被磷酸化并与外来的引物对FW001和FW006一起使用。5.22 实施例22-准随机PCRTM突变
准随机PCRM突变结合诱变的PCRTM技术是由Vallette等(1989)、Tomic等(1990)以及LaBean和Kauffman(1993)描述的。诱变引物,有时其长度超过70个核苷,被设计在编码一个完整的结构区域(如一个环)的核苷位置上引入变化。退化的密码子代表性地包括比率为82%的野生型核苷加上另外3种核苷,各为6%,在靶区域的每个位置上半随机地引入变化*(LaBean和Kauffman,1993)。当可能时,利用天然的限制性位点;当天然位点不适宜时,使用2s酶类(Stemmer和Morris,1992,列出对本技术有用的另外的限制酶)。PCRTM在一种Perkin ElmerCetus DNA Thermal Cycler(Perkin-Elmer,Norwalk,CT)中进行,使用一种AmpliTaqTM DNA聚合酶试剂盒(Perkin-Elmer)和SphI-线性化的pEG1701作为模板DNA。采用以下条件进行拟随机的PCRTM扩增:在94℃下变性1.5分钟,在50℃下退火2分钟,以及在72℃下延伸3分钟,循环30次。最后的14个延伸循环中每个循环加25秒延伸。底物浓度为20微升,或者对于长的诱变底物为40微升。使用如WizardTM PCRTMPreps(Promega,Madison,WI)和QlAquick PCRTM Purification kit(QIAGEN Inc.,Chatsworth,CA)的商品化的试剂盒来清洗PCRTM的产物。在一些实例中,PCRTM的产物在限制消化之前,用Klenow Fragment(Promega)依照厂家指导进行处理,填满任何单个碱基的突出部分。5.22.1 pEG1707
EG1707,包含在EG11221中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的Pf1MI-PflMI片段,前者为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点460-480(编码1α3,4的氨基酸154-160)上发生改变。引物MVT075,其包括2s类的限制酶BsaI的识别位点,以及引物FW006被用于通过拟随机诱变在该区域引入变化。引物MVT076,也含有一个BsaI位点,和引物FW001用于PCRTM扩增一段“连接”片段。在PCRTM扩增之后,两个产物均被清洗、末端填充、用BsaI消化并彼此连接。凝胶纯化连接的片段并使用引物对FW001和FW006将其作为PCRTM扩增的引物。将PCRTM产物进行清洗、末端填充、用PflMI消化、凝胶纯化及连接到经PflMI消化并纯化过的pEG1701载体DNA上。5.22.2 pEG1720和pEG1726
pEG1720和pEG1726,分别包含在EG11234和EG11241中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点859-885(编码1α7,8的氨基酸287-295)上发生改变。使用拟随机PCRTM诱变在该区域中引入变化。诱变引物MVT111,设计含有一个BsaI位点,以及引物FW006被用于引入变化。引物对MVT094,也含有BsaI位点,和FW001被用于扩增连接片段。将PCRTM产物用BsaI消化、凝胶纯化及彼此连接。将连接的产物使用引物对FW001和FW006进行PCRTM扩增,用PflMI消化。5.22.3 pEG1714、pEG1715、pEG1716、pEG1718、pEG1719、pEG1722、pEG1723、pEG1724以及pEG1725
pEG1714、pEG1715、pEG1716、pEG1718、pEG1719、pEG1722、pEG1723、pEG1724以及pEG1725,分别包含在EG11228、EG11229、EG11230、EG11232、EG11233、EG11236、EG11237、EG11238和EG11239中,其构建是通过用另一个片段取代pEG1701中Cry3Bb上的PflMI-PflMI片段,该片段为经PflMI消化并在凝胶上进行纯化的PCRTM片段,其在Cry3Bb核苷位点931-954(编码1β1,α8的氨基酸311-318)上发生改变。使用拟随机PCRTM诱变在该区域中引入变化,使用诱变引物MVT003和引物FW006。引物MVT003和FW006用来扩增一段连接片段。将PCRTM产物用Klenow和进行末端填充并用BamHI消化。将从FW001-FW006消化的较大片段进行凝胶纯化,然后与消化的MVT103-FW006片段连接。将连接的产物进行凝胶纯化,并通过使用引物FW001和FW006的PCRTM进行扩增。将扩增的产物用PflMI消化,并在连接到经PflMI消化并纯化的pEG1701载体DNA上之前进行凝胶纯化。5.22.4 pEG1701.Lβ2,3
带有cry3Bb野生型序列1051-1065位核苷(编码Cry3Bb的结构区域1β2,3)变体的质粒,其构建是通过用独立的MluI-和SpeI-消化的PCRTM产物取代pEG1701的MluI-SpeI片段。该PCRTM产物的产生是通过拟随机PCRTM诱变,其中诱变引物MVT081与FW006配对。这些质粒作为一个群体命名为pEG1701.1β2,3。5.22.5 pEG1701.Lβ6,7
含有cry3Bb野生型在1234-1248位核苷上的序列(编码Cry3Bb的结构区域1β6,7)变体的质粒,其构建是通过用独立的MluI-和SpeI-消化的PCRTM产物取代pEG1701的MluI-SpeI片段。该PCRTM产物的产生是通过拟随机PCRTM诱变,其中诱变引物MVT085与WD115配对。配对引物MVT089和WD112被用来扩增一段连接片段。两种PCRTM产物均被TaqI消化并相互连接。将连接的产物进行凝胶纯化,并通过使用配对引物MVT089和FW006的PCRTM进行扩增。将扩增的产物用MluI和SpeI进行消化,并连接到经MluI和SpeI消化并纯化的pEG1701载体DNA上。这些质粒作为一个群体命名为pEG1701.1β6,7。5.22.6 pEG1701.Lβ10,11
含有突变的cry3Bb 1450-1467位核苷上的序列(编码Cry3Bb的结构区域1β10,11)质粒,其构建是通过用分离的SpeI-和PstI消化的PCRTM产物取代pEG1701的SpeI-PstI片段。该PCRTM产物的产生是通过拟随机PCRTM诱变,其中诱变引物MVT105与引物MVT070配对。配对引物MVT092和MVT083被用来形成一段连接片段。(MVT083是一段为另一个区域设计的诱变低聚物。由MVT083引入的序列变化在限制消化之后被消除,不会影响cry3Bb在1β10,11区域的变化。)
两种PCRTM产物均被BsaI消化并与通过配对引物MVT083和MVT070进行的PCRTM扩增的连接产物相互连接。用SpeI和PstI消化所得到的PCRTM产物,以及对其进行凝胶纯化。这些质粒作为一个群体命名为pEG1701.1β10,11。5.23 实施例23-DNA滑移
DNA-滑移,如Stemmer(1994)所描述,被用于联合cry3Bb基因的个别变更。5.23.1 pEG1084、pEG1085、pEG1086以及pEG1087
pEG1084、pEG1085、pEG1086、以及pEG1087,分别包含在EG11081、EG11082、EG11083、以及EG11084中,从DNA滑移中恢复。简单地,PflMI DNA片段的产生是通过使用引物集合A和B以及pEG1707、pEG1714、pEG1715、pEG1716、pEG1041、pEG1046、pEG1047、和pEG1054各自的质粒作为DNA模板。将所得到的DNA片段以等质量汇聚,并用DNA酶I进行消化,通过三个成功的冻结融化循环将50-100bp的DNA片段从琼脂糖凝胶中回收出来:在干冰乙醇浴池中三分钟,接着在50℃下完全溶解。回收的DNA片段通过无引物的PCRTM和使用Stemmer(1994)描述的引物组合A和B的PCRTM-扩增进行组合。最后的PCRTM-扩增的DNA片段用PflMI切除并被用于取代pEG1701中相应的Cry3Bb PflMI DNA片段。5.24 实施例24-重组DNA技术
标准的重组DNA步骤大致根据Sambrook等(1989)的描述来进行。5.24.1 pEG1717
pEG1717包含于EG11231中,是通过把pEG1710中的小BglII片段替代为来源于pEG1714的小BglII片段来构建的。5.24.2 pEG1721
pEG1721包含于EG11235中,是通过把pEG1710中的小BglII片段替代为来源于pEG1087的小BglII片段来构建的。5.24.3 pEG1063
pEG1063包含于EG11057中,是通过把来源于pEG1054的含有ori43的NcoI DNA片段替代为来源于pEG1046的经过分离的含有ori 43以及在Cry3Bb中的变更的NcoI DNA片段来构建的。5.24.4 pEG1063
pEG1063包含于EG11058中,是通过把来源于pEG1054的含有ori43的NcoI DNA片段替代为来源于pEG1707的经过分离的含有ori 43以及在Cry3Bb中的变更的NcoI DNA片段来构建的。5.24.5 pEG1095
pEG1095包含于EG11095中,是通过把pEG1701中的MluI-SpeI DNA片段替代为来源于pEG1086的相应的MluI-SpeI DNA片段来构建的。5.25 实施例25--在构建Cry3Bb*变体的过程中使用的引物
以下所示的是在通过定点突变、三重PCRTM(triplex PCR)以及准随机PCRTM(quasi-random PCR)来获得cry3Bb*变体时所用的引物。引物得自Ransom Hill Bioscience,Inc.(Ramona,CA)以及Integrated DNA Technologies,Inc.(Coralville,IA)。在一个或多个残基上含有特定退化的引物的特定的组合物示于第5.30节,实施例30。5.25.1 引物FW001(序列编号:71):5’AGACAACTCI’ACAGTAAAAGATG-3’5.25.2 引物FW006(序列编号:72):5’-GGTAATTGGTCAATAGAATC-3’5.25.3 引物MVT095(序列编号:73):5’-CAGAAGATGTTGCTGAATTCNNNCATAGACAATTAAAAC-3’5.25.4 引物MVT097(序列编号:74):5’-GATGTTGCTGAATTCTATNNNAGACAATTAAAAC-3’5.25.5 引物MYT091(序列编号:75):5’-CCCATTTTATGATATTBDNTTATACTCAAAAGG-3’5.25.6 引物MVT075(序列编号:76):5’-GCTATGCTGGTCTCGGAAGAAAEFNFFNFJNJFJFJNFINJFJAAAAGAAGCCAAGATCGAAT-3’5.25.7 引物MVT076(序列编号:77):5’-GGTCACCTAGGTCTCTCTTCCAGGAATTTAACGCATTAAC-3’5.25.8 引物MVT111(序列编号:78):5’-AGCTATGCTGGTCTCCCATTTJEHIEJEJJEIIKRRJEHEIJEENIIIGTTAAAACAGAACTAAC-3’5.25.9 引物MVT094(序列编号:79):5’-ATCCAGTGGGGTCTCAAATGGGAAAAGTACAATTAG-’3’5.25.10 引物MVT103(序列编号:80):5’-CATTTTTACGGATCCAATTTTTJFFFJNEEJEFNFJNFEILEIJEOGGACCAACTTTTTTGAG-3’5.25.11 引物MVT081(序列编号:8”:5’-GAATTTCATACGCGTCTTCAACCTGGTJEHJJJIINMEEIEJTCTTTCAATTATTGGTCTGG-3’5.25.12 引物MVT085(序列编号:82):5’-AAAAGTTTATCGAACTATAGCTAATACAGACGTAGCGGCTJQQFFNEEJIIJEEIGTATATTTAGGTGTTACG-3’5.25.13 引物A(序列编号:83)3B2PFLM I:5’-GGAGTTCCATTTGCTGGGGC-3’5.25.14 引物B(序列编号:84)3B2PFLM2:5’-ATCTCCATAAAATGGGG-3’5.25.15 引物C(序列编号:85)3B2165DG:5’-GCGAAGTAAAAGAAGCCAAGGTCGAATAAGGG-3’5.25.16 引物D(序列编号:86)3B2160SKRD:5’-CCTTTAAGTTTGCGAAATCCACACAGCCAAGGTCGAATAAGGG-3’5.25.17 引物E(序列编号:87)3B2290VP:5’-CCCATTTTATGATGTTCGGTTATACCCAAAAGGGG-3’5.25.18 引物F(序列编号:88)3B2EDA104:5’-GGCCAAGTGAAGACCCATGGAAGGC-3’5.25.19 引物G(序列编号:89)3B2KG189:5’-GCAGTTTCCGGATTCGAAGTGC-3’5.25.20 引物WD112(序列编号:90):5’-CCGCTACGTCTGTATTA-3’5.25.21 引物WD115(序列编号:91):5’-ATAATGGAAGCACCTGA-3’5.25.22 引物MVT105(序列编号:92):5’-AGCTATGCTGGTCTCTTCTTAEJIFEIIEFFIJFIJIINACAATTCCATTTTTTACTTGG-3’5.25.23 引物MVT092(序列编号:93):5’-ATCCAGTTGGGTCTCTAAGAAACAAACCGCGTAATTAAGC-3’5.25.24 引物MVT070(序列编号:94):5’-CCTCAAGGGTTATAACATCC-3’5.25.25 引物MVT083(序列编号:95):5’-GTACAAAAGCTAAGCTTTIEJIINPEEMEEIJNJESCGAACTATAGCTAATACAG-3’5.26 实施例26--经过改变的cry3Bb基因的序列分析
有时候使用大肠杆菌DH5αTM(GIBCO BRL,Gaithersburg,MD),JM110以及SureTM(Stratagene,La Jolla,CA)细胞来扩增测序用的质粒DNA。根据生产商的步骤把质粒转化到这些细胞中。DNA序列是用购自U.S.Biochemical Corporation(Cleveland,Ohio)的Sequenase_2.0 DNA测序试剂盒测定的。表11列出了在第6节中所描述的质粒、它们各自与野生型cry3Bb序列的差异、所获得的氨基酸变化、以及变化的结构位置。
表11
cry3Bb*基因的DNA序列变化以及由此造成的Cry3Bb*蛋白的氨基酸替代质粒 cry3Bd*DNA序列 Cry3Bb*的氨基酸序列 改变的结构位置pEG1707 A460T,C461T,A462T,C464A,T465C,T466C,T467A, T154F,P155H,L156H,L158R 1α3,4
A468T,A469T,G470C,T472C,T473G,G474T,
A477T,A478T,G479CpEG1708 T687C,T688C,A689T,C691A,A692G Y230L,H231S α6pEG1709 T667C,T687C,T688A,A689G,C691A,A692G S223P,Y230S α6pEG1710 T687C,A692G H231R α6pEG1711 T687C,C691A H231N,T241S α6pEG1712 T687C,C691A,A692C,T693C H231T α6pEG1713 C868A,G869A,G870T R290N 1α7,β1pEG1714 C932T,A938C,T942G,G949A,T954C S311L,N313T,E317K 1β1,α8pEG1715 T931A,A933C,T942A,T945A,G949A,A953G, S311T,E317K,Y318C 1β1,α8
T954CpEG1716 T931G,A933C,C934G,T945G,C946T,A947G, S311A,L312V,Q316W 1β1,α8
G951A,T954C
表11(续)质粒 cry3Bb*DNA序列 Cry3Bb*的氨基酸序列 改变的结构位置pEG1717 T687C,A692α,C932T,A938C,T942G,G949A, H231R,S311L,N313T,E317K α6,1β1,α8
T954CpEG1718 T931A,A933G,T935C,T936A,A938C,T939C, S311T,L312P,N313T,E317N 1β1,α8
T942C,T945A,G951T,T954CpEG1719 T931G,A933C,T936G,T942C,C943T,T945A, S311A,Q316D 1β1,α8
C946G,G948C,T954CPEG1720 T861C,T866C,C868A,T871C,T872G,A875T, 1289T,L291R,Y292F,S293R 1α7,β1
T877A,C878G,A882GpEG1721 T687C,A692G,C932T H231R,S311L α6,1β1,α8pEG1722 T931A,C932T,A933C,T936C,T942G,T945A,T954C S3111 1β1,α8pEG1723 T931A,C932T,A933C,T936C,A937G,A938T, S3111,N313H 1β1,α8
C941A,T942C,T945A,C946A,A947T,A950T,
T954CpEG1724 A933C,T936C,A937G,A938T,C941A,T942C, N313V,T314N,Q316M,E317V 1β1,α8
T945A,C946A,A947T,A950T,T954C
表11(续)质粒 cry3Bb*DNA序列 Cry3Bb*的氨基酸序列 改变的结构位置pEG1725 A933T,A938G,T939G,T942A,T944C,T945A, N-313R,L315P,Q316L,E317A 1β1,α8
A947T,G948T,A950C,T954CpEG1726 A860T,T861C,G862A,C868T,G869T,T°71C, Y287F,D288N,R290L 1α7,β1
A873T,T877A,C878G,A879TpEG1727 C868G,G869T R290V 1α7,β1pEG1041 A494G D165G α4pEG1046 G479A,A481C,A482C,A484C,G485A, S160N,K161P,P162H,D165G α4
A486C,A494GpEG1047 A865G,T877C 1289V,S293P 1α7,β1pEG1052 G479A,A481C,A482C,A484C,G485A,A486C, S160N,K161P,P162H,D165G, α4,1α7,β1
A494G,A865G,T877C I289V,S293PpEG1054 T309A,Δ310,Δ311,Δ312 D103E,ΔA104 1α2a,2bpEG1057 A565G,A566G K189G 1α4,5pEG1062 T309A,Δ310,Δ311,Δ312,G479A,A481C,A482C, D103E,ΔA104,S160N,K161P, 1α2a,2bα4
A484C,G485A,A486C,A494G P162H,D165G
表11(续)质粒 cry3Bb*DNA序列 Cry3Bb*的氨基酸序列 改变的结构位置pEG1063 T309A,Δ310,Δ311,Δ312,A460T,C461T,A462T, D103E,ΔA104,T154F,P155H, 1α2a,2b1α3,4
C464A,T465C,T466C,T467A,A468T,A469T, L156H,L158R
G470C,T472C,T473G,G474T,A477T,A478T,
G479CpEG1084 A494G,T931A,A933C,T942A,T945A,G949A, D165G,S311T,E317K α4,1β1,α8
T954CpEG1085 A494G,A865G,T877C,T914C,T931G,A933C, D165G,I289V,S293P,F305S, α4,1α7,β1β1,1β1,α8
C934G,T945G,C946T,A947G,G951A,T954C, S311A,L312V,Q3 16W,Q348R, β2,β3b
A1043G,T1094C V365ApEG1086 A865G,T877C,A1043G I289V,S293P,Q348R 1α7,β1,β2pEG1087 A494G,C932T D165G,S311L α4,1β1,α8pEG1095 A1043G Q348R β25.27 实施例27--Cry3Bb*蛋白的表达5.27.1 培养条件
用标准配方制备LB琼脂(Maniatis等,1982)。淀粉琼脂得自DifcoLaboratories(Detroit,MI)并另外补充有5g/l的琼脂。C2液体培养基如Donovan等人所描述的(1988)。C2液体培养基有时候不含有磷酸缓冲液(C2-P)。所有的培养基均在25至30℃温育,同时给液体培养基振荡(150rpm)直到形成孢子并发生裂解。5.27.2 转化条件
通过Macaluso以及Mettus(1991)的电穿孔方法把pEG1701及其衍生物引入一种结晶晶体的(acrystalliferious*)的苏云金芽胞杆菌变种kurstaki EG7566(Baum,1994)或EG10368(美国专利5,322,687)中。在一些情形中对这种方法进行如下的修改以获得最大数量的转化体。让接受体苏云金芽胞杆菌菌株在30℃于LB琼脂过夜生长之后把它接种到加有0.5%甘油的心脑培养液中,生长到光密度值(600mm)大约为0.5,于冰上冷冻10分钟,用EB洗2次,然后重悬为1/50体积的EB。经过转化的细胞在LB琼脂或淀粉琼脂(加有5ug/ml的氯霉素)中筛选。通过视觉对菌落进行筛选以鉴定能够产生晶态蛋白的转化体;这些菌落通常都比不产生晶态蛋白的菌落更不透明。5.27.3 菌株和蛋白设计
把含有一个编码经过改变的Cry3Bb*蛋白的经过改变的cry3Bb*基因用一个“EG”号码标示,如EG11231。把经过改变的Cry3Bb*蛋白称为Cry3Bb再加上菌株号码,如Cry3Bb.11231。把在某一个结构位置有改变的蛋白的集合称为Cry3Bb再加上结构位点,如Cry3Bb.1β2,3。在表12中列出与本发明相关的质粒、含有这些质粒的新的苏云金芽胞杆菌菌株、所使用的生结晶体的苏云金芽胞杆菌接受者菌株、以及这些新菌株所生产的蛋白。5.28 实施例28--Cry3Bb-60的产生和性质鉴定5.28.1 Cry3Bb-60的产生
让生产Cry3Bb的菌株EG7231(美国专利5,187,091)在加有3mg/ml的氯霉素的C2培养基中生长。在产生孢子并发生裂解之后,把培养基用水清洗,用Cody等(1992)的NaBr增溶及重结晶方法纯化Cry3Bb蛋白。用BCA Protein Assay(Pierce,Rockford,IL)确定蛋白的浓度。把重结晶的蛋白每100mg溶解在10ml 50mM的KOH中,并用100mM的CAPS(3-[环己胺]-1-丙磺酸,pH9.0)把pH值缓冲在9.0。用胰蛋白酶处理可溶毒素,重量比为每50mg毒素用1mg的胰蛋白酶,在室温下作用20分钟至过夜。胰蛋白酶在蛋白中存在的精氨酸和赖氨酸残基的羧基端剪切蛋白。对于8剂量生物学鉴定法,稍微改变溶解的条件以增加蛋白的浓度:在12.77mg/ml的经过纯化的Cry3Bb*悬浮液中逐滴加入2.7ml的50mM的KOH直到晶体溶解。然后用100mM的CAPS(pH9.0)把体积调节到7ml。
表12
带有改变的cry3Bb*基因的质粒被转化到苏云金芽胞杆菌中
用于表达被改变的Cry3Bb*蛋白
质粒设计 |
新的BT菌株 |
表达的蛋白 |
pEG1701 |
EG11204 |
WT Cry3Bb |
pEG1701 |
EG11037 |
WT Cry3Bb |
pEG1707 |
EG11221 |
Cry3Bb.11221 |
pEG1708 |
EG11222 |
Cry3Bb.11222 |
pEG1709 |
EG11223 |
Cry3Bb.11223 |
pEG1710 |
EG11224 |
Cry3Bb.11224 |
pEG1711 |
EG11225 |
Cry3Bb.11225 |
pEG1712 |
EG11226 |
Cry3Bb.11226 |
pEG1713 |
EG11227 |
Cry3Bb.11227 |
pEG1714 |
EG11228 |
Cry3Bb.11228 |
pEG1715 |
EG11229 |
Cry3Bb.11229 |
pEG1716 |
EG11230 |
Cry3Bb.11230 |
pEG1717 |
EG11231 |
Cry3Bb.11231 |
pEG1718 |
EG11232 |
Cry3Bb.11232 |
pEG1719 |
EG11233 |
Cry3Bb.11233 |
pEG1720 |
EG11234 |
Cry3Bb.11234 |
pEG1721 |
EG11235 |
Cry3Bb.11235 |
pEG1722 |
EG11236 |
Cry3Bb.11236 |
pEG1723 |
EG11237 |
Cry3Bb.11237 |
表12(续)
pEG1724 |
EG11238 |
Cry3Bb.11238 |
pEG1725 |
EG11239 |
Cry3Bb.11239 |
pEG1726 |
EG11241 |
Cry3Bb.11241 |
pEG1727 |
EG11242 |
Cry3Bb.11242 |
pEG1041 |
EG11032 |
Cry3Bb.11032 |
pEG1046 |
EG11035 |
Cry3Bb.11035 |
pEG1047 |
EG11036 |
Cry3Bb.11036 |
pEG1052 |
EG11046 |
Cry3Bb.11046 |
pEG1054 |
EG11048 |
Cry3Bb.11048 |
pEG1057 |
EG11051 |
Cry3Bb.11051 |
pEG1062 |
EG11057 |
Cry3Bb.11057 |
pEG1063 |
EG11058 |
Cry3Bb.11058 |
pEG1084 |
EG11081 |
Cry3Bb.11081 |
pEG1085 |
EG11082 |
Cry3Bb.11082 |
pEG1086 |
EG11083 |
Cry3Bb.11083 |
pEG1087 |
EG11084 |
Cry3Bb.11084 |
pEG1095 |
EG11095 |
Cry3Bb.11095 |
pEG1098 |
EG11098 |
Cry3Bb.11098 |
pEG1701.1β2,3 |
未命名菌株的集合 |
Cry3Bb.1β2,3 |
pEG1701.1β6,7 |
未命名菌株的集合 |
Cry3Bb.1β6,7 |
pEG1701.1β10,11 |
未命名菌株的集合 |
Cry3Bb.1β10,11 |
5.28.2 Cry3Bb-60的分子量的确定
通过SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析,使用商业性的分子量标记来确定占主要的、胰蛋白酶降解的Cry3Bb片段的分子量。把降解的片段称为Cry3Bb-60。没有观察到这个60kD降解产物有发生进一步的降解。5.28.3 Cry3Bb-60的N-末端的确定
为了确定Cry3Bb-60的氨基端序列,通过SDS-PAGE分步收集胰蛋白酶的降解产物并在常规的western免疫印迹步骤之后把其转移到ImmoobilonTM-P膜(Millipore Corporation,Bedford,MA)上。转移之后,用水清洗膜2次,然后用0.025%的考马氏亮蓝R-250加40%甲醇染色5分钟。用剃须刃片切下Cry3Bb.60条带。在Tufts MedicalSchool,Department of Physiology(Boston,MA),使用标准的Edman降解步骤测定氨基端的序列。确定其氨基端的序列为SKRSQDR(序列编号:96),对应于Cry3Bb的第160-166位氨基酸。胰蛋白酶在氨基酸R159的羧基端产生降解,从而除去了螺旋1-3。5.29 实施例29--Cry3Bb*蛋白的生物活性5.29.1 培养条件和蛋白浓度的确定
用于1剂量生物学鉴定法的培养物在加有5ug/ml氯霉素的C2-P(C2-P/cm5)中生长,然后用3倍体积的0.005% Triton X-100_稀释。没有确定这些培养物的蛋白浓度。用于8剂量生物学鉴定法的培养物在C2/cm5中生长,用1-2倍体积的无菌水清洗1-2次并重悬于1/10体积的无菌的0.005% Triton X-100_中。根据Brussock以及Currier(1990)的方法确定每种浓缩液的毒素蛋白的浓度,其中省略了用3M的HEPES进行处理的步骤。用0.005% Triton X-100_把蛋白的浓度调节到3.2mg/ml以供最高剂量化验使用。用如9.1节中所述的方法生产并定量用于8剂量生物学鉴定法的Cry3Bb.60。5.29.2 昆虫的生物学鉴定法
根据Staney等(1992)的方法培养Diabrotica undecimpunctatahowardi Barber(南部谷物食根虫或SCRW)以及Diabroticavirgifera virgifiera LeConte(西部谷物食根虫或SCRW)幼虫。根据Slaney等(1992)的方法进行8剂量化验和probit*分析。每个剂量(50ul样品/食物的孔,表面积175mm2)试验32只幼虫。阳性对照是野生型的生产Cry3Bb的菌株EG 11037或EG 11204。所有的生物学鉴定法都是用128孔板进行的,每一孔中含有大约1ml的食物,盖有穿孔的聚脂薄膜(C-D International Inc.,Pitman,NJ)。1剂量的鉴定法以大致相同的方法进行,只是对每一菌株只进行一次剂量的试验。所有的试验至少重复2次。5.29.3 昆虫生物学鉴定法的结果:对抗SCRW的单剂量化验
把1-剂量化验的结果表达为试验菌株与野生型相比的相对死亡率(RM,实验培养物的死亡率(%)/野生型培养物的死亡率(%))。通过反复的对抗SCRW幼虫的1剂量化验可以把来源于通过PCRTM方法构建的质粒(在cry3Bb基因序列中引入随机或半随机变化)的改变的和改善的Cry3Bb蛋白与其它的改变了的但是没有改善的Cry3Bb蛋白区分开来。那些与野生型Cry3Bb比较(或者对于含有多个改变位点的蛋白,与“父代”的经过改变的Cry3Bb蛋白比较)活性提高的蛋白(定义为RM≥1.5),则通过8剂量化验进一步进行鉴定。由1-剂量化验的结果(来源于在一个单一的结构区域,如1β2,3,中含有随机或半随机改变的蛋白)产生的总体的RM“样式”可以被用于确定这些结构区域是否具有重要的生物学活性。野生型活性(RM~1)的保持表明改变在该区域得到了容忍。活性的全部丧失(RM<1)表明该区域对于生物学活性具有重要作用。5.29.4 Cry3Bb.1β2,3:对抗SCRW的单剂量化验的结果
Cry3Bb.1β2,3蛋白是一个在Cry3Bb的1β2,3区域(见5.3.4节)改变了的蛋白的集合。这些改变的蛋白的1-剂量化验的典型的结果示于图12中。Cry3Bb.1β2,3蛋白的RM值小于1,少数几个接近1,这表明这一区域对于毒性是很重要的。5.29.5 Cry3Bb.1β6,7:对抗SCRW的单剂量化验的结果
Cry3Bb.1β6,7蛋白是一个在Cry3Bb的1β6,7区域(见5.3.5节)改变了的蛋白的集合。这些改变的蛋白的1-剂量化验的典型的结果示于图13中。Cry3Bb。1β6,7蛋白的RM值除了少数几个接近1以外,其它的都小于1,这表明这一区域对于毒性是很重要的。5.29.6 Cry3Bb.1β10,11:对抗SCRW的单剂量化验的结果
Cry3Bb.1β10,11蛋白是一个在Cry3Bb的1β10,11区域(见5.3.6节)改变了的蛋白的集合。这些改变的蛋白的1-剂量化验的典型的结果示于图14中。Cry3Bb.1β10,11蛋白的RM值除了少数几个接近1以外,其它的都小于1,这表明这一区域对于生物活性是很重要的。5.29.7 昆虫生物学鉴定法结果:对抗SCRW的8-剂量化验的结果
8-剂量化验的结果表示为LC50值(导致50%死亡率的蛋白浓度),置信区间(confidence interval)为95%。显示对抗SCRW幼虫的活性提高的改变的Cry3Bb蛋白的置信区间为95%的LC50值以及同时确定的野生型Cry3Bb对照的LC50值在表13中列出,表13还列出了每种改善的蛋白相对野生型的活性的级数增加。
表13
用重复的8-剂量化验对被设计的Cry3Bb蛋白对抗SCRW幼虫的能力进行试验以确定LC50值
|
LC50 ug/孔(95%C.I.) | |
改善的蛋白 |
改善的蛋白 |
野生型Cry3Bb对照 |
相对野生型活性的级数增加 |
Cry3Bb.60 |
6.7(5.3-8.4) |
24.1(15-39) |
3.6x |
Cry3Bb.11221 |
3.2(2.5-4) |
20.5(14.5-29) |
6.4x |
Cry3Bb.11222 |
7.3(6-9) |
29.4(23-37) |
4.0x |
Cry3Bb.11223 |
10.5(9-12) |
29.4(23-37) |
2.8x |
Cry3Bb.11224 |
6.5(5.1-9.2) |
32.5(25-43) |
5.0x |
Cry3Bb.11225 |
13.7(11-16.8) |
49.5(39-65) |
3.6x |
Cry3Bb.11226 |
16.7(10.6-24.2) |
49.5(39-65) |
3.0x |
Cry3Bb.11227 |
11.1(9.1-13.5) |
21.3(16-28) |
1.9x |
Cry3Bb.11228 |
8.0(6.6-9.8) |
32.9(25-45) |
4.1x |
Cry3Bb.11229 |
7.2(5.8-8.8) |
18.2(15-22) |
2.5x |
Cry3Bb.11230 |
7.0(5.8-8.6) |
32.9(25-45) |
4.7x |
Cry3Bb.11331 |
3.3(3.0-3.7) |
26.1(22-31) |
7.9x |
Cry3Bb.11132 |
6.4(5.4-7.7) |
32.9(25-45) |
5.1x |
Cry3Bb.11233 |
15.7(12-20) |
32.9(25-45) |
3.2x |
Cry3Bb.11234 |
7(6-9) |
29(22-39) |
4.1x |
Cry3Bb.11235 |
4.2(3.6-4.9) |
13.3(10-17) |
3.2x |
Cry3Bb.11236 |
11.6(9-15) |
36.4(27-49) |
3.1x |
Cry3Bb.11237 |
6.8(4-11) |
36.4(2749) |
5.4x |
Cry3Bb.11238 |
13.9(11-17) |
36.4(27-49) |
2.6x |
Cry3Bb.11239 |
13.0(10-16) |
36.4(27-49) |
2.8x |
Cry3Bb.11241 |
11(7-16) |
29(22-39) |
2.6x |
Cry3Bb.11242 |
11.9(9.2-16) |
30(23-38) |
2.5x |
Cry3Bb.11032 |
4.2(3.6-4.9) |
13.3(10-17) |
3.1x |
表13(续)
Cry3Bb.11035 |
10.3(8-13) |
27.9(23-34) |
2.7x |
Cry3Bb.11036 |
6.5(5.1-7.9) |
27.9(23-34) |
4.3X |
Cry3Bb.11046 |
12.1(8-19) |
31.2(25-39) |
2.6x |
Cry3Bb.11048 |
8.3(6-11) |
35.4(24-53) |
4.3x |
Cry3Bb.11051 |
11.8(8-16) |
35.4(24-53) |
3.0x |
Cry3Bb.11057 |
8.8(7-11) |
29.5(24-36) |
3.4x |
Cry3Bb.11058 |
9.6(6-14) |
33.4(27-43) |
3.5x |
Cry3Bb.11081 |
8.5(7-11) |
51.5(37-79) |
6.1x |
Cry3Bb.11082 |
10.6(8-13) |
51.5(37-79) |
4.9x |
Cry3Bb.11083 |
7.0(5-10) |
51.5(37-79) |
7.4x |
Cry3Bb.11084 |
7.2(4-12) |
51.5(37-79) |
7.2x |
Cry3Bb.11095 |
11.1(9-14) |
51.5(37-79) |
4.6x |
Cry3Bb.11098 | | | |
5.29.8 昆虫生物学鉴定法的结果:对抗WCRW的8-剂量化验
WCRW幼虫非常细小,不容易处理。因此在8-剂量化验中,只有对一些显示对抗SCRW幼虫的活性有改善的设计的Cry3Bb试验了其对抗WCRW幼虫的活性。在表14中示出了设计的Cry3Bb蛋白的LC50值以及同时确定的野生型Cry3Bb对照的LC50值
表14
对抗SCRW幼虫的活力改善了的Cry3Bb蛋白其对抗WCRW幼虫的活力同时也改善了
|
LC50 ug/孔(95% C.I.) | |
改善的蛋白 |
改善的蛋白 |
Cry3Bb野生型对照 |
相对野生型活性的级数增加 |
EG11083 |
6.3(4.7-8.2) |
63.5(46-91) |
10.1x |
EG11230 |
24.2(13-40) |
4.5(2.1-7.4) |
5.4x |
EG11231 |
32.2(14-67) |
2.5(1.7-3.6) |
12.9x |
5.30 实施例30-通道的活性
用Slatin等(1990)描述的方法测量了由Cry3Bb以及它的一些衍生物产生的离子通道。在一些情况中,脂双层是用磷脂酰乙醇胺(PE)∶磷脂酰胆碱(PC)4∶1的混合物制备的。毒素蛋白是用12mM KOH从经过清洗的C2培养基中的苏云金芽胞杆菌培养物溶解的。离心除去孢子和其它的碎片,把10ug的溶解的毒素蛋白加入到膜小室的cis小室(4.5ml)中。用BCA Protein Assay(Pierce)确定蛋白的浓度。5.30.1 野生型Cry3Bb的通道活性
当暴露于黑脂膜时,Cry3Bb形成了导率状态各不相同的离子通道。由Cry3Bb形成的通道很少是不连续的通道,它们开启和关闭状态界限分明,通常需要把毒素与膜一起温育30-45分钟才能观察到类似于通道的事件。在形成初始的导率之后,尺寸在2小时内从大约200pS增加到大约10,000pS。只有那些小的导率(≤200pS)是电压依赖性的。在200pS以上,导率是完全均衡的。Cry3Bb通道同时还表现出依赖于β-巯基乙醇的激活,在膜小室的cis小室中加入β-巯基乙醇2分钟之后从大约为200pS的小的导率生长到几千pS。5.30.2Cry3Bb.11032
当增溶的毒素蛋白被加入到膜小室的cis小室中时,Cry3Bb.11032的通道活性更象野生型的Cry3Bb。然而,当通过在有Cry3Bb.11032蛋白存在的情况下形成或“绘制”膜时,把该蛋白人工地结合到膜中时,可以观察到通道的初始导率增加了16倍(~4000pS)。这一现象在野生型的Cry3Bb中没有观察到。5.30.3 Cry3Bb.11035
当暴露于人工膜时,Cry3Bb.11035蛋白自发地形成通道,这些通道在相对较短的时间内(~5分钟)生长为大的导率。导率介于3000-6000pS之间,而且类似于野生型的Cry3Bb,在低导率值时是电压依赖性的。5.30.4 Cry3Bb.11048
Cry3Bb.11048蛋白并不形成通道,但却形成均匀的孢子(相对电压而言),就这一点而言,它与野生型Cry3Bb很不一样。一旦形成孢子,它仍保持开启并允许一个稳定的导率(介于25-130pS之间)。5.30.5 Cry3Bb.11224以及Cry3Bb.11226
在Cry3Bb.11224和Cry3Bb.11226蛋白中,由H231形成的野生型Cry3Bb的金属结合位置在二体结构中被除去。由两种设计的蛋白所形成的导率与野生型Cry3Bb的是一样的,只是两种设计的蛋白都不具有依赖于β-巯基乙醇的激活。5.30.6 Cry3Bb.11221
已经发现Cry3Bb.11221蛋白可以迅速地形成100-200pS的小的通道,它的电压依赖性有限。在负电位观察到更高的导率。在其它研究中,活性的产生被延迟27分钟,这在野生型Cry3Bb中更为典型。然而,不同于野生型Cry3Bb的是,Cry3Bb.11221形成了高分辨的、600pS的通道,通道的开启状态很长。该蛋白最终达到7000pS的导率。5.30.7 Cry3Bb.11242
Cry3Bb.11242蛋白在暴露于人工膜之后立即形成小的导率。导率在大约3分钟内稳定、迅速地生长到6000pS。观察到一些电压依赖性,特别偏爱反向电位。5.30.8 Cry3Bb.11230
不同于野生型Cry3Bb,Cry3Bb.11230形成界限分明的通道,它的开启状态长,而且其导率不随时间生长。观测到的最大的导率达到3000pS。图15图解了由Cry3Bb和Cry3Bb.11230所形成的通道的区别。5.30.9 Cry3Bb.60
Cry3Bb.60在暴露于人工膜20分钟内形成界限分明的通道。这些通道的导率和频率随着时间生长。Cry3Bb.60在平面脂双层中的行为在两方面不同于Cry3Bb。Cry3Bb.60所创造的导率形成得比Cry3Bb更为迅速,而且不同于Cry3Bb的是,这个导率是稳定的,具有稳定的离子通道典型的界限分明的开启和关闭状态(图16)。5.31 实施例31--引物组合物
表15
序列编号:83 |
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
N |
25 |
25 |
25 |
25 |
表16
序列编号:84 |
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
N |
25 |
25 |
25 |
25 |
表17
序列编号:85 |
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
B |
16 |
16 |
52 |
16 |
D |
70 |
10 |
10 |
10 |
N |
25 |
25 |
25 |
25 |
表18
序列编号:86 |
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
E |
82 |
6 |
6 |
6 |
F |
6 |
6 |
6 |
82 |
J |
6 |
82 |
6 |
6 |
I |
6 |
6 |
82 |
6 |
N |
25 |
25 |
25 |
25 |
表19
序列编号:88 |
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
J |
6 |
82 |
6 |
6 |
E |
82 |
6 |
6 |
6 |
H |
1 |
1 |
1 |
97 |
I |
6 |
6 |
82 |
6 |
K |
15 |
15 |
15 |
55 |
R |
15 |
55 |
15 |
15 |
表20
序列编号:90 |
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
J |
6 |
82 |
6 |
6 |
F |
6 |
6 |
6 |
82 |
N |
25 |
25 |
25 |
25 |
E |
82 |
6 |
6 |
6 |
I |
6 |
6 |
82 |
6 |
L |
8 |
1 |
83 |
8 |
O |
1 |
1 |
1 |
97 |
表21
序列编号:91 |
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
J |
6 |
82 |
6 |
6 |
E |
82 |
6 |
6 |
6 |
H |
1 |
1 |
1 |
97 |
I |
6 |
6 |
82 |
6 |
N |
25 |
25 |
25 |
25 |
M |
82 |
2 |
8 |
8 |
表22
序列编号:92
|
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
J |
6 |
82 |
6 |
6 |
Q |
0 |
9 |
82 |
9 |
F |
6 |
6 |
6 |
82 |
N |
25 |
25 |
25 |
25 |
E |
82 |
6 |
6 |
6 |
I |
6 |
6 |
82 |
6 |
表23
序列编号:92
|
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
J |
6 |
82 |
6 |
6 |
F |
6 |
6 |
6 |
82 |
N |
25 |
25 |
25 |
25 |
E |
82 |
6 |
6 |
6 |
I |
6 |
6 |
82 |
6 |
表24
序列编号:95
|
核苷混合物的百分比(%) |
密码 |
A |
T |
G |
C |
J |
6 |
82 |
6 |
6 |
E |
82 |
6 |
6 |
6 |
H |
1 |
1 |
1 |
97 |
I |
6 |
6 |
82 |
6 |
K |
15 |
15 |
15 |
55 |
R |
15 |
55 |
15 |
15 |
5.32 实施例32--Cry3Bb的原子坐标
Cry3Bb蛋白的原子坐标在9.1节的附录中给出。5.33 实施例33--Cry3A的原子坐标
Cry3A蛋白的原子坐标在9.2节的附录中给出。5.34 实施例34-修饰Cry基因以便在植物中表达
已知野生型的cry基因(全长或截短的)在植物中表达很差。典型地,cry基因中的G+C含量少(37%)而且通常含有许多富含A+T的区域、潜在的多聚腺苷酰化作用位点和许多ATTTA序列。表25示出了潜在的腺苷酰化作用的序列清单,这些序列在制备“植物化”基因构建物时可以被避免。
表25
潜在的多聚腺苷酰化信号的序列清单
AATAAA* AAGCAT
AATAAT* ATTAAT
AACCAA ATACAT
ATATAA AAAATA
AATCAA ATTAAA**
ATACTA AATTAA**
ATAAAA AATACA**
ATGAAA CATAAA**
*表示一个潜在的主要植物多聚腺苷酰化作用位点。
**表示一个潜在的次要的动物多聚腺苷酰化作用位点。
所有其它的表示的是潜在的次要的植物多聚腺苷酰化作用位点。
突变区域可以如下进行选择。鉴定cry基因的DNA序列中的含有5个以上连续的A或T碱基对的所有区域。根据它们的长度和在多于20-30碱基对区域的周围序列中A+T百分最高含量情况排出次序。对DNA进行分析以确定那些可能含有多聚腺苷酰化作用位置或ATTTA序列的区域。然后设计一些低聚核苷酸,使其最大可能地消除含有多聚腺苷酰化作用位点或ATTTA序列的A+T连续区域。根据已发表的报道,有两个植物多聚腺苷酰化作用位点显示出具有更重要的作用。选择可以增加G+C含量、但是不产生适合那些对克隆和经过修饰的基因的组装有用的酶(如BamHI,BglII,SacI,NcoI,EcoRV等)的限制性酶切位点的密码子。类似地,避免使用含有两个碱基TA或GC的密码子,据报道它们是在植物中不频繁出现的密码子。
虽然CaMV35S启动子在大多数植物组织中通常是一个高度组成型的启动子,但是由CaMV35S启动子启动的基因表达的水平在花组织中比在叶组织中所观察到的要低。因为给一些昆虫损害的具有经济重要性的目标是花部分或来源于花部分;如cotton square和棉铃、烟草花蕾、番茄花蕾和果实,所以增加晶体蛋白在这些组织中的表达(较之于由CaMV35S启动子所获得的表达)通常是有利的。
玄参花叶病毒(FMV)的35S启动子是CaMV35S启动子的类似物。这一启动子已经被分离出来并设计在一个植物转化载体中。与CAMV启动子相比,FMV 35S启动子在花组织中高度表达,同时在其它的组织,如叶子,中也提供了类似的高水平的基因表达。可以设计一个植物转化载体,在这个载体中全部长度的cry基因由FMV 35S启动子来启动。烟草植株可以用这一载体进行转化,并用Western印迹或ELISA免疫测定法来比较晶体蛋白在叶和花组织中的表达情况。FMV启动子已经被用于在花组织中生产相对高水平的晶体蛋白(相对于CAMV启动子)。5.35 实施例35-合成的cry基因和ssRUBISCO启动子以及叶绿体转运肽的表达
植物中编码RUBISCO小亚基(SSU)的基因通常是高效表达的,它是由光调控的,有时候显示组织特异性。这些表达特性很大程度上是由这些基因的启动子序列造成的。已经可以用SSU启动子在经过转化的植物中表达异源的基因。典型地,一种植物会含有多个SSU基因,而且对于不同的SSU基因,其表达的水平和组织特异性是不同的。SSU蛋白在核中编码,在细胞质中以前体的形式合成,该前体含有一个被称为叶绿体转运肽(CTP)的N末端延伸。CTP引导前体进入叶绿体并促进SSU蛋白被摄取进入叶绿体。在这个过程中,CTP被从SSU蛋白中剪切下来。这些CTP序列已经被用于引导异源代表进入经过转化的植物的叶绿体。
SSU启动子由有许多在植物中表达异源基因的优点。有一些SSU启动子是高效表达的,其表达的水平与CAMV 35S的一样高,甚至更高。SSU启动子表达的组织分布与CAMV 35S启动子的有所不同,所以当要控制一些害虫时,可以有利地把晶体蛋白的表达指向那些SSU得到最高效表达的细胞。例如,虽然CAMV 35S启动子是相对具构成性的,但是在叶子中,它在导管组织中的表达效率比在叶子的其它部位中的都要高,而大部分SSU启动子在叶子的叶肉细胞中有最高效的表达。一些SSU启动子也是更具有组织特异性。所以可以利用一个特定的SSU启动子来仅仅在一个植物组织的子集中表达本发明中的蛋白,如果例如发现这一蛋白在某种特定的细胞中的表达对这些细胞是有害的。例如,为了控制马铃薯中的科罗拉多薯虫,有利地可以使用SSU启动子来把晶体蛋白的表达指向叶子,而不是指向可以食用的块茎。
使用SSU CTP序列把晶体蛋白定位到叶绿体中可能是有利的。把苏云金芽胞杆菌晶体蛋白定位到叶绿体可以可以保护这些叶绿体不受那些发现于细胞质中的蛋白水解酶的作用。这可以稳定蛋白并导致活性毒素的高水平聚集。Cry基因可以与SSU启动子或其它的启动子(如CAMV 35S)结合使用。5.36 实施例36-用信号肽把Cry*蛋白导向细胞外空间或液泡
此处所描述的用合成基因生产的苏云金芽胞杆菌蛋白被定位到植物细胞的细胞质中,这一细胞质定位导致植物具有杀虫效力。为了某种目的,把苏云金芽胞杆菌蛋白指向植物细胞的其它隔室是有利的。把苏云金芽胞杆菌蛋白定位于细胞质以外的其它隔室将导致苏云金芽胞杆菌蛋白更少暴露于细胞质蛋白水解酶,从而使得蛋白更多地积累,使杀虫活性增强。细胞外定位会导致某些昆虫更有效地暴露于苏云金芽胞杆菌蛋白中,从而使效力更高。如果发现苏云金芽胞杆菌蛋白对植物细胞功能有害,那么把它定位到一个非细胞质隔室就可以保护这些细胞免受这些蛋白的破坏。
在植物和其它的真核生物中,注定要定位于细胞外或几个特定的隔室中的蛋白典型地都被合成带有一个称为信号肽的N末端氨基酸区段。这一信号肽引导蛋白进入隔室化途径(compartmentalizationpathway),而且典型地在隔室化的一个早期步骤中即被从成熟的蛋白中剪切下来。对于一个细胞外蛋白而言,分泌途径典型地包括共转录插入到内质网中,此时信号肽被剪切。接着成熟的蛋白通过高尔基体进入与质膜融合在一起的小泡,从而把蛋白释放进入细胞外空间。定位到其它隔室的蛋白也遵从类似的途径。例如,定位于内质网或高尔基体的蛋白遵从这一方案,但是它们特定地保留在合适的隔室中。在植物中,有一些蛋白也定位到液泡中,液泡是存在于许多植物细胞的细胞质中的另外一个结合于膜上的隔室。定位于液泡的蛋白在高尔基体处与上述的途径分叉开来,在高尔基体,它们进入与液泡融合在一起的小泡中。
蛋白定位的一个共同的特征是启动隔室化过程的信号肽。在许多情形中,把信号肽融合到蛋白中将导致该蛋白定位到内质网。这一步骤的效率同时也将取决于成熟蛋白本身的序列。把一个蛋白引入一个特定的隔室,而不是引入细胞外空间的信号没有很清楚的定义。看起来许多引导蛋白到达特定隔室的信号是包含于成熟蛋白的氨基酸序列中的。一些定位于液泡的蛋白就是这样的,但是仍无法精确地定义这些序列。看起来分泌到细胞外空间是那些含有一个信号序列而不是区分信号的蛋白的“缺省”途径。因此,把苏云金芽胞杆菌蛋白导出细胞质的一个策略是把合成的苏云金芽胞杆菌基因融合到编码已知植物信号肽的DNA序列中。这些融合基因将产生进入分泌途径的苏云金芽胞杆菌蛋白,并导致细胞外分泌或定位到液泡或其它的隔室。
几种植物基因的信号肽已经被描述。其中的一个序列是针对烟草致病相关蛋白PR 1b,这个蛋白已经被描述(Comelissen等,1986)。PR 1b蛋白正常是定位于细胞外空间的。另外一种类型的信号肽包含于豆类的种子储存蛋白中。这些蛋白定位于种子的蛋白体中,蛋白体是一种存在于种子中的类似于液泡的隔室。刀豆(Phaseolitsvulgaris)7S储存蛋白的β亚基的一个信号肽DNA序列-PuvB-已经被描述(Doyle等,1986)。根据这些发表的序列可以用编码PR1b和PuvB的信号肽的低聚核苷酸来化学合成基因。在一些希望分泌或隔室化异源蛋白的情形中,必需包括在信号肽正常剪切位点之外的一些氨基酸序列。这是确保信号肽能被正确剪切所必需的。5.37 实施例37-用Cry3Bb变体分离Diabrotica种类抗性的转基因玉米5.37.1 植物基因构建
以双链DNA的形式存在的植物基因的表达包括信使RNA(mRNA)用RNA聚合酶从一条DNA链进行转录,以及随后mRNA的初始转录产物在核中的加工。这一加工过程包括一个3’端没有被转录的区域,它给RNA的3’端添加了多聚腺苷酸。DNA转录为mRNA是由一个通常被称为“启动子“的DNA区域调控的。启动子区域含有一个碱基序列,它给RNA聚合酶发送信号让其与DNA联合并启动mRNA转录,用其中的一条DNA链作为模板制造一条相应的RNA链。
已有文献报道了一些在植物细胞中有活性的启动子。这些启动子可以从植物或植物病毒中获得,包括但不局限于胭脂碱合酶(NOS)以及章鱼碱合酶(OCS)启动子(它们带有Agrobacteriumtumefaciens的诱导肿瘤的质粒)、花椰菜花叶病毒(CAMV)19S和35S启动子、来源于核酮糖1,5-二磷酸羟化酶小亚基((ssRUBISCO,一种丰富的植物多肽)的光诱导启动子、以及玄参花叶病毒(FMV)35S启动子。所有这些启动子已经被用于创造不同类型的DNA构建物,这些构建物已经在植物中表达(见,例如美国专利No.5,463,175,该专利被特定地作为参照结合于此文中)。
所选择的特定的启动子应是能够导致编码酶的序列充分表达以生产有效数量的蛋白。优选的一套启动子是组成型的启动子,如能够在大部分植物器官中高水平表达的CaMV 35S或FMV 35S启动子(美国专利No.5,378,619,该专利被特定地作为参照结合于此文中)。另外一套优选的启动子是根增强的或特异的启动子,如来源于CAMV的4as-1启动子或小麦POX1启动子(美国专利No.5,023,179,该专利被特定地作为参照结合于此文中;Hertig等,1991)。根增强的或特异的启动子对于控制转基因谷物中的谷物食根虫(Diabrolicus种类)是特别优选的。
在本发明的DNA构建物(即嵌合植物基因)中所使用的启动子如果需要,可以被修饰以影响它们的控制特征。例如,CaMV 35S启动子可以被连接到ssRUBISCO基因中在无光时抑制ssRUBISCO表达的那一部分上,以创造一个在叶子上有活性而在根上无活性的启动子。如此获得的嵌合体启动子可以被如此处所述进行使用。在本发明的描述中,短语“CaMV 35S”启动子因此包括CaMV 35S启动子的变体,如通过与启动子区域连接、随机或受控突变等而获得的启动子。进而,这些启动子可以被改变以含有多个“增强子序列”来协助提高基因的表达。
由本发明的DNA构建物产生的RNA也含有一个5’端非翻译引导序列。这一序列可以来源于被选择来表达基因的启动子,而且可以被特定地进行修饰以便增加mRNA的翻译。5’端非翻译区域可以得自病毒RNA、合适得真核细胞基因、或者合成的基因序列。本发明并不局限于那些非翻译区域是来源于伴随着启动子序列的5’端非翻译序列的构建物。
为了优化在单子叶植物(如玉米)中的表达,必需在DNA表达构建物中包括一个内含子。这一内含子必需典型地被设置于靠近mRNA 5’端非翻译序列中。这一内含子可以得自(但不局限于)含有玉米hps70的一套内含子(美国专利No.5,424,412;该专利被特定地作为参照结合于此文中)或稻谷Act1内含子(McElroy等,1990)。如下所示,玉米hps70内含子在本发明中是有用的。
如上所注释的,本发明的嵌合植物基因中非翻译区域含有一个多聚腺苷酰化作用信号,这个信号在植物中的功能是导致在RNA的3’端添加腺苷酸。优选的3’区的例子有:(1)含有致瘤农杆菌(Ti)的质粒基因(如胭脂碱合酶(NOS)基因)的多聚腺苷酰化作用信号的3’端转录、非翻译区域;以及(2)植物基因,如豌豆ssRUBISCO E9基因(Fischhoff等,1987)。5.37.2 植物转化和表达
含有本发明结构编码序列的嵌合植物基因可以被以合适的方法插入到植物的基因组中。合适的植物转化载体包括那些来源于Agrobacteritim lumefaciens Ti质粒的载体,以及那些由,例如Herrera-Estrella(1983)、Bevan(1983)、Klee(1985)以及欧洲专利申请出版No.EP0120516所公开的载体。除了来源于农杆菌Ti或根诱导(Ri)质粒的植物转化载体以外,可以用可选的方法把本发明的DNA构建物插入到植物细胞中。这类方法可以包括,例如使用脂质体、电穿孔、增加游离DNA摄取的化学剂、通过微粒抛射轰击游离传递DNA、以及使用病毒或花粉进行转化(Fromm等,1986;Armstrong等,1990;Fromm等,1990)。5.37.3 构建用于cry3Bb变体的单子叶植物表达载体5.37.3.1 设计用于植物表达的Cry3Bb基因变体
为了有效地在转基因植物中表达cry3Bb变体,那些编码变体的基因必需含有合适的序列组合物(Diehn等,1996)。这类序列的一个例子是v11231基因(序列编号:99),它编码具有Diabrotica活性的Cry3Bb 11231变体蛋白(序列编号:100)。这一基因是通过cry3Bb合成基因(序列编号:101)的突变(Kunkel,1985)获得的,上述的cry3Bb合成基因所编码的蛋白与天然cry3Bb基因(GenBank访问号码m89794,序列编号:102)所编码的蛋白是同源的。下列的多聚核苷酸被用于突变初始的cry3Bb合成基因(序列编号:101)以创造v11231基因((序列编号:99)。低聚#1:
5’-TAGGCCTCCATCCATGGCAAACCCTAACAATC-3’(序列编号:103)低聚#2:
5’-TCCCATCTTCCTACTTACGACCCTGCAGAAATACGGTCCAAC-3’(序列编号:104)低聚#3:
5’-GACCTCACCTACCAAACATTCGATCTTG-3’(序列编号:105)低聚#4:
5’-CGAGTTCTACCGTAGGCAGCTCAAG-3’(序列编号:106)5.37.3.2 构建Cry3Bb单子叶植物表达载体
为了把cry3Bb变体基因v11231放置在一个适合在单子叶植物中表达的载体中(即接受经过增强的花椰菜花叶病毒35S启动子的控制并连接到hsp70内含子上,再接一个胭脂碱合成酶多聚腺苷酰化作用位点,如美国专利No.5,424,412中所述,该专利被特定地作为参照结合于此文中),用NcoI和EcoRI酶解载体pMON19469。电泳分离、纯化大约为4.6kb的的较大的载体条带并把它用T4 DNA合成酶连接到含有v11231基因(序列编号:99)的大约为2kb的NcoI-EcoRI片段上。把连接混合物转化到大肠杆菌中,回收具有羧苄青霉素抗性的菌落并用DNA miniprep步骤回收质粒DNA。用例如NcoI和EcoRI(同时)、NotI、以及PstI对这一DNA进行限制性内切酶分析以鉴定含有pMON33708的菌落,pMON33708是通过v11231编码序列在经过增强的CaMV35S启动子的控制下融合到hsp70内含子中获得的。
为了把v11231设置在一个适于回收经过稳定转化的抗虫植物的载体中,通过电泳和纯化把来源于pMON33708的含有赖氨酸氧化酶编码序列(后者在经过增强的CaMV35S启动子的控制下融合到hsp70内含子中)分离出来。把这一片段连接到经过NotI以及小牛肠碱性磷酸酶处理的pMON30460中,其中pMON30460含有受控于CAMV 35S启动子的新霉素磷酸转移酶编码基因。通过把这一转化混合物转化到大肠杆菌中来获得卡那霉素抗性菌落,通过对质粒miniprep DNA进行限制性内切酶酶解来鉴定含有pMON33710的菌落。可以用限制性内切酶,如NotI、EcoRV、HindIII、ArcoI、EcoRI、以及BglII来鉴定在pMON30460的NotI位点含有pMON33708的NotI片段的合适的菌落(即PMON33710),其取向是使得两个基因是前后相连的(即v11231表达盒的3’端连接到nptII表达盒的5’端)。在谷物原生质体中pMON33710对v11231蛋白的表达可以通过以电穿孔的方法把pMON33710 DNA导入原生质体中然后再进行蛋白印迹和ELISA分析来得以验证。这一载体可以通过基因枪轰击导入谷物胚胎的基因组DNA中,然后再通过巴龙霉素选择来获得表达v11231基因的谷物,如美国专利No.5,424,412所述,该专利被特定地作为参照结合于此文中)。
在一个实施例中,通过共同轰击把载体和潮霉素抗性赋予质粒一起引入玉米未成熟的胚胎角质鳞片(immature embryo scutella,IES)中,然后用潮霉素进行选择和再生。用ELISA分析来鉴定表达v11231蛋白的转基因玉米株系。随后测试这些事件所获得的子代种子抵抗Diabrotica喂食的效果。5.37.3.3 Cry3Bb.11231在植物中的表现
在幼苗和10英尺盆鉴定法同时测验表达Cry3Bb.11231蛋白的经过转化的谷物植株抵抗西部谷物食根虫(WCR)幼虫的能力。经过转化的基因型是A634,其中对R0和A634杂交的子代进行了评估。观察包括对幼虫发育(体重)的影响、根损伤速率(RDR)、以及蛋白的表达。含有cry3Bb基因的转化载体是pMON33710。处理包括积极和消极的同种群(isopopulation)处理以及A634检查。
幼苗的鉴定法包括以下步骤:(i)在含有盆土的1盎司的杯子中放置单个的种子;(ii)抽穗(spiking)时,每株幼苗用4只幼虫进行侵袭;以及(iii)在侵袭之后,幼苗在25℃、50%湿度以及14∶10(L∶D)的条件下保温7天。在保温的时间内,给盆土添加足够的水分以维持幼苗的活力。
10英尺鉴定法包括以下步骤:(i)把单个的种子放置在含有盆土的10英尺盆中;(ii)在栽种14天后,每一盆用800个虫卵进行侵袭,其中虫卵已经预先进行温育以便在侵袭后第5天能够孵化;以及(iii)在侵袭之后,在与幼苗鉴定法一样的条件下把植物保温4天。每天从盆顶和盆面给盆浇水。
在幼苗鉴定法中,在第7天计算根的损伤速率并称量存活的幼虫的重量。与此同时,用ELISA确定根部Cry3Bb蛋白的浓度。在幼苗鉴定法中用于评估根损伤的衡量如下:RDR(根损伤速率)0=没有可见的摄食;RDR 1=很轻的摄食;RDR 2=轻的摄食;RDR 3=中等摄食;RDR 4=严重摄食;RDR 5=非常严重的摄食。
表26示出了幼苗鉴定法的结果。表达Cry3Bb蛋白的植物可以完全地杜绝WCR的摄食,其中存活的幼虫在处理期间并没有生长。没有表达的处理中,平均幼虫的重量介于2.03-2.73mg之间,而表达cry3Bb的处理中存活的幼虫的平均重量为0.11mg。没有表达和有表达的同种群的根损伤速率分别为3.86和0.33。在消极的、对照性的处理中幼虫的存活率介于75-85%之间,而在Cry3Bb处理中幼虫只有25%存活。
表26
在一个幼苗化验中,表达Cry3Bb的植物对WCR幼虫的影响
Plants Larvae事件 处理 N 根 RDR+/- 存 活 重量(mg)平均
N
(ppm) SD 率(%) 值+/-标准偏
差16 阴性 7 0.0 3.86+/ 21 75 2.73+/-1.67
-0.6516 阳性 3 29.01 0.33+/ 3 25 0.11+/-0.07
-0.45A634 核对 4 0.0 -- 13 81 2.03+/-0.83
对于10英尺盆鉴定法,在昆虫侵袭的4周之后记录植物的高度并计算根损伤的速率(Iowa 1-6 scale;Hills和Peters,1971)。
10英尺盆鉴定法的结果示于表27中。表达Cry3Bb蛋白的的植物的喂食损伤显著减少,并且比没有表达的植物更高。在事件16中,两个表达事件的较高者几乎称为完全的对照。消极的处理导致根的损伤速率很高,表明受昆虫的侵害很严重。积极处理的平均根损伤速率在事件6和16中分别为3.4和2.2.消极处理的平均根损伤速率相应地为5.0和5.6。表27在一个10英寸盆的化验中,表达Cry3Bb的玉米对控制WCR幼虫进食的影响事件 治疗 N Root RDR+/-平均偏差 植物高度(cm)
(ppm)6 阴性 7 0.0 5.0+/-1.41 49.7+/-18.726 阳性 5 7.0 3.4+/-1.14 73.9+/-8.6716 阴性 5 0.0 5.6+/-0.89 61.2+/-7.7516 阳性 5 55.0 2.2+/-0.84 83.8+/-7.15
总之,从幼苗化验可以看出,表达Cry3Bb蛋白的谷物对WCR幼虫的发育具有显著的生物学影响。当面对厉害的昆虫群袭时,表达Cry3Bb蛋白的植物不受WCR幼虫喂食的损害,如10英尺盆化验所示。6.0 序列编号的简要描述
序列编号:1cry3Bb.11221基因的DNA序列。
序列编号:2Cry3Bb.11221多肽的氨基酸序列。
序列编号:3cry3Bb.11222基因的DNA序列。
序列编号:4Cry3Bb.11222多肽的氨基酸序列。
序列编号:5cry3Bb.11223基因的DNA序列。
序列编号:6Cry3Bb.11223多肽的氨基酸序列。
序列编号:7cry3Bb.11224基因的DNA序列。
序列编号:8Cry3Bb.11224多肽的氨基酸序列。
序列编号:9cry3Bb.11225基因的DNA序列。
序列编号:10Cry3Bb.11225多肽的氨基酸序列。
序列编号:11cry3Bb.11226基因的DNA序列。
序列编号:12Cry3Bb.11226多肽的氨基酸序列。
序列编号:13cry3Bb.11227基因的DNA序列。
序列编号:14Cry3Bb.11227多肽的氨基酸序列。
序列编号:15cry3Bb.11228基因的DNA序列。
序列编号:16Cry3Bb.11228多肽的氨基酸序列。
序列编号:17cry3Bb.11229基因的DNA序列。
序列编号:18Cry3Bb.11229多肽的氨基酸序列。
序列编号:19cry3Bb.11230基因的DNA序列。
序列编号:20Cry3Bb.11230多肽的氨基酸序列。
序列编号:21cry3Bb.11231基因的DNA序列。
序列编号:22Cry3Bb.11231多肽的氨基酸序列。
序列编号:23cry3Bb.11232基因的DNA序列。
序列编号:24Cry3Bb.11232多肽的氨基酸序列。
序列编号:25cry3Bb.11233基因的DNA序列。
序列编号:26Cry3Bb.11233多肽的氨基酸序列。
序列编号:27cry3Bb.11234基因的DNA序列。
序列编号:28Cry3Bb.11234多肽的氨基酸序列。
序列编号:29cry3Bb.11235基因的DNA序列。
序列编号:30Cry3Bb.11235多肽的氨基酸序列。
序列编号:31cry3Bb.11236基因的DNA序列。
序列编号:32Cry3Bb.11236多肽的氨基酸序列。
序列编号:33cry3Bb.11237基因的DNA序列。
序列编号:34Cry3Bb.11237多肽的氨基酸序列。
序列编号:35cry3Bb.11238基因的DNA序列。
序列编号:36Cry3Bb.11238多肽的氨基酸序列。
序列编号:37cry3Bb.11239基因的DNA序列。
序列编号:38Cry3Bb.11239多肽的氨基酸序列。
序列编号:39cry3Bb.11241基因的DNA序列。
序列编号:40Cry3Bb.11241多肽的氨基酸序列。
序列编号:41cry3Bb.11242基因的DNA序列。
序列编号:42Cry3Bb.11242多肽的氨基酸序列。
序列编号:43cry3Bb.11032基因的DNA序列。
序列编号:44Cry3Bb.11032多肽的氨基酸序列。
序列编号:45cry3Bb.11035基因的DNA序列。
序列编号:46Cry3Bb.11035多肽的氨基酸序列。
序列编号:47cry3Bb.11036基因的DNA序列。
序列编号:48Cry3Bb.11036多肽的氨基酸序列。
序列编号:49cry3Bb.11046基因的DNA序列。
序列编号:50Cry3Bb.11046多肽的氨基酸序列。
序列编号:51cry3Bb.11048基因的DNA序列。
序列编号:52Cry3Bb.11048多肽的氨基酸序列。
序列编号:53cry3Bb.11051基因的DNA序列。
序列编号:54Cry3Bb.11051多肽的氨基酸序列。
序列编号:55cry3Bb.11057基因的DNA序列。
序列编号:56Cry3Bb.11057多肽的氨基酸序列。
序列编号:57cry3Bb.11058基因的DNA序列。
序列编号:58Cry3Bb.11058多肽的氨基酸序列。
序列编号:59cry3Bb.11081基因的DNA序列。
序列编号:60Cry3Bb.11081多肽的氨基酸序列。
序列编号:61cry3Bb.11082基因的DNA序列。
序列编号:62Cry3Bb.11082多肽的氨基酸序列。
序列编号:63cry3Bb.11083基因的DNA序列。
序列编号:64Cry3Bb.11083多肽的氨基酸序列。
序列编号:65cry3Bb.11084基因的DNA序列。
序列编号:66Cry3Bb.11084多肽的氨基酸序列。
序列编号:67cry3Bb.11095基因的DNA序列。
序列编号:68Cry3Bb.11095多肽的氨基酸序列。
序列编号:69cry3Bb.60基因的DNA序列。
序列编号:70Cry3Bb.60多肽的氨基酸序列。
序列编号:71引物FW001
序列编号:72引物FW006
序列编号:73引物MVT095
序列编号:74引物MVT097
序列编号:75引物MVT091
序列编号:76引物MVT075
序列编号:77引物MVT076
序列编号:78引物MVT111
序列编号:79引物MVT094
序列编号:80引物MVT103
序列编号:81引物MVT081
序列编号:82引物MVT085
序列编号:83引物A
序列编号:84引物B
序列编号:85引物C
序列编号:86引物D
序列编号:87引物E
序列编号:88引物F
序列编号:89引物G
序列编号:90引物WD112
序列编号:91引物WD115
序列编号:92引物MVT105
序列编号:93引物MVT092
序列编号:94引物MVT070
序列编号:95引物MVT083
序列编号:96Cry3Bb.多肽的N端氨基酸序列。
序列编号:97野生型cry3Bb.基因的DNA序列。
序列编号:98野生型Cry3Bb.多肽的氨基酸序列。
序列编号:99cry3Bb.11231基因的植物化DNA序列。
序列编号:100植物化Cry3Bb.11231多肽的氨基酸序列。
序列编号:101用于制备序列编号:99的cry3Bb.基因的DNA序列。
序列编号:102野生型Cry3Bb.基因的氨基酸序列,Genbank第#M89794.
序列编号:103低聚物#1的DNA序列。
序列编号:104低聚物#2的DNA序列。
序列编号:105低聚物#3的DNA序列。
序列编号:106低聚物#4的DNA序列。
序列编号:107cry3Bb.11098基因的DNA序列。
序列编号:108Cry3Bb.11098多肽的氨基酸序列。7.0参考文献
以下参考文献提供了对本发明中所描述的进行补充的示范性的程序或其它的细节。把它们作为参照结合于本发明中。
美国专利4,237,224,出版日期:12/02/1980.
美国专利4,332,898,出版日期:6/01/1982.
美国专利4,342,832,出版日期:8/03/1982.
美国专利4,356,270,出版日期:10/26/1982.
美国专利4,362,817,出版日期:12/07/1982.
美国专利4,371,625,出版日期:2/01/1983.
美国专利4,448,885,出版日期:5/15/1984.
美国专利4,467,036,出版日期:8/21/1984.
美国专利4,554,101,出版日期:11/19/1985.
美国专利4,683,195,出版日期:7/28/1987.
美国专利4,683,202,出版日期:7/28/1987.
美国专利4,757,011,出版日期:7/12/1988.
美国专利4,766,203,出版日期:8/23/1988.
美国专利4,769,061,出版日期:9/06/1988.
美国专利4,797,279,出版日期:1/10/1989.
美国专利4,800,159,出版日期:1/24/1989.
美国专利4,883,750,出版日期:11/28/1989.
美国专利4,910,016,出版日期:3/20/1990
美国专利4,940,835,出版日期:2/23/1990.
美国专利4,965,188,出版日期:10/23/1990.
美国专利4,971,908,出版日期:11/20/1990.
美国专利4,987,071,出版日期:1/22/1991.
美国专利5,380,831,出版日期:1/10/1995.
美国专利5,023,179,出版日期:6/11/1991.
美国专利5,024,837,出版日期:6/18/1991.
美国专利5,126,133,出版日期:6/30/1992.
美国专利5,176,995,出版日期:10/15/1991,
美国专利5,187,091,出版日期:XXXXX,1993.
美国专利5,322,687,出版日期:7/21/1994.
美国专利5,334,711,出版日期:8/02/1994.
美国专利5,378,619,出版日期:1/3/1995.
美国专利5,424,412,出版日期:6/13/1995.
美国专利5,441,884,出版日期:8/15/1995.
美国专利5,463,175,出版日期:10/01/1995.
美国专利5,500,365,出版日期:3/19/1996.
美国专利5,591,616,出版日期:1/07/1997.
美国专利 5,631,359,出版日期:5/20/1997.
美国专利 5,659,123,出版日期:8/19/1997.
欧洲专利 No.EP 0120516.
欧洲专利 No.EP 0360257.
欧洲专利申请 No.92110298.4.
欧洲专利申请 No.295156AI.
英国专利 2202328.
国际专利申请出版 No.WO 91/03162.
国际专利申请出版 No.WO 92/07065.
国际专利申请出版 No.WO 93/15187.
国际专利申请出版 No.WO 93/23569.
国际专利申请出版 No.WO 94/02595.
国际专利申请出版 No.WO 94/13688.
国际专利申请出版 No.PCT/US87/00880.
国际专利申请出版 No.PCT/US89/01025.
国际专利申请出版 No.WO 88/09812.
国际专利申请出版 No.WO 88/10315.
国际专利申请出版 No.WO 89/06700.
国际专利申请出版 No.WO 93/07278.Abbott,″A method for computing the effectiveness of an insecticide,″J. Econ. Ento-
mol.,18:265-267,1925.Abdullah et al.,Biotechnology,4:1087,1986.Almond and Dean,Biochemistry,32:1040-1046,1993.An et al.,EMBO J.,4:277-287,1985.Angsuthanasamnbat et al.,FEMS Microbiol. Lett.,111:255-262,1993.Armstrong et al.,Plant Cell Rep.,9:335-339,1990.Aronson,Wu,Zhang,“Mutagenesis of specificity and toxicity regions of a Bacillus
thuringiensis protoxin gene.” J. Bacteriol.,177:4059-4065,1995.Bagdasarian et al.,Gene,16:237,1981.Baum et al.,Appl.Environ. Microbiol.,56:3420-3428,1990.Baum,″Tn5401,a new class II transposable element from Bacillus thuringiensis,″J.
Bacteriol.,176:2835-2845,1994.Baum,J.Bacteriol.,177:4036-4042,1995.Baum,Kakefuda,Gawron-Burke,″Engineering Bacillus thuringiensis Bioinsecticides
with an Indigenous Site-Specific Recombination System,″Appl.Environ.Mi-
crobiol..62:XXX-XXX,1996.Benbrook et al,In:Proceedings Bio Expo 1986,Butterworth,Stoneham,MA,pp.27-
54,1986.Bevan et al.,Nature,304:184,1983.Bolivar et al.,Gene,2:95,1977.Branden and Tooze,″Introduction to Protein Structure,″Garland Publishing,Inc.
,New York,NY,1991.Brussock and Currier,″Use of sodium dodeeyl sulfate-polacryamide gel electropho-
resis to quantify Bacillus thuringiensisδ-endotoxins,″In:“Analytical Chemis-
try of Bacillus thuringiensis,” L.A. Hickle and W.L. Fitch,(Eds),American
Chemical Society,Washington D.C.,pp.78-87,1990.Capecchi,″High efficiency transformation by direct microinjection of DNA into cul-
tured mammalian cells,″Cell.22(2):479-488,1980.Caramori,Albertini,Galizzi,″In vivo generation of hybrids between two Bacillus
thuringiensis insect-toxin-encoding genes,″Gene,98:37-44,1991.Cashmore et al.,Gen.Eng.of Planls,Plenum Press,New York,29-38,1983.Chambers et al.,Appl.Environ. Microbiol.,173:3966-3976,1991.Chau et al.,Science,244:174-181,1989.Chen et al.,Nucl.Acids Res,20:4581-9,1992.Chen,Curtiss,Alcantara,Dean,″Mutations in domain I of Bacillus thuringiensis δ-
endotoxin CryIAb reduce the irreversible binding of toxin to Manduca sexta
brush border membrane vesicles,″J.Biol.Chem.,270:6412-6419,1995.Chen,Lee,Dean,″Site-directed mutations in a highly conserved region of Bacilhus
thuringiensis δ-endotoxin affect inhibition of short circuit current across Bom-
byx mori midguts,″Proc.Natl.Acad Sci.USA,90:9041-9045,1993.Chowrira and Burke,Nucl.Acids Res.,20:2835-2840,1992.Clapp,″Somatic gene therapy into hematopoietic cells.Current status and future im-
plications,″Clin.Perinatol.,20(1):155-168,1993.Cody,Luft,Jensen,Pangborn English,″Purification and crystallization of insecticidal
δ-endotoxin CryIIIB2 from Bacillus thuringiensis,″Proteins:Struct.Funct.
Genet.,14:324,1992.Collins and Olive,Biochem.,32:2795-2799,1993.Conway and Wickens,In:RNA Processing.p.40,Cold Spring Harbor Laboratory,
Cold Spring Harbor,NY,1988.Cornelissen et al.,″A tobacco mosaic virus-induced tobacco protein is homologous to
the sweet-tasting protein thaumatin,″Nature,321(6069):531-532,1986.Cramer,Cohen,Merrill,Song,″Structure and dynamics of the colicin E1 channel,″
Molec.Microbiol.,4:519-526,1990.CRC Handbook of Chemistry and Physics,58th edition,CRC Press,Inc..Cleveland,
Ohio,p-C769,1977.Cristou et al,Plant Physiol,87:671-674,1988.Curiel,Agarwal,Wagner,Cotten,″Adenovirus enhancement of transferrin-
polylysine-mediated gene delivery,″Proc.Natl.Acad.Sci.USA,88(19):8850-
8854,1991.Curiel,Wagner,Cotten,Birnstiel,Agarwal,Li,Loechel,Hu,″High-efficiency gene
transfer mediated by adenovirus coupled to DNA-polylysine complexes,″
Hum.Gen.Ther.,3(2):147-154,1992.Daum,″Revision of two computer programs for probit analysis,″Bull. Entomol.Soc.
Amer.,16:10-15,1970.De Maagd,Kwa,van der Klei,Yamamoto,Schipper,Vlak,Stiekema,Bosch,
″Domain III substitution in Bacillus thuringiensis delta-endotoxin CryIA(b)
results in superior toxicity for Spodoptera exigua and altered membrane pro-
tein recognition,″Appl.Environ.Microbiol.,62:1537-1543,1996.Dean et al.,Nucl. Acids Res.,14(5):2229,1986.Dhir et al.,Plant Cell Reports,10:97,1991.Diehn et al.,Genet.Engineer.,18:83-99,1996.Donovan,Dankocsik,Gilbert,Groat,Gawron-Burke,Carlton,″The P2 protein of
Bacillus thuringiensis var. kurstaki:nucleotide sequence and entomocidal ac-
tivity,″J.Biol.Chem.,263:561-567,1988.Doyle et al.,J.Biol.Chem.,261(20):9228-9236,1986.Dropulic et al.,J.Virol.,66:1432-41,1992.Dunitz,″The entropic cost of bound water in crystals and biomolecules,″Science,
264:670-68x,1994.Earp and Ellar,Nucl.Acids Res.,15:3619,1987.Eglitis and Anderson,″Retroviral vectors for introduction of genes into mammalian
cells,″Biotechniques,6(7):608-614,1988.Eglitis,Kantoff,Kohn,Karson,Moen,Lothrop.Blaese,Anderson,″Retroviral-
mediated gene transfer into hemopoietic cells,″Adv.Exp.Med.Biol.,241:19-
27,1988.Elroy-Stein and Moss,Proc.Natl.Acad.Sci.USA.87:6743-7,1990.English and Slatin,Insect Biochem.Mol.Biol.,22:1-7,1992.English,Readdy,Bastian,″Delta-endotoxin-induced leakage of 86Rb+-K+ and H2O
from phospholipid vesicles is catalyzed by reconstituted midgut membrane,″
Insect Biochem.,21:177-184,1991.Fischhoff et al.,Bio/Technology,5:807-813,1987.Fraley et al.,Bio/Technology,3:629-635,1985.Fraley et al.,Proc.Natl.Acad.Sci.USA,80:4803,1983.Frohman,PCRTM Protocols,a Guide to Methods and Applications XVIII Ed.,Aca-
demic Press,New York,1990.Fromm et al.,Bio/Technology,8:833-839,1990.Fromm et al.,Nature,319:791-793,1986.Fromm,Taylor,Walbot,″Expression of genes transferred into monocot and dicot
plant cells by electroporation,″Proc.Natl.Acad.Sci.USA,82(17):5824-5828,
1985.Fujimura et al.,Plant Tissue Cult. Lett.,2:74,1985.Fynan,Webster,Fuller,Haynes,Santoro,Robinson,″DNA vaccines:protective im-
munizations by parenteral,mucosal,and gene gun inoculations,″Proc.Natl.
Acad.Sci.USA,90(24):11478-11482,1993.Galitsky,Cody,Wojtczak,Ghosh,Luft,Pangborn,Wawrzak,English,″Crystal and
Molecular Structure of the Insecticidal Bacterial δ-Endotoxin CryIIIB2 of
Bacillus thuringiensis,″Research Communication to Ecogen Inc.,Langhome,
PA,1993.Gao and Huang,Nucl.Acids Res.,21:2867-72,1993.Gazit and Shai,″Structural and Functional Characterization of the α-5 segment of
Bacillus thuringiensis δ-endotoxin,″Biochemistry.32:3429-3436,1993.Gazit and Shai,″The assembly and organization of the α5 and α7 helices from the
pore-forming domain of Bacillus thuringiensis δ-endotoxin,″J.Biol.Chem.,
270:2571-2578,1995.Ge,Rivers,Milne,Dean,″Functional domains of Bacilhus thuringiensis insecticidal
crystal proteins:refinement of Heliothis virescens and Trichoplusia ni speci-
ficity domains on CryIA(c),″J.Biol.Chem,266:17954-17958.1991.Genovese and Milcarek,In.RNA Processing,p.62,Cold Spring Harbor Laboratory.
Cold Spring Harbor,NY,1988.Gil and Proudfoot,Nature,312:473,1984.Gonzalez Jr.et al.,Proc.Natl.Acad.Sci USA,79:6951-6955,1982.Graham and van der Eb,″Transformation of rat cells by DNA of human adenovirus
5,″Virology,54(2):536-539,1973.Grochulski,Masson,Borisova,Pusztai-Carey,Schwartz,Brousseau,Cygler,″Bacillus
thuringiensis CryIA(a) insecticidal toxin:crystal structure and channel forma-
tion,″J.Mol.Biol.,254:447-464,1995.Guerrier-Takada et al.,Cell,35:849,1983.Hampel and Tritz,Biochem.,28:4929,1989.Hampel et al.,Nucl.Acids Res.,18:299,1990.Harlow and Lane,″Antibodies:A Laboratory Manual,″Cold Spring Harbor Labora-
tory,Cold Spring Harbor,NY,1988.Herrera-Estrella et al.,Nature,303:209,1983.Hertel et al.,Nucl.Acids Res.,20:3252,1992.Hertig et al.,Plant Mol.Biol.,16:171-174,1991.Hess,Intern Rev.Cytol.,107:367,1987.Hills and Peters,J.Econ.Entomol.,64:764-765,1971.Hockema,In:The Binary Plant Vector System,Offset-durkkerij,Kanters B.V.,Al-
blasserdam,Chapter 5.H_fte and Whitely,Microbiol.Rev.,53:242-255,1989.Holland et al.,Biochemistry,17:4900,1978.Holsters et al,Mol.Gen.Genet.,163:181-187,1978.Honee,van der Salm,Visser,Nucl.Acids Res.,16:6240,1988.Horsch et al.,Science,227:1229-1231,1985.Humason,In:Animal Tissue Techniques,W.H.Freeman and Company,1967.Jaeger et al.,Proc.Natl.Acad.Sci.USA,86:7706-7710,1989.Johnston and Tang,″Gene gun transfection of animal cells and genetic immuniza-
tion,″Methods Cell.Biol.,43(A):353-365,1994.Jorgensen et al.,Mol.Gen.Genet.,207:471,1987.Kaiser and Kezdy,Science,223:249-255,1984.Kashani-Saber et al.,Antisense Res.Dev.,2:3-15,1992.Keller et al.,EMBO J,8:1309-14,1989.Klee et al.,Bio/Technology,3:637-642,1985.Klein et al.,Nature,327:70,1987.Klein et al.,Proc Natl.Acad Sci.USA,85:8502-8505,1988.Kozak,Nature,308:241-246,1984.Krieg et al.,Anzeiger fur Schadlingskunde Pflanzenschutz Umweltschutz,57:145-150,
1984.Krieg et al.,Z.ang Ent.,96:500-508,1983.Kuby,Immunology 2nd Edition,W.H.Freeman & Company,NY,1994Kunkle,″Rapid and efficient site-specific mutagenesis without phenotypic selection.″
Proc.Natl.Acad.Sci.USA,82:488-492,1985.Kunkle,Roberts,Zabour,Methods Enzymol.,154:367-382,1987.Kwak,Lu,Dean,″Exploration of receptor binding of Bacillus thuringiensis toxins,″
Mem.Inst.Oswaldo,90:75-79,1995.Kwoh et al.,Proc.Natl.Acad.Sci.USA,86(4):1173-1177,1989.Kyte and Doolittle,J.Mol.Biol.,157:105-132,1982.L′Huillier et al.,EMBO J,11:4411-8,1992.LaBean and Kauffman,″Design of synthetic gene libraries encoding random sequence
proteins with desired ensemble characteristics,″Prot. Sci.,2:1249-1254,1993.Lambert,Buysse,Decock,Jansens,Piens,Saey,Seurinck,Van Audenhove,Van Rie,
Van Vliet,Peferoen,″A Bacillus thuringiensis insecticidal crystal protein with
a high activity against members of the family Noctuidae,″Appl.Environ.Mi-
crobiol.,62:80-86,1996.Lee,Milne,Ge,Dean,″Location of a Bombyx mori receptor binding region on a Ba-
cillus thuringiensis δ-endotoxin,″J.Biol.Chem.,267:3115-3121,1992.Lee,Young,Dean,″Domain III exchanges of Bacillus thuringiersis CrylA toxins af-
fect binding to different gypsy moth midgut receptors,″Biochem.Biophys.
Res.Commun.,216:306-312,1995.Li,Carroll,Ellar,″Crystal structure of insecticidal δ-endotoxin from Bacillus
thuringiensis at 2.5_ resolution,″Nature (London),353:815-821,1991.Lieber et al.,Methods Enzymol.,217:47-66,1993.Lindstrom et al.,Developmental Genetics,11:160,1990.Lisziewicz et al.,Proc.Natl.Acad.Sci.U.S.A.,90:8000-4,1993.Lorz et al.,Mol.Gen.Genet.,199:178,1985.Lu,Rajamohan,Dean,″Identification of amino acid residues of Bacillus thuringiensis
δ-endotoxin CryIAa associated with membrane binding and toxicity to Bom-
byx mori,″J.Bacteriol.,176:5554-5559,1994.Lu,Xiao,Clapp,Li,Broxmeyer,″High efficiency retroviral mediated gene transduc-
tion into single isolated immature and replatable CD34(3+) hematopoietic
stem/progenitor cells from human umbilical cord blood,″J.Exp.Med.,
178(6):2089-2096,1993.Macaluso and Mettus,J.Bacteriol.,173:1353-1356,1991.Maddock et al.,Third International Congress of Plant Molecular Biology,Abstract
372,1991.Maloy et al.,″Microbial Genetics″2nd Edition.Jones and Bartlett Publishers,Boston,
MA,1994.Maloy,″Experimental Techniques in Bacterial Genetics″Jones and Bartlett Publish-
ers,Boston,MA,1990.Maniatis,Fritsch,Sambrook,In:Molecular Cloning:A Laboratory Manual,Cold
Spring Harbor Laboratory,Cold Spring Harbor,NY,1982.Marcotte et al.,Nature,335:454,1988.McDevitt et al.,Cell,37:993-999,1984.McElroy et al.,Plant Cell,2:163-171,1990.Mettus and Macaluso,Appl.Environ.Microbiol.,56:1128-1134,1990.Michael,″Mutagenesis by Incorporation of a Phosphorylated Oligo During PCRTM
Amplification,″BioTechniques,16(3):410-412,1994.Neuhaus et al.,Theor.Appl.Genet.,75:30,1987.Odell et al.,Nature,313:810,1985.Ohara et al,Proc.Natl.Acad.Sci.USA,86(15):5673-5677,1989.Ohkawa et al.,Nucl.Acids Symp.Ser.,27:15-6,1992.Ojwang et al.,Proc.Natl.Acad.Sci.USA,89:10802-6,1992.Olson et al.,J.Bacteriol.,150:6069,1982.Omirulleh et al.,Plant Molecular Biology,21:415-428.1993.Pandey and Marzluff,In″RNA Processing,″p.133,Cold Spring Harbor Laboratory,
Cold Spring Harbor,NY,1987.Pena et al.,Nature,325:274,1987.Perrault et al,Nature,344:565,1990.Perrotta and Been,Biochem.,31:16,1992.Pieken et al.,Science,253:314,1991.Poszkowski el al.,EMBO J.,3:2719,1989.Potrykus et al.,Mol.Gen.Genet.,199:183,1985.Poulsen et al.,Mol.Gen.Genet.,205:193-200,1986.Prokop and Bajpai,″Recombinant DNA Technology I,″Ann.N.Y.Acad.Sci.,
646:xxx-xxx,1991.Rajamohan,Alcantara,Lee,Chen,Curtiss,Dean,″Single amino acid changes in do-
main II of Bacillus thuringiensis CryIAb δ-endotoxin affect irreversible bind-
ing to Manduca sexta midgut membrane vesicles,″J.Bacteriol.,177:2276-
2282,1995.Rajamohan,Cotrill,Gould,Dean,″Role of domain II,loop 2 residues of Bacillus
thuringiensis CryIAb δ-endotoxin in reversible and irreversible binding to
Manduca sexta and Heliothis virescens,”J.Biol.Chem.,271:2390-2397,
1996.Rogers et al.,In:Methods For Plant Molecular Biology,A.Weissbach and H.Weiss-
bach,eds.,Academic Press Inc.,San Diego,CA 1988.Rogers et al.,Methods Enzymol.,153:253-277,1987.Rossi et al.,Aids Res.Hum.Retrovir.,8:183,1992.Sadofsky and Alwine,Molec.Cell.Biol.,4(8):1460-1468,1984.Sambrook et al.,“Molecular Cloning:A Laboratory Manual,”Cold Spring Harbor
Laboratory,Cold Spring Harbor,NY,1989.Sanchis,Lereclus,Menou,Chaufaux,Guo,Lecadet,Mol.Microbiol.,3:229-238,
1989.Sanchis,Lereclus,Menou,Chaufaux,Lecadet,Mol.Microbiol..2:393-404,1988.Sarver et al.,Science,247:1222-1225,1990.Saville and Collins,Cell,61:685-696,1990.Saville and Collins,Proc. Natl.Acad.Sci.USA,88:8826-8830,1991.Scanlon et al.,Proc.Natl.Acad.Sci.USA,88:10591-5,1991.Scaringe et al.,Nucl.Acids Res.,18:5433-5441,1990.Schnepf and Whitely,Proc.Natl.Acad Sci.USA,78:2893-2897,1981.Schnepf et al.,J.Biol.Chem.,260:6264-6272,1985.Segal,″Biochemical Calculations″2nd Edition,John Wiley & Sons,New York,1976.Shaw and Kamen,Cell,46:659-667,1986.Shaw and Kamen,In.“RNA Processing”,p.220,Cold Spring Harbor Laboratory,
Cold Spring Harbor,NY,1987.Simpson,Science,233:34,1986.Slaney,Robbins,English,″Mode of action of Bacillus thuringiensis toxin CryIIIA:
An analysis of toxicity in Leptinotarsa decemlineata (Say) and Diabrotica un-
decimpunctata howardi Barber,″Insect Biochem.Molec.Biol.,22:9-18,1992.Slatin,Abrams,English,″Delta-endotoxins form cation-selectivc channels in planar
lipid bilayers,″Biochem.Biophys.Res.Comm.,169(2):765-772,1990.Smedley and Ellar,″Mutagenesis of three surface-exposed loops of a Bacillus
thuringiensis insecticidal toxin reveals residues important for toxicity,receptor
recognition and possibly membrane insertion,″Microbiology,142:1617-1624,
1996.Smith and Ellar,″Mutagenesis of two surface-exposed loops of the Bacillus
thuringiensis CrylC δ-endotoxin affects insecticidal specificity,″Biochem.J.,
302:611-616,1994.Smith,Merrick,Bone,Ellar,Appl.Environ Microbiol.,62:680-684,1996.Spielmann et al.,Mol.Gen.Genet.,205:34,1986.Stemmer and Morris,″Enzymatic Inverse PCRTM:A Restriction Site Independent,
SingIe-Fragment Method for High-Efficiency,Site-Directed Mutagenesis,″
BioTechniques,13(2):214-220,1992.Stemmer,Proc.Natl.Acad.Sci.USA,91:10747-1075,1994.Taira et al.,Nucl.Acids Res.,19:5125-30,1991.Tomic et al.,Nucl.Acids Res.,12:1656,1990.Tomic,Sunjevaric,Savtchenko,Blumenberg,″A rapid and simple method for intro-
ducing specific mutations into any position of DNA leaving all other positions
unaltered,″Nucleic Acids Res.,18(6):1656,1990.Toriyama et al.,Theor Appl.Genet.,73:16,1986.Uchimiya et al. Mol.Gen.Genet.,204:204,1986.Upender et al.,Biotechniques,18:29-31,1995.Usman and Cedergren,TIBS,17:34,1992.Usman and Cedergren,Trends in Biochem.Sci.,17:334,1992.Usman et al.,J.Am.Chem.Soc.,109:7845-7854,1987.Vallette,Merge,Reiss,Adesnik,″Construction of mutant and chimeric genes using
the polymerase chain reaction,″Nucl.Acids Res.,17:723-733,1989.Vasil et al.,″Herbicide-resistant fertile transgenic wheat plants obtained by micropro-
jectile bombardment of regenerable embryogenic callus,″Biotechnology,
10:667-674,1992.Vasil,Biotechnology,6:397,1988.Velten and Schell,Nucl.Acids Res.,13:6981-6998,1985.Velten et al.,EMBO J.,3:2723-2730,1984.Ventura et al.,Nucl.Acids Res.,21:3249-55,1993.Vodkin et al.,Cell,34:1023,1983.Vogel et al.,J.Cell Biochem.,Suppl.13D:312,1989,Von Tersch,Slatin,Kulesza,English,″Membrane permeabilizing activity of Bacillus
thuringiensis Coleopteran-active toxins CryIIIB2 and CryIIIB2 domain 1 pep-
tides,″Appl.Env Microbiol.,60:3711-3717,1994.Wagner,Zatloukal,Cotten,Kirlappos,Mechtler.Curiel,Bimstiel,″Coupling of ade-
novirus to transferrin-polylysine/DNA complexes greatly enhances receptor-
mediated gene delivery and expression of transfected genes,″Proc.Natl. Acad.
Sci.USA,89(13):6099-6103,1992.Walker et al.,Proc.Natl.Acad Sci.USA.89(1):392-396,1992.Walters et al.,Biochem.Biophys.Res.Commun.,196:921-926,1993.Watson et al.,Molecular Biology of the Gene,4th Ed.,W.A.Benjamin,Inc.,Menlo
Park,CA,1987.Weerasinghe et al.,J.Virol.,65:5531-4,1991.Weissbach and Weissbach,Methods for Plant Molecular Biology,(eds.),Academic
Press,Inc.,San Diego,CA,1988.Wenzler et al.,Plant Mol. Biol.,12:41-50,1989.Wickens and Stephenson,Science,226:1045,1984.Wickens et al.,In:“RNA Processing,”p.9,Cold Spring Harbor Laboratory,Cold
Spring Harbor,NY,1987.Wolfersberger et al.,Appl.Environ.Microbiol.,62:279-282,1996.Wong and Neurnarnn,″Electric field mediated gene transfer,″Biochim.Biophys.Res.
Commun.,107(2):584-587,1982.Woolf et al.,Proc.Natl.Acad.Sci.USA,89:7305-7309,1992.Wu and Aronson,″Localized mutagenesis defines regions of the Bacillus thuringien-
sis δ-endotoxin involved in toxicity and specificity,″J.Biol.Chem.,267:2311-
2317,1992.Wu and Dean,″Functional significance of loops in the receptor binding domain of
Bacillus thuringiensis CryIIIA δ-endotoxin,″J.Mol.Biol.,255:628-640,1996.Yamada et al.,Plant Cell Rep.,4:85,1986.Yang et al.,Proc.Natl.Acad.Sci.USA,87:4144-48,1990.Yu et al.,Proc.Natl.Acad.Sci.USA.90:6340-4,1993.Zatloukal,Wagner,Cotten,Phillips,Plank,Steinlein,Curiel,Bimstiel,
″Transferrinfeetion:a highly efficient way to express gene constructs in eu-
karyotic cells,″Ann.N.Y.Acad.Sci.,660:136-153,1992.Zhang and Matthews,″Conservations of solvent-binding sites in 10 crystal forms of
T4 lysozyme,″Prot.Sci.,3:1031-1039,1994.Zhou et al.,Mol.Cell Biol.,10:4529-37,1990.
在本发明的指导下,本发明中所公开和要求权限的所有的组合物可以被正确地制造和执行。虽然已经通过优选实施例对本发明的组合物和方法进行了描述,但是显而易见,本工艺的熟练人士可以对本发明的组合物和方法按照本发明中所述的步骤或步骤的顺序作各种变更而不脱离本发明的概念、精神和范围。更具体地,显然本发明中所述的试剂可以用它们的化学和物理相关的试剂代替而能够获得相同或相似的结果。本工艺的熟练人士所熟知的所有的这些类似的替代和修改被认为是属于如增补的权利要求所定义的本发明的精神、范围和概念之内的。
序列清单(1)一般信息:
(i)申请者:
(A)名称:ECOGEN,INC./MONSANTO COMPANY
(B)街道:2005 CABOT BLVD W/700 CHESTERFIELD VILLAGE
PKY N
(C)城市:LANGHORE/ST.LOUIS
(D)州:PA/MO
(E)国家:美国
(F)邮政编码:819047/63198
(A)名称:LEIGH H.ENGLISH
(B)街道:120 CHAPEL DR
(C)城市:CHRUCHVILLE
(D)州:PA
(E)国家:美国
(F)邮政编码:18966
(A)名称:SUSAN M.BRUSSOCK
(B)街道:7 HILLSIDE LN
(C)城市:NEW HOPE
(D)州:PA
(E)国家:美国
(F)邮政编码:18938
(A)名称:THOMAS M.MALVAR
(B)街道:12046 CHARTER HOUSE LN
(C)城市:ST.LOUIS
(D)州:MO
(E)国家:美国
(F)邮政编码:63146
(A)名称:JAMES W.BRYSON
(B)街道:87 WOOD STREAM DR
(C)城市:LANGHORNE
(D)州:PA
(E)国家:美国
(F)邮政编码:19053
(A)名称:CAROLINE A.KULESZA
(B)街道:301 OLD LYNCHBURG RD
(C)城市:CHARLOTTESVILLE
(D)州:VA
(E)国家:美国
(F)邮政编码:22903
(A)名称:FREDERICK S.WALTERS
(B)街道:3413 6TH AVE
(C)城市:BEAVER FALLS
(D)州:PA
(E)国家:美国
(F)邮政编码:15010
(A)名称:STEPHEN L.SLATIN
(B)街道:3823 LESLIE PL
(C)城市:FAIR LAWN
(D)州:NJ
(E)国家:美国
(F)邮政编码:07410
(A)名称:MICHAEL A.VON TERSCH
(B)街道:14 RUTLEDGE AVE
(C)城市:TRENTON
(D)州:NJ
(E)国家:美国
(F)邮政编码:08618
(A)名称:CHARLES ROMANO
(B)街道:2402 MAPLE CROSSING DR
(C)城市:WILDWOOD
(D)州:MO
(E)国家:美国
(F)邮政编码:63011
(ii)发明的题目:INSECT-RESISTANT TRANSGENIC PLANTS AND
METHODS FOR IMPROVING DELTA-ENDOTOXIN ACTIVITY AGAINST
TARGET INSECTS
(iii)序列的数目:113
(iv)计算机可读形式:
(A)介质形式:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release #1.0,Version #1.30(EPO)
(v)此次申请的数据:
申请号码:未知
(vi)上次申请日期:
(A)申请号码:US 08/993,170
(B)存当日期:18-DEC-1997
(vi)上次申请日期:
(A)申请号码:US 08/993,722
(B)存当日期:18-DEC-1997
(vi)上次申请日期:
(A)申请号码:US 08/993,775
(B)存当日期:18-DEC-1997
(vi)上次申请日期:
(A)申请号码:US 08/996,441
(B)存当日期:18-DEC-1997(2)序列编号1的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性(ix)特性:
(A)名称/关键词:CDS
(B)定位:1..1956(xi)序列描述:序列编号:1:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA TTT CAC CAT TCT CGT CGT TCT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Phe His His Ser Arg Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lye Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号2的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:2Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Phe His His Ser Arg Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350G1y Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号3的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956
(xi)序列描述:序列编号:3:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser ThrVal Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTC CTT AGT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Leu Ser Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Ash Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
510 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号4的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:4:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro 1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Leu Ser Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号5的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956(xi)序列描述:序列编号:5:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT CCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Pro Glu
210 215 220GAT GTT GCT GAA TTC AGT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Ser His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号6的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:6:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Ash His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Pro Glu
210 215 220Asp Val Ala Glu Phe Ser His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Cln Leu
645 650(2)序列编号7的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956(xi)序列描述:序列编号:7ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTC TAT CGT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号8的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:8:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号9的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956(xi)SEQUENCE DESCRIPTION:SEQ ID NO:9:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Als Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTC TAT AAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr Asn Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240TCT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Ser Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号10的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:10Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe ArG Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr Asn Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Ser Asp His Cys Val ASn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号11的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956
(xi)序列描述:序列编号:11:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTC TAT ACC AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr Thr Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn G1y
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号12的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:12:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
160 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr Thr Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号13的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)SEQUENCE DESCRIPTION:SEQ ID NO:13:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT AAT TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Asn Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号14的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:14:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Asn Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号15的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)SEQUENCE DESCRIPTION:SEQ ID NO:15:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TTA CTT ACT ACG CTT CAG AAG TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号16的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:16Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号17的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:17:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT ACC CTT AAT ACA CTA CAG AAG TGC GGA CCA 960Phe Thr Asp Pro Ile Phe Thr Leu Asn Thr Leu Gln Lys Cys Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号18的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:18:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Thr Leu Asn Thr Leu Gln Lys Cys Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号19的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:19ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT GCC GTT AAT ACT CTG TGG GAA TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Ala Val Asn Thr Leu Trp Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT TTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号20的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:20Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro 1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ala Val Asn Thr Leu Trp Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号21的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:21ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA ACA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTC TAT CGT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TTA CTT ACT ACG CTT CAG AAG TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号22的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:22:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser His Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号23的信息:
(i)序列特征:
(A)长度:195g碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1.1956
(xi)序列描述:序列编号:23:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro ASn ASn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT ACG CCA ACC ACC CTA CAG GAT TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Thr Pro Thr Thr Leu Gln Asp Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号24的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:24:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Thr Pro Thr Thr Leu Gln Asp Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Lau Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号25的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:25:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT GCC CTG AAT ACC TTA GAC GAG TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Ala Leu Asn Thr Leu Asp Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
6l0 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号26的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:26:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ala Leu Asn Thr Leu Asp Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号27的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1.1956
(xi)序列描述:序列编号:27:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAC GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ACT AGG CGA TTC AGA AAG GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Thr Arg Arg Phe Arg Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号28的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:28:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Thr Arg Arg Phe Arg Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号29的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:29:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTC TAT CGT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TTA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Leu Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号30的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:30:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Leu Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Tle Pro Val Gln Leu
645 650
(2)序列编号31的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:31:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT ATC CTC AAT ACG CTA CAG GAG TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Ile Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号32的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:32:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ile Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号33的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:33ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT ATC CTA CAT ACG CTG CAG GAG TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Ile Leu His Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Sar Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号34的信息
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:34:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ile Leu His Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号35的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:35:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCC CTC GTT AAC CTA ATG GTG TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Val Asn Leu Met Val Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号36的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:36:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro 1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Val Asn Leu Met Val Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号37的信息:
(i)序列特征:
(A)长度: 1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:37:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCT CTT AGG ACA CCA CTT GCG TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Arg Thr Pro Leu Ala Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Clu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号38的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:38:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Arg Thr Pro Leu Ala Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Pne Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号39的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:39:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TTC AAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Phe Asn
275 280 285ATT TTG CTT TAC AGT AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Leu Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号40的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:40Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Phe Asn
275 280 285Ile Leu Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe rle Pro Val Gln Leu
645 650
(2)序列编号41的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1.1956
(xi)序列描述:序列编号:41:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG GTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT GTG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Val Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号42的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:42:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Val Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号43的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:43:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CrT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号44的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:44:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号45的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1.1956
(xi)序列描述:序列编号:45:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AAT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn145 150 155 160CCA CAC AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Pro His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号46的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:46:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn145 150 155 160Pro His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号47的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:47:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285GTT CGG TTA TAC CCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号48的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:48:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号49的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1956
(xi)序列描述:序列编号:49:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGA GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AAT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn145 150 155 160CCA CAC AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Pro His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285GTT CGG TTA TAC CCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号50的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:50:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn145 150 155 160Pro His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650
(2)序列编号51的信息:
(i)序列特征:
(A)长度:1956碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位: 1..1953
(xi)序列描述:序列编号:51:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAA GAC CCA TGG AAG GCT TTT ATG GCA CAA 336Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
100 105 110GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT AAA 384Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
115 120 125GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT GTT 432Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130 135 140AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT AAA 480Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys145 150 155 160AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT CAT 528Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
165 170 175TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG CTG 576Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
180 185 190TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA TTA 624Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
195 200 205AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA GAT 672Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210 215 220GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC ACT 720Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225 230 235 240GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA GGT 768Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
245 250 255TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA ATG 816Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
260 265 270ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT ATT 864Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
275 280 285CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT TTT 912Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290 295 300ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA ACT 960Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305 310 315 320TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT TAT 1008Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
325 330 335TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT GGG 1056Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
340 345 350AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA CCT 1104Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
355 360 365AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT AAA 1152Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370 375 380TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT TAT 1200Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385 390 395 400CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG GTA 1248Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
405 410 415TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA AAA 1296Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
420 425 430AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC CAT 1344Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
435 440 445GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA GAT 1392Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450 455 460GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA TGT 1440Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465 470 475 480TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG ACA 1488Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
485 490 495CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT ACT 1536His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
500 505 510CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC ATT 1584Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
515 520 525ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA GAA 1632Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530 535 540TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA GCC 1680Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545 550 555 560TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT AAC 1728Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
565 570 575TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC TAC 1776Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
580 585 590ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA TTT 1824Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
595 600 605GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG AAT 1872Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610 615 620GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC TAT 1920Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625 630 635 640ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1956Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号52的信息:
(i)序列特征:
(A)长度:651个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:52:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro 1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
100 105 110Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
115 120 125Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130 135 140Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser Lys145 150 155 160Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
165 170 175Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
180 185 190Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
195 200 205Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210 215 220Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225 230 235 240Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
245 250 255Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
260 265 270Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
275 280 285Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290 295 300Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305 310 315 320Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
325 330 335Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
340 345 350Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
355 360 365Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370 375 380Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385 390 395 400Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
405 410 415Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
420 425 430Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
435 440 445Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450 455 460Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465 470 475 480Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
485 490 495His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
500 505 510Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
515 520 525Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530 535 540Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545 550 555 560Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
565 570 575Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
580 585 590Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
595 600 605Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610 615 620Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625 630 635 640Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号53的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956(xi)序列描述:序列编号:53:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC GGA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Gly Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号54的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:54:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Gly Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号55的信息:
(i)序列特征:
(A)长度:1956碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1953
(xi)序列描述:序列编号:55:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAA GAC CCA TGG AAG GCT TTT ATG GCA CAA 336Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
100 105 110GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT AAA 384Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
115 120 125GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT GTT 432Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130 135 140AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AAT CCA 480Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn Pro145 150 155 160CAC AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT CAT 528His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
165 170 175TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG CTG 576Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
180 185 190TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA TTA 624Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
195 200 205AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA GAT 672Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210 215 220GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC ACT 720Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225 230 235 240GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA GGT 768Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
245 250 255TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA ATG 816Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
260 265 270ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT ATT 864Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
275 280 285CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT TTT 912Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290 295 300ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA ACT 960Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305 310 315 320TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT TAT 1008Phe Leu Ser Ile Glu Arg Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
325 330 335TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT GGG 1056Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
340 345 350AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA CCT 1104Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
355 360 365AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT AAA 1152Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370 375 380TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT TAT 1200Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385 390 395 400CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG GTA 1248Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
405 410 415TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA AAA 1296Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
420 425 430AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC CAT 1344Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
435 440 445GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA GAT 1392Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450 455 460GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA TGT 1440Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465 470 475 480TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG ACA 1488Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
485 490 495CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT ACT 1536His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
500 505 510CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC ATT 1584Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
515 520 525ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA GAA 1632Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530 535 540TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA GCC 1680Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545 550 555 560TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT AAC 1728Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
565 570 575TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC TAC 1776Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
580 585 590ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA TTT 1824Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
595 600 605GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG AAT 1872Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610 615 620GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC TAT 1920Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625 630 635 640ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1956Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号56的信息:
(i)序列特征:
(A)长度:651个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:56:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Glu Asn Pro Trp Lys Ala Phe Met Ala Gln
100 105 110Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
115 120 125Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130 135 140Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Asn Pro145 150 155 160His Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
165 170 175Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
180 185 190Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
195 200 205Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210 215 220Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225 230 235 240Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
245 250 255Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
260 265 270Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
275 280 285Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290 295 300Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305 310 315 320Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
325 330 335Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
340 345 350Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
355 360 365Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370 375 380Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385 390 395 400Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
405 410 415Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
420 425 430Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
435 440 445Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450 455 460Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465 470 475 480Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
485 490 495His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
500 505 510Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
515 520 525Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530 535 540Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545 550 555 560Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Sar Thr Thr Asn
565 570 575Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
580 585 590Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
595 600 605Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610 615 620Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625 630 635 640Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号57的信息:
(i)序列特征:
(A)长度:1956碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1953
(xi)序列描述:序列编号:57:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAA GAC CCA TGG AAG GCT TTT ATG GCA CAA 336Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
100 105 110GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT AAA 384Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
115 120 125GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT GTT 432Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130 135 140AAT GCG TTA AAT TCC TGG AAG AAA TTT CAC CAT TCT CGT CGT TCT AAA 480Asn Ala Leu Asn Ser Trp Lys Lys Phe His His Ser Arg Arg Ser Lys145 150 155 160AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT CAT 528Arg Ser Gln Asp Arg Ils Arg Glu Leu Phe Ser Gln Ala Glu Ser His
165 170 175TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG CTG 576Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
180 185 190TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA TTA 624Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
195 200 205AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA GAT 672Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210 215 220GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC ACT 720Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225 230 235 240GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA GGT 768Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
245 250 255TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA ATG 816Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
260 265 270ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT ATT 864Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
275 280 285CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT TTT 912Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290 295 300ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA ACT 960Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305 310 315 320TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT TAT 1008Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
325 330 335TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT GGG 1056Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
340 345 350AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA CCT 1104Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
355 360 365AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT AAA 1152Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370 375 380TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT TAT 1200Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385 390 395 400CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG GTA 1248Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
405 410 415TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA AAA 1296Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
420 425 430AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC CAT 1344Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
435 440 445GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA GAT 1392Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450 455 460GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA TGT 1440Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465 470 475 480TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG ACA 1488Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
485 490 495CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT ACT 1536His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
500 505 510CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC ATT 1584Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
515 520 525ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA GAA 1632Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530 535 540TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA GCC 1680Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545 550 555 560TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT AAC 1728Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
565 570 575TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC TAC 1776Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
580 585 590ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA TTT 1824Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
595 600 605GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG AAT 1872Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610 615 620GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC TAT 1920Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625 630 635 640ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1956Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号58的信息:
(i)序列特征:
(A)长度:651个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:58:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Glu Asp Pro Trp Lys Ala Phe Met Ala Gln
100 105 110Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser Lys
115 120 125Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr Val
130 135 140Asn Ala Leu Asn Ser Trp Lys Lys Phe His His Ser Arg Arg Ser Lys145 150 155 160Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His
165 170 175Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val Leu
180 185 190Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu
195 200 205Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu Asp
210 215 220Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr Thr225 230 235 240Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg Gly
245 250 255Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu Met
260 265 270Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp Ile
275 280 285Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile Phe
290 295 300Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro Thr305 310 315 320Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp Tyr
325 330 335Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe Gly
340 345 350Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg Pro
355 360 365Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp Lys
370 375 380Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val Tyr385 390 395 400Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys Val
405 410 415Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln Lys
420 425 430Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly His
435 440 445Val Sar Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr Asp
450 455 460Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu Cys465 470 475 480Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp Thr
485 490 495His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile Thr
500 505 510Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser Ile
515 520 525Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys Glu
530 535 540Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala Ala545 550 555 560Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn
565 570 575Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile Tyr
580 585 590Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr Phe
595 600 605Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys Asn
610 615 620Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile Tyr625 630 635 640Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号59的信息;
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956
(xi)序列描述:序列编号:59:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Glu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Ash Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT ACC CTT AAT ACA CTA CAG AAG TAC GGA CCA 960Phe Thr Asp Pro Ile Phe Thr Leu Asn Thr Leu Gln Lys Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1l04Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 65n(2)序列编号60的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:60:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Thr Leu Asn Thr Leu Gln Lys Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu ASn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号61的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956
(xi)序列描述:序列编号:61:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ArA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285GTT CGG TTA TAC CCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TCT ACG GAT CCA ATT TTT GCC GTT AAT ACT CTG TGG GAA TAC GGA CCA 960Ser Thr Asp Pro Ile Phe Ala Val Asn Thr Leu Trp Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CGA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GCA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Ala Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
488 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Ash Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号62的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:序列编号:62:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Ser Thr Asp Pro Ile Phe Ala Val Asn Thr Leu Trp Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Ala Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 4l5Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号63的信息;
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956
(xi)序列描述:序列编号:63:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285GTT CGG TTA TAC CCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CGA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584TAr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号64的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:64:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Val Arg Leu Tyr Pro Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号65的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性(ix)特征:
(A)名称/关键词:CDS
(B)定位1..1956(xi)序列描述:序列编号:65:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GGT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TTA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Leu Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号66的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:66:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Lau Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Leu Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号67的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956
(xi)序列描述:序列编号:67:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GCA TTA AAT GGT TTA AGA 760Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CGA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA C AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA l440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号68的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:68:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro 1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Arg Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号69的信息:
(i)序列特征:
(A)长度:1482碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1479
(xi)序列描述:序列编号:69:AGT AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA 48Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu1 5 10 15AGT CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA 96Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
20 25 30GTG CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG 144Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
35 40 45CTA TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA 192Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
50 55 60GAA GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA 240Glu Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln65 70 75 80TAC ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA 288Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
85 90 95AGA GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA 336Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
100 105 110GAA ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT 384Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
115 120 125GAT ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC 432Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
130 135 140ATT TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA 480Ile Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly145 150 155 160CCA ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT 528Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
165 170 175GAT TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC 576Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
180 185 190TTT GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT 624Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
195 200 205AGA CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA 672Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
210 215 220GAT AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA 720Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys225 230 235 240GTT TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT 768Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
245 250 255AAG GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT 816Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
260 265 270CAA AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT 864Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
275 280 285GGC CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA 912Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
290 295 300ACA GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG 960Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala305 310 315 320GAA TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT 1008Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
325 330 335TGG ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG 1056Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
340 345 350ATT ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TrG TCT TCA GGT GCT 1104Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
355 360 365TCC ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA 1152Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
370 375 380AAA GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA 1200Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser385 390 395 400GCA GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC 1248Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile ArG Tyr Ala Ser Thr
405 410 415ACT AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC 1296Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
420 425 430ATC TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA 1344Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
435 440 445ACA TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT 1392Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
450 455 460AAG AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA 1440Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys465 470 475 480ATC TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1482Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
485 490(2)序列编号70的信息:
(i)序列特征:
(A)长度:493个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性:
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:70:Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu1 5 10 15Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
20 25 30Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
35 40 45Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
50 55 60Glu Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln65 70 75 80Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
85 90 95Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
100 105 110Glu Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr
115 120 125Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
130 135 140Ile Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly145 150 155 160Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
165 170 175Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
180 185 190Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
195 200 205Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
210 215 220Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys225 230 235 240Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
245 250 255Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
260 265 270Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
275 280 285Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
290 295 300Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala305 310 315 320Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
325 330 335Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
340 345 350Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
355 360 365Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
370 375 380Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser385 390 395 400Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
405 410 415Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
420 425 430Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
435 440 445Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
450 455 460Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys465 470 475 480Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
485 490(2)序列编号71的信息:
(i)序列特征:
(A)长度:23碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:71:AGACAACTCT ACAGTAAAAG ATG 23(2)序列编号72的信息:
(i)序列特征:
(A)长度:20碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:72:GGTAATTGGT CAATAGAATC 20(2)序列编号73的信息:
(i)序列特征:
(A)长度:39碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:21..23
(D)其它的信息:/注释=“N=A,T,G,或C”
(xi)序列描述:序列编号:73:CAGAAGATGT TGCTGAATTC NNNCATAGAC AATTAAAAC 39(2)序列编号74的信息:
(i)序列特征:
(A)长度:34碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:19..21
(D)其它的信息:/注释=“N=A,T,G,或C”
(xi)序列描述:序列编号:74:GATGTTGCTG AATTCTATNN NAGACAATTA AAAC 34(2)序列编号75的信息:
(i)序列特征:
(A)长度:33碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:17
(D)其它的信息:/注释=“N=A,T,C,或G”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:18
(D)其它的信息:/注释=“N=T,G,C,或A”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:1g
(D)其它的信息:/注释=“N=A,T,G,或C”
(xi)序列描述:序列编号:75:CCCATTTTAT GATATTNNNT TATACTCAAA AGG 33(2)序列编号76的信息:
(i)序列特征:
(A)长度:64碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:24
(D)其它的信息:/注释:“N=T,G,C,或A”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:(25,27,28,30,34,36,39,43)的其中之一
(D)其它的信息:/注释:“N=A,T,G,或C”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:(31,33,35,37,42,44)的其中之一
(D)其它的信息:/注释:“N=A,G,C,或T”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:40
(D)其它的信息:/注释:“N=A,T,C,或G”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:(26,29,32,38,41)的其中之一
(D)其它的信息:/注释:“N=A,T,G,或C”
(xi)序列描述:序列编号:76:AGCTATGCTG GTCTCGGAAG AAANNNNNNN NNNNNNNNNN NATNAAAAGA AGCCAAGATC 60GAAT 64(2)序列编号77的信息:
(i)序列特征:
(A)长度:40碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:77:GGTCACCTAG GTCTCTCTTC CAGGAATTTA ACGCATTAAC 40(2)序列编号78的信息:
(i)序列特征:
(A)长度:65碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:(22,27,29,30,37,42)的其中之一
(D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:(23,26,28,31,38,40,43,44)的其中之一
(D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:(24,39)的其中之一
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:(25,32,33,41,46,47,48)的其中之一
(D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:34
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:45
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修饰的碱基
(B)定位:35..36
(D)其它的信息:/注释=“N=A,G,C或T”
(xi)序列描述:序列编号:78:AGCTATGCTG GTCTCCCATT TNNNNNNNNN NNNNNNNNNN NNNNNNNNGT TAAAACAGAA 60CTAAC 65(2)序列编号79的信息:
(i)序列特征:
(A)长度:36碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:79:ATCCAGTGGG GTCTCAAATG GGAAAAGTAC AATTAG 36(2)序列编号80的信息:
(i)序列特征:
(A)长度:63碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(23,27,31,36,44)的其中之一
(D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(24,25,26,33,3 5,38)的其中之一
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(28,34,37)的其中之一
(D)其它的信息:/注释=“N=A,T,G或C”
(i)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(29,30,32,39,42,45)的其中之一
(D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(40,43)的其中之一
(D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:41
(D)其它的信息:/注释=“N=A,C,T或G”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:46
(D)其它的信息:/注释=“N=A,T,G或C”
(xi)序列描述:序列编号:80:CATTTTTACG GATCCAATTT TTNNNNNNNN NNNNNNNNNN NNNNNNGGAC CAACTTTTTT 60GAG 63(2)序列编号81的信息:
(i)序列特征:
(A)长度:62碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(28,31,32,33,42)的其中之一
(D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(29,38,39,41)的其中之一
(D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:30
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(34,35,40)的其中之一
(D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:36
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:37
(D)其它的信息:/注释=“N=A,T,G或C”
(xi)序列描述:序列编号:81:GAATTTCATA CGCGTCTTCA ACCTGGTNNN NNNNNNNNNN NNTCTTTCAA TTATTGGTCT 60GG 62(2)序列编号82的信息:
(i)序列特征:
(A)长度:73碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(41,49,52)的其中之一
(D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:42..43
(D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:44..45
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:46
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(47,48,53,54)的其中之一
(D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(50,51,55)的其中之一
(D)其它的信息:/注释=“N=A,T,C或G”
(xi)序列描述:序列编号:82:AAAAGTTTAT CGAACTATAG CTAATACAGA CGTAGCGGCT NNNNNNNNNN NNNNNGTATA 60TTTAGGTGTT ACG 73(2)序列编号83的信息:
(i)序列特征:
(A)长度:20碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:83:GGAGTTCCAT TTGCTGGGGC 20(2)序列编号84的信息:
(i)序列特征:
(A)长度:17碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:84:ATCTCCATAA AATGGGG 17(2)序列编号85的信息:
(i)序列特征:
(A)长度:32碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:85:GCGAAGTAAA AGAAGCCAAG GTCGAATAAG GG 32(2)序列编号86的信息:
(i)序列特征:
(A)长度:43碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:86:CCTTTAAGTT TGCGAAATCC ACACAGCCAA GGTCGAATAA GGG 43(2)序列编号87的信息:
(i)序列特征:
(A)长度:35碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:87:CCCATTTTAT GATGTTCGGT TATACCCAAA AGGGG 35(2)序列编号88的信息:
(i)序列特征:
(A)长度:25碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:88:GGCCAAGTGA AGACCCATGG AAGGC 25(2)序列编号89的信息:
(i)序列特征:
(A)长度:22碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:89:GCAGTTTCCG GATTCGAAGT GC 22(2)序列编号90的信息:
(i)序列特征:
(A)长度:17碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:90:CCGCTACGTC TGTATTA 17(2)序列编号91的信息:
(i)序列特征:
(A)长度:17碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:91:ATAATGGAAG CACCTGA 17(2)序列编号92的信息:
(i)序列特征:
(A)长度:60碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
208
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(22,26,29)的其中之一
(D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(23,33,36)的其中之一
(D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(24,27,28,32,35,37,38)的其中之一
(D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(25,30,31,34)的其中之一
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:39
(D)其它的信息:/注释=“N=A,T,G或C”
(xi)序列描述:序列编号:92:AGCTATGCTG GTCTCTTCTT ANNNNNNNNN NNNNNNNNNA CAATTCCATT TTTTACTTGG 60(2)序列编号93的信息:
(i)序列特征:
(A)长度:40碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:93:ATCCAGTTGG GTCTCTAAGA AACAAACCGC GTAATTAAGC 40(2)序列编号94的信息:
(i)序列特征:
(A)长度:20碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:94:CCTCAAGGGT TATAACATCC 20(2)序列编号95的信息:
(i)序列特征:
(A)长度:55碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:链状
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(19,22,23,31)的其中之一
(D)其它的信息:/注释=“N=A,T,C或G”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(20,26,27,29,30,35)的其中之一
(D)其它的信息:/注释=“N=T,G,C或A”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(21,32,34)的其中之一
(D)其它的信息:/注释=“N=A,G,C或T”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:(24,33)的其中之一
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:25
(D)其它的信息:/注释=“N=A,G,T或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:28
(D)其它的信息:/注释=“N=A,T,G或C”
(ix)特征:
(A)名称/关键词:经过修改的碱基
(B)定位:36
(D)其它的信息:/注释=“N=A,G,C或T”
(xi)序列描述:序列编号:95:GTACAAAAGC TAAGCTTTNN NNNNNNNNN NNNNNNCGAA CTATAGCTAA TACAG 55(2)序列编号96的信息:
(i)序列特征:
(A)长度:7个氨基酸
(B)类型:氨基酸
(C)链的性质:单链
(D)拓扑学:链状
(xi)序列描述:序列编号:96:
Ser Lys Arg Ser Gln Asp Arg
1 5(2)序列编号97的信息:
(i)序列特征:
(A)长度:1959个氨基酸
(B)类型:氨基酸
(C)链的性质:单链
(D)拓扑学:链状
(ix)特征:
(A)名称/关键词:CDS
(B)定位:1..1956
(xi)序列描述:序列编号:97:ATG AAT CCA AAC AAT CGA AGT GAA CAT GAT ACG ATA AAG GTT ACA CCT 48Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15AAC AGT GAA TTG CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 96Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30CCA AAT TCA ACA CTA GAA GAA TTA AAT TAT AAA GAA TTT TTA AGA ATG 144Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45ACT GAA GAC AGT TCT ACG GAA GTG CTA GAC AAC TCT ACA GTA AAA GAT 192Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60GCA GTT GGG ACA GGA ATT TCT GTT GTA GGG CAG ATT TTA GGT GTT GTA 240Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80GGA GTT CCA TTT GCT GGG GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT 288Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95AAC ACT ATA TGG CCA AGT GAT GCT GAC CCA TGG AAG GCT TTT ATG GCA 336Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110CAA GTT GAA GTA CTG ATA GAT AAG AAA ATA GAG GAG TAT GCT AAA AGT 384Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125AAA GCT CTT GCA GAG TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 432Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140GTT AAT GCG TTA AAT TCC TGG AAG AAA ACA CCT TTA AGT TTG CGA AGT 480Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160AAA AGA AGC CAA GAT CGA ATA AGG GAA CTT TTT TCT CAA GCA GAA AGT 528Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175CAT TTT CGT AAT TCC ATG CCG TCA TTT GCA GTT TCC AAA TTC GAA GTG 576His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190CTG TTT CTA CCA ACA TAT GCA CAA GCT GCA AAT ACA CAT TTA TTG CTA 624Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205TTA AAA GAT GCT CAA GTT TTT GGA GAA GAA TGG GGA TAT TCT TCA GAA 672Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220GAT GTT GCT GAA TTT TAT CAT AGA CAA TTA AAA CTT ACA CAA CAA TAC 720Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240ACT GAC CAT TGT GTT AAT TGG TAT AAT GTT GGA TTA AAT GGT TTA AGA 768Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255GGT TCA ACT TAT GAT GCA TGG GTC AAA TTT AAC CGT TTT CGC AGA GAA 816Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270ATG ACT TTA ACT GTA TTA GAT CTA ATT GTA CTT TTC CCA TTT TAT GAT 864Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285ATT CGG TTA TAC TCA AAA GGG GTT AAA ACA GAA CTA ACA AGA GAC ATT 912Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300TTT ACG GAT CCA ATT TTT TCA CTT AAT ACT CTT CAG GAG TAT GGA CCA 960Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320ACT TTT TTG AGT ATA GAA AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 1008Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335TAT TTA CAG GGG ATT GAA TTT CAT ACG CGT CTT CAA CCT GGT TAC TTT 1056Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350GGG AAA GAT TCT TTC AAT TAT TGG TCT GGT AAT TAT GTA GAA ACT AGA 1104Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365CCT AGT ATA GGA TCT AGT AAG ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380AAA TCT ACT GAA CCT GTA CAA AAG CTA AGC TTT GAT GGA CAA AAA GTT 1200Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400TAT CGA ACT ATA GCT AAT ACA GAC GTA GCG GCT TGG CCG AAT GGT AAG 1248Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415GTA TAT TTA GGT GTT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA 1296Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430AAA AAT GAA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445CAT GTA AGT GCA CAG GAT TCT ATT GAC CAA TTA CCG CCA GAA ACA ACA 1392His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT AAT TAC GCG GAA 1440Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480TGT TTC TTA ATG CAG GAC CGT CGT GGA ACA ATT CCA TTT TTT ACT TGG 1488Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495ACA CAT AGA AGT GTA GAC TTT TTT AAT ACA ATT GAT GCT GAA AAG ATT 1536Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510ACT CAA CTT CCA GTA GTG AAA GCA TAT GCC TTG TCT TCA GGT GCT TCC 1584Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525ATT ATT GAA GGT CCA GGA TTC ACA GGA GGA AAT TTA CTA TTC CTA AAA 1632Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540GAA TCT AGT AAT TCA ATT GCT AAA TTT AAA GTT ACA TTA AAT TCA GCA 1680Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560GCC TTG TTA CAA CGA TAT CGT GTA AGA ATA CGC TAT GCT TCT ACC ACT 1728Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575AAC TTA CGA CTT TTT GTG CAA AAT TCA AAC AAT GAT TTT CTT GTC ATC 1776Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590TAC ATT AAT AAA ACT ATG AAT AAA GAT GAT GAT TTA ACA TAT CAA ACA 1824Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605TTT GAT CTC GCA ACT ACT AAT TCT AAT ATG GGG TTC TCG GGT GAT AAG 1872Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620AAT GAA CTT ATA ATA GGA GCA GAA TCT TTC GTT TCT AAT GAA AAA ATC 1920Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640TAT ATA GAT AAG ATA GAA TTT ATC CCA GTA CAA TTG TAA 1959Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号98的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii)分子类型:蛋白质
(xi)序列描述:序列编号:98:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Prol 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
l80 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Lau Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号99的信息:
(i)序列特征:
(A)长度:2000碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性(xi)序列描述:序列编号:99:CCATCCATGG CAAACCCTAA CAATCGTTCC GAACACGACA CCATCAAGGT TACTCCAAAC 60TCTGAGTTGC AAACTAATCA CAACCAGTAC CCATTGGCTG ACAATCCTAA CAGTACTCTT 120GAGGAACTTA ACTACAAGGA GTTTCTCCGG ATGACCGAAG ATAGCTCCAC TGAGGTTCTC 180GATAACTCTA CAGTGAAGGA CGCTGTTGGA ACTGGCATTA GCGTTGTGGG ACAGATTCTT 240GGAGTGGTTG GTGTTCCATT CGCTGGAGCT TTGACCAGCT TCTACCAGTC CTTTCTCAAC 300ACCATCTGGC CTTCAGATGC TGATCCCTGG AAGGCTTTCA TGGCCCAAGT GGAAGTCTTG 360ATCGATAAGA AGATCGAAGA GTATGCCAAG TCTAAAGCCT TGGCTGAGTT GCAAGGTTTG 420CAGAACAACT TCGAGGATTA CGTCAACGCA CTCAACAGCT GGAAGAAAAC TCCCTTGAGT 480CTCAGGTCTA AGCGTTCCCA GGACCGTATT CGTGAACTTT TCAGCCAAGC CGAATCCCAC 540TTCAGAAACT CCATGCCTAG CTTTGCCGTT TCTAAGTTCG AGGTGCTCTT CTTGCCAACA 600TACGCACAAG CTGCCAACAC TCATCTCTTG CTTCTCAAAG ACGCTCAGGT GTTTGGTGAG 660GAATGGGGTT ACTCCAGTGA AGATGTTGCC GAGTTCTACC GTAGGCAGCT CAAGTTGACT 720CAACAGTACA CAGACCACTG CGTCAACTGG TACAACGTTG GGCTCAATGG TCTTAGAGGA 780TCTACCTACG ACGCATGGGT GAAGTTCAAC AGGTTTCGTA GAGAGATGAC CTTGACTGTG 840CTCGATCTTA TCGTTCTCTT TCCATTCTAC GACATTCGTC TTTACTCCAA AGGCGTTAAG 900ACAGAGCTGA CCAGAGACAT CTTCACCGAT CCCATCTTCC TACTTACGAC CCTGCAGAAA 960TACGGTCCAA CTTTTCTCTC CATTGAGAAC AGCATCAGGA AGCCTCACCT CTTCGACTAT 1020CTGCAAGGCA TTGAGTTTCA CACCAGGTTG CAACCTGGTT ACTTCGGTAA GGATTCCTTC 1080AACTACTGGA GCGGAAACTA CGTTGAAACC AGACCATCCA TCGGATCTAG CAAGACCATC 1140ACTTCTCCAT TCTACGGTGA CAAGAGCACT GAGCCAGTGC AGAAGTTGAG CTTCGATGGG 1200CAGAAGGTGT ATAGAACCAT CGCCAATACC GATGTTGCAG CTTGGCCTAA TGGCAAGGTC 1260TACCTTGGAG TTACTAAAGT GGACTTCTCC CAATACGACG ATCAGAAGAA CGAGACATCT 1320ACTCAAACCT ACGATAGTAA GAGGAACAAT GGCCATGTTT CCGCACAAGA CTCCATTGAC 1380CAACTTCCAC CTGAAACCAC TGATGAACCA TTGGAGAAGG CTTACAGTCA CCAACTTAAC 1440TACGCCGAAT GCTTTCTCAT GCAAGACAGG CGTGGCACCA TTCCGTTCTT TACATGGACT 1500CACAGGTCTG TCGACTTCTT TAACACTATC GACGCTGAGA AGATTACCCA ACTTCCCGTG 1560GTCAAGGCTT ATGCCTTGTC CAGCGGAGCT TCCATCATTG AAGGTCCAGG CTTCACCGGT 1620GGCAACTTGC TCTTCCTTAA GGAGTCCAGC AACTCCATCG CCAAGTTCAA AGTGACACTT 1680AACTCAGCAG CCTTGCTCCA ACGTTACAGG GTTCGTATCA GATACGCAAG CACTACCAAT 1740CTTCGCCTCT TTGTCCAGAA CAGCAACAAT GATTTCCTTG TCATCTACAT CAACAAGACT 1800ATGAACAAAG ACGATGACCT CACCTACCAA ACATTCGATC TTGCCACTAC CAATAGTAAC 1860ATGGGATTCT CTGGTGACAA GAACGAGCTG ATCATAGGTG CTGAGAGCTT TGTCTCTAAT 1920GAGAAGATTT ACATAGACAA GATCGAGTTC ATTCCAGTTC AACTCTAATA GATCCCCCGG 1980GCTGCAGGAA TTCGATATCA 2000(2)序列编号100的信息:
(i)序列特征:
(A)长度:653个氨基酸
(B)类型:氨基酸
(C)链的性质:
(D)拓扑学:线性
(xi)序列描述:序列编号:100:Met Ala Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thrl 5 10 15Pro Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp
20 25 30Asn Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg
35 40 45Met Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys
50 55 60Asp Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val65 70 75 80Val Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe
85 90 95Leu Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met
100 105 110Ala Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys
115 120 125Ser Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp
130 135 140Tyr Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg145 150 155 160Ser Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu
165 170 175Ser His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu
180 185 190Val Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu
195 200 205Leu Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser
210 215 220Glu Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln225 230 235 240Tyr Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu
245 250 255Arg Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg
260 265 270Glu Met Thr Leu Thr Val Leu . p Leu Ile Val Leu Phe Pro Phe Tyr
275 280 285Asp Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp
290 295 300Ile Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly305 310 315 320Pro Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe
325 330 335Asp Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr
340 345 350Phe Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr
355 360 365Arg Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly
370 375 380Asp Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys385 390 395 400Val Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly
405 410 415Lys Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp
420 425 430Gln Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn
435 440 445Gly His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr
450 455 460Thr Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala465 470 475 480Glu Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr
485 490 495Trp Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys
500 505 510Ile Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala
515 520 525Ser Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu
530 535 540Lys Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser545 550 555 560Ala Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr
565 570 575Thr Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val
580 585 590Ile Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln
595 600 605Thr Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp
610 615 620Lys Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys625 630 635 640Ile Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号101的信息:
(i)序列特征:
(A)长度:2050碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:10TGGAGCTCCA CCGCGGTGGC GGCCGCTCTA GAACTAGTGG ATCTAGGCCT CCATATGAAC 60CCTAACAATC GTTCCGAACA CGACACCATC AAGGTTACTC CAAACTCTGA GTTGCAAACT 120AATCACAACC AGTACCCATT GGCTGACAAT CCTAACAGTA CTCTTGAGGA ACTTAACTAC 180AAGGAGTTTC TCCGGATGAC CGAAGATAGC TCCACTGAGG TTCTCGATAA CTCTACAGTG 240AAGGACGCTG TTGGAACTGG CATTAGCGTT GTGGGACAGA TTCTTGGAGT GGTTGGTGTT 300CCATTCGCTG GAGCTTTGAC CAGCTTCTAC CAGTCCTTTC TCAACACCAT CTGGCCTTCA 360GATGCTGATC CCTGGAAGGC TTTCATGGCC CAAGTGGAAG TCTTGATCGA TAAGAAGATC 420GAAGAGTATG CCAAGTCTAA AGCCTTGGCT GAGTTGCAAG GTTTGCAGAA CAACTTCGAG 480GATTACGTCA ACGCACTCAA CAGCTGGAAG AAAACTCCCT TGAGTCTCAG GTCTAAGCGT 540TCCCAGGACC GTATTCGTGA ACTTTTCAGC CAAGCCGAAT CCCACTTCAG AAACTCCATG 600CCTAGCTTTG CCGTTTCTAA GTTCGAGGTG CTCTTCTTGC CAACATACGC ACAAGCTGCC 660AACACTCATC TCTTGCTTCT CAAAGACGCT CAGGTGTTTG GTGAGGAATG GGGTTACTCC 720AGTGAAGATG TTGCCGAGTT CTACCATAGG CAGCTCAAGT TGACTCAACA GTACACAGAC 780CACTGCGTCA ACTGGTACAA CGTTGGGCTC AATGGTCTTA GAGGATCTAC CTACGACGCA 840TGGGTGAAGT TCAACAGGTT TCGTAGAGAG ATGACCTTGA CTGTGCTCGA TCTTATCGTT 900CTCTTTCCAT TCTACGACAT TCGTCTTTAC TCCAAAGGCG TTAAGACAGA GCTGACCAGA 960GACATCTTCA CCGATCCCAT CTTCTCACTT AACACCCTGC AGGAATACGG TCCAACTTTT 1020CTCTCCATTG AGAACAGCAT CAGGAAGCCT CACCTCTTCG ACTATCTGCA AGGCATTGAG 1080TTTCACACCA GGTTGCAACC TGGTTACTTC GGTAAGGATT CCTTCAACTA CTGGAGCGGA 1140AACTACGTTG AAACCAGACC ATCCATCGGA TCTAGCAAGA CCATCACTTC TCCATTCTAC 1200GGTGACAAGA GCACTGAGCC AGTGCAGAAG TTGAGCTTCG ATGGGCAGAA GGTGTATAGA 1260ACCATCGCCA ATACCGATGT TGCAGCTTGG CCTAATGGCA AGGTCTACCT TGGAGTTACT 1320AAAGTGGACT TCTCCCAATA CGACGATCAG AAGAACGAGA CATCTACTCA AACCTACGAT 1380AGTAAGAGGA ACAATGGCCA TGTTTCCGCA CAAGACTCCA TTGACCAACT TCCACCTGAA 1440ACCACTGATG AACCATTGGA GAAGGCTTAC AGTCACCAAC TTAACTACGC CGAATGCTTT 1500CTCATGCAAG ACAGGCGTGG CACCATTCCG TTCTTTACAT GGACTCACAG GTCTGTCGAC 1560TTCTTTAACA CTATCGACGC TGAGAAGATT ACCCAACTTC CCGTGGTCAA GGCTTATGCC 1620TTGTCCAGCG GAGCTTCCAT CATTGAAGGT CCAGGCTTCA CCGGTGGCAA CTTGCTCTTC 1680CTTAAGGAGT CCAGCAACTC CATCGCCAAG TTCAAAGTGA CACTTAACTC AGCAGCCTTG 1740CTCCAACGTT ACAGGGTTCG TATCAGATAC GCAAGCACTA CCAATCTTCG CCTCTTTGTC 1800CAGAACAGCA ACAATGATTT CCTTGTCATC TACATCAACA AGACTATGAA CAAAGACGAT 1860GACCTCACCT ACAACACATT CGATCTTGCC ACTACCAATA GTAACATGGG ATTCTCTGGT 1920GACAAGAACG AGCTGATCAT AGGTGCTGAG AGCTTTGTCT CTAATGAGAA GATTTACATA 1980GACAAGATCG AGTTCATTCC AGTTCAACTC TAATAGATCC CCCGGGCTGC AGGAATTCGA 2040TATCAAGCTT 2050(2)序列编号102的信息:
(i)序列特征:
(A)长度:2280碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:102:TTAAAATTAA TTTTGTATAC TTTTCATTGT AATAATATGA TTTTAAAAAC GAAAAAGTGC 60ATATACAACT TATCAGGAGG GGGGGGATGC ACAAAGAAGA AAAGAATAAG AAGTGAATGT 120TTATAATGTT CAATAGTTTT ATGGGAAGGC ATTTTATCAG GTAGAAAGTT ATGTATTATG 180ATAAGAATGG GAGGAAGAAA AATGAATCCA AACAATCGAA GTGAACATGA TACGATAAAG 240GTTACACCTA ACAGTGAATT GCAAACTAAC CATAATCAAT ATCCTTTAGC TGACAATCCA 300AATTCAACAC TAGAAGAATT AAATTATAAA GAATTTTTAA GAATGACTGA AGACAGTTCT 360ACGGAAGTGC TAGACAACTC TACAGTAAAA GATGCAGTTG GGACAGGAAT TTCTGTTGTA 420GGGCAGATTT TAGGTGTTGT AGGAGTTCCA TTTGCTGGGG CACTCACTTC ATTTTATCAA 480TCATTTCTTA ACACTATATG GCCAAGTGAT GCTGACCCAT GGAAGGCTTT TATGGCACAA 540GTTGAAGTAC TGATAGATAA GAAAATAGAG GAGTATGCTA AAAGTAAAGC TCTTGCAGAG 600TTACAGGGTC TTCAAAATAA TTTCGAAGAT TATGTTAATG CGTTAAATTC CTGGAAGAAA 660ACACCTTTAA GTTTGCGAAG TAAAAGAAGC CAAGATCGAA TAAGGGAACT TTTTTCTCAA 720GCAGAAAGTC ATTTTCGTAA TTCCATGCCG TCATTTGCAG TTTCCAAATT CGAAGTGCTG 780TTTCTACCAA CATATGCACA AGCTGCAAAT ACACATTTAT TGCTATTAAA AGATGCTCAA 840GTTTTTGGAG AAGAATGGGG ATATTCTTCA GAAGATGTTG CTGAATTTTA TCATAGACAA 900TTAAAACTTA CACAACAATA CACTGACCAT TGTGTTAATT GGTATAATGT TGGATTAAAT 960GGTTTAAGAG GTTCAACTTA TGATGCATGG GTCAAATTTA ACCGTTTTCG CAGAGAAATG 1020ACTTTAACTG TATTAGATCT AATTGTACTT TTCCCATTTT ATGATATTCG GTTATACTCA 1080AAAGGGGTTA AAACAGAACT AACAAGAGAC ATTTTTACGG ATCCAATTTT TTCACTTAAT 1140ACTCTTCAGG AGTATGGACC AACTTTTTTG AGTATAGAAA ACTCTATTCG AAAACCTCAT 1200TTATTTGATT ATTTACAGGG GATTGAATTT CATACGCGTC TTCAACCTGG TTACTTTGGG 1260AAAGATTCTT TCAATTATTG GTCTGGTAAT TATGTAGAAA CTAGACCTAG TATAGGATCT 1320AGTAAGACAA TTACTTCCCC ATTTTATGGA GATAAATCTA CTGAACCTGT ACAAAAGCTA 1380AGCTTTGATG GACAAAAAGT TTATCGAACT ATAGCTAATA CAGACGTAGC GGCTTGGCCG 1440AATGGTAAGG TATATTTAGG TGTTACGAAA GTTGATTTTA GTCAATATGA TGATCAAAAA 1500AATGAAACTA GTACACAAAC ATATGATTCA AAAAGAAACA ATGGCCATGT AAGTGCACAG 1560GATTCTATTG ACCAATTACC GCCAGAAACA ACAGATGAAC CACTTGAAAA AGCATATAGT 1620CATCAGCTTA ATTACGCGGA ATGTTTCTTA ATGCAGGACC GTCGTGGAAC AATTCCATTT 1680TTTACTTGGA CACATAGAAG TGTAGACTTT TTTAATACAA TTGATGCTGA AAAGATTACT 1740CAACTTCCAG TAGTGAAAGC ATATGCCTTG TCTTCAGGTG CTTCCATTAT TGAAGGTCCA 1800GGATTCACAG GAGGAAATTT ACTATTCCTA AAAGAATCTA GTAATTCAAT TGCTAAATTT 1860AAAGTTACAT TAAATTCAGC AGCCTTGTTA CAACGATATC GTGTAAGAAT ACGCTATGCT 1920TCTACCACTA ACTTACGACT TTTTGTGCAA AATTCAAACA ATGATTTTCT TGTCATCTAC 1980ATTAATAAAA CTATGAATAA AGATGATGAT TTAACATATC AAACATTTGA TCTCGCAACT 2040ACTAATTCTA ATATGGGGTT CTCGGGTGAT AAGAATGAAC TTATAATAGG AGCAGAATCT 2100TTCGTTTCTA ATGAAAAAAT CTATATAGAT AAGATAGAAT TTATCCCAGT ACAATTGTAA 2160GGAGATTTTA AAATGTTGGG TGATGGTCAA AATGAAAGAA TAGGAAGGTG AATTTTGATG 2220GTTAGGAAAG ATTCTTTTAA CAAAAGCAAC ATGGAAAAGT ATACAGTACA AATATTAACC 2280(2)序列编号103的信息:
(i)序列特征:
(A)长度:32碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:103:TAGGCCTCCA TCCATGGCAA ACCCTAACAA TC 32(2)序列编号104的信息:
(i)序列特征:
(A)长度:42碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:104:TCCCATCTTC CTACTTACGA CCCTGCAGAA ATACGGTCCA AC 42(2)序列编号105的信息:
(i)序列特征:
(A)长度:28碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:105:GACCTCACCT ACCAAACATT CGATCTTG 28(2)序列编号106的信息:
(i)序列特征:
(A)长度:25碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:106:CGAGTTCTAC CGTAGGCAGC TCAAG 25(2)序列编号107的信息:
(i)序列特征:
(A)长度:1959碱基对
(B)类型:核苷酸
(C)链的性质:单链
(D)拓扑学:线性
(xi)序列描述:序列编号:107:ATGAATCCAA ACAATCGAAG TGAACATGAT ACGATAAAGG TTACACCTAA CAGTGAATTG 60CAAACTAACC ATAATCAATA TCCTTTAGCT GACAATCCAA ATTCAACACT AGAAGAATTA 120AATTATAAAG AATTTTTAAG AATGACTGAA GACAGTTCTA CGGAAGTGCT AGACAACTCT 180ACAGTAAAAG ATGCAGTTGG GACAGGAATT TCTGTTGTAG GGCAGATTTT AGGTGTTGTA 240GGAGTTCCAT TTGCTGGGGC ACTCACTTCA TTTTATCAAT CATTTCTTAA CACTATATGG 300CCAAGTGATG CTGACCCATG GAAGGCTTTT ATGGCACAAG TTGAAGTACT GATAGATAAG 360AAAATAGAGG AGTATGCTAA AAGTAAAGCT CTTGCAGAGT TACAGGGTCT TCAAAATAAT 420TTCGAAGATT ATGTTAATGC GTTAAATTCC TGGAAGAAAA CACCTTTAAG TTTGCGAAGT 480AAAAGAAGCC AAGGTCGAAT AAGGGAACTT TTTTCTCAAG CAGAAAGTCA TTTTCGTAAT 540TCCATGCCGT CATTTGCAGT TTCCAAATTC GAAGTGCTGT TTCTACCAAC ATATGCACAA 600GCTGCAAATA CACATTTATT GCTATTAAAA GATGCTCAAG TTTTTGGAGA AGAATGGGGA 660TATTCTTCAG AAGATGTTGC TGAATTCTAT CGTAGACAAT TAAAACTTAC ACAACAATAC 720ACTGACCATT GTGTTAATTG GTATAATGTT GGATTAAATG GTTTAAGAGG TTCAACTTAT 780GATGCATGGG TCAAATTTAA CCGTTTTCGC AGAGAAATGA CTTTAACTGT ATTAGATCTA 840ATTGTACTTT TCCCATTTTA TGATATTCGG TTATACTCAA AAGGGGTTAA AACAGAACTA 900ACAAGAGACA TTTTTACGGA TCCAATTTTT TTACTTACTA CGCTTCAGAA GTACGGACCA 960ACTTTTTTGA GTATAGAAAA CTCTATTCGA AAACCTCATT TATTTGATTA TTTACAGGGG 1020ATTGAATTTC ATACGCGTCT TCAACCTGGT TACTTTGGGA AAGATTCTTT CAATTATTGG 1080TCTGGTAATT ATGTAGAAAC TAGACCTAGT ATAGGATCTA GTAAGACAAT TACTTCCCCA 1140TTTTATGGAG ATAAATCTAC TGAACCTGTA CAAAAGCTAA GCTTTGATGG ACAAAAAGTT 1200TATCGAACTA TAGCTAATAC AGACGTAGCG GCTTGGCCGA ATGGTAAGGT ATATTTAGGT 1260GTTACGAAAG TTGATTTTAG TCAATATGAT GATCAAAAAA ATGAAACTAG TACACAAACA 1320TATGATTCAA AAAGAAACAA TGGCCATGTA AGTGCACAGG ATTCTATTGA CCAATTACCG 1380CCAGAAACAA CAGATGAACC ACTTGAAAAA GCATATAGTC ATCAGCTTAA TTACGCGGAA 1440TGTTTCTTAA TGCAGGACCG TCGTGGAACA ATTCCATTTT TTACTTGGAC ACATAGAAGT 1500GTAGACTTTT TTAATACAAT TGATGCTGAA AAGATTACTC AACTTCCAGT AGTGAAAGCA 1560TATGCCTTGT CTTCAGGTGC TTCCATTATT GAAGGTCCAG GATTCACAGG AGGAAATTTA 1620CTATTCCTAA AAGAATCTAG TAATTCAATT GCTAAATTTA AAGTTACATT AAATTCAGCA 1680GCCTTGTTAC AACGATATCG TGTAAGAATA CGCTATGCTT CTACCACTAA CTTACGACTT 1740TTTGTGCAAA ATTCAAACAA TGATTTTCTT GTCATCTACA TTAATAAAAC TATGAATAAA 1800GATGATGATT TAACATATCA AACATTTGAT CTCGCAACTA CTAATTCTAA TATGGGGTTC 1860TCGGGTGATA AGAATGAACT TATAATAGGA GCAGAATCTT TCGTTTCTAA TGAAAAAATC 1920TATATAGATA AGATAGAATT TATCCCAGTA CAATTGTAA 1959(2)序列编号108的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(C)链的性质:
(D)拓扑学:线性(xi)序列描述:序列编号: 108:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr Arg Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Leu Leu Thr Thr Leu Gln Lys Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号109的信息:
(i)序列特征:
(A)长度:649个氨基酸
(B)类型:氨基酸
(C)链的性质:
(D)拓扑学:线性(xi) 序列描述: 序列编号: 109:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Ala Thr Glu1 5 10 15Asn Asn Glu Val Ser Asn Asn His Ala Gln Tyr Pro Leu Ala Asp Thr
20 25 30Pro Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Arg Thr Thr
35 40 45Asp Asn Asn Val Glu Ala Leu Asp Ser Ser Thr Thr Lys Asp Ala Ile
50 55 60Gln Lys Gly Ile Ser Ile Ile Gly Asp Leu Leu Gly Val Val Gly Phe65 70 75 80Pro Tyr Gly Gly Ala Leu Val Ser Phe Tyr Thr Asn Leu Leu Asn Thr
85 90 95Ile Trp Pro Gly Glu Asp Pro Leu Lys Ala Phe Met Gln Gln Val Glu
100 105 110Ala Leu Ile Asp Gln Lys Ile Ala Asp Tyr Ala Lys Asp Lys Ala Thr
115 120 125Ala Glu Leu Gln Gly Leu Lys Asn Val Phe Lys Asp Tyr Val Ser Ala
l30 135 140Leu Asp Ser Trp Asp Lys Thr Pro Leu Thr Leu Arg Asp Gly Arg Ser145 150 155 160Gln Gly Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg
165 170 175Arg Ser Met Pro Ser Phe Ala Val Ser Gly Tyr Glu Val Leu Phe Leu
180 185 190Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp
195 200 205Ala Gln Ile Tyr Gly Thr Asp Trp Gly Tyr Ser Thr Asp Asp Leu Asn
210 215 220Glu Phe His Thr Lys Gln Lys Asp Leu Thr Ile Glu Tyr Thr Asn His225 230 235 240Cys Ala Lys Trp Tyr Lys Ala Gly Leu Asp Lys Leu Arg Gly Ser Thr
245 250 255Tyr Glu Glu Trp Val Lys Phe Asn Arg Tyr Arg Arg Glu Met Thr Leu
260 265 270Thr Val Leu Asp Leu Ile Thr Leu Phe Pro Leu Tyr Asp Val Arg Thr
275 280 285Tyr Thr Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Val Leu Thr Asp
290 295 300Pro Ile Val Ala Val Asn Asn Met Asn Gly Tyr Gly Thr Thr Phe Ser305 310 315 320Asn Ile Glu Asn Tyr Ile Arg Lys Pro His Leu Phe Asp Tyr Leu His
325 330 335Ala Ile Gln Phe His Ser Arg Leu Gln Pro Gly Tyr Phe Gly Thr Asp
340 345 350Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Ser Thr Arg Ser Ser Ile
355 360 365Gly Ser Asp Glu Ile Ile Arg Ser Pro Phe Tyr Gly Asn Lys Ser Thr
370 375 380Leu Asp Val Gln Asn Leu Glu Phe Asn Gly Glu Lys Val Phe Arg Ala385 390 395 400Val Ala Asn Gly Asn Leu Ala Val Trp Pro Val Gly Thr Gly Gly Thr
405 410 415Lys Ile His Ser Gly Val Thr Lys Val Gln Phe Ser Gln Tyr Asn Asp
420 425 430Arg Lys Asp Glu Val Arg Thr Gln Thr Tyr Asp Ser Lys Arg Asn Val
435 440 445Gly Gly Ile Val Phe Asp Ser Ile Asp Gln Leu Pro Pro Ile Thr Thr
450 455 460Asp Glu Ser Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Val Arg465 470 475 480Cys Phe Leu Leu Gln Gly Gly Arg Gly Ile Ile Pro Val Phe Thr Trp
485 490 495Thr His Lys Ser Val Asp Phe Tyr Asn Thr Leu Asp Ser Glu Lys Ile
500 505 510Thr Gln Ile Pro Phe Val Lys Ala Phe Ile Leu Val Asn Ser Thr Ser
515 520 525Val Val Ala Gly Pro Gly Phe Thr Gly Gly Asp Ile Ile Lys Cys Thr
530 535 540Asn Gly Ser Gly Leu Thr Leu Tyr Val Thr Pro Ala Pro Asp Leu Thr545 550 555 560Tyr Ser Lys Thr Tyr Lys Ile Arg Ile Arg Tyr Ala Ser Thr Ser Gln
565 570 575Val Arg Phe Gly Ile Asp Leu Gly Ser Tyr Thr His Ser Ile Ser Tyr
580 585 590Phe Asp Lys Thr Met Asp Lys Gly Asn Thr Leu Thr Tyr Asn Ser Phe
595 600 605Asn Leu Ser Ser Val Ser Arg Pro Ile Glu Ile Ser Gly Gly Asn Lys
610 615 620Ile Gly Val Ser Val Gly Gly Ile Gly Ser Gly Asp Glu Val Tyr Ile625 630 635 640Asp Lys Ile Glu Phe Ile Pro Met Asp
645(2)序列编号110的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(C)链的性质:
(D)拓扑学:线性(xi) 序列描述: 序列编号: 110:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Pro Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asp Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp Ala Gln Val Phe Gly Glu Glu Trp Gly Tyr Ser Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Val Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Ser
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Ile Tyr Phe Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Gly Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Ile Val Ile
580 585 590Tyr IIe Asn Lys Thr Met Asn Ile Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Thr
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号111的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(C)链的性质:
(D)拓扑学:线性(xi) SEQUENCE DESCRIPTION:SEQ ID NO:111:Met Asn Pro Asn Asn Arg Ser Glu His Asp Thr Ile Lys Val Thr Pro1 5 10 15Asn Ser Glu Leu Gln Thr Asn His Asn Gln Tyr Pro Leu Ala Asp Asn
20 25 30Pro Asn Ser Thr Leu Glu Glu Leu Asn Tyr Lys Glu Phe Leu Arg Met
35 40 45Thr Glu Asp Ser Ser Thr Glu Val Leu Asp Asn Ser Thr Val Lys Asp
50 55 60Ala Val Gly Thr Gly Ile Ser Val Val Gly Gln Ile Leu Gly Val Val65 70 75 80Gly Val Pro Phe Ala Gly Ala Leu Thr Ser Phe Tyr Gln Ser Phe Leu
85 90 95Asn Thr Ile Trp Pro Ser Asp Ala Asp Pro Trp Lys Ala Phe Met Ala
100 105 110Gln Val Glu Val Leu Ile Asp Lys Lys Ile Glu Glu Tyr Ala Lys Ser
115 120 125Lys Ala Leu Ala Glu Leu Gln Gly Leu Gln Asn Asn Phe Glu Asp Tyr
130 135 140Val Asn Ala Leu Asn Ser Trp Lys Lys Thr Pro Leu Ser Leu Arg Ser145 150 155 160Lys Arg Ser Gln Asp Arg Ile Arg Glu Leu Phe Ser Gln Ala Glu Ser
165 170 175His Phe Arg Asn Ser Met Pro Ser Phe Ala Val Ser Lys Phe Glu Val
180 185 190Leu Phe Leu Pro Thr Tyr Ala Gln Ala Ala Asn Thr His Leu Leu Leu
195 200 205Leu Lys Asp ALa Gln Val Phe Gly Glu Glu Trp Gly Tyr 5er Ser Glu
210 215 220Asp Val Ala Glu Phe Tyr His Arg Gln Leu Lys Leu Thr Gln Gln Tyr225 230 235 240Thr Asp His Cys Val Asn Trp Tyr Asn Val Gly Leu Asn Gly Leu Arg
245 250 255Gly Ser Thr Tyr Asp Ala Trp Val Lys Phe Asn Arg Phe Arg Arg Glu
260 265 270Met Thr Leu Thr Val Leu Asp Leu Ile Val Leu Phe Pro Phe Tyr Asp
275 280 285Ile Arg Leu Tyr Ser Lys Gly Val Lys Thr Glu Leu Thr Arg Asp Ile
290 295 300Phe Thr Asp Pro Ile Phe Ser Leu Asn Thr Leu Gln Glu Tyr Gly Pro305 310 315 320Thr Phe Leu Ser Ile Glu Asn Ser Ile Arg Lys Pro His Leu Phe Asp
325 330 335Tyr Leu Gln Gly Ile Glu Phe His Thr Arg Leu Gln Pro Gly Tyr Phe
340 345 350Gly Lys Asp Ser Phe Asn Tyr Trp Ser Gly Asn Tyr Val Glu Thr Arg
355 360 365Pro Ser Ile Gly Ser Ser Lys Thr Ile Thr Ser Pro Phe Tyr Gly Asp
370 375 380Lys Ser Thr Glu Pro Val Gln Lys Leu Ser Phe Asp Gly Gln Lys Val385 390 395 400Tyr Arg Thr Ile Ala Asn Thr Asp Val Ala Ala Trp Pro Asn Gly Lys
405 410 415Val Tyr Leu Gly Val Thr Lys Val Asp Phe Ser Gln Tyr Asp Asp Gln
420 425 430Lys Asn Glu Thr Ser Thr Gln Thr Tyr Asp Ser Lys Arg Asn Asn Gly
435 440 445His Val Ser Ala Gln Asp Ser Ile Asp Gln Leu Pro Pro Glu Thr Thr
450 455 460Asp Glu Pro Leu Glu Lys Ala Tyr Ser His Gln Leu Asn Tyr Ala Glu465 470 475 480Cys Phe Leu Met Gln Asp Arg Arg Gly Thr Ile Pro Phe Phe Thr Trp
485 490 495Thr His Arg Ser Val Asp Phe Phe Asn Thr Ile Asp Ala Glu Lys Ile
500 505 510Thr Gln Leu Pro Val Val Lys Ala Tyr Ala Leu Ser Ser Gly Ala Ser
515 520 525Ile Ile Glu Gly Pro Gly Phe Thr Gly Gly Asn Leu Leu Phe Leu Lys
530 535 540Glu Ser Ser Asn Ser Ile Ala Lys Phe Lys Val Thr Leu Asn Ser Ala545 550 555 560Ala Leu Leu Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr
565 570 575Asn Leu Arg Leu Phe Val Gln Asn Ser Asn Asn Asp Phe Leu Val Ile
580 585 590Tyr Ile Asn Lys Thr Met Asn Lys Asp Asp Asp Leu Thr Tyr Gln Thr
595 600 605Phe Asp Leu Ala Thr Thr Asn Ser Asn Met Gly Phe Ser Gly Asp Lys
610 615 620Asn Glu Leu Ile Ile Gly Ala Glu Ser Phe Val Ser Asn Glu Lys Ile625 630 635 640Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Gln Leu
645 650(2)序列编号112的信息:
(i)序列特征:
(A)长度:659个氨基酸
(B)类型:氨基酸
(C)链的性质:
(D)拓扑学:线性(xi)序列描述:序列编号:112Met Ile Arg Met Gly Gly Arg Lys Met Asn Pro Asn Asn Arg Ser Glu1 5 10 15Tyr Asp Thr Ile Lys Val Thr Pro Asn Ser Glu Leu Pro Thr Asn His
20 25 30Asn Gln Tyr Pro Leu Ala Asp Asn Pro Asn Ser Thr Leu Glu Glu Leu
35 40 45Asn Tyr Lys Glu Phe Leu Arg Met Thr Ala Asp Asn Ser Thr Glu Val
50 55 60Leu Asp Ser Ser Thr Val Lys Asp Ala Val Gly Thr Gly Ile Ser Val65 70 75 80Val Gly Gln Ile Leu Gly Val Val Gly Val Pro Phe Ala Gly Ala Leu
85 90 95Thr Ser Phe Tyr Gln Ser Phe Leu Asn Ala Ile Trp Pro Ser Asp Ala
100 l05 110Asp Pro Trp Lys Ala Phe Met Ala Gln Val Glu Val Leu Ile Asp Lys
115 120 125Lys Ile Glu Glu Tyr Ala Lys Ser Lys Ala Leu Ala Glu Leu Gln Gly
130 135 140Leu Gln Asn Asn Phe Glu Asp Tyr Val Asn Ala Leu Asp Ser Trp Lys145 150 155 160Lys Ala Pro Val Asn Leu Arg Ser Arg Arg Ser Gln Asp Arg Ile Arg
165 170 175Glu Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro Ser
180 185 190Phe Ala Val Ser Lys Phe Glu Val Leu Phe Leu Pro Thr Tyr Ala Gln
195 200 205Ala Ala Asn Thr His Leu Leu Leu Leu Lys Asp Ala Gln Val Phe Gly
210 215 220Glu Glu Trp Gly Tyr Ser Ser Glu Asp Ile Ala Glu Phe Tyr Gln Arg225 230 235 240Gln Leu Lys Leu Thr Gln Gln Tyr Thr Asp His Cys Val Asn Trp Tyr
245 250 255Asn Val Gly Leu Asn Ser Leu Arg Gly Ser Thr Tyr Asp Ala Trp Val
260 265 270Lys Phe Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu
275 280 285Ile Val Leu Phe Pro Phe Tyr Asp Val Arg Leu Tyr Ser Lys Gly Val
290 295 300Lys Thr Glu Leu Thr Arg Asp Ile Phe Thr Asp Pro Ile Phe Thr Leu305 310 315 320Asn Ala Leu Gln Glu Tyr Gly Pro Thr Phe Ser Ser Ile Glu Asn Ser
325 330 335Ile Arg Lys Pro His Leu Phe Asp Tyr Leu Arg Gly Ile Glu Phe His
340 345 350Thr Arg Leu Arg Pro Gly Tyr Ser Gly Lys Asp Ser Phe Asn Tyr Trp
355 360 365Ser Gly Asn Tyr Val Glu Thr Arg Pro Ser Ile Gly Ser Asn Asp Thr
370 375 380Ile Thr Ser Pro Phe Tyr Gly Asp Lys Ser Ile Glu Pro Ile Gln Lys385 390 395 400Leu Ser Phe Asp Gly Gln Lys Val Tyr Arg Thr Ile Ala Asn Thr Asp
405 410 415Ile Ala Ala Phe Pro Asp Gly Lys Ile Tyr Phe Gly Val Thr Lys Val
420 425 430Asp Phe Ser Gln Tyr Asp Asp Gln Lys Asn Glu Thr Ser Thr Gln Thr
435 440 445Tyr Asp Ser Lys Arg Tyr Asn Gly Tyr Leu Gly Ala Gln Asp Ser Ile
450 455 460Asp Gln Leu Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Ala Tyr465 470 475 480Ser His Gln Leu Asn Tyr Ala Glu Cys Phe Leu Met Gln Asp Arg Arg
485 490 495Gly Thr Ile Pro Phe Phe Thr Trp Thr His Arg Ser Val Asp Phe Phe
500 505 510Asn Thr Ile Asp Ala Glu Lys Ile Thr Gln Leu Pro Val Val Lys Ala
515 520 525Tyr Ala Leu Ser Ser Gly Ala Ser Ile Ile Glu Gly Pro Gly Phe Thr
530 535 540Gly Gly Asn Leu Leu Phe Leu Lys Glu Ser Ser Asn Ser Ile Ala Lys545 550 555 560Phe Lys Val Thr Leu Asn Ser Ala Ala Leu Leu Gln Arg Tyr Arg Val
565 570 575Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu Arg Leu Phe Val Gln Asn
580 585 590Ser Asn Asn Asp Phe Leu Val Ile Tyr Ile Asn Lys Thr Met Asn Ile
595 600 605Asp Gly Asp Leu Thr Tyr Gln Thr Phe Asp Phe Ala Thr Ser Asn Ser
610 615 620Asn Met Gly Phe Ser Gly Asp Thr Asn Asp Phe Ile Ile Gly Ala Glu625 630 635 640Ser Phe Val Ser Asn Glu Lys Ile Tyr Ile Asp Lys Ile Glu Phe Ile
645 650 655Pro Val Gln(2)序列编号113的信息:
(i)序列特征:
(A)长度:652个氨基酸
(B)类型:氨基酸
(C)链的性质:
(D)拓扑学:线性(xi)序列描述:序列编号:113:Met Ile Arg Lys Gly Gly Arg Lys Met Asn Pro Asn Asn Arg Ser Glu1 5 10 15His Asp Thr Ile Lys Thr Thr Glu Asn Asn Glu Val Pro Thr Asn His
20 25 30Val Gln Tyr Pro Leu Ala Glu Thr Pro Asn Pro Thr Leu Glu Asp Leu
35 40 45Asn Tyr Lys Glu Phe Leu Arg Met Thr Ala Asp Asn Asn Thr Glu Ala
50 55 60Leu Asp Ser Ser Thr Thr Lys Asp Val Ile Gln Lys Gly Ile Ser Val65 70 75 80Val Gly Asp Leu Leu Gly Val Val Gly Phe Pro Phe Gly Gly Ala Leu
85 90 95Val Ser Phe Tyr Thr Asn Phe Leu Asn Thr Ile Trp Pro Ser Glu Asp
100 105 110Pro Trp Lys Ala Phe Met Glu Gln Val Glu Ala Leu Met Asp Gln Lys
115 120 125Ile Ala Asp Tyr Ala Lys Asn Lys Ala Leu Ala Glu Leu Gln Gly Leu
130 135 140Gln Asn Asn Val Glu Asp Tyr Val Ser Ala Leu Ser Ser Trp Gln Lys145 150 155 160Asn Pro Val Ser Ser Arg Asn Pro His Ser Gln Gly Arg Ile Arg Glu
165 170 175Leu Phe Ser Gln Ala Glu Ser His Phe Arg Asn Ser Met Pro Ser Phe
180 185 190Ala Ile Ser Gly Tyr Glu Val Leu Phe Leu Thr Thr Tyr Ala Gln Ala
195 200 205Ala Asn Thr His Leu Phe Leu Leu Lys Asp Ala Gln Ile Tyr Gly Glu
210 215 220Glu Trp Gly Tyr Glu Lys Glu Asp Ile Ala Glu Phe Tyr Lys Arg Gln225 230 235 240Leu Lys Leu Thr Gln Glu Tyr Thr Asp His Cys Val Lys Trp Tyr Asn
245 250 255Val Gly Leu Asp Lys Leu Arg Gly Ser Ser Tyr Glu Ser Trp Val Asn
260 265 270Phe Asn Arg Tyr Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile
275 280 285Ala Leu Phe Pro Leu Tyr Asp Val Arg Leu Tyr Pro Lys Glu Val Lys
290 295 300Thr Glu Leu Thr Arg Asp Val Leu Thr Asp Pro Ile Val Gly Val Asn305 310 315 320Asn Leu Arg Gly Tyr Gly Thr Thr Phe Ser Asn Ile Glu Asn Tyr Ile
325 330 335Arg Lys Pro His Leu Phe Asp Tyr Leu His Arg Ile Gln Phe His Thr
340 345 350Arg Phe Gln Pro Gly Tyr Tyr Gly Asn Asp Ser Phe Asn Tyr Trp Ser
355 360 365Gly Asn Tyr Val Ser Thr Arg Pro Ser Ile Gly Ser Asn Asp Ile Ile
370 375 380Thr Ser Pro Phe Tyr Gly Asn Lys Ser Ser Glu Pro Val Gln Asn Leu385 390 395 400Glu Phe Asn Gly Glu Lys Val Tyr Arg Ala Val Ala Asn Thr Asn Leu
405 410 415Ala Val Trp Pro Ser Ala Val Tyr Ser Gly Val Thr Lys Val Glu Phe
420 425 430Ser Gln Tyr Asn Asp Gln Thr Asp Glu Ala Ser Thr Gln Thr Tyr Asp
435 440 445Ser Lys Arg Asn Val Gly Ala Val Ser Trp Asp Ser Ile Asp Gln Leu
450 455 460Pro Pro Glu Thr Thr Asp Glu Pro Leu Glu Lys Gly Tyr Ser His Gln465 470 475 480Leu Asn Tyr Val Met Cys Phe Leu Met Gln Gly Ser Arg Gly Thr Ile
485 490 495Pro Val Leu Thr Trp Thr His Lys Ser Val Asp Phe Phe Asn Met Ile
500 505 510Asp Ser Lys Lys Ile Thr Gln Leu Pro Leu Val Lys Ala Tyr Lys Leu
515 520 525Gln Ser Gly Ala Ser Val Val Ala Gly Pro Arg Phe Thr Gly Gly Asp
530 535 540Ile Ile Gln Cys Thr Glu Asn Gly Ser Ala Ala Thr Ile Tyr Val Thr545 550 555 560Pro Asp Val Ser Tyr Ser Gln Lys Tyr Arg Ala Arg Ile His Tyr Ala
565 570 575Ser Thr Ser Gln Ile Thr Phe Thr Leu Ser Leu Asp Gly Ala Pro Phe
580 585 590Asn Gln Tyr Tyr Phe Asp Lys Thr Ile Asn Lys Gly Asp Thr Leu Thr
595 600 605Tyr Asn Ser phe Asn Leu Ala Ser Phe Ser Thr Pro Phe Glu Leu Ser
610 615 620Gly Asn Asn Leu Gln Ile Gly Val Thr Gly Leu Ser Ala Gly Asp Lys625 630 635 640Val Tyr Ile Asp Lys Ile Glu Phe Ile Pro Val Asn
645 650