CN1195855C

CN1195855C - 棉子糖合酶基因及其用途

Info

Publication number: CN1195855C
Application number: CNB971072795A
Authority: CN
Inventors: 渡辺英二郎; 大江田宪治
Original assignee: Sumitomo Chemical Co Ltd
Current assignee: Sumitomo Chemical Co Ltd
Priority date: 1996-12-18
Filing date: 1997-12-18
Publication date: 2005-04-06
Anticipated expiration: 2017-12-18
Also published as: ES2276416T3; DK0849359T3; CN1190129A; US7723567B1; CA2218448A1; EP0849359A3; BR9706398A; EP0849359A2; DE69736972D1; CA2218448C; AR010362A1; ATE346142T1; DE69736972T2; RU2224022C2; EP0849359B1; KR19980064209A

Abstract

从不同的植物中分离编码能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白的棉子糖合酶基因。这些棉子糖合酶基因对改变植物中棉子糖族寡糖的含量是有用的。

Description

棉子糖合酶基因及其用途

发明领域

本发明涉及棉子糖(raffinose)合酶基因及其用途。

发明背景

棉子糖族寡糖是蔗糖的衍生物，其由O-α-D-吡喃型半乳糖(galactopyranosyl)-(1→6)n-o-α-D-吡喃型葡萄糖(glucopyraosyl(1→2)-β-D-flucto-呋喃糖苷(furanoside)作为通式所代表，并且当n＝1时将它们命名为“棉子糖”，当n＝2时命名为“木苏糖(stachyose)”，当n＝3时命名为“毛蕊花糖(verbascose)”，且当n＝4时命名为“筋骨草糖”(ajugose)。

除了蔗糖以外，这种棉子糖族寡糖的最大含量发现于植物中，并且已知它们不仅含于高等植物包括裸子植物和松科的(pinaceous)植物(如，云杉)和被子植物如豆科(leguminous)植物(如，大豆、菜豆)，芸苔科(brassiceeous)植物(如，饲料芸苔(rape))、藜科(chenopodiaceous)植物(如，甜菜)、锦葵科植物(如，棉花)以及杨柳科植物(如，杨树)，而且含于绿藻、小球藻属(chlorella)。因此，它们与蔗糖一样广泛存在于植物界中。

棉子糖族寡糖在许多植物的贮存器官或种子中作为储备糖或在有些植物组织间的糖运输现象中作为易位糖而发挥作用。

此外，已知如果以适当的量存在于食物中，棉子糖族寡糖具有产生良好状态肠杆菌植物的作用。因此，棉子糖族寡糖已用作用于添加至有些种类食物中的有功能食物材料并用于特定健康食物的领域。

通过在许多植物中以蔗糖起始的棉子糖族寡糖合成系统制备具有这种作用和用途的棉子糖族寡糖。该生物合成系统通常包括这样的反应，即经过α(1→b)键将来自galactotinol的半乳糖基团连续添加至附着于蔗糖分子中D-葡萄糖残基位置6的碳原子的羟基上。

在该生物合成系统的第一步中，棉子糖合酶是关于通过以下方法棉子糖制备反应的酶，即将来自galactotinol的D-半乳糖基团经过α(1→b)键与附着于蒸糖分子中D-葡萄糖残基位置6碳原子的羟基结合。已表明该酶构成了上面合成系统中的限速步骤，并且已显示该酶在控制棉子糖族寡糖生物合成中是相当重要的。

控制棉子糖合酶在植物中的表达水平或活性使改变棉子糖族寡糖在这些植物中的含量是可能的。然而，虽然该酶本身的存在已通过用生化技术测其活性而证实，但棉子糖合酶仍然没有成功地作为均一蛋白而分离和纯化。此外，该酶的氨基酸序列仍然是未知的，并且没有试图开始分离编码该酶基因的报导。

在这些情况下，本发明者进行了深入的研究最终成功地从蚕豆中分离出棉子糖合酶和编该酶的基因。由此完成了本发明。

因此，本发明提供下面(的内容)：

1)从植物中分离的并具有编码能通过以下方法制备棉子糖的蛋白氨基酸序列的核苷酸序列的棉子糖合酶基因，即将D-半乳糖基团经α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子的羟基上。

2)根据第1条的棉子糖合酶基因，其中的植物为双子叶植物。

3)根据第2条的棉子糖合酶基因，其中的双子叶植物为豆科植物。

4)根据第3条的棉子糖合酶基因，其中的豆科植物为蚕豆。

5)具有编码下述蛋白(a)或(b)核苷酸序列的棉子糖合酶基因：

(a)具有SEQ ID No：1氨基酸序列的蛋白；

(b)具有在SEQ ID No：1的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列，并能够通过将D-半乳糖基团经过α(1→6)键与附着于蒸糖分子中D-葡萄糖残基位置6碳原子的羟基结合而制备棉子糖的蛋白。

6)具有SEQ ID No：2核苷酸序列的棉子糖合酶基因。

7)根据第3条的棉子糖合酶基因，其中的豆科植物为大豆。

8)具有编码下述蛋白(a)或(b)核苷酸序列的棉子糖合酶基因：

(a)具有SEQ ID No：3氨基酸序列的蛋白；

(B)具有在SEQ ID No：3的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列，并能够通过将D-半乳糖基团经过α(1→6)键与附着于蒸糖分子中D-葡萄糖残基的位置6碳原子的羟基结合而制备棉子糖的蛋白。

9)具有SEQ ID No：4：核苷酸序列的棉子糖合酶基因。

10)根据第2条的棉子糖合酶基因，其中的双子叶植物为唇形科植物。

11)根据第10条的棉子糖合酶基因，其中的唇形科植物为日本菜蓟(Japanese artichoke)。

12)具有编码SEQ ID No：5氨基酸序列的核苷酸序列的棉子糖合酶基因。

13)具有SEQ ID No：6核苷酸序列的棉子糖合酶基因。

14)根据第1条的棉子糖合酶基因，其中的植物为单子叶植物。

15)根据第14条的棉子糖合酶基因，其中的单子叶植物为禾本科植物。

16)根据第15条的棉子糖合酶基因，其中的禾本科植物为玉米(corn)。

17)具有编码SEQ ID No：7氨基酸序列的核苷酸序列的棉子糖合酶基因。

18)具有SEQ ID No：8核苷酸序列的棉子糖合酶基因。

19)具有下述的氨基酸序列(a)或(b)的棉子糖合酶蛋白。

(a)SEQ ID No：1或SEQ ID No：3的氨基酸序列。

(b)SEQ ID No：1：或SEQ ID No：3的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列；

该蛋白能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。

20)具有SEQ ID No：1：或SEQ ID No：3氨基酸序列的棉子糖合酶蛋白。

21)具有第1、2、3、4、7、10、11、14、15或16条棉子糖合酶基因部分核苷酸序列的基因片段。

22)具有第5、6、8、9、12、13、17或18条棉子糖合酶基因部分核苷酸序列的基因片段。

23)根据第21条或第22条的基因片段，其中的核苷酸数目在从15到50的范围内。

24)用于检测棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法，包括将标记的第21、22或23条基因片段的探针与有机体得到的基因组DNA或cDNA片段杂交；并且检测特异地与探针结合的DNA片段。

25)用于检测棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法，包括将标记的第21、22或23条基因片段的探针与植物得到的基因组DNA或cDNA片段杂交；并且检测特异地与探针结合的DNA片段。

26)用于扩增棉子糖合酶基因或具有其部分核苷酸序列的基因片段的方法，包括将具有第21、22或23条基因片段核苷酸序列的引物与有机体得到的基因组DNA或cDNA退火；并且通过聚合酶链式反应扩增得到的DNA片段。

27)用于扩增棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法，包括将具有第21、22或23条基因片段核苷酸序列的引物与植物得到的基因组DNA或cDNA退火；并且通过聚合酶链式反应扩增得到的DNA片段。

28)用于获得棉子糖合酶基因的方法，包括以下步骤：即通过第24、25、26或27条的方法鉴定含有棉子糖合酶基因或具有其部分核苷酸序列基因片段的DNA片段；和分离及纯化鉴定的DNA片段。

29)通过第24、25、26或27条方法鉴定含有棉子糖合酶基因或具有其部分核苷酸序列基因片段的DNA片段而获得棉子糖合酶基因；和分离及纯化鉴定的DNA片段。

30)包括第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或29条棉子糖合酶基因，和连接到其上的启动子的嵌合体基因。

31)通过将第30条的嵌合体基因导入宿主有机体而获得的转化子。

32)包括第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29或30棉子糖合酶基因的质粒。

33)以第32条质粒转化的宿主有机体，或其细胞。

34)以第32条质粒转化的微生物。

35)以第32条质粒转化的植物或其细胞。

36)用于代谢修饰的方法，包括将第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29或30条的棉子糖合酶基因导入宿主有机体或其细胞，从而使宿主有机体中棉子糖族寡糖的含量发生变化。

37)用于制备棉子糖合酶蛋白的方法，包括从通过培养第34条的微生物而获得的培养物中分离和纯化棉子糖合酶蛋白。

38)能够结合第19或20条棉子糖合酶蛋白的抗棉子糖合酶抗体。

39)用于检测棉子糖合酶蛋白的方法，包括以第38条的抗棉子糖合酶抗体检测蛋白；和通过该抗体与棉子糖合酶蛋白之间的抗原-抗体反应检测棉子糖合酶蛋白。

附图简述

图1显示用于棉子糖合酶基因在大肠杆菌中表达的质粒的构建。pBluescript KS-RS为含有克隆于其中的棉子糖合酶基因的质粒。RS代表棉子糖合酶基因，并且显示于该图上部的核苷酸序列为棉子糖合酶基因两个末端部分的核苷酸序列。由小写字母代表的部分序列为来自载体pBluescript II KS-的核苷酸序列。两个加框的核苷酸序列分别为棉子糖合酶基因的起始密码子(ATG)和终止密码子(TGATAA)。几个限制性核酸内切酶的识别位点显示于核苷酸序列的上方。pGEX-RS和pTrc-RS为用于棉子糖合酶基因在大肠杆菌中表达的质粒。Ptac、Ptrc、GST、lacI^q和rrnB分别代表tac启动子。trc启动子，谷胱甘肽-S-转移酶基因，乳糖阻遇蛋白基因和核糖体RNA转录终止信号。

图2显示用于在植物中表达每个具有棉子糖合酶基因和连接到其上的启动子的嵌合基因的表达载体的构建。克隆于质粒pBluescript KS-RS中棉子糖合酶基因的限制性核酸内切酶图谱显示于该图的下方。pBI221RS和pBI221(-)RS表示用于大豆转化表达载体的限制性核酸内切酶图谱。35S和NOS分别代表来自花椰菜花叶病毒的35S启动子和胭脂氨酸合酶基因终止子。

图3显示用于在植物中表达每个具有棉子糖合酶基因和连接到其上的启动子的嵌合基因的表达载体的构建。克隆于质粒pBluescript KS-RS中的棉子糖合酶基因限制性核酸内切酶图谱显示于该图的上方。pBI121RS和pBI121(-)RS表示用于芥子转化二等分载体(binary vectors)的限制性核酸内切酶图谱。对于二等分载体，仅显示右边缘与左边缘之间的部分。35S NOS和NPT分别代表来自花椰菜花叶病毒的35S启动子。胭脂氨酸合酸基因终止子和卡那霉素抗生基因。

发明详述

下述的基因工程可根据一般方法完成，例如，在“分子克隆：实验指南第2版”(1989)，冷泉港实验室出版社，ISBN 0-87969-309-6；“当前分子生物学方法”(1987)，John Wiley & Sons，Inc.ISBN 0-471-50338-X；和“当前蛋白科学方法”(1995)，John Wiley & Sons，Inc.ISBN 0-471-11184-8中所述。

用于这里的“棉子糖合酶基因”指具有编码以下蛋白氨基酸序列的核苷酸序列的基因(以下简称为本基因)，这种蛋白能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖并且可以植物中制备这种基因。

更为具体地，可以双子叶植物如豆科植物(如，蚕豆，大豆)和唇形科<如，日本菜蓟>或从单子叶植物和禾本科植物(如，玉米)中制备本基因。本基因的具体实例有“具有编码具有SEQ ID No：1氨基酸序列蛋白的核苷酸序列的棉子糖合酶基因”，“具有编码具有通过在SEQ ID No：1的氨基酸序列中缺失、替代、修饰或添加1个或几个氨基酸而获得的氨基酸序列，并且能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖子分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白核苷酸序列的棉子糖合酶基因”；“具有编码具有SED ID No：3氨基酸序列蛋白核苷酸序列的棉子糖合酶基因；”“具有编码具有通过在SEQ ID No：3氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而获得的氨基酸序列；并且能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白核苷酸序列的棉子糖合酶基因”；“具有编码SEQ ID No：5氨基酸序列的核苷酸序列的棉子糖合酶基因”；以及“具有编码SEQ ID No：7氨基酸序列物核苷酸序列的棉子糖合酶基因。”

例如，本发明可通过下面的方法获得。

在液氮中冷冻豆科植物如蚕豆(Vicia faba)或大豆(Grlycine max)的组织并用臼或其它方法物理研磨成细粉状组织碎片。通过一般方法从组织碎片中提取RNA。在提取中可利用商业上可得到的RNA提取试剂盒。通过乙醇沉淀从RNA提取物中分离总RNA。通过一般方法从分离的总RNA中分离具poly-A尾部的RNA。在分离中可利用商业上可得到的oligo-dT柱。通过一般方法从获得的分离物(即，具poly-A尾部的RNA)中合成cDNA。在合成中可利用商业上可得到的cDNA合成试剂盒。

例如，作为本基因“具有编码具有SEQ ID No：1：氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的cDNA片段可用上面获得的蚕豆cDNA作为模板和显示于下表1中的引物1到3通过PCR扩增获得。根据SEQ ID No：2的核苷酸序列依据目的可设计和合成用于此的引物。例如，为了扩增“具有编码具有SEQ ID No：1氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的开放阅读框区域”；可设计和合成显示于下表2的引物1到4。

用相同的方式，可用从大豆获得的cDNA作为模板和，例如，显示于下表1中的引物4到6通过PCR扩增获得“具有编码具有SEQ ID No：3氨基酸序列蛋白核苷酸序列棉子糖合酶基因”的cDNA片段。可根据SEQ ID No：4的核苷酸序列，依据目的设计和合成用于基中的引物。例如，为了扩增“具有编码具有SEQ ID No：3氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的开放阅读框区域，可设计和合成显示于表2中的引物5到8。

可根据一般方法，例如在“分子克隆；实验指南第2版”(1989)，冷泉港实验室出版社；和“当前分子生物学方法”(1987)，John wiley & SonsInc.ISBN 0-471-50338-X中所述，亚克隆扩增的DNA片段。更为具体地，克隆可，例如，用TA克隆试剂盒(Invitrogen)和质粒载体如pBluescnpt II(stratagene)完成。克隆DNA片段的核苷酸序列可通过双脱氧终止方法测定，例如，由F.Sanger，S，Nicklen，A.R.Coulson，在美国科学院院报(1977)，74，pp.5463-5467中所述。例如，可优选使用从珀金-埃尔默商业上可得到的ABI PRISM Dye终止子循环测序现成反应试剂盒。

(序列表1)

引物1：AATTTTCAAG CATAGCCAAG TTAACCACCT 30 聚体

引物2：GCTCACAAGA TAATGATGTT AGTC 24 聚体

引物3：ATACAAGTGA GGAACTTGAC CA 22 聚体

引物4：CCAAACCATA GCAAACCTAA GCAC 24 聚体

引物5：ACAACAGAAA AATATGACTC TTATTACT 28 聚体

引物6：AAAAGAGAGT CAAACATCAT AGTATC 26 聚体

(序列表2)

引物1：ATGGCACCAC CAAGCATAAC CAAAACTGC 29 聚体

引物2：ATGGCACCAC CAAGCATAAC CAAAACTGCA ACCCTCCAAG ACG 43 聚体

引物3：TCAAAATAAA AACTGGACCA AAGAC 25 聚体

引物4：TCAAAATAAA AACTGGACCA AAGACAATGT 30 聚体

引物5：ATGGCTCCAA GCATAAGCAA AACTG 25 聚体

引物6：ATGGCTCCAA GCATAAGCAA AACTGTGGAA CT 32 聚体

引物7：TCAAAATAAA AACTCAACCA TTGAC 25 聚体

引物8：TCAAAATAAA AACTCAACCA TTGACAATTT TGAAGCACT 39 聚体

用于这里的术语“基因片段”指具有本基因部分核苷酸序列的基因片段(以下简称为本基因片段)。例如，其可以是来自植物并具有下面基因部分核苷酸序列的基因片段，该基因具有编码能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖位置6碳原子上的羟基结合而制备棉子糖蛋白的苷酸序列。本基因片段的具体实例是具有基因的部分核苷酸序列的一种基因片段，该基因具有编码SEQ ID No：1氨基酸序列的核苷酸序列和具有基因的部分核苷酸序列的一种基因片段，该基因具有SEQ ID No：2核苷酸序列，更为具体地具有核苷酸序列或其部分苷酸序列，编码显示于下表3中任一氨基酸序列的一种基因片段。

这些基因段可用作杂交方法中的探针或PCR方法中的引物。对于PCR方法中的引物，从确保退火特异性的观点出发，一般其核苷酸数目较大是优选的；然而，从以下观点出发，即引物本身易具有更高极结构从而导致退火效率可能的弱化并在合成后的纯化中需要复杂的程序，其核苷酸数目不太大也是优选的。在通常情况下，由单链DNA所组成的基因片段，其中的核苷酸数目在15到50范围内是优选的。

(序列表3)

#1 Gly Ile Lys Phe Met Ser Ile Phe Arg Phe Lys Val Trp Trp Thr Thr

His Trp Val Gly

#2 Ile Ile Asp Lys Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr

#3 Gly Gly Cys Pro Pro Gly Phe Val Ile Ile Asp Asp Gly Trp Gln

#4 Thr Ser Ala Gly Glu Gln Met Pro Cys Arg Leu Val Lys Tyr Glu Glu

Asn

#5 Val Tyr Val Trp His Ala Leu Cys Gly Tyr Trp Gly Gly Val Arg Pro

#6 Thr Met Glu Asp Leu Ala Val Asp Lys Ile Val Glu Asn Gly Val Gly

Leu Val Pro Pro

#7 Gly Leu His Ser His Leu Glu Ser Ala Gly Ile Asp Gly Val Lys Val

Asp Val Ile His Leu Leu Glu

#8 Gly Gly Arg Val Glu Leu Ala Arg Ala Tyr Tyr Lys Ala Leu

#9 Val Lys Lys His Phe Lys Gly Asn Gly Val Ile Ala

#10 Glu His Cys Asn Asp Phe Phe Leu Leu Gly Thr Glu Ala Ile Ser Leu

Gly Arg Val Gly Asp Asp Phe Trp Cys Ser Asp Pro Ser Gly Asp Pro

Asn Gly Thr Tyr Trp Leu Gln Gly Cys His Met Val His Cys

#11 Ala Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln Pro Asp Trp Asp

Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His Ala Ala Ser Arg

Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp

#12 Leu Pro Asp Gly Ser Ile Leu Arg Cys

#13 Ala Leu Pro Thr Arg Asp Cys Leu Phe Glu Asp Pro Leu His Asn Gly

Lys Thr Met Leu Lys Ile Trp Asn

#14 Gly Val Leu Gly Leu Phe Asn Cys Gln Gly Gly Gly Trp

#15 Phe Ala pro Ile Gly Leu Val Asn Met

标记本基因片段，且然后用作杂交方法中的探针并与有机体获得的DNA杂交，从而可检测具有特异结合到其上探针的DNA片段。因此，从有机体获得的基因文库中，可检测具有编码能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖酶的氨基酸序列的核苷酸序列的棉子糖合酶基因；或具有其部分核苷酸序列的基因片段(以下简称为本检测方法)。

作为从有机体获得的DNA，可以使用例如，所需植物的cDNA文库或基因组文库。基因文库也可以是商上可得到的基因文库或根据一般的文库制备方法制备的文库，例如，在“分子克隆：实验指南第2版”(1989)，冷泉港实验室出版社；“当前分子生物学方法”(1987)，John Wiely& Sons，Inc.ISBN 0-471-50338-X中所述的方法。

作为杂交方法，根据用于文库制备中载体的种类，可使用噬菌斑杂交或菌落杂交。更为具体地，当待用的文库以噬菌体载体构建时，在无菌条件下将合适的宿主微生物与噬菌体混合，进一步与软琼脂培养基混合，并将混合物铺板于琼脂培养基上。之后，于37℃培养培养物直到合适大小的噬菌斑出现。当待用的文库以质粒载体构建时，将该已修改质粒转化入合适的宿主微生物以形成转化子。将获得的转化子稀释至合适的浓度，并将稀释液铺板于琼脂培养基上，然后于37℃培养培养物直到合适大小的菌落出现。

在上面文库中任一种情况，培养以后将滤膜置于琼脂培养基的表面，从而使噬体或转化株转移至膜上。用碱将该膜变性，然后中和，并且例如，当使用民龙膜时，以紫外光照射该膜，从而将DNA固定于膜上。然后将该膜与作为探针的通过一般方法标记的本基因片段杂交。对于该方法，可参考，例如，D.M.Glover编，“DNA克隆，实践方法”IRL出版社(1985)，ISBN 0-947946-18-7。用于杂交中很多种试剂和温度条件；例如，通过加入6×SSC(0.9M NaCl，0.9M柠檬酸)，0.1-1％SDS，100μg/ml变性鲑精DNA，并于65℃孵育1小时完成预杂交。然后加入作为探针的标记的本基因片段，并混合。杂交于42℃-68℃4到16小时完成。以2×SSC，OH％SDS洗膜，进一步以0-2×SSC，0-0.1％SDS冲洗，且然后干燥。例如通过放射自显影或其它技术分析膜以检测膜上探针的位置并由此检测具有所用探针核苷酸序列同源的核苷酸序列DNA的位置。因此，可以检测本基因或本基因片段。在原始琼脂培养基上鉴定相应于膜上这样检测到的DNA位置的克隆，并且筛选阳性克隆，从而可分离具有该DNA的克隆。重复相同的检测步骤以纯化具有该DNA的克隆。

也可使用其它的检测方法，例如，以Grbco BRL商业上可得到的基因诱捕DNA阳性筛选系统试剂盒。在该方法中，将单链DNA文库与生物素化的本基因片段(即，探针)杂交，接着加入结合链亲和素(strep to avidin)的磁珠并混合。用磁铁从混合物中收集结合链亲和素的磁珠，从而收集和检测具有同源于所用探针核苷酸序列的核苷酸序列，通过本基因片段，生物素和链亲和素结合到这些磁珠上的单链DNA。因此，可检测本基因或本基因片段。通过用合适的寡核苷酸作为引物以合适的DNA聚合酶处理可将该收集到的单链DNA转变成双链形式。

本检测方法也可用于植物分析中。更为具体地，根据一般方法，例如在“克隆和测序(植物生物技术实验指南)”在Itaru Watanabe指导下编辑、Masihiro Sugiura编，Noson Bunka-sha，东京出版(1990)中所述制备植物基因组DNA。以几种合适的限制性核酸内切酶消化植物基因组DNA，接着电泳，并根据一般方法将电泳的DNA印迹至滤膜上。将该滤膜与通过一般方法从本基因片段中制备的探针杂交，并检测与探针杂交的DNA片段。比较不同种特定植物种类之间该DNA片段的长度，该长度差异便分析这些种类之间伴随从棉子糖族寡糖表达的表型特征差异成为可能。此外，当将通过上面方法检测到的DNA片段在基因重组子植物和相同种类的非-基因重组子植物之间进行长度比较时，通过检测杂交带数目前者植物较后者植物大或杂交带深度前者植物较后者植物深可在分前者植物与后者植物。该方法可根据RFLP(限制性片段长度多态性)方法完成，例如，在“植物PCR实验方法”在Ko shimamoto和Takuji sasaki指导下编辑，Shujun-sha，东京出版(1995)，ISBN 4-87962-144-7，pp-90-94中所述。

用具有本基因片段核苷酸序列的引物的PCR方法使从有机体获得的DNA中扩增这样的棉子糖合酶基因是可能的，即具有编码能够通过将D-地乳糖基因是可能的，即具有编码能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备糖酶氨基酸序列的核苷酸序列的棉子糖合酶基因；或具有其部分核苷酸序列的基因片段(以下简称为本扩增方法)。

更为具体地，例如，通过一般合成方法化学合成具有本基因片段核苷酸序列中15到50个核苷酸的寡核苷酸。根据下面的密码子表，显示核苷酸序列编码的对应氨基酸，可合成混合引物从而依据可编码某一氨基酸密码子的变异，将引物中特定位置的残基变成几种碱基的混合物。

密码子表

Phe	UUU	Ser	UCU	Tyr	UAU	Cys	UGU
	UUU		UCU		UAU		UGU	UUC	UCC	UAC	UGC
	Leu		UUA		UCA		Stop	UUC	UCC	UAC	UGC	UAA	Stop	UGA
UUG			UUA	UCG	UCA	UAG		Trp	UGG			UAA	Stop	UGA
UUG			CUU	UCG	Pro	UAG		Trp	UGG	CCU	His	CAU	Arg	CGU
CUC		CCC	CUU	CAC		CGC				CCU		CAU		CGU
CUC		CCC	CUA	CAC		CGC	CCA	Gln	CAA	CGA
CUG		CCG	CUA	CAG		CGG	CCA		CAA	CGA
CUG		CCG	Ile	CAG		CGG	AUU		Thr	ACU	Asn	AAU		Ser	AGU
AUC	ACC	AAC		AGC			AUU			ACU		AAU			AGU
AUC	ACC	AAC		AGC	AUA	ACA	Lys	AAA		Arg		AGA
Met	AUG	ACG		AAG	AUA	ACA		AAA			AGG	AGA
Met	AUG	ACG	Val	AAG	GUU	Ala		GCU			AGG	Asp	GAU	Gly	GGU
GUC	GCC	GAC		GGC	GUU			GCU					GAU		GGU
GUC	GCC	GAC		GGC	GUA		GCA	Glu	GAA	GGA
GUG	GCG	GAG		GGG	GUA		GCA		GAA	GGA

此处，也可使用能与多种碱基形成配对的碱基，如次黄嘌呤核苷代替上面的几种碱基的混合物。更为具体地，例如，可使用具有显示于表4中核苷酸序列的引物。在该上下文中，与由双链DNA所组成的本基因的编码链具有相同核苷酸序列的寡核苷酸称为“有引物”，并且具有与编码链互补的核苷酸序列的寡核苷酸称为“反义引物”。

与存在于棉子糖合酶基因或待扩增的具有其部分核苷酸序列基因片段编码链中5’上游一侧具有相同核苷酸序列的有义引物和具有互补于该编码链3’-下游一侧核苷酸序列的核苷酸序列的反义引物联合用于PCR反应从而，例如，从基因文库基因组文库或cDNA作为模板扩增DNA片段。此时，可通过以电泳的一般方法证实DNA片段的扩增。对于扩增的DNA片段，构速其限制性核酸内切酶图谱或通过一般方法测定其核苷酸序列，从而可鉴定本基因或本基因片段。对于用于此的基因文库，例如，可使用所需植物的cDNA文库或基因组cDNA文库。对于植物基因文库，可这样使用来源于植物的商业上可得到的文库；或根据一般的文库制备方法制备的文库，例如，在“分子克隆：实验指南第2版”(1989)，冷泉港实验室出版社，中所述或也可使用“当前分子生物学方法”(1987)，John wiley & Sons，Inc，ISBN 0-471-50338-X。作为用于本扩增方法中的基因组DNA或cDNA，例如，可使用从所需植物中制备的cDNA或基因组cDNA。

更为具体地，例如，根据SEQ ID No：1氨基酸序列而设计的引物与作为模板的来自唇形科植物，日本菜蓟的cDNA用于本扩增方法中，从而可扩增具有SEQ ID No：6核苷酸序列的棉子糖合酶基因片段。此外，例如，根据SEQ IDNo：1氨基酸序列设计的引物与作为模板的来自禾本科植物，玉米的cDNA用于本扩增方法中，从而可扩增具有SED IQ No：8核苷酸序列的棉子糖合酶基因片段。

(序列表4)

1-F 32聚体

TTIAAIGTITGGTGGACIACICAITGGGTIGG

2-F 41聚体

ATIATIGAIAAITTIGGITGGTGIACITGGGAIGCITTITA

2-RV 41聚体

TAIAAIGCITCCCAIGTICACCAICCIAAITTITCIATIAT

3-F 44聚体

GGIGGITGICCICCIGGITTIGTIATIATIGAIGAIGGITGGCA

3-RV 44聚体

TGCCAICCITCITCIATIATIACIAAICCIGGIGGICAICCICC

4-F 32聚体

AAIAAICAITTIAAIGGIAAIGGIGTIATIGC

4-RV 32聚体

GCIATIACICCITTICCITTIAAITGITTITT

5-F 38聚体

TGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT

5-RV 38聚体

AACATITCCCAITCIGGITGIATIAAITTICCCATCCA

6-RV 27聚体

CATITTIACIA(AG)ICCIATIGGIGCIAA

本扩增方法也可用于分析植物基因。更为具体地，例如，从不同种指定植物种类中制备的植物基因组DNA用作为扩增方法的模板以扩增DNA片段。扩增的DNA片段与甲醛溶液混合，通过于85℃加热5分钟而变性，接着于冰快速冷却。例如，将该样品在含有0％或10％甘油的6％聚丙烯酰胺凝胶中进行电泳。在该电泳中，可使用商业上可得到的用于SSCP(单链构型多态性)的电泳仪，并进行电泳，同时将凝胶保持恒温，如，5℃，25℃或37℃。例如，通过用商业上可得到试剂的银染方法的方法从电泳的凝胶中检测DNA片段。

从在不同种间检测到DNA片段的电泳中的行为差异，检测棉子糖含基因的突变，并且分析由突变造成的伴随棉子糖族寡糖表达的表型特征的差异。该方法可根据SSCP方法完成，例如，在“植物PCR实验方法”，在Ko shimamoto和Takuji Sasaki指导下编辑，shujun-sha，东京(1995)出版，ISBN 4-87962-144-7，pp.141-146中所述。

上述的本检测方法或本扩增方法也可用于鉴定棉子糖合酶基因或具有其部分核苷酸序列的基因片段且然后分离和纯化鉴定的基因或其基因片段以获得本基因(以下简称为本基因获得方法)。

例如，通过检测由本基因片段所组成并与通过上述本检测方法从有机体获得基因文库中DNA杂交的探针从鉴定出与所用探针具有同源核苷酸序列的DNA；纯化带有该DNA的克隆；并从克隆中分离如纯化质粒或噬菌体DNA可获得本基因或本基因片段。当这样获得的DNA为具有部分棉子糖合酶基因的核苷酸序列的基因片段时，用该DNA作为探针通过本基因检测方法进一步筛选基因文库得到全长的本基因。

例如，通过用具有本基因片段核苷酸序列的引物进行聚合酶链式反应以从通过上述本扩增方法得到的有机体DNA中扩增DNA片段；且然后构建扩增DNA片段的限制性核酸内切酶图谱或测定其核苷酸序列可获得本基因或本基因片段。根据获得基因片段的核苷酸序列，合成用于5’-末端序列分析的反义引物，和合成用于3’-末端序列分析的有义引物。可通过用这些引物和商业上可得到的试剂盒，如，Clontech的Marakhon试剂盒的RACE访求测定全长本基因的核苷酸序列。全长的本基因可通过根据这样测定的核苷酸序列中两个末端序列合成新的引物并再次进行聚合酶链式反应而获得。

上述本基因获得方法使从各种有机体中获得棉子糖合醇基因作为本基因成为可能。例如，这样的基因，其编码棉子糖合酶，该酶具有与SEQ ID No：1氨基酸序列在相应于400个或更多个氨基酸长度的区域中约50％或更高的同源性的氨基酸序列；并且能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。更为具体地，例如，具有SEQ ID No：4核苷酸序列的棉子糖合酶基因可通过以下方法获得，包括通过本扩增方法用从SEQ ID No：1氨基酸序列设计的引物和大豆cDNA作为模板扩增和鉴定含有具有部分棉子糖合酶基因核苷酸序列基因片段的DNA片段；分离和纯化鉴定出的DNA片段，接着通过上面步骤以获得含有该DNA片段的全长基因。

可以构成包括本基因和连接到其上启动子的嵌合体基因(以下简称为本嵌合体基因)。

只要其在待转化的宿主有机体中是有功能的，待用的启动子没有特别的限制。该启动子可包括，例如，合成的在大肠杆菌中有功能的启动子，如大肠杆菌乳糖纵子启动子，大肠杆菌色氨酸操纵子启动子和tac启动子；酶母乙醇脱氢酶基因(ADH)启动子；腺病毒主要晚期(Ad.ML)启动子，SV40早期启动子，及杆状病毒启动子。

当宿主有机体为植物或其细胞时，启动子可包括，例如，从T-DNA得到的组成型启动子如胭脂氨酸合酶基因(NOS)启动子和章鱼氨酸合酶基因(OCS)启动子；从植物病毒得到的启动子如从花椰菜花叶病毒(CaMV)得到的19S和35S启动子；得到的启动子如苯丙氨酸氨-裂合酶(PAL)基因启动子，查耳酮合酶(CHS)基因启动子和发病机理相关蛋白(PR)基因启动子。此外，也可使用载体pSUM-GY1(见JP-A-06-189777-1994)，其具有在特定植物组织中得到特导表达的启动子，例如，从大豆得到的种子贮藏蛋白大豆球蛋白基因的启动子。

使用构建的嵌合体基因从而具有这种启动子使在特定的植物组织中增加或减少棉子糖族寡糖的含量成为可能。

然后根据一般的基因工程方法将本嵌合体基因导入宿主有机体中以得到转化子。如果必要，根据用于将基因导入宿主有机体的转化方法，可使用质粒形式的本嵌合体基因。此外，本嵌合体基因可以含有终止子。在这种情况，一般优选构速嵌合体基因从而使终止子位于棉子糖合酶基因的下游。只要其在待转化的宿主有机体中有功能，待用的终止子没有特别的限制。例如，当宿主有机体为植物或其细胞时，终止子可包括，例如，从T-DNA得到的组成型终止子如胭脂氨酸合酶基因(NOS)终止子；和从植物得到的终止子如洋葱病毒GV1或GV2的终止子。

如果必要，本基因可以质粒的形式使用。例如，当宿主有机体是微生物时，通过一般的方法，例如，在“分子克隆：实验指南第2版”(1989)，冷泉港实验室出版社或“当前分子生物学方法”(1987)，JohnWiley & Sons，Inc，ISBN 0-471-50338-X中所述，将构建的质粒导入微生物中。以抗生素抗性或营养缺陷标记筛选这样转化的微生物。当宿主有机体是植物时，通过一般方法如以农杆菌感染(见JP-B 2-58917/1990和JP-A 60-70080/1985。电穿孔进入原生质体(见JP-A 60-251887/1985和JP-B 5-68575/1993)或粒子枪方法(见JP-A 5-508316/1993和JP-A 63-258525/1998)将构建的质粒导入植入细胞。以抗生素如卡那毒素或潮霉毒筛选通过导入质粒而转化的植物细胞。从这样转化的植物细胞中，可通过一般的植物细胞培养方法再生出转化的植物，例如，通过在“植物基因操作指南(怎样制备转基因植物)”由Uchimiya，1990写，Kodan-sha科学出版社(ISBN 4-06-153513-7)，pp.27-55中描述的方法。此外，收集转化植物的种子也使增殖转化的植物成为可能。此外，获得的转化植物与非转化植物之间的较使制备具有转化植物特征的子代植物成为可能。

可以通过将本基因导入宿主有机体或其细胞并修饰宿主有机体或其细胞中的代谢而改变棉子糖族寡糖的含量。作为这种方法，例如，可以使用以下方法，即通过构建包括本基因或连接到其上启动子的本嵌合体基因，其中的本基因以适于转录、翻译和表达为蛋白的原始方向与启动子连接且然后将本嵌合体基因导入宿主有机体或其细胞而增加宿主有机体中棉子糖族寡糖含量的用于代谢修饰的方法；或通过构建包括本基因和连接到其上启动子的本嵌合体基因，其中的本基固以不适于翻译和表达为蛋白的相反方向与启动子连接，且然后将本嵌合体基因导入宿主有机体或其细胞而减少宿主有机体或其细胞中棉子糖族寡糖的含量的用于代谢修饰的方法。

这里使用的术语“棉子糖合酶蛋白”指由本基因编码的蛋白(以下简称为本蛋白)。例如，其可包括这样的酶蛋白，它具有SEQ ID No：1或SEQ ID No：3氨基酸序列，或具有在SEQ ID No：1或SEQ ID No：3氨基酸序列中通过缺失、替代、修饰或添加1个或几个氨基酸而得到的氨基酸序列；并且能够通过将D-半乳糖基团经过α(1→6)键与附着与蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。

本蛋白具体的实例为SEQ IQ No：1氨基酸序列(799个氨基酸；分子量，89kDa)的酶蛋白和具有SEQ ID No：3氨基酸(781个氨基酸；分子量，87kDa)的酶蛋白。

尽管本蛋白可，例如，从豆科植物如蚕豆(Vicia faba)中通过一般的生化方法如(NH₄)₂SO₄沉淀、离子交换柱、疏水柱、羟碳灰石柱或凝胶滤膜柱制备，但其也可从以本质粒转化的宿主有机体或其细胞中制备。更为具体地，例如，用发玛西亚GST基因融合载体试剂盒，将本基因插入附于试剂盒中的表达载体质粒。根据一般的基因工程方法将得到的载体质粒导入微生物如大肠杆菌中。将获得转化子的培养物培养于具有IPTG(异丙基硫代-β-D-半乳糖苷)的培养基中，从而使本蛋白可作为融合蛋白在培养物中表达和产生。可通过一般的方法如细菌细胞裂解、柱操作或SDS-PAGE电泳分离和纯化诱导表达的融合蛋白。以蛋白酶如凝血酶或血液凝固因子Xa消化融合蛋白得到本蛋白。该过程优选，例如，根据在“当前蛋白科学方法”(1995)，JohnWiley & Sons，Inc，ISBN 0-471-11184-8中所述的方法完成。例如，通过在L.Lehle和W.Janner，欧洲生化杂志，38-103-110(1973)中所述的方法可测定本蛋白的活性。

用上面制备的本蛋白作为抗原通过一般的免疫学方法可制备能够结合棉子糖合酶蛋白的抗棉子糖合酶抗体(以下简称为本抗体)。更为具体地，可，例如，根据在Ed Harlow与David Lane，“抗体：实验指南”(1988)，冷泉港实验室出版化，ISBN 0-87969-314-2中所述的方法制备本抗体。

可通过以本抗体处理测试蛋白并且检测具有特异性结合到其上本抗体的蛋白来检测本蛋白。这种检测方法可根据如Western印迹方法和酶联免疫吸附分析(ELISA)的免疫学技术加以完成，例如，在Ed Harlow和David Lane，“抗体：实验指南”(1988)，冷泉港实验室出版社，中所述的方法。

例如，Western印迹方法按如下完成：例如，根据在酶学方法，182卷，“蛋白纯化指南”98 174-193，ISBN 9-12-182083-1中所述的方法从植物中提取蛋白。根据所用的植物组织可适当地改变提取缓冲液的组成。根据一般的SDS-PAGE方法将提取的蛋白电泳。通过以一般的电转方法的Western印迹将凝胶中电泳的蛋白的转移至膜上。更为具体地，例如，将凝胶浸于转移缓冲液(25mMTris，192mM甘氨酸，20％甲醇)中10分钟，且然后置于与凝胶切成相同大小的PVDF膜上。将凝胶与膜一起置于商业上可得到的半干型转膜仪中。以0.8到2mA/cm²的恒定电流45分钟到1小时完成印迹。可用一级抗体和以碱性磷酸酶或辣根过氧化物酶标记的二极抗体或蛋白A以用于Western印迹检测的试剂盒对转移至膜上的蛋白进行免疫学检测。此时，可通过用本抗体作为一级抗体检测膜上的本蛋白。

在ELISA方法中，例如，根据对最终结合到ELISA平板表面上的抗原进行免疫学检测的原则利用结合到由树脂制成的96-孔ELISA平板表面上蛋白的特性。测试蛋白作为溶液加入并结合到ELISA平板上，接着，例如，通过加入含有如5％小牛血清蛋白的蛋白的PBS封闭。之后，以PBS洗孔，向其中加入含有本抗体的溶液以进行反应。洗孔之后，进一步向孔中加入含有从碱性磷酸酶或辣根过氧化物酶标记的二极抗体的溶液，接着洗孔。最后，向孔中加入用于检测的底物溶液，并以ELISA读数器检测底物颜色的形成。

在另一种方法中，加入本抗体并结合到ELISA平板上，接着通过，例如，加入含有如5％小牛血清蛋白的蛋白的PBS封闭。然后将测试蛋白作为溶液加入，并且测试蛋白中含有的抗原与已结合到平板上的本抗体结合，接着洗孔，且进一步向孔中加入本抗体。此时所用的本抗体优选为从不同于用于制备第一次使用的本抗体动物的动物种类中制备的抗体。然后向孔中加入含有以碱性磷酸酶或辣根过氧化物酶标记的二极抗体的溶液，接着洗孔。此时所用的二次抗体必需具有结合后来加入的本抗体的特性。最后，加入用于检测的底物溶液，并以ELISA读数器检测颜色的形成。

实施例

本发明将通过下面的实施例进一步说明；然而，本发明无论怎么也不以任何方式限于这些实施例。

实施例1(肌醇半乳糖苷的纯化)

以甲醇将约250ml的甜菜黑叶舌(blakstrap)糖密稀释5倍。将稀释液以21,400×g于室温离心15分钟以去除不溶性物质。将获得的上清液转移至2-升的锥形瓶中，向其中加入一半体积的异丙醇并以搅拌混匀(portionwise)。将锥形瓶于室温放置一段时间直到得到的沉淀物附着到锥形瓶壁上。然后轻轻倾倒去除上清液。向沉淀物中加入500ml乙醇，并以旋转式振荡器通过搅拌洗混合物。进一步重复洗几次。从锥形瓶壁上刮下洗过的沉淀物，接着于滤纸上空气干燥。将空气干燥的沉淀物(干粉)溶于纯水至约40％(W/V)。向该溶液中加入伯乐的AG501-X8(D)，接着搅拌。重复该操作直到溶液颜色变得几乎没有观察到。以微孔的Sep-Pak QMA柱处理得到的溶液，并进一步以微孔的Sep-Pak CM，Sep-Pak C18和Sep-Pak Silica柱预处理。将5ml体积得到的溶液上样于Wako-凝胶LP40C18柱(Wako纯化学工业，2.6cm×85cm)中，并以纯水洗脱。以便携式糖折光计测量洗脱液糖的含量，并且以微孔的Sugar-pak Na(7.8mm×300mm)柱通过高效相层析(HPLC)分析糖的组成。以410型水分化析光计进行糖的检测。将含有肌醇半乳糖苷的洗脱液冻干，并将得到的冻干粉溶于5ml纯水中。将该溶液装于TOYOPEARL HW40(S)柱(TOSO，2.6cm×90cm)中，并以纯水洗脱。以上述相同的方式分析洗脱液，从而获得纯化的肌醇半乳糖苷。

将获得的肌醇半乳糖苷于25℃置于达到含有80mM磷酸盐缓冲液(pH6.5)，2mg/ml肌醇半乳糖苷，和8.3Uα-半乳糖苷酶(室灵曼，超产大肠杆菌662038)的反应混合物中40分钟。以氯仿抽提反应混和物，并通过HPLC分析水层。证实得到的肌醇半乳糖苷被水解成半乳糖和肌醇。

实施例2(棉子糖合酶活性的测量)

根据L.Lehle和W.Tanner，欧洲生化杂志，38，103-110(1973))描述在以下条件中测量棉子糖合酶活性。

首先，将待用于活性测量的2μl样品加入18ul的反应混和物中，该混和物达到含有100mM Tris-HCl(pH7.4)，5mM DTT(二硫苏糖醇)，0.01％BSA，200μM蔗糖5mM肌醇半乳糖，740KBq/ml(31.7μM)[¹⁴C]蔗糖，并且将反应混合物置于37℃3到20小时。反应后，向反应混和物中加入30μl乙醇，接着搅拌并以15,000rpm离心5分钟。将5ul体积的上清液点于用于薄层层析的HPTLC纤维素平板(Merck，10cm×20cm)上，并以n-丁醇∶吡啶∶水∶醋酸＝60∶40∶30∶3展开。将展开的平板干燥且然后以用于测定制备的[¹⁴C]棉子糖的图像分析仪(富士照相胶卷，FUJIX生物图像分析仪BAS-2000II)加以定量分析。

实施例3(棉子糖合酶的纯化)

按如下从蚕豆中进行棉子糖合酶的纯化：对于每种纯化蛋白的溶液，存在于蛋白溶液中的蛋白通过SDS-PAGE(Daiichi Kagaku Yakuhin)加以分析，并根据实验例2中描述的方法测量其酶活性。

首先，将300g贮存于-80℃的蚕豆未成熟种子(Nintoku Issun)融化并然后去皮。将去皮的种子置于600ml溶液中，其中含有100mM Tris-HCl(pH7.4)，5mM DTT(二硫苏糖醇)，1mM EDTA，1mM PMSF(苯甲基碘酰氟)和1mM的苯甲酰胺，并在冰上以上臼研磨。将研磨的材料于4℃21,400×g离心50分钟。向得到的上清液中加入1/20体积的10％聚乙烯亚胺(pH8.0)。将混合物于4℃搅拌15分钟，并于4℃以15,700×g离心20分钟。向得到的上清液中搅拌加入196g/l的(NH₄)₂SO₄。将混合物在冰上搅拌30分钟，并于4℃以15,700×g离心20分钟。向得到的上清液中进一步搅拌加入142g/l(NH₄)₂SO₄。在冰上搅拌30分钟以后，将混合物于4℃以15,700×g离心20分钟。将得到的沉淀物溶于50ml 100mM Tris-Hcl(pH7.4)和5mM DTT(二硫苏糖醇)中，并将溶液在20mM Tris-Hcl(pH7.4)，1mM DTT(二硫苏糖醇)和1mM ED7A中4℃透析过夜。透析后，将悬液于4℃以70,000×g离心60分钟。向得到的上清液中加入1mM苯甲酰胺Hcl，5mMε-氨基-n-己酸，1μg/ml抗蛋白酶，1μg/ml亮抑酶肽和10mM EGTA，并进一步加入1/40体积的2M Kcl。将混合物装入以0.05M Kcl，20mM Tris-Hcl(pH7.4)，1mM DTT(二硫苏糖醇)和1mM EDTA平衡的DEAE-葡聚糖纤维素柱(发玛西亚，2.5cm×21.5cm)中，并以0.05至0.5M Kcl的梯度洗脱吸附的蛋白。到此时期的纯化步骤重复三次，并合并具有棉子糖合酶活性的馏份且然后按如下纯化：

向具有棉子糖合酶活性的洗脱馏份中加入1/4体积的均一(portionwise)饱和的(NH₄)₂SO₄。

将溶液装入以20％饱和(NH₄)₂SO₄，20mM Tris-Hcl(pH7.4)，1mM DTT(二硫苏糖醇)和1mM EDTA平衡的Phenyl-琼脂糖柱(发玛西亚，2.5cm×10.2cm)中，并以20％到0％梯度的(NH₄)₂SO₄洗脱的吸附的蛋白。得到的活性馏份通过加入0.01M磷酸钾缓冲液(pH7.5)至2倍体积而稀释。将稀释的溶液装入预先以0.01M磷酸钾缓冲液(pH7.5)和2mM DTT(二硫苏糖醇)平衡的Econo-Pac 10DG柱(伯乐，5ml)中，并以0.01至0.5M梯度的磷酸钾缓冲液(pH7.5)和2mM的DTT(二硫苏糖醇)洗脱吸附的蛋白。发现此时期获得的活性馏份已被纯化达6500一倍或更高的特异性活性。具有棉子糖合酶活性的部分得到的纯化蛋的溶液装入以0.2M Kcl、20mM Tris-Hcl(pH7.4)，1mM DTT(二硫苏糖醇)和1mM EDTA平衡的Super dex 200柱(发玛西亚，1.6cm×60cm)中。将这样分离的纯化蛋白进行SDS-PAGE，并测量棉子糖合酶的活性。具有棉子糖合酶活性的蛋白带在SDS-PAGE中被鉴定为具有约90KDa的分子量。

实施例4(棉子糖合酶部分氨基酸序列的分析)

向约1ml在实施例3中以Econo-Pac 10DG柱(伯乐，5ml)纯化的纯化蛋白溶液中加入1/9体积的100％TCA，并将混合物置于冰上30分钟。以10,000×g离心15分钟后，将得到的沉淀物悬于500μl的冷丙酮(-20℃)中，接着进一步离心。重复该丙酮清洗。并将收集的沉淀物干燥且然后溶于200μl的SDS-上样缓冲液中，接着进行SDS-PAGE。对电泳的凝胶进行CBB染色，从其中切出棉子糖合酶蛋白带。

向这样获得的凝胶中加入1ml 50％的乙腈和0.2M的碳酸铵(pH8.9)，并继续于室温搅拌20分钟清洗。以相同的方式再次洗凝胶一次，并且在减压下干燥至达到体积减小程度。向该凝胶中加入1ml 0.02％吐温-20和0.2M的碳酸铵(pH8.9)，并将混合物于室温搅拌15分钟。去除溶液后，加入400μl8M的尿素和0.4M的NH₄HCO₃，进一步加入40μl 45mM的DTT(二硫苏糖醇)，并将混合物置于50℃20分钟。完全回到室温后，加入4μl 1M的碘乙酸，并将混合物于黑暗中室温搅拌20分钟。去除溶液后，加入1ml纯水，并将混合物于室温搅拌5分钟，接着清洗。进一步洗二次后，加入1ml 50％的乙腈和0.2M的碳酸铵(pH8.9)，并将混合物于室温搅拌15分钟。再次重复相同的处理，之后去除溶液，将凝胶在减压下干燥到减小体积程度。

向该凝胶中加入100μl体积的Achromobacter蛋白酶I(Takara，残基特异性蛋白酶试剂盒)溶液。进一步加入0.02％的吐温-20和0.2M的碳酸铵(pH8.9)至凝胶不暴露于溶液表面的程度，并将混合物置于37℃42小时。进一步加入500μl 0.09％的TFA和70％的乙腈，并将混合物于室温搅拌30分钟。将含于样品管中的得到的混合物浮于超声浴中，接着超声处理(BRANSON，60W输出功率)5分钟。将这样处理的管和内容物离心，将得到的提取物收集于别的涂布硅氧烷的样品管中。另一方面，再次向沉淀物中加入500μl 0.09％的TFA和70％的乙腈，接着以上述相同的方式重复提取。合并得到的提取物且然后在减压的条件下浓缩至得到200至300μl剩余溶液体积的程度。向浓缩液中加入25μl 8M的尿素和0.4M的NH₄HCO₃，并将混合物浓缩至得到100μl或更小体积剩余溶液的程度。从纯水将浓缩液调至100μl，并将混合物经Ultrafree C3 GV(微孔)滤膜过滤。然后将获得的过滤液经Aquapore BU-300C-4(2.1mm×30mm)柱通过0.1％的TFA/2.1％至68.6％梯度的乙腈洗脱。监测215nm处的吸收从收集其峰值处的馏份。将收集的样品在减压下蒸发至完全干燥，且然后以ABI蛋白测序议473A分析以检测棉子糖合酶的部分氨基酸序列。

实施例5(cDNA的制备)

将约2g的未成熟蚕豆(Nintoku Issun)种子冻于液氮中且然后以臼研磨，向其中加入20ml等基因(Nippon基因)，并将混合物进一步彻底研磨。将研磨的材料转入离心管中，向其中加入4ml的氯仿，并将混合物从旋涡混合器搅拌且然后于4℃以6,500×g离心10分钟。收集水层，向其中加入10ml异丙醇，并搅拌混合物且然后于4℃以6,500×g离心10分钟。将得到的沉淀物以10ml 70％的乙醇洗且然后溶于1ml洗脱缓冲液(10mM Tris-Hcl(pH7.5))，1mM EDTA，0.1％SDS)中。将溶液置于60℃10分钟且然后以10,000×g离心1分钟以去除不溶性物质。向得到的上清液中加入等体积的Oligo tex-dT30(Takara)，并且搅拌混合物且然后置于65℃5分钟。将混合物置于冰上且然后放置3分钟，向其中加入200μl 5M的NaCl，并将混合物置于37℃10分钟。将混合物然后于4℃以10,000×g离心3分钟。收集沉淀物且然后悬于1ml TE缓冲液中，并将悬液置于65℃5分钟，置于冰上且然后放置3分钟，接着于4℃以10,000×g离心3分钟以去除沉淀物。

向得到的上清液中加入100μl 3M的醋酸钠和2ml的乙醇，RNA以乙醇沉淀并收集。将收集的RNA以70％的乙醇洗2次且然后溶于20μl灭菌水中，用于以后的cDNA合成。通过测量260nm处的吸收测定获得的RNA量。

对于cDNA合成，使用用于RT-PCR的第一链合成试剂盒(Amercham)和cDNA合成试剂盒(Takara)，并且所有的操作根据说明书完成。

实施例6(从cDNA分析棉子糖合酶基因的核苷酸序列)

根据实施例4中获得的氨基酸序列，合成具有显示于下表5中核苷酸序列的混合合成DNA引物。用Clontech的优势Klen Taq cDNA试剂盒以珀金-埃尔默Gene Amp PCR系统2400和DNA热循环仪480完成PCR方法。聚合酶链式反应用上面的引物于94℃1分钟，50℃3分钟和72℃3分钟进行，并将重复该反应40次。结果，具有下表5中显示的核苷酸序列的引物8.2与13.3RV、引物13.4与10.3RV以及引物7.4与10.3RV的结合分别得到1.2kb、0.5kb和1.2kb带的扩增。以TA克隆试剂盒(Invitrogen)克隆这些扩增的DNA片段，接着用珀金-埃尔默的ABI PRISM Dye终止子循环测序现成反应试剂盒进行测序反应并以ABI 373S DNA测序仪进行核苷酸序列分析。结果，发现这些DNA片段分别具有SEQ ID NO：2核苷酸序列中第813个碱基至第1915个碱基、第1936个碱基至第2413个碱基以及第1226个碱甚至第2413个碱基的核苷酸序列。根据这些核苷酸序列，制备具有显示于下表6中核苷酸序列的合成DNA引物，并以Clontech的马拉松cDNA扩增试剂盒分析位于cDNA两末端区域的核苷酸序列。结果，最后测定SEQ ID NO：2的核苷酸序列。

序列

(序列表5)

#8.2 26聚体

AA(AG) AC(ATGC) GC(ATGC) CC(ATGC) AG(TC) AT(TCA) AT(TCA) GAC AA

#13.4 20聚体

AA(AG) AT(TCA) TGG AA(TC) CT(ATGC) AAC AA

#7.4 24聚体

AA(AG) GC(ATGC) AG(AG) GT(ATGC) GT(ATGC) GT(ATGC) CC(ATGC) AAG

#13.3RV 21聚体

(TC)TT (AG)TT (ATGC)AG (AG)TT CCA (AGT)AT TTT

#10.3RV 21聚体

(TC)TT (AG)TC (TC)TC (AG)TA (ATGC)AG (AG)AA TTT

(序列表6)

RS-2RV 30聚体

GGCTGAGGTTCGGTTCATTCCTGAATCATC

RS-7 30聚体

CCAAATGGTACATATTGGCTCCAAGGTTGT

RS-8 30聚体

AAGAGTGTATCTGAATTTTCACGCGCGGTG

RS-9 30聚体

TGGTGCAATGGGAAAACTCCAATGAGCACC

RS-10 30聚体

ATGAAGTGTTCTGATAGATTGAAAGTTTCG

RS-11 30聚体

CAGTCTCTGGAGTTTGATGATAATGCAAGT

实施例7(从蚕虫cDNA中克隆棉子糖合酶基因)

合成从SEQ ID NO：1氨基酸序列设计的引物，即，具有显示于下表7核苷酸序列的引物。用这些引物和在实施例5中获得的cDNA作为模板，在实施例6中所述的条件下通过PCR扩增开放阅读框区域的DNA片段。从所用的引物中含有其识别序列的限制性核酸内切酶Bam HI和Xba I消化扩增的DNA片段。用连接试剂盒(Takara)，将这样消化的DNA片段克隆于预先从Bam HI和Xba I消化的质粒pBluescript II KS-(Stratagene)中。克隆DNA片段的核苷酸序列从珀金-埃尔默的ABI PRISM Dye终止子循环测序现成反应试剂盒加以确证。在这样获得的克隆中，发现SEQ ID NO：2的核苷酸序列中第1591位置的碱基从胞腺嘧啶(T)变成胞嘧啶(C)。然而，这是一个无义突变而没有改变氨基酸；因此，将该克隆命名为pBluescriptKS-RS，且用于以后的实验中。

(序列表7)

RS-N 41聚体

CGCGGATCCACCATGGCACCACCAAGCATAACCAAAACTGC

RS-C 37聚体

TGCTCTAGATTATCAAAATAAAAACTGGACCAAAGAC

实施例8(蚕豆棉子糖合酶基因在大肠杆菌中的表达)

以Bam HI和Nat I消化实施例7中获得的具有蚕豆棉子糖合酶基因的质粒pBluescript KS-RS，并克隆于以Bam HI和Nat I消化的质粒pGEX-473(发玛西亚)中以得到显示于图1中的质粒pGEX-RS。

以Nco I和Xba I消化质粒pBluescript KS-RS，并且克隆于从Nco I和Xba I消化的质粒pTrc 99A(发玛西亚)中以得到显示于图1中的质粒pTrc-RS。

将这些质粒导入大肠杆菌菌株HB101，并用得到的转化子确证棉子糖合酶的表达。将每1ml体积的过夜转化了培养物接种于100ml LB培养基并于37℃孵育约3小时，接着加入IPTG(异丙基硫代-β-D-半乳糖苷)至1mM的终浓度并进一步孵育5小时。将培养物以21,400×g离心10分钟，并收集细菌细胞。将收集的细菌细胞保存于-80℃。向冻存细菌细胞中加入10倍体积的100mMTris-Hcl(pH7.4)，1mM EDTA，5mM DTT(二硫苏糖醇)，1mM PMSF(苯甲基磺酰氟)及1mM苯甲酰胺，并融化和悬浮细菌细胞。以超声裂解仪(Branson)处理这些悬液从进行细菌细胞的裂解。将获得的裂解细胞混合物以16,000×g离心10分钟，并收集可溶性蛋白。

用每4μl体积的这样获得的蛋白溶液根据上述的方法测量棉子糖活性。反应于37℃进行64小时。作为对照，使用从其中之一的载体，pGEX-4T3转化的大肠杆菌菌株HB101。结果显示于表1。检测HB101(pGEX-RS)和HB101(pTrc-RS)转化子样品中的棉子糖合成。

表1

转化子	制备的棉子糖量(pmol)
转化子	制备的棉子糖量(pmol)	HB101(pGEX4T-3)	0.56
HB101(pGEX-RS)	10.50	HB101(pGEX4T-3)	0.56
HB101(pGEX-RS)	10.50	HB101(pTrc-RS)	11.10

实施例9(从大豆cDNA中克隆棉子糖合酶基因)

从实施例5中所述的相同方式，从未成熟Williams 82大豆(Glycinemax)的种子中获得cDNA。用该cDNA作为模板且从SEQ ID NO：1氨基酸序列设计的引物，即，具有下面序列表8中显示核苷酸序列的引物，在实施6中所述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Invitrogen)克隆，接着用珀金-埃尔默的ABI PRISM Dye终止子循环测序现成的试剂盒进行测序反应并以ABI 373S DNA测序仪进行核苷酸序列分析。根据该序列，合成具有下面序列表9中显示核苷酸序列的引物。用与实施例5中所述的相同方式从Williams 82大豆叶中获得的mRNA以马拉松Clontech试剂盒进行cDNA的合成。以连接酶将获得的cDNA连接于含于该试剂盒中的衔接子上。该操作根据附属的方法完成。用这样制备的连接衔接子的cDNA，以显示于下面序列表9中的引物进行聚合酶链式反应。根据附属于Clontech马拉松试剂盒中的方法分析该基因两末端的核苷酸序列。结果，SEQID NO：4的核苷酸序列得以测定。

(序列表8)

1-F引物 35聚体

CGATTIAAIGTITGGTGGACIACICAITGGGTIGG

2-RV引物 45聚体

GGCCTAIAAIGCITCCCAIGTICACCAICCIAAITTITCIATIAT

5-F引物 41聚体

CGATGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT

6-RV引物 32聚体

GGCCACATITTIACIA(AG)CCIATIGGIGCIAA

(序列表9)

SN-1 30聚体

CACGAACTGGGGCACGAGACACAGATGATG

SC-3RV 30聚体

AAGCAAGTCACGGAGTGTGAATAGTCAGAG

SC-5 30聚体

ACACGAGACTGTTTGTTTGAAGACCCCTTG

SC-6 25聚体

TGGAATCTCAACAAATATACAGGTG

SN-3RV 30聚体

GGGTCATGGCCAACGTGGACGTATAAGCAC

SN-4RV 30聚体

GATGATCACTGGCGCGGTTTTCTCCTCGAG

实施例10(从日本菜蓟cDNA中获得棉子糖合酶基因)

以与实施例5中所述的相同的方式，从日本菜蓟(Stachys sieboldii)叶中获得cDNA。用该cDNA作为模板且从SEQ ID NO：1氨基酸序列设计的引物，即，具有显示于下面序列表10中核苷酸序列的引物，在实施例6中描述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Invitrogen)克隆，接着用珀金-埃尔默的ABI PRISM Dye终止子循环测序现成反应试剂盒进行序列反应并且以ABI 373S DNA测序仪进行核苷酸序列分析。结果，SEQ ID NO：6的核苷酸序列得以测定。

根据这样获得的核苷酸序列，制备合成的DNA引物，并且以Clontech马拉松试剂盒分析该基因两末端区域的核苷酸序列。

(序列表10)

1-F引物 35聚体

CGATTIAAIGTITGGTGGACIACICAITGGGTIGG

4-RV引物 37聚体

GGCCAGCIATIACICCITTICCITTIAAITGITTITT

2-F引物 44聚体

CGAATIATIGAIAAITTIGGITGGTGIACITGGGAIGCITTITA

6-RV引物 32聚体

GGCCACATITTIACIA(AG)ICCIATIGGIGCIAA

实施例11(从玉米cDNA中获得棉子糖合酶基因)

以与实施例5中所述的相同的方式，从先锋3358玉米(Zea mays L.)叶中获得cDNA。用该cDNA作为模板并且用从SEQ ID NO：1氨基酸序列设计的引物，即，具有下面序列表11中显示的核苷酸序列的引物，在实施例6中所述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Inuitrogen)克隆，接着用珀金埃尔默的ABI PRISM Dye终止子循环测序现成反应试剂盒进行序列反应并以ABI的373S DNA测序仪进行核苷酸序列分析。根据该序列，合成具有下面序列表12中显示核苷酸序列的引物。以与实施例5中所述的相同的方式，用连接酶将从先锋3358玉米(Zeamays L.)叶中获得的mRNA连接到含于Clontech马拉松试剂盒中的衔接子上。该操作根据附属的方法完成。用这样制备的连接衔接子的cDNA，以显示于下面序列表12中的引物用与上述相同的方式进行聚合酶链式反应。结果，SEQ IDNO：8的核苷酸序列得以测定。

根据这样获得的核苷酸序列，制备合成的DNA引物，并且以与实施例9中所述相同的方式，以Clontech的马拉松试剂盒分析该基因5’-末端区域的核苷酸序列。

(序列表11)

5-F引物 41聚体

CGATGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT

6-RV引物 32聚体

GGCCACATITTIACIA(AG)ICCIATIGGIGCIAA

(序列表12)

M-10引物 25聚体

GACGTCGAGTGGAAGAGCGGCAAGG

M-11引物 25聚体

CACCTACGAGCTCTTCGTCGTTGCC

实施例12(植物中35S-蚕豆棉子糖合酶基因嵌合体基因表达载体的构建)

以限制性核酸内切酶BamHI和SacI消化实施例7中获得的具有棉子糖合酶基因的质粒pBluescript KS-RS。用连接试剂盒(Takara)，将这样消化的DNA片段克隆于预先以BamHI和SacI消化的二等分载体(binaryvector)pBI121(Clontech)。将这样获得的载体命名为pBI121-RS。

为了反义实验，将预先以Bam HI和Sac I消化的质粒pBI121(Clontech)连接到显示于下面序列表13中的接头上(linker)以得到pBI121(-)。以与所述的用于制备上面的pBI121-RS相同的方式用该pBI121(-)制备pBI121(-)-RS。

以pBI221制备类似的载体。以限制性核酸内切酶Bam HI和Sac I消化实施例7中获得的质粒pBluescript KS-RS。用连接试剂盒(Takara)，将这样消化的DNA片段克隆于预先以BamHI和SacI消化的载体pBI221(Clontech)中。将这样获得的载体命名为pBI221-RS。

为了反义实验，将预先以BamHI和SacI消化的质粒pBI221(Clontech)连接到显示于下面序列13中的接头中以得到pBI221(-)。以与所述的用于上面pBI221-RS制备相同的方式用该pBI221(-)制备pBI221(-)-RS。

将这些表达载体的构建显示于图2和3。

(序列表13)

BamSac-(+)接头 25聚体

GATCGAGCTCGTGTCGGATCCAGCT

BamSac-(-)接头 17聚体

GGATCCGACACGAGCTC

实施13(以蚕豆棉子糖合酶基因对芥子的转化)

用实施例12中制备的载体pBI121-RS和pBI121(-)RS通过农杆菌感染方法转化芥子(Brassica juncia)。

将预先通过氯化钙处理将其变成感受态状态的根癌土壤杆菌(C58C1菌株，利福平抗性)独立地以实施例12中制备的两种质粒pBI121-RS和pBI121(-)-RS转化。利用导入质粒中卡那霉素抗性基因(新霉素磷酸转移酶，NPTII)赋予的卡那霉素抗性特征在含有50μg/ml利福平和25μg/ml卡那霉素的LB培养基上完成转化子的筛选。

将获得的转化子农杆菌(根癌土壤杆菌C58菌株，利福平抗性)于28℃在含有50μg/ml利福平和25μg/ml卡那霉素的LB培养基上培养一昼夜，并将培养物用于通过下述方法对芥子的转化。

将芥子种子无菌播种于1/2MS培养基，2％蔗糖，0.7％琼脂中。一周后，以手术刀切下发牙植物的子叶和叶柄，并转移至MS培养基，3％蔗糖，0.7琼脂，4.5μM BA，0.05μM 2.4-D，3.3μM AgNO₃，接着预培养1天。将预培养的子叶和叶柄转移主农杆菌培养物的1000-倍稀释液中以导致感染5分钟。将感染的子叶和叶柄再次转移到与用于预培养相同的培养基中，并培养3到4天。将培养的子叶和叶柄转移至MS培养基，3％蔗糖，4.5μM BA，0.05μM2.4-D，3.3μM AgNO₃，500mg/l氨噻肟头孢霉素(cefotaxim)，并且震摇灭菌1天。将灭菌的子叶和叶柄转移至MS培养基，3％蔗糖，0.7％琼脂，4.5μM BA，0.05μM 2.4-D，3.3μM AgNO₃，100mg/ml氨噻肟头孢霉素，20mg/l卡那霉素，并培养3到4周。将子叶和叶柄转移到MS培养基，3％蔗糖，0.7％琼脂，4.5μM BA，0.05μM 2.4-D，100mg/l氨噻肟头孢霉素。20mg/l卡那霉素并培养。以3到4周的间隔在该培养基上传代培养。当嫩枝再生开始出现时，将这些嫩枝传代培养于MS培养基，3％蔗糖，0.7％琼脂，20mg/l卡那霉素，并培养3到4周。将生根的植物转移到蛭石∶泥炭藓(peat moss)＝1∶1，并于白天/黑夜＝12小时∶12小时的循环将条件控制于21°到22℃。随着植株体生长的进行，将植株以培土适当培养。根据上述方法从再生植株的叶中提取基因组DNA，并且插入植物体基因组中的基因用显示于下面序列表14中的引物通过PCR加以确证。

(序列表14)

35S 30聚体

TTCCAGTATGGACGATTCAAGGCTTGCTTC

NOS 25聚体

ATGTATAATTGCGGGACTCTAATCA

RS-F 30聚体

AAGAGTGTATCTGAATTTTCACGCGCGGTG

RS-RV聚体 33聚体

ACCTTCCCATACACCTTTTGGATGAACCTTCAA

实施例14(以蚕虫棉子糖合酶基因对大豆体细胞胚的转化)

将大豆“Fayette”体细胞胚的培养细胞(400到500mg FW)以一层安排于6cm琼脂平板中心部分具有20mm直径的圆内。将具有在实施例12中从蚕豆棉子糖合酶基因和35S启动子制备的嵌合体基因的质粒pBI221-RS和pBI221(-)-RS根据公开的日本专利申请No.3-291501/1991导入大豆体细胞胚中。即，将这些质粒与在Soshiki Baiyo，20，323-327(1994)中所述的用于筛选的β-葡萄醛酸酶(GUS)/潮霉素-抗性基因(HPT)共表达载体pSUM-GH：No：I混合。以粒子枪(800mg/包被金颗粒200μg/射；抛物体终止-样品距离(projectiles topper-sample distance)，100mm)将这些混合的质粒用于基因导入到大豆体细胞胚中。导入后，将旋转培养物在25℃照明16小时条件下培养于含有25到50μg/ml潮霉素的MS修饰液体培养基中(西格玛)，并且筛选转化的体细胞胚。

对于具有黄绿色和生长能力的被筛选约3个月的潮霉素抗性大豆体细胞胚，从上面序列表14中显示的引物进行聚合链式反应以检测蚕豆棉子糖合酶基因区域扩增与否。这证实了蚕豆棉子糖合酶基因插入到大豆基因组中。

此外，将获得的体细胞胚用于植株再生以得到具有蚕豆棉子糖合酶基因的转化子大豆。

培养基组成

用于上面实施例中的LB和MS培养基具下面各自的组成。

(LB培养基)

细菌用-胰蛋白胨 10g

细菌用-酵母提取物 5g

NaCl 10g/l升H₂O(pH7.0)

(MS培养基)

KNO₃ 2022mg/l

NH₄NO₃ 1650mg/l

NH₄Cl 2140mg/l

MgSO₄·7H₂O 370mg/l

CaCl₂·2H₂O 440mg/l

MnSO₄·4H₂O 22.3mg/l

ZnSO₄·7H₂O 8.6mg/l

CuSO₄·5H₂O 0.025mg/l

KI 0.83mg/l

CoCl₂·6H₂O 0.025mg/l

H₃BO₃ 6.2mg/l

NaMoO₄·2H₂O 0.25mg/l

FeSO₄·7H₂O 27.8mg/l

Na₂EDTA 37.3mg/l

烟酸 0.5mg/l

硫氨素Hcl 1mg/l

吡哆醇Hcl 0.5ml/l

肌醇 100mg/l

甘氨酸 2mg/l

序列简述

1.SEQ ID NO：1

SEQ ID NO：1序列显示在从蚕豆获得的棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。

2.SEQ ID NO：2

SEQ ID NO：2的序列显示从蚕豆获得的棉子糖合酶基因的cDNA核苷酸序列。

3.SEQ ID NO：3

SEQ ID NO：3序列显示在从大豆获得的棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。

4.SEQ ID NO：4

SEQ ID NO：4的序列显示从大豆获得棉子糖合酶基因的cDNA核苷酸序列。

5.SEQ ID NO：5

SEQ ID NO：5的序列显示在从日本菜蓟获得的棉子糖合酶基因中编码的棉子糖合酶蛋白氨基酸序列。

6.SEQ ID NO：6

SEQ ID NO：6的序列显示从日本菜蓟获得棉子糖合酶基因的cDNA核苷酸序列。

7.SEQ ID NO：7

SEQ ID NO：7的序列显示在从玉米中获得棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。

8.SEQ ID NO：8

SEQ ID NO：8的序列显示从玉米获得棉子糖合酶基因的cDNA核苷酸序列。

9.序列表1：

显示于序列表1中的核苷酸序列为用于棉子糖合酶合酶基因cDNA片段扩增的典型引物。所有这些序列根据该基因的非编码区的核苷酸序列。引物1是相应于从蚕豆获得棉子糖合酶基因cDNA片段的5’末端的有义引物。引物2和3是相应于从蚕豆获得棉子糖合酶基因cDNA片段的3’-末端的反义引物。引物4是相应于从大豆获得棉子糖合酶基因cDNA片段5’-末端的有义引物。引物5和6是相应于从大豆获得棉子糖合酶基因cDNA片段3’-末端的反义引物。根据目的，可用适当的方式将合适限制性核酸内切酶的识别序列添加到这些核苷酸序列的5’-末端。

10.序列表2：

显示于序列表2中的核苷酸序列为用于在棉子糖合酶基因cDNA序列中编码棉子糖合酶蛋白氨基酸序列开放阅读框扩增的典型引物。引物1和2为相应于从蚕豆获得棉子糖合酶蛋白N-末端的有义引物。引物3和4为相应于从蚕豆获得棉子糖合酶蛋白C-末端的反义引物。引物5和6为相应于从大豆获得棉子糖合酶蛋白N-末端的有义引物。引物7和8为相应于从大豆获得棉子糖合酶蛋白C-末端的反义引物。根据目的，可用适当的方式将合适限制性核酸内切酶的识别序列添加到这些序列的5’末端。

11.序列表3：

显示于序列表3中的氨基酸序列为棉子糖合酶蛋白部分的氨基酸序列。

#1相当于SEQ ID NO：1氨基酸序列中第110个氨基酸延伸至第129个氨基酸的部分氨基酸序列。

#2为相当于在SEQ ID NO：1氨基酸序列中从第234个氨基酸延伸至第247个氨基酸的部分氨基酸序列。

#3为相当于SEQ ID NO：1氨基酸序列中从第265个氨基酸延伸至第279个氨基酸的部分氨基酸序列。

#4为相当于于SEQ ID NO：1氨基酸序列中第296个氨基酸延伸到第312个氨基酸的部分氨基酸序列。

#5为相当于SEQ ID NO：1氨基酸序列中第346个氨基酸延伸到第361个氨基酸的部分氨基酸序列。

#6为相当于SEQ ID NO：1氨基酸序列中第383个氨基酸延伸到第402个氨基酸的部分氨基酸序列。

#7为相当于SEQ ID NO：1氨基酸序列中第411个氨基酸延伸到第433个氨基酸的部分氨基酸序列。

#8为相当于SEQ ID NO：1氨基酸序列中第440个氨基酸延伸到第453个氨基酸的部分氨基酸序列。

#9为相当于SEQ ID NO：1氨基酸序列中第457个氨基酸延伸到第468个氨基酸的部分氨基酸序列。

#10为相当于SEQ ID NO：1氨基酸序列中从第471个氨基酸延伸到第516个氨基酸的部分氨基酸序列。

#11为相当于SEQ ID NO：1氨基酸序列中从第517个氨基酸延伸到第559个氨基酸的部分氨基酸序列。

#12为相当SEQ ID NO：1氨基酸序列中从第574个氨基酸延伸到第582个氨基酸的部分氨基酸序列。

#13为相当于SEQ ID NO：1氨基酸序列中从第586个氨基酸延伸到第609个氨基酸的部分氨基酸序列。

#14为相当于SEQ ID NO：1氨基酸序列中从第615个氨基酸延伸到第724个氨基酸的部分氨基酸序列。

个氨基酸的部分氨基酸序列。

12.序列表4：

显示于序列表4中的核苷酸序列为根据序列表3中显示的一些氨基酸序列合成的典型引物。引物号后使用的符号“F”意思是由该符号代表的引物具有有义序列。引物号后使用的符号“RV”意思是由该符号代表的引物具有反义序列。引物相应于SEQ ID NO：1氨基酸序列中第119个氨基酸延伸到第129个氨基酸的部分氨基酸序列。引物2相应于SEQ ID NO：1氨基酸序列中第234个氨基酸延伸到第247个氨基酸的部分氨基酸序列。引物3相应于SEQ ID NO：1氨基酸序列中第265个氨基酸延伸到第279个氨基酸的部分氨基酸序列。引物4相应于SEQ ID NO：1氨基酸序列中第458个氨基酸延伸到第468个氨基酸的部分氨基酸序列。引物5相应于SEQ ID NO：1氨基酸序列中第522个氨基酸延伸到第534个氨基酸的部分氨基酸序列。引物6相应于SEQ ID NO：1氨基酸序列中第716个氨基酸延伸到第724个氨基酸的部分氨基酸序列。

13.序列表5：

显示于序列表5中的核苷酸序列为根据纯化的蚕豆棉子糖合酶蛋白部分氨基酸序列而合成的典型引物。显示于圆括号中的碱基意思为将那些碱基用于合成中。在引物号后使用的符号“RV”意思为由该符号代表的引物具有反义序列。

14.序列表6：

显示于序列表6中的核苷酸序列为用于通过RACE方法分析蚕豆棉子糖合酶基因cDNA核苷酸序列两个末端区域的典型引物。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。

15.序列表7：

显示于序列表7中的核苷酸序列为用于克隆蚕豆棉子糖合酶基因中的典型引物。RS-N相应于该开放阅读框的N-末端并在5’-末端一侧含有限制性核酸内切酶BamHI和NcoI的识别位点。RS-C为相应于该开放阅读框C-末端的反义引物并且在5’-末端一侧含有限制性核酸内切酶XbaI的识别位点。

16.序列表8：

显示于序列表8中的核苷酸序列为用于克隆大豆棉子糖合酶基因片段中的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的符号“RV”意思为由该符号代表的引物具有反义序列。

17.序列表9：

显示于序列表9中的核苷酸序列为用于分析大豆棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。

用SN-1和SC-3RV通过聚合酶链式反应进行核苷酸序列分析。SC-5和SC-6用于分析3’-末端区域的核苷酸序列，且SN-3RV和SN-4RV用于分析5’-末端区域的核苷酸序列。

18.序列表10：

显示于序列表10中的核苷酸序列为用于分析日本菜蓟棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。

19.序列表11：显示于序列表11中的核苷酸序列为用于分析玉米棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。符号“I”代表的碱基为用于合成的次黄苷。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。

20.序列表12：

显示于序列表12中的核苷酸序列为用于分析玉米棉子糖合酶基因片段cDNA核苷酸序列分析中的典型引物。M-10和M-11用于3’-末端区域核苷酸序列的分析。

21.序列表13：

显示于序列表1 3中的核苷酸序列为用于构建反义实验载体中的典型衔接子。当混合在一起时这些合成DNA征段采取双链形式因为它们为互补链。该双链DNA片段在两末端具有限制性核酸内切酶BamHI和SacI切割位点的粘性末端，并在双链区域含有限制性核酸内切酶BamHI和SacI的限制性位点。

22.序列表14：

显示于序列表14中的核苷酸序列为用于确证基因导入重组植物体基因组PCR实验中的典型引物。35S为位于35S启动子位点下游区域的引物，并且NOS为位于NOS终止子位点上游区域的引物。RS-F为蚕豆棉子糖合酶基因的有义引物，且RS-RV为蚕豆棉子糖合酶基因的反义引物。

序列表

(1)一般信息

(i)申请人：Eijiro，Watanabe

Kenji，Oeda

(ii)发明题目：棉子糖合基因及其用途

(iii)序列数：8

(iv)联系地址：

(A)联系人：Birch，Stewart，Kolasch & Birch，LLP

(B)街道：8110 Gatehouse Road，Suite 500 East

(C)城市：Falls Church

(D)街道：Virginia

(E)国家：USA

(F)邮编：22042

(V)计算机可读形式：

(A)媒体类型：Floppy disk

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOC/MS-DOS

(D)软件：PatentIn Release # 1.0，Version # 1.25

(vi)目前申请数据

(A)申请号：

(B)申请日：

(C)分类：C12N 9/100，C12N 15/52

(Vii)在先申请数据

(A)申请号：JP-338673/1996

(B)申请日：18-12-1996

(Viii)律师/代理人信息

(A)姓名：

(B)登记号

(C)参考/摘要号

(ix)电信信息

(A)电话：(703)205-8000

(B)电传：(703)205-8050

(2)ID NO：1的信息：

(i)序列特征：

(A)长度：799个氨基酸

(B)类型：氨基酸

(D)拓扑：线型

(ii)分子类型：肽

(vi)原始来源：

(A)生物：broad bean(Vicia faba)

(B)菌株：Nintoku Issun

(F)组织类型：种子

(xi)SEQ ID NO：1的序列描述：

Met Ala Pro Pro Ser Ile Thr Lys Thr Ala Thr Leu Gln Asp Val Ile

1 5 10 15

Ser Thr Ile Asp Ile Gly Asn Gly Asn Ser Pro Leu Phe Ser Ile Thr

20 25 30

Leu Asp Gln Ser Arg Asp Phe Leu Ala Asn Gly His Pro Phe Leu Thr

35 40 45

Gln Val Pro Pro Asn Ile Thr Thr Thr Thr Thr Thr Thr Ala Ser Ser

50 55 60

Phe Leu Asn Leu Lys Ser Asn Lys Asp Thr Ile Pro Asn Asn Asn Asn

65 70 75 80

Thr Met Leu Leu Gln Gln Gly Cys Phe Val Gly Phe Asn Ser Thr Glu

85 90 95

Pro Lys Ser His His Val Val Pro Leu Gly Lys Leu Lys Gly Ile Lys

100 105 110

Phe Met Ser Ile Phe Arg Phe Lys Val Trp Trp Thr Thr His Trp Val

115 120 125

Gly Thr Asn Gly Gln Glu Leu Gln His Glu Thr Gln Met Leu Ile Leu

130 135 140

Asp Lys Asn Asp Ser Leu Gly Arg Pro Tyr Val Leu Leu Leu Pro Ile

145 150 155 160

Leu Glu Asn Thr Phe Arg Thr Ser Leu Gln Pro Gly Leu Asn Asp His

165 170 175

Ile Gly Met Ser Val Glu Ser Gly Ser Thr His Val Thr Gly Ser Ser

180 185 190

Phe Lys Ala Cys Leu Tyr Ile His Leu Ser Asn Asp Pro Tyr Ser Ile

195 200 205

Leu Lys Glu Ala Val Lys Val Ile Gln Thr Gln Leu Gly Thr Phe Lys

210 215 220

Thr Leu Glu Glu Lys Thr Ala Pro Ser Ile Ile Asp Lys Phe Gly Trp

225 230 235 240

Cys Thr Trp Asp Ala Phe Tyr Leu Lys Val His Pro Lys Gly Val Trp

245 250 255

Glu Gly Val Lys Ser Leu Thr Asp Gly Gly Cys Pro Pro Gly Phe Val

260 265 270

Ile Ile Asp Asp Gly Trp Gln Ser Ile Cys His Asp Asp Asp Asp Glu

275 280 285

Asp Asp Ser Gly Met Asn Arg Thr Ser Ala Gly Glu Gln Met Pro Cys

290 295 300

Arg Leu Val Lys Tyr Glu Glu Asn Ser Lys Phe Arg Glu Tyr Glu Asn

305 310 315

Pro Glu Asn Gly Gly Lys Lys Gly Leu Gly Gly Phe Val Arg Asp Leu

320 325 330 335

Lys Glu Glu Phe Gly Ser Val Glu Ser Val Tyr Val Trp His Ala Leu

340 345 350

Cys Gly Tyr Trp Gly Gly Val Arg Pro Gly Val His Gly Met Pro Lys

355 360 365

Ala Arg Val Val Val Pro Lys Val Ser Gln Gly Leu Lys Met Thr Met

370 375 380

Glu Asp Leu Ala Val Asp Lys Ile Val Glu Asn Gly Val Gly Leu Val

385 390 395 400

Pro Pro Asp Phe Ala His Glu Met Phe Asp Gly Leu His Ser His Leu

405 410 415

Glu Ser Ala Gly Ile Asp Gly Val Lys Val Asp Val Ile His Leu Leu

420 425 430

Glu Leu Leu Ser Glu Glu Tyr Gly Gly Arg Val Glu Leu Ala Arg Ala

435 440 445

Tyr Tyr Lys Ala Leu Thr Ser Ser Val Lys Lys His Phe Lys Gly Asn

450 455 460

Gly Val Ile Ala Ser Met Glu His Cys Asn Asp Phe Phe Leu Leu Gly

465 470 475 480

Thr Glu Ala Ile Ser Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Ser

485 490 495

Asp Pro Ser Gly Asp Pro Asn Gly Thr Tyr Trp Leu Gln Gly Cys His

500 505 510

Met Val His Cys Ala Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln

515 520 525

Pro Asp Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His

530 535 540

Ala Ala Ser Arg Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Cys

545 550 555 560

Val Gly Asn His Asn Phe Lys Leu Leu Lys Ser Leu Val Leu Pro Asp

565 570 575

Gly Ser Ile Leu Arg Cys Gln His Tyr Ala Leu Pro Thr Arg Asp Cys

580 585 590

Leu Phe Glu Asp Pro Leu His Asn Gly Lys Thr Met Leu Lys Ile Trp

595 600 605

Asn Leu Asn Lys Tyr Thr Gly Val Leu Gly Leu Phe Asn Cys Gln Gly

610 615 620

Gly Gly Trp Cys Pro Glu Ala Arg Arg Asn Lys Ser Val Ser Glu Phe

625 630 635 640

Ser Arg Ala Val Thr Cys Tyr Ala Ser Pro Glu Asp Ile Glu Trp Cys

645 650 655

Asn Gly Lys Thr Pro Met Ser Thr Lys Gly Val Asp Phe Phe Ala Val

660 665 670

Tyr Phe Phe Lys Glu Lys Lys Leu Arg Leu Met Lys Cys Ser Asp Arg

675 680 685

Leu Lys Val Ser Leu Glu Pro Phe Ser Phe Glu Leu Met Thr Val Ser

690 695 700

Pro Val Lys Val Phe Ser Lys Arg Phe Ile Gln Phe Ala Pro Ile Gly

705 710 715 720

Leu Val Asn Met Leu Asn Ser Gly Gly Ala Ile Gln Ser Leu Glu Phe

725 730 735

Asp Asp Asn Ala Ser Leu Val Lys Ile Gly Val Arg Gly Cys Gly Glu

740 745 750

Met Ser Val Phe Ala Ser Glu Lys Pro Val Cys Cys Lys Ile Asp Gly

755 760 765

Val Lys Val Lys Phe Leu Tyr Glu Asp Lys Met Ala Arg Val Gln Ile

770 775 780

Leu Trp Pro Ser Ser Ser Thr Leu Ser Leu Val Gln Phe Leu Phe Stop

785 790 795 800

(2)SEQ ID NO：2的信息

(i)序列特征：

(A)长度：2746个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑：线型

(ii)分子类型：cDNA到mRNA

(ix)特征：

(A)名称/关键词：肽

(B)位置：101到2500

(C)鉴定方法：实验

(xi)SEQ ID NO：2的序列描述：

AATTTTCAAG CATAGCCAAG TTAACCACCT TAGAAACATT CCTACAAGCT ACTTATCCCT 60

GTCAATAAGC TACTAAGCTA CCAGAGTCTC ATCAATCACC ATG GCA CCA CCA AGC 115

Met Ala Pro Pro Ser

5

ATA ACC AAA ACT GCA ACC CTC CAA GAC GTA ATA AGC ACC ATC GAT ATT 163

Ile Thr Lys Thr Ala Thr Leu Gln Asp Val Ile Ser ThrIle Asp Ile

10 15 20

GGT AAT GGT AAC TCA CCC TTA TTC TCC ATA ACC TTA GAC CAA TCA CGT 211

Gly Asn Gly Asn Ser Pro Leu Phe Ser Ile Thr Leu Asp Gln Ser Arg

25 30 35

GAC TTC CTT GCA AAT GGC CAC CCT TTC CTC ACC CAA GTC CCA CCT AAC 259

Asp Phe Leu Ala Asn Gly His Pro Phe Leu Thr Gln Val Pro Pro Asn

40 45 50

ATA ACA ACA ACA ACA ACA ACC ACT GCT TCC TCT TTT CTC AAT CTC AAA 307

Ile Thr Thr Thr Thr Thr Thr Thr Ala Ser Ser Phe Leu Asn Leu Lys

55 60 65

TCC AAC AAA GAT ACC ATT CCC AAC AAC AAC AAC ACC ATG TTG TTG CAA 355

Ser Asn Lys Asp Thr Ile Pro Asn Asn Asn Asn Thr Met Leu Leu Gln

70 75 80 85

CAA GGT TGT TTC GTT GGT TTC AAC TCC ACC GAA CCC AAA AGC CAC CAC 403

Gln Gly Cys Phe Val Gly Phe Asn Ser Thr Glu Pro Lys Ser His His

90 95 100

GTA GTT CCA CTC GGC AAA CTA AAA GGA ATC AAA TTC ATG AGC ATA TTC 451

Val Val Pro Leu Gly Lys Leu Lys Gly Ile Lys Phe Met Ser Ile Phe

105 110 115

CGG TTC AAA GTT TGG TGG ACA ACT CAC TGG GTC GGA ACA AAT GGA CAG 499

Arg Phe Lys Val Trp Trp Thr Thr His Trp Val Gly Thr Asn Gly Gln

120 125 130

GAA CTA CAA CAC GAA ACA CAA ATG TTA ATC CTG GAC AAA AAC GAC TCC 547

Glu Leu Gln His Glu Thr Gln Met Leu Ile Leu Asp LysAsn Asp Ser

135 140 145

CTC GGA CGA CCC TAT GTC TTA CTC CTC CCA ATC CTA GAA AAC ACC TTC 595

Leu Gly Arg Pro Tyr Val Leu Leu Leu Pro Ile Leu Glu Asn Thr Phe

150 155 160 165

CGA ACC TCA CTC CAA CCC GGT CTC AAC GAT CAC ATA GGC ATG TCC GTC 643

Arg Thr Ser Leu Gln Pro Gly Leu Asn Asp His Ile Gly Met Ser Val

170 175 180

GAA AGC GGT TCA ACA CAT GTC ACC GGG TCA AGC TTC AAA GCA TGT CTT 691

Glu Ser Gly Ser Thr His Val Thr Gly Ser Ser Phe Lys Ala Cys Leu

185 190 195

TAC ATC CAT CTC AGT AAC GAC CCA TAC AGT ATA CTA AAA GAA GCA GTT 739

Tyr Ile His Leu Ser Asn Asp Pro Tyr Ser Ile Leu Lys Glu Ala Val

200 205 210

AAA GTA ATC CAA ACT CAG TTA GGA ACA TTC AAG ACT CTT GAA GAA AAA 787

Lys Val Ile Gln Thr Gln Leu Gly Thr Phe Lys Thr Leu Glu Glu Lys

215 220 225

ACA GCA CCT AGT ATT ATA GAC AAA TTC GGT TGG TGC ACG TGG GAT GCT 835

Thr Ala Pro Ser Ile Ile Asp Lys Phe Gly Trp Cys Thr Trp Asp Ala

230 235 240 245

TTT TAC TTG AAG GTT CAT CCA AAA GGT GTA TGG GAA GGT GTA AAG TCT 883

Phe Tyr Leu Lys Val His Pro Lys Gly Val Trp Glu Gly Val Lys Ser

250 255 260

CTC ACA GAT GGT GGT TGT CCT CCC GGT TTC GTC ATA ATC GAC GAC GGT 931

Leu Thr Asp Gly Gly Cys Pro Pro Gly Phe Val Ile Ile Asp Asp Gly

265 270 275

TGG CAA TCC ATT TGT CAT GAC GAT GAC GAT GAA GAT GAT TCA GGA ATG 979

Trp Gln Ser Ile Cys His Asp Asp Asp Asp Glu Asp Asp Ser Gly Met

280 285 290

AAC CGA ACC TCA GCC GGG GAA CAA ATG CCA TGC AGA CTT GTA AAA TAC 1027

Asn Arg Thr Ser Ala Gly Glu Gln Met Pro Cys Arg Leu Val Lys Tyr

295 300 305

GAA GAG AAT TCT AAG TTT AGA GAA TAT GAG AAT CCT GAA AAT GGA GGG 1075

Glu Glu Asn Ser Lys Phe Arg Glu Tyr Glu Asn Pro Glu Asn Gly Gly

310 315 320 325

AAG AAA GGT TTG GGT GGT TTT GTG AGG GAT TTG AAG GAA GAG TTT GGG 1123

Lys Lys Gly Leu Gly Gly Phe Val Arg Asp Leu Lys Glu Glu Phe Gly

330 335 340

AGT GTG GAG AGT GTT TAT GTT TGG CAT GCG CTT TGT GGG TAT TGG GGC 117l

Ser Val Glu Ser Val Tyr Val Trp His Ala Leu Cys Gly Tyr Trp Gly

345 350 355

GGG GTT AGG CCT GGA GTG CAT GGG ATG CCG AAA GCT AGG GTT GTT GTT 1219

Gly Val Arg Pro Gly Val His Gly Met Pro Lys Ala Arg Val Val Val

360 365 370

CCG AAG GTG TCT CAG GGG TTG AAG ATG ACG ATG GAG GAT TTG GCG GTG 1267

Pro Lys Val Ser Gln Gly Leu Lys Met Thr Met Glu Asp Leu Ala Val

375 380 385

GAT AAG ATT GTT GAG AAC GGT GTG GGG CTA GTG CCG CCA GAT TTT GCA 1315

Asp Lys Ile Val Glu Asn Gly Val Gly Leu Val Pro Pro Asp Phe Ala

390 395 400 405

CAT GAG ATG TTT GAT GGG CTT CAC TCT CAT TTG GAG TCG GCG GGA ATT 1363

His Glu Met Phe Asp Gly Leu His Ser His Leu Glu Ser Ala Gly Ile

410 415 420

GAC GGT GTT AAA GTT GAT GTT ATC CAT CTG CTT GAG TTA CTA TCA GAG 1411

Asp Gly Val Lys Val Asp Val Ile His Leu Leu Glu Leu Leu Ser Glu

425 430 435

GAA TAT GGT GGA CGA GTT GAG CTA GCA AGA GCT TAT TAC AAA GCA CTA 1459

Glu Tyr Gly Gly Arg Val Glu Leu Ala Arg Ala Tyr Tyr Lys Ala Leu

440 445 450

ACC TCA TCA GTG AAG AAA CAT TTC AAA GGC AAT GGT GTA ATT GCT AGC 1507

Thr Ser Ser Val Lys Lys His Phe Lys Gly Asn Gly Val Ile Ala Ser

455 460 465

ATG GAG CAT TGC AAC GAC TTC TTT CTC CTC GGC ACC GAA GCC ATA TCC 1555

Met Glu His Cys Asn Asp Phe Phe Leu Leu Gly Thr Glu Ala Ile Ser

470 475 480 485

CTC GGC CGC GTC GGA GAT GAT TTT TGG TGC TCT GAT CCA TCT GGT GAT 1603

Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Ser Asp Pro Ser Gly Asp

490 495 500

CCA AAT GGT ACA TAT TGG CTC CAA GGT TGT CAC ATG GTA CAT TGT GCC 1651

Pro Asn Gly Thr Tyr Trp Leu Gln Gly Cys His Met Val His Cys Ala

505 510 515

TAC AAC AGT TTA TGG ATG GGA AAT TTC ATT CAG CCA GAT TGG GAC ATG 1699

Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln Pro Asp Trp Asp Met

520 525 530

TTT CAG TCC ACT CAT CCT TGT GCT GAA TTT CAT GCC GCC TCA CGA GCC 1747

Phe Gln Ser Thr His Pro Cys Ala Glu Phe His Ala Ala Ser Arg Ala

535 540 545

ATA TCC GGC GGA CCA ATT TAT GTT AGT GAT TGT GTT GGT AAT CAC AAT 1795

Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Cys Val Gly Asn His Asn

550 555 560 565

TTC AAG TTG CTC AAA TCT CTT GTT TTG CCC GAT GGT TCT ATC TTG CGT 1843

Phe Lys Leu Leu Lys Ser Leu Val Leu Pro Asp Gly Ser Ile Leu Arg

570 575 580

TGT CAA CAT TAC GCA CTC CCT ACA AGA GAT TGC TTG TTT GAA GAC CCT 1891

Cys Gln His Tyr Ala Leu Pro Thr Arg Asp Cys Leu Phe Glu Asp Pro

585 590 595

TTG CAT AAT GGC AAA ACA ATG CTG AAA ATT TGG AAT CTC AAC AAA TAT 1939

Leu His Asn Gly Lys Thr Met Leu Lys Ile Trp Asn Leu Asn Lys Tyr

600 605 610

ACA GGT GTT TTG GGT CTT TTC AAC TGC CAA GGT GGT GGG TGG TGT CCT 1987

Thr Gly Val Leu Gly Leu Phe Asn Cys Gln Gly Gly Gly Trp Cys Pro

615 620 625

GAG GCA CGG CGA AAC AAG AGT GTA TCT GAA TTT TCA CGC GCG GTG ACA 2035

Glu Ala Arg Arg Asn Lys Ser Val Ser Glu Phe Ser Arg Ala Val Thr

630 635 640 645

TGT TAT GCA AGT CCC GAA GAC ATT GAA TGG TGC AAT GGG AAA ACT CCA 2083

Cys Tyr Ala Ser Pro Glu Asp Ile Glu Trp Cys Asn Gly Lys Thr Pro

650 655 660

ATG AGC ACC AAA GGT GTG GAT TTT TTT GCT GTG TAT TTT TTC AAG GAG 2131

Met Ser Thr Lys Gly Val Asp Phe Phe Ala Val Tyr Phe Phe Lys Glu

665 670 675

AAG AAA TTG AGG CTC ATG AAG TGT TCT GAT AGA TTG AAA GTT TCG CTT 2179

Lys Lys Leu Arg Leu Met Lys Cys Ser Asp Arg Leu Lys Val Ser Leu

680 685 690

GAG CCA TTT AGT TTT GAG CTA ATG ACA GTG TCT CCA GTG AAA GTG TTT 2227

Glu Pro Phe Ser Phe Glu Leu Met Thr Val Ser Pro Val Lys Val Phe

695 700 705

TCG AAA AGG TTT ATA CAG TTT GCA CCG ATT GGG TTA GTG AAC ATG CTG 2275

Ser Lys Arg Phe Ile Gln Phe Ala pro Ile Gly Leu Val Asn Met Leu

710 715 720 725

AAC TCT GGT GGT GCG ATT CAG TCT CTG GAG TTT GAT GAT AAT GCA AGT 2323

Asn Ser Gly Gly Ala Ile Gln Ser Leu Glu Phe Asp Asp Asn Ala Ser

730 735 740

TTG GTC AAG ATT GGG GTG AGA GGT TGC GGG GAG ATG AGC GTG TTT GCG 2371

Leu Val Lys Ile Gly Val Arg Gly Cys Gly Glu Met Ser Val Phe Ala

745 750 755

TCT GAG AAA CCG GTT TGC TGC AAA ATT GAT GGG GTT AAG GTG AAA TTT 2419

Ser Glu Lys Pro Val Cys Cys Lys Ile Asp Gly Val Lys Val Lys Phe

760 765 770

CTT TAT GAG GAC AAA ATG GCA AGA GTT CAA ATT CTG TGG CCT AGT TCT 2467

Leu Tyr Glu Asp Lys Met Ala Arg Val Gln Ile Leu Trp Pro Ser Ser

775 780 785

TCA ACA TTG TCT TTG GTC CAG TTT TTA TTT TGA TCCCTAGGAA TCCTATGCAC 2520

Ser Thr Leu Ser Leu Val Gln Phe Leu Phe Stop

790 795 800

GTGTCTCTGT TTACAAGTAC TTTATATAAG TATAATATGT ATCTATTTCC ATTTTTAACT 2580

GTCTTTATGC AATTAGGTGG TCAATTAGTT ATTTGTTTGT GAAGTAACTA ACTTGCTTGT 2640

GTTGTAAGCT TATAATATAT GGTCAAGTTC CTCACTTGTA TATACCTGTT GTATGTATAA 2700

ATTTTACTAT ATATGACTAA CATCATTATC TTGTGAGCAA AAAAAA 2746

(2)SEQ ID NO：3的信息

(i)序列特征：

(A)长度：781个碱基酸

(B)类型：氨基酸

(D)拓扑：线型

(ii)分子类型：肽

(vi)原始来源

(A)生物：大豆(glycine max)

(B)品种：Williams 82

(F)组织类型：种子和叶

(xi)SEQ ID NO：3的序列描述：

Met Ala Pro Ser Ile Ser Lys Thr Val Glu Leu Asn Ser Phe Gly Leu

5 10 15

Val Asn Gly Asn Leu Pro Leu Ser Ile Thr Leu Glu Gly Ser Asn Phe

20 25 30

Leu Ala Asn Gly His Pro Phe Leu Thr Glu Val Pro Glu Asn Ile Ile

35 40 45

Val Thr Pro Ser Pro Ile Asp Ala Lys Ser Ser Lys Asn Asn Glu Asp

50 55 60

Asp Asp Val Val Gly Cys Phe Val Gly Phe His Ala Asp Glu Pro Arg

65 70 75 80

Ser Arg His Val Ala Ser Leu Gly Lys Leu Arg Gly Ile Lys Phe Met

85 90 95

Ser Ile Phe Arg Phe Lys Val Trp Trp Thr Thr His Trp Val Gly Ser

100 105 110

Asn Gly His Glu Leu Glu His Glu Thr Gln Met Met Leu Leu Asp Lys

115 120 125

Asn Asp Gln Leu Gly Arg Pro Phe Val Leu Ile Leu Pro Ile Leu Gln

130 135 140

Ala Ser Phe Arg Ala Ser Leu Gln Pro Gly Leu Asp Asp Tyr Val Asp

145 150 155 160

Val Cys Met Glu Ser Gly Ser Thr Arg Val Cys Gly Ser Ser Phe Gly

165 170 175

Ser Cys Leu Tyr Val His Val Gly His Asp Pro Tyr Gln Leu Leu Arg

180 185 190

Glu Ala Thr Lys Val Val Arg Met His Leu Gly Thr Phe Lys Leu Leu

195 200 205

Glu Glu Lys Thr Ala Pro Val Ile Ile Asp Lys Phe Gly Trp Cys Thr

210 215 220

Trp Asp Ala Phe Tyr Leu Lys Val His Pro Ser Gly Val Trp Glu Gly

225 230 235 240

Val Lys Gly Leu Val Glu Gly Gly Cys Pro Pro Gly Met Val Leu Ile

245 250 255

Asp Asp Gly Trp Gln Ala Ile Cys His Asp Glu Asp Pro Ile Thr Asp

260 265 270

Gln Glu Gly Met Lys Arg Thr Ser Ala Gly Glu Gln Met Pro Cys Arg

275 280 285

Leu Val Lys Leu Glu Glu Asn Tyr Lys Phe Arg Gln Tyr Cys Ser Gly

290 295 300

Lys Asp Ser Glu Lys Gly Met Gly Ala Phe Val Arg Asp Leu Lys Glu

305 310 315 320

Gln Phe Arg Ser Val Glu Gln Val Tyr Val Trp His Ala Leu Cys Gly

325 330 335

Tyr Trp Gly Gly Val Arg Pro Lys Val Pro Gly Met Pro Gln Ala Lys

340 345 350

Val Val Thr Pro Lys Leu Ser Asn Gly Leu Lys Leu Thr Met Lys Asp

355 360 365

Leu Ala Val Asp Lys Ile Val Ser Asn Gly Val Gly Leu Val Pro Pro

370 375 380

His Leu Ala His Leu Leu Tyr Glu Gly Leu His Ser Arg Leu Glu Ser

385 390 395 400

Ala GlyIle Asp Gly Val Lys Val Asp Val Ile His Leu Leu Glu Met

405 410 415

Leu Ser Glu Glu Tyr Gly Gly Arg Val Glu Leu Ala Lys Ala Tyr Tyr

420 425 430

Lys Ala Leu Thr Ala Ser Val Lys Lys His Phe Lys Gly Asn Gly Val

435 440 445

Ile Ala Ser Met Glu His Cys Asn Asp Phe Phe Leu Leu Gly Thr Glu

450 455 460

Ala Ile Ala Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr Asp Pro

465 470 475 480

Ser Gly Asp Pro Asn Gly Thr Tyr Trp Leu Gln Gly Cys His Met Val

485 490 495

His Cys Ala Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln Pro Asp

500 505 510

Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His Ala Ala

515 520 525

Ser Arg Ala Ile Ser Gly Gly Pro Val Tyr Val Ser Asp Cys Val Gly

530 535 540

Lys His Asn Phe Lys Leu Leu Lys Ser Leu Ala Leu Pro Asp Gly Thr

545 550 555 560

Ile Leu Arg Cys Gln His Tyr Ala Leu Pro Thr Arg Asp Cys Leu Phe

565 570 575

Glu Asp Pro Leu His Asp Gly Lys Thr Met Leu Lys Ile Trp Asn Leu

580 585 590

Asn Lys Tyr Thr Gly Val Leu Gly Leu Phe Asn Cys Gln Gly Gly Gly

595 600 605

Trp Cys Pro Val Thr Arg Arg Asn Lys Ser Ala Ser Glu Phe Ser Gln

610 615 620

Thr Val Thr Cys Leu Ala Ser Pro Gln Asp Ile Glu Trp Ser Asn Gly

625 630 635 640

Lys Ser Pro Ile Cys Ile Lys Gly Met Asn Val Phe Ala Val Tyr Leu

645 650 655

Phe Lys Asp His Lys Leu Lys Leu Met Lys Ala Ser Glu Lys Leu Glu

660 665 670

Val Ser Leu Glu Pro Phe Thr Phe Glu Leu Leu Thr Val Ser Pro Val

675 680 685

Ile Val Leu Ser Lys Lys Leu Ile Gln Phe Ala Pro Ile Gly Leu Val

690 695 700

Asn Met Leu Asn Thr Gly Gly Ala Ile Gln Ser Met Glu Phe Asp Asn

705 710 715 720

His Ile Asp Val Val Lys Ile Gly Val Arg Gly Cys Gly Glu Met Lys

725 730 735

Val Phe Ala Ser Glu Lys Pro Val Ser Cys Lys Leu Asp Gly Val Val

740 745 750

Val Lys Phe Asp Tyr Glu Asp Lys Met Leu Arg Val Gln Val Pro Trp

755 760 765

Pro Ser Ala Ser Lys Leu Ser Met Val Glu Phe Leu Phe Stop

770 775 780(2)SEQ ID NO：4的信息

(i)序列特征：

(A)长度：2598个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑：线型

(ii)分子类型：cDNA到mRNA

(ix)特征：

(A)名称/关键词：肽

(B)位置：62到2407

(C)鉴定方法：实验

(xi)SEQ ID NO：4的序列描述：

CCAAACCATA GCAAACCTAA GCACCAAACC TCTTTCTTTC AAGATCCTTG AATTCAGTCC 60

C ATG GCT CCA AGC ATA AGC AAA ACT GTG GAA CTA AAT TCA TTT GGT 106

Met Ala Pro Ser Ile Ser Lys Thr Val Glu Leu Asn Ser Phe Gly

5 10 15

CTT GTC AAC GGT AAT TTG CCT TTG TCC ATA ACC CTA GAA GGA TCA AAT 154

Leu Val Asn Gly Asn Leu Pro Leu Ser Ile Thr Leu Glu Gly Ser Asn

20 25 30

TTC CTC GCC AAC GGC CAC CCT TTT CTC ACG GAA GTT CCC GAA AAC ATA 202

Phe Leu Ala Asn Gly His Pro Phe Leu Thr Glu Val Pro Glu Asn Ile

35 40 45

ATA GTC ACC CCT TCA CCC ATC GAC GCC AAG AGT AGT AAG AAC AAC GAG 250

Ile Val Thr Pro Ser Pro Ile Asp Ala Lys Ser Ser Lys Asn Asn Glu

50 55 60

GAC GAC GAC GTC GTA GGT TGC TTC GTG GGC TTC CAC GCG GAC GAG CCC 298

Asp Asp Asp Val Val Gly Cys Phe Val Gly Phe His Ala Asp Glu Pro

65 70 75

AGA AGC CGA CAC GTG GCT TCC CTG GGG AAG CTC AGA GGA ATA AAA TTC 346

Arg Ser Arg His Val Ala Ser Leu Gly Lys Leu Arg Gly Ile Lys Phe

80 85 90 95

ATG AGC ATA TTC CGG TTT AAG GTG TGG TGG ACC ACT CAC TGG GTC GGT 394

Met Ser Ile Phe Arg Phe Lys Val Trp Trp Thr Thr His Trp Val Gly

100 105 110

AGC AAC GGA CAC GAA CTG GAG CAC GAG ACA CAG ATG ATG CTT CTC GAC 442

Ser Asn Gly His Glu Leu Glu His Glu Thr Gln Met Met Leu Leu Asp

115 120 125

AAA AAC GAC CAG CTC GGA CGC CCC TTT GTG TTG ATT CTC CCG ATC CTC 490

Lys Asn Asp Gln Leu Gly Arg Pro Phe Val Leu Ile Leu Pro Ile Leu

130 135 140

CAA GCC TCG TTC CGA GCC TCC CTG CAA CCC GGT TTG GAT GAT TAC GTG 538

Gln Ala Ser Phe Arg Ala Ser Leu Gln Pro Gly Leu Asp Asp Tyr Val

145 150 155

GAC GTT TGC ATG GAG AGC GGG TCG ACA CGT GTC TGT GGC TCC AGC TTC 586

Asp Val Cys Met Glu Ser Gly Ser Thr Arg Val Cys Gly Ser Ser Phe

160 165 170 175

GGG AGC TGC TTA TAC GTC CAC GTT GGC CAT GAC CCG TAT CAG TTG CTT 634

Gly Ser Cys Leu Tyr Val His Val Gly His Asp Pro Tyr Gln Leu Leu

180 185 190

AGA GAA GCA ACT AAA GTC GTT AGG ATG CAT TTG GGG ACG TTC AAG CTT 682

Arg Glu Ala Thr Lys Val Val Arg Met His Leu Gly Thr Phe Lys Leu

195 200 205

CTC GAG GAG AAA ACC GCG CCA GTG ATC ATA GAC AAG TTT GGT TGG TGT 730

Leu Glu Glu Lys Thr Ala Pro Val Ile Ile Asp Lys Phe Gly Trp Cys

210 215 220

ACA TGG GAC GCG TTT TAC TTG AAG GTG CAT CCC TCA GGT GTG TGG GAA 778

Thr Trp Asp Ala Phe Tyr Leu Lys Val His Pro Ser Gly Val Trp Glu

225 230 235

GGG GTG AAA GGG TTG GTG GAG GGA GGG TGC CCT CCA GGG ATG GTC CTA 826

Gly Val Lys Gly Leu Val Glu Gly Gly Cys Pro Pro Gly Met Val Leu

240 245 250 255

ATC GAC GAC GGG TGG CAA GCC ATT TGT CAC GAC GAG GAC CCC ATA ACG 874

Ile Asp Asp Gly Trp Gln Ala Ile Cys His Asp Glu Asp Pro Ile Thr

260 265 270

GAC CAA GAG GGT ATG AAG CGA ACC TCC GCA GGG GAG CAA ATG CCA TGC 922

Asp Gln Glu Gly Met Lys Arg Thr Ser Ala Gly Glu Gln Met Pro Cys

275 280 285

AGG TTG GTG AAG TTG GAG GAA AAT TAC AAG TTC AGA CAG TAT TGT AGT 970

Arg Leu Val Lys Leu Glu Glu Asn Tyr Lys Phe Arg Gln Tyr Cys Ser

290 295 300

GGA AAG GAT TCT GAG AAG GGT ATG GGT GCC TTT GTT AGG GAC TTG AAG 1018

Gly Lys Asp Ser Glu Lys Gly Met Gly Ala Phe Val Arg Asp Leu Lys

305 310 315

GAA CAG TTT AGG AGC GTG GAG CAG GTG TAT GTG TGG CAC GCG CTT TGT 1066

Glu Gln Phe Arg Ser Val Glu Gln Val Tyr Val Trp His Ala Leu Cys

320 325 330 335

GGG TAT TGG GGT GGG GTC AGA CCC AAG GTT CCG GGC ATG CCC CAG GCT 1114

Gly Tyr Trp Gly Gly Val Arg Pro Lys Val Pro Gly Met Pro Gln Ala

340 345 350

AAG GTT GTC ACT CCG AAG CTG TCC AAT GGA CTA AAA TTG ACA ATG AAG 1162

Lys Val Val Thr Pro Lys Leu Ser Asn Gly Leu Lys Leu Thr Met Lys

355 360 365

GAT TTA GCG GTG GAT AAG ATC GTC AGT AAC GGA GTI GGA CTG GTG CCA 1210

Asp Leu Ala Val Asp Lys Ile Val Ser Asn Gly Val Gly Leu Val Pro

370 375 380

CCA CAC CTG GCT CAC CIT TTG TAC GAG GGG CTC CAC TCC CGT TTG GAA 1258

Pro His Leu Ala His Leu Leu Tyr Glu Gly Leu His Ser Arg Leu Glu

385 390 395

TCT GCG GGT ATT GAC GGT GTT AAG GTT GAC GTT ATA CAC TTG CTC GAG 1306

Ser Ala Gly Ile Asp Gly Val Lys Val Asp Val Ile His Leu Leu Glu

400 405 410 415

ATG CTA TCC GAG GAA TAC GGT GGC CGT GTT GAG CTA GCC AAA GCT TAT 1354

Met Leu Ser Glu Glu Tyr Gly Gly Arg Val Glu Leu Ala Lys Ala Tyr

420 425 430

TAC AAA GCG CTC ACT GCT TCG GTG AAG AAG CAT TTC AAA GGC AAT GGG 1402

Tyr Lys Ala Leu Thr Ala Ser Val Lys Lys His Phe Lys Gly Asn Gly

435 440 445

GTC ATT GCG AGC ATG GAG CAT TGT AAT GAC TTC TTT CTC CTT GGT ACC 1450

Val Ile Ala Ser Met Glu His Cys Asn Asp Phe Phe Leu Leu Gly Thr

450 455 460

GAA GCC ATA GCC CTT GGG CGC GTA GGA GAT GAT TTT TGG TGC ACT GAT 1498

Glu Ala Ile Ala Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr Asp

465 470 475

CCC TCT GGA GAT CCA AAT GGC ACG TAT TGG CTC CAA GGG TGT CAC ATG 1546

Pro Ser Gly Asp Pro Asn Gly Thr Tyr Trp Leu Gln Gly Cys His Met

480 485 490 495

GTG CAC TGT GCC TAC AAC AGC TTG TGG ATG GGG AAT TTT ATT CAG CCG 1594

Val His Cys Ala Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln Pro

500 505 510

GAT TGG GAC ATG TTC CAG TCC ACT CAC CCT TGT GCC GAA TTC CAT GCA 1642

Asp Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His Ala

515 520 525

GCC TCT AGG GCC ATC TCT GGT GGA CCA GTT TAC GTT AGT GAT TGT GTT 1690

Ala Ser Arg Ala Ile Ser Gly Gly Pro Val Tyr Val Ser Asp Cys Val

530 535 540

GGA AAG CAC AAC TTC AAG TTG CTC AAG AGC CTC GCT TTG CCT GAT GGG 1738

Gly Lys His Asn Phe Lys Leu Leu Lys Ser Leu Ala Leu Pro Asp Gly

545 550 555

ACG ATT TTG CGT TGT CAA CAC TAT GCA CTC CCC ACA CGA GAC TGT TTG 1786

Thr Ile Leu Arg Cys Gln His Tyr Ala Leu Pro Thr Arg Asp Cys Leu

560 565 570 575

TTT GAA GAC CCC TTG CAT GAT GGG AAG ACA ATG CTC AAA ATT TGG AAT 1834

Phe Glu Asp Pro Leu His Asp Gly Lys Thr Met Leu Lys Ile Trp Asn

580 585 590

CTC AAC AAA TAT ACA GGT GTT TTG GGT CTA TTT AAT TGC CAA GGA GGT 1882

Leu Asn Lys Tyr Thr Gly Val Leu Gly Leu Phe Asn Cys Gln Gly Gly

595 600 605

GGG TGG TGT CCC GTA ACT AGG AGA AAC AAG AGT GCC TCT GAA TTT TCA 1930

Gly Trp Cys Pro Val Thr Arg Arg Asn Lys Ser Ala Ser Glu Phe Ser

610 615 620

CAA ACT GTG ACA TGC TTA GCG AGT CCT CAA GAC ATT GAA TGG AGC AAT 1978

Gln Thr Val Thr Cys Leu Ala Ser Pro Gln Asp Ile Glu Trp Ser Asn

625 630 635

GGG AAA AGC CCA ATA TGC ATA AAA GGG ATG AAT GTG TTT GCT GTA TAT 2026

Gly Lys Ser Pro Ile Cys Ile Lys Gly Met Asn Val Phe Ala Val Tyr

640 645 650 655

TTG TTC AAG GAC CAC AAA CTA AAG CTC ATG AAG GCA TCA GAG AAA TTG 2074

Leu Phe Lys Asp His Lys Leu Lys Leu Met Lys Ala Ser Glu Lys Leu

660 665 670

GAA GTT TCA CTT GAG CCA TTT ACT TTT GAG CTA TTG ACA GTG TCT CCA 2122

Glu Val Ser Leu Glu Pro Phe Thr Phe Glu Leu Leu Thr Val Ser Pro

675 680 685

GTG ATT GTG CTG TCA AAA AAG TTA ATT CAA TTT GCT CCA ATT GGA TTA 2170

Val Ile Val Leu Ser Lys Lys Leu Ile Gln Phe Ala Pro Ile Gly Leu

690 695 700

GTG AAC ATG CTT AAC ACT GGT GGT GCC ATT CAG TCC ATG GAG TTT GAC 2218

Val Asn Met Leu Asn Thr Gly Gly Ala Ile Gln Ser Met Glu Phe Asp

705 710 715

AAC CAC ATA GAT GTG GTC AAA ATT GGG GTT AGG GGT TGT GGG GAG ATG 2266

Asn His Ile Asp Val Val Lys Ile Gly Val Arg Gly Cys Gly Glu Met

720 725 730 735

AAG GTG TTT GCA TCA GAG AAA CCA GTT AGT TGC AAA CTA GAT GGG GTA 2314

Lys Val Phe Ala Ser Glu Lys Pro Val Ser Cys Lys Leu Asp Gly Val

740 745 750

GTT GTA AAA TTT GAT TAT GAG GAT AAA ATG CTG AGA GTG CAA GTT CCC 2362

Val Val Lys Phe Asp Tyr Glu Asp Lys Met Leu Arg Val Gln Val Pro

755 760 765

TGG CCT AGT GCT TCA AAA TTG TCA ATG GTT GAG TTT TTA TTT TGA TCCCT 2412

Trp Pro Ser Ala Ser Lys Leu Ser Met Val Glu Phe Leu Phe Stop

770 775 780

GAAGGTGAAT TTGGGATACT ATGATGTTTG ACTCTCTTTT TAAGTAATAA GAGTCATATT 2472

TTTCTGTTGT AAAAAAAAAA AAAAAA 2498

(2)SEQ ID NO：5的信息

(i)序列特征：

(A)长度：587个氨基酸

(B)类型：氨基酸

(D)拓扑：线型

(ii)分子类型：肽

(vi)原始来源：

(A)生物：Japanese artichoke(Stachys sieboldii)

(F)组织类型：叶

(xi)SEQ ID NO：5的序列描述：

Thr Asn Gly Ser Asp Leu Glu Arg Glu Thr Gln Ile Val Val Leu Asp

1 5 10 15

Lys Ser Asp Asp Arg Pro Tyr Ile Val Leu Leu Pro Leu Ile Glu Gly

20 25 30

Gln Phe Arg Ala Ser Leu Gln Pro Gly Val Asp Asp Phe Ile Asp Ile

35 40 45

Cys Val Glu Ser Gly Ser Thr Lys Val Asn Glu Ser Ser Phe Arg Ala

50 55 60

Ser Leu Tyr Met His Ala Gly Asp Asp Pro Phe Thr Leu Val Lys Asp

65 70 75 80

Ala Val Lys Val Ala Arg His His Leu Gly Thr Phe Arg Leu Leu Glu

85 90 95

Glu Lys Thr Pro Pro Gly Ile Val Asp Lys Phe Gly Trp Cys Thr Trp

100 105 110

Asp Ala Phe Tyr Leu Asn Val Gln Pro His Gly Val Met Glu Gly Val

115 120 125

Gln Gly Leu Val Asp Gly Gly Cys Pro Pro Gly Leu Val Leu Ile Asp

130 135 140

Asp Gly Trp Gln Ser Ile Cys His Asp Asn Asp Ala Leu Thr Thr Glu

145 150 155 160

Gly Met Gly Arg Thr Ser Ala Gly Glu Gln Met Pro Cys Arg Leu Ile

165 170 175

Lys Phe Glu Glu Asn Tyr Lys Phe Arg Glu Tyr Glu Ser Pro Asn Lys

180 185 190

Thr Gly Pro Gly Pro Asn Thr Gly Met Gly Ala Phe Ile Arg Asp Met

195 200 205

Lys Asp Asn Phe Lys Ser Val Asp Tyr Val Tyr Val Trp His Ala Leu

210 215 220

Cys Gly Tyr Trp Gly Gly Leu Arg Pro Asn Val Pro Gly Leu Pro Glu

225 230 235 240

Ala Lys Leu Ile Glu Pro Lys Leu Thr Pro Gly Leu Lys Thr Thr Met

245 250 255

Glu Asp Leu Ala Val Asp Lys Ile Val Asn Asn Gly Val Gly Leu Val

260 265 270

Pro Pro Glu Phe Val Glu Gln Met Tyr Glu Gly Leu His Ser His Leu

275 280 285

Glu Ser Val Gly Ile Asp Gly Val Lys Val Asp Val Ile His Leu Leu

290 295 300

Glu Met Leu Cys Glu Asp Tyr Gly Gly Arg Val Asp Leu Ala Lys Ala

305 310 315 320

Tyr Tyr Lys Ala Leu Ser Ser Ser Val Asn Asn His Phe Asn Gly Asn

325 330 335

Gly Val Ile Ala Gly Leu Glu His Cys Asn Asp Phe Met Phe Leu Gly

340 345 350

Thr Glu Ala Ile Thr Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr

355 360 365

Asp Pro Ser Gly Asp Pro Asn Gly Thr Phe Trp Leu Gln Gly Cys His

370 375 380

Met Val His Cys Ala Tyr Asn Ser Ile Trp Met Gly Asn Phe Ile His

385 390 395 400

Pro Asp Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His

405 410 415

Ala Ala Ser Arg Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser

420 425 430

Val Gly Lys His Asn Phe Glu Leu Leu Arg Ser Leu Val Leu Pro Asp

435 440 445

Gly Ser Ile Leu Arg Cys Asp Tyr Tyr Ala Leu Pro Thr Arg Asp Cys

450 455 460

Leu Phe Glu Asp Pro Leu His Asn Gly Lys Thr Met Leu Lys Ile Trp

465 470 475 480

Asn Tyr Asn Lys Phe Thr Gly Val Val Gly Thr Phe Asn Cys Gln Gly

485 490 495

Gly Gly Trp Ser Arg Glu Val Arg Arg Asn Gln Cys Ala Ala Glu Tyr

500 505 510

Ser His Ala Val Ser Ser Ser Ala Gly Pro Ser Asp Ile Glu Trp Lys

515 520 525

Gln Gly Thr Ser Pro Ile Asp Val Asp Gly Val Lys Thr Phe Ala Leu

530 535 540

Tyr Leu Phe His Glu Lys Lys Leu Val Leu Ser Lys Pro Ser Asp Lys

545 550 555 560

Ile Asp Ile Thr Leu Glu Pro Phe Asp Phe Glu Leu Ile Thr Val Ser

565 570 575

pro Val Iys Thr Leu Ala Asn Cys Thr Val Gln

580 585

(2)SEQ ID NO：6的信息

(i)序列特征：

(A)长度：1762个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑：线型

(ii)分子类型：cDNA到mRNA

(ix)特征：

(A)名称/关键词：肽

(B)位置：2到1762

(C)鉴定方法：实验

(xi)SEQ ID NO：6的序列描述：

G ACA AAC GGG TCG GAT CTT GAG CGG GAA ACT CAA ATA GTC GTG CTC 46

Thr Asn Gly Ser Asp Leu Glu Arg Glu Thr Gln Ile Val Val Leu

1 5 10 15

GAC AAG TCC GAC GAC AGG CCC TAC ATC GTG CTG CTT CCG CTC ATC GAG 94

Asp Lys Ser Asp Asp Arg Pro Tyr Ile Val Leu Leu Pro Leu Ile Glu

20 25 30

GGG CAG TTT CGG GCT TCC CTT CAG CCC GGT GTG GAT GAT TTT ATC GAT 142

Gly Gln Phe Arg Ala Ser Leu Gln Pro Gly Val Asp Asp Phe Ile Asp

35 40 45

ATT TGT GTC GAA AGC GGG TCA ACC AAG GTC AAC GAG TCC TCG TTC CGT 190

Ile Cys Val Glu Ser Gly Ser Thr Lys Val Asn Glu Ser Ser Phe Arg

50 55 60

GCT TCG CTC TAC ATG CAC GCC GGT GAT GAC CCT TTT ACC CTG GTG AAG 238

Ala Ser Leu Tyr Met His Ala Gly Asp Asp Pro Phe Thr Leu Val Lys

65 70 75

GAC GCC GTG AAG GTG GCG CGC CAC CAC CTC GGG ACG TTC AGG CTG CTG 286

Asp Ala Val Lys Val Ala Arg His His Leu Gly Thr Phe Arg Leu Leu

80 85 90 95

GAG GAG AAA ACT CCG CCG GGG ATC GTC GAC AAA TTC GGG TGG TGC ACG 334

Glu Glu Lys Thr Pro Pro Gly Ile Val Asp Lys Phe Gly Trp Cys Thr

100 105 110

TGG GAT GCG TTC TAC CTC AAC GTC CAG CCC CAC GGC GTT ATG GAG GGC 382

Trp Asp Ala Phe Tyr Leu Asn Val Gln Pro His Gly Val Met Glu Gly

115 120 125

GTG CAG GGG CTG GTT GAC GGC GGA TGT CCG CCG GGG CTG GTG TTG ATC 430

Val Gln Gly Leu Val Asp Gly Gly Cys Pro Pro Gly Leu Val Leu Ile

130 135 140

GAC GAC GGG TGG CAG TCC ATT TGT CAC GAC AAC GAC GCG CTC ACC ACC 478

Asp Asp Gly Trp Gln Ser Ile Cys His Asp Asn Asp Ala Leu Thr Thr

145 150 155

GAG GGG ATG GGG AGA ACC TCC GCC GGA GAG CAA ATG CCC TGC AGG TTG 526

Glu Gly Met Gly Arg Thr Ser Ala Gly Glu Gln Met Pro Cys Arg Leu

160 165 170 175

ATC AAG TTT GAG GAG AAT TAC AAG TTC AGG GAG TAC GAG AGC CCG AAT 574

Ile Lys Phe Glu Glu Asn Tyr Lys Phe Arg Glu Tyr Glu Ser Pro Asn

180 185 190

AAA ACT GGG CCG GGC CCG AAT ACG GGG ATG GGG GCC TTT ATT CGT GAC 622

Lys Thr Gly Pro Gly Pro Asn Thr Gly Met Gly Ala Phe Ile Arg Asp

195 200 205

ATG AAG GAC AAT TTC AAG AGT GTG GAC TAC GTG TAC GTG TGG CAT GCG 670

Met Lys Asp Asn Phe Lys Ser Val Asp Tyr Val Tyr Val Trp His Ala

210 215 220

TTG TGT GGT TAT TGG GGC GGG CTC AGG CCC AAT GTT CCG GGC CTG CCC 718

Leu Cys Gly Tyr Trp Gly Gly Leu Arg Pro Asn Val Pro Gly Leu Pro

225 230 235

GAG GCT AAG CTC ATT GAG CCC AAA CTG ACT CCT GGG CTT AAG ACC ACC 766

Glu Ala Lys Leu Ile Glu Pro Lys Leu Thr Pro Gly Leu Lys Thr Thr

240 245 250 255

ATG GAA GAT TTG GCT GTT GAT AAG ATT GTC AAC AAT GGC GTG GGT CTG 814

Met Glu Asp Leu Ala Val Asp Lys Ile Val Asn Asn Gly Val Gly Leu

260 265 270

GTC CCA CCG GAG TTT GTT GAA CAA ATG TAT GAA GGA TTA CAT TCA CAT 862

Val Pro Pro Glu Phe Val Glu Gln Met Tyr Glu Gly Leu His Ser His

275 280 285

CTC GAA TCT GTG GGG ATT GAT GGA GTC AAA GTT GAC GTC ATC CAT TTG 910

Leu Glu Ser Val Gly Ile Asp Gly Val Lys Val Asp Val Ile His Leu

290 295 300

TTG GAA ATG TTG TGT GAA GAC TAT GGT GGG AGA GTG GAC TTA GCC AAG 958

Leu Glu Met Leu Cys Glu Asp Tyr Gly Gly Arg Val Asp Leu Ala Lys

305 310 315

GCT TAT TAC AAG GCC TTA TCA AGC TCA GTT AAC AAC CAC TTC AAC GGC 1006

Ala Tyr Tyr Lys Ala Leu Ser Ser Ser Val Asn Asn His Phe Asn Gly

320 325 330 335

AAC GGC GTC ATC GCT GGC CTG GAG CAC TGC AAT GAC TTC ATG TTT CTC 1054

Asn Gly Val Ile Ala Gly Leu Glu His Cys Asn Asp Phe Met Phe Leu

340 345 350

GGA ACC GAG GCC ATT ACC TTG GGT CGT GTC GGG GAT GAT TTT TGG TGC 1102

Gly Thr Glu Ala Ile Thr Leu Gly Arg Val Gly Asp Asp Phe Trp Cys

355 360 365

ACT GAT CCA TCT GGA GAT CCC AAT GGC ACG TTC TGG TTG CAA GGG TGT 1150

Thr Asp Pro Ser Gly Asp Pro Asn Gly Thr Phe Trp Leu Gln Gly Cys

370 375 380

CAC ATG GTG CAC TGC GCC TAC AAC AGC ATA TGG ATG GGT AAT TTC ATC 1198

His Met Val His Cys Ala Tyr Asn Ser Ile Trp Met Gly Asn Phe Ile

385 390 395

CAC CCT GAT TGG GAC ATG TTT CAA TCG ACT CAC CCT TGC GCT GAA TTC 1246

His Pro Asp Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe

400 405 410 415

CAC GCT GCC TCA CGA GCC ATC TCC GGC GGG CCC ATT TAC GTC AGT GAC 1294

His Ala Ala Ser Arg Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp

420 425 430

TCG GTC GGA AAG CAC AAC TTC GAG CTC CTT AGG AGC CTC GTT CTT CCC 1342

Ser Val Gly Lys His Asn Phe Glu Leu Leu Arg Ser Leu Val Leu Pro

435 440 445

GAT GGC TCC ATC CTC CGT TGT GAT TAC TAC GCG CTT CCG ACT CGC GAT 1390

Asp Gly Ser Ile Leu Arg Cys Asp Tyr Tyr Ala Leu Pro Thr Arg Asp

450 455 460

TGC CTC TTT GAA GAT CCA CTT CAC AAT GGC AAG ACT ATG CTC AAA ATT 1438

Cys Leu Phe Glu Asp Pro Leu His Asn Gly Lys Thr Met Leu Lys Ile

465 470 475

TGG AAT TAT AAC AAG TTC ACC GGA GTT GTC GGA ACT TTC AAC TGC CAA 1486

Trp Asn Tyr Asn Lys Phe Thr Gly Val Val Gly Thr Phe Asn Cys Gln

480 485 490 495

GGT GGC GGG TGG AGC CGG GAA GTG CGT CGC AAC CAA TGC GCT GCC GAG 1534

Gly Gly Gly Trp Ser Arg Glu Val Arg Arg Asn Gln Cys Ala Ala Glu

500 505 510

TAT TCC CAC GCC GTC TCC TCT AGC GCT GGT CCG AGT GAC ATT GAG TGG 1582

Tyr Ser His Ala Val Ser Ser Ser Ala Gly Pro Ser Asp Ile Glu Trp

515 520 525

AAG CAA GGA ACG AGT CCG ATC GAC GTC GAC GGC GTC AAA ACA TTC GCG 1630

Lys Gln Gly Thr Ser Pro Ile Asp Val Asp Gly Val Lys Thr Phe Ala

530 535 540

TTG TAC CTA TTC CAC GAG AAG AAA CTC GTC CTT TCT AAG CCA TCA GAC 1678

Leu Tyr Leu Phe His Glu Lys Lys Leu Val Leu Ser Lys Pro Ser Asp

545 550 555

AAA ATC GAC ATC ACG CTT GAG CCC TTC GAT TTT GAG CTG ATA ACC GTT 1726

Lys Ile Asp Ile Thr Leu Glu Pro Phe Asp Phe Glu Leu Ile Thr Val

560 565 570 575

TCT CCA GTC AAA ACT CTA GCC AAT TGC ACC GTC CAA 1762

Ser Pro Val Lys Thr Leu Ala Asn Cys Thr Val Gln

580 585

(2)SEQ ID NO：7的信息

(i)序列特征：

(A)长度：271个氨基酸

(B)类型：氨基酸

(D)拓扑：线型

(ii)分子类型：肽

(vi)原始来源：

(A)生物：玉米(Zea mays L.)

(B)品种：Pioneer 3358

(F)组织类型：叶

(xi)SEQ ID NO：7的序列描述：

Gln Ser Thr His Pro Cys Ala Ala Phe His Ala Ala Ser Arg Ala Ile

5 10 15

Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser Val Gly Gln His Asp Phe

20 25 30

Ala Leu Leu Arg Arg Leu Ala Leu Pro Asp Gly Thr Val Leu Arg Cys

35 40 45

Glu Gly His Ala Leu Pro Thr Arg Asp Cys Leu Phe Ala Asp Pro Leu

50 55 60

His Asp Gly Arg Thr Val Leu Lys Ile Trp Asn Val Asn Arg Phe Ala

65 70 75 80

Gly Val Val Gly Ala Phe Asn Cys Gln Gly Gly Gly Trp Ser Pro Glu

85 90 95

Ala Arg Arg Asn Lys Cys Phe Ser Glu Phe Ser Val Pro Leu Ala Ala

100 105 110

Arg Ala Ser Pro Ser Asp Val Glu Trp Lys Ser Gly Lys Ala Gly Pro

115 120 125

Gly Val Ser Val Lys Asp Val Ser Gln Phe Ala Val Tyr Ala Val Glu

130 135 140

Ala Arg Thr Leu Gln Leu Leu Arg Pro Asp Glu Gly Val Asp Leu Thr

145 150 155 160

Leu Gln Pro Phe Thr Tyr Glu Leu Phe Val Val Ala Pro Val Arg Val

165 170 175

Ile Ser His Glu Arg Ala Ile Lys Phe Ala Pro Ile Gly Leu Ala Asn

180 185 190

Met Leu Asn Thr Ala Gly Ala Val Gln Ala Phe Glu Ala Lys Lys Asp

195 200 205

Ala Ser Gly Val Thr Ala Glu Val Phe Val Lys Gly Ala Gly Glu Leu

210 215 220

Val Ala Tyr Ser Ser Ala Thr Pro Arg Leu Cys Lys Val Asn Gly Asp

225 230 235 240

Glu Ala Glu Phe Thr Tyr Lys Asp Gly Val Val Thr Val Asp Val Pro

245 250 255

Trp Ser Gly Ser Ser Ser Lys Leu Cys Cys Val Gln Tyr Val Tyr Stop

260 265 270

(2)SEQ ID NO：8的信息

(i)序列特征：

(A)长度：996个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑：线型

(ii)分子类型：从cDNA到mRNA

(ix)特征：

(A)名称/关键词：肽

(B)位置：2到817

(C)鉴定方法：实验

(xi)SEQ ID NO：8的序列描述：

C CAG TCC ACG CAC CCC TGC GCC GCC TTC CAC GCC GCG TCC CGC GCC 46

Gln Ser Thr His Pro Cys Ala Ala Phe His Ala Ala Ser Arg Ala

5 10 15

ATC TCC GGC GGG CCC ATC TAC GTC AGC GAC TCG GTG GGG CAG CAC GAC 94

Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser Val Gly Gln His Asp

20 25 30

TTC GCG CTG CTC CGC CGC CTG GCG CTC CCC GAC GGC ACC GTC CTC CGG 142

Phe Ala Leu Leu Arg Arg Leu Ala Leu Pro Asp Gly Thr Val Leu A

35 40 45

TGC GAG GGC CAC GCG CTG CCC ACG CGC GAC TGC CTC TTC GCC GAC CCG 190

Cys Glu Gly His Ala Leu Pro Thr Arg Asp Cys Leu Phe Ala Asp Pro

50 55 60

CTC CAC GAC GGC CGG ACC GTG CTC AAG ATC TGG AAC GTG AAC CGC TTC 238

Leu His Asp Gly Arg Thr Val Leu Lys Ile Trp Asn Val Asn Arg Phe

65 70 75

GCC GGC GTC GTC GGC GCC TTC AAC TGC CAG GGC GGC GGG TGG AGC CCC 286

Ala Gly Val Val Gly Ala Phe Asn Cys Gln Gly Gly Gly Trp Ser Pro

80 85 90 95

GAG GCG CGG CGG AAC AAG TGC TTC TCG GAG TTC TCC GTG CCC CTG GCC 334

Glu Ala Arg Arg Asn Lys Cys Phe Ser Glu Phe Ser Val Pro Leu Ala

100 105 110

GCG CGC GCC TCG CCG TCC GAC GTC GAG TGG AAG AGC GGC AAG GCG GGG 382

Ala Arg Ala Ser Pro Ser Asp Val Glu Trp Lys Ser Gly Lys Ala Gly

115 120 125

CCA GGC GTC AGC GTC AAG GAC GTC TCC CAG TTC GCC GTG TAC GCG GTC 430

Pro Gly Val Ser Val Lys Asp Val Ser Gln Phe Ala Val Tyr Ala Val

130 135 140

GAG GCC AGG ACG CTG CAG CTG CTG CGC CCC GAC GAG GGC GTC GAC CTC 478

Glu Ala Arg Thr Leu Gln Leu Leu Arg Pro Asp Glu Gly Val Asp Leu

145 150 155

ACG CTG CAG CCC TTC ACC TAC GAG CTC TTC GTC GTT GCC CCC GTG CGC 526

Thr Leu Gln Pro Phe Thr Tyr Glu Leu Phe Val Val Ala Pro Val Arg

160 165 170 175

GTC ATC TCG CAT GAG CGG GCC ATC AAG TTC GCG CCC ATC GGA CTC GCC 574

Val Ile Ser His Glu Arg Ala Ile Lys Phe Ala Pro Ile Gly Leu Ala

180 185 190

AAC ATG CTC AAC ACC GCC GGC GCC GTG CAG GCG TTC GAG GCC AAG AAA 622

Asn Met Leu Asn Thr Ala Gly Ala Val Gln Ala Phe Glu Ala Lys Lys

195 200 205

GAT GCT AGC GGC GTC ACG GCA GAG GTG TTC GTG AAG GGC GCA GGG GAG 670

Asp Ala Ser Gly Val Thr Ala Glu Val Phe Val Lys Gly Ala Gly Glu

210 215 220

CTG GTG GCG TAC TCG TCG GCG ACG CCC AGG CTC TGC AAG GTG AAC GGC 718

Leu Val Ala Tyr Ser Ser Ala Thr Pro Arg Leu Cys Lys Val Asn Gly

225 230 235

GAC GAG GCC GAG TTC ACG TAC AAG GAC GGC GTG GTC ACC GTC GAC GTG 766

Asp Glu Ala Glu Phe Thr Tyr Lys Asp Gly Val Val Thr Val Asp Val

240 245 250 255

CCG TGG TCG GGG TCG TCG TCG AAG CTG TGT TGC GTC CAG TAC GTC TAC 814

Pro Trp Ser Gly Ser Ser Ser Lys Leu Cys Cys Val Gln Tyr Val Tyr

260 265 270

TGA GCCGGACGGG CCGATGACTC TGCGTCTCTG CTCCCTGCTG GCCTGCTCAG GAC 873

Stop

ATAATCTAAT GTTTAGAGCT TACCAGGTTT TACAGCTCTA TCAGTTTACT TTTGTTTTTC 933

TGCTCTTCGT TTTTTAAGAA TTATTTCTAT TGTGTGAATT AATGAGTGCT TTCCTTCTAA 993

AAA 996

Claims

1、一种棉子糖合酶基因，该基因具有编码SEQ ID NO：1氨基酸序列的核苷酸序列。

2、具有SEQ ID NO：2的核苷酸序列的一种棉子糖合酶基因。

3、一种具有SEQ ID NO：1的氨基酸序列的棉子糖合酶蛋白。

4、包括权利要求1或2的棉子糖合酶基因，和连接到其上的启动子的嵌合体基因。

5、一种制造转化子的方法，该方法包括将权利要求4的嵌合体基因导入宿主有机体中。

6、一种质粒，该质粒包括权利要求1、2或4的棉子糖合酶基因。

7、一种制造宿主有机体的方法，该方法包括将权利要求6的质粒引入宿主细胞。

8、一种微生物，该微生物是以权利要求6的质粒转化的微生物。

9、一种植物细胞，该植物细胞是以权利要求6的质粒转化的植物细胞。

10、用于代谢修饰的方法，包括将权利要求1、2或4的棉子糖合酶基因导入宿主有机体或其细胞，从而使宿主有机体中棉子糖族寡糖的含量发生变化。

11、用于制备棉子糖合酶蛋白的方法，包括从通过培养权利要求8的微生物而获得的培养物中分离和纯化棉子糖合酶蛋白。

12、能够结合权利要求3的棉子糖合酶蛋白的抗棉子糖合酶抗体。