CN1195855C - 棉子糖合酶基因及其用途 - Google Patents

棉子糖合酶基因及其用途 Download PDF

Info

Publication number
CN1195855C
CN1195855C CNB971072795A CN97107279A CN1195855C CN 1195855 C CN1195855 C CN 1195855C CN B971072795 A CNB971072795 A CN B971072795A CN 97107279 A CN97107279 A CN 97107279A CN 1195855 C CN1195855 C CN 1195855C
Authority
CN
China
Prior art keywords
leu
gly
val
ser
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB971072795A
Other languages
English (en)
Other versions
CN1190129A (zh
Inventor
渡辺英二郎
大江田宪治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Chemical Co Ltd
Original Assignee
Sumitomo Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Chemical Co Ltd filed Critical Sumitomo Chemical Co Ltd
Publication of CN1190129A publication Critical patent/CN1190129A/zh
Application granted granted Critical
Publication of CN1195855C publication Critical patent/CN1195855C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

从不同的植物中分离编码能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白的棉子糖合酶基因。这些棉子糖合酶基因对改变植物中棉子糖族寡糖的含量是有用的。

Description

棉子糖合酶基因及其用途
发明领域
本发明涉及棉子糖(raffinose)合酶基因及其用途。
发明背景
棉子糖族寡糖是蔗糖的衍生物,其由O-α-D-吡喃型半乳糖(galactopyranosyl)-(1→6)n-o-α-D-吡喃型葡萄糖(glucopyraosyl(1→2)-β-D-flucto-呋喃糖苷(furanoside)作为通式所代表,并且当n=1时将它们命名为“棉子糖”,当n=2时命名为“木苏糖(stachyose)”,当n=3时命名为“毛蕊花糖(verbascose)”,且当n=4时命名为“筋骨草糖”(ajugose)。
除了蔗糖以外,这种棉子糖族寡糖的最大含量发现于植物中,并且已知它们不仅含于高等植物包括裸子植物和松科的(pinaceous)植物(如,云杉)和被子植物如豆科(leguminous)植物(如,大豆、菜豆),芸苔科(brassiceeous)植物(如,饲料芸苔(rape))、藜科(chenopodiaceous)植物(如,甜菜)、锦葵科植物(如,棉花)以及杨柳科植物(如,杨树),而且含于绿藻、小球藻属(chlorella)。因此,它们与蔗糖一样广泛存在于植物界中。
棉子糖族寡糖在许多植物的贮存器官或种子中作为储备糖或在有些植物组织间的糖运输现象中作为易位糖而发挥作用。
此外,已知如果以适当的量存在于食物中,棉子糖族寡糖具有产生良好状态肠杆菌植物的作用。因此,棉子糖族寡糖已用作用于添加至有些种类食物中的有功能食物材料并用于特定健康食物的领域。
通过在许多植物中以蔗糖起始的棉子糖族寡糖合成系统制备具有这种作用和用途的棉子糖族寡糖。该生物合成系统通常包括这样的反应,即经过α(1→b)键将来自galactotinol的半乳糖基团连续添加至附着于蔗糖分子中D-葡萄糖残基位置6的碳原子的羟基上。
在该生物合成系统的第一步中,棉子糖合酶是关于通过以下方法棉子糖制备反应的酶,即将来自galactotinol的D-半乳糖基团经过α(1→b)键与附着于蒸糖分子中D-葡萄糖残基位置6碳原子的羟基结合。已表明该酶构成了上面合成系统中的限速步骤,并且已显示该酶在控制棉子糖族寡糖生物合成中是相当重要的。
控制棉子糖合酶在植物中的表达水平或活性使改变棉子糖族寡糖在这些植物中的含量是可能的。然而,虽然该酶本身的存在已通过用生化技术测其活性而证实,但棉子糖合酶仍然没有成功地作为均一蛋白而分离和纯化。此外,该酶的氨基酸序列仍然是未知的,并且没有试图开始分离编码该酶基因的报导。
在这些情况下,本发明者进行了深入的研究最终成功地从蚕豆中分离出棉子糖合酶和编该酶的基因。由此完成了本发明。
因此,本发明提供下面(的内容):
1)从植物中分离的并具有编码能通过以下方法制备棉子糖的蛋白氨基酸序列的核苷酸序列的棉子糖合酶基因,即将D-半乳糖基团经α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子的羟基上。
2)根据第1条的棉子糖合酶基因,其中的植物为双子叶植物。
3)根据第2条的棉子糖合酶基因,其中的双子叶植物为豆科植物。
4)根据第3条的棉子糖合酶基因,其中的豆科植物为蚕豆。
5)具有编码下述蛋白(a)或(b)核苷酸序列的棉子糖合酶基因:
(a)具有SEQ ID No:1氨基酸序列的蛋白;
(b)具有在SEQ ID No:1的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列,并能够通过将D-半乳糖基团经过α(1→6)键与附着于蒸糖分子中D-葡萄糖残基位置6碳原子的羟基结合而制备棉子糖的蛋白。
6)具有SEQ ID No:2核苷酸序列的棉子糖合酶基因。
7)根据第3条的棉子糖合酶基因,其中的豆科植物为大豆。
8)具有编码下述蛋白(a)或(b)核苷酸序列的棉子糖合酶基因:
(a)具有SEQ ID No:3氨基酸序列的蛋白;
(B)具有在SEQ ID No:3的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列,并能够通过将D-半乳糖基团经过α(1→6)键与附着于蒸糖分子中D-葡萄糖残基的位置6碳原子的羟基结合而制备棉子糖的蛋白。
9)具有SEQ ID No:4:核苷酸序列的棉子糖合酶基因。
10)根据第2条的棉子糖合酶基因,其中的双子叶植物为唇形科植物。
11)根据第10条的棉子糖合酶基因,其中的唇形科植物为日本菜蓟(Japanese artichoke)。
12)具有编码SEQ ID No:5氨基酸序列的核苷酸序列的棉子糖合酶基因。
13)具有SEQ ID No:6核苷酸序列的棉子糖合酶基因。
14)根据第1条的棉子糖合酶基因,其中的植物为单子叶植物。
15)根据第14条的棉子糖合酶基因,其中的单子叶植物为禾本科植物。
16)根据第15条的棉子糖合酶基因,其中的禾本科植物为玉米(corn)。
17)具有编码SEQ ID No:7氨基酸序列的核苷酸序列的棉子糖合酶基因。
18)具有SEQ ID No:8核苷酸序列的棉子糖合酶基因。
19)具有下述的氨基酸序列(a)或(b)的棉子糖合酶蛋白。
(a)SEQ ID No:1或SEQ ID No:3的氨基酸序列。
(b)SEQ ID No:1:或SEQ ID No:3的氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而衍生的氨基酸序列;
该蛋白能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。
20)具有SEQ ID No:1:或SEQ ID No:3氨基酸序列的棉子糖合酶蛋白。
21)具有第1、2、3、4、7、10、11、14、15或16条棉子糖合酶基因部分核苷酸序列的基因片段。
22)具有第5、6、8、9、12、13、17或18条棉子糖合酶基因部分核苷酸序列的基因片段。
23)根据第21条或第22条的基因片段,其中的核苷酸数目在从15到50的范围内。
24)用于检测棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将标记的第21、22或23条基因片段的探针与有机体得到的基因组DNA或cDNA片段杂交;并且检测特异地与探针结合的DNA片段。
25)用于检测棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将标记的第21、22或23条基因片段的探针与植物得到的基因组DNA或cDNA片段杂交;并且检测特异地与探针结合的DNA片段。
26)用于扩增棉子糖合酶基因或具有其部分核苷酸序列的基因片段的方法,包括将具有第21、22或23条基因片段核苷酸序列的引物与有机体得到的基因组DNA或cDNA退火;并且通过聚合酶链式反应扩增得到的DNA片段。
27)用于扩增棉子糖合酶基因或具有其部分核苷酸序列基因片段的方法,包括将具有第21、22或23条基因片段核苷酸序列的引物与植物得到的基因组DNA或cDNA退火;并且通过聚合酶链式反应扩增得到的DNA片段。
28)用于获得棉子糖合酶基因的方法,包括以下步骤:即通过第24、25、26或27条的方法鉴定含有棉子糖合酶基因或具有其部分核苷酸序列基因片段的DNA片段;和分离及纯化鉴定的DNA片段。
29)通过第24、25、26或27条方法鉴定含有棉子糖合酶基因或具有其部分核苷酸序列基因片段的DNA片段而获得棉子糖合酶基因;和分离及纯化鉴定的DNA片段。
30)包括第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或29条棉子糖合酶基因,和连接到其上的启动子的嵌合体基因。
31)通过将第30条的嵌合体基因导入宿主有机体而获得的转化子。
32)包括第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29或30棉子糖合酶基因的质粒。
33)以第32条质粒转化的宿主有机体,或其细胞。
34)以第32条质粒转化的微生物。
35)以第32条质粒转化的植物或其细胞。
36)用于代谢修饰的方法,包括将第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29或30条的棉子糖合酶基因导入宿主有机体或其细胞,从而使宿主有机体中棉子糖族寡糖的含量发生变化。
37)用于制备棉子糖合酶蛋白的方法,包括从通过培养第34条的微生物而获得的培养物中分离和纯化棉子糖合酶蛋白。
38)能够结合第19或20条棉子糖合酶蛋白的抗棉子糖合酶抗体。
39)用于检测棉子糖合酶蛋白的方法,包括以第38条的抗棉子糖合酶抗体检测蛋白;和通过该抗体与棉子糖合酶蛋白之间的抗原-抗体反应检测棉子糖合酶蛋白。
附图简述
图1显示用于棉子糖合酶基因在大肠杆菌中表达的质粒的构建。pBluescript KS-RS为含有克隆于其中的棉子糖合酶基因的质粒。RS代表棉子糖合酶基因,并且显示于该图上部的核苷酸序列为棉子糖合酶基因两个末端部分的核苷酸序列。由小写字母代表的部分序列为来自载体pBluescript II KS-的核苷酸序列。两个加框的核苷酸序列分别为棉子糖合酶基因的起始密码子(ATG)和终止密码子(TGATAA)。几个限制性核酸内切酶的识别位点显示于核苷酸序列的上方。pGEX-RS和pTrc-RS为用于棉子糖合酶基因在大肠杆菌中表达的质粒。Ptac、Ptrc、GST、lacIq和rrnB分别代表tac启动子。trc启动子,谷胱甘肽-S-转移酶基因,乳糖阻遇蛋白基因和核糖体RNA转录终止信号。
图2显示用于在植物中表达每个具有棉子糖合酶基因和连接到其上的启动子的嵌合基因的表达载体的构建。克隆于质粒pBluescript KS-RS中棉子糖合酶基因的限制性核酸内切酶图谱显示于该图的下方。pBI221RS和pBI221(-)RS表示用于大豆转化表达载体的限制性核酸内切酶图谱。35S和NOS分别代表来自花椰菜花叶病毒的35S启动子和胭脂氨酸合酶基因终止子。
图3显示用于在植物中表达每个具有棉子糖合酶基因和连接到其上的启动子的嵌合基因的表达载体的构建。克隆于质粒pBluescript KS-RS中的棉子糖合酶基因限制性核酸内切酶图谱显示于该图的上方。pBI121RS和pBI121(-)RS表示用于芥子转化二等分载体(binary vectors)的限制性核酸内切酶图谱。对于二等分载体,仅显示右边缘与左边缘之间的部分。35S NOS和NPT分别代表来自花椰菜花叶病毒的35S启动子。胭脂氨酸合酸基因终止子和卡那霉素抗生基因。
发明详述
下述的基因工程可根据一般方法完成,例如,在“分子克隆:实验指南第2版”(1989),冷泉港实验室出版社,ISBN 0-87969-309-6;“当前分子生物学方法”(1987),John Wiley & Sons,Inc.ISBN 0-471-50338-X;和“当前蛋白科学方法”(1995),John Wiley & Sons,Inc.ISBN 0-471-11184-8中所述。
用于这里的“棉子糖合酶基因”指具有编码以下蛋白氨基酸序列的核苷酸序列的基因(以下简称为本基因),这种蛋白能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖并且可以植物中制备这种基因。
更为具体地,可以双子叶植物如豆科植物(如,蚕豆,大豆)和唇形科<如,日本菜蓟>或从单子叶植物和禾本科植物(如,玉米)中制备本基因。本基因的具体实例有“具有编码具有SEQ ID No:1氨基酸序列蛋白的核苷酸序列的棉子糖合酶基因”,“具有编码具有通过在SEQ ID No:1的氨基酸序列中缺失、替代、修饰或添加1个或几个氨基酸而获得的氨基酸序列,并且能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖子分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白核苷酸序列的棉子糖合酶基因”;“具有编码具有SED ID No:3氨基酸序列蛋白核苷酸序列的棉子糖合酶基因;”“具有编码具有通过在SEQ ID No:3氨基酸序列中通过缺失、替代、修饰或添加一个或几个氨基酸而获得的氨基酸序列;并且能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖的蛋白核苷酸序列的棉子糖合酶基因”;“具有编码SEQ ID No:5氨基酸序列的核苷酸序列的棉子糖合酶基因”;以及“具有编码SEQ ID No:7氨基酸序列物核苷酸序列的棉子糖合酶基因。”
例如,本发明可通过下面的方法获得。
在液氮中冷冻豆科植物如蚕豆(Vicia faba)或大豆(Grlycine max)的组织并用臼或其它方法物理研磨成细粉状组织碎片。通过一般方法从组织碎片中提取RNA。在提取中可利用商业上可得到的RNA提取试剂盒。通过乙醇沉淀从RNA提取物中分离总RNA。通过一般方法从分离的总RNA中分离具poly-A尾部的RNA。在分离中可利用商业上可得到的oligo-dT柱。通过一般方法从获得的分离物(即,具poly-A尾部的RNA)中合成cDNA。在合成中可利用商业上可得到的cDNA合成试剂盒。
例如,作为本基因“具有编码具有SEQ ID No:1:氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的cDNA片段可用上面获得的蚕豆cDNA作为模板和显示于下表1中的引物1到3通过PCR扩增获得。根据SEQ ID No:2的核苷酸序列依据目的可设计和合成用于此的引物。例如,为了扩增“具有编码具有SEQ ID No:1氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的开放阅读框区域”;可设计和合成显示于下表2的引物1到4。
用相同的方式,可用从大豆获得的cDNA作为模板和,例如,显示于下表1中的引物4到6通过PCR扩增获得“具有编码具有SEQ ID No:3氨基酸序列蛋白核苷酸序列棉子糖合酶基因”的cDNA片段。可根据SEQ ID No:4的核苷酸序列,依据目的设计和合成用于基中的引物。例如,为了扩增“具有编码具有SEQ ID No:3氨基酸序列蛋白核苷酸序列的棉子糖合酶基因”的开放阅读框区域,可设计和合成显示于表2中的引物5到8。
可根据一般方法,例如在“分子克隆;实验指南第2版”(1989),冷泉港实验室出版社;和“当前分子生物学方法”(1987),John wiley & SonsInc.ISBN 0-471-50338-X中所述,亚克隆扩增的DNA片段。更为具体地,克隆可,例如,用TA克隆试剂盒(Invitrogen)和质粒载体如pBluescnpt II(stratagene)完成。克隆DNA片段的核苷酸序列可通过双脱氧终止方法测定,例如,由F.Sanger,S,Nicklen,A.R.Coulson,在美国科学院院报(1977),74,pp.5463-5467中所述。例如,可优选使用从珀金-埃尔默商业上可得到的ABI PRISM Dye终止子循环测序现成反应试剂盒。
(序列表1)
引物1:AATTTTCAAG CATAGCCAAG TTAACCACCT 30  聚体
引物2:GCTCACAAGA TAATGATGTT AGTC 24        聚体
引物3:ATACAAGTGA GGAACTTGAC CA 22          聚体
引物4:CCAAACCATA GCAAACCTAA GCAC 24        聚体
引物5:ACAACAGAAA AATATGACTC TTATTACT 28    聚体
引物6:AAAAGAGAGT CAAACATCAT AGTATC 26      聚体
(序列表2)
引物1:ATGGCACCAC CAAGCATAAC CAAAACTGC 29                 聚体
引物2:ATGGCACCAC CAAGCATAAC CAAAACTGCA ACCCTCCAAG ACG 43 聚体
引物3:TCAAAATAAA AACTGGACCA AAGAC 25                     聚体
引物4:TCAAAATAAA AACTGGACCA AAGACAATGT 30                聚体
引物5:ATGGCTCCAA GCATAAGCAA AACTG 25                     聚体
引物6:ATGGCTCCAA GCATAAGCAA AACTGTGGAA CT 32             聚体
引物7:TCAAAATAAA AACTCAACCA TTGAC 25                     聚体
引物8:TCAAAATAAA AACTCAACCA TTGACAATTT TGAAGCACT 39      聚体
用于这里的术语“基因片段”指具有本基因部分核苷酸序列的基因片段(以下简称为本基因片段)。例如,其可以是来自植物并具有下面基因部分核苷酸序列的基因片段,该基因具有编码能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖位置6碳原子上的羟基结合而制备棉子糖蛋白的苷酸序列。本基因片段的具体实例是具有基因的部分核苷酸序列的一种基因片段,该基因具有编码SEQ ID No:1氨基酸序列的核苷酸序列和具有基因的部分核苷酸序列的一种基因片段,该基因具有SEQ ID No:2核苷酸序列,更为具体地具有核苷酸序列或其部分苷酸序列,编码显示于下表3中任一氨基酸序列的一种基因片段。
这些基因段可用作杂交方法中的探针或PCR方法中的引物。对于PCR方法中的引物,从确保退火特异性的观点出发,一般其核苷酸数目较大是优选的;然而,从以下观点出发,即引物本身易具有更高极结构从而导致退火效率可能的弱化并在合成后的纯化中需要复杂的程序,其核苷酸数目不太大也是优选的。在通常情况下,由单链DNA所组成的基因片段,其中的核苷酸数目在15到50范围内是优选的。
(序列表3)
#1    Gly Ile Lys Phe Met Ser Ile Phe Arg Phe Lys Val Trp Trp Thr Thr
      His Trp Val Gly
#2    Ile Ile Asp Lys Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr
#3    Gly Gly Cys Pro Pro Gly Phe Val Ile Ile Asp Asp Gly Trp Gln
#4    Thr Ser Ala Gly Glu Gln Met Pro Cys Arg Leu Val Lys Tyr Glu Glu
      Asn
#5    Val Tyr Val Trp His Ala Leu Cys Gly Tyr Trp Gly Gly Val Arg Pro
#6    Thr Met Glu Asp Leu Ala Val Asp Lys Ile Val Glu Asn Gly Val Gly
      Leu Val Pro Pro
#7    Gly Leu His Ser His Leu Glu Ser Ala Gly Ile Asp Gly Val Lys Val
      Asp Val Ile His Leu Leu Glu
#8    Gly Gly Arg Val Glu Leu Ala Arg Ala Tyr Tyr Lys Ala Leu
#9    Val Lys Lys His Phe Lys Gly Asn Gly Val Ile Ala
#10   Glu His Cys Asn Asp Phe Phe Leu Leu Gly Thr Glu Ala Ile Ser Leu
      Gly Arg Val Gly Asp Asp Phe Trp Cys Ser Asp Pro Ser Gly Asp Pro
      Asn Gly Thr Tyr Trp Leu Gln Gly Cys His Met Val His Cys
#11   Ala Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln Pro Asp Trp Asp
      Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His Ala Ala Ser Arg
      Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp
#12   Leu Pro Asp Gly Ser Ile Leu Arg Cys
#13   Ala Leu Pro Thr Arg Asp Cys Leu Phe Glu Asp Pro Leu His Asn Gly
      Lys Thr Met Leu Lys Ile Trp Asn
#14   Gly Val Leu Gly Leu Phe Asn Cys Gln Gly Gly Gly Trp
#15   Phe Ala pro Ile Gly Leu Val Asn Met
标记本基因片段,且然后用作杂交方法中的探针并与有机体获得的DNA杂交,从而可检测具有特异结合到其上探针的DNA片段。因此,从有机体获得的基因文库中,可检测具有编码能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖酶的氨基酸序列的核苷酸序列的棉子糖合酶基因;或具有其部分核苷酸序列的基因片段(以下简称为本检测方法)。
作为从有机体获得的DNA,可以使用例如,所需植物的cDNA文库或基因组文库。基因文库也可以是商上可得到的基因文库或根据一般的文库制备方法制备的文库,例如,在“分子克隆:实验指南第2版”(1989),冷泉港实验室出版社;“当前分子生物学方法”(1987),John Wiely& Sons,Inc.ISBN 0-471-50338-X中所述的方法。
作为杂交方法,根据用于文库制备中载体的种类,可使用噬菌斑杂交或菌落杂交。更为具体地,当待用的文库以噬菌体载体构建时,在无菌条件下将合适的宿主微生物与噬菌体混合,进一步与软琼脂培养基混合,并将混合物铺板于琼脂培养基上。之后,于37℃培养培养物直到合适大小的噬菌斑出现。当待用的文库以质粒载体构建时,将该已修改质粒转化入合适的宿主微生物以形成转化子。将获得的转化子稀释至合适的浓度,并将稀释液铺板于琼脂培养基上,然后于37℃培养培养物直到合适大小的菌落出现。
在上面文库中任一种情况,培养以后将滤膜置于琼脂培养基的表面,从而使噬体或转化株转移至膜上。用碱将该膜变性,然后中和,并且例如,当使用民龙膜时,以紫外光照射该膜,从而将DNA固定于膜上。然后将该膜与作为探针的通过一般方法标记的本基因片段杂交。对于该方法,可参考,例如,D.M.Glover编,“DNA克隆,实践方法”IRL出版社(1985),ISBN 0-947946-18-7。用于杂交中很多种试剂和温度条件;例如,通过加入6×SSC(0.9M NaCl,0.9M柠檬酸),0.1-1%SDS,100μg/ml变性鲑精DNA,并于65℃孵育1小时完成预杂交。然后加入作为探针的标记的本基因片段,并混合。杂交于42℃-68℃4到16小时完成。以2×SSC,OH%SDS洗膜,进一步以0-2×SSC,0-0.1%SDS冲洗,且然后干燥。例如通过放射自显影或其它技术分析膜以检测膜上探针的位置并由此检测具有所用探针核苷酸序列同源的核苷酸序列DNA的位置。因此,可以检测本基因或本基因片段。在原始琼脂培养基上鉴定相应于膜上这样检测到的DNA位置的克隆,并且筛选阳性克隆,从而可分离具有该DNA的克隆。重复相同的检测步骤以纯化具有该DNA的克隆。
也可使用其它的检测方法,例如,以Grbco BRL商业上可得到的基因诱捕DNA阳性筛选系统试剂盒。在该方法中,将单链DNA文库与生物素化的本基因片段(即,探针)杂交,接着加入结合链亲和素(strep to avidin)的磁珠并混合。用磁铁从混合物中收集结合链亲和素的磁珠,从而收集和检测具有同源于所用探针核苷酸序列的核苷酸序列,通过本基因片段,生物素和链亲和素结合到这些磁珠上的单链DNA。因此,可检测本基因或本基因片段。通过用合适的寡核苷酸作为引物以合适的DNA聚合酶处理可将该收集到的单链DNA转变成双链形式。
本检测方法也可用于植物分析中。更为具体地,根据一般方法,例如在“克隆和测序(植物生物技术实验指南)”在Itaru Watanabe指导下编辑、Masihiro Sugiura编,Noson Bunka-sha,东京出版(1990)中所述制备植物基因组DNA。以几种合适的限制性核酸内切酶消化植物基因组DNA,接着电泳,并根据一般方法将电泳的DNA印迹至滤膜上。将该滤膜与通过一般方法从本基因片段中制备的探针杂交,并检测与探针杂交的DNA片段。比较不同种特定植物种类之间该DNA片段的长度,该长度差异便分析这些种类之间伴随从棉子糖族寡糖表达的表型特征差异成为可能。此外,当将通过上面方法检测到的DNA片段在基因重组子植物和相同种类的非-基因重组子植物之间进行长度比较时,通过检测杂交带数目前者植物较后者植物大或杂交带深度前者植物较后者植物深可在分前者植物与后者植物。该方法可根据RFLP(限制性片段长度多态性)方法完成,例如,在“植物PCR实验方法”在Ko shimamoto和Takuji sasaki指导下编辑,Shujun-sha,东京出版(1995),ISBN 4-87962-144-7,pp-90-94中所述。
用具有本基因片段核苷酸序列的引物的PCR方法使从有机体获得的DNA中扩增这样的棉子糖合酶基因是可能的,即具有编码能够通过将D-地乳糖基因是可能的,即具有编码能够通过将D-半乳糖基因经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备糖酶氨基酸序列的核苷酸序列的棉子糖合酶基因;或具有其部分核苷酸序列的基因片段(以下简称为本扩增方法)。
更为具体地,例如,通过一般合成方法化学合成具有本基因片段核苷酸序列中15到50个核苷酸的寡核苷酸。根据下面的密码子表,显示核苷酸序列编码的对应氨基酸,可合成混合引物从而依据可编码某一氨基酸密码子的变异,将引物中特定位置的残基变成几种碱基的混合物。
                              密码子表
Phe   UUU Ser   UCU Tyr   UAU Cys   UGU
  UUC   UCC   UAC   UGC
Leu   UUA   UCA Stop   UAA   Stop   UGA
  UUG   UCG   UAG   Trp   UGG
  CUU Pro   CCU His   CAU Arg   CGU
  CUC   CCC   CAC   CGC
  CUA   CCA Gln   CAA   CGA
  CUG   CCG   CAG   CGG
  Ile   AUU   Thr   ACU Asn   AAU Ser   AGU
  AUC   ACC   AAC   AGC
  AUA   ACA Lys   AAA Arg   AGA
  Met   AUG   ACG   AAG   AGG
  Val   GUU   Ala   GCU Asp   GAU   Gly   GGU
  GUC   GCC   GAC   GGC
  GUA   GCA   Glu   GAA   GGA
  GUG   GCG   GAG   GGG
此处,也可使用能与多种碱基形成配对的碱基,如次黄嘌呤核苷代替上面的几种碱基的混合物。更为具体地,例如,可使用具有显示于表4中核苷酸序列的引物。在该上下文中,与由双链DNA所组成的本基因的编码链具有相同核苷酸序列的寡核苷酸称为“有引物”,并且具有与编码链互补的核苷酸序列的寡核苷酸称为“反义引物”。
与存在于棉子糖合酶基因或待扩增的具有其部分核苷酸序列基因片段编码链中5’上游一侧具有相同核苷酸序列的有义引物和具有互补于该编码链3’-下游一侧核苷酸序列的核苷酸序列的反义引物联合用于PCR反应从而,例如,从基因文库基因组文库或cDNA作为模板扩增DNA片段。此时,可通过以电泳的一般方法证实DNA片段的扩增。对于扩增的DNA片段,构速其限制性核酸内切酶图谱或通过一般方法测定其核苷酸序列,从而可鉴定本基因或本基因片段。对于用于此的基因文库,例如,可使用所需植物的cDNA文库或基因组cDNA文库。对于植物基因文库,可这样使用来源于植物的商业上可得到的文库;或根据一般的文库制备方法制备的文库,例如,在“分子克隆:实验指南第2版”(1989),冷泉港实验室出版社,中所述或也可使用“当前分子生物学方法”(1987),John wiley & Sons,Inc,ISBN 0-471-50338-X。作为用于本扩增方法中的基因组DNA或cDNA,例如,可使用从所需植物中制备的cDNA或基因组cDNA。
更为具体地,例如,根据SEQ ID No:1氨基酸序列而设计的引物与作为模板的来自唇形科植物,日本菜蓟的cDNA用于本扩增方法中,从而可扩增具有SEQ ID No:6核苷酸序列的棉子糖合酶基因片段。此外,例如,根据SEQ IDNo:1氨基酸序列设计的引物与作为模板的来自禾本科植物,玉米的cDNA用于本扩增方法中,从而可扩增具有SED IQ No:8核苷酸序列的棉子糖合酶基因片段。
(序列表4)
1-F        32聚体
           TTIAAIGTITGGTGGACIACICAITGGGTIGG
2-F        41聚体
           ATIATIGAIAAITTIGGITGGTGIACITGGGAIGCITTITA
2-RV       41聚体
           TAIAAIGCITCCCAIGTICACCAICCIAAITTITCIATIAT
3-F        44聚体
           GGIGGITGICCICCIGGITTIGTIATIATIGAIGAIGGITGGCA
3-RV       44聚体
           TGCCAICCITCITCIATIATIACIAAICCIGGIGGICAICCICC
4-F        32聚体
           AAIAAICAITTIAAIGGIAAIGGIGTIATIGC
4-RV       32聚体
           GCIATIACICCITTICCITTIAAITGITTITT
5-F        38聚体
           TGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT
5-RV       38聚体
           AACATITCCCAITCIGGITGIATIAAITTICCCATCCA
6-RV       27聚体
           CATITTIACIA(AG)ICCIATIGGIGCIAA
本扩增方法也可用于分析植物基因。更为具体地,例如,从不同种指定植物种类中制备的植物基因组DNA用作为扩增方法的模板以扩增DNA片段。扩增的DNA片段与甲醛溶液混合,通过于85℃加热5分钟而变性,接着于冰快速冷却。例如,将该样品在含有0%或10%甘油的6%聚丙烯酰胺凝胶中进行电泳。在该电泳中,可使用商业上可得到的用于SSCP(单链构型多态性)的电泳仪,并进行电泳,同时将凝胶保持恒温,如,5℃,25℃或37℃。例如,通过用商业上可得到试剂的银染方法的方法从电泳的凝胶中检测DNA片段。
从在不同种间检测到DNA片段的电泳中的行为差异,检测棉子糖含基因的突变,并且分析由突变造成的伴随棉子糖族寡糖表达的表型特征的差异。该方法可根据SSCP方法完成,例如,在“植物PCR实验方法”,在Ko shimamoto和Takuji Sasaki指导下编辑,shujun-sha,东京(1995)出版,ISBN 4-87962-144-7,pp.141-146中所述。
上述的本检测方法或本扩增方法也可用于鉴定棉子糖合酶基因或具有其部分核苷酸序列的基因片段且然后分离和纯化鉴定的基因或其基因片段以获得本基因(以下简称为本基因获得方法)。
例如,通过检测由本基因片段所组成并与通过上述本检测方法从有机体获得基因文库中DNA杂交的探针从鉴定出与所用探针具有同源核苷酸序列的DNA;纯化带有该DNA的克隆;并从克隆中分离如纯化质粒或噬菌体DNA可获得本基因或本基因片段。当这样获得的DNA为具有部分棉子糖合酶基因的核苷酸序列的基因片段时,用该DNA作为探针通过本基因检测方法进一步筛选基因文库得到全长的本基因。
例如,通过用具有本基因片段核苷酸序列的引物进行聚合酶链式反应以从通过上述本扩增方法得到的有机体DNA中扩增DNA片段;且然后构建扩增DNA片段的限制性核酸内切酶图谱或测定其核苷酸序列可获得本基因或本基因片段。根据获得基因片段的核苷酸序列,合成用于5’-末端序列分析的反义引物,和合成用于3’-末端序列分析的有义引物。可通过用这些引物和商业上可得到的试剂盒,如,Clontech的Marakhon试剂盒的RACE访求测定全长本基因的核苷酸序列。全长的本基因可通过根据这样测定的核苷酸序列中两个末端序列合成新的引物并再次进行聚合酶链式反应而获得。
上述本基因获得方法使从各种有机体中获得棉子糖合醇基因作为本基因成为可能。例如,这样的基因,其编码棉子糖合酶,该酶具有与SEQ ID No:1氨基酸序列在相应于400个或更多个氨基酸长度的区域中约50%或更高的同源性的氨基酸序列;并且能够通过将D-半乳糖基团经过α(1→6)键与附着于蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。更为具体地,例如,具有SEQ ID No:4核苷酸序列的棉子糖合酶基因可通过以下方法获得,包括通过本扩增方法用从SEQ ID No:1氨基酸序列设计的引物和大豆cDNA作为模板扩增和鉴定含有具有部分棉子糖合酶基因核苷酸序列基因片段的DNA片段;分离和纯化鉴定出的DNA片段,接着通过上面步骤以获得含有该DNA片段的全长基因。
可以构成包括本基因和连接到其上启动子的嵌合体基因(以下简称为本嵌合体基因)。
只要其在待转化的宿主有机体中是有功能的,待用的启动子没有特别的限制。该启动子可包括,例如,合成的在大肠杆菌中有功能的启动子,如大肠杆菌乳糖纵子启动子,大肠杆菌色氨酸操纵子启动子和tac启动子;酶母乙醇脱氢酶基因(ADH)启动子;腺病毒主要晚期(Ad.ML)启动子,SV40早期启动子,及杆状病毒启动子。
当宿主有机体为植物或其细胞时,启动子可包括,例如,从T-DNA得到的组成型启动子如胭脂氨酸合酶基因(NOS)启动子和章鱼氨酸合酶基因(OCS)启动子;从植物病毒得到的启动子如从花椰菜花叶病毒(CaMV)得到的19S和35S启动子;得到的启动子如苯丙氨酸氨-裂合酶(PAL)基因启动子,查耳酮合酶(CHS)基因启动子和发病机理相关蛋白(PR)基因启动子。此外,也可使用载体pSUM-GY1(见JP-A-06-189777-1994),其具有在特定植物组织中得到特导表达的启动子,例如,从大豆得到的种子贮藏蛋白大豆球蛋白基因的启动子。
使用构建的嵌合体基因从而具有这种启动子使在特定的植物组织中增加或减少棉子糖族寡糖的含量成为可能。
然后根据一般的基因工程方法将本嵌合体基因导入宿主有机体中以得到转化子。如果必要,根据用于将基因导入宿主有机体的转化方法,可使用质粒形式的本嵌合体基因。此外,本嵌合体基因可以含有终止子。在这种情况,一般优选构速嵌合体基因从而使终止子位于棉子糖合酶基因的下游。只要其在待转化的宿主有机体中有功能,待用的终止子没有特别的限制。例如,当宿主有机体为植物或其细胞时,终止子可包括,例如,从T-DNA得到的组成型终止子如胭脂氨酸合酶基因(NOS)终止子;和从植物得到的终止子如洋葱病毒GV1或GV2的终止子。
如果必要,本基因可以质粒的形式使用。例如,当宿主有机体是微生物时,通过一般的方法,例如,在“分子克隆:实验指南第2版”(1989),冷泉港实验室出版社或“当前分子生物学方法”(1987),JohnWiley & Sons,Inc,ISBN 0-471-50338-X中所述,将构建的质粒导入微生物中。以抗生素抗性或营养缺陷标记筛选这样转化的微生物。当宿主有机体是植物时,通过一般方法如以农杆菌感染(见JP-B 2-58917/1990和JP-A 60-70080/1985。电穿孔进入原生质体(见JP-A 60-251887/1985和JP-B 5-68575/1993)或粒子枪方法(见JP-A 5-508316/1993和JP-A 63-258525/1998)将构建的质粒导入植入细胞。以抗生素如卡那毒素或潮霉毒筛选通过导入质粒而转化的植物细胞。从这样转化的植物细胞中,可通过一般的植物细胞培养方法再生出转化的植物,例如,通过在“植物基因操作指南(怎样制备转基因植物)”由Uchimiya,1990写,Kodan-sha科学出版社(ISBN 4-06-153513-7),pp.27-55中描述的方法。此外,收集转化植物的种子也使增殖转化的植物成为可能。此外,获得的转化植物与非转化植物之间的较使制备具有转化植物特征的子代植物成为可能。
可以通过将本基因导入宿主有机体或其细胞并修饰宿主有机体或其细胞中的代谢而改变棉子糖族寡糖的含量。作为这种方法,例如,可以使用以下方法,即通过构建包括本基因或连接到其上启动子的本嵌合体基因,其中的本基因以适于转录、翻译和表达为蛋白的原始方向与启动子连接且然后将本嵌合体基因导入宿主有机体或其细胞而增加宿主有机体中棉子糖族寡糖含量的用于代谢修饰的方法;或通过构建包括本基因和连接到其上启动子的本嵌合体基因,其中的本基固以不适于翻译和表达为蛋白的相反方向与启动子连接,且然后将本嵌合体基因导入宿主有机体或其细胞而减少宿主有机体或其细胞中棉子糖族寡糖的含量的用于代谢修饰的方法。
这里使用的术语“棉子糖合酶蛋白”指由本基因编码的蛋白(以下简称为本蛋白)。例如,其可包括这样的酶蛋白,它具有SEQ ID No:1或SEQ ID No:3氨基酸序列,或具有在SEQ ID No:1或SEQ ID No:3氨基酸序列中通过缺失、替代、修饰或添加1个或几个氨基酸而得到的氨基酸序列;并且能够通过将D-半乳糖基团经过α(1→6)键与附着与蔗糖分子中D-葡萄糖残基位置6碳原子上的羟基结合而制备棉子糖。
本蛋白具体的实例为SEQ IQ No:1氨基酸序列(799个氨基酸;分子量,89kDa)的酶蛋白和具有SEQ ID No:3氨基酸(781个氨基酸;分子量,87kDa)的酶蛋白。
尽管本蛋白可,例如,从豆科植物如蚕豆(Vicia faba)中通过一般的生化方法如(NH4)2SO4沉淀、离子交换柱、疏水柱、羟碳灰石柱或凝胶滤膜柱制备,但其也可从以本质粒转化的宿主有机体或其细胞中制备。更为具体地,例如,用发玛西亚GST基因融合载体试剂盒,将本基因插入附于试剂盒中的表达载体质粒。根据一般的基因工程方法将得到的载体质粒导入微生物如大肠杆菌中。将获得转化子的培养物培养于具有IPTG(异丙基硫代-β-D-半乳糖苷)的培养基中,从而使本蛋白可作为融合蛋白在培养物中表达和产生。可通过一般的方法如细菌细胞裂解、柱操作或SDS-PAGE电泳分离和纯化诱导表达的融合蛋白。以蛋白酶如凝血酶或血液凝固因子Xa消化融合蛋白得到本蛋白。该过程优选,例如,根据在“当前蛋白科学方法”(1995),JohnWiley & Sons,Inc,ISBN 0-471-11184-8中所述的方法完成。例如,通过在L.Lehle和W.Janner,欧洲生化杂志,38-103-110(1973)中所述的方法可测定本蛋白的活性。
用上面制备的本蛋白作为抗原通过一般的免疫学方法可制备能够结合棉子糖合酶蛋白的抗棉子糖合酶抗体(以下简称为本抗体)。更为具体地,可,例如,根据在Ed Harlow与David Lane,“抗体:实验指南”(1988),冷泉港实验室出版化,ISBN 0-87969-314-2中所述的方法制备本抗体。
可通过以本抗体处理测试蛋白并且检测具有特异性结合到其上本抗体的蛋白来检测本蛋白。这种检测方法可根据如Western印迹方法和酶联免疫吸附分析(ELISA)的免疫学技术加以完成,例如,在Ed Harlow和David Lane,“抗体:实验指南”(1988),冷泉港实验室出版社,中所述的方法。
例如,Western印迹方法按如下完成:例如,根据在酶学方法,182卷,“蛋白纯化指南”98 174-193,ISBN 9-12-182083-1中所述的方法从植物中提取蛋白。根据所用的植物组织可适当地改变提取缓冲液的组成。根据一般的SDS-PAGE方法将提取的蛋白电泳。通过以一般的电转方法的Western印迹将凝胶中电泳的蛋白的转移至膜上。更为具体地,例如,将凝胶浸于转移缓冲液(25mMTris,192mM甘氨酸,20%甲醇)中10分钟,且然后置于与凝胶切成相同大小的PVDF膜上。将凝胶与膜一起置于商业上可得到的半干型转膜仪中。以0.8到2mA/cm2的恒定电流45分钟到1小时完成印迹。可用一级抗体和以碱性磷酸酶或辣根过氧化物酶标记的二极抗体或蛋白A以用于Western印迹检测的试剂盒对转移至膜上的蛋白进行免疫学检测。此时,可通过用本抗体作为一级抗体检测膜上的本蛋白。
在ELISA方法中,例如,根据对最终结合到ELISA平板表面上的抗原进行免疫学检测的原则利用结合到由树脂制成的96-孔ELISA平板表面上蛋白的特性。测试蛋白作为溶液加入并结合到ELISA平板上,接着,例如,通过加入含有如5%小牛血清蛋白的蛋白的PBS封闭。之后,以PBS洗孔,向其中加入含有本抗体的溶液以进行反应。洗孔之后,进一步向孔中加入含有从碱性磷酸酶或辣根过氧化物酶标记的二极抗体的溶液,接着洗孔。最后,向孔中加入用于检测的底物溶液,并以ELISA读数器检测底物颜色的形成。
在另一种方法中,加入本抗体并结合到ELISA平板上,接着通过,例如,加入含有如5%小牛血清蛋白的蛋白的PBS封闭。然后将测试蛋白作为溶液加入,并且测试蛋白中含有的抗原与已结合到平板上的本抗体结合,接着洗孔,且进一步向孔中加入本抗体。此时所用的本抗体优选为从不同于用于制备第一次使用的本抗体动物的动物种类中制备的抗体。然后向孔中加入含有以碱性磷酸酶或辣根过氧化物酶标记的二极抗体的溶液,接着洗孔。此时所用的二次抗体必需具有结合后来加入的本抗体的特性。最后,加入用于检测的底物溶液,并以ELISA读数器检测颜色的形成。
实施例
本发明将通过下面的实施例进一步说明;然而,本发明无论怎么也不以任何方式限于这些实施例。
实施例1(肌醇半乳糖苷的纯化)
以甲醇将约250ml的甜菜黑叶舌(blakstrap)糖密稀释5倍。将稀释液以21,400×g于室温离心15分钟以去除不溶性物质。将获得的上清液转移至2-升的锥形瓶中,向其中加入一半体积的异丙醇并以搅拌混匀(portionwise)。将锥形瓶于室温放置一段时间直到得到的沉淀物附着到锥形瓶壁上。然后轻轻倾倒去除上清液。向沉淀物中加入500ml乙醇,并以旋转式振荡器通过搅拌洗混合物。进一步重复洗几次。从锥形瓶壁上刮下洗过的沉淀物,接着于滤纸上空气干燥。将空气干燥的沉淀物(干粉)溶于纯水至约40%(W/V)。向该溶液中加入伯乐的AG501-X8(D),接着搅拌。重复该操作直到溶液颜色变得几乎没有观察到。以微孔的Sep-Pak QMA柱处理得到的溶液,并进一步以微孔的Sep-Pak CM,Sep-Pak C18和Sep-Pak Silica柱预处理。将5ml体积得到的溶液上样于Wako-凝胶LP40C18柱(Wako纯化学工业,2.6cm×85cm)中,并以纯水洗脱。以便携式糖折光计测量洗脱液糖的含量,并且以微孔的Sugar-pak Na(7.8mm×300mm)柱通过高效相层析(HPLC)分析糖的组成。以410型水分化析光计进行糖的检测。将含有肌醇半乳糖苷的洗脱液冻干,并将得到的冻干粉溶于5ml纯水中。将该溶液装于TOYOPEARL HW40(S)柱(TOSO,2.6cm×90cm)中,并以纯水洗脱。以上述相同的方式分析洗脱液,从而获得纯化的肌醇半乳糖苷。
将获得的肌醇半乳糖苷于25℃置于达到含有80mM磷酸盐缓冲液(pH6.5),2mg/ml肌醇半乳糖苷,和8.3Uα-半乳糖苷酶(室灵曼,超产大肠杆菌662038)的反应混合物中40分钟。以氯仿抽提反应混和物,并通过HPLC分析水层。证实得到的肌醇半乳糖苷被水解成半乳糖和肌醇。
实施例2(棉子糖合酶活性的测量)
根据L.Lehle和W.Tanner,欧洲生化杂志,38,103-110(1973))描述在以下条件中测量棉子糖合酶活性。
首先,将待用于活性测量的2μl样品加入18ul的反应混和物中,该混和物达到含有100mM Tris-HCl(pH7.4),5mM DTT(二硫苏糖醇),0.01%BSA,200μM蔗糖5mM肌醇半乳糖,740KBq/ml(31.7μM)[14C]蔗糖,并且将反应混合物置于37℃3到20小时。反应后,向反应混和物中加入30μl乙醇,接着搅拌并以15,000rpm离心5分钟。将5ul体积的上清液点于用于薄层层析的HPTLC纤维素平板(Merck,10cm×20cm)上,并以n-丁醇∶吡啶∶水∶醋酸=60∶40∶30∶3展开。将展开的平板干燥且然后以用于测定制备的[14C]棉子糖的图像分析仪(富士照相胶卷,FUJIX生物图像分析仪BAS-2000II)加以定量分析。
实施例3(棉子糖合酶的纯化)
按如下从蚕豆中进行棉子糖合酶的纯化:对于每种纯化蛋白的溶液,存在于蛋白溶液中的蛋白通过SDS-PAGE(Daiichi Kagaku Yakuhin)加以分析,并根据实验例2中描述的方法测量其酶活性。
首先,将300g贮存于-80℃的蚕豆未成熟种子(Nintoku Issun)融化并然后去皮。将去皮的种子置于600ml溶液中,其中含有100mM Tris-HCl(pH7.4),5mM DTT(二硫苏糖醇),1mM EDTA,1mM PMSF(苯甲基碘酰氟)和1mM的苯甲酰胺,并在冰上以上臼研磨。将研磨的材料于4℃21,400×g离心50分钟。向得到的上清液中加入1/20体积的10%聚乙烯亚胺(pH8.0)。将混合物于4℃搅拌15分钟,并于4℃以15,700×g离心20分钟。向得到的上清液中搅拌加入196g/l的(NH4)2SO4。将混合物在冰上搅拌30分钟,并于4℃以15,700×g离心20分钟。向得到的上清液中进一步搅拌加入142g/l(NH4)2SO4。在冰上搅拌30分钟以后,将混合物于4℃以15,700×g离心20分钟。将得到的沉淀物溶于50ml 100mM Tris-Hcl(pH7.4)和5mM DTT(二硫苏糖醇)中,并将溶液在20mM Tris-Hcl(pH7.4),1mM DTT(二硫苏糖醇)和1mM ED7A中4℃透析过夜。透析后,将悬液于4℃以70,000×g离心60分钟。向得到的上清液中加入1mM苯甲酰胺Hcl,5mMε-氨基-n-己酸,1μg/ml抗蛋白酶,1μg/ml亮抑酶肽和10mM EGTA,并进一步加入1/40体积的2M Kcl。将混合物装入以0.05M Kcl,20mM Tris-Hcl(pH7.4),1mM DTT(二硫苏糖醇)和1mM EDTA平衡的DEAE-葡聚糖纤维素柱(发玛西亚,2.5cm×21.5cm)中,并以0.05至0.5M Kcl的梯度洗脱吸附的蛋白。到此时期的纯化步骤重复三次,并合并具有棉子糖合酶活性的馏份且然后按如下纯化:
向具有棉子糖合酶活性的洗脱馏份中加入1/4体积的均一(portionwise)饱和的(NH4)2SO4
将溶液装入以20%饱和(NH4)2SO4,20mM Tris-Hcl(pH7.4),1mM DTT(二硫苏糖醇)和1mM EDTA平衡的Phenyl-琼脂糖柱(发玛西亚,2.5cm×10.2cm)中,并以20%到0%梯度的(NH4)2SO4洗脱的吸附的蛋白。得到的活性馏份通过加入0.01M磷酸钾缓冲液(pH7.5)至2倍体积而稀释。将稀释的溶液装入预先以0.01M磷酸钾缓冲液(pH7.5)和2mM DTT(二硫苏糖醇)平衡的Econo-Pac 10DG柱(伯乐,5ml)中,并以0.01至0.5M梯度的磷酸钾缓冲液(pH7.5)和2mM的DTT(二硫苏糖醇)洗脱吸附的蛋白。发现此时期获得的活性馏份已被纯化达6500一倍或更高的特异性活性。具有棉子糖合酶活性的部分得到的纯化蛋的溶液装入以0.2M Kcl、20mM Tris-Hcl(pH7.4),1mM DTT(二硫苏糖醇)和1mM EDTA平衡的Super dex 200柱(发玛西亚,1.6cm×60cm)中。将这样分离的纯化蛋白进行SDS-PAGE,并测量棉子糖合酶的活性。具有棉子糖合酶活性的蛋白带在SDS-PAGE中被鉴定为具有约90KDa的分子量。
实施例4(棉子糖合酶部分氨基酸序列的分析)
向约1ml在实施例3中以Econo-Pac 10DG柱(伯乐,5ml)纯化的纯化蛋白溶液中加入1/9体积的100%TCA,并将混合物置于冰上30分钟。以10,000×g离心15分钟后,将得到的沉淀物悬于500μl的冷丙酮(-20℃)中,接着进一步离心。重复该丙酮清洗。并将收集的沉淀物干燥且然后溶于200μl的SDS-上样缓冲液中,接着进行SDS-PAGE。对电泳的凝胶进行CBB染色,从其中切出棉子糖合酶蛋白带。
向这样获得的凝胶中加入1ml 50%的乙腈和0.2M的碳酸铵(pH8.9),并继续于室温搅拌20分钟清洗。以相同的方式再次洗凝胶一次,并且在减压下干燥至达到体积减小程度。向该凝胶中加入1ml 0.02%吐温-20和0.2M的碳酸铵(pH8.9),并将混合物于室温搅拌15分钟。去除溶液后,加入400μl8M的尿素和0.4M的NH4HCO3,进一步加入40μl 45mM的DTT(二硫苏糖醇),并将混合物置于50℃20分钟。完全回到室温后,加入4μl 1M的碘乙酸,并将混合物于黑暗中室温搅拌20分钟。去除溶液后,加入1ml纯水,并将混合物于室温搅拌5分钟,接着清洗。进一步洗二次后,加入1ml 50%的乙腈和0.2M的碳酸铵(pH8.9),并将混合物于室温搅拌15分钟。再次重复相同的处理,之后去除溶液,将凝胶在减压下干燥到减小体积程度。
向该凝胶中加入100μl体积的Achromobacter蛋白酶I(Takara,残基特异性蛋白酶试剂盒)溶液。进一步加入0.02%的吐温-20和0.2M的碳酸铵(pH8.9)至凝胶不暴露于溶液表面的程度,并将混合物置于37℃42小时。进一步加入500μl 0.09%的TFA和70%的乙腈,并将混合物于室温搅拌30分钟。将含于样品管中的得到的混合物浮于超声浴中,接着超声处理(BRANSON,60W输出功率)5分钟。将这样处理的管和内容物离心,将得到的提取物收集于别的涂布硅氧烷的样品管中。另一方面,再次向沉淀物中加入500μl 0.09%的TFA和70%的乙腈,接着以上述相同的方式重复提取。合并得到的提取物且然后在减压的条件下浓缩至得到200至300μl剩余溶液体积的程度。向浓缩液中加入25μl 8M的尿素和0.4M的NH4HCO3,并将混合物浓缩至得到100μl或更小体积剩余溶液的程度。从纯水将浓缩液调至100μl,并将混合物经Ultrafree C3 GV(微孔)滤膜过滤。然后将获得的过滤液经Aquapore BU-300C-4(2.1mm×30mm)柱通过0.1%的TFA/2.1%至68.6%梯度的乙腈洗脱。监测215nm处的吸收从收集其峰值处的馏份。将收集的样品在减压下蒸发至完全干燥,且然后以ABI蛋白测序议473A分析以检测棉子糖合酶的部分氨基酸序列。
实施例5(cDNA的制备)
将约2g的未成熟蚕豆(Nintoku Issun)种子冻于液氮中且然后以臼研磨,向其中加入20ml等基因(Nippon基因),并将混合物进一步彻底研磨。将研磨的材料转入离心管中,向其中加入4ml的氯仿,并将混合物从旋涡混合器搅拌且然后于4℃以6,500×g离心10分钟。收集水层,向其中加入10ml异丙醇,并搅拌混合物且然后于4℃以6,500×g离心10分钟。将得到的沉淀物以10ml 70%的乙醇洗且然后溶于1ml洗脱缓冲液(10mM Tris-Hcl(pH7.5)),1mM EDTA,0.1%SDS)中。将溶液置于60℃10分钟且然后以10,000×g离心1分钟以去除不溶性物质。向得到的上清液中加入等体积的Oligo tex-dT30(Takara),并且搅拌混合物且然后置于65℃5分钟。将混合物置于冰上且然后放置3分钟,向其中加入200μl 5M的NaCl,并将混合物置于37℃10分钟。将混合物然后于4℃以10,000×g离心3分钟。收集沉淀物且然后悬于1ml TE缓冲液中,并将悬液置于65℃5分钟,置于冰上且然后放置3分钟,接着于4℃以10,000×g离心3分钟以去除沉淀物。
向得到的上清液中加入100μl 3M的醋酸钠和2ml的乙醇,RNA以乙醇沉淀并收集。将收集的RNA以70%的乙醇洗2次且然后溶于20μl灭菌水中,用于以后的cDNA合成。通过测量260nm处的吸收测定获得的RNA量。
对于cDNA合成,使用用于RT-PCR的第一链合成试剂盒(Amercham)和cDNA合成试剂盒(Takara),并且所有的操作根据说明书完成。
实施例6(从cDNA分析棉子糖合酶基因的核苷酸序列)
根据实施例4中获得的氨基酸序列,合成具有显示于下表5中核苷酸序列的混合合成DNA引物。用Clontech的优势Klen Taq cDNA试剂盒以珀金-埃尔默Gene Amp PCR系统2400和DNA热循环仪480完成PCR方法。聚合酶链式反应用上面的引物于94℃1分钟,50℃3分钟和72℃3分钟进行,并将重复该反应40次。结果,具有下表5中显示的核苷酸序列的引物8.2与13.3RV、引物13.4与10.3RV以及引物7.4与10.3RV的结合分别得到1.2kb、0.5kb和1.2kb带的扩增。以TA克隆试剂盒(Invitrogen)克隆这些扩增的DNA片段,接着用珀金-埃尔默的ABI PRISM Dye终止子循环测序现成反应试剂盒进行测序反应并以ABI 373S DNA测序仪进行核苷酸序列分析。结果,发现这些DNA片段分别具有SEQ ID NO:2核苷酸序列中第813个碱基至第1915个碱基、第1936个碱基至第2413个碱基以及第1226个碱甚至第2413个碱基的核苷酸序列。根据这些核苷酸序列,制备具有显示于下表6中核苷酸序列的合成DNA引物,并以Clontech的马拉松cDNA扩增试剂盒分析位于cDNA两末端区域的核苷酸序列。结果,最后测定SEQ ID NO:2的核苷酸序列。
序列
(序列表5)
#8.2        26聚体
            AA(AG) AC(ATGC) GC(ATGC) CC(ATGC) AG(TC) AT(TCA) AT(TCA) GAC AA
#13.4       20聚体
            AA(AG) AT(TCA) TGG AA(TC) CT(ATGC) AAC AA
#7.4        24聚体
            AA(AG) GC(ATGC) AG(AG) GT(ATGC) GT(ATGC) GT(ATGC) CC(ATGC) AAG
#13.3RV     21聚体
            (TC)TT (AG)TT (ATGC)AG (AG)TT CCA (AGT)AT TTT
#10.3RV     21聚体
            (TC)TT (AG)TC (TC)TC (AG)TA (ATGC)AG (AG)AA TTT
(序列表6)
RS-2RV      30聚体
            GGCTGAGGTTCGGTTCATTCCTGAATCATC
RS-7        30聚体
            CCAAATGGTACATATTGGCTCCAAGGTTGT
RS-8        30聚体
            AAGAGTGTATCTGAATTTTCACGCGCGGTG
RS-9        30聚体
            TGGTGCAATGGGAAAACTCCAATGAGCACC
RS-10       30聚体
            ATGAAGTGTTCTGATAGATTGAAAGTTTCG
RS-11       30聚体
            CAGTCTCTGGAGTTTGATGATAATGCAAGT
实施例7(从蚕虫cDNA中克隆棉子糖合酶基因)
合成从SEQ ID NO:1氨基酸序列设计的引物,即,具有显示于下表7核苷酸序列的引物。用这些引物和在实施例5中获得的cDNA作为模板,在实施例6中所述的条件下通过PCR扩增开放阅读框区域的DNA片段。从所用的引物中含有其识别序列的限制性核酸内切酶Bam HI和Xba I消化扩增的DNA片段。用连接试剂盒(Takara),将这样消化的DNA片段克隆于预先从Bam HI和Xba I消化的质粒pBluescript II KS-(Stratagene)中。克隆DNA片段的核苷酸序列从珀金-埃尔默的ABI PRISM Dye终止子循环测序现成反应试剂盒加以确证。在这样获得的克隆中,发现SEQ ID NO:2的核苷酸序列中第1591位置的碱基从胞腺嘧啶(T)变成胞嘧啶(C)。然而,这是一个无义突变而没有改变氨基酸;因此,将该克隆命名为pBluescriptKS-RS,且用于以后的实验中。
(序列表7)
RS-N      41聚体
          CGCGGATCCACCATGGCACCACCAAGCATAACCAAAACTGC
RS-C      37聚体
          TGCTCTAGATTATCAAAATAAAAACTGGACCAAAGAC
实施例8(蚕豆棉子糖合酶基因在大肠杆菌中的表达)
以Bam HI和Nat I消化实施例7中获得的具有蚕豆棉子糖合酶基因的质粒pBluescript KS-RS,并克隆于以Bam HI和Nat I消化的质粒pGEX-473(发玛西亚)中以得到显示于图1中的质粒pGEX-RS。
以Nco I和Xba I消化质粒pBluescript KS-RS,并且克隆于从Nco I和Xba I消化的质粒pTrc 99A(发玛西亚)中以得到显示于图1中的质粒pTrc-RS。
将这些质粒导入大肠杆菌菌株HB101,并用得到的转化子确证棉子糖合酶的表达。将每1ml体积的过夜转化了培养物接种于100ml LB培养基并于37℃孵育约3小时,接着加入IPTG(异丙基硫代-β-D-半乳糖苷)至1mM的终浓度并进一步孵育5小时。将培养物以21,400×g离心10分钟,并收集细菌细胞。将收集的细菌细胞保存于-80℃。向冻存细菌细胞中加入10倍体积的100mMTris-Hcl(pH7.4),1mM EDTA,5mM DTT(二硫苏糖醇),1mM PMSF(苯甲基磺酰氟)及1mM苯甲酰胺,并融化和悬浮细菌细胞。以超声裂解仪(Branson)处理这些悬液从进行细菌细胞的裂解。将获得的裂解细胞混合物以16,000×g离心10分钟,并收集可溶性蛋白。
用每4μl体积的这样获得的蛋白溶液根据上述的方法测量棉子糖活性。反应于37℃进行64小时。作为对照,使用从其中之一的载体,pGEX-4T3转化的大肠杆菌菌株HB101。结果显示于表1。检测HB101(pGEX-RS)和HB101(pTrc-RS)转化子样品中的棉子糖合成。
                       表1
    转化子     制备的棉子糖量(pmol)
    HB101(pGEX4T-3)     0.56
    HB101(pGEX-RS)     10.50
    HB101(pTrc-RS)     11.10
实施例9(从大豆cDNA中克隆棉子糖合酶基因)
从实施例5中所述的相同方式,从未成熟Williams 82大豆(Glycinemax)的种子中获得cDNA。用该cDNA作为模板且从SEQ ID NO:1氨基酸序列设计的引物,即,具有下面序列表8中显示核苷酸序列的引物,在实施6中所述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Invitrogen)克隆,接着用珀金-埃尔默的ABI PRISM Dye终止子循环测序现成的试剂盒进行测序反应并以ABI 373S DNA测序仪进行核苷酸序列分析。根据该序列,合成具有下面序列表9中显示核苷酸序列的引物。用与实施例5中所述的相同方式从Williams 82大豆叶中获得的mRNA以马拉松Clontech试剂盒进行cDNA的合成。以连接酶将获得的cDNA连接于含于该试剂盒中的衔接子上。该操作根据附属的方法完成。用这样制备的连接衔接子的cDNA,以显示于下面序列表9中的引物进行聚合酶链式反应。根据附属于Clontech马拉松试剂盒中的方法分析该基因两末端的核苷酸序列。结果,SEQID NO:4的核苷酸序列得以测定。
(序列表8)
1-F引物        35聚体
               CGATTIAAIGTITGGTGGACIACICAITGGGTIGG
2-RV引物       45聚体
               GGCCTAIAAIGCITCCCAIGTICACCAICCIAAITTITCIATIAT
5-F引物        41聚体
               CGATGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT
6-RV引物       32聚体
               GGCCACATITTIACIA(AG)CCIATIGGIGCIAA
(序列表9)
SN-1           30聚体
               CACGAACTGGGGCACGAGACACAGATGATG
SC-3RV         30聚体
               AAGCAAGTCACGGAGTGTGAATAGTCAGAG
SC-5        30聚体
            ACACGAGACTGTTTGTTTGAAGACCCCTTG
SC-6        25聚体
            TGGAATCTCAACAAATATACAGGTG
SN-3RV      30聚体
            GGGTCATGGCCAACGTGGACGTATAAGCAC
SN-4RV      30聚体
            GATGATCACTGGCGCGGTTTTCTCCTCGAG
实施例10(从日本菜蓟cDNA中获得棉子糖合酶基因)
以与实施例5中所述的相同的方式,从日本菜蓟(Stachys sieboldii)叶中获得cDNA。用该cDNA作为模板且从SEQ ID NO:1氨基酸序列设计的引物,即,具有显示于下面序列表10中核苷酸序列的引物,在实施例6中描述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Invitrogen)克隆,接着用珀金-埃尔默的ABI PRISM Dye终止子循环测序现成反应试剂盒进行序列反应并且以ABI 373S DNA测序仪进行核苷酸序列分析。结果,SEQ ID NO:6的核苷酸序列得以测定。
根据这样获得的核苷酸序列,制备合成的DNA引物,并且以Clontech马拉松试剂盒分析该基因两末端区域的核苷酸序列。
(序列表10)
1-F引物        35聚体
               CGATTIAAIGTITGGTGGACIACICAITGGGTIGG
4-RV引物       37聚体
               GGCCAGCIATIACICCITTICCITTIAAITGITTITT
2-F引物        44聚体
               CGAATIATIGAIAAITTIGGITGGTGIACITGGGAIGCITTITA
6-RV引物       32聚体
               GGCCACATITTIACIA(AG)ICCIATIGGIGCIAA
实施例11(从玉米cDNA中获得棉子糖合酶基因)
以与实施例5中所述的相同的方式,从先锋3358玉米(Zea mays L.)叶中获得cDNA。用该cDNA作为模板并且用从SEQ ID NO:1氨基酸序列设计的引物,即,具有下面序列表11中显示的核苷酸序列的引物,在实施例6中所述的条件下通过PCR扩增DNA片段。将这样通过PCR扩增的DNA片段用TA克隆试剂盒(Inuitrogen)克隆,接着用珀金埃尔默的ABI PRISM Dye终止子循环测序现成反应试剂盒进行序列反应并以ABI的373S DNA测序仪进行核苷酸序列分析。根据该序列,合成具有下面序列表12中显示核苷酸序列的引物。以与实施例5中所述的相同的方式,用连接酶将从先锋3358玉米(Zeamays L.)叶中获得的mRNA连接到含于Clontech马拉松试剂盒中的衔接子上。该操作根据附属的方法完成。用这样制备的连接衔接子的cDNA,以显示于下面序列表12中的引物用与上述相同的方式进行聚合酶链式反应。结果,SEQ IDNO:8的核苷酸序列得以测定。
根据这样获得的核苷酸序列,制备合成的DNA引物,并且以与实施例9中所述相同的方式,以Clontech的马拉松试剂盒分析该基因5’-末端区域的核苷酸序列。
(序列表11)
5-F引物        41聚体
               CGATGGATGGGIAAITTIATICAICCIGAITGGGAIATGTT
6-RV引物       32聚体
               GGCCACATITTIACIA(AG)ICCIATIGGIGCIAA
(序列表12)
M-10引物       25聚体
               GACGTCGAGTGGAAGAGCGGCAAGG
M-11引物       25聚体
               CACCTACGAGCTCTTCGTCGTTGCC
实施例12(植物中35S-蚕豆棉子糖合酶基因嵌合体基因表达载体的构建)
以限制性核酸内切酶BamHI和SacI消化实施例7中获得的具有棉子糖合酶基因的质粒pBluescript KS-RS。用连接试剂盒(Takara),将这样消化的DNA片段克隆于预先以BamHI和SacI消化的二等分载体(binaryvector)pBI121(Clontech)。将这样获得的载体命名为pBI121-RS。
为了反义实验,将预先以Bam HI和Sac I消化的质粒pBI121(Clontech)连接到显示于下面序列表13中的接头上(linker)以得到pBI121(-)。以与所述的用于制备上面的pBI121-RS相同的方式用该pBI121(-)制备pBI121(-)-RS。
以pBI221制备类似的载体。以限制性核酸内切酶Bam HI和Sac I消化实施例7中获得的质粒pBluescript KS-RS。用连接试剂盒(Takara),将这样消化的DNA片段克隆于预先以BamHI和SacI消化的载体pBI221(Clontech)中。将这样获得的载体命名为pBI221-RS。
为了反义实验,将预先以BamHI和SacI消化的质粒pBI221(Clontech)连接到显示于下面序列13中的接头中以得到pBI221(-)。以与所述的用于上面pBI221-RS制备相同的方式用该pBI221(-)制备pBI221(-)-RS。
将这些表达载体的构建显示于图2和3。
(序列表13)
BamSac-(+)接头        25聚体
                      GATCGAGCTCGTGTCGGATCCAGCT
BamSac-(-)接头        17聚体
                      GGATCCGACACGAGCTC
实施13(以蚕豆棉子糖合酶基因对芥子的转化)
用实施例12中制备的载体pBI121-RS和pBI121(-)RS通过农杆菌感染方法转化芥子(Brassica juncia)。
将预先通过氯化钙处理将其变成感受态状态的根癌土壤杆菌(C58C1菌株,利福平抗性)独立地以实施例12中制备的两种质粒pBI121-RS和pBI121(-)-RS转化。利用导入质粒中卡那霉素抗性基因(新霉素磷酸转移酶,NPTII)赋予的卡那霉素抗性特征在含有50μg/ml利福平和25μg/ml卡那霉素的LB培养基上完成转化子的筛选。
将获得的转化子农杆菌(根癌土壤杆菌C58菌株,利福平抗性)于28℃在含有50μg/ml利福平和25μg/ml卡那霉素的LB培养基上培养一昼夜,并将培养物用于通过下述方法对芥子的转化。
将芥子种子无菌播种于1/2MS培养基,2%蔗糖,0.7%琼脂中。一周后,以手术刀切下发牙植物的子叶和叶柄,并转移至MS培养基,3%蔗糖,0.7琼脂,4.5μM BA,0.05μM 2.4-D,3.3μM AgNO3,接着预培养1天。将预培养的子叶和叶柄转移主农杆菌培养物的1000-倍稀释液中以导致感染5分钟。将感染的子叶和叶柄再次转移到与用于预培养相同的培养基中,并培养3到4天。将培养的子叶和叶柄转移至MS培养基,3%蔗糖,4.5μM BA,0.05μM2.4-D,3.3μM AgNO3,500mg/l氨噻肟头孢霉素(cefotaxim),并且震摇灭菌1天。将灭菌的子叶和叶柄转移至MS培养基,3%蔗糖,0.7%琼脂,4.5μM BA,0.05μM 2.4-D,3.3μM AgNO3,100mg/ml氨噻肟头孢霉素,20mg/l卡那霉素,并培养3到4周。将子叶和叶柄转移到MS培养基,3%蔗糖,0.7%琼脂,4.5μM BA,0.05μM 2.4-D,100mg/l氨噻肟头孢霉素。20mg/l卡那霉素并培养。以3到4周的间隔在该培养基上传代培养。当嫩枝再生开始出现时,将这些嫩枝传代培养于MS培养基,3%蔗糖,0.7%琼脂,20mg/l卡那霉素,并培养3到4周。将生根的植物转移到蛭石∶泥炭藓(peat moss)=1∶1,并于白天/黑夜=12小时∶12小时的循环将条件控制于21°到22℃。随着植株体生长的进行,将植株以培土适当培养。根据上述方法从再生植株的叶中提取基因组DNA,并且插入植物体基因组中的基因用显示于下面序列表14中的引物通过PCR加以确证。
(序列表14)
35S        30聚体
           TTCCAGTATGGACGATTCAAGGCTTGCTTC
NOS        25聚体
           ATGTATAATTGCGGGACTCTAATCA
RS-F       30聚体
           AAGAGTGTATCTGAATTTTCACGCGCGGTG
RS-RV聚体        33聚体
                 ACCTTCCCATACACCTTTTGGATGAACCTTCAA
实施例14(以蚕虫棉子糖合酶基因对大豆体细胞胚的转化)
将大豆“Fayette”体细胞胚的培养细胞(400到500mg FW)以一层安排于6cm琼脂平板中心部分具有20mm直径的圆内。将具有在实施例12中从蚕豆棉子糖合酶基因和35S启动子制备的嵌合体基因的质粒pBI221-RS和pBI221(-)-RS根据公开的日本专利申请No.3-291501/1991导入大豆体细胞胚中。即,将这些质粒与在Soshiki Baiyo,20,323-327(1994)中所述的用于筛选的β-葡萄醛酸酶(GUS)/潮霉素-抗性基因(HPT)共表达载体pSUM-GH:No:I混合。以粒子枪(800mg/包被金颗粒200μg/射;抛物体终止-样品距离(projectiles topper-sample distance),100mm)将这些混合的质粒用于基因导入到大豆体细胞胚中。导入后,将旋转培养物在25℃照明16小时条件下培养于含有25到50μg/ml潮霉素的MS修饰液体培养基中(西格玛),并且筛选转化的体细胞胚。
对于具有黄绿色和生长能力的被筛选约3个月的潮霉素抗性大豆体细胞胚,从上面序列表14中显示的引物进行聚合链式反应以检测蚕豆棉子糖合酶基因区域扩增与否。这证实了蚕豆棉子糖合酶基因插入到大豆基因组中。
此外,将获得的体细胞胚用于植株再生以得到具有蚕豆棉子糖合酶基因的转化子大豆。
培养基组成
用于上面实施例中的LB和MS培养基具下面各自的组成。
(LB培养基)
细菌用-胰蛋白胨                    10g
细菌用-酵母提取物                  5g
NaCl                               10g/l升H2O(pH7.0)
(MS培养基)
KNO3                              2022mg/l
NH4NO3                           1650mg/l
NH4Cl                             2140mg/l
MgSO4·7H2O                   370mg/l
CaCl2·2H2O                   440mg/l
MnSO4·4H2O                   22.3mg/l
ZnSO4·7H2O                   8.6mg/l
CuSO4·5H2O                   0.025mg/l
KI                               0.83mg/l
CoCl2·6H2O                   0.025mg/l
H3BO3                         6.2mg/l
NaMoO4·2H2O                  0.25mg/l
FeSO4·7H2O                   27.8mg/l
Na2EDTA                        37.3mg/l
烟酸                             0.5mg/l
硫氨素Hcl                        1mg/l
吡哆醇Hcl                        0.5ml/l
肌醇                             100mg/l
甘氨酸                           2mg/l
序列简述
1.SEQ ID NO:1
SEQ ID NO:1序列显示在从蚕豆获得的棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。
2.SEQ ID NO:2
SEQ ID NO:2的序列显示从蚕豆获得的棉子糖合酶基因的cDNA核苷酸序列。
3.SEQ ID NO:3
SEQ ID NO:3序列显示在从大豆获得的棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。
4.SEQ ID NO:4
SEQ ID NO:4的序列显示从大豆获得棉子糖合酶基因的cDNA核苷酸序列。
5.SEQ ID NO:5
SEQ ID NO:5的序列显示在从日本菜蓟获得的棉子糖合酶基因中编码的棉子糖合酶蛋白氨基酸序列。
6.SEQ ID NO:6
SEQ ID NO:6的序列显示从日本菜蓟获得棉子糖合酶基因的cDNA核苷酸序列。
7.SEQ ID NO:7
SEQ ID NO:7的序列显示在从玉米中获得棉子糖合酶基因中编码的棉子糖合酶蛋白的氨基酸序列。
8.SEQ ID NO:8
SEQ ID NO:8的序列显示从玉米获得棉子糖合酶基因的cDNA核苷酸序列。
9.序列表1:
显示于序列表1中的核苷酸序列为用于棉子糖合酶合酶基因cDNA片段扩增的典型引物。所有这些序列根据该基因的非编码区的核苷酸序列。引物1是相应于从蚕豆获得棉子糖合酶基因cDNA片段的5’末端的有义引物。引物2和3是相应于从蚕豆获得棉子糖合酶基因cDNA片段的3’-末端的反义引物。引物4是相应于从大豆获得棉子糖合酶基因cDNA片段5’-末端的有义引物。引物5和6是相应于从大豆获得棉子糖合酶基因cDNA片段3’-末端的反义引物。根据目的,可用适当的方式将合适限制性核酸内切酶的识别序列添加到这些核苷酸序列的5’-末端。
10.序列表2:
显示于序列表2中的核苷酸序列为用于在棉子糖合酶基因cDNA序列中编码棉子糖合酶蛋白氨基酸序列开放阅读框扩增的典型引物。引物1和2为相应于从蚕豆获得棉子糖合酶蛋白N-末端的有义引物。引物3和4为相应于从蚕豆获得棉子糖合酶蛋白C-末端的反义引物。引物5和6为相应于从大豆获得棉子糖合酶蛋白N-末端的有义引物。引物7和8为相应于从大豆获得棉子糖合酶蛋白C-末端的反义引物。根据目的,可用适当的方式将合适限制性核酸内切酶的识别序列添加到这些序列的5’末端。
11.序列表3:
11.序列表3:
显示于序列表3中的氨基酸序列为棉子糖合酶蛋白部分的氨基酸序列。
#1相当于SEQ ID NO:1氨基酸序列中第110个氨基酸延伸至第129个氨基酸的部分氨基酸序列。
#2为相当于在SEQ ID NO:1氨基酸序列中从第234个氨基酸延伸至第247个氨基酸的部分氨基酸序列。
#3为相当于SEQ ID NO:1氨基酸序列中从第265个氨基酸延伸至第279个氨基酸的部分氨基酸序列。
#4为相当于于SEQ ID NO:1氨基酸序列中第296个氨基酸延伸到第312个氨基酸的部分氨基酸序列。
#5为相当于SEQ ID NO:1氨基酸序列中第346个氨基酸延伸到第361个氨基酸的部分氨基酸序列。
#6为相当于SEQ ID NO:1氨基酸序列中第383个氨基酸延伸到第402个氨基酸的部分氨基酸序列。
#7为相当于SEQ ID NO:1氨基酸序列中第411个氨基酸延伸到第433个氨基酸的部分氨基酸序列。
#8为相当于SEQ ID NO:1氨基酸序列中第440个氨基酸延伸到第453个氨基酸的部分氨基酸序列。
#9为相当于SEQ ID NO:1氨基酸序列中第457个氨基酸延伸到第468个氨基酸的部分氨基酸序列。
#10为相当于SEQ ID NO:1氨基酸序列中从第471个氨基酸延伸到第516个氨基酸的部分氨基酸序列。
#11为相当于SEQ ID NO:1氨基酸序列中从第517个氨基酸延伸到第559个氨基酸的部分氨基酸序列。
#12为相当SEQ ID NO:1氨基酸序列中从第574个氨基酸延伸到第582个氨基酸的部分氨基酸序列。
#13为相当于SEQ ID NO:1氨基酸序列中从第586个氨基酸延伸到第609个氨基酸的部分氨基酸序列。
#14为相当于SEQ ID NO:1氨基酸序列中从第615个氨基酸延伸到第724个氨基酸的部分氨基酸序列。
个氨基酸的部分氨基酸序列。
12.序列表4:
显示于序列表4中的核苷酸序列为根据序列表3中显示的一些氨基酸序列合成的典型引物。引物号后使用的符号“F”意思是由该符号代表的引物具有有义序列。引物号后使用的符号“RV”意思是由该符号代表的引物具有反义序列。引物相应于SEQ ID NO:1氨基酸序列中第119个氨基酸延伸到第129个氨基酸的部分氨基酸序列。引物2相应于SEQ ID NO:1氨基酸序列中第234个氨基酸延伸到第247个氨基酸的部分氨基酸序列。引物3相应于SEQ ID NO:1氨基酸序列中第265个氨基酸延伸到第279个氨基酸的部分氨基酸序列。引物4相应于SEQ ID NO:1氨基酸序列中第458个氨基酸延伸到第468个氨基酸的部分氨基酸序列。引物5相应于SEQ ID NO:1氨基酸序列中第522个氨基酸延伸到第534个氨基酸的部分氨基酸序列。引物6相应于SEQ ID NO:1氨基酸序列中第716个氨基酸延伸到第724个氨基酸的部分氨基酸序列。
13.序列表5:
显示于序列表5中的核苷酸序列为根据纯化的蚕豆棉子糖合酶蛋白部分氨基酸序列而合成的典型引物。显示于圆括号中的碱基意思为将那些碱基用于合成中。在引物号后使用的符号“RV”意思为由该符号代表的引物具有反义序列。
14.序列表6:
显示于序列表6中的核苷酸序列为用于通过RACE方法分析蚕豆棉子糖合酶基因cDNA核苷酸序列两个末端区域的典型引物。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。
15.序列表7:
显示于序列表7中的核苷酸序列为用于克隆蚕豆棉子糖合酶基因中的典型引物。RS-N相应于该开放阅读框的N-末端并在5’-末端一侧含有限制性核酸内切酶BamHI和NcoI的识别位点。RS-C为相应于该开放阅读框C-末端的反义引物并且在5’-末端一侧含有限制性核酸内切酶XbaI的识别位点。
16.序列表8:
显示于序列表8中的核苷酸序列为用于克隆大豆棉子糖合酶基因片段中的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的符号“RV”意思为由该符号代表的引物具有反义序列。
17.序列表9:
显示于序列表9中的核苷酸序列为用于分析大豆棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。
用SN-1和SC-3RV通过聚合酶链式反应进行核苷酸序列分析。SC-5和SC-6用于分析3’-末端区域的核苷酸序列,且SN-3RV和SN-4RV用于分析5’-末端区域的核苷酸序列。
18.序列表10:
显示于序列表10中的核苷酸序列为用于分析日本菜蓟棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。符号“I”代表的碱基为用于合成中的次黄苷。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。
19.序列表11:显示于序列表11中的核苷酸序列为用于分析玉米棉子糖合酶基因片段cDNA核苷酸序列中的典型引物。符号“I”代表的碱基为用于合成的次黄苷。引物号后使用的符号“RV”意思为该符号代表的引物具有反义序列。
20.序列表12:
显示于序列表12中的核苷酸序列为用于分析玉米棉子糖合酶基因片段cDNA核苷酸序列分析中的典型引物。M-10和M-11用于3’-末端区域核苷酸序列的分析。
21.序列表13:
显示于序列表1 3中的核苷酸序列为用于构建反义实验载体中的典型衔接子。当混合在一起时这些合成DNA征段采取双链形式因为它们为互补链。该双链DNA片段在两末端具有限制性核酸内切酶BamHI和SacI切割位点的粘性末端,并在双链区域含有限制性核酸内切酶BamHI和SacI的限制性位点。
22.序列表14:
显示于序列表14中的核苷酸序列为用于确证基因导入重组植物体基因组PCR实验中的典型引物。35S为位于35S启动子位点下游区域的引物,并且NOS为位于NOS终止子位点上游区域的引物。RS-F为蚕豆棉子糖合酶基因的有义引物,且RS-RV为蚕豆棉子糖合酶基因的反义引物。
                        序列表
(1)一般信息
(i)申请人:Eijiro,Watanabe
           Kenji,Oeda
(ii)发明题目:棉子糖合基因及其用途
(iii)序列数:8
(iv)联系地址:
    (A)联系人:Birch,Stewart,Kolasch & Birch,LLP
    (B)街道:8110 Gatehouse Road,Suite 500 East
    (C)城市:Falls Church
    (D)街道:Virginia
    (E)国家:USA
    (F)邮编:22042
(V)计算机可读形式:
    (A)媒体类型:Floppy disk
    (B)计算机:IBM PC兼容机
    (C)操作系统:PC-DOC/MS-DOS
    (D)软件:PatentIn Release # 1.0,Version # 1.25
(vi)目前申请数据
    (A)申请号:
    (B)申请日:
    (C)分类:C12N 9/100,C12N 15/52
(Vii)在先申请数据
    (A)申请号:JP-338673/1996
    (B)申请日:18-12-1996
(Viii)律师/代理人信息
    (A)姓名:
    (B)登记号
    (C)参考/摘要号
(ix)电信信息
    (A)电话:(703)205-8000
    (B)电传:(703)205-8050
    (2)ID NO:1的信息:
(i)序列特征:
    (A)长度:799个氨基酸
    (B)类型:氨基酸
    (D)拓扑:线型
(ii)分子类型:肽
(vi)原始来源:
    (A)生物:broad bean(Vicia faba)
    (B)菌株:Nintoku Issun
    (F)组织类型:种子
(xi)SEQ ID NO:1的序列描述:
Met Ala Pro Pro Ser Ile Thr Lys Thr Ala Thr Leu Gln Asp Val Ile
1                 5                  10                  15
Ser Thr Ile Asp Ile Gly Asn Gly Asn Ser Pro Leu Phe Ser Ile Thr
             20                  25                  30
Leu Asp Gln Ser Arg Asp Phe Leu Ala Asn Gly His Pro Phe Leu Thr
         35                  40                  45
Gln Val Pro Pro Asn Ile Thr Thr Thr Thr Thr Thr Thr Ala Ser Ser
     50                  55                  60
Phe Leu Asn Leu Lys Ser Asn Lys Asp Thr Ile Pro Asn Asn Asn Asn
 65                  70                  75                  80
Thr Met Leu Leu Gln Gln Gly Cys Phe Val Gly Phe Asn Ser Thr Glu
                 85                  90                  95
Pro Lys Ser His His Val Val Pro Leu Gly Lys Leu Lys Gly Ile Lys
            100                 105                 110
Phe Met Ser Ile Phe Arg Phe Lys Val Trp Trp Thr Thr His Trp Val
        115                 120                 125
Gly Thr Asn Gly Gln Glu Leu Gln His Glu Thr Gln Met Leu Ile Leu
    130                 135                 140
Asp Lys Asn Asp Ser Leu Gly Arg Pro Tyr Val Leu Leu Leu Pro Ile
145                 150                 155                 160
Leu Glu Asn Thr Phe Arg Thr Ser Leu Gln Pro Gly Leu Asn Asp His
                165                 170                 175
Ile Gly Met Ser Val Glu Ser Gly Ser Thr His Val Thr Gly Ser Ser
            180                 185                 190
Phe Lys Ala Cys Leu Tyr Ile His Leu Ser Asn Asp Pro Tyr Ser Ile
        195                 200                 205
Leu Lys Glu Ala Val Lys Val Ile Gln Thr Gln Leu Gly Thr Phe Lys
    210                 215                 220
Thr Leu Glu Glu Lys Thr Ala Pro Ser Ile Ile Asp Lys Phe Gly Trp
225                 230                 235                 240
Cys Thr Trp Asp Ala Phe Tyr Leu Lys Val His Pro Lys Gly Val Trp
                245                 250                 255
Glu Gly Val Lys Ser Leu Thr Asp Gly Gly Cys Pro Pro Gly Phe Val
            260                 265                 270
Ile Ile Asp Asp Gly Trp Gln Ser Ile Cys His Asp Asp Asp Asp Glu
        275                 280                 285
Asp Asp Ser Gly Met Asn Arg Thr Ser Ala Gly Glu Gln Met Pro Cys
    290                 295                 300
Arg Leu Val Lys Tyr Glu Glu Asn Ser Lys Phe Arg Glu Tyr Glu Asn
305                 310                 315
Pro Glu Asn Gly Gly Lys Lys Gly Leu Gly Gly Phe Val Arg Asp Leu
320             325                 330                 335
Lys Glu Glu Phe Gly Ser Val Glu Ser Val Tyr Val Trp His Ala Leu
            340                 345                 350
Cys Gly Tyr Trp Gly Gly Val Arg Pro Gly Val His Gly Met Pro Lys
        355                 360                 365
Ala Arg Val Val Val Pro Lys Val Ser Gln Gly Leu Lys Met Thr Met
    370                 375                 380
Glu Asp Leu Ala Val Asp Lys Ile Val Glu Asn Gly Val Gly Leu Val
385                 390                 395                 400
Pro Pro Asp Phe Ala His Glu Met Phe Asp Gly Leu His Ser His Leu
                405                 410                 415
Glu Ser Ala Gly Ile Asp Gly Val Lys Val Asp Val Ile His Leu Leu
            420                 425                 430
Glu Leu Leu Ser Glu Glu Tyr Gly Gly Arg Val Glu Leu Ala Arg Ala
        435                 440                 445
Tyr Tyr Lys Ala Leu Thr Ser Ser Val Lys Lys His Phe Lys Gly Asn
    450                 455                 460
Gly Val Ile Ala Ser Met Glu His Cys Asn Asp Phe Phe Leu Leu Gly
465                 470                 475                 480
Thr Glu Ala Ile Ser Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Ser
                485                 490                 495
Asp Pro Ser Gly Asp Pro Asn Gly Thr Tyr Trp Leu Gln Gly Cys His
            500                  505                 510
Met Val His Cys Ala Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln
        515                 520                 525
Pro Asp Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His
    530                 535                 540
Ala Ala Ser Arg Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Cys
545                 550                 555                 560
Val Gly Asn His Asn Phe Lys Leu Leu Lys Ser Leu Val Leu Pro Asp
                565                 570                 575
Gly Ser Ile Leu Arg Cys Gln His Tyr Ala Leu Pro Thr Arg Asp Cys
            580                 585                 590
Leu Phe Glu Asp Pro Leu His Asn Gly Lys Thr Met Leu Lys Ile Trp
        595                 600                 605
Asn Leu Asn Lys Tyr Thr Gly Val Leu Gly Leu Phe Asn Cys Gln Gly
    610                 615                 620
Gly Gly Trp Cys Pro Glu Ala Arg Arg Asn Lys Ser Val Ser Glu Phe
625                 630                 635                 640
Ser Arg Ala Val Thr Cys Tyr Ala Ser Pro Glu Asp Ile Glu Trp Cys
                645                 650                 655
Asn Gly Lys Thr Pro Met Ser Thr Lys Gly Val Asp Phe Phe Ala Val
            660                 665                 670
Tyr Phe Phe Lys Glu Lys Lys Leu Arg Leu Met Lys Cys Ser Asp Arg
        675                 680                 685
Leu Lys Val Ser Leu Glu Pro Phe Ser Phe Glu Leu Met Thr Val Ser
    690                 695                 700
Pro Val Lys Val Phe Ser Lys Arg Phe Ile Gln Phe Ala Pro Ile Gly
705                 710                 715                 720
Leu Val Asn Met Leu Asn Ser Gly Gly Ala Ile Gln Ser Leu Glu Phe
                725                 730                 735
Asp Asp Asn Ala Ser Leu Val Lys Ile Gly Val Arg Gly Cys Gly Glu
            740                  745                750
Met Ser Val Phe Ala Ser Glu Lys Pro Val Cys Cys Lys Ile Asp Gly
        755                 760                 765
Val Lys Val Lys Phe Leu Tyr Glu Asp Lys Met Ala Arg Val Gln Ile
    770                 775                 780
Leu Trp Pro Ser Ser Ser Thr Leu Ser Leu Val Gln Phe Leu Phe Stop
785                 790                 795                 800
(2)SEQ ID NO:2的信息
   (i)序列特征:
      (A)长度:2746个碱基对
      (B)类型:核酸
      (C)链型:单链
      (D)拓扑:线型
   (ii)分子类型:cDNA到mRNA
   (ix)特征:
      (A)名称/关键词:肽
      (B)位置:101到2500
      (C)鉴定方法:实验
   (xi)SEQ ID NO:2的序列描述:
AATTTTCAAG CATAGCCAAG TTAACCACCT TAGAAACATT CCTACAAGCT ACTTATCCCT     60
GTCAATAAGC TACTAAGCTA CCAGAGTCTC ATCAATCACC ATG GCA CCA CCA AGC      115
                                            Met Ala Pro Pro Ser
                                                              5
ATA ACC AAA ACT GCA ACC CTC CAA GAC GTA ATA AGC ACC ATC GAT ATT      163
Ile Thr Lys Thr Ala Thr Leu Gln Asp Val Ile Ser ThrIle Asp Ile
                 10                  15                 20
GGT AAT GGT AAC TCA CCC TTA TTC TCC ATA ACC TTA GAC CAA TCA CGT      211
Gly Asn Gly Asn Ser Pro Leu Phe Ser Ile Thr Leu Asp Gln Ser Arg
             25                  30                  35
GAC TTC CTT GCA AAT GGC CAC CCT TTC CTC ACC CAA GTC CCA CCT AAC      259
Asp Phe Leu Ala Asn Gly His Pro Phe Leu Thr Gln Val Pro Pro Asn
         40                  45                  50
ATA ACA ACA ACA ACA ACA ACC ACT GCT TCC TCT TTT CTC AAT CTC AAA      307
Ile Thr Thr Thr Thr Thr Thr Thr Ala Ser Ser Phe Leu Asn Leu Lys
     55                  60                  65
TCC AAC AAA GAT ACC ATT CCC AAC AAC AAC AAC ACC ATG TTG TTG CAA      355
Ser Asn Lys Asp Thr Ile Pro Asn Asn Asn Asn Thr Met Leu Leu Gln
 70                  75                  80                  85
CAA GGT TGT TTC GTT GGT TTC AAC TCC ACC GAA CCC AAA AGC CAC CAC      403
Gln Gly Cys Phe Val Gly Phe Asn Ser Thr Glu Pro Lys Ser His His
                 90                  95                 100
GTA GTT CCA CTC GGC AAA CTA AAA GGA ATC AAA TTC ATG AGC ATA TTC      451
Val Val Pro Leu Gly Lys Leu Lys Gly Ile Lys Phe Met Ser Ile Phe
            105                 110                 115
CGG TTC AAA GTT TGG TGG ACA ACT CAC TGG GTC GGA ACA AAT GGA CAG      499
Arg Phe Lys Val Trp Trp Thr Thr His Trp Val Gly Thr Asn Gly Gln
        120                 125                 130
GAA CTA CAA CAC GAA ACA CAA ATG TTA ATC CTG GAC AAA AAC GAC TCC      547
Glu Leu Gln His Glu Thr Gln Met Leu Ile Leu Asp LysAsn Asp Ser
    135                 140                 145
CTC GGA CGA CCC TAT GTC TTA CTC CTC CCA ATC CTA GAA AAC ACC TTC      595
Leu Gly Arg Pro Tyr Val Leu Leu Leu Pro Ile Leu Glu Asn Thr Phe
150                 155                 160                 165
CGA ACC TCA CTC CAA CCC GGT CTC AAC GAT CAC ATA GGC ATG TCC GTC      643
Arg Thr Ser Leu Gln Pro Gly Leu Asn Asp His Ile Gly Met Ser Val
                170                 175                 180
GAA AGC GGT TCA ACA CAT GTC ACC GGG TCA AGC TTC AAA GCA TGT CTT       691
Glu Ser Gly Ser Thr His Val Thr Gly Ser Ser Phe Lys Ala Cys Leu
            185                 190                 195
TAC ATC CAT CTC AGT AAC GAC CCA TAC AGT ATA CTA AAA GAA GCA GTT       739
Tyr Ile His Leu Ser Asn Asp Pro Tyr Ser Ile Leu Lys Glu Ala Val
        200                 205                 210
AAA GTA ATC CAA ACT CAG TTA GGA ACA TTC AAG ACT CTT GAA GAA AAA       787
Lys Val Ile Gln Thr Gln Leu Gly Thr Phe Lys Thr Leu Glu Glu Lys
    215                 220                 225
ACA GCA CCT AGT ATT ATA GAC AAA TTC GGT TGG TGC ACG TGG GAT GCT       835
Thr Ala Pro Ser Ile Ile Asp Lys Phe Gly Trp Cys Thr Trp Asp Ala
230                 235                 240                 245
TTT TAC TTG AAG GTT CAT CCA AAA GGT GTA TGG GAA GGT GTA AAG TCT       883
Phe Tyr Leu Lys Val His Pro Lys Gly Val Trp Glu Gly Val Lys Ser
                250                 255                 260
CTC ACA GAT GGT GGT TGT CCT CCC GGT TTC GTC ATA ATC GAC GAC GGT       931
Leu Thr Asp Gly Gly Cys Pro Pro Gly Phe Val Ile Ile Asp Asp Gly
            265                 270                 275
TGG CAA TCC ATT TGT CAT GAC GAT GAC GAT GAA GAT GAT TCA GGA ATG       979
Trp Gln Ser Ile Cys His Asp Asp Asp Asp Glu Asp Asp Ser Gly Met
        280                 285                 290
AAC CGA ACC TCA GCC GGG GAA CAA ATG CCA TGC AGA CTT GTA AAA TAC      1027
Asn Arg Thr Ser Ala Gly Glu Gln Met Pro Cys Arg Leu Val Lys Tyr
    295                 300                 305
GAA GAG AAT TCT AAG TTT AGA GAA TAT GAG AAT CCT GAA AAT GGA GGG      1075
Glu Glu Asn Ser Lys Phe Arg Glu Tyr Glu Asn Pro Glu Asn Gly Gly
310                 315                 320                 325
AAG AAA GGT TTG GGT GGT TTT GTG AGG GAT TTG AAG GAA GAG TTT GGG      1123
Lys Lys Gly Leu Gly Gly Phe Val Arg Asp Leu Lys Glu Glu Phe Gly
                330                 335                 340
AGT GTG GAG AGT GTT TAT GTT TGG CAT GCG CTT TGT GGG TAT TGG GGC      117l
Ser Val Glu Ser Val Tyr Val Trp His Ala Leu Cys Gly Tyr Trp Gly
            345                 350                 355
GGG GTT AGG CCT GGA GTG CAT GGG ATG CCG AAA GCT AGG GTT GTT GTT      1219
Gly Val Arg Pro Gly Val His Gly Met Pro Lys Ala Arg Val Val Val
        360                 365                 370
CCG AAG GTG TCT CAG GGG TTG AAG ATG ACG ATG GAG GAT TTG GCG GTG      1267
Pro Lys Val Ser Gln Gly Leu Lys Met Thr Met Glu Asp Leu Ala Val
    375                 380                 385
GAT AAG ATT GTT GAG AAC GGT GTG GGG CTA GTG CCG CCA GAT TTT GCA      1315
Asp Lys Ile Val Glu Asn Gly Val Gly Leu Val Pro Pro Asp Phe Ala
390                 395                 400                 405
CAT GAG ATG TTT GAT GGG CTT CAC TCT CAT TTG GAG TCG GCG GGA ATT      1363
His Glu Met Phe Asp Gly Leu His Ser His Leu Glu Ser Ala Gly Ile
                410                 415                 420
GAC GGT GTT AAA GTT GAT GTT ATC CAT CTG CTT GAG TTA CTA TCA GAG      1411
Asp Gly Val Lys Val Asp Val Ile His Leu Leu Glu Leu Leu Ser Glu
            425                 430                 435
GAA TAT GGT GGA CGA GTT GAG CTA GCA AGA GCT TAT TAC AAA GCA CTA      1459
Glu Tyr Gly Gly Arg Val Glu Leu Ala Arg Ala Tyr Tyr Lys Ala Leu
        440                 445                 450
ACC TCA TCA GTG AAG AAA CAT TTC AAA GGC AAT GGT GTA ATT GCT AGC      1507
Thr Ser Ser Val Lys Lys His Phe Lys Gly Asn Gly Val Ile Ala Ser
    455                 460                 465
ATG GAG CAT TGC AAC GAC TTC TTT CTC CTC GGC ACC GAA GCC ATA TCC      1555
Met Glu His Cys Asn Asp Phe Phe Leu Leu Gly Thr Glu Ala Ile Ser
470                 475                 480                 485
CTC GGC CGC GTC GGA GAT GAT TTT TGG TGC TCT GAT CCA TCT GGT GAT      1603
Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Ser Asp Pro Ser Gly Asp
                490                 495                 500
CCA AAT GGT ACA TAT TGG CTC CAA GGT TGT CAC ATG GTA CAT TGT GCC      1651
Pro Asn Gly Thr Tyr Trp Leu Gln Gly Cys His Met Val His Cys Ala
            505                 510                 515
TAC AAC AGT TTA TGG ATG GGA AAT TTC ATT CAG CCA GAT TGG GAC ATG      1699
Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln Pro Asp Trp Asp Met
        520                 525                 530
TTT CAG TCC ACT CAT CCT TGT GCT GAA TTT CAT GCC GCC TCA CGA GCC      1747
Phe Gln Ser Thr His Pro Cys Ala Glu Phe His Ala Ala Ser Arg Ala
    535                 540                 545
ATA TCC GGC GGA CCA ATT TAT GTT AGT GAT TGT GTT GGT AAT CAC AAT      1795
Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Cys Val Gly Asn His Asn
550                 555                 560                 565
TTC AAG TTG CTC AAA TCT CTT GTT TTG CCC GAT GGT TCT ATC TTG CGT      1843
Phe Lys Leu Leu Lys Ser Leu Val Leu Pro Asp Gly Ser Ile Leu Arg
                570                 575                 580
TGT CAA CAT TAC GCA CTC CCT ACA AGA GAT TGC TTG TTT GAA GAC CCT      1891
Cys Gln His Tyr Ala Leu Pro Thr Arg Asp Cys Leu Phe Glu Asp Pro
            585                 590                 595
TTG CAT AAT GGC AAA ACA ATG CTG AAA ATT TGG AAT CTC AAC AAA TAT      1939
Leu His Asn Gly Lys Thr Met Leu Lys Ile Trp Asn Leu Asn Lys Tyr
        600                 605                 610
ACA GGT GTT TTG GGT CTT TTC AAC TGC CAA GGT GGT GGG TGG TGT CCT      1987
Thr Gly Val Leu Gly Leu Phe Asn Cys Gln Gly Gly Gly Trp Cys Pro
    615                 620                 625
GAG GCA CGG CGA AAC AAG AGT GTA TCT GAA TTT TCA CGC GCG GTG ACA      2035
Glu Ala Arg Arg Asn Lys Ser Val Ser Glu Phe Ser Arg Ala Val Thr
630                 635                 640                 645
TGT TAT GCA AGT CCC GAA GAC ATT GAA TGG TGC AAT GGG AAA ACT CCA      2083
Cys Tyr Ala Ser Pro Glu Asp Ile Glu Trp Cys Asn Gly Lys Thr Pro
                650                 655                 660
ATG AGC ACC AAA GGT GTG GAT TTT TTT GCT GTG TAT TTT TTC AAG GAG      2131
Met Ser Thr Lys Gly Val Asp Phe Phe Ala Val Tyr Phe Phe Lys Glu
            665                 670                 675
AAG AAA TTG AGG CTC ATG AAG TGT TCT GAT AGA TTG AAA GTT TCG CTT      2179
Lys Lys Leu Arg Leu Met Lys Cys Ser Asp Arg Leu Lys Val Ser Leu
        680                 685                 690
GAG CCA TTT AGT TTT GAG CTA ATG ACA GTG TCT CCA GTG AAA GTG TTT      2227
Glu Pro Phe Ser Phe Glu Leu Met Thr Val Ser Pro Val Lys Val Phe
    695                 700                 705
TCG AAA AGG TTT ATA CAG TTT GCA CCG ATT GGG TTA GTG AAC ATG CTG      2275
Ser Lys Arg Phe Ile Gln Phe Ala pro Ile Gly Leu Val Asn Met Leu
710                 715                 720                 725
AAC TCT GGT GGT GCG ATT CAG TCT CTG GAG TTT GAT GAT AAT GCA AGT      2323
Asn Ser Gly Gly Ala Ile Gln Ser Leu Glu Phe Asp Asp Asn Ala Ser
                730                 735                 740
TTG GTC AAG ATT GGG GTG AGA GGT TGC GGG GAG ATG AGC GTG TTT GCG      2371
Leu Val Lys Ile Gly Val Arg Gly Cys Gly Glu Met Ser Val Phe Ala
            745                 750                 755
TCT GAG AAA CCG GTT TGC TGC AAA ATT GAT GGG GTT AAG GTG AAA TTT      2419
Ser Glu Lys Pro Val Cys Cys Lys Ile Asp Gly Val Lys Val Lys Phe
        760                 765                 770
CTT TAT GAG GAC AAA ATG GCA AGA GTT CAA ATT CTG TGG CCT AGT TCT      2467
Leu Tyr Glu Asp Lys Met Ala Arg Val Gln Ile Leu Trp Pro Ser Ser
    775                 780                 785
TCA ACA TTG TCT TTG GTC CAG TTT TTA TTT TGA TCCCTAGGAA TCCTATGCAC    2520
Ser Thr Leu Ser Leu Val Gln Phe Leu Phe Stop
790                 795                 800
GTGTCTCTGT TTACAAGTAC TTTATATAAG TATAATATGT ATCTATTTCC ATTTTTAACT    2580
GTCTTTATGC AATTAGGTGG TCAATTAGTT ATTTGTTTGT GAAGTAACTA ACTTGCTTGT    2640
GTTGTAAGCT TATAATATAT GGTCAAGTTC CTCACTTGTA TATACCTGTT GTATGTATAA    2700
ATTTTACTAT ATATGACTAA CATCATTATC TTGTGAGCAA AAAAAA                   2746
(2)SEQ ID NO:3的信息
   (i)序列特征:
      (A)长度:781个碱基酸
      (B)类型:氨基酸
      (D)拓扑:线型
   (ii)分子类型:肽
   (vi)原始来源
      (A)生物:大豆(glycine max)
      (B)品种:Williams 82
      (F)组织类型:种子和叶
   (xi)SEQ ID NO:3的序列描述:
Met Ala Pro Ser Ile Ser Lys Thr Val Glu Leu Asn Ser Phe Gly Leu
                  5                  10                  15
Val Asn Gly Asn Leu Pro Leu Ser Ile Thr Leu Glu Gly Ser Asn Phe
             20                  25                  30
Leu Ala Asn Gly His Pro Phe Leu Thr Glu Val Pro Glu Asn Ile Ile
         35                  40                  45
Val Thr Pro Ser Pro Ile Asp Ala Lys Ser Ser Lys Asn Asn Glu Asp
     50                  55                  60
Asp Asp Val Val Gly Cys Phe Val Gly Phe His Ala Asp Glu Pro Arg
65                   70                  75                  80
Ser Arg His Val Ala Ser Leu Gly Lys Leu Arg Gly Ile Lys Phe Met
                 85                  90                  95
Ser Ile Phe Arg Phe Lys Val Trp Trp Thr Thr His Trp Val Gly Ser
            100                 105                 110
Asn Gly His Glu Leu Glu His Glu Thr Gln Met Met Leu Leu Asp Lys
        115                 120                 125
Asn Asp Gln Leu Gly Arg Pro Phe Val Leu Ile Leu Pro Ile Leu Gln
    130                 135                 140
Ala Ser Phe Arg Ala Ser Leu Gln Pro Gly Leu Asp Asp Tyr Val Asp
145                 150                 155                 160
Val Cys Met Glu Ser Gly Ser Thr Arg Val Cys Gly Ser Ser Phe Gly
                165                 170                 175
Ser Cys Leu Tyr Val His Val Gly His Asp Pro Tyr Gln Leu Leu Arg
            180                 185                 190
Glu Ala Thr Lys Val Val Arg Met His Leu Gly Thr Phe Lys Leu Leu
        195                 200                 205
Glu Glu Lys Thr Ala Pro Val Ile Ile Asp Lys Phe Gly Trp Cys Thr
    210                 215                 220
Trp Asp Ala Phe Tyr Leu Lys Val His Pro Ser Gly Val Trp Glu Gly
225                 230                 235                 240
Val Lys Gly Leu Val Glu Gly Gly Cys Pro Pro Gly Met Val Leu Ile
                245                 250                 255
Asp Asp Gly Trp Gln Ala Ile Cys His Asp Glu Asp Pro Ile Thr Asp
            260                 265                 270
Gln Glu Gly Met Lys Arg Thr Ser Ala Gly Glu Gln Met Pro Cys Arg
        275                 280                 285
Leu Val Lys Leu Glu Glu Asn Tyr Lys Phe Arg Gln Tyr Cys Ser Gly
    290                 295                 300
Lys Asp Ser Glu Lys Gly Met Gly Ala Phe Val Arg Asp Leu Lys Glu
305                 310                 315                 320
Gln Phe Arg Ser Val Glu Gln Val Tyr Val Trp His Ala Leu Cys Gly
                325                 330                 335
Tyr Trp Gly Gly Val Arg Pro Lys Val Pro Gly Met Pro Gln Ala Lys
            340                 345                 350
Val Val Thr Pro Lys Leu Ser Asn Gly Leu Lys Leu Thr Met Lys Asp
        355                 360                 365
Leu Ala Val Asp Lys Ile Val Ser Asn Gly Val Gly Leu Val Pro Pro
    370                 375                 380
His Leu Ala His Leu Leu Tyr Glu Gly Leu His Ser Arg Leu Glu Ser
385                 390                 395                 400
Ala GlyIle Asp Gly Val Lys Val Asp Val Ile His Leu Leu Glu Met
               405                 410                     415
Leu Ser Glu Glu Tyr Gly Gly Arg Val Glu Leu Ala Lys Ala Tyr Tyr
            420                 425                 430
Lys Ala Leu Thr Ala Ser Val Lys Lys His Phe Lys Gly Asn Gly Val
        435                 440                 445
Ile Ala Ser Met Glu His Cys Asn Asp Phe Phe Leu Leu Gly Thr Glu
    450                 455                 460
 Ala Ile Ala Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr Asp Pro
 465                 470                 475                 480
 Ser Gly Asp Pro Asn Gly Thr Tyr Trp Leu Gln Gly Cys His Met Val
                 485                 490                 495
 His Cys Ala Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln Pro Asp
             500                 505                 510
 Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His Ala Ala
         515                 520                 525
 Ser Arg Ala Ile Ser Gly Gly Pro Val Tyr Val Ser Asp Cys Val Gly
     530                 535                 540
 Lys His Asn Phe Lys Leu Leu Lys Ser Leu Ala Leu Pro Asp Gly Thr
 545                 550                 555                 560
 Ile Leu Arg Cys Gln His Tyr Ala Leu Pro Thr Arg Asp Cys Leu Phe
                 565                 570                 575
 Glu Asp Pro Leu His Asp Gly Lys Thr Met Leu Lys Ile Trp Asn Leu
             580                 585                 590
 Asn Lys Tyr Thr Gly Val Leu Gly Leu Phe Asn Cys Gln Gly Gly Gly
         595                 600                 605
 Trp Cys Pro Val Thr Arg Arg Asn Lys Ser Ala Ser Glu Phe Ser Gln
     610                 615                 620
Thr Val Thr Cys Leu Ala Ser Pro Gln Asp Ile Glu Trp Ser Asn Gly
625                 630                 635                 640
Lys Ser Pro Ile Cys Ile Lys Gly Met Asn Val Phe Ala Val Tyr Leu
                645                 650                 655
Phe Lys Asp His Lys Leu Lys Leu Met Lys Ala Ser Glu Lys Leu Glu
            660                 665                 670
Val Ser Leu Glu Pro Phe Thr Phe Glu Leu Leu Thr Val Ser Pro Val
        675                 680                 685
Ile Val Leu Ser Lys Lys Leu Ile Gln Phe Ala Pro Ile Gly Leu Val
    690                 695                 700
Asn Met Leu Asn Thr Gly Gly Ala Ile Gln Ser Met Glu Phe Asp Asn
705                 710                 715                 720
His Ile Asp Val Val Lys Ile Gly Val Arg Gly Cys Gly Glu Met Lys
                725                 730                 735
Val Phe Ala Ser Glu Lys Pro Val Ser Cys Lys Leu Asp Gly Val Val
              740                 745                 750
Val Lys Phe Asp Tyr Glu Asp Lys Met Leu Arg Val Gln Val Pro Trp
        755                 760                 765
Pro Ser Ala Ser Lys Leu Ser Met Val Glu Phe Leu Phe Stop
    770                 775                 780(2)SEQ ID NO:4的信息
  (i)序列特征:
     (A)长度:2598个碱基对
     (B)类型:核酸
     (C)链型:单链
     (D)拓扑:线型
  (ii)分子类型:cDNA到mRNA
  (ix)特征:
     (A)名称/关键词:肽
     (B)位置:62到2407
     (C)鉴定方法:实验
  (xi)SEQ ID NO:4的序列描述:
CCAAACCATA GCAAACCTAA GCACCAAACC TCTTTCTTTC AAGATCCTTG AATTCAGTCC     60
C ATG GCT CCA AGC ATA AGC AAA ACT GTG GAA CTA AAT TCA TTT GGT        106
  Met Ala Pro Ser Ile Ser Lys Thr Val Glu Leu Asn Ser Phe Gly
                    5                  10                  15
CTT GTC AAC GGT AAT TTG CCT TTG TCC ATA ACC CTA GAA GGA TCA AAT      154
Leu Val Asn Gly Asn Leu Pro Leu Ser Ile Thr Leu Glu Gly Ser Asn
                 20                  25                  30
TTC CTC GCC AAC GGC CAC CCT TTT CTC ACG GAA GTT CCC GAA AAC ATA      202
Phe Leu Ala Asn Gly His Pro Phe Leu Thr Glu Val Pro Glu Asn Ile
             35                  40                  45
ATA GTC ACC CCT TCA CCC ATC GAC GCC AAG AGT AGT AAG AAC AAC GAG      250
Ile Val Thr Pro Ser Pro Ile Asp Ala Lys Ser Ser Lys Asn Asn Glu
         50                  55                  60
GAC GAC GAC GTC GTA GGT TGC TTC GTG GGC TTC CAC GCG GAC GAG CCC      298
Asp Asp Asp Val Val Gly Cys Phe Val Gly Phe His Ala Asp Glu Pro
     65                  70                  75
AGA AGC CGA CAC GTG GCT TCC CTG GGG AAG CTC AGA GGA ATA AAA TTC      346
Arg Ser Arg His Val Ala Ser Leu Gly Lys Leu Arg Gly Ile Lys Phe
 80                  85                  90                  95
ATG AGC ATA TTC CGG TTT AAG GTG TGG TGG ACC ACT CAC TGG GTC GGT      394
Met Ser Ile Phe Arg Phe Lys Val Trp Trp Thr Thr His Trp Val Gly
                100                 105                 110
AGC AAC GGA CAC GAA CTG GAG CAC GAG ACA CAG ATG ATG CTT CTC GAC      442
Ser Asn Gly His Glu Leu Glu His Glu Thr Gln Met Met Leu Leu Asp
            115                 120                 125
AAA AAC GAC CAG CTC GGA CGC CCC TTT GTG TTG ATT CTC CCG ATC CTC      490
Lys Asn Asp Gln Leu Gly Arg Pro Phe Val Leu Ile Leu Pro Ile Leu
        130                 135                 140
CAA GCC TCG TTC CGA GCC TCC CTG CAA CCC GGT TTG GAT GAT TAC GTG      538
Gln Ala Ser Phe Arg Ala Ser Leu Gln Pro Gly Leu Asp Asp Tyr Val
    145                 150                 155
GAC GTT TGC ATG GAG AGC GGG TCG ACA CGT GTC TGT GGC TCC AGC TTC      586
Asp Val Cys Met Glu Ser Gly Ser Thr Arg Val Cys Gly Ser Ser Phe
160                 165                 170                 175
GGG AGC TGC TTA TAC GTC CAC GTT GGC CAT GAC CCG TAT CAG TTG CTT      634
Gly Ser Cys Leu Tyr Val His Val Gly His Asp Pro Tyr Gln Leu Leu
                180                 185                 190
AGA GAA GCA ACT AAA GTC GTT AGG ATG CAT TTG GGG ACG TTC AAG CTT      682
Arg Glu Ala Thr Lys Val Val Arg Met His Leu Gly Thr Phe Lys Leu
            195                 200                 205
CTC GAG GAG AAA ACC GCG CCA GTG ATC ATA GAC AAG TTT GGT TGG TGT      730
Leu Glu Glu Lys Thr Ala Pro Val Ile Ile Asp Lys Phe Gly Trp Cys
        210                 215                 220
ACA TGG GAC GCG TTT TAC TTG AAG GTG CAT CCC TCA GGT GTG TGG GAA      778
Thr Trp Asp Ala Phe Tyr Leu Lys Val His Pro Ser Gly Val Trp Glu
    225                 230                 235
GGG GTG AAA GGG TTG GTG GAG GGA GGG TGC CCT CCA GGG ATG GTC CTA      826
Gly Val Lys Gly Leu Val Glu Gly Gly Cys Pro Pro Gly Met Val Leu
240                 245                 250                 255
ATC GAC GAC GGG TGG CAA GCC ATT TGT CAC GAC GAG GAC CCC ATA ACG      874
Ile Asp Asp Gly Trp Gln Ala Ile Cys His Asp Glu Asp Pro Ile Thr
                260                 265                 270
GAC CAA GAG GGT ATG AAG CGA ACC TCC GCA GGG GAG CAA ATG CCA TGC      922
Asp Gln Glu Gly Met Lys Arg Thr Ser Ala Gly Glu Gln Met Pro Cys
            275                 280                 285
AGG TTG GTG AAG TTG GAG GAA AAT TAC AAG TTC AGA CAG TAT TGT AGT      970
Arg Leu Val Lys Leu Glu Glu Asn Tyr Lys Phe Arg Gln Tyr Cys Ser
        290                 295                 300
GGA AAG GAT TCT GAG AAG GGT ATG GGT GCC TTT GTT AGG GAC TTG AAG      1018
Gly Lys Asp Ser Glu Lys Gly Met Gly Ala Phe Val Arg Asp Leu Lys
    305                 310                 315
GAA CAG TTT AGG AGC GTG GAG CAG GTG TAT GTG TGG CAC GCG CTT TGT      1066
Glu Gln Phe Arg Ser Val Glu Gln Val Tyr Val Trp His Ala Leu Cys
320                 325                 330                 335
GGG TAT TGG GGT GGG GTC AGA CCC AAG GTT CCG GGC ATG CCC CAG GCT      1114
Gly Tyr Trp Gly Gly Val Arg Pro Lys Val Pro Gly Met Pro Gln Ala
                340                 345                 350
AAG GTT GTC ACT CCG AAG CTG TCC AAT GGA CTA AAA TTG ACA ATG AAG      1162
Lys Val Val Thr Pro Lys Leu Ser Asn Gly Leu Lys Leu Thr Met Lys
            355                 360                 365
GAT TTA GCG GTG GAT AAG ATC GTC AGT AAC GGA GTI GGA CTG GTG CCA      1210
Asp Leu Ala Val Asp Lys Ile Val Ser Asn Gly Val Gly Leu Val Pro
        370                 375                 380
CCA CAC CTG GCT CAC CIT TTG TAC GAG GGG CTC CAC TCC CGT TTG GAA      1258
Pro His Leu Ala His Leu Leu Tyr Glu Gly Leu His Ser Arg Leu Glu
    385                 390                 395
TCT GCG GGT ATT GAC GGT GTT AAG GTT GAC GTT ATA CAC TTG CTC GAG      1306
Ser Ala Gly Ile Asp Gly Val Lys Val Asp Val Ile His Leu Leu Glu
400                 405                 410                 415
ATG CTA TCC GAG GAA TAC GGT GGC CGT GTT GAG CTA GCC AAA GCT TAT      1354
Met Leu Ser Glu Glu Tyr Gly Gly Arg Val Glu Leu Ala Lys Ala Tyr
                420                 425                 430
TAC AAA GCG CTC ACT GCT TCG GTG AAG AAG CAT TTC AAA GGC AAT GGG      1402
Tyr Lys Ala Leu Thr Ala Ser Val Lys Lys His Phe Lys Gly Asn Gly
            435                 440                 445
GTC ATT GCG AGC ATG GAG CAT TGT AAT GAC TTC TTT CTC CTT GGT ACC      1450
Val Ile Ala Ser Met Glu His Cys Asn Asp Phe Phe Leu Leu Gly Thr
        450                 455                 460
GAA GCC ATA GCC CTT GGG CGC GTA GGA GAT GAT TTT TGG TGC ACT GAT      1498
Glu Ala Ile Ala Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr Asp
    465                 470                 475
CCC TCT GGA GAT CCA AAT GGC ACG TAT TGG CTC CAA GGG TGT CAC ATG      1546
Pro Ser Gly Asp Pro Asn Gly Thr Tyr Trp Leu Gln Gly Cys His Met
480                 485                 490                 495
GTG CAC TGT GCC TAC AAC AGC TTG TGG ATG GGG AAT TTT ATT CAG CCG      1594
Val His Cys Ala Tyr Asn Ser Leu Trp Met Gly Asn Phe Ile Gln Pro
                   500                 505                 510
GAT TGG GAC ATG TTC CAG TCC ACT CAC CCT TGT GCC GAA TTC CAT GCA      1642
Asp Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His Ala
            515                 520                 525
GCC TCT AGG GCC ATC TCT GGT GGA CCA GTT TAC GTT AGT GAT TGT GTT      1690
Ala Ser Arg Ala Ile Ser Gly Gly Pro Val Tyr Val Ser Asp Cys Val
        530                 535                 540
GGA AAG CAC AAC TTC AAG TTG CTC AAG AGC CTC GCT TTG CCT GAT GGG      1738
Gly Lys His Asn Phe Lys Leu Leu Lys Ser Leu Ala Leu Pro Asp Gly
    545                 550                 555
ACG ATT TTG CGT TGT CAA CAC TAT GCA CTC CCC ACA CGA GAC TGT TTG      1786
Thr Ile Leu Arg Cys Gln His Tyr Ala Leu Pro Thr Arg Asp Cys Leu
560                 565                 570                 575
TTT GAA GAC CCC TTG CAT GAT GGG AAG ACA ATG CTC AAA ATT TGG AAT      1834
Phe Glu Asp Pro Leu His Asp Gly Lys Thr Met Leu Lys Ile Trp Asn
                580                 585                 590
CTC AAC AAA TAT ACA GGT GTT TTG GGT CTA TTT AAT TGC CAA GGA GGT      1882
Leu Asn Lys Tyr Thr Gly Val Leu Gly Leu Phe Asn Cys Gln Gly Gly
            595                 600                 605
GGG TGG TGT CCC GTA ACT AGG AGA AAC AAG AGT GCC TCT GAA TTT TCA      1930
Gly Trp Cys Pro Val Thr Arg Arg Asn Lys Ser Ala Ser Glu Phe Ser
        610                 615                 620
CAA ACT GTG ACA TGC TTA GCG AGT CCT CAA GAC ATT GAA TGG AGC AAT      1978
Gln Thr Val Thr Cys Leu Ala Ser Pro Gln Asp Ile Glu Trp Ser Asn
    625                 630                 635
GGG AAA AGC CCA ATA TGC ATA AAA GGG ATG AAT GTG TTT GCT GTA TAT      2026
Gly Lys Ser Pro Ile Cys Ile Lys Gly Met Asn Val Phe Ala Val Tyr
640                 645                 650                 655
TTG TTC AAG GAC CAC AAA CTA AAG CTC ATG AAG GCA TCA GAG AAA TTG      2074
Leu Phe Lys Asp His Lys Leu Lys Leu Met Lys Ala Ser Glu Lys Leu
                660                 665                 670
GAA GTT TCA CTT GAG CCA TTT ACT TTT GAG CTA TTG ACA GTG TCT CCA      2122
Glu Val Ser Leu Glu Pro Phe Thr Phe Glu Leu Leu Thr Val Ser Pro
            675                 680                 685
GTG ATT GTG CTG TCA AAA AAG TTA ATT CAA TTT GCT CCA ATT GGA TTA      2170
Val Ile Val Leu Ser Lys Lys Leu Ile Gln Phe Ala Pro Ile Gly Leu
        690                 695                 700
GTG AAC ATG CTT AAC ACT GGT GGT GCC ATT CAG TCC ATG GAG TTT GAC      2218
Val Asn Met Leu Asn Thr Gly Gly Ala Ile Gln Ser Met Glu Phe Asp
    705                 710                 715
AAC CAC ATA GAT GTG GTC AAA ATT GGG GTT AGG GGT TGT GGG GAG ATG      2266
Asn His Ile Asp Val Val Lys Ile Gly Val Arg Gly Cys Gly Glu Met
720                 725                 730                 735
AAG GTG TTT GCA TCA GAG AAA CCA GTT AGT TGC AAA CTA GAT GGG GTA      2314
Lys Val Phe Ala Ser Glu Lys Pro Val Ser Cys Lys Leu Asp Gly Val
                740                 745                 750
GTT GTA AAA TTT GAT TAT GAG GAT AAA ATG CTG AGA GTG CAA GTT CCC      2362
Val Val Lys Phe Asp Tyr Glu Asp Lys Met Leu Arg Val Gln Val Pro
            755                 760                 765
TGG CCT AGT GCT TCA AAA TTG TCA ATG GTT GAG TTT TTA TTT TGA TCCCT    2412
Trp Pro Ser Ala Ser Lys Leu Ser Met Val Glu Phe Leu Phe Stop
                770                 775                 780
GAAGGTGAAT TTGGGATACT ATGATGTTTG ACTCTCTTTT TAAGTAATAA GAGTCATATT    2472
TTTCTGTTGT AAAAAAAAAA AAAAAA                                         2498
(2)SEQ ID NO:5的信息
   (i)序列特征:
      (A)长度:587个氨基酸
      (B)类型:氨基酸
      (D)拓扑:线型
   (ii)分子类型:肽
   (vi)原始来源:
      (A)生物:Japanese artichoke(Stachys sieboldii)
      (F)组织类型:叶
   (xi)SEQ ID NO:5的序列描述:
Thr Asn Gly Ser Asp Leu Glu Arg Glu Thr Gln Ile Val Val Leu Asp
  1               5                  10                  15
Lys Ser Asp Asp Arg Pro Tyr Ile Val Leu Leu Pro Leu Ile Glu Gly
             20                  25                  30
Gln Phe Arg Ala Ser Leu Gln Pro Gly Val Asp Asp Phe Ile Asp Ile
         35                  40                  45
Cys Val Glu Ser Gly Ser Thr Lys Val Asn Glu Ser Ser Phe Arg Ala
     50                  55                  60
Ser Leu Tyr Met His Ala Gly Asp Asp Pro Phe Thr Leu Val Lys Asp
 65                  70                  75                  80
Ala Val Lys Val Ala Arg His His Leu Gly Thr Phe Arg Leu Leu Glu
                 85                  90                  95
Glu Lys Thr Pro Pro Gly Ile Val Asp Lys Phe Gly Trp Cys Thr Trp
            100                 105                 110
Asp Ala Phe Tyr Leu Asn Val Gln Pro His Gly Val Met Glu Gly Val
        115                 120                 125
Gln Gly Leu Val Asp Gly Gly Cys Pro Pro Gly Leu Val Leu Ile Asp
    130                 135                 140
Asp Gly Trp Gln Ser Ile Cys His Asp Asn Asp Ala Leu Thr Thr Glu
145                 150                 155                 160
Gly Met Gly Arg Thr Ser Ala Gly Glu Gln Met Pro Cys Arg Leu Ile
                165                 170                 175
Lys Phe Glu Glu Asn Tyr Lys Phe Arg Glu Tyr Glu Ser Pro Asn Lys
            180                 185                 190
Thr Gly Pro Gly Pro Asn Thr Gly Met Gly Ala Phe Ile Arg Asp Met
        195                 200                 205
Lys Asp Asn Phe Lys Ser Val Asp Tyr Val Tyr Val Trp His Ala Leu
    210                 215                 220
Cys Gly Tyr Trp Gly Gly Leu Arg Pro Asn Val Pro Gly Leu Pro Glu
225                 230                 235                 240
Ala Lys Leu Ile Glu Pro Lys Leu Thr Pro Gly Leu Lys Thr Thr Met
                245                 250                 255
Glu Asp Leu Ala Val Asp Lys Ile Val Asn Asn Gly Val Gly Leu Val
            260                 265                 270
Pro Pro Glu Phe Val Glu Gln Met Tyr Glu Gly Leu His Ser His Leu
        275                 280                 285
Glu Ser Val Gly Ile Asp Gly Val Lys Val Asp Val Ile His Leu Leu
    290                 295                 300
Glu Met Leu Cys Glu Asp Tyr Gly Gly Arg Val Asp Leu Ala Lys Ala
305                 310                 315                 320
Tyr Tyr Lys Ala Leu Ser Ser Ser Val Asn Asn His Phe Asn Gly Asn
                325                 330                 335
Gly Val Ile Ala Gly Leu Glu His Cys Asn Asp Phe Met Phe Leu Gly
            340                 345                 350
Thr Glu Ala Ile Thr Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr
        355                 360                 365
Asp Pro Ser Gly Asp Pro Asn Gly Thr Phe Trp Leu Gln Gly Cys His
    370                 375                 380
Met Val His Cys Ala Tyr Asn Ser Ile Trp Met Gly Asn Phe Ile His
385                 390                 395                 400
Pro Asp Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe His
                405                 410                 415
Ala Ala Ser Arg Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser
            420                 425                 430
Val Gly Lys His Asn Phe Glu Leu Leu Arg Ser Leu Val Leu Pro Asp
        435                 440                 445
Gly Ser Ile Leu Arg Cys Asp Tyr Tyr Ala Leu Pro Thr Arg Asp Cys
    450                 455                 460
Leu Phe Glu Asp Pro Leu His Asn Gly Lys Thr Met Leu Lys Ile Trp
465                 470                 475                 480
Asn Tyr Asn Lys Phe Thr Gly Val Val Gly Thr Phe Asn Cys Gln Gly
                485                 490                 495
Gly Gly Trp Ser Arg Glu Val Arg Arg Asn Gln Cys Ala Ala Glu Tyr
            500                 505                 510
Ser His Ala Val Ser Ser Ser Ala Gly Pro Ser Asp Ile Glu Trp Lys
        515                 520                 525
Gln Gly Thr Ser Pro Ile Asp Val Asp Gly Val Lys Thr Phe Ala Leu
    530                 535                 540
Tyr Leu Phe His Glu Lys Lys Leu Val Leu Ser Lys Pro Ser Asp Lys
545                 550                 555                 560
Ile Asp Ile Thr Leu Glu Pro Phe Asp Phe Glu Leu Ile Thr Val Ser
                565                 570                 575
pro Val Iys Thr Leu Ala Asn Cys Thr Val Gln
            580                 585
(2)SEQ ID NO:6的信息
   (i)序列特征:
      (A)长度:1762个碱基对
      (B)类型:核酸
      (C)链型:单链
      (D)拓扑:线型
   (ii)分子类型:cDNA到mRNA
   (ix)特征:
      (A)名称/关键词:肽
      (B)位置:2到1762
      (C)鉴定方法:实验
   (xi)SEQ ID NO:6的序列描述:
G ACA AAC GGG TCG GAT CTT GAG CGG GAA ACT CAA ATA GTC GTG CTC         46
  Thr Asn Gly Ser Asp Leu Glu Arg Glu Thr Gln Ile Val Val Leu
    1               5                  10                  15
GAC AAG TCC GAC GAC AGG CCC TAC ATC GTG CTG CTT CCG CTC ATC GAG       94
Asp Lys Ser Asp Asp Arg Pro Tyr Ile Val Leu Leu Pro Leu Ile Glu
                 20                  25                  30
GGG CAG TTT CGG GCT TCC CTT CAG CCC GGT GTG GAT GAT TTT ATC GAT      142
Gly Gln Phe Arg Ala Ser Leu Gln Pro Gly Val Asp Asp Phe Ile Asp
             35                  40                  45
ATT TGT GTC GAA AGC GGG TCA ACC AAG GTC AAC GAG TCC TCG TTC CGT      190
Ile Cys Val Glu Ser Gly Ser Thr Lys Val Asn Glu Ser Ser Phe Arg
         50                  55                  60
GCT TCG CTC TAC ATG CAC GCC GGT GAT GAC CCT TTT ACC CTG GTG AAG      238
Ala Ser Leu Tyr Met His Ala Gly Asp Asp Pro Phe Thr Leu Val Lys
    65                  70                  75
GAC GCC GTG AAG GTG GCG CGC CAC CAC CTC GGG ACG TTC AGG CTG CTG      286
Asp Ala Val Lys Val Ala Arg His His Leu Gly Thr Phe Arg Leu Leu
 80                  85                  90                  95
GAG GAG AAA ACT CCG CCG GGG ATC GTC GAC AAA TTC GGG TGG TGC ACG      334
Glu Glu Lys Thr Pro Pro Gly Ile Val Asp Lys Phe Gly Trp Cys Thr
                100                 105                 110
TGG GAT GCG TTC TAC CTC AAC GTC CAG CCC CAC GGC GTT ATG GAG GGC      382
Trp Asp Ala Phe Tyr Leu Asn Val Gln Pro His Gly Val Met Glu Gly
            115                 120                 125
GTG CAG GGG CTG GTT GAC GGC GGA TGT CCG CCG GGG CTG GTG TTG ATC      430
Val Gln Gly Leu Val Asp Gly Gly Cys Pro Pro Gly Leu Val Leu Ile
        130                 135                 140
GAC GAC GGG TGG CAG TCC ATT TGT CAC GAC AAC GAC GCG CTC ACC ACC      478
Asp Asp Gly Trp Gln Ser Ile Cys His Asp Asn Asp Ala Leu Thr Thr
    145                 150                 155
GAG GGG ATG GGG AGA ACC TCC GCC GGA GAG CAA ATG CCC TGC AGG TTG      526
Glu Gly Met Gly Arg Thr Ser Ala Gly Glu Gln Met Pro Cys Arg Leu
160                 165                 170                 175
ATC AAG TTT GAG GAG AAT TAC AAG TTC AGG GAG TAC GAG AGC CCG AAT      574
Ile Lys Phe Glu Glu Asn Tyr Lys Phe Arg Glu Tyr Glu Ser Pro Asn
                180                 185                 190
AAA ACT GGG CCG GGC CCG AAT ACG GGG ATG GGG GCC TTT ATT CGT GAC      622
Lys Thr Gly Pro Gly Pro Asn Thr Gly Met Gly Ala Phe Ile Arg Asp
            195                 200                 205
ATG AAG GAC AAT TTC AAG AGT GTG GAC TAC GTG TAC GTG TGG CAT GCG      670
Met Lys Asp Asn Phe Lys Ser Val Asp Tyr Val Tyr Val Trp His Ala
        210                 215                 220
TTG TGT GGT TAT TGG GGC GGG CTC AGG CCC AAT GTT CCG GGC CTG CCC      718
 Leu Cys Gly Tyr Trp Gly Gly Leu Arg Pro Asn Val Pro Gly Leu Pro
     225                 230                 235
GAG GCT AAG CTC ATT GAG CCC AAA CTG ACT CCT GGG CTT AAG ACC ACC      766
Glu Ala Lys Leu Ile Glu Pro Lys Leu Thr Pro Gly Leu Lys Thr Thr
240                 245                 250                 255
ATG GAA GAT TTG GCT GTT GAT AAG ATT GTC AAC AAT GGC GTG GGT CTG      814
Met Glu Asp Leu Ala Val Asp Lys Ile Val Asn Asn Gly Val Gly Leu
                260                 265                 270
GTC CCA CCG GAG TTT GTT GAA CAA ATG TAT GAA GGA TTA CAT TCA CAT      862
Val Pro Pro Glu Phe Val Glu Gln Met Tyr Glu Gly Leu His Ser His
            275                 280                 285
CTC GAA TCT GTG GGG ATT GAT GGA GTC AAA GTT GAC GTC ATC CAT TTG      910
Leu Glu Ser Val Gly Ile Asp Gly Val Lys Val Asp Val Ile His Leu
        290                 295                 300
TTG GAA ATG TTG TGT GAA GAC TAT GGT GGG AGA GTG GAC TTA GCC AAG      958
Leu Glu Met Leu Cys Glu Asp Tyr Gly Gly Arg Val Asp Leu Ala Lys
    305                 310                 315
GCT TAT TAC AAG GCC TTA TCA AGC TCA GTT AAC AAC CAC TTC AAC GGC      1006
Ala Tyr Tyr Lys Ala Leu Ser Ser Ser Val Asn Asn His Phe Asn Gly
320                 325                 330                 335
AAC GGC GTC ATC GCT GGC CTG GAG CAC TGC AAT GAC TTC ATG TTT CTC      1054
Asn Gly Val Ile Ala Gly Leu Glu His Cys Asn Asp Phe Met Phe Leu
                340                 345                 350
GGA ACC GAG GCC ATT ACC TTG GGT CGT GTC GGG GAT GAT TTT TGG TGC      1102
Gly Thr Glu Ala Ile Thr Leu Gly Arg Val Gly Asp Asp Phe Trp Cys
            355                 360                 365
ACT GAT CCA TCT GGA GAT CCC AAT GGC ACG TTC TGG TTG CAA GGG TGT      1150
Thr Asp Pro Ser Gly Asp Pro Asn Gly Thr Phe Trp Leu Gln Gly Cys
        370                 375                 380
CAC ATG GTG CAC TGC GCC TAC AAC AGC ATA TGG ATG GGT AAT TTC ATC      1198
His Met Val His Cys Ala Tyr Asn Ser Ile Trp Met Gly Asn Phe Ile
    385                 390                 395
CAC CCT GAT TGG GAC ATG TTT CAA TCG ACT CAC CCT TGC GCT GAA TTC      1246
His Pro Asp Trp Asp Met Phe Gln Ser Thr His Pro Cys Ala Glu Phe
400                 405                 410                 415
CAC GCT GCC TCA CGA GCC ATC TCC GGC GGG CCC ATT TAC GTC AGT GAC      1294
His Ala Ala Ser Arg Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp
                420                 425                 430
TCG GTC GGA AAG CAC AAC TTC GAG CTC CTT AGG AGC CTC GTT CTT CCC      1342
Ser Val Gly Lys His Asn Phe Glu Leu Leu Arg Ser Leu Val Leu Pro
            435                 440                 445
GAT GGC TCC ATC CTC CGT TGT GAT TAC TAC GCG CTT CCG ACT CGC GAT      1390
Asp Gly Ser Ile Leu Arg Cys Asp Tyr Tyr Ala Leu Pro Thr Arg Asp
        450                 455                 460
TGC CTC TTT GAA GAT CCA CTT CAC AAT GGC AAG ACT ATG CTC AAA ATT      1438
Cys Leu Phe Glu Asp Pro Leu His Asn Gly Lys Thr Met Leu Lys Ile
    465                 470                 475
TGG AAT TAT AAC AAG TTC ACC GGA GTT GTC GGA ACT TTC AAC TGC CAA      1486
Trp Asn Tyr Asn Lys Phe Thr Gly Val Val Gly Thr Phe Asn Cys Gln
480                 485                 490                 495
GGT GGC GGG TGG AGC CGG GAA GTG CGT CGC AAC CAA TGC GCT GCC GAG      1534
Gly Gly Gly Trp Ser Arg Glu Val Arg Arg Asn Gln Cys Ala Ala Glu
                500                 505                 510
TAT TCC CAC GCC GTC TCC TCT AGC GCT GGT CCG AGT GAC ATT GAG TGG      1582
Tyr Ser His Ala Val Ser Ser Ser Ala Gly Pro Ser Asp Ile Glu Trp
            515                 520                 525
AAG CAA GGA ACG AGT CCG ATC GAC GTC GAC GGC GTC AAA ACA TTC GCG      1630
Lys Gln Gly Thr Ser Pro Ile Asp Val Asp Gly Val Lys Thr Phe Ala
        530                 535                 540
TTG TAC CTA TTC CAC GAG AAG AAA CTC GTC CTT TCT AAG CCA TCA GAC      1678
Leu Tyr Leu Phe His Glu Lys Lys Leu Val Leu Ser Lys Pro Ser Asp
    545                 550                 555
AAA ATC GAC ATC ACG CTT GAG CCC TTC GAT TTT GAG CTG ATA ACC GTT      1726
Lys Ile Asp Ile Thr Leu Glu Pro Phe Asp Phe Glu Leu Ile Thr Val
560                 565                 570                 575
TCT CCA GTC AAA ACT CTA GCC AAT TGC ACC GTC CAA                      1762
Ser Pro Val Lys Thr Leu Ala Asn Cys Thr Val Gln
                580                 585
(2)SEQ ID NO:7的信息
   (i)序列特征:
      (A)长度:271个氨基酸
      (B)类型:氨基酸
      (D)拓扑:线型
   (ii)分子类型:肽
   (vi)原始来源:
      (A)生物:玉米(Zea mays L.)
      (B)品种:Pioneer 3358
      (F)组织类型:叶
   (xi)SEQ ID NO:7的序列描述:
Gln Ser Thr His Pro Cys Ala Ala Phe His Ala Ala Ser Arg Ala Ile
                  5                  10                  15
Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser Val Gly Gln His Asp Phe
             20                  25                  30
Ala Leu Leu Arg Arg Leu Ala Leu Pro Asp Gly Thr Val Leu Arg Cys
         35                  40                  45
Glu Gly His Ala Leu Pro Thr Arg Asp Cys Leu Phe Ala Asp Pro Leu
     50                  55                  60
His Asp Gly Arg Thr Val Leu Lys Ile Trp Asn Val Asn Arg Phe Ala
 65                  70                  75                  80
Gly Val Val Gly Ala Phe Asn Cys Gln Gly Gly Gly Trp Ser Pro Glu
                 85                  90                  95
Ala Arg Arg Asn Lys Cys Phe Ser Glu Phe Ser Val Pro Leu Ala Ala
            100                 105                 110
Arg Ala Ser Pro Ser Asp Val Glu Trp Lys Ser Gly Lys Ala Gly Pro
        115                 120                 125
Gly Val Ser Val Lys Asp Val Ser Gln Phe Ala Val Tyr Ala Val Glu
    130                 135                 140
Ala Arg Thr Leu Gln Leu Leu Arg Pro Asp Glu Gly Val Asp Leu Thr
145                 150                 155                 160
Leu Gln Pro Phe Thr Tyr Glu Leu Phe Val Val Ala Pro Val Arg Val
                165                 170                 175
Ile Ser His Glu Arg Ala Ile Lys Phe Ala Pro Ile Gly Leu Ala Asn
            180                 185                 190
Met Leu Asn Thr Ala Gly Ala Val Gln Ala Phe Glu Ala Lys Lys Asp
        195                 200                 205
Ala Ser Gly Val Thr Ala Glu Val Phe Val Lys Gly Ala Gly Glu Leu
    210                 215                 220
Val Ala Tyr Ser Ser Ala Thr Pro Arg Leu Cys Lys Val Asn Gly Asp
225                 230                 235                 240
Glu Ala Glu Phe Thr Tyr Lys Asp Gly Val Val Thr Val Asp Val Pro
                245                 250                 255
Trp Ser Gly Ser Ser Ser Lys Leu Cys Cys Val Gln Tyr Val Tyr Stop
            260                 265                 270
(2)SEQ ID NO:8的信息
   (i)序列特征:
      (A)长度:996个碱基对
      (B)类型:核酸
      (C)链型:单链
      (D)拓扑:线型
   (ii)分子类型:从cDNA到mRNA
   (ix)特征:
      (A)名称/关键词:肽
      (B)位置:2到817
      (C)鉴定方法:实验
   (xi)SEQ ID NO:8的序列描述:
C CAG TCC ACG CAC CCC TGC GCC GCC TTC CAC GCC GCG TCC CGC GCC      46
  Gln Ser Thr His Pro Cys Ala Ala Phe His Ala Ala Ser Arg Ala
                    5                  10                  15
ATC TCC GGC GGG CCC ATC TAC GTC AGC GAC TCG GTG GGG CAG CAC GAC    94
Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser Val Gly Gln His Asp
                 20                  25                  30
TTC GCG CTG CTC CGC CGC CTG GCG CTC CCC GAC GGC ACC GTC CTC CGG      142
Phe Ala Leu Leu Arg Arg Leu Ala Leu Pro Asp Gly Thr Val Leu A
             35                  40                  45
TGC GAG GGC CAC GCG CTG CCC ACG CGC GAC TGC CTC TTC GCC GAC CCG      190
Cys Glu Gly His Ala Leu Pro Thr Arg Asp Cys Leu Phe Ala Asp Pro
         50                  55                  60
CTC CAC GAC GGC CGG ACC GTG CTC AAG ATC TGG AAC GTG AAC CGC TTC      238
Leu His Asp Gly Arg Thr Val Leu Lys Ile Trp Asn Val Asn Arg Phe
     65                  70                  75
GCC GGC GTC GTC GGC GCC TTC AAC TGC CAG GGC GGC GGG TGG AGC CCC      286
Ala Gly Val Val Gly Ala Phe Asn Cys Gln Gly Gly Gly Trp Ser Pro
 80                  85                  90                  95
GAG GCG CGG CGG AAC AAG TGC TTC TCG GAG TTC TCC GTG CCC CTG GCC      334
Glu Ala Arg Arg Asn Lys Cys Phe Ser Glu Phe Ser Val Pro Leu Ala
                100                 105                 110
GCG CGC GCC TCG CCG TCC GAC GTC GAG TGG AAG AGC GGC AAG GCG GGG      382
Ala Arg Ala Ser Pro Ser Asp Val Glu Trp Lys Ser Gly Lys Ala Gly
            115                 120                 125
CCA GGC GTC AGC GTC AAG GAC GTC TCC CAG TTC GCC GTG TAC GCG GTC      430
Pro Gly Val Ser Val Lys Asp Val Ser Gln Phe Ala Val Tyr Ala Val
        130                 135                 140
GAG GCC AGG ACG CTG CAG CTG CTG CGC CCC GAC GAG GGC GTC GAC CTC      478
Glu Ala Arg Thr Leu Gln Leu Leu Arg Pro Asp Glu Gly Val Asp Leu
    145                 150                 155
ACG CTG CAG CCC TTC ACC TAC GAG CTC TTC GTC GTT GCC CCC GTG CGC      526
Thr Leu Gln Pro Phe Thr Tyr Glu Leu Phe Val Val Ala Pro Val Arg
160                 165                 170                 175
GTC ATC TCG CAT GAG CGG GCC ATC AAG TTC GCG CCC ATC GGA CTC GCC      574
Val Ile Ser His Glu Arg Ala Ile Lys Phe Ala Pro Ile Gly Leu Ala
                180                 185                 190
AAC ATG CTC AAC ACC GCC GGC GCC GTG CAG GCG TTC GAG GCC AAG AAA      622
Asn Met Leu Asn Thr Ala Gly Ala Val Gln Ala Phe Glu Ala Lys Lys
            195                 200                 205
GAT GCT AGC GGC GTC ACG GCA GAG GTG TTC GTG AAG GGC GCA GGG GAG      670
Asp Ala Ser Gly Val Thr Ala Glu Val Phe Val Lys Gly Ala Gly Glu
        210                 215                 220
CTG GTG GCG TAC TCG TCG GCG ACG CCC AGG CTC TGC AAG GTG AAC GGC      718
Leu Val Ala Tyr Ser Ser Ala Thr Pro Arg Leu Cys Lys Val Asn Gly
    225                 230                 235
GAC GAG GCC GAG TTC ACG TAC AAG GAC GGC GTG GTC ACC GTC GAC GTG      766
Asp Glu Ala Glu Phe Thr Tyr Lys Asp Gly Val Val Thr Val Asp Val
240                 245                 250                 255
CCG TGG TCG GGG TCG TCG TCG AAG CTG TGT TGC GTC CAG TAC GTC TAC      814
Pro Trp Ser Gly Ser Ser Ser Lys Leu Cys Cys Val Gln Tyr Val Tyr
                260                 265                 270
TGA GCCGGACGGG CCGATGACTC TGCGTCTCTG CTCCCTGCTG GCCTGCTCAG GAC       873
Stop
ATAATCTAAT GTTTAGAGCT TACCAGGTTT TACAGCTCTA TCAGTTTACT TTTGTTTTTC    933
TGCTCTTCGT TTTTTAAGAA TTATTTCTAT TGTGTGAATT AATGAGTGCT TTCCTTCTAA    993
AAA                                                                  996

Claims (12)

1、一种棉子糖合酶基因,该基因具有编码SEQ ID NO:1氨基酸序列的核苷酸序列。
2、具有SEQ ID NO:2的核苷酸序列的一种棉子糖合酶基因。
3、一种具有SEQ ID NO:1的氨基酸序列的棉子糖合酶蛋白。
4、包括权利要求1或2的棉子糖合酶基因,和连接到其上的启动子的嵌合体基因。
5、一种制造转化子的方法,该方法包括将权利要求4的嵌合体基因导入宿主有机体中。
6、一种质粒,该质粒包括权利要求1、2或4的棉子糖合酶基因。
7、一种制造宿主有机体的方法,该方法包括将权利要求6的质粒引入宿主细胞。
8、一种微生物,该微生物是以权利要求6的质粒转化的微生物。
9、一种植物细胞,该植物细胞是以权利要求6的质粒转化的植物细胞。
10、用于代谢修饰的方法,包括将权利要求1、2或4的棉子糖合酶基因导入宿主有机体或其细胞,从而使宿主有机体中棉子糖族寡糖的含量发生变化。
11、用于制备棉子糖合酶蛋白的方法,包括从通过培养权利要求8的微生物而获得的培养物中分离和纯化棉子糖合酶蛋白。
12、能够结合权利要求3的棉子糖合酶蛋白的抗棉子糖合酶抗体。
CNB971072795A 1996-12-18 1997-12-18 棉子糖合酶基因及其用途 Expired - Fee Related CN1195855C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP338673/1996 1996-12-18
JP338673/96 1996-12-18
JP33867396 1996-12-18

Publications (2)

Publication Number Publication Date
CN1190129A CN1190129A (zh) 1998-08-12
CN1195855C true CN1195855C (zh) 2005-04-06

Family

ID=18320389

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB971072795A Expired - Fee Related CN1195855C (zh) 1996-12-18 1997-12-18 棉子糖合酶基因及其用途

Country Status (12)

Country Link
US (1) US7723567B1 (zh)
EP (1) EP0849359B1 (zh)
KR (1) KR19980064209A (zh)
CN (1) CN1195855C (zh)
AR (1) AR010362A1 (zh)
AT (1) ATE346142T1 (zh)
BR (1) BR9706398A (zh)
CA (1) CA2218448C (zh)
DE (1) DE69736972T2 (zh)
DK (1) DK0849359T3 (zh)
ES (1) ES2276416T3 (zh)
RU (1) RU2224022C2 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6891084B1 (en) 1996-04-26 2005-05-10 Ajinomoto Co., Inc. DNA encoding raffinose synthase from soybean
AU735864B2 (en) * 1997-04-28 2001-07-19 Ajinomoto Co., Inc. Raffinose synthase gene, method for producing raffinose, and transgenic plant
AU760702B2 (en) * 1998-04-30 2003-05-22 Sumitomo Chemical Company, Limited Raffinose synthase genes and their use
AU1227200A (en) * 1998-10-23 2000-05-15 E.I. Du Pont De Nemours And Company Plant raffinose synthase homologs
EP1048733A3 (en) * 1999-04-30 2002-07-31 Sumitomo Chemical Company, Limited Plant promoters
JP2002262885A (ja) 2001-03-14 2002-09-17 Ajinomoto Co Inc 植物に対するストレス耐性付与方法
US8471107B2 (en) * 2009-04-16 2013-06-25 Schillinger Genetics, Inc. Soybeans having high germination rates and ultra-low raffinose and stachyose content
US8728726B1 (en) * 2010-07-09 2014-05-20 The United States Of America, As Represented By The Secretary Of Agriculture RS2 mutant allele, perfect molecular markers, and low raffinose/stachyose soybean germplasm
CN110117600A (zh) * 2019-05-08 2019-08-13 西北农林科技大学 一种玉米棉子糖合成关键酶基因及其应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5055401A (en) * 1987-04-10 1991-10-08 Alko Ltd. Construction of new α-galactosidase producing yeast strains and the industrial application of these strains
US4971908A (en) 1987-05-26 1990-11-20 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthase
ZA925592B (en) * 1991-07-24 1994-01-24 Du Pont Nucleotide sequences of galactinol synthase from zucchini and soybean
US5710365A (en) 1991-10-24 1998-01-20 E. I. Du Pont De Nemours And Company Soybean products with improved carbohydrate composition and soybean plants
US6166292A (en) * 1996-04-26 2000-12-26 Ajinomoto Co., Inc. Raffinose synthetase gene, method of producing raffinose and transgenic plant
US6891084B1 (en) * 1996-04-26 2005-05-10 Ajinomoto Co., Inc. DNA encoding raffinose synthase from soybean
AU735864B2 (en) * 1997-04-28 2001-07-19 Ajinomoto Co., Inc. Raffinose synthase gene, method for producing raffinose, and transgenic plant

Also Published As

Publication number Publication date
ES2276416T3 (es) 2007-06-16
DK0849359T3 (da) 2007-03-19
CN1190129A (zh) 1998-08-12
US7723567B1 (en) 2010-05-25
CA2218448A1 (en) 1998-06-18
EP0849359A3 (en) 2000-04-19
BR9706398A (pt) 1999-10-05
EP0849359A2 (en) 1998-06-24
DE69736972D1 (de) 2007-01-04
CA2218448C (en) 2009-10-06
AR010362A1 (es) 2000-06-07
ATE346142T1 (de) 2006-12-15
DE69736972T2 (de) 2007-09-20
RU2224022C2 (ru) 2004-02-20
EP0849359B1 (en) 2006-11-22
KR19980064209A (ko) 1998-10-07

Similar Documents

Publication Publication Date Title
CN1249245C (zh) 种子散失
CN1154740C (zh) 根皮层特异性基因启动子
CN1024021C (zh) 含谷胱甘肽s-转移酶基因的除莠剂耐性植物
CN1202246C (zh) 获得修饰表型的方法和措施
CN1245516C (zh) 编码乙酰乳酸合酶基因的基因
CN1170940C (zh) 生长得到改造的植物以及获得此种植物的方法
CN1273586C (zh) β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因
CN1671850A (zh) 二酰甘油酰基转移酶核酸序列及相关产物
CN1656224A (zh) 编码乙酰乳酸合酶的基因
CN101080493A (zh) 表达右旋葡聚糖蔗糖酶和合成改性淀粉的转化植物
CN1195861C (zh) 将多肽被囊化于淀粉基质中
CN1151252C (zh) 生产微生物转谷氨酰胺酶的方法
CN101076594A (zh) 参与糖和脂质代谢的蛋白质的拟南芥编码基因及使用方法
CN1195855C (zh) 棉子糖合酶基因及其用途
CN1549861A (zh) 利用植物细胞分泌性生产具有人型糖链的糖蛋白的方法
CN1584049A (zh) 转基因产品检测寡核苷酸芯片的制作方法及其应用
CN1252097A (zh) 转基因植物选择方法
CN1842601A (zh) 通过靶向抑制内源贮藏蛋白增强植物种子中异源多肽的累积
CN1639337A (zh) 具有催泪成分合成酶活性的蛋白质或多肽、编码该蛋白质或多肽的 DNA、利用该 DNA制造具有催泪成分合成酶活性的蛋白质或多肽的制造方法以及具有抑制该蛋白质或多肽的mRNA翻译的功能的核酸分子
CN1298853C (zh) 耐缺铁性稻类的构建
CN1198921C (zh) 棉子糖合成酶基因、棉子糖的制备方法及其转化的植物
CN1195862C (zh) 分离和纯化的包括在蛇麻腺中特异性表达的基因的核酸
CN101037696A (zh) 一种水稻冷害基因及应用
CN1240837C (zh) 植物纤维的修饰
CN1214105C (zh) Map激酶磷酸酶突变体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050406

Termination date: 20131218