CN1253584A - 提高植物种子中赖氨酸含量的嵌合基因和方法 - Google Patents

提高植物种子中赖氨酸含量的嵌合基因和方法 Download PDF

Info

Publication number
CN1253584A
CN1253584A CN98803732A CN98803732A CN1253584A CN 1253584 A CN1253584 A CN 1253584A CN 98803732 A CN98803732 A CN 98803732A CN 98803732 A CN98803732 A CN 98803732A CN 1253584 A CN1253584 A CN 1253584A
Authority
CN
China
Prior art keywords
seq
gene
seed
plant
methionin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN98803732A
Other languages
English (en)
Inventor
S·C·法尔科
R·E·麦德维特三世
S·U·艾佩尔鲍姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN1253584A publication Critical patent/CN1253584A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • C12N15/8254Tryptophan or lysine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Developmental Biology & Embryology (AREA)
  • Pregnancy & Childbirth (AREA)
  • Reproductive Health (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pretreatment Of Seeds And Plants (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了一些嵌合基因。一种嵌合基因编码一种植物赖氨酸酮戊二酸还原酶,第二种嵌合基因编码赖氨酸不敏感的二氢2、6-吡啶二羧酸合成酶(DHDPS),第二种嵌合基因与一个植物叶绿体转运序列操纵性连接,两种嵌合基因都与植物种子特异性调节序列操纵性连接。本发明还提供使用它们来在转化植物的种子中产生水平提高的赖氨酸的方法。

Description

提高植物种子中赖氨酸含量的嵌合基因和方法
与相关申请的相互参考
本发明是正在申请的、1997年3月27日提交的系列号No.08/824,627的部分继续申请,后者是正在申请的、1995年6月7日提交的系列号No.08/474,633的部分继续申请,后者又是正在申请的、1994年1月6日提交的系列号No.08/178,212的部分继续申请,后者即为1993年3月18日提交的PCT/US93/02480的国家申请,现已放弃,而它又是现已放弃的1992年3月19日提交的系列号No.07/855,414的部分继续申请。
发明领域
本发明涉及提高植物种子中赖氨酸含量的嵌合基因和方法,具体地说,本发明涉及两种嵌合基因,第一种嵌合基因编码一种植物赖氨酸酮戊二酸还原酶(LKR),第二种嵌合基因编码赖氨酸不敏感的二氢2、6-吡啶二羧酸合成酶(DHDPS),第二种嵌合基因与一个植物叶绿体转运序列操纵性连接,两种嵌合基因都与植物种子特异性调节序列操纵性连接。
发明背景
许多脊椎动物包括人缺乏制造多种氨基酸的能力,因而需要在食物中含有这些氨基酸。这些氨基酸被称为必需氨基酸。来自多种谷物的人食物和动物饲料缺乏十种必需氨基酸中的一些。在玉米(Zea maysL.)中,赖氨酸是多种动物的食物需求中最主要的限制氨基酸。大豆(Glycine max L.)粉被用作以玉米为基础的动物饲料的添加剂主要是作为赖氨酸补充。因此,增加玉米或大豆粉中赖氨酸含量将能减少或取消用微生物发酵生产的赖氨酸补充混合谷物饲料的必要。
植物育种者长期以来致力于使用天然发生的突变体来改善作物中的蛋白质量和数量。含有高于正常水平的赖氨酸(70%)的玉米品系已经得到了鉴定(Mertz et al.(1964)Science 145:279,Mertz et al.(1965)Science 150:1469-70)。但是,整合了一个突变基因---暗色-2的这些品系表现了比较差的农业品质(对疾病和害虫的易感性提高、产量降低8-14%、谷粒重量低、干燥慢、研磨去壳的干燥加工产量低以及储藏困难增加),因此不能商业化应用(Deutscher(1978)Adv.Exp.Medicine and Biology 105:281-300)。在CIMMYT用暗色-2和含糖-3基因培育的Quality Protein Maize(QPM)及相关的改进品在其谷粒中具有坚硬的胚乳和高水平的赖氨酸及色氨酸(Vasal,S.K.,et al.Proceedings of the 3rd seed protein symposium,Gaterseleben,August31-September2,1983)。但是,QPM品系中代表的基因库是热带或亚热带的。Qulity Protein Maize是一种遗传混合性状,现有品系不易适应于美国使用的凹种质,这就阻碍了玉米育种者接受QPM。
种子的氨基酸含量主要(90-99%)决定于种子中蛋白的氨基酸组成,在次要层次上(1-10%)决定于游离氨基酸库。种子中的总蛋白量从谷物干重的约10%到豆类干重的20-40%各不相同。蛋白中结合的氨基酸多数存在于种子的贮藏蛋白中,后者是在种子发育中合成的,并作为发芽后的主要营养储备。在许多种子中,贮藏蛋白占总蛋白的50%或更多。
为该进种子中的氨基酸成分,遗传工程技术被用来分离和在转基因植物中表达贮藏蛋白基因。例如,一个来自巴西坚果的编码一种含有26%含硫氨基酸的种子2S白蛋白的基因已经获得了分离(Altenbachet al.(1987)Plant Mol.Biol.13:513-522),并在转化的烟草的种子中在来自一种菜豆蛋白贮藏蛋白基因的调节序列的控制下进行了表达。富含硫的蛋白在烟草种子中的积累导致种子中蛋氨酸含量增加30%(Altenbach et al(1989)Plant Mol.Biol.13:513-522)。但是,目前还没有鉴定到与植物蛋白的平均赖氨酸含量相比赖氨酸得到类似增加的植物种子贮藏蛋白,这阻碍了这种方法用于提高赖氨酸。
一个替代方法是通过遗传工程技术来增加特殊的游离氨基酸如赖氨酸的产生和积累。但是,对于植物种子中赖氨酸的生物合成和代谢,几乎没有什么可用的指导。
赖氨酸以及苏氨酸、甲硫氨酸和异亮氨酸是由天冬氨酸衍生的氨基酸,这个家族的成员的生物合成的调节是相互联系的。该途径中代谢流向的调节似乎主要是通过末端产物。该途径的第一个步骤是天冬氨酸激酶(AK)对天冬氨酸的磷酸化,此酶已被发现在多种有机体中是调节的一个重要的靶。但是已在模型植物系统稀脉浮萍(Lemnapaucicostata)中对四碳分子通过天冬氨酸途径的通量进行了详细的生理学研究(Giovanelli et al.(1989)Plant Physiol.90:1584-1599)。该参考文献陈述道:“这些数据现在提供了明确的证据,由天冬氨酸激酶催化的步骤通常不是一个调节4碳单位进入氨基酸的天冬氨酸家族的重要位点(在植物中)”。
天冬氨酸家族途径也被相信是在分支点反应处受到调节。对于赖氨酸,这是由二氢2、6-吡啶二羧酸合成酶(DHDPS)催化的天冬氨酰-β-半醛与丙酮酸的缩合,而对于苏氨酸和甲硫氨酸,高丝氨酸脱氢酶(HDH)催化的天冬氨酰-β-半醛还原及接着的高丝氨酸激酶(HK)催化的高丝氨酸磷酸化是重要的控制点。
大肠杆菌dapA编码一种DHDPS酶,该酶对赖氨酸抑制的敏感性比典型的植物DHDPS酶例如麦芽DHDPS低大约20倍。该大肠杆菌dapA基因已与花椰菜花叶病毒的35S启动子和一种植物叶绿体转运序列相连。该嵌合基因被通过转化导入烟草细胞中,显示能在叶中导致游离赖氨酸水平显著提高(Glassman et al.(1989)PCT Patent appl.PCT/US89/01309,Shaul et al.(1992)Plant Jour.2:203-209,Galili et al.(1992)EPO Patent appl.91119328.2)。但是,在这些研究介绍的任何转化植物中,种子的赖氨酸含量没有增加。相同的嵌合基因也被导入到马铃薯中,并导致再生植物的叶、根和块茎中游离赖氨酸的少量增加(Galili et al.(1992)EPO Patent Appl.91119328.2,Perl et al.(1992)Plant Mol.Biol.19:815-823)。这些工作者还报道了通过转化将一种编码一种赖氨酸不敏感AK酶的大肠杆菌lysC基因导入到烟草细胞中(Galili et al.(1992)Eur.Patent Appl.91119328;Shaul et al.(1992)Plant Physiol.100:1157-1163)。该大肠杆菌酶的表达在转化植物的叶和种子中导致游离苏氨酸的水平提高。将表达大肠杆菌DHDPS和AK的植物杂交产生了比亲本DHDPS植物在叶中积累更多游离赖氨酸但比亲本AK植物在叶中产生较少游离苏氨酸的子代。没有种子中游离赖氨酸水平提高的证据。
对植物中生物合成途径调节细节了解的局限性,使遗传工程技术的应用,尤其是对种子,变得不确定。种子中天冬氨酸衍生氨基酸的来源几乎没有有用的信息。例如对于多数植物,还不知道它们是在种子中合成还是从叶转运到种子,或者是两种情况都有。此外,游离氨基酸仅占种子中总氨基酸含量的一小部分。因此,为显著影响种子的总氨基酸组成,游离氨基酸必须有许多倍的过量积累。而且,对于种子中游离氨基酸的分解代谢,知道的很少。在正在发育的玉米和大麦胚乳中已经观察到了游离赖氨酸的分解代谢。赖氨酸分解代谢的第一个步骤据信是由赖氨酸酮戊二酸还原酶(LKR)催化(Brochetto-Bragaet al.(1992)Plant Physiol.98:1139-1147)。此蛋白事实上是一种双功能酶,它还负责催化推测的赖氨酸分解代谢的第二个步骤,即为酵母氨酸脱氢酶(SDH)(Goncalves-Butruille et al.(1996)Plant Physiol.110:765-771)。从植物中分离编码LKR/SDH蛋白不同部分的基因组或cDNA克隆只有少数报道。GeneBank入藏号ATU9579列出了来自拟南芥菜(Arabidopsis thaliana)的双功能酶的一个全长cDNA克隆的序列。该克隆编码的蛋白是来自真菌有机体的LKR和SDH蛋白二者的同源物。来自拟南芥的基因组克隆的序列也可由GeneBank入藏号U95758获得(Tang,et al.(1997)Plant Cell 9:1305-1316和Epelbaum,et al.(1997)Plant Mol.Biol.35:735-748)。GeneBank入藏号AF003551公开了一个来自玉米的cDNA,该cDNA指导LKR/SDH蛋白的SDH结构域中的一个多肽的合成。GeneBank入藏号AF042184公开了一个来自欧洲油菜(Brassicanapus)的cDNA的序列,该序列与来自拟南芥的全长克隆的相对短的部分同源。但是,这种分解代谢途径是否广泛存在于植物中以及它们是否影响游离氨基酸的积累水平还不清楚。最后,游离氨基酸如赖氨酸或苏氨酸的过量积累对种子发育和存活性的影响还不清楚。
到现在为止,还不知道通过遗传工程增加种子中赖氨酸水平的方法。因此,需要这样的基因、嵌合基因以及在种子中表达它们的方法,这样,种子中赖氨酸的过量积累将导致营养品质改善。
发明简述
本发明涉及一种含有一个编码全部或部分赖氨酸酮戊二酸还原酶的核酸序列的分离核酸片段。
在另一个实施方案中,本发明涉及一种含有前面所说的编码全部或部分赖氨酸酮戊二酸还原酶的核酸片段的嵌合基因或其亚片段,该嵌合基因与合适的种子特异性调节序列操纵性相连,其中所说的嵌合基因降低转化植物的种子中以及用前面所说的嵌合基因转化的植物细胞或植物种子中的赖氨酸酮戊二酸还原酶活性。
在第三个实施方案中,本发明涉及一种植物细胞,在该植物细胞中,由于编码赖氨酸酮戊二酸还原酶的基因中的突变,赖氨酸酮戊二酸还原酶的活性被降低。
在第四个实施方案中,本发明涉及一种植物种子,在该种子中,由于编码赖氨酸酮戊二酸还原酶的基因中的突变,赖氨酸酮戊二酸还原酶的活性被降低。
在第五个实施方案中,本发明涉及一种降低植物种子中赖氨酸酮戊二酸还原酶活性的方法,该方法包括:
a)用嵌合基因转化植物细胞,该嵌合基因含有前面所说的编码全部或部分赖氨酸酮戊二酸还原酶的核酸片段或其亚片段,并与合适的种子特异性调节序列操纵性相连,其中所说的嵌合基因降低转化植物种子中的赖氨酸酮戊二酸还原酶活性;
b)在适合获得种子的条件下由步骤(a)获得的转化植物细胞再生可育成熟的植物;
c)由步骤(b)的种子中筛选筛选赖氨酸酮戊二酸还原酶活性降低的子代;并
d)选择其种子含有降低的赖氨酸酮戊二酸还原酶活性的品系。
在第六个实施方案中,本发明涉及一种核酸片段,该片段包含:
a)一个第一种嵌合基因,该嵌合基因含有前面所说的编码全部或部分赖氨酸酮戊二酸还原酶的核酸片段或其亚片段,并与合适的种子特异性调节序列操纵性相连,其中所说的嵌合基因降低转化植物种子中的赖氨酸酮戊二酸还原酶活性;以及
b)一个第二种嵌合基因,在该嵌合基因中,一个编码对赖氨酸抑制不敏感的二氢2、6-吡啶二羧酸合成酶(DHDPS)的核酸片段,与一个植物叶绿体转运序列和一个植物种子特异性调节序列操纵性连接。
本发明的第七个实施方案涉及一种植物和种子,该植物和种子在其基因组中含有前面所说的核酸片段或第一种或第二种前面所说的嵌合基因。
附图和序列表简述
本发明可由下面的详细介绍以及组成本申请的一个部分的附图和序列表来获得更全面的理解。
图1显示侧视和前视的一个α螺旋。
图2显示一个绕线型α螺旋结构的后视图(图2a)和侧视图(图2b)。
图3显示亮氨酸和甲硫氨酸的化学结构,并强调它们的相似形状。
图4a显示一个叶基因表达盒的图解,图4b显示一个种子特异性基因表达盒的图解。
图5显示双体质粒载体pZS97K的图谱。
图6显示双体质粒载体pZS97的图谱。
图7A显示双体质粒载体pZS199的图谱;图7B显示双体质粒载体pFS9926的图谱;图7C显示双体质粒载体pBT593的图谱;图7D显示双体质粒载体pBT597的图谱。
图8A显示质粒载体pBT603的图谱;图8B显示质粒载体pBT614的图谱。
图9显示两种植物cDNA编码的多肽与真菌SDH(谷氨酸形成)之间的氨基酸序列相似性。
图10描述制备一种载体(pSK5)的策略,该载体用于SSP基因序列的构建和表达。
图11显示将寡核苷酸序列插入碱性基因序列的单一EarI位点的策略。
图12显示将碱性基因寡核苷酸插入pSK5的NcoI/EcoR位点来制备质粒pSK6。按图8用该碱性基因序列在单一EarI位点插入不同的SSP编码区域来制备所列的克隆区段。
图13显示使用63bp“区段”寡核苷酸插入来制备用于图12中复制方案的非重复性基因序列。
图14(A和B)显示使用符合读框的融合来扩增非重复性基因“区段”的策略。
图15显示含有种子特异性启动子和3’序列盒的载体。使用NcoI和Asp718位点将SSP序列插入到这些载体中。
图16显示质粒载体pML63的图谱。
图17显示质粒载体pBT680的图谱。
图18显示质粒载体pBT681的图谱。
图19显示质粒载体pLH104的图谱。
图20显示质粒载体pLH105的图谱。
图21显示质粒载体pBT739的图谱。
图22显示质粒载体pBT756的图谱。
SEQ ID NO:1显示实施例1中介绍的、野生型大肠杆菌lysC基因的编码区的核苷酸和氨基酸序列,该基因编码AKIII。
SEQ ID NO:2和3被用于实施例2来在大肠杆菌lysC基因的翻译起始密码子处产生一个NcoI位点。
SEQ ID NO:4和5在实施例3中用作PCR引物来分离棒状杆菌dapA基因。
SEQ ID NO:6显示实施例3中介绍的、野生型棒状杆菌dapA基因的编码区的核苷酸和氨基酸序列,该基因编码赖氨酸不敏感的DHDPS。
SEQ ID NO:7被用于实施例4来在大肠杆菌dapA基因的翻译起始密码子处产生一个NcoI位点。
SEQ ID NO:8、9、10和11用于实施例6中制备一种叶绿体转运序列,并将此序列与大肠杆菌lysC、大肠杆菌lysC-M4、大肠杆菌dapA和棒状杆菌dapA基因连接。
SEQ ID NO:12和13被用于实施例6来在大肠杆菌dapA基因的紧接着翻译终止密码子的后面产生一个KpnI位点。
SEQ ID NO:14和15在实施例6中用作PCR引物来制备一种叶绿体转运序列,并将此序列与棒状杆菌dapA基因连接。
SEQ ID NO:16-92代表核酸片段和它们编码的多肽,它们被用来制备嵌合基因,这种嵌合基因编码适合在植物的种子中表达的、富含赖氨酸的、合成性种子贮藏蛋白。
SEQ ID NO:93在实施例6中用作玉米的组成性表达盒。
SEQ ID NO:94-99被用于实施例6来制备一种玉米叶绿体转运序列,并将此序列与大肠杆菌lysC-M4基因连接。
SEQ ID NO:100和101在实施例6中用作PCR引物来制备一种玉米叶绿体转运序列,并将此序列与大肠杆菌dapA基因连接。
SEQ ID NO:102和103是来自拟南芥菜的编码植物赖氨酸酮戊二酸还原酶/酵母氨酸脱氢酶的cDNA。
SEQ ID NO:104和105是分别与SEQ ID NO:102和103编码的真菌酵母氨酸脱氢酶(谷氨酸形成)同源的多肽。
SEQ ID NO:106和107在实施例25中用作PCR引物来在玉米DHDPS基因的5’和3’端增加NcoI和KpnI位点。
SEQ ID NO:108和109用于从拟南芥基因组DNA PCR扩增一个2.24kb的DNA片段。
SEQ ID NO:110显示拟南芥LKR/SDH基因组DNA片段的序列。
SEQ ID NO:111显示拟南芥LKR/SDH的cDNA序列。
SEQ ID NO:112显示推导的拟南芥LKR/SDH蛋白的氨基酸序列。
SEQ ID NO:113和114用于PCR扩增大豆和玉米LKR/SDH的cDNA片段。
SEQ ID NO:115显示大豆LKR/SDH cDNA片段的序列。
SEQ ID NO:116显示玉米LKR/SDH cDNA片段的序列。
SEQ ID NO:117显示推导的大豆LKR/SDH蛋白的部分氨基酸序列。
SEQ ID NO:118显示推导的玉米LKR/SDH蛋白的部分氨基酸序列。
SEQ ID NO:119显示大豆的一个2582核苷酸cDNA的序列。
SEQ ID NO:120显示玉米的一个3265核苷酸cDNA的序列。
SEQ ID NO:121显示推导的、由SEQ ID NO:119的核苷酸3至2357编码的、大豆LKR/SDH蛋白的部分氨基酸序列。
SEQ ID NO:122显示推导的、由SEQ ID NO:120的核苷酸3至3071编码的、大豆LKR/SDH蛋白的部分氨基酸序列。
SEQ ID NO:123是一个相当于SEQ ID NO:120的核苷酸1至1908的核苷酸序列。
SEQ ID NO:124是由SEQ ID NO:123推导的氨基酸序列。
SEQ ID NO:125显示水稻的一个720核苷酸LKR/SDH cDNA的序列。
SEQ ID NO:126显示推导的、由SEQ ID NO:125的核苷酸2至720编码的、水稻LKR/SDH蛋白的部分氨基酸序列。
SEQ ID NO:127显示水稻的一个308核苷酸LKR/SDH cDNA的序列。
SEQ ID NO:128显示推导的、由SEQ ID NO:127的核苷酸1至129编码的、水稻LKR/SDH蛋白的部分氨基酸序列。
SEQ ID NO:129显示小麦的一个429核苷酸cDNA的序列。
SEQ ID NO:130显示推导的、由SEQ ID NO:129的核苷酸1至252编码的、小麦LKR/SDH蛋白的部分氨基酸序列。
SEQ ID NO:131显示拟南芥cDNA克隆的SDH编码区。
SEQ ID NO:132显示拟南芥LKR/SDH蛋白的SDH结构域的氨基酸序列。
序列表遵照Nucleic Acids Research 13:3021-3030(1985)和Biochemical Journal 219(No.2):345-373(1984)中介绍的IUPAC-IUB标准,对核苷酸序列特征使用单字母密码,对氨基酸使用三字母密码,上述文献在此引入作为参考。
发明详述
本发明介绍核酸片段和程序,这些核酸片段和程序可用来使转化植物的种子中,赖氨酸的积累相对于未转化植物的赖氨酸水平增加。为通过遗传工程增加植物种子中游离赖氨酸的积累,需要确定植物种子中该途径中的哪些酶控制该途径。为完成这一点,从细菌中分离了编码该途径中酶的基因。在某些场合,在这些基因中取得突变,使其编码的酶对末端产物抑制不敏感。将细胞内定位序列和合适的调节序列连接来制备嵌合基因,这两种序列是为了在植物种子中进行表达。然后将嵌合基因通过转化导入植物,并评价它们在种子中引起赖氨酸积累的能力。
本发明提供一个独特的第一种核酸片段,它含有两个核酸亚片段(亚序列),一个编码LKR,另一个编码DHDPS,后者对赖氨酸的反馈抑制基本上不敏感。对于本申请的目标来讲,基本上不敏感一词的意思是与催化相同反应的典型的植物酶相比,对赖氨酸的反馈抑制的敏感性至少低20倍。已经发现,与未转化的宿主植物相比,亚片段的一种组合成功地增加了转化植物的种子中积累的赖氨酸。
还已经发现,种子中积累过量的游离赖氨酸的全部潜力被赖氨酸分解代谢减弱。而且,已经发现,赖氨酸分解代谢导致赖氨酸分解产物如酵母氨酸和α-氨基己二酸的积累。这里提供两种可选择的途径来降低由于分解代谢而引起的过量赖氨酸的损失以及减少赖氨酸分解产物的积累。在第一种方法中,通过降低酶赖氨酸酮戊二酸还原酶(LKR)的活性来阻止赖氨酸分解代谢,该酶催化赖氨酸分解的第一个步骤。这可通过在编码LKR的植物基因中引入一个能降低或消除酶功能的突变来完成。这样的突变可在赖氨酸超产生品系中通过筛选不能积累赖氨酸分解产物---酵母氨酸和α-氨基己二酸的突变体来鉴定。另外,还提供几种分离植物LKR基因的方法,还提供含有植物LKR cDNA的核酸片段。然后可以制备用来在植物种子中表达反义LKR RNA或共抑制LKR的嵌合基因。将此嵌合LKR基因与编码赖氨酸不敏感的DHDPS的嵌合基因连接,并通过同时转化将二者导入植物中,或者用独立地转化了每种嵌合基因的植物进行杂交来将嵌合基因连在一起。
在第二种方法中,过量的游离赖氨酸被整合成一种对分解不敏感的形式,例如通过将其整合成二聚、三聚或寡聚肽、或优选成一种富含赖氨酸的贮藏蛋白。被选用的富含赖氨酸的贮藏蛋白应含有高于蛋白平均水平的赖氨酸。理想的情况是,这些贮藏蛋白应含有至少15%重量的赖氨酸。本发明提供一组能在体内表达并用作富含赖氨酸的种子贮藏蛋白的优选多肽的设计。合成编码富含赖氨酸的合成性贮藏蛋白(SSP)的基因,并制备在其中SSP基因与适于在植物种子中表达的调节序列相连的嵌合基因。然后将SSP嵌合基因与嵌合的DHDPS基因连接,并将二者通过同时转化导入到植物中,或者用独立地转化了每种嵌合基因的植物进行杂交来将嵌合基因连在一起。
这里介绍一种转化植物的方法,其中所产生的植物种子具有至少10%的赖氨酸,优选具有10%至比未转化植物的种子高四倍的赖氨酸。在这里以实施例形式提供的是,种子赖氨酸水平比未转化植物提高100%的转化油菜植物、种子赖氨酸水平比未转化植物的赖氨酸水平提高4倍的大豆植物、以及种子赖氨酸水平提高130%的玉米植物。
在本公开的上下文中,将会使用多种词汇,用在这里,“核酸”一词指一种由含有糖、磷酸以及一种嘌呤或一种嘧啶的单体(核苷酸)组成的大分子,它可以是单链或双链。一个“核酸片段”是一种给定核酸分子的一个部分。在高等植物中脱氧核糖核酸(DNA)是遗传物质,而核糖核酸(RNA)参与将DNA中的信息转移至蛋白质中。“基因组”是指一种有机体的每个细胞含有的全体遗传物质。“核苷酸序列”一词是指DNA或RNA的一种多聚体,它可以是单链或双链的,并可选择性地含有能整合到DNA或RNA多聚体中的合成、非天然或修饰的核苷酸碱基。
用在这里,“与…同源”一词是指两种核酸分子的核苷酸序列之间或两种蛋白分子的氨基酸序列之间的互补性。同源性的定量评估可通过在严格条件下按本领域的技术人员所熟知的方法(如Hames andHiggins(eds.)Nucleic Acid Hybridisation,IRL Press,Oxford,U.K.)进行DNA-DNA或DNA-RNA杂交来提供,或通过比较两种核酸或蛋白之间的序列相似性来提供。
用在这里,“基本上相似”是指可能参与了这样一种碱基改变的DNA序列,该碱基改变不在其编码的氨基酸中造成一个改变,或可能参与了这样一种碱基改变,该碱基改变改变了一个或多个氨基酸,但不影响该DNA序列编码的蛋白的功能特性。因此应当理解,本发明包含的范围大于具体的举例序列。本发明还包含能产生基本上不影响所得蛋白的功能特性的无声突变的序列修饰,例如序列中的删除、插入或替换。例如,本发明包括基因序列中反映遗传密码的简并性或在一个给定位点导致一种化学等价氨基酸生成的改变,这样,一种疏水氨基酸丙氨酸的密码子可以被编码另一种疏水性差一些的氨基酸如甘氨酸或疏水性强一些的氨基酸如缬氨酸、亮氨酸或异亮氨酸的密码子替换。与此相似,能导致一种带负电荷的残基取代另一种,如天冬氨酸取代谷氨酸,或一种带正电荷的残基取代另一种,如赖氨酸取代精氨酸的改变,也可用来制备一种生物学等价的产物。能导致蛋白分子的N末端和C末端改变的核苷酸改变也可用来改变蛋白的活性。在一些场合,的确需要制备序列的突变体来研究改变对蛋白的生物学活性的影响。每一种推荐的修饰都很好地用本领域的常规技术来完成,对编码产物生物学活性的保留也是一样。而且,本领域的技术人员应认识到,本发明所包含的“基本上相似”的序列也可用它们在严格条件下(0.1XSSC,0.1%SDS,65℃)与这里举例的序列杂交的能力来定义。
“基因”指一个表达一种特殊蛋白的核酸片段,包括编码区前面(5’非编码)和后面(3’非编码)的调节序列。“天然”基因指天然状态下发现的、带有其自身调节序列的基因。“嵌合基因”指一种含有异源性调节和编码序列的基因。“内源性”基因指通常在基因组的天然位置发现的天然基因。“外源”基因指一种通常不会在宿主有机体中发现、但用基因转移的方法引入的基因。
“编码序列”指编码一种特殊蛋白并且不包含非编码区的DNA序列。
“起始密码子”和“终止密码子”指一个编码序列中分别指定蛋白合成(mRNA翻译)的起始和链终止的三联核苷酸单位。“开放阅读框”指编码序列的翻译起始和终止密码子之间编码的氨基酸序列。
“RNA转录物”指由RNA聚合酶催化的DNA序列转录产生的产物。当RNA转录物是一种DNA序列的精确互补拷贝时,它是指初级转录物,或者它可以是一个由初级转录物经过转录后加工而衍生的RNA序列。“信使RNA(mRNA)”指能被细胞翻译成蛋白的RNA。“cDNA”指一种与mRNA互补并衍生自mRNA的双链DNA。“有义”RNA指含有mRNA的RNA转录物。“反义RNA”指一种与一个靶初级转录物或mRNA的全部或部分互补并能通过干扰其初级转录物或mRNA的加工、运输和/或翻译来阻碍靶基因表达的RNA转录物。一种反义RNA可以与特定基因转录物的任何部分互补,即在5’非编码序列、3’非编码序列、内含子、或编码序列互补。此外,用在这里,反义RNA可以含有能提高反义RNA阻断基因表达效率的核酶序列的区域。“核酶”指一种催化性RNA,并包含序列特异的内切核酸酶。
用在这里,合适的“调节序列”指位于编码序列的上游(5’)、内部、和/或下游(3’)的核苷酸序列,这种序列能潜在地协同细胞的蛋白生物合成装置来控制编码序列的转录和/或表达。这些调节序列包括启动子、翻译前导序列、转录终止序列和聚腺苷酸化序列。
“启动子”指基因中的一段DNA序列,通常位于其编码序列的上游(5’),它通过提供对RNA聚合酶和适当转录所需的其他因子的识别来控制编码序列的表达。一个启动子还可含有参与蛋白因子结合的DNA序列,这种蛋白因子控制应答于生理或发育状况的转录起始的效果。启动子还可含有增强子元件。
“增强子”是一段能激活启动子活性的DNA序列。它可以是启动子的一个天然元件,或是一个插入来提高启动子的水平和/或组织特异性的异源元件。“组成型启动子”指那些能在所有组织中并在所有的时间内指导基因表达的启动子。这里所说的“器官特异性”或“发育特异性”启动子分别指那些几乎只在特殊的组织中如叶或种子中或只在一个器官的特殊发育阶段例如胚胎发育的早期或晚期指导基因表达的启动子。
“操纵性相连”一词是指一个单一核酸分子上的核酸序列相互联系,一个的功能受另一个的影响。例如,当一个启动子能够影响一个结构基因的表达时(即结构基因在启动子的转录控制之下),我们就称启动子与结构基因(即,这里给出的编码赖氨酸不敏感的天冬氨酸激酶的基因)操纵性相连。
用在这里,“表达”一词的意思是一个基因编码的蛋白产物的产生。更具体地说,“表达”指由本发明的核酸片段衍生的有义(mRNA)或反义RNA的转录和稳定积累,并协助细胞的蛋白装置,导致蛋白产物的水平改变。“反义抑制”指能抑制靶蛋白表达的反义RNA转录物的产生。“超表达”指转基因有机体中超过正常或非转基因有机体中产生水平的一个基因产物的产生。“共抑制”指一个与内源基因基本上同源的外源基因的表达导致外源和内源基因二者的表达抑制。“水平改变”指转基因有机体中基因产物的产生数量或比例与正常或非转基因有机体不同。
“3’非编码序列”指基因中含有聚腺苷酸化信号和任何其他能影响mRNA加工或基因表达的调节信号的DNA序列部分。聚腺苷酸化信号的特征通常是影响在mRNA前体的3’末端加上聚腺苷酸序列。
“翻译前导序列”指基因中启动子和编码序列之间能转录为RNA的DNA序列部分,并存在于完全加工的mRNA中翻译起始密码子的上游(5’)。翻译前导序列可能影响初级转录物加工成mRNA、mRNA的稳定性或翻译效率。
“成熟”蛋白指翻译加工后的不带有其靶向信号的多肽。“前体”蛋白指mRNA翻译的初级产物。“叶绿体靶向信号”指与一种蛋白一起翻译并指导该蛋白进入叶绿体的一段氨基酸序列。“叶绿体转运序列”指编码一种叶绿体靶向信号的一个核苷酸序列。
在这里“转化”指一种外源基因转移到一种宿主有机体的基因组中并稳定遗传。植物转化方法的例子包括农杆菌介导的转化和粒子加速或“基因枪”转化技术。
在这里“氨基酸”指天然产生的L-氨基酸(丙氨酸、精氨酸、天冬氨酸、天冬酰胺、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、脯氨酸、苯丙氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸)。“必需氨基酸”是那些动物不能合成的氨基酸。在这里一个“多肽”或“蛋白”指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)组成的分子。
在这里“合成蛋白”指由已知不是天然产生的氨基酸序列组成的蛋白。这种氨基酸序列由一个天然产生蛋白的共有序列衍生,或可以是全新的。
“一级序列”指在不考虑分子构象的情况下一个多肽链中氨基酸的连接次序。一级序列按习惯从多肽链的氨基端写至羧基端。
在这里“二级结构”指在不考虑侧链特性和构象的情况下多肽链的物理化学优先的规则的骨架排列。在这里“α螺旋”指每圈螺旋约3.6个残基的右手螺旋。在这里“两亲性螺旋”指处于这样一种螺旋构象的多肽,螺旋的一个侧面主要是亲水性的,而另一个侧面主要是疏水性的。
在这里“绕线”指两个平行右手α螺旋的一种集合,其中两个α螺旋相互缠绕形成一种左手超螺旋。
这里讨论的“盐桥”指带电荷的氨基酸侧链的之间形成的酸碱对,带电荷的氨基酸侧链在空间中以一定方式排列,从而在一条多肽链的两个部分之间或一条链与另一条链之间维持一种相互吸引的静电作用。
“宿主细胞”的意思是用导入的遗传物质转化了的细胞。AK基因的分离
以前已经对大肠杆菌lysC基因进行了克隆、限制酶切图谱绘制和序列测定(Cassan et al.(1986)J.Biol.Chem.261:1052-1057)。在本发明中,lysC基因由一个噬菌体λ克隆上获得,该噬菌体克隆来自一个订购的文库,该文库包含3400个克隆的大肠杆菌DNA的重叠片段,并由Kohara、Akiyama和Isono构建(Kohara et al.(1987)Cell50:595-508)。大肠杆菌lysC基因编码一种酶AKIII,该酶对赖氨酸抑制敏感。在lysC基因中获得了一个突变,该突变导致AKIII酶对赖氨酸产生抗性。
为确定赖氨酸抗性的分子基础,对野生型lysC基因和三个突变基因的序列进行了测定。克隆的野生型lysC基因的序列(示于SEQ IDNO:1)在编码区的5个位置与发表的lysC序列不同。
编码赖氨酸不敏感的天冬氨酸激酶的三个突变lysC基因的序列每一个都与野生型序列有一个核苷酸的不同,从而在蛋白中导致一个单个氨基酸的替换。一个突变体(M2)在SEQ ID NO:1的核苷酸954处用一个A取代了一个G,从而在AKIII的氨基酸序列中导致一个异亮氨酸取代甲硫氨酸,两个突变体(M3和M4)在SEQ ID NO:1的核苷酸1055处具有相同的T取代C,导致一个异亮氨酸取代苏氨酸。
按实施例1中的介绍在体内或用本领域的技术人员熟知的定点诱变方法在体外也可制备其他的突变,从而在这些位置产生对野生型AKIII中存在的甲硫氨酸或苏氨酸残基的氨基酸取代。这种突变可用来产生一种赖氨酸不敏感的酶。而且,实施例1中介绍的方法可用来根据需要方便地分离和分析多种另外的编码赖氨酸不敏感的AKIII的突变lysC基因。
已经有多种其他的AK基因得到了克隆和序列测定。它们包括大肠杆菌的thrA基因(Katinka et al.(1980)Proc.Natl.Acad.Sci.USA 77:5730-5733)、大肠杆菌的metL基因(Zakin et al.(1983)J.Biol.Chem.258:3028-3031)、啤酒酵母的HOM3基因(Rafalski etal.(1988)J.Biol.Chem.263:2146-2151)。大肠杆菌的thrA基因编码一种双功能蛋白---AKI-HDHII。该酶的AK活性对赖氨酸不敏感,但对苏氨酸敏感。大肠杆菌的metL基因也编码一种双功能蛋白---AKII-HDHII,此酶的AK活性也对赖氨酸不敏感。酵母的HOM3基因编码一种对赖氨酸不敏感但对苏氨酸敏感的AK。
除了这些基因,还已经知道几种编码赖氨酸不敏感的AK的植物基因。在大麦中,已经描述了在两个不连接的基因中带有突变从而产生两种赖氨酸不敏感的AK同功酶的赖氨酸加苏氨酸抗性突变体(Brightet al.(1982)Nature 299:278-279,Rognes et al.(1983)Planta157:32-38,Arruda et al.(1984)Plant Physiol.76:442-446)。在玉米中,一种赖氨酸加苏氨酸抗性细胞系具有对赖氨酸抑制的敏感性比其亲本系低的AK活性(Hibberd et al.(1980)Planta 148:183-187)。一个随后分离到的赖氨酸加苏氨酸抗性玉米突变体在一个不同的遗传位点有了改变,并也能产生赖氨酸不敏感的AK(Diedricket al.(1990)Theor.Appl.Genet.79:209-215,Dotson et al.(1990)Planta 182:546-552)。在烟草中,在叶中有两种AK酶,一种对赖氨酸敏感,另一种对苏氨酸敏感。已经描述了一种能表达完全的赖氨酸不敏感AK的赖氨酸加苏氨酸抗性烟草突变体(Frankard etal.(1991)Theor.Appl.Genet.82:273-282)。这些植物突变体能用作编码赖氨酸不敏感AK的基因的来源,并以这里的介绍为基础,用来提高转化植物的种子中赖氨酸和苏氨酸的积累。
已经报道了一个来自胡萝卜的AK的部分氨基酸序列(Wilson etal.(1991)Plant Physiol.97:1323-1328)。使用这些信息,就可以设计、合成一组简并性的DNA寡核苷酸,并用作杂交探针来分离胡萝卜AK基因。最近已经分离了胡萝卜AK基因,其核苷酸序列已经得到了测定(Matthews et al.(1991)U.S.S.N.07/746,705)。该基因可用作异源性杂交探针来分离上面介绍的编码赖氨酸不敏感AK的基因。在大肠杆菌中高水平表达野生型和突变型lysC基因
为完成在大肠杆菌中高水平表达lysC基因,使用了一个应用噬菌体T7 RNA聚合酶/T7启动子系统的细菌表达载体(Rosenberg et al.(1987)Gene 56:125-135)。按实施例2中的介绍对该表达载体和lysC基因进行修饰来构建一个lysC表达载体。为表达突变的lysC基因(M2、M3和M4),按实施例2中的介绍用突变基因取代野生型lysC基因。
为进行高水平表达,将每种表达载体转化到大肠杆菌B121(DE3)中(Studier et al.(1986)J.Mol.Biol.189:113-130)。按实施例2中的介绍使培养物生长、诱导表达、收集细胞、以及制备抽提物。由未诱导和诱导的培养物制备的抽提物的上清和沉淀部分按实施例2中的介绍用SDS聚丙烯酰胺凝胶电泳和AK酶试验进行分析。诱导培养物的上清和沉淀部分中用考马斯蓝染色见到的主要蛋白为AKIII。大约80%的AKIII蛋白存在于上清中,AKIII占抽提物中大肠杆菌总蛋白的10-20%。
约80%的AKIII活性存在于上清部分中。野生型和突变体粗抽提物的比活为每毫克总蛋白每分钟5-7umoles。在试验中野生型AKIII对L-赖氨酸的存在敏感。在约0.4mM的浓度发现百分之五十的抑制,在约0.1mM时发现90%的抑制。相反,突变体M2、M3和M4完全不被15mM L-赖氨酸抑制。
按实施例2的介绍从一个诱导培养物的上清中纯化野生型AKIII蛋白。制备针对纯化AKIII蛋白的兔抗体。
文献中已经介绍了多种其他的微生物表达载体。本领域的技术人员可以使用它们中的任意一种来构建lysC表达载体。然后可以将这些lysC表达载体通过转化导入合适的微生物中来提供一种高水平表达AKIII的系统。DHDPS基因的分离
以前已经对大肠杆菌dapA基因(ecodapA)进行了克隆、限制酶切图谱绘制和序列测定(Richaud et al.(1986)J.Bacteriol.166:297-300)。在本发明中,dapA基因由一个噬菌体λ克隆上获得,该噬菌体克隆来自一个订购的文库,该文库包含3400个克隆的大肠杆菌DNA的重叠片段,并由Kohara、Akiyama和Isono构建(Kohara et al.(1987)Cell 50:595-508)。ecodapA基因编码一种DHDPS酶,该酶对赖氨酸抑制敏感。但是,它对赖氨酸抑制的敏感性比典型的植物DHDPS如麦芽DHDPS低大约20倍。
棒状杆菌dapA基因(cordapA)基因是用聚合酶链反应(PCR)从ATCC菌株13032的基因组DNA获得的。棒状杆菌dapA基因的核苷酸序列已经发表(Bonnassie et al.(1990)Nucleic Acids Res.18:6421)。由该序列可以设计用于聚合酶链反应(PCR)的寡核苷酸引物,来扩增含有该基因的DNA片段,同时,在基因的起始密码子和紧接着终止密码子的后面加入单一的限制内切酶位点,以便于进一步构建含有该基因的结构。cordapA基因分离的细节在实施例3中介绍。cordapA基因编码一种对赖氨酸抑制不敏感的DHDPS酶。
除了在翻译起始密码子处加入一个限制内切酶位点,PCR引物还将cordapA基因的第二个密码子从编码丝氨酸的AGC改变为编码丙氨酸的GCT。数种表达活性的、赖氨酸不敏感的DHDPS的克隆DNA片段获得了分离,这说明第二个密码子的氨基酸取代不影响酶活性。
将PCR产生的棒状杆菌dapA基因亚克隆到来自Promega的噬菌粒载体pGEM-9zf(-)中,制备单链DNA并进行序列测定(SEQ ID NO:6)。除了已经提到的在第二个密码子的不同外,另外还有两个位置---核苷酸798和799不同,该序列基本与已发表的序列匹配。在已发表的序列中,这两个位置是TC,而在示于SEQ ID NO:6的基因中,它们是CT。这个变化导致亮氨酸取代丝氨酸的氨基酸取代。该差异产生的原因不明。该差异对DHDPS的酶活性没有明显的影响。
其他编码DHDPS基因的分离已在文献中介绍。来自小麦的一个编码DHDPS的cDNA(Kaneko et al.(1990)J.Biol.Chem.265:17451-17455)和来自玉米的一个编码DHDPS的cDNA(Frisch et al.(1991)Mol.Gen.Genet.228:287-293)是两个例子。这些基因编码野生型赖氨酸敏感的DHDPS酶。但是,Negrutui et al.((1984)Theor.Appl.Genet.68:11-20)获得了两个AEC抗性烟草突变体,在这两个突变体中,DHDPS活性对赖氨酸抑制的敏感性比野生型酶低。这些基因可用已经介绍的分离小麦或玉米基因的方法进行分离,或可将小麦或玉米基因用作异源杂交探针进行分离。
本领域的技术人员还可用ecodapA基因、cordapA基因或两种植物DHDPS基因中的一种作为DNA杂交探针来分离其他编码DHDPS的基因。此外,其他编码DHDPS的基因还可用一种大肠杆菌dapA突变体的功能互补来分离,如同分离cordapA基因(Yeh et al.(1988)Mol.Gen.Genet.212:105-111)和玉米DHDPS基因一样。在大肠杆菌中高水平表达ecodapA和cordapA基因
为完成在大肠杆菌中高水平表达ecodapA和cordapA基因,使用了一个应用噬菌体T7 RNA聚合酶/T7启动子系统的细菌表达载体(Rosenberg et al.(1987)Gene 56:125-135)。按下面的介绍对该载体和dapA基因进行修饰来构建ecodapA和cordapA的表达载体。
为进行高水平表达,将每种表达载体转化到大肠杆菌BL21(DE3)中(Studier et al.(1986)J.Mol.Biol.189:113-130)。按实施例4中的介绍使培养物生长、诱导表达、收集细胞、以及制备抽提物。由未诱导和诱导的培养物制备的抽提物的上清和沉淀部分按实施例4中的介绍用SDS聚丙烯酰胺凝胶电泳和DHDPS酶试验进行分析。诱导培养物的上清和沉淀部分中用考马斯蓝染色见到的主要蛋白具有32-34kd的分子量,这是DHDPS的预期大小。即使在未诱导的培养物中,这种蛋白也是产生的最主要的蛋白。
在诱导的带有ecodapA基因的培养物中,约80%的DHDPS蛋白存在于上清中,DHDPS占抽提物中总蛋白的10-20%。在诱导的带有cordapA基因的培养物中,超过50%的DHDPS蛋白存在于沉淀部分中。在两种情况下,沉淀部分都是90-95%纯的DHDPS,并且没有明显数量的其他单一蛋白。因此这些部分有足够的纯度来用于产生兔抗体。
诱导的抽提物的上清部分中的大肠杆菌DHDPS比活为每毫克蛋白约50 OD540单位。在试验中大肠杆菌DHDPS对L-赖氨酸的存在敏感。在浓度约0.4mM时发现百分之五十的抑制。对于棒状杆菌DHDPS,在非诱导的抽提物而不是诱导的抽提物的上清部分中检测到酶活性。酶活性为每毫克蛋白每分钟约4OD530单位。与大肠杆菌DHDPS相对,棒状杆菌DHDPS完全不被L-赖氨酸抑制,即使在浓度为70mM时也是这样。
文献中已经介绍了多种其他的微生物表达载体。本领域的技术人员可以使用它们中的任意一种来构建ecodapA或cordapA表达载体。然后可以将这些lysC表达载体通过转化导入合适的微生物中来提供一种高水平表达DHDPS的系统。表达高水平DHDPS和/或AKIII的大肠杆菌的氨基酸分泌
将大肠杆菌表达盒插入到表达载体中,然后转化到大肠杆菌BL21(DE3)(Studier et al.(1986)J.Mol.Biol.189:113-130)中,来诱导大肠杆菌产生和分泌氨基酸。所用方法的细节和结果示于实施例5。
也可用本领域的技术人员所熟知的其他微生物表达载体来制备和组合用于lysC和dapA基因的表达盒。然后可将这些表达载体通过转化导入合适微生物来提供产生和分泌赖氨酸、苏氨酸和甲硫氨酸的替代系统。用于植物中表达的嵌合基因的构建
用来表达本发明的嵌合基因的一组优选的异源宿主是真核生物细胞,特别是高等植物的细胞。高等植物及它们的种子中优选的是大豆、油菜(Brassica narpu、B.campestris)、向日葵(Helianthusannus)、棉花(Gossypium hirsutum)、玉米、烟草(Nicotianatabacum)、苜蓿(Medicago sativa)、小麦(Triticum sp)、大麦(Hordeum vulgare)、燕麦(Avena sativa,L)、高粱(Sorghumbicolor)、水稻(Oryaz sativa)和饲料草。在植物中表达需要使用在这样的植物中有功能的调节序列。在植物中表达外源基因的技术已经很成熟(De Blaere et al.(1987)Meth.Enzymol.143:277-291)。在植物中表达适当水平的本发明的不同嵌合基因可通过使用多种不同的启动子来完成。这种嵌合基因可一起在一个单一的表达载体上或顺序使用一个以上的载体转移到宿主植物中。
选择来驱动编码序列表达的启动子的来源并不重要,只要它具有足够的转录活性通过在所需的宿主组织中表达可翻译的mRNA或反义RNA来完成本发明。用于在所有的植物器官中表达特别是在叶中表达的启动子,包括在花椰菜花叶病毒中指导19S和35S转录物的启动子(Odell et al.(1985)Nature 313:810-812;Hull et al.(1987)Virology 86:482-493)、核酮糖1,5-二磷酸羧化酶小亚基启动子(Morelli et al.(1985)Nature 315:200;Broglie et al.(1984)Science 224:838;Hererra-Estrella et al.(1984)Nature 310:115;Coruzzi et al.(1984)EMBO J.3:1671;Faciotti et al.(1985)Bio/Technology 3:241)、玉米醇溶蛋白启动子(Matzke et al.(1984)EMBO J.3:1525)和叶绿素a/b结合蛋白启动子(Lampa et al.(1986)Nature 316:750-752)。
根据本申请,需要选择在植物的一种或多种器官中具有特异性的启动子。其例子包括如果需要在光合器官中表达时的核酮糖1,5-二磷酸羧化酶小亚基的光诱导启动子、或在种子有特异活性的启动子。
优选的启动子是那些能在种子中进行特异性表达的启动子。这样的启动子特别有用,因为种子是植物性氨基酸的主要来源,还因为种子特异性表达可避免非种子器官中的任何潜在的有害影响。种子特异性启动子的例子包括但不限于种子贮藏蛋白的启动子。种子贮藏蛋白受到严格的调节,并以一种高器官特异性和阶段特异性的方式几乎只在种子中表达(Higgins et al.(1984)Ann.Rev.Plant Physiol.35:191-221;Goldberg et al.(1989)Cell 56:149-160;Thompson etal.(1989)BioEssays 10:108-113)。而且,不同的种子贮藏蛋白可能在种子发育的不同阶段表达。
在转基因的双子叶植物中种子贮藏蛋白基因的种子特异性表达目前已经有大量的例子。它们包括来自双子叶植物的编码β-菜豆蛋白(Sengupta-Goplalan et al.(1985)Proc.Natl.Acad.Sci.USA82:3320-3324;Hoffman et al.(1988)Plant Mol.Biol.11:717-729)、菜豆凝集素(Voelker et al.(1987)EMBO J.6:3571-3577)、大豆凝集素(Okamuro et al.(1986)Proc.Natl.Acad.Sci.USA 83:8240-8244)、大豆kunitz胰蛋白酶抑制剂(Perez-Grau et al.(1989)Plant Cell 1:1095-1109)、β-伴大豆球蛋白(Beachy et al.(1985)EMBO J.4:3047-3053;Barker et al.(1988)Proc.Natl.Acad.Sci.USA 85:458-462;Chen et al.(1988)EMBO J.7:297-302;Chen et al.(1989)Dev.Genet.10:112-122;Naito et al.(1988)Plant Mol.Biol.11:109-123)、豌豆球蛋白(Higgins et al.(1988)Plant Mol.Biol.11:683-695)、伴豌豆球蛋白(Newbigin et al.(1990)Planta 180:461)、豌豆豆球蛋白(Shirsat et al.(1989)Mol.Gen.Genetics 215:326)、油菜napin(Radke et al.(1988)Theor.Appl.Genet.75:685-694)的基因,以及来自单子叶植物的基因如编码玉米的15kD玉米醇溶蛋白(Hoffman et al.(1987)EMBO J.6:3213-3221;Schernthaner et al.(1988)EMBO J.7:1249-1253;Williamson et al.(1988)Plant Physiol.88:1002-1007)、大麦β-醇溶蛋白(Marris et al.(1988)Plant Mol. Biol.10:359-366)、小麦谷蛋白(Colot et al.(1987)EMBO J.6:3559-3564)的基因。而且,嵌合基因结构中与异源编码序列操纵相连的种子特异基因的启动子在转基因植物中保持它们的时序和空间表达模式。这样的例子包括用来在拟南芥和欧洲油菜种子中表达脑啡肽的拟南芥菜2S种子贮藏蛋白基因启动子(Vandekerckhove et al.(1989)Bio/Technology 7:929-932)、用来表达荧光素酶的菜豆凝集素和β-菜豆蛋白启动子(Riggs et al.(1989)Plant Sci.63:47-57)、以及用来表达氯霉素乙酰转移酶的小麦麦谷蛋白启动子(Colot et al.(1987)EMBO J.6:3559-3564)。
对表达本发明的核酸片段特别有用的启动子是来自数种充分研究的大豆种子贮藏蛋白基因的异源启动子,例如那些编码Kunitz胰蛋白酶抑制剂(Jofuku et al.(1989)Plant Cell 1:1079-1093;Perez-Grau et al.(1989)Plant Cell 1:1095-1109)、大豆球蛋白(Nielson et al.(1989)Plant Cell 1:313-328)、β-伴大豆球蛋白(Harada et al.(1989)Plant Cell 1:415-425)的基因的启动子。编码大豆β-伴大豆球蛋白贮藏蛋白的α’和β亚基的启动子在转基因植物中的大豆种子发育的中期和晚期在子叶中表达mRNA或反义RNA将会特别有用(Beachy et al.(1985)EMBO J.4:3047-3053;Barker etal.(1988)Proc.Natl.Acad.Sci.USA 85:458-462;Chen et al.(1988)EMBO J.7:297-302;Chen et al.(1989)Dev.Genet.10:112-122;Naito et al.(1988)Plant Mol.Biol.11:109-123)。因为:a)对其在转基因种子中的表达很少有位置效应,和b)两个启动子显示不同的时序调节:α’亚基基因的启动子比β亚基基因的启动子早几天表达。
对表达本发明的核酸片段的特别有用的启动子还有来自数种充分研究的玉米种子贮藏蛋白基因的异源启动子,例如来自10kD玉米醇溶蛋白(Kirihara et al.(1988)Gene 71:359-370)、27kD玉米醇溶蛋白(Prat et al.(1987)Gene 52:51-49;Gallardo et al.(1988)Plant Sci.54:211-281)、和19kD玉米醇溶蛋白(Marks etal.(1985)J.Biol.Chem.260:16451-16459)的胚乳特异性启动子。这些启动子在玉米中的相关转录活性已经有了报道(Kodrzyck etal.(1989)Plant Cell 1:105-114),这就为在玉米中使用的嵌合基因结构选择一种启动子提供了基础。为在玉米胚中进行表达,可以使用来自GLB1基因的强胚特异性启动子(Kriz(1989)BiochemicalGenetics 27:239-251,Wallace et al.(1991)Plant Physiol.95:973-975)。
预期将增强子或增强子样元件引入其他启动子结构也能提供水平提高的初级转录来完成本发明。它们包括病毒增强子如在35S启动子中发现的增强子(Odell et al.(1988)Plant Mol.Biol.10:263-272)、来自冠瘿碱基因的增强子(Fromm et al.(1989)Plant Cell1:977-984)、或来自任何其他来源的、当置于一个与本发明的核酸片段操纵相连的启动子中时能导致转录提高的增强子。
特别重要的是从β伴大豆球蛋白α亚基的基因中分离的DNA序列元件,该元件使一种组成型启动子的种子特异性提高40倍(Chen et al.(1988)EMBO J.7:297-302;Chen et al.(1989)Dev.Genet 10:112-122)。本领域的技术人员能容易地分离这种元件,并将其插入到任何基因的启动子区域,来在转基因植物中用该启动子获得种子特异性提高的表达。将这样一种元件插入到与β-伴大豆球蛋白基因在不同时间表达的任何种子特异性基因中,将导致转基因植物中的表达在种子发育期间持续较长时间。
任何能提供适当表达可能需要的一种聚腺苷酸化信号和其他调节序列的3’非编码区都可用来完成本发明。这可包括来自任何贮藏蛋白的3’端如菜豆蛋白基因的3’端、β-伴大豆球蛋白基因的3’端、来自病毒基因的3’端如35S或19S花椰菜花叶病毒转录物的3’端、冠瘿碱合成基因的3’端、核酮糖1,5-二磷酸羧化酶或叶绿素a/b结合蛋白的3’端、或任何来源的3’端序列,只要应用该序列能提供所需的、存在于其核酸序列中的调节信息,来导致与其操纵连接的启动子/编码区组合物适当表达。本领域中有大量的例子介绍了不同3’端非编码区的使用(例如,见Ingelbrecht et al.(1989)Plant Cell 1:671-680)。
为适当表达蛋白,在需要时,可将编码细胞内定位序列的DNA序列插入到lysC和dapA编码序列中来完成本发明。已知植物氨基酸生物合成酶定位在叶绿体中,因此在合成时带有叶绿体靶向信号。细菌蛋白如DHDPS和AKIII没有信号。因此,可以将一种叶绿体转运序列融合到lysC和dapA编码序列中。优选的叶绿体转运序列是核酮糖1,5-二磷酸羧化酶的小亚基的转运序列,例如来自大豆的核酮糖1,5-二磷酸羧化酶的小亚基的转运序列(Berry-Lowe et al.(1982)J.Mol.Appl.Genet.1:483-498)可用于双子叶植物,来自玉米的核酮糖1,5-二磷酸羧化酶的小亚基(Lebrun et al.(1987)Nucleic AcidsRes.15:4360)的转运序列可用于单子叶植物。将嵌合基因导入植物
本领域的技术人员可以使用多种方法来将一个DNA序列导入(即转化)至高等植物的真核细胞(见EPO公开0 295 959 A2和0 138 341A1)。这些方法包括那些以农杆菌属的Ti和Ri质粒为基础的转化载体为基础的方法。特别优选的是使用这些载体的双体型。Ti衍生的载体可以转化广泛不同的高等植物,包括单子叶植物和双子叶植物,例如大豆、棉花和油菜(Pacciotti et al.(1985)Bio/Technology 3:24;Byme et al.(1987)Plant Cell,Tissue and Organ Culture 8:3;Sukhapinda et al.(1987)Plant Mol.Biol.8:209-216;Lorz etal.(1985)Mol.Gen.Genet.199:178;Potrykus(1985)Mol.Gen.Genet.199:183)。
为导入植物,本发明的嵌合基因可按照实施例7-12和14-16中的介绍插入到双体载体中。这些载体是根癌农杆菌(Agrobacteriumtumefaciens)的一种双体Ti质粒载体系统的一部分(Bevan,(1984)Nucl.Acids.Res.12:8711-8720)。
本领域的技术人员可以使用其他转化方法,例如外源DNA结构的直接摄取(见EPO publication 0 295 959 A2)、电转化技术(见Frommet al.(1986)Nature(London)319:791)、或用包被了核酸结构的金属颗粒高速轰击(见Kline et al.(1987)Nature(London)327:70,和见U.S.Pat.No.4,945,050)。一旦转化成功,本领域的技术人员就可将细胞再生。
特别相关的是最近介绍的用来将外源基因转化到商业上重要的作物如油菜(见De Block et al.(1989)Plant Physiol.91:694-701)、向日葵(Everett et al.(1987)Bio/Technology 5:1201)、大豆(McCabe et al.(1988)Bio/Technology 6:923;Hinchee et al.(1988)Bio/Technology 6:915;Chee et al.(1989)Plant Physiol.91:1212-1218;Christou et al.(1989)Proc.Natl.Acad.Sci.USA 86:7500-7504;EPO Publication 0 301 749 A2)和玉米(Gordon-Kamm et al.(1990)Plant Cell 2:603-618;Fromm et al.(1990)Biotechnology 8:833-839)中去的方法。
对于用高速轰击的方法导入植物,可将本发明的嵌合基因按实施例6介绍的方法插入到合适的载体中。按实施例17-19的介绍获得转化的植物。在烟草植物中表达lysC和dapA嵌合基因
为进行在转化植物的叶或种子中表达嵌合基因的试验,可以用本领域的技术人员所熟知的方法来用酶学和/或免疫学方法检测和定量AKIII和DHDPS蛋白。以此方式容易鉴定产生高水平表达蛋白的品系。
为测量叶中的游离氨基酸组成,可以用各种方法包括实施例7中介绍的方法来抽提游离氨基酸。为测量种子中的游离或总氨基酸组成,抽提物可用各种方法包括实施例8中介绍的方法来制备。
AKIII或AKIII-M4(带有一种叶绿体靶向信号)的表达对叶中游离赖氨酸或苏氨酸(或任何其他氨基酸)的水平没有明显的影响(见实施例7中的表2)。因为AKIII-M4对该途径中任何末端产物引起的反馈抑制都不敏感,这说明控制作用发生在叶中生物合成途径的其他步骤。
相反,在种子中AKIII或AKIII-M4(带有一种叶绿体靶向信号)的表达分别导致种子中游离苏氨酸的水平比非转化植物高2-4倍或4-23倍,并在某些场合使游离赖氨酸的水平提高2-3倍(表3、实施例8)。在表达高水平的AKIII或AKIII-M4蛋白的转化子与具有高水平的游离苏氨酸的转化子之间有非常好的相关性,但对于赖氨酸则不是这样。用AKIII-M4蛋白产生的游离苏氨酸或赖氨酸相对较小的提高不足以在种子中总苏氨酸或赖氨酸水平上与未转化植物相比产生可检测到的提高。通过AKIIIM4蛋白表达来产生的游离苏氨酸的较大提高足以在种子中总苏氨酸水平上与未转化植物的种子相比产生可检测到的提高。种子的总苏氨酸含量被观察到有百分之十六至二十五的提高。显示总苏氨酸提高的品系同样也是显示游离苏氨酸水平提高最大和高表达AKIII-M4蛋白的品系。
上述介绍显示,氨基酸生物合成发生在种子中,并可被编码氨基酸生物合成酶的外源基因调节。而且,它们显示,一种氨基酸生物合成途径的控制在不同的植物器官如种子和叶中明显不同。这个发现的重要性强调了应考虑下面介绍的叶和种子中表达一种外源DHDPS的不同影响。可以得出结论,种子中苏氨酸生物合成主要通过AK的末端产物抑制来控制。因此,植物种子中的苏氨酸积累可通过一种转化导入的基因的表达来提高,该基因编码对赖氨酸抑制不敏感并位于叶绿体中的AK。
上述介绍还证明,在种子中表达高水平的导入酶的转化植物在种子中积累高水平的游离苏氨酸。而且这些介绍还证明,在种子中表达一种赖氨酸不敏感的AK的转化植物比表达相似水平的一种赖氨酸敏感的AK的转化植物在种子中积累更高水平的游离苏氨酸。为使游离苏氨酸获得有商业价值的提高,优选使用一种赖氨酸不敏感的AK。
这些介绍表明,种子中的游离赖氨酸水平通过AK的末端产物抑制控制着另一种天冬氨酸衍生氨基酸---苏氨酸的积累。为积累高水平的游离赖氨酸自身,需要通过一种赖氨酸不敏感的AK的表达来绕开AK的赖氨酸抑制。
在转化烟草植物的年轻和成熟的叶中完成了活性大肠杆菌DHDPS酶的表达(表4、实施例9)。在表达带有一种叶绿体靶向信号的酶的植物的年轻叶中积累了比正常烟草植物高50至100倍的高水平的游离赖氨酸,但在没有这样一种靶向信号时却不能。但是,在较大的叶中只观察到少得多的游离赖氨酸积累(2至8倍)。测量韧皮部中赖氨酸的实验表明赖氨酸从大的叶中输出。这种输出的赖氨酸可能为小的正在生长的叶中赖氨酸的积累作贡献,小的正在生长的叶已知是吸收而不是输出营养物质。即使大肠杆菌DHDPS酶在种子以及叶中表达也没有观察到对这些植物的种子中游离赖氨酸水平的影响。
带有或不带有一种叶绿体靶向信号的大肠杆菌DHDPS酶的高水平种子特异性表达在任何转化品系中对种子的总的或游离的赖氨酸或苏氨酸(或任何其他氨基酸)组成都没有影响(表5、实施例10)。这些结果证明一种基本上对赖氨酸抑制不敏感的DHDPS酶在种子中的表达不足以导致游离赖氨酸的产生或积累增加。
这些来自表达大肠杆菌DHDPS酶的转化子的介绍表明,在叶中赖氨酸生物合成主要通过DHDPS的末端产物抑制来控制,而在种子中该途径至少有一个另外的控制点。来自表达大肠杆菌AKIII和AKIII-M4酶的转化子的介绍表明,种子中的游离赖氨酸的水平通过AK的末端产物抑制控制了所有天冬氨酸衍生氨基酸的积累。因此AK是一个另外的控制点。
为在叶和种子中同时完成大肠杆菌DHDPS和AKIII-M4二者的高水平表达,可将表达每种基因的植物杂交,并选择表达二者的杂合子。另一种方法可构建在同一DNA片段上含有两种基因的载体,并通过转化将连接的基因导入植物。这是一种优选的方法,因为基因在随后的繁殖作用中保持连接。在同一DNA片段上携带两种基因的代表性载体在实施例11、12、15、16、18、19和25中介绍。
用一种携带大肠杆菌DHDPS和AKIII-M4基因二者与35S启动子连接的载体转化的烟草植物在实施例11中介绍。在表达很少或不表达AKIII-M4的转化子中,大肠杆菌DHDPS的表达水平决定了叶中赖氨酸积累的水平(实施例11,表6)。但是在表达AKIII-M4和大肠杆菌DHDPS二者的转化子中,每种蛋白的表达水平都在赖氨酸积累水平的控制中起作用。表达相当水平的DHDPS的转化品系在也表达AKIII-M4时积累更多的赖氨酸(表6,比较品系564-18A、564-56A、564-36E、564-55B和564-47A)。这样,一种赖氨酸不敏感AK的表达在协同有对赖氨酸的敏感性比内源的植物酶低20倍的一种DHDPS酶的表达时,能提高叶中赖氨酸的积累。
由在种子中单独表达大肠杆菌AKIII-M4和大肠杆菌DHDPS而来的这些叶结果和种子结果表明,在种子中同时表达大肠杆菌AKIII-M4和大肠杆菌DHDPS二者将导致游离赖氨酸的积累增加,并也将导致游离苏氨酸的积累增加。用一种携带大肠杆菌DHDPS和AKIII-M4基因二者与菜豆蛋白启动子连接的载体转化的烟草植物在实施例12中介绍。在这些植物中游离赖氨酸和游离苏氨酸的积累增加。游离苏氨酸增加的水平比正常种子高4倍,而不是在单独表达AKIII-M4的种子中所观察到的20倍。游离苏氨酸积累的减少表明,途径中间物偏向生物合成的赖氨酸分支。游离赖氨酸的水平比正常种子(或单独表达大肠杆菌DHDPS的种子)高2倍。但是种子中赖氨酸的增加比不上在叶中观察到的100倍提高。
大肠杆菌DHDPS酶对赖氨酸抑制的敏感性比植物DHDPS低,但仍能被赖氨酸抑制。上述对AK蛋白的介绍表明,一种完全对赖氨酸不敏感的酶的表达比敏感性低于植物酶但仍被赖氨酸抑制的酶能导致大得多的天冬氨酸途径末端产物苏氨酸积累。因此,按实施例15和19的介绍,构建了携带棒状杆菌DHDPS和AKIII-M4基因与种子特异性启动子连接的载体。用携带棒状杆菌DHDPS和AKIII-M4基因与种子特异性启动子连接的载体转化的烟草植物在实施例15中介绍。如表9中所示,这些植物在种子中并不比前面介绍的大肠杆菌DHDPS酶和赖氨酸不敏感的AK一起表达的植物显示更多的游离赖氨酸积累。事后该结果可用以下事实解释:种子中赖氨酸的积累从没有达到足够高的水平来抑制大肠杆菌DHDPS,所以用赖氨酸不敏感的棒状杆菌DHDPS取代该酶没有效果。
在表达高水平的大肠杆菌AKIII-M4和大肠杆菌DHDPS或棒状杆菌DHDPS的转化品系中,可以检测到种子中有相当数量的α-氨基己二酸。这种化合物被认为是谷物种子中赖氨酸分解代谢途径的一种中间产物,但因为其积累水平较低,通常只能用放射性示踪实验来检测。发现相对游离氨基酸水平的高水平的这种中间产物,说明在这些转化品系的种子中有大量赖氨酸产生,并正在进入分解代谢途径。在种子中仅表达大肠杆菌DHDPS或仅表达AKIII-M4的转化子中没有观察到α-氨基己二酸的增加。这些结果显示,需要同时表达两种酶来在种子中产生高水平的游离赖氨酸。为积累高水平的游离赖氨酸还需要阻止赖氨酸分解。此外,还可能需要将产生的高水平的赖氨酸转成一种对降解不敏感的形式,例如将其整合成一种双体、三体或寡聚体肽,或一种富含赖氨酸的贮藏蛋白。在油菜和大豆植物中表达lysC和dapA嵌合基因
为分析转化的油菜和大豆的种子中嵌合的lysC和dapA基因的表达以及确定表达对种子中氨基酸含量的结果,可以按照实施例16或19或其他任何合适的方法制备一种种子粉。在需要时,可通过诸如己烷抽提将种子粉部分或完全脱脂。从粉中制备蛋白抽提物并分析AK和/或DHDPS酶活性。此外,AK和/或DHDPS蛋白的存在可用本领域的技术人员熟知的方法进行免疫学检测。为测量种子中游离氨基酸组成,可从粉中抽提游离氨基酸并用本领域的技术人员熟知的方法分析(见实施例8、16和19中的合适程序)。
由一个携带cordapA基因的载体获得的所有油菜转化子都表达棒状杆菌DHDPS蛋白,由一个携带lysC-M4基因的载体获得的8个转化子中的6个表达AKIII-M4蛋白(实施例16,表12)。这样就能简单地在油料种子油菜籽中表达这些蛋白。表达DHDPS蛋白的转化子显示在它们的种子中游离赖氨酸水平大于100倍的提高。在表达高水平的DHDPS蛋白的转化子和具有高水平的游离赖氨酸的转化子之间有很好的相关性。一个表达AKIII-M4的转化子在没有棒状杆菌DHDPS的情况下在种子中显示赖氨酸水平5倍的提高。两种酶的同时表达导致赖氨酸而不是苏氨酸高水平的积累。
在许多转化品系尤其是表达最高水平的DHDPS和AKIII蛋白的品系中观察到了高水平的α-氨基己二酸,这是赖氨酸分解代谢的标记。因此,通过使赖氨酸酮戊二酸还原酶失活来阻止赖氨酸的分解代谢将进一步增加种子中游离赖氨酸的积累。此外,将赖氨酸整合到一种多肽或富含赖氨酸的蛋白中将阻止分解代谢并导致种子中赖氨酸积累的增加。
为测定成熟的油菜种子中的总氨基酸组成,按实施例16中的介绍分析脱脂的粉。对种子中的相对氨基酸水平以总氨基酸中的赖氨酸百分比的形式进行了比较。与未转化的对照相比,观察到了种子中赖氨酸水平5-100%的增加。具有最高赖氨酸含量的转化子表达高水平的大肠杆菌AKIII-M4和棒状杆菌DHDPS二者。在这种转化子中赖氨酸占种子总氨基酸的15%,明显高于任何以前已知的油菜种子。
7个大豆转化子中有6个表达DHDPS蛋白。在6个表达DHDPS的转化子中,在单个种子中GUS和DHDPS表达之间有很好的相关性。因此,GUS和DHDPS基因整合在大豆基因组的相同位点。7个转化子中有4个表达AKIII蛋白,同样,在单个的种子中AKIII、GUS和DHDPS的表达之间有很好的相关性。这样,在这四个转化子中,GUS、AKIII和DHDPS基因整合在大豆基因组的相同位点。
单独和与大肠杆菌AKIII-M4一起表达棒状杆菌DHDPS的大豆转化子在其种子中积累高水平的游离赖氨酸。在含有高水平赖氨酸的种子中也观察到了高水平的酵母氨酸,后者是赖氨酸分解代谢的第一个代谢产物。还观察到较少数量的α-氨基己二酸。这样,通过使赖氨酸酮戊二酸还原酶失活来阻止赖氨酸的分解代谢将进一步增加大豆种子中游离赖氨酸的积累。此外,将赖氨酸整合到一种多肽或富含赖氨酸的蛋白中将阻止分解代谢并导致种子中赖氨酸积累的增加。
对从转基因以单个位点分离的转化子中获得的单个种子中的游离赖氨酸水平进行的分析表明,在大约四分之一的种子中游离赖氨酸水平的增加明显较高。因为四分之一的种子预期对转基因是纯合的,因此很可能较高赖氨酸的种子是纯合型的。而且,这表明游离赖氨酸增加的水平依赖于转基因的拷贝数。因此,赖氨酸水平可以通过对两种不同的转化子杂交并获得在两个转基因位点纯合的子代来进一步提高。
表达棒状杆菌DHDPS的大豆种子在总的种子赖氨酸积累上显示明显的提高。观察到与未转化对照相比总赖氨酸含量提高5-35%的种子。在这些种子中,赖氨酸占种子总氨基酸的7.5-7.7%。
一起表达棒状杆菌DHDPS和大肠杆菌AKIII-M4的大豆种子显示比单独表达棒状杆菌DHDPS的大豆种子多得多的总的种子赖氨酸积累。观察到了总赖氨酸含量提高大于4倍的种子。在这些种子中,赖氨酸占总的种子氨基酸的20-25%,明显高于任何以前已知的大豆种子。在玉米中表达lysC和dapA嵌合基因
从转化的愈伤组织再生的玉米组织能用Southern印迹或PCR分析完整的lysC和dapA转基因的存在。携带这些基因的植物可自交或与一种原种远交来制备F1种子。将6至8个种子混合,并用Western印迹分析来分析棒状杆菌DHDPS蛋白和大肠杆菌AKIII-M4蛋白的表达。种子的游离氨基酸组成和总氨基酸组成按上面的介绍来确定。
棒状杆菌DHDPS蛋白和/或大肠杆菌AKIII-M4蛋白的表达,在种子的胚中可使用在胚中有活性的调节序列优选来自球蛋白1基因的调节序列来获得;或在胚乳中使用在胚乳中有活性的调节序列优选来自谷蛋白2基因或10kD玉米醇溶蛋白基因的调节序列来获得(详见实施例26)。种子中的游离赖氨酸水平从对照种子中的约1.4%游离氨基酸增加到单独表达来自球蛋白1启动子的棒状杆菌DHDPS的转化子种子中的15-27%。增加的游离赖氨酸定位在表达来自球蛋白1启动子的棒状杆菌DHDPS的种子的胚中。
游离赖氨酸的大量提高导致总的种子赖氨酸含量的明显增加。在表达来自球蛋白1启动子的棒状杆菌DHDPS的种子中,总的赖氨酸水平可至少提高130%。通过将来自球蛋白1启动子的大肠杆菌AKIII-M4蛋白与棒状杆菌DHDPS一起表达可使游离赖氨酸水平提高更大。
预期赖氨酸的分解代谢在玉米胚乳中比胚中大得多。因此,为达到胚乳中赖氨酸明显增加,优选在胚乳中表达棒状杆菌DHDPS和大肠杆菌AKIII-M4二者,并通过按下面的介绍降低赖氨酸酮戊二酸还原酶的水平来减少赖氨酸分解代谢。一种植物赖氨酸酮戊二酸还原酶基因的分离
可能需要阻止赖氨酸分解代谢来积累高水平的游离赖氨酸,和需要阻止赖氨酸降解产物如酵母氨酸和α-氨基己二酸的积累。证据表明,赖氨酸在植物中通过酵母氨酸途径分解。该途径存在的第一个酶学证据是在正在发育的玉米种子的胚乳中检测到赖氨酸酮戊二酸还原酶(LKR)活性(Arruda et al.(1982)Plant Physiol.69:988-989)。LKR催化赖氨酸分解代谢的第一个步骤---L-赖氨酸与α-酮戊二酸使用NADPH作为辅因子缩合成酵母氨酸。在玉米中LKR活性自胚乳发育启动时迅速增加,在授粉后约20天达到高峰,然后降低(Arruda et al.(1983)Phytochemistry 22:2687-2689)。为阻止赖氨酸的分解代谢,需要降低或消除LKR的表达或活性。这可通过以下步骤来完成:克隆LKR基因,制备一种用于LKR共抑制的嵌合基因或制备一种表达LKR的反义RNA的嵌合基因,通过转化将嵌合基因导入植物。此外,可以获取其中LKR酶活性缺失的植物突变体。
本领域的技术人员可使用多种方法来克隆一种植物LKR基因。按照Brochetto-Braga et al.((1992)Plant Physiol.98:1139-1147)的介绍从玉米胚乳中纯化蛋白,并用来制备抗体。然后将抗体用来从一个cDNA表达文库中筛选LKR克隆。此外,纯化的蛋白可用来测定蛋白氨基端的或蛋白酶产生的内部肽片段的氨基酸序列。以氨基酸序列为基础可制备简并性的寡核苷酸探针,并用来通过杂交对一个植物cDNA或基因组DNA文库进行筛选。
另一种方法使用一种大肠杆菌菌株,该菌株在一种含有20ug/ml的L-赖氨酸的合成培养基中不能生长。在该菌株中表达全长的LKRcDNA将通过降低赖氨酸浓度使生长抑制逆转。一种合适大肠杆菌菌株的构建及将其用来从一种植物cDNA文库中选择能导致赖氨酸抗性生长的克隆在实施例20中介绍。
还有另一种方法依赖于植物LKR和酵母氨酸脱氢酶的同源性。真菌酵母氨酸脱氢酶(谷氨酸形成)和酵母氨酸脱氢酶(赖氨酸形成)催化真菌赖氨酸生物合成途径的最后两个步骤。植物LKR和真菌酵母氨酸脱氢酶(赖氨酸形成)催化正向和逆反应二者,并使用相同的底物和使用相似的辅因子。与此类似,植物酵母氨酸脱氢酶(谷氨酸形成)催化赖氨酸分解代谢途径的第二个步骤,它在正向和逆反应二者中都起作用,使用相同的底物,并使用与真菌酵母氨酸脱氢酶(谷氨酸形成)相似的辅因子。数种编码真菌酵母氨酸脱氢酶的基因已经获得了分离和序列测定,并可方便地被本领域的技术人员使用(Xuan etal.(1990)Mol.Cell.Biol.10:4795-4806,Feller et al.(1994)Mol.Cell.Biol.14:6411-6418)。这些基因可用作异源杂交探针来鉴定植物KLR和植物酵母氨酸脱氢酶(谷氨酸形成)的核酸片段,或另外来鉴定植物cDNA中的同源性蛋白的编码区。
从人和牛的研究中获得的生物化学和遗传证据已经证明,哺乳动物LKR和酵母氨酸脱氢酶(谷氨酸形成)酶活性存在于一个单一的蛋白上,该蛋白的单体分子量约为117,000。这与真菌酶相反,真菌酶存在于分离的蛋白上,酵母氨酸脱氢酶(赖氨酸形成)的分子量约为44,000,酵母氨酸脱氢酶(谷氨酸形成)的分子量约为51,000。已经报道植物LKR具有约140,000的分子量,这表明它与动物催化蛋白一样,LKR和酵母氨酸脱氢酶(谷氨酸形成)酶活性存在于一个单一的蛋白上。
本发明提供两种含有来自拟南芥菜的cDNA的植物酵母氨酸脱氢酶(谷氨酸形成)核酸片段(SEQ ID NO:102和103)。它们是作为编码与真菌酵母氨酸脱氢酶(谷氨酸形成)同源的蛋白的cDNA而鉴定的。这些核酸片段被用来设计和合成寡核苷酸引物(SEQ ID NO:108和SEQ ID NO:109)。这些引物被合成并用来从基因组拟南芥DNA中PCR扩增一条2.24kb的DNA片段。该DNA片段被用来通过与基因组DNA文库杂交来分离一条更大的基因组DNA片段,后者包括完整的编码区以及5’和3’两翼序列。本发明提供了该基因组DNA片段的序列(SEQ ID NO:110),寡核苷酸以该序列为基础进行合成,并用来通过RT-PCR分离一个全长的cDNA。本发明提供了全长cDNA的序列(SEQID NO:111)。这些核酸片段可用作杂交探针来从任何所需的植物中鉴定和分离编码LKR和酵母氨酸脱氢酶(谷氨酸形成)酶活性二者的基因组DNA片段或cDNA片段。
拟南芥LKR/SDH蛋白的推导的氨基酸序列示于SEQ ID NO:112。该氨基酸序列显示,在植物中LKR和SDH酶活性处于一个单一的双功能蛋白上,并显示该蛋白缺少一个N-末端靶向序列,这说明赖氨酸降解途径位于植物细胞溶胶中。拟南芥LKR/SDH蛋白的氨基酸序列与其他LKR和SDH蛋白的氨基酸序列进行了比较,因而揭示了保守氨基酸序列区域。简并性的寡核苷酸可以基于此信息进行设计,并用来通过PCR从其他有机体优选从植物中扩增基因组或cDNA片段。作为这些的一个例子,设计了SEQ ID NO:113和SEQ ID No:114,并将其用来扩增大豆和玉米LKR/SDH cDNA片段。大豆LKR/SDH cDNA的一个部分序列示于SEQ ID NO:115,玉米cDNA的一个部分序列示于SEQ ID NO:116。如同对拟南芥所做的,这些DNA片段可用来通过与玉米或大豆基因组或cDNA文库杂交来分离更大的DNA片段,后者包括完整的编码区以及5’和3’两翼序列。在如5’RACE的方法中使用SEQ ID NO:115和SEQ ID NO:116中的序列作为起始物质,并通过与cDNA文库杂交,从大豆和玉米LKR/SDH的编码区中获得了更完全的序列信息。大豆LKR/SDH的一个几乎全长的cDNA序列示于SEQ ID NO:119,玉米LKR/SDH的一个几乎全长的cDNA序列示于SEQ ID NO:120。来自玉米的LKR/SDH cDNA的一个剪切的版本示于SEQ ID NO:123。
大豆LKR/SDH蛋白的推导的部分氨基酸序列示于SEQ ID NO:117和121,玉米LKR/SDH蛋白的推导的部分氨基酸序列示于SEQ ID NO:118、122和124。这些氨基酸序列可与其他LKR/SDH蛋白的氨基酸序列如拟南芥LKR/SDH蛋白序列进行比较,来揭示保守氨基酸序列区域。根据此信息可设计和合成寡核苷酸引物,来从其他任何植物来源分离LKR/SDH基因组或cDNA片段。
获得来自拟南芥、大豆和玉米的植物LKR/SDH蛋白的序列信息,使我们能够将这些序列与从其他植物获得的EST序列包括获自水稻和小麦的EST进行比较。SEQ ID NO:125和127列出了来自水稻的编码LKR/SDH的部分cDNA克隆的序列,SEQ ID NO:129列出了来自小麦的编码LKR/SDH片段的部分cDNA克隆的序列。预期由这些序列编码的蛋白片段分别示于SEQ ID NO:126、128和130。
获得植物LKR/SDH基因使阻断转化植物中LKR/SDH基因的表达成为可能。为完成这种阻断,可以通过将LKR基因或基因片段与上面介绍的任何植物启动子序列连接,来构建一种设计来共抑制LKR的嵌合基因。(见U.S.Patent No.5,231,020中,通过共抑制来阻断植物基因表达的方法学)。另外,可以通过将LKR基因或基因片段按反方向与上面介绍的任何植物启动子序列连接,来构建一种设计来表达针对全部或部分LKR基因的反义RNA的嵌合基因。(见U.S.Patent No.5,107,065中通过反义RNA来阻断植物基因表达的方法学)。可通过转化将共抑制或反义嵌合基因导入植物。然后选择其中内源性LKR基因的表达降低或消除的转化子。
用于嵌合基因的优选的启动子是种子特异性启动子。就大豆、油菜和其他双子叶植物而言,优选采用来自一种菜豆蛋白基因、一种β-伴大豆球蛋白基因、大豆球蛋白基因、Kunitz胰蛋白酶抑制基因、或油菜napin基因的强种子特异性启动子。就玉米和其他单子叶植物而言,优选采用一种强的胚乳特异性启动子如10kD或27kD玉米醇溶蛋白启动子,或一种强的胚特异性启动子如FLB1启动子。
含有任何嵌合LKR基因的转化植物可用上面介绍的方法获得。为获得表达一种LKR共抑制或反义LKR的嵌合基因以及一种编码基本上对赖氨酸不敏感的DHDPS的嵌合基因的转化植物,可将共抑制或反义LKR基因与编码基本上对赖氨酸不敏感的DHDPS的嵌合基因连接,并通过转化将两种基因导入植物。另外,可将编码LKR共抑制或反义LKR的嵌合基因导入以前转化的、表达基本上对赖氨酸不敏感的DHDPS的植物中,或将共抑制或反义LKR基因导入正常的植物,并将获得的转化子与表达基本上对赖氨酸不敏感的DHDPS的植物杂交。
获得植物LKR/SDH基因使在异源系统中表达蛋白成为可能。为证明这一点,使用PCR引物制备一种包含拟南芥SDH编码区(SEQ ID NO:119)的DNA片段,并连接到一种原核表达载体中。在大肠杆菌中完成拟南芥SDH的高水平表达,从细菌抽提物中纯化SDH蛋白,并用来制备针对该蛋白的抗体。这些抗体可用来对植物突变体进行筛选,来寻找不产生LKR/SDH蛋白或产生比亲本植物量少的该蛋白的突变体。可以将表达减少的LKR/SDH蛋白或完全不表达该蛋白的植物突变体与表达基本上对赖氨酸不敏感的DHDPS的植物杂交。富含赖氨酸的多肽的设计
可能需要将产生的高水平赖氨酸转化成一种对降解不敏感的形式,例如通过将其整合成双体、三体或寡聚肽,或一种富含赖氨酸的贮藏蛋白。已知没有富含赖氨酸的天然蛋白。
本发明的一个方面是设计能在体内表达来用作一种富含赖氨酸的种子贮藏蛋白的多肽。多肽是氨基酸的线性多聚体,在链中一个氨基酸的α羧基与下一个氨基酸的α氨基共价连接。链中残基之间以及与周围溶质的非共价相互作用决定了分子的最后构象。本领域的技术人员在设计一种稳定折叠的多肽链时肯定会考虑静电力、氢键、范德华力、疏水相互作用和各个氨基酸残基的构象优先(见例子:Creighton,(1984)Proteins,Structures and Molecular Properties,W.H.Freeman and Company,New York,pp133-197,或Schulz et al.,(1979)Principles of Protein Structure,Springer Verlag,NewYork,pp27-45)。相互作用的数目和它们的复杂性提示,在可能时设计可使用天然蛋白模型作为辅助。
本发明包含的合成性贮藏蛋白是选择来作为这样一种多肽,该多肽很可能相对于植物种子中蛋白的平均水平富含赖氨酸。赖氨酸在生理pH下是一种带电荷的氨基酸,因此通常在蛋白分子的表面被发现(Chothia,(1976)Journal of Molecular Biology 105:1-14)。为使赖氨酸的含量最大,本发明的申请者为本发明所包含的合成性贮藏蛋白选择了一种具有高比面值的分子形状。另外的选择是将多数蛋白的普通球形形状延伸来形成一种杆状延伸结构或使球形形状变扁成一种碟状结构。本发明的申请者选择了前一种构象,因为在纤维蛋白族中有数种长杆状蛋白的天然模型(Creighton,(1984)Proteins,Structures and Molecular Properties,W.H.Freeman and Company,New York,p191)。
绕线结构是纤维蛋白族中研究比较彻底的一种类型(见Cohen etal.(1986)Trends Biochem.Sci.11:245-248)。天然例子发现于α-角蛋白、副肌球蛋白、轻酶解肌球蛋白和原肌球蛋白。这些蛋白分子由两个平行的α螺旋组成,这两个α螺旋在一个左手超螺旋中相互缠绕。该超螺旋的重复距离是140(与之相比,单个螺旋每圈的重复距离是5.4)。超螺旋在两个单个的α螺旋的轴间产生轻微的扭曲(10°)。
在绕线中单个螺旋每圈有3.5个残基,从而在超螺旋中导致精确的7个残基的周期性(见图1)。因此就螺旋轴而言,多肽链中每7个残基占据相同的位置。如图1和2a所示,本发明的申请者用(d、e、f、g、a、b、c)来表示本发明的这种七价单位的七个位置。这符合用于绕线文献的传统。
七价的a和d氨基酸在初级结构中遵循一种4、3重复模式,并处在一个单个α螺旋的一个侧面(见图1)。当一个α螺旋的一个侧面的氨基酸都是非极性时,螺旋的该侧面是疏水性的,并可与其他的疏水表面如另一个相似螺旋的非极性侧面结合。当两个螺旋二聚体化使它们的疏水侧面相互并列时,就产生了一种绕线结构(见图2a)。
在天然绕线结构中α螺旋组分的外表面的氨基酸(b、c、e、f、g)通常是极性的,这与预期的球蛋白中暴露和埋藏残基类型的模式一致(Schulz,et al.,(1979)Principles of Protein Structure.Springer Verlag,New York,p12;Talbot et al.(1982)Acc.Chem.Res.15:224-230;Hodges et al.,(1981)Journal of BiologicalChemistry 256:1214-1224)。有时发现带电荷的氨基酸在相对链的位置e和g’或g和e’之间形成盐桥(见图2a)。
这样,两个两亲性螺旋如图1中所示的螺旋通过a、a’、d和d’残基之间的疏水相互作用组合以及通过e和g’和/或g和e’残基之间的盐桥连接在一起。疏水残基被包裹在超螺旋内使链维持“注册(inregister)”。对于仅含几圈α螺旋链组分的短肽来说,螺旋轴之间的10°扭曲可以忽略不计,两条链可以认为是平行的(如图2a中所示)。
文献中已经报道了大量的合成性绕线结构(Lau et al.,(1984)Journal of Biological Chemistry 259:13253-13261;Hodges etal.,(1988)Peptide Research 1:19-30;DeGrado et al.,(1989)Science 243:622-628;O’Neil et al.,(1990)Science 250:646-651)。虽然这些多肽大小不同,Lau等人发现29个氨基酸足以二聚体化来形成绕线结构(Lau et al.,(1984)Journal of BiologicalChemistry 259:13253-13261)。本发明的申请者按28残基来构建本发明的多肽,构建更大的链是为了构象稳定。
本发明的多肽被设计来与一种绕线基元在水性环境中二聚体化。本发明的申请者使用一种疏水相互作用和静电相互作用的组合来使绕线构象稳定。多数非极性残基被限制在a和d位置来产生一种与螺旋轴平行的疏水条带。这是二聚体化面。本发明的申请者避免沿该侧面使用大侧链氨基酸来减少二聚体化的空间干扰作用,并有利于形成稳定的绕线结构。
尽管最近的文献报道提示,甲硫氨酸在位置a和d使亮氨酸拉链类型中的绕线结构不稳定(Landschuiz et al.,(1989)Science 243:1681-1688 and Hu et al.,(1990)Science 250:1400-1403),本发明的申请者仍选择甲硫氨酸来取代SSP多肽的疏水侧面上的亮氨酸。甲硫氨酸在分子形状上与亮氨酸相似(图3)。本发明的申请者证明,疏水核心中的甲硫氨酸引起的绕线结构不稳定似乎集中在这样一种序列中,在该序列中盐桥(e-g’和g-e’)在螺旋中的任何可能的位置上产生(即每个七价结构两次)。
为达到与制备一种富含赖氨酸多肽的目标匹配的程度,本发明的申请者将多肽中的不平衡电荷减少到最低。这有助于在体内表达时防止合成性的贮藏蛋白与其他植物蛋白间的不需要的相互作用。
本发明的多肽被设计成能自发折叠成一种精确的、构象稳定的结构---α螺旋绕线结构,并且在一级序列上限制最少。这就使合成性贮藏蛋白能够根据特殊的最终使用要求进行定制。使用七价重复单位中的b、c和f位置,任何氨基酸都可以以每7个残基中大于1的频率进行整合。本发明的申请者指出,在本发明的合成性贮藏蛋白中,可以整合高达43%的选自异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苏氨酸和缬氨酸的必需氨基酸,可以整合高达14%的选自苯丙氨酸、色氨酸和酪氨酸的必需氨基酸。
在SSP中,只有Met、Leu、Ile、Val或Thr位于疏水核心。而且,SSP中的e、g、e’和g’位置受到限制,从而在一个SSP双体的两条多肽链之间的这些位置通常产生一种静电吸引力。这使SSP多肽在双体时更稳定。
这样,本发明介绍的新型合成性贮藏蛋白代表了可能为绕线多肽的一种特殊类型。并不是所有能在水性溶液中采用一种两亲性α螺旋构象的多肽都能使用于这里介绍的本发明。
由本发明的申请者的工作得到的以下规则规定了本发明的申请者在其发明中使用的SSP多肽:
合成性多肽包含n个七价单位(d、e、f、g、a、b、c),每个七价单位可以相同或不同,其中:
n至少为4;
a和d独立地选自Met、Leu、Val、Ile和Thr;
e和g独立地选自酸/碱对Glu/Lys、Lys/Glu、Arg/Glu、Arg/Asp、Lys/Asp、Glu/Arg、Asp/Arg和Asp/Lys;
b、c和f独立地选自除了Gly或Pro的任何氨基酸,并且每个七价单位中b、c和f的至少两个氨基酸选自Glu、Lys、Asp、Arg、His、Thr、Ser、Asn、Gln、Cys和Ala。编码富含赖氨酸的多肽的嵌合基因
编码上面介绍的多肽的DNA序列可根据遗传密码进行设计。在特定氨基酸存在多个密码子时,可以选择那些在植物中翻译优选的密码子。对应于这些DNA序列的寡核苷酸可用一种ABI DNA合成仪合成,使用本领域技术人员熟知的方法与对应于互补链的寡核苷酸退火,并插入到一种质粒载体中。编码的多肽序列可通过在合成基因的限制内切酶位点插入另外的退火寡核苷酸来延长。构建编码本发明的富含赖氨酸的多肽的基因的一些代表性的策略以及优选实施方案的DNA和氨基酸序列在实施例21中提供。
一种设计来表达编码一种富含赖氨酸的多肽的合成性贮藏蛋白基因的RNA的嵌合基因可通过将该基因与上面介绍的任何植物启动子序列连接来构建。优选的启动子为种子特异性启动子。就大豆、油菜和其他双子叶植物而言,来自一种菜豆蛋白基因、一种β-伴大豆球蛋白基因、大豆球蛋白基因、Kunitz胰蛋白酶抑制基因、或油菜napin基因的强种子特异性启动子将是优选的。就玉米或其他单子叶植物而言,一种强的胚乳特异性启动子如10kD或27kD玉米醇溶蛋白启动子或一种强的胚特异性启动子如玉米球蛋白1启动子将是优选的。
为获得表达编码一种富含赖氨酸的多肽的合成性贮藏蛋白的嵌合基因的植物,可用上面介绍的任何方法转化植物。为获得表达一种嵌合SSP基因和编码基本上对赖氨酸不敏感的DHDPS和AK的嵌合基因二者的植物,可将SSP基因与编码对赖氨酸基本上不敏感的DHDPS和AK的嵌合基因连接,并将三种基因通过转化导入植物。另外,也可将嵌合的SSP基因导入以前转化的表达基本上对赖氨酸不敏感的DHDPS和AK的植物中,或将SSP基因导入正常植物,然后将获得的转化子与表达基本上对赖氨酸不敏感的DHDPS和AK的植物杂交。
含有赖氨酸生物合成基因的转化植物与含有富含赖氨酸蛋白基因的转化植物遗传杂交的结果(实施例23)证明,种子中的总赖氨酸水平可通过这些基因的同时表达而增加。这个结果特别令人振奋,因为在杂合子中所有转基因的基因拷贝数都减少了。预期如果生物合成基因和富含赖氨酸蛋白基因都是纯合子时,赖氨酸水平会进一步增加。使用cts/lysC-M4嵌合基因作为植物转化的选择性标记
许多植物的细胞培养物和幼苗的生长可被高浓度的赖氨酸加苏氨酸抑制。生长可通过加入甲硫氨酸(或高丝氨酸,它在体内可转化为甲硫氨酸)来恢复。赖氨酸加苏氨酸抑制被认为是内源性AK的反馈抑制造成的,这种反馈抑制减少了该途径的流通量,从而导致甲硫氨酸饥饿。在烟草中,在叶中有两种AK酶,一种为赖氨酸敏感型,一种为苏氨酸敏感型。(Negrutui et al.,(1984)Theor.Appl.Genet.68:11-20)。高浓度的赖氨酸加苏氨酸抑制苗从烟草叶盘中生长,并且抑制可通过加入低浓度的甲硫氨酸逆转。因此,生长抑制很可能是由于两种AK同功酶的抑制。
有活性的赖氨酸和苏氨酸不敏感的AKIII-M4的表达也能逆转赖氨酸加苏氨酸生长抑制(表2,实施例7)。在表达的AKIII-M4蛋白水平与对赖氨酸加苏氨酸的抗性之间有很好的相关性。赖氨酸敏感的野生型AKIII的表达没有相似的结果。因为AKII-M4蛋白的表达允许在通常为抑制的环境下生长,如实施例13和17所说明的,一种能在植物中引起AKIII-M4表达的嵌合基因可用作转化的一种选择性遗传标记。
                       实施例
本发明在下面的实施例中作进一步的说明,在这些实施例中,除非另外说明,所有的部分和百分比都用重量来表示,温度用摄氏温度表示。应当理解,这些实施例说明本发明的优选实施方案,它们仅仅是用来进行说明。由上面的讨论和这些实施例,本发明的技术人员可明确本发明的基本特征,并在不偏离其精神和范围的情况下,能够对本发明进行不同的改变和修饰,使之适应不同的用途和环境。
                      实施例1大肠杆菌lysC基因的分离和lysC中导致赖氨酸不敏感AKIII的突变
以前已经对大肠杆菌lysC基因进行了克隆、限制酶切图谱绘制和序列测定(Cassan et al.(1986)J.Biol.Chem.261:1052-1057)。在本发明中,lysC基因由一个噬菌体λ克隆上获得,该噬菌体克隆来自一个订购的文库,该文库包含3400个克隆的大肠杆菌DNA的重叠片段,并由Kohara、Akiyama和Isono构建(Kohara et al.(1987)Cell 50:595-508)。该文库提供了整个大肠杆菌染色体的一个物理图谱并将物理图谱与遗传图谱联系。由下列知识:lysC的图谱位置在大肠杆菌遗传图谱的90分钟处(Theze et al.(1974)J.Bacteriol.117:133-143),克隆基因的限制内切酶图谱(Cassan etal.(1986)J.Biol.Chem.261:1052-1057),以及大肠杆菌文库中克隆的DNA片段的限制内切酶图谱(Kohara et al.(1987)Cell 50:595-508),我们可以选择λ噬菌体4E5和7A4(Kohara et al.(1987)Cell 50:595-508)作为可能携带lysC基因的候选物。噬菌体按介绍(见Current Protocols in Molecular Biology(1987)Ausubel etal.Eds.John Wiley & Sons New York)使用LE392作为宿主(见Sambrook et al.(1989)Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory Press)由单个噬菌斑在液体中培养。噬菌体DNA按介绍(见Current Protocols in Molecular Biology(1987)Ausubel et al.Eds.John Wiley & Sons New York)用酚抽提进行制备。
由基因序列预测了几个lysC基因特征性的限制内切酶片段,包括一个1860bp的EcoR I-Nhe I片段、一个2140bp的EcoR I-Xmn I片段和一个1600bp的EcoR I-BamH I片段。在两种噬菌体DNA中检测到了这些片段的每一个,这证明它们携带了lysC基因。分离EcoRI-Nhe I片段,并亚克隆到用同样酶切消化的质粒pBR322中,产生了一种氨苄青霉素抗性、四环素敏感的大肠杆菌转化子,此质粒被命名为pBT436。
为使克隆的lysC基因有功能,将pBT436转化到大肠杆菌菌株Gif106M1(E.coli Genetic Stock Center Strain CGSC-5074)中,该菌株在三个大肠杆菌AK基因的每一个中都有突变(Theze et al.(1974)J.Bacteriol.117:133-143)。该菌株缺乏所有的AK活性,因此需要二氨基庚二酸(赖氨酸的一种前体,也是细胞壁生物合成必需的)、苏氨酸和甲硫氨酸。在转化的菌株中,所有这些营养需要都被解除,这证明克隆的lysC基因编码有功能的AKIII。
在生长培养基中加入浓度约为0.2mM的赖氨酸(或二氨基庚二酸,它在体内能很容易地转化为赖氨酸)将抑制用pBT436转化的Gif106M1的生长。使用补加有精氨酸和异亮氨酸(Gif106M1生长所需)以及氨苄青霉素(维持对pBT436质粒的选择)的M9培养基(见Sambrook et al.(1989)Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory Press)。这种抑制可通过在生长培养基中加入苏氨酸加赖氨酸进行逆转。这些结果表明,AKIII可被外源性添加的赖氨酸抑制而导致对其他由天冬氨酸衍生的氨基酸的饥饿。可以使用pBT436转化的Gif106M1来选择编码赖氨酸不敏感的AKIII的lysC突变。
挑取用pBT436转化的Gif106M1的单菌落,重悬于200uL的由100uL 1%赖氨酸加100uL的M9培养基混合的一种混合物中。将含有107至108细胞的整个细胞悬液涂布在一个培养皿中,培养皿中含有补加了精氨酸、异亮氨酸和氨苄青霉素的M9培养基。如此制备16个培养皿。16个培养皿中有11个出现了1至20个菌落,从中挑取一个或两个(如果可能)菌落,再次检测赖氨酸抗性。由此获得了9个赖氨酸抗性菌落。从8个这样的克隆中制备质粒,并重新转化至Gif106M1来确定赖氨酸抗性决定子是否为质粒携带。8个质粒中有6个产生了赖氨酸抗性克隆。这6个克隆中有3个携带编码不被15mM赖氨酸抑制的AKIII的lysC基因,而野生型AKIII被0.3-0.4mM赖氨酸50%抑制,并被1mM赖氨酸>90%抑制(详见实施例2)。
为确定赖氨酸抗性的分子基础,对野生型lysC基因和三种突变基因的序列进行了测定。使用了一种“使用SequenaseTM用小量制备的DNA进行双链模板测序”的方法(Kraft et al.(1988)BioTechniques6:544-545)。为便于测序,根据已发表的lysC序列合成了跨越每200bp的寡核苷酸引物。pBT436中克隆的野生型lysC基因的序列(SEQ IDNO:1)在编码区的5个位置与已发表的lysC序列不同。这些核苷酸差异中有四个在密码子的第三个位置,不会导致AKIII蛋白的氨基酸序列改变。有一个在AKIII的氨基酸58处导致一个半胱氨酸至甘氨酸的取代。这些差异可能是由于克隆lysC基因的不同菌株导致的。
编码赖氨酸不敏感AK的三种突变lysC基因的序列每种只与野生型序列有单一一个核苷酸的差异,从而在蛋白中产生一个单一的氨基酸取代。突变体M2在SEQ ID NO:1的954核苷酸处有一个A取代G,从而在氨基酸318处产生一个异亮氨酸取代甲硫氨酸,突变体M3和M4在SEQ ID NO:1的1055核苷酸处有一个相同的T取代C,从而在氨基酸352处产生一个异亮氨酸取代苏氨酸。因此,这两种单一氨基酸取代都足以使AKIII酶对赖氨酸抑制不敏感。
                       实施例2在大肠杆菌中高水平表达野生型和突变型lysC基因
使用下列寡核苷酸将一个Nco I(CCATGG)位点插入在lysC基因的翻译起始密码子处:SEQ ID NO:2GATCCATGGC TGAAATTGTT GTCTCCAAAT TTGGCGSEQ ID NO:3GTACCGCCAA ATTTGGAGAC AACAATTTCA GCCATG在退火时,这些寡核苷酸具有BamH I和Asp718“粘性”末端。质粒pBT436用BamH I和Asp718消化,前者切去lysC编码序列的上游,后者切去起始密码子下游31个核苷酸。将退火的寡核苷酸与质粒载体连接,并获取大肠杆菌转化子。制备质粒DNA,并根据一个Nco I位点的存在筛选寡核苷酸的插入。将含有该位点的一个质粒测序来确定插入的正确性,并将其命名为pBT457。除了在lysC的起始密码子处制造一个Nco I位点,该寡核苷酸插入还改变了第二个密码子,即从编码丝氨酸的TCT改变为编码丙氨酸的GCT。这个氨基酸取代对AKIII的酶活性没有明显的影响。
为在大肠杆菌中获得lysC基因的高水平表达,使用细菌表达载体pBT430。这个载体是pET-3a的一个衍生物(Rosenberg et al.(1987)Gene 56:125-135),它应用了噬菌体T7 RNA聚合酶/T7启动子系统。质粒pT430是通过首先将pET-3a中的EcoR I和Hind III在原始位置破坏来构建的。将一个含有EcoR I和Hind III位点的寡核苷酸接头插入到pET-3a的BamH I位点。这在pET-3a中制造了一个额外的单一克隆位点用于将基因插入到该载体中。然后,用寡核苷酸定点诱变将翻译起始位置的Nde I位点转变为一个Nco I位点。pET-3aM中这个区域的5’-CATATGG就被转变为pBT430中的5’-CCCATGG。
将lysC基因以一个1560bp的Nco I-EcoR I片段的形式从质粒pBT457中切出,并插入到用相同酶消化的表达载体pBT430中,产生质粒pBT461。为表达突变的lysC基因(M2、M3和M4),pBT461用Kpn I-EcoR I消化,去除自翻译起始密码子约30个核苷酸下游的野生型lysC基因,并插入来自突变基因的同源Kpn I-EcoR I片段,分别产生质粒PBT490、pBT491和pBT492。
为获得高水平表达,将每种质粒转化到大肠杆菌菌株BL21(DE3)中(Studier et al.(1986)J.Mol.Biol.189:113-130)。培养物在含有氨苄青霉素的LB培养基中在25℃生长。在600nm处的光密度约为1时,加入IPTG(异丙基-β-半乳糖苷,诱导物)至终浓度0.4mM,继续在25℃温育3小时。离心收集细胞,在原培养物体积的1/20(或1/100)的50mM NaCl、50mM Tris-Cl、pH7.5、1mM EDTA中重新悬浮,并在-20℃冷冻。取1ml冷冻物在37℃融化,并在冰-水槽中超声波破碎来裂解细胞。裂解物在4℃用15000rpm离心5分钟,移去上清,将沉淀重新悬浮于1mL的上述缓冲液.
未诱导和IPTG诱导的BL21(DE3)/pBT461培养物的上清和沉淀部分用SDS聚丙烯酰胺凝胶电泳进行分析。诱导培养物上清中用考马斯蓝染色可见的主要蛋白具有约48kd的分子量,这是AKIII的预期大小。约80%的AKIII蛋白存在于上清中,AKIII占抽提物中总大肠杆菌蛋白的10-20%。
AK活性按如下所示进行分析:分析混合物(用于12个分析试管)4.5mL H2O1.0mL 8M KOH1.0mL 8M NH2OH-HCl1.0mL 1M Tris-HCl pH8.00.5mL 0.2M ATP(121mg/mL于0.2M NaOH中)50uL 1M MgSO4每只1.5mL eppendorf分析试管含:0.64mL分析混合物0.04mL 0.2M L-天冬氨酸或0.04mL H2O0.0005-0.12mL抽提物加水至总体积0.8mL
将分析试管在30℃温育所需的时间(10-60分钟),然后加入0.4mL的FeCl3试剂(10%w/v FeCl3、3.3%三氯乙酸、0.7M HCl),并将上述物质在一只eppendorf离心管中离心2分钟。倒出上清,在540nm处读OD值,并与天冬氨酰异羟肟酸标准比较。
大约80%的AKIII活性存在于上清部分中。野生型和突变型粗抽提物的比活为每毫克总蛋白每分钟5-7uM产物。野生型AKIII在试验中对L-赖氨酸的存在敏感。在浓度为约0.4mM发现50%的抑制,在约1.0mM时发现90%的抑制。相反,突变体AKIII-M2、M3和M4(见实施例1)完全不被15mM的L-赖氨酸抑制。
按如下方法从IPTG诱导的培养物的上清中纯化野生型的AKIII蛋白。在1mL抽提物中,加入0.25mL的10%硫酸链霉素,并在4℃保温过夜。混合物在4℃用15000rpm离心15分钟。收集上清,用一个Sephadex G-25 M柱(Column PD-10,Pharmacia)脱盐。然后将其上一个Mono-Q HPLC柱,并用0-1M的NaCl梯度洗脱。将两个含有大多数AKIII活性的1mL级份混合、浓缩、脱盐,并上一个HPLC分子筛柱(TSK G3000SW)。将级份用20mM KPO4缓冲液、pH7.2、2mMMgSO4、10mM β-巯基乙醇、0.15M KCl、0.5mM L-赖氨酸洗脱,用SDS聚丙烯酰胺凝胶电泳发现其纯度大于95%。将纯化的AKIII蛋白送至Hazelton Research Facility(310 Swampridge Road,Denver,PA 17517)来制备针对该蛋白的抗体。
                      实施例3大肠杆菌和谷氨酸棒杆菌dapA基因的分离
以前已经对大肠杆菌dapA基因(ecodapA)进行了克隆、限制酶切图谱绘制和序列测定(Richaud et al.(1986)J.Bacteriol.166:297-300)。在本发明中,dapA基因由一个噬菌体λ克隆上获得,该噬菌体克隆来自一个订购的文库,该文库包含3400个克隆的大肠杆菌DNA的重叠片段,并由Kohara、Akiyama和Isono构建(Kohara et al.(1987)Cell 50:595-508,见实施例1)。由下列知识:dapA的图谱位置在大肠杆菌遗传图谱的53分钟处(Bachman(1983)Microbiol.Rev.47:180-230),克隆基因的限制内切酶图谱(Richaud et al.(1986)J.Bacteriol.166:297-300),以及大肠杆菌文库中克隆的DNA片段的限制内切酶图谱(Kohara et al.(1987)Cell 50:595-508),我们可以选择λ噬菌体4C11和5A8(Kohara et al.(1987)Cell50:595-508)作为可能携带dapA基因的候选物。噬菌体按介绍(见Current Protocols in Molecular Biology(1987)Ausubel et al.Eds.John Wiley & Sons New York)使用LE392作为宿主(见Sambrooket al.(1989)Molecular Cloning,A Laboratory Manual,ColdSpring Harbor Laboratory Press)由单个噬菌斑在液体中培养。噬菌体DNA按介绍(见Current Protocols in Molecular Biology(1987)Ausubel et al.Eds.John Wiley & Sons New York)用酚抽提进行制备。两个噬菌体含有预期为dapA基因的约2.8kb的Pst I DNA片段(Richaud et al.(1986)J.Bacteriol.166:297-300)。从消化的噬菌体5A8中分离片段,并将其插入到Pst I消化的载体pBR322中,产生质粒pBT427。
棒状杆菌dapA基因(cordapA)基因是用聚合酶链反应(PCR)从ATCC菌株13032的基因组DNA获得的。棒状杆菌dapA基因的核苷酸序列已经发表(Bonnassie et al.(1990)Nucleic Acids Res.18:6421)。由该序列可以设计用于聚合酶链反应(PCR)的寡核苷酸引物,来扩增含有该基因的DNA片段,同时,在基因的起始密码子(Nco I)和紧接着终止密码子的后面(EcoR I)加入单一的限制内切酶位点。寡核苷酸引物为:SEQ ID NO:4CCCGGGCCAT GGCTACAGGT TTAACAGCTA AGACCGGAGT AGAGCACTSEQ ID NO:5GATATCGAAT TCTCATTATA GAACTCCAGC TTTTTTC
PCR使用一个Perkin-Elmer Cetus试剂盒按照厂商的说明在一台相同公司制造的热循环仪上进行。反应产物在上琼脂糖凝胶电泳并用溴化乙啶染色时,显示约900bp的强烈的DNA带,该大小为棒状杆菌dapA基因的预期大小。将该PCR产生的片段用限制内切酶Nco I和EcoR I消化,并插入到用相同酶切的表达载体pBT430中(见实施例2)。除了在翻译起始位点处引入一个Nco I位点,该PCR引物还将第二个密码子从编码丝氨酸的AGC改变为编码丙氨酸的GCT。分离到了几个表达有活性的、对赖氨酸不敏感的DHDPS(见实施例4),这表明第二个密码子的氨基酸取代并不影响活性,其中一个克隆被命名为FS766。
将含有PCR产生的棒状杆菌dapA基因的Nco I和EcoR I片段亚克隆到来自Promega的噬菌粒载体pGEM-9zf(-)中,制备单链DNA并进行序列测定。该序列示于SEQ ID NO:6。
除了已经提到的在第二个密码子的不同外,还有两个位置---核苷酸798和799不同,该序列基本与已发表的序列匹配。在已发表的序列中,这两个位置是TC,而在示于SEQ ID NO:6的基因中,它们是CT。这个变化导致亮氨酸取代丝氨酸的氨基酸取代。该差异产生的原因不明。其原因可能是已发表的序列中的一个错误、用来分离该基因的菌株的不同或PCR产生的错误。后者似乎不可能,因为在至少三个独立分离的PCR产生的dapA基因中观察到了相同的改变。该差异对DHDPS的酶活性没有明显的影响(见实施例4)。
                      实施例4在大肠杆菌中高水平表达大肠杆菌和谷氨酸棒杆菌dapA基因
使用寡核苷酸定向诱变将一个Nco I位点(CCATTG)插入在大肠杆菌dapA基因的翻译起始密码子处。将质粒pBT427(见实施例3)中的含有dapA基因的2.8kb的Pst I DNA片段插入噬菌粒载体pTZ18R(Pharmicia)的Pst I位点,产生pBT431。将dapA基因定向为使编码链存在于单链噬菌粒DNA。寡核苷酸定向诱变使用一个来自Bio-Rad的Muta-Gene试剂盒按照厂商的程序进行,并使用如下所示的诱变引物。SEQ ID NO:7CTTCCCGTGA CCATGGGCCA TC可能的突变体通过一个Nco I位点的存在进行筛选,通过DNA测序,一个被命名为pBT437的质粒显示在突变附近含有合适的序列。在翻译起始密码子处加入一个Nco I位点也导致第二个密码子从编码苯丙氨酸的TCC改变为编码缬氨酸的GTC。
为在大肠杆菌中高水平表达dapA基因,使用了一种细菌表达载体pBT430(见实施例2)。将大肠杆菌dapA基因以一个1150bp的NcoI-Hind III片段的形式从质粒pBT437中切出,并插入到用相同酶消化的表达载体pBT430中,产生质粒pBT442。为表达棒状杆菌的dapA基因,使用插入在pBT430中的SEQ ID NO:6的910bp Nco I至EcoRI片段(pFS766,见实施例3)。
为获得高水平表达,将每种质粒转化到大肠杆菌菌株BL21(DE3)中(Studier et al.(1986)J.Mol.Biol.189:113-130)。培养物在含有氨苄青霉素的LB培养基中在25℃生长。在600nm处的光密度约为1时,加入IPTG(异丙基-β-半乳糖苷,诱导物)至终浓度0.4mM,继续在25℃温育3小时。离心收集细胞,在原培养物体积的1/20(或1/100)的50mM NaCl、50mM Tris-Cl、pH7.5、1mM EDTA中重新悬浮,并在-20℃冷冻。取1ml冷冻物在37℃融化,并在冰-水槽中超声波破碎来裂解细胞。裂解物在4℃用15000rpm离心5分钟,移去上清,将沉淀重新悬浮于1mL的上述缓冲液。
未诱导和IPTG诱导的BL21(DE3)/pBT442或BL21(DE3)/pFS766培养物的抽提物的上清和沉淀部分用SDS聚丙烯酰胺凝胶电泳进行分析。在两种诱导培养物的上清和沉淀部分中用考马斯蓝染色见到的主要蛋白具有32-34kd的分子量,这是DHDPS的预期大小。即使在未诱导的培养物中,这种蛋白也是产生的最主要的蛋白。
在BL21(DE3)/pBT442的IPTG诱导的培养物中,约80%的DHDPS蛋白存在于上清中,DHDPS占抽提物中总蛋白的10-20%。在BL21(DE3)/pFS766的IPTG诱导的培养物中,超过50%的DHDPS蛋白存在于沉淀部分中。在两种情况下,沉淀部分都是90-95%纯的DHDPS,并且没有明显数量的其他单种蛋白。因此这些部分有足够的纯度来用于产生抗体。将含有2-4mg大肠杆菌DHDPS或棒状杆菌DHDPS的沉淀部分溶解于50mM NaCl、50mM Tris-Cl、pH7.5、1mM EDTA、0.2mM二硫苏糖醇、0.2%SDS中,并送至Hazelton Research Facility(310Swampridge Road,Denver,PA 17517)来制备针对该蛋白的抗体。
DHDPS的酶活性按下面进行分析:分析混合物(用于10×1.0mL分析试管或40×0.25mL微量皿)2.5mL    H2O0.5mL    1.0M Tris-HCl pH8.00.5mL    0.1M丙酮酸钠0.5mL    邻氨基苯甲醛(乙醇中,10mg/mL)25uL     1.0N HCl中的1.0M DL-天冬氨酰-β-半醛
                   分析(1.0mL):             微量分析(0.25mL):DHDPS分析混合物          0.40mL                  0.10mL酶抽提物+水              0.10mL                  0.025mL10mM L-赖氨酸            5uL或20uL               1uL或5uL在30℃温育所需的时间,加入如下进行终止:1.0N HCl                0.50mL                  0.125mL显色30-60分钟。在eppendorf离心机中离心沉淀。将OD540对0分钟读作空白。对于微量分析,在微滴定池中加入每份0.2mL,在OD530处读数。
诱导的抽提物的上清部分中的大肠杆菌DHDPS的比活在1.0mL分析中约为每毫克蛋白每分钟50 OD540单位。在试验中大肠杆菌DHDPS对L-赖氨酸的存在敏感。在约0.5mM的浓度时发现50%的抑制。对棒状杆菌DHDPS来说,在非诱导的抽提物而不是诱导的抽提物的上清部分中检测到酶活性。在0.25mL试验中,酶活性为每毫克蛋白每分钟约4 OD530单位。与大肠杆菌DHDPS相对,棒状杆菌DHDPS完全不被L-赖氨酸抑制,即使在浓度为70mM时也是这样。
                     实施例5表达高水平DHDPS和/或AKIII的大肠杆菌的氨基酸分泌
含有大肠杆菌dapA基因与T7 RNA聚合酶启动子相连的大肠杆菌表达盒通过如下来分离:用Bgl II和BamH I消化pBT442(见实施例4),通过琼脂糖凝胶电泳使消化产物分开,从凝胶中洗脱约1250bp的片段。将此片段插入到质粒pBT461(含有T7启动子/lysC基因)和pBT492(含有T7启动子/lysC-M4基因)的BamHI位点处。用限制性内切酶分析鉴定两种基因以相同方向转录的插入子,由此产生了质粒pBT517(T7/dapA+T7/lysC-M4)和pBT519(T7/dapA+T7/lysC)。
为诱导大肠杆菌产生和分泌氨基酸,将这些质粒以及质粒pBT442、pBT461和pBT492(以pBR322作为对照)转化到大肠杆菌菌株BL21(DE3)中(Studier et al.(1986)J.Mol.Biol.189:113-130)。所有这些质粒尤其是pBT517和pBT519在这种宿主中有些不稳定,需要在生长过程中通过选择氨苄青霉素抗性来小心维持。
将所有的菌株在基本盐的M9培养基(见Sambrook et al.(1989)Molecular Cloning,A Laboratory Manual,Cold Spring HarborLaboratory Press)中在37℃生长过夜,M9培养基补加有氨苄青霉素来维持对质粒的选择。当达到OD600为1时收集培养物。离心去除细胞,将上清(3mL)通过0.2微米的滤膜以去除残余的细胞和大分子。将5毫升的上清部分在一台Beckman Model 6300氨基酸分析仪上用过柱后的茚三酮检测分析其氨基酸组成。结果示于表1。
                         表1
             培养物上清中的氨基酸浓度(mM)
Plasmid    Lys    Thr    Met    Ala    Val    Asp    Glu
pBR322      0      0      0     0.05   0.1     0      0
pBT442     0.48    0      0     0.04   0.06    0      0
pBT461     0.14  0.05     0     0.02   0.03    0      0
pBT492     0.16  0.07     0     0.02   0.03    0      0
pBT517     0.18    0     0.01    0      0     0.02   0.02
pBT519     0.14    0     0.01    0      0     0.01    0
除了pBR322对照外,所有质粒都导致赖氨酸分泌到培养基中。lysC或lysC-M4基因的表达导致赖氨酸和苏氨酸二者的分泌。lysC-M4+dapA的表达导致赖氨酸、甲硫氨酸、天冬氨酸和谷氨酸的分泌,但不导致苏氨酸分泌。此外,在培养物上清中没有检测到丙氨酸和缬氨酸。用lysC+dapA获得了类似的结果,除了没有谷氨酸分泌。
                      实施例6用于在植物中表达的dapA、lysC和lysC-M4嵌合基因的构建
使用几种表达盒来构建用于在植物表达ecodapA、cordapA、lysC和lysC-M4的嵌合基因。一个叶表达盒(图4a)由花椰菜花叶病毒的35S启动子(Odell et al.(1985)Nature 313:810-812;Hull et al.(1987)Virology 86:482-493)、来自叶绿体a/b结合蛋白(Cab)基因的翻译前导序列(Dunsmuir(1985)Nucleic Acids Res.13:2503-2518)和来自胭脂氨酸合成酶(Nos)基因的3’转录终止区域(Depicker et al.(1982)J.Mol.Appl.Genet.1:561-570)组成。5’和3’区域之间是限制内切酶位点Nco I(它包括翻译起始密码子ATG)、EcoR I、Sma I和Kpn I。整个表达盒的两翼是Sal I位点,在表达盒的上游还有一个BamH I位点。
一个种子特异性表达盒(图4b)由来自编码菜豆(Phaseolusvulgaris)的种子贮藏蛋白菜豆蛋白的β亚单位的基因的启动子和转录终止子组成(Doyle et al.(1986)J.Biol.Chem.261:9228-9238)。菜豆蛋白表达盒包括菜豆蛋白的翻译起始密码子上游(5’)约500个核苷酸和翻译终止密码子下游(3’)约1650个核苷酸。5’和3’区域之间是单一的限制内切酶位点Nco I(它包括翻译起始密码子ATG)、Sma I、Kpn I和Xba I,整个表达盒的两翼是Hind III位点。
第二个种子特异性表达盒用于cordapA基因。它由来自大豆Kunitz胰蛋白酶抑制蛋白3(KTI3)的启动子和转录终止子组成(Jofuku et al.(1989)Plant Cell 1:427-435)。KTI3表达盒包括菜豆蛋白的翻译起始密码子上游(5’)约2000个核苷酸和翻译终止密码子下游(3’)约240个核苷酸。5’和3’区域之间是单一的限制内切酶位点Nco I(它包括翻译起始密码子ATG)、Xba I、Kpn I和SmaI,整个表达盒的两翼是BamH I位点。
一个玉米的组成型表达盒用于lysC-M4基因和ecodapA基因的表达。它由一个嵌合启动子和来自一个未知功能的玉米基因的3’区域组成,该嵌合启动子衍生自两个玉米启动子的片段,并通过体外定向诱变修饰产生一种高水平的组成型启动子。5’和3’区域之间是单一的限制内切酶位点Nco I(它包括翻译起始密码子ATG)、Sma I和Bgl II。组成型玉米表达盒的核苷酸序列示于SEQ ID NO:93。
已知植物氨基酸生物合成酶位于叶绿体中,因此在合成时带有一个叶绿体靶向信号。细菌蛋白如DHDPS和AKIII没有这样的信号。因此在一些嵌合基因中,一种叶绿体转运序列(cts)融合到ecodapA、cordapA、lysC和lysc-M4编码序列中。使用的cts以来自大豆的核酮糖1,5-二磷酸羧化酶小亚基的cts为基础(Berry-Lowe et al.(1982)J.Mol.Appl.Genet.1:483-498)。按下面的介绍合成和使用寡核苷酸SEQ ID NO:8-11。对玉米来说,使用的cts以来自玉米的核酮糖1,5-二磷酸羧化酶小亚基的cts为基础(Lebrun et al.(1987)Nucleic Acids Res.15:4360),并命名为mcts以将其与大豆cts区分。按下面的介绍合成和使用SEQ ID NO:17-22。
制备了14种嵌合基因:
No.1)35S启动子/Cab前导/lysC/Nos3’
No.2)35S启动子/Cab前导/cts/lysC/Nos3’
No.3)35S启动子/Cab前导/cts/lysC-M4/Nos3’
No.4)菜豆蛋白5’区域/cts/lysC/菜豆蛋白3’区域
No.5)菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域
No.6)355启动子/Cab前导/ecodapA/Nos3’
No.7)35S启动子/Cab前导/cts/ecodapA/Nos3’
No.8)菜豆蛋白5’区域/ecodapA/菜豆蛋白3’区域
No.9)菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’区域
No.10)35S启动子/Cab前导/cts/cordapA/Nos3’
No.11)菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域
No.12)KTI3 5’区域/cts/cordapA/KTI3 3’区域
No.13)HH534 5’区域/mcts/lysC-M4/HH2-1 3’区域
No.14)HH534 5’区域/mcts/ecodapA/HH2-1 3’区域
从电泳后的琼脂糖凝胶中分离一个1440bp的含有整个lysC编码区加90bp的3’非编码区序列的Nco I-Hpa I片段,并将其插入到用Nco I和Sma I消化的叶表达盒中(嵌合基因No.1),产生质粒pBT483。
将编码叶绿体靶向信号的羧基端部分的寡核苷酸SEQ ID NO:8和SEQ ID NO:9退火,产生Nco I匹配末端,通过琼脂糖凝胶电泳纯化,并插入到Nco I消化的pBT461中。用DNA测序来鉴定以正确方向插入的正确序列,产生pBT496。将编码叶绿体靶向信号的氨基端部分的寡核苷酸SEQ ID NO:10和SEQ ID NO:11退火,产生Nco I匹配末端,通过琼脂糖凝胶电泳纯化,并插入到Nco I消化的pBT496中。用DNA测序来鉴定以正确方向插入的正确序列,产生pBT521。如此cts被融合到lysC基因中。
为将cts融合到lysC-M4基因中,用Sal I消化pBT521,并分离一个约900bp的包括cts和lysC的氨基端编码区的DNA片段。将此片段插入到用Sal I消化的pBT492中,结果用融合的cts和lysC的氨基端编码区取代了lysC-M4的氨基端编码区。因为导致赖氨酸不敏感的突变不在被取代的片段中,新产生的质粒pBT523带有融合的cts与lysC-M4。
分离1600bp的含有cts与lysC融合加约90bp的3’非编码区序列的Nco I-Hpa I片段,并将其插入到用Nco I和Sma I消化的叶表达盒中(嵌合基因No.2),产生质粒pBT541;插入到用Nco I和Sma I消化的种子特异性表达盒中(嵌合基因No.4),产生质粒pBT543。
类似地,分离1600bp的含有cts与lysC-M4融合加约90bp的3’非编码区序列的Nco I-Hpa I片段,并将其插入到用Nco I和Sma I消化的叶表达盒中(嵌合基因No.3),产生质粒pBT540;插入到用Nco I和Sma I消化的种子特异性表达盒中(嵌合基因No.5),产生质粒pBT544。
在插入到表达盒之前,ecodapA基因通过修饰在紧接着翻译终止密码子之后插入一个限制内切酶位点Kpn I。为此目的,合成寡核苷酸SEQ ID NO:12-13:SEQ ID NO:12CCGGTTTGCT GTAATAGGTA CCASEQ ID NO:13AGCTTGGTAC CTATTACAGC AAACCGGCAT G
将寡核苷酸SEQ ID NO:12和SEQ ID NO:13退火,在一端产生一个Sph I匹配末端,在另一端产生一个Hind III匹配末端,并插入到用Sph I和Hind III消化的pBT437中。正确序列的插入用DNA测序证实,产生pBT443。
从电泳后的琼脂糖凝胶中分离一个来自pBT443的880bp的含有整个ecodapA编码区的Nco I-Kpn I片段,并将其插入到用Nco I和Kpn I消化的叶表达盒中(嵌合基因No.6),产生质粒pBT450,插入到用Nco I和Kpn I消化的种子特异性表达盒中(嵌合基因No.8),产生质粒pBT494。
将编码叶绿体靶向信号的羧基端部分的寡核苷酸SEQ ID NO:8和SEQ ID NO:9退火,产生Nco I匹配末端,通过琼脂糖凝胶电泳纯化,并插入到Nco I消化的pBT450中。用DNA测序来鉴定以正确方向插入的正确序列,产生pBT451。从电泳后的琼脂糖凝胶中分离一个950bp的来自质粒pBT451的编码叶绿体靶向信号的羧基端部分与整个ecodapA编码区融合的Nco I和Kpn I片段,并插入到用Nco I和Kpn I消化的种子特异性表达盒中,产生质粒pBT495。将编码叶绿体靶向信号的氨基端部分的寡核苷酸SEQ ID NO:10和SEQ ID NO:11退火,产生Nco I匹配末端,通过琼脂糖凝胶电泳纯化,并插入到NcoI消化的pBT451和pBT495中。用DNA测序来鉴定以正确方向插入的正确序列,分别产生pBT455和pBT520。如此cts被融合到叶表达盒中(嵌合基因No.7)和种子特异性表达盒中(嵌合基因No.9)的ecodapA基因中。
从电泳后的琼脂糖凝胶中分离一个来自pFS766的870bp的含有整个cordapA编码区的Nco I-EcoR I片段,并将其插入到用Nco I和EcoR I消化的叶表达盒中,产生质粒pFS789。为将cts与cordapA基因连接,用PCR制备一个含有整个cts的DNA片段。模板DNA为pBT540,使用的寡核苷酸引物为:SEQ ID NO:14GCTTCCTCAA TGATCTCCTC CCCAGCTSEQ ID NO:15CATTGTACTC TTCCACCGTT GCTAGCAA
PCR使用一个Perkin-Elmer Cetus试剂盒按照厂商的说明在一台相同公司制造的热循环仪上进行。PCR产生的160bp片段在存在4种三磷酸脱氧核糖核苷酸的情况下用T4 DNA聚合酶处理以获得一种平末端片段。将cts片段插入到用Nco I消化并用DNA聚合酶Klenow片段填平了5’突出端的pFS789中。用DNA测序确定插入片段和载体/插入子连接的正确性,由此产生含有嵌合基因No.10的pFS846。
从电泳后的琼脂糖凝胶中分离一个来自pFS846的1030bp的含有cts与cordapA编码区连接的Nco I-Kpn I片段,并将其插入到用Nco I和Kpn I消化的菜豆种子表达盒中,产生含有嵌合基因No.11的质粒pFS889,类似地,将来自pFS846的1030bp的Nco I-Kpn I片段插入到用Nco I和Kpn I消化的KTI3种子表达盒中,产生含有嵌合基因No.12的质粒pFS862。
将编码叶绿体靶向信号的羧基端部分的寡核苷酸SEQ ID NO:94和SEQ ID NO:95退火,产生Xba I和Nco I匹配末端,通过琼脂糖凝胶电泳纯化,并插入到Xba I加Nco I消化的pBT492(见实施例2)中。用DNA测序证明正确序列的插入,产生pBT556。将编码叶绿体靶向信号的中间部分的寡核苷酸SEQ ID NO:96和SEQ ID NO:97退火,产生Bgl II和Xba I匹配末端,通过琼脂糖凝胶电泳纯化,并插入到Bgl II和Xba I消化的pBT556中,用DNA测序证明正确序列的插入,产生pBT557。将编码叶绿体靶向信号的氨基端部分的寡核苷酸SEQ IDNO:98和SEQ ID NO:99退火,产生Nco I和Afl II匹配末端,通过琼脂糖凝胶电泳纯化,并插入到Nco I和Afl II消化的pBT557中,用DNA测序证明正确序列的插入,产生pBT558。如此mcts与lysC-M4基因融合。
从电泳后的琼脂糖凝胶中分离一个来自pBT558的1.6kb的含有mcts与lysC-M4基因连接的Nco I-Hpa I片段,并将其插入到用NcoI和Sma I消化的组成型玉米表达盒中,产生含有嵌合基因No.13的质粒pBT573。
为将mcts与ecodapA基因连接,使用上面介绍的PCR制备一个含有整个mcts的DNA片段。模板DNA为pBT558,使用的寡核苷酸引物为:SEQ ID NO:100:GCGCCCACCG TGATGASEQ ID NO:101:CACCGGATTC TTCCGC
将mcts片段插入到用Nco I消化并用DNA聚合酶Klenow片段填平了5’突出端的pBT450(上面)中。用DNA测序确定插入片段和载体/插入子连接的正确性,由此产生pBT576。质粒pBT576用Asp718消化,并用DNA聚合酶Klenow片段处理以产生一种平末端片段,然后用Nco I消化。从电泳后的琼脂糖凝胶中分离所产生的1030bp的含有ecodapA基因与mcts连接的Nco I-平末端片段。将此片段插入到用Bgl II消化、并用DNA聚合酶Klenow片段处理而产生一个平末端、然后用Nco I消化的组成型玉米表达盒中,产生含有嵌合基因No.14的质粒pBT583。
                      实施例7用35S启动子/lysC嵌合基因转化烟草
用35S启动子/lysC嵌合基因转化烟草按下述进行:
35S启动子/Cab前导/lysC/Nos3’、35S启动子/Cab前导/cts/lysC/Nos3’和35S启动子/Cab前导/cts/lysC-M4/Nos3’嵌合基因以3.5-3.6kb的BamH I-EcoR I片段的形式进行分离,并插入到BamH I-EcoR I消化的载体pZS97K(图5)中,分别产生质粒pBT497、pBT545和pBT542。该载体是一种根癌农杆菌的双体Ti质粒载体系统的一部分(Bevan,(1984)Nucl.Acids.Res.12:8711-8720)。该载体含有:(1)嵌合基因胭脂氨酸合成酶启动子/新霉素磷酸转移酶编码区(nos:NPT II)作为转化植物细胞的一个选择标记(Bevan etal.(1983)Nature 304:184-186);(2)Ti质粒的T-DNA的左翼和右翼(Bevan,(1984)Nucl.Acids.Res.12:8711-8720);(3)带有单一限制内切酶位点EcoR I、Kpn I、BamH I和Sal I的大肠杆菌lacZα-互补区段(Viera和Messing(1982)Gene 19:259-267);(4)来自假单胞菌质粒pVS1的细菌复制起始区域(Itoh et al.(1984)Plasmid 11:206-220);(5)来自Tn5的细菌新霉素磷酸转移酶基因(Berg et al.(1975)Proc.Natl.Acad Sci.U.S.A.72:3628-3632)作为转化的根癌农杆菌的一个选择标记。
还将35S启动子/Cab前导/cts/lysC/Nos3’和35S启动子/Cab前导/cts/lysC-M4/Nos3’嵌合基因插入到双体载体pBT456中,分别产生pBT547和pBT546。该载体是pZS97K,其中嵌合基因35S启动子/Cab前导/cts/dapA/Nos3’已经以一个BamH I-Sal I片段的形式插入(见实施例9)。在克隆过程中dapA嵌合基因发生了大的缺失。结果这些质粒与pBT545和pBT542等价,即在植物中表达的转基因(不是选择标记基因NPT II)仅为35S启动子/Cab前导/cts/lysC/Nos3’或35S启动子/Cab前导/cts/lysC-M4/Nos3’。
含有lysC嵌合基因的双体载体用三亲本杂交(Ruvkin et al.(1981)Nature 289:85-88)转移到农杆菌菌株LBA4404/pAL4404(Hockema et al.(1983)Nature 303:179-180)中。用农杆菌转化子接种烟草叶盘(Horsch et al.(1985)Science 227:1229-1231)。在含有卡那霉素的培养基中使转基因植物再生。
为分析转基因植物叶中嵌合基因的表达,按下述方法抽提蛋白。将约2.5克除去中脉的植物幼叶置于一个dounce匀浆器中,并加入0.2克的聚乙烯吡咯烷酮和11ml的50mM Tris-HCl pH8.0、50mMNaCl、1mM EDTA(TNE),彻底磨碎。用Brinkman Polytron Homogenizer在设置7处理20秒将上清进一步匀浆。所获得的上清在Dupont-Sorvall超速离心机上用SS34转头在4℃用16000rpm离心20分钟以去除颗粒物。倒出上清,在需要时加入TNE将体积调为10mL,并加入8mL冷的饱和硫酸铵。将混合物在冰上放置30分钟,并按上面的介绍离心。倒出上清,将含有AKIII蛋白的沉淀重新悬浮于1mL的TNE,并通过一个Sephadex G-25 M柱(Column PD-10,Pharmacia)脱盐。
为进行免疫学分析,将三体积的抽提物与一体积的4X SDS-凝胶样品缓冲液(0.17M Tris-HCl pH6.8、6.7%SDS、16.7%(v/v)β-巯基乙醇、33%(v/v)甘油)混合,取每个抽提物按每泳道3uL走SDS聚丙烯酰胺凝胶,以细菌产生的AKIII作为分子大小对照,以从未转化的烟草中抽提的蛋白作为一种阴性对照。然后将蛋白电转印到一张硝酸纤维膜上(Western Blot)。使用BioRad提供的标准程序及其Immun-Blot Kit将膜与按实施例2中的介绍制备的AKIII抗体按1∶5000稀释的兔血清进行反应。漂洗去除未结合的第一抗体之后,将膜与第二抗体---1∶3000稀释的结合有辣根过氧化物酶的驴抗兔Ig(Amersham)反应。漂洗去除未结合的二抗后,将膜与Amersham化学发光试剂反应,并在X-射线胶片上曝光。
13个含有嵌合基因35S启动子/Cab前导/cts/lysC-M4/Nos3’的转化子中有7个、17个含有嵌合基因35S启动子/Cab前导/cts/lysC/Nos3’的转化子中有13个能产生AKIII蛋白(表2)。在所有场合,能与AKIII抗体反应的蛋白有几个大小。在所有的样品中出现了大约等量的与大肠杆菌中产生的AKIII大小相同的蛋白和一种约6kd的大蛋白,这说明叶绿体靶向信号已从约一半的合成蛋白中移去。这进一步说明约一半的蛋白进入了叶绿体。此外,还观察到了相当数量的一种具有更高分子量的蛋白。这种蛋白的来源不清楚,出现的总量等于或略大于成熟和假定的AKIII前体蛋白的合并量。
按实施例2的介绍分析叶抽提物的AK活性。如果存在AK活性,可通过其对赖氨酸加苏氨酸的抗性提高来将AKIII与内源性AK活性区分。但不幸的是,此试验没有足够的灵敏度来可靠地检测这些抽提物中的AKIII活性。4个含有嵌合基因35S启动子/Cab前导/cts/lysC/Nos3’的转化子中有0个能显示AKIII活性,只有一个来自一个含有嵌合基因35S启动子/Cab前导/cts/lysC-M4/Nos3’的转化子的抽提物产生了可信水平的酶活性。该抽提物来自转化子546-49A,它也是通过Western印迹显示最高水平的AKIII-M4蛋白的抽提物。
另一种检测有活性的AKIII酶表达的方法是评价叶组织对高浓度的赖氨酸加苏氨酸的敏感性或抗性。许多植物的细胞培养物和幼苗的生长可被高浓度的赖氨酸加苏氨酸抑制。生长可通过加入甲硫氨酸(或高丝氨酸,它在体内可转化为甲硫氨酸)来恢复。赖氨酸加苏氨酸抑制被认为是内源性AK的反馈抑制造成的,这种反馈抑制减少了该途径的流通量,从而导致甲硫氨酸饥饿。在烟草中,在叶中有两种AK酶,一种为赖氨酸敏感型,一种为苏氨酸敏感型。(Negrutui et al.,(1984)Theor.Appl.Genet.68:11-20)。高浓度的赖氨酸加苏氨酸抑制苗从烟草叶盘中生长,并且抑制可通过加入低浓度的甲硫氨酸逆转。因此,生长抑制很可能是由于两种AK同功酶的抑制。
有活性的赖氨酸和苏氨酸不敏感的AKIII-M4的表达预计可以逆转生长抑制。由表2可以观察到这一点。事实上,在表达的AKIII-M4的水平与对赖氨酸加苏氨酸的抗性之间有很好的相关性。赖氨酸敏感的野生型AKIII的表达就没有相似的效果。只有最高表达的转化子才显示一些对赖氨酸加苏氨酸抑制的抗性,并且这远不如用AKIII-M4观察到的强烈。
为测定叶中的游离氨基酸组成,按下述方法抽提游离氨基酸。将大约30-40mg幼叶组织用剃刀切碎,浸入0.6mL于干冰中按12v/5v/3v比例混合的甲醇/氯仿/水(MCW)中。10-30分钟后将悬液取至室温下,并用一台Omni 1000 Handheld RechargeableHomogenizer匀浆化,然后在一个eppendorf微量离心机中离心约3分钟。将大约0.6mL上清倒出,在沉淀中加入0.2mL的MCW,然后旋转震荡并按上述离心。将大约0.2mL第二次的上清加入第一次的上清中。在两次上清合并物中加入0.2mL氯仿,接着加入0.3mL水。将混合物旋转震荡,并在一个eppendorf微量离心机中离心约3分钟,取出约1.0mL的上层水相,在一个Savant Speed真空浓缩器中干燥。使用过柱后茚三酮检测将十分之一的样品上一台Beckman Model 6300氨基酸分析仪。将叶中的相对游离氨基酸水平按赖氨酸或苏氨酸对亮氨酸的比例进行比较,即以亮氨酸作为内在标准。在叶中AKIII或AKIII-M4的表达对赖氨酸或苏氨酸(或任何其他氨基酸)没有一致的影响(表2)。
                            表2
BT542  转化子  :35S启动子/Cab前导/cts/lysC-M4/Nos 3′
BT545  转化子  :35S启动子/Cab前导/cts/lysC/Nos 3′
BT546  转化子  :35S启动子/Cab前导/cts/lysC-M4/Nos 3′
BT547  转化子  :35S启动子/Cab前导/cts/lysC/Nos 3′
         游离氨                                 对Lys 3mM+
                      AKIII活性     WESTERN
        基酸/叶
                                                 Thr3mM的
  品系      K/L   T/L   U/MG/HR        印迹         抗性
542-5B      0.5   3.5      0            -            -
542-26A     0.5   3.3      0            -            -
542-27B     0.5   3.4      0            ++           +++
542-35A     0.5   4.3      0.01         -            -
542-54A     0.5   2.8      0            -            -
542-57B     0.5   3.4      0            -            +
545-5A      n.d.  n.d.     0.02         ++
545-7B      0.5   3.4      0            +
545-17B     0.6   2.5      0.01         +
545-27A     0.6   3.5      0            ++
545-50E     0.6   3.6      0.03         ++
545-52A     0.5   3.6      0.02         -
546-4A      0.4   4.5      0            +            +
546-24B     0.6   4.9      0.04         ++           ++
546-44A     0.5   6.0      0.03         +            ++
546-49A     0.7   7.0      0.10         +++          +++
546-54A     0.5   6.4      0            +            +
546-56B     0.5   4.4      0.01         -            -
546-58B     0.6   8.0      0            +            ++
547-3D      0.4   5.4      0            ++           -
547-8B      0.6   5.0      0.02         -
547-9A       0.5     4.3     0.03      +++
547-12A      0.7     3.9      0        +++         +
547-15B      0.6     4.5      0          +         -
547-16A      0.5     3.6      0         ++
547-18A      0.5     4.0               +++         -
547-22A      0.8     4.4                 -
547-25C      0.5     4.3                 +         -
547-28C      0.6     5.6                 -
547-29C      0.5     3.8               +++         +
                      实施例8用菜豆蛋白启动子/lysC嵌合基因转化烟草
菜豆蛋白启动子/lysC嵌合基因表达盒---菜豆蛋白5’区域/cts/lysC/菜豆蛋白3’区域和菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域(实施例6)以约3.3kb的Hind III片段的形式进行分离,并插入到双体载体pZS97(图6)的单一Hind III位点中,分别产生质粒pBT548和pBT549。除了存在两个额外的单一克隆位点Sma I和Hind III以及以细菌β-内酰胺酶基因(导致氨苄青霉素抗性)取代细菌新霉素磷酸转移酶基因作为转化的根癌农杆菌的选择标记外,此载体与实施例7中介绍的pZS97K相似。
按实施例7列出的方法,将含有lysC嵌合基因的双体载体用三亲本杂交(Ruvkin et al.(1981)Nature 289:85-88)转移到农杆菌菌株LBA4404/pAL4404中,用农杆菌转化子接种烟草叶盘,并使转基因植物再生。
为分析嵌合基因在转化植物的种子中的表达,让植物开花,自体授粉并结实。按下述方法从成熟的种子中抽提总蛋白。将大约30-40mg种子置于一个1.5mL一次性塑料离心管中,在50mM Tris-HCl pH6.8、2mM EDTA、1%SDS、1%(v/v)β-巯基乙醇中磨碎。研磨使用一个带有设计来适用于微量离心管的一次性塑料柄的机械研磨器进行。所获得的悬液在一台微量离心机上在室温离心5分钟去除颗粒物。将三体积的抽提物与1体积的4X SDS-凝胶样品缓冲液(0.17M Tris-HClpH6.8、6.7%SDS、16.7%(v/v)β-巯基乙醇、33%(v/v)甘油)混合,取每个抽提物按每泳道5uL走SDS聚丙烯酰胺凝胶,以细菌产生的AKIII作为分子大小对照,以从未转化的烟草中抽提的蛋白作为一种阴性对照。然后将蛋白电转印到一张硝酸纤维膜上。使用BioRad提供的标准程序及其Immun-Blot Kit将膜与AKIII抗体(按实施例2中的介绍制备)按1∶5000稀释的兔血清进行反应。漂洗去除未结合的第一抗体之后,将膜与第二种抗体---1∶3000稀释的结合有辣根过氧化物酶的驴抗兔Ig(Amersham)反应。漂洗去除未结合的二抗后,将膜与Amersham化学发光试剂反应,并在X-射线胶片上曝光。
11个含有嵌合基因菜豆蛋白5’区域/cts/lysC/菜豆蛋白3’区域的转化子中有10个、11个含有嵌合基因菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域的转化子中有10个能产生AKIII蛋白(表3)。在所有场合,能与AKIII抗体反应的蛋白有几个大小。在所有的样品中出现了大约等量的与大肠杆菌中产生的AKIII大小相同的蛋白和一种约6kd的大蛋白,这说明叶绿体靶向信号已从约一半的合成蛋白中移去。这进一步说明约一半的蛋白进入了叶绿体。此外,还观察到了一些低分子量的蛋白,可能代表AKIII多肽的降解产物。
为测定种子中的游离氨基酸组成,按下述方法从成熟种子中抽提游离氨基酸。将大约30-40mg成熟种子和约等量的无菌沙置于一个1.5mL一次性塑料离心管中,并在室温加入0.2mL按12v/5v/3v比例混合的甲醇/氯仿/水(MCW)中。种子用一个带有设计来适用于微量离心管的一次性塑料柄的机械研磨器磨碎。研磨后再加入0.5mL的MCW。然后将混合物旋转震荡,并接着在一个eppendorf微量离心机中离心约3分钟。将大约0.6mL上清倒出,在沉淀中加入0.2mL的MCW,然后旋转震荡并按上述离心。将大约0.2mL的第二次上清加入第一次的上清中。在两次上清合并物中加入0.2mL氯仿,接着加入0.3mL水。将混合物旋转震荡,并在一个eppendorf微量离心机中离心约3分钟,取出约1.0mL的上层水相,在一个Savant Speed真空浓缩器中干燥。将样品在6N盐酸、0.4%(v/v)β-巯基乙醇中在氮气环境下在110-120℃水解24小时,使用过柱后茚三酮检测将四分之一的样品上一台Beckman Model 6300氨基酸分析仪。将种子中的相对游离氨基酸水平按赖氨酸、甲硫氨酸、苏氨酸或异亮氨酸对亮氨酸的比例进行比较,即以亮氨酸作为内在标准。
为测定种子的总氨基酸组成,将6个种子在6N盐酸、0.4%(v/v)β-巯基乙醇中在氮气环境下在110-120℃水解24小时,使用过柱后茚三酮检测将十分之一的样品上一台Beckman Model 6300氨基酸分析仪。将种子中的相对氨基酸水平按赖氨酸、甲硫氨酸、苏氨酸或异亮氨酸对亮氨酸的比例进行比较,即以亮氨酸作为内在标准。因为转基因在这些原代转化子的自体授粉子代中是分离的,而且仅分析了6个种子,因此可能有一些取样误差。因此对一些品系的测量重复了多次(表3)。
种子中cts/lysC基因的表达导致种子中游离苏氨酸的水平提高2-4倍,并在某些场合使游离赖氨酸的水平提高2-3倍。在表达高水平的AKIII蛋白的转化子与表达高水平的游离苏氨酸的转化子之间有非常好的相关性,但对于赖氨酸则不是这样。游离苏氨酸或赖氨酸的这种相对较小的提高不足以在种子中产生总苏氨酸或赖氨酸水平的可检测到的提高。种子中cts/lysC-M4基因的表达导致种子中游离苏氨酸的水平提高4-23倍,并在某些场合使游离赖氨酸的水平提高2-3倍。在表达高水平的AKIII蛋白的转化子与表达高水平的游离苏氨酸的转化子之间有非常好的相关性,但同样对于赖氨酸则不是这样。游离苏氨酸的较大提高足以在种子中产生总苏氨酸或赖氨酸水平的可检测到的提高。在三个进行了多次取样的品系中观察到了种子的总苏氨酸含量有16-25%的提高。(为进行比较,显示了异亮氨酸对亮氨酸的比值)。显示总苏氨酸提高的品系同样也是显示游离苏氨酸提高水平最大和高表达AKIII-M4蛋白的品系。由这些结果我们可以估计,游离苏氨酸占正常烟草种子中存在的总苏氨酸的大约1%,但在表达高水平的AKIII-M4的种子中则占大约18%。
                    表3
BT548  转化子:菜豆蛋白5’区域/cts/lysC/菜豆蛋白3’
BT549  转化子:菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’
                种子                      种子
              游离氨基酸                总氨基酸        印迹
品质          K/L T/L I/L              K/L T/L I/L   正常     0.49   1.34   0.68    0.35   0.68   0.63       -548-2A    1.15   2.3    0.78    0.43   0.71   0.67       +548-4D    0.69   5.3    0.80    0.35   0.69   0.65     +++548-6A    0.39   3.5    0.85    0.35   0.69   0.64       +548-7A    0.82   4.2    0.83    0.36   0.68   0.65      ++548-14A   0.41   3.1    0.82    0.32   0.67   0.65       +548-18A   0.51   1.5    0.69    0.37   0.67   0.63       -548-22A   1.41   2.9    0.75    0.47   0.74   0.65     +++548-24A   0.73   3.7    0.81    0.38   0.68   0.65      ++548-41A   0.40   2.8    0.77    0.37   0.68   0.65       +548-50A   0.46   4.0    0.81    0.33   0.68   0.65       +548-57A   0.50   3.8    0.80    0.33   0.67   0.65      ++549-5A    0.63   5.9    0.69    0.32   0.65   0.65       +549-7A    0.51   8.3    0.78    0.33   0.67   0.63      ++549-20A   0.67   30     0.88    0.38* 0.82* 0.65*  ++++549-34A   0.43   1.3    0.69    0.32   0.64   0.63       -549-39D   0.83   16     0.83    0.35   0.71   0.63     +++549-40A   0.80   4.9    0.74    0.33   0.63   0.64       +549-41C   0.99   13     0.80    0.38* 0.79* 0.65*   +++549-46A   0.48   7.7    0.84    0.34   0.70   0.64       +549-52A   0.81   9.2    0.80    0.39   0.70   0.65      ++549-57A   0.60   15     0.77    0.35* 0.85* 0.64*   +++549-60D   0.85   11     0.79    0.37   0.73   0.65      ++正常,对游离氨基酸来说是用6个样品的平均值来计算,对总氨基酸是用23个样品的平均值来计算*指至少5个样品的平均值
由两种用菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域转化的植物---植物549-5A和549-40A自体授粉获得的种子显示3个卡那霉素抗性幼苗和1个卡那霉素敏感幼苗,这表明转基因的一个单一的插入位点。将子代植物培养和自体授粉,并分析种子的卡那霉素标记基因的分离。转基因插入子为纯合型的子代植物因而含有两个拷贝的基因盒的子代植物在其种子中积累的苏氨酸,是其含有一个拷贝的基因盒的杂合型姊妹株的大约2倍,是不含该基因的种子的约8倍。这证明该大肠杆菌酶的表达水平控制着游离苏氨酸的积累。
                     实施例9用35S启动子/ecodapA嵌合基因转化烟草
35S启动子/Cab前导/ecodapA/Nos3’和35S启动子/Cab前导/cts/ecodapA/Nos3’嵌合基因以约3.1和3.3kb的BamH I-Sal I片段的形式进行分离,并分别插入到BamH I-Sal I消化的双体载体pZS97K(图5)中,分别产生质粒pBT462和pBT463。该双体载体在实施例7中介绍。
按实施例7列出的方法,将含有ecodapA嵌合基因的双体载体用三亲本杂交转移到Agrobacterium菌株LBA4404/pAL4404中,用农杆菌转化子接种烟草叶盘,并使转基因植物再生。
为分析嵌合基因在转化植物叶中的表达,按实施例7中的介绍抽提蛋白,并作下述修改。将约18mL来自第一次硫酸铵沉淀的上清与另外12mL冷的饱和硫酸铵混合。将混合物置于冰上30分钟,并按实施例7的介绍离心。倒出上清,将含有DHDPS蛋白的沉淀重新悬浮于1mL的TNE中,并通过一个Sephadex G-25柱(Column PD-10,Pharmacia)脱盐。
按实施例4的介绍分析叶抽提物的DHDPS活性。可通过其对赖氨酸的抗性提高来将大肠杆菌DHDPS与烟草DHDPS活性区分。大肠杆菌DHDPS在0.1mM赖氨酸时保留了80-90%的活性,而烟草DHDPS被该浓度的赖氨酸几乎完全抑制。10个含有嵌合基因35S启动子/Cab前导/ecodapA/Nos3’的转化子中有1个能显示大肠杆菌DHDPS表达,而10个含有嵌合基因35S启动子/Cab前导/cts/ecodapA/Nos3’的转化子中
按实施例7中的介绍从叶中抽提游离氨基酸。嵌合基因35S启动子/Cab前导/cts/ecodapA/Nos3’而不是35S启动子/Cab前导/ecodapA/Nos3’的表达导致了叶中游离赖氨酸水平的显著提高。观察到了游离赖氨酸水平比未转化的烟草高2至90倍。
让转化植物开花、自体授粉并结实。将来自几个用35S启动子/Cab前导/cts/ecodapA/Nos3’基因转化的品系的种子表面除菌,并在存在卡那霉素的情况下在琼脂平板上发芽。鉴定能显示3个卡那霉素抗性幼苗对一个卡那霉素敏感幼苗的品系,该比例是转基因上单个插入位点的标志。使用标准的遗传学分析从这些品系中获得转基因插入子纯合的子代。然后对纯合型子代分析在幼叶和成熟叶中大肠杆菌DHDPS的表达以及在幼叶和成熟叶中和在种子中积累的游离氨基酸的水平。
在转化子的纯合型子代的幼叶和成熟叶中都明显出现了有活性的大肠杆菌DHDPS的表达(表4)。在植物的幼叶中积累了水平比正常烟草植物高50至100倍的游离赖氨酸,但在较大的叶中只观察到少得多的游离赖氨酸积累(2至8倍)。测量韧皮部中赖氨酸的实验表明赖氨酸从大的叶中输出。这种输出的赖氨酸可能为小的正在生长的叶中赖氨酸的积累作贡献,已知小的正在生长的叶吸收而不是输出营养物质。因为大的叶组成植物生物量的主要部分,因此植物中总的赖氨酸积累增加更受较大叶中赖氨酸水平的影响。没有观察到对这些植物种子中游离赖氨酸水平的影响(表4)。
                          表4
            BT463转化子的35S启动子/Cab
         前导/cts/ecodapA/Nos3’纯合型子代
                叶游离         大肠杆菌    种子注射
                氨基酸           DHDPS      氨基酸品系    叶的大小 K/L   K/TOT     OD/60′/mg     K/L正常      3in.   0.5   0.006         0          0.5463-18C-2   3in.   47    0.41          7.6        0.4463-18C-2   12in.  1     0.02          5.5        ---463-25A-4   3in.   58    0.42          6.6        0.4463-25A-4   12in.  4     0.02          12.2       ---463-38C-3   3in.   28    0.28          6.1        0.5463-38C-3   12in.  2     0.04          8.3        ---
                     实施例10用菜豆蛋白启动子/ecodapA嵌合基因转化烟草
嵌合基因表达盒---菜豆蛋白5’区域/ecodapA/菜豆蛋白3’区域和菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’区域(实施例6)分别以约2.6kb和2.8kb的Hind III片段的形式进行分离。将这些片段插入到双体载体pZS97(图6)的单一Hind III位点中,分别产生质粒pBT506和pBT534。该载体在实施例8中介绍。
按实施例7列出的方法,将含有ecodapA嵌合基因的双体载体用三亲本杂交转移到Agrobacterium菌株LBA4404/pAL4404中,用农杆菌转化子接种烟草叶盘,并使转基因植物再生。
为分析嵌合基因的表达,让转化植物开花、自体授粉并结实。总的种子蛋白按实施例8中的介绍抽提并按实施例7的介绍进行免疫学分析,但作如下修改。使用BioRad提供的标准程序及其Immun-BlotKit将Western印迹膜与实施例4中制备的DHDPS抗体按1∶5000稀释的兔血清进行反应。
14个含有嵌合基因菜豆蛋白5’区域/ecodapA/菜豆蛋白3’区域的转化子中有13个、13个含有嵌合基因菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’区域的转化子中有9个能产生用Western印迹可检测到的DHDPS(表3)。能与DHDPS抗体反应的蛋白有几个大小。大多数蛋白与大肠杆菌中产生的DHDPS大小相同,无论嵌合基因是否包含叶绿体转运信号。这说明叶绿体靶向信号已从合成的前体蛋白中有效移去。这进一步说明大多数蛋白进入了叶绿体。此外,还观察到了一些低分子量的蛋白,可能代表DHDPS多肽的降解产物。
为测定种子中游离氨基酸组成和总氨基酸组成,按实施例8中的介绍从种子中抽提游离氨基酸和总氨基酸。ecodapA基因或cts/ecodapA基因的表达都对任何转化品系的种子的总赖氨酸或苏氨酸组成没有影响(表5)。还检测了几个用菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’区域嵌合基因转化的品系中对游离氨基酸组成的任何影响。同样,在表达高水平的大肠杆菌DHDPS蛋白的品系中没有观察到对种子的赖氨酸或苏氨酸组成的即使是很温和的影响(表5)。这是一个令人惊奇的结果,因为已知这种蛋白的表达对叶中游离赖氨酸的水平有非常大的影响(见实施例9)。
对于这一点,一个可能的解释是通过Western印迹观察到的DHDPS是没有功能的。为检验这个假说,从成熟的种子中制备总蛋白抽提物,并分析DHDPS活性。将大约30-40mg种子置于一个1.5mL一次性塑料离心管中,在0.25mL的50mM Tris-HCl、50mM NaCl、1mM EDTA(TNE)中磨碎。研磨使用一个带有设计来适用于微量离心管的一次性塑料柄的机械研磨器进行。所获得的悬液在一台微量离心机上在室温离心5分钟去除颗粒物。从沉淀物质和上层油相之间取大约0.1mL的水相上清。种子抽提物按实施例4的介绍分析DHDPS活性。大肠杆菌DHDPS可通过提高的对赖氨酸抗性与烟草DHDPS活性区分,大肠杆菌DHDPS在0.4mM赖氨酸时保留大约50%的活性,而烟草DHDPS完全被该浓度的赖氨酸抑制。在所有4个检测的种子抽提物中都观察到了高水平的大肠杆菌DHDPS活性,这就排除了这种可能性。
ecodapA嵌合基因中cts序列的存在对于在叶中诱导赖氨酸的高水平积累是必需的。因此另一个可能的解释是,cts序列在菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’区域嵌合基因插入到双体载体的过程中以某种方式丢失。但是,对几种转化品系的PCR分析证明了cts序列的存在,这就排除了这种可能性。
第三种解释是,氨基酸通常不在种子中合成,因而该途径的其他酶不存在于种子中。实施例8中所示的实验结果,即菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域的表达导致种子中游离苏氨酸的高水平积累,表明不是这种原因。
将这些结果综合起来并结合实施例9中所示的结果,证明:种子或叶中的一种赖氨酸不敏感的DHDPS的表达都不足以使种子中游离赖氨酸的积累增加。
                    表5BT506  转化子:菜豆蛋白5’区/ecodapA/菜豆蛋白3’BT534  转化子:菜豆蛋白5’区/cts/ecodapA/菜豆蛋白3’
            种子:游离       种子:总        大肠杆菌
             氨基酸           氨基酸           DHDPS品系          K/L    T/L       K/L    T/L       OD/60′/MG      WESTERN正常         0.49   1.34      0.35    0.68506-2B                          0.34    0.66                         +506-4B                          0.33    0.67                         +506-16A                         0.34    0.67                         +506-17A                         0.36    0.55         7.7           +++506-19A                         0.37    0.45                        ++506-22A                         0.34    0.67                        ++506-23B                         0.35    0.67                        ++506-33B                         0.34    0.67                        ++506-38B                         0.36    0.69         8.7           +++506-39A                         0.37    0.70                        ++506-40A                         0.36    0.68                         -506-47A                         0.32    0.68                       +++506-48A                         0.33    0.69                       +++506-49A                         0.33    0.69                       +++534-8A                          0.34    0.66                         -534-9A                          0.36    0.67                        ++534-22B        0.43   1.32      0.39    0.51         4.9           +++534-31A                         0.34    0.66                         -534-38A        0.35   1.49      0.42    0.33                       +++534-39A                         0.38    0.69                         +534-7A                          0.34    0.67                       +++534-25B                         0.35    0.67                       +++534-34B        0.80   1.13      0.42    0.70                         -534-35A        0.43   1.18      0.33    0.67                       +++534-37B        0.42   1.58      0.37    0.68                         -534-43A                         0.35    0.68                       +++534-48A        0.46   1.24      0.35    0.68         6.2           +++
                    实施例11用35S启动子/cts/dapA加35S启动子/cts/lysC-M4嵌合基因转化烟草
将35S启动子/Cab前导/cts/ecodapA/Nos3’和35S启动子/Cab前导/cts/lysC-M4/Nos3’嵌合基因组合在双体载体pZS97K(图5)中。该双体载体在实施例7中介绍。合成一个寡核苷酸接头来将35S启动子/Cab前导/cts/lysC-M4/Nos3’嵌合基因5’端的BamH I位点(见图4a)转变为一个EcoR I位点。然后从质粒pBT540中(实施例6)以一个3.6kb的EcoR I片段的形式分离35S启动子/Cab前导/cts/lysC-M4/Nos3’嵌合基因,并插入到用EcoR I消化的pBT463(实施例9)中,产生质粒pBT564。该载体同时含有以相同方向插入的35S启动子/Cab前导/cts/ecodapA/Nos3’和35S启动子/Cab前导/cts/lysC-M4/Nos3’嵌合基因。
按实施例7列出的方法,将含有ecodapA和lysC-M4嵌合基因的双体载体用三亲本杂交转移到Agrobacterium菌株LBA4404/pAL4404中,用农杆菌转化子接种烟草叶盘,并使转基因植物再生。
为分析嵌合基因在转化植物的叶中的表达,蛋白按实施例7中对AKIII和实施例9中对DHDPS的介绍进行抽提。叶抽提物按实施例4和9中的介绍分析DHDPS活性。大肠杆菌DHDPS可通过其提高的对赖氨酸的抗性来与烟草DHDPS活性区分。大肠杆菌DHDPS在0.1mM赖氨酸时保留了80-90%的活性,而烟草DHDPS被该浓度的赖氨酸完全抑制。按实施例7和10的介绍通过Western印迹对抽提物进行AKIII和DHDPS蛋白表达的免疫学分析。
12个转化子中有10个表达大肠杆菌DHDPS酶活性(表6)。酶活性与免疫学检测的DHDPS蛋白数量之间有很好的相关性。和实施例7中的介绍一样,AK试验没有足够的灵敏度来在这些抽提物中检测酶活性。但是,在12个抽提物的8个中用免疫学方法检测到了AKIII-M4蛋白。在一些转化子---564-21A和47A中,DHDPS和AKIII-M4的表达水平之间有很大的不一致,但在12个品系的10个中,它们有很好的相关性。
按实施例7中的介绍从叶中抽提游离氨基酸并分析氨基酸组成。在没有明显的AKIII-M4时,嵌合基因35S启动子/Cab前导/cts/ecodapA/Nos3’的表达水平决定了赖氨酸积累的水平(表6)。比较品系564-21A、47A和39C,它们都不表达明显的AKIII-M4。品系564-21A积累的赖氨酸水平比表达较低水平的大肠杆菌DHDPS的品系564-47A约高10倍,比不表达大肠杆菌DHDPS的品系564-39C约高40倍。但是,在都表达相似数量的大肠杆菌DHDPS的转化子(564-18A、56A、36E、55B、47A)中,嵌合基因35S启动子/Cab前导/cts/lysC-M4/Nos3’的表达水平控制着赖氨酸积累的水平。因此很清楚,虽然在单独表达时35S启动子/Cab前导/cts/lysC-M4/Nos3’的表达对叶中游离氨基酸水平没有影响(实施例7),但它在与35S启动子/Cab前导/cts/ecodapA/Nos3’嵌合基因一起表达时能增加赖氨酸的积累。这些基因一起表达不影响叶中其他任何游离氨基酸的水平。
                                 表6BT564  转化子:35S启动子/Cab前导/cts/ecodapA/Nos 3′
           35S启动子/Cab前导/cts/lusC-M4/Nos 3′
                                     大肠杆菌
                                        DHDPS        WESTERN      WESTERN品系      游离氨基酸叶
       nmol/4mg      游离氨基酸叶       U/MG/HR       DHDPS       AK-III
       TOT   K      K/L      K/TOT564-21A    117   57     52       0.49         2.4          +++         +/-564-18A     99   56     69       0.57         1.1           ++          ++564-56A    104   58     58       0.56         1.5           ++          ++564-36E     85   17     17       0.20         1.5           ++         +++564-55B     54    5     9.1      0.10         1.0           ++           +564-47A     18    1     4.8      0.06         0.8           ++           -564-35A     37    7     13       0.18         0.3            +          ++564-60D     61    3     4.5      0.06         0.2            +          ++564-45A     46    4     8.1      0.09         0.4            +           +564-44B     50    1     1.7      0.02         0.1          +/-           -564-49A     53    1     1.0      0.02           0          +/-           -564-39C     62    1     1.4      0.02           0            -           -
按实施例8中的介绍从来自自体授粉植物的成熟种子中抽提游离氨基酸并定量。来自未转化植物的种子与来自叶中显示最高游离赖氨酸积累的植物即植物564-18A、564-21A、564-36E、564-56A的种子相比,游离氨基酸含量没有明显的不同。
                     实施例12用菜豆蛋白启动子/cts/ecodapA加菜豆蛋白启动子/cts/lysC-M4嵌合基因转化烟草
将嵌合基因表达盒---菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’区域和菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域(实施例6)组合在双体载体pZS97(图6)中。该双体载体在实施例8中介绍。为完成这一点,将菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’区域嵌合基因以一个2.7kb的Hind III片段的形式分离,并插入到载体pUC1318(Kay et al.(1987)Nucleic Acids Res.6:2778)的HindIII位点,产生pBT568。然后就可以用BamH I消化pBT568,并分离在一个2.7kb的BamH I片段上的嵌合基因。将该片段插入到用BamHI消化的pBT549(实施例9)中,产生pBT570。该双体载体同时含有以相同方向插入的嵌合基因菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’基因和菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’。
按实施例7列出的方法,将双体载体pBT570用三亲本杂交转移到Agrobacterium菌株LBA4404/pAL4404中,用农杆菌转化子接种烟草叶盘,并使转基因植物再生。
为分析嵌合基因在转化植物种子中的表达,让转化植物开花、自体授粉并结实。按实施例8中的介绍从成熟种子中抽提总蛋白并用Western印迹进行分析。
25个转化子中有21个表达DHDPS蛋白,这其中有19个还表达AKIII蛋白(表7)。表达蛋白的数量与转化子中存在的基因拷贝数有关。根据卡那霉素标记基因的分离,表达最高的品系---570-4B、570-12C、570-59B和570-23B都有两个或更多的基因盒插入位点。在所有检测到蛋白的待测品系的成熟种子中,都观察到了酶活性的大肠杆菌DHDPS。
为测定种子的游离氨基酸组成,按实施例8的介绍从成熟种子中抽提游离氨基酸并进行分析。在表达高水平的DHDPS和AKIII二者的转化子与具有高水平的游离赖氨酸和苏氨酸的转化子之间有很好的相关性。表达最高的品系(在表7中用星标记)在种子中显示游离赖氨酸水平提高达2倍、游离苏氨酸水平提高达4倍。
在表达最高的品系中,可以检测到高水平的α-氨基己二酸。这种化合物已知是谷物种子中赖氨酸分解代谢的一种中间产物,但由于其积累水平低,通常只能通过放射性示踪实验检测到。这种中间产物水平的增加表明大量的赖氨酸正在这些转化品系的种子中产生,并正通过分解代谢途径。在仅表达大肠杆菌DHDPS或仅表达AKIII-M4的转化子的种子中没有观察到α-氨基己二酸的增加。这些结果显示,需要同时表达两种酶来生产高水平的游离赖氨酸。
                              表7
BT570  转化子:菜豆蛋白5’区/cts/lysC-M4/菜豆蛋白3’区
               菜豆蛋白5’区/cts/ecodapA/菜豆蛋白3’区
         游离氨基       总氨基       WESTERN       WESTERN      大肠杆菌
         酸/种子        酸/种子      大肠杆菌     大肠杆菌        DHDPS      子代品系        K/L    T/L     K/L    T/L     DHDPS         AKIII        U/MG/HR  Kanr∶Kans正常       0.49    1.3    0.35   0.68        -            -570-4B     0.31    2.6    0.34   0.64      +++           ++                       15∶1570-7C     0.39    2.3    0.34   0.64       ++            +570-8B     0.29    2.1    0.34   0.63        +            -570-12C*  0.64    5.1    0.36   0.68     ++++         ++++           >4.3     >15∶1570-18A    0.33    3.0    0.35   0.65       ++           ++                       15∶1570-24A    0.33    2.0    0.34   0.65       ++            -570-37A    0.33    2.1    0.34   0.64      +/-          +/-570-44A    0.29    2.1    0.34   0.64       ++            +570-46B    0.41    2.1    0.35   0.65       ++            +570-51B    0.33    1.5    0.33   0.64        -            -             0570-59B*  0.46    3.0    0.35   0.65      +++          +++             2.6     >15∶1570-80A    0.31    2.2    0.34   0.64       ++            +570-11A    0.28    2.3    0.34   0.67       ++           ++                       3∶1570-17B    0.27    1.6    0.34   0.65        -            -570-20A    0.41    2.3    0.35   0.67       ++            +570-21B    0.26    2.4    0.34   0.68       ++            +570-23B*  0.40    3.6    0.34   0.68      +++          +++             3.1       63∶1570-25D    0.30    2.3    0.35   0.66       ++          +/-570-26A    0.28    1.5    0.34   0.64        -            -570-32A    0.25    2.5    0.34   0.67       ++            +570-35A    0.25    2.5    0.34   0.63       ++           ++                        3∶1570-38A-1  0.25    2.6    0.34   0.64       ++           ++                        3∶1570-38A-3  0.33    1.6    0.35   0.63        -            -570-42A    0.27    2.5    0.34   0.62       ++           ++                        3∶1570-45A    0.60    3.4    0.39   0.64       ++           ++                        3∶1*表示游离氨基酸样品含有α-氨基己二酸
                     实施例13使用cts/lysC-M4嵌合基因作为烟草转化的一种选择性标记
双体载体pZS97K(pBT542,见实施例7)中的35S启动子/Cab前导/cts/lysC-M4/Nos3’嵌合基因被用作烟草转化的一种选择性遗传标记。高浓度的赖氨酸加苏氨酸能抑制苗从烟草叶盘中生长。有活性的赖氨酸和苏氨酸不敏感的AKIII-M4的表达能逆转这种生长抑制(见实施例7)。
双体载体pBT542用三亲本杂交转移到Agrobacterium菌株LBA4404/pAL4404中,用农杆菌转化子接种烟草叶盘,将产生的转化苗在含有3mM赖氨酸加3mM苏氨酸的生苗培养基上选择。将苗转移至含有3mM赖氨酸加3mM苏氨酸的生根培养基中,由生根的苗培养植物。将来自植物的叶盘置于含有3mM赖氨酸加3mM苏氨酸的生苗培养基中。通过在此培养基上发生在叶盘周围的苗增殖来鉴定转化的植物。
                    实施例14用35S启动子/cts/cordapA嵌合基因转化烟草
35S启动子/Cab前导/cts/cordapA/Nos3’嵌合基因以一个3.0kb的BamHI-Sal I片段的形式分离,并插入BamH I-Sal I消化的双体载体pZS97K(图5)中,产生质粒pFS852。该双体载体在实施例7中介绍。
按实施例7列出的方法,将含有cordapA嵌合基因的双体载体用三亲本杂交转移到Agrobacterium菌株LBA4404/pAL4404中,用农杆菌转化子接种烟草叶盘,并使所获得的转基因植物再生。
为分析嵌合基因在转化植物叶中的表达,按实施例7中的介绍抽提蛋白,并作下述修改。将约18mL来自第一次硫酸铵沉淀的上清与另外12mL冷的饱和硫酸铵混合。将混合物置于冰上30分钟,并按实施例7的介绍离心。倒出上清,将含有DHDPS蛋白的沉淀重新悬浮于1mL的TNE中,并通过一个Sephadex G-25柱(Column PD-10,Pharmacia)脱盐。
按实施例4的介绍分析叶抽提物的DHDPS蛋白和酶活性。棒状杆菌DHDPS酶活性可通过其对赖氨酸抑制不敏感来与烟草DHDPS活性区分。11个转化子中有8个能显示棒状杆菌DHDPS表达,这是通过western印迹和酶活性两种方法证实的。
按实施例7中的介绍从叶中抽提游离氨基酸。棒状杆菌DHDPS的表达导致叶中游离赖氨酸水平的大幅度提高(表8)。但是,在DHDPS的表达水平和游离赖氨酸的积累量之间没有很好的相关性。观察到游离赖氨酸水平比未转化烟草高2至50倍。在显示高水平的游离赖氨酸的品系中,叶中总赖氨酸水平也有2-2.5倍的提高。
                               表8
FS586  转化子:35S启动子/Cab前导/cts/cordapA/Nos 3′
           游离氨       总氨基        WESTERN       棒状杆菌
          基酸/叶        酸/叶       棒状杆菌         DHDPS
品系        K/L           K/L          DHDPS         U/MG/HR正常          0.5           0.8            -              -FS586-2A        1.0           0.8            -              -FS586-4A        0.9           0.8            +             6.1FS586-11B       3.6           0.8            +             3.4FS586-11D       26            2.0            +             3.5FS586-13A       2.4           0.8            +             3.5FS586-19C       5.1           0.8            +             3.1FS586-22B     >15            1.5            +             2.3FS586-30B                     0.8            -              -FS586-38B       18            1.5           ++             3.9FS586-51A       1.3           0.8            -              -FS586-58C       1.2           0.8            +             5.1
让植物开花、自体授粉并结实。按实施例8的介绍收集成熟的种子,并分析游离氨基酸组成。转化子的游离赖氨酸含量与未转化的烟草种子相比没有不同。
                    实施例15用KTI3启动子/cts/cordapA或菜豆蛋白启动子/cts/cordapA加菜豆蛋白启动子/cts/lysC-M4嵌合基因转化烟草
将嵌合基因表达盒---KTI3 5’区域/cts/cordapA/KTI3 3’区域和菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域以及菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域和菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域(实施例6)组合到双体载体pZS97(图6)中。该双体载体在实施例8中介绍。
为完成这一点,KTI3 5’区域/cts/cordapA/KTI3 3’区域嵌合基因盒以一个3.3kb的BamH I片段的形式分离,并插入到用BamH I消化的pBT549(实施例8)中,产生pFS883。此双体质粒含有以相反方向插入的嵌合基因KTI3 5’区域/cts/cordapA/KTI3 3’区域和菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域。
使用寡核苷酸接头将菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域嵌合基因盒两端的Hind III位点转变为BamH I位点。然后以一个2.7kb的BamH I片段的形式分离基因盒,并插入到用BamH I消化的pBT549(实施例8)中,产生质粒pFS903。该双体载体同时含有以相同方向插入的嵌合基因菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域和菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域。
按实施例7列出的方法,将双体载体pFS883和pFS903用三亲本杂交转移到Agrobacterium菌株LBA4404/pAL4404中,用农杆菌转化子接种烟草叶盘,并使所获得的转基因植物再生。
为分析嵌合基因在转化植物种子中的表达,让植物开花、自体授粉和结实。按实施例8中的介绍从成熟的种子中抽提蛋白,并用western印迹进行分析。
22个检测的转化子中有21个表达DHDPS,这其中有18个还表达AKIII蛋白(表8)。除一个外,在检测到蛋白的所有测试品系的成熟种子中都观察到有酶活性的棒状杆菌DHDPS。
为测定种子的游离氨基酸组成,按实施例8中的介绍从成熟种子中抽提游离氨基酸并进行分析。在表达高水平的DHDPS和AKIII蛋白的转化子与具有高水平的游离赖氨酸和苏氨酸的转化子之间有很好的相关性。表达最高的品系显示在种子中高达3倍游离赖氨酸水平提高和高达8倍的游离苏氨酸水平提高。如同实施例12中所介绍的,在许多转化品系中观察到了高水平的α-氨基己二酸(在表9中用星号指示),它是赖氨酸分解代谢的标志。在有KTI3或菜豆蛋白调节序列驱动棒状杆菌DHDPS基因表达的转化子之间游离氨基酸组成或蛋白表达水平没有主要的差别。
                   表9FS883  转化子:菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’
           KTI3 5′区域/cts/cordapA/KTI3 3′FS903  转化子:菜豆蛋白5’区域/cts/lysC/M4/菜豆蛋白3’
           菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’
           游离氨基       WESTERN    WESTERN     棒状杆菌
            酸/种子       棒状杆菌  大肠杆菌      DHDPS      子代
品系      K/L    T/L        DHDPS     AKIII      U/MG/HR    Kanr∶Kans正常        0.5    1.3          -         -FS883-4A      0.9    4.0          +         +                   >15∶1FS883-11A     1.0    3.5         ++        ++          3.1         3∶1FS883-14B     0.5    2.5         ++        ++FS883-16A*   0.7    10.5         +       +++          0FS883-17A*   1.0    5.0        +++       +++          7.0FS883-18C*   1.2    3.5         ++         +          5.8         3∶1FS883-21A     0.5    1.5          +       +/-FS883-26B*   1.1    3.6         ++        ++          2.4FS883-29B     0.5    1.5          +         -          0.4FS883-32B     0.7    2.4         ++         +          1.5        3∶1FS883-38B*   1.1    11.3         +        ++          2.0FS883-59C*   1.4    6.1          +         +          0.5       15∶1FS903-3C      0.5    1.8          +       +++FS903-8A*    0.8    2.1        +++      ++++FS903-9B      0.6    1.8         ++        ++          4.3FS903-10A     0.5    1.5          -         -FS903-22F     0.5    1.8         ++        ++          0.9FS903-35B*   0.8    2.1         ++        ++FS903-36B     0.7    1.5          +         -FS903-40A     0.6    1.8          +         +FS903-41A*   1.2    2.0         ++       +++FS903-42A     0.7    2.2         ++       +++          5.4FS903-44C     0.5    1.9FS903-53B     0.6    1.9*表示游离氨基酸样品含有α-氨基己二酸
在以单基因盒插入分离的两个品系的正在发育的种子中,也进行了氨基酸组成以及细菌DHDPS和AKIII蛋白表达的分析(见表10)。预计KTI3启动子控制下的DHDPS的表达被检测到的时间比在菜豆蛋白启动子控制下的AKIII蛋白早。在开花后的第14天两种蛋白都以高水平表达,并且游离赖氨酸水平比正常种子提高大约8倍。这些结果证明,赖氨酸不敏感的DHDPS和赖氨酸不敏感的AK的同时表达导致种子中高水平游离赖氨酸的产生。但游离赖氨酸不再积累至更高的水平。在成熟种子中游离赖氨酸水平比正常的成熟种子高2至3倍,并且有赖氨酸降解产物α-氨基己二酸积累。这些结果进一步为下述结论提供了证据,即赖氨酸分解代谢发生在种子中,并阻止表达赖氨酸不敏感的DHDPS和赖氨酸不敏感的AK的转化子中产生的游离赖氨酸的高水平积累。
                            表10FS883转化子正在发育的种子:
         菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域
         KTI3 5′区域/cts/cordapA/KTI3 3′区域
                       游离氨基           WESTERN          WESTERN
                        酸/种子           棒状杆菌        大肠杆菌
品系    开花后的天数   K/L   T/L           DHDPS            AKIIIFS883-18C        9         1.1   2.1             -                -FS883-18C        10        1.4   3.3           +/-                -FS883-18C        11        1.4   2.5             +                -FS883-18C        14        4.3   1.0            ++               ++FS883-18C*     成熟       1.2   3.5           +++               ++FS883-32B        9         1.3   2.9             +                -FS883-32B        10        1.6   2.7             +                -FS883-32B        11        1.4   2.3             +                -FS883-32B*      14        3.9   1.3            ++               ++FS883-32B*     成熟       0.7   2.4           +++               ++*表示游离氨酸样品含有α-氨基己二酸
                     实施例16用菜豆蛋白启动子/cts/cordapA和菜豆蛋白启动子/cts/lysC-M4嵌合基因转化油菜
将嵌合基因盒---菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域、菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域以及菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域加菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域(实施例6)插入到双体载体pZS199(图7a)中,该载体与实施例8中介绍的pSZ97K类似。在pSZ199中,来自花椰菜花叶病毒的35S启动子取代了Nos启动子驱动NPT II的表达来提供该标记基因的更好表达,并且含有多限制内切酶位点的多接头的方向相反。
为插入菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域,该基因盒以一个2.7kb的BamH I片段的形式分离(如同实施例15的介绍),并插入到用BamH I消化的pZS199中,产生质粒pFS926(图7B)。该双体质粒含有以与35S/NPT II/nos 3’标记基因相同方向插入的嵌合基因菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域。
为插入菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域,该基因盒以一个3.3kb的EcoR I至Spe I片段的形式分离,并插入到用EcoRI加Xba I消化的pZS199中,产生质粒pBT593(图7C)。该双体质粒含有以与35S/NPT II/nos 3’标记基因相同方向插入的嵌合基因菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域。
为合并两种盒,使用寡核苷酸接头将pBT593的EcoR I位点转变为一个BamH I位点,所获得的载体用BamH I酶切,菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域基因盒以一个2.7kb的BamH I片段的形式分离并插入,产生质粒pBT597(图7D)。该双体质粒含有以与35S/NPT II/nos 3’标记基因相同方向插入的两种嵌合基因---菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域和菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域。
通过将苗片与失去抵御能力(disarmed)的并携带合适双体载体的根癌农杆菌菌株LBA4404共培养来转化欧洲油菜栽培种“Westar”。
将欧洲油菜种子在10%(v/v)CloroX、0.1%SDS中搅拌除菌30分钟,然后用无菌的蒸馏水充分漂洗。使种子在含有30mM CaCl2和1.5%琼脂的无菌培养基上发芽,并在暗处在24℃生长6天。
用于植物转化的农杆菌的液体培养物在含有100mg/L卡那霉素的Minimal A培养基中在28℃生长过夜。离心沉淀细菌细胞,并按108细胞/mL的浓度重悬于含有100uM的acetosyringone的液体Murashig和Skoog Minimal Organic培养基中。
将欧洲油菜下胚轴切成5mm片段,并立即置于细菌悬液中。30分钟后,将下胚轴片段从细菌悬液中取出,并置于含有100uM的acetosyringone的BC-35愈伤组织培养基中。将植物组织和农杆菌在24℃在微光下共培养3天。
将下胚轴片段转移到含有200mg/L羧苄青霉素(以杀死农杆菌)和25mg/L卡那霉素(以选择转化植物细胞生长)的BC-35愈伤组织培养基中终止共培养。将苗片段在这种培养基上在24℃在连续光照下温育3周。
3周后,将片段转移至含有200mg/L羧苄青霉素和25mg/L卡那霉素的BS-48再生培养基中。将植物组织每两周转种至新鲜的选择再生培养基中,并置于与愈伤组织培养基中的介绍相同的培养条件下。推测的转化愈伤组织在再生培养基上生长迅速,当愈伤组织达到直径约2mm时,将其从下胚轴片段上取出,并置于不含卡那霉素的相同培养基中。
在转移至BS-48再生培养基后数周内苗开始出现。当苗形成可以分辨的茎后,将其从愈伤组织上切下,转移至MSV-1A延长培养基中,并移至24℃、16:8小时的光周期下。
当苗延长数节后,在琼脂表面上将其切下,并将切割端浸入Rootone中。将处理过的苗直接种入湿的Metro-Mix350无土盆栽培养基中。用塑料袋覆盖盆,并在大约10天后当植物明显生长时移去。转化的结果示于表11。用每种双体载体获取转化植物。Minimal A细菌生长培养基溶解于蒸馏水:
10.5g          磷酸钾、二碱
4.5g           磷酸钾、单碱
1.0g           硫酸铵
0.5g           柠檬酸钠、二水加蒸馏水至979mL高压灭菌加20mL过滤除菌的10%蔗糖加1mL过滤除菌的1M MgSO4Brassica愈伤组织培养基BC-35每升
Murashige and Minimal Organic Medium
(MS盐、100mg/L I-肌醇、0.4mg/L硫胺素、GIBCO#510-3118)
30g           蔗糖
18g           甘露醇
0.5mg/L       2、4-D
0.3mg/L       细胞分裂素
0.6%         琼脂糖
pH5.8Brassica再生培养基BS-48
Murashige and Minimal Organic Medium
Gamborg B5维生素(SIGMA#1019)
10g           蔗糖
250mg         木糖
600mg         MES
0.4%         琼脂糖
pH5.7过滤除菌并在高压灭菌后加入:
2.0mg/L       玉米素
0.1mg/L       IAABrassica苗延长培养基MSV-1A
Murashige and Minimal Organic Medium
Gamborg       B5维生素
10g           蔗糖
0.6%         琼脂糖
pH5.8
                             表11
                          油菜转化子
                                          生苗愈伤
双体载体                   KANR愈伤     组织的数目      植物的数目
          切割端的数量    组织的数目
pZS199        120             41              5               2
pFS926        600            278             52              28
pBT593        600             70             10               3
pBT597        600            223             40              23
植物在16:8小时的光周期下生长,白天温度为23℃,夜间温度为17℃。当初级开花茎开始延长时,用一个网状含花粉的袋覆盖它以防止异种杂交。每天摇动植物数次以便于自体授粉。在种植后约3个月收获自体授粉的成熟种子。
一种部分脱脂的种子粉按如下制备:将40mg成熟的干种子用一个杵和臼在液氮中研磨成细粉。加入1毫升己烷,将混合物在室温摇动15分钟。在一个eppendorf离心管中沉淀粉,弃去己烷并重复己烷抽提过程。然后将粉在65℃干燥10分钟直至己烷完全挥发,只剩下干粉。按如下从成熟种子中抽提总蛋白。将大约30-40mg种子置于一个1.5mL一次性塑料离心管中,在0.25mL的50mM Tris-HCl pH6.8、2mM EDTA、1%SDS、1%(v/v)β-巯基乙醇中磨碎。研磨使用一个带有设计来适用于微量离心管的一次性塑料柄的机械研磨器进行。所获得的悬液在一台微量离心机上在室温离心5分钟去除颗粒物。将三体积的抽提物与1体积的4X SDS-凝胶样品缓冲液(0.1M Tris-HClpH6.8、6.7%SDS、16.7%(v/v)β-巯基乙醇、33%(v/v)甘油)混合,取每个抽提物按每泳道5uL走SDS聚丙烯酰胺凝胶,以细菌产生的DHDPS或AKIII作为分子大小对照,以从未转化的烟草种子中提取的蛋白作为一种阴性对照。然后将蛋白电转印到一张硝酸纤维膜上。使用BioRad提供的标准程序及其Immun-Blot Kit将膜与DHDPS或AKIII抗体按1∶5000稀释的兔血清进行反应。漂洗去除未结合的第一抗体之后,将膜与第二种抗体---1∶3000稀释的结合有辣根过氧化物酶的驴抗兔Ig(Amersham)反应。漂洗去除未结合的二抗后,将膜与Amersham化学发光试剂反应,并在X-射线胶片上曝光。
8个FS926转化子中有8个、7个BT597转化子中有7个能表达DHDPS蛋白。一个BT593转化子和7个BT597转化子中有5个能表达AKIII-M4蛋白(表12)。因此在油菜种子中表达这些蛋白非常简单。
为测定种子中的游离氨基酸组成,按下述方法抽提游离氨基酸。将40mg脱脂粉在室温加入0.6mL按12v/5v/3v比例混合的甲醇/氯仿/水(MCW)中。将混合物旋转震荡,然后在一个eppendorf微量离心机中离心大约3分钟。将大约0.6mL上清倒出,在沉淀中加入另外0.2mL的MCW,然后旋转震荡并按上述离心。将大约0.2mL的第二次上清加入第一次的上清中。在两次上清合并物中加入0.2mL氯仿,接着加入0.3mL水。将混合物旋转震荡,并在一个eppendorf微量离心机中离心大约3分钟,取出约1.0mL的上层水相,在一个SavantSpeed真空浓缩器中干燥。将样品在6N盐酸、0.4%(v/v)β-巯基乙醇中在氮气环境下在110-120℃水解24小时,使用过柱后茚三酮检测将四分之一的样品上一台Beckman Model 6300氨基酸分析仪。将种子中的相对游离氨基酸水平按赖氨酸或苏氨酸对亮氨酸的比例进行比较,即以亮氨酸作为内在标准。
与烟草种子相对,棒状杆菌DHDPS的表达在油菜转化子中导致游离赖氨酸积累的大量增加。表达最高的品系在种子中显示游离赖氨酸水平大于100倍的提高。表达AKIII-M4的转化子在没有棒杆菌DHDPS时显示种子中游离苏氨酸水平增加5倍。两种酶同时表达导致游离赖氨酸高水平的积累,但不导致苏氨酸高水平的积累。
在许多转化品系中观察到了高水平的α-氨基己二酸,这是赖氨酸分解代谢的标记。因此,通过使赖氨酸酮戊二酸还原酶失活来阻止赖氨酸的分解代谢将进一步增加种子中游离赖氨酸的积累。此外,将赖氨酸整合到一种多肽或富含赖氨酸的蛋白中将阻止分解代谢并导致种子中赖氨酸积累的增加。
为测定成熟种子中的总氨基酸组成,将2mg脱脂粉在6N盐酸、0.4%(v/v)β-巯基乙醇中在氮气环境下在110-120℃水解24小时,使用过柱后茚三酮检测将1/100的样品上一台Beckman Model 6300氨基酸分析仪。将种子中的相对氨基酸水平按赖氨酸、苏氨酸或α-氨基己二酸占总氨基酸的百分比进行比较。
在表达DHDPS和在种子中积累高水平赖氨酸的转化子之间有很好的相关性。观察到了比未转化对照赖氨酸水平提高5-100%的种子。在表达水平最高的转化子中,赖氨酸占种子总氨基酸的13%,明显高于以前已知的任何油菜种子。这个转化子同时表达高水平的大肠杆菌AKIII-M4和棒状杆菌DHDPS。
                             表12
FS926  转化子:菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’
BT593  转化子:菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’
BT597  转化子:菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’
               菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’
                                  WESTERN      WESTERN       %总氨基酸
                  游离氨基酸      棒状杆菌     大肠杆菌
              K/L    T/L   AA/LK                              K    T   AA
品系                                DHDPS      AKIII-M4WESTAR         0.8     2.0     0         -          -          6.5  5.6  0ZS199          1.3     3.2     0         -          -          6.3  5.4  0FS926-3        140     2.0     16     ++++          -          12   5.1  1.0FS926-9        110     1.7     12     ++++          -          11   5.0  0.8FS926-11       7.9     2.0     5.2      ++          -          7.7  5.2  0FS926-6        14      1.8     4.6     +++          -          8.2  5.9  0FS926-22       3.1     1.3     0.3       +          -          6.9  5.7  0FS926-27       4.2     1.9     1.1      ++          -          7.1  5.6  0FS926-29       38      1.8     4.7    ++++          -          12   5.2  1.6FS926-68       4.2     1.8     0.9      ++          -          8.3  5.5  0BT593-42       1.4     11      0         -         ++          6.3  6.0  0BT597-14       6.0     2.6     4.3      ++         +/-         7.0  5.3  0BT597-145      1.3     2.9     0         +           -BT597-4        38      3.7     4.5    ++++        ++++         13   5.6  1.6BT597-68       4.7     2.7     1.5      ++           +         6.9  5.8  0BT597-100      9.1     1.9     1.7    +++           ++         6.6  5.7  0BT597-148      7.6     2.3     0.9    +++            +         7.3  5.7  0BT597-169      5.6     2.6     1.7    +++          +++         6.6  5.7  0AA是α-氨基己二酸
                     实施例17使用一种lysC-M4嵌合基因作为一种选择标记转化玉米
成胚愈伤组织培养由不成熟的胚(大约1.0至1.5mm)开始,该不成熟的胚从一个玉米品系的粒上切下,该玉米品系被培育来提供一种“类型II愈伤组织”培养应答。在授粉后10至12天切下胚,并轴侧向下放置,与琼脂糖固化的补加0.5mg/L 2、4-D的N6培养基(N6-0.5)接触(Chu et al.(1974)Sci Sin 18:659-668)。将胚在暗处在27℃保存。易碎的成胚愈伤组织由未分化的细胞团组成,其中胚柄结构上的体细胞原胚和体细胞胚骨架从不成熟胚的盾片上增殖。鉴定从单个胚分离的成胚愈伤组织克隆,并每2至3周在N6-0.5培养基上转种。
使用颗粒轰击方法来将基因转移至愈伤组织培养细胞中。一种BiolisticTM PDS-1000/He (BioRAD Laboratories,Hercules,CA)被用于这些实验。
将含有嵌合基因HH534 5’区域/mcts/lysC-M4/HH2-1 3’区域(见实施例6)的质粒pBT573沉淀到金颗粒的表面。该质粒被设计来用于玉米中的组成型基因表达。为完成这一点,将2.5ug的pBT573(水中,浓度约1mg/mL)加入到25mL悬浮于水中(每mL 60mg金)的金颗粒中(平均直径为1.5um)。然后边旋转试管边加入氯化钙(25mL的2.5M溶液)和亚精胺(10mL、0.1M溶液)。然后将金颗粒在一个微量离心机中离心10秒钟,弃去上清。然后将金颗粒重新悬浮于200mL的无水乙醇中,再次离心并弃去上清。最后,将金颗粒重新悬浮于25mL无水乙醇中,并超声波处理两次,每次1秒。然后在每个巨载体皿中加入5uL DNA包被的金颗粒,使乙醇挥发,使DNA包被的金颗粒在皿中干燥。
将成胚愈伤组织(来自命名为#132.2.2的愈伤组织品系)安置在一个100×20mm培养皿中的一个直径约为6cm的圆形区域内,培养皿中含有补加了0.25M山梨糖醇和0.25M甘露醇的N6-0.5培养基。在轰击前植物在这种培养基中放置2小时作为一种预处理,并在轰击过程中维持在这种培养基中。在2小时预处理期间的末期,将含有组织的培养皿置于PDS-1000/He的橱中。然后将橱中的空气抽出直至28英寸Hg的真空。用氦脉冲对巨载体加速,使用一种当脉冲管中的氦压力达到1100psi时破裂的破裂膜。将组织放置在离终止屏约8cm处。用DNA包被的金颗粒轰击4个组织板。在轰击后,立即将愈伤组织转移至没有补加山梨糖醇或甘露醇的N6-0.5培养基中。
轰击后第7天,将小块(2-4mM直径)愈伤组织转移至不含酪素或脯氨酸但补加了赖氨酸和苏氨酸(LT)各2mM的N6-0.5培养基中。使组织继续在此培养基上缓慢生长,并每2周将其转移至新鲜的补加了LT的N6-0.5培养基中。12周后,在两个单独的、含有补加了LT的培养基的板中,鉴定了两个活跃生长的愈伤组织克隆。当这些克隆转种到选择培养基上时,它们继续生长。lysC-M4基因在选择到的克隆中的存在用PCR分析来证明。将愈伤组织转移到能促进植物再生的培养基中。
                    实施例18用组成型玉米启动子/cts/cordapA和组成型玉米启动子/cts/lysC-M4转化玉米
将嵌合基因盒---HH534 5’区域/mcts/ecodapA/HH2-1 3’区域加HH534 5’区域/mcts/lysC-M4/HH2-1 3’区域(实施例6)插入到载体pGem9z中制备一种玉米转化载体。用Sal I消化质粒pBT583(实施例6),并分离一个1850bp的含有HH534 5’区域/mcts/ecodapA/HH2-1 3’区域基因盒的片段。将此DNA片段插入到用Xho I消化的pBT573(实施例6)中,该载体携带有HH534 5’区域/mcts/lysC-M4/HH2-1 3’区域。所产生的载体含有以相同方向插入的两种嵌合基因,它被命名为pBT586。
使用颗粒轰击方法将载体pBT586导入玉米成胚愈伤组织中。成胚愈伤组织的建立和颗粒轰击的参数见实施例17的介绍。
在转化中,可以使用两种含有选择性标记的质粒载体中的一种。一种质粒---pALSLUC(Fromm et al.(1990)Biotechnology 8:833-839)含有一种玉米乙酰乳酸合成酶(ALS)基因的cDNA。该ALScDNA在体外进行了突变,因而该基因编码的酶对chlorsulfuron有抗性。该质粒还含有一种使用来自花椰菜花叶病毒的35S启动子和胭脂氨酸合成酶基因的3’区域来表达一种萤火虫荧光素酶编码区的基因(de Wet et al.(1987)Molec.Cell Biol.7:725-737)。另一种质粒---pDETRIC含有来自吸水链霉菌的bar基因,该基因能提供对杀虫剂glufosinate的抗性(Thompson et al.(1987)The EMBO Journal6:2519-2523)。该细菌基因中的翻译密码子从GTG改变为ATG以适应在植物中的翻译起始(De Block et al.(1987)The EMBO Journal6:2513-2518)。该bar基因由来自花椰菜花叶病毒的35S启动子驱动,并使用来自根癌农杆菌的章鱼氨酸合成酶基因的终止和聚腺苷酸化信号。
为进行轰击,将2.5ug的每种质粒---pBT586和两种选择标记质粒中的一种按实施例17中的介绍沉淀在金颗粒的表面。对成胚愈伤组织培养物的轰击也按实施例17中的介绍进行。
在轰击后的第7天,将组织转移至选择型培养基。将用选择标记pALSLUC轰击的组织转移至含有chlorsulfuron(30mg/L)并且不含酪素或脯氨酸的N6-0.5培养基中。将用选择标记pDETRIC轰击的组织转移至含有2mg/L的glufosinate并且不含酪素或脯氨酸的N6-0.5培养基中。继续让组织在这些选择培养基上缓慢生长。在另外2周后,将组织转移至含有选择试剂的新鲜N6-0.5培养基中。
在另外6-8周后,可以鉴定出chlorsulfuron和glufosinate抗性的愈伤组织克隆。当这些克隆转移至选择培养基时,它们继续生长。
pBT586在转化克隆中的存在已用PCR分析进行了证明。导入的AK酶的功能通过将转化克隆铺于含有赖氨酸和苏氨酸各2mM(LT选择,见实施例13)的N6-0.5培养基进行了检测。所有的克隆都能在LT培养基上生长,这说明大肠杆菌天冬氨酸激酶获得了表达并有合适的功能。为证实大肠杆菌DHDPS酶是有功能的,将转化的愈伤组织铺于含有2uM 2-氨乙基半胱氨酸(ACE)的N6-0.5培养基,后者是一种赖氨酸类似物和植物DHDPS的强抑制剂。转化的愈伤组织对AEC有抗性,这说明导入的DHDPS被产生和有功能,因为它对AEC的敏感性比植物酶低大约16倍。由数种转化克隆进行了植物再生,并使其生长至成熟。
                     实施例19用菜豆蛋白启动子/cts/cordapA和菜豆蛋白启动子/cts/lysC-M4嵌合基因转化大豆
将嵌合基因盒---菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域加菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域(实施例6)插入到大豆转化载体pBT603中(图8A)。该载体在一个修饰的pGEM9Z质粒中含有一个由来自花椰菜花叶病毒的35S启动子驱动大肠杆菌β-葡糖醛酸糖苷酶基因表达组成的大豆转化标记基因(Jefferson et al.(1986)Proc.Natl.Acad.Sci.USA 83:8447-8451)并带有Nos3’。
为插入菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域,该基因盒以一个3.3kb的Hind III片段的形式分离,并插入到用Hind III消化的pBT603中,产生质粒pBT609。该双体质粒含有以与35S/GUS/nos 3’标记基因相反方向插入的嵌合基因菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域。
为插入菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域,该基因盒以一个2.7kb的BamH I片段的形式分离(如同实施例15的介绍),并插入到用BamH I消化的pBT609中,产生质粒pBT614(图8B)。该质粒含有以相同方向插入的两种嵌合基因---菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域和菜豆蛋白5’区域/cts/cordapA/菜豆蛋白3’区域,两种嵌合基因均与35S/GUS/Nos 3’标记基因方向相反。
按照美国专利No.5,015,580中的介绍用质粒pBT614转化大豆。大豆转化由Agracetus Company(Middleton,WI)进行。从5个转化品系中获得了种子,并进行了分析。
预计转基因应在转化植物的R1种子中分离。为鉴定携带转化标记基因的种子,用剃刀将一小片种子切下,并置于一次性塑料微量板的一个小孔中。制备一种含有100mM NaH2PO4、10mM EDTA、0.5mM K4Fe(CN)6、0.1%TritonX-100、0.5mg/mL 5-溴-4-氯-3-吲哚-β-葡糖醛酸的GUS分析混合物,并在每个微量孔中加入0.15mL。将微量板在37℃温育45分钟。显兰色表明种子中GUS的表达。
7个转化品系中有5个显示GUS表达约3∶1的分离,这表明GUS基因插入到大豆基因组的一个单一位点。其他转化子显示了9∶1和15∶1的分离,说明GUS基因插入到两个位点。
通过研磨成细粉从单个种子的一个片段制备了一种粉。按下述方法从粉中抽提总蛋白:将1mg粉加入0.1mL的43mM Tris-HClpH6.8、1.7%SDS、4.2%(v/v)β-巯基乙醇、8%(v/v)甘油)中,将悬液旋转震荡,煮沸2-3分钟,再旋转震荡。所获得的悬液在一台微量离心机上在室温离心5分钟去除颗粒物。取每个抽提物10uL走SDS聚丙烯酰胺凝胶,以细菌产生的DHDPS或AKIII作为分子大小对照。然后将蛋白电转印到一张硝酸纤维膜上。使用BioRad提供的标准程序及其Immun-Blot Kit将膜分别与DHDPS或AKIII抗体按1∶5000或1∶1000稀释的兔血清进行反应。漂洗去除未结合的第一抗体之后,将膜与第二种抗体---1∶3000稀释的结合有辣根过氧化物酶的驴抗兔Ig(Amersham)反应。漂洗去除未结合的二抗后,将膜与Amersham化学发光试剂反应,并在X-射线胶片上曝光。
7个转化子中有6个表达DHDPS蛋白。在这6个表达DHDPS的转化子中,单个种子中DHDPS和GUS的表达之间有很好的相关性(表13)。因此,GUS和DHDPS基因整合在大豆基因组的相同位点。7个转化子中有4个表达AKIII蛋白,并且同样单个种子中AKIII、GUS和DHDPS的表达之间有很好的相关性(表13)。因此在这四个转化子中GUS、AKIII和DHDPS基因整合在大豆基因组的相同位点。有一个转化子在其种子中只表达GUS。
为测定种子中的游离氨基酸组成,按下述方法从种子粉中抽提游离氨基酸。在室温将大约8-10mg粉加入1.0mL按12v/5v/3v比例混合的甲醇/氯仿/水(MCW)中。将混合物旋转震荡,并接着在一个eppendorf微量离心机中离心约3分钟。将大约0.8mL上清倒出,在此上清中加入0.2mL氯仿,接着加入0.3mL水。将混合物旋转震荡,并在一个eppendorf微量离心机中离心约3分钟,取出约1.0mL的上层水相,在一个Savant Speed真空浓缩器中干燥。将样品在6N盐酸、0.4%(v/v)β-巯基乙醇中在氮气环境下在110-120℃水解24小时,使用过柱后茚三酮检测将十分之一的样品上一台Beckman Model6300氨基酸分析仪。将种子中的相对游离氨基酸水平按赖氨酸对亮氨酸的比例进行比较,即以亮氨酸作为内在标准。
单独表达棒状杆菌DHDPS和同时表达它与大肠杆菌AKIII-M4的大豆转化子在其种子中积累高水平的游离赖氨酸。观察到了游离赖氨酸水平20倍至120倍的提高(表13)。在含有高水平赖氨酸的种子中还观察到了高水平的酵母氨酸,它是赖氨酸分解代谢的标志。因此,通过使赖氨酸酮戊二酸还原酶失活来阻止赖氨酸的分解代谢将进一步增加大豆种子中游离赖氨酸的积累。此外,将赖氨酸整合到一种多肽或富含赖氨酸的蛋白中将阻止分解代谢并导致种子中赖氨酸积累的增加。
为测定成熟种子中的总氨基酸组成,将1-4mg种子粉在6N盐酸、0.4%(v/v)β-巯基乙醇中在氮气环境下在110-120℃水解24小时,使用过柱后茚三酮检测将1/50的样品上一台Beckman Model 6300氨基酸分析仪。种子中的赖氨酸水平(和其他氨基酸)按其占总氨基酸的百分比进行比较。
表达棒状杆菌DHDPS的大豆种子显示种子总赖氨酸积累的显著提高。我们观察到种子中总赖氨酸含量比未转化的对照增加5-35%。在这些种子中赖氨酸占种子总氨基酸的7.5-7.7%。
同时表达棒状杆菌DHDPS和大肠杆菌AKIII-M4的大豆种子比单独表达棒状杆菌DHDPS的大豆种子显示更多的种子总赖氨酸积累。我们观察到种子中总赖氨酸含量增加超过4倍。在这些种子中,赖氨酸占种子总氨基酸的20-25%,明显高于以前已知的任何大豆种子。
                         表13
品系-种子       GUS      游离LYS/LEU    DHDPS    AKIII    %总的种子赖氨酸
A2396-145-4      -           0.9          -        -            5.8
A2396-145-8      -           1.0          -        -
A2396-145-5      -           0.8                                5.9
A2396-145-3      -           1.0
A2396-145-9      +           2.0
A2396-145-6      +           4.6
A2396-145-1      +           8.7
A2396-145-10     +           18.4                               7.5
A2396-145-7      +           21.7         +       -             6.7
A2396-145-2      +           45.5         +       -             7.2
A5403-175-9      -           1.3
A5403-175-4      -           1.2          -       -             6.0
A5403-175-3      -           1.0          -       -             6.0
A5403-175-7      +           1.5
A5403-175-5      +           1.8
A5403-175-1      +           6.2A5403-175-2       +        6.5                                 6.3A5403-175-6       +        14.4A5403-175-8       +        47.8           +         -          7.7A5403-175-10      +        124.3          +         -          7.5A5403-181-9       +        1.4A5403-181-10      +        1.4            -         -          5.7A5403-181-8       +        0.9A5403-181-6       +        1.5A5403-181-4       -        0.7            -         -          5.9A5403-181-5       +        1.1A5403-181-2       -        1.8            -         -          5.6A5403-181-3       +        2.7            -         -          5.5A5403-181-7       +        1.9A5403-181-1       -        2.3A5403-183-9       -        0.8A5403-183-6       -        0.7            -         -          6.0A5403-183-8       -        1.3A5403-183-4       -        1.3            -         -          6.0A5403-183-5       +        0.9A5403-183-3       +        3.1A5403-183-1       +        3.3A5403-183-7       +        9.9A5403-183-10      +        22.3           +         +          6.7A5403-183-2       +        23.1           +         +          7.3A5403-196-8       -        0.9            -         -          5.9A5403-196-6       +        8.3A5403-196-1       +        16.1           +         +          6.8A5403-196-7       +        27.9A5403-196-3       +        52.8A5403-196-5       +        26A5403-196-2       +        16.2           +         +A5403-196-10      +        29             +         +          7.5A5403-196-4       +        58.2           +         +          7.6A5403-196-9       +        47.1A2396-233-1         +                    +        +      25A2396-233-2         +                                    18A2396-233-3         +                                    23A2396-233-4         +                                    20A2396-233-5         -                  +/-        -      6.0A2396-233-6         +                                    16A2396-233-13        +                    +        +      18A2396-234-1         +                    +        +      8.3A2396-234-2         +                    +        +      13A2396-234-3         +                                    10A2396-234-4         +                                    19A2396-234-9         +                                    15A2396-234-16        -                    -        -      5.9野生型对照         -          0.9       -        -      5.6
                      实施例20一种植物赖氨酸酮戊二酸还原酶基因的分离
在正在发育的玉米种子的不成熟胚乳中已经观察到了赖氨酸酮戊二酸还原酶(LKR)的酶活性(Arruda et al.(1982)Plant Physiol.69:988-989)。LKR活性自胚乳发育启动时迅速增加,在授粉后约20天达到高峰,然后降低(Arruda et al.(1983)Phytochemistry 22:2687-2689)。
为克隆玉米LKR基因,从授粉19天后正在发育的种子中分离RNA。将此RNA送至Clentech Laboratories,Inc.,(Palo Alto,CA),在载体λZap II中进行一个cDNA文库的常规合成。按Clentech提供的程序将λZap II文库转变为一个噬菌粒文库,然后转变为一个质粒文库。一旦转变成一个质粒文库,所获得的氨苄青霉素抗性克隆就携带插入在载体pBluescript SK(-)中的cDNA。该cDNA的表达在载体上的lacZ启动子的控制之下。
使用100uL的λZap II噬菌体和1uL的丝状辅助噬菌体的混合物制备了两个噬菌粒文库。使用100uL的λZap II噬菌体和10uL的辅助噬菌体的混合物以及20uL的λZap II噬菌体和10uL的辅助噬菌体的混合物制备了另外两个噬菌粒文库。在不考虑所用的混合物时,这些噬菌粒制备物的滴度相似,在使用大肠杆菌菌株XL1-Blue为宿主时约为每ml 2×103氨苄青霉素抗性转染子,在以DE126(见下文)为宿主时约为每ml 1×103
为选择携带LKR基因的克隆,我们构建了一个特殊设计的大肠杆菌宿主---DE126。DE126的构建分几个阶段。(1)使用一种标准方法(方法见J.Miller,Experiments in Molecular Genetics)通过转染TST1培养物(F-,araD139,Δ(argF-lac)205,flb5301,pstF25,relA1,rpsL150,malE52∷Tn10,deoC1,λ-1)(E.coli Genetic StockCenter#6137)制备大肠杆菌噬菌体Plvir的一种通用转导贮存物。
(2)将此噬菌体贮存物在一个转导杂交中用作供体(方法见J.Miller,Experiments in Molecular Genetics),并以菌株GIF106M1(F-,arg-,ilvA296,lysC1001,thrA1101,metL1000,λ-1,rpsL9,malT1,xyl-7,mtl-2,thil(?),supE44(?))(E.coliGenetic Stock Center#5074)作为受体。在含有抗生素四环素的加富培养基(补加有DAP的L)上选择重组子。提供四环素抗性的转座子Tn10插入在菌株TST1的malE基因中。由此杂交获得的四环素抗性转导子可能含有malE基因附近的高达2分钟的大肠杆菌染色体。基因malE和lysC的距离少于0.5分钟,正好在共转导的距离内。
(3)对200个四环素抗性的转导子全部进行表型分型,还进行适当的发酵和营养性状分析。由于在thrA、metL和lysC中的突变,受体菌株GIF106M1完全没有天冬氨酸激酶同功酶,因此其生长需要苏氨酸、甲硫氨酸、赖氨酸和内消旋-二氨基庚二酸(DAP)的存在。带有来自TST1中固有的lysC+和malE∷Tn10的转导子预期能在基本培养基上生长,基本培养基含有维生素B1、L-精氨酸、L-异亮氨酸和L-缬氨酸,并含有葡萄糖作为碳源和能量来源。而且,具有lysC+、metL-和thrA-的遗传组成的菌株只表达赖氨酸敏感的天冬氨酸激酶。因此向基本培养基中加入赖氨酸通过诱导苏氨酸、甲硫氨酸和DAP饥饿而抑制lysC+重组子的生长。在检查的200个四环素抗性转导子中,有49个能在不含苏氨酸、甲硫氨酸和DAP的基本培养基上生长,而且所有这49个转导子都被向基本培养基中加入赖氨酸所抑制。其中一个这种转导子被命名为DE125。DE125的表型为四环素抗性、生长需要精氨酸、异亮氨酸和缬氨酸、并对赖氨酸敏感。此菌株的基因型为F-malE∷Tn10 arg- ilvA296 thrA1101 metL1000λ- rpsL9 malT1 xyl-7mtl-2 thil(?)supE44(?)。
(4)此步骤涉及菌株DE125的一种雄性衍生物的制备。使用接合的方法将菌株DE125与雄性菌株AB1528(F’16/delta(gpt-proA)62,lacY1或lacZ4,glnV44,galK2 rac-(?),hisG4,rfbd1,mgl-51,kdgK51(?),ilvC7,argE3,thi-1)(E.coli Genetic StockCenter#1528)交配。F’16携带ilvGMEDAYC基因束。将两种菌株在允许每种菌株生长的加富培养基上交叉划线。温育后,将板影印到一种含有四环素、精氨酸、维生素B1和葡萄糖的合成培养基中。DE125不能在这种培养基上生长,因为它不能合成异亮氨酸。AB1528的生长也受到抑制,因为该培养基中含有抗生素四环素并且没有脯氨酸和组氨酸。在这个选择培养基上长出了一片细胞。将这些重组细胞在相同培养基上进行单菌落分离。其中一个克隆的表型被测定为Ilv+、Arg-、TetR、赖氨酸敏感、雄性特异性噬菌体(MS2)敏感,与简单地将F’16从AB1528转移到DE125一致。此克隆被命名为DE126,它的表型为F’16/malE52∷Tn10,arg-,ilvA296,thrA1101,metL1000,Lys C+,λ-,rpsL9,malT1,xyl-7,mtl-2,thil-1? supE44?。它在合成培养基中被20ug/mL的L-赖氨酸抑制。
为从玉米cDNA文库中选择携带LKR基因的克隆,将100uL噬菌粒文库与100uL DE126在L肉汤中生长的过夜培养物混合,将细胞铺于含有维生素B1、L-精氨酸、作为碳源和能量来源的葡萄糖、100ug/mL的氨苄青霉素以及浓度为20、30或40ug/mL的L-赖氨酸的合成培养基上。对三种不同的赖氨酸浓度每种制备4块平板。预计噬菌粒和DE126细胞的数量可产生每块平板大约1×105氨苄青霉素抗性的转染子。每块平板能长出10至30个赖氨酸抗性克隆(大约每5000个氨苄青霉素抗性克隆1个赖氨酸抗性)。
从10个独立克隆中分离质粒DNA,并再转化到DE126中。10个DNA中有7个能产生赖氨酸抗性克隆,这证明质粒上携带有赖氨酸抗性性状。对几个克隆的DNA进行了序列测定和生物化学分析。我们发现插入DNA片段来自大肠杆菌基因组而不是一种玉米cDNA,这表明Clontech提供的cDNA文库被污染。
使用另一种方法来鉴定编码LKR的植物cDNA。该方法基于植物LKR与编码酵母氨酸脱氢酶的真菌基因的预期的同源性。真菌酵母氨酸脱氢酶(谷氨酸形成)和酵母氨酸脱氢酶(赖氨酸形成)催化真菌赖氨酸生物合成途径的最后两个步骤。植物LKR和真菌酵母氨酸脱氢酶(赖氨酸形成)催化正向和逆反应二者,并使用相同的底物和使用相似的辅因子。与此类似,植物酵母氨酸脱氢酶(谷氨酸形成)催化赖氨酸分解代谢途径的第二个步骤,它在正向和逆反应二者中都起作用,使用相同的底物,并使用与真菌酵母氨酸脱氢酶(谷氨酸形成)相似的辅因子。
从人和牛的研究中获得的生物化学和遗传证据已经证明,哺乳动物LKR和酵母氨酸脱氢酶(谷氨酸形成)酶活性存在于一个单一的蛋白上,该蛋白的单体分子量约为117,000。这与真菌酶相反,真菌酶存在于分离的蛋白上,酵母氨酸脱氢酶(赖氨酸形成)的分子量约为44,000,酵母氨酸脱氢酶(谷氨酸形成)的分子量约为51,000。已经报道植物LKR具有约140,000的分子量,这表明它与动物催化蛋白一样,LKR和酵母氨酸脱氢酶(谷氨酸形成)酶活性存在于一个单一的蛋白上。
数种编码真菌酵母氨酸脱氢酶的基因已经获得了分离和序列测定(Xuan et al.(1990)Mol.Cell.Biol.10:4795-4806,Feller etal.(1994)Mol.Cell.Biol.14:6411-6418)。由这些基因序列推导的真菌蛋白序列,可用来从植物cDNA数据库中筛选编码与真菌酵母氨酸脱氢酶同源的植物蛋白的DNA片段。我们从拟南芥菜中发现了两个植物cDNA片段---SEQ ID NO:102和SEQ ID NO:103,它们分别编码多肽SEQ ID NO:104和SEQ ID NO:105,这两个多肽与酵母氨酸脱氢酶(谷氨酸形成)同源。真菌和植物多肽之间的序列相似性(见图9)证明,这些cDNA编码拟南芥酵母氨酸脱氢酶。我们合成了寡核苷酸SEQ ID NO:108和SEQ ID NO:109,并用于从拟南芥基因组DNA中扩增一个2.24kb的DNA片段。该片段的DNA测序证明,它编码LKR/SDH。使用Boehringer Mannheim’s Dig-High Prime试剂盒和程序用地高辛(DIG)标记该片段。用此探针通过噬菌斑杂交对一个CD4-8Landsberg erecta基因组文库进行筛选。将大约2.7×105重组噬菌体铺于在37℃过夜培养的宿主大肠杆菌LE392。程序与DIG Wash andBlock Set(Boehringer Mannheim)中的介绍相同,杂交温度设置为55℃。分离到了5个阳性克隆,将其中一个亚克隆到质粒载体pBluescriptSK+/-(Stratagene),并转化到DH5αTM感受态细胞(GibcoBRL)中,并测序。
拟南芥LKR/SDH基因的全部基因组序列示于SEQ ID NO:110。该序列包括大约2kb的5’非编码区和500bp的3’非编码区以及23个内含子。通过RT-PCR从全部拟南芥RNA中分离了相应cDNA的重叠片段。LKR-SDH cDNA的序列分析揭示了一个3.16kb的ORF,它编码一个117kd的蛋白,序列分析证明,LKR和SDH酶位于一条多肽。来自cDNA的拟南芥LKR/SDH基因的完整的蛋白编码序列示于SEQ IDNO:111。拟南芥LKR/SDH蛋白的推导的氨基酸序列示于SEQ ID NO:112。该蛋白缺少一个N-末端靶向序列,这说明赖氨酸降解途径位于植物细胞溶胶中。
根据拟南芥LKR/SDH的氨基酸序列与其他LKR蛋白的氨基酸序列的比较设计了简并性寡核苷酸SEQ ID NO:113和SEQ ID No:114。它们被用来从分离自正在发育的大豆或玉米种子的mRNA或由mRNA合成的cDNA用PCR扩增大豆和玉米LKR/SDH cDNA片段。对PCR产生的大豆和玉米cDNA进行克隆和测序。大豆LKR/SDH cDNA片段的序列示于SEQ ID NO:115,玉米cDNA片段的序列示于SEQ ID NO:116。大豆LKR/SDH蛋白的推导的部分氨基酸序列示于SEQ ID NO:117。玉米LKR/SDH蛋白的推导的部分氨基酸序列示于SEQ ID NO:118。上述用PCR获得的编码玉米和大豆LKR/SDH蛋白的部分cDNA被用于扩展有关其功能的序列信息的程序。这些程序包括从cDNA文库中鉴定重叠克隆的RACE和直接的DNA:DNA杂交,它们对本领域的技术人员来说是熟知的。由这些结果,我们获得了编码LKR/SDH的更完整的玉米和大豆cDNA的序列。SEQ ID NO:119和120分别列出了来自玉米和大豆的几乎全长的LKR/SDH编码区的序列。由这些大豆和玉米的cDNA编码的蛋白的推导序列分别示于SEQ ID NO:121和122。
从用水稻根和叶以及用小麦苗制备的文库中鉴定了编码水稻和小麦LKR/SDH的部分cDNA克隆。cDNA文库按照厂商推荐的程序制备在Uni-ZAPTMXR载体中(Stratagene Cloning Systems,La Jolla,CA)。Uni-ZAPTMXR文库转变为质粒文库按照Stratagene提供的程序来完成。通过转变,cDNA插入子包含在质粒载体pBluescript中。来自随机挑选的含有重组pBluescript质粒的细菌克隆的cDNA插入子用聚合酶链反应进行扩增,扩增反应使用对插入cDNA序列两翼的载体序列特异的引物,或者从培养的细菌细胞中制备质粒DNA。扩增的插入DNA或质粒DNA在染料-引物测序反应中测序来制备部分cDNA序列(表达的序列标记或“ESTs”,见Adams,M.D.et al.,(1991)Science252:1651)。所获得的ESTs用一台Perkin Elmer Model 377荧光测序仪进行分析。将ESTs可能编码的蛋白产物与拟南芥LKR/SDH的全长序列(SEQ ID NO:112)比较。构建了一个来自水稻的部分cDNA的一个毗连序列,并示于SEQ ID NO:125。由该cDNA毗连序列预测的蛋白片段示于SEQ ID NO:126。还从水稻中鉴定了另一个对应于LKR/SDH编码区的3’端的cDNA,该序列列于SEQ ID NO:127。预测的蛋白片段示于SEQ ID NO:128。一个小麦部分克隆获得了鉴定,该克隆含有示于SEQ ID NO:129的序列。该cDNA编码的预测的蛋白片段列于SEQ ID NO:130。
SDH编码区包括拟南芥cDNA克隆(SEQ ID NO:131)的3’的1.4kb,并编码一种约52kD的蛋白(SEQ ID NO:132)。使用PCR引物制备了一种编码SDH的DNA片段,该DNA片段被加上了所需的限制内切酶片段,将该DNA片段连接到原核表达载体pBT430(见实施例2)中。限制内切酶切割位点的加入导致第二个密码子由thr改变为ala。在表达T7 RNA聚合酶的大肠杆菌BL21(DE3)LysS宿主中获得了拟南芥SDH的高水平表达。IPTG诱导的转化了携带1.4kb插入子的载体的细胞抽提物用SDS-PAGE分析,在这些细胞中有一种预期大小的蛋白超表达。将细胞抽提物分成上清(可溶性)和沉淀(不可溶)组分显示,在两者中都存在大量的蛋白。测量了细菌抽提物的可溶性部分中的SDH活性。在来自用未修饰的载体转化的细胞抽提物中没有观察到SDH活性。来自含有SDH cDNA插入子的细胞抽提物能将大量的NAD+转变为NADH。该反应是SDH特异的,因为在没有SDH底物酵母氨酸的情况下没有观察到明显的活性。由这些细菌抽提物纯化SDH蛋白,并用于制备针对这些蛋白的兔抗体。
为阻断转化植物中LKR基因的表达,通过将LKR基因或基因片段与上面介绍的任何一种植物启动子序列连接来构建一种设计来共抑制LKR的嵌合基因(见U.S.Patent No.5,231,020中,通过共抑制来阻断植物基因表达的方法学)。用PCR在位置7引入一个Nco I位点和在位置1265引入一个Kpn I位点来对玉米LKR基因---SEQ ID NO:120进行修饰。将含有玉米LKR基因片段的该Nco I和Kpn I DNA片段插入到一种含有麦谷蛋白2启动子和10kD玉米醇溶蛋白3’区域的质粒(见实施例25)中,来制备一种用于在玉米胚乳中共抑制LKR表达的嵌合基因。用PCR在位置2引入一个Nco I位点和在位置690引入一个Kpn I位点来对大豆LKR基因---SEQ ID NO:119进行修饰。将含有大豆LKR基因片段的该Nco I和Kpn I DNA片段插入到一种含有KTI3启动子和KTI3 3’区域的质粒(见实施例6)中,来制备一种用于在大豆种子中共抑制LKR表达的嵌合基因。另外,可以通过将LKR基因或基因片段按反方向与上面介绍的任何植物启动子序列连接,来构建一种设计来表达针对全部或部分LKR基因的反义RNA的嵌合基因。(见U.S.Patent No.5,107,065中通过反义RNA来阻断植物基因表达的方法学)。可按照其他实施例如实施例18或实施例19中的介绍通过转化将共抑制或反义嵌合基因导入植物。然后选择其中内源性LKR基因的表达降低或消除的转化子。
                      实施例21在表达载体pSK5中构建合成基因
为便于下面介绍的合成基因的构建和表达,需要构建一种具有下列属性的质粒载体:
1.没有Ear I限制内切酶位点,这样序列的插入将产生一个单一的位点。
2.含有一个四环素抗性基因,从而避免质粒在生长和毒性蛋白的表达过程中丢失。
3.含有来自质粒pBT430的大约290bp,包括T7启动子和终止元件,用于插入序列在大肠杆菌中表达。
4.在T7启动子后面的适当位置含有单一的EcoR I和Nco I限制内切酶位点以允许寡核苷酸序列的插入。
为获得属性1和属性2,本发明的申请者使用了质粒pSK1,该质粒是pBR322的一种自发突变体,其中氨苄青霉素基因和该基因附近的Ear I位点被删除。质粒pSK1保留了四环素抗性基因、位于碱基1的EcoR I限制内切酶位点和位于碱基2353的一个单一Ear I位点。为移去pSK1的位于碱基2353的Ear I位点,用pSK1作为模板进行了一个聚合酶链反应(PCR)。将大约10飞摩尔的pSK1与寡核苷酸SM70和SM71各1ug混合,两种寡核苷酸在一台ABI 1306B DNA合成仪上使用厂商的程序合成。SM70    5’-CTGACTCGCTGCGCTCGGTC 3’       SEQ ID NO:16SM71    5’-TATTTTCTCCTTACGCATCTGTGC-3’   SEQ ID NO:17
这些寡核苷酸在pSK1模板上的引导位点示于图10。PCR使用一个Perkin-Elmer Cetus试剂盒(Emeryville,CA)按照厂商的说明在一台相同公司制造的热循环仪上进行。PCR共进行25各循环,参数为95℃、1分钟;42℃、2分钟;72℃、12分钟。寡核苷酸被设计来引导除了Ear I附近的一个30b片段外的整个pSK1质粒的复制(见图10)。从100uL反应产物中取10uL上1%琼脂糖凝胶,并用溴化乙啶染色,来显示一个约3.0kb的相当于复制质粒的预期大小的条带。
将剩下的PCR反应混合物(90uL)与20uL 2.5mM的三磷酸脱氧核苷酸(dATP、dTTP、dGTP和dCTP)混合,加入30单位的Klenow酶,并将混合物在37℃温育30分钟,接着在65℃温育10分钟。Klenow酶被用来补平PCR产生的不平末端。将DNA用乙醇沉淀、用70%乙醇洗涤、真空干燥、并重新悬浮于水。然后用T4 DNA激酶在存在1mM ATP的条件下在激酶缓冲液中处理DNA。将此混合物在37℃温育30分钟,接着在65℃温育10分钟。在10uL激酶处理的制备物中,加入2uL5X连接缓冲液和10单位的T4连接酶。连接在15℃下进行16小时。连接后,将DNA分成两半,其中一半用Ear I酶消化.Klenow、激酶、连接和限制内切酶反应按Sambrook et al.,(Molecular Cloning,ALaboratory Manual,2nd ed.(1989)Cold Spring Harbor LaboratoryPress)的介绍进行。Klenow、激酶、连接酶和多数限制内切酶购自BRL。一些限制内切酶购自NEN Biolabs(Beverly,MA)或BoehringerMannheim(Indianapolis IN)。使用CaCl2法按Sambrook etal.,(Molecular Cloning,A Laboratory Manual,2nd ed.(1989)Cold Spring Harbor Laboratory Press)的介绍将两个连接的DNA样品分别转化到感受态的JM103[supE thiΔ(lac-proAB)F’[traD36proAB,lacIq lacZ ΔM15]限制阴性]中,并铺于含有12.5ug/mL四环素的培养基中。Ear I消化和未消化获得了相同数量的转化子,这表明Ear I位点已从这些结构物中移去。按Sambrook etal.,(Molecular Cloning,A Laboratory Manual,2nd ed.(1989)Cold Spring Harbor Laboratory Press)的介绍用小量碱裂解法制备DNA,接着用限制内切酶消化分析,来对克隆进行筛选。选择了一个单独的克隆,该克隆对四环素有抗性,并且不含任何Ear I位点。此载体被命名为pSK2。pSK2剩余的EcoR I位点通过用EcoR I消化并用Klenow补平并连接来破坏。一个不含EcoR I位点的克隆被命名为pSK3。
为获得上述属性3和属性4,用PCR从质粒pBT430(见实施例2)扩增噬菌体T7 RNA聚合酶启动子/终止子元件。寡核苷酸引物SM78(SEQ ID NO:18)和SM79(SEQ ID NO:19)被设计来从pBT430中引导一个跨越T7启动子/终止子序列的300bp的片段(见图10)。SM78 5’-TTCATCGATAGGCGACCACACCCGTCC-3’  SEQ ID NO:18SM79 5’-AATATCGATGCCACGATGCGTCCGGCG-3’  SEQ ID NO:19
按照前面的介绍使用pBT430作为模板进行PCR反应,并制备一种300bp的片段。片段的末端按照上面的介绍使用Klenow酶补平并磷酸化。来自质粒pSK3的DNA用PvuII消化,然后用牛肠碱性磷酸酶(Boehringer Mannheim)处理来移去5’磷酸。该程序按Sambrook etal.,(Molecular Cloning,A Laboratory Manual,2nd ed.(1989)Cold Spring Harbor Laboratory Press)的介绍进行。酶切和去磷酸化的pSK3 DNA用乙醇沉淀,并取一部分与PCR产生的含有T7启动子序列的片段用于一个连接反应。将连接混合物转化到大肠杆菌JM103[supE thi Δ(lac-proAB)F’[traD36 proAB,lacIq lacZ ΔM15]限制阴性]中,并筛选四环素抗性克隆。质粒DNA用小量碱法制备,并进行限制内切酶分析来检测PCR产物的插入和方向。选择两个克隆进行序列分析:质粒pSK5含有示于图10的方向的片段。使用SequenaseT7 DNA聚合酶(US Biochemical Corp.)和厂商推荐的程序在碱变性的双链DNA上进行的序列分析表明,pSK5在T7启动子/终止子序列中没有PCR复制错误。
基于Ear I位点的重复合成基因序列的构建的策略示于图11。第一步是一个编码14个氨基酸的碱性基因的寡核苷酸序列的插入。该寡核苷酸插入子含有一个单一的Ear I限制内切酶位点用于随后的编码一个或多个7价重复的寡核苷酸的插入,并加入一个单一的Asp718限制内切酶位点用于将基因序列转入植物载体。寡核苷酸的翼端被设置为允许其插入至载体pSK5的单一Nco I和EcoR I位点。
               M  E  E  K  M  K  A  M  E  E  K
SM81     5′-CATGGAGGAGAAGATGAAGGCGATGGAAGAGAAG
SM80          3′-CTCCTCTTCTACTTCCGCTACCTTCTCTTC
              NCO I                        EAR I
         M  K  A                          (SEQ ID NO:22)
SM81     ATGAAGGCGTGATAGGTACCG-3′        (SEQ ID NO:20)
SM80     TACTTCCGCACTATCCATGGCTTAA-5′    (SEQ ID NO:21)
                       ASP718 ECOR I
质粒pSK5的DNA用Nco I和EcoR I限制内切酶完全消化,并用琼脂糖凝胶电泳纯化。将纯化的DNA(0.1ug)与寡核苷酸SM80(SEQID NO:14)和81(SEQ ID NO:13)各1ug混合,并连接。将连接产物转化至大肠杆菌JM103[supE thi Δ(lac-proAB)F’[traD36 proAB,lacIq lacZ ΔM15]限制阴性]中,用快速质粒DNA提取法并接着用限制内切酶消化分析来筛选四环素抗性的转化子。选择了一个克隆,该克隆具有Ear I、Nco I、Asp718和EcoR I位点各一个,这表明寡核苷酸的适当插入。该克隆被命名为pSK6(图12)。对T7启动子后面的DNA区域的测序证明了预期序列的寡核苷酸的插入。
通过制备能直接连接到碱性基因的单一Ear I位点中的寡核苷酸对,将重复7价编码序列添加到上述碱性基因结构中。寡核苷酸SM84(SEQ ID NO:23)和SM85(SEQ ID NO:24)编码SSP5 7价重复。寡核苷酸SM82(SEQ ID NO:25)和SM83(SEQ ID NO:26)编码SSP77价重复。
SSP5        M  E  E  K  M  K  A        (SEQ ID NO:28)
SM84  5′-GATGGAGGAGAAGATGAAGGC-3′    (SEQ ID NO:23)
SM85  3′-  CCTCCTCTTCTACTTCCGCTA-5′  (SEQ ID NO:24)
SSP7        M  E  E  K  L  K  A        (SEQ ID NO:27)
SM82  5′-GATGGAGGAGAAGCTGAAGGC-3′    (SEQ ID NO:25)
SM83  3′-  CCTCCTCTTCGACTTCCGCTA-5′  (SEQ ID NO:26)
将各套寡核苷酸连接,并纯化获得编码多个7价重复的DNA片段用于插入到表达载体。将总量约为2ug的每套寡核苷酸磷酸化,并在室温连接2小时。将各套寡核苷酸的连接多聚体在一个18%非变性的20×20×0.015cm的聚丙烯酰胺凝胶(丙烯酰胺∶双丙烯酰胺=19∶1)上分离。用下面的方法纯化凝胶上分离的168bp(8n)或更大的多聚体形式:切下含有条带的聚丙烯酰胺小片,加入1.0mL的0.5M乙酸胺、1mM EDTA(pH7.5),在37℃旋转试管过夜。离心沉淀聚丙烯酰胺,在上清中加入1ug的tRNA,用2倍体积的乙醇在-70℃沉淀DNA片段,用70%(v/v)乙醇洗涤,干燥,并重新悬浮于10uL水中。
用Ear I酶完全消化10微克的pSK6 DNA,并用牛肠碱性磷酸酶处理。按下述方法分离切割和去磷酸化的载体DNA:在低熔点琼脂糖凝胶上电泳后,切下DNA条带,在55℃使琼脂糖液化,按照厂商推荐的程序用NACS PREPAC柱(BRL)纯化。将大约0.1ug的Ear I消化和磷酸酶处理的纯化pSK6 DNA与5uL凝胶纯化的寡核苷酸多聚体混合并连接。将连接混合物转化到大肠杆菌JM103[supE thi Δ(lac-proAB)F’[traD36 proAB,lacIq lacZ ΔM15]限制阴性]中,并筛选四环素抗性克隆。通过限制内切酶消化用快速质粒制备法制备的DNA确定插入DNA的长度,来筛选克隆。限制内切酶分析通常用Asp718和Bgl II消化质粒DNA并接着在18%非变性的聚丙烯酰胺凝胶上分离来进行。用溴化乙啶将片段染色,当只有碱性基因片段存在时,就会显示产生了一个150bp的片段。寡核苷酸片段的插入将以21碱基的倍数增加此大小。通过这种筛选,我们选择了几个克隆用于DNA序列分析和在大肠杆菌中表达编码序列。
                       表14
                         7价氨基酸克隆#      SEQ ID NO:    重复(SSP)测序      SEQ ID NO:C15            29         5.7.7.7.7.7.5          30C20            31         5.7.7.7.7.7.5          32C30            33         5.7.7.7.7.5            34D16            35         5.5.5.5                36D20            37         5.5.5.5.5              38D33            39         5.5.5.5                40每个结构物的序列两翼的第一个和最后一个SSP5 7价来自上面介绍的碱性基因。插入子用下划线表示。
由于寡核苷酸的寡聚形式的凝胶纯化并没有得到预期的较大插入子(即大于8n)的富集,本发明的申请者使用了一种不同的方法来进行后面几轮插入构建。为构建这种结构物系列,另外制备了分别编码SSP8、9、10和11氨基酸序列的4套寡核苷酸:
SSP8               M  E  E  K  L  K  K             (SEQ ID NO:49)
SM86          5′-GATGGAGGAGAAGCTGAAGAA-3 ′       (SEQ ID NO:41)
SM87          3′-   CCTCCTCTTCGACTTCTTCTA-5′     (SEQ ID NO:42)
SSP9               M  E  E  K  L  K  W             (SEQ ID NO:50)
SM88          5′-GATGGAGGAGAAGCTGAAGTG-3 ′       (SEQ ID NO:43)
SM89          3′-   CCTCCTCTTCGACTTCACCTA-5 ′    (SEQ ID NO:44)
SSP10              M  E  E  K  M  K  K             (SEQ ID NO:51)
SM90          5′-GATGGAGGAGAAGATGAAGAA-3 ′       (SEQ ID NO:45)
SM91          3′-   CCTCCTCTTCTACTTCTTCTA-5′     (SEQ ID NO:46)
SSP11              M  E  E  K  M  K  W             (SEQ ID NO:52)
SM92          5′-GATGGAGGAGAAGATGAAGTG-3 ′       (SEQ ID NO:47)
SM93          3′-   CCTCCTCTTCTACTTCACCTA-5′     (SEQ ID NO:48)
下面的HPLC程序被用来在寡核苷酸按上面的介绍磷酸化和连接后纯化各套寡核苷酸的多聚体形式。色谱在一台Hewlett Packard液相色谱系统,Model 1090M上进行。流出物的吸收在260nm处检测。将连接后的寡核苷酸在12,000xg离心5分钟,并注射到一个固定了0.5微米内部滤膜(Supelco)的2.5微米TSK DEAE-NPR离子交换柱中(35cm×4.6mm i.d.)。使用一种梯度洗脱和一种双缓冲液流动相[缓冲液A:25mM Tris-Cl,pH9.0,和缓冲液B:缓冲液A+1 MNaCl]将寡核苷酸以长度为基础分开。缓冲液A和缓冲液B在使用前都通过0.2微米滤膜。在30℃以流速为每分钟1mL使用下面的梯度方案:
      时间           %A         %B
      起始           75          25
      0.5分钟        55          45
      5分钟          50          50
      20分钟         38          62
      23分钟          0          100
      30分钟          0          100
      31分钟         75          25收集3分钟至9分钟之间的部分(500uL)。将对应于长度在120bp和2000bp之间的部分混合,长度用质粒DNA的限制内切酶消化的对照分离来确定。
将4.5mL每套寡核苷酸的混合部分通过加入10ug tRNA和9.0mL乙醇进行沉淀,用70%乙醇漂洗两次,并重新悬浮于50uL水中。取10uL重悬的HPLC纯化寡核苷酸加入至0.1ug上面介绍的用Ear I酶切并去磷酸化的pSK6 DNA中,在15℃连接过夜。还将经过磷酸化和自连接但没有用凝胶或HPLC纯化的上面介绍的所有6套寡核苷酸与pSK6载体用于单独的连接反应。将连接产物转化到大肠杆菌DH5α(supE44 ΔlacU169(Φ80 lacZ ΔM15)hsdR17 recA1 endA1 gyr196thil relA1)中,并选择四环素抗性克隆。本发明的申请者选择DH5α(supE44 ΔlacU169(Φ80 lacZ ΔM15)hsdR17 recA1 endA1 gyr196thil relA1)用于随后的所有工作,因为这种菌株具有很高的转化效率,并且为recA-。recA-排除了下面的考虑,即这些重复DNA结构可能成为同源重组的底物而导致多聚体序列的删除。
按上面的介绍筛选克隆。选择几个克隆来代表6套寡核苷酸的每种插入。
                      表15
                         7价氨基酸
克隆#     SEQ ID NO:    重复(SSP)测序    SEQ ID NO:
82-4         53         7.7.7.7.7.7.5        54
84-H3        55         5.5.5.5              56
86-H23       57         5.8.8.5              58
88-2         59         5.9.9.9.5            60
90-H8        61         5.10.10.10.5         62
92-2         63         5.11.11.5            64序列两翼的第一个和最后一个SSP5 7价单位代表碱性基因序列。插入序列被下划线。包括字母“H”的克隆号表示HPLC纯化的寡核苷酸。克隆82-4中第一个碱性基因重复的缺失可能是在载体pSK6转移到recA-菌株前碱性基因重复5.5之间的同源重组产生的。HPLC程序没有提高较长多价形式的寡核苷酸套插入到碱性基因中,但它可作为连接的寡核苷酸的一种有效纯化方法。
设计编码SSP序列的混合物,使用尽可能不同的密码子的寡核苷酸。这样做是为了减少下面的可能性,即当合成基因被转化到植物中时重复性的插入子通过同源重组被删除,也为了延长所构建的基因元件的长度。这种寡核苷酸编码7价编码单位的4个重复(28个氨基酸残基),并能插入到任何以前构建的克隆的单一Ear I位点。SM96和SM97编码SSP(5)4,SM98和SM99编码SSP(7)4,SM100加SM101编码SSP8.9.8.9。
                       M  E  E  K  M  K  A  M  E  E  K  M  K
      SM96        5′-GATGGAGGAAAAGATGAAGGCGATGGAGGAGAAAATGAAA
      SM97        3′    CCTCCTTTTCTACTTCCGCTACCTCCTCTTTTACTTTA  M  E  E  K  M  K  A  M  E  E  K  M  K  A             (SEQ ID NO:67)GCTATGGAGGAAAAGATGAAAGCGATGGAGGAGAAAATGAAGGC-3′        (SEQ ID NO:65)CGATACCTCCTTTTCTACTTTCGCTACCTCCTCTTTTACTTCCGCTA-5′     (SEQ ID NO:66)
                       M  E  E  K  L  K  A  M  E  E  K  L  K
      SM98        5′-GATGGAGGAAAAGCTGAAAGCGATGGAGGAGAAACTCAAG
      SM99        3′    CCTCCTTTTCGACTTTCGCTACCTCCTCTTTGAGTTC
  A  M  E  E  K  L  K  A  M  E  E  K  L  K  A           (SEQ ID NO:70)
  GCTATGGAAGAAAAGCTTAAAGCGATGGAGGAGAAACTGAAGGC-3′      (SEQ ID NO:68)
  CGATACCTTCTTTTCGAATTTCGCATCCTCCTCTTTGACTTCCGCTA-5′   (SEQ ID NO:69)
                       M  E  E  K  L  K  K  M  E  E  K  L  K
      SM100       5′-GATGGAGGAAAAGCTTAAGAAGATGGAAGAAAAGCTGAAA
      SM101       3′    CCTCCTTTTCGAATTCTTCTACCTTCTTTTCGACTTT
  W  M  E  E  K  L  K  K  M  E  E  K  L  K  W         (SEQ ID NO:73)
  TGGATGGAGGAGAAACTCAAAAAGATGGAGGAAAAGCTTAAATG-3′    (SEQ ID NO:71)
  ACCTACCTCCTCTTTGAGTTTTTCATCCTCCTTTTCGAATTTACCTA-5′ (SEQ ID NO:72)
来自克隆82-4和84-H3的DNA用Ear I酶完全消化,用磷酸酶处理,并凝胶纯化。将约0.2ug的这种DNA与已经过磷酸化的SM96和SM97、SM98和SM99或SM100和SM101每套各1ug混合。将DNA和寡核苷酸连接过夜,然后将连接混合物转化至大肠杆菌DH5α。按上面的介绍从四环素抗性克隆中筛选寡核苷酸插入子的存在。根据限制内切酶消化图谱选择克隆进行序列分析。
                           表16克隆#    SEQ ID NO:    7价氨基酸重复(SSP)的测序      SEQ ID NO:2-9          74          7.7.7.7.7.7.8.9.8.9.5            753-5          78          7.7.7.7.7.7.5.5                  795-1          76          5.5.5.7.7.7.7.5                  77
插入的寡核苷酸元件被下划线
克隆2-9由寡核苷酸SM100(SEQ ID NO:71)和SM101(SEQ IDNO:72)连接到克隆82-4(见上文)的Ear I位点而衍生。克隆3-5(SEQ ID NO:78)由寡核苷酸套SM96(SEQ ID NO:65)和SM97(SEQID NO:66)的前22个碱基插入到克隆82-4(SEQ ID NO:53)的EarI位点而衍生。这种部分插入可能反映了这些高重复性寡聚体的不适当退火。克隆5-1(SEQ ID NO:76)由寡核苷酸SM98(SEQ ID NO:68)和SM99(SEQ ID NO:69)连接到克隆84-3H(SEQ ID NO:55)的Ear I位点而衍生。策略II
构建合成基因序列的第二个策略通过让DNA和氨基酸序列都有更大的灵活性来完成。此策略示于图13和图14。第一步是将一个编码一个16氨基酸的碱性基因的寡核苷酸序列插入开始的载体pSK5。该寡核苷酸插入子像前面的碱性基因结构一样,含有一个单一的Ear I位点,用来随后插入编码一个或多个7价重复的寡核苷酸。该碱性基因还在3’末端含有一个BspH I位点。此酶切位点的翼端被设计来允许使用Nco I翼端进行“框内”蛋白融合。因此,基因元件可使用图14中所示的复制方案进行倍增。寡核苷酸套的翼端允许插入到载体pSK5的单一Nco I和EcoR I位点。
              M  E  E  K  M  K  K  L  E  E  K
SM107    5′-CATGGAGGAGAAGATGAAAAAGCTCGAAGAGAAG
SM106         3′-CTCCTCTTCTACTTTTTCGAGCTTCTCTTC
              NCO I                       EAR I
M  K  V  M  K                          (SEQ ID NO:82)
ATGAAGGTCATGAAGTGATAGGTACCG-3′        (SEQ ID NO:80)
TACTTCCAGTACTTCACTATCCATGGCTTAA-5′    (SEQ ID NO:81)
      BSPH I   ASP 718将寡核苷酸套按上面策略I的介绍插入到pSK5载体中。所获得的质粒被命名为pSK34。
使用上面介绍的程序将编码35个氨基酸的元件的寡核苷酸套连接到pSK34碱性基因的单一Ear I位点中。在这种情况下,寡核苷酸不经过凝胶和HPLC纯化而仅简单地退火,并用于连接反应。使用下面的寡核苷酸套:SEG3             L  E  E  K  M  K  A  M  E  D  K  M  K  WSM110       5′-GCTGGAAGAAAAGATGAAGGCTATGGAGGACAAGATGAAATGGSM111           3′-CCTTCTTTTCTACTTCCGATACCTCCTGTTCTACTTTACC
             L  E  E  K  M  K  K                  (SEQ ID NO:85)
                                                  (氨基酸8-28)
            CTTGAGGAAAAGATGAAGAA-3′              (SEQ ID NO:83)
            GAACTCCTTTTCTACTTCTTCGA-5′           (SEQ ID NO:84)SEG4            L  E  E  K  M  K  A  M  E  D  K  M  K  WSM112      5′-GCTCGAAGAAAGATGAAGGCAATGGAAGACAAAATGAAGTGGSM113          3′-GCTTCTTTCTACTTCCGTTACCTTCTGTTTTACTTCACC
            L  E  E  K  M  K  K                   (SEQ ID NO:86)
                                                  (氨基酸8-28)
            CTTGAGGAGAAAATGAAGAA-3′              (SEQ ID NO:87)
            GAACTCCTCTTTTACTTCTTCGA-5′           (SEQ ID NO:88)SEG5           L  K  E  E  M  A  K  M  K  D  E  M  W  KSM114     5′-GCTCAAGGAGGAAATGGCTAAGATGAAAGACGAAATGTGGAAASM115         3′-GTTCCTCCTTTACCGATTCTACTTTCTGCTTTACACCTTT
             L  K  E  E  M  K  K                  (SEQ ID NO:89)
                                                  (氨基酸8-28)
             CTGAAAGAGGAAATGAAGAA                 (SEQ ID NO:90)
             GACTTTCTCCTTTACTTCTTCGA              (SEQ ID NO:91)通过限制内切酶消化并接着在6%丙烯酰胺凝胶上分离来在克隆中筛选插入区段的存在。用DNA序列分析证明寡核苷酸的正确插入。含有区段3、4和5的克隆被分别命名为pSKseg3、pSKseg4和pSKseg5。
将这些“区段”克隆用于图14中所示的复制方案。10ug质粒pSKseg3用Nhe I和BspH I完全消化,使用Whatman纸技术从一个琼脂糖凝胶中分离1503bp片段。10ug质粒pSKseg4用Nhe I和Nco I完全消化,并分离2109bp的凝胶带。将等量的这些片段连接,并在四环素上选择重组子。用限制性内切酶消化筛选克隆,并证明其序列。所获得的质粒被命名为pSKseg34。
将pSKseg34和pSKseg5质粒DNA消化,分离片段,并以与上述相同的方式连接,从而制备一种质粒,此质粒含有编码区段5与区段3和4融合的DNA序列。此结构物被命名为pSKseg534,它编码下列氨基酸序列:
SSP534    NH2-MEEKMKKLKEEMAKMKDEMWKLKEEMKKLEEKMKVMEEKMKKLEEKMKA
                 MEDKMKWLEEKMKKLEEKMKVMEEKMKKLEEKMKAMEDKMKWLEEKMKK
                 LEEKMKVMK-COOH      (SEQ ID NO:92)
                     实施例22用于在植物种子中表达的SSP嵌合基因的构建
为在植物种子中表达实施例21中介绍的合成基因产物,将这些序列转移到种子启动子载体pCW108、pCW109或pML113(图5)中。载体pCW108和pML113含有菜豆蛋白启动子(从碱基+1至碱基-494)和菜豆基因3’序列的1191碱基。质粒pCW109含有β-伴大豆球蛋白启动子(从碱基+1至碱基-619)和相同的菜豆基因3’序列的1191碱基。这些载体被设计来允许直接将编码序列克隆到单一的Nco I和Asp718位点。这些载体还在5’端和3’端提供位点(Hind III或Sal I)来允许将启动子/编码序列/3’序列直接转移到合适的双体载体。
为插入合成的贮藏蛋白基因序列,将10ug的载体DNA用Asp718和Nco I限制内切酶完全消化。通过在1.0%琼脂糖凝胶上以15伏特电泳过夜来纯化线性化的载体。按下述方法收集片段:在条带前切下琼脂糖凝胶,在凝胶中插入一张10×5mm的Whatman纸,并将片段电泳到纸上(Errington,(1990)Nucleic Acids Research,18:17)。通过离心将片段和缓冲液从纸上离下,通过加入10mg tRNA、10uL的3M乙酸钠和200uL乙醇来将~100uL中的DNA沉淀。沉淀的DNA用70%的乙醇洗涤两次,并真空干燥。将片段DNA重新悬浮于20uL水中,并取部分稀释10倍用于连接反应。
来自克隆3-5(携带SSP3-5编码序列)和pSK534(携带SSP534编码序列)的质粒DNA(10mg)用Asp718和Nco I限制内切酶完全消化。将消化产物在18%聚丙烯酰胺非变性凝胶上分离。从胶上将含有所需片段的胶条切下,将胶条插入一个1%琼脂糖凝胶中并用100伏特电泳20分钟来进行纯化。将DNA片段收集到10×5mm的Whatman 3MM纸片上。离心将缓冲液和片段离下,用乙醇沉淀DNA。将片段重新悬浮于6uL水中。加入1微升上面介绍的稀释载体片段、2uL的5X连接缓冲液和1uL的T4连接酶。将混合物在15℃连接过夜。
将连接混合物转化到大肠杆菌DH5α(supE44 ΔlacU169(Φ80 lacZΔM15)hsdR17 recA1 endA1 gyr196 thil relA1)中,并选择氨苄青霉素抗性克隆。用限制性内切酶消化分析快速法提取的质粒DNA和DNA测序来筛选克隆。
                      实施例23含有嵌合基因菜豆蛋白启动子/cts/lysC-M4和β-伴大豆球蛋白启动子/SSP3-5的烟草植物
使用双体质粒pZS97来将实施例22的SSP3-5嵌合基因和实施例4的大肠杆菌dapA和lysC-M4基因转移到烟草植物中。双体载体pZS97(图6)是一种根癌农杆菌的双体Ti质粒载体系统的一部分(Bevan,(1984)Nucl.Acids.Res.12:8711-8720)。该载体含有:(1)嵌合基因胭脂氨酸合成酶启动子::新霉素磷酸转移酶编码区(nos::NPT II)作为转化植物细胞的一个选择标记(Bevan et al.(1983)Nature 304:184-186);(2)Ti质粒的T-DNA的左翼和右翼(Bevan,(1984)Nucl.Acids.Res.12:8711-8720);(3)在多接头区域带有单一的Sal I位点(pZS97K)或单一的Hind III位点(pZS97)的大肠杆菌lacZα-互补区段(Viera和Messing(1982)Gene 19:259-267);(4)来自假单胞菌质粒pVS1的细菌复制起始区域(Itoh etal.(1984)Plasmid 11:206-220);(5)作为转化的根癌农杆菌的一个选择标记的细菌β-内酰胺酶基因。
用Hind III酶完全消化质粒pZS97 DNA,并用凝胶纯化消化的质粒。将Hind III消化的pZS97 DNA与用Hind III消化并凝胶分离的实施例22的SSP3-5嵌合基因混合、连接、转化,并在氨苄青霉素上对克隆进行选择。
含有嵌合基因的双体载体用三亲本杂交(Ruvkin et al.(1981)Nature 289:85-88)转移到根癌农杆菌菌株LBA4404/pAL4404(Hockema et al.(1983)Nature 303:179-180)中,选择羧苄青霉素抗性。用含有双体载体的农杆菌培养物转化烟草叶盘(Horsch et al.(1985)Science 227:1229-1231)。在含有卡那霉素的选择培养基中使转基因植物再生。
这样就获得了含有嵌合基因---β-伴大豆球蛋白启动子/SSP3-5/菜豆蛋白3’区域的转化烟草植物。根据卡那霉素标记基因的3∶1分离,鉴定了携带SSP3-5基因单位点插入的两个转化植物---pSK44-3A和pSK44-9A。然后根据这些植物的种子中卡那霉素抗性的4∶0分离,鉴定了为转基因纯合的原始转化子的子代---pSK44-3A-6和pSK44-9A-5。
类似地,按照实施例12的介绍,获得了用嵌合基因-菜豆蛋白5’区域/cts/lysC-M4/菜豆蛋白3’区域和菜豆蛋白5’区域/cts/ecodapA/菜豆蛋白3’区域转化的烟草植物。根据卡那霉素标记基因的3∶1分离,鉴定了一个携带DHDPS和AK基因单位点插入的转化植物---pBT570-45A。然后根据这些植物的种子中卡那霉素抗性的4∶0分离,鉴定了为转基因纯合的原始转化子的子代---pBT570-45A-3和pBT570-45A-4。
为制备携带三种嵌合基因的植物,使用纯合型亲本进行遗传杂交。植物在温室环境中生长至成熟。在开花的前一天选择用作雄性和雌性的花,并移去花序上的旧花。为进行杂交,在快要开放且花药还没有裂开时选择雌花。在一侧打开花冠并移去花药。选择当天开放的花作为雄花,并使裂开的花药释放成熟花粉。移去花药,并用来向剥去了花药的雌花的雌蕊授粉。然后将雌蕊用塑料袋套住防止再次授粉。使种子荚发育并干燥4-6周,然后收获。从每个杂交中回收2至3个独立的荚。进行下面的杂交。雄性               X                 雌性BT570-45A-3                       pSK44-3A-6BT570-45A-4                       pSK44-3A-6pSK44-3A-6                        BT570-45A-4BT570-45A-5                       pSK44-9A-5pSK44-9A-5                        BT570-45A-5
将干种子荚打开,从每个杂交中收集种子并混合。每个杂交计算30个种子,将来自每个亲本自交花的种子用作对照。按实施例8的介绍将双份的种子样品进行水解和总氨基酸含量分析。赖氨酸的增加数量用比野生型种子高的总氨基酸百分比的形式示于表16中,总氨基酸中含2.56%的赖氨酸,表16中还显示了种子胚乳中的每种基因的拷贝数。
                       表17
                          拷贝数
                         AK & DHDPS      拷贝数
雄性      X       雌性       基因        SSP基因      赖氨酸增加BT570-45A     X     BT570-45A     1*           0             0pSK44-9A      X     pSK44-9A      0             1*          0.12pSK44-9A-5    X     pSK44-9A-5    0             2            0.29pSK44-9A-5    X     BT570-45A-5   1             1            0.6BT570-45A-5   X     pSK44-9A-5    1             1            0.29pSK44-3A      X     pSK44-3A      0             1*          0.28pSK44-3A-6    X     pSK44-3A-6    0             2            0.5pSK44-3A-6    X     BT570-45A-4   1             1            0.62BT570-45A-3   X     pSK44-3A-6    1             1            0.27BT570-45A-4   X     pSK44-3A-6    1             1            0.29
*拷贝数是种子群体中的平均数
这些杂交的结果证明,种子中的总赖氨酸水平能通过赖氨酸生物合成基因和高赖氨酸蛋白SSP3-5的同时表达来增加。在来自杂交烟草植物的种子中,当生物合成基因来自雌性亲本时,这种协同作用非常强。预计如果生物合成基因和富含赖氨酸的蛋白的基因均为纯合子时,赖氨酸水平会进一步提高。
                   实施例24含有嵌合基因菜豆蛋白启动子/cts/cordapA、菜豆蛋白启动子/cts/lysC-M4和β-伴大豆球蛋白启动子/SSP3-5的大豆植物
表达嵌合基因---菜豆蛋白启动子/cts/ecodapA/菜豆蛋白3’区域和菜豆蛋白启动子/cts/lysC-M4/菜豆蛋白3’区域的转化大豆植物已在实施例19中介绍。表达嵌合基因---菜豆蛋白启动子/SSP3-5/菜豆蛋白3’区域的转化大豆植物通过将该嵌合基因以一个分离的Hind III片段的形式插入到一种相当的大豆转化载体质粒pML63(图16)并按实施例19中的介绍进行转化来获得。
从种子的胚轴向外的一侧切下小片来对原初转化子的种子进行取样。按实施例19的介绍分析小片的GUS活性来确定哪一个分离的种子携带转基因。将半数的种子磨成粉,并用酶联免疫吸附实验(ELISA)分析SSP-3-5蛋白的表达。按下述方法进行。
使用Pharmacia pGEX GST基因融合系统(Current Protocols inMolecular Biology,Vol.2,pp 16.7.1-8,(1989)John Wiley andSons)制备了谷胱甘肽-S-转移酶和SSP3-5基因产物的一种融合蛋白。融合蛋白在谷胱甘肽琼脂糖(Sigma)或谷胱甘肽Sepharose(Pharmacia)珠上用亲和层析进行纯化,用Centricon 10(Amicon)滤膜浓缩,然后用SDS聚丙烯酰胺凝胶电泳(15%丙烯酰胺,19∶1的丙烯酰胺∶双丙烯酰胺)进一步纯化。凝胶用考马斯蓝染色30分钟,在50%(v/v)甲醇、10%(v/v)乙酸中脱色,并使用Amicon CentriluterMicroelectroeluter电洗脱蛋白带(Paul T.Matsudaira ed.,《微量测序的蛋白质和肽纯化实用指南》,Academic Press,Inc.NewYork,1989)。用同样的方式制备和电泳第二块凝胶,将第二块凝胶在不含乙酸的染料[9份50%甲醇中的0.1%考马斯蓝G250(Bio-Rad)和1份蒸馏水中的Serva Blue(Serva,Westbury,NY)]中染色1-2小时。将凝胶在20%(v/v)甲醇、3%(v/v)甘油短暂脱色0.5-1小时至GST-SSP-3-5条带刚好能看见。从凝胶上切下此带,并将其电洗脱物送至Hazelton Laboratories用作抗原来免疫一只新西兰兔。共使用1mg的抗原(0.8mg于凝胶中,0.2mg于溶液中)。由HazeltonLaboratories每隔三周提供测试血。在蛋白和血清的不同稀释度时用来自含有T7启动子控制之下的SSP3-5基因的细胞的大肠杆菌抽提物进行western印迹,检测大致的滴度。
使用一个Protein A Sepharose柱从血清中分离IgG。将IgG按每孔5ug包被微量滴定板。将一份单独的IgG生物素化。
将来自转基因植物的水抽提物稀释,并通常以含1ug总蛋白的样品为起始加入孔中。将样品稀释多次以保证至少有一个稀释度能给出在用同一块板制备的标准曲线范围内的结果。标准曲线用化学合成的SSP3-5蛋白来绘制。将样品在37℃温育1小时,并洗涤板。然后将生物素化的IgG加入孔中。板在37℃温育1小时并洗涤。将碱性磷酸酶接合的链亲和素加入孔中,在37℃温育1小时并洗涤。将一种由1M二乙胺中的1mg/ml对硝基苯磷酸组成的底物加入孔中,并将板在37℃温育1小时。在孔中加入5%的EDTA终止溶液,并用405nm减650nm的读数值来读取吸收值。转基因大豆种子含有0.5至2.0%的水抽提的SSP3-5蛋白。
将剩下的一半GUS和SSP3-5蛋白阳性的种子种植,并在温室中生长至成熟。为确定GUS表型的纯合子,按上面的介绍在这些R1植物的种子中筛选GUS活性的分离。然后将菜豆蛋白/SSP3-5基因的纯合型植物与表达棒状杆菌dapA基因产物或表达棒状杆菌dapA基因产物加大肠杆菌lysC-M4基因产物的纯合型转基因大豆杂交。
作为通过遗传杂交将SSP嵌合基因与cordapA基因加大肠杆菌lysC-M4嵌合基因连接在一起的一种优选的替代方法,可以按实施例19中的介绍由上面介绍的基因片段构建携带所有基因的一个单一的大豆转化载体,并转化到大豆中。
                     实施例25构建用于在转化玉米的胚和胚乳中表达棒状杆菌DHDPA、lysr-玉米DHDPS、大肠杆菌AKIII-M4和SSP3-5蛋白的嵌合基因
为转化到玉米中,制备了下列嵌合基因:
球蛋白1启动子/mcts/lysC-M4/NOS 3’区域
球蛋白1启动子/mcts/cordapA/NOS 3’区域
麦谷蛋白2启动子/mcts/lysC-M4/NOS 3’区域
麦谷蛋白2启动子/mcts/cordapA/NOS 3’区域
球蛋白1启动子/SSP3-5/球蛋白1 3’区域
麦谷蛋白2启动子/SSP3-5/10kD 3’区域
球蛋白1启动子/玉米lysr-突变DHDPS基因/球蛋白1 3’区域
麦谷蛋白2启动子/玉米lysr-突变DHDPS基因/10kD 3’区域
使用基于已发表序列(Reina et al.(1990)Nucleic Acids Res.18:6426-6426)的引物,用PCR从玉米基因组DNA中克隆麦谷蛋白2启动子。该启动子片段包含自ATG翻译起始密码子上游的1020核苷酸。通过PCR在ATG起始位点处插入了一个Nco I位点来允许能直接翻译的融合。在启动子的5’端引入了一个BamH I位点。将1.02kb的BamH I至Nco I启动子片段克隆到植物表达载体pML63(见实施里4)中的BamH I至Nco I以取代35S启动子,产生了载体pML90。此载体含有与GUS编码区和NOS 3’连接的麦谷蛋白2启动子。
10kD玉米醇溶蛋白3’区域来自一个10kD玉米醇溶蛋白基因克隆,该克隆是使用基于发表序列(Kirihara et al.(1988)Gene 71:359-370)的寡核苷酸引物用PCR由基因组DNA制备的。该3’区域自终止密码子延伸940核苷酸。通过寡核苷酸插入法在紧接着TAG终止密码子的后面添加Kpn I、Sma I和Xba I限制内切酶位点以便于克隆。分离了一个含有10kD 3’区域的Sma I至Hind III区段,并将其连接到Sma I和Hind III消化的pML90中来用10kD 3’区域取代NOS 3’序列,由此产生了质粒pML103。pML103含有麦谷蛋白2启动子、一个位于GUS基因的ATG起始密码子处的Nco I位点、终止密码子后面的Sma I和Xba I位点以及940核苷酸的10kD玉米醇溶蛋白3’区域。
使用基于已发表的球蛋白1基因序列(Kriz et al.(1989)PlantPhysiol.91:636)的寡核苷酸探针,从一个Clontech玉米基因组DNA文库中分离了球蛋白1启动子和3’序列。此克隆区段包括自ATG翻译起始密码子向上游延伸1078核苷酸的启动子片段、包括内含子的整个球蛋白编码区、和自翻译终止密码子向下游延伸803碱基的3’区域。为允许用其他编码序列取代球蛋白1编码序列,通过PCR,在ATG起始密码子处引入了一个Nco I位点,并在翻译终止密码子的后面引入Kpn I和Xba I位点,由此产生载体pCC50。在球蛋白1启动子片段还有第二个Nco I位点。球蛋白1基因盒的两翼为Hind III位点。
已知植物氨基酸生物合成酶定位在叶绿体中,因此在合成时带有叶绿体靶向信号。细菌蛋白如DHDPS和AKIII没有这种信号。因此,按下面的介绍将一种叶绿体转运序列(cts)融合到嵌合基因中的cordapA和lysC-M4编码序列中。对玉米来说,使用的cts以玉米核酮糖1,5-二磷酸羧化酶小亚基的cts为基础(Lebrun et al.(1987)Nucleic Acids Res.15:4360),并将其命名为mct以将其与来自大豆的cts区别。合成寡核苷酸SEQ ID NO:94-99,并按实施例6的介绍进行使用。
为构建嵌合基因:球蛋白1启动子/mcts/lysC-M4/NOS 3’区域从质粒pBT588(见实施例6)中分离一个含有mcts/lysC-M4编码序列的Nco I至Hpa I片段,并插入到Nco I加Sma I消化的pCC50中,产生质粒pBT663。
为构建嵌合基因:球蛋白1启动子/mcts/cordapA/NOS 3’区域从质粒pBT576(见实施例6)中分离一个含有mcts/ecodapA编码序列的Nco I至Kpn I片段,并插入到Nco I加Kpn I消化的pCC50中,产生质粒pBT662。然后按下述方法用cordapA编码序列取代ecodapA编码序列。将一个含有远端三分之二的mcts与cordapA编码序列融合的Afl II至Kpn I片段插入到用Afl II和Kpn I消化的pBT662中,产生质粒pBT677。
为构建嵌合基因:
麦谷蛋白2启动子/mcts/lysC-M4/NOS 3’区域,从质粒pBT588(见实施例6)中分离一个含有mcts/lysC-M4编码序列的Nco I至Hpa I片段,并插入到Nco I加Sma I消化的pML90中,产生质粒pBT580。
为构建嵌合基因:麦谷蛋白2启动子/mcts/cordapA/NOS 3’区域,从质粒pBT677中分离一个含有mcts/ecodapA编码序列的Nco I至KpnI片段,并插入到Nco I加Kpn I消化的pML90中,产生质粒pBT679。
嵌合基因:球蛋白1启动子/mcts/lysC-M4/NOS 3’区域和球蛋白1启动子/mcts/cordapA/NOS 3’区域按下述方法连接在一个质粒中。用HindIII部分消化pBT677,并分离全长的线性化质粒DNA。从pBT663中分离一个携带球蛋白1启动子/mcts/lysC-M4/NOS 3’区域的Hind III片段,并连接到线性化的pBT677中,产生pBT680(图17)。
嵌合基因:麦谷蛋白2启动子/mcts/lysC-M4/NOS 3’区域和麦谷蛋白2启动子/mcts/cordapA/NOS 3’区域按下述方法连接在一个质粒中。用Sal I部分消化pBT580,并分离全长的线性化质粒DNA。从pBT679中分离一个携带麦谷蛋白2启动子/mcts/cordapA/NOS 3’区域的Sal I片段,并连接到线性化的pBT580中,产生pBT681(图18)。
为构建嵌合基因:麦谷蛋白2启动子/SSP3-5/10kD 3’区域,将含有麦谷蛋白2启动子和10kD玉米醇溶蛋白3’区域的质粒pML103(上文)在Nco I和Sma I位点切开。通过Xba I酶切并接着用DNA聚合酶Klenow片段将粘性末端补平,然后用Nco I酶切,分离一个Nco I至平末端片段形式的SSP3-5编码区(实施例22)。将此193碱基对的Nco I至平末端片段连接到Nco I和Sma I酶切的pML103中,产生pLH104(图19)。
为构建嵌合基因:球蛋白1启动子/SSP3-5/球蛋白1 3’区域,将193碱基对的含有SSP3-5编码区(实施例22)的Nco I和Xba I片段插入到质粒pCC50(上文)中的球蛋白1的5’和3’区域之间,产生pLH105(图20)。
玉米DHDPS cDNA基因以前已经得到了克隆和测序(Frisch et al.(1991)Mol Gen Genet 228:287-293)。在该基因中引入了一个能使蛋白对赖氨酸的反馈抑制不敏感的突变。该突变是一个单碱基改变,导致蛋白中的一个单个氨基酸取代,丙氨酸166改变为缬氨酸。此lysr玉米DHDPS基因获自明尼苏达大学的Dr.Burle Gengenbach。使用下面的引物通过PCR,在该基因的翻译起始密码子处引入了一个Nco I位点,在紧接着翻译终止密码子的后面引入了一个Kpn I位点。
SEQ ID NO:106:  5′-ATTCCCCATG GTTTCGCCGA CGAAT
SEQ ID NO:107:  5′-CTCTCGGTAC CTAGTACCTA CTGATCAAC
为构建嵌合基因:球蛋白1启动子/lysr玉米DHDPS基因/球蛋白1 3’区域,将1144碱基对的含有lysr玉米DHDPS基因的Nco I和Kpn I片段插入到质粒pCC50(上文)中的球蛋白1的5’和3’区域之间,产生pBT739(图21)。
为构建嵌合基因:麦谷蛋白2启动子/lysr玉米DHDPS基因/10kD 3’区域,将1144碱基对的含有lysr玉米DHDPS基因的Nco I和Kpn I片段插入到一个含有麦谷蛋白2启动子和10kD玉米醇溶蛋白3’区域的质粒中,产生质粒pBT756(图22)。
除下面不同外,玉米转化按实施例17和18中的介绍进行:
1)除了用于轰击的培养物被指定为LH132.5.X或LH132.6.X外,成胚细胞培养物发育按实施例17中的介绍进行。
2)在这些实验中所用的选择标记为35S启动子控制之下的实施例18中介绍的来自pDETRIC的35S/bar基因或一种合成的膦丝菌素-N-乙酰转移酶(pat)基因---35S/Ac和来自花椰菜花叶病毒的3’终止子/聚腺苷酸化信号(Eckes et al.,(1989)J Cell Biochem Suppl13D)。
3)轰击参数如实施例17和18中的介绍,不同之处在于将1.5ug的各种DNA(35S/bar或35S/Ac、pBT681和pLH104或35S/Ac、pbt680和pLH105)共沉淀到金颗粒上来以“三轰击”的形式进行轰击。
4)转基因细胞系的选择按实施例18中介绍的glufosinate选择来进行,但组织在轰击后24小时内置于选择培养基。
                      实施例26在胚和胚乳中含有表达棒状杆菌DHDPS和大肠杆菌AKIII-M4或lysR玉米DHDPS嵌合基因的玉米植物
按实施例25的介绍用下面的嵌合基因转化玉米:
·连接了或没有连接球蛋白1启动子/mcts/lysC-M4/NOS 3’区域的球蛋白1启动子/mcts/cordapA/NOS 3’区域
·连接了或没有连接麦谷蛋白2启动子/mcts/lysC-M4/NOS 3’区域的麦谷蛋白2启动子/mcts/cordapA/NOS 3’区域
通过Southern印迹或PCR分析由转化的愈伤组织再生的植物中完整的转基因的存在。将植物自交或与一个原种品系杂交来制备F1种子。将6至8个种子混合,并用western印迹分析棒状杆菌DHDPS蛋白和大肠杆菌AKIII-M4蛋白的表达。种子中的游离氨基酸组成和总氨基酸组成按前面实施例中的介绍进行测定。
在玉米种子中观察到了由球蛋白1或麦谷蛋白2启动子驱动的棒状杆菌DHDPS蛋白的表达(表12)。在玉米种子中还观察到了由麦谷蛋白启动子驱动的大肠杆菌AKIII-M4蛋白的表达。游离氨基酸水平从对照种子中的约1.4%的游离氨基酸提高到三种表达球蛋白1启动子控制的棒状杆菌DHDPS的不同转化子种子中的15-27%。增加的游离赖氨酸和作为赖氨酸分解代谢的指示物的酵母氨酸在表达球蛋白1启动子控制下的棒状杆菌DHDPS的种子中均定位在胚中。在表达麦谷蛋白2启动子控制下的棒状杆菌DHDPS的种子中不管其是否表达大肠杆菌AKIII-M4,都没有观察到游离赖氨酸的增加。预计赖氨酸分解代谢在胚乳中比在胚中强烈得多,这种可能性阻止了表达麦谷蛋白控制下的棒状杆菌DHDPS加大肠杆菌AKIII-M4的种子中高水平赖氨酸的积累。
赖氨酸通常占种子氨基酸含量的约2.3%。因此在表12中非常明显,在表达球蛋白1启动子控制下的棒状杆菌DHDPS的种子中,赖氨酸占种子总氨基酸的百分比提高了130%。
                               表12
                       WESTERN      WESTERN      种子游离氨基酸    种子总氨基酸
                      棒状杆菌      大肠杆菌       的LYS百分比      的LYS百分比转基因品系      启动子     DHDPS        AKIII-M41088.1.2x原种  球蛋白1       +             -               15              3.61089.4.2x原种  球蛋白1       +             -               21              5.11099.2.1x自交  球蛋白1       +             -               27              5.31090.2.1x原种  麦谷蛋白2     +             -               1.2             1.71092.2.1x原种  麦谷蛋白2     +             +               1.1             2.2
                     序列表(1)一般信息:
(i)申请人:
   (A)收件人:E.I.DU PONT DE NEMOURS AND COMPANY
   (B)街道:1007 MARKET STREET
   (C)城市:WILMINGTON
   (D)州:DELAWARE
   (E)国家:U.S.A.
   (F)邮政编码:19898
   (A)电话:302-992-5481
   (B)传真:302-892-7949
   (C)电报:835420
(ii)发明题目:提高植物种子中赖氨酸含量的嵌合基因和方法
(iii)序列数:132
(iv)电脑可读形式:
   (A)媒体类型:软盘,3.5英寸
   (B)电脑:IBM PC兼容机
   (C)操作系统:MICROSOFT WINDOWS95
   (D)软件:MICROSOFT WORD FOR WINDOWS95(7.0)
(v)当前申请数据:
   (A)申请编号:
   (B)提交日期:
   (C)分类:
(vi)在先申请数据
   (A)申请编号:08/824,627
   (B)提交日期:1997年3月27日
(vii)律师/代理人信息:
   (A)姓名:CHRISTENBURY,LYNNE M.
   (B)注册号码:30,971
   (C)参考/摘要号码:BB-1037-F(2)SEQ ID NO:1信息:
(i)序列特征:
   (A)长度:1350碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:1..1350
(xi)序列描述:SEQ ID NO:1:ATG GCT GAA ATT GTT GTC TCC AAA TTT GGC GGT ACC AGC GTA GCT GAT    48Met Ala Glu Ile Val Val Ser Lys Phe Gly Gly Thr Ser Val Ala Asp1               5                  10                  15TTT GAC GCC ATG AAC CGC AGC GCT GAT ATT GTG CTT TCT GAT GCC AAC    96Phe Asp Ala Met Asn Arg Ser Ala Asp Ile Val Leu Ser Asp Ala Asn
         20                  25                  30GTG CGT TTA GTT GTC CTC TCG GCT TCT GCT GGT ATC ACT AAT CTG CTG    144Val Arg Leu Val Val Leu Ser Ala Ser Ala Gly Ile Thr Asn Leu Leu
     35                  40                  45GTC GCT TTA GCT GAA GGA CTG GAA CCT GGC GAG CGA TTC GAA AAA CTC    192Val Ala Leu Ala Glu Gly Leu Glu Pro Gly Glu Arg Phe Glu Lys Leu
 50                  55                  60GAC GCT ATC CGC AAC ATC CAG TTT GCC ATT CTG GAA CGT CTG CGT TAC    240Asp Ala Ile Arg Asn Ile Gln Phe Ala Ile Leu Glu Arg Leu Arg Tyr65                  70                  75                  80CCG AAC GTT ATC CGT GAA GAG ATT GAA CGT CTG CTG GAG AAC ATT ACT    288Pro Asn Val Ile Arg Glu Glu Ile Glu Arg Leu Leu Glu Asn Ile Thr
             85                  90                  95GTT CTG GCA GAA GCG GCG GCG CTG GCA ACG TCT CCG GCG CTG ACA GAT    336Val Leu Ala Glu Ala Ala Ala Leu Ala Thr Ser Pro Ala Leu Thr Asp
        100                 105                 110GAG CTG GTC AGC CAC GGC GAG CTG ATG TCG ACC CTG CTG TTT GTT GAG    384Glu Leu Val Ser His Gly Glu Leu Met Ser Thr Leu Leu Phe Val Glu
    115                 120                 125ATC CTG CGC GAA CGC GAT GTT CAG GCA CAG TGG TTT GAT GTA CGT AAA    432Ile Leu Arg Glu Arg Asp Val Gln Ala Gln Trp Phe Asp Val Arg Lys
130                 135                 140GTG ATG CGT ACC AAC GAC CGA TTT GGT CGT GCA GAG CCA GAT ATA GCC    480Val Met Arg Thr Asn Asp Arg Phe Gly Arg Ala Glu Pro Asp Ile Ala145                 150                 155                 160GCG CTG GCG GAA CTG GCC GCG CTG CAG CTG CTC CCA CGT CTC AAT GAA    528Ala Leu Ala Glu Leu Ala Ala Leu Gln Leu Leu Pro Arg Leu Asn Glu
            165                 170                 175GGC TTA GTG ATC ACC CAG GGA TTT ATC GGT AGC GAA AAT AAA GGT CGT    576Gly Leu Val Ile Thr Gln Gly Phe Ile Gly Ser Glu Asn Lys Gly Arg
        180                 185                 190ACA ACG ACG CTT GGC CGT GGA GGC AGC GAT TAT ACG GCA GCC TTG CTG     624Thr Thr Thr Leu Gly Arg Gly Gly Ser Asp Tyr Thr Ala Ala Leu Leu
    195                 200                 205GCG GAG GCT TTA CAC GCA TCT CGT GTT GAT ATC TGG ACC GAC GTC CCG     672Ala Glu Ala Leu His Ala Ser Arg Val Asp Ile Trp Thr Asp Val Pro
210                 215                 220GGC ATC TAC ACC ACC GAT CCA CGC GTA GTT TCC GCA GCA AAA CGC ATT    720Gly Ile Tyr Thr Thr Asp Pro Arg Val Val Ser Ala Ala Lys Arg Ile225                 230                 235                 240GAT GAA ATC GCG TTT GCC GAA GCG GCA GAG ATG GCA ACT TTT GGT GCA    768Asp Glu Ile Ala Phe Ala Glu Ala Ala Glu Met Ala Thr Phe Gly Ala
            245                 250                 255AAA GTA CTG CAT CCG GCA ACG TTG CTA CCC GCA GTA CGC AGC GAT ATC    816Lys Val Leu His Pro Ala Thr Leu Leu Pro Ala Val Arg Ser Asp Ile
        260                 265                 270CCG GTC TTT GTC GGC TCC AGC AAA GAC CCA CGC GCA GGT GGT ACG CTG    864Pro Val Phe Val Gly Ser Ser Lys Asp Pro Arg Ala Gly Gly Thr Leu
    275                 280                 285GTG TGC AAT AAA ACT GAA AAT CCG CCG CTG TTC CGC GCT CTG GCG CTT    912Val Cys Asn Lys Thr Glu Asn Pro Pro Leu Phe Arg Ala Leu Ala Leu
290                 295                 300CGT CGC AAT CAG ACT CTG CTC ACT TTG CAC AGC CTG AAT ATG CTG CAT    960Arg Arg Asn Gln Thr Leu Leu Thr Leu His Ser Leu Asn Met Leu His305                 310                 315                 320TCT CGC GGT TTC CTC GCG GAA GTT TTC GGC ATC CTC GCG CGG CAT AAT   1008Ser Arg Gly Phe Leu Ala Glu Val Phe Gly Ile Leu Ala Arg His Asn
            325                 330                 335ATT TCG GTA GAC TTA ATC ACC ACG TCA GAA GTG AGC GTG GCA TTA ACC   1056Ile Ser Val Asp Leu Ile Thr Thr Ser Glu Val Ser Val Ala Leu Thr
        340                 345                 350CTT GAT ACC ACC GGT TCA ACC TCC ACT GGC GAT ACG TTG CTG ACG CAA   1104Leu Asp Thr Thr Gly Ser Thr Ser Thr Gly Asp Thr Leu Leu Thr Gln
    355                 360                 365TCT CTG CTG ATG GAG CTT TCC GCA CTG TGT CGG GTG GAG GTG GAA GAA   1152Ser Leu Leu Met Glu Leu Ser Ala Leu Cys Arg Val Glu Val Glu Glu
370                 375                 380
GGT CTG GCG CTG GTC GCG TTG ATT GGC AAT GAC CTG TCA AAA GCC TGC   1200
Gly Leu Ala Leu Val Ala Leu Ile Gly Asn Asp Leu Ser Lys Ala Cys
385                 390                 395                 400
GCC GTT GGC AAA GAG GTA TTC GGC GTA CTG GAA CCG TTC AAC ATT CGC   1248
Ala Val Gly Lys Glu Val Phe Gly Val Leu Glu Pro Phe Asn Ile Arg
                405                 410                 415
ATG ATT TGT TAT GGC GCA TCC AGC CAT AAC CTG TGC TTC CTG GTG CCC   1296
Mer Ile Cys Tyr Gly Ala Ser Ser His Asn Leu Cys Phe Leu Val Pro
            420                 425                 430
GGC GAA GAT GCC GAG CAG GTG GTG CAA AAA CTG CAT AGT AAT TTG TTT   1344
Gly Glu Asp Ala Glu Gln Val Val Gln Lys Leu His Ser Asn Leu Phe
        435                 440                 445
GAG TAA                                                           1350
Glu  *
    4502)SEQ ID NO:2信息:
(i)序列特征:
   (A)长度:36碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:2:
GATCCATGGC TGAAATTGTT GTCTCCAAAT TTGGCG                                 362)SEQ ID NO:3信息:
(i)序列特征:
   (A)长度:36碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:3:
GTACCGCCAA ATTTGGAGAC AACAATTTCA GCCATG                                 362)SEQ ID NO:4信息:
(i)序列特征:
   (A)长度:48碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:4:
CCCGGGCCAT GGCTACAGGT TTAACAGCTA AGACCGGAGT AGAGCACT                    482)SEQ ID NO:5信息:
(i)序列特征:
   (A)长度:37碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:5:
GATATCGAAT TCTCATTATA GAACTCCAGC TTTTTTC                                37(2)SEQ ID NO:6信息:
(i)序列特征:
   (A)长度:917碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:3..911
(xi)序列描述:SEQ ID NO:6:CC ATG GCT ACA GGT TTA ACA GCT AAG ACC GGA GTA GAG CAC TTC GGC     47Met Ala Thr Gly Leu Thr Ala Lys Thr Gly Val Glu His Phe Gly
 1               5                  10                  15ACC GTT GGA GTA GCA ATG GTT ACT CCA TTC ACG GAA TCC GGA GAC ATC    95Thr Val Gly Val Ala Met Val Thr Pro Phe Thr Glu Ser Gly Asp Ile
             20                  25                  30GAT ATC GCT GCT GGC CGC GAA GTC GCG GCT TAT TTG GTT GAT AAG GGC   143Asp Ile Ala Ala Gly Arg Glu Val Ala Ala Tyr Leu Val Asp Lys Gly
         35                  40                  45TTG GAT TCT TTG GTT CTC GCG GGC ACC ACT GGT GAA TCC CCA ACG ACA   191Leu Asp Ser Leu Val Leu Ala Gly Thr Thr Gly Glu Ser Pro Thr Thr
     50                  55                  60ACC GCC GCT GAA AAA CTA GAA CTG CTC AAG GCC GTT CGT GAG GAA GTT   239Thr Ala Ala Glu Lys Leu Glu Leu Leu Lys Ala Val Arg Glu Glu Val
 65                  70                  75GGG GAT CGG GCG AAG CTC ATC GCC GGT GTC GGA ACC AAC AAC ACG CGG   287Gly Asp Arg Ala Lys Leu Ile Ala Gly Val Gly Thr Asn Asn Thr Arg80                  85                  90                  95ACA TCT GTG GAA CTT GCG GAA GCT GCT GCT TCT GCT GGC GCA GAC GGC   335Thr Ser Val Glu Leu Ala Glu Ala Ala Ala Ser Ala Gly Ala Asp Gly
            100                 105                 110CTT TTA GTT GTA ACT CCT TAT TAC TCC AAG CCG AGC CAA GAG GGA TTG   383Leu Leu Val Val Thr Pro Tyr Tyr Ser Lys Pro Ser Gln Glu Gly Leu
        115                 120                 125CTG GCG CAC TTC GGT GCA ATT GCT GCA GCA ACA GAG GTT CCA ATT TGT   431Leu Ala His Phe Gly Ala Ile Ala Ala Ala Thr Glu Val Pro Ile Cys
    130                 135                 140CTC TAT GAC ATT CCT GGT CGG TCA GGT ATT CCA ATT GAG TCT GAT ACC   479Leu Tyr Asp Ile Pro Gly Arg Ser Gly Ile Pro Ile Glu Ser Asp Thr
145                 150                 155ATG AGA CGC CTG AGT GAA TTA CCT ACG ATT TTG GCG GTC AAG GAC GCC   527Met Arg Arg Leu Ser Glu Leu Pro Thr Ile Leu Ala Val Lys Asp Ala160                 165                 170                 175AAG GGT GAC CTC GTT GCA GCC ACG TCA TTG ATC AAA GAA ACG GGA CTT   575Lys Gly Asp Leu Val Ala Ala Thr Ser Leu Ile Lys Glu Thr Gly Leu
            180                 185                 190GCC TGG TAT TCA GGC GAT GAC CCA CTA AAC CTT GTT TGG CTT GCT TTG   623Ala Trp Tyr Ser Gly Asp Asp Pro Leu Asn Leu Val Trp Leu Ala Leu
        195                 200                 205GGC GGA TCA GGT TTC ATT TCC GTA ATT GGA CAT GCA GCC CCC ACA GCA   671Gly Gly Ser Gly Phe Ile Ser Val Ile Gly His Ala Ala Pro Thr Ala
    210                 215                 220TTA CGT GAG TTG TAC ACA AGC TTC GAG GAA GGC GAC CTC GTC CGT GCG   719Leu Arg Glu Leu Tyr Thr Ser Phe Glu Glu Gly Asp Leu Val Arg Ala
225                 230                 235CGG GAA ATC AAC GCC AAA CTA TCA CCG CTG GTA GCT GCC CAA GGT CGC   767Arg Glu Ile Asn Ala Lys Leu Ser Pro Leu Val Ala Ala Gln Gly Arg240                 245                 250                 255TTG GGT GGA GTC AGC TTG GCA AAA GCT GCT CTG CGT CTG CAG GGC ATC   815Leu Gly Gly Val Ser Leu Ala Lys Ala Ala Leu Arg Leu Gln Gly Ile
            260                 265                 270AAC GTA GGA GAT CCT CGA CTT CCA ATT ATG GCT CCA AAT GAG CAG GAA   863Asn Val Gly Asp Pro Arg Leu Pro Ile Met Ala Pro Asn Glu Gln Glu
        275                 280                 285CTT GAG GCT CTC CGA GAA GAC ATG AAA AAA GCT GGA GTT CTA TAA TGAGAATTC   918Leu Glu Ala Leu Arg Glu Asp Met Lys Lys Ala Gly Val Leu  *
    290                 295                 3002)SEQ ID NO:7信息:
(i)序列特征:
   (A)长度:22碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:7:
CTTCCCGTGA CCATGGGCCA TC                                           222)SEQ ID NO:8信息:
(i)序列特征:
   (A)长度:75碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:8:
CATGGCTGGC TTCCCCACGA GGAAGACCAA CAATGACATT ACCTCCATTG CTAGCAACGG  60
TGGAAGAGTA CAATG                                                   752)SEQ ID NO:9信息:
(i)序列特征:
   (A)长度:75碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:9:
CATGCATTGT ACTCTTCCAC CGTTGCTAGC AATGGAGGTA ATGTCATTGT TGGTCTTCCT  60
CGTGGGGAAG CCAGC                                                   752)SEQ ID NO:10信息:
(i)序列特征:
   (A)长度:90碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:10:
CATGGCTTCC TCAATGATCT CCTCCCCAGC TGTTACCACC GTCAACCGTG CCGGTGCCGG  60
CATGGTTGCT CCATTCACCG GCCTCAAAAG                                   902)SEQ ID NO:11信息:
(i)序列特征:
   (A)长度:90碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:11:
CATGCTTTTG AGGCCGGTGA ATGGAGCAAC CATGCCGGCA CCGGCACGGT TGACGGTGGT  60
AACAGCTGGG GAGGAGATCA TTGAGGAAGC                                   902)SEQ ID NO:12信息:
(i)序列特征:
   (A)长度:23碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:12:
CCGGTTTGCT GTAATAGGTA CCA                                          232)SEQ ID NO:13信息:
(i)序列特征:
   (A)长度:31碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:13:
AGCTTGGTAC CTATTACAGC AAACCGGCAT G                                  312)SEQ ID NO:14信息:
(i)序列特征:
   (A)长度:27碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:14:
GCTTCCTCAA TGATCTCCTC CCCAGCT                                       272)SEQ ID NO:15信息:
(i)序列特征:
   (A)长度:28碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:15:
CATTGTACTC TTCCACCGTT GCTAGCAA                                      282)SEQ ID NO:16信息:
(i)序列特征:
   (A)长度:20碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..20
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM70”
(xi)序列描述:SEQ ID NO:16:
CTGACTCGCT GCGCTCGGTC                                               202)SEQ ID NO:17信息:
(i)序列特征:
   (A)长度:24碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..24
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM71”
(xi)序列描述:SEQ ID NO:17:
TATTTTCTCC TTACGCATCT GTGC                                          242)SEQ ID NO:18信息:
(i)序列特征:
   (A)长度:27碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..27
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM78”
(xi)序列描述:SEQ ID NO:18:
TTCATCGATA GGCGACCACA CCCGTCC                                       272)SEQ ID NO:19信息:
(i)序列特征:
   (A)长度:27碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..27
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM79”
(xi)序列描述:SEQ ID NO:19:
AATATCGATG CCACGATGCG TCCGGCG                                       272)SEQ ID NO:20信息:
(i)序列特征:
   (A)长度:55碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..55
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM81”
(xi)序列描述:SEQ ID NO:20:
CATGGAGGAG AAGATGAAGG CGATGGAAGA GAAGATGAAG GCGTGATAGG TACCG        552)SEQ ID NO:21信息:
(i)序列特征:
   (A)长度:55碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..55
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM80”
(xi)序列描述:SEQ ID NO:21:
AATTCGGTAC CTATCACGCC TTCATCTTCT CTTCCATCGC CTTCATCTTC TCCTC       552)SEQ ID NO:22信息:
(i)序列特征:
   (A)长度:14氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(ix)特征:
   (A)名称/关键词:蛋白质
   (B)位置:1..14
   (C)其他信息:/标记=名称
                /注释=“碱性基因[(SSP5)2]”
(xi)序列描述:SEQ ID NO:22:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala1               5                   102)SEQ ID NO:23信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM84”
(xi)序列描述:SEQ ID NO:23:
GATGGAGGAG AAGATGAAGG C                                            212)SEQ ID NO:24信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM85”
(xi)序列描述:SEQ ID NO:24:
ATCGCCTTCA TCTTCTCCTC C                                             212)SEQ ID NO:25信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM82”
(xi)序列描述:SEQ ID NO:25:
GATGGAGGAG AAGCTGAAGG C                                            212)SEQ ID NO:26信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM83”
(xi)序列描述:SEQ ID NO:26:
ATCGCCTTCA GCTTCTCCTC C                                            212)SEQ ID NO:27信息:
(i)序列特征:
   (A)长度:7氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:27:Met Glu Glu Lys Leu Lys Ala1               52)SEQ ID NO:28信息:
(i)序列特征:
   (A)长度:7氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:28:Met Glu Glu Lys Met Lys Ala1               52)SEQ ID NO:29信息:
(i)序列特征:
   (A)长度:160碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:C15
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..151
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.7.7.7.7.7.5”
(xi)序列描述:SEQ ID NO:29:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG    46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Ala Met
1               5                  10                  15GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG  94Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu
             20                  25                  30AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAA GAG AAG ATG  142Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Met
         35                  40                  45AAG GCG TGATAGGTAC CG                                            160Lys Ala
     502)SEQ ID NO:30信息:
(i)序列特征:
   (A)长度:49氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:30:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu1               5                  10                  15Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys
         20                  25                  30Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Met Lys
     35                  40                  45Ala2)SEQ ID NO:31信息:
(i)序列特征:
   (A)长度:160碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:C20
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..151
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.7.7.7.7.7.5”
(xi)序列描述:SEQ ID NO:31:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG    46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Ala Met
1               5                  10                  15GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG  94Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu
             20                  25                  30AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAA GAG AAG ATG  142Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Met
         35                  40                  45AAG GCG TGATAGGTAC CG                                            160Lys Ala
     502)SEQ ID NO:32信息:
(i)序列特征:
   (A)长度:49氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:30:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu1               5                  10                  15Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys
         20                  25                  30Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Met Lys
     35                  40                  45Ala2)SEQ ID NO:33信息:
(i)序列特征:
   (A)长度:139碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:C30
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..130
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.7.7.7.7.5”
(xi)序列描述:SEQ ID NO:33:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG    46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Ala Met
1               5                  10                  15GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG  94Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu
             20                  25                  30AAG CTG AAG GCG ATG GAA GAG AAG ATG AAG GCG TGATAGGTAC CG    l39Lys Leu Lys Ala Met Glu Glu Lys Met Lys Ala
         35                  402)SEQ ID NO:34信息:
(i)序列特征:
   (A)长度:42氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:34:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu1               5                  10                  15Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys
         20                  25                  30Leu Lys Ala Met Glu Glu Lys Met Lys Ala
     35                  402)SEQ ID NO:35信息:
(i)序列特征:
   (A)长度:97碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:D16
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..88
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.5.5.5”
(xi)序列描述:SEQ ID NO:35:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG ATG AAG GCG ATG    46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met
1               5                  10                  15GAG GAG AAG ATG AAG GCG ATG GAA GAG AAG ATG AAG GCG TGATAGGTAC   95Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala
             20                  25CG                                                               972)SEQ ID NO:36信息:
(i)序列特征:
   (A)长度:28氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:36:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met Glu1               5                  10                  15Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala
         20                  252)SEQ ID NO:37信息:
(i)序列特征:
   (A)长度:118碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:D20
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..109
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.5.5.5.5”
(xi)序列描述:SEQ ID NO:37:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG ATG AAG GCG ATG    46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met
1               5                  10                  15GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG ATG AAG GCG ATG GAA GAG  94Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met Glu Glu
             20                  25                  30AAG ATG AAG GCG TGATAGGTAC CG                                    118Lys Met Lys Ala
         352)SEQ ID NO:38信息:
(i)序列特征:
   (A)长度:35氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:38:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met Glu1               5                  10                  15Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys
         20                  25                  30Met Lys Ala
     352)SEQ ID NO:39信息:
(i)序列特征:
   (A)长度:97碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:D33
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..88
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.5.5.5”
(xi)序列描述:SEQ ID NO:39:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG ATG AAG GCG ATG   46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met
1               5                  10                  15GAG GAG AAG ATG AAG GCG ATG GAA GAG AAG ATG AAG GCG TGATAGGTAC  95Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala
             20                  25CG                                                              972)SEQ ID NO:40信息:
(i)序列特征:
   (A)长度:28氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:40:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met Glu1               5                  10                  15Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala
         20                  252)SEQ ID NO:41信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM86”
(xi)序列描述:SEQ ID NO:41:GATGGAGGAG AAGCTGAAGA A                                                 212)SEQ ID NO:42信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM87”
(xi)序列描述:SEQ ID NO:42:ATCTTCTTCA GCTTCTCCTC C                                                 212)SEQ ID NO:43信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM88”
(xi)序列描述:SEQ ID NO:43:GATGGAGGAG AAGCTGAAGT G                                                212)SEQ ID NO:44信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM89”
(xi)序列描述:SEQ ID NO:44:ATCCACTTCA GCTTCTCCTC C                                                212)SEQ ID NO:45信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM90”
(xi)序列描述:SEQ ID NO:45:GATGGAGGAG AAGATGAAGA A                                                 212)SEQ ID NO:46信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM91”
(xi)序列描述:SEQ ID NO:46:ATCTTCTTCA TCTTCTCCTC C                                               212)SEQ ID NO:47信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM92”
(xi)序列描述:SEQ ID NO:47:GATGGAGGAG AAGATGAAGT G                                   212)SEQ ID NO:48信息:
(i)序列特征:
   (A)长度:21碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..21
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM93”
(xi)序列描述:SEQ ID NO:48:ATCCACTTCA TCTTCTCCTC C                                   212)SEQ ID NO:49信息:
(i)序列特征:
   (A)长度:7氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:49:Met Glu Glu Lys Leu Lys Lys1               52)SEQ ID NO:50信息:
(i)序列特征:
   (A)长度:7氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:50:Met Glu Glu Lys Leu Lys Trp1               52)SEQ ID NO:51信息:
(i)序列特征:
   (A)长度:7氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:51:Met Glu Glu Lys Met Lys Lys1               52)SEQ ID NO:52信息:
(i)序列特征:
   (A)长度:7氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:52:Met Glu Glu Lys Met Lys Trp1               52)SEQ ID NO:53信息:
(i)序列特征:
   (A)长度:160碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:82-4
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..151
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“7.7.7.7.7.7.5”
(xi)序列描述:SEQ ID NO:53:C ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG   46Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met
1               5                  10                  15GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG  94Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu
             20                  25                  30AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAA GAG AAG ATG 142Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Met
         35                  40                  45AAG GCG TGATAGGTAC CG                                           160Lys Ala
     502)SEQ ID NO:54信息:
(i)序列特征:
   (A)长度:49氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:54:Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu1               5                  10                  15Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys
         20                  25                  30Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Met Lys
     35                  40                  45Ala2)SEQ ID NO:55信息:
(i)序列特征:
   (A)长度:97碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:84-H3
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..88
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.5.5.5”
(xi)序列描述:SEQ ID NO:55:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG ATG AAG GCG ATG    46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met
1               5                  10                  15GAG GAG AAG ATG AAG GCG ATG GAA GAG AAG ATG AAG GCG TGATAGGTAC   95Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala
             20                  25CG                                                               972)SEQ ID NO:56信息:
(i)序列特征:
   (A)长度:28氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:56:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met Glu1               5                  10                  15Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala
         20                  252)SEQ ID NO:57信息:
(i)序列特征:
   (A)长度:97碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:86-H23
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..88
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.8.8.5”
(xi)序列描述:SEQ ID NO:57:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG CTG AAG AAG ATG    46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Lys Met
1               5                  10                  15GAG GAG AAG CTG AAG AAG ATG GAA GAG AAG ATG AAG GCG TGATAGGTAC   95Glu Glu Lys Leu Lys Lys Met Glu Glu Lys Met Lys Ala
             20                  25CG                                                               972)SEQ ID NO:58信息:
(i)序列特征:
   (A)长度:28氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:58:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Lys Met Glu1               5                  10                  15Glu Lys Leu Lys Lys Met Glu Glu Lys Met Lys Ala
         20                  252)SEQ ID NO:59信息:
(i)序列特征:
   (A)长度:112碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:88-2
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..103
   (D)其他信息:/功能=“合成的贮藏蛋白”
                    /产物=“蛋白”
                    /基因=“SSP”
                    /标准_名称=“5.9.9.9.5”
(xi)序列描述:SEQ ID NO:59:C ATG GAG GAG AAG ATG AAG GCG AAG AAG CTG AAG TGG ATG GAG GAG    46Met Glu Glu Lys Met Lys Ala Lys Lys Leu Lys Trp Met Glu Glu
1               5                  10                  15AAG CTG AAG TGG ATG GAG GAG AAG CTG AAG TGG ATG GAA GAG AAG ATG  94Lys Leu Lys Trp Met Glu Glu Lys Leu Lys Trp Met Glu Glu Lys Met
             20                  25                  30AAG GCG TGATAGGTAC CG                                            112Lys Ala2)SEQ ID NO:60信息:
(i)序列特征:
   (A)长度:33氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:60:Met Glu Glu Lys Met Lys Ala Lys Lys Leu Lys Trp Met Glu Glu Lys1               5                  10                  15Leu Lys Trp Met Glu Glu Lys Leu Lys Trp Met Glu Glu Lys Met Lys
         20                  25                  30Ala2)SEQ ID NO:61信息:
(i)序列特征:
   (A)长度:118碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:90-H8
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..109
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.10.10.10.5”
(xi)序列描述:SEQ ID NO:61:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG ATG AAG AAG ATG   46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Lys Met
1               5                  10                  15GAG GAG AAG ATG AAG AAG ATG GAG GAG AAG ATG AAG AAG ATG GAA GAG 94Glu Glu Lys Met Lys Lys Met Glu Glu Lys Met Lys Lys Met Glu Glu
             20                  25                  30AAG ATG AAG GCG TGATAGGTAC CG                                   118Lys Met Lys Ala
         352)SEQ ID NO:62信息:
(i)序列特征:
   (A)长度:35氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:62:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Lys Met Glu1               5                  10                  15Glu Lys Met Lys Lys Met Glu Glu Lys Met Lys Lys Met Glu Glu Lys
         20                  25                  30Met Lys Ala
     352)SEQ ID NO:63信息:
(i)序列特征:
   (A)长度:97碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:92-2
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..88
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.11.11.5”
(xi)序列描述:SEQ ID NO:63:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG ATG AAG TGG ATG     46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Trp Met
1               5                  10                  15GAG GAG AAG ATG AAG TGG ATG GAA GAG AAG ATG AAG GCG TGATAGGTAC    95Glu Glu Lys Met Lys Trp Met Glu Glu Lys Met Lys Ala
             20                  25CG                                                                972)SEQ ID NO:64信息:
(i)序列特征:
   (A)长度:28氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:64:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Trp Met Glu1               5                  10                  15Glu Lys Met Lys Trp Met Glu Glu Lys Met Lys Ala
         20                  252)SEQ ID NO:65信息:
(i)序列特征:
   (A)长度:84碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..84
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM96”
(xi)序列描述:SEQ ID NO:65:GATGGAGGAA AAGATGAAGG CGATGGAGGA GAAAATGAAA GCTATGGAGG AAAAGATGAA 60AGCGATGGAG GAGAAAATGA AGGC                                        842)SEQ ID NO:66信息:
(i)序列特征:
   (A)长度:84碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..84
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM97”
(xi)序列描述:SEQ ID NO:66:ATCGCCTTCA TTTTCTCCTC CATCGCTTTC ATCTTTTCCT CCATAGCTTT CATTTTCTCC  60TCCATCGCCT TCATCTTTTC CTCC                                         842)SEQ ID NO:67信息:
(i)序列特征:
   (A)长度:28氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(ix)特征:
   (A)名称/关键词:蛋白质
   (B)位置:1..14
   (C)其他信息:/标记=名称
                /注释=“(SSP5)4”
(xi)序列描述:SEQ ID NO:67:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met Glu1               5                  10                  15Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala
             20                  252)SEQ ID NO:68信息:
(i)序列特征:
   (A)长度:84碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..84
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM98”
(xi)序列描述:SEQ ID NO:68:GATGGAGGAA AAGCTGAAAG CGATGGAGGA GAAACTCAAG GCTATGGAAG AAAAGCTTAA  60AGCGATGGAG GAGAAACTGA AGGC                                         842)SEQ ID NO:69信息:
(i)序列特征:
   (A)长度:84碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..84
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM99”
(xi)序列描述:SEQ ID NO:69:ATCGCCTTCA GTTTCTCCTC CTACGCTTTA AGCTTTTCTT CCATAGCCTT GAGTTTCTCC  60TCCATCGCTT TCAGCTTTTC CTCC                                         842)SEQ ID NO:70信息:
(i)序列特征:
   (A)长度:28氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(ix)特征:
   (A)名称/关键词:蛋白质
   (B)位置:1..28
   (C)其他信息:/标记=名称
                /注释=“(SSP7)4”
(xi)序列描述:SEQ ID NO:70:Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu1               5                   10                  15Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala
        20                  252)SEQ ID NO:71信息:
(i)序列特征:
   (A)长度:84碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..84
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM100”
(xi)序列描述:SEQ ID NO:71:GATGGAGGAA AAGCTTAAGA AGATGGAAGA AAAGCTGAAA TGGATGGAGG AGAAACTCAA  60AAAGATGGAG GAAAAGCTTA AATG                                         842)SEQ ID NO:72信息:
(i)序列特征:
   (A)长度:84碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..84
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM101”
(xi)序列描述:SEQ ID NO:72:ATCCATTTAA GCTTTTCCTC CTACTTTTTG AGTTTCTCCT CCATCCATTT CAGCTTTTCT  60TCCATCTTCT TAAGCTTTTC CTCC                                         842)SEQ ID NO:73信息:
(i)序列特征:
   (A)长度:28氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(ix)特征:
(xi)序列描述:SEQ ID NO:73:Met Glu Glu Lys Leu Lys Lys Met Glu Glu Lys Leu Lys Trp Met Glu1               5                   10                  15Glu Lys Leu Lys Lys Met Glu Glu Lys Leu Lys Trp
        20                  252)SEQ ID NO:74信息:
(i)序列特征:
   (A)长度:243碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:2-9
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..235
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“7.7.7.7.7.7.8.9.8.9.5”
(xi)序列描述:SEQ ID NO:74:C ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG       46Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met
1               5                  10                  15GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG     94Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu
             20                  25                  30AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAG GAA AAG CTT     142Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu
         35                  40                  45AAG AAG ATG GAA GAA AAG CTG AAA TGG ATG GAG GAG AAA CTC AAA AAG     190Lys Lys Met Glu Glu Lys Leu Lys Trp Met Glu Glu Lys Leu Lys Lys
     50                  55                  60ATG GAG GAA AAG CTT AAA TGG ATG GAA GAG AAG ATG AAG GCG TGATAGGTAC  242Met Glu Glu Lys Leu Lys Trp Met Glu Glu Lys Met Lys Ala
 65                  70                  75C                                                                   2432)SEQ ID NO:75信息:
(i)序列特征:
   (A)长度:77氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:75:Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu1               5                  10                  15Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys
         20                  25                  30Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys
     35                  40                  45Lys Met Glu Glu Lys Leu Lys Trp Met Glu Glu Lys Leu Lys Lys Met
 50                  55                  60Glu Glu Lys Leu Lys Trp Met Glu Glu Lys Met Lys Ala65                  70                  752)SEQ ID NO:76信息:
(i)序列特征:
   (A)长度:175碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(vii)直接来源:
   (B)克隆:5-1
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:2..172
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“5.5.5.7.7.7.7.5”
(xi)序列描述:SEQ ID NO:76:C ATG GAG GAG AAG ATG AAG GCG ATG GAG GAG AAG ATG AAG GCG ATG     46Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met
1               5                  10                  15GAG GAG AAG ATG AAG GCG ATG GAG GAA AAG CTG AAA GCG ATG GAG GAG   94Glu Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu
             20                  25                  30AAA CTC AAG GCT ATG GAA GAA AAG CTT AAA GCG ATG GAG GAG AAA CTG   142Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu
         35                  40                  45AAG GCC ATG GAA GAG AAG ATG AAG GCG TGATAG                        179Lys Ala Met Glu Glu Lys Met Lys Ala
     50                  552)SEQ ID NO:77信息:
(i)序列特征:
   (A)长度:56氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:77:Met Glu Glu Lys Met Lys Ala Met Glu Glu Lys Met Lys Ala Met Glu1               5                  10                  15Glu Lys Met Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys
         20                  25                  30Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys
     35                  40                  45Ala Met Glu Glu Lys Met Lys Ala
 50                  552)SEQ ID NO:78信息:
(i)序列特征:
   (A)长度:187碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(vi)原始来源:
   (B)菌株:大肠杆菌
   (G)细胞类型:DH5α
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:3..173
   (D)其他信息:/功能=“合成的贮藏蛋白”
                /产物=“蛋白”
                /基因=“SSP”
                /标准_名称=“SSP-3-5”
(xi)序列描述:SEQ ID NO:78:CC ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG    47Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met
 1               5                  10                  15GAG GAG AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAG GAG   95Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu
             20                  25                  30AAG CTG AAG GCG ATG GAG GAG AAG CTG AAG GCG ATG GAG GAA AAG ATG   143Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Met
         35                  40                  45AAG GCG ATG GAA GAG AAG ATG AAG GCG TGATAGGTAC CGAATTC            187Lys Ala Met Glu Glu Lys Met Lys Ala
     50                  552)SEQ ID NO:79信息:
(i)序列特征:
   (A)长度:56氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:79:Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu1               5                  10                  15Glu Lys Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys
         20                  25                  30Leu Lys Ala Met Glu Glu Lys Leu Lys Ala Met Glu Glu Lys Met Lys
     35                  40                  45Ala Met Glu Glu Lys Met Lys Ala
 50                  552)SEQ ID NO:80信息:
(i)序列特征:
   (A)长度:61碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..61
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM107”
(xi)序列描述:SEQ ID NO:80:CATGGAGGAG AAGATGAAAA AGCTCGAAGA GAAGATGAAG GTCATGAAGT GATAGGTACC  60G                                                                  612)SEQ ID NO:81信息:
(i)序列特征:
   (A)长度:61碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..61
   (C)其他信息:/产物=“合成的寡核苷酸”
              /标准_名称=“SM106”
(xi)序列描述:SEQ ID NO:81:AATTCGGTAC CTATCACTTC ATGACCTTCA TCTTCTCTTC GAGCTTTTTC ATCTTCTCCT  60C                                                                  612)SEQ ID NO:82信息:
(i)序列特征:
   (A)长度:16氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(ix)特征:
   (A)名称/关键词:蛋白质
   (B)位置:1..16
   (C)其他信息:/标记=名称
                /注释=“pSK34碱性基因”
(xi)序列描述:SEQ ID NO:82:Met Glu Glu Lys Met Lys Lys Leu Glu Glu Lys Met Lys Val Met Lys1               5                   10                  152)SEQ ID NO:83信息:
(i)序列特征:
   (A)长度:63碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..63
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM110”
(xi)序列描述:SEQ ID NO:83:GCTGGAAGAA AAGATGAAGG CTATGGAGGA CAAGATGAAA TGGCTTGAGG AAAAGATGAA  60GAA                                                                632)SEQ ID NO:84信息:
(i)序列特征:
   (A)长度:63碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..63
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM111”
(xi)序列描述:SEQ ID NO:84:AGCTTCTTCA TCTTTTCCTC AAGCCATTTC ATCTTGTCCT CCATAGCCTT CATCTTTTCT  60TCC                                                                632)SEQ ID NO:85信息:
(i)序列特征:
   (A)长度:37氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:未知
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:85:Met Glu Glu Lys Met Lys Lys Leu Glu Glu Lys Met Lys Ala Met Glu1               5                  10                  15Asp Lys Met Lys Trp Leu Glu Glu Lys Met Lys Lys Leu Glu Glu Lys
         20                  25                  30Met Lys Val Met Lys
     352)SEQ ID NO:86信息:
(i)序列特征:
   (A)长度:37氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线形
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:86:Met Glu Glu Lys Met Lys Lys Leu Glu Glu Lys Met Lys Ala Met Glu1               5                  10                  15Asp Lys Met Lys Trp Leu Glu Glu Lys Met Lys Lys Leu Glu Glu Lys
         20                  25                  30Met Lys Val Met Lys
     352)SEQ ID NO:87信息:
(i)序列特征:
   (A)长度:62碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..62
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM112”
(xi)序列描述:SEQ ID NO:87:GCTCGAAGAA AGATGAAGGC AATGGAAGAC AAAATGAAGT GGCTTGAGGA GAAAATGAAG  60AA                                                                 622)SEQ ID NO:88信息:
(i)序列特征:
   (A)长度:62碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..62
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM113”
(xi)序列描述:SEQ ID NO:88:AGCTTCTTCA TTTTCTCCTC AAGCCACTTC ATTTTGTCTT CCATTGCCTT CATCTTTCTT  60CG                                                                 622)SEQ ID NO:89信息:
(i)序列特征:
   (A)长度:37氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线形
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:89:Met Glu Glu Lys Met Lys Lys Leu Lys Glu Glu Met Ala Lys Met Lys1               5                  10                  15Asp Glu Met Trp Lys Leu Lys Glu Glu Met Lys Lys Leu Glu Glu Lys
         20                  25                  30Met Lys Val Met Lys
     352)SEQ ID NO:90信息:
(i)序列特征:
   (A)长度:63碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..63
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM114”
(xi)序列描述:SEQ ID NO:90:GCTCAAGGAG GAAATGGCTA AGATGAAAGA CGAAATCTGG AAACTGAAAG AGGAAATGAA  60GAA                                                                632)SEQ ID NO:91信息:
(i)序列特征:
   (A)长度:63碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(ix)特征:
   (A)名称/关键词:misc_feature
   (B)位置:1..63
   (C)其他信息:/产物=“合成的寡核苷酸”
                /标准_名称=“SM115”
(xi)序列描述:SEQ ID NO:91:AGCTTCTTCA TTTCCTCTTT CAGTTTCCAC ATTTCGTCTT TCATCTTAGC CATTTCCTCC  60TTG                                                                632)SEQ ID NO:92信息:
(i)序列特征:
   (A)长度:107氨基酸
   (B)类型:氨基酸
   (D)拓扑学:线形
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:92:Met Glu Glu Lys Met Lys Lys Leu Lys Glu Glu Met Ala Lys Met Lys1               5                  10                  15Asp Glu Met Trp Lys Leu Lys Glu Glu Met Lys Lys Leu Glu Glu Lys
         20                  25                  30Met Lys Val Met Glu Glu Lys Met Lys Lys Leu Glu Glu Lys Met Lys
     35                  40                  45Ala Met Glu Asp Lys Met Lys Trp Leu Glu Glu Lys Met Lys Lys Leu
 50                  55                  60Glu Glu Lys Met Lys Val Met Glu Glu Lys Met Lys Lys Leu Glu Glu65                  70                  75                  80Lys Met Lys Ala Met Glu Asp Lys Met Lys Trp Leu Glu Glu Lys Met
             85                  90                  95Lys Lys Leu Glu Glu Lys Met Lys Val Met Lys
        100                 1052)SEQ ID NO:93信息:
(i)序列特征:
   (A)长度:839碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:93:GGATCCCCCG GGCTGCAGGA ATTCTACGTA CCATATAGTA AGACTTTGTA TATAAGACGT    60CACCTCTTAC GTGCATGGTT ATATGTGACA TGTGCAGTGA CGTTGTACCA TATAGTAAGA   120CTTTGTATAT AAGACGTCAC CTCTTACGTG CATGGTTATA TGTGACATGT GCAGTGACGT   180TAACCGCACC CTCCTTCCCG TCGTTTCCCA TCTCTTCCTC CTTTAGAGCT ACCACTATAT   240AAATCAGGGC TCATTTTCTC GCTCCTCACA GGCTCATCAG CACCCCGGCA GTGCCACCCC   300GACTCCCTGC ACCTGCCATG GGTACGCTAG CCCGGGAGAT CTGACAAAGC AGCATTAGTC   360CGTTGATCGG TGGAAGACCA CTCGTCAGTG TTGAGTTGAA TGTTTGATCA ATAAAATACG   420GCAATGCTGT AAGGGTTGTT TTTTATGCCA TTGATAATAC ACTGTACTGT TCAGTTGTTG   480AACTCTATTT CTTAGCCATG CCAGTGCTTT TCTTATTTTG AATAACATTA CAGCAAAAAG   540TTGAAAGACA AAAAAANNNN NCCCCGAACA GAGTGCTTTG GGTCCCAAGC TTCTTTAGAC   600TGTGTTCGGC GTTCCCCCTA AATTTCTCCC CTATATCTCA CTCACTTGTC ACATCAGCGT   660TCTCTTTCCC CTATATCTCC ACGCTCTACA GCAGTTCCAC CTATATCAAA CCTCTATACC   720CCACCACAAC AATATTATAT ACTTTCATCT TCACCTAACT CATGTACCTT CCAATTTTTT   780TCTACTAATA ATTATTTACG TGCACAGAAA CTTAGGCAAG GGAGAGAGAG AGCGGTACC    8392)SEQ ID NO:94信息:
(i)序列特征:
   (A)长度:43碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:94:CTAGAAGCCT CGGCAACGTC AGCAACGGCG GAAGAATCCG GTG                         432)SEQ ID NO:95信息:
(i)序列特征:
   (A)长度:43碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:95:CATGCACCGG ATTCTTCCGC CGTTGCTGAC GTTGCCGAGG CTT                         432)SEQ ID NO:96信息:
(i)序列特征:
   (A)长度:55碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:96:GATCCCATGG CGCCCCTTAA GTCCACCGCC AGCCTCCCCG TCGCCCGCCG CTCCT            552)SEQ ID NO:97信息:
(i)序列特征:
   (A)长度:55碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:97:CTAGAGGAGC GGCGGGCGAC GGGGAGGCTG GCGGTGGACT TAAGGGGCGC CATGG            552)SEQ ID NO:98信息:
(i)序列特征:
   (A)长度:59碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:98:CATGGCGCCC ACCGTGATGA TGGCCTCGTC GGCCACCGCC GTCGCTCCGT TCCAGGGGC       592)SEQ ID NO:99信息:
(i)序列特征:
   (A)长度:59碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:99:TTAAGCCCCT GGAACGGAGC GACGGCGGTG GCCGACGAGG CCATCATCAC GGTGGGCGC       592)SEQ ID NO:100信息:
(i)序列特征:
   (A)长度:16碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:100:GCGCCCACCG TGATGA                                                      162)SEQ ID NO:101信息:
(i)序列特征:
   (A)长度:16碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:101:CACCGGATTC TTCCGC                                                     162)SEQ ID NO:102信息:
(i)序列特征:
   (A)长度:372碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:102:GTAAGATTGG TAAAGTCCAG CAAGAAAATG AGATAAAAGA GAAGCCTGAA ATGACGAAAA     60AATCAGGTGT TTTGATTCTT GGTGCTGGAC GTGTGTNTCG CCCAGCTGCT GATTTCCTAG    120CTTCAGTTAG AACCATTTCG TCACAGCAAT GGTACAAAAC ATATTTCGGA GCAGACTCTG    180AAGAGAAAAC AGATGTTCAT GTGATTGTCG CGTCTCTGTA TCTTAAGGAT GCCAAAGAGA    240CGGTTGAAGG TATTTCAGAT GTAGAAGCAG TTCGGCTAGA TGTATCTGAT AGTGAAAGTC    300TCCTTAAGTA TGTTTCTCAG GTTGATGTTG TCCTAAGTTT ATTACCTGCA AGTTGTCATG    360CTTGTTGTAG CA                                                        3722)SEQ ID NO:103信息:
(i)序列特征:
   (A)长度:323碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:103:GGAAGCACAC TGCGACTCTT TTGGAATTCG GGGACATCAA GAATGGACAA ACAACAACCG          60CTATGGCCAA GACTGTTGGG ATCCCTGCAG CCATTGGAGC TCTGCTGTTA ATTGAAGACA         120AGATCAAGAC AAGAGGAGTC TTAAGGCCTC TCGAAGCAGA GGTGTATTTG CCAGCTTTGG         180ATATATTGCA AGCATATGGT ATAAAGCTGA TGGAGAAGGC AGAATGATCA AAGAACTCTG         240TATATTGTTT CTNTCTATAA CTTGGAGTTG GAGACAAAGC TGAAGGAGNC AGNGCCATTA         300GACCAGCAAA AAAAGGAGGA GGA                                                 3232)SEQ ID NO:104信息:
(i)序列特征:
   (A)长度:123氨基酸
   (B)类型:氨基酸
   (C)线型:单链
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:104:Lys Ile Gly Lys Val Gln Gln Glu Asn Glu Ile Lys Glu Lys Pro Glu1               5                   10                  15Met Thr Lys Lys Ser Gly Val Leu Ile Leu Gly Ala Gly Arg Val Xaa
        20                  25                  30Arg Pro Ala Ala Asp Phe Leu Ala Ser Val Arg Thr Ile Ser Ser Gln
    35                  40                  45Gln Trp Tyr Lys Thr Tyr Phe Gly Ala Asp Ser Glu Glu Lys Thr Asp
 50                  55                  60Val His Val Ile Val Ala Ser Leu Tyr Leu Lys Asp Ala Lys Glu Thr65                  70                  75                  80Val Glu Gly Ile Ser Asp Val Glu Ala Val Arg Leu Asp Val Ser Asp
            85                  90                  95Ser Glu Ser Leu Leu Lys Tyr Val Ser Gln Val Asp Val Val Leu Ser
        100                 105                 110Leu Leu Pro Ala Ser Cys His Ala Cys Cys Ser
    115                 1202)SEQ ID NO:105信息:
(i)序列特征:
   (A)长度:74氨基酸
   (B)类型:氨基酸
   (C)线型:单链
   (D)拓扑学:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:105:Lys His Thr Ala Thr Leu Leu Glu Phe Gly Asp Ile Lys Asn Gly Gln1               5                   10                  15Thr Thr Thr Ala Met Ala Lys Thr Val Gly Ile Pro Ala Ala Ile Gly
        20                  25                  30Ala Leu Leu Leu Ile Glu Asp Lys Ile Lys Thr Arg Gly Val Leu Arg
    35                  40                  45Pro Leu Glu Ala Glu Val Tyr Leu Pro Ala Leu Asp Ile Leu Gln Ala
50                  55                  60Tyr Gly Ile Lys Leu Met Glu Lys Ala Glu65                  702)SEQ ID NO:106信息:
(i)序列特征:
   (A)长度:25碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:106:ATTCCCCATG GTTTCGCCGA CGAAT                                            252)SEQ ID NO:107信息:
(i)序列特征:
   (A)长度:29碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:107:CTCTCGGTAC CTAGTACCTA CTGATCAAC                                         292)SEQ ID NO:108信息:
(i)序列特征:
   (A)长度:24碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:108:AGAGAAGCCT GAAATGACGA AAAA                                              242)SEQ ID NO:109信息:
(i)序列特征:
   (A)长度:24碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:109:GTCTTGGCCA TAGCGGTTGT TGTT                                              242)SEQ ID NO:110信息:
(i)序列特征:
   (A)长度:8160碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:110:TCTAGATGCA CATTCAACTC GAGGTTGTTG CATGATGTTT CATTTACCAA AAAAATCATA      60GTCAAATTAT GTAAGCAAAT GATATTACAG AAAAGTTTTA CTAGAGAGTT TCAGATTTAC     120ACATGCACAA CGTTAAAAAA AATAGCAGAA AAAAGAAAGA AGAAAAGTTC TTTATTTGTG     180AGAAAAATGT ATGAAAAAAA AAGAGATGGG TGTAAAAAGC AAAAGGATAG GACCACTGTT     240ACTTTGTAGC CTCGTTGAGG AATCTCTTCT CGCATCTCGA CTTTTGTGCC ATTGCAAAGT     300CAATGCCCAG AACTTGTTCC CAGGCCATCT CCAATTAACT ACGTCTATTT AATTAAACTT     360TTAAAAGAAA ACCTAATAAA TTAAACAAAA GAAAAGCCGT CAACGAAATC TAAGCTTGCA     420GCGATATCGA TGAACTGATA CCAAAACAAT GTTCAAGTTT CACTTTCAAA TTGTTTTTTC     480TTGAAATAGT TTATTGGGTA AGGCCCATAG ATATTTCATA AGAAGAACAC TTGTCGAGGT     540TGAATCGTAT GTCTGCCCAC CGCGGCCCAT GCATCCTCTG TTGGTAGCAT AATCGTTTTA     600GGCCATACTA TTGTTCGTAC ACACTGATTT TGAAGTCACC TTTGTGCACT CCTTAATTCC     660TAAATTGAAG AAGCTTGTTC TCATTCTTCT TTGGGTTACA AATGCCAAGG CAAAAGGAAC     720TTGGGCCAAA TTAAGACAAC AACTCAAGCC CACTCTCTGC AAATAATACT TGGGAATTTT     780TACTAAAACG GTGCGTTTCA TCCAAGAATC TATTAATATC CCTAACTTGA AATCATCATA     840TACGTAACCC AACATATTAA AGAGTTAATA ATGTTAAAAA AAGTCTCAGA AGAGAGAGAC     900GTAGAGAACA CGGAAAGTGG TAACTGGTAA GCGTCGTCAT CGAGGATATA GTAGCTACGT     960GAGCAAACGT CTTCACTCAT CTCTGTCTAT TTCTCTTCGA ATACACGTAA TACATTTTCG   1020ATTGGATTGA TCCTCCCTCG GTCCTATCCA AGTATCCATC CACGTAAACA AGAGCTTGTT   1080CCTTTCTTGT TTTTTCTTTC TTTAAATAGT AAAAATACTT ATTTCATTTG TTTCGTTTGA   1140TTTCATTATT ATTGTCTATG GCATTATATA CTATATATAT TATTTCTACA ACATTGGCTG   1200GCTCACGTTG TTCTCGTGTA TACAACAAAC TTAATTAATG TCTCTCTATT GCATTAGATA   1260GTTTCGGAGC ATATCCATTA TGTGAAAGCC ACATTAAGTT ATAACTAAAA GTAGTTTTCG   1320AAAGAGCTTA ATTAAGTTAT GTTCTGTTTC AAATAAAAAT GAACACGAGG GATTTTTTTT   1380TTTTTTGACA GATCATTATT AACAAAAATG ATTACCTGAA GAAAGGGGAA AATAATTATA   1440GCTGATTACA GATCATTATT AACAAAAAGA ATTCTTGTCA CATCATTCAT TATAACAAGA   1500AATATTATAT TATATTAATT TAATCTTTCG CTAACACGCC CACAATATAT TAATCATATA   1560CGTAATTTAG CTTATAAAAA GGACGGAAAG AGATTATTAC TGCGCCTAAA AAACTCACTA   1620ATTCCAAAGA AAAAAAAAAG CTTGTATTTT TTCTTGACAA ACCAGCTCAC AGGCATTGCA   1680TGATCAAACT CATCAGGTAC GTTTTGATTC CTTCTTCCAT AATTTTCCCA TCTTGAGGAA   1740TGCAAATTTG GAGAGCGCTT TAGCTAAATC ACTGCCTTCA TTTTTTCACT TTGGATTTAA   1800TAATTTGCAT TCCTCTCTTC CTCTCTGCTC TGTTCTGTTC TGTTCTGTTC TGATTTGAGT   1860TTTCAATTAA TCGCTCGAGC AAAAGCTATT TCTCAACTCG TTAAATTTCT GTTCCCAGTT   1920TGTTCGATTT TCAACAGTTT CACATTAAAG TTTGGGTTTT TGATGTTTGG TTGATGAAAC   1980TCGAAATATG AAATGTTTGT GAATCTATTC CAGGGTGTTT AAAATAAGGG TTTGTTGTTC   2040ATCTGCAGAG ATTATATGTT TTTACATGAA AGATGAATTC AAATGGCCAT GAGGAGGAGA   2100AGAAGTTGGG GAATGGAGTT GTGGGGATTC TAGCTGAAAC AGTTAACAAA TGGGAGAGAC   2160GAACACCATT GACGCCATCG CATTGCGCTC GCCTTTTACA CGGTGGGAAA GACAGAACCG   2220GCATTTCCCG CATTGTGGTT CAGCCATCTG CTAAGCGTAT CCATCATGAT GCCTTGTATG   2280AAGATGTTGG GTGTGAAATT TCTGATGATT TGTCTGATTG TGGGCTTATA CTTGGAATCA   2340AACAACCTGA GGTGTGGGAA TTTGCATTAA AAAGAGTTCC TTTTTTTCTT CTATATATAT   2400ATCAGTTTAT GAGATTTGAT TCTGTTTGCA GCTAGAAATG ATTCTTCCAG AGAGAGCATA   2460CGCTTTCTTT TCACATACTC ATAAGGCACA GAAAGAGAAC ATGCCTTTGT TGGATAAAGT   2520ATTACACTTT TCATTTATCC TTTTAGTCCT ATCTAAGATA CTGAGGAATG TTGACAAAAG   2580GGGTATCCAA TTGCAGATTC TTTCTGAGAG AGTGACTTTG TGTGATTATG AGCTCATTGT   2640TGGGGATCAT GGGAAACGAT TATTGGCGTT TGGTAAATAT GCAGGCAGAG CTGGTCTTGT   2700TGACTTCTTA CACGGACTTG GACAGCGTAA GCTCATGTTA TAATTCTGAT GATCAGGACA     2760TGTTTCTGTG CAGAACAAGA TGAGATGTAA TTTTCCATGT TTGATGCAGG ATATCTAAGT     2820CTAGGATACT CAACACCTTT CCTCTCGCTC GGTGCATCGT ATATGTATTC CTCATTGGCT     2880GCTGCAAAAG CCGCTGTAAT TTCTGTTGGT GAAGAAATTG CAAGCCAGGG ACTGCCATTA     2940GGAATCTGCC CTCTTGTATT TGTCTTCACC GGAACAGGAA ATGGTATCTT CTTTAGTTCT     3000ACTGCGAGTT CTTTGAATCC TTCTGCATAT GTTTCATCTC ATTAAAAAAT TTCTCATCCG     3060CAGTTTCTCT GGGGGCGCAA GAAATTTTCA AGCTTCTTCC TCACACTTTT GTTGAACCAA     3120GCAAACTTCC TGAACTATTT GTAAAAGTAA GTCACGCTTT GCTTTTTATT TGGTTTCAGA     3180GTTTTGAAGA TTCTGAAATG TATATTTCTC ACAGGACAAA GGAATTAGTC AAAATGGGAT     3240TTCAACAAAG CGAGTCTATC AAGTATATGG TTGTATTATT ACCAGCCAAG ACATGGTTGA     3300ACACAAAGAT CCATCAAAGT CATTCGACAA AGTAACACTT ACCTTCTTAG CTCCTTGGCT     3360GTGACTTTTG TTCCACTACG CTAAAGTAGA ATACCTATTA ATTCTTCAAG CTTATGATGT     3420TTAGGCCGAC TATTATGCAC ACCCGGAACA TTACAATCCA GTTTTCCACG AAAAGATATC     3480GCCATATACG TCTGTTCTTG GTAGATCCTG ATCACTGTTT TACCTTTAAA GCTCAAGAGT     3540TTACATATAA GCAAATCCTC TGTCCACTCC GTGACTGTGA CCATCTCATT TTGGTTAGTT     3600CCAGTGTGTA ACCCCTATGA CTTTCTGTGC AGTAAACTGT ATGTACTGGG AGAAGAGGTT     3660TCCCTGTCTT CTGAGCACAA AACAGCTTCA AGATTTAACA AAAAAAGGAC TCCCACTAGT     3720AGGCATATGT GATATAACTT GTGACATCGG TGGCTCCATT GAATTTGTTA ACCGAGCTAC     3780TTTAATCGAT TCCCCTTTCT TCAGGTAATA TATACTTAGG AAGAGCTTTC TTTTGAGTCA     3840TCTACGTTTA CTATGATGAA ACTCGTCGAG CTAAACACTA TCTCTAGGTT TAATCCCTCG     3900AACAATTCAT ACTACGATGA CATGGATGGG GATGGCGTAC TATGCATGGC TGTTGACATT     3960TTACCCACAG AATTTGCAAA AGAGGTATGT ATGAAGGTTA CAGTTATAGT ACTTAAGATT     4020AAATCTAAAG TTAAAAACCT TGTATTGAGT GGGAGTTCTT GTGTCCTGAA AAAGGCATCC     4080CAGCATTTTG GAGATATTCT TTCCGGATTT GTCGGTAGTT TGGCTTCAAT GACTGAAATT     4140TCAGATCTAC CAGCACATCT GAAGAGGGCT TGCATAAGCT ATAGGGGAGA ATTGACATCT     4200TTGTATGAGT ATATTCCACG TATGAGGAAG TCAAATCCAG AGTATGTTCT GCTTCGAGCG     4260TTACTTCATC TGAAATATTT AGGCCTCTTC TCTAAACTAT GTTTTCATCT TTACCCACTT     4320TAACTGCAGA GAGGCACAAG ATAATATTAT CGCCAACGGG GTTTCCAGCC AGAGAACATT     4380CAACATATTG GTTAGTTTTG ATGAAGAAAG TATATATAAC TAGTTTCCGA ATCATATGAT     4440TTAAGCTAAT GAATTAAGAA AATATATAGT TCAAGACTTA TGATTCATAT CTCTATCAAC    4500TTTTTGACCA AAGATTGATA CTTTTTCGAC ATCTGTCACA GCATTTTGTG ATGATTTTGA    4560TTGAGACAAA TCATTTGTAG GTATCTCTGA GCGGACACCT ATTTGATAAG TTTCTGATAA    4620ACGAAGCTCT TGATATGATC GAAGCGGCTG GTGGCTCATT TCATTTGGCT AAATGTGAAC    4680TGGGGCAGAG CGCTGATGCT GAATCGTACT CAGAACTTGA AGTAAGTTTC TTTCTGGATA    4740AAACCTAATC ATTCACATGG AACAACTGTC AAGAGTTTTT AATGTCACGT TTAGGTTCAA    4800TGTCCTTTTC ACTAAGTCTC GTAAGTTTTT AAAACAAGTA AACAAACTAC AAGCCAAAAA    4860CATTCTGGCC CCACATTAAC CTATTCCCAC TTGTTAAAGA ACCCATCTTG CATTATCTTG    4920GTAGGTTGGT GCGGATGATA AGAGAGTATT GGATCAAATC ATTGATTCAT TAACTCGGTT    4980AGCTAATCCA AATGAAGATT ATATATCCCC ACATAGAGAA GCAAATAAGA TCTCACTGAA    5040GATTGGTAAA GTCCAGCAAG AAAATGAGAT AAAAGAGAAG CCTGAAATGA CGAAAAAATC    5100AGGCGTTTTG ATTCTTGGTG CTGGACGTGT GTGTCGCCCA GCTGCTGATT TCCTAGCTTC    5160AGTTAGAACC ATTTCGTCAC AGCAATGGTA CAAAACATAT TTCGGAGCAG ACTCTGAAGA    5220GAAAACAGAT GTTCATGTGA TTGTCGCGTC TCTGTATCTT AAGGATGCCA AAGAGGTAGG    5280AGAAGCCTTT GGGCTTCATC TGAGTAATTC AGTGTATACG ATGAACTATC AATCTTTTAA    5340AGTTTTACTG ATGATCAAAT TTTCCGCAGA CGGTTGAAGG TATTTCAGAT GTAGAAGCAG    5400TTCGGCTAGA TGTATCTGAT AGTGAAAGTC TCCTTAAGTA TGTTTCTCAG GTATTTTCCT    5460AACTTCTCTG TTCTTAGATC ACCTTTACTT CAAACTCCAC TGTTCAAATC CATGATCTTA    5520TATTTTTTTT TCATTGCACG CAGGTTGATG TTGTCCTAAG TTTATTACCT GCAAGTTGTC    5580ATGCTGTTGT AGCAAAGAGA TGCATTGAGG TAAATTCCTA ACGTTTAATG CGTTTTCCGA    5640GTGAAGTTAT GAAATTTGCA AATGTTATTC GACATAGAGG TTAAACTTCC TCTGCATAAC    5700ACATTCTTTC AGTAGTTTCC GGTTCCTAAA TGTCTCTGTT TCTTCTTTCT GATTCACTCA    5760GCTGAAGAAG CATCTCGTCA CTGCTAGCTA TGTTGATGAT GAAACGTCCA TGTTACATGA    5820GAAGGCTAAG AGTGCTGGGA TAACGATTCT AGGCGAAATG GGACTGGACC CTGGAATCGG    5880TATGATATCT CACAACATAG TATCTCTTAA GATCATTTGT TCACTTGATT TAACTTAAGT    5940GCATTTATCT TCAAAATATT TCCCGGATAA CTGAGAAGGT GATCCTACAA TGAATCTTTC    6000AGATCACATG ATGGCGATGA AAATGATCAA CGATGCTCAT ATCAAAAAAG GGAAAGTGAA    6060GTCTTTTACC TCTTATTGTG GAGGGCTTCC CTCTCCTGCT GCAGCAAATA ATCCATTAGC    6120ATATAAATTT AGGTACGGTA GTCCTTTACG CCATTAACAT ATTTTGTTTT GTTTAACTCA    6180TTTAGACATC CTTTCAGAAT TTCGCTTACT CAATTACATC TCGGTATTTT CAGCTGGAAC    6240CCTGCTGGAG CAATTCGAGC TGGTCAAAAC CCCGCCAAAT ACAAAAGCAA CGGCGACATA    6300ATACATGTTG ATGGTATGAA AAACAAAATA TGTCTACATG CAGGAGAGGT TGGAGTAGTT    6360TAGCTTCACT ACACATCATT TTTGTTTAAG CGAGCAATGT AAATCGCAGG GAAGAATCTC    6420TATGATTCCG CGGCAAGATT CCGAGTACCT AATCTTCCAG CTTTTGCATT GGAGTGTCTT    6480CCAAATCGTG ACTCCTTGGT TTACGGGGAA CATTATGGCA TCGAGAGCGA AGCAACAACG    6540ATATTTCGTG GAACACTCAG ATATGAAGGC ATGAATTCCA TAATCACAAC TCACGACTCA    6600CTTCTCCATA TCTGAAGGCT TAACACTTGT TTTCTTTTGG CTTGTACAGG GTTTAGTATG    6660ATAATGGCAA CACTTTCGAA ACTTGGATTC TTTGACAGTG AAGCAAATCA AGTACTCTCC    6720ACTGGAAAGA GGATTACGTT TGGTGCTCTT TTAAGTAACA TTCTAAATAA GGATGCCGAC    6780AATGAATCAG AGCCCCTAGC GGGAGAAGAA GAGATAAGCA AGAGAATTAT CAAGCTTGGA    6840CATTCCAAGG AGACTGCAGC CAAAGCTGCC AAAACAATTG TGTAAGCTTC TCCATGAAGA    6900TATATAATCT GAATGTTGCA GTGTGATTCC AATTCTTCTA CGAAACTCCT AACCCCAATT    6960CTTTTGTGGT GTCTTAGATT CTTGGGGTTC AACGAAGAGA GGGAGGTTCC ATCACTGTGT    7020AAAAGCGTAT TTGATGCAAC TTGTTACCTA ATGGAAGAGA AACTAGCTTA TTCCGGAAAT    7080GAACAGGTCT CTGTTTCATG TGAAAGCATT AGTTTTCTTC TCTCACTTGT ATTTGGTGTT    7140ACTTACTGAC ATAAACTTTG GACAATCTTT TGCATTATGT TTTCAGGACA TGGTGCTTTT    7200GCATCACGAA GTAGAAGTGG AATTCCTTGA AAGCAAACGT ATAGAGAAGC ACACTGCGAC    7260TCTTTTGGAA TTCGGGGACA TCAAGAATGG GCAAACAACA ACCGCTATGG CCAAGACTGT    7320TGGGATCCCT GCAGCCATTG GAGCTCTGGT CCTTACTAAG ACTTTGATCA CCACTTTTTC    7380CTGTCTATAT TTCTCTAAAA TGAAAGTTTT AAGCGTTTGT TTTATGATGT TGTGTGTTGC    7440AGCTGTTAAT TGAAGACAAG ATCAAGACAA GAGGAGTCTT AAGGCCTTTC GAAGCAGAGG    7500TGTATTTGCC AGGTAAATTA GAATTCCGCT TCAAAAGGAT GTGTGTTGCA GATAAAGACA    7560ATGATGTTGA TTTGTTGTGT GTTTGGGATA TGTGGTGTTA TACATACAGC TTTGGATATA    7620TTGCAAGCAT ATGGTATAAA GCTGATGGAG AAGGCAGAAT GATCAAAGAA CTCTGTATAT    7680TGTTTCTCTC TATAACTTGG AGTTGGAGAC AAAGCTGAAG AAGACAGAGA CATTAGACCA    7740GCAAAAAAAG AAGAAGAAGG AAGAAGATAA GCCTCGATCC TTGGGTGACG AGTATCTATA    7800TGTTTATATG TACTATATGT TATGTTGTAC AGAAGAAGTC GTGTCCACAA ATATCAATTG    7860ATGTCAGATG TCTAGTAAGT GATCATGTGT AGCATACAAA CTGGAGTAAT TTAAAAAGTG    7920AATAAACAAA AATAATTACT AAACGTTATT CCAAGTAGCT TTCCAAGACA GTCACTTGCC   7980CTTTTCCAAT TTCCCTTGCA ATTAACTAAA TTGCTCTTCA CGATATGATA TTATACCAAA   8040ATGGTGATAC CTTGGGAATT GTTAATTTGA CTCATTTGAA CAAATCTCAT CTATAAAATC   8100ATCCCACCTC TCCACCACAT TTGTTCTCAC TACCAATCAA AAAATAATCT AGTCTTAAAC   81602)SEQID NO:111信息:
(i)序列特征:
   (A)长度:3194碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:111:ATGAATTCAA ATGGCCATGA GGAGGAGAAG AAGTTGGGGA ATGGAGTTGT GGGGATTCTA       60TCTGAAACAG TTAACAAATG GGAGAGACGA ACACCATTGA CGCCATCGCA TTGCGCTCGC      120CTTTTACACG GTGGGAAAGA CAGAACCGGC ATTTCCCGCA TTGTGGTTCA GCCATCTGCT      180AAGCGTATCC ATCATGATGC CTTGTATGAA CATGTTGGGT GTGAAATTTC TGATGATTTG      240TCTGATTGTG GGCTTATACT TGGAATCAAA CAACCTGAGC TAGAAATGAT TCTTCCAGAG      300AGAGCATACG CTTTCTTTTC ACATACTCAT AAGGCACAGA AAGAGAACAT GCCTTTGTTG      360GATAAAATTC TTTCTGAGAG AGTGACTTTG TGTGATTATG AGCTCATTGT TGGGGATCAT      420GGGAAACGAT TATTGGCGTT TGGTAAATAT GCAGGCAGAG CTGGTCTTGT TGACTTCTTA      480CACGGACTTG GACAGCGATA TCTAAGTCTA GGATACTCAA CACCTTTCCT CTCGCTCGGT      540GCATCGTATA TGTATTCCTC ATTGGCTGCT GCAAAAGCCG CTGTAATTTC TGTTGGTGAA      600GAAATTGCAA GCCAGGGACT GCCATTAGGA ATCTGCCCTC TTGTATTTGT CTTCACCGGA      660ACAGGAAATG TTTCTCTGGG GGCGCAAGAA ATTTTCAAGC TTCTTCCTCA CACTTTTGTT      720GAACCAAGCA AACTTCCTGA ACTATTTGTA AAAGACAAAG GAATTAGTCA AAATGGGATT      780TCAACAAAGC GAGTCTATCA AGTATATGGT TGTATTATTA CCAGCCAAGA CATGGTTGAA      840CACAAAGATC CATCAAAGTC ATTCGACAAA GCCGACTATT ATGCACACCC GGAACATTAC      900AATCCAGTTT TCCACGAAAA GATATCGCCA TATACGTCTG TTCTTGTAAA CTGTATGTAC      960TGGGAGAAGA GGTTTCCCTG TCTTCTGAGC ACAAAACAGC TTCAAGATTT AACAAAAAAA     1020GGACTCCCAC TAGTAGGCAT ATGTGATATA ACTTGTGACA TCGGTGGCTC CATTGAATTT     1080GTTAACCGAG CTACTTTAAT CGATTCCCCT TTCTTCAGGT TTAATCCCTC GAACAATTCA     1140TACTACGATG ACATGGATGG GGATGGCGTA CTATGCATGG CTGTTGACAT TTTACCCACA     1200GAATTTGCAA AAGAGGCATC CCAGCATTTT GGAGATATTC TTTCCGGATT TGTCGGTAGT     1260TTGGCTTCAA TGACTGAAAT TTCAGATCTA CCAGCACATC TGAAGAGGGC TTGCATAAGC     1320TATAGGGGAG AATTGACATC TTTGTATGAG TATATTCCAC GTATGAGGAA GTCAAATCCA     1380GAAGAGGCAC AAGATAATAT TATCGCCAAC GGGGTTTCCA GCCAGAGAAC ATTCAACATA     1440TTGGTATCTC TGAGCGGACA CCTATTTGAT AAGTTTCTGA TAAACGAAGC TCTTGATATG     1500ATCGAAGCGG CTGGTGGCTC ATTTCATTTG GCTAAATGTG AACTGGGGCA GAGCGCTGAT     1560GCTGAATCGT ACTCAGAACT TGAAGTTGGT GCGGATGATA AGAGAGTATT GGATCAAATC     1620ATTGATTCAT TAACTCGGTT AGCTAATCCA AATGAAGATT ATATATCCCC ACATAGAGAA     1680GCAAATAAGA TCTCACTGAA GATTGGTAAA GTCCAGCAAG AAAATGAGAT AAAAGAGAAG     1740CCTGAAATGA CGAAAAAATC AGGTGTTTTG ATTCTTGGTG CTGGACGTGT GTGTCGCCCA     1800GCTGCTGATT TCCTAGCTTC AGTTAGAACC ATTTCGTCAC AGCAATGGTA CAAAACATAT     1860TTCGGAGCAG ACTCTGAAGA GAAAACAGAT GTTCATGTGA TTGTCGCGTC TCTGTATCTT     1920AAGGATGCCA AAGAGACGGT TGAAGGTATT TCAGATGTAG AAGCAGTTCG GCTAGATGTA     1980TCTGATAGTG AAAGTCTCCT TAAGTATGTT TCTCAGGTTG ATGTTGTCCT AAGTTTATTA     2040CCTGCAAGTT GTCATGCTGT TGTAGCAAAG ACATGCATTG AGCTGAAGAA GCATCTCGTC     2100ACTGCTAGCT ATGTTGATGA TGAAACGTCC ATGTTACATG AGAAGGCTAA GAGTGCTGGG     2160ATAACGATTC TAGGCGAAAT GGGACTGGAC CCTGGAATCG ATCACATGAT GGCGATGAAA     2220ATGATCAACG ATGCTCATAT CAAAAAAGGG AAAGTGAAGT CTTTTACCTC TTATTGTGGA     2280GGGCTTCCCT CTCCTGCTGC AGCAAATAAT CCATTAGCAT ATAAATTTAG CTGGAACCCT     2340GCTGGAGCAA TTCGAGCTGG TCAAAACCCC GCCAAATACA AAAGCAACGG CGACATAATA     2400CATGTTGATG GGAAGAATCT CTATGATTCC GCGGCAAGAT TCCGAGTACC TAATCTTCCA     2460GCTTTTGCAT TGGAGTGTTT TCCAAATCGT GACTCCTTGG TTTACGGGGA ACATTATGGC     2520ATCGAGAGCG AAGCAACAAC GATATTTCGT GGAACACTCA GATATGAAGG GTTTAGTATG     2580ATAATGGCAA CACTTTCGAA ACTTGGATTC TTTGACAGTG AAGCAAATCA AGTACTCTCC     2640ACTGGAAAGA GGATTACGTT TGGTGCTCTT TTAAGTAACA TTCTAAATAA GGATGCAGAC     2700AATGAATCAG AGCCCCTAGC GGGAGAAGAA GAGATAAGCA AGAGAATTAT CAAGCTTGGA     2760CATTCCAAGG AGACTGCAGC CAAAGCTGCC AAAACAATTG TATTCTTGGG GTTCAACGAA     2820GAGAGGGAGG TTCCATCACT GTGTAAAAGC GTATTTGATG CAACTTGTTA CCTAATGGAA     2880GAGAAACTAG CTTATTCCGG AAATGAACAG GACATGGTGC TTTTGCATCA CGAAGTAGAA     2940GTGGAATTCC TTGAAAGCAA ACGTATAGAG AAGCACACTG CGACTCTTTT GGAATTCGGG     3000GACATCAAGA ATGGACAAAC AACAACCGCT ATGGCCAAGA CTGTTGGGAT CCCTGCAGCC     3060ATTGGAGCTC TGGTGTTAAT TGAAGACAAG ATCAAGACAA GAGGAGTCTT AAGGCCTCTC     3120GAAGCAGAGG TGTATTTGCC AGCTTTGGAT ATATTGCAAG CATATGGTAT AAAGCTGATG     3180GAGAAGGCAG AATGA                                                      31952)SEQ ID NO:112信息:
(i)序列特征:
   (A)长度:1064氨基酸
   (B)类型:氨基酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:112:Met Asn Ser Asn Gly His Glu Glu Glu Lys Lys Leu Gly Asn Gly Val1               5                   10                  15Val Gly Ile Leu Ser Glu Thr Val Asn Lys Trp Glu Arg Arg Thr Pro
        20                  25                  30Leu Thr Pro Ser His Cys Ala Arg Leu Leu His Gly Gly Lys Asp Arg
    35                  40                  45Thr Gly Ile Ser Arg Ile Val Val Gln Pro Ser Ala Lys Arg Ile His
50                  55                  60His Asp Ala Leu Tyr Glu His Val Gly Cys Glu Ile Ser Asp Asp Leu65                  70                  75                  80Ser Asp Cys Gly Leu Ile Leu Gly Ile Lys Gln Pro Glu Leu Glu Met
            85                  90                  95Ile Leu Pro Glu Arg Ala Tyr Ala Phe Phe Ser His Thr His Lys Ala
        100                 105                 110Gln Lys Glu Asn Met Pro Leu Leu Asp Lys Ile Leu Ser Glu Arg Val
    115                 120                 125Thr Leu Cys Asp Tyr Glu Leu Ile Val Gly Asp His Gly Lys Arg Leu
130                 135                 140Leu Ala Phe Gly Lys Tyr Ala Gly Arg Ala Gly Leu Val Asp Phe Leu145                 150                 155                 160His Gly Leu Gly Gln Arg Tyr Leu Ser Leu Gly Tyr Ser Thr Pro Phe
            165                 170                 175Leu Ser Leu Gly Ala Ser Tyr Met Tyr Ser Ser Leu Ala Ala Ala Lys
        180                 185                     190Ala Ala Val Ile Ser Val Gly Glu Glu Ile Ala Ser Gln Gly Leu Pro
    195                 200                     205Leu Gly Ile Cys Pro Leu Val Phe Val Phe Thr Gly Thr Gly Asn Val
210                 215                     220Ser Leu Gly Ala Gln Glu Ile Phe Lys Leu Leu Pro His Thr Phe Val225                 230                 235                 240Glu Pro Ser Lys Leu Pro Glu Leu Phe Val Lys Asp Lys Gly Ile Ser
            245                 250                 255Gln Asn Gly Ile Ser Thr Lys Arg Val Tyr Gln Val Tyr Gly Cys Ile
        260                 265                 270Ile Thr Ser Gln Asp Met Val Glu His Lys Asp Pro Ser Lys Ser Phe
    275                 280                 285Asp Lys Ala Asp Tyr Tyr Ala His Pro Glu His Tyr Asn Pro Val Phe
290                 295                 300His Glu Lys Ile Ser Pro Tyr Thr Ser Val Leu Val Asn Cys Met Tyr305                 310                 315                 320Trp Glu Lys Arg Phe Pro Cys Leu Leu Ser Thr Lys Gln Leu Gln Asp
            325                 330                 335Leu Thr Lys Lys Gly Leu Pro Leu Val Gly Ile Cys Asp Ile Thr Cys
        340                 345                 350Asp Ile Gly Gly Ser Ile Glu Phe Val Asn Arg Ala Thr Leu Ile Asp
    355                 360                 365Ser Pro Phe Phe Arg Phe Asn Pro Ser Asn Asn Ser Tyr Tyr Asp Asp
370                 375                 380Met Asp Gly Asp Gly Val Leu Cys Met Ala Val Asp Ile Leu Pro Thr385                 390                 395                 400Glu Phe Ala Lys Glu Ala Ser Gln His Phe Gly Asp Ile Leu Ser Gly
            405                 410                 415Phe Val Gly Ser Leu Ala Ser Met Thr Glu Ile Ser Asp Leu Pro Ala
        420                 425                 430His Leu Lys Arg Ala Cys Ile Ser Tyr Arg Gly Glu Leu Thr Ser Leu
    435                 440                 445Tyr Glu Tyr Ile Pro Arg Met Arg Lys Ser Asn Pro Glu Glu Ala Gln
450                 455                 460Asp Asn Ile Ile Ala Asn Gly Val Ser Ser Gln Arg Thr Phe Asn Ile465                 470                 475                 480Leu Val Ser Leu Ser Gly His Leu Phe Asp Lys Phe Leu Ile Asn Glu
            485                 490                 495Ala Leu Asp Met Ile Glu Ala Ala Gly Gly Ser Phe His Leu Ala Lys
        500                 505                 510Cys Glu Leu Gly Gln Ser Ala Asp Ala Glu Ser Tyr Ser Glu Leu Glu
    515                 520                 525Val Gly Ala Asp Asp Lys Arg Val Leu Asp Gln Ile Ile Asp Ser Leu
530                 535                 540Thr Arg Leu Ala Asn Pro Asn Glu Asp Tyr Ile Ser Pro His Arg Glu545                 550                 555                 560Ala Asn Lys Ile Ser Leu Lys Ile Gly Lys Val Gln Gln Glu Asn Glu
            565                 570                 575Ile Lys Glu Lys Pro Glu Met Thr Lys Lys Ser Gly Val Leu Ile Leu
        580                 585                 590Gly Ala Gly Arg Val Cys Arg Pro Ala Ala Asp Phe Leu Ala Ser Val
    595                 600                 605Arg Thr Ile Ser Ser Gln Gln Trp Tyr Lys Thr Tyr Phe Gly Ala Asp
610                 615                 620Ser Glu Glu Lys Thr Asp Val His Val Ile Val Ala Ser Leu Tyr Leu625                 630                 635                 640Lys Asp Ala Lys Glu Thr Val Glu Gly Ile Ser Asp Val Glu Ala Val
            645                 650                 655Arg Leu Asp Val Ser Asp Ser Glu Ser Leu Leu Lys Tyr Val Ser Gln
        660                 665                 670Val Asp Val Val Leu Ser Leu Leu Pro Ala Ser Cys His Ala Val Val
    675                 680                 685Ala Lys Thr Cys Ile Glu Leu Lys Lys His Leu Val Thr Ala Ser Tyr
690                 695                 700Val Asp Asp Glu Thr Ser Met Leu His Glu Lys Ala Lys Ser Ala Gly705                 710                 715                 720Ile Thr Ile Leu Gly Glu Met Gly Leu Asp Pro Gly Ile Asp His Met
            725                 730                 735Met Ala Met Lys Met Ile Asn Asp Ala His Ile Lys Lys Gly Lys Val
        740                 745                 750Lys Ser Phe Thr Ser Tyr Cys Gly Gly Leu Pro Ser Pro Ala Ala Ala
    755                 760                 765Asn Asn Pro Leu Ala Tyr Lys Phe Ser Trp Asn Pro Ala Gly Ala Ile
770                 775                 780Arg Ala Gly Gln Asn Pro Ala Lys Tyr Lys Ser Asn Gly Asp Ile Ile785                 790                 795                 800His Val Asp Gly Lys Asn Leu Tyr Asp Ser Ala Ala Arg Phe Arg Val
            805                 810                 815Pro Asn Leu Pro Ala Phe Ala Leu Glu Cys Phe Pro Asn Arg Asp Ser
        820                 825                 830Leu Val Tyr Gly Glu His Tyr Gly Ile Glu Ser Glu Ala Thr Thr Ile
    835                 840                 845Phe Arg Gly Thr Leu Arg Tyr Glu Gly Phe Ser Met Ile Met Ala Thr
850                 855                 860Leu Ser Lys Leu Gly Phe Phe Asp Ser Glu Ala Asn Gln Val Leu Ser865                 870                 875                 880Thr Gly Lys Arg Ile Thr Phe Gly Ala Leu Leu Ser Asn Ile Leu Asn
            885                 890                 895Lys Asp Ala Asp Asn Glu Ser Glu Pro Leu Ala Gly Glu Glu Glu Ile
        900                 905                 910Ser Lys Arg Ile Ile Lys Leu Gly His Ser Lys Glu Thr Ala Ala Lys
    915                 920                 925Ala Ala Lys Thr Ile Val Phe Leu Gly Phe Asn Glu Glu Arg Glu Val
930                 935                 940Pro Ser Leu Cys Lys Ser Val Phe Asp Ala Thr Cys Tyr Leu Met Glu945                 950                 955                 960Glu Lys Leu Ala Tyr Ser Gly Asn Glu Gln Asp Met Val Leu Leu His
            965                 970                 975His Glu Val Glu Val Glu Phe Leu Glu Ser Lys Arg Ile Glu Lys His
        980                 985                 990Thr Ala Thr Leu Leu Glu Phe Gly Asp Ile Lys Asn Gly Gln Thr Thr
    995                 1000                1005Thr Ala Met Ala Lys Thr Val Gly Ile Pro Ala Ala Ile Gly Ala Leu
1010                1015                1020Val Leu Ile Glu Asp Lys Ile Lys Thr Arg Gly Val Leu Arg Pro Leu1025                1030                1035                1040Glu Ala Glu Val Tyr Leu Pro Ala Leu Asp Ile Leu Gln Ala Tyr Gly
            1045                1050                1055Ile Lys Leu Met Glu Lys Ala Glu
        10602)SEQ ID NO:113信息:
(i)序列特征:
   (A)长度:23碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:113:TTYTCICAYA CICAYAARGC ICA                                              232)SEQ ID NO:114信息:
(i)序列特征:
   (A)长度:20碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:114:TTYTCCCART ACATRCARTT                                                  202)SEQ ID NO:115信息:
(i)序列特征:
   (A)长度:619碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:115:GAAAACATGC CTTTGCTGGA TAAGATTCTA GCTGAGAGGG CATCGTTATA TGACTATGAA     60TTAATTGTTG GGGACACTGG GAAAAGGTTA CTTGCATTTG GAAAATTCGC TGGTAGGGCT    120GGAATGATCG ACTTTTTGCG CGGATTAGGA CAGCGGTTTT TAAGTCTTGG ATATTCAACA    180CCTTTCTTGT CACTTGGATC ATCTTACATG TACCCTTCCC TGGCTGCTGC TAAGGCTGCT    240GTGATTTCTG TTGGTGAAAA ATTGCGACGC AGGGATTGCC ATTGGGGATT TGTCCCCTGG    300TTTGTTTATT TACTGGTTCA GGAAATGTTT GTTCTGGTGC ACAGGAGATA TTTAAGCTTC    360TTCCTCATAC CTTTGTTGAT CCATCTAAAC TACGCGACCT ACATAGAACG GACCCAGATC    420AACCAAGGCA TGCTTCAAAA AGAGTTTTCC AAGTTTATGG TTGTGTTGTG ACTGCCCAAG    480ACATGGTTGA ACCCAAAGAT CACGTGATAG TGTTTGACAA AGCAGACTAC TATGCACATC    540CTGAGCATTA CAATCCCACT TTCCATGAAA AAATAGCACC ATATGCATCT GTTATTGTCA    600ATTGCATGTA TTGGGAAAA                                                 6192)SEQ ID NO:116信息:
(i)序列特征:
   (A)长度:620碱基对
   (B)类型:核酸
   (C)线型:双链
   (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:116:GAGAATATGC CACTGTTAGA CAAGATCCTT GAAGAAAGGG TGTCCTTGTT TGATTATGAG        60CTAATTGTTG GAGATGATGG GAAAAGATCA CTAGCATTTG GGAAATTTGC TGGTAGAGCT       120GGACTGATAG ATTTCTTACA TGGTCTCGGA CAGCGATATT TGAGCCTTGG ATACTCCACT       180CCATTTCTCT CTCTGGGACA TCTCATATGT TCCTTCGCTC GCTGCAGCCA AGGCTGCAGT       240CATTGTCGTT GCAGAAGAGA TAGCAACATT TGGACTTCCA TCCGGAATTT GTCCGATAGT       300GTTTGTGTTC ACTGGAGTTG GAAACGTCTC TCAGGGTGCG CAGGAGATAT TCAAGTTATT       360GCCCCATACC TTTGTTGATG CTGAGAAGCT TCCCGAAATT TTTCAGGCCA GGAATCTGTC       420TAAGCAATCT CAGTCGACCA AGAGAGTATT TCAACTTTAT GGTTGTGTTG TGACCTCTAG       480AGACATAGTT TCTCACAAGG ATCCCACCAG ACAATTTGAC AAAGGTGACT ATTATGCTCA       540TCCAGAACAC TACACCCCTG TTTTTCATGA AAGAATTGCT CCATATGCAT CTGTCATCGT       600AAACTGCATG TATTGGGAAA                                                   6202)SEQ ID NO:117信息:
(i)序列特征:
   (A)长度:206氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:线形
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:117:Glu Asn Met Pro Leu Leu Asp Lys Ile Leu Ala Glu Arg Ala Ser Leu1               5                   10                  15Tyr Asp Tyr Glu Leu Ile Val Gly Asp Thr Gly Lys Arg Leu Leu Ala
        20                  25                  30Phe Gly Lys Phe Ala Gly Arg Ala Gly Met Ile Asp Phe Leu Arg Gly
    35                  40                  45Leu Gly Gln Arg Phe Leu Ser Leu Gly Tyr Ser Thr Pro Phe Leu Ser
50                  55                  60Leu Gly Ser Ser Tyr Met Tyr Pro Sar Leu Ala Ala Ala Lys Ala Ala65                  70                  75                  80Val Ile Ser Val Gly Glu Xaa Ile Ala Thr Gln Gly Leu Pro Leu Gly
            85                  90                  95Ile Cys Pro Leu Val Cys Leu Phe Thr Gly Ser Gly Asn Val Cys Ser
        100                 105                 110Gly Ala Gln Glu Ile Phe Lys Leu Leu Pro His Thr Phe Val Asp Pro
    115                 120                 125Ser Lys Leu Arg Asp Leu His Arg Thr Asp Pro Asp Gln Pro Arg His
130                 135                 140Ala Ser Lys Arg Val Phe Gln Val Tyr Gly Cys Val Val Thr Ala Gln145                 150                 155                 160Asp Met Val Glu Pro Lys Asp His Val Ile Val Phe Asp Lys Ala Asp
            165                 170                 175Tyr Tyr Ala His Pro Glu His Tyr Asn Pro Thr Phe His Glu Lys Ile
        180                 185                 190Ala Pro Tyr Ala Ser Val Ile Val Asn Cys Met Tyr Trp Glu
    195                 200                 2052)SEQ ID NO:118信息:
(i)序列特征:
   (A)长度:207氨基酸
   (B)类型:氨基酸
   (C)线型:未知
   (D)拓扑学:线形
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:118:Glu Asn Met Pro Leu Leu Asp Lys Ile Leu Glu Glu Arg Val Ser Leu1               5                   10                  15Phe Asp Tyr Glu Leu Ile Val Gly Asp Asp Gly Lys Arg Ser Leu Ala
        20                  25                  30Phe Gly Lys Phe Ala Gly Arg Ala Gly Leu Ile Asp Phe Leu His Gly
    35                  40                  45Leu Gly Gln Arg Tyr Leu Ser Leu Gly Tyr Ser Thr Pro Phe Leu Ser
50                  55                  60Leu Gly Xaa Ser His Met Xaa Pro Ser Leu Ala Ala Ala Lys Ala Ala65                  70                  75                  80Val Ile Val Val Ala Glu Glu Ile Ala Thr Phe Gly Leu Pro Ser Gly
            85                  90                  95Ile Cys Pro Ile Val Phe Val Phe Thr Gly Val Gly Asn Val Ser Gln
        100                 105                 110Gly Ala Gln Glu Ile Phe Lys Leu Leu Pro His Thr Phe Val Asp Ala
    115                 120                 125Glu Lys Leu Pro Glu Ile Phe Gln Ala Arg Asn Leu Ser Lys Gln Ser
130                 135                 140Gln Ser Thr Lys Arg Val Phe Gln Leu Tyr Gly Cys Val Val Thr Ser145                 150                 155                 160Arg Asp Ile Val Ser His Lys Asp Pro Thr Arg Gln Phe Asp Lys Gly
            165                 170                 175Asp Tyr Tyr Ala His Pro Glu His Tyr Thr Pro Val Phe His Glu Arg
        180                 185                 190Ile Ala Pro Tyr Ala Ser Val Ile Val Asn Cys Met Tyr Trp Glu
    195                 200                 2052)SEQ ID NO:119信息:
(i)序列特征:
   (A)长度:2582碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:对应于mRNA的cDNA
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
   (A)有机体:Glycine max
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:3..2357
(xi)序列描述:SEQ ID NO:119:TTGAACCCAA AGATCACGTG ATAGTGTTTG ACAAAGCAGA CTACTATTCA CACCCTGAGC      60ATTACAATCC CACTTTCCAT GAAAAAATAG GACCATATGC ATCTGTTATT GTCAATTGCA      120TGTATTGGGA GAAAAGATTT CCTCAATTGC CGAGCTATAA GCAGATGCAA GACTTAATGG      180GCCGGGGGAG CCCCCTTGTT GGAATAGCTG ACATAACGTG TGATATAGGG GGTTCAATTG      240AGTTTGTTAA CCGCGGTACT TCAATTGATT CACCCTTCTT CAGATATGAT CCCTTAACAA      300ATTCCTACCA TGATGATATG GAGGGGAATG GAGTGATATG CTTAGCTGTT GACATTCTTC      360CAACAGAATT TGCAAAGGAG GCTTCCCAAC ATTTTGGAAA CATACTTTCC CAATTTGTTG      420TAAATTTGGC TTCTGCTACA GACATTACAA AGTTGCCTGC TCACTTAAGG AGAGCTTGCA     480TAGCCCATAA AGGAGTGCTA ACCTCCTTAT ATGATTATAT CCCACGCATG CGGAGTTCTG     540ATTCAGAGGA AGTATCAGAA AACGCAGAAA ATTCTCTATC CAACAAAAGG AAGTACAATA     600TATCGGTGTC TCTGAGTGGT CACTTATTTG ATCAGTTTCT GATAAATGAG GCCTTAGATA     660TTATTGAAGC TGCAGGAGGC TCCTTCCACT TAGTCAACTG CCATGTGGGT CAGAGCATTG     720AAGCCGTATC ATTCTCTGAA CTTGAAGTTG GTGCAGATAA CAGGGCTGTT CTGGATCAAA     780TCATTGATTC TTTAACTGCT ATTGCTAGTC CAACTGAACA TGATAGATTT TCAAATCAAG     840ATTCAAGTAA AATTTCACTT AAGCTTGGTA AAGTTGAAGA GAATGGCATA GAGAAGGAAT     900CTGACCCCAG AAAGAAGGCT GCGGTTTTAA TTCTTGGAGC TGGTCGGGTC TGTCAACCAG     960CTGCTGAAAT GTTATCATCA TTTGGAAGGC CATCATCGAG CCAATGGTAT AAAACATTGT    1020TGGAAGATGA TTTTGAATGT CAAACTGATG TAGAAGTCAT TGTGGGATCT CTGTACCTGA    1080AGGATGCAGA GCAGACTGTT GAGGGCATTC CAAATGTAAC CGGAATTCAG CTTGATGTGA    1140TGGATCGTGC CAATTTGTGT AAGTACATTT CACAGGTTGA CGTTGTTATA AGTTTGCTGC    1200CCCCAAGTTG TCATATTATT GTAGCAAATG CTTGCATTGA GCTGAAAAAA CATCTTGTCA    1260CTGCTAGCTA TGTTGATAGC TCCATGTCAA TGCTAAATGA TAAGGCTAAA GATGCTGGCA    1320TAACAATTCT TGGAGAGATG GGCTTGGACC CAGGAATTGG TCATATGATG GCAATGAAGA    1380TGATCAACCA AGCACATGTG AGGAAGGGGA AAATAAAGTC TTTCACTTCT TATTGTGGTG    1440GACTTCCATC TCCTGAAGCT GCTAACAATC CATTAGCATA TAAATTCAGT TGGAATCCTG    1500CAGGAGCCAT CCGAGCTGGG CGCAATCCTG CCACCTACAA ATGGGGTGGT GAAACTGTAC    1560ATATTGATGG GGACGATCTT TATGATTCGG CTACAAGACT AAGGCTACCG GACCTTCCTG    1620CTTTTGCTTT GGAATGTCTC CCAAATCGCA ATTCATTACT TTATGGGGAT TTGTATGGAA    1680TAACTGAAGC ATCAACCATT TTCCGTGGAA CCCTCCGCTA TGAAGGATTT AGTGAGATCA    1740TGGGGACACT GTCTAGGATT AGCTTATTTA ACAATGAAGC CCATTCGTTG CTAATGAATG    1800GACAAAGACC AACTTTCAAA AAATTCTTAT TTGAACTTCT CAAAGTTGTT GGTGATAATC    1860CAGATGAACT ATTGATAGGA GAGAATGACA TCATGGAGCA AATATTAATA CAAGGGCACT    1920GCAAAGATCA AAGAACGGCA ATGGAGACAG CAAAAACAAT CATTTTCTTG GGACTTCTTG    1980ACCAAACTGA AATCCCTGCT TCCTGCAAAA GTGCTTTTGA TGTTGCTTGT TTCCGCATGG    2040AGGAGAGGTT ATCATACACC AGCACAGAAA AGGATATGGT GCTTTTGCAT CATGAAGTGG    2100AAATAGAATA CCCAGATAGC CAAATTACAG AGAAGCATAG AGCTACTTTA CTTGAATTTG    2160GGAAGACTCT TGATGAAAAA ACCACAACTG CCATGGCCCT TACTGTTGGT ATTCCAGCTG    2220CTGTTGGAGC TTTGCTTTTA TTGACAAACA AAATTCAGAC AAGAGGAGTC TTAAGGCCTA    2280TCGAACCTGA AGTATACAAT CCAGCACTGG ATATTATAGA AGCTTATGGG ATCAAGTTGA    2340TAGAGAAGAC CGAGTAATTT GCATYTATGA ATTGATGTAT AGGTGTACAT TAATGTACAC    2400CATGCAATGT TTGATTTGAA TAAGATAAAA TATAATAATT ACTGCAGTCA TGGAATTGCA    2460ACTGCCATTC TATGCAACTG TCAGAAATGG ACCACACGGT ACCAGCATAG TTAAAACACT    2520TAGGCAGATA CCAATTTCAA TTGCAGCAGT ACAATCCAAC CAGTTATGAA GTATGGTTCT    2580AG                                                                   25822)SEQ ID NO:120信息:
(i)序列特征:
   (A)长度:3265碱基对
   (B)类型:核酸
   (C)线型:单链
   (D)拓扑学:线形
(ii)分子类型:对应于mRNA的cDNA
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
   (A)有机体:Zea mays
(ix)特征:
   (A)名称/关键词:CDS
   (B)位置:3..3071
(xi)序列描述:SEQ ID NO:120:ATTGTGCCCG CCTTCTGCTA GGAGGAGGCA AGAACGGACC TCGAGTAAAC CGGATTATTG       60TGCAGCCAAG CACAAGGAGG ATCCATCATG ACGCTCAGTA TGAGGATGCA GGATGCGAGA      120TTTCAGAAGA CCTGTCAGAA TGCGGCCTTA TCATAGGCAT CAAACAACCC AAGCTGCAGA      180TGATTCTTTC AGATAGAGCG TACGCTTTCT TTTCACACAC ACACAAAGCC CAAAAAGAGA      240ATATGCCACT GTTAGACAAG ATCCTTGAAG AAAGGGTGTC CTTGTTTGAT TATGAGCTAA      300TTGTTGGAGA TGATGGGAAA AGATCACTAG CATTTGGGAA ATTTGCTGGT AGAGCTGGAC      360TGATAGATTT CTTACATGGT CTCGGACAGC GATATTTGAG CCTTGGATAC TCGACTCCAT      420TTCTCTCTCT GGGACAATCT CATATGTATC CTTCGCTCGC TGCAGCCAAG GCTGCAGTCA      480TTGTCGTTGC AGAAGAGATA GCAACATTTG GACTTCCATC CGGAATTTGT CCGATAGTGT      540TTGTGTTCAC TGGAGTTGGA AACGTCTCTC AGGGTGCGCA GGAGATATTC AAGTTATTGC      600CCCATACCTT TGTTGATGCT GAGAAGCTTC CCGAAATTTT TCAGGCCAGG AATCTGTCTA      660AGCAATCTCA GTCGACCAAG AGAGTATTTC AACTTTATGG TTGTGTTGTG ACCTCTAGAG      720ACATAGTTTC TCACAAGGAT CCCACCAGAC AATTTGACAA AGGTGACTAT TATGCTCATC      780CAGAACACTA CACCCCTGTT TTTCATGAAA GAATTGCTCC ATATGCATCT GTCATCGTAA      840ACTGTATGTA TTGGGAGAAG AGGTTTCCAC CATTACTAAA TATGGATCAG TTACAGCAAT      900TGATGGAGAC TGGTTGTCCT TTAGTCGGCG TTTGTGACAT AACTTGTGAT ATTGGAGGTT      960CCATTGAATT TATCAACAAG AGTACATCAA TAGAGAGGCC TTTCTTTCGG TATGATCCTT    1020CTAAGAATTC ATACCATGAT GATATGGAAG GTGCCGGAGT GGTCTGCTTG GCTGTTGACA    1080TTCTCCCTAC AGAATTCTCT AAAGAGGCCT CCCAACATTT TGGAAACATA CTATCTAGAC    1140TTGTTGCTAG TTTGGCCTCA GTGAAGCAAC CGGCAGAACT TCCTTCCTAC TTGAGAAGAG    1200CTTGCATTGC ACATGCTGGC AGATTAACTC CTTTGTATGA ATATATCCCT AGGATGAGAA    1260ATACTATGAT AGATTTGGCA CCCGCAAAAA CAAATCCATT GCCTGACAAG AAGTATAGCA    1320CCCTGGTATC TCTCAGTGGG CACCTATTTG ATAAGTTCCT TATAAATGAA GCTTTGGACA    1380TCATTGAGAC AGCTGGAGGT TCATTTCACT TGGTTAGATG TGAAGTTGGA CAAAGCACGG    1440ATGATATGTC ATACTCAGAG CTTGAAGTAG GAGCAGATGA TACTGCCACA TTGGATAAAA    1500TTATTGATTC CTTGACTTCT TTAGCTAATG AACATGGTGG AGATCACGAT GCCGGGCAAG    1560AAATTGAATT AGCTCTGAAG ATAGGAAAAG TCAATGAGTA TGAAACTGAC GTCACAATTG    1620ATAAAGGAGG GCCAAAGATT TTAATTCTTG GAGCTGGAAG AGTCTGTCGG CCAGCTGCTG    1680AGTTTCTGGC ATCTTACCCA GACATATGTA CCTATGGTGT TGATGACCAT GATGCAGATC    1740AAATTCATGT TATCGTGGCA TCTTTGTATC AAAAAGATGC AGAAGAGACA GTTGATGGTA    1800TTGAAAATAC AACTGCTACC CAGCTTGATG TTGCTGATAT TGGAAGCCTT TCAGATCTTG    1860TTTCTCAGGT TGAGGTTGTA ATTAGCTTGC TGCCTGCTAG TTTTCATGCT GCCATTGCAG    1920GAGTATGCAT AGAGTTGAAG AAGCACATGG TAACGGCAAG CTATGTTGAT GAATCCATGT    1980CAAACTTGAG CCAAGCTGCC AAAGATGCAG GTGTAACTAT ACTTTGTGAA ATGGGCCTAG    2040ATCCTGGCAT AGATCACTTG ATGTCAATGA AGATGATTGA TGAAGCTCAT GCACGAAAGG    2100GAAAAATAAA GGCATTTACA TCTTACTGTG GTGGATTGCC ATCTCCAGCT GCAGCAAACA    2160ATCCGCTTGC CTATAAATTC AGTTGGAACC CAGCTGGTGC ACTCCGGTCA GGGAAAAATC    2220CTGCAGTCTA CAAATTTCTT GGTGAGACGA TCCATGTAGA TGGTCATAAC TTGTATGAAT    2280CAGCAAAGAG GCTCAGACTA CGAGAGCTTC CAGCTTTTGC TCTGGAACAC TTGCCAAATC    2340GGAATTCCTT GATATATGGT GACCTTTATG GTATCTCCAA AGAAGCATCC ACCATATATA    2400GGGCTACTYT TCGTTACGAA GGTTTTAGTG AGATTATGGT AACCCTTTCC AAAACTGGGT    2460TCTTTGATGC TGCAAATCAT CCACTGCTGC AAGATACTAG TCGTCCAACA TATAAGGGTT    2520TCCTTGATGA ACTACTGAAT AATATCTCCA CAATTAACAC GGACTTAGAT ATTGAAGCTT    2580CTGGTGGATA CGATGATGAC CTGATTGCCA GACTGTTGAA GCTCGGGTGT TGCAAAAATA    2640AGGAAATAGC TGTTAAGACA GTCAAAACCA TCAAGTTCTT GGGACTACAT GAAGAGACTC    2700AAATACCTAA GGGTTGTTCG AGCCCATTTG ATGTGATTTG CCAGCGAATG GAACAGAGGA    2760TGGCCTATGG CCACAATGAG CAAGACATGG TACTGCTCCA CCACGAAGTC GAGGTGGAAT    2820ACCCGGACGG GCAACCCGCC GAAAAGCACC AAGCGACGCT ACTGGAGTTC GGGAAGGTTG    2880AAAATGGCAG GTCCACCACT GCCATGGCGC TGACCGTCGG CATTCCAGCA GCAATAGGGG    2940CCCTGCTATT GCTAAAGAAT AAGGTCCAGA CGAAAGGAGT GATCAGGCCT CTGCAACCGG    3000AAATCTACGT TCCAGCATTG GAGATCTTGG AGTCGTCGGG CATCAAGCTG GTTGAGAAAG    3060TGGAGACTTG AAAGTTCCCT GATACACAGA TAAAGATAGT ATGATATAGC AGGGCACATG    3120TATCTTTTGT ATTAACTCCG TTCTGGAATA TATATTTGTG AACTAAAATG TGACAAATAA    3180AAAGAACGGG TGGAGTATAT TGTAAGAGAC GGCAAAGAAA CCTCTGTATA TATGACCTGT    3240CGATATCAAA TAATGCCGAT CAGTT                                          32652)SEQ ID NO:121信息:
(i)序列特征:
  (A)长度:784氨基酸
  (B)类型:氨基酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:蛋白质
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Glycine max
(xi)序列描述:SEQ ID NO:121:Glu Pro Lys Asp His Val Ile Val Phe Asp Lys Ala Asp Tyr Tyr Ser1               5                   10                  15His Pro Glu His Tyr Asn Pro Thr Phe His Glu Lys Ile Ala Pro Tyr
        20                  25                  30Ala Ser Val Ile Val Asn Cys Met Tyr Trp Glu Lys Arg Phe Pro Gln
    35                  40                  45Leu Pro Ser Tyr Lys Gln Met Gln Asp Leu Met Gly Arg Gly Ser Pro
50                  55                  60Leu Val Gly Ile Ala Asp Ile Thr Cys Asp Ile Gly Gly Ser Ile Glu65                  70                  75                  80Phe Val Asn Arg Gly Thr Ser Ile Asp Ser Pro Phe Phe Arg Tyr Asp
            85                  90                  95Pro Leu Thr Asn Ser Tyr His Asp Asp Met Glu Gly Asn Gly Val Ile
        100                 105                 110Cys Leu Ala Val Asp Ile Leu Pro Thr Glu Phe Ala Lys Glu Ala Ser
    115                 120                 125Gln His Phe Gly Asn Ile Leu Ser Gln Phe Val Val Asn Leu Ala Ser
130                 135                 140Ala Thr Asp Ile Thr Lys Leu Pro Ala His Leu Arg Arg Ala Cys Ile145                 150                 155                 160Ala His Lys Gly Val Leu Thr Ser Leu Tyr Asp Tyr Ile Pro Arg Met
            165                 170                 175Arg Ser Ser Asp Ser Glu Glu Val Ser Glu Asn Ala Glu Asn Ser Leu
        180                 185                 190Ser Asn Lys Arg Lys Tyr Asn Ile Ser Val Ser Leu Ser Gly His Leu
    195                 200                 205Phe Asp Gln Phe Leu Ile Asn Glu Ala Leu Asp Ile Ile Glu Ala Ala
210                 215                 220Gly Gly Ser Phe His Leu Val Asn Cys His Val Gly Gln Ser Ile Glu225                 230                  235                240Ala Val Ser Phe Ser Glu Leu Glu Val Gly Ala Asp Asn Arg Ala Val
            245                 250                 255Leu Asp Gln Ile Ile Asp Ser Leu Thr Ala Ile Ala Ser Pro Thr Glu
        260                 265                 270His Asp Arg Phe Ser Asn Gln Asp Ser Ser Lys Ile Ser Leu Lys Leu
    275                 280                 285Gly Lys Val Glu Glu Asn Gly Ile Glu Lys Glu Ser Asp Pro Arg Lys
290                 295                 300Lys Ala Ala Val Leu Ile Leu Gly Ala Gly Arg Val Cys Gln Pro Ala305                 310                 315                 320Ala Glu Met Leu Ser Ser Phe Gly Arg Pro Ser Ser Ser Gln Trp Tyr
            325                 330                 335Lys Thr Leu Leu Glu Asp Asp Pne Glu Cys Gln Thr Asp Val Glu Val
        340                 345                 350Ile Val Gly Ser Leu Tyr Leu Lys Asp Ala Glu Gln Thr Val Glu Gly
    355                 360                 365Ile Pro Asn Val Thr Gly Ile Gln Leu Asp Val Met Asp Arg Ala Asn
370                 375                 380Leu Cys Lys Tyr Ile Ser Gln Val Asp Val Val Ile Ser Leu Leu Pro385                 390                 395                 400Pro Ser Cys His Ile Ile Val Ala Asn Ala Cys Ile Glu Leu Lys Lys
            405                 410                 415His Leu Val Thr Ala Ser Tyr Val Asp Ser Ser Met Ser Met Leu Asn
        420                 425                 430Asp Lys Ala Lys Asp Ala Gly Ile Thr Ile Leu Gly Glu Met Gly Leu
    435                 440                 445Asp Pro Gly Ile Gly His Met Met Ala Met Lys Met Ile Asn Gln Ala
450                 455                 460His Val Arg Lys Gly Lys Ile Lys  Ser Phe Thr Ser Tyr Cys Gly Gly465                 470                  475                 480Leu Pro Ser Pro Glu Ala Ala Asn Asn Pro Leu Ala Tyr Lys Phe Ser
            485                 490                 495Trp Asn Pro Ala Gly Ala Ile Arg Ala Gly Arg Asn Pro Ala Thr Tyr
        500                 505                 510Lys Trp Gly Gly Glu Thr Val His Ile Asp Gly Asp Asp Leu Tyr Asp
    515                 520                 525Ser Ala Thr Arg Leu Arg Leu Pro Asp Leu Pro Ala Phe Ala Leu Glu
530                 535                 540Cys Leu Pro Asn Arg Asn Ser Leu Leu Tyr Gly Asp Leu Tyr Gly Ile545                 550                 555                 560Thr Glu Ala  Ser Thr Ile Phe Arg Gly Thr Leu Arg Tyr Glu Gly Phe
             565                 570                 575Ser Glu Ile Met Gly Thr Leu Ser Arg Ile Ser Leu Phe Asn Asn Glu
        580                 585                 590Ala His Ser Leu Leu Met Asn Gly Gln Arg Pro Thr Phe Lys Lys Phe
    595                 600                 605Leu Phe Glu Leu Leu Lys Val Val Gly Asp Asn Pro Asp Glu Leu Leu
610                 615                 620Ile Gly Glu Asn Asp Ile Met Glu Gln Ile Leu Ile Gln Gly His Cys625                 630                 635                 640Lys Asp Gln Arg Thr Ala Met Glu Thr Ala Lys Thr Ile Ile Phe Leu
            645                 650                 655Gly Leu Leu Asp Gln Thr Glu Ile Pro Ala Ser Cys Lys Ser Ala Phe
        660                 665                 670Asp Val Ala Cys Phe Arg Met Glu Glu Arg Leu Ser Tyr Thr Ser Thr
    675                  680                 685Glu Lys Asp Met Val Leu Leu His His Glu Val Glu Ile Glu Tyr Pro
690                 695                 700Asp Ser Gln Ile Thr Glu Lys His Arg Ala Thr Leu Leu Glu Phe Gly705                 710                 715                 720Lys Thr Leu Asp Glu Lys Thr Thr Thr Ala Met Ala Leu Thr Val Gly
            725                 730                 735Ile Pro Ala Ala Val Gly Ala Leu Leu Leu Leu Thr Asn Lys Ile Gln
        740                 745                 750Thr Arg Gly Val Leu Arg Pro Ile Glu Pro Glu Val Tyr Asn Pro Ala
    755                 760                 765Leu Asp Ile Ile Glu Ala Tyr Gly Ile Lys Leu Ile Glu Lys Thr Glu
770                 775                 7802)SEQ ID NO:122信息:
(i)序列特征:
  (A)长度:1022氨基酸
  (B)类型:氨基酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:蛋白质
(iii)假说:无
(vi)原始来源:
  (A)有机体:Zea mays
(xi)序列描述:SEQ ID NO:122:Cys Ala Arg Leu Leu Leu Gly Gly Gly Lys Asn Gly Pro Arg Val Asn1               5                   10                  15Arg Ile Ile Val Gln Pro Ser Thr Arg Arg Ile His His Asp Ala Gln
        20                  25                  30Tyr Glu Asp Ala Gly Cys Glu Ile Ser Glu Asp Leu Ser Glu Cys Gly
    35                  40                  45Leu Ile IIe Gly Ile Lys Gln Pro Lys Leu Gln Met Ile Leu Ser Asp
50                  55                  60Arg Ala Tyr Ala Phe Phe Ser His Thr His Lys Ala Gln Lys Glu Asn65              70                      75                  80Met Pro Leu Leu Asp Lys Ile Leu Glu Glu Arg Val Ser Leu Phe Asp
            85                  90                  95Tyr Glu Leu Ile Val Gly Asp Asp Gly Lys Arg Ser Leu Ala Phe Gly
        100                 105                 110Lys Phe Ala Gly Arg Ala Gly Leu Ile Asp Phe Leu His Gly Leu Gly
    115                 120                 125Gln Arg Tyr Leu Ser Leu Gly Tyr Ser Thr Pro Phe Leu Ser Leu Gly
130                 135                 140Gln Ser His Met Tyr Pro Ser Leu Ala Ala Ala Lys Ala Ala Val Ile145                 150                 155                 160Val Val Ala Glu Glu Ile Ala Thr Phe Gly Leu Pro Ser Gly Ile Cys
            165                 170                 175Pro Ile Val Phe Val Phe Thr Gly Val Gly Asn Val Ser Gln Gly Ala
        180                 185                 190Gln Glu Ile Phe Lys Leu Leu Pro His Thr Phe Val Asp Ala Glu Lys
    195                 200                 205Leu Pro Glu Ile Phe Gln Ala Arg Asn Leu Ser Lys Gln Ser Gln Ser
210                 215                 220Thr Lys Arg Val Phe Gln Leu Tyr Gly Cys Val Val Thr Ser Arg Asp225                 230                 235                 240Ile Val Ser His Lys Asp Pro Thr Arg Gln Phe Asp Lys Gly Asp Tyr
            245                 250                 255Tyr Ala His Pro Glu His Tyr Thr Pro Val Phe His Glu Arg Ile Ala
        260                 265                 270Pro Tyr Ala Ser Val Ile Val Asn Cys Met Tyr Trp Glu Lys Arg Phe
    275                 280                 285Pro Pro Leu Leu Asn Met Asp Gln Leu Gln Gln Leu Met Glu Thr Gly
290                 295                 300Cys Pro Leu Val Gly Val Cys Asp Ile Thr Cys Asp Ile Gly Gly Ser305                 310                 315                 320Ile Glu Phe Ile Asn Lys Ser Thr Ser Ile Glu Arg Pro Phe Phe Arg
            325                  330                335Tyr Asp Pro Ser Lys Asn Ser Tyr His Asp Asp Met Glu Gly Ala Gly
        340                 345                 350Val Val Cys Leu Ala Val Asp Ile Leu Pro Thr Glu Phe Ser Lys Glu
    355                 360                 365Ala Ser Gln His Phe Gly Asn Ile Leu Ser Arg Leu Val Ala Ser Leu
370                 375                 380Ala Ser Val Lys Gln Pro Ala Glu Leu Pro Ser Tyr Leu Arg Arg Ala385                 390                 395                 400Cys Ile Ala His Ala Gly Arg Leu Thr Pro Leu Tyr Glu Tyr Ile Pro
            405                 410                 415Arg Met Arg Asn Thr Met Ile Asp Leu Ala Pro Ala Lys Thr Asn Pro
        420                 425                 430Leu Pro Asp Lys Lys Tyr Ser Thr Leu Val Ser Leu Ser Gly His Leu
    435                 440                 445Phe Asp Lys Phe Leu Ile Asn Glu Ala Leu Asp Ile Ile Glu Thr Ala
450                 455                 460Gly Gly Ser Phe His Leu Val Arg Cys Glu Val Gly Gln Ser Thr Asp465                 470                 475                 480Asp Met Ser Tyr Ser Glu Leu Glu Val Gly Ala Asp Asp Thr Ala Thr
            485                 490                 495Leu Asp Lys Ile Ile Asp Ser Leu Thr Ser Leu Ala Asn Glu His Gly
        500                 505                 510Gly Asp His Asp Ala Gly Gln Glu Ile Glu Leu Ala Leu Lys Ile Gly
    515                 520                 525Lys Val Asn Glu Tyr Glu Thr Asp Val Thr Ile Asp Lys Gly Gly Pro
530                 535                 540Lys Ile Leu Ile Leu Gly Ala Gly Arg Val Cys Arg Pro Ala Ala Glu545                 550                 555                 560Phe Leu Ala Ser Tyr Pro Asp Ile Cys Thr Tyr Gly Val Asp Asp His
            565                 570             575Asp Ala Asp Gln Ile His Val Ile Val Ala Ser Leu Tyr Gln Lys Asp
        580                 585                 590Ala Glu Glu Thr Val Asp Gly Ile Glu Asn Thr Thr Ala Thr Gln Leu
    595                 600                 605Asp Val Ala Asp Ile Gly Ser Leu Ser Asp Leu Val Ser Gln Val Glu
610                 615                 620Val Val Ile Ser Leu Leu Pro Ala Ser Phe His Ala Ala Ile Ala Gly625                 630                 635                 640Val Cys Ile Glu Leu Lys Lys His Met Val Thr Ala Ser Tyr Val Asp
            645                 650                 655Glu Ser Met Ser Asn Leu Ser Gln Ala Ala Lys Asp Ala Gly Val Thr
        660                 665                 670Ile Leu Cys Glu Met Gly Leu Asp Pro Gly Ile Asp His Leu Met Ser
    675                 680                 685Met Lys Met Ile Asp Glu Ala His Ala Arg Lys Gly Lys Ile Lys Ala
690                 695                 700Phe Thr Ser Tyr Cys Gly Gly Leu Pro Ser Pro Ala Ala Ala Asn Asn705                 710                 715                 720Pro Leu Ala Tyr Lys Phe Ser Trp Asn Pro Ala Gly Ala Leu Arg Ser
            725                 730                 735Gly Lys Asn Pro Ala Val Tyr Lys Phe Leu Gly Glu Thr Ile His Val
        740                 745                 750Asp Gly His Asn Leu Tyr Glu Ser Ala Lys Arg Leu Arg Leu Arg Glu
    755                 760                 765Leu Pro Ala Phe Ala Leu Glu His Leu Pro Asn Arg Asn Ser Leu Ile
770                 775                 780Tyr Gly Asp Leu Tyr Gly Ile Ser Lys Glu Ala Ser Thr Ile Tyr Arg785                 790                 795                 800Ala Thr Xaa Arg Tyr Glu Gly Phe Ser Glu Ile Met Val Thr Leu Ser
            805                 810                 815Lys Thr Gly Phe Phe Asp Ala Ala Asn His Pro Leu Leu Gln Asp Thr
        820                 825                 830Ser Arg Pro Thr Tyr Lys Gly Phe Leu Asp Glu Leu Leu Asn Asn Ile
    835                 840                 845Ser Thr Ile Asn Thr Asp Leu Asp Ile Glu Ala Ser Gly Gly Tyr Asp
850                 855                 860Asp Asp Leu Ile Ala Arg Leu Leu Lys Leu Gly Cys Cys Lys Asn Lys865                 870                 875                 880Glu Ile Ala Val Lys Thr Val Lys Thr Ile Lys Phe Leu Gly Leu His
            885                 890                 895Glu Glu Thr Gln Ile Pro Lys Gly Cys Ser Ser Pro Phe Asp Val Ile
        900                 905                 910Cys Gln Arg Met Glu Gln Arg Met Ala Tyr Gly His Asn Glu Gln Asp
    915                 920                 925Met Val Leu Leu His His Glu Val Glu Val Glu Tyr Pro Asp Gly Gln
930                 935                 940Pro Ala Glu Lys His Gln Ala Thr Leu Leu Glu Phe Gly Lys Val Glu945                 950                 955                 960Asn Gly Arg Ser Thr Thr Ala Met Ala Leu Thr Val Gly Ile Pro Ala
            965                 970                 975Ala Ile Gly Ala Leu Leu Leu Leu Lys Asn Lys Val Gln Thr Lys Gly
        980                 985                 990Val Ile Arg Pro Leu Gln Pro Glu Ile Tyr Val Pro Ala Leu Glu Ile
    995                 1000                1005Leu Glu Ser Ser Gly Ile Lys Leu Val Glu Lys Val Glu Thr
1010                1015                10202)SEQ ID NO:123信息:
(i)序列特征:
  (A)长度:1908碱基对
  (B)类型:核酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:对应于mRNA的cDNA
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Zea mays
(ix)特征:
  (A)名称/关键词:CDS
  (B)位置:3..1908
(xi)序列描述:SEQ ID NO:123:ATTGTGCCCG CCTTCTGCTA GGAGGAGGCA AGAACGGACC TCGAGTAAAC CGGATTATTG    60TGCAGCCAAG CACAAGGAGG ATCCATCATG ACGCTCAGTA TGAGGATGCA GGATGCGAGA   120TTTCAGAAGA CCTGTCAGAA TGCGGCCTTA TCATAGGCAT CAAACAACCC AAGCTGCAGA   180TGATTCTTTC AGATAGAGCG TACGCTTTCT TTTCACACAC ACACAAAGCC CAAAAAGAGA   240ATATGCCACT GTTAGACAAG ATCCTTGAAG AAAGGGTGTC CTTGTTTGAT TATGAGCTAA   300TTGTTGGAGA TGATGGGAAA AGATCACTAG CATTTGGGAA ATTTGCTGGT AGAGCTGGAC   360TGATAGATTT CTTACATGGT CTCGGACAGC GATATTTGAG CCTTGGATAC TCGACTCCAT   420TTCTCTCTCT GGGACAATCT CATATGTATC CTTCGCTCGC TGCAGCCAAG GCTGCAGTCA   480TTGTCGTTGC AGAAGAGATA GCAACATTTG GACTTCCATC CGGAATTTGT CCGATAGTGT   540TTGTGTTCAC TGGAGTTGGA AACGTCTCTC AGGGTGCGCA GGAGATATTC AAGTTATTGC   600CCCATACCTT TGTTGATGCT GAGAAGCTTC CCGAAATTTT TCAGGCCAGG AATCTGTCTA   660AGCAATCTCA GTCGACCAAG AGAGTATTTC AACTTTATGG TTGTGTTGTG ACCTCTAGAG   720ACATAGTTTC TCACAAGGAT CCCACCAGAC AATTTGACAA AGGTGACTAT TATGCTCATC   780CAGAACACTA CACCCCTGTT TTTCATGAAA GAATTGCTCC ATATGCATCT GTCATCGTAA   840ACTGTATGTA TTGGGAGAAG AGGTTTCCAC CATTACTAAA TATGGATCAG TTACAGCAAT   900TGATGGAGAC TGGTTGTCCT TTAGTCGGCG TTTGTGACAT AACTTGTGAT ATTGGACGTT   960CCATTGAATT TATCAACAAG AGTACATCAA TAGAGAGGCC TTTCTTTCGG TATGATCCTT  1020CTAAGAATTC ATACCATGAT GATATGGAAG GTGCCGGAGT GGTCTGCTTG GCTGTTGACA  1080TTCTCCCTAC AGAATTCTCT AAAGAGGCCT CCCAACATTT TGGAAACATA CTATCTAGAC  1140TTGTTGCTAG TTTGGCCTCA GTGAAGCAAC CGGCAGAACT TCCTTCCTAC TTGAGAAGAG  1200CTTGCATTGC ACATGCTGGC AGATTAACTC CTTTGTATGA ATATATCCCT AGGATGAGAA  1260ATACTATGAT AGATTTGGCA CCCGCAAAAA CAAATCCATT GCCTGACAAG AAGTATAGCA  1320CCCTGGTATC TCTCAGTGGG CACCTATTTG ATAAGTTCCT TATAAATGAA GCTTTGGACA  1380TCATTGAGAC AGCTGGAGGT TCATTTCACT TGGTTAGATG TGAAGTTGGA CAAAGCACGG  1440ATGATATGTC ATACTCAGAG CTTGAAGTAG GAGCAGATGA TACTGCCACA TTGGATAAAA  1500TTATTGATTC CTTGACTTCT TTAGCTAATG AACATGGTGG AGATCACGAT GCCGGGCAAG  1560AAATTGAATT AGCTCTGAAG ATAGGAAAAG TCAATGAGTA TGAAACTGAC GTCACAATTG  1620ATAAAGGAGG GCCAAAGATT TTAATTCTTG GAGCTGGAAG AGTCTGTCGG CCAGCTGCTG  1680AGTTTCTGGC ATCTTACCCA GACATATGTA CCTATGGTGT TGATGACCAT GATGCAGATC  1740AAATTCATGT TATCGTGGCA TCTTTGTATC AAAAAGATGC AGAAGAGACA GTTGATGGTA  1800TTGAAAATAC AACTGCTACC CAGCTTGATG TTGCTGATAT TGGAAGCCTT TCAGATCTTG  1860TTTCTCAGGT TGAGGTTGTA ATTAGCTTGC TGCCTGCTAG TTTTCATG               19082)SEQ ID NO:124信息:
(i)序列特征:
  (A)长度:640氨基酸
  (B)类型:氨基酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:蛋白质
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Zea mays
(xi)序列描述:SEQ ID NO:124:Cys Ala Arg Leu Leu Leu Gly Gly Gly Lys Asn Gly Pro Arg Val Asn1                   5               10                  15Arg Ile Ile Val Gln Pro Ser Thr Arg Arg Ile His His Asp Ala Gln
        20                  25                  30Tyr Glu Asp Ala Gly Cys Glu Ile Ser Glu Asp Leu Ser Glu Cys Gly
    35                  40                  45Leu Ile Ile Gly Ile Lys Gln Pro Lys Leu Gln Met Ile Leu Ser Asp
50                  55                  60Arg Ala Tyr Ala Phe Phe Ser His Thr His Lys Ala Gln Lys Glu Asn65                  70                  75                  80Met Pro Leu Leu Asp Lys Ile Leu Glu Glu Arg Val Ser Leu Phe Asp
            85                  90                  95Tyr Glu Leu Ile Val Gly Asp Asp Gly Lys Arg Ser Leu Ala Phe Gly
        100                 105                 110Lys Phe Ala Gly Arg Ala Gly Leu Ile Asp Phe Leu His Gly Leu Gly
    115                 120                 125Gln Arg Tyr Leu Ser Leu Gly Tyr Ser Thr Pro Phe Leu Ser Leu Gly
130                 135                 140Gln Ser His Met Tyr Pro Ser Leu Ala Ala Ala Lys Ala Ala Val Ile145                 150                 155                 160Val Val Ala Glu Glu Ile Ala Thr Phe Gly Leu Pro Ser Gly Ile Cys
            165                170                  175Pro Ile Val Phe Val Phe Thr Gly Val Gly Asn Val Ser Gln Gly Ala
        180                 185                 190Gln Glu Ile Phe Lys Leu Leu Pro His Thr Phe Val Asp Ala Glu Lys
    195                 200                 205Leu Pro Glu Ile Phe Gln Ala Arg Asn Leu Ser Lys Gln Ser Gln Ser
210                 215                 220Thr Lys Arg Val Phe Gln Leu Tyr Gly Cys Val Val Thr Ser Arg Asp225                 230                 235                 240Ile Val Ser His Lys Asp Pro Thr Arg Gln Phe Asp Lys Gly Asp Tyr
            245                 250                 255Tyr Ala His Pro Glu His Tyr Thr Pro Val Phe His Glu Arg Ile Ala
        260                 265                 270Pro Tyr Ala Ser Val Ile Val Asn Cys Met Tyr Trp Glu Lys Arg Phe
    275                 280                 285Pro Pro Leu Leu Asn Met Asp Gln Leu Gln Gln Leu Met Glu Thr Gly
290                 295                 300Cys Pro Leu Val Gly Val Cys Asp Ile Thr Cys Asp Ile Gly Gly Ser305                 310                 315                 320Ile Glu Phe Ile Asn Lys Ser Thr Ser Ile Glu Arg Pro Phe Phe Arg
            325                 330                 335Tyr Asp Pro Ser Lys Asn Ser Tyr His Asp Asp Met Glu Gly Ala Gly
        340                 345                 350Val Val Cys Leu Ala Val Asp Ile Leu Pro Thr Glu Phe Ser Lys Glu
    355                 360                 365Ala Ser Gln His Phe Gly Asn Ile Leu Ser Arg Leu Val Ala Ser Leu
370                 375                 380Ala Ser Val Lys Gln Pro Ala Glu Leu Pro Ser Tyr Leu Arg Arg Ala385                 390                 395                 400Cys Ile Ala His Ala Gly Arg Leu Thr Pro Leu Tyr Glu Tyr Ile Pro
            405                 410                 415Arg Met Arg Asn Thr Met Ile Asp Leu Ala Pro Ala Lys Thr Asn Pro
        420                 425                 430Leu Pro Asp Lys Lys Tyr Ser Thr Leu Val Ser Leu Ser Gly His Leu
435                     440                 445Phe Asp Lys Phe Leu Ile Asn Glu Ala Leu Asp Ile Ile Glu Thr Ala
450                 455                 460Gly Gly Ser Phe His Leu Val Arg Cys Glu Val Gly Gln Ser Thr Asp465                 470                 475                 480Asp Met Ser Tyr Ser Glu Leu Glu Val Gly Ala Asp Asp Thr Ala Thr
            485                 490                 495Leu Asp Lys Ile Ile Asp Ser Leu Thr Ser Leu Ala Asn Glu His Gly
        500                 505                 510Gly Asp His Asp Ala Gly Gln Glu Ile Glu Leu Ala Leu Lys Ile Gly
    515                 520                 525Lys Val Asn Glu Tyr Glu Thr Asp Val Thr Ile Asp Lys Gly Gly Pro
530                 535                 540Lys Ile Leu Ile Leu Gly Ala Gly Arg Val Cys Arg Pro Ala Ala Glu545                 550                 555                 560Phe Leu Ala Ser Tyr Pro Asp Ile Cys Thr Tyr Gly Val Asp Asp His
            565                 570                 575Asp Ala Asp Gln Ile His Val Ile Val Ala Ser Leu Tyr Gln Lys Asp
        580                 585                 590Ala Glu Glu Thr Val Asp Gly Ile Glu Ash Thr Thr Ala Thr Gln Leu
    595                 600                 605Asp Val Ala Asp Ile Gly Ser Leu Ser Asp Leu Val Ser Gln Val Glu
610                 615                 620Val Val Ile Ser Leu Leu Pro Ala Ser Phe His Ala Ala Ile Ala Gly625                 630                 635                 6402)SEQ ID NO:125信息:
(i)序列特征:
  (A)长度:720碱基对
  (B)类型:核酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:对应于mRNA的cDNA
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Oryza sativa
(ix)特征:
  (A)名称/关键词:CDS
  (B)位置:2..720
(ix)特征:
  (A)名称/关键词:misc_feature
  (B)位置:215
  (D)其他信息:/标记=未知
(ix)特征:
  (A)名称/关键词:misc_feature
  (B)位置:678
  (D)其他信息:/标记=未知
(xi)序列描述:SEQ ID NO:125:GTTTAAACAT CTTTCCAATC TTGTTTCTCA GGTTGAAGTA GTAGrTAGCT TGCTGCCTGC    60CAGTTTTCAT GCTGCCATAG CAAGAGTATG CATAGAGATG AAGAAGCACT TGGTCACTGC   120AAGCTATGTT GATGAGTCCA TGTCAAAGTT GGAACAATCT GCAGAAGGTG CTGGTGTAAC   180TATTCTCTGT GAAATGGGCC TGGATCCTGG CATANATCAT ATGATGTCAA TGAAGATGAT   240TGACGAAGCA CATTCACGGA AGGGGAAAAT AAAGTCATTT ACATCCTTTT GTGGAGGACT   300TCCATCTCCA GCTTCTGCAA ACAATCCACT TGCTTATAAG TTCAGTTGGA GTCCAGCTGG   360TGCCATCCGT GCAGGGAGAA ACCCTGCTGT CTACAAATTT CATGGAGAAA TCATCCATGT   420AGATGGTGAT AAATTGTATG AATCCGCAAA GAGGCTCAGA TTACMAGAAC TTCCAGCTTT   480TGCACTGGAA CACTTGCCAA ACCGGAATTC CTTGATGTAT GGAGACCTGT ATGGGATCTC   540CAAAGAAGCA TCTACTGTGT ACAGGGCTAC TCTTCGTTAT GAAGGATTTA ATGAGATAAT   600GGCAACCTTC GCGAAAATTG GGTTTTTTGA TGCTGCAAGT CATCCACTGT TGCAACAAAC   660TACTCGCCCT ACATACANGG ATTTCCTGTT GAACCCTCAA TGCTTGTACA TCTCCAAAAC   7202)SEQ ID NO:126信息:
(i)序列特征:
  (A)长度:239氨基酸
  (B)类型:氨基酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:蛋白质
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Oryza sativa
(xi)序列描述:SEQ ID NO:126:Phe Lys His Leu Ser Asn Leu Val Ser Gln Val Glu Val Val Val Ser1               5                   10                  15Leu Leu Pro Ala Ser Phe His Ala Ala Ile Ala Arg Val Cys Ile Glu
        20                  25                  30Met Lys Lys His Leu Val Thr Ala Ser Tyr Val Asp Glu Ser Met Ser
    35                  40                  45Lys Leu Glu Gln Ser Ala Glu Gly Ala Gly Val Thr Ile Leu Cys Glu
50                  55                  60Met Gly Leu Asp Pro Gly Ile Xaa His Met Met Ser Met Lys Met Ile65                  70                  75                  80Asp Glu Ala His Ser Arg Lys Gly Lys Ile Lys Ser Phe Thr Ser Phe
            85                  90                  95Cys Gly Gly Leu Pro Ser Pro Ala Ser Ala Asn Asn Pro Leu Ala Tyr
        100                 105                 110Lys Phe Ser Trp Ser Pro Ala Gly Ala Ile Arg Ala Gly Arg Asn Pro
    115                  120                125Ala Val Tyr Lys Phe His Gly Glu Ile Ile His Val Asp Gly Asp Lys
130                 135                 140Leu Tyr Glu Ser Ala Lys Arg Leu Arg Leu Xaa Glu Leu  Pro Ala Phe145                 150                 155                  160Ala Leu Glu His Leu Pro Asn Arg Asn Ser Leu Met Tyr Gly Asp Leu
            165                 170                 175Tyr Gly Ile Ser Lys Glu Ala Ser Thr Val Tyr Arg Ala Thr Leu Arg
        180                 185                 190Tyr Glu Gly Phe Asn Glu Ile Met Ala Thr Phe Ala Lys Ile Gly Phe
    195                 200                 205Phe Asp Ala Ala Ser His Pro Leu Leu Gln Gln Thr Thr Arg Pro Thr
210                 215                 220Tyr Xaa Asp Phe Leu Leu Asn Pro Gln Cys Leu Tyr Ile Ser Lys225                 230                 2352)SEQ ID NO:127信息:
(i)序列特征:
  (A)长度:308碱基对
  (B)类型:核酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:对应于mRNA的cDNA
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Oryza sativa
(ix)特征:
  (A)名称/关键词:CDS
  (B)位置:1..129
(xi)序列描述:SEQ ID NO:127:CTGCTGTTGC TCCAGAACAA GATCCAAAAG AAAGGAGTGA TCAGGCCTCT GGAACCTGAA    60ATTTACATTC CAGCGTTGGA GATCTT6GAG TCATCGGGTA TCAAGCTGGC GGAGAGAGTG   120GA6ACCTGAG AATCGGACCC AATATGTATA ATGTAGCATG GTGGTAGCTT CTCTATATAT   180ATGCTTCAGT GAATAATTGA TTTGCCGTTG TGTGGTAATT AAGCAATGCC CGCTAATAAA   240TTGTACCGTA GAAGTCCTTC TATGTACATC CGTATCAAAA AATAAAAAAA GCATCGATTA   300GCTTGAAT                                                            3082)SEQ ID NO:128信息:
(i)序列特征:
  (A)长度:42氨基酸
  (B)类型:氨基酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:多肽
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Oryza sativa
(xi)序列描述:SEQ ID NO:128:Leu Leu Leu Leu Gln Asn Lys Ile Gln Lys Lys Gly Val Ile Arg Pro1               5                   10                  15Leu Glu Pro Glu Ile Tyr Ile Pro Ala Leu Glu Ile Leu Glu Ser Ser
        20                  25                  30Gly Ile Lys Leu Ala Glu Arg Val Glu Thr
    35                  402)SEQ ID NO:129信息:
(i)序列特征:
  (A)长度:429碱基对
  (B)类型:核酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:对应于mRNA的cDNA
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Triticum aestivum
(ix)特征:
  (A)名称/关键词:CDS
  (B)位置:1..252
(ix)特征:
  (A)名称/关键词:misc_feature
  (B)位置:172
  (D)其他信息:/标记=未知
(ix)特征:
  (A)名称/关键词:misc_feature
  (B)位置:186
  (D)其他信息:/标记=未知(ix)特征:
  (A)名称/关键词:misc_feature
  (B)位置:331
  (D)其他信息:/标记=未知
(xi)序列描述:SEQ ID NO:129:TACCCCGACG GGGACCCCAC CGAGAAGCAC CAAGCGACGC TGCTGGAGTT CGGAAAGACC    60GAGAACGGCA GGCCCACCAC CGCCATGGCC CTCACCGTTG GGGTACCGGC AGCGATAGGA   120GCCCTGCTCT TGCTCCAGAA CAAGGTCCAG AGGAAAGGGG TGATCCGGCC TNTGGAACCG   180GAGATNTACA TCCCTGCGCT GGAGATCTTG GAAGCGTCGG GCATCAAGCT GATCGAGAGA   240GTGGAGACCT GAGGATGTCA GGATGGGATG AGAATCTATC GAGTATATAT GCTGCAGCAA   300CAGAGGCAGT GAGTAAATAA AATGATGATT NTCGCCGTTG TAAGTAAAAT GAGTGGACTG   360TATGTATGTA TGTGACTATC TATTGTACTA CATATATACC AAATCTGTCG CCGGTTGATT   420CTGTTGGTG                                                           4292)SEQ ID NO:130信息:
(i)序列特征:
  (A)长度:83氨基酸
  (B)类型:氨基酸
  (C)线型:单链
  (D)拓扑学:线形
(ii)分子类型:蛋白质
(iii)假说:无
(iv)反义链:无
(vi)原始来源:
  (A)有机体:Triticum aestivum
(xi)序列描述:SEQ ID NO:130:Tyr Pro Asp Gly Asp Pro Thr Glu Lys His Gln Ala Thr Leu Leu Glu1               5                   10                  15Phe Gly Lys Thr Glu Asn Gly Arg Pro Thr Thr Ala Met Ala Leu Thr
        20                  25                  30Val Gly Val Pro Ala Ala Ile Gly Ala Leu Leu Leu Leu Gln Asn Lys
    35                  40                  45Val Gln Arg Lys Gly Val Ile Arg Pro Xaa Glu Pro Glu Xaa Tyr Ile
50                  55                  60Pro Ala Leu Glu Ile Leu Glu Ala Ser Gly Ile Lys Leu Ile Glu Arg65                  70                  75                  80Val Glu Thr2)SEQ ID NO:131信息:
(i)序列特征:
  (A)长度:1449碱基对
  (B)类型:核酸
  (C)线型:双链
  (D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(xi)序列描述:SEQ ID NO:131:ATGACGAAAA AATCAGGTGT TTTGATTCTT GGTGCTGGAC GTGTGTGTCG CCCAGCTGCT    60GATTTCCTAG CTTCAGTTAG AACCATTTCG TCACAGCAAT GGTACAAAAC ATATTTCGGA   120GCAGACTCTG AAGAGAAAAC AGATGTTCAT GTGATTGTCG CGTCTCTGTA TCTTAAGGAT   180GCCAAAGAGA CGGTTGAAGG TATTTCAGAT GTAGAAGCAG TTCGGCTAGA TGTATCTGAT   240AGTGAAAGTC TCCTTAAGTA TGTTTCTCAG GTTGATGTTG TCCTAAGTTT ATTACCTGCA   300AGTTGTCATG CTGTTGTAGC AAAGACATGC ATTGAGCTGA AGAAGCATCT CGTCACTGCT   360AGCTATGTTG ATGATGAAAC GTCCATGTTA CATGAGAAGG CTAAGAGTGC TGGGATAACG   420ATTCTAGGCG AAATGGGACT GGACCCTGGA ATCGATCACA TGATGGCGAT GAAAATGATC   480AACGATGCTC ATATCAAAAA AGGGAAAGTG AAGTCTTTTA CCTCTTATTG TGGAGGGCTT   540CCCTCTCCTG CTGCAGCAAA TAATCCATTA GCATATAAAT TTAGCTGGAA CCCTGCTGGA   600GCAATTCGAG CTGGTCAAAA CCCCGCCAAA TACAAAAGCA ACGGCGACAT AATACATGTT   660GATGGGAAGA ATCTCTATGA TTCCGCGGCA AGATTCCGAG TACCTAATCT TCCAGCTTTT   720GCATTGGAGT GTTTTCCAAA TCGTGACTCC TTGGTTTACG GGGAACATTA TGGCATCGAG   780AGCGAAGCAA CAACGATATT TCGTGGAACA CTCAGATATG AAGGGTTTAG TATGATAATG   840GCAACACTTT CGAAACTTGG ATTCTTTGAC AGTGAAGCAA ATCAAGTACT CTCCACTGGA   900AAGAGGATTA CGTTTGGTGC TCTTTTAAGT AACATTCTAA ATAAGGATGC AGACAATGAA   960TCAGAGCCCC TAGCGGGAGA AGAAGAGATA AGCAAGAGAA TTATCAAGCT TGGACATTCC  1020AAGGAGACTG CAGCCAAAGC TGCCAAAACA ATTGTATTCT TGGGGTTCAA CGAAGAGAGG  1080GAGGTTCCAT CACTGTGTAA AAGCGTATTT GATGCAACTT GTTACCTAAT GGAAGAGAAA  1140CTAGCTTATT CCGGAAATGA ACAGGACATG GTGCTTTTGC ATCACGAAGT AGAAGTGGAA  1200TTCCTTGAAA GCAAACGTAT AGAGAAGCAC ACTGCGACTC TTTTGGAATT CGGGGACATC  1260AAGAATGGAC AAACAACAAC CGCTATGGCC AAGACTGTTG GGATCCCTGC AGCCATTGGA  1320GCTCTGGTGT TAATTGAAGA CAAGATCAAG ACAAGAGGAG TCTTAAGGCC TCTCGAAGCA  1380GAGGTGTATT TGCCAGCTTT GGATATATTG CAAGCATATG GTATAAAGCT GATGGAGAAG  1440GCAGAATGA                                                          14492)SEQ ID NO:132信息:
(i)序列特征:
  (A)长度:482氨基酸
  (B)类型:氨基酸
  (C)线型:未知
  (D)拓扑学:线形
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:132:Met Thr Lys Lys Ser Gly Val Leu Ile Leu Gly Ala Gly Arg Val Cys1               5                   10                  15Arg Pro Ala Ala Asp Phe Leu Ala Ser Val Arg Thr Ile Ser Ser Gln
        20                  25                  30Gln Trp Tyr Lys Thr Tyr Phe Gly Ala Asp Ser Glu Glu Lys Thr Asp
    35                  40                  45Val His Val Ile Val Ala Ser Leu Tyr Leu Lys Asp Ala Lys Glu Thr
50                  55                 60Val Glu Gly Ile Ser Asp Val Glu Ala Val Arg Leu Asp Val Ser Asp65                  70                  75                  80Ser Glu Ser Leu Leu Lys Tyr Val Ser Gln Val Asp Val Val Leu Ser
            85                  90                  95Leu Leu Pro Ala Ser Cys His Ala Val Val Ala Lys Thr Cys Ile Glu
       100                 105                 110Leu Lys Lys His Leu Val Thr Ala Ser Tyr Val Asp Asp Glu Thr Ser
    115                 120                 125Met Leu His Glu Lys Ala Lys Ser Ala Gly Ile Thr Ile Leu Gly Glu
130                 135                 140Met Gly Leu Asp Pro Gly Ile Asp His Met Met Ala Met Lys Met Ile145                 150                 155                 160Asn Asp Ala His Ile Lys Lys Gly Lys Val Lys Ser Phe Thr Ser Tyr
            165                 170                 175Cys Gly Gly Leu Pro Ser Pro Ala Ala Ala Asn Asn Pro Leu Ala Tyr
        180                 185                 190Lys Phe Ser Trp Asn Pro Ala Gly Ala Ile Arg Ala Gly Gln Asn Pro
    195                 200                 205Ala Lys Tyr Lys Ser Asn Gly Asp Ile Ile His Val Asp Gly Lys Asn
210                 215                 220Leu Tyr Asp Ser Ala Ala Arg Phe Arg Val Pro Asn Leu Pro Ala Phe225                 230                 235                 240Ala Leu Glu Cys Phe Pro Asn Arg Asp Ser Leu Val Tyr Gly Glu His
            245                 250                 255Tyr Gly Ile Glu Ser Glu Ala Thr Thr Ile Phe Arg Gly Thr Leu Arg
        260                 265                 270Tyr Glu Gly Phe Ser Met Ile Met Ala Thr Leu Ser Lys Leu Gly Phe
    275                 280                 285Phe Asp Ser Glu Ala Asn Gln Val Leu Ser Thr Gly Lys Arg Ile Thr
290                 295                 300Phe Gly Ala Leu Leu Ser Asn Ile Leu Asn Lys Asp Ala Asp Asn Glu305                 310                 315                 320Ser Glu Pro Leu Ala Gly Glu Glu Glu Ile Ser Lys Arg Ile Ile Lys
            325                 330                 335Leu Gly His Ser Lys Glu Thr Ala Ala Lys Ala Ala Lys Thr Ile Val
        340                 345                 350Phe Leu Gly Phe Asn Glu Glu Arg Glu Val Pro Ser Leu Cys Lys Ser
    355                 360                 365Val Phe Asp Ala Thr Cys Tyr Leu Met Glu Glu Lys Leu Ala Tyr Ser
370                 375                 380Gly Asn Glu Gln Asp Met Val Leu Leu His His Glu Val Glu Val Glu385                 390                 395                 400Phe Leu Glu Ser Lys Arg Ile Glu Lys His Thr Ala Thr Leu Leu Glu
            405                 410                 415Phe Gly Asp Ile Lys Asn Gly Gln Thr Thr Thr Ala Met Ala Lys Thr
        420                 425                 430Val Gly Ile Pro Ala Ala Ile Gly Ala Leu Val Leu Ile Glu Asp Lys
    435                 440                 445Ile Lys Thr Arg Gly Val Leu Arg Pro Leu Glu Ala Glu Val Tyr Leu
450                 455                 460Pro Ala Leu Asp Ile Leu Gln Ala Tyr Gly Ile Lys Leu Met Glu Lys465                 470                 475                 480Ala Glu

Claims (20)

1.含有一个编码全部或部分赖氨酸酮戊二酸还原酶的核酸序列的一种分离核酸片段。
2.权利要求1的核酸片段,其中该核酸序列编码一个与SEQ IDNO:104、SEQ ID NO:105、SEQ ID NO:112、SEQ ID NO:117、SEQID NO:118、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130或SEQ ID NO:132描述的多肽基本上相似的多肽。
3.权利要求1的核酸片段,其含有一个核酸序列,其中该核酸序列与SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129或SEQ ID NO:131的核酸序列基本上相似。
4.权利要求1的核酸片段,包含一个SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129或SEQ ID NO:131的核酸序列。
5.权利要求1的核酸片段,其中该核酸片段编码一个列于SEQ IDNO:104、SEQ ID NO:105、SEQ ID NO:112、SEQ ID NO:117、SEQID NO:118、SEQ ID NO:121、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQID NO:130或SEQ ID NO:132的多肽。
6.一种嵌合基因,它包含与合适的种子特异性调节序列操纵连接的编码赖氨酸酮戊二酸还原酶或其一个亚片段的权利要求1的分离核酸片段,其中所说的嵌合基因降低了用该嵌合基因转化的植物种子中的赖氨酸酮戊二酸还原酶活性。
7.根据权利要求6的嵌合基因,其中分离核酸片段含有一个与SEQ ID NO:110、SEQ ID NO:111、SEQ ID NO:115、SEQ ID NO:116、SEQ ID NO:119、SEQ ID NO:120、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129或SEQ ID NO:131的序列基本上相似的核酸序列或其亚序列。
8.一种赖氨酸酮戊二酸还原酶活性被降低了的植物细胞,降低的原因是一个编码赖氨酸酮戊二酸还原酶的基因中的一个突变。
9.用权利要求6或7的嵌合基因转化的一种植物细胞,其中所说的转化植物细胞具有降低了的赖氨酸酮戊二酸还原酶活性。
10.一种赖氨酸酮戊二酸还原酶活性被降低了的植物种子,降低的原因是一个编码赖氨酸酮戊二酸还原酶的基因中的一个突变。
11.用权利要求6或7的嵌合基因转化的一种植物种子,其中所说的转化植物种子具有降低了的赖氨酸酮戊二酸还原酶活性。
12.根据权利要求9的植物细胞,其中所说的植物细胞选自拟南芥、玉米、大豆、油菜、小麦和水稻。
13.根据权利要求11的植物种子,其中所说的植物细胞选自拟南芥、玉米、大豆、油菜、小麦和水稻。
14.一种在植物种子中降低赖氨酸酮戊二酸还原酶活性的方法,包括:
(a)用权利要求6或7的嵌合基因转化植物细胞;
(b)在适合获得种子的条件下由获自步骤(a)的转化植物细胞再生繁殖性的成熟植物;
(c)在步骤(b)的子代种子中筛选降低的赖氨酸酮戊二酸还原酶活性;并
(d)选择那些种子中具有降低的赖氨酸酮戊二酸还原酶活性的品系。
15.获自权利要求14的植物的种子。
16.一种核酸片段,它包括:
(a)一个权利要求6或7的第一种嵌合基因和
(b)一个第二种嵌合基因,其中,一个编码基本上对赖氨酸抑制不敏感的二氢2、6-吡啶二羧酸合成酶的核酸片段与一种植物叶绿体转运序列和一种植物种子特异性调节序列操纵相连。
17.一种植物,在其基因组中含有一个权利要求6或7的第一种嵌合基因,其中所说的基因降低了转化植物种子中的赖氨酸酮戊二酸还原酶活性,并含有一个第二种嵌合基因,其中,一个编码基本上对赖氨酸抑制不敏感的二氢2、6-吡啶二羧酸合成酶的核酸片段与一种植物叶绿体转运序列和一种植物种子特异性调节序列操纵相连。
18.一种在其基因组中含有权利要求16的核酸片段的植物。
19.获自在其基因组中含有第一种和第二种嵌合基因的权利要求17的植物的种子。
20.获自在其基因组中含有权利要求16的核酸片段的权利要求18的植物的种子。
CN98803732A 1997-03-27 1998-03-27 提高植物种子中赖氨酸含量的嵌合基因和方法 Pending CN1253584A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US82462797A 1997-03-27 1997-03-27
US08/824,627 1997-03-27

Publications (1)

Publication Number Publication Date
CN1253584A true CN1253584A (zh) 2000-05-17

Family

ID=25241893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98803732A Pending CN1253584A (zh) 1997-03-27 1998-03-27 提高植物种子中赖氨酸含量的嵌合基因和方法

Country Status (12)

Country Link
EP (1) EP0973880A2 (zh)
JP (1) JP2001502923A (zh)
KR (1) KR20010005645A (zh)
CN (1) CN1253584A (zh)
AU (1) AU747997B2 (zh)
BR (1) BR9811256A (zh)
CA (1) CA2280196C (zh)
HU (1) HUP0002305A3 (zh)
ID (1) ID22486A (zh)
PL (1) PL336042A1 (zh)
TR (1) TR199902349T2 (zh)
WO (1) WO1998042831A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100412198C (zh) * 2006-04-05 2008-08-20 北京凯拓迪恩生物技术研发中心有限责任公司 一种提高水稻种子中赖氨酸含量的方法及其专用载体
CN102051376B (zh) * 2010-01-27 2013-03-20 华中农业大学 基于油菜子叶叶绿体转化的组织培养体系及获得转化植株的方法

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1074629A1 (en) * 1999-07-30 2001-02-07 Coöperatieve Verkoop- en Productievereniging van Aardappelmeel en Derivaten 'AVEBE' B.A. Sink protein
US7157281B2 (en) 2003-12-11 2007-01-02 Monsanto Technology Llc High lysine maize compositions and event LY038 maize plants
AR047598A1 (es) * 2004-02-10 2006-01-25 Monsanto Technology Llc Semilla de maiz transgenica con mayor contenido de aminoacidos
US7855323B2 (en) 2004-02-10 2010-12-21 Monsanto Technology Llc Recombinant DNA for gene suppression
BRPI0616848A8 (pt) * 2005-10-03 2017-09-19 Monsanto Technology Llc Semente de planta transgênica com maior teor de lisina
US7964774B2 (en) 2008-05-14 2011-06-21 Monsanto Technology Llc Plants and seeds of spring canola variety SCV384196
US8466342B2 (en) 2009-06-09 2013-06-18 Pioneer Hi Bred International Inc Early endosperm promoter and methods of use
CA2775146A1 (en) 2009-10-26 2011-05-12 Pioneer Hi-Bred International, Inc. Somatic ovule specific promoter and methods of use
US9204603B2 (en) 2011-12-21 2015-12-08 The Curators Of The University Of Missouri Soybean variety S05-11482
WO2013096818A1 (en) 2011-12-21 2013-06-27 The Curators Of The University Of Missouri Soybean variety s05-11268
WO2013103365A1 (en) 2012-01-06 2013-07-11 Pioneer Hi-Bred International, Inc. Pollen preferred promoters and methods of use
EP2800816A1 (en) 2012-01-06 2014-11-12 Pioneer Hi-Bred International Inc. Ovule specific promoter and methods of use
US8878009B2 (en) 2012-04-26 2014-11-04 Monsanto Technology, LLP Plants and seeds of spring canola variety SCV318181
US8859857B2 (en) 2012-04-26 2014-10-14 Monsanto Technology Llc Plants and seeds of spring canola variety SCV259778
US8835720B2 (en) 2012-04-26 2014-09-16 Monsanto Technology Llc Plants and seeds of spring canola variety SCV967592
WO2014059155A1 (en) 2012-10-11 2014-04-17 Pioneer Hi-Bred International, Inc. Guard cell promoters and uses thereof
CA2905743C (en) 2013-03-13 2021-09-28 Pioneer Hi-Bred International, Inc. Glyphosate application for weed control in brassica
CN105339380A (zh) 2013-03-14 2016-02-17 先锋国际良种公司 用以防治昆虫害虫的组合物和方法
EP2971000A4 (en) 2013-03-15 2016-11-23 Pioneer Hi Bred Int PHI-4 POLYPEPTIDES AND METHOD FOR THEIR USE
EA030896B1 (ru) 2013-08-16 2018-10-31 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные белки и способы их применения
MX359027B (es) 2013-09-13 2018-09-12 Pioneer Hi Bred Int Proteinas insecticidas y metodos para su uso.
RU2688486C2 (ru) 2014-01-16 2019-05-21 Калиста, Инк. Микроорганизмы для повышенного продуцирования аминокислот и связанные с ними способы
EP3102592B1 (en) 2014-02-07 2020-05-20 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US20170218384A1 (en) 2014-08-08 2017-08-03 Pioneer Hi-Bred International, Inc. Ubiquitin promoters and introns and methods of use
WO2016044092A1 (en) 2014-09-17 2016-03-24 Pioneer Hi Bred International Inc Compositions and methods to control insect pests
EP3207143B1 (en) 2014-10-16 2023-11-22 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US20170359965A1 (en) 2014-12-19 2017-12-21 E I Du Pont De Nemours And Company Polylactic acid compositions with accelerated degradation rate and increased heat stability
CN108064233B (zh) 2015-05-19 2022-07-15 先锋国际良种公司 杀昆虫蛋白及其使用方法
EP3310803A1 (en) 2015-06-16 2018-04-25 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
CN109475096B (zh) 2015-08-06 2022-08-23 先锋国际良种公司 植物来源的杀昆虫蛋白及其使用方法
US11236347B2 (en) 2015-08-28 2022-02-01 Pioneer Hi-Bred International, Inc. Ochrobactrum-mediated transformation of plants
EP3390431A1 (en) 2015-12-18 2018-10-24 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
BR112018012887B1 (pt) 2015-12-22 2024-02-06 Pioneer Hi-Bred International, Inc Cassete de expressão, vetor, métodos de obtenção de célula vegetal e planta transgênica, métodos para expressar um polinucleotídeo
EP3960863A1 (en) 2016-05-04 2022-03-02 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CA3022858A1 (en) 2016-06-16 2017-12-21 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
EP4083215A1 (en) 2016-06-24 2022-11-02 Pioneer Hi-Bred International, Inc. Plant regulatory elements and methods of use thereof
US11155829B2 (en) 2016-07-01 2021-10-26 Pioneer Hi-Bred International, Inc. Insecticidal proteins from plants and methods for their use
WO2018013333A1 (en) 2016-07-12 2018-01-18 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
EP3535285B1 (en) 2016-11-01 2022-04-06 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN111373046A (zh) 2017-09-25 2020-07-03 先锋国际良种公司 组织偏好性启动子和使用方法
EP3764796A4 (en) 2018-03-14 2021-12-22 Pioneer Hi-Bred International, Inc. INSECTICIDAL PROTEINS FROM PLANTS AND METHOD OF USING THEM
WO2019178042A1 (en) 2018-03-14 2019-09-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins from plants and methods for their use
BR112020023800A2 (pt) 2018-05-22 2021-02-23 Pioneer Hi-Bred International, Inc. elementos reguladores de planta e métodos de uso dos mesmos
WO2020005933A1 (en) 2018-06-28 2020-01-02 Pioneer Hi-Bred International, Inc. Methods for selecting transformed plants
BR112021008329A2 (pt) 2018-10-31 2021-08-03 Pioneer Hi-Bred International, Inc. composições e métodos para transformação de plantas mediada por ochrobactrum
EP4182466A2 (en) 2020-07-14 2023-05-24 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN114317557B (zh) * 2022-01-06 2023-07-07 河南农业大学 玉米ZmRIBA1基因在高赖氨酸玉米育种中的应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5258300A (en) * 1988-06-09 1993-11-02 Molecular Genetics Research And Development Limited Partnership Method of inducing lysine overproduction in plants
JPH07504821A (ja) * 1992-03-19 1995-06-01 イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー 植物の種子のリシンおよびスレオニン含有量を増加させるための核酸断片および方法
WO1995015392A1 (en) * 1993-11-30 1995-06-08 E.I. Du Pont De Nemours And Company Chimeric geens and methods for increasing the lysine content of the seeds of corn, soybean and rapeseed plants
CN1272437C (zh) * 1994-06-14 2006-08-30 味之素株式会社 α-酮戊二酸脱氢酶基因以及赖氨酸的生产方法
US5919617A (en) * 1994-12-21 1999-07-06 Miami University Methods and reagents for detecting fungal pathogens in a biological sample

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100412198C (zh) * 2006-04-05 2008-08-20 北京凯拓迪恩生物技术研发中心有限责任公司 一种提高水稻种子中赖氨酸含量的方法及其专用载体
CN102051376B (zh) * 2010-01-27 2013-03-20 华中农业大学 基于油菜子叶叶绿体转化的组织培养体系及获得转化植株的方法

Also Published As

Publication number Publication date
PL336042A1 (en) 2000-06-05
KR20010005645A (ko) 2001-01-15
CA2280196C (en) 2012-05-15
ID22486A (id) 1999-10-21
JP2001502923A (ja) 2001-03-06
CA2280196A1 (en) 1998-10-01
BR9811256A (pt) 2000-07-18
AU747997B2 (en) 2002-05-30
WO1998042831A3 (en) 1998-12-10
TR199902349T2 (xx) 2000-01-21
EP0973880A2 (en) 2000-01-26
HUP0002305A3 (en) 2002-09-30
HUP0002305A2 (hu) 2000-09-28
WO1998042831A2 (en) 1998-10-01
AU6780198A (en) 1998-10-20

Similar Documents

Publication Publication Date Title
CN1253584A (zh) 提高植物种子中赖氨酸含量的嵌合基因和方法
US6459019B1 (en) Chimeric genes and methods for increasing the lysine and threonine content of the seeds of plants
EP1002113B1 (en) Plant amino acid biosynthetic enzymes
CA2190263C (en) Nucleic acid fragments, chimeric genes and methods for increasing the methionine content of the seeds of plants
CA2132414C (en) Nucleic acid fragments and methods for increasing the lysine and threonine content of the seeds of plants
US7022895B2 (en) Plant amino acid biosynthetic enzymes
AU704510B2 (en) Chimeric genes and methods for increasing the lysine content of the seeds of corn, soybean and rapeseed plants
AU736671B2 (en) Suppression of specific classes of soybean seed protein genes
CN1798843A (zh) 植物中细胞分裂素活性的调节
CN1285875A (zh) 突变的羟基苯丙酮酸双氧化酶、基dna序列和含该基因且耐除草剂的植物的分离
CN1324408A (zh) 来自稻米的核酸分子及其用于生产改性淀粉的用途
CN1198777A (zh) 有关谷氨酸脱氢酶α-和β-亚基的新多肽和多核苷酸及用法
CN1753992A (zh) 种子中蛋白质含量降低的植物及其制备方法和利用方法
CN1468311A (zh) 异麦芽寡糖合酶
CN1685040A (zh) 用于在植物中表达基因的种子特异性usp启动子
CN101044153A (zh) 用于植物中的真核翻译起始因子基因调节元件
CN1719971A (zh) 转基因高色氨酸植物
CN1849390A (zh) 在绿色植物和微生物中高水平生产对苯二酚葡糖苷
CN1423520A (zh) 调节植物细胞分裂的组合物和方法
CN1638785A (zh) 增强型蛋白及其应用方法
US20050005330A1 (en) Chimeric genes and methods for increasing the lysine content of the seeds of plants
CN1728939A (zh) 生产改变含油量的植物
CN1238513C (zh) 使用绒毡层特异的锌指转录因子使花粉受育性降低的方法
CN1852982A (zh) 用于调节玉米中细胞周期蛋白依赖性激酶抑制剂样多肽的物质和方法
CN1842591A (zh) 提高植物中油脂水平的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication