CN1564866B - 自加工的植物及植物部分 - Google Patents

自加工的植物及植物部分 Download PDF

Info

Publication number
CN1564866B
CN1564866B CN028198565A CN02819856A CN1564866B CN 1564866 B CN1564866 B CN 1564866B CN 028198565 A CN028198565 A CN 028198565A CN 02819856 A CN02819856 A CN 02819856A CN 1564866 B CN1564866 B CN 1564866B
Authority
CN
China
Prior art keywords
plant
enzyme
starch
corn
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN028198565A
Other languages
English (en)
Other versions
CN1564866A (zh
Inventor
M·B·拉纳汉
S·S·巴苏
C·J·巴泰
陈文�
J·克莱格
M·肯克玛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=23223692&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1564866(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN1564866A publication Critical patent/CN1564866A/zh
Application granted granted Critical
Publication of CN1564866B publication Critical patent/CN1564866B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2428Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2422Alpha-amylase (3.2.1.1.) from plant source
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • C12N9/2457Pullulanase (3.2.1.41)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • C12N9/246Isoamylase (3.2.1.68)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01001Alpha-amylase (3.2.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01003Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/0102Alpha-glucosidase (3.2.1.20)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01041Pullulanase (3.2.1.41)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01068Isoamylase (3.2.1.68)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明提供多核苷酸序列,优选合成的多核苷酸,其编码为在植物中表达而优化的加工酶。该多核苷酸编码耐中温、耐高温或耐超高温的加工酶,该酶在适当的活化条件下能够被活化从而对目的底物发挥作用,本发明还提供“自加工”的转基因植物以及植物部分,如谷粒,这些植物能够表达一种或多种这样的酶,并且具有改变了的组分,所述组分利于植物和谷粒生长。还提供了制备及使用这些植物的方法,例如生产风味改善的食物产品的方法,生产可发酵底物用于制备乙醇以及发酵饮料的方法。

Description

自加工的植物及植物部分
相关申请
本申请要求于2001年8月27日申请的申请No.60/315,281的优先权,该申请并入本文作为参考。
技术领域
本发明基本涉及植物分子生物学领域,更具体而言,涉及生产能够表达加工酶(processing enzyme)的植物,所述酶能够给该植物或其产品带来期望的特性。
背景技术
酶通常被用来加工各种各样的农产品,如木材,水果和蔬菜,淀粉,果汁等等。一般而言,加工所用的酶是从不同来源以工业规模生产并回收的,例如来自微生物微生物发酵(芽孢杆菌α-淀粉酶)或从植物分离(咖啡β-半乳糖苷酶或木瓜蛋白酶来自植物部分)。通过在适当含水量,温度,时间和机械混合条件下混合酶和底物,使酶反应以商业上可行的方式实现,酶制品在不同处理应用中得到使用。这些方法涉及酶的生产,酶制剂的制备,酶与底物的混合,以及将混合物置于适当条件下以促进酶促反应等分离的步骤。能够减少或省下时间,能量,混合,资本投入,和/或酶生产成本,或者生产出改良或新型产品的方法都是有用和有益的。对这些方面有所需求的一个实例就是玉米粉碎领域。
目前,玉米是经过粉碎以获得玉米淀粉和其它玉米粉碎副产品,如玉米面筋饲料,玉米面筋粉和玉米油。经过这个过程得到的淀粉通常还需要进一步被处理成其它产品,如衍生淀粉和糖,或通过发酵来制备包括醇类或乳酸在内的一系列产品。处理玉米淀粉经常涉及各种酶的应用,特别是能够水解并转化淀粉为可发酵糖或果糖的酶(α-和葡萄糖-淀粉酶,α-葡糖糖苷酶,葡萄糖异构酶等)。目前商业应用的处理过程均为资本密集型,因为必须建造非常巨大的碾碎机才能以合理成本效率所需的大规模处理玉米。另外,这个过程需要单独制备水解或修饰淀粉的酶然后需要机械来混合酶和底物以生产水解的淀粉产物。
从玉米粒回收淀粉的过程已众所周知,并涉及湿磨加工。玉米湿磨法包括以下步骤:浸泡玉米粒,磨碎玉米粒和分离玉米粒的各组分。玉米粒被浸泡在浸泡容器内,该容器内有约120°F的对流水流,将玉米粒在浸泡容器内浸泡24-48小时。该浸泡水通常含有约0.2%重量百分比的二氧化硫。处理中使用二氧化硫来减少微生物的生长,同时也减少胚乳蛋白中的二硫键,以促进淀粉-蛋白的有效分离。通常,每蒲式耳玉米使用约0.59加仑浸泡水。浸泡水被认为是废液,通常含有不希望水平的残余二氧化硫。
然后将浸泡的玉米粒脱水,并进行一系列摩擦型粉碎机处理。第一套摩擦型粉碎机能够破裂玉米粒,从玉米粒的剩余部分释放出胚芽。以Bauer品牌出售一种适于湿磨的商业摩擦型粉碎机。通过离心从玉米粒的剩余部分分离出胚芽。一种常用的商业离心分离器是Merco离心分离器。摩擦粉碎机和离心分离器都是需要能量才能操作的大型昂贵机械。
该过程的下一个步骤是将剩余的玉米粒组分,包括淀粉,外皮,纤维和面筋继续进行另一套摩擦粉碎处理并传送通过清洗筛,从淀粉和面筋(胚乳蛋白)中分离出纤维组分。淀粉和面筋会通过这个筛网而纤维则不会。通过离心或在离心后进行第三次粉碎来从胚乳蛋白中分离出淀粉。离心形成了淀粉浆,将其脱水,并用新鲜水洗涤,干燥到约12%含水量。这种基本上纯的淀粉通常进一步用酶处理。
由于去除种子外皮、胚和胚乳蛋白可以将淀粉有效地与酶接触,这样获得的水解产物中其它玉米粒组分的污染也相对较少,因此要从玉米粒的其它组分中分离淀粉。分离还可以保证玉米粒的其它组分被有效回收,继而作为副产品出售,以提高工厂的收益。
湿磨处理得到淀粉后,通常还要经过凝胶化(gelatinization),液化和糊精化作用以获得麦芽糖糊精产品,而其后的糖化,异构化和精炼步骤是用于制备葡萄糖,麦芽糖和果糖。
由于目前可获得的酶不能快速地水解结晶淀粉,所以在淀粉水解过程中进行凝胶化作用。为了使淀粉可被水解酶作用,通常用水(20-40%干物质)将淀粉制成浆状,然后在适当的胶凝作用温度下加热。对于玉米淀粉而言,该温度为105°-110℃。凝胶化的淀粉通常非常粘稠,因此在下一个被称为液化的步骤中被稀薄化。液化破坏了淀粉葡萄糖分子间的一些键,可以通过酶或使用酸进行。该步骤以及其后的糊精化步骤中均使用热稳定的内切α-淀粉酶。在糊精化步骤中控制水解的程度以使得到的水解产物中葡萄糖可以达到期望的百分比。
根据所需要的产物,可以通过大量不同的外切淀粉酶和脱支酶对由液化步骤所得到的糊精产物进行进一步水解。如果最终的目的是果糖,那么通常使用固定化的葡萄糖异构酶将葡萄糖转化为果糖。
通过干磨法从玉米淀粉制备可发酵糖(然后制备例如乙醇)能够促进外源性淀粉酶有效地接触淀粉的步骤。这些方法比湿磨法的资本投入低,但是由于这些方法得到的副产品通常不如湿磨法得到的有价值,因此,仍然希望获得显著的成本利益。例如,在湿磨的玉米中,玉米粒被磨成粉末以促进玉米与降解酶的有效接触。玉米粉经酶水解后,由于残留的固体含有蛋白质和一些其它组分,所以还可用作饲料。Eckhoff最近在一篇名为“Fermentation and costs of fuel ethanol fromcorn with quick-germ process”的论文中阐述了湿磨法的改良潜力以及相关问题(Appl.Biochem.Biotechno1.,94:41(2001))。这种“快速胚芽(quick-germ)”方法能够使用缩短的浸泡时间从淀粉中分离出富含油的胚芽。
内生性加工酶在植物中的调控和/或水平可以形成目的产物的这样的一个例子是甜玉米。典型的甜玉米品种与饲料玉米(tield corn)品种的区别在于甜玉米不能生物合成正常水平的淀粉。在淀粉生物合成相关酶编码基因中的遗传突变通常被用于甜玉米品种以限制淀粉的生物合成。这种突变(例如甜和超甜突变)都位于淀粉合酶和ADP-葡萄糖焦磷酸化酶编码基因中。产生可口甜味所需要的三种单糖——果糖,葡萄糖和蔗糖在这些突变株内的发育胚乳中累积,而这种甜味正是可食用鲜玉米消费者所青睐的。但是,如果淀粉累积的水平过高而使得玉米成熟过长时间(晚熟收获)或者玉米在被消费前保存了过长时间,那么就会丧失甜味而变为淀粉味和口感(mouthfeel)。因此甜玉米的收获期(harvest window)非常窄,并且储藏期限有限。
种植甜玉米的农民的另一困难是这些品种的应用仅仅限制在可食用食品上。如果农民在种子发育期希望放弃收获甜玉米用作可使用食品,那么收成将损失相当大。甜玉米的谷物产量和质量会因为两个基本原因而较低。第一个原因是淀粉生物合成途径中的突变破坏了淀粉生物合成的机制,玉米还没有完全灌浆,导致产量和质量损失。第二,由于在玉米中存在高水平的糖,不能将这些糖贮存为淀粉,这些种子的整体吸收强度(sink strength)有所减少,而这加剧了玉米粒中储存营养的缩减。这些甜玉米品种种子的胚乳会收缩并破裂,而不会经历适当的干燥过程,并且易于染病。甜玉米谷物的这种低质量还会有进一步的农艺学影响;如种子存活率低,发芽率低,秧苗易染病,以及早期秧苗不易存活等,这都是由于淀粉累积量过低而导致的各种因素所致。这样,甜玉米质量低的问题会影响消费者,农民/种植者,经销商和种子生产商。
于是,对于干磨法,渴望有一种能改进这种工艺和/或提高副产品价值的方法。对于湿磨法,需要有一种淀粉加工方法能够不需要配备长时间浸泡,研磨,粉碎和/或分离玉米粒组分所需的设备。例如,需要能够在湿磨法中修改或省掉浸泡步骤,因为这可以减少需要处理的废液的量,从而节省能源和时间,并提高研磨容量(会缩短玉米粒在浸泡容器内的时间)。还需要消除或改进将含淀粉的胚乳与胚分离的方法。
发明概述
本发明涉及自加工(self-processing)植物和植物部分以及其使用方法。本发明的自加工植物和植物部分能够表达并活化(耐中温,耐高温(thermophilic)和耐超高温(hyperthermophilic))酶。活化了(耐中温,耐高温和耐超高温)酶后,植物和植物部分能够对底物进行自加工,以此获得目的产物。
本发明提供分离的多核苷酸,该多核苷酸a)含有SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52或59或者其互补序列,或在低严谨性杂交条件下能够与SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52或59任一序列的互补序列杂交、并且编码具有α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸,或者b)编码含有SEQ ID NO:10,13,14,15,16,18,20,24,26,27,28,29,30,33,34,35,36,38,40,42,44,45,47,49或51的多肽或其酶活性片段。优选地,该分离的多核苷酸编码含有第一多肽和第二肽的融合多肽,其中所述第一多肽具有α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶或葡糖淀粉酶活性。最优选地,第二肽含有信号序列肽,其能够将第一多肽靶向植物的液泡,内质网,叶绿体,淀粉颗粒,种子或细胞壁。例如,该信号序列可以是waxy的N末端信号序列,γ-玉米醇溶蛋白的N末端信号序列,淀粉结合域,或者C末端淀粉结合域。还进一步包括下述多核苷酸:在低严谨性杂交条件下能够与SEQ ID NO:2,9,或52任一序列的互补序列杂交并且编码具有α-淀粉酶活性的多肽的多核苷酸,在低严谨性杂交条件下能够与SEQ ID NO:4或25的互补序列杂交并且编码具有支链淀粉酶活性的多肽的多核苷酸,在低严谨性杂交条件下能够与SEQ ID NO:6的互补序列杂交并且编码具有α-葡糖苷酶活性的多肽的多核苷酸;在低严谨性杂交条件下能够与SEQ ID NO:19,21,37,39,41或43任一序列的互补序列杂交并且编码具有葡糖异构酶活性的多肽的多核苷酸;在低严谨性杂交条件下能够与SEQ ID NO:46,48,50或59的互补序列杂交并且编码具有葡糖淀粉酶活性的多肽的多核苷酸。
另外,还提供含有多核苷酸的表达盒,所述多核苷酸a)具有SEQID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52,或59或其互补序列,或在低严谨性杂交条件下能够与SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52,或59任一序列的互补序列杂交并且编码具有α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸,或者b)编码含有SEQ ID NO:10,13,14,15,16,18,20,24,26,27,28,29,30,33,34,35,36,38,40,42,44,45,47,49或51的多肽或其酶活性片段。优选地,该表达盒进一步含有与所述多核苷酸可操作地相连的启动子,例如诱导型启动子,组织特异性启动子或优选胚乳特异性启动子。优选地,该胚乳特异性启动子为玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子。在一个优选实施方式中,该启动子含有SEQ ID NO:11或SEQ ID NO:12。而且,在另一优选实施方式中该多核苷酸是以相对于启动子而言为有义的方向定位。本发明的表达盒还可以进一步编码与所述多核苷酸编码多肽可操作地相连的信号序列。该信号序列优选将与其可操作地相连的多肽靶向植物的液泡,内质网,叶绿体,淀粉颗粒(starch granule),种子或细胞壁。优选的信号序列包括waxy的N末端信号序列,γ-玉米醇溶蛋白的N末端信号序列,或者淀粉结合域。
本发明还涉及含有本发明表达盒的载体或细胞。细胞可选自:土壤杆菌,单子叶植物细胞,双子叶植物细胞,Liliopsida细胞,Panicoideae细胞,玉米细胞,和谷类细胞。优选细胞是玉米细胞。
本发明还包括用本发明载体稳定转化的植物。本发明提供用含有α-淀粉酶的载体稳定转化的植物,所述α-淀粉酶具有SEQ ID NO:1,10,13,14,15,16,33,或35的任一氨基酸序列,或由含有SEQ IDNO:2或9的多核苷酸所编码。优选α-淀粉酶是耐超高温的。
在另一实施方式中,还提供用含有支链淀粉酶的载体稳定转化的植物,所述支链淀粉酶具有SEQ ID NO:24或34的任一氨基酸序列,或由含有SEQ ID NO:4或25的多核苷酸所编码。还提供用含有α-葡糖苷酶的载体稳定转化的植物,所述α-葡糖苷酶具有SEQ ID NO:26或27的任一氨基酸序列,或由含有SEQ ID NO:6的多核苷酸所编码。优选该α-葡糖苷酶是耐超高温的。还描述了用含有葡萄糖异构酶的载体稳定转化的植物,所述葡萄糖异构酶具有SEQ ID NO:18,20,28,29,30,38,40,42,或44的任一氨基酸序列,或由含有SEQ IDNO:19,21,37,39,41或43的多核苷酸所编码。优选该葡萄糖异构酶是耐超高温的。在另一实施方案中还描述了用含有葡糖淀粉酶的载体稳定转化的植物,所述葡糖淀粉酶具有SEQ ID NO:45,47或49的任一氨基酸序列,或由含有SEQ ID NO:46,48,50,或59的多核苷酸所编码。优选该葡萄糖淀粉酶是耐超高温的。
还提供从本发明被稳定转化的植物获得的植物产品,如种子,果实或谷粒。
在另一实施方案中,本发明还涉及转化的植物,其基因组中增加有重组多核苷酸,所述多核苷酸与启动子序列可操作地相连且编码至少一种加工酶,该多核苷酸的序列已被优化用于在所述植物内表达。该植物可以是单子叶植物,如玉米,或双子叶植物。优选该植物为谷类植物或经济植物。加工酶选自:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,葡聚糖酶,β-淀粉酶,α-葡糖苷酶,异淀粉酶,支链淀粉酶,新支链淀粉酶(neo-pullulanase),异支链淀粉酶(iso-pullulanase),淀粉支链淀粉酶(amylopullulanase),纤维素酶,外切-1,4-β-纤维二糖水解酶,外切-1,3-β-D-葡聚糖酶,β-葡糖苷酶,内切葡聚糖酶,L-阿拉伯糖酶,α-阿拉伯糖苷酶,半乳聚糖酶(galactanase),半乳糖苷酶,甘露聚糖酶,甘露糖苷酶,木聚糖酶,木糖苷酶,蛋白酶,葡聚糖酶,木聚糖酶,酯酶,植酸酶和脂肪酶。优选该加工酶为选自下述的淀粉加工酶:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,β-淀粉酶,α-葡糖苷酶,异淀粉酶,支链淀粉酶,新支链淀粉酶,异支链淀粉酶和淀粉支链淀粉酶(amylopullulanase)。更优选该酶选自:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,葡萄糖异构酶,α-葡糖苷酶,和支链淀粉酶。还进一步优选耐超高温的加工酶。根据本发明,酶可以是选自下述的非淀粉降解酶:蛋白酶,葡聚糖酶,木聚糖酶,酯酶,植酸酶和脂肪酶。这些酶还可以是耐超高温的。在一个优选实施方案中,该酶能够在植物的液泡,内质网,叶绿体,淀粉颗粒,种子或细胞壁中累积。而且,在另一实施方案中,植物的基因组中还可以增加含有非耐超高温酶的第二重组多核苷酸。
本发明另一方面提供转化的植物,其基因组中增加了编码至少一种选自下述的加工酶的重组多核苷酸:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶和支链淀粉酶,所述多核苷酸与启动子序列可操作地相连,该多核苷酸的序列已被优化用于在该植物中表达。优选该加工酶为耐超高温酶和玉米。
另一实施方案提供转化的玉米植物,其基因组中增加了编码至少一种选自下述的加工酶的重组多核苷酸:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶和支链淀粉酶,所述多核苷酸与启动子序列可操作地相连,该多核苷酸的序列已被优化用于在玉米植物中表达。优选该加工酶为耐超高温酶。
还提供了转化的植物,其基因组增加了具有SEQ ID NO:2,9或52的重组多核苷酸,所述多核苷酸与启动子和信号序列可操作地相连。另外,还描述了转化的植物,其基因组增加了具有SEQ ID NO:4或25的重组多核苷酸,所述多核苷酸与启动子和信号序列可操作地相连。在另一实施方案中还描述了转化的植物,其基因组增加了具有SEQ ID NO:6的重组多核苷酸,所述多核苷酸与启动子和信号序列可操作地相连。另外,还提供了转化的植物,其基因组增加了具有SEQID NO:19,21,37,39,41或43的重组多核苷酸。转化的植物,其基因组增加了具有SEQ ID NO:46,48,50或59的重组多核苷酸。
本文还进一步设想了从转化的植物获得的产品。产品包括例如:种子,果实,或谷粒。该产品还可以是加工酶,淀粉或糖。
还进一步描述了从本发明被稳定转化的植物所获得的植物。在这个方面而言,该植物可以是杂交植物或近交(inbred)植物。
本发明的另一实施方案还提供了淀粉组合物,其含有至少一种加工酶,该酶是蛋白酶、葡聚糖酶或酯酶。优选该酶耐超高温。
本发明的另一实施方案提供含有至少一种加工酶的谷粒(grain),所述酶是α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶或葡萄糖异构酶。优选该酶耐超高温。
另一实施方案提供了制备淀粉颗粒的方法,包括:将含有至少一种非淀粉加工酶的谷物在能够激活所述至少一种酶的条件下处理,产生含有淀粉颗粒和非淀粉降解产物的混合物,其中所述谷物获自转化的植物,其基因组增加了编码至少一种酶的表达盒;并从混合物中分离出淀粉颗粒。其中,所述优选为蛋白酶,葡聚糖酶,木聚糖酶,植酸酶或酯酶。而且优选该酶耐超高温。所述谷物可以是经碎裂化的谷物和/或可以在低或高含水量条件下处理。或者,该谷物可以用二氧化硫处理。优选本发明进一步包括从混合物中分离非淀粉产品。还进一步描述了由该方法获得的淀粉产品和非淀粉产品。
在另一实施方案中,还提供了生产超甜玉米(hypersweet corn)的方法,包括在能够活化所述至少一种酶的条件下处理转化的玉米或其部分,以使玉米中的多糖转化为糖(sugar)从而获得超甜玉米,所述玉米或其部分的基因组已增加了编码至少一种淀粉降解酶或淀粉异构酶的表达盒,并在胚乳中表达该表达盒。该表达盒优选进一步含有与酶编码多核苷酸可操作连接的启动子。该启动子可以是例如组成型启动子,种子特异性启动子或胚乳特异性启动子。优选该酶耐超高温。更优选该酶为α-淀粉酶。这里所用的表达盒还可进一步含有编码信号序列的多核苷酸,该信号序列与所述至少一种酶可操作连接。信号序列可以将耐超高温酶导向例如质外体或内质网。优选该酶含有SEQ IDNO:13,14,15,16,33或35任一序列。
在最优选的实施方案中,描述了产生超甜玉米的方法,包括在下述条件下处理转化的玉米或其部分,该玉米或其部分的基因组已增加了编码α-淀粉酶的表达盒,并在胚乳冲中表达该表达盒,所述条件能够活化所述至少一种酶,以将玉米中的多糖转化为糖,产生超甜玉米。优选地该酶是耐超高温的,该耐超高温α-淀粉酶含有SEQ ID NO:10、13、14、15、16、33或35任何氨基酸序列,或其具有α-淀粉酶活性的酶活性片段。
本文还描述了制备水解的淀粉产物的溶液的方法,包括在能够活化所述至少一种酶的条件下处理含有淀粉颗粒和至少一种加工酶的植物部分,从而使酶加工淀粉颗粒以形成含有水解的淀粉产物的水溶液,其中所述植物部分是获自转化的植物,所述植物的基因组增加了编码所述至少一种淀粉加工酶的表达盒;并收集含有水解的淀粉产物的水性溶液。水解的淀粉产物可以含有糊精,麦芽寡糖,葡萄糖和/或其混合物。优选该酶为α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,淀粉支链淀粉酶,葡萄糖异构酶或其组合。另外,优选该酶耐超高温。另一方面,该植物部分的基因组还可进一步增加编码非耐超高温淀粉加工酶的表达盒。该非耐超高温淀粉加工酶可选自:淀粉酶,葡糖淀粉酶,α-葡糖苷酶,支链淀粉酶,葡萄糖异构酶或其组合。另一方面,该加工酶优选在胚乳中表达。优选该植物部分为颗粒,来自玉米,小麦,大麦,黑麦,燕麦,甘蔗或稻。优选所述的至少一种加工酶与启动子和信号序列可操作地相连,所述信号肽能够将酶导向淀粉颗粒或内质网或细胞壁。该方法还可进一步包括分离水解的淀粉产物和/或发酵水解的淀粉产物的步骤。
本发明的另一方面描述了制备水解的淀粉产物的方法,包括在能够活化所述至少一种酶的条件下处理含有淀粉颗粒和至少一种淀粉加工酶的植物部分,从而使酶加工淀粉颗粒以形成成含有水解的淀粉产物的水性溶液,其中所述植物部分是获自转化的植物,所述植物的基因组已增加了编码至少一种α-淀粉酶的表达盒;并收集含有水解的淀粉产物的水性溶液。优选该α-淀粉酶可以耐超高温,更优选该耐超高温的α-淀粉酶含有SEQ ID NO:1,10,13,14,15,16,33或35任一序列的氨基酸序列,或其具有α-淀粉酶活性的片段。优选地,该表达盒含有选自如下序列的多核苷酸:SEQ ID NO:2,9,46或52或其互补序列,或者在低严谨性杂交条件下能够与SEQ ID NO:2,9,46或52杂交并且编码具有α-淀粉酶活性的多肽的多核苷酸。同时,本发明还包括进一步含有编码非耐超高温淀粉加工酶的多核苷酸的转化植物的基因组。或者,可以用非耐超高温淀粉加工酶处理植物的部分。
本发明还提供含有在植物细胞中存在的至少一种淀粉加工酶的转化植物部分,其中该植物部分是获自转化的植物,该植物的基因组已增加了编码至少一种淀粉加工酶的表达盒。优选地,该酶为选自下述的淀粉加工酶:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,β淀粉酶,α-葡糖苷酶,异淀粉酶,支链淀粉酶,新支链淀粉酶,异支链淀粉酶和淀粉支链淀粉酶。同时,优选该酶耐超高温。所述植物可以是任何植物,但优选玉米。
本发明另一实施方案是含有在植物的细胞或细胞壁内存在的至少一种非淀粉加工酶的转化植物部分,其中所述植物部分获自转化植物,该植物的基因组已增加了编码至少一种非淀粉加工酶或至少一种非淀粉多糖加工酶的表达盒。优选地,该酶耐超高温。同时,所述非淀粉加工酶优选选自:蛋白酶,葡聚糖酶,木聚糖酶,酯酶,植酸酶和脂酶。所述植物部分可以是任何植物部分,但优选穗,种子,果实,谷粒,秸杆(stover),谷壳或渣屑(bagasse)。
本发明还提供转化的植物部分。例如,描述了含有α-淀粉酶的转化植物部分,所述淀粉酶具有SEQ ID NO:1,10,13,14,15,16,33或35任一序列的氨基酸序列,或者由含有SEQ ID NO:2,9,46或52任一序列的多核苷酸所编码;含有α-葡糖苷酶的转化植物部分,所述α-葡糖苷酶具有SEQ ID NO:5,26或27任一序列的氨基酸序列,或者由含有SEQ ID NO:6的多核苷酸所编码;含有葡萄糖异构酶的转化植物部分,所述葡萄糖异构酶具有SEQ ID NO:28,29,30,38,40,42或44任一序列的氨基酸序列,或者由含有SEQ ID NO:19,21,37,39,41或43任一序列的多核苷酸所编码;含有葡糖淀粉酶的转化植物部分,所述葡糖淀粉酶具有SEQ ID NO:45或SEQ ID NO:47或SEQ ID NO:49的氨基酸序列,或者由含有SEQ ID NO:46,48,50或59任一序列的多核苷酸所编码;以及含有支链淀粉酶的转化植物部分,所述支链淀粉酶由含有SEQ ID NO:4或25任一序列的多核苷酸序列所编码。
另一实施方案提供了转化植物部分中淀粉的转化方法,包括活化其中所含淀粉加工酶。还提供了根据该方法获得的淀粉,糊精,麦芽寡糖或糖。
本发明还描述了在植物部分的细胞壁或细胞内含有至少一种非淀粉加工酶的转化植物部分的使用方法,包括在一定条件下处理含有至少一种非淀粉多糖加工酶的转化植物部分,以活化所述的至少一种酶酶来消化非淀粉多糖从而形成含有寡糖和/或糖(sugars)的水性溶液,其中所述植物部分是获自转化的植物,所述植物的基因组已增加了编码所述至少一种非淀粉多糖加工酶的表达盒;并收集含有寡糖和/或糖的水性溶液。优选该非淀粉多糖加工酶可以耐超高温。
还提供了使用含有至少一种加工酶的转化种子的方法,包括在能够活化所述至少一种酶的条件下,处理含有至少一种蛋白酶或脂酶的转化种子,从而获得含有氨基酸和脂肪酸的水性混合物,其中所述种子获自转化的植物,所述植物的基因组已增加了编码所述至少一种酶的表达盒;并收集水性混合物。优选氨基酸或脂肪酸或二者均为分离的。优选所述至少一种蛋白酶或脂酶可以耐超高温。
制备乙醇的方法,包括在能够激活所述至少一种酶的条件下处理含有至少一种多糖加工酶的植物部分,从而降解多糖以形成寡糖或可发酵糖,其中所述植物部分获自转化的植物,所述植物的基因组增加了编码所述至少一种多糖加工酶的表达盒;并在能够促进可发酵糖或寡糖转化为乙醇的条件下保温可发酵糖。优选植物部分为谷粒,果实,种子,茎,木材,蔬菜或根。优选该植物部分获自选自下述的植物:燕麦,大麦,小麦,浆果,葡萄,黑麦,玉米,稻,马铃薯,甜菜,甘蔗,菠萝,草和树。在另一优选实施方案中,该多糖加工酶为:α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,葡萄糖异构酶,支链淀粉酶或其组合。
还提供了一种制备乙醇的方法,包括在能够活化所述至少一种酶的时间和条件下,将含有至少一种选自下组的酶的植物部分加热处理以使多糖消化从而形成可发酵糖:α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,葡萄糖异构酶,支链淀粉酶或其组合,其中所述植物部分获自转化的植物,所述植物的基因组已增加了编码该至少一种酶的表达盒;并在能够促进可发酵糖转化为乙醇的条件下保温可发酵糖。优选所述的至少一种酶可以耐超高温或耐中温。
在另一实施方案中描述了制备乙醇的方法,包括在能够活化所述至少一种酶的条件下,处理含有至少一种非淀粉加工酶的植物部分以使非淀粉多糖消化成寡糖和可发酵糖,其中所述植物部分获自转化的植物,所述植物的基因组增加了编码该至少一种酶的表达盒;并在能够促进可发酵糖转化为乙醇的条件下保温可发酵糖。优选所述非淀粉加工酶为葡聚糖酶,木聚糖酶或纤维素酶。
还提供了一种制备乙醇的方法,包括在能够活化所述的至少一种酶条件下,处理含有至少一种选自下组的酶的植物部分以使多糖消化成可发酵糖:α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,葡萄糖异构酶,支链淀粉酶或其组合,其中所述植物部分获自转化的植物,所述植物的基因组增加了编码所述至少一种酶的表达盒;并在能够促进可发酵糖转化为乙醇的条件下保温可发酵糖。优选该酶耐超高温。
同时还提供了无需额外加入甜味剂而生产增甜谷粉制食品(farinaceous food product)的方法,包括在能够活化所述至少一种酶的条件下,处理含有至少一种淀粉加工酶的植物部分以将植物部分中的淀粉颗粒加工成糖类从而形成甜味产品,其中所述植物部分获自转化的植物,所述植物的基因组已增加了编码所述至少一种酶的表达盒;并将所述甜味产品加工成谷粉制食品。所述谷粉制食品可以由甜味产品和水制成。另外,所述谷粉制食品可以含有麦芽,调味剂,维生素,矿物质,着色剂或其组合。优选所述的至少一种酶可以耐超高温。该酶可选自:α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其任何组合。所述植物还可以选自:大豆,黑麦,燕麦,大麦,小麦,玉米,稻和甘蔗。优选所述谷粉制食品是谷类食品,早餐食品,即食食品或焙烤食品。该方法中还可以包括焙烤,煮沸,加热,蒸汽加工,放电(electrical discharge)或其组合。
本发明还提供了无需加入甜味剂使含淀粉的产品增甜的方法,包括在能够活化所述至少一种酶的条件下,处理含有至少一种淀粉加工酶的淀粉以使淀粉消化形成糖从而形成甜味淀粉,其中所述淀粉获自转化的植物,所述植物的基因组已增加了编码所述至少一种酶的表达盒;并将所述甜味淀粉加入产品以制成甜味的含淀粉产品。所述转化植物优选选自:玉米,大豆,黑麦,燕麦,大麦,小麦,稻和甘蔗。优选所述的至少一种酶可以耐超高温。更优选该至少一种酶为α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其组合。
本发明还提供谷粉制食品和甜味含淀粉产品。
本发明还提供了使含多糖水果或蔬菜增甜的方法,包括在能够活化所述至少一种酶的条件下,处理含有至少一种多糖加工酶的水果或蔬菜,由此加工水果或蔬菜中的多糖形成糖(sugar),获得甜味水果或蔬菜,其中所述水果或蔬菜获自转化的植物,所述植物的基因组已增加了编码所述至少一种多糖加工酶的表达盒。所述水果或蔬菜选自马铃薯,番茄,香蕉,南瓜,豌豆和菜豆。优选所述的至少一种酶可以耐超高温。
本发明还进一步提供制备含糖的水性溶液的方法,包括在能够活化所述至少一种酶的条件下,处理获自植物部分的淀粉颗粒,从而得到含糖的水性溶液。
另一实施方案提供了在淀粉衍生产物回收之前不涉及湿磨(wetmilling)或干磨(dry milling)谷粒而从谷粒中制备淀粉衍生产物的方法,包括在能够活化所述至少一种酶的条件下,处理含有淀粉颗粒和至少一种淀粉加工酶的植物部分,以加工淀粉颗粒形成含有糊精或糖的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组已增加了编码所述至少一种淀粉加工酶的表达盒;并收集所述含有淀粉衍生产物的水性溶液。优选所述的至少一种淀粉加工酶可以耐超高温。
还提供了分离α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶和支链淀粉酶的方法,包括栽培所述转化植物和从中分离α-淀粉酶、葡糖淀粉酶、葡糖异构酶、α-葡糖苷酶和支链淀粉酶。优选所述酶可以耐超高温。
还提供了制备麦芽糖糊精的方法,包括将转基因谷物与水混合,加热该混合物,从形成的糊精糖浆中分离出固体,并收集麦芽糖糊精。优选该转基因谷物含有至少一种淀粉加工酶。优选该淀粉加工酶是α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,和葡萄糖异构酶。同时还提供了由该方法所形成的麦芽糖糊精和组合物。
本发明提供在回收淀粉衍生产物之前不涉及机械破裂谷粒而从谷粒制备糊精或糖的方法,包括在能够活化所述至少一种酶的条件下,处理含有淀粉颗粒和至少一种淀粉加工酶的植物部分,以加工淀粉颗粒形成含有糊精或糖的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组增加了编码所述至少一种加工酶的表达盒;并收集所述含有糖和/或糊精的水性溶液。
本发明还提供了制备可发酵糖的方法,包括在能够活化所述至少一种酶的条件下,处理含有淀粉颗粒和至少一种淀粉加工酶的植物部分,以加工淀粉颗粒形成含有糊精或糖的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组已增加了编码所述至少一种加工酶的表达盒;并收集所述含有可发酵糖的水性溶液。
同时本发明还包括由含有耐超高温α-淀粉酶的载体稳定转化的玉米植物。优选例如由含有α-淀粉酶编码多核苷酸序列的载体所稳定转化的玉米植物,所述α-淀粉酶与SEQ ID NO:1或SEQ ID NO:51具有大于60%的一致性。
附图说明
图1A和图1B表明在来自pNOV6201植物的分离的T1谷粒和来自六个pNOV6200系的玉米粒中以及胚乳中表达的α-淀粉酶活性。
图2表明来自pNOV6201系的分离T1谷粒中α-淀粉酶活性。
图3表明将含有热稳定性797GL3α-淀粉酶的转基因玉米糊状物发酵后所形成的乙醇的量,所述糊状物已在85℃和95℃经历了不超过60分钟的液化。该图说明发酵72小时所得到的乙醇产量在液化15分钟到60分钟之间几乎没有变化。而且还显示在95℃液化产生的糊状物在各个时间点形成的乙醇产量比85℃液化产生的糊状物的高。
图4表明含有热稳定性α-淀粉酶的转基因玉米糊状物在经过了85℃和95℃的不超过60分钟的液化然后再发酵后残留的淀粉量(%)。该图表明发酵72小时的乙醇产量在液化15分钟到60分钟之间几乎没有变化。而且还显示在95℃液化产生的糊状物在各个时间点形成的乙醇产量比85℃液化产生的糊状物的更高。
图5表明转基因玉米与对照玉米及其各种混合物在85℃和95℃制备的糊状物所形成的乙醇产量。该图表明:由于发酵后淀粉剩余量减少,因此含有α-淀粉酶的转基因玉米在使淀粉可被发酵利用方面有显著改进。
图6表明转基因谷物,对照玉米及其各种混合物在85℃和95℃制备的糊状物发酵后,在干燥釜留物(stillage)中测得的残留淀粉量。
图7显示含有3%转基因玉米的样品在5.2-6.4的不同pH范围,在20-80小时的时间作为发酵时间函数的乙醇产量。该图说明在较低pH条件下进行的发酵的速度比pH6.0或更高pH条件下快。
图8表明含有0-12wt%不同重量百分比转基因玉米的糊状物在5.2-6.4的不同pH范围的发酵过程中的乙醇产量。该图表明乙醇的产量与样品中转基因谷物的含量无关。
图9显示来自由pNOV7005转化的不同事件的T2种子分析结果。相较于非转基因的对照,可以在许多事件中检测到支链淀粉酶活性的高表达。
图10A和图10B显示转基因玉米粉中由表达的支链淀粉酶所产生的淀粉水解产物的HPLC分析结果。将表达支链淀粉酶的玉米的面粉在反应缓冲液中75℃保温30分钟,从玉米淀粉中形成中等链寡糖(聚合程度(DP)约为10-30)和短的直链淀粉(DP约为100-200)。图10A和图10B显示加入的钙离子对于支链淀粉酶酶活的影响效果。
图11A和图11B显示两种反应混合物的淀粉水解产物经HPLC分析后形成的数据。被标示为“淀粉酶”的第一种反应含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米粉样品混合物[1∶1(w/w)];而“淀粉酶+支链淀粉酶”的第二种反应混合物则含有表达α-淀粉酶的转基因玉米和表达支链淀粉酶的转基因玉米的玉米粉样品混合物[1∶1(w/w)]。
图12表明两种混合物的每25μl反应混合物中糖产物的μg量。被标示为“淀粉酶”的第一种反应含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米粉样品混合物[1∶1(w/w)];而“淀粉酶+支链淀粉酶”的第二种反应混合物则含有能表达α-淀粉酶的转基因玉米和能表达支链淀粉酶的转基因玉米的玉米粉样品混合物[1∶1(w/w)]。
图13A和图13B显示在85℃和95℃保温30分钟结束时两组反应混合物的淀粉水解产物。每组中都有两种反应混合物;第一种反应被称为“淀粉酶X支链淀粉酶”,含有既能表达α-淀粉酶又能表达支链淀粉酶的转基因玉米(通过异花授粉而产生)的玉米粉,第二种反应为“淀粉酶”,是表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米粉样品混合物,二者以能够获得与杂交玉米(淀粉酶X支链淀粉酶)观察到的相同量的α-淀粉酶活性的比例混合。
图14表明淀粉转化为葡萄糖的降解作用,其中使用了非转基因玉米种子(对照),含有797GL3α-淀粉酶的转基因玉米种子以及797GL3转基因玉米种子和MalAα-葡糖苷酶的组合。
图15说明在室温或30℃下粗淀粉的转化。该图中,反应混合物1和2分别是水和淀粉在室温或30℃下的混合物。反应混合物3和4分别是大麦α-淀粉酶和淀粉在室温或30℃下的混合物。反应混合物5和6是热厌氧杆菌属(Thermoanaerobacterium)葡糖淀粉酶和淀粉在室温或30℃下的混合物。反应混合物7和8分别是大麦α-淀粉酶(sigma)和热厌氧杆菌属葡糖淀粉酶及淀粉在室温或30℃下的混合物。反应混合物9和10分别是大麦α-淀粉酶(sigma)对照和淀粉在室温或30℃下的混合物。热厌氧杆菌属葡糖淀粉酶产物的聚合程度(DP)已被标出。
图16显示如实施例19所述,使用α-淀粉酶,α-葡糖苷酶和葡萄糖异构酶组合从淀粉酶转基因玉米面粉中生产果糖。将淀粉酶玉米面粉和酶溶液加水或缓冲液一起混合。所有的反应都含有60mg淀粉酶玉米面粉,液体总体积均为600μl,90℃保温2小时。
图17表明100%来自自加工谷粒的淀粉酶玉米面粉在90℃保温0-1200分钟下反应产物峰面积对保湿时间的函数。
图18表明10%来自自加工谷粒的淀粉酶玉米面粉和90%对照玉米面粉在90℃保温0-1200分钟下反应产物峰面积对保温时间的函数。
图19提供在70°,80°,90°或100℃下保温不超过90分钟的转基因淀粉酶玉米面粉的HPLC分析结果,来评价温度对淀粉水解的影响。
图20表明在各种反应条件下,含有60mg转基因淀粉酶玉米面粉与酶溶液和水或缓冲液的混合物样品的ELSD峰面积。一组反应使用50mM MOPS缓冲,pH7.0,室温下,外加10mM MgSO4和1mMCoCl2;另一组反应中用水替代含金属的缓冲液。所有反应均在90℃保温2小时。
发明详述
本发明中,“自加工”植物或植物部分内已导入了分离的多核苷酸,该多核苷酸编码能够在植物体内加工,例如修饰,淀粉,多糖,脂类,蛋白等的加工酶,其中所述加工酶可以耐中温,高温或超高温,并可通过粉碎,加入水,加热或以其它方式提供酶发挥作用所需条件而被活化。所述编码加工酶的分离多核苷酸被整合到植物或植物部分中以在其中表达。表达和活化该酶后,本发明的植物或植物部分会加工所述加工酶作用的底物。因此,本发明的植物或植物部分在没有或只有减少的通常对这些底物进行加工所必需的外部因素存在下,当其中的加工酶被活化之后能够对该酶的底物进行自加工。因此,本发明的转化植物,转化植物细胞和转化植物部分具有“内在”的加工能力,能够通过掺入其中的酶来加工期望的底物。优选该加工酶的编码多核苷酸为“遗传稳定的”,即,该多核苷酸能够在本发明的转化植物或植物部分中稳定地维持,并可通过连续世代而被后代稳定地继承。
根据本发明,使用这些植物和植物部分的方法能够在回收淀粉衍生产物之前不必经过粉碎或以其它方式物理破裂植物部分。例如,本发明提供了改进的处理玉米和其他谷物以回收淀粉衍生产物的方法。本发明还提供了允许回收淀粉颗粒的方法,所述淀粉颗粒在其内部或在其上含有一定水平的淀粉降解酶,所述水平的酶足以水解淀粉内部的特异键而无需加入外源淀粉水解酶。本发明还提供改进的来自通过本发明方法获得的自加工植物或植物部分的产品。
另外,“自加工”的转化植物部分,如谷粒,以及转化的植物避免了现有技术存在的主要问题,即,加工酶通常都由微生物发酵生产,这需要从培养上清液中分离酶,而这会耗费资金;分离的酶需要被处理以用于特殊应用,并且必须发展添加,混合和将酶与其底物反应的工艺及机械。本发明的转化植物或其部分还可以成为加工酶自身以及该酶的底物和产物,如糖,氨基酸,脂肪酸和淀粉及非淀粉多糖的来源。本发明的植物还可以用于制备后代植物,如杂种和近交种。
加工酶及其编码多核苷酸
加工酶(耐中温,高温或超高温)的编码多核苷酸被导入植物或其部分。根据在植物或转基因植物和/或期望终产物中所发现的该加工酶作用的期望底物来选择该加工酶。例如,该酶可以是淀粉加工酶,如淀粉降解或淀粉异构化酶,或者是非淀粉加工酶。适合的加工酶包括但不限于淀粉降解或淀粉异构化酶,例如包括α-淀粉酶,内切或外切-1,4或1,6-α-D,葡糖淀粉酶,葡萄糖异构酶,β-淀粉酶,α-葡糖苷酶和其它外切淀粉酶;以及淀粉脱支酶,如异淀粉酶,支链淀粉酶,新支链淀粉酶,异支链淀粉酶,淀粉支链淀粉酶等,糖基转移酶,如环糊精糖基转移酶等,纤维素酶如外切1,4-β-纤维二糖水解酶,外切-1,3-β-D-葡聚糖酶,半纤维素酶,β-葡糖苷酶等,内切葡聚糖酶如,内切-1,3-β-葡聚糖酶和内切-1,4-β-葡聚糖酶等;L-阿拉伯糖酶(L-arabinases),如内切-1,5-α-L-阿拉伯糖酶,β-阿拉糖苷酶等,半乳聚糖酶(galactanases)如内切1,4-β-D-半乳聚糖酶,内切1,3-β-D-半乳聚糖酶,β-半乳糖苷酶,α-半乳糖苷酶等;甘露聚糖酶(mannanases),如内切1,4-β-D-甘露聚糖酶,β-甘露糖苷酶,α-甘露糖苷酶等;木聚糖酶,如内切1,4-β-木聚糖酶,β-D-木糖苷酶,1,3-β-D-木聚糖酶等;以及果胶酶;和非淀粉加工酶,包括蛋白酶,葡聚糖酶,木聚糖酶,硫氧还蛋白/硫氧还蛋白还原酶,酯酶,植酸酶和脂酶。
在一个实施方案中,该加工酶为选自下述的淀粉降解酶:α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶,淀粉支链淀粉酶,葡萄糖异构酶或其组合。正如本发明将要进一步描述的:根据该实施方案,在将包含在植物或植物部分内的酶活化后,该淀粉降解酶能够使自加工植物或植物部分降解淀粉。可以根据期望的终产物来选择所述淀粉降解酶。例如,可以选择葡萄糖异构酶来将葡萄糖(己糖)转化为果糖。或者可以根据基于例如加工程度的函数而具有不同链长或具有各种期望的支链模式的期望淀粉衍生终产物来选择酶。比如,在较短保温时间条件下α-淀粉酶,葡糖淀粉酶或淀粉支链淀粉酶可以用来生产糊精产物,而在较长保温时间条件下来生产短链产物或糖。可使用支链淀粉酶特异性地水解淀粉的分支点来形成高直链淀粉的淀粉,或使用新支链淀粉酶来生产散布有1,6键的α-1,4键链的淀粉。可以使用葡糖苷酶来生产极限糊精,或者使用不同的各种组合来制备其它淀粉衍生物。
在另一实施方案中,该加工酶为选自下述的非淀粉加工酶:蛋白酶,葡聚糖酶,木聚糖酶和酯酶。这些非淀粉降解酶可以使本发明的自加工植物或植物部分并入其到植物的靶区域,并且当被激活后破坏植物却能使淀粉颗粒保持完整。例如,在一个优选的实施方案中,该非淀粉降解酶靶向植物细胞的胚乳基质并在活化后,破坏胚乳基质却能够保持胚乳基质内的淀粉颗粒不被破坏,而更易于从所得的材料中回收。
本发明还进一步提供了加工酶的各种组合。例如,可以结合使用淀粉加工酶和非淀粉加工酶。可利用编码各种酶的多基因构建体来获得加工酶的组合。或者,可通过已知的方法使已稳定转化各酶的单个转基因植物杂交来获得含有多种酶的植物。另一方法包括对转基因植物使用外源酶。
加工酶可以从任何来源分离或制备,而其相应多核苷酸可以由本领域技术人员确定。例如,该加工酶,优选α-淀粉酶,可来源于火球菌属(Pyrococcus)(如激烈火球菌(Pyrococcus furiosus)),栖热菌属(Thermus),热球菌属(Thermococcus)(如Thermococcushydrothermalis),硫化叶菌属(Sulfolobus)(如硫磺矿硫化叶菌(Sulfolobus solfataricus)),栖热袍菌属(Thermotoga)(如海栖热袍菌(T.maritima)和那不勒斯栖热袍菌(T.neapolitana)),热厌氧杆菌属(Thermoanaerobacterium)(如Thermoanaerobactertengcongensis),曲霉属(Aspergillus)(如Aspergillus shirousami和黑色曲霉(Aspergillus niger)),根霉属(Rhizopus)(如米根霉(Rhizopusoryzae)),热变形菌目(Thermoproteales),硫还原球菌属(Desulfurococcus)(如Desulfurococcus amylolyticus),嗜热碱甲烷杆菌(Methanobacterium thermoautotrophicum),詹氏甲烷球菌(Methanococcus jannaschii),坎氏甲烷嗜热菌(Methanopyruskandleri),Thermosynechococcus elongatus,耐酸热原体(Thermoplasma acidophilum),火山热原体(Thermoplasmavolcanium),敏捷气热菌(Aeropyrum perinx)和植物如玉米,大麦和稻。
本发明的加工酶能够在被导入植物基因组并被表达后活化。测定每个单个酶被活化的条件,可以包括各种条件,如温度,pH,水合作用,金属、活化性化合物、失活性化合物的存在等。例如,温度依赖性酶可包括耐中温,高温和超高温酶。耐中温酶通常在20-65℃具有最大活性,而在高于70℃的温度下会失活。耐中温酶在30-37℃具有显著的活性,优选在30℃的活性为最大活性的至少10%,更优选为最大活性的至少20%。
耐高温酶在50-80℃具有最大活性,而在高于80℃的温度下会失活。优选耐高温酶在30℃的活性低于最大活性的20%,更优选低于最大活性的10%。
耐超高温酶在更高温度下具有活性。耐超高温酶在高于80℃的温度下具有最大活性,而在至少80℃的温度下保持活性,更优选在至少90℃的温度下保持活性,最优选在至少95℃的温度下保持活性。耐超高温酶在低温条件下仍具有降低的活性。耐超高温酶在30℃的活性可以低于最大活性的10%,更优选低于最大活性的5%。
编码该加工酶的多核苷酸优选被修饰包含这样的密码子,所述密码子被优化用于在被选择生物体如植物体内表达(例如参见,Wada等,Nucl.Acids Res.,18:2367(1990),Murray等,Nucl.Acids Res.,17:477(1989),U.S.Patent Nos.5,096,825,5,625,136,5,670,356和5,874,304)。密码子优化的序列是合成的序列,即,它们并非是天然存在的,并优选编码相同的多肽(或全长多肽的酶活性片段,并且该片段与全长多肽具有的活性基本上相同),所述多肽由编码加工酶的非密码子优化亲代多核苷酸所编码。优选该多肽为生化性质独特的或有所改进的,例如,通过对来自亲代多肽的特定加工酶编码DNA的递推突变(recursive mutagenesis),从而改进其在加工应用中的性能。优选多核苷酸被优化在靶宿主植物内表达,并且其编码加工酶。制备这种酶的方法包括突变,如递推突变和筛选。用于突变和核苷酸序列改变的方法是本领域公知的。例如参见,Kunkel,Proc.Natl.Acad.Sci.USA,82:488,(1985);Kunkel等,Methods in Enzymol.,154:367(1987);US Patent No.4,873,192;Walker和Gaastra,eds.(1983)Techniques in Molecular Biology (MacMillan Publishing Company,New York)以及这里所引的参考文献和Arnold等,Chem.Eng.Sci.,51:5091(1996))。优化核酸片段在靶植物或生物内表达的方法是本领域公知的。简言之,获得指示着靶生物所用最佳密码子的密码子使用表,选择最佳密码子用于替换靶多核苷酸中的密码子,然后化学合成优化序列。玉米偏爱密码子如US Patent No.5,625,136所述。
还进一步展望了本发明多核苷酸的互补核酸。在滤膜(filter)上进行的Southern或Northern印迹中,具有多于100个互补残基的互补核酸杂交的低严谨性条件的例子是50%甲酰胺,例如在50%甲酰胺,1M NaCl,1%SDS中,37℃下杂交,并在60-65℃下用0.1X SSC洗涤。示范性的低严谨性条件包括用30-35%甲酰胺,1M NaCl,1%SDS(十二烷基硫酸钠)的缓冲液37℃杂交,并在50-55℃下用1X-2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)清洗。示范性的中等严谨性条件包括在40-45%甲酰胺,1.0M NaCl,1%SDS中37℃杂交,并在55-60℃下用0.5X-1X SSC清洗。
另外,还包括编码所述加工酶“酶活性”片段的多核苷酸。本文中,“酶活性”指所述加工酶的多肽片段,并且其与所述加工酶具有基本上相同的在适当条件下修饰所述加工酶通常作用的底物的生物学活性。
在一个优选实施方案中,本发明的多核苷酸为玉米优化的多核苷酸,其编码α-淀粉酶,例如SEQ ID NO:2,9,46和52所示。在另一优选实施方案中,该多肽为编码支链淀粉酶的玉米优化多核苷酸,例如SEQ ID NO:4或25所示。在另一优选实施方案中,所述多核苷酸是编码α-葡糖苷酶的玉米优化多核苷酸,如SEQ ID NO:6所示。另一优选实施方案中,该多肽为编码葡萄糖异构酶的玉米优化多核苷酸,如SEQ ID NO:19,21,37,39,41或43所示。在另一优选实施方案中,优选编码葡糖淀粉酶的玉米优化多核苷酸,如SEQ ID NO:46,48或50所示。另外,SEQ ID NO:57还提供了编码葡聚糖酶/甘露聚糖酶融合多肽的玉米优化多核苷酸。本发明进一步提供了这种多核苷酸的互补序列,其在中度或优选在低严谨性杂交条件下可以杂交,并且视情况而定,编码具有α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶,葡糖淀粉酶,葡聚糖酶或甘露聚糖酶活性的多肽。
多核苷酸可以与“核酸”或“多核酸”互换使用,指脱氧核糖核苷酸或核糖核苷酸,及其单链或双链形式的多聚体,由含有糖,磷酸和碱基的单体(核苷酸)构成,所述碱基为嘌呤或嘧啶。除非另有说明,该术语包括含有天然核苷酸已知类似物的核酸,其与对照核苷酸具有类似的结合特性,并以天然核苷酸类似的方式被代谢。除非另有说明,特定的核酸序列除包括明确列出的序列外,还隐含包括其保守修饰的各种变体(例如简并密码子取代)以及互补序列。具体地,简并密码子的取代可以通过生成这样的序列而获得,所述序列中一个或多个被选择(或全部)密码子的第三个位置被混合碱基和/或脱氧次黄苷残基取代。
还包括“变体”或实质上类似的序列。对于核苷酸序列,变体包括那些由于遗传密码的简并性的缘故而编码天然蛋白相同氨基酸序列的那些序列。天然存在的等位基因变体例如这些变体可以使用已知的分子生物学技术鉴定,如聚合酶链式反应(PCR),杂交技术,和连接重组装(Ligation reassembly)技术。变体核苷酸序列还包括合成来源的核苷酸序列,如那些例如使用定点突变而形成编码天然蛋白的核苷酸序列,以及编码具有氨基酸取代的多肽的核苷酸序列。通常,本发明的核苷酸序列变体与天然核苷酸序列具有至少40%,50%,60%,优选70%,更优选80%,尤其优选90%,最优选99%和基于这些等级的单个单位的百分比一致性。例如,71%,72%,73%等,直到至少90%等级。变体还可以包括相应于被鉴定基因片段的全长基因。
调控序列:启动子/信号序列/可选择标记
编码本发明加工酶的多核苷酸可以与编码定位信号或信号序列(在多肽的N-或C-末端)的多核苷酸序列可操作地相连,从而例如将耐超高温酶靶向植物内的特定区室。这种靶的实例包括但不限于,液泡,内质网,叶绿体,造粉体,淀粉颗粒或细胞壁,或靶向特定组织,如种子。编码具有信号序列的加工酶的多核苷酸——特别是与组织特异性或诱导型启动子联合使用的多核苷酸——在植物内表达可以在植物体内产生高水平的定位加工酶。已知许多信号序列能够影响多核苷酸的表达或者影响多核苷酸靶向特定区室或特定区室以外部位。本领域已知的适当信号序列和靶向启动子包括但不限于本文所述的那些。
例如,当期望在特定组织或器官内表达时可以使用组织特异性启动子。反之,当期望响应刺激的基因表达时,诱导型启动子可为所选的调控元件。当期望在整个植物的细胞内持续地表达时,可使用组成型启动子。转化载体的表达构建体中还可以包含中心启动子上游和/或下游的额外调控序列,以使异源核苷酸序列在转基因植物内以各种水平表达。
已描述了许多表达特征各异的植物启动子。已被公开的一些组成型启动子包括稻肌动蛋白1(Wang等,Mol.Cell.Biol.,12:3399(1992);U.S.Patent No.5,641,876),CaMV 35S(Odell等,Nature,313:810(1985)),CaMV 19S(Lawton等,1987),nos(Ebert等,1987),Adh(Walker等,1987),蔗糖合酶(Yang&Russell,1990)和泛素启动子。
在转基因植物中用于组织特异性靶向基因的载体通常包括组织特异性启动子,还可以包含其它组织特异性调控元件,如增强子序列。根据本公开的教导,那些能够引导在某些植物组织内特异性表达或提高表达的启动子对于本领域技术人员是明了的。例如包括,rbcS启动子,为绿色组织特异性;ocs,nos和mas启动子,其在根部或创伤叶组织中有更高活性;截短的(-90到+8)35S启动子,其能够指导在根部的增强表达,α-微管蛋白基因,其指导在根中表达,以及来自玉米醇溶蛋白储备蛋白质基因的启动子,其能够指导在胚乳内表达。
组织特异性表达可以这样功能性地完成:将组成型表达基因(所有组织)与仅在特定组织内表达的反义基因一起导入,所述特定组织是指不期望该基因产物的组织。例如,可使用来自花椰菜花叶病毒的35S启动子来导入编码脂酶的基因,这样就能够在所有组织内表达。使用例如玉米醇溶蛋白启动子在玉米谷粒内表达脂酶基因的反义转录产物能够防止脂酶蛋白在种子内积累。这样由导入基因编码的蛋白质就可以在除谷粒之外的所有组织内存在。
另外,已经报道了植物内的几种组织特异性调控基因和/或启动子。一些报道的组织特异性基因包括编码种子储备蛋白(如napin,cruciferin,β-conglycinin和云扁豆蛋白)玉米醇溶蛋白或油体蛋白(如oleosin)的基因,或与脂肪酸生物合成相关的基因(包括酰基载体蛋白,硬酯酰-ACP去饱和酶,和脂肪酸去饱和酶(fad 2-1)),以及其它在胚发育阶段表达的基因(如Bce 4,参见EP 255378和Kridl等,Seed Science Research,1:209(1991))。已公开的组织特异性启动子包括凝集素(Vodkin,Prog.Clin.Biol.Res.,138;87(1983);Lindstrom等,Der.Genet.,11:160(1990)),玉米醇脱氢酶1(Vogel等,1989;Dennis等,Nucleic Acids Res.,12:3983(1984)),玉米集光复合体(Simpson,1986;Bansal等,Proc.Natl.Acad.Sci.USA,89:3654(1992)),玉米热休克蛋白(Odell等,1985,Rochester等,1986),豌豆小亚基RuBP羧化酶(Poulsen等,1986;Cashmore等,1983),Ti质粒甘露碱(mannopine)合酶(Langridge等,1989),Ti质粒胭脂碱合酶(Langridge等,1989),矮牵牛苯基苯乙烯酮异构酶(vanTunen等,EMBO J.,7;1257(1988)),菜豆甘氨酸富集蛋白1(Keller等,Genes Dev.,3:1639(1989)),截短的CaMV 35s(Odell等,Nature,313:810(1985)),马铃薯patatin(Wenzler等,Plant Mol.Biol.,13:347(1989)),根细胞(Yamamoto等,Nucleic Acids Res.,18:7449(1990)),玉米的玉米醇溶蛋白(Reina等,Nucleic Acids Res.,18:6425(1990);Kriz等,Mol.Gen.Genet.,207:90(1987);Wandelt等,Nucleic Acids Res.,17:2354(1989);Langridge等,Cell,34:1015(1983);Reina等,Nucleic Acids Res.,18:7449(1990)),球蛋白-1(Belanger等,Genetics,129:863(1991)),α-微管蛋白,cab(Sullivan等,Mol.Gen.Genet.,215:431(1989)),PEPCase(Hudspeth&Grula,1989),R基因复合体相关启动子(Chandler等,Plant Cell,1:1175(1989)),以及苯基苯乙烯酮合酶启动子(Franken等,EMBO J.,10:2605(1991))。特别适用于种子特异性表达的是豌豆豌豆球蛋白启动子(Czako等,Mol.Gen.Genet.,235:33(1992)。(还可参见US5,625,136,并入本文作为参考)。其它可用于在成熟叶片内表达的启动子是那些在衰老启动时打开的启动子,如来自阿布属的SAG启动子(Gan等,Science,270:1986(1995))。
从开花到果实发育时或过程(至少直到开始成熟)中表达的一类果实特异性启动子在US 4,943,674中公开,将其全文并入本文作为参考。在棉纤维中优先表达的cDNA克隆已被分离(John等,Proc.Natl.Acad.Sci.USA,89:5769(1992))。在果实发育过程中显示出差异表达的番茄cDNA克隆已被分离并表征(Mansson等,Gen.Genet.,200:356(1985),Slater等,Plant Mol.Biol.,5:137(1985))。多聚半乳糖醛酸酶基因的启动子在果实开始成熟的阶段处于活跃状态。US4,535,060,US 4,769,061,US 4,801,590和US 5,107,065描述了多聚半乳糖醛酸酶基因,将这些文献并入本文作为参考文献。
其它组织特异性启动子例子包括在叶受损(如被昆虫啃食)后能够引导在叶细胞、在块茎(例如patatin启动子)以及在纤维细胞(发育相关纤维细胞蛋白的例子是E6(John等,Proc.Natl.Acad.Sci.USA89:5769(1992)))内表达的那些启动子。尽管所述E6基因在叶,胚珠和花中以低水平转录,但在纤维内最为活跃。
一些“组织特异性”启动子的组织特异性可能并不是绝对的,本领域技术人员可以利用白喉毒素序列对其进行测试。还可以用不同组织特异性启动子的各种组合,通过“渗漏”表达来获得组织特异性表达(Beals等,Plant Cell,9:1527(1997))。本领域技术人员还可以分离出其他的组织特异性启动子(参见US 5,589,379)。
在一个实施方案中,多糖水解基因产物(如α-淀粉酶)的方向可以靶向特定的细胞器(如质外体)而不是细胞质。这可使用玉米γ玉米醇溶蛋白N末端信号序列(SEQ ID NO:17)来示范,该序列可使蛋白特异性靶向质外体。将蛋白或酶靶向特定区室可以使酶以不会与底物接触的方式定位。通过这种方式,酶直到接触到了其底物才会开始酶促反应。可通过研磨(物理破坏细胞完整性)或加热细胞或植物组织来破坏含有该酶的植物细胞或器官的完整性,以使该酶接触其底物。例如,可将耐中温淀粉水解酶靶向质外体或内质网,从而使其无法与造粉体中的淀粉颗粒接触。研磨该谷粒会使谷粒完整性破坏,这样淀粉水解酶就会与淀粉颗粒接触。以这种方式就可以避免酶和其底物共同定位的潜在负面影响。
在另一实施方案中,组织特异性启动子包括胚乳特异性启动子,如玉米γ玉米醇溶蛋白启动子(如SEQ ID NO:12所示)或玉米ADP-gpp启动子(如SEQ ID NO:11所示,其包括5’非翻译区和内含子序列)。这样,本发明包括含有启动子的分离多核苷酸,所述启动子含有SEQ ID NO:11或12,能够在低严谨度杂交条件下与其互补序列杂交的多核苷酸,或其片段,它具有启动子活性,如SEQ ID NO:11或12所示启动子活性的至少10%,优选50%的活性。
本领域另一实施方案中,编码耐超高温加工酶的多核苷酸与叶绿体(造粉体)转运肽(CTP)以及来自例如waxy基因的淀粉结合域可操作地相连。该实施方案中的示范多核苷酸编码SEQ ID NO:10(与waxy的淀粉结合域相连的α-淀粉酶)。其他多核苷酸编码与信号序列相连的耐超高温加工酶,所述信号序列能够将酶靶向内质网并分泌到质外体内(如编码SEQ ID NO:13,27或30的多核苷酸所示范的,其分别含有与α-淀粉酶,α-葡糖苷酶,葡萄糖异构酶可操作地相连的玉米γ-玉米醇溶蛋白N末端序列),与信号序列相连的耐超高温加工酶,所述信号序列能够将酶滞留在内质网内(如编码SEQ ID NO:14,26,28,29,33,34,35或36的多核苷酸所示范的,其含有与耐超高温酶可操作地相连的玉米γ玉米醇溶蛋白N末端序列,其与SEKDEL可操作地相连,其中所述耐超高温酶为α-淀粉酶,malAα-葡糖苷酶,T.maritima葡萄糖异构酶,T.neapolitana葡萄糖异构酶),与能够将酶靶向造粉体的N末端序列可操作地相连的耐超高温加工酶(如编码SEQ ID NO:15的多核苷酸,其含有与α-淀粉酶可操作地相连的waxy的N-末端造粉体导向序列),将酶靶向淀粉颗粒的耐超高温融合多肽(如编码SEQ ID NO:16的多核苷酸所示范的,其含有能够导向造粉体的waxy N末端序列,该N末端与含有waxy淀粉结合域的α-淀粉酶/waxy融合多肽可操作地相连),与ER滞留信号相连的耐超高温加工酶(如编码SEQ ID NO:38和39的多核苷酸)。另外,耐超高温加工酶还可与具有氨基酸序列(SEQ ID NO:53)的粗淀粉(raw starch)结合部位相连,其中编码所述加工酶的多核苷酸与编码该结合部位的玉米优化核酸序列(SEQ ID NO:54)相连。
已报道了几种诱导型启动子。Gatz在Current Opinion inBiotechnology,7:168(1996)中以及Gatz C在Annu.Rev.Plant Physiol.Plant Mol.Biol.48:89(1997)中已描述了许多。示例包括四环素阻抑系统,Lac阻抑系统,铜诱导型系统,水杨酸诱导型系统(如PR1a系统),糖皮质激素诱导型(Aoyama T等,N-H Plant Journal,11:605(1997))和蜕皮激素诱导型系统。其它诱导型启动子包括ABA-和膨胀(turgor)-诱导型启动子,生长素结合蛋白基因启动子(Schwob等,Plant J.4:423(1993)),UDP葡萄糖类黄酮糖基转移酶基因启动子(Ralston等,Genetics,119:185(1988)),MPI蛋白酶抑制剂启动子(Cordero等,Plant J.,6:141(1994)),和甘油醛-3-磷酸脱氢酶基因启动子(Kohler等,Plant Mol.Biol.,29:1293(1995);Quigley等,J.Mol.Evol.,29:412(1989);Martinez等,J.Mol.Biol.,208:511(1989))。还包括苯磺酰胺诱导型(US 5,364,780)和乙醇诱导型(WO97/06269和WO97/06268)系统以及谷胱甘肽S转移酶启动子。
其它研究聚焦于根据环境压力或外界刺激而响应的诱导型调节的基因,如盐度提高,干旱,病原体和损伤(Graham等,J.Biol.Chem.,260:6555(1985);Graham等,J.Biol.Chem.,260:6561(1985),Smith等,Planta,168:94(1986))。已经报道在损伤马铃薯植物的叶片内会累积金属羧肽酶抑制剂蛋白(Graham等,Biochem.Biophys.Res.Comm.,101:1164(1981))。还报道过其它能够被茉莉酮酸甲酯,诱导剂,热休克,无氧压力或杀虫剂安全剂诱导的其它植物基因。
嵌合反式作用(transacting)病毒复制蛋白的受控表达可以被其它遗传学方法进一步调控,例如Cre介导的基因活化(Odell等,Mol.Gen.Genet.,113:369(1990))。这样,在启动子和复制蛋白编码序列之间含有被lox位点结合的3’调控序列的DNA片段(所述调控序列能够阻断嵌合复制基因从启动子处表达)可通过Cre介导的切除作用去除,使得反式作用复制基因表达。在这种情况下,嵌合的Cre基因,嵌合的反式作用复制基因,或者上述两种基因都能够由组织和发育特异性或诱导型启动子调控。另一种遗传学方法是使用tRNA抑制基因。例如,tRNA抑制基因的受控表达可以条件性地调控含有适当终止密码子的反式作用复制蛋白编码序列的表达(Ulmasov等,Plant Mol.Biol.,35:417(1997))。同样,嵌合tRNA抑制基因,嵌合反式作用复制基因,或者上述二者都能够由组织和发育特异性或诱导型启动子调控。
优选地,对于多细胞生物,启动子还可以是特殊组织,器官或发育阶段特异性的。这种启动子的例子包括但不限于:玉蜀黍(Zeamays)ADP-gpp和玉蜀黍γ-玉米醇溶蛋白启动子和玉蜀黍球蛋白启动子。
可能期望仅仅在植物发育的某个时间段内在转基因植物内表达基因。发育的时机选择通常与组织特异性基因的表达相关联。例如,玉米醇溶蛋白储备蛋白的表达就通常在授粉作用后约15天在胚乳内开始。
另外,还可以构建并使用载体在转基因植物细胞内将特定基因产物靶向细胞内组分,或将蛋白导向细胞外环境。这通常可通过将编码转运或信号肽序列的DNA序列与特定基因编码序列相连而完成。所获的转运或信号肽分别将蛋白运送到特定的细胞内或细胞外目的地。然后可以在翻译后被去除。转运或信号肽是通过促进蛋白通过细胞内各种膜(如液泡,泡囊,质体和线粒体膜)来发挥作用的,而所述信号肽能够指导蛋白通过细胞外膜。
这种诸如玉米γ玉米醇溶蛋白N末端信号序列等能够导向内质网并分泌到质外体中的信号肽序列可以与本发明编码耐超高温加工酶的多核苷酸可操作地相连(Torrent等,1997)。例如,SEQ ID NO:13,27和30提供了编码与玉米γ玉米醇溶蛋白N末端序列可操作地相连的耐超高温酶的多核苷酸。另一信号序列是用于将多肽滞留在内质网内的SEKDEL氨基酸序列(Munro和Pelham,1987)。例如,编码SEQID NO:14,26,28,29,33,34,35或36的多核苷酸,其含有与加工酶可操作地相连的玉米γ玉米醇溶蛋白N末端序列,所述酶与SEKDEL可操作地相连。多肽还可以通过与waxy造粉体导向肽融合从而靶向造粉体(Klosgen等,1986)或淀粉颗粒。例如,编码耐超高温加工酶的多核苷酸可以与叶绿体(造粉体)转运肽(CTP)以及来自例如waxy的淀粉结合域可操作地相连。SEQ ID NO:10示范了与waxy的淀粉结合域相连的α-淀粉酶。SEQ ID NO:15示范了与waxy的造粉体导向序列的N末端序列可操作地相连的α-淀粉酶。另外,编码加工酶的多核苷酸还可以用waxy淀粉结合域来与淀粉颗粒融合。例如,SEQ ID NO:16示范了含有waxy N末端造粉体导向序列的融合多肽,所述序列与含有waxy淀粉结合域的α-淀粉酶/waxy融合多肽可操作地相连。
如本领域所公知的,本发明的多核苷酸除了加工信号外,还可以进一步含有其它调控序列。“调控序列”和“适当的调控序列”都是指定位于编码序列上游(5’非编码序列)、之中或下游(3’非编码序列)的核苷酸序列,该序列可以影响相连编码序列的转录,RNA加工或稳定性,或者翻译。调控序列包括增强子,启动子,翻译前导序列,内含子和多聚腺苷化信号序列。它们包括天然和合成的序列以及合成和天然序列的组合序列。
如本领域所公知的,本发明还可使用可选择标记以允许将转化植物或植物组织筛选出来。技术人员可能会期望将可选择或可筛选标记基因用作目的可表达基因,或者除目的可表达基因之外,还使用可选择或可筛选标记基因。“标记基因”是能够使表达该基因的细胞具备独特表型的基因,从而能够将转化细胞与不具备该标记的细胞相互区分开来。这样的基因可以编码可选择或可筛选标记,这取决于该标记是否赋予可用化学方法,即利用选择剂(如除草剂,抗生素等)进行选择的特性,或其是否只不过是可以通过观察或检测,即通过筛选而鉴定的特性(例如R座位特性)。适当标记基因的许多实例为本领域所知,可以用于实践本发明。
该术语可选择或可筛选标记的范围内,还包括编码“可分泌标记”的基因,其分泌可以作为对转化细胞进行鉴定或选择的手段而被检测。实例包括编码可分泌抗原的标记,该抗原可以通过抗体相互作用被鉴定出来,或者甚至是编码可分泌酶的标记,所述酶可以通过其催化活性而被检测出来。可分泌蛋白的种类很多,包括可通过例如ELISA检测的小型可扩散蛋白;可在细胞外液中检测到的小型活性酶(如α-淀粉酶,β内酰胺酶,膦丝菌素转乙酰酶);以及插入或包埋在细胞壁内的蛋白(如含有前导序列的蛋白,例如在伸展蛋白或烟草PR-S的表达单元中观察到的)。
就可选择的分泌型标记而言,使用编码含有独特的表位并被隐居在细胞壁内的蛋白的基因被认为是特别有益的。这样的分泌抗原标记理想地使用在植物组织中有低背景的表位序列,能够使其有效表达并靶向通过质膜的启动子-前导序列,会形成与细胞壁结合的蛋白,这样就可以使抗体接近。被修饰而含有独特表位的正常分泌型细胞壁蛋白就可以满足这样的需求。
适于以这种方式修饰的一种蛋白就是伸展蛋白,或富含羟基脯氨酸的糖蛋白(HPRG)。例如,玉米HPRG(Steifel等,The Plant Cell,2:785(1990))分子在分子生物学,表达和蛋白结构上已被详细地表征。但是,可以通过加入抗原位点而对任何一种伸展蛋白和/或富含甘氨酸细胞壁蛋白(Keller等,EMBO Journal,8:1309(1989)进行修饰从而形成可筛选标记。
a.可选择标记
可用于本发明的选择标记包括但不限于:neo或nptII基因(Potrykus等,Mol.Gen.Genet.,199:183(1985)),其编码卡那霉素抗性,可利用卡那霉素进行筛选,及G418等;bar基因,其能够赋予除草剂膦丝菌素抗性;编码改变的EPSP合酶蛋白的基因(Hinchee等,Biotech,6:915(1988))从而能够赋予草甘膦抗性;腈水解酶,如来自Klebsiella ozaenae的bxn,其赋予溴苯腈抗性(Stalker等,Science,242:419(1988));突变的乙酰乳酸合酶(ALS),其能够赋予咪唑啉酮,磺酰脲类或其它ALS抑制化合物抗性(欧洲专利申请154,204,1985);氨甲喋呤抗性DHFR基因(Thillet等,J.Biol.Chem.,263:12500(1988));能够赋予除草剂茅草枯抗性的茅草枯脱卤素酶基因;磷酸甘露糖异构酶(PMI)基因;能够赋予5-甲基色氨酸抗性的突变邻氨基苯甲酸合酶基因;能够赋予抗生素潮霉素抗性的hph基因;或者甘露糖-6-磷酸异构酶基因(这里还称作磷酸甘露糖异构酶基因),其提供代谢甘露糖的能力(US 5,767,378和5,994,629)。本领域技术人员能够选择适当的可选择标记基因实践本发明。当使用突变的EPSP合酶时,并入适当的叶绿体转运肽CTP还可以获得额外的益处(EP0,218,571,1987)。
可用于选择转化株的可选择标记基因的一个说明性实例是编码膦丝菌素转乙酰酶的基因,如吸水链霉菌(Streptomyces hygroscopicus)的bar基因或绿产色链霉菌(Streptomyces viridochromogenes)的pat基因。膦丝菌素转乙酰酶(PAT)能够将除草剂bialaphos中的活性成分膦丝菌素(PPT)失活。PPT能够抑制谷氨酰胺合酶(Mrakami等,Mol.Genn.Genet.,205:42(1986);Twell等,Plant Physiol.91:1270(1989)),导致氨迅速积累,使细胞死亡。将该选择系统与单子叶植物一起使用获得的成功令人感到意外,因为已经报道了在谷类转化中的巨大困难(Potrykus,Trends Biotehch.,7:269(1989))。
当期望使用bialaphos抗性基因实践本发明时,一个非常有用的基因是可获自链霉菌属物种(如ATCC No.21,705)的bar或pat基因。已经公开了bar基因的克隆(Murakami等,Mol.Gen.Genet.,205:42(1986);Thompson等,EMBO Journal,6:2519(1987))以及bar基因在单子叶植物以外植物内的应用(De Block等,EMBO Journal,6:2513(1987);De Block等,Plant Physiol.91:694(1989))。
b.可筛选标记
可使用的可筛选标记包括但不限于,β-葡糖醛酸酶或uidA基因(GUS),已知其编码的酶的各种产色底物;R-座位基因,其编码的产物能够调节花青甙色素(红色)在植物组织内的产生(Dellaporta等,Chromosome Sructure and Function,263-282(1988));β-内酰胺酶基因(Sutcliffe,PNAS USA 75:3737(1978)),已知其编码的酶的各种产色底物(如PADAC,一种产色头孢菌素);xylE基因(Zukowsky等,PNAS USA,80:1101(1983)),其编码儿茶酚双加氧酶,该酶可转化产色儿茶酚;α-淀粉酶基因(Ikuta等,Biotech.,8:241(1990));酪氨酸酶基因(Katz等,J.Gen.Microbiol.,129:2703(1983)),其编码能够氧化酪氨酸为DOPA和多巴醌的酶,DOPA和多巴醌反过来能够缩合形成可容易检测的化合物黑色素;β-半乳糖苷酶基因,其编码有多种产色底物的酶;萤光素酶(lux)基因(Ow等,Science,234:856(1986)),其可以允许生物发光检测;或水母发光蛋白基因(Prasher等,Biochem.Biophys.Res.Comm.,126:1259(1985)),其可用于钙敏感性生物发光检测,或绿色荧光蛋白基因(Niedz等,Plant Cell Reports,14:403(1995))。
来自玉米R基因复合物的基因被认为是特别有效的可筛选标记。玉米中的R基因复合物编码能够在多数种子和植物组织内调节花青甙色素生产的蛋白。来自R基因复合物的基因适于转化玉米,因为该基因在转化细胞内的表达不会伤害细胞。这样,被导入这种细胞内的R基因会导致红色色素表达,如果稳定导入就能够以红色部分来目测打分。如果玉米品系携带着编码花青甙生物合成途径中酶中间体的基因的显性等位基因(C2,A1,A2,Bz1和Bz2),但是在R座位携带有隐性的等位基因,则用R转化来自该品系的任何细胞都会导致红色色素的生成。示范的品系包括Wisconsin22,其含有rg-Stadler等位基因和TR112,其为一种K55的衍生物,为r-g,b,P1。或者如果C1和R等位基因被共同导入时可使用玉米的任何基因型。另一个期待可用于本发明的筛选标记是萤火虫萤光素酶,由lux基因编码。可使用例如X光片,闪烁计数,荧光分光光度法,低照度摄像机,光子计数照相机或多室发光光度法(multiwell luminometry)检测转化细胞中lux基因的存在。还设想该系统可被发展用于生物发光的群体筛选,如在组织培养皿上,或者甚至用于整个植物筛选。
用于转化植物的多核苷酸可以包括但不限于,植物基因和非植物基因DNA,如来自细菌,酵母,动物或病毒的DNA。被导入的DNA可以包括修饰的基因,基因的部分,嵌合基因,包括来自相同或不同玉米基因型的基因。术语“嵌合基因”或“嵌合DNA”是指含有来自物种的至少两种DNA序列或区段的基因或DNA序列或区段,所述物种在天然环境下不会合并该DNA,或者其中DNA序列或片段以在未转化植物的天然基因组内通常不会发生的方式放置或相连。
还提供了含有编码耐超高温加工酶的多核苷酸的表达盒,所述多核苷酸优选密码子被优化的多核苷酸。优选表达盒中的多核苷酸(第一多核苷酸)与调控序列,如启动子,增强子,终止序列或其组合可操作地相连,并且还可任选地与编码信号序列(N-或C-末端)的第二多核苷酸可操作地相连,该多核苷酸可将第一多核苷酸所编码的酶导向特定细胞或亚细胞部位。这样,启动子和一个或多个信号序列能够使酶在植物、植物组织或植物细胞内的特定位置高水平表达。启动子可以是组成型的启动子,诱导型(条件型)启动子或组织特异性启动子,如胚乳特异性启动子,例如玉米γ玉米醇溶蛋白启动子(如SEQID NO:12)或玉米ADP-gpp启动子(如SEQ ID NO:11,其含有5’非翻译和内含子序列)。本发明还提供了含有启动子的分离多核苷酸,所述启动子含有SEQ ID NO:11或12,在低严谨性杂交条件下与其互补序列杂交的多核苷酸,或其具有启动子活性的片段,例如所述启动子活性是具有SEQ ID NO:11或12的启动子的活性的至少10%,优选至少50%。还提供含有本发明表达盒或多核苷酸的载体以及含有本发明多核苷酸,表达盒或载体的转化细胞。本发明的载体可以含有编码不止一种本发明耐超高温加工酶的多核苷酸序列,该序列可以是正义或反义方向,且转化细胞可以含有一个或多个本发明载体。优选能够将核酸导入植物细胞的载体。
转化
表达盒或者含有该表达盒的载体构建体可以被插入细胞中。该表达盒或载体构建体能够以附加型被携带或整合到细胞基因组中。然后转化细胞可以培养为转基因植物。相应地,本发明提供该转基因植物的产物。这种产物可以包括但不限于,种子,果实,后代和转基因植物后代的产物。
本领域技术人员可利用多种将构建体导入宿主细胞的技术,许多这样的技术都是已知的。细菌和许多真核细胞的转化可利用聚乙二醇,氯化钙,病毒感染,噬菌体感染,电穿孔和其它本领域公知方法进行。转化植物细胞或组织的方法包括使用根癌农杆菌(A.tumefaciens)或毛根农杆菌(A.rhizogenes)作为转化工具的DNA转化,电穿孔,DNA注射,微粒轰击,颗粒加速等(如参见EP 295959和EP138341)。
在一个实施方案中,来自土壤杆菌属Ti衍生载体的Ti和Ri质粒二元型载体被用于转化各种高等植物,包括单子叶和双子叶植物,如大豆,棉花,油菜,烟草和稻(Pacciotti等,Bio/Technology,3:241(1985):Byrne等,Plant Cell Tissue and Organ Culture,8:3(1987);Sukhapinda等,Plant Mol. Biol.8:209(1987);Lorz等,Mol.Gen.Genet.,199:178(1985);Potrykus,Mol.Gen.Genet.,199:183(1985);Park等,J.Plant Biol.38:365(1985):Hiei等,Plant J.,6:271(1994))。利用T-DNA转化植物细胞已经进行了大量的研究,已被详细公开(EP120516;Hoekema,The Binary Plant Vector System.Offset-drukkerij Kanters B.V.;Alblasserdam(1985),Chapter V;Knauf等,Genetic Analysis of Host Range Expression byAgrogacterium,见:Molecular Genetics of the Bacteria-PlantInteraction,Puhler,A.编,Springer-Verlag,New York,1983,p.245;以及An.等,EMBO J.,4:277(1985))。
其它转化方法是本领域技术人员可获得的,如外源DNA构建体的直接摄取(见EP295959),电穿孔技术(Fromm等,Nature(London),319:791(1986)),或者用覆盖有核酸构建体的金属粒子进行的高速粒子轰击(Kline等,Nature(London)327:70(1987)和US 4,945,050)。转化后,细胞可以由本领域技术人员进行再生。特别相关的是最近发表的转化外源基因到重要经济作物如菜籽油菜(De Block等,PlantPhysiol.91:694-701(1989)),向日葵(Everett等,Bio/Technology,5:1201(1987)),大豆(McCabe等,Bio/Technolgy,6:923(1988);Hinchee等,Bio/Technology,6:915(1988);Chee等,Plant Physiol.,91:1212(1989);Christou等,Proc.Natl.Acad.Sci USA,86:7500(1989)EP301749),稻(Hiei等,Plant J.6:271(1994))和玉米(Gordon Kamm等,Plant Cell,2:603(1990);Fromm等,Biotechnology,8:833,(1990))内的方法。
含有基因组片段或合成片段的表达载体可以被导入原生质体或导入完整组织或分离细胞内。优选表达载体是被导入完整的组织。常用的培养植物组织的方法是已知的,例如,参见Maki等,“Procedures forIntroducing Foreign DNA into Plants”in Methods in Plant MolecularBiology&Biotechnology,Glich等,(编)pp.67-68,CRC Press(1993);以及Phillips等,“Cell-Tissue Culture and In-Vitro Manipulation”inCorn&Corn Improvement,3rd Edition10,Sprague等,(编)pp.345-387,American Society of Agronomy Inc.(1988)。
在一个实施方案中,表达载体可以使用直接基因转移方法被导入玉米或其它植物组织,如微粒介导的运送,DNA注射,电穿孔等。用生物轰击设备(biolistic device)进行微粒介导运送可将表达载体导入植物组织。例如参见,Tomes等,“Direct DNA transfer into intact cellsvia microproj ectile bombardment”in Gamborg和Phillips(编)PlantCell,Tissue and Organ Culture:Fundamental Methods SpringerVerlag,Berlin(1995)。但是,本发明设想了根据已知的转化方法用耐超高温酶转化植物。还可参见,Weissinger等,Annual Rev.Genet.,22:421(1988);Sanford等,Particulate Science and Techmology,5:27(1987)(洋葱);Christou等,Plant Physiol.,87:671(1988)(大豆);McCabe等,Bio/Technology,6:923(1988)(大豆);Datta等,Bio/Technology,8:736(1990)(稻);Klein等,Proc.Natl.Acad,Aci.USA,85:4305(1988)(玉米);Klein等,Bio/Technology,6:559(1988)(玉米);Klein等,Plant Physiol.,91:440(1988)(玉米);Fromm等,Bio/Technology,8:833(1990)(玉米);以及Gordon-Kamm等,PlantCell,2,603(1990)(玉米);Svab等,Proc.Natl.Acad.Sci.USA,87:8526(1990)(烟草叶绿体);Koziel等,Biotechnology,11:194(1993)(玉米);Shimamoto等,Nature,338:274(1989)(稻);Christou等,Biotechnology,9:957(1991)(稻);欧洲专利申请EP0332581(鸭茅和其它Pooideae);Vasil等,Biotechnology,11:1553(1993)(小麦);Weeks等,Plant Physi0l.,102:1077(1993)(小麦)。Methodsin Molecular Biology,83.Arabidopsis Protocols,Martinez-Zapater和Salinas编,1998Humana Press(阿布属)。
可以用单一DNA分子或多个DNA分子(即共转化)来实现植物的转化,这些技术都适用于本发明的表达盒和构建体。许多转化载体都可以用于植物转化,本发明的表达盒可与任何这种载体一起使用。载体的选择依赖于优选的转化技术和转化的目的物种。
最后,最期望用于导入单子叶植物基因组的DNA片段可以是同源基因或基因家族,所述基因编码期望的性状(如蛋白,脂类或多糖的水解)并被导入处在新启动子或增强子等,或者甚至可能是同源或组织特异性(如根-,珠托/叶鞘-,轮-,茎-,穗柄(earshank)-,谷粒-或叶-特异性)启动子或调控元件的调控下。实际上还预计本发明的特定应用是以组成型或诱导型的方式进行的基因导向。
合适转化载体的实例
植物转化领域已知有许多用于植物转化的转化载体,本发明的基因可以与本领域公知的任何这种载体一起使用。载体的选择依据优选的转化技术以及转化的靶物种。
a.适于土壤杆菌转化的载体
使用根癌农杆菌(Agrobacterium tumefaciens)进行转化可以使用许多载体。这些通常携带至少一种T-DNA边界(border)序列,包括例如pBIN19(Bevan,Nucl.Acids.Res.(1984))。下文将介绍两种适于土壤杆菌转化的典型载体的构建过程。
pCIB200和pCIB2001
二元载体pCIB200和pCIB2001可用于构建重组载体以使用土壤杆菌进行转化,其构建过程如下。用NarI消化pTJS75(Schmidhauser&Helinski,J.Bacteriol.,164:446(1985)),切除四环素抗性基因,再插入来自pUC4K的AccI片段,所述片段带有NPTII(Messing&Vierra,Gene,19:259(1982):Bevan等,Nature,304:184(1983):McBride等,Plant Molecular Biology,14:266(1990))得到pTJS75kan。将XhoI接头与PCIB7的EvoRV片段相连,所述片段含有左侧和右侧的T-DNA边界,植物可选择nos/nptII嵌合基因,和pUC多接头(Rothstein等,Gene,53:153(1987))。将XhoI消化的片段克隆到SalI消化的pTJS75kan中,得到pCIB200(参见EP0332104,实施例19)。pCIB200含有以下独特的多接头限制位点:EcoRI,SstI,KpnI,BglII,XbaI和SalI。pCIB2001是pCIB200的衍生物,通过向多接头中插入额外的限制性位点而得到。pCIB2001中多接头中的独特限制性位点为:EcoRI,SstI,KpnI,BglII,XbaI,SalI,MluI,BclI,AvrII,ApaI,HpaI和StuI。除含有这些独特的限制性位点外,pCIB2001还含有植物和细菌卡那霉素选择标记,土壤杆菌介导的转化所用的左侧和右侧T-DNA边界,用于在大肠杆菌和其它宿主之间转移的RK2-衍生trfA功能,和同样来自RK2的OriT和OriV功能。pCIB2001多接头适于克隆含有自身调控信号的植物表达盒。
pCIB10及其潮霉素选择衍生物;
二元载体pCIB10含有编码用于在植物中进行选择的卡那霉素抗性基因以及T-DNA右侧和左侧边界序列,插入了来自宽宿主范围的质粒pRK252的序列,使其在大肠杆菌(E.coli)和土壤杆菌中能够复制。Rothstein等描述了其构建过程(Gene,53:153(1987))。构建了pCIB10的各种衍生物,这些衍生物并入了Gritz等所描述的(Gene,25:179(1983))潮霉素B磷酸转移酶的基因。这些衍生物使转基因植物能够只在潮霉素(pCIB743)上或在潮霉素和卡那霉素(pCIB715,pCIB717)上进行选择。
b.适于非土壤杆菌转化的载体
不使用根癌农种菌进行的转化避免了在选择的转化载体中必需使用T-DNA序列,这样,除了例如上述含有T-DNA序列的载体外,还可以使用缺乏这些序列的载体。不依赖土壤杆菌的转化技术包括通过粒子轰击,原生质体吸收(如PEG和电穿孔)以及显微注射进行的转化。载体的选择很大程度上依赖于待转化物种的优选选择。将进一步描述适于非土壤杆菌转化的典型载体构建过程的非限制性实例。
pCIB3064
pCIB3064是pUC的衍生载体,适于与利用除草剂basta(或膦丝菌素)进行的选择共同使用来直接基因转移。质粒pCIB246含有CaMV35S启动子,该启动子与大肠杆菌GUS基因和CaMV 35S转录终止子可操作融合。该质粒描述在PCT公开申请WO93/07278。该载体的35S启动子含有两个起始位点5’的ATG序列。这些序列已使用标准PCR技术进行了突变,突变去除了ATG,并形成了SspI和PvuII限制性位点。新的限制性位点距唯一的SalI为96和37bp,距实际的起始位点为101和42bp。所获的pCIB246衍生物命名为pCIB3025。然后通过SalI和SacI消化从pCIB3025切除GUS基因,末端处理成平头并重新连接形成pCIB3060质粒。该质粒pJIT82可以获自John InnesCentre,Norwich,将含有Streptomyces viridochromogenes的bar基因的400bp SmaI片段切除,并插入到pCIB3060的HpaI位点(Thompson等,EMBO J.,6:2519(1987))。这样就形成了pCIB3064,其含有bar基因,处于CaMV 35S启动子和终止子的调控下,用于除草剂筛选,并含有氨苄青霉素抗性基因(用于在大肠杆菌中筛选)以及带有唯一SphI,PstI,HindIII和BamHI位点的多接头。该载体适于克隆含有自身调控信号的植物表达盒。
pSOG19和pSOG35
质粒pSOG35是利用能够赋予氨甲喋呤抗性的大肠杆菌基因二氢叶酸还原酶(DHFR)作为选择标记的转化载体。使用PCR从pSOG10扩增35S启动子(-800bp),玉米Adh1基因的内含子(-550bp)和GUS非翻译前导序列18bp。同样用PCR扩增编码大肠杆菌II型二氢叶酸还原酶基因的250bp片段,将这两种PCR片段与pB1221(Clontech)的SacI-PstI片段组装,所述pB1221片段含有pUC19载体的骨架以及胭脂碱合酶终止子。这些片段组装后形成了pSOG19,其含有35S启动子,该启动子与内含子6序列,GUS前导序列,DHFR基因和胭脂碱合酶终止子融合。用玉米褪绿斑点病毒(Maize ChloroticMottle Virus)(MCMV)的前导序列替换pSOG19中的GUS前导序列就形成了载体pSOG35。pSOG19和pSOG35携带有氨苄青霉素抗性的pUC基因并具有HindIII,SphI,PstI和EcoRI位点,可用于克隆外源物质。
c.适于叶绿体转化的载体
为了在植物质体中表达本发明的核苷酸序列,可使用质体转化载体pPH143(WO 97/32011,实施例36)。该核苷酸序列被插入pPH143从而取代了PROTOX编码序列。然后将该序列用于质体转化并根据壮观霉素抗性筛选转化株。或者,将该核苷酸序列插入pPH143从而使其替代aadH基因。在这种情况下,依据PROTOX抑制剂的抗性筛选转化株。
接受转化方法处理的植物宿主
任何能够随后无性繁殖(克隆繁殖)的植物组织,无论是通过器官发生或是胚胎发生,都可以用本发明的构建体进行转化。术语器官发生指从分生组织中心顺序地发育芽或根的过程,而胚胎发生指芽和根以一致的方式(而非顺序地)共同发育的过程,不论从体细胞或配子开始。特定组织的选择依据可使用的和最适于待转化的特定物种的无性繁殖系统而定。示范性的靶组织包括分化和未分化的组织或植物,包括但不限于叶片圆盘,根,茎,枝条,叶,花粉,种子,胚,子叶,下胚轴,大配子体,愈伤组织,现存的分生组织(如顶端分生组织,腋芽和根分生组织),以及诱导的分生组织(如子叶分生组织和下胚轴分生组织),肿瘤组织和各种形式的细胞和培养物,如单细胞,原生质体,胚和愈伤组织。植物组织可以在植物或器官,组织或细胞培养物内。
本发明的植物可以是各种形式。该植物可以是转化细胞和非转化细胞的嵌合体;该植物可以是无性系转化株(如所有的细胞均转化含有表达盒);该植物可以含有转化及非转化组织的嫁接体(如在柑橘物种中转化的根状茎嫁接到未转化的接穗上)。该转化植物可以各种方式繁殖,如通过无性繁殖或经典育种技术。例如,第一代(或T1)转化的植物可以自花授粉形成纯合的第二代(或T2)转化植物,而T2植物可进一步通过经典育种技术繁殖。显性选择标记(如nptII)可与表达盒相连以辅助育种。
本发明还可以用于转化任何植物物种,包括单子叶或双子叶植物,包括但不限于,玉米(玉蜀黍),芸苔属物种(Brassica sp.)(如欧洲油菜(B.napus),芜青(B.rapa),芥菜(B.jucea)),特别是那些作为种子油来源的芸苔属物种,紫苜蓿(Medicago sativa),稻(Oryzasativa),黑麦(Secale cereale),高粱(两色蜀黍(Sorghum bicolor),蜀黍(Sorghum vulgare)),黍(如御谷(Pennisetum glaucum),野生稷(Panicum miliaceum),谷子(Setaria italica),子(Eleusinecoracana)),向日葵(Helianthus annuus),红花(Carthamustinctorius),小麦(Triticum aestivum),大豆(Glycine max),烟草(Nicotiana tabacum),马铃薯(Solanum tuberosum),落花生(Arachishypogaea),棉花(海岛棉(Gossypium barbadense),陆地棉(Gossypium hirsutum)),甘薯(Ipomoea batatus),木薯(Manihotesculenta),咖啡属(Cofea spp.),椰子(Cocos nucifera),菠萝(Ananascomosus),柑橘属(Citrus spp.),可可树(Theobroma cacao),茶(Camellia sinensis),香蕉属(Musa spp.),鳄梨(Persea americana),无花果(Ficus casica),番石榴(Psidium guajava),芒果(Mangiferaindica),油橄榄(Olea europaea),番木瓜(Carica papaya),腰果(Anacardium occidentale),全缘澳洲坚果(Macadamia integrifolia),扁桃(Prunus amygdalus),甜菜(Beta vulgaris),甘蔗属(Saccharumspp.),燕麦,大麦,蔬菜,观赏植物,木本植物如针叶树和落叶树,南瓜,西葫芦,大麻,夏南瓜,苹果,梨,温柏,甜瓜,李,樱桃,桃,油桃,杏,草莓,葡萄,覆盆子,黑莓,大豆,高粱,甘蔗,菜籽油菜(rapeseed),三叶草,胡萝卜和鼠耳芥(Arabidopsis thaliana)。
蔬菜包括番茄(Lycopersicon esculentum),莴苣(如Lactucasativa),菜豆(Phaseolus vulgaris),利马豆(Phaseolus limensis),山黧豆属(Lathyrus spp.),花椰菜,嫩茎花椰菜,芜菁,萝卜,菠菜,石刁柏,洋葱,蒜,胡椒,芹菜和香瓜属(Cucumis)的成员,如黄瓜(C.sativus),棱瓜(C.cantalupensis)和香瓜(C.melo)。观赏植物包括杜鹃花属(Rhododendron spp.),八仙花(Macrophyllahydrangea),芙蓉(Hibiscus rosasanensis),蔷薇属(Rosa spp.),郁金香属(Tulipa spp.),水仙属(Narcissus spp.),碧冬茄(Petuniahybrida),麝香石竹(Dianthus caryophyllus),一品红(Euphorbiapulcherrima)和菊花。可用于实施本发明的针叶树包括,例如松树,如火炬松(Pinus taeda),湿地松(Pinus elliotii),西黄松(Pinusponderosa),小干松(Pinus contorta)和辐射松(Pinus radiata),花旗松(Pseudotsuga menziesii);加州铁杉(Tsuga canadensis);白云杉(Picea glauca);北美红杉(Sequoia sempervirens);冷松,如太平洋冷松(Abies amabilis)和胶枞(Abies balsamea);以及杉木(cedars),如北美乔柏(Thuja plicata)和黄扁柏(Chamaecyparisnootkatensis)。豆科植物包括菜豆类(beans)和豌豆类。菜豆类包括瓜尔豆、槐豆、苦豆(fenugreek)、大豆、菜豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等。豆科植物包括但不限于,落花生属,如花生,野豌豆属,如广布野豌豆,毛苕子,赤豆,绿豆和鹰嘴豆,羽扇豆属,如羽扇豆,三叶草,菜豆属,如菜豆,和利马豆,豌豆属(Pisum),如车轴草,草木犀属(Medicago),如苜蓿,苜蓿属,如紫目
Figure B028198565D00431
,百脉根属,如车轴草,兵豆属,如兵豆,和假木兰。用于本发明方法的优选饲料和草皮草包括苜蓿,鸭茅,牛尾覃,黑麦草,红顶草和小糠草。
优选地,本发明植物包括作物,如玉米,苜蓿,向日葵,芸苔属,大豆,棉花,红花,花生,高粱,小麦,黍,烟草,大麦,稻,番茄,马铃薯,南瓜,香瓜类,豆类作物等。其它优选的植物包括Liliopsida和Panicoideae。
当目的DNA序列被转化到特定植物物种中后,就可以使用传统育种技术,使该DNA在该物种中传播,或者转移到相同物种的其它品体中,特别包括商业品体。
以下描述了一些转化双子叶和单子叶植物的代表性方法,以及代表性的质体转化技术。
a.双子叶植物的转化
用于转化双子叶植物的技术是本领域公知的,保括以土壤杆菌为基础的技术以及那些不需要土壤杆菌的技术。非土壤杆菌技术包括原生质体或细胞对于外源遗传物质的直接摄取。这可通过PEG或电穿孔介导的摄取,粒子轰击介导的运送或显微注射来完成。Paszkowski等,EMBO J.,3:2717(1984),Potrykus等,Mol.Gen.Genet.,1999:169(1985),Reich等,Biotechnology,4:1001(1986)和Klein等,Nature,327:70(1987)都描述了这些技术。无论何种情况,都可使用本领域公知的标准技术将转化细胞再生为完整的植物。
土壤杆菌介导的转化是转化双子叶植物的优选技术,因为其转化效率高,且可广泛应用于许多不同的物种。土壤杆菌转化通常涉及将携带有外源目的DNA的二元载体(如pCIB200或pCIB2001)转移到适当的土壤杆菌菌株内,这可能依赖于由宿主土壤杆菌株携带的位于共居(co-resident)Ti质粒或染色体上的vir基因的互补(如菌株CIB542用于pCIB200和pCIB2001(Uknes等,Plant Cell,5:159(1993)))。重组二元载体到土壤杆菌的转移由三亲交配过程来完成,该过程使用携带有重组二元载体的大肠杆菌,携带有诸如pRK2013等的质粒的辅助大肠杆菌菌株,该辅助菌株能够将重组二元载体转移到靶土壤杆菌菌株内。或者,可通过DNA转化将重组二元载体转移到土壤杆菌中(
Figure B028198565D00441
&Willmitzer,Nucl.Acids Res.,16:9877(1988))。
利用重组土壤杆菌进行的靶植物物种转化通常涉及将土壤杆菌与该植物的外植体共培养,并使用本领域公知的技术。在携带有抗生素或除草剂抗性标记的选择培养基上再生转化的组织,所述标记位于二元质粒T-DNA边界之间。
载体的导入可以采用已知方式。优选用于转化的细胞包括土壤杆菌,单子叶植物细胞和双子叶植物细胞,包括Liliopsida细胞和Panicoideae细胞。优选的单子叶细胞为谷类细胞,如玉米(玉蜀黍),大麦和小麦以及积累淀粉的双子叶细胞,如马铃薯。
用基因转化植物细胞的另一方法涉及向植物组织和细胞中推进惰性或生物活性颗粒。该技术在美国专利US 4,945,050,5,036,006和5,100,792中有描述。通常,该过程涉及在能够有效穿透细胞外表面并掺入其内部的条件下向植物组织和细胞中推进惰性或生物活性颗粒。当使用惰性颗粒时,载体可以通过用含目的基因的该载体包被该颗粒而被导入细胞。或者,可用载体包围靶细胞这样可通过跟随粒子将载体带入细胞。生物活性颗粒(如干酵母细胞,干细菌或噬菌体,其均含有待导入的DNA)也可以被推进植物细胞组织。
b.单子叶植物的转化
目前大多数单子叶植物物种的转化均已成为常规性的操作。优选的技术包括使用乙二醇(PEG)或电穿孔技术以及粒子轰击进入愈伤组织的方式直接将基因转移到原生质体。转化可以用单一DNA种类或多个DNA种类(即共转化)进行,这些技术都适用于本发明。共转化可以具有如下优点:避免完整载体构建以及制备带有不连锁的目的基因和选择标记座位的转基因植物,如果认为需要的话,能够在随后的过程中去除该可选择标记。但是,共转化的一个缺陷是分开的DNA种类被整合到基因组中的频率小于100%(Schocher等,Biotechnolgy,4:1093(1986))。
专利申请EP0292435,EP0392225和WO93/07278描述了从玉米原种(elite)近交品系制备愈伤组织和原生质体,使用PEG或电穿孔转化原生质体,以及从转化的原生质体再生玉米植物的方法。Gordon-kamm等(Plant Cell,2:603(1990))和Fromm等(Biotechnolgy,8:833(1990))均公开了使用粒子轰击转化A188衍生玉米品系的方法。另外,WO03/07278和Koziel等(Biotechnology,11:194(1993))均描述了使用粒子轰击转化原种近交玉米品系。该技术使用了授粉后14-15天从玉米穗剪下的1.5-2.5mm长的未成熟玉米胚和PDS-1000He Biolistics设备。
还可应用原生质体或粒子轰击直接转移基因来实现稻的转化。已公开了Japonica型和Indica型的原生质体介导转化(Zhang等,PlantCell Rep.,7:379(1988);Shimamoto等,Nature,338:274(1989);Datta等,Biotechnology,8:736(1990))。这两种类型还可使用粒子轰击进行常规转化(Christou等,Biotechnology,9:957(1991)。另外,WO93/21335公开了电穿孔转化稻的方法。专利申请EP0332581公开了制备,转化及再生Pooideae原生质体的方法。这些技术可以转化鸭茅属(Dactylis)和小麦。另外,Vasil等(Biotechnology,10:667(1992))开公开了使用粒子轰击进入C型长期可再生愈伤组织细胞转化小麦的方法,Vasil等(Biotechnology,11:1553(1993))和Weeks等(PlantPhysiol.,102:1077(1993))还公开了使用未成熟胚和未成熟胚衍生的愈伤组织进行粒子轰击转化小麦的方法。但是转化小麦的优选方法涉及利用未成熟胚粒子轰击的转化,并且包括在基因运送前进行高蔗糖或高麦芽糖步骤。轰击前,将任意数量的胚(0.75-1mm长)植到3%蔗糖和3mg/l 2,4-D的MS培养基上(Murashiga&Skoog,PhysiologiaPlantarum,15:473(1962))用于诱导体细胞胚,该过程在黑暗条件下进行。在轰击当天,将胚从诱导培养基中取出并置于渗压剂上(即以期望的浓度,通常为15%,加入蔗糖或麦芽糖的诱导培养基)。使胚质壁分离2-3小时,然后轰击。通常每个靶板上有20个胚胎,但不是关键性的。使用标准方法,将适当的基因携带质粒(如pCIB3064或pSG35)沉淀到微米大小的金颗粒上。用DuPont
Figure B028198565D00461
氦设备,标准80目筛网,约1000psi的爆破压力轰击各板胚。轰击后,将胚放回暗处使其恢复约24小时(仍置于渗压剂上)。24小时后将胚从渗压剂取出再置于诱导培养基上约1个月使其再生。约1一个月后,将带有发育的胚胎发生愈伤组织的胚外植体转移到再生培养基中(MS+1mg/升NAA,5mg/升GA),该培养基还进一步含有适当的选择剂(pCIB3064为10mg/l basta,pSOG35则使用2mg/l氨甲喋呤)。大约1个月后,将长出的芽转移到更大的名为“GA7s”的无菌容器内,该容器含有半强度MS,2%蔗糖和相同浓度的选择剂。
已经公开了使用土壤杆菌转化单子叶植物的方法,参见WO94/00977和US5,591,616,均引入本文作为参考。
c.质体转化
大致如文献(Svab和Maliga,PNAS,90:913(1993))所述,在T琼脂培养基上的1”圆形矩阵上使Nicotiana tabacum c.V.‘Xanthi nc’的种子发芽,每板7个,用覆有pPH143和pPH145质粒DNA的1μm钨颗粒(M10,Biorad,Hercules,CA)在播种后12-14进行轰击。轰击后的幼苗在T培养基上培育2天,然后切下叶子并在RMOP培养基平板上将远轴一侧向上置于亮光处(350-500μmol光子/m2/s)(Svab,H ajdu kiewicz和Maliga,PNAS,87:8526(1990)),所述培养基含有500μg/ml二盐酸壮观霉素(Sigma St.Louis,MO)。轰击后3-8周将出现在黄化叶子下面的耐性芽亚克隆到相同的选择培养基中,使其形成愈伤组织,并分离第二批芽进行亚克隆。通过Southern印迹标准技术(Sambrook等,Molecular Cloning:A Laboratory Manual,ColdSpring Harbor(1989)),评价独立亚克隆中转化质体基因组拷贝的完全分离(homoplasmicity)。在1%Tris-硼酸盐(TBE)琼脂凝胶上分离BamHI/EcoRI消化的总细胞DNA(Mettler,I.J.Plant Mol.BiolReporter,5:346(1987)),转移到尼龙膜上(Amersham)并与32P标记的随机引发DNA序列杂交,该DNA序列相应于pC8的0.7kbBamHI/HindIII DNA片段,其含有rps7/12质体靶向序列的一部分。无菌条件下在含有壮观霉素的MS/IBA培养基上使同质芽生根(McBride等,PNAS,91:7301(1994))并转移到温室。
稳定转化植物的制备及表征
然后在适于筛选转基因细胞的选择培养基中培养转化植物细胞使其形成愈伤组织。从愈伤组织形成芽(shoots),再通过在生根培养基中生长从芽形成幼苗。通常各种构建体会与标记相连以便于选择植物细胞。为方便起见,该标记可以是对杀生物剂(特别是抗生素,如卡那霉素,G418,博莱霉素,潮霉素,氯霉素,除草剂等)的抗性。所用的特定标记将允许与缺乏被导入DNA的细胞相比较而筛选出转化细胞。DNA构建体的组分,包括本发明的转录/表达盒,均可以从宿主天然(内源性)或外来(外源性)的序列制备。“外来”指该序列在构建体被导入的野生型宿主中不存在。异源构建体将含有至少一个区域,该区域不是转录起始区域所来源的基因天然的。
为确认转基因在转基因细胞和植物中存在,可使用本领域公知的方法进行Southern印迹分析。由于利用适当的限制性酶,多核苷酸区段能够容易地与含有区段的构建体区分,所以可通过Southern印迹检测并定量多核苷酸区段到基因组的整合。转基因的表达产物可以各种方式检测,视该产物的属性而定,包括Western印迹和酶试验。一种十分有效的定量蛋白表达及检测不同植物组织中复制情况的方法是使用报道基因,如GUS。一旦获得了转基因植物,就可以使其生长产生具有期望表型的植物组织或部分。可以收集该植物组织或植物部分和/或收获种子。种子可以作为来源用于生长另外的含有具有期望特征的植物组织或部分的植物。
这样本发明提供含有至少一种本发明多核苷酸,表达盒或载体的转化植物或植物部分,如穗,种子,果实,谷粒,秸杆(stover),谷壳(chaff)或渣屑(bagasse),使用这种植物或其部分的方法以及制备这种植物的方法。转化的植物或其部分会表达加工酶,该酶任选地位于某一组织或发育谷粒的特定细胞或亚细胞部位。例如,本发明提供含有在植物细胞内存在的至少一种淀粉加工酶的转化植物部分,其中所述植物部分获自转化植物,其基因组中增加了编码至少一种淀粉加工酶的表达盒。该加工酶除非被诸如加热,研磨或其它方法活化否则不会对靶底物起作用,其中所述方法使得酶能够在酶有活性的条件下接触底物。
本发明优选方法
本发明的自加工植物和植物部分可在各种利用其中表达和活化的加工酶(耐中温,高温或超高温)的方法中应用。根据本发明,获自转基因植物的转基因植物部分被置于能够表达并活化该加工酶的条件下,其中所述转基因植物的基因组中增加了至少一种淀粉加工酶。活化后,该加工酶被激活并能够对其通常作用的底物发挥作用从而获得期望产物。例如,活化后该淀粉加工酶作用淀粉使其降解,水解,异构化或以其它方式修饰以获得期望的结果。可使用非淀粉加工酶来破坏植物细胞膜以促进植物淀粉,脂类,氨基酸或其它产品的提取。另外,非耐超高温酶和耐超高温酶可以与本发明的自加工植物或植物部分相结合使用。例如,耐中温非淀粉降解酶可以被活化以破坏植物细胞膜从而利于淀粉提取,然后,活化自加工植物体内的耐超高温淀粉降解酶以降解淀粉。
在谷物中表达的酶可以将含有该酶的植物或其部分置于能够提高酶活性的条件下而将其活化。例如,可以使用下述的一项或多项技术:可将植物部分与水接触,这样为水解酶提供了底物从而将该酶活化。可以使植物部分与水接触,这样使酶从其在植物部分发育过程中沉积的区域迁移出从而与底物接触。由于在成熟,谷物干燥和再水化过程中区域化被破坏,因此酶的迁移是可能的。完整或破裂的谷粒可以与水接触,这样使酶从其在植物部分发育过程中沉积的位置迁移出从而与底物接触。还可加入活化性化合物使酶活化。例如,钙依赖性酶可以通过加入钙使其活化。其它的活化性化合物可由本领域技术人员确定。可以通过去除失活剂而使酶活化。例如,已知一些肽抑制剂会抑制淀粉酶,淀粉酶可以与淀粉酶抑制剂共表达然后再通过加入蛋白酶将其活化。可将pH调整到酶活性最大的状态而活化酶。还可以提高温度来活化酶。在不超过酶最高温度时升高温度通常会提高酶活性。从环境温度活性水平升高温度到耐中温酶会丧失活性的温度,该酶的活性会提高,通常该丧失活性的温度为低于或等于70℃。同样,可以升高温度来活化耐高温酶和耐超高温酶。耐高温酶可通过将温度加热至活性或稳定性的最高温度而将其活化。对于耐高温酶该稳定性或活性最高温度通常为70-85℃。耐超高温酶比耐中温或耐高温酶具有更高的相对活化,因为其潜在温度变动更大,从25℃直到85℃或95℃甚至100℃。可通过任何方法提高温度,例如通过加热如通过烘烤,煮沸,加热或汽蒸,放电或其组合。另外还可通过研磨来活化表达耐中温或耐高温酶植物内的酶从而使酶与底物接触。
最适条件,如温度,水化,pH等,均可由本领域技术人员确定,并可依据所用的具体酶和该酶期望的应用而定。
本发明还提供可能辅助特定作用的外源性酶的应用。例如,本发明自加工植物或植物部分可以与外源性酶结合使用以促进反应。例如,转基因α-淀粉酶玉米可以与其它淀粉加工酶如支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶,甘露聚糖酶,半纤维素酶等结合使用,以水解淀粉或形成乙醇。实际上,已经发现,与仅仅使用转基因α-淀粉酶玉米相比,将转基因α-淀粉酶玉米与这种酶共同使用能够出乎意料地提供优异的淀粉转化程度。
这里提供了构思的适当方法的实例。
a.从植物中提取淀粉
本发明提供促进从植物中提取淀粉的方法。特别是,将至少一种多核苷酸导入植物从而使该酶与植物内的淀粉颗粒的物理位置十分靠近,所述多核苷酸编码能够破坏胚乳物理限制性基质(细胞壁,非淀粉多糖和蛋白基质)的加工酶。优选地,在本发明的该实施方案中转化植物表达一种或多种蛋白酶,葡聚糖酶,木聚糖酶,硫氧还蛋白/硫氧还蛋白还原酶,酯酶等,但不表达具备任何淀粉降解活性的酶,这样就可以维持淀粉颗粒的完整性。这些酶在植物部分如谷粒内的表达会提高谷粒的加工特性。所述加工酶可以是耐中温,高温或超高温的。在一个实例中,来自本发明转化植物的谷粒被加热干燥,很可能灭活非耐超高温加工酶并改进种子的完整性。谷粒(或破裂的谷粒)在高或低的水份含量或条件下(参见Primary Cereal Processing,Gordon和Willim,eds,pp.319-337(1994),将其引入本文作为参考)使用或不使用二氧化硫,在低温或高温(时间是非常重要的)下浸泡。达到升高的温度后,任选在一定水分含量条件下,通过活化酶如蛋白酶,木聚糖酶,植酸酶或葡聚糖酶,破坏胚乳基质的完整性,这些酶能够降解胚乳中的蛋白和非淀粉多糖而使其中的淀粉颗粒保持完整并更易从所获产物材料中回收。另外,流出物(elluent)中的蛋白和非淀粉多糖至少被部分降解且高度浓缩,因此可用于改良的动物饲料,食品或作为微生物发酵的中间成分。流出物被认为是组成改善的玉米浆。
这样,本发明提供制备淀粉颗粒的方法。该方法包括在能够活化所述至少一种酶的条件下处理谷粒,如破裂的谷粒,形成含有淀粉颗粒和非淀粉降解产物,如消化的胚乳基质产物的混合物,其中所述谷粒含有至少一种非淀粉加工酶。非淀粉加工酶可以是耐中温,高温或超高温的。活化酶后,从混合物中分离出淀粉颗粒。所述谷粒获自转化植物,其基因组含有(或增加了)编码所述至少一种酶的表达盒。例如,该加工酶可以是蛋白酶,葡聚糖酶,木聚糖酶,植酸酶,硫氧还蛋白酶/硫氧还蛋白还原酶或酯酶。优选该加工酶耐超高温。可以在低或高含水量条件下,在二氧化硫存在或不存在下处理谷粒。根据转基因植物谷粒中加工酶的活性和表达水平,可以在加工前或过程中将转基因谷粒与商品谷粒混合。还提供了该方法获得的产品,如淀粉,非淀粉产品和含有至少一种额外组分的改进型浸泡水(玉米浆)。
b.淀粉加工方法
本发明转化植物或植物部分可以含有本文公开的淀粉加工酶,其能够将淀粉颗粒降解为糊精,其它修饰的淀粉或己糖(如α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶,淀粉支链淀粉酶)或将葡萄糖转化为果糖(如葡萄糖异构酶)。优选地,该淀粉降解酶选自α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,新支链淀粉酶,淀粉支链淀粉酶,葡萄糖异构酶,和其组合,被应用于转化谷粒。另外,该酶优选地与启动子和信号序列可操作地相连,所述信号序列将酶靶向淀粉颗粒,造粉体,质外体或内质网。最优选该酶在胚乳表达,特别是玉米胚乳,并定位在一个或多个细胞区室内,或位于淀粉颗粒本身中。优选的植物部分是谷粒。优选的植物部分来自玉米,小麦,大麦,黑麦,燕麦,甘蔗或稻。
根据一种本发明的淀粉降解方法,转化的谷粒在淀粉颗粒中积累淀粉降解酶,在50℃-60℃常规温度下浸泡谷粒,并以本领域公知方法湿磨。优选该淀粉降解酶耐超高温。由于酶被亚细胞靶向淀粉颗粒,或通过在常规温度下将酶与淀粉颗粒在湿磨加工过程中相接触,将酶与淀粉颗粒相连,该加工酶与淀粉颗粒被共纯化以获得淀粉颗粒/酶混合物。回收淀粉颗粒/酶混合物后,通过有利于酶活性的条件使酶活化。例如,可将酶置于各种含水量和/或温度条件下加工以促进淀粉部分(为制备衍生淀粉或糊精)或完全水解为己糖。通过这种方式获得含有高浓度葡萄糖或果糖当量的糖浆。该方法能够有效地节省时间,能量和酶消耗,并提高淀粉转化为相应己糖的效率以及产品如高糖浸泡水(玉米浆)和更高葡萄糖当量的糖浆的生产效率。
另一实施方案中,处理表达该酶的植物或该植物的产品如果实或谷粒或从该谷粒制备的面粉,以活化酶,并将植物内表达和包含的多糖转化为糖(sugars)。优选地,将该酶与信号序列融合,如本文所述,所述信号序列将酶靶向淀粉颗粒,造粉体,质外体或内质网。然后可以从植物或植物产品中分离形成的糖。另一实施方案中,根据本领域公知并在本文公开的方法,将能够转化多糖为糖(sugars)的加工酶置于诱导型启动子的调控下。该加工酶可以是耐中温,高温或超高温的。将植物培养到期望阶段,然后诱导启动子使该酶表达并将植物或植物产品中的多糖转化为糖。优选该酶与能够将其靶向淀粉颗粒,造粉体,质外体或内质网的信号序列可操作地相连。另一实施方案中,制备了表达能够将淀粉转化为糖的加工酶的转化植物。将该酶与可将酶导向植物中淀粉颗粒的信号序列相融合。之后从含有由转化植物表达的该酶的转化植物中分离淀粉。然后活化分离的淀粉中所含的该酶使其将淀粉转化为糖。该酶可以是耐中温,高温或超高温的。本文提供了能够转化淀粉为糖的耐超高温酶的实例。该方法可与任何这样的植物使用,所述植物能够产生多糖并能够表达能将多糖转化为糖或水解的淀粉产物,如糊精,麦芽寡糖,葡糖糖和/或其混合物的酶。
本发明提供从植物或植物产物制备糊精和改性淀粉的方法,所述植物或植物产物已被能够水解多糖某些共价键以形成多糖衍生物的加工酶转化。在一个实施方案中,表达该酶的植物或其产物,如果实或谷粒,或由该谷粒制成的面粉,被置于足以活化该酶并将植物中所含多糖转化为分子量减小的多糖的条件下。优选地,如本文所述,将该酶与信号序列融合,所述信号序列将酶靶向淀粉颗粒,造粉体,质外体或内质网。然后可从植物或植物产品中分离或回收产生的糊精或衍生淀粉。另一实施方案中,根据本领域公知和在本文公开的方法,将能够转化多糖为糊精或改性淀粉的加工酶置于诱导型启动子的调控下。将植物培养到期望阶段,然后诱导启动子使该酶表达并将植物或植物产品中的多糖转化为糊精或改性淀粉。优选该酶为α-淀粉酶,支链淀粉酶,异或新支链淀粉酶,并优选该酶与能够将其靶向淀粉颗粒,造粉体,质外体或内质网的信号序列可操作地相连。一个实施方案中,该酶被靶向质外体或内质网。另一实施方案中,制备了表达能够将淀粉转化为糊精或改性淀粉的酶的转化植物。该酶与能够将其靶向植物内淀粉颗粒的信号序列融合。然后从含有转化植物所表达酶的转化植物中分离淀粉。然后在足以活化酶的条件下,活化淀粉中所含的酶,使其转化淀粉为糊精或改性淀粉。本文提供了能够转化淀粉为水解淀粉产物的耐超高温酶实例。该方法可与任何这样的植物使用,所述植物能够产生多糖并能够表达能将多糖转化为糖的酶。
另一实施方案中,在利于淀粉降解酶活性的条件下,浸泡来自本发明转化植物的谷粒各种不同时间,所述植物能够积累淀粉降解酶,该酶可以降解淀粉颗粒中的键形成糊精,改性淀粉或己糖(如α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶,淀粉支链淀粉酶)。所获的混合物可能含有高水平的淀粉衍生产物。这种谷粒的应用:1)避免了研磨谷粒或为首先获得淀粉颗粒而以其它方式加工谷粒的需求,2)通过将酶直接放在谷粒胚乳组织内而使得淀粉更加容易被酶接近,以及3)无需微生物产生的淀粉水解酶。这样,通过在水的存在下加热谷粒——优选玉米谷粒——以使酶作用底物,可避免己糖回收前的整个湿磨过程。
该方法还可以用于制备乙醇,高果糖糖浆,含己糖(葡萄糖)发酵培养基或任何其它不需要精制谷粒组分的淀粉应用。
本发明还提供制备糊精,麦芽寡糖和/或糖(sugar)的方法,涉及在活化所述至少一种酶的条件下,处理含有淀粉颗粒和至少一种淀粉加工酶的植物部分,从而使酶消化淀粉颗粒以形成含糖水性溶液。该植物部分获自转化植物,其基因组中增加了编码所述至少一种加工酶的表达盒。然后收集含有糊精,麦芽寡糖和/或糖的水性溶液。一个实施方案中,该加工酶为α-淀粉酶,α-葡糖苷酶,支链淀粉酶,葡糖淀粉酶,淀粉支链淀粉酶,葡萄糖异构酶或其任意组合。优选该酶耐超高温。另一实施方案中,该方法还进一步包括分离糊精,麦芽寡糖和/或糖的步骤。
c.改良的玉米品种
本发明还提供改良玉米品种(以及其它作物品种)的制备方法,所述品种具有正常水平的淀粉累积量并在其胚乳或淀粉累积器官内积累足量水平的淀粉分解酶,使得一旦活化其中所含的酶,例如,对于耐超高温酶,通过煮沸或加热该植物或其部分,该酶被激活,并促进淀粉到单糖的快速转化。这些单糖(主要为葡萄糖)可以给被处理玉米带来甜味。所获的玉米植物为改良品种,具有作为谷物生产杂交种和甜玉米的双重用途。这样,本发明提供生产超甜玉米的方法,包括在能够活化所述至少一种酶的条件下,处理转化玉米或其部分,所述玉米或其部分的基因组中增加了表达盒,并在胚乳中表达该表达盒,所述表达盒含有与编码至少一种淀粉分解酶的第一多核苷酸可操作地相连的启动子,这样可将玉米中的多糖转化为糖,产生超甜玉米。所述启动子可以是组成型启动子,种子特异性启动子或胚乳特异性启动子,其与编码加工酶如α-淀粉酶(如含有SEQ ID NO:13,14或16的酶)的多核苷酸序列相连。优选地,该酶耐超高温。在一个实施方案中,该表达盒进一步含有编码信号序列的第二多核苷酸,该信号序列与第一多核苷酸所编码的酶可操作地相连。本发明该实施方案中的示范性信号序列能够将酶导向质外体,内质网,淀粉颗粒或造粉体。培养该玉米植物,使得形成带有谷粒的玉米穗,然后诱导启动子使酶表达并将植物所含的多糖转化为糖(sugar)。
d.自发酵植物
在本发明的另一实施方案中,植物,如玉米,稻,小麦或甘蔗被工程改造成在其细胞壁中积累大量加工酶,如木聚糖酶,纤维素酶,半纤维素酶,葡聚糖酶,果胶酶等(非淀粉多糖降解酶)。收获谷粒组分(或者如果是甘蔗则是收获糖)后,将秸杆,谷壳或渣屑用作酶的来源,该酶被引导表达和积累在细胞壁内,并用作生物质的来源。秸杆(或其它剩余组织)被用作回收可发酵糖的工艺的原料。这个获得可发酵糖的工艺由活化非淀粉多糖降解酶组成。例如,活化可以包括在水的存在下,以足够将非淀粉多糖水解为最终糖的时间,加热植物组织。这样,该自加工秸杆产生转化多糖为单糖所需要的酶,而基本上无需额外的成本,因为它们是原料的一种组分。另外,温度依赖性酶对植物生长和发育没有有害影响,而通过与该蛋白融合的纤维素/木糖结合域而实现的细胞壁导向,甚至于向多糖微纤维内导向,可改善底物与酶的可接近性。
这样,本发明还提供一种使用转化的植物部分的方法,该植物部分细胞的细胞壁内包含至少一种非淀粉多糖加工酶。该方法包括在活化所述至少一种加工酶的条件下,处理含有至少一种非淀粉多糖加工酶的转化植物部分,从而消化淀粉颗粒以形成含有糖的水性溶液,其中所述植物部分获自转化植物,其基因组中增加了编码所述至少一种非淀粉多糖加工酶的表达盒;并收集含糖的水性溶液。本发明还包括转化的植物或植物部分,在该植物或其部分的细胞中或细胞的细胞壁中含有至少一种非淀粉多糖加工酶。该植物部分获自转化植物,其基因组中增加了编码所述至少一种非淀粉加工酶的表达盒,所述加工酶如木聚糖酶,纤维素酶,葡聚糖酶,果胶酶或其任意组合。
e.高蛋白和糖含量的水相
在另一实施方案中,蛋白酶和酯酶被工程改造在种子如大豆种子内积累。通过例如加热等方法活化蛋白酶或酯酶后,种子内的这些酶会在加工过程中水解大豆中的脂类和储备蛋白。这样就获得了含有氨基酸的可溶性产物和脂肪酸,所述产物可用作饲料,食品或发酵培养基。多糖通常在加工后谷粒的不溶性组分内发现。但是,通过结合种子内多糖降解酶的表达和积累,蛋白和多糖就可以被水解,然后可在水相内发现。例如,来自玉米的玉米醇溶蛋白和来自大豆的储备蛋白和非淀粉多糖可以这种方式溶解。这种水相和疏水相的组分可通过用有机溶剂或超临界二氧化碳抽提而容易地分离。这样就提供了制备谷粒水相抽提物的方法,所述抽提物含有更高水平蛋白,氨基酸,糖类(sugars)或糖质(saccharides)。
f.自加工发酵
本发明提供了一种制备乙醇,发酵饮料或其它发酵衍生产物的方法。该方法涉及获得植物或植物的产物或部分,或植物衍生物如谷物面粉,其中表达了能够将多糖转化为糖(sugar)的加工酶。该植物或其产物被处理以使得如上所述通过多糖转化产生糖。然后根据本领域公知技术发酵该糖和植物的其它组分以形成乙醇或发酵饮料,或其它发酵衍生产物。例如参见美国专利US 4,929,452。简言之,在能够促进糖转化为乙醇的条件下与酵母一起孵育由多糖转化形成的糖。适当的酵母包括耐高醇和耐高糖的酵母菌株,例如酵母酿酒酵母(S.cerevisiae)ATCC No.20867。该菌株于1987年9月17日保藏在美国典型培养物保藏中心(American Type Culture Colletion,Rockville,MD),保藏号为ATCC No.20867。然后发酵产物或发酵饮料可经过蒸馏分离出乙醇或蒸馏饮料,或者以其它方式回收发酵产物。该方法所用的植物可以是任何含有多糖并能够表达本发明酶的植物。这里公开了许多这样的植物。优选该植物是经济作物。更优选该植物是通常用于制备乙醇或发酵饮料,或发酵产物的那些植物,如小麦,大麦,玉米,黑麦,马铃薯,葡萄或稻。最优选该植物为玉米。
该方法包括在活化所述至少一种酶的条件下处理含有至少一种多糖加工酶的植物部分,从而消化植物部分中的多糖以形成可发酵糖。该多糖加工酶可以是耐中温,高温或超高温的。优选该酶耐超高温。该植物部分获自转化植物,其基因组中增加了编码所述至少一种多糖加工酶的表达盒。本发明该实施方案的植物部分包括但不限于,谷粒,果实,种子,茎,木质,蔬菜或根。优选植物包括但不限于,燕麦,大麦,小麦,浆果,葡萄,黑麦,玉米,稻,马铃薯,甜菜,甘蔗,菠萝,草和树。植物部分可与商品谷粒或其它市售底物组合使用;该加工底物的来源可以是自加工植物以外的来源。然后在促进可发酵糖转化为乙醇的条件下,例如与酵母和/或其它微生物共同孵育可发酵糖。在一个优选实施方案中,该植物部分来自用α-淀粉酶转化的玉米,该淀粉酶已被发现可以降低发酵时间和成本。
已经发现,当使用根据本发明方法制备的表达热稳定性α-淀粉酶的转基因玉米进行发酵时,残余淀粉的量降低。这说明在发酵过程中更多淀粉被溶解。残余淀粉量的这种减少导致蒸馏器的谷粒具有更高重量的蛋白含量和更高价值。另外,本发明转基因玉米的发酵可以在较低pH和在较高温度,例如,高于85℃,优选高于90℃,更优选95℃或更高,进行液化加工,使用较低pH导致降低用于调整pH的化学物品的成本,使用较高温度导致缩短液化时间,且使淀粉更彻底溶解化,减少液化时间,所有这些都使得发酵反应的乙醇产量更高,效率更高。
另外,已发现用甚至小比例的根据本发明制备的转基因植物与常规植物部分接触,可以减少发酵时间,降低相关成本。因此,相对于使用不含多糖加工酶的植物部分,本发明涉及减少植物发酵时间,包括使用来自含有多糖加工酶的植物的转基因植物部分,所述酶可以将多糖转化为糖。
g.粗淀粉加工酶及其编码多核苷酸
编码耐中温加工酶的多核苷酸被导入植物或植物部分。在一个优选实施方案中,本发明多核苷酸是玉米优化的多核苷酸,例如SEQ IDNO:48,50和59所示的,其编码葡糖淀粉酶,例如SEQ ID NO:47和49所示的。另一优选实施方案中,本发明多核苷酸为玉米优化多核苷酸,例如SEQ ID NO:52所示,其编码α-淀粉酶,例如SEQ ID NO:51所示。另外,本发明进一步包括加工酶融合产物。一个优选实施方案中,本发明多核苷酸是玉米优化多核苷酸,例如SEQ ID NO:46所示,其编码α-淀粉酶和葡糖淀粉酶融合物,例如SEQ ID NO:45所示。本发明进一步提供加工酶的组合。例如,提供了淀粉加工酶和非淀粉加工酶的组合。加工酶的这种组合可通过利用编码各种酶的多基因构建体而获得。或者,被该酶稳定转化的各转基因植物可用公知方法杂交以获得含有两种酶的植物。另一方法包括和该转基因植物一起使用外源酶。
淀粉加工酶和非淀粉加工酶的来源可分离或衍生自任何来源,其相应多核苷酸可由本领域技术人员确定。优选,α-淀粉酶来自曲霉属(如Aspergillus shirousami和黑色曲霉(Aspergillus niger)),根霉属(如米根霉(Rhizopus oryzae))和植物如玉米,大麦和稻。优选葡糖淀粉酶来自曲霉属(如Aspergillus shirousami和Aspergillusniger),根霉属(如米根霉(Rhizopus oryzae))和热厌氧杆菌属(Thermoanaerobacter)(如热解糖热厌氧杆菌(Thermoanaerobacterthermosaccharolyticum))。
本发明另一实施方案中,多核苷酸编码耐中温淀粉加工酶,其与玉米优化多核苷酸可操作地相连,例如SEQ ID NO:54所示,所述玉米优化多核苷酸编码粗淀粉结合域,例如SEQ ID NO:53所示。
另一实施方案中,组织特异性启动子包括胚乳特异性启动子如玉米γ-玉米醇溶蛋白启动子(例如SEQ ID NO:12所示)或玉米ADP-gpp启动子(例如SEQ ID NO:11所示,其包括5’非翻译序列和内含子序列)。这样,本发明包括含有启动子的分离多核苷酸,所述启动子含有SEQ ID NO:11或12,在低严谨度杂交条件下能够与其互补序列杂交的多核苷酸,或其具有启动子活性的片段,例如所述活性为具有SEQID NO:11或12序列的启动子的活性的至少10%,优选至少50%。
一个实施方案中,淀粉水解基因的产物,如α-淀粉酶,葡糖淀粉酶或α-淀粉酶/葡糖淀粉酶融合物可被靶向特定细胞器或部位,如内质网或质外体,而不是细胞质。示例是玉米γ-玉米醇溶蛋白N末端信号序列(SEQ ID NO:17)的应用,该序列赋予蛋白特异性导向质外体,以及γ-玉米醇溶蛋白N末端信号序列(SEQ ID NO:17)的应用,所述信号序列与加工酶可操作地相连,该酶与用于滞留于内质网内的序列SEKDEL可操作地相连。将蛋白或酶导向特定区域可以使酶以某种方式定位,这种方式使得酶不会与底物相接触。通过这种方式,直到该酶接触到底物才会发生酶的酶作用。该酶可以通过研磨(物理破坏细胞完整性)和水化过程与其底物接触。例如,耐中温淀粉水解酶可以被导向质外体或内质网,从而不会与造粉体中的淀粉颗粒接触。研磨谷粒会破坏谷粒的完整性,然后淀粉水解酶会与淀粉颗粒接触。以这种方式,酶和其底物共定位的潜在副作用可以被避免。
h.无需加入甜味剂的食物产品
还提供了不加入甜味剂而生产增甜谷粉制食品(farinaceous foodproduct)的方法。谷粉制食品实例包括但不限于,早餐食品,即食食品,烘烤食品,意大利面食和谷物产品如早餐谷类食品。该方法包括在活化所述淀粉加工酶的条件下,处理含有至少一种淀粉加工酶的植物部分以使植物部分中的淀粉颗粒加工为糖以形成甜味产品,所述甜味产品是相对于例如由来自不含该耐超高温酶的植物部分的淀粉颗粒所制成的产品而言。优选该淀粉加工酶耐超高温并通过加热,如烘烤,煮沸,加热,汽蒸,放电或其组合而被活化。该植物获自转化植物,例如转化大豆,黑麦,燕麦,大麦,小麦,玉米,稻或甘蔗,所述转化植物的基因组中增加了编码所述至少一种耐超高温淀粉加工酶的表达盒,所述加工酶如α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其任意组合。然后将甜味产品加工成谷粉制食品。本发明还提供由该方法制备的谷粉制食品产品,如谷类食品,早餐食品,即食食品,烘烤食品。该谷粉制食品产品可以由甜味产品和水制成,并可含有麦芽,调味剂,维生素,矿物质,着色剂或其任意组合。
该酶可在将植物材料导入谷类产品之前或在加工谷类产品的过程中被活化,以将植物材料中的多糖转化为糖(sugar)。相应地,植物材料内所含的多糖可通过在加入到谷粉制产品之前活化该材料而转化为糖,例如对于耐超高温酶,通过加热活化。然后将含有由多糖转化而成的糖的植物材料加入产品中以生产甜味产品。或者,可在加工谷粉制产品过程中由酶将多糖转化为糖。用于制备谷类产品的方法实例是本领域公知的,包括加热,烘烤,煮沸等,如美国专利US 6,183,788;6,159,530;6,149,965;4,988,521和5,368,870所述的。
简言之,可通过与水一起混合各种干配料而制备生面团,并煮制使淀粉组分凝胶化并形成煮熟味(cooked flavor)。然后可机械加工该煮制过的材料以形成煮制的面团如谷类面团。所述干配料可以包括各种添加剂如糖,淀粉,盐,维生素,矿物质,色素,调味剂,盐等。除水外,还可加入各种液体配料如玉米(玉蜀黍)或麦芽糖浆。谷粉材料可包括谷类谷粒,切割谷粒(cut grains),粗磨谷粉(grits)或来自小麦,稻,玉米,燕麦,大麦,黑麦或其它谷粒的面粉及其混合物,它们来自本发明转基因植物。然后可通过诸如挤压或冲压的方法将面团加工成期望的形状,再使用诸如James炊具,烤箱或放电设备等进一步烹饪。
还提供不加入甜味剂而使含淀粉产品增甜的方法。该方法包括在能够活化所述至少一种酶的条件下,处理含有至少一种淀粉加工酶的淀粉,从而消化淀粉形成糖从而形成处理过的(变甜)淀粉,例如,该甜味是相对于通过处理不含所述耐超高温酶的淀粉所制成的产品而言。本发明淀粉获自转化植物,所述转化植物的基因组中增加了编码所述至少一种加工酶的表达盒,优选的酶包括α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其组合。优选该酶耐超高温并可用加热活化。优选的转化植物包括玉米,大豆,黑麦,燕麦,小麦,大麦,稻和甘蔗。然后将该处理过的淀粉加入产品中以形成增甜的含淀粉产品,如谷粉制食品产品。还提供由该方法制备的增甜的含淀粉产品。
本发明还提供使含多糖果实或蔬菜增甜的方法,包括:在能够活化所述至少一种酶的条件下,处理含有至少一种多糖加工酶的果实或蔬菜,从而加工果实或蔬菜中的多糖以形成糖,产生增甜的果实或蔬菜,例如,该甜味是相对于来自不含多糖加工酶的植物的蔬菜或水果而言。本发明的水果或蔬菜获自转化植物,所述转化植物的基因组中增加了编码所述至少一种多糖加工酶的表达盒。
优选的水果和蔬菜包括马铃薯,番茄,香蕉,南瓜,豌豆和菜豆。优选的酶包括α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其组合。优选该酶耐超高温。
i.增甜含多糖植物或植物部分
该方法涉及获得如上所述表达多糖加工酶的植物,该酶可将多糖转化为糖(sugar)。相应地,该酶在植物和植物产物,如果实或蔬菜内表达。在一个实施方案中,该酶置于诱导型启动子调控之下,使得该酶的表达可以被外界刺激诱导。这样的诱导型启动子和构建体是本领域公知的并在本文描述。在植物或其产物内表达该酶可使植物或其产物内所含的多糖转化为糖并使该植物或其产物增甜。在另一实施方案中,该多糖加工酶组成型表达。这样,该植物或其产物可在足以活化该酶的条件下被活化,通过活化酶而将多糖转化为糖,使植物或植物产物增甜。这样,该果实或蔬菜中多糖到糖的自加工会产生增甜的果实或蔬菜,例如,该甜味是相对于来自不含多糖加工酶的植物的蔬菜或水果而言。本发明的水果或蔬菜获自转化植物,所述转化植物的基因组中增加了编码所述至少一种多糖加工酶的表达盒。优选的水果和蔬菜包括马铃薯,番茄,香蕉,南瓜,豌豆和菜豆。优选的酶包括α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其组合。优选该多糖加工酶耐超高温。
j.从含有可破坏胚乳基质的酶的转化谷粒中分离淀粉
本发明提供从转化谷粒中分离淀粉的方法,其中表达能够破坏胚乳基质的酶。该方法涉及获得表达酶的植物,所述酶会通过修饰例如细胞壁,非淀粉多糖和/或蛋白破坏胚乳基质。这种酶的实例包括但不限于:蛋白酶,葡聚糖酶,硫氧还蛋白,硫氧还蛋白还原酶和酯酶。这样的酶不包括任何显示淀粉降解活性的酶,这样使得淀粉颗粒的完整性得以维持。优选该酶与能够将酶靶向淀粉颗粒的信号序列融合。在一个实施方案中,谷粒被加热干燥以活化所述加工酶并使谷粒内所含的内源性酶失活。热处理导致所述酶的活化,酶会作用破坏胚乳基质,然后就可将淀粉颗粒容易地与胚乳基质分离。在另一实施方案中,将谷粒在高或低的水分含量下,在低温或高温下浸泡,可以使用或不使用二氧化硫。然后加热处理该谷粒以破坏胚乳基质并允许容易地分离淀粉颗粒。另一实施方案中,创造适当的温度和含水量条件以使蛋白酶进入淀粉颗粒内并降解颗粒内所含的蛋白。这样的处理会形成高产量的淀粉颗粒,而污染蛋白很少。
k.具有高糖当量的糖浆及该糖浆制备乙醇或发酵饮料的应用
该方法涉及获得如上所述表达多糖加工酶的植物,所述酶可将多糖转化为糖。在能够使表达的酶将植物或其产物内所含多糖转化为糊精,麦芽寡糖和/或糖的条件下,在水流(aqueous stream)中浸泡该植物或其产物。然后分离所述含有由多糖转化所形成的糊精,麦芽寡糖和/或糖的水流,以制备具有高糖当量的糖浆。该方法可以包括或不包括额外的湿磨植物或其产物以获得淀粉颗粒的步骤。可用于本方法的酶的实例包括但不限于,α-淀粉酶,葡糖淀粉酶,支链淀粉酶和α-葡糖苷酶。优选该酶耐超高温。根据该方法所形成的糖可包括但不限于,己糖,葡萄糖和果糖。可用于本方法的植物实例包括但不限于玉米,小麦或大麦。可使用的植物产物的实例包括但不限于,果实,谷粒和蔬菜。另一实施方案中,该多糖加工酶受诱导型启动子的调控。相应地,在浸泡过程前或之中,该启动子被诱导使酶表达,然后酶会将多糖转化为糖。诱导型启动子及含有该启动子的构建体的实例是本领域公知的,并在这里公开。这样,如果该多糖加工酶耐超高温,浸泡就可在高温下进行以活化该耐超高温酶并且使该植物或其产物内的内源性酶失活。另一实施方案中,能够将多糖转化为糖的耐超高温酶是组成型表达的。该酶可以不或可以通过信号序列靶向植物组分。该植物或其产物被浸泡在高温条件下以使植物内所含多糖转化为糖。
还提供了从具有高糖当量的糖浆制备乙醇或发酵饮料的方法。该方法涉及在允许糖浆内所含糖被转化为乙醇或发酵饮料的条件下,将糖浆与酵母一起培养。这种发酵饮料的实例包括但不限于,啤酒和葡萄酒。发酵条件是本领域公知的,并在美国专利US 4,929,452和本文中有描述。优选酵母为耐高醇和耐高糖菌株,如酿酒酵母(S.cerevisiae)ATCC No.20867。发酵产物或发酵饮料可被蒸馏以分离乙醇或蒸馏饮料。
l.耐超高温酶在植物细胞壁内的积累
本发明提供在植物细胞壁内积累耐超高温酶的方法。该方法涉及在植物内表达耐超高温酶,所述酶与细胞壁导向信号相融合,这样被导向的酶就会在细胞壁积累。优选该酶能够将多糖转化为单糖。导向序列的实例包括但不限于,纤维素或木糖结合域。耐超高温酶的实例包括SEQ ID NO:1,3,5,10,13,14,15或16所示的酶。可在从进料中回收糖的工艺中加入含有细胞壁的植物材料作为目的酶的来源,或所述植物材料可作为将来自其它来源的多糖转化为单糖的酶的来源而添加。另外,该细胞壁还可作为纯化酶的来源。纯化酶的方法是本领域公知的,包括但不限于,凝胶过滤,离子交换层析,色谱聚焦,等电点聚焦,亲合层析,FPLC,HPLC,盐沉淀,透析等。相应地,本发明还提供从植物细胞壁分离的纯化酶。
m.制备和分离加工酶的方法
根据本发明,本发明重组产生的加工酶可通过如下方式制备:转化含有本发明加工酶的植物组织或植物细胞,所述酶可在植物内被活化,选择被转化的植物组织或细胞,将转化植物组织或细胞培养为转化植物,并从转化植物或其部分中分离加工酶。优选该重组产生的酶是α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶和支链淀粉酶。最优选该酶由选自下述任何序列的多核苷酸编码:SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52或59。
下述实施例进一步描述本发明,但不是以任何方式限制本发明的范围。
实施例
实施例1
玉米优化的耐超高温淀粉加工酶/异构化酶的基因的构建
根据期望的活性谱来选择参与淀粉降解或葡萄糖异构化的各种酶,即,α-淀粉酶,支链淀粉酶,α-葡糖苷酶和葡萄糖异构酶。这些活性谱包括例如环境温度下最小活性,高温活性/稳定性,和低pH下的活性。然后使用如US专利5,625,136所述的玉米偏爱密码子设计相应基因,并由Integrated DNA Technologies,Inc.(Coralville,IA)合成。
根据耐超高温活性选择了具有SEQ ID NO:1氨基酸序列的797GL3α-淀粉酶。推导了该酶的核酸序列并进行玉米优化,如SEQ IDNO:2所示。类似地,选择具有SEQ ID NO:3氨基酸序列的6gp3支链淀粉酶。推导了该酶的核酸序列并进行玉米优化,如SEQ ID NO:4所示。
根据文献J.Bact.177:482-485(1995);J.Bact.180:1287-1295(1998)获得了硫磺矿硫化叶菌(Sulfolobus solfataricus)的malAα-葡糖苷酶氨基酸序列。根据公开的该蛋白氨基酸序列(SEQ ID NO:5),设计了编码malAα-葡糖苷酶的玉米优化合成基因(SEQ ID NO:6)。
选择了几种葡萄糖异构酶。根据登录号为NC_000853的已公开DNA序列预测海栖热袍菌(Thermotoga maritima))的葡萄糖异构酶氨基酸序列(SEQ ID NO:18),并设计其玉米优化合成基因(SEQ IDNO:19)。类似地,根据Appl.Envir.Microbiol.61(5):1867-1875(1995)公开的,登录号为L38994的DNA序列预测那不勒斯栖热袍菌(T.neapolitana)的葡萄糖异构酶氨基酸序列(SEQ ID NO:20),并设计编码那不勒斯栖热袍菌葡萄糖异构酶的玉米优化合成基因(SEQ ID NO:21)。
实施例2
797GL3α-淀粉酶和淀粉包封区域(starch encapsulating region)的 融合物在大肠杆菌中的表达
编码耐超高温797GL3α-淀粉酶和来自玉米颗粒结合淀粉合成酶(waxy)的淀粉包封区域(SER)的融合物的构建体被导入大肠杆菌中并表达。编码氨基酸序列(SEQ ID NO:8)的玉米颗粒结合淀粉合成酶cDNA(SEQ ID NO:7)(Klosgen RB等,1986)被克隆并作为淀粉结合域或淀粉包封区域(SER)的来源。使用根据GenBank登录号X03935设计的引物SV 57(5’AGCGAATTCATGGCGGCTCTGGCCACGT3’)(SEQ ID NO:22)和SV 58(5’AGCTAAGCTTCAGGGCGCGGCCACGTTCT3’)(SEQ ID NO:23),从玉米种子制备的RNA进行RT-PCR扩增全长cDNA。以EcoRI/HindIII片段将全长cDNA克隆到pBluescript中,质粒命名为pNOV4022。
从pNOV4022中扩增waxy cDNA的C末端部分(由919-1818bp编码),包括淀粉结合域,并按阅读框架融合到全长玉米优化797GL3基因(SEQ ID NO:2)的3’末端。该融合基因产物,797GL3/Waxy,具有SEQ ID NO:9的核酸序列并且编码SEQ ID NO:10的氨基酸序列,将其以NcoI/XbaI片段克隆入用NcoI/NheI酶切过的pET28b(NOVAGEN,Madison,WI)。此外,将797GL3基因以NcoI/XbaI片段单独克隆入pET28b载体。
pET28/797GL3和pET28/797GL3/Waxy载体被转化到BL21/DE3大肠杆菌细胞(NOVAGEN)中并根据厂商说明书培养和诱导。PAGE/考马斯染色分析显示了两种提取物中的诱导蛋白,分别相应于预测大小的融合和非融合淀粉酶。
按下述分析总细胞提取物中的耐超高温淀粉酶活性:将5mg淀粉悬浮在20μl水中,然后用25μl乙醇稀释。将待测淀粉酶活性的样品或标准淀粉酶阳性对照加入混合物中,并加水到终反应体积500μl。该反应在80℃进行15-45分钟。然后冷却反应液到室温,加入500μl邻联二茴香胺和葡萄糖氧化酶/过氧化物酶混合物(Sigma)。在37℃孵育混合物30分钟。加入500μl 12N硫酸以终止反应。测量540nm下的吸光值以定量由淀粉酶/样品释放的葡萄糖数量。融合及非融合淀粉酶提取物的实验结果显示:耐超高温淀粉酶活性水平类似,而对照提取物则呈阴性。这说明797GL3淀粉酶与waxy蛋白的C末端部分融合时(高温下)仍然具有活性。
实施例3
分离用于在玉米中胚乳特异性表达的启动子片段
使用根据GenBank登录号M81603设计的引物,从玉米基因组DNA扩增1515碱基对片段(SEQ ID NO:11)的玉米(Zea mays)ADP-gpp(ADP-葡萄糖焦磷酸化酶)大亚基的启动子和5’非编码区I(包括第一个内含子)。ADP-gpp启动子已被证实具有胚乳特异性(Shaw和Hannah,1992)。
从质粒pGZ27.3(获自Dr.Brian Larkins)扩增673bp片段的玉米(Zea mays)γ-玉米醇溶蛋白基因启动子。该γ-玉米醇溶蛋白基因启动子已被证实具有胚乳特异性(Torrent等,1997)。
实施例4
797GL3耐超高温α-淀粉酶转化载体的构建
按下述构建具有各种导向信号的表达盒以在玉米胚乳内表达797GL3耐超高温α-淀粉酶:
pNOV6200(SEQ ID NO:13)含有玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)与如实施例1所述合成的797GL3淀粉酶的融合物,所述信号序列用于靶向内质网并分泌到质外体内(Torrent等,1997)。该融合产物被克隆到玉米ADP-gpp启动子后,用于在胚乳内特异性表达。
pNOV6201(SEQ ID NO:14)含有γ-玉米醇溶蛋白N末端信号序列与带有C末端额外序列SEKDEL的合成797GL3淀粉酶的融合物,所述C末端额外序列用于靶向并滞留在内质网(ER)内(Munro和Pelham,1987)。该融合产物被克隆到玉米ADP-gpp启动子后,用于在胚乳内特异性表达。
pNOV7013含有γ-玉米醇溶蛋白N末端信号序列与带有C末端额外序列SEKDEL的合成797GL3淀粉酶的融合物,SEKDEL序列用于靶向并滞留到内质网(ER)内。除pNOV 7103中玉米γ-玉米醇溶蛋白启动子(SEQ ID NO:12)被用于取代玉米ADP-gpp启动子以在胚乳内表达融合产物之外,pNOV7013与pNOV6021相同。
pNOV4029(SEQIDNO:15)含有waxy造粉体导向肽(Klosgen等,1986)与合成的797GL3淀粉酶的融合物,用于靶向造粉体。该融合产物被克隆到玉米ADP-gpp启动子后,用于在胚乳内特异性表达。
pNOV4031(SEQ ID NO:16)含有waxy造粉体导向肽与合成的797GL3/waxy融合蛋白的融合物,用于靶向淀粉颗粒。该融合产物被克隆到玉米ADP-gpp启动子后,用于在胚乳内特异性表达。
通过将这些融合物克隆到玉米γ-玉米醇溶蛋白启动子之后制备其它的构建体以使得酶更高水平表达。所有表达盒都转移到二元载体内用于通过农杆菌(Agrobacterium)感染转化玉米。含有磷酸甘露糖异构酶(PMI)基因的二元载体可以允许用甘露糖筛选转基因细胞。转化的玉米植物进行自体受粉或者异型杂交,收集种子用于分析。
以与用于上述α-淀粉酶完全相同的方式,通过上述导向信号序列与6gp3支链淀粉酶或340g12α-葡糖苷酶的融合,制备其它构建体。这些融合产物被克隆到玉米ADP-gpp启动子和/或γ-玉米醇溶蛋白启动子之后,并如上所述转化到玉米中。转化的玉米植物进行自体受粉或者异型杂交,收集种子用于分析。
可通过杂交表达单个酶的植物,或通过将几种表达盒克隆到相同的二元载体内进行共转化而获得酶的组合。
实施例5
6GP3耐高温支链淀粉酶的植物转化载体的构建
按下述构建表达盒以在玉米胚乳的内质网中表达6GP3耐高温支链淀粉酶。
pNOV7005(SEQ ID NO:24和25)含有玉米γ-玉米醇溶蛋白N末端信号序列与带有C末端额外序列SEKDEL的合成6GP3支链淀粉酶的融合物,靶向并滞留到ER内。使用引物进行PCR将氨基酸肽SEKDEL与该酶的C末端融合,引物的设计使得合成基因可以扩增并同时在该蛋白的C末端加入6个氨基酸。该融合产物被克隆到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
实施例6
malA耐超高温α-葡糖苷酶的植物转化载体的构建
按下述构建带有各种导向信号的表达盒以在玉米胚乳内表达硫磺矿硫化叶菌malA耐超高温α-葡糖苷酶。
pNOV4831(SEQ ID NO:26)含有玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)与带有C末端额外序列SEKDEL的合成malAα-葡糖苷酶的融合物,用于靶向并滞留到内质网内(Munro和Pelham,1987)。该融合产物被克隆到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
pNOV4839(SEQ ID NO:27)中含有玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)与合成的malAα-葡糖苷酶的融合物,使得靶向内质网并分泌到质外体内(Torrent等,1997)。该融合产物被克隆到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
pNOV4837中含有玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)与带有C末端额外序列SEKDEL的合成malAα-葡糖苷酶的融合物,使得靶向并滞留到ER内。该融合产物被克隆到玉米ADP-gpp启动子之后,用于在胚乳内特异性表达。该克隆的氨基酸序列与pNOV4831(SEQ ID NO:26)的相同。
实施例7
耐超高温的海栖热袍菌和那不勒斯栖热袍菌葡萄糖异构酶的植物转化载体的构建
按下述构建带有各种导向信号的表达盒以在玉米胚乳内表达海栖热袍菌和那不勒斯栖热袍菌耐超高温葡萄糖异构酶。
pNOV4832(SEQ ID NO:28)中含有玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),此信号序列与带有C末端额外序列SEKDEL的合成海栖热袍菌葡萄糖异构酶融合,使得靶向并滞留到ER内。该融合产物被克隆到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
pNOV4833(SEQ ID NO:29)中将含有玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),此信号序列与带有C末端额外序列SEKDEL的合成那不勒斯栖热袍菌葡萄糖异构酶融合,使得靶向并滞留到ER内。该融合产物被克隆到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
pNOV4840(SEQ ID NO:30)中含有玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),此信号序列与合成的那不勒斯栖热袍菌葡萄糖异构酶融合,使得靶向ER并分泌到质外体内(Torrent等,1997)。该融合产物被克隆到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
pNOV4838含有γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),此信号序列与带有C末端额外序列SEKDEL的合成那不勒斯栖热袍菌葡萄糖异构酶融合,使得靶向并滞留到ER内。该融合产物被克隆到玉米ADP-gpp启动子之后,用于在胚乳内特异性表达。该克隆的氨基酸序列与pNOV4833(SEQ ID NO:29)的相同。
实施例8
用于表达耐超高温葡聚糖酶EglA的植物转化载体的构建
pNOV4800(SEQ ID NO:58)含有大麦α-淀粉酶AMY32b信号序列(MGKNGNLCCFSLLLLLLAGLASGHQ)(SEQ ID NO:31)与EglA成熟蛋白序列的融合物,用于定位到质外体。该融合产物被克隆到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
实施例9
用于表达多种耐超高温酶的植物转化载体的构建
pNOV4841含有双基因构建体,797GL3α-淀粉酶融合物和6GP3支链淀粉酶融合物。797GL3融合物(SEQ ID NO:33)和6GP3融合物(SEQ ID NO:34)都具备玉米γ-玉米醇溶蛋白N末端信号序列和SEKDEL序列用于靶向并滞留在ER内。每个融合物分别克隆到分开的γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
pNOV4842含有双基因构建体,797GL3α-淀粉酶融合物和malAα-葡糖苷酶融合物。797GL3融合多肽(SEQ ID NO:35)和malAα-葡糖苷酶融合多肽(SEQ ID NO:36)都具备玉米γ-玉米醇溶蛋白N末端信号序列和SEKDEL序列用于靶向并滞留在ER内。每个融合多肽分别克隆到分开的γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。
pNOV4843含有双基因构建体,797GL3α-淀粉酶融合物和malAα-葡糖苷酶融合物。797GL3融合多肽和malAα-葡糖苷酶融合多肽都具备玉米γ-玉米醇溶蛋白N末端信号序列和SEKDEL序列用于靶向并滞留在ER内。797GL3融合多肽被克隆到γ-玉米醇溶蛋白启动子之后,而malA融合多肽被克隆到玉米ADP-gpp启动子之后,用于在胚乳内特异性表达。797GL3融合物和malA融合物的氨基酸序列与pNOV4842的(分别为SEQ ID NO:35和36)相同。
pNOV4844含有三基因构建体,797GL3α-淀粉酶融合物,6GP3支链淀粉酶融合物和malAα-葡糖苷酶融合物。797GL3,malA和6GP3都具备玉米γ-玉米醇溶蛋白N末端信号序列和SEKDEL序列用于靶向并滞留在ER内。797GL3和malA融合物被克隆到两个分开的玉米γ-玉米醇溶蛋白启动子之后,而6GP3融合物被克隆到玉米ADP-gpp启动子之后,用于在胚乳内特异性表达。797GL3和malA融合物的氨基酸序列与pNOV4842的(分别为SEQ ID NO:35和36)相同。6GP3融合物的氨基酸序列与pNOV4841中的6GP3融合物的(SEQ ID NO:34)相同。
所有的表达盒都被转移到二元载体pNOV2117中用于通过农杆菌感染转化玉米。pNOV2117含有磷酸甘露糖异构酶(PMI)基因,允许使用甘露糖筛选转基因细胞。pNOV2117是带有pVS1和ColE1复制起点的二元载体。该载体含有来自pAD1289的组成型VirG基因(Hansen,G.等,PNAS USA 91:7603-7607(1994))和来自Tn7的放线壮观素抗性基因。克隆到左和右边界之间多接头内的是玉米泛素启动子,PMI编码序列和pNOV117的胭脂碱合酶终止子(Negrotto,D等,Plant Cell Reports 19:798-803(2000))。转化的玉米植物可以自体受粉或异型杂交并收集种子用于分析。可通过杂交表达单个酶的植物,或通过用一种多元基因表达盒转化植物,而获得不同酶的组合。
实施例10
细菌和毕赤氏酵母(Pichia)表达载体的构建
按下述构建表达盒用于在毕赤氏酵母或细菌内表达耐超高温α-葡糖苷酶和葡萄糖异构酶:
pNOV4829(SEQ ID NO:37和38)含有在细菌表达载体pET29a内的合成海栖热袍菌葡萄糖异构酶与ER滞留信号的融合物。该葡萄糖异构酶融合基因被克隆到pET29a的NcoI和SacI位点中,这样就加入了蛋白纯化所需的N末端S标签。
pNOV4830(SEQ ID NO:39和40)含有在细菌表达载体pET29a内的合成那不勒斯栖热袍菌葡萄糖异构酶与ER滞留信号的融合物。该葡萄糖异构酶融合基因被克隆到pET29a的NcoI和SacI位点中,这样就加入了蛋白纯化所需的N末端S标签。
pNOV4835(SEQ ID NO:41和42)含有合成的海栖热袍菌葡萄糖异构酶基因,该基因被克隆到细菌表达载体pET28C的BamHI和EcoRI位点中。这样就使His标签(纯化蛋白所需)与葡萄糖异构酶的N末端融合。
pNOV4836(SEQ ID NO:43和44)含有合成的那不勒斯栖热袍菌葡萄糖异构酶基因,该基因被克隆到细菌表达载体pET28C的BamHI和EcoRI位点中。这样就使His标签(纯化蛋白所需)与葡萄糖异构酶的N末端融合。
实施例11
基本上如Negrotto等,Plant Cell Reports 19:798-803所述,进行未成熟玉米胚的转化。对于本实施例,所有的培养基组分如上述引文中Negrotto等人所述,但是,此文献中描述的各培养基组分是可以被代替的。
A.转化质粒和可选择标记
将转化所用的基因克隆到适于转化玉米的载体内。该实施例中所用的载体含有磷酸甘露糖异构酶(PMI)基因,以筛选转基因系(Negrotto等,(2000)Plant Cell Reports 19:798-803)。
B.制备根癌农杆菌
在YEP(酵母提取物(5g/L),蛋白胨(10g/L),NaCl(5g/L),15g/l琼脂,pH6.8)固体培养基上28℃下培养含有植物转化质粒的农杆菌菌株LBA4404(pSB1)2-4天。然后将大约0.8X109农杆菌悬浮到补充有100μM As(Negrotto等,(2000)Plant Cell Rep 19:798-803)的LS-inf培养基内。在该培养基内预诱导细菌30-60分钟。
C.接种
从8-12天龄的玉米穗上剪切下来自A188或其它适当基因型的未成熟胚放入液体LS-inf+100μM As中。用新鲜感染培养基漂洗一次胚。然后加入土壤杆菌溶液,漩涡器上震荡胚30秒,并与细菌静置5分钟。然后将该胚保持盾片面向上的方向转移到LSAs培养基内,黑暗培养2-3天。然后,从每个培养皿中将20-25个胚转移到补充有氨噻肟头孢霉素(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中并在28℃暗处培养10天。
D.选择转化细胞并再生转化植物
将形成胚胎发生愈伤组织的未成熟胚转移到LSD1M0.5S培养基中。用6周时间在该培养基上筛选培养物,在第3周时进行传代培养步骤。将存活的愈伤组织转移到补充有甘露糖的Reg1培养基内。在光亮下培养(16小时光/8小时暗)后,再将绿色组织转移到不含生长调节剂的Reg2培养基内并孵育1-2周。将小植物(plantlet)转移到含有Reg3培养基的Magenta GA-7盒子(Magenta Corp,Chicago Ill)内并在光亮下生长。2-3周后,PCR检测植物是否存在PMI基因和其它目的基因。PCR测试的阳性植物被转移到温室中。
实施例12
分析表达导向质外体或ER的α-淀粉酶的玉米植物的T1种子
获得了用实施例4所述pNOV6200或pNOV6201转化的自体授粉玉米植物的T1种子。在暴露到高温下之前,根据目视检查和碘溶液对淀粉进行的正常染色,这些玉米粒内淀粉的积累呈现正常状态。解剖未成熟的玉米粒,将纯化的胚乳单独置于微量离心管内并浸泡在200μl 50mM NaPO4缓冲液内。将该管置于85℃水浴20分钟,然后冰上冷却。向各管中加入20微升1%碘溶液并混合。大约25%的分离的玉米粒显示出正常的淀粉染色。剩余的75%未能染色,说明淀粉已被降解为不能被碘染色的低分子量糖。发现pNOV6200或pNOV6201的T1玉米粒能够自身水解玉米淀粉。在37℃孵育后检测不到淀粉减少。
通过从胚乳中分离耐超高温蛋白组分再经过PAGE/考马斯染色来进一步分析淀粉酶的表达。观察到了适当分子量(50kD)的分离蛋白带。使用市售着色直链淀粉(AMYLAZYME,来自Megazyme,Ireland)对这些样品进行α-淀粉酶测试试验。高水平的耐超高温淀粉酶活性与此50kD蛋白的存在相关。
进一步发现来自多数表达耐超高温α-淀粉酶(所述酶被导向造粉体)的转基因玉米的玉米粒淀粉在环境温度下足够活跃,如果该酶被允许直接与淀粉颗粒相接触,那么可以水解多数淀粉。具有耐超高温α-淀粉酶(所述酶被导向造粉体)的80个品系中,4个被鉴定能够在玉米粒内积累淀粉。使用比色amylazyme试验分析这些品系中的3个品系的热稳定性α-淀粉酶活性。淀粉酶试验说明这3个品系中热稳定性淀粉酶活性水平很低。当在适当的含水量(moisture)和加热条件下处理从这3个品系中纯化的淀粉时,淀粉被水解,这说明存在足够水平的α-淀粉酶以促进从这些品系制备的淀粉的自身水解。
获得了来自pNOV6200或pNOV6201转化体的多个独立品系的T1种子。解剖各品系的单个玉米粒,分别在300μl 50mM NaPO4缓冲液中单独匀浆各纯化的胚乳。分析胚乳悬浮液试样在85℃下的α-淀粉酶活性。大约80%的品系发生耐超高温活性的分离(参见图1A,1B和2)。
在100℃加热来自野生型植物或pNOV6201转化植物的玉米粒1,2,3或6小时然后用碘溶液进行淀粉染色。3或6小时后,分别在成熟玉米粒内检测到极少量淀粉或检测不到淀粉。这样,当在高温孵育时,如下转基因玉米成熟玉米粒内的淀粉被水解,所述转基因玉米表达耐超高温淀粉酶,该酶被导向内质网。
另一实验中,pNOV6201植物的成熟T1玉米粒被浸泡在50℃下16小时,来自所述玉米粒的部分纯化的淀粉在85℃加热5分钟后被水解。这说明玉米粒研磨后,靶向内质网的α-淀粉酶与淀粉结合并能够在加热后水解淀粉。碘染色说明在50℃浸泡16小时后在成熟种子内淀粉仍维持完整。
另一实验中,从pNOV6201转化植物分离的成熟玉米粒在95℃加热16小时,然后干燥。在表达耐超高温α-淀粉酶的种子内,淀粉水解为糖导致干燥后产生皱褶外观。
实施例13
分析表达导向造粉体的α-淀粉酶的玉米植物的T1种子
获得了用实施例4所述pNOV4029或pNOV4031转化的自体受粉玉米植物的T1种子。在这些品系的玉米粒内淀粉积累明显地不正常。虽然严重程度不同,但所有的品系都分离出极低的淀粉表型,或不存在淀粉表型。在暴露到高温之前,碘对纯化自未成熟玉米粒的胚乳仅有微弱的染色。85℃下20分钟后,不出现染色作用。当玉米穗被干燥,玉米粒皱缩。如果允许与淀粉颗粒直接接触,这种淀粉酶明显地在温室温度下具有足够的活性来水解淀粉。
实施例14
发酵表达α-淀粉酶的玉米植物的谷粒
100%转基因谷粒,85℃对95℃,不同的液化时间
含有热稳定性α-淀粉酶的转基因玉米(pNOV6201)在不添加外源α-淀粉酶的发酵中表现良好,液化所需的时间大为缩短,并使淀粉的溶解更彻底。用下述步骤进行实验室发酵(下文详述):1)研磨,2)含水量(moisture)分析,3)制备含研磨后的玉米,水,backset和α-淀粉酶的浆液,4)液化和5)同时糖化和发酵(SSF)。该实施例中,液化步骤的温度和时间如下所述变化。另外,转基因玉米用或不用外源α-淀粉酶液化,并将乙醇产生性能与用市售α-淀粉酶处理过的对照玉米相对比。
使用含有α-淀粉酶基因和PMI可选择标记的载体,即pNOV6201,根据实施例4所述方法制备本实施例所用的转基因玉米。将表达高水平热稳定性α-淀粉酶的转基因品系的花粉授粉给市售杂种(N3030BT),获得转基因玉米。将玉米干燥到11%含水量并室温下保藏。该转基因玉米粉的α-淀粉酶含量为95单位/g,而1单位酶可在85℃,pH6.0MES缓冲液中每分钟从玉米面粉产生1微摩尔还原性末端。所用的对照玉米是已知乙醇产生性能良好的黄色马齿形玉米。
1)研磨:在配备有2.0mm筛的Perten 3100锤式粉碎机内研磨转基因玉米(1180g),这样产生转基因玉米粉。彻底清洗后,在相同的粉碎机内研磨对照玉米,以免被转基因玉米污染。
2)含水量分析:将转基因和对照玉米样品(20g)在铝秤盘(weighboat)内称重,100℃加热4小时。再次称重,从重量损失计算含水量。转基因面粉的含水量为9.26%,对照面粉为12.54%。
3)制备浆液:设计浆液的组成以便在SSF开始时形成带有36%固体的浆状物。对照样品在100ml塑料瓶中制备并含有21.50g对照玉米面粉,23ml去离子水,6.0ml backset(8%重量的固体),和0.30ml用水稀释50倍的市售α-淀粉酶。选择该α-淀粉酶剂量以代表工业应用。当在上述转基因α-淀粉酶试验的条件下进行实验时,对照α-淀粉酶的剂量为2U/g玉米粉。加入氢氧化铵调整pH为6.0。以同样的方式制备转基因样品,但是含有20g玉米面粉,因为转基因玉米面粉的含水量较低。用与对照样品同样剂量的α-淀粉酶或者不用外源α-淀粉酶制备转基因面粉浆液。
4)液化:含有转基因玉米面粉浆液的瓶子浸泡到85℃或95℃水浴内5,15,30,45或60分钟。在85℃孵育对照浆液60分钟。高温孵育过程中,每5分钟就用手剧烈混合浆液一次。高温步骤后冰上冷却浆液。
5)同时糖化和发酵:液化形成的浆状物与葡糖淀粉酶(0.65ml1/50稀释的市售L-400葡糖淀粉酶),蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%UreaLiquor)混合。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2排出通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴孵育。发酵24小时后,温度降到86F;48小时时设为82F。
通过制备含有酵母(0.12g)和70克麦芽糖糊精,230ml水,100mlbackset,葡糖淀粉酶(0.88ml 10倍稀释的市售葡糖淀粉酶),蛋白酶(1.76ml 100倍稀释的市售酶),尿素(1.07克),青霉素(0.67mg)和硫酸锌(0.13g)的混合物,使用于接种的酵母增殖。在需要该繁殖培养物之前的那天开始制备并在90°F混合下孵育繁殖培养物。
24,48和72小时时,从各发酵罐中取出样品,0.2μm滤器过滤并HPLC分析乙醇和糖。分析72小时的样品中总共溶解的固体和残留淀粉。
HPCL分析在配有折光率检测器,柱加热器和Bio-Rad AminexHPX-87H柱的二元梯度系统内进行。用0.005M H2SO4的水溶液以1ml/min的速度平衡该系统。柱温度为50℃。样品加样体积为5μl;洗脱使用相同的溶剂。通过注射已知的标准物来校准RI反应。测量各注射样品内的乙醇和葡萄糖。
残留淀粉按下述测定。在50℃烤箱内干燥样品和标准物,然后在样品粉碎机内研磨成粉末。将粉末(0.2g)称量到15ml有刻度的离心管内。用10ml含水乙醇(80%v/v)通过在涡旋之后离心并去除上清来洗粉末3次。将DMSO(2.0ml)加入到沉淀内,再加入3.0ml在MOPS缓冲液内的热稳定性α-淀粉酶(300单位)。剧烈混合后,85℃水浴中孵育该管60分钟。孵育过程中,对管进行4次混合。冷却样品并加入4.0ml醋酸钠缓冲液(200mM,pH4.5),再加入0.1ml葡糖淀粉酶(20U)。50℃孵育样品2小时,混合,然后3500rpm离心5分钟。0.2μM滤器过滤上清并按如上所述HPLC方法分析上清中的葡萄糖。使用50μl注射量作为具有低剩余淀粉的(<20%固体)样品的加样量。
结果转基因玉米在不加入α-淀粉酶的发酵中表现良好。72小时的乙醇产量在加入或不加入外源α-淀粉酶时基本相同,如表1所示。这些数据也表明当液化温度更高时,会获得更大的乙醇产量;相对于其它商业所用的酶如液化芽孢杆菌(Bacillus liquefaciens)α-淀粉酶而言,在转基因玉米内表达的本发明酶在更高温度时具有活性。
表1
当液化时间改变时,发现有效生产乙醇所需的液化时间比常规方法所需的缩短很多。图3显示从15分钟到60分钟的液化几乎不改变72小时发酵的乙醇产量。另外95℃液化比85℃液化在每一个时间点上都导致乙醇量更多。这些结果说明使用耐超高温酶改善了该过程。
对照玉米比转基因玉米的乙醇终产量高,但是之所以选择对照是由于其发酵表现非常优秀。相反,转基因玉米具有经选择以利于转化的遗传背景。通过公知的育种技术将此α-淀粉酶性状导入原种(elite)玉米种质应当可以消除此差异。
检测72小时产生的啤酒的残留淀粉水平(图4)显示,转基因α-淀粉酶使发酵可利用的淀粉的量显著提高;发酵后残留的淀粉量减少许多。
使用乙醇水平和残留淀粉水平,最适液化时间为95℃15分钟和85℃30分钟。该实验中这些时间是发酵罐水浴的总共时间,这样就包括了样品温度从室温升至85℃或95℃所用的时间。更短的液化时间可能对大规模工业过程最佳,工业过程中可通过使用蒸汽加压锅等设备快速加热浆状物。常规工业液化过程需要收集槽从而使浆状物在高温下孵育1或多个小时。本发明避免了对这种收集槽的需要,并提高液化设备的生产力。
发酵过程中α-淀粉酶的一个重要功能是减少浆状物的粘性。在各个时间点,含有转基因玉米粉的样品的粘性明显小于对照样品。另外转基因样品似乎不经过在所有对照样品中均会出现的凝胶状期;凝胶化通常在玉米浆被加热加工时出现。因此,使胚乳碎块内遍布α-淀粉酶会在加热加工过程中通过防止形成大的凝胶(所述凝胶会使扩散变缓并加大混合和泵出浆状物所需的能量投入)给浆状物带来有益的物理特性。
转基因玉米内的高剂量α-淀粉酶还可以增加转基因浆状物的有利特性。在85℃,转基因玉米的α-淀粉酶活性比对照所用外源α-淀粉酶剂量的活性高出许多倍。后者被选作为商用等级的代表。
实施例15
当与对照玉米混合时转基因玉米的有效作用
以5%-100%转基因玉米面粉的不同水平将转基因玉米面粉与对照玉米面粉混合。如实施例14所述处理。含有转基因表达的α-淀粉酶的浆状物在85℃液化30分钟或95℃液化15分钟;对照浆状物如实施例14所述制备,并在85℃液化30分钟或60分钟(每样一个)或95℃液化15或60分钟(每样一个)。
48和72小时的乙醇产量和剩余淀粉的数据如表2所示。48小时的乙醇水平如图5所示;剩余淀粉的测量值如图6所示。这些数据显示当转基因谷物仅占浆状物中总谷物的一小部分时(低至5%),转基因表达的热稳定性α-淀粉酶在乙醇生产方面仍表现非常良好。数据还显示当总谷物内含有至少40%转基因谷粒时,剩余淀粉明显低于对照浆合物。
表2
Figure B028198565D00791
对照样品。均为2次测定的平均值。
实施例16
在总玉米中使用1.5-12%的转基因玉米时乙醇产量随液化pH的 改变
由于转基因玉米以总玉米5-10%的比例在发酵中表现良好,接下来进行另外一系列发酵,该发酵中总玉米含有1.5-12%的转基因玉米。pH在6.4-5.2范围内变化,转基因玉米内表达的α-淀粉酶的活性的最适pH低于工业上常规所用的pH。
该实验按实施例15所述进行,除下述例外:
1)转基因玉米面粉按总干重1.5%-12.0%的水平与对照玉米面粉混合。
2)对照玉米为N3030BT,其比实施例14和15所用对照更加接近转基因玉米。
3)含有转基因粉的样品内不加入外源性α-淀粉酶。
4)液化前将样品pH调整到5.2,5.6,6.0或6.4。每种pH均制备了至少5种样品,涵盖了0%转基因玉米粉-12%转基因玉米粉的范围。
5)所有样品均在85℃液化60分钟。
作为发酵时间的函数,乙醇含量的改变如图7所示。该图显示从含有3%转基因玉米的样品所获的数据。在较低pH下的发酵比pH6.0或更高pH时进行得快。在具有其它剂量转基因玉米的样品内也观察到了类似的行为。与高水平的表达相结合的转基因酶活性pH曲线可以允许在较低pH下液化,导致发酵更快速,这样比常规pH6.0下的发酵过程导致生产能力更高。
72小时乙醇产量如图8所示。可以看出,根据乙醇产量,这些结果显示对样品内所含的转基因谷物数量几乎没有依赖性。因此,该谷物含有丰富的淀粉酶来促进发酵生产乙醇。还说明较低pH的液化能够获得更高乙醇产量。
监测液化后样品的粘性,发现pH6.0时,6%的转基因谷物足以充分降低粘性。pH5.2和5.6时,粘性等于12%转基因谷物的对照的粘性,但是对于转基因谷物百分比更低的情况却不是如此。
实施例17
使用耐高温酶从玉米粉生产果糖
已证实,表达耐超高温α-淀粉酶797GL3的玉米,当与α-葡糖苷酶(MalA)和木糖异构酶(XylA)混合时,可促进果糖生产。
将表达797GL3的pNOV6201转基因植物的种子在Kleco槽内磨成面粉,这样形成了淀粉酶面粉。以同样的方式研磨非转基因玉米谷粒获得对照面粉。
在大肠杆菌中表达α-葡糖苷酶,MalA(来自硫磺矿硫化叶菌)。将收获的细菌悬浮在50mM pH7.0的含有1mM 4-(2-氨乙基)苯磺酰氟的磷酸钾缓冲液内,然后在French细胞压碎器内裂解。4℃下23000xg离心裂解液15分钟。取出上清,加热到70℃维持10分钟,冰上冷却10分钟,然后4℃下34000x g离心30分钟。取出上清,在centricon10装置中将MalA浓缩2倍。保留centricon 10步骤的滤液以作为MalA的阴性对照。
在大肠杆菌中表达那不勒斯栖热袍菌的xylA基因,制备木糖(葡萄糖)异构酶。将细菌悬浮在pH7.0的100mM磷酸钠中并通过French细胞压碎器使其裂解。沉淀细胞碎片后,将提取物加热到80℃10分钟然后离心。上清液中含有XylA酶活性。与XylA提取物平行制备空载体的对照提取物。
将玉米粉(60mg每份样品)与缓冲液及来自大肠杆菌的提取物混合。如表3所示,样品含有淀粉酶玉米面粉(淀粉酶)或对照玉米面粉(对照),50μl MalA提取物(+)或滤液(-),以及20μl XylA提取物(+)或空载体对照(-)。所有的样品都含有230μl 50mM MOPS,10mM MgSO4,和1mM CoCl2;室温下缓冲液pH为7.0。
在85℃孵育样品18小时。孵育期末,用0.9ml 85℃水稀释样品,并离心去除未溶材料。然后通过Centricon3超滤装置过滤上清级分,并HPLC分析和ELSD检测。
用Astec Polymer Amin柱,5微米粒度,250X 4.6mm,和AlltechELSD 2000检测器装配梯度HPLC系统。用15∶85的水∶乙腈混合物预先平衡该系统。流速为1ml/min。注射上样后维持起始条件5分钟,然后20分钟梯度达到50∶50的水∶乙腈,再用相同溶剂运行10分钟。用80∶20的水∶乙腈洗该系统20分钟,然后用起始溶剂再平衡。在5.8min洗脱果糖,8.7分钟洗脱葡萄糖。
表3
  样品   玉米粉   MalA   XylA   果糖峰面积x 10<sup>-6</sup>   葡萄糖峰面积x10<sup>-6</sup>
  1   淀粉酶   +   +   25.9   110.3
  2   淀粉酶   -   +   7.0   12.4
  3   淀粉酶   +   -   0.1   147.5
  4   淀粉酶   -   -   0   25.9
  样品   玉米粉   MalA   XylA   果糖峰面积x 10<sup>-6</sup>   葡萄糖峰面积x10<sup>-6</sup>
  5   对照   +   +   0.8   0.5
  6   对照   -   +   0.3   0.2
  7   对照   +   -   1.3   1.7
  8   对照   -   -   0.2   0.3
HPLC结果还说明在含有α-淀粉酶的所有样品中都存在更多的麦芽寡糖。这些结果说明三种耐高温酶能够在高温下共同作用以从玉米面粉生产果糖。
实施例18
带有异构酶的淀粉酶面粉
另一实施例中,将淀粉酶面粉与纯化的MalA和两种细菌木糖异构酶--海栖热袍菌的XylA和获自Diversa的被称为BD8037的酶之一混合。淀粉酶面粉如实施例18所述制备。
带有6His纯化标签的硫磺矿硫化叶菌MalA在大肠杆菌内表达。如实施例18所述制备细胞裂解液,然后使用镍亲合树脂(Probond,Invitrogen)根据厂商说明书对天然蛋白的纯化说明,纯化至均匀外观。
带有S标签和ER滞留信号的海栖热袍菌XylA在大肠杆菌内表达并以与实施例18所述的那不勒斯栖热袍菌XylA同样的方式制备。
获得的木糖异构酶BD8037为冻干粉末,将其重悬浮在0.4x初始体积的水中。
将淀粉酶玉米粉与酶溶液和水或缓冲液混合。所有的反应都含有60mg淀粉酶面粉和总共600μl的液体。一组反应用加入了10mMMgSO4,1mM CoCl2的50mM室温下pH7.0的MOPS作为缓冲液;第二组反应用水代替含金属的缓冲液。异构酶的量如表4所示有所变化。所有反应均在90℃孵育2小时。离心制备反应上清液。用额外600μl水洗涤沉淀并再离心。将各反应的上清液级分合并,Centrico 10过滤,如实施例17所述,用具有ELSD检测的HPLC分析。观察到的葡萄糖和果糖量如图15所示。
表4
  样品   淀粉酶面粉   MalA   异构酶
  1   60mg   +   无
  2   60mg   +   海栖热袍菌,100μl
  3   60mg   +   海栖热袍菌,10μl
  4   60mg   +   海栖热袍菌,2μl
  样品   淀粉酶面粉   MalA   异构酶
  5   60mg   +   BD8037,100μl
  7   60mg   +   BD8037,2μl
  C   60mg   无   无
对于各异构酶而言,当反应中存在α-淀粉酶和α-葡糖苷酶时,从玉米面粉以剂量依赖性的方式生成果糖。这些结果说明,加入或不加入金属离子时,表达淀粉酶797GL3的谷物都能够与MalA和各种不同耐高温异构酶一起作用,以在高温下从玉米粉生成果糖。当加入二价金属离子时,异构酶可以在90℃实现预期的大约55%果糖的果糖:葡萄糖平衡。这对于使用耐中温异构酶的现有方法而言是个改进,因为现有技术需要层析分离以提高果糖浓度。
实施例19
在玉米内表达支链淀粉酶
对于pNOV7013或pNOV7005纯合的转基因植物进行杂交以产生共同表达797GL3α-淀粉酶和6GP3支链淀粉酶的转基因玉米种子。
获得了pNOV7005或pNOV4093转化的自体受粉玉米植物的T1或T2种子。pNOV4093是玉米优化合成6GP3基因(SEQ ID NO:3,4)与用于将融合蛋白定位于造粉体的造粉体导向序列(SEQ ID NO:7,8)的融合蛋白。该融合蛋白处于ADPgpp启动子(SEQ ID NO:11)的调控下用于在胚乳内特异性表达。pNOV7005构建体将支链淀粉酶的表达靶向胚乳内质网。该酶在ER的定位使得淀粉可在玉米粒内正常积累。还观察到高温处理前碘溶液对淀粉的正常染色。
如同α-淀粉酶的情况,靶向造粉体的支链淀粉酶(pNOV4093)的表达引起玉米粒内淀粉的异常积累。当玉米穗被干燥时,玉米粒发生了皱缩。显然,该耐高温支链淀粉酶在低温下具有足够的活性,并且如果与种子胚乳内的淀粉颗粒直接接触,能够水解淀粉。
从玉米面粉制备酶或酶提取物:在Kleco粉碎机上研磨转基因种子,再将粉末置于50mM NaOAc pH5.5的缓冲液内室温孵育1小时,其间不断震荡,从中提取支链淀粉酶。然后14000rpm离心孵育的混合物15分钟。上清作为酶的来源。
支链淀粉酶实验:该实验反应在96孔板上进行。从玉米粉中提取的支链淀粉酶(100μl)用900μl含有40mM CaCl2的50mM pH5.5NaOAc缓冲液稀释10倍。涡旋该混合物,将一片Limit-Dextrizyme(天青蛋白交联支链淀粉,来自Megazyme)加入各反应混合物并75℃孵育30分钟(或者如提及的)。孵育期末,3500rpm离心反应混合物15分钟。上清稀释5倍并转移到96孔平底板上测定590nm吸光值。支链淀粉酶对天青蛋白交联支链淀粉的水解形成了水溶性染色片段,其释放速率(测定为590nm吸光值的提高)与酶活性直接相关。
图9显示来自pNOV7005转化的不同事件的T2种子的分析。可在许多事件中检测到支链淀粉酶活性的表达高于非转基因对照。
向测定量(~100μg)的来自转基因(表达支链淀粉酶,淀粉酶或这两种酶)和/或对照(非转基因)的干玉米粉中加入1000μl含有40mM CaCl2的50mM pH5.5NaOAc缓冲液。反应混合物涡旋震荡并摇床孵育1小时。如图所示,将孵育混合物转移到高温(75℃,支链淀粉酶的最适反应温度或如图所示)下开始酶反应一段时间。冰上冷却以终止反应。然后14000rpm离心反应混合物10分钟。将上清的等分试样(100μl)稀释3倍,0.2微米滤器过滤用于HPLC分析。
使用下述条件进行样品的HPLC分析:
柱:Alltech Prevail Carbohydrate ES 5微米250X4.6mm
检测器:Alltech ELSD 2000
泵:Gilson 322
注射器:Gilson 215注射器/稀释器
溶剂:HPLC级乙腈(Fisher Scientific)和水(由Waters MilliporeSystem纯化)
低聚合度(DP1-15)的寡糖所用梯度
时间      %水      %乙腈
0         15        85
5         15        85
25        50        50
35        50        50
36        80        20
55        80        20
56        15        85
76        15        85
高聚合度(DP20-100及以上)的糖所用梯度
时间      %水      %乙腈
0         35        65
60        85        15
70        85        15
85        35        65
100       35        65
数据分析所用系统:Gilson Unipoint软件系统版本3.2
图10A和10B显示由表达的支链淀粉酶作用转基因玉米粉淀粉所形成的水解产物的HPLC分析。将表达支链淀粉酶的玉米粉在反应缓冲液内75℃孵育30分钟,导致从玉米淀粉形成中等链长寡糖(DP~10-30)和短直链淀粉链(DP~100-200)。该图还显示支链淀粉酶的活性对钙离子有依赖性。
表达支链淀粉酶的转基因玉米可以用于生产脱支(α1-6键的断裂)的修饰淀粉/或糊精,从而使得直链淀粉/直链糊精具有高水平。此外,根据所用淀粉种类(如蜡样,高直链淀粉等)不同,由支链淀粉酶形成的直链淀粉/糊精的链长分布也会不同,这样修饰淀粉/糊精的特性也不相同。
还使用支链淀粉作为底物说明α1-6键的水解。该分离自玉米粉的支链淀粉酶有效地水解支链淀粉。孵育后形成的产物的HPLC分析(如述)表明,正如所期望的,由于酶水解了支链淀粉分子内的α1-6连接从玉米形成了麦芽三糖。
实施例20
在玉米内表达支链淀粉酶
从玉米粉中提取然后通过PAGE和考马斯染色,进一步分析6gp3支链淀粉酶的表达。在Kleco粉碎机内研磨种子30秒获得玉米面粉。用50mM pH5.5NaOAc缓冲液从大约150mg面粉提取酶。混合物涡旋震荡并室温下摇床孵育1小时,然后在70℃再孵育15分钟。离心反应混合物(室温14000rpm 15分钟)并将上清用于SDS-PAGE分析。观察到了适当分子量(95kDal)的蛋白带。使用市售染料缀合的极限糊精(LIMIT-DEXTRIZYME,来自Megazyme,Ireland)对样品进行支链淀粉酶实验。耐高温支链淀粉酶活性的高水平与95kD蛋白的存在相关。
转基因玉米种子的Western印迹和ELISA分析也表明了~95kD蛋白的表达,该蛋白与制备的抗支链淀粉酶的抗体(大肠杆菌内表达)反应。
实施例21
加入支链淀粉酶表达玉米提高淀粉水解速度并改善短链(可发酵) 寡糖的产量
图11A和11B所示数据来自来自如上所述两种反应混合物的淀粉水解产物的HPLC分析。第一种反应标为“淀粉酶”,其含有按实施例4所述方法制备的α-淀粉酶表达转基因玉米与例如非转基因玉米A188的玉米面粉样品混合物[1∶1(w/w)];第二种反应混合物为“淀粉酶+支链淀粉酶”,其含有α-淀粉酶表达转基因玉米和按实施例19所述方法制备的支链淀粉酶表达转基因玉米的玉米面粉样品混合物[1∶1(w/w)]。所获的结果支持了支链淀粉酶与α-淀粉酶联合使用于淀粉水解过程的有益效果。这些有益效果来自淀粉水解速度的提高(图11A)和可发酵低DP寡糖产量的提高(图11B)。
发现在玉米内表达的α-淀粉酶单独或与支链淀粉酶一起(或任何其它淀粉水解酶的组合)可用于制备麦芽糖糊精(直链或支链寡糖)(图11A,11B,12和13A)。根据不同的反应条件、水解酶的类型及其组合和所用淀粉的类型,所形成的麦芽糖糊精的组成及由此其特性也有所变化。
图12描述了以和图11描述类似的方式进行的实验的结果。图内标出了孵育反应中采取的不同的温度和时间方案。支链淀粉酶的最适反应温度为75℃,而α-淀粉酶为>95℃。这样,按照所示方案可以提供支链淀粉酶和/或α-淀粉酶分别在其最适反应温度下进行催化的范围。从这些结果很明显地推导出α-淀粉酶与支链淀粉酶的组合在60分钟孵育期末对玉米淀粉水解得更好。
如上所述(除了在这些反应中使用~150mg玉米粉),在孵育30分钟末对两组反应混合物的淀粉水解产物进行HPLC分析,结果如图13A和13B。第一组反应在85℃下孵育而第二组在95℃下孵育。每组都有两种反应混合物;第一种被称为“淀粉酶X支链淀粉酶”,其含有表达α-淀粉酶和支链淀粉酶的转基因玉米(异花授粉形成)的玉米粉,而第二种反应被称为“淀粉酶”混合物,由表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品以一定比例混合形成,所述比例使其可获得与杂种(淀粉酶X支链淀粉酶)中观察到的α-淀粉酶活性相同量的活性。当在85℃下孵育玉米面粉样品时,α-淀粉酶和支链淀粉酶杂交情况下低DP寡糖的总产量高于仅表达α-淀粉酶的玉米。95℃下孵育会(至少部分地)失活支链淀粉酶,从而在“淀粉酶X支链淀粉酶”和“淀粉酶”之间几乎观察不到差异。但是,当使用淀粉酶和支链淀粉酶杂交玉米粉时,在孵育期末,这两种孵育温度下的数据都显示出:葡萄糖产量比使用仅表达α-淀粉酶的玉米的产量有显著提高(图13B)。这样,在将淀粉完全水解为葡萄糖具重要性的情况下,使用同时表达α-淀粉酶和支链淀粉酶的玉米会尤其有益。
上述实施例提供了足够的证据支持当联合使用α-淀粉酶时在玉米种子中表达的支链淀粉酶会改进淀粉水解过程。α1-6键特异性的支链淀粉酶活性比α-淀粉酶(α1-4键特异性)能远为有效地使淀粉脱支,从而减少支链寡糖(如极限糊精,潘糖,这些通常是不可发酵的)的数量并提高直链短寡糖(容易发酵为乙醇等)的量。第二,由支链淀粉酶催化脱支而造成的淀粉分子片断化会提高α-淀粉酶与底物的可接近性从而提高α-淀粉酶催化反应的效率。
实施例22
为确定797GL3α-淀粉酶和mal Aα-葡糖苷酶是否能够在相似pH和温度条件下起作用以形成高于由单个酶所产生的葡萄糖产量,将大约0.35ug malAα-葡糖苷酶(细菌中产生)加入含有1%淀粉和如下纯化的淀粉的溶液,所述纯化的淀粉由非转基因玉米种子(对照)或797GL3转基因玉米种子(797GL3玉米种子中,α-淀粉酶与淀粉共纯化)纯化获得。另外,将从非转基因和797GL3转基因玉米种子纯化的淀粉在不存在任何malA酶的情况下加入到1%的玉米淀粉中。在90℃pH6.0下孵育混合物1小时,离心去除不溶物,HPLC分析可溶组分中葡萄糖水平。如图14所示,797GL3α-淀粉酶和malAα-葡糖苷酶在类似的pH和温度条件下作用以水解淀粉为葡萄糖。生成的葡萄糖产量明显高于由单个酶形成的产量。
实施例23
测定热厌氧杆菌(Thermoanaerobacteriam)葡糖淀粉酶在粗淀粉(raw-starch)水解中的应用。如图15所示,在室温和30℃,用水,大麦α-淀粉酶(来自Sigma的商业制品),热厌氧杆菌葡糖淀粉酶及其组合,测定粗淀粉的水解转化。如图,大麦α-淀粉酶和热厌氧杆菌葡糖淀粉酶的组合能够水解粗淀粉为葡萄糖。另外,由大麦淀粉酶和热厌氧杆菌GA形成的葡萄糖产量显著高于由单个酶形成的产量。
实施例24
用于粗淀粉水解的玉米优化基因和序列以及植物转化载体
根据酶在大约20℃-50℃的温度下水解粗淀粉的能力选择酶。然后如实施例1所述,使用玉米偏爱密码子设计相应基因或基因片段用于构建合成基因。
选择Aspergillus shirousami α-淀粉酶/葡糖淀粉酶融合多肽(不含信号序列),其氨基酸序列如SEQ ID NO:45所示,由Biosci.Biotech.Biochem.,56:884-889(1992);Agric.Biol.Chem.545:1905-14(1990);Biosci.Biotechnol.Biochem.56:174-79(1992)鉴定。设计玉米优化核酸序列,如SEQ ID NO:46所示。
类似地,选择热解糖热厌氧杆菌(Thermoanaerobacteriumthermosaccharolyticum)葡糖淀粉酶,其氨基酸序列如SEQ ID NO:47所示,由Biosci.Biotech.Biochem.,62:302-308(1998)公开。设计玉米优化核酸序列(SEQ ID NO:48)。
选择米根霉(Rhizopus oryzea)葡糖淀粉酶,其氨基酸序列(不含信号序列)(SEQ ID NO:50)如文献所述(Agric.Biol.Chem.,(1986)50,pg 957-964)公开。设计玉米优化核酸序列,如SEQ ID NO:51所示。
另外,选择玉米α-淀粉酶,其氨基酸序列(SEQ ID NO:51)和核酸序列(SEQ ID NO:52)来自文献。例如参见Plant Physiol.105:759-760(1994)。
构建表达盒以从设计的SEQ ID NO:46玉米优化核酸表达Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合多肽,从设计的如SEQ ID NO:48所示玉米优化核酸表达热解糖热厌氧杆菌葡糖淀粉酶,从设计的如SEQ ID NO:50所示玉米优化核酸表达具有氨基酸(不含信号序列)(SEQ ID NO:49)的米根霉葡糖淀粉酶,以及表达玉米α-淀粉酶。
将质粒中含有的玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)与编码酶的合成基因融合。任选地,可将SEKDEL序列与合成基因的C末端融合以靶向并滞留到ER。将融合产物在植物转化质粒中克隆到玉米γ-玉米醇溶蛋白启动子之后以在胚乳内特异性表达。该融合产物通过土壤杆菌感染被运送到玉米组织。
实施例25
构建含有所选酶的表达盒以表达酶。将含有粗淀粉结合位点序列的质粒与编码酶的合成基因融合。粗淀粉结合位点使融合的酶能与非凝胶化的淀粉相结合。根据文献确定粗淀粉结合位点的氨基酸序列(SEQ ID NO:53),核酸序列经过对玉米优化,如SEQ ID NO:54所示。将玉米优化核酸序列在质粒中与编码酶的合成基因融合以在植物内表达。
实施例26
构建玉米优化基因和载体用于植物转化
如实施例1所述,使用玉米偏爱密码子设计基因或基因片段以构建合成基因。
选择激烈火球菌(Pyrococcus furiosus)EGLA耐超高温内切葡聚糖酶,其氨基酸序列(不含信号序列)如SEQ ID NO:55所示,由Journal of Bacteriology(1991)181,pg 284-290鉴定。设计玉米优化核酸序列,如SEQ ID NO:56所示。
选择黄栖热菌(Thermus flavus)木糖异构酶,其氨基酸序列如SEQ ID NO:57所示,由Applied Biochemistry and Biotechnology 62:15-27(1997)公开.
构建表达盒以从玉米优化的核酸(SEQ ID NO:56)表达激烈火球菌EGLA(内切葡聚糖酶),以及从SEQ ID NO:57氨基酸序列的玉米优化编码核酸表达黄栖热菌木糖异构酶。
将含有玉米γ-玉米醇溶蛋白N末端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)的质粒与编码酶的合成玉米优化基因融合。任选地,可将SEKDEL序列与合成基因的C末端融合以靶向并滞留到ER。将融合产物克隆到植物转化质粒中玉米γ-玉米醇溶蛋白启动子之后以在胚乳内特异性表达。该融合产物通过土壤杆菌感染被运送到玉米组织。
实施例27
使用玉米内表达的耐高温酶从玉米面粉生产葡萄糖
当与水溶液混合并在90℃孵育时,已证实耐超高温α-淀粉酶797GL3和α-葡糖苷酶(MalA)的表达可以导致葡萄糖产生。
通过测定α-葡糖苷酶活性来鉴定表达MalA酶的转基因玉米系(168A10B系,pNOV4831),酶活性由对硝基苯基-α-葡糖苷的水解指示。
将表达797GL3的转基因植物玉米粒在Kleco槽内研磨成面粉,由此形成淀粉酶面粉。将表达MalA的转基因植物玉米粒在Kleco槽内研磨成粉,形成MalA面粉。以同样方式将非转基因植物玉米粒研磨形成对照面粉。
缓冲液为50mM MES缓冲液pH 6.0
玉米面粉水解反应:如下表5所示制备样品。将玉米粉(约60mg/每份样品)与pH6.0的40ml 50mM MES缓冲液混合。在90℃水浴中孵育样品2.5小时和14小时。在指定的孵育时间点上取出样品并分析葡萄糖含量。
通过葡萄糖氧化酶/辣根过氧化物酶实验分析样品内的葡萄糖。GOPOD试剂含有:0.2mg/ml邻联茴香胺,100mM Tris pH7.5,100U/ml葡萄糖氧化酶和10U/ml辣根过氧化物酶。将20μl样品或稀释样品和葡萄糖标准(从0-0.22mg/ml变化)排列在96孔板上。向各孔中加入100μl GOPOD试剂并混合,然后37℃孵育该板30分钟。加入100μl硫酸(9M),540nm下读吸光值。参照标准曲线确定样品的葡萄糖浓度。在各样品内观察到的的葡萄糖量如表5所示。
表5
  样品   WT面粉mg 淀粉酶面粉mg   MalA面粉mg   缓冲液ml   葡萄糖2.5hmg   葡萄糖14hmg
  1   66   0   0   40   0   0
  2   31   30   0   40   0.26   0.50
  3   30   0   31.5   40   0   0.09
  4   0   32.2   30.0   40   229   12.30
  5   0   6.1   562   40   1.16   8.52
这些数据说明当玉米内表达耐超高温α-淀粉酶和α-葡糖苷酶形成玉米产物时,当该产物在适当条件下被水解和加热时可以形成葡萄糖。
实施例28
生产麦芽糖糊精
使用表达耐高温α-淀粉酶的谷物制备麦芽糖糊精。该示范性过程不需要淀粉的预分离,也不需要加入外源性酶。
将表达797GL3的转基因植物玉米粒在Kleco槽内研磨成粉,形成“淀粉酶面粉”。将10%转基因/90%非转基因玉米粒的混合物在Kleco槽内以同样方式研磨形成“10%淀粉酶面粉”。
以5μl水每mg面粉的比例用水混合淀粉酶面粉和10%淀粉酶面粉(约60mg/样品)。如表6所示,在90℃孵育获得的浆液不超过20小时。在85℃加入0.9ml 50mM EDTA终止反应并用吸管吹吸混合。取出0.2ml浆液样品,离心去除不溶物并用水稀释3倍。
用具有ELSD检测的HPLC分析样品中的糖和麦芽糖糊精。用Astec Polymer Amino柱,5微米粒度,250X 4.6mm和Alltech ELSD2000检测器装配梯度HPLC系统。用15∶85的水∶乙腈混合物预先平衡该系统。流速为1ml/min。注射上样后维持起始条件5分钟,然后为20分钟梯度至50∶50的水∶乙腈,再以相同溶剂运行10分钟。用80∶20的水∶乙腈洗该系统20分钟,然后用起始溶剂再平衡。
将所获的峰面积相对于面粉的体积和重量标化。每μg碳水化合物的ELSD响应因子随着DP的增高而降低,这样较高DP的麦芽糖糊精在总体中所占的百分比高于由峰面积所指示的。
100%淀粉酶面粉的反应产物的相对峰面积如图17所示。10%淀粉酶面粉的反应产物的相对峰面积如图18所示。
这些数据说明可通过改变加热时间来生产不同的麦芽糖糊精混合物。可通过混合转基因α-淀粉酶表达玉米和野生型玉米来改变α-淀粉酶活性水平,从而改变麦芽糖糊精性质谱。
本实施例所述的水解反应产物可通过多种成熟技术被浓缩并纯化用于食品和其它应用,所述技术包括:离心,过滤,离子交换,凝胶渗透,超滤,纳米过滤(nanofiltration),反向渗透,用碳颗粒脱色,喷雾干燥和其它本领域公知技术。
实施例29
时间和温度对麦芽糖糊精产量的影响
可通过改变反应时间和温度来改变含有耐高温α-淀粉酶的谷物自水解所获的麦芽糖糊精产物组成。
另一实验中,如上实施例28所述制备淀粉酶面粉并以300μl水每60mg面粉的比例与水混合。在70℃,80℃,90℃或100℃孵育样品不超过90分钟。在90℃加入900ml 50mM EDTA终止反应。离心去除不溶物并通过0.45μm尼龙滤器过滤。如实施例28所述HPLC分析滤液。
分析结果如图19所示。DP数命名是指聚合程度。DP2是麦芽糖;DP3是麦芽三糖等。临近洗脱末尾的一个单峰中洗脱下较大的DP麦芽糖糊精,标记为“>DP12”。该聚集体包括可以通过0.45μm滤器和通过保护柱的糊精,并不含有不能通过滤器或保护柱的非常大淀粉片段。
该实验说明可通过改变温度和孵育时间来改变产物的麦芽糖糊精组成,以获得期望的麦芽寡糖或麦芽糖糊精产物。
实施例30
生产麦芽糖糊精
还可在加热处理前向水和面粉混合物中加入其它酶如α-葡糖苷酶和木糖异构酶,或者通过包括盐来改变由含有耐高温α-淀粉酶的转基因玉米所形成的麦芽糖糊精产物的组成。
另一实验中,如上制备的淀粉酶面粉与纯化的MalA和/或命名为BD8037的细菌木糖异构酶混合。在大肠杆菌内表达带有6His纯化标签的硫磺矿硫化叶菌MalA。如实施例28所述制备细胞裂解液,然后使用镍亲合树脂(Probond,Invitrogen)根据厂商说明书对天然蛋白的纯化说明,纯化至均匀外观。从Diversa获得的木糖异构酶BD8037为冻干粉末,将其重悬浮在0.4x初始体积的水中。
将淀粉酶玉米粉与酶溶液和水或缓冲液混合。所有的反应都含有60mg淀粉酶面粉和总共600μl的液体。一组反应用加入了10mMMgSO4,1mM CoCl2的50mM室温下pH7.0的MOPS作为缓冲液;第二组反应用水代替含金属的缓冲液。所有反应均在90℃孵育2小时。离心制备反应上清液。用额外600μl水洗涤沉淀并再离心。将来自各反应的上清液合并,Centrico 10过滤,如上所述,用带有ELSD检测的HPLC分析。
结果如图20所示。该图说明,加入或不加入金属离子,表达淀粉酶797GL3的谷物都能够与其它耐高温酶作用,在高温下从玉米粉生成各种麦芽糖糊精混合物。特别地,将葡糖淀粉酶或α-葡糖苷酶包括在内可以产生更多葡萄糖产物和其它低DP产物。包括葡萄糖异构酶可以使产物内存在果糖,这样可以比由淀粉酶单独或淀粉酶与α-葡糖苷酶形成的产物更甜。另外,该数据还表明DP5,DP6和DP7麦芽寡糖的比例可以通过加入二价阳离子盐,如CoCl2和MgSO4来提高。
改变由此处所述反应所形成的麦芽糖糊精的组成的其它方法包括:改变反应pH,改变转基因或非转基因谷物内的淀粉类型,改变固体比率或加入有机溶剂。
实施例31
在回收淀粉衍生产物之前无需机械破坏从谷物制备糊精或糖
将表达α-淀粉酶797GL3的转基因谷物与水接触并在90℃加热过夜(>14小时),制备了糖和麦芽糖糊精。然后从谷物中过滤分离液体。通过实施例15所述方法HPLC分析液体产物。表6给出所检测产物的情况。
表6
  分子种类   产物浓度μg/25μl注射量
  果糖   0.4
  葡萄糖   18.0
  麦芽糖   56.0
  DP3<sup>*</sup>   26.0
  DP4<sup>*</sup>   15.9
  DP5<sup>*</sup>   11.3
  DP6<sup>*</sup>   5.3
  DP7<sup>*</sup>   1.5
DP3的定量包括麦芽三糖还可包括以α(1→6)键替代了α(1→4)键的麦芽三糖异构体。类似地,DP4-DP7的定量包括指定链长的直链麦芽寡糖以及以一个或多个α(1→6)键替代了一个或多个α(1→4)键的异构体。
这些数据表明将表达α-淀粉酶的完整谷物与水接触并加热可以制备糖和麦芽糖糊精。然后可以通过过滤或离心或重力沉降从完整谷物分离产物。
实施例32
发酵表达米根霉葡糖淀粉酶的玉米中粗淀粉
从按实施例29所述制备的转基因植物收获转基因玉米粒。将此玉米粒研磨成面粉。该玉米粒表达含有米根霉葡糖淀粉酶(SEQ ID NO:49)的活性片段的蛋白,该蛋白靶向内质网。
如实施例15所述将玉米粒研磨成粉。然后制备含有20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2排出通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例33
发酵表达米根霉葡糖淀粉酶的玉米中的粗淀粉的实施例
从按实施例28所述制备的转基因植物收获转基因玉米粒。将玉米粒磨成粉。该玉米粒表达含有米根霉葡糖淀粉酶(SEQ ID NO:49)的活性片段的蛋白,该蛋白靶向内质网。
如实施例15所述将玉米粒研磨成粉。然后制备含有20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml10倍稀释的50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2排出通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例34
加入外源性α-淀粉酶发酵表达米根霉葡糖淀粉酶的玉米的完整玉 米粒中的粗淀粉的实施例
从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米粒表达含有米根霉葡糖淀粉酶(SEQ ID NO:49)的活性片段的蛋白,该蛋白靶向内质网。
将玉米粒与20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)相接触。加入氢氧化铵调整pH为6.0。加入下述成分:购自sigma的大麦α-淀粉酶(2mg),蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有混合物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该混合物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例35
发酵表达米根霉葡糖淀粉酶和玉米(Zea mays)淀粉酶的玉米中 的粗淀粉的实施例
从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米粒表达含有米根霉葡糖淀粉酶(SEQ ID NO:49)的活性片段的蛋白,该蛋白靶向内质网。该玉米粒还表达带有粗淀粉结合域的玉米淀粉酶,如实施例28所述。
如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例36
发酵表达热解糖热厌氧杆菌葡糖淀粉酶的玉米中的粗淀粉的实施
从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米粒表达含有热解糖热厌氧杆菌葡糖淀粉酶(SEQ ID NO:47)的活性片段的蛋白,该蛋白靶向内质网。
如实施例15所述将玉米粒研磨成粉。然后制备含有20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例37
发酵表达黑曲霉(Aspergillus niger)葡糖淀粉酶的玉米中的粗淀 粉的实施例
从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米粒表达含有黑曲霉葡糖淀粉酶的活性片段(Fiil,N.P.“从两个不同但紧密相关的mRNA合成黑曲霉的葡糖淀粉酶G1和G2”EMBO J.3(5),1097-1102(1984)登录号P04064)的蛋白。编码该葡糖淀粉酶的玉米优化核酸具有SEQ ID NO:59的序列,该蛋白靶向内质网。
如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)的混合物。加入氢氧化铵调整pH为6.0。向混合物中加入下述:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有混合物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例39
发酵表达黑曲霉葡糖淀粉酶和玉米(Zea mays)淀粉酶的玉米中 的粗淀粉的实施例
从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米粒表达含有黑曲霉葡糖淀粉酶的活性片段(Fiil,N.P.“Glucoamylases从两个不同但紧密相关的mRNA合成黑曲霉的葡糖淀粉酶G1和G2”EMBO J.3(5),1097-1102(1984)登录号P04064)的蛋白(SEQ ID NO:59,玉米优化核酸),该蛋白靶向内质网。该玉米粒还表达带有粗淀粉结合域的玉米淀粉酶,如实施例28所述。
如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例39
发酵表达热解糖热厌氧杆菌葡糖淀粉酶和大麦淀粉酶的玉米中的 粗淀粉的实施例
从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米粒表达含有热解糖热厌氧杆菌葡糖淀粉酶(SEQ ID NO:47)活性片段的蛋白,该蛋白靶向内质网。该玉米粒还表达低pI大麦淀粉酶amy1基因(Rogers,J.C.和Milliman,C.“分离并序列分析大麦α-淀粉酶cDNA克隆”J.Biol.Chem.258(13),8169-8174(1983)),该基因被修饰以使蛋白表达靶向内质网。
如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化铵调整pH为6.0。向浆状物中加入下述在成分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例40
发酵表达热解糖热厌氧杆菌葡糖淀粉酶和大麦淀粉酶的玉米的完 整玉米粒内粗淀粉的实施例
从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米粒表达含有热解糖热厌氧杆菌葡糖淀粉酶(SEQ ID NO:47)活性片段的蛋白,该蛋白靶向内质网。该玉米粒还表达低pI大麦淀粉酶amy1基因(Rogers,J.C.和Milliman,C.“分离并序列分析大麦α-淀粉酶cDNA克隆”J.Biol.Chem.258(13),8169-8174(1983)),该基因被修饰以使蛋白表达靶向内质网。
将玉米粒与20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)相接触。加入氢氧化铵调整pH为6.0。向混合物中加入下述成分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有混合物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该混合物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
实施例41
发酵表达α-淀粉酶和葡糖淀粉酶融合物的玉米中的粗淀粉的实施例
从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米粒表达例如SEQ ID NO:46提供的玉米优化多核苷酸,该多核苷酸编码α-淀粉酶和葡糖淀粉酶融合物如SEQ ID NO:45,其靶向内质网。
如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉,23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide&urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设为82F。
接种的酵母如实施例14所述进行繁殖。
如实施例14所述取出样品然后用实施例14所述方法分析。
所有出版物,专利和专利申请均并入此处作为参考。根据上面的说明书,本发明已经通过一些优选实施方案描述了本发明,许多详细描述只是为了举例说明本发明,本领域技术人员均可理解:本发明是容许其它实施方案的,并且这里所述的一些细节可以在不背离本发明基本原则的情况下被相当大地改变。
797GL3α-淀粉酶氨基酸序列(SEQ ID NO:1)
MAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGISAIWIPPASKGMSGGYSM
GYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVLADIVINHRAGGDLEWNPF
VGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDICHDKSWDQYWLWASQES
YAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGEYWDTNVDALLNWAYSSG
AKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAVTFVANHDTDIIWNKYPAY
AFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVYYDSDEMIFVRNGYGSKPG
LITYINLGSSKVGRWVYVPKFAGACIHHEYTGNLGGWVDKYVYSSGWVYLEAPAYDPANGQ
YGYSVWSYCGVG
797GL3α-淀粉酶玉米优化核酸序列(SEQ ID NO:2)
ATGGCCAAGTACCTGGAGCTGGAGGAGGGCGGCGTGATCATGCAGGCGTTCTACTGGGA
CGTCCCGAGCGGAGGCATCTGGTGGGACACCATCCGCCAGAAGATCCCCGAGTGGTACG
ACGCCGGCATCTCCGCGATCTGGATACCGCCAGCTTCCAAGGGCATGTCCGGGGGCTACT
CGATGGGCTACGACCCGTACGACTACTTCGACCTCGGCGAGTACTACCAGAAGGGCACG
GTGGAGACGCGCTTCGG GTCCAAGCAGGAGCTCATCAACATGATCAACACGGCGCACGC
CTACGGCATCAAGGTCATCGCGGACATCGTGATCAACCACAGGGCCGGCGGCGACCTGG
AGTGGAACCCGTTCGTCGGCGACTACACCTGGACGGACTTCTCCAAGGTCGCCTCCGGCA
AGTACACCGCCAACTACCTCGACTTCCACCCCAACGAGCTGCACGCGGGCGACTCCGGC
ACGTTCGGCGGCTACCCGGACATCTGCCACGACAAGTCCTGGGACCAGTACTGGCTCTGG
GCCTCGCAGGAGTCCTACGCGGCCTACCTGCGCTCCATCGGCATCGACGCGTGGCGCTTC
GACTACGTCAAGGGCTACGGGGCCTGGGTGGTCAAGGACTGGCTCAACTGGTGGGGCGG
CTGGGCGGTGGGCGAGTACTGGGACACCAACGTCGACGCGCTGCTCAACTGGGCCTACT
CCTCCGGCGCCAAGGTGTTCGACTTCCCCCTGTACTACAAGATGGACGCGGCCTTCGACA
ACAAGAACATCCCGGCGCTCGTCGAGGCCCTGAAGAACGGCGGCACGGTGGTCTCCCGC
GACCCGTTCAAGGCCGTGACCTTCGTCGCCAACCACGACACGGACATCATCTGGAACAA
GTACCCGGCGTACGCCTTCATCCTCACCTACGAGGGCCAGCCCACGATCTTCTACCGCGA
CTACGAGGAGTGGCTGAACAAGGACAAGCTCAAGAACCTGATCTGGATTCACGACAACC
TCGCGGGCGGCTCCACTAGTATCGTGTACTACGACTCCGACGAGATGATCTTCGTCCGCA
ACGGCTACGGCTCCAAGCCCGGCCTGATCACGTACATCAACCTGGGCTCCTCCAAGGTGG
GCCGCTGGGTGTACGTCCCGAAGTTCGCCGGCGCGTGCATCCACGAGTACACCGGCAAC
CTCGGCGGCTGGGTGGACAAGTACGTGTACTCCTCCGGCTGGGTCTACCTGGAGGCCCCG
GCCTACGACCCCGCCAACGGCCAGTACGGCTACTCCGTGTGGTCCTACTGCGGCGTCGGC
6gp3支链淀粉酶氨基酸序列(SEQ ID NO:3)
MGHWYKHQRAYQFTGEDDFGKVAVVKLPMDLTKVGIIVRLNEWQAKDVAKDRFIEIKDGK
AEVWILQGVEEIFYEKPDTSPRIFFAQARSNKVIEAFLTNPVDTKKKELFKVTVDGKEIPVSRV
EKADPTDIDVTNYVRIVLSESLKEEDLRKDVELIIEGYKPARVIMMEILDDYYYDGELGAVYS
PEKTIFRVWSPVSKWVKVLLFKNGEDTEPYQVVNMEYKGNGVWEAVVEGDLDGVFYLYQL
ENYGKIRTTVDPYSKAVYANNQESAVVNLARTNPEGWENDRGPKIEGYEDAIIYEIHIADITG
LENSGVKNKGLYLGLTEENTKGPGGVTTGLSHLVELGVTHVHILPFFDFYTGDELDKDFEKY
YNWGYDPYLFMVPEGRYSTDPKNPHTRIREVKEMVKALHKHGIGVIMDMVFPHTYGIGELS
AFDQTVPYYFYRIDKTGAYLNESGCGNVIASERPMMRKFIVDTVTYWVKEYHIDGFRFDQM
GLIDKKTMLEVERALHKIDPTIILYGEPWGGWGAPIRFGKSDVAGTHVAAFNDEFRDAIRGSV
FNPSVKGFVMGGYGKETKIKRGVVGSINYDGKLIKSFALDPEETINYAACHDNHTLWDKNY
LAAKADKKKEWTEEELKNAQKLAGAILLTSQGVPFLHGGQDFCRTTNFNDNSYNAPISINGF
DYERKLQFIDVFNYHKGLIKLRKEHPAFRLKNAEEIKKHLEFLPGGRRIVAFMLKDHAGGDP
WKDIVVIYNGNLEKTTYKLPEGKWNVVVNSQKAGTEVIETVEGTIELDPLSAYVLYRE
6gp3支链淀粉酶玉米优化核酸序列(SEQ ID NO:4)
ATGGGCCACTGGTACAAGCACCAGCGCGCCTACCAGTTCACCGGCGAGGACGACTTCGG
GAAGGTGGCCGTGGTGAAGCTCCCGATGGACCTCACCAAGGTGGGCATCATCGTGCGCC
TCAACGAGTGGCAGGCGAAGGACGTGGCCAAGGACCGCTTCATCGAGATCAAGGACGGC
AAGGCCGAGGTGTGGATACTCCAGGGCGTGGAGGAGATCTTCTACGAGAAGCCGGACAC
CTCCCCGCGCATCTTCTTCGCCCAGGCCCGCTCCAACAAGGTGATCGAGGCCTTCCTCAC
CAACCCGGTGGACACCAAGAAGAAGGAGCTGTTCAAGGTGACCGTCGACGGCAAGGAG
ATCCCGGTGTCCCGCGTGGAGAAGGCCGACCCGACCGACATCGACGTGACCAACTACGT
GCGCATCGTGCTCTCCGAGTCCCTCAAGGAGGAGGACCTCCGCAAGGACGTGGAGCTGA
TCATCGAGGGCTACAAGCCGGCCCGCGTGATCATGATGGAGATCCTCGACGACTACTACT
ACGACGGCGAGCTGGGGGCGGTGTACTCCCCGGAGAAGACCATCTTCCGCGTGTGGTCC
CCGGTGTCCAAGTGGGTGAAGGTGCTCCTCTTCAAGAACGGCGAGGACACCGAGCCGTA
CCAGGTGGTGAACATGGAGTACAAGGGCAACGGCGTGTGGGAGGCCGTGGTGGAGGGC
GACCTCGACGGCGTGTTCTACCTCTACCAGCTGGAGAACTACGGCAAGATCCGCACCACC
GTGGACCCGTACTCCAAGGCCGTGTACGCCAACAACCAGGAGTCTGCAGTGGTGAACCT
CGCCCGCACCAACCCGGAGGGCTGGGAGAACGACCGCGGCCCGAAGATCGAGGGCTAC
GAGGACGCCATCATCTACGAGATCCACATCGCCGACATCACCGGCCTGGAGAACTCCGG
CGTGAAGAACAAGGGCCTCTACCTCGGCCTCACCGAGGAGAACACCAAGGCCCCGGGCG
GCGTGACCACCGGCCTCTCCCACCTCGTGGAGCTGGGCGTGACCCACGTGCACATCCTCC
CGTTCTTCGACTTCTACACCGGCGACGAGCTGGACAAGGACTTCGAGAAGTACTACAACT
GGGGCTACGACCCGTACCTCTTCATGGTGCCGGAGGGCCGCTACTCCACCGACCCGAAG
AACCCGCACACCCGAATTCGCGAGGTGAAGGAGATGGTGAAGGCCCTCCACAAGCACGG
CATCGGCGTGATCATGGACATGGTGTTCCCGCACACCTACGGCATCGGCGAGCTGTCCGC
CTTCGACCAGACCGTGCCGTACTACTTCTACCGCATCGACAAGACCGGCGCCTACCTCAA
CGAGTCCGGCTGCGGCAACGTGATCGCCTCCGAGCGCCCGATGATGCGCAAGTTCATCGT
GGACACCGTGACCTACTGGGTGAAGGAGTACCACATCGACGGCTTCCGCTTCGACCAGA
TGGGCCTCATCGACAAGAAGACCATGCTGGAGGTGGAGCGCGCCCTCCACAAGATCGAC
CCGACCATCATCCTCTACGGCGAGCCGTGGGGCGGCTGGGGGGCCCCGATCCGCTTCGG
CAAGTCCGACGTGGCCGGCACCCACGTGGCCGCCTTCAACGACGAGTTCCGCGACGCCA
TCCGCGGCTCCGTGTTCAACCCGTCCGTGAAGGGCTTCGTGATGGGCGGCTACGGCAAGG
AGACCAAGATCAAGCGCGGCGTGGTGGGCTCCATCAACTACGACGGCAAGCTCATCAAG
TCCTTCGCCCTCGACCCGGAGGAGACCATCAACTACGCCGCCTGCCACGACAACCACACC
CTCTGGGACAAGAACTACCTCGCCGCCAAGGCCGACAAGAAGAAGGAGTGGACCGAGG
AGGAGCTGAAGAACGCCCAGAAGCTCGCCGGCGCCATCCTCCTCACTAGTCAGGGCGTG
CCGTTCCTCCACGGCGGCCAGGACTTCTGCCGCACCACCAACTTCAACGACAACTCCTAC
AACGCCCCGATCTCCATCAACGGCTTCGACTACGAGCGCAAGCTCCAGTTCATCGACGTG
TTCAACTACC ACAAGGGCCTCATCAAGCTCCGCAAGGAGCACCCGGCCTTCCGCCTCAAG
AACGCCGAGGAGATCAAGAAGCACCTGGAGTTCCTCCCGGGCGGGCGCCGCATCGTGGC
CTTCATGCTCAAGGACCACGCCGGCGGCGACCCGTGGAAGGACATCGTGGTGATCTACA
ACGGCAACCTGGAGAAGACCACCTACAAGCTCCCGGAGGGCAAGTGGAACGTGGTGGTG
AACTCCCAGAAGGCCGGCACCGAGGTGATCGAGACCGTGGAGGGCACCATCGAGCTGGA
CCCGCTCTCCGCCTACGTGCTCTACCGCGAG
硫磺矿硫化叶菌maI A α-葡糖苷酶氨基酸序列(SEQ ID NO:5)
METIKIYENKGVYKVVIGEPFPPIEFPLEQKISSNKSLSELGLTIVQQGNKVTVEKSLDLKEHIIG
LGEKAFELDRKRKRYVMYNVDAGAYKKYQDPLYVSIPLFISVKDGVATGYFFNSASKVIFDV
GLEEYDKVIVTIPEDSVEFYVIEGPRIEDVLEKYTELTGKPFLPPMWAFGYMISRYSYYPQDK
VVELVDIMQKEGFRVAGVFLDIHYMDSYKLFTWHPYRFPEPKKLIDELHKRNVKLITIVDHGI
RVDQNYSPFLSGMGKFCEIESGELFVGKMWPGTTVYPDFFREDTREWWAGLISEWLSQGVD
GIWLDMNEPTDFSRAIEIRDVLSSLPVQFRDDRLVTTFPDNVVHYLRGKRVKHEKVRNAYPL
YEAMATFKGFRTSHRNEIFILSRAGYAGIQRYAFIWTGDNTPSWDDLKLQLQLVLGLSISGVP
FVGCDIGGFQGRNFAEIDNSMDLLVKYYALALFFPFYRSHKATDGIDTEPVFLPDYYKEKVK
EIVELRYKFLPYIYSLALEASEKGHPVIRPLFYEFQDDDDMYRIEDEYMVGKYLLYAPIVSKEE
SRLVTLPRGKWYNYWNGEIINGKS VVKSTHELPIYLREGSIIPLEGDELIVYGETSFKRYDNAE
ITSSSNEIKFSREIYVSKLTITSEKPVSKIIVDDSKEIQVEKTMQNTYVAKINQKIRGKINLE
硫磺矿硫化叶菌mal A α-葡糖苷酶玉米优化核酸序列(SEQ ID NO:6)
ATGGAGACCATCAAGATCTACGAGAACAAGGGCGTGTACAAGGTGGTGATCGGCGAGCC
GTTCCCGCCGATCGAGTTCCCGCTCGAGCAGAAGATCTCCTCCAACAAGTCCCTCTCCGA
GCTGGGCCTCACCATCGTGCAGCAGGGCAACAAGGTGATCGTGGAGAAGTCCCTCGACC
TCAAGGAGCACATCATCGGCCTCGGCGAGAAGGCCTTCGAGCTGGACCGCAAGCGCAAG
CGCTACGTGATGTACAACGTGGACGCCGGCGCCTACAAGAAGTACCAGGACCCGCTCTA
CGTGTCCATCCCGCTCTTCATCTCCGTGAAGGACGGCGTGGCCACCGGCTACTTCTTCAA
CTCCGCCTCCAAGGTGATCTTCGACGTGGGCCTCGAGGAGTACGACAAGGTGATCGTGA
CCATCCCGGAGGACTCCGTGGAGTTCTACGTGATCGAGGGCCCGCGCATCGAGGACGTG
CTCGAGAAGTACACCGAGCTGACCGGCAAGCCGTTCCTCCCGCCGATGTGGGCCTTCGGC
TACATGATCTCCCGCTACTCCTACTACCCGCAGGACAAGGTGGTGGAGCTGGTGGACATC
ATGCAGAAGGAGGGCTTCCGCGTGGCCGGCGTGTTCCTCGACATCCACTACATGGACTCC
TACAAGCTCTTCACCTGGCACCCGTACCGCTTCCCGGAGCCGAAGAAGCTCATCGACGAG
CTGCACAAGCGCAACGTGAAGCTCATCACCATCGTGGACCACGGCATCCGCGTGGACCA
GAACTACTCCCCGTTCCTCTCCGGCATGGGCAAGTTCTGCGAGATCGAGTCCGGCGAGCT
GTTCGTGGGCAAGATGTGGCCGGGCACCACCGTGTACCCGGACTTCTTCCGCGAGGACA
CCCGCGAGTGGTGGGCCGGCCTCATCTCCGAGTGGCTCTCCCAGGGCGTGGACGGCATCT
GGCTCGACATGAACGAGCCGACCGACTTCTCCCGCGCCATCGAGATCCGCGACGTGCTCT
CCTCCCTCCCGGTGCAGTTCCGCGACGACCGCCTCGTGACCACCTTCCCGGACAACGTGG
TGCACTACCTCCGCGGCAAGCGCGTGAAGCACGAGAAGGTGCGCAACGCCTACCCGCTC
TACGAGGCGATGGCCACCTTCAAGGGCTTCCGCACCTCCCACCGCAACGAGATCTTCATC
CTCTCCCGCGCCGGCTACGCCGGCATCCAGCGCTACGCCTTCATCTGGACCGGCGACAAC
ACCCCGTCCTGGGACGACCTCAAGCTCCAGCTCCAGCTCGTGCTCGGCCTCTCCATCTCC
GGCGTGCCGTTCGTGGGCTGCGACATCGGCGGCTTCCAGGGCCGCAACTTCGCCGAGATC
GACAACTCGATGGACCTCCTCGTGAAGTACTACGCCCTCGCCCTCTTCTTCCCGTTCTACC
GCTCCCACAAGGCCACCGACGGCATCGACACCGAGCCGGTGTTCCTCCCGGACTACTAC
AAGGAGAAGGTGAAGGAGATCGTGGAGCTGCGCTACAAGTTCCTCCCGTACATCTACTC
CCTCGCCCTCGAGGCCTCCGAGAAGGGCCACCCGGTGATCCGCCCGCTCTTCTACGAGTT
CCAGGACGACGACGACATGTACCGCATCGAGGACGAGTACATGGTGGGCAAGTACCTCC
TCTACGCCCCGATCGTGTCCAAGGAGGAGTCCCGCCTCGTGACCCTCCCGCGCGGCAAGT
GGTACAACTACTGGAACGGCGAGATCATCAACGGCAAGTCCGTGGTGAAGTCCACCCAC
GAGCTGCCGATC TACCTCCGCGAGGGCTCCATCATCCCGCTCGAGGGCGACGAGCTGATC
GTGTACGGCGAGACCTCCTTCAAGCGCTACGACAACGCCGAGATCACCTCCTCCTCCAAC
GAGATCAAGTTCTCCCGCGAGATCTACGTGTCCAAGCTCACCATCACCTCCGAGAAGCCG
GTGTCCAAGATCATCGTGGACGACTCCAAGGAGATCCAGGTGGAGAAGACCATGCAGAA
CACCTACGTGGCCAAGATCAACCAGAAGATCCGCGGCAAGATCAACCTCGAGTGA
Waxy cDNA序列(SEQ ID NO:7)
ATGGCGGCTCTGGCCACGTCGCAGCTCGTCGCAACGCGCGCCGGCCTGGGCGTCCCGGA
CGCGTCCACGTTCCGCCGCGGCGCCGCGCAGGGCCTGAGGGGGGCCCGGGCGTCGGCGG
CGGCGGACACGCTCAGCATGCGGACCAGCGCGCGCGCGGCGCCCAGGCACCAGCACCAG
CAGGCGCGCCGCGGGGCCAGGTTCCCGTCGCTCGTCGTGTGCGCCAGCGCCGGCATGAA
CGTCGTCTTCGTCGGCGCCGAGATGGCGCCGTGGAGCAAGACCGGAGGCCTCGGCGACG
TCCTCGGCGGCCTGCCGCCGGCCATGGCCGCGAACGGGCACCGTGTCATGGTCGTCTCTC
CCCGCTACGACCAGTACAAGGACGCCTGGGACACCAGCGTCGTGTCCGAGATCAAGATG
GGAGACGGGTACGAGACGGTCAGGTTCTTCCACTGCTACAAGCGCGGAGTGGACCGCGT
GTTCGTTGACCACCCACTGTTCCTGGAGAGGGTTTGGGGAAAGACCGAGGAGAAGATCT
ACGGGCCTGTCGCTGGAACGGACTACAGGGACAACCAGCTGCGGTTCAGCCTGCTATGC
CAGGCAGCACTTGAAGCTCCAAGGATCCTGAGCCTCAACAACAACCCATACTTCTCCGG
ACCATACGGGGAGGACGTCGTGTTCGTCTGCAACGACTGGCACACCGGCCCTCTCTCGTG
CTACCTCAAGAGCAACTACCAGTCCCACGGCATCTACAGGGACGCAAAGACCGCTTTCT
GCATCCACAACATCTCCTACCAGGGCCGGTTCGCCTTCTCCGACTACCCGGAGCTGAACC
TCCCCGAGAGATTCAAGTCGTCCTTCGATTTCATCGACGGCTACGAGAAGCCCGTGGAAG
GCCGGAAGATCAACTGGATGAAGGCCGGGATCCTCGAGGCCGACAGGGTCCTCACCGTC
AGCCCCTACTACGCCGAGGAGCTCATCTCCGGCATCGCCAGGGGCTGCGAGCTCGACAA
CATCATGCGCCTCACCGGCATCACCGGCATCGTCAACGGCATGGACGTCAGCGAGTGGG
ACCCCAGCAGGGACAAGTACATCGCCGTGAAGTACGACGTGTCGACGGCCGTGGAGGCC
AAGGCGCTGAACAAGGAGGCGCTGCAGGCGGAGGTCGGGCTCCCGGTGGACCGGAACA
TCCCGCTGGTGGCGTTCATCGGCAGGCTGGAAGAGCAGAAGGGCCCCGACGTCATGGCG
GCCGCCATCCCGCAGCTCATGGAGATGGTGGAGGACGTGCAGATCGTTCTGCTGGGCAC
GGGCAAGAAGAAGTTCGAGCGCATGCTCATGAGCGCCGAGGAGAAGTTCCCAGGCAAG
GTGCGCGCCGTGGTCAAGTTCAACGCGGCGCTGGCGCACCACATCATGGCCGGCGCCGA
CGTGCTCGCCGTCACCAGCCGCTTCGAGCCCTGCGGCCTCATCCAGCTGCAGGGGATGCG
ATACGGAACGCCCTGCGCCTGCGCGTCCACCGGTGGACTCGTCGACACCATCATCGAAG
GCAAGACCGGGTTCCACATGGGCCGCCTCAGCGTCGACTGCAACGTCGTGGAGCCGGCG
GACGTCAAGAAGGTGGCCACCACCTTGCAGCGCGCCATCAAGGTGGTCGGCACGCCGGC
GTACGAGGAGATGGTGAGGAACTGCATGATCCAGGATCTCTCCTGGAAGGGCCCTGCCA
AGAACTGGGAGAACGTGCTGCTCAGCCTCGGGGTCGCCGGCGGCGAGCCAGGGGTTGAA
GGCGAGGAGATCGCGCCGCTCGCCAAGGAGAACGTGGCCGCGCCC
Waxy氨基酸序列(SEQ ID NO:8)
MAALATSQLVATRAGLGVPDASTFRRGAAQGLRGARASAAADTLSMRTSARAAPRHQHQQ
ARRGARFPSLVVCASAGMNVVFVGAEMAPWSKTGGLGDVLGGLPPAMAANGHRVMVVSP
RYDQYKDAWDTSVVSEIKMGDGYETVRFFHCYKRGVDRVFVDHPLFLERVWGKTEEKIYG
PVAGTDYRDNQLRFSLLCQAALEAPRILSLNNNPYFSGPYGEDVVFVCNDWHTGPLSCYLKS
NYQSHGIYRDAKTAFCIHNISYQGRFAFSDYPELNLPERFKSSFDFIDGYEKPVEGRKINWMK
AGILEADRVLTVSPYYAEELISGIARGCELDNIMRLTGITGIVNGMDVSEWDPSRDKYLAVKY
DVSTAVEAKALNKEALQAEVGLPVDRNIPLVAFIGRLEEQKGPDVMAAAIPQLMEMVEDVQ
IVLLGTGKKKFERMLMSAEEKFPGKVRAVVKFNAALAHHIMAGADVLAVTSRFEPCGLIQL
QGMRYGTPCACASTGGLVDTIIEGKTGFHMGRLSVDCNVVEPADVKKVATTLQRAIKVVGT
PAYEEMVRNCMIQDLSWKGPAKNWENVLLSLGVAGGEPGVEGEELAPLAKENVAAP
797GL3/Waxy核酸序列(SEQ ID NO:9)
ATGGCCAAGTACCTGGAGCTGGAGGAGGGCGGCGTGATCATGCAGGCGTTCTACTGGGA
CGTCCCGAGCGGAGGCATCTGGTGGGACACCATCCGCCAGAAGATCCCCGAGTGGTACG
ACGCCGGCATCTCCGCGATCTGGATACCGCCAGCTTCCAAGGGCATGTCCGGGGGCTACT
CGATGGGCTACGACCCGTACGACTACTTCGACCTCGGCGAGTACTACCAGAAGGGCACG
GTGGAGACGCGCTTCGGGTCCAAGCAGGAGCTCATCAACATGATCAACACGGCGCACGC
CTACGGCATCAAGGTCATCGCGGACATCGTGATCAACCACAGGGCCGGCGGCGACCTGG
AGTGGAACCCGTTCGTCGGCGACTACACCTGGACGGACTTCTCCAAGGTCGCCTCCGGCA
AGTACACCGCCAACTACCTCGACTTCCACCCCAACGAGCTGCACGCGGGCGACTCCGGC
ACGTTCGGCGGCTACCCGGACATCTGCCACGACAAGTCCTGGGACCAGTACTGGCTCTGG
GCCTCGCAGGAGTCCTACGCGGCCTACCTGCGCTCCATCGGCATCGACGCGTGGCGCTTC
GACTACGTCAAGGGCTACGGGGCCTGGGTGGTCAAGGACTGGCTCAACTGGTGGGGCGG
CTGGGCGGTGGGCGAGTACTGGGACACCAACGTCGACGCGCTGCTCAACTGGGCCTACT
CCTCCGGCGCCAAGGTGTTCGACTTCCCCCTGTACTACAAGATGGACGCGGCCTTCGACA
ACAAGAACATCCCGGCGCTCGTCGAGGCCCTGAAGAACGGCGGCACGGTGGTCTCCCGC
GACCCGTTCAAGGCCGTGACCTTCGTCGCCAACCACGACACGGACATCATCTGGAACAA
GTACCCGGCGTACGCCTTCATCCTCACCTACGAGGGCCAGCCCACGATCTTCTACCGCGA
CTACGAGGAGTGGCTGAACAAGGACAAGCTCAAGAACCTGATCTGGATTCACGACAACC
TCGCGGGCGGCTCCACTAGTATCGTGTACTACGACTCCGACGAGATGATCTTCGTCCGCA
ACGGCTACGGCTCCAAGCCCGGCCTGATCACGTACATCAACCTGGGCTCCTCCAAGGTGG
GCCGCTGGGTGTACGTCCCGAAGTTCGCCGGCGCGTGCATCCACGAGTACACCGGCAAC
CTCGGCGGCTGGGTGGACAAGTACGTGTACTCCTCCGGCTGGGTCTACCTGGAGGCCCCG
GCCTACGACCCCGCCAACGGCCAGTACGGCTACTCCGTGTGGTCCTACTGCGGCGTCGGC
ACATCGATTGCTGGCATCCTCGAGGCCGACAGGGTCCTCACCGTCAGCCCCTACTACGCC
GAGGAGCTCATCTCCGGCATCGCCAGGGGCTGCGAGCTCGACAACATCATGCGCCTCAC
CGGCATCACCGGCATCGTCAACGGCATGGACGTCAGCGAGTGGGACCCCAGCAGGGACA
AGTACATCGCCGTGAAGTACGACGTGTCGACGGCCGTGGAGGCCAAGGCGCTGAACAAG
GAGGCGCTGCAGGCGGAGGTCGGGCTCCCGGTGGACCGGAACATCCCGCTGGTGGCGTT
CATCGGCAGGCTGGAAGAGCAGAAGGGCCCCGACGTCATGGCGGCCGCCATCCCGCAGC
TCATGGAGATGGTGGAGGACGTGCAGATCGTTCTGCTGGGCACGGGCAAGAAGAAGTTC
GAGCGCATGCTCATGAGCGCCGAGGAGAAGTTCCCAGGCAAGGTGCGCGCCGTGGTCAA
GTTCAACGCGGCGCTGGCGCACCACATCATGGCCGGCGCCGACGTGCTCGCCGTCACCA
GCCGCTTCGAGCCCTGCGGCCTCATCCAGCTGCAGGGGATGCGATACGGAACGCCCTGC
GCCTGCGCGTCCACCGGTGGACTCGTCGACACCATCATCGAAGGCAAGACCGGGTTCCA
CATGGGCCGCCTCAGCGTCGACTGCAACGTCGTGGAGCCGGCGGACGTCAAGAAGGTGG
CCACCACCTTGCAGCGCGCCATCAAGGTGGTCGGCACGCCGGCGTACGAGGAGATGGTG
AGGAACTGCATGATCCAGGATCTCTCCTGGAAGGGCCCTGCCAAGAACTGGGAGAACGT
GCTGCTCAGCCTCGGGGTCGCCGGCGGCGAGCCAGGGGTTGAAGGCGAGGAGATCGCGC
CGCTCGCCAAGGAGAACGTGGCCGCGCCC
797 GL3/Waxy氨基酸序列(SEQ ID NO:10)
MAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGISAIWIPPASKGMSGGYSM
GYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVLADIVINHRAGGDLEWNPF
VGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDICHDKSWDQYWLWASQES
YAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGEYWDTNVDALLNWAYSSG
AKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAVTFVANHDTDIIWNKYPAY
AFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVYYDSDEMIFVRNGYGSKPG
LITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYSSGWVYLEAPAYDPANGQ
YGYSVWSYCGVGTSIAGILEADRVLTVSPYYAEELISGIARGCELDNIMRLTGITGIVNGMDV
SEWDPSRDKYIAVKYDVSTAVEAKALNKEALQAEVGLPVDRNIPLVAFIGRLEEQKGPDVM
AAAIPQLMEMVEDVQIVLLGTGKKKFERMLMSAEEKFPGKVRAVVKFNAALAHHIMAGAD
VLAVTSRFEPCGLIQLQGMRYGTPCACASTGGLVDTIIEGKTGFHMGRLSVDCNVVEPADVK
KVATTLQRAIKVVGTPAYEEMVRNCMIQDLSWKGPAKNWENVLLSLGVAGGEPGVEGEEIA
PLAKENVAAP
玉蜀黍ADP-gpp启动子核酸序列(SEQ ID NO:11)
GGAGAGCTATGAGACGTATGTCCTCAAAGCCACTTTGCATTGTGTGAAACCAATATCGAT
CTTTGTTACTTCATCATGCATGAACATTTGTGGAAACTACTAGCTTACAAGCATTAGTGA
CAGCTCAGAAAAAAGTTATCTATGAAAGGTTTCATGTGTACCGTGGGAAATGAGAAATG
TTGCCAACTCAAACACCTTCAATATGTTGTTTGCAGGCAAACTCTTCTGGAAGAAAGGTG
TCTAAAACTATGAACGGGTTACAGAAAGGTATAAACCACGGCTGTGCATTTTGGAAGTA
TCATCTATAGATGTCTGTTGAGGGGAAAGCCGTACGCCAACGTTATTTACTCAGAAACAG
CTTCAACACACAGTTGTCTGCTTTATGATGGCATCTCCACCCAGGCACCCACCATCACCT
ATCTCTCGTGCCTGTTTATTTTCTTGCCCTTTCTGATCATAAAAAAACATTAAGAGTTTGC
AAACATGCATAGGCATATCAATATGCTCATTTATTAATTTGCTAGCAGATCATCTTCCTAC
TCTTTACTTTATTTATTGTTTGAAAAATATGTCCTGCACCTAGGGAGCTCGTATACAGTAC
CAATGCATCTTCATTAAATGTGAATTTCAGAAAGGAAGTAGGAACCTATGAGAGTATTTT
TCAAAATTAATTAGCGGCTTCTATTATGTTTATAGCAAAGGCCAAGGGCAAAATTGGAAC
ACTAATGATGGTTGGTTGCATGAGTCTGTCGATTACTTGCAAGAAATGTGAACCTTTGTT
TCTGTGCGTGGGCATAAAACAAACAGCTTCTAGCCTCTTTTACGGTACTTGCACTTGCAA
GAAATGTGAACTCCTTTTCATTTCTGTATGTGGACATAATGCCAAAGCATCCAGGCTTTTT
CATGGTTGTTGATGTCTTTACACAGTTCATCTCCACCAGTATGCCCTCCTCATACTCTATA
TAAACACATCAACAGCATCGCAATTAGCCACAAGATCACTTCGGGAGGCAAGTGCGATT
TCGATCTCGCAGCCACCTTTTTTTGTTCTGTTGTAAGTATACCTTCCCTTACCATCTTTATC
TGTTAGTTTAATTTGTAATTGGGAAGTATTAGTGGAAAGAGGATGAGATGCTATCATCTA
TGTACTCTGCAAATGCATCTGACGTTATATGGGCTGCTTCATATAATTTGAATTGCTCCAT
TCTTGCCGACAATATATTGCAAGGTATATGCCTAGTTCCATCAAAAGTTCTGTTTTTTCAT
TCTAAAAGCATTTTAGTGGCACACAATTTTTGTCCATGAGGGAAAGGAAATCTGTTTTGG
TTACTTTGCTTGAGGTGCATTCTTCATATGTCCAGTTTTATGGAAGTAATAAACTTCAGTT
TGGTCATAAGATGTCATATTAAAGGGCAAACATATATTCAATGTTCAATTCATCGTAAAT
GTTCCCTTTTTGTAAAAGATTGCATACTCATTTATTTGAGTTGCAGGTGTATCTAGTAGTT
GGAGGAG
玉蜀黍γ-玉米醇溶蛋白核酸序列(SEQ ID NO:12)
GATCATCCAGGTGCAACCGTATAAGTCCTAAAGTGGTGAGGAACACGAAACAACCATGC
ATTGGCATGTAAAGCTCCAAGAATTTGTTGTATCCTTAACAACTCACAGAACATCAACCA
AAATTGCACGTCAAGGGTATTGGGTAAGAAACAATCAAACAAATCCTCTCTGTGTGCAA
AGAAACACGGTGAGTCATGCCGAGATCATACTCATCTGATATACATGCTTACAGCTCACA
AGACATTACAAACAACTCATATTGCATTACAAAGATCGTTTCATGAAAAATAAAATAGG
CCGGACAGGACAAAAATCCTTGACGTGTAAAGTAAATTTACAACAAAAAAAAAGCCATA
TGTCAAGCTAAATCTAATTCGTTTTACGTAGATCAACAACCTGTAGAAGGCAACAAAACT
GAGCCACGCAGAAGTACAGAATGATTCCAGATGAACCATCGACGTGCTACGTAAAGAGA
GTGACGAGTCATATACATTTGGCAAGAAACCATGAAGCTGCCTACAGCCGTCTCGGTGG
CATAAGAACACAAGAAATTGTGTTAATTAATCAAAGCTATAAATAACGCTCGCATGCCT
GTGCACTTCTCCATCACCACCACTGGGTCTTCAGACCATTAGCTTTATCTACTCCAGAGCG
CAGAAGAACCCGATCGACA
pNOV6200淀粉酶融合氨基酸序列(SEQ ID NO:13)
MRVLLVALALLALAASATSAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGI
SAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVI
ADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDI
CHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGE
YWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAV
TFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVY
YDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYS
SGWVYLEAPAYDPANGQYGYSVWSYCGVG
pNOV6201淀粉酶融合氨基酸序列(SEQ IE NO:14)
MRVL氨VALALLALAASATSAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGI
SAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELIMINTAHAYGIKVI
ADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDI
CHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGE
YWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAV
TFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVY
YDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYS
SGWVYLEAPAYDPANGQYGYSVWSYCGVGSEKDEL
pNOV4029淀粉酶融合氨基酸序列(SEQ ID NO:15)
MLAALATSQLVATRAGLGVPDASTFRRGAAQGLRGARASAAADTLSMRTSARAAPRHQHQ
QARRGARFPSLVVCASAGAMAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDA
GISAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIK
VIADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYP
DICHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAV
GEYWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFK
AVTFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSI
VYYDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYV
YSSGWVYLEAPAYDPANGQYGYSVWSYCGVGTSI
pNOV4031淀粉酶融合氨基酸序列(SEQ ID NO:16)
MLAALATSQLVATRAGLGVPDASTFRRGAAQGLRGARASAAADTLSMRTSARAAPRHQHQ
QARRGARFPSLVVCASAGAMAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDA
GISAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIK
VIADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYP
DICHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAV
GEYWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFK
AVTFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSI
VYYDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYV
YSSGWVYLEAPAYDPANGQYGYSVWSYCGVGTSIAGILEADRVLTVSPYYAEELISGIARGC
ELDNIMRLTGITGIVNGMDVSEWDPSRDKYIAVKYDVSTAVEAKALNKEALQAEVGLPVDR
NIPLVAFIGRLEEQKGPDVMAAAIPQLMEMVEDVQIVLLGTGKKKFERMLMSAEEKFPGKVR
AVVKFNAALAHHIMAGADVLAVTSRFEPCGLIQLQGMRYGTPCACASTGGLVDTIIEGKTGF
HMGRLSVDCNVVEPADVKKVATTLQRAIKVVGTPAYEEMVRNCMIQDLSWKGPAKNWEN
VLLSLGVAGGEPGVEGEEI
APLAKENVAAP
玉米γ-玉米酶溶蛋白N-末端信号序列(SEQ ID NO:17)
(MRVLLVALALLALAASATS)
海栖热袍菌(Thermotoga maritima)葡萄糖异构酶氨基酸序列(SEQ ID NO:18)
MAEFFPEIPKIQFEGKESTNPLAFRFYDPNEVIDGKPLKDHLKFSVAFWHTFVNEGRDPFGDPT
AERPWNRFSDPMDKAFARVDALFEFCEKLNIEYFCFHDRDIAPEGKTLRETNKILDKVVERIK
ERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAAAQVKKALEITKELGGEGYVF
WGGREGYETLLNTDLGLELENLARFLRMAVEYAKKIGFTGQFLIEPKPKEPTKHQYDFDVAT
AYAFLKNHGLDEYFKFNIEANHATLAGHTFQHELRMARILGKLGSIDANQGDLLLGWDTDQ
FPTNIYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVEDLFIGHIAGMDTFALGFKIAYK
LAKDGVFDKFIEEKYRSFKEGIGKEIVEGKTDFEKLEEYIIDKEDIELPSGKQEYLESLLNSYIV
KTIAELR
海栖热袍菌葡萄糖异构酶玉米优化核酸序列(SEQ ID NO:19)
ATGGCCGAGTTCTTCCCGGAGATCCCGAAGATCCAGTTCGAGGGCAAGGAGTCCACCAA
CCCGCTCGCCTTCCGCTTCTACGACCCGAACGAGGTGATCGACGGCAAGCCGCTCAAGG
ACCACCTCAAGTTCTCCGTGGCCTTCTGGCACACCTTCGTGAACGAGGGCCGCGACCCGT
TCGGCGACCCGACCGCCGAGCGCCCGTGGAACCGCTTCTCCGACCCGATGGACAAGGCC
TTCGCCCGCGTGGACGCCCTCTTCGAGTTCTGCGAGAAGCTCAACATCGAGTACTTCTGC
TTCCACGACCGCGACATCGCCCCGGAGGGCAAGACCCTCCGCGAGACCAACAAGATCCT
CGACAAGGTGGTGGAGCGCATCAAGGAGCGCATGAAGGACTCCAACGTGAAGCTCCTCT
GGGGCACCGCCAACCTCTTCTCCCACCCGCGCTACATGCACGGCGCCGCCACCACCTGCT
CCGCCGACGTGTTCGCCTACGCCGCCGCCCAGGTGAAGAAGGCCCTGGAGATCACCAAG
GAGCTGGGCGGCGAGGGCTACGTGTTCTGGGGCGGCCGCGAGGGCTACGAGACCCTCCT
CAACACCGACCTCGGCCTGGAGCTGGAGAACCTCGCCCGCTTCCTCCGCATGGCCGTGGA
GTACGCCAAGAAGATCGGCTTCACCGGCCAGTTCCTCATCGAGCCGAAGCCGAAGGAGC
CGACCAAGCACCAGTACGACT TCGACGTGGCCACCGCCTACGCCTTCCTCAAGAACCAC
GGCCTCGAC
GAGTACTTCAAGTTCAACATCGAGGCCAACCACGCCACCCTCGCCGGCCACACCTTCCAG
CACGAGCTGCGCATGGCCCGCATCCTCGGCAAGCTCGGCTCCATCGACGCCAACCAGGG
CGACCTCCTCCTCGGCTGGGACACCGACCAGTTCCCGACCAACATCTACGACACCACCCT
CGCCATGTACGAGGTGATCAAGGCCGGCGGCTTCACCAAGGGCGGCCTCAACTTCGACG
CCAAGGTGCGCCGCGCCTCCTACAAGGTGGAGGACCTCTTCATCGGCCACATCGCCGGC
ATGGACACCTTCGCCCTCGGCTTCAAGATCGCCTACAAGCTCGCCAAGGACGGCGTGTTC
GACAAGTTCATCGAGGAGAAGTACCGCTCCTTCAAGGAGGGCATCGGCAAGGAGATCGT
GGAGGGCAAGACCGACTTCGAGAAGCTGGAGGAGTACATCATCGACAAGGAGGACATC
GAGCTGCCGTCCGGCAAGCAGGAGTACCTGGAGTCCCTCCTCAACTCCTACATCGTGAAG
ACCATCGCCGAGCTGCGCTGA
那不勒斯栖热袍菌(Thermotoga neapolitaana)葡萄糖异构酶氨基酸序列(SEQ ID NO:20)
MAEFFPEIPKVQFEGKESTNPLAFKFYDPEEIIDGKPLKDHLKFSVAFWHTFVNEGRDPFGDPT
ADRPWNRYTDPMDKAFARVDALFEFCEKLNIEYFCFHDRDIAPEGKTLRETNKILDKVVERI
KERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAAAQVKKALEITKELGGEGYV
FWGGREGYETLLNTDLGFELENLARFLRMAVDYAKRIGFTGQFLIEPKPKEPTKHQYDFDVA
TAYAFLKSHGLDEYFKFNIEANHATLAGHTFQHELRMARILGKLGSIDANQGDLLLGWDTD
QFPTNVYDTTLAMYEIKGGFTKGGLNFDAKVRRASYKVEDLFIGHIAGMDTFALGFKVA
YKLVKDGVLDKFIEEKYRSFREGIGRDIVEGKVDFEKLEEYIIDKETIELPSGKQEYLESLINSY
IVKTILELR
那不勒斯栖热袍菌葡萄糖异构酶玉米优化核酸序列(SEQ ID NO:21)
ATGGCCGAGTTCTTCCCGGAGATCCCGAAGGTGCAGTTCGAGGGCAAGGAGTCCACCAA
CCCGCTCGCCTTCAAGTTCTACGACCCGGAGGAGATCATCGACGGCAAGCCGCTCAAGG
ACCACCTCAAGTTCTCCGTGGCCTTCTGGCACACCTTCGTGAACGAGGGCCGCGACCCGT
TCGGCGACCCGACCGCCGACCGCCCGTGGAACCGCTACACCGACCCGATGGACAAGGCC
TTCGCCCGCGTGGACGCCCTCTTCGAGTTCTGCGAGAAGCTCAACATCGAGTACTTCTGC
TTCCACGACCGCGACATCGCCCCGGAGGGCAAGACCCTCCGCGAGACCAACAAGATCCT
CGACAAGGTGGTGGAGCGCATCAAGGAGCGCATGAAGGACTCCAACGTGAAGCTCCTCT
GGGGCACCGCCAACCTCTTCTCCCACCCGCGCTACATGCACGGCGCCGCCACCACCTGCT
CCGCCGACGTGTTCGCCTACGCCGCCGCCCAGGTGAAGAAGGCCCTGGAGATCACCAAG
GAGCTGGGCGGCGAGGGCTACGTGTTCTGGGGCGGCCGCGAGGGCTACGAGACCCTCCT
CAACACCGACCTCGGCTTCGAGCTGGAGAACCTCGCCCGCTTCCTCCGCATGGCCGTGGA
CTACGCCAAGCGCATCGGCTTCACCGGCCAGTTCCTCATCGAGCCGAAGCCGAAGGAGC
CGACCAAGCACCAGTACGACTTCGACGTGGCCACCGCCTACGCCTTCCTCAAGTCCCACG
GCCTCGACGAGTACTTCAAGTTCAACATCGAGGCCAACCACGCCACCCTCGCCGGCCAC
ACCTTCCAGCACGAGCTGCGCATGGCCCGCATCCTCGGCAAGCTCGGCTCCATCGACGCC
AACCAGGGCGACCTCCTCCTCGGCTGGGACACCGACCAGTTCCCGACCAACGTGTACGA
CACCACCCTCGCCATGTACGAGGTGATCAAGGCCGGCGGCTTCACCAAGGGCGGCCTCA
ACTTCGACGCCAAGGTGCGCCGCGCCTCCTACAAGGTGGAGGACCTCTTCATCGGCCACA
TCGCCGGCATGGACACCTTCGCCCTCGGCTTCAAGGTGGCCTACAAGCTCGTGAAGGACG
GCGTGCTCGACAAGTTCATCGAGGAGAAGTACCGCTCCTTCCGCGAGGGCATCGGCCGC
GACATCGTGGAGGGCAAGGTGGACTTCGAGAAGCTGGAGGAGTACATCATCGACAAGG
AGACCATCGAGCTGCCGTCCGGCAAGCAGGAGTACCTGGAGTCCCTCATCAACTCCTAC
ATCGTGAAGACCATCCTGGAGCTGCGCTGA
SV57(SEQ ID NO:22)(5’AGCGAATTCATGGCGGCTCTGGCCACGT 3’)
SV58(SEQ ID NO:23)(5’AGCTAAGCTTCAGGGCGCGGCCACGTTCT 3’)
pNOV70056GP3融合氨基酸序列(SEQ ID NO:24)
MRVLLVALALLALAASATSAGHWYKHQRAYQFTGEDDFGKVAVVKLPMDLTKVGIIVRLN
EWQAKDVAKDRFIEIKDGKAEVWILQGVEEIFYEKPDTSPRIFFAQARSNKVIEAFLTNPVDT
KKKELFKVTVDGKEIPVSRVEKADPTDIDVTNYVRIVLSESLKEEDLRKDVELIIEGYKPARVI
MMEILDDYYYDGELGAVYSPEKTIFRVWSPVSKWVKVLLFKNGEDTEPYQVVNMEYKGNG
VWEAVVEGDLDGVFYLYQLENYGKIRTTVDPYSKAVYANNQESAVVNLARTNPEGWENDR
GPKIEGYEDAIIYEIHIADITGLENSGVKNKGLYLGLTEENTKAPGGVTTGLSHLVELGVTHVH
ILPFFDFYTGDELDKDFEKYYNWGYDPYLFMVPEGRYSTDPKNPHTRIREVKEMVKALHKH
GIGVIMDMVFPHTYGIGELSAFDQTVPYYFYRIDKTGAYLNESGCGNVIASERPMMRKFIVDT
VTYWVKEYHIDGFRFDQMGLIDKKTMLEVERALHKIDPTIILYGEPWGGWGAPIRFGKSDVA
GTHVAAFNDEFRDAIRGSVFNPSVKGFVMGGYGKETKIKRGVVGSINYDGKLIKSFALDPEE
TINYAACHDNHTLWDKNYLAAKADKKKEWTEEELKNAQKLAGAILLTSQGVPFLHGGQDF
CRTTNFNDNSYNAPISINGFDYERKLQFIDVFNYHKGLIKLRKEHPAFRLKNAEEIKKHLEFLP
GGRRIVAFMLKDHAGGDPWKDIVVIYNGNLEKTTYKLPEGKWNVVVNSQKAGTEVIETVEG
TTELDPLSAYVLYRESEKDEL
pNOV7005 6GP3融合玉米优化核酸序列(SEQ ID NO:25)
ATGAGGGTGTTGCTCGTTGCCCTCGCTCTCCTGGCTCTCGCTGCGAGCGCCACCAGCGCT
GGCCACTGGTACAAGCACCAGCGCGCCTACCAGTTCACCGGCGAGGACGACTTCGGGAA
GGTGGCCGTGGTGAAGCTCCCGATGGACCTCACCAAGGTGGGCATCATCGTGCGCCTCA
ACGAGTGGCAGGCGAAGGACGTGGCCAAGGACCGCTTCATCGAGATCAAGGACGGCAA
GGCCGAGGTGTGGATACTCCAGGGCGTGGAGGAGATCTTCTACGAGAAGCCGGACACCT
CCCCGCGCATCTTCTTCGCCCAGGCCCGCTCCAACAAGGTGATCGAGGCCTTCCTCACCA
ACCCGGTGGACACCAAGAAGAAGGAGCTGTTCAAGGTGACCGTCGACGGCAAGGAGAT
CCCGGTGTCCCGCGTGGAGAAGGCCGACCCGACCGACATCGACGTGACCAACTACGTGC
GCATCGTGCTCTCCGAGTCCCTCAAGGAGGAGGACCTCCGCAAGGACGTGGAGCTGATC
ATCGAGGGCTACAAGCCGGCCCGCGTGATCATGATGGAGATCCTCGACGACTACTACTA
CGACGGCGAGCTGGGGGCGGTGTACTCCCCGGAGAAGACCATCTTCCGCGTGTGGTCCC
CGGTGTCCAAGTGGGTGAAGGTGCTCCTCTTCAAGAACGGCGAGGACACCGAGCCGTAC
CAGGTGGTGAACATGGAGTACAAGGGCAACGGCGTGTGGGAGGCCGTGGTGGAGGGCG
ACCTCGACGGCGTGTTCTACCTCTACCAGCTGGAGAACTACGGCAAGATCCGCACCACCG
TGGACCCGTACTCCAAGGCCGTGTACGCCAACAACCAGGAGTCTGCAGTGGTGAACCTC
GCCCGCACCAACCCGGAGGGCTGGGAGAACGACCGCGGCCCGAAGATCGAGGGCTACG
AGGACGCCATCATCTACGAGATCCACATCGCCGACATCACCGGCCTGGAGAACTCCGGC
GTGAAGAACAAGGGCCTCTACCTCGGCCTCACCGAGGAGAACACCAAGGCCCCGGGCGG
CGTGACCACCGGCCTCTCCCACCTCGTGGAGCTGGGCGTGACCCACGTGCACATCCTCCC
GTTCTTCGACTTCTACACCGGCGACGAGCTGGACAAGGACTTCGAGAAGTACTACAACTG
GGGCTACGACCCGTACCTCTTCATGGTGCCGGAGGGCCGCTACTCCACCGACCCGAAGA
ACCCGCACACCCGAATTCGCGAGGTGAAGGAGATGGTGAAGGCCCTCCACAAGCACGGC
ATCGGCGTGATCATGGACATGGTGTTCCCGCACACCTACGGCATCGGCGAGCTGTCCGCC
TTCGACCAGACCGTGCCGTACTACTTCTACCGCATCGACAAGACCGGCGCCTACCTCAAC
GAGTCCGGCTGCGGCAACGTGATCGCCTCCGAGCGCCCGATGATGCGCAAGTTCATCGT
GGACACCGTGACCTACTGGGTGAAGGAGTACCACATCGACGGCTTCCGCTTCGACCAGA
TGGGCCTCATCGACAAGAAGACCATGCTGGAGGTGGAGCGCGCCCTCCACAAGATCGAC
CCGACCATCATCCTCTACGGCGAGCCGTGGGGCGGCTGGGGGGCCCCGATCCGCTTCGG
CAAGTCCGACGTGGCCGGCACCCACGTGGCCGCCTTCAACGACGAGTTCCGCGACGCCA
TCCGCGGCTCCGTGTTCAACCCGTCCGTGAAGGGCTTCGTGATGGGCGGCTACGGCAAGG
AGACCAAGATCAAGCGCGGCGTGGTGGGCTCCATCAACTACGACGGCAAGCTCATCAAG
TCCTTCGCCCTCGACCCGGAGGAGACCATCAACTACGCCGCCTGCCACGACAACCACACC
CTCTGGGACAAGAACTACCTCGCCGCC
AAGGCCGACAAGAAGAAGGAGTGGACCGAGGAGGAGCTGAAGAACGCCCAGAAGCTCG
CCGGCGCCATCCTCCTCACTAGTCAGGGCGTGCCGTTCCTCCACGGCGGCCAGGACTTCT
GCCGCACCACCAACTTCAACGACAACTCCTACAACGCCCCGATCTCCATCAACGGCTTCG
ACTACGAGCGCAAGCTCCAGTTCATCGACGTGTTCAACTACCACAAGGGCCTCATCAAGC
TCCGCAAGGAGCACCCGGCCTTCCGCCTCAAGAACGCCGAGGAGATCAAGAAGCACCTG
GAGTTCCTCCCGGGCGGGCGCCGCATCGTGGCCTTCATGCTCAAGGACCACGCCGGCGG
CGACCCGTGGAAGGACATCGTGGTGATCTACAACGGCAACCTGGAGAAGACCACCTACA
AGCTCCCGGAGGGCAAGTGGAACGTGGTGGTGAACTCCCAGAAGGCCGGCACCGAGGTG
ATCGAGACCGTGGAGGGCACCATCGAGCTGGACCCGCTCTCCGCCTACGTGCTCTACCGC
GAGTCCGAGAAGGACGAGCTGTGA
pNOV4831malA融合氨基酸序列(SEQ ID NO:26)
MRVLLVALALLALAASATSMETIKIYENKGVYKVVIGEPFPPIEFPLEQKISSNKSLSELGLTIV
QQGNKVIVEKSLDLKEHIIGLGEKAFELDRKRKRYVMYNVDAGAYKKYQDPLYVSIPLFISV
KDGVATGYFFNSASKVIFDVGLEEYDKVIVTIPEDSVEFYVIEGPRIEDVLEKYTELTGKPFLPP
MWAFGYMISRYSYYPQDKVVELVDIMQKEGFRVAGVFLDIHYMDSYKLFTWHPYRFPEPK
KLIDELHKRNVKLITIVDHGIRVDQNYSPFLSGMGKFCEIESGELFVGKMWPGTTVYPDFFRE
DTREWWAGLISEWLSQGVDGIWLDMNEPTDFSRAIEIRDVLSSLPVQFRDDRLVTTFPDNVV
HYLRGKRVKHEKVRNAYPLYEAMATFKGFRTSHRNEIFILSRAGYAGIQRYAFIWTGDNTPS
WDDLKLQLQLVLGLSISGVPFVGCDIGGFQGRNFAEIDNSMDLLVKYYALALFFPFYRSHKA
TDGIDTEPVFLPDYYKEKVKEIVELRYKFLPYIYSLALEASEKGHPVIRPLFYEFQDDDDMYRI
EDEYMVGKYLLYAPIVSKEESRLVTLPRGKWYNYWNGEIINGKSVVKSTHELPIYLREGSIIP
LEGDELIVYGETSFKRYDNAEITSSSNEIKFSREIYVSKLTTTSEKPVSKIIVDDSKEIQVEKTMQ
NTYVAKINQKIRGKINLESEKDEL
pNOV4839malA融合氨基酸序列(SEQ ID NO:27)
MRVLLVALALLALAASATSMETIKIYENKGVYKVVIGEPFPPIEFPLEQKISSNKSLSELGLTTV
QQGNKVIVEKSLDLKEHIIGLGEKAFELDRKRKRYVMYNVDAGAYKKYQDPLYVSIPLFISV
KDGVATGYFFNSASKVIFDVGLEEYDKVIVTIPEDSVEFYVIEGPRIEDVLEKYTELTGKPFLPP
MWAFGYMISRYSYYPQDKVVELVDIMQKEGFRVAGVFLDIHYMDSYKLFTWHPYRFPEPK
KLIDELHKRNVKLITIVDHGIRVDQNYSPFLSGMGKFCEIESGELFVGKMWPGTTVYPDFFRE
DTREWWAGLISEWLSQGVDGIWLDMNEPTDFSRAIEIRDVLSSLPVQFRDDRLVTTFPDNVV
HYLRGKRVKHEKVRNAYPLYEAMATFKGFRTSHRNEIFILSRAGYAGIQRYAFIWTGDNTPS
WDDLKLQLQLVLGLSISGVPFVGCDIGGFQGRNFAEIDNSMDLLVKYYALALFFPFYRSHKA
TDGIDTEPVFLPDYYKEKVKEIVELRYKFLPYIYSLALEASEKGHPVIRPLFYEFQDDDDMYRI
EDEYMVGKYLLYAPIVSKEESRLVTLPRGKWYNYWNGEIINGKSVVKSTHELPIYLREGSIIP
LEGDELIVYGETSFKRYDNAEITSSSNEIKFSREIYVSKLTITSEKPVSKIIVDDSKEIQVEKTMQ
NTYVAKINQKIRGKINLE
pNOV4832葡萄糖异构酶融合氨基酸序列(SEQ ID NO:28)
MRVLLVALALLALAASATSMAEFFPEIPKIQFEGKESTNPLAFRFYDPNEVIDGKPLKDHLKFS
VAFWHTFVNEGRDPFGDPTAERPWNRFSDPMDKAFARVDALFEFCEKLNIEYFCFHDRDLAP
EGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAAA
QVKKALEITKELGGEGYVFWGGREGYETLLNTDLGLELENLARFLRMAVEYAKKIGFTGQF
LIEPKPKEPTKHQYDFDVATAYAFLKNHGLDEYFKFNIEANHATLAGHTFQHELRMARILGK
LGSIDANQGDLLLGWDTDQFPTNTYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVEDL
FIGHLAGMDTFALGFKIAYKLAKDGVFDKFIEEKYRSFKEGIGKEIVEGKTDFEKLEEYIIDKE
DIELPSGKQEYLESLLNSYIVKTIAELRSEKDEL
pNOV4833葡萄糖异构酶融合氨基酸序列(SEQ ID NO:29)
MRVLLVALALLALAASATSMAEFFPEIPKVQFEGKESTNPLAFKFYDPEEIIDGKPLKDHLKFS
VAFWHTFVNEGRDPFGDPTADRPWNRYTDPMDKAFARVDALFEFCEKLNIEYFCFHDRDIA
PEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAA
AQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGFELENLARFLRMAVDYAKRIGFTGQ
FLIEPKPKEPTKHQYDFDVATAYAFLKSHGLDEYFKFNIEANHATLAGHTFQHELRMARILG
KLGSIDANQGDLLLGWDTDQFPTNVYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVE
DLFIGHIAGMDTFALGFKVAYKLVKDGVLDKFIEEKYRSFREGIGRDIVEGKVDFEKLEEYIIID
KETIELPSGKQEYLESLINSYIVKTILELRSEKDEL
pNOV4840葡萄糖异构酶融合氨基酸序列(SEQ ID NO:30)
MRVLLVALALLALAASATSMAEFFPEIPKVQFEGKESTNPLAFKFYDPEEIIDGKPLKDHLKFS
VAFWHTFVNEGRDPFGDPTADRPWNRYTDPMDKAFARVDALFEFCEKLNIEYFCFHDRDLA
PEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAA
AQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGFELENLARFLRMAVDYAKRIGFTGQ
FLIEPKPKEPTKHQYDFDVATAYAFLKSHGLDEYFKFNIEANHATTAGHTFQHELRMARILG
KLGSIDANQGDLLLGWDTDQFPTNVYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVE
DLFIGHIAGMDTFALGFKVAYKLVKDGVLDKFIEEKYRSFREGIGRDIVEGKVDFEKLEEYIID
KETIELPSGKQEYLESLINSYIVKTILELR
大麦α淀粉酶AMY32b信号序列(SEQID NO:31)
(MGKNGNLCCFSLLLLLLAGLASGHQ)
PR1a信号序列(SEQ ID NO:32)
(MGFVLFSQLPSFLLVSTLLLFLVISHSCRA)
797GL3融合物(SEQ ID NO:33)
MRVLLVALALLALAASATSAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGI
SAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVI
ADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDI
CHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGE
YWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAV
TFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVY
YDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYS
SGWVYLEAPAYDPANGQYGYSVWSYCGVGSEKDEL
6GP3融合物(SEQ ID NO:34)
MRVLLVALALLALAASATSAGHWYKHQRAYQFTGEDDFGKVAVVKLPMDLTKVGIIVRLN
EWQAKDVAKDRFIEIKDGKAEVWILQGVEEIFYEKPDTSPRIFFAQARSNKVIEAFLTNPVDT
KKKELFKVTVDGKEIPVSRVEKADPTDIDVTNYVRIVLSESLKEEDLRKDVELIIEGYKPARVI
MMEILDDYYYDGELGAVYSPEKTIFRVWSPVSKWVKVLLFKNGEDTEPYQVVNMEYKGNG
VWEAVVEGDLDGVFYLYQLENYGKIRTTVDPYSKAVYANNQESAVVNLARTNPEGWENDR
GPKIEGYEDAIIYEIHIADITGLENSGVKNKGLYLGLTEENTKAPGGVTTGLSHLVELGVTHVH
ILPFFDFYTGDELDKDFEKYYNWGYDPYLFMVPEGRYSTDPKNPHTRIREVKEMVKALHKH
GIGVIMDMVFPHTYGIGELSAFDQTVPYYFYRIDKTGAYLNESGCGNVIASERPMMRKFIVDT
VTYWVKEYHIDGFRFDQMGLIDKKTMLEVERALHKIDPTIILYGEPWGGWGAPIRFGKSDVA
GTHVAAFNDEFRDAIRGSVFNPSVKGFVMGGYGKETKIKRGVVGSINYDGKLIKSFALDPEE
TINYAACHDNHTLWDKNYLAAKADKKKEWTEEELKNAQKLAGAILLTSQGVPFLHGGQDF
CRTTNFNDNSYNAPISINGFDYERKLQFIDVFNYHKGLIKLRKEHPAFRLKNAEEIKKHLEFLP
GGRRIVAFMLKDHAGGDPWKDIVVIYNGNLEKTTYKLPEGKWNVVVNSQKAGTEVIETVEG
TIELDPLSAYVLYRESEKDEL
797GL3融合物(SEQ ID NO:35)
MRVLLVALALLALAASATSAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGI
SAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVI
ADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDI
CHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGE
YWDTNVCDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAV
TFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVY
YDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYS
SGWVYLEAPAYDPANGQYGYSVWSYCGVGSEKDEL
malA融合物(SEQ ID NO:36)
MRVLLVALALLALAASATSMETIKIYENKG VYKVVIGEPFPPIEFPLEQKISSNKSLSELGLTIV
QQGNKVIVEKSLDLKEHIIGLGEKAFELDRKRKRYVMYNVDAGAYKKYQDPLYVSIPLFISV
KDGVATGYFFNSASKVIFDVGLEEYDKVIVTPEDSVEFYVIEGPRIEDVLEKYTELTGKPFLPP
MWAFGYMISRYSYYPQDKVVELVDIMQKEGFRVAGVFLDIHYMDSYKLFTWHPYRFPEPK
KLIDELHKRNVKLITIVDHGIRVDQNYSPFLSGMGKFCEIESGELFVGKMWPGTTVYPDFFRE
DTREWWAGLISEWLSQGVDGIWLDMNEPTDFSRAIEIRDVLSSLPVQFRDDRLVTTFPDNVV
HYLRGKRVKHEKVRNAYPLYEAMATFKGFRTSHRNEIFILSRAGYAGIQRYAFIWTGDNTPS
WDDLKLQLQLVLGLSISGVPFVGCDIGGFQGRNFAEIDNSMDLLVKYYALALFFPFYRSHKA
TDGIDTEPVFLPDYYKEKVKEIVELRYKFLPYIYSLALEASEKGHPVIRPLFYEFQDDDDMYRI
EDEYMVGKYLLYAPIVSKEESRLVTLPRGKWYNYWNGEIINGKSVVKSTHELPIYLREGSIIP
LEGDELIVYGETSFKRYDNAEITSSSNEIKFSREIYVSKLTTTSEKPVSKIIVDDSKEIQVEKTMQ
NTYVAKINQKIRGKINLESEKDEL
pNOV4829葡萄糖异构酶融合核苷酸序列(SEQ ID NO:37)
ATGAAAGAAACCGCTGCTGCTAAATTCGAACGCCAGCACATGGACAGCCCAGATCTGGG
TACCCTGGTGCCACGCGGTTCCATGGCCGAGTTCTTCCCGGAGATCCCGAAGATCCAGTT
CGAGGGCAAGGAGTCCACCAACCCGCTCGCCTTCCGCTTCTACGACCCGAACGAGGTGA
TCGACGGCAAGCCGCTCAAGGACCACCTCAAGTTCTCCGTGGCCTTCTGGCACACCTTCG
TGAACGAGGGCCGCGACCCGTTCGGCGACCCGACCGCCGAGCGCCCGTGGAACCGCTTC
TCCGACCCGATGGACAAGGCCTTCGCCCGCGTGGACGCCCTCTTCGAGTTCTGCGAGAAG
CTCAACATCGAGTACTTCTGCTTCCACGACCGCGACATCGCCCCGGAGGGCAAGACCCTC
CGCGAGACCAACAAGATCCTCGACAAGGTGGTGGAGCGCATCAAGGAGCGCATGAAGG
ACTCCAACGTGAAGCTCCTCTGGGGCACCGCCAACCTCTTCTCCCACCCGCGCTACATGC
ACGGCGCCGCCACCACCTGCTCCGCCGACGTGTTCGCCTACGCCGCCGCCCAGGTGAAG
AAGGCCCTGGAGATCACCAAGGAGCTGGGCGGCGAGGGCTACGTGTTCTGGGGCGGCCG
CGAGGGCTACGAGACCCTCCTCAACACCGACCTCGGCCTGGAGCTGGAGAACCTCGCCC
GCTTCCTCCGCATGGCCGTGGAGTACGCCAAGAAGATCGGCTTCACCGGCCAGTTCCTCA
TCGAGCCGAAGCCGAAGGAGCCGACCAAGCACCAGTACGACTTCGACGTGGCCACCGCC
TACGCCTTCCTCAAGAACCACGGCCTCGACGAGTACTTCAAGTTCAACATCGAGGCCAAC
CACGCCACCCTCGCCGGCCACACCTTCCAGCACGAGCTGCGCATGGCCCGCATCCTCGGC
AAGCTCGGCTCCATCGACGCCAACCAGGGCGACCTCCTCCTCGGCTGGGACACCGACCA
GTTCCCGACCAACATCTACGACACCACCCTCGCCATGTACGAGGTGATCAAGGCCGGCG
GCTTCACCAAGGGCGGCCTCAACTTCGACGCCAAGGTGCGCCGCGCCTCCTACAAGGTG
GAGGACCTCTTCATCGGCCACATCGCCGGCATGGACACCTTCGCCCTCGGCTTCAAGATC
GCCTACAAGCTCGCCAAGGACGGCGTGTTCGACAAGTTCATCGAGGAGAAGTACCGCTC
CTTCAAGGAGGGCATCGGCAAGGAGATCGTGGAGGGCAAGACCGACTTCGAGAAGCTG
GAGGAGTACATCATCGACAAGGAGGACATCGAGCTGCCGTCCGGCAAGCAGGAGTACCT
GGAGTCCCTCCTCAACTCCTACATCGTGAAGACCATCGCCGAGCTGCGCTCCGAGAAGG
ACGAGCTGTGA
pNOV4829葡萄糖异构酶融合氨基酸序列(SEQ ID NO:38)
MKETAAAKFERQHMDSPDLGTLVPRGSMAEFFPEIPKIQFEGKESTNPLAFRFYDPNEVIDGK
PLKDHLKFSVAFWHTFVNEGRDPFGDPTAERPWNRFSDPMDKAFARVDALFEFCEKLNIEYF
CFHDRDIAPEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCS
ADVFAYAAAQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGLELENLARFLRMAVEY
AKKIGFTGQFLIEPKPKEPTKHQYDFDVATAYAFLKNHGLDEYFKFNIEANHATLAGHTFQH
ELRMARILGKLGSIDANQGDLLLGWDTDQFPTNTYDTTLAMYEVIKAGGFTKGGLNFDAKV
RRASYKVEDLFIGHLAGMDTFALGFKLAYKLAKDGVFDKFIEEKYRSFKEGIGKEIVEGKTDF
EKLEEYIIDKEDIELPSGKQEYLESLLNSYIVKTLAELRSEKDEL
pNOV4830葡萄糖异构酶融合核苷酸序列(SEQ ID NO:39)
ATGAAAGAAACCGCTGCTGCTAAATTCGAACGCCAGCACATGGACAGCCCAGATCTGGG
TACCCTGGTGCCACGCGGTTCCATGGCCGAGTTCTTCCCGGAGATCCCGAAGGTGCAGTT
CGAGGGCAAGGAGTCCACCAACCCGCTCGCCTTCAAGTTCTACGACCCGGAGGAGATCA
TCGACGGCAAGCCGCTCAAGGACCACCTCAAGTTCTCCGTGGCCTTCTGGCACACCTTCG
TGAACGAGGGCCGCGACCCGTTCGGCGACCCGACCGCCGACCGCCCGTGGAACCGCTAC
ACCGACCCGATGGACAAGGCCTTCGCCCGCGTGGACGCCCTCTTCGAGTTCTGCGAGAA
GCTCAACATCGAGTACTTCTGCTTCCACGACCGCGACATCGCCCCGGAGGGCAAGACCCT
CCGCGAGACCAACAAGATCCTCGACAAGGTGGTGGAGCGCATCAAGGAGCGCATGAAG
GACTCCAACGTGAAGCTCCTCTGGGGCACCGCCAACCTCTTCTCCCACCCGCGCTACATG
CACGGCGCCGCCACCACCTGCTCCGCCGACGTGTTCGCCTACGCCGCCGCCCAGGTGAAG
AAGGCCCTGGAGATCACCAAGGAGCTGGGCGGCGAGGGCTACGTGTTCTGGGGCGGCCG
CGAGGGCTACGAGACCCTCCTCAACACCGACCTCGGCTTCGAGCTGGAGAACCTCGCCC
GCTTCCTCCGCATGGCCGTGGACTACGCCAAGCGCATCGGCTTCACCGGCCAGTTCCTCA
TCGAGCCGAAGCCGAAGGAGCCGACCAAGCACCAGTACGACTTCGACGTGGCCACCGCC
TACGCCTTCCTCAAGTCCCACGGCCTCGACGAGTACTTCAAGTTCAACATCGAGGCCAAC
CACGCCACCCTCGCCGGCCACACCTTCCAGCACGAGCTGCGCATGGCCCGCATCCTCGGC
AAGCTCGGCTCCATCGACGCCAACCAGGGCGACCTCCTCCTCGGCTGGGACACCGACCA
GTTCCCGACCAACGTGTACGACACCACCCTCGCCATGTACGAGGTGATCAAGGCCGGCG
GCTTCACCAAGGGCGGCCTCAACTTCGACGCCAAGGTGCGCCGCGCCTCCTACAAGGTG
GAGGACCTCTTCATCGGCCACATCGCCGGCATGGACACCTTCGCCCTCGGCTTCAAGGTG
GCCTACAAGCTCGTGAAGGACGGCGTGCTCGACAAGTTCATCGAGGAGAAGTACCGCTC
CTTCCGCGAGGGCATCGGCCGCGACATCGTGGAGGGCAAGGTGGACTTCGAGAAGCTGG
AGGAGTACATCATCGACAAGGAGACCATCGAGCTGCCGTCCGGCAAGCAGGAGTACCTG
GAGTCCCTCATCAACTCCTACATCGTGAAGACCATCCTGGAGCTGCGCTCCGAGAAGGAC
GAGCTGTGA
pNOV4830葡萄糖异构酶融合氨基酸序列(SEQ ID NO:40)
MKETAAAKFERQHMDSPDLGTLVPRGSMAEFFPEIPKVQFEGKESTNPLAFKFYDPEEIIDGK
PLKDHLKFSVAFWHTFVNEGRDPFGDPTADRPWNRYTDPMDKAFARVDALFEFCEKLNIEY
FCFHDRDIAPEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCS
ADVFAYAAAQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGFELENLARFLRMAVDY
AKRIGFTGQFLIEPKPKEPTKHQYDFDVATAYAFLKSHGLDEYFKFNIEANHATLAGHTFQHE
LRMARILGKLGSIDANQGDLLLGWDTDQFPTNVYDTTLAMYEVIKAGGFTKGGLNFDAKVR
RASYKVEDLFIGHLAGMDTFALGFKVAYKLVKDGVLDKFIEEKYRSFREGIGRDIVEGKVDFE
KLEEYIIDKETIELPSGKQEYLESLINSYIVKTILELRSEKDEL
pNOV4835海栖热袍菌葡萄糖异构酶融合核苷酸序列(SEQ ID NO:41)
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCA
TATGGCTAGCATGACTGGTGGACAGCAAATGGGTCGGATCCCCATGGCCGAGTTCTTCCC
GGAGATCCCGAAGATCCAGTTCGAGGGCAAGGAGTCCACCAACCCGCTCGCCTTCCGCT
TCTACGACCCGAACGAGGTGATCGACGGCAAGCCGCTCAAGGACCACCTCAAGTTCTCC
GTGGCCTTCTGGCACACCTTCGTGAACGAGGGCCGCGACCCGTTCGGCGACCCGACCGCC
GAGCGCCCGTGGAACCGCTTCTCCGACCCGATGGACAAGGCCTTCGCCCGCGTGGACGC
CCTCTTCGAGTTCTGCGAGAAGCTCAACATCGAGTACTTCTGCTTCCACGACCGCGACAT
CCCCCGGAGGGCAAGACCCTCCGCGAGACCAACAAGATCCTCGACAAGGTGGTGGAGCG
CATCAAGGAGCGCATGAAGGACTCCAACGTGAAGCTCCTCTGGGGCACCGCCAACCTCT
TCTCCCACCCGCGCTACATGCACGGCGCCGCCACCACCTGCTCCGCCGACGTGTTCGCCT
ACGCCGCCGCCCAGGTGAAGAAGGCCCTGGAGATCACCAAGGAGCTGGGCGGCGAGGG
CTACGTGTTCTGGGGCGGCCGCGAGGGCTACGAGACCCTCCTCAACACCGACCTCGGCCT
GGAGCTGGAGAACCTCGCCCGCTTCCTCCGCATGGCCGTGGAGTACGCCAAGAAGATCG
GCTTCACCGGCCAGTTCCTCATCGAGCCGAAGCCGAAGGAGCCGACCAAGCACCAGTAC
GCTTCGACGTGGCCACCGCCTACGCCTTCCTCAAGAACCACGGCCTCGACGAGTACTTCA
AGTTCAACATCGAGGCCAACCACGCCACCCTCGCCGGCCACACCTTCCAGCACGAGCTG
CGCATGGCCCGCATCCTCGGCAAGCTCGGCTCCATCGACGCCAACCAGGGCGACCTCCTC
CTCGGCTGGGACACCGACCAGTTCCCGACCAACATCTACGACACCACCCTCGCCATGTAC
GAGGTGATCAAGGCCGGCGGCTTCACCAAGGGCGGCCTCAACTTCGACGCCAAGGTGCG
CCGCGCCTCCTACAAGGTGGAGGACCTCTTCATCGGCCACATCGCCGGCATGGACACCTT
CGCCCTCGGCTTCAAGATCGCCTACAAGCTCGCCAAGGACGGCGTGTTCGACAAGTTCAT
CGAGGAGAAGTACCGCTCCTTCAAGGAGGGCATCGGCAAGGAGATCGTGGAGGGCAAG
ACCGACTTCGAGAAGCTGGAGGAGTACATCATCGACAAGGAGGACATCGAGCTGCCGTC
CGGCAAGCAGGAGTACCTGGAGTCCCTCCTCAACTCCTACATCGTGAAGACCATCGCCG
AGCTGCGCTGA
pNOV4835海栖热袍菌葡萄糖异构酶融合氨基酸序列(SEQ ID NO:42)
MGSSHHHHHHSSGLVPRGSHMASMTGGQQMGRIPMAEFFPEIPKIQFEGKESTNPLAFRFYD
PNEVIDGKPLKDHLKFSVAFWHTFVNEGRDPFGDPTAERPWNRFSDPMDKAFARVDALFEF
CEKLNIEYFCFHDRDIAPEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYM
HGAATTCSADVFAYAAAQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGLELENLARF
LRMAVEYAKKIGFTGQFLIEPKPKEPTKHQYDFDVATAYAFLKNHGLDEYFKFNIEANHATL
AGHTFQHELRMARILGKLGSIDANQGDLLLGWDTDQFPTNTYDTTLAMYEVIKAGGFTKGG
LNFDAKVRRASYKVEDLFIGHIAGMDTFALGFKIAYKLAKDGVFDKFIEEKYRSFKEGIGKEI
VEGKTDFEKLEEYIIDKEDIELPSGKQEYLESLLNSYIVKTLAELR
pNOV4836那不勒斯栖热袍菌葡萄糖异构酶融合核苷酸序列(SEQ ID NO:43)
ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCA
TATGGCTAGCATGACTGGTGGACAGCAAATGGGTCGGATCCCCATGGCCGAGTTCTTCCC
GGAGATCCCGAAGGTGCAGTTCGAGGGCAAGGAGTCCACCAACCCGCTCGCCTTCAAGT
TCTACGACCCGGAGGAGATCATCGACGGCAAGCCGCTCAAGGACCACCTCAAGTTCTCC
GTGGCCTTCTGGCACACCTTCGTGAACGAGGGCCGCGACCCGTTCGGCGACCCGACCGCC
GACCGCCCGTGGAACCGCTACACCGACCCGATGGACAAGGCCTTCGCCCGCGTGGACGC
CCTCTTCGAGTTCTGCGAGAAGCTCAACATCGAGTACTTCTGCTTCCACGACCGCGACAT
CCCCCGGAGGGCAAGACCCTCCGCGAGACCAACAAGATCCTCGACAAGGTGGTGGAGCG
CATCAAGGAGCGCATGAAGGACTCCAACGTGAAGCTCCTCTGGGGCACCGCCAACCTCT
TCTCCCACCCGCGCTACATGCACGGCGCCGCCACCACCTGCTCCGCCGACGTGTTCGCCT
ACGCCGCCGCCCAGGTGAAGAAGGCCCTGGAGATCACCAAGGAGCTGGGCGGCGAGGG
CTACGTGTTCTGGGGCGGCCGCGAGGGCTACGAGACCCTCCTCAACACCGACCTCGGCTT
CGAGCTGGAGAACCTCGCCCGCTTCCTCCGCATGGCCGTGGACTACGCCAAGCGCATCG
GCTTCACCGGCCAGTTCCTCATCGAGCCGAAGCCGAAGGAGCCGACCAAGCACCAGTAC
GACTTCGACGTGGCCACCGCCTACGCCTTCCTCAAGTCCCACGGCCTCGACGAGTACTTC
AAGTTCAACATCGAGGCCAACCACGCCACCCTCGCCGGCCACACCTTCCAGCACGAGCT
GCGCATGGCCCGCATCCTCGGCAAGCTCGGCTCCATCGACGCCAACCAGGGCGACCTCCT
CCTCGGCTGGGACACCGACCAGTTCCCGACCAACGTGTACGACACCACCCTCGCCATGTA
CGAGGTGATCAAGGCCGGCGGCTTCACCAAGGGCGGCCTCAACTTCGACGCCAAGGTGC
GCCGCGCCTCCTACAAGGTGGAGGACCTCTTCATCGGCCACATCGCCGGCATGGACACCT
TCGCCCTCGGCTTCAAGGTGGCCTACAAGCTCGTGAAGGACGGCGTGCTCGACAAGTTCA
TCGAGGAGAAGTACCGCTCCTTCCGCGAGGGCATCGGCCGCGACATCGTGGAGGGCAAG
GTGGACTTCGAGAAGCTGGAGGAGTACATCATCGACAAGGAGACCATCGAGCTGCCGTC
CGGCAAGCAGGAGTACCTGGAGTCCCTCATCAACTCCTACATCGTGAAGACCATCCTGG
AGCTGCGCTGA
pNOV4836那不勒斯栖热袍菌葡萄糖异构酶融合氨基酸序列(SEQ ID NO:44)
MGSSHHHHHHSSGLVPRGSHMASMTGGQQMGRIPMAEFFPEIPKVQFEGKESTNPLAFKFYD
PEEIIDGKPLKDHLKFSVAFWHTFVNEGRDPFGDPTADRPWNRYTDPMDKAFARVDALFEFC
EKLNIEYFCFHDRDIAPEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMH
GAATTCSADVFAYAAAQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGFELENLARFL
RMAVDYAKRIGFTGQFLIEPKPKEPTKHQYDFDVATAYAFLKSHGLDEYFKFNIEANHATLA
GHTFQHELRMARILGKLGSIDANQGDLLLGWDTDQFPTNVYDTTLAMYEVIKAGGFTKGGL
NFDAKVRRASYKVEDLFIGHIAGMDTFALGFKVAYKLVKDGVLDKFIEEKYRSFREGIGRDI
VEGKVDFEKLEEYIIDKETIELPSGKQEYLESLINSYIVKTILELR
Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合氨基酸序列(不含信号序列) (SEQ IDNO:45)
ATPADWRSQSIYFLLTDRFARTDGSTTATCNTADQKYCGGTWQGIIDKLDYIQGMGFTAIWI
TPVTAQLPQTTAYGDAYHGYWQQDIYSLNENYGTADDLKALSSALHERGMYLMVDVVAN
HMGYDGAGSSVDYSVFKPFSSQDYFHPFCFIQNYEDQTQVEDCWLGDNTVSLPDLDTTKDV
VKNEWYDWVGSLVSNYSIDGLRIDTVKHVQKDFWPGYNKAAGVYCIGEVLDVDPAYTCPY
QNVMDGVLNYPIYYPLLNAFKSTSGSMDDLYNMINTVKSDCPDSTLLGTFVENHDNPRFASY
TNDIALAKNVAAFIILNDGIPIIYAGQEQHYAGGNDPANREATWLSGYPTDSELYKLIASANAI
RNYAISKDTGFVTYKNWPIYKDDTTIAMRKGTDGSQIVTILSNKGASGDSYTLSLSGAGYTA
GQQLTEVIGCTTVTVGSDGNVPVPMAGGLPRVLYPTEKLAGSKICSSSKPATLDSWLSNEAT
VARTAILNNIGADGAWVSGADSGIVVASPSTDNPDYFYTWTRDSGIVLKTLVDLFRNGDTDL
LSTIEHYISSQAIIQGVSNPSGDLSSGGLGEPKFNDETAYAGSWGRPQRDGPALRATAMIGF
GQWLLDNGYTSAATEIVWPLVRNDLSYVAQYWNQTGYDLWEEVNGSSFFTIAVQHRALVE
GSAFATAVGSSCSWCDSQAPQILCYLQSFWTGSYILANFDSSRSGKDTNTLLGSIHTFDPEAG
CDDSTFQPCSPRALANHKEVVDSFRSIYTLNDGLSDSEAVAVGRYPEDSYYNGNPWFLCTLA
AAEQLYDALYQWDKQGSLEITDVSLDFFKALYSGAATGTYSSSSSTYSSIVSAVKTFADGFVS
IVETHAASNGSLSEQFDKSDGDELSARDLTWSYAALLTANNRRNSVVPPSWGETSASSVPGT
CAATSASGTYSSVTVTSWPSIVATGGTTTTATTTGSGGVTSTSKTTTTASKTSTTTSSTSCTTP
TAVAVTFDLTATTTYGENIYLVGSISQLGDWETSDGIALSADKYTSSNPPWYVTVTLPAGESF
EYKFIRVESDDSVEWESDPNREYTVPQACGESTATVTDTWR
Aspergillus shirousami α-淀粉酶/葡糖淀粉酶融合玉米优化核酸序列(不含信号序列)(SEQ ID NO:46)
GCCACCCCGGCCGACTGGCGCTCCCAGTCCATCTACTTCCTCCTCACCGACCGCTTCGCC
CGCACCGACGGCTCCACCACCGCCACCTGCAACACCGCCGACCAGAAGTACTGCGGCGG
CACCTGGCAGGGCATCATCGACAAGCTCGACTACATCCAGGGCATGGGCTTCACCGCCA
TCTGGATCACCCCGGTGACCGCCCAGCTCCCGCAGACCACCGCCTACGGCGACGCCTACC
ACGGCTACTGGCAGCAGGACATCTACTCCCTCAACGAGAACTACGGCACCGCCGACGAC
CTCAAGGCCCTCTCCTCCGCCCTCCACGAGCGCGGCATGTACCTCATGGTGGACGTGGTG
GCCAACCACATGGGCTACGACGGCGCCGGCTCCTCCGTGGACTACTCCGTGTTCAAGCCG
TTCTCCTCCCAGGACTACTTCCACCCGTTCTGCTTCATCCAGAACTACGAGGACCAGACC
CAGGTGGAGGACTGCTGGCTCGGCGACAACACCGTGTCCCTCCCGGACCTCGACACCAC
CAAGGACGTGGTGAAGAACGAGTGGTACGACTGGGTGGGCTCCCTCGTGTCCAACTACT
CCATCGACGGCCTCCGCATCGACACCGTGAAGCACGTGCAGAAGGACTTCTGGCCGGGC
TACAACAAGGCCGCCGGCGTGTACTGCATCGGCGAGGTGCTCGACGTGGACCCGGCCTA
CACCTGCCCGTACCAGAACGTGATGGACGGCGTGCTCAACTACCCGATCTACTACCCGCT
CCTCAACGCCTTCAAGTCCACCTCCGGCTCGATGGACGACCTCTACAACATGATCAACAC
CGTGAAGTCCGACTGCCCGGACTCCACCCTCCTCGGCACCTTCGTGGAGAACCACGACAA
CCCGCGCTTCGCCTCCTACACCAACGACATCGCCCTCGCCAAGAACGTGGCCGCCTTCAT
CATCCTCAACGACGGCATCCCGATCATCTACGCCGGCCAGGAGCAGCACTACGCCGGCG
GCAACGACCCGGCCAACCGCGAGGCCACCTGGCTCTCCGGCTACCCGACCGACTCCGAG
CTGTACAAGCTCATCGCCTCCGCCAACGCCATCCGCAACTACGCCATCTCCAAGGACACC
GGCTTCGTGACCTACAAGAACTGGCCGATCTACAAGGACGACACCACCATCGCCATGCG
CAAGGGCACCGACGGCTCCCAGATCGTGACCATCCTCTCCAACAAGGGCGCCTCCGGCG
ACTCCTACACCCTCTCCCTCTCCGGCGCCGGCTACACCGCCGGCCAGCAGCTCACCGAGG
TGATCGGCTGCACCACCGTGACCGTGGGCTCCGACGGCAACGTGCCGGTGCCGATGGCC
GGCGGCCTCCCGCGCGTGCTCTACCCGACCGAGAAGCTCGCCGGCTCCAAGATATGCTCC
TCCTCCAAGCCGGCCACCCTCGACTCCTGGCTCTCCAACGAGGCCACCGTGGCCCGCACC
GCCATCCTCAACAACATCGGCGCCGACGGCGCCTGGGTGTCCGGCGCCGACTCCGGCAT
CGTGGTGGCCTCCCCGTCCACCGACAACCCGGACTACTTCTACACCTGGACCCGCGACTC
CGGCATCGTGCTCAAGACCCTCGTGGACCTCTTCCGCAACGGCGACACCGACCTCCTCTC
CACCATCGAGCACTACATCTCCTCCCAGGCCATCATCCAGGGCGTGTCCAACCCGTCCGG
CGACCTCTCCTCCGGCGGCCTCGGCGAGCCGAAGTTCAACGTGGACGAGACCGCCTACG
CCGGCTCCTGGGGCCGCCCGCAGCGCGACGGCCCGGCCCTCCGCGCCACCGCCATGATC
GGCTTCGGCCAGTGGCTCCTCGACAACGGCTACACCTCCGCCGCCACCGAGATCGTGTGG
CCGCTCGTGCGCAACGACCTCTCCTACGTGGCCCAGTACTGGAACCAGACCGGCTACGAC
CTCTGGGAGGAGGTGAACGGCTCCTCCTTCTTCACCATCGCCGTGCAGCACCGCGCCCTC
GTGGAGGGCTCCGCCTTCGCCACCGCCGTGGGCTCCTCCTGCTCCTGGTGCGACTCCCAG
GCCCCGCAGATCCTCTGCTACCTCCAGTCCTTCTGGACCGGCTCCTACATCCTCGCCAACT
TCGACTCCTCCCGCTCCGGCAAGGACACCAACACCCTCCTCGGCTCCATCCACACCTTCG
ACCCGGAGGCCGGCTGCGACGACTCCACCTTCCAGCCGTGCTCCCCGCGCGCCCTCGCCA
ACCACAAGGAGGTGGTGGACTCCTTCCGCTCCATCTACACCCTCAACGACGGCCTCTCCG
ACTCCGAGGCCGTGGCCGTGGGCCGCTACCCGGAGGACTCCTACTACAACGGCAACCCG
TGGTTCCTCTGCACCCTCGCCGCCGCCGAGCAGCTCTACGACGCCCTCTACCAGTGGGAC
AAGCAGGGCTCCCTGGAGATCACCGACGTGTCCCTCGACTTCTTCAAGGCCCTCTACTCC
GGCGCCGCCACCGGCACCTACTCCTCCTCCTCCTCCACCTACTCCTCCATCGTGTCCGCCG
TGAAGACCTTCGCCGACGGCTTCGTGTCCATCGTGGAGACCCACGCCGCCTCCAACGGCT
CCCTCTCCGAGCAGTTCGACAAGTCCGACGGCGACGAGCTGTCCGCCCGCGACCTCACCT
GGTCCTACGCCGCCCTCCTCACCGCCAACAACCGCCGCAACTCCGTGGTGCCGCCGTCCT
GGGGCGAGACCTCCGCCTCCTCCGTGCCGGGCACCTGCGCCGCCACCTCCGCCTCCGGCA
CCTACTCCTCCGTGACCGTGACCTCCTGGCCGTCCATCGTGGCCACCGGCGGCACCACCA
CCACCGCCACCACCACCGGCTCCGGCGGCGTGACCTCCACCTCCAAGACCACCACCACC
GCCTCCAAGACCTCCACCACCACCTCCTCCACCTCCTGCACCACCCCGACCGCCGTGGCC
GTGACCTTCGACCTCACCGCCACCACCACCTACGGCGAGAACATCTACCTCGTGGGCTCC
ATCTCCCAGCTCGGCGACTGGGAGACCTCCGACGGCATCGCCCTCTCCGCCGACAAGTAC
ACCTCCTCCAACCCGCCGTGGTACGTGACCGTGACCCTCCCGGCCGGCGAGTCCTTCGAG
TACAAGTTCATCCGCGTGGAGTCCGACGACTCCGTGGAGTGGGAGTCCGACCCGAACCG
CGAGTAC
ACCGTGCCGCAGGCCTGCGGCGAGTCCACCGCCACCGTGACCGACACCTGGCGC
热解糖热厌氧杆菌(Thermoanaerobaterium thermosaccharolgticum)葡糖淀粉酶氨基酸序列 (不含信号序列)(SEQ ID NO:47)
VLSGCSNNVSSIKIDRFNNISAVNGPGEEDTWASAQKQGVGTANNYVSRVWFTLANGAISEV
YYPTIDTADVKEIKFIVTDGKSFVSDETKDAISKVEKFTDKSLGYKLVNTDKKGRYRITKEIFT
DVKKNSLIMKAKFEALEGSIHYKLYLAYDPHIKNQGSYNEGYVIKANNNEMLMAKRDNV
YTALSSNIGWKGYSIGYYKVNDIMTDLDENKQMTKHYDSARGNIIEGAEIDLTKNSEFEIVLS
FGGSDSEAAKTALETLGEDYNNLKNNYIDEWTKYCNTLNNFNGKANSLYYNSMMILKASED
KTNKGAYLASLSIPWGDGQRDDNTGGYHLVWSRDLYHVANAFIAAGDVDSANRSLDYLA K
VVKDNGMIPQNTWISGKPYWTSIQLDEQADPIILSYRLKRYDLYDSLVKPLADFIIKIGPKTGQ
ERWEEIGGYSPATMAAEVAGLTCAAYIAEQNKDYESAQKYQEKADNWQKLIDNLTYTENG
PLGNGQYYIRIAGLSDPNADFMINIANGGGVYDQKEIVDPSFLELVRLGVKSADDPKILNTLK
VVDSTIKVDTPKGPSWYRYNHDGYGEPSKTELYHGAGKGRLWPLLTGERGMYEIAAGKDA
TPYVKAMEKFANEGGIISEQV WEDTGLPTDSASPLNWAHAEYVILFASNIEHKVLDMPDIVY
热解糖热厌氧杆菌(Thermoanaerobaterium thermosaccharolgticum)葡糖淀粉酶玉米优化核 酸序列(不含信号序列)(SEQ ID NO:48)
GTGCTCTCCGGCTGCTCCAACAACGTGTCCTCCATCAAGATCGACCGCTTCAACAACATC
TCCGCCGTGAACGGCCCGGGCGAGGAGGACACCTGGGCCTCCGCCCAGAAGCAGGGCGT
GGGCACCGCCAACAACTACGTGTCCCGCGTGTGGTTCACCCTCGCCAACGGCGCCATCTC
CGAGGTGTACTACCCGACCATCGACACCGCCGACGTGAAGGAGATCAAGTTCATCGTGA
CCGACGGCAAGTCCTTCGTGTCCGACGAGACCAAGGACGCCATCTCCAAGGTGGAGAAG
TTCACCGACAAGTCCCTCGGCTACAAGCTCGTGAACACCGACAAGAAGGGCCGCTACCG
CATCACCAAGGAAATCTTCACCGACGTGAAGCGCAACTCCCTCATCATGAAGGCCAAGT
TCGAGGCCCTCGAGGGCTCCATCCACGACTACAAGCTCTACCTCGCCTACGACCCGCACA
TCAAGAACCAGGGCTCCTACAACGAGGGCTACGTGATCAAGGCCAACAACAACGAGATG
CTCATGGCC AAGCGCGACAACGTGTACACCGCCCTCTCCTCCAACATCGGCTGGAAGGG
CTACTCCATCGGCTACTACAAGGTGAACGACATCATGACCGACCTCGACGAGAACAAGC
AGATGACCAAGCACTACGACTCCGCCCGCGG CAACATCATCGAGGGCGCCGAGATCGAC
CTCACCAAGAACTCCGAGTTCGAGATCGTGCTCTCCTTCGGCGGCTCCGACTCCGAGGCC
GCCAAGACCGCCCTCGAGACCCTCGGCGAGGACTACAACAACCTCAAGAACAACTACAT
CGACGAGTGGACCAAGTACTGCAACACCCTCAACAACTTCAACGGCAAGGCCAACTCCC
TCTACTACAACTCCATGATGATCCTCAAGGCCTCCGAGGACAAGACCAACAAGGGCGCC
TACATCGCCTCCCTCTCCATCCCGTGGGGCGACGGCCAGCGCGACGACAACACCGGCGG
CTACCACCTCGTGTGGTCCCGCGACCTCTACCACGTGGCCAACGCCTTCATCGCCGCCGG
CGACGTGGACTCCGCCAACCGCTCCCTCGACTACCTCGCCAAGGTGGTGAAGGACAACG
GCATGATCCCGCAGAACACCTGGATCTCCGGCAAGCCGTACTGGACCTCCATCCAGCTCG
ACGAGCAGGCCGACCCGATCATCCTCTCCTACCGCCTCAAGCGCTACGACCTCTACGACT
CCCTCGTGAAGCCGCTCGCCGACTTCATCATCAAGATCGGCCCGAAGACCGGCCAGGAG
CGCTGGGAGGAGATCGGCGGCTACTCCCCGGCCACGATGGCCGCCGAGGTGGCCGGCCT
CACCTGCGCCGCCTACATCGCCGAGCAGAACAAGGACTACGAGTCCGCCCAGAAGTACC
AGGAGAAGGCCGACAACTGGCAGAAGCTCATCGACAACCTCACCTACACCGAGAACGGC
CCGCTCGGCAACGGCCAGTACTACATCCGCATCGCCGGCCTCTCCGACCCGAACGCCGAC
TTCATGATCAACATCGCCAACGGCGGCGGCGTGTACGACCAGAAGGAGATCGTGGACCC
GTCCTTCCTCGAGCTGGTGCGCCTCGGCGTGAAGTCCGCCGACGACCCGAAGATCCTCAA
CACCCTCAAGGTGGTGGACTCCACCATCAAGGTGGACACCCCGAAGGGCCCGTCCTGGT
ATCGCTACAACCACGACGGCTACGGCGAGCCGTCCAAGACCGAGCTGTACCACGGCGCC
GGCAAGGGCCGCCTCTGGCCGCTCCTCACCGGCGAGCGCGGCATGTACGAGATCGCCGC
CGGCAAGGACGCCACCCCGTACGTGAAGGCGATGGAGAAGTTCGCCAACGAGGGCGGC
ATCATCTCCGAGCAGGTGTGGGAGGACACCGGCCTCCCGACCGACTCCGCCTCCCCGCTC
AACTGGGCCCACGCCGAGTACGTGATCCTCTTCGCCTCCAACATCGAGCACAAGGTGCTC
GACATGCCGGACATCGTGTAC
米根霉(Rhizopus oryzae)葡糖淀粉酶氨基酸序列(不含信号序列)(SEQ ID NO:49)
ASIPSSASVQLDSYNYDGSTFSGKIYVKNIAYSKKVTVIYADGSDNWNNNGNTIAASYSAPIS
GSNYEYWTFSASINGIKEFYIKYEVSGKTYYDNNNSANYQVSTSKPTTTTATATTTTAPSTST
TTPPSRSEPATFPTGNSTISSWIKKQEGISRFAMLRNINPPGSATGFIAASLSTAGPDYYYAWTR
DAALTSNVIVYEYNTTLSGNKTILNVLKDYVTFSVKTQSTSTVCNCLGEPKFNPDASGYTGA
WGRPQNDGPAERATTFILFADSYLTQTKDASYVTGTLKPAIFKDLDYVVNVWSNGCFDLWE
EVNGVHFYTLMVMRKGLLLGADFAKRNGDSTRASTYSSTASTIANKISSFWVSSNNWIQVSQ
SVTGGVSKKGLDVSTLLAANLGSVDDGFFTPGSEKILATAVAVEDSFASLYPINKNLPSYLGN
SIGRYPEDTYNGNGNSQGNSWFLAVTGYAELYYRAIKEWIGNGGVTVSSISLPFFKKFDSSAT
SGKKYTVGTSDFNNLAQNIALAADRFLSTVQLHAHNNGSLAEEFDRTTGLSTGARDLTWSH
ASLITASYAKAGAPAA
米根霉葡糖淀粉酶玉米优化核酸序列(不含信号序列)(SEQ ID NO:50)
GCCTCCATCCCGTCCTCCGCCTCCGTGCAGCTCGACTCCTACAACTACGACGGCTCCACC
TTCTCCGGCAAAATCTACGTGAAGAACATCGCCTACTCCAAGAAGGTGACCGTGATCTAC
GCCGACGGCTCCGACAACTGGAACAACAACGGCAACACCATCGCCGCCTCCTACTCCGC
CCCGATCTCCGGCTCCAACTACGAGTACTGGACCTTCTCCGCCTCCATCAACGGCATCAA
GGAGTTCTACATCAAGTACGAGGTGTCCGGCAAGACCTACTACGACAACAACAACTCCG
CCAACTACCAGGTGTCCACCTCCAAGCCGACCACCACCACCGCCACCGCCACCACCACC
ACCGCCCCGTCCACCTCCACCACCACCCCGCCGTCCCGCTCCGAGCCGGCCACCTTCCCG
ACCGGCAACTCCACCATCTCCTCCTGGATCAAGAAGCAGGAGGGCATCTCCCGCTTCGCC
ATGCTCCGCAACATCAACCCGCCGGGCTCCGCCACCGGCTTCATCGCCGCCTCCCTCTCC
ACCGCCGGCCCGGACTACTACTACGCCTGGACCCGCGACGCCGCCCTCACCTCCAACGTG
ATCGTGTACGAGTACAACACCACCCTCTCCGGCAACAAGACCATCCTCAACGTGCTCAAG
GACTACGTGACCTTCTCCGTGAAGACCCAGTCCACCTCCACCGTGTGCAACTGCCTCGGC
GAGCCGAAGTTCAACCCGGACGCCTCCGGCTACACCGGCGCCTGGGGCCGCCCGCAGAA
CGACGGCCCGGCCGAGCGCGCCACCACCTTCATCCTCTTCGCCGACTCCTACCTCACCCA
GACCAAGGACGCCTCCTACGTGACCGGCACCCTCAAGCCGGCCATCTTCAAGGACCTCG
ACTACGTGGTGAACGTGTGGTCCAACGGCTGCTTCGACCTCTGGGAGGAGGTGAACGGC
GTGCACTTCTACACCCTCATGGTGATGCGCAAGGGCCTCCTCCTCGGCGCCGACTTCGCC
AAGCGCAACGGCGACTCCACCCGCGCCTCCACCTACTCCTCCACCGCCTCCACCATCGCC
AACAAAATCTCCTCCTTCTGGGTGTCCTCCAACAACTGGATACAGGTGTCCCAGTCCGTG
ACCGGCGGCGTGTCCAAGAAGGGCCTCGACGTGTCCACCCTCCTCGCCGCCAACCTCGGC
TCCGTGGACGACGGCTTCTTCACCCCGGGCTCCGAGAAGATCCTCGCCACCGCCGTGGCC
GTGGAGGACTCCTTCGCCTCCCTCTACCCGATCAACAAGAACCTCCCGTCCTACCTCGGC
AACTCCATCGGCCGCTACCCGGAGGACACCTACAACGGCAACGGCAACTCCCAGGGCAA
CTCCTGGTTCCTCGCCGTGACCGGCTACGCCGAGCTGTACTACCGCGCCATCAAGGAGTG
GATCGGCAACGGCGGCGTGACCGTGTCCTCCATCTCCCTCCCGTTCTTCAAGAAGTTCGA
CTCCTCCGCCACCTCCGGCAAGAAGTACACCGTGGGCACCTCCGACTTCAACAACCTCGC
CCAGAACATCGCCCTCGCCGCCGACCGCTTCCTCTCCACCGTGCAGCTCCACGCCCACAA
CAACGGCTCCCTCGCCGAGGAGTTCGACCGCACCACCGGCCTCTCCACCGGCGCCCGCG
ACCTCACCTGGTCCCACGCCTCCCTCATCACCGCCTCCTACGCCAAGGCCGGCGCCCCGG
CCGCC
玉米α-淀粉酶氨基酸序列(SEQ ID NO:51)
MAKHLAAMCWCSLLVLVLLCLGSQLAQSQVLFQGFNWESWKKQGGWNYLLGRVDDIAA
TGATHVWLPQPSHSVAPQGYMPGRLYDLDASKYGTHAELKSLTAAFHAKGVQCVADVVIN
HRCADYKDGRGIYCVFEGGTPDSRLDWGPDMICSDDTQYSNGRGHRDTGADFAAAPDIDHL
NPRVQQELSDWLNWLKSDLGFDGWRLDFAKGYSAAVAKVYVDSTAPTFVVAEIWSSLHYD
GNGEPSSNQDADRQELVNWAQAVGGPAAAFDFTTKGVLQAAVQGELWRMKDGNGKAPG
MIGWLPEKAVTFVDNHDTGSTQNSWPFPSDKVMQGYAYILTHPGTPCIFYDHVFDWNLKQE
ISALSAVRSRNGIHPGSELNILAADGDLYVAKIDDKVIVKIGSRYDVGNLIPSDFHAVAHGNN
YCVWEKHGLRVPAGRHH
玉米α-淀粉酶核酸序列(SEQ ID NO:52)
ATGGCGAAGCACTTGGCTGCCATGTGCTGGTGCAGCCTCCTAGTGCTTGTACTGCTCTGC
TTGGGCTCCCAGCTGGCCCAATCCCAGGTCCTCTTCCAGGGGTTCAACTGGGAGTCGTGG
AAGAAGCAAGGTGGGTGGTACAACTACCTCCTGGGGCGGGTGGACGACATCGCCGCGAC
GGGGGCCACGCACGTCTGGCTCCCGCAGCCGTCGCACTCGGTGGCGCCGCAGGGGTACA
TGCCCGGCCGGCTCTACGACCTGGACGCGTCCAAGTACGGCACCCACGCGGAGCTCAAG
TCGCTCACCGCGGCGTTCCACGCCAAGGGCGTCCAGTGCGTCGCCGACGTCGTGATCAAC
CACCGCTGCGCCGACTACAAGGACGGCCGCGGCATCTACTGCGTCTTCGAGGGCGGCAC
GCCCGACAGCCGCCTCGACTGGGGCCCCGACATGATCTGCAGCGACGACACGCAGTACT
CCAACGGGCGCGGGCACCGCGACACGGGGGCCGACTTCGCCGCCGCGCCCGACATCGAC
CACCTCAACCCGCGCGTGCAGCAGGAGCTCTCGGACTGGCTCAACTGGCTCAAGTCCGA
CCTCGGCTTCGACGGCTGGCGCCTCGACTTCGCCAAGGGCTACTCCGCCGCCGTCGCCAA
GGTGTACGTCGACAGCACCGCCCCCACCTTCGTCGTCGCCGAGATATGGAGCTCCCTCCA
CTACGACGGCAACGGCGAGCCGTCCAGCAACCAGGACGCCGACAGGCAGGAGCTGGTC
AACTGGGCGCAGGCGGTGGGCGGCCCCGCCGCGGCGTTCGACTTCACCACCAAGGGCGT
GCTGCAGGCGGCCGTCCAGGGCGAGCTGTGGCGCATGAAGGACGGCAACGGCAAGGCG
CCCGGGATGATCGGCTGGCTGCCGGAGAAGGCCGTCACGTTCGTCGACAACCACGACAC
CGGCTCCACGCAGAACTCGTGGCCATTCCCCTCCGACAAGGTCATGCAGGGCTACGCCTA
TATCCTCACGCACCCAGGAACTCCATGCATCTTCTACGACCACGTTTTCGACTGGAACCT
GAAGCAGGAGATCAGCGCGCTGTCTGCGGTGAGGTCAAGAAACGGGATCCACCCGGGG
AGCGAGCTGAACATCCTCGCCGCCGACGGGGATCTCTACGTCGCCAAGATTGACGACAA
GGTCATCGTGAAGATCGGGTCACGGTACGACGTCGGGAACCTGATCCCCTCAGACTTCCA
CGCCGTTGCCCCTGGCAACAACTACTGCGTTTGGGAGAAGCACGGTCTGAGAGTTCCAGC
GG GGCGGCACCACTAG
粗淀粉结合位点氨基酸序列(SEQ ID NO:53)
ATGGTTTTATTTGSGGVTSTSKTTTTASKTSTTTSSTSCTTPTAV
粗淀粉结合位点玉米优化核酸序列(SEQ ID NO:54)
GCCACCGGCGGCACCACCACCACCGCCACCACCACCGGCTCCGGCGGCGTGACCTCCAC
CTCCAAGACCACCACCACCGCCTCCAAGACCTCCACCACCACCTCCTCCACCTCCTGCAC
CACCCCGACCGCCGTGTC
激烈火球菌(Pyrococcus furiosus)EGLA氨基酸序列(不含信号序列)(SEQ ID NO:55)
IYFVEKYHTSEDKSTSNTSSTPPQTTLSTTKVLKIRYPDDGEWPGAPIDKDGDGNPEFYIEINL
WNILNATGFAEMTYNLTSGVLHYVQQLDNIVLRDRSNWVHGYPEIFYGNKPWNANYATDG
PIPLPSKVSNLTDFYLTISYKLEPKNGLPINFAIESWLTREAWRTTGINSDEQEVMIWIYYDGL
QPAGSKVKEIVVPIIVNGTPVNATFEVWKANIGWEYVAFRIKTPIKEGTVTIPYGAFISVAANIS
SLPNYTELYLEDVEIGTEFGTPSTTSAHLEWWITNITLTPLDRPLIS
激烈火球菌EGLA玉米优化核酸序列(不含信号序列)(SEQ ID NO:56)
ATCTACTTCGTGGAGAAGTACCACACCTCCGAGGACAAGTCCACCTCCAACACCTCCTCC
ACCCCGCCGCAGACCACCCTCTCCACCACCAAGGTGCTCAAGATCCGCTACCCGGACGA
CGGCGAGTGGCCCGGCGCCCCGATCGACAAGGACGGCGACGGCAACCCGGAGTTCTACA
TCGAGATCAACCTCTGGAACATCCTCAACGCCACCGGCTTCGCCGAGATGACCTACAACC
TCACTAGTGGCGTGCTCCACTACGTGCAGCAGCTCGACAACATCGTGCTCCGCGACCGCT
CCAACTGGGTGCACGGCTACCCGGAAATCTTCTACGGCAACAAGCCGTGGAACGCCAAC
TACGCCACCGACGGCCCGATCCCGCTCCCGTCCAAGGTGTCCAACCTCACCGACTTCTAC
CTCACCATCTCCTACAAGCTCGAGCCGAAGAACGGTCTCCCGATCAACTTCGCCATCGAG
TCCTGGCTCACCCGCGAGGCCTGGCGCACCACCGGCATCAACTCCGACGAGCAGGAGGT
GATGATCTGGATCTACTACGACGGCCTCCAGCCCGCGGGCTCCAAGGTGAAGGAGATCG
TGGTGCCGATCATCGTGAACGGCACCCCGGTGAACGCCACCTTCGAGGTGTGGAAGGCC
AACATCGGCTGGGAGTACGTGGCCTTCCGCATCAAGACCCCGATCAAGGAGGGCACCGT
GACCATCCCGTACGGCGCCTTCATCTCCGTGGCCGCCAACATCTCCTCCCTCCCGAACTA
CACCGAGAAGTACCTCGAGGACGTGGAGATCGGCACCGAGTTCGGCACCCCGTCCACCA
CCTCCGCCCACCTCGAGTGGTGGATCACCAACATCACCCTCACCCCGCTCGACCGCCCGC
TCATCTCCTAG
黄栖热菌(Thermus flavus)木糖异构酶氨基酸序列(SEQ ID NO:57)
MYEPKPEHRFTFGLWTVDNVDRDPFGDTVRERLDPVYVVHKLAELGAYGVNLHDEDLIPRG
TPPQERDQIVRRFKKALDETVLKVPMVTANLFSEPAFRDGASTTRDPWVWAYALRKSLETM
DLGAELGAEIYMFWMVRERSEVESTDKTRKVWDWVRETLNFMTAYTEDQGYGYRFSVEPK
PNEPRGDIYFTTVGSMLALIHTLDRPER
FGLNPEFAHETMAGLNFDHAVAQAVDAGKLFHIDLNDQRMSRFDQDLRFGSENLKAGFFLV
DLLESSGYQGPRHFEAHALRTEDEEGVWTFVRVCMRTYLIIKVRAETFREDPEVKELLAAYY
QEDPATLALLDPYSREKAEALKRAELPLETKRRRGYALERLDQLAVEYLLGVRG
pNOV4800核苷酸序列(Amy32B信号序列和EGLA)(SEQ ID NO:58)
ATGGGGAAGAACGGCAACCTGTGCTGCTTCTCTCTGCTGCTGCTTCTTCTCGCCGGGTTG
GCGTCCGGCCATCAAATCTACTTCGTGGAGAAGTACCACACCTCCGAGGACAAGTCCAC
CTCCAACACCTCCTCCACCCCGCCGCAGACCACCCTCTCCACCACCAAGGTGCTCAAGAT
CCGCTACCCGGACGACGGTGAGTGGCCCGGCGCCCCGATCGACAAGGACGGCGACGGCA
ACCCGGAGTTCTACATCGAGATCAACCTCTGGAACATCCTCAACGCCACCGGCTTCGCCG
AGATGACCTACAACCTCACTAGTGGCGTGCTCCACTACGTGCAGCAGCTCGACAACATCG
TGCTCCGCGACCGCTCCAACTGGGTGCACGGCTACCCGGAAATCTTCTACGGCAACAAGC
CGTGGAACGCCAACTACGCCACCGACGGCCCGATCCCGCTCCCGTCCAAGGTGTCCAAC
CTCACCGACTTCTACCTCACCATCTCCTACAAGCTCGAGCCGAAGAACGGTCTCCCGATC
AACTTCGCCATCGAGTCCTGGCTCACCCGCGAGGCCTGGCGCACCACCGGCATCAACTCC
GACGAGCAGGAGGTGATGATCTGGATCTACTACGACGGCCTCCAGCCCGCGGGCTCCAA
GGTGAAGGAGATCGTGGTGCCGATCATCGTGAACGGCACCCCGGTGAACGCCACCTTCG
AGGTGTGGAAGGCCAACATCGGCTGGGAGTACGTGGCCTTCCGCATCAAGACCCCGATC
AAGGAGGGCACCGTGACCATCCCGTACGGCGCCTTCATCTCCGTGGCCGCCAACATCTCC
TCCCTCCCGAACTACACCGAGAAGTACCTCGAGGACGTGGAGATCGGCACCGAGTTCGG
CACCCCGTCCACCACCTCCGCCCACCTCGAGTGGTGGATCACCAACATCACCCTCACCCC
GCTCGACCGCCCGCTCATCTCCTAG
黑色曲霉(Aspergillus niger)玉米优化核酸(SEQ ID NO:59)
ATGTCCTTCCGCTCCCTCCTCGCCCTCTCCGGCCTCGTGTGCACCGGCCTCGCCAACGTGA
TCTCCAAGCGCGCCACCCTCGACTCCTGGCTCTCCAACGAGGCCACCGTGGCCCGCACCG
CCATCCTCAACAACATCGGCGCCGACGGCGCCTGGGTGTCCGGCGCCGACTCCGGCATC
GTGGTGGCCTCCCCGTCCACCGACAACCCGGACTACTTCTACACCTGGACCCGCGACTCC
GGCCTCGTGCTCAAGACCCTCGTGGACCTCTTCCGCAACGGCGACACCTCCCTCCTCTCC
ACCATCGAGAACTACATCTCCGCCCAGGCCATCGTGCAGGGCATCTCCAACCCGTCCGGC
GACCTCTCCTCCGGCGCCGGCCTCGGCGAGCCGAAGTTCAACGTGGACGAGACCGCCTA
CACCGGCTCCTGGGGCCGCCCGCAGCGCGACGGCCCGGCCCTCCGCGCCACCGCCATGA
TCGGCTTCGGCCAGTGGCTCCTCGACAACGGCTACACCTCCACCGCCACCGACATCGTGT
GGCCGCTCGTGCGCAACGACCTCTCCTACGTGGCCCAGTACTGGAACCAGACCGGCTAC
GACCTCTGGGAGGAGGTGAACGGCTCCTCCTTCTTCACCATCGCCGTGCAGCACCGCGCC
CTCGTGGAGGGCTCCGCCTTCGCCACCGCCGTGGGCTCCTCCTGCTCCTGGTGCGACTCC
CAGGCCCCGGAGATCCTCTGCTACCTCCAGTCCTTCTGGACCGGCTCCTTCATCCTCGCCA
ACTTCGACTCCTCCCGCTCCGGCAAGGACGCCAACACCCTCCTCGGCTCCATCCACACCT
TCGACCCGGAGGCCGCCTGCGACGACTCCACCTTCCAGCCGTGCTCCCCGCGCGCCCTCG
CCAACCACAAGGAGGTGGTGGACTCCTTCCGCTCCATCTACACCCTCAACGACGGCCTCT
CCGACTCCGAGGCCGTGGCCGTGGGCCGCTACCCGGAGGACACCTACTACAACGGCAAC
CCGTGGTTCCTCTGCACCCTCGCCGCCGCCGAGCAGCTCTACGACGCCCTCTACCAGTGG
GACAAGCAGGGCTCCCTCGAGGTGACCGACGTGTCCCTCGACTTCTTCAAGGCCCTCTAC
TCCGACGCCGCCACCGGCACCTACTCCTCCTCCTCCTCCACCTACTCCTCCATCGTGGACG
CCGTGAAGACCTTCGCCGACGGCTTCGTGTCCATCGTGGAGACCCACGCCGCCTCCAACG
GCTCCATGTCCGAGCAGTACGACAAGTCCGACGGCGAGCAGCTCTCCGCCCGCGACCTC
ACCTGGTCCTACGCCGCCCTCCTCACCGCCAACAACCGCCGCAACTCCGTGGTGCCGGCC
TCCTGGGGCGAGACCTCCGCCTCCTCCGTGCCGGGCACCTGCGCCGCCACCTCCGCCATC
GGCACCTACTCCTCCGTGACCGTGACCTCCTGGCCGTCCATCGTGGCCACCGGCGGCACC
ACCACCACCGCCACCCCGACCGGCTCCGGCTCCGTGACCTCCACCTCCAAGACCACCGCC
ACCGCCTCCAAGACCTCCACCTCCACCTCCTCCACCTCCTGCACCACCCCGACCGCCGTG
GCCGTGACCTTCGACCTCACCGCCACCACCACCTACGGCGAGAACATCTACCTCGTGGGC
TCCATCTCCCAGCTCGGCGACTGGGAGACCTCCGACGGCATCGCCCTCTCCGCCGACAAG
TACACCTCCTCCGACCCGCTCTGGTACGTGACCGTGACCCTCCCGGCCGGCGAGTCCTTC
GAGTACAAGTTCATCCGCATCGAGTCCGACGACTCCGTGGAGTGGGAGTCCGACCCGAA
CCGCGAGTACACCGTGCCGCAGGCCTGCGGCACCTCCACCGCCACCGTGACCGACACCT
GGCGC
序列表
<110>Lanahan,Mike
<120>自加工的植物及植物部分
<130>109846.317
<140>US 60/315,281
<141>2001-08-27
<160>60
<170>FastSEQ for Windows  Version  4.0
<210>1
<211>436
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>1
Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala
 1               5                  10                  15
Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg
            20                  25                  30
Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile
         35                  40                  45
Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp
     50                  55                  60
Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val
65                  70                  75                  80
Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr
                85                  90                  95
Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His
            100                 105                 110
Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr
        115                 120                 125
Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr
    130                 135                 140
Leu Asp Phe His Pro Asn GluLeu  His Ala Gly Asp Ser Gly Thr Phe
145                 150                 155                 160
Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp
                165                 170                 175
Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly
            180                 185                 190
Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val
        195                 200                 205
Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr
    210                 215                 220
Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly
225                 230                 235                 240
Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe
                245                 250                 255
Asp Asn LVs Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly
            260                 265                 270
Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn
        275                 280                 285
His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile
    290                 295                 300
Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu
305                 310                 315                 320
Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn
                325                 330                 335
Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met
            340                 345                 350
Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr
        355                 360                 365
Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys
    370                 375                 380
Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp
385                 390                 395                 400
Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro
                405                 410                 415
Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr
            420                 425                 430
Cys Gly Val Gly
        435
<210>2
<211>1308
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>2
atggccaagt  acctggagct  ggaggagggc  ggcgtgatca  tgcaggcgtt  ctactgggac  60
gtcccgagcg  gaggcatctg  gtgggacacc  atccgccaga  agatccccga  gtggtacgac  120
gccggcatct  ccgcgatctg  gataccgcca  gcttccaagg  gcatgtccgg  gggctactcg  180
atgggctacg  acccgtacga  ctacttcgac  ctcggcgagt  actaccagaa  gggcacggtg  240
gagacgcgct  tcgggtccaa  gcaggagctc  atcaacatga  tcaacacggc  gcacgcctac  300
ggcatcaagg  tcatcgcgga  catcgtgatc  aaccacaggg  ccggcggcga  cctggagtgg  360
aacccgttcg  tcggcgacta  cacctggacg  gacttctcca  aggtcgcctc  cggcaagtac  420
accgccaact  acctcgactt  ccaccccaac  gagctgcacg  cgggcgactc  cggcacgttc  480
ggcggctacc  cggacatctg  ccacgacaag  tcctgggacc  agtactggct  ctgggcctcg  540
caggagtcct  acgcggccta  cctgcgctcc  atcggcatcg  acgcgtggcg  cttcgactac  600
gtcaagggct  acggggcctg  ggtggtcaag  gactggctca  actggtgggg  cggctgggcg  660
gtgggcgagt  actgggacac  caacgtcgac  gcgctgctca  actgggccta  ctcctccggc  720
gccaaggtgt  tcgacttccc  cctgtactac  aagatggacg  cggccttcga  caacaagaac  780
atcccggcgc  tcgtcgaggc  cctgaagaac  ggcggcacgg  tggtctcccg  cgacccgttc  840
aaggccgtga  ccttcgtcgc  caaccacgac  acggacatca  tctggaacaa  gtacccggcg  900
tacgccttca  tcctcaccta  cgagggccag  cccacgatct  tctaccgcga  ctacgaggag  960
tggctgaaca  aggacaagct  caagaacctg  atctggattc  acgacaacct  cgcgggcggc  1020
tccactagta  tcgtgtacta  cgactccgac  gagatgatct  tcgtccgcaa  cggctacggc  1080
tccaagcccg  gcctgatcac  gtacatcaac  ctgggctcct  ccaaggtggg  ccgctgggtg  1140
tacgtcccga  agttcgccgg  cgcgtgcatc  cacgagtaca  ccggcaacct  cggcggctgg  1200
gtggacaagt  acgtgtactc  ctccggctgg  gtctacctgg  aggccccggc  ctacgacccc  1260
gccaacggcc  agtacggcta  ctccgtgtgg  tcctactgcg  gcgtcggc                1308
<210>3
<211>800
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>3
Met Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe Thr Gly Glu
 1               5                  10                  15
Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met Asp Leu Thr
            20                  25                  30
Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala Lys Asp Val
        35                  40                  45
Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala Glu Val Trp
    50                  55                  60
Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro Asp Thr Ser
65                  70                  75                  80
Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val Ile Glu Ala
                85                  90                  95
Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu Phe Lys Val
            100                 105                 110
Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu Lys Ala Asp
        115                 120                 125
Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val Leu Ser Glu
    130                 135                 140
Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu Ile Ile Glu
145                 150                 155                 160
Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu Asp Asp Tyr
                165                 170                 175
Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu Lys Thr Ile
            180                 185                 190
Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val Leu Leu Phe
        195                 200                 205
Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn Met Glu Tyr
    210                 215                 220
Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp Leu Asp Gly
225                 230                 235                 240
Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile Arg Thr Thr
                245                 250                 255
Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln Glu Ser Ala
            260                 265                 270
Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu Asn Asp Arg
        275                 280                 285
Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr Glu Ile His
    290                 295                 300
Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys Asn Lys Gly
305                 310                 315                 320
Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Gly Pro Gly Gly Val
                325                 330                 335
Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr His Val His
            340                 345                 350
Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu Asp Lys Asp
        355                 360                 365
Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu Phe Met Val
    370                 375                 380
Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His Thr Arg Ile
385                 390                 395                 400
Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His Gly Ile Gly
                405                 410                 415
Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile Gly Glu Leu
            420                 425                 430
Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg Ile Asp Lys
        435                 440                 445
Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val Ile Ala Ser
    450                 455                 460
Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val Thr Tyr Trp
465                 470                 475                 480
Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln Met Gly Leu
                485                 490                 495
Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu His Lys Ile
            500                 505                 510
Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly Trp Gly Ala
        515                 520                 525
Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His Val Ala Ala
    530                 535                 540
Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val Phe Asn Pro
545                 550                 555                 560
Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu Thr Lys Ile
                565                 570                 575
Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys Leu Ile Lys
            580                 585                 590
Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala Ala Cys His
        595                 600                 605
Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala Lys Ala Asp
    610                 615                 620
Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala Gln Lys Leu
625                 630                 635                 640
Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe Leu His Gly
                645                 650                 655
Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn Ser Tyr Asn
            660                 665                 670
Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys Leu Gln Phe
        675                 680                 685
Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu Arg Lys Glu
    690                 695                 700
His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys Lys His Leu
705                 710                 715                 720
Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met Leu Lys Asp
                725                 730                 735
His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile Tyr Asn Gly
            740                 745                 750
Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys Trp Asn Val
        755                 760                 765
Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu Thr Val Glu
    770                 775                 780
Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu Tyr Arg Glu
785                 790                 795                 800
<210>4
<211>2400
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>4
atgggccact ggtacaagca ccagcgcgcc taccagttca ccggcgagga cgacttcggg 60
aaggtggccg tggtgaagct cccgatggac ctcaccaagg tgggcatcat cgtgcgcctc 120
aacgagtggc aggcgaagga cgtggccaag gaccgcttca tcgaga caa ggacggcaag 180
gccgaggtgt ggatactcca gggcgtggag gagatcttct acgagaagcc ggacacctcc 240
ccgcgcatct tcttcgccca ggcccgctcc aacaaggtga tcgaggcctt cctcaccaac 300
ccggtggaca ccaagaagaa ggagctgttc aaggtgaccg tcgacggcaa ggagatcccg 360
gtgtcccgcg tggagaaggc cgacccgacc gacatcgacg tgaccaacta cgtgcgcatc 420
gtgctctccg agtccctcaa ggaggaggac ctccgcaagg acgtggagct gatcatcgag 480
ggctacaagc cggcccgcgt gatcatgatg gagatcctcg acgactacta ctacgacggc 540
gagctggggg cggtgtactc cccggagaag accatcttcc gcgtgtggtc cccggtgtcc 600
aagtgggtga aggtgctcct cttcaagaac ggcgaggaca ccgagccgta ccaggtggtg 660
aacatggagt acaagggcaa cggcgtgtgg gaggccgtgg tggagggcga cctcgacggc 720
gtgttctacc tctaccagct ggagaactac ggcaagatcc gcaccaccgt ggacccgtac 780
tccaaggccg tgtacgccaa caaccaggag tctgcagtgg tgaacctcgc ccgcaccaac 840
ccggagggct gggagaacga ccgcggcccg aagatcgagg gctacgagga cgccatcatc 900
tacgagatcc acatcgccga catcaccggc ctggagaact ccggcgtgaa gaacaagggc 960
ctctacctcg gcctcaccga ggagaacacc aaggccccgg gcggcgtgac caccggcctc 1020
tcccacctcg tggagctggg cgtgacccac gtgcacatcc tcccgttctt cgacttctac 1080
accggcgacg agctggacaa ggacttcgag aagtactaca actggggcta cgacccgtac 1140
ctcttcatgg tgccggaggg ccgctactcc accgacccga agaacccgca cacccgaatt 1200
cgcgaggtga aggagatggt gaaggccctc cacaagcacg gcatcggcgt gatcatggac 1260
atggtgttcc cgcacaccta cggcatcggc gagctgtccg ccttcgacca gaccgtgccg 1320
tactacttct accgcatcga caagaccggc gcctacctca acgagtccgg ctgcggcaac 1380
gtgatcgcct ccgagcgccc gatgatgcgc aagttcatcg tggacaccgt gacctactgg 1440
gtgaaggagt accacatcga cggcttccgc ttcgaccaga tgggcctcat cgacaagaag 1500
accatgctgg aggtggagcg cgccctccac aagatcgacc cgaccatcat cctctacggc 1560
gagccgtggg gcggctgggg ggccccgatc cgcttcggca agtccgacgt ggccggcacc 1620
cacgtggccg ccttcaacga cgagttccgc gacgccatcc gcggctccgt gttcaacccg 1680
tccgtgaagg gcttcgtgat gggcggctac ggcaaggaga ccaagatcaa gcgcggcgtg 1740
gtgggctcca tcaactacga cggcaagctc atcaagtcct tcgccctcga cccggaggag 1800
accatcaact acgccgcctg ccacgacaac cacaccctct gggacaagaa ctacctcgcc 1860
gccaaggccg acaagaagaa ggagtggacc gaggaggagc tgaagaacgc ccagaagctc 1920
gccggcgcca tcctcctcac tagtcagggc gtgccgttcc tccacggcgg ccaggacttc 1980
tgccgcacca ccaacttcaa cgacaactcc tacaacgccc cgatctccat caacggcttc 2040
gactacgagc gcaagctcca gttcatcgac gtgttcaact accacaaggg cctcatcaag 2100
ctccgcaagg agcacccggc cttccgcctc aagaacgccg aggagatcaa gaagcacctg 2160
gagttcctcc cgggcgggcg ccgcatcgtg gccttcatgc tcaaggacca cgccggcggc 2220
gacccgtgga aggacatcgt ggtgatctac aacggcaacc tggagaagac cacctacaag 2280
ctcccggagg gcaagtggaa cgtggtggtg aactcccaga aggccggcac cgaggtgatc 2340
gagaccgtgg agggcaccat cgagctggac ccgctctccg cctacgtgct ctaccgcgag 2400
<210>5
<211>693
<212>PRT
<213>硫磺矿硫化叶菌
<400>5
Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr Lys Val Val
 1               5                  10                  15
Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu Gln Lys Ile
            20                  25                  30
Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile Val Gln Gln
        35                  40                  45
Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys Glu His Ile
    50                  55                  60
Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys Arg Lys Arg
65                  70                  75                  80
Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys Tyr Gln Asp
                85                  90                  95
Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys Asp Gly Val
            100                 105                 110
Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile Phe Asp Val
        115                 120                 125
Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro Glu Asp Ser
    130                 135                 140
Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp Val Leu Glu
145                 150                 155                 160
Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro Met Trp Ala
                165                 170                 175
Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln Asp Lys Val
            180                 185                 190
Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg Val Ala Gly
        195                 200                 205
Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu Phe Thr Trp
    210                 215                 220
His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp Glu Leu His
225                 230                 235                 240
Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly Ile Arg Val
                245                 250                 255
Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys Phe Cys Glu
            260                 265                 270
Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro Gly Thr Thr
        275                 280                 285
Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp Trp Ala Gly
    290                 295                 300
Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile Trp Leu Asp
305                 310                 315                 320
Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile Arg Asp Val
                325                 330                 335
Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu Val Thr Thr
            340                 345                 350
Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg Val Lys His
        355                 360                 365
Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met Ala Thr Phe
    370                 375                 380
Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile Leu Ser Arg
385                 390                 395                 400
Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp Thr Gly Asp
                405                 410                 415
Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln Leu Val Leu
            420                 425                 430
Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp Ile Gly Gly
        435                 440                 445
Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met Asp Leu Leu
    450                 455                 460
Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr Arg Ser His
465                 470                 475                 480
Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu Pro Asp Tyr
                485                 490                 495
Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr Lys Phe Leu
            500                 505                 510
Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys Gly His Pro
        515                 520                 525
Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp Asp Met Tyr
    530                 535                 540
Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu Tyr Ala Pro
545                 550                 555                 560
Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro Arg Gly Lys
                565                 570                 575
Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys Ser Val Val
            580                 585                 590
Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly Ser Ile Ile
        595                 600                 605
Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr Ser Phe Lys
    610                 615                 620
Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu Ile Lys Phe
625                 630                 635                 640
Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser Glu Lys Pro
                645                 650                 655
Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln Val Glu Lys
            660                 665                 670
Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys Ile Arg Gly
        675                 680                 685
Lys Ile Asn Leu Glu
    690
<210>6
<211>2082
<212>DNA
<213>硫磺矿硫化叶菌
<400>6
atggagacca  tcaagatcta  cgagaacaag  ggcgtgtaca  aggtggtgat  cggcgagccg  60
ttcccgccga  tcgagttccc  gctcgagcag  aagatctcct  ccaacaagtc  cctctccgag  120
ctgggcctca  ccatcgtgca  gcagggcaac  aaggtgatcg  tggagaagtc  cctcgacctc  180
aaggagcaca  tcatcggcct  cggcgagaag  gccttcgagc  tggaccgcaa  gcgcaagcgc  240
tacgtgatgt  acaacgtgga  cgccggcgcc  tacaagaagt  accaggaccc  gctctacgtg  300
tccatcccgc  tcttcatctc  cgtgaaggac  ggcgtggcca  ccggctactt  cttcaactcc  360
gcctccaagg  tgatcttcga  cgtgggcctc  gaggagtacg  acaaggtgat  cgtgaccatc  420
ccggaggact  ccgtggagtt  ctacgtgatc  gagggcccgc  gcatcgagga  cgtgctcgag  480
aagtacaccg  agctgaccgg  caagccgttc  ctcccgccga  tgtgggcctt  cggctacatg  540
atctcccgct  actcctacta  cccgcaggac  aaggtggtgg  agctggtgga  catcatgcag  600
aaggagggct  tccgcgtggc  cggcgtgttc  ctcgacatcc  actacatgga  ctcctacaag  660
ctcttcacct  ggcacccgta  ccgcttcccg  gagccgaaga  agctcatcga  cgagctgcac  720
aagcgcaacg  tgaagctcat  caccatcgtg  gaccacggca  tccgcgtgga  ccagaactac  780
tccccgttcc  tctccggcat  gggcaagttc  tgcgagatcg  agtccggcga  gctgttcgtg  840
ggcaagatgt  ggccgggcac  caccgtgtac  ccggacttct  tccgcgagga  cacccgcgag  900
tggtgggccg  gcctcatctc  cgagtggctc  tcccagggcg  tggacggcat  ctggctcgac  960
atgaacgagc  cgaccgactt  ctcccgcgcc  atcgagatcc  gcgacgtgct  ctcctccctc  1020
ccggtgcagt  tccgcgacga  ccgcctcgtg  accaccttcc  cggacaacgt  ggtgcactac  1080
ctccgcggca  agcgcgtgaa  gcacgagaag  gtgcgcaacg  cctacccgct  ctacgaggcg  1140
atggccacct  tcaagggctt  ccgcacctcc  caccgcaacg  agatcttcat  cctctcccgc  1200
gccggctacg  ccggcatcca  gcgctacgcc  ttcatctgga  ccggcgacaa  caccccgtcc  1260
tgggacgacc  tcaagctcca  gctccagctc  gtgctcggcc  tctccatctc  cggcgtgccg  1320
ttcgtgggct  gcgacatcgg  cggcttccag  ggccgcaact  tcgccgagat  cgacaactcg  1380
atggacctcc  tcgtgaagta  ctacgccctc  gccctcttct  tcccgttcta  ccgctcccac  1440
aaggccaccg  acggcatcga  caccgagccg  gtgttcctcc  cggactacta  caaggagaag  1500
gtgaaggaga  tcgtggagct  gcgctacaag  ttcctcccgt  acatctactc  cctcgccctc  1560
gaggcctccg  agaagggcca  cccggtgatc  cgcccgctct  tctacgagtt  ccaggacgac  1620
gacgacatgt  accgcatcga  ggacgagtac  atggtgggca  agtacctcct  ctacgccccg  1680
atcgtgtcca  aggaggagtc  ccgcctcgtg  accctcccgc  gcggcaagtg  gtacaactac  1740
tggaacggcg  agatcatcaa  cggcaagtcc  gtggtgaagt  ccacccacga  gctgccgatc  1800
tacctccgcg  agggctccat  catcccgctc  gagggcgacg  agctgatcgt  gtacggcgag  1860
acctccttca  agcgctacga  caacgccgag  atcacctcct  cctccaacga  gatcaagttc  1920
tcccgcgaga  tctacgtgtc  caagctcacc  atcacctccg  agaagccggt  gtccaagatc  1980
atcgtggacg  actccaagga  gatccaggtg  gagaagacca  tgcagaacac  ctacgtggcc  2040
aagatcaacc  agaagatccg  cggcaagatc  aacctcgagt  ga                      2082
<210>7
<211>1818
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>7
atggcggctc  tggccacgtc  gcagctcgtc  gcaacgcgcg  ccggcctggg  cgtcccggac  60
gcgtccacgt  tccgccgcgg  cgccgcgcag  ggcctgaggg  gggcccgggc  gtcggcggcg  120
gcggacacgc  tcagcatgcg  gaccagcgcg  cgcgcggcgc  ccaggcacca  gcaccagcag  180
gcgcgccgcg  gggccaggtt  cccgtcgctc  gtcgtgtgcg  ccagcgccgg  catgaacgtc  240
gtcttcgtcg  gcgccgagat  ggcgccgtgg  agcaagaccg  gaggcctcgg  cgacgtcctc  300
ggcggcctgc  cgccggccat  ggccgcgaac  gggcaccgtg  tcatggtcgt  ctctccccgc  360
tacgaccagt  acaaggacgc  ctgggacacc  agcgtcgtgt  ccgagatcaa  gatgggagac  420
gggtacgaga  cggtcaggtt  cttccactgc  tacaagcgcg  gagtggaccg  cgtgttcgtt  480
gaccacccac  tgttcctgga  gagggtttgg  ggaaagaccg  aggagaagat  ctacgggcct  540
gtcgctggaa  cggactacag  ggacaaccag  ctgcggttca  gcctgctatg  ccaggcagca  600
cttgaagctc  caaggatcct  gagcctcaac  aacaacccat  acttctccgg  accatacggg  660
gaggacgtcg  tgttcgtctg  caacgactgg  cacaccggcc  ctctctcgtg  ctacctcaag  720
agcaactacc  agtcccacgg  catctacagg  gacgcaaaga  ccgctttctg  catccacaac  780
atctcctacc  agggccggtt  cgccttctcc  gactacccgg  agctgaacct  ccccgagaga  840
ttcaagtcgt  ccttcgattt  catcgacggc  tacgagaagc  ccgtggaagg  ccggaagatc  900
aactggatga  aggccgggat  cctcgaggcc  gacagggtcc  tcaccgtcag  cccctactac  960
gccgaggagc  tcatctccgg  catcgccagg  ggctgcgagc  tcgacaacat  catgcgcctc  1020
accggcatca  ccggcatcgt  caacggcatg  gacgtcagcg  agtgggaccc  cagcagggac  1080
aagtacatcg  ccgtgaagta  cgacgtgtcg  acggccgtgg  aggccaaggc  gctgaacaag  1140
gaggcgctgc  aggcggaggt  cgggctcccg  gtggaccgga  acatcccgct  ggtggcgttc  1200
atcggcaggc  tggaagagca  gaagggcccc  gacgtcatgg  cggccgccat  cccgcagctc  1260
atggagatgg  tggaggacgt  gcagatcgtt  ctgctgggca  cgggcaagaa  gaagttcgag  1320
cgcatgctca  tgagcgccga  ggagaagttc  ccaggcaagg  tgcgcgccgt  ggtcaagttc  1380
aacgcggcgc  tggcgcacca  catcatggcc  ggcgccgacg  tgctcgccgt  caccagccgc  1440
ttcgagccct  gcggcctcat  ccagctgcag  gggatgcgat  acggaacgcc  ctgcgcctgc  1500
gcgtccaccg  gtggactcgt  cgacaccatc  atcgaaggca  agaccgggtt  ccacatgggc  1560
cgcctcagcg  tcgactgcaa  cgtcgtggag  ccggcggacg  tcaagaaggt  ggccaccacc  1620
ttgcagcgcg  ccatcaaggt  ggtcggcacg  ccggcgtacg  aggagatggt  gaggaactgc  1680
atgatccagg  atctctcctg  gaagggccct  gccaagaact  gggagaacgt  gctgctcagc  1740
ctcggggtcg  ccggcggcga  gccaggggtt  gaaggcgagg  agatcgcgcc  gctcgccaag  1800
gagaacgtgg  ccgcgccc                                                    1818
<210>8
<211>606
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>8
Met Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly Leu
 1               5                  10                  15
Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly Leu
            20                  25                  30
Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg Thr
        35                  40                  45
Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg Gly
    50                  55                  60
Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Met Asn Val
65                  70                  75                  80
Val Phe Val Gly Ala Glu Met Ala Pro Trp Ser Lys Thr Gly Gly Leu
                85                  90                  95
Gly Asp Val Leu Gly Gly Leu Pro Pro Ala Met Ala Ala Asn Gly His
            100                 105                 110
Arg Val Met Val Val Ser Pro Arg Tyr Asp Gln Tyr Lys Asp Ala Trp
        115                 120                 125
Asp Thr Ser Val Val Ser Glu Ile Lys Met Gly Asp Gly Tyr Glu Thr
    130                 135                 140
Val Arg Phe Phe His Cys Tyr Lys Arg Gly Val Asp Arg Val Phe Val
145                 150                 155                 160
Asp His Pro Leu Phe Leu Glu Arg Val Trp Gly Lys Thr Glu Glu Lys
                165                 170                 175
Ile Tyr Gly Pro Val Ala Gly Thr Asp Tyr Arg Asp Asn Gln Leu Arg
            180                 185                 190
Phe Ser Leu Leu Cys Gln Ala Ala Leu Glu Ala Pro Arg Ile Leu Ser
        195                 200                 205
Leu Asn Asn Asn Pro Tyr Phe Ser Gly Pro Tyr Gly Glu Asp Val Val
    210                 215                 220
Phe Val Cys Asn Asp Trp His Thr Gly Pro Leu Ser Cys Tyr Leu Lys
225                 230                 235                 240
Ser Asn Tyr Gln Ser His Gly Ile Tyr Arg Asp Ala Lys Thr Ala Phe
                245                 250                 255
Cys Ile His Asn Ile Ser Tyr Gln Gly Arg Phe Ala Phe Ser Asp Tyr
            260                 265                 270
Pro Glu Leu Asn Leu Pro Glu Arg Phe Lys Ser Ser Phe Asp Phe Ile
        275                 280                 285
Asp Gly Tyr Glu Lys Pro Val Glu Gly Arg Lys Ile Asn Trp Met Lys
    290                 295                 300
Ala Gly Ile Leu Glu Ala Asp Arg Val Leu Thr Val Ser Pro Tyr Tyr
305                 310                 315                 320
Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg Gly Cys Glu Leu Asp Asn
                325                 330                 335
Ile Met Arg Leu Thr Gly Ile Thr Gly Ile Val Asn Gly Met Asp Val
            340                 345                 350
Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr Ile Ala Val Lys Tyr Asp
        355                 360                 365
Val Ser Thr Ala Val Glu Ala Lys Ala Leu Asn Lys Glu Ala Leu Gln
    370                 375                 380
Ala Glu Val Gly Leu Pro Val Asp Arg Asn Ile Pro Leu Val Ala Phe
385                 390                 395                 400
Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro Asp Val Met Ala Ala Ala
                405                 410                 415
Ile Pro Gln Leu Met Glu Met Val Glu Asp Val Gln Ile Val Leu Leu
            420                 425                 430
Gly Thr Gly Lys Lys Lys Phe Glu Arg Met Leu Met Ser Ala Glu Glu
        435                 440                 445
Lys Phe Pro Gly Lys Val Arg Ala Val Val Lys Phe Asn Ala Ala Leu
    450                 455                 460
Ala His His Ile Met Ala Gly Ala Asp Val Leu Ala Val Thr Ser Arg
465                 470                 475                 480
Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln Gly Met Arg Tyr Gly Thr
                485                 490                 495
Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu Val Asp Thr Ile Ile Glu
            500                 505                 510
Gly Lys Thr Gly Phe His Met Gly Arg Leu Ser Val Asp Cys Asn Val
        515                 520                 525
Val Glu Pro Ala Asp Val Lys Lys Val Ala Thr Thr Leu Gln Arg Ala
    530                 535                 540
Ile Lys Val Val Gly Thr Pro Ala Tyr Glu Glu Met Val Arg Asn Cys
545                 550                 555                 560
Met Ile Gln Asp Leu Ser Trp Lys Gly Pro Ala Lys Asn Trp Glu Asn
                565                 570                 575
Val Leu Leu Ser Leu Gly Val Ala Gly Gly Glu Pro Gly Val Glu Gly
            580                 585                 590
Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn Val Ala Ala Pro
        595                 600                 605
<210>9
<211>2223
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>9
atggccaagt  acctggagct  ggaggagggc  ggcgtgatca  tgcaggcgtt  ctactgggac  60
gtcccgagcg  gaggcatctg  gtgggacacc  atccgccaga  agatccccga  gtggtacgac  120
gccggcatct  ccgcgatctg  gataccgcca  gcttccaagg  gcatgtccgg  gggctactcg  180
atgggctacg  acccgtacga  ctacttcgac  ctcggcgagt  actaccagaa  gggcacggtg  240
gagacgcgct  tcgggtccaa  gcaggagctc  atcaacatga  tcaacacggc  gcacgcctac  300
ggcatcaagg  tcatcgcgga  catcgtgatc  aaccacaggg  ccggcggcga  cctggagtgg  360
aacccgttcg  tcggcgacta  cacctggacg  gacttctcca  aggtcgcctc  cggcaagtac  420
accgccaact  acctcgactt  ccaccccaac  gagctgcacg  cgggcgactc  cggcacgttc  480
ggcggctacc  cggacatctg  ccacgacaag  tcctgggacc  agtactggct  ctgggcctcg  540
caggagtcct  acgcggccta  cctgcgctcc  atcggcatcg  acgcgtggcg  cttcgactac  600
gtcaagggct  acggggcctg  ggtggtcaag  gactggctca  actggtgggg  cggctgggcg  660
gtgggcgagt  actgggacac  caacgtcgac  gcgctgctca  actgggccta  ctcctccggc  720
gccaaggtgt  tcgacttccc  cctgtactac  aagatggacg  cggccttcga  caacaagaac  780
atcccggcgc  tcgtcgaggc  cctgaagaac  ggcggcacgg  tggtctcccg  cgacccgttc  840
aaggccgtga  ccttcgtcgc  caaccacgac  acggacatca  tctggaacaa  gtacccggcg  900
tacgccttca  tcctcaccta  cgagggccag  cccacgatct  tctaccgcga  ctacgaggag  960
tggctgaaca  aggacaagct  caagaacctg  atctggattc  acgacaacct  cgcgggcggc  1020
tccactagta  tcgtgtacta  cgactccgac  gagatgatct  tcgtccgcaa  cggctacggc  1080
tccaagcccg  gcctgatcac  gtacatcaac  ctgggctcct  ccaaggtggg  ccgctgggtg  1140
tacgtcccga  agttcgccgg  cgcgtgcatc  cacgagtaca  ccggcaacct  cggcggctgg  1200
gtggacaagt  acgtgtactc  ctccggctgg  gtctacctgg  aggccccggc  ctacgacccc  1260
gccaacggcc  agtacggcta  ctccgtgtgg  tcctactgcg  gcgtcggcac  atcgattgct  1320
ggcatcctcg  aggccgacag  ggtcctcacc  gtcagcccct  actacgccga  ggagctcatc  1380
tccggcatcg  ccaggggctg  cgagctcgac  aacatcatgc  gcctcaccgg  catcaccggc  1440
atcgtcaacg  gcatggacgt  cagcgagtgg  gaccccagca  gggacaagta  catcgccgtg  1500
aagtacgacg  tgtcgacggc  cgtggaggcc  aaggcgctga  acaaggaggc  gctgcaggcg  1560
gaggtcgggc  tcccggtgga  ccggaacatc  ccgctggtgg  cgttcatcgg  caggctggaa  1620
gagcagaagg  gccccgacgt  catggcggcc  gccatcccgc  agctcatgga  gatggtggag  1680
gacgtgcaga  tcgttctgct  gggcacgggc  aagaagaagt  tcgagcgcat  gctcatgagc  1740
gccgaggaga  agttcccagg  caaggtgcgc  gccgtggtca  agttcaacgc  ggcgctggcg  1800
caccacatca  tggccggcgc  cgacgtgctc  gccgtcacca  gccgcttcga  gccctgcggc  1860
ctcatccagc  tgcaggggat  gcgatacgga  acgccctgcg  cctgcgcgtc  caccggtgga  1920
ctcgtcgaca  ccatcatcga  aggcaagacc  gggttccaca  tgggccgcct  cagcgtcgac  1980
tgcaacgtcg  tggagccggc  ggacgtcaag  aaggtggcca  ccaccttgca  gcgcgccatc  2040
aaggtggtcg  gcacgccggc  gtacgaggag  atggtgagga  actgcatgat  ccaggatctc  2100
tcctggaagg  gccctgccaa  gaactgggag  aacgtgctgc  tcagcctcgg  ggtcgccggc  2160
ggcgagccag  gggttgaagg  cgaggagatc  gcgccgctcg  ccaaggagaa  cgtggccgcg  2220
ccc                                                                     2223
<210>10
<211>741
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>10
Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala
 1               5                  10                  15
Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg
            20                  25                  30
Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile
        35                  40                  45
Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp
    50                  55                  60
Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val
65                  70                  75                  80
Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr
                85                  90                  95
Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His
            100                 105                 110
Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr
        115                 120                 125
Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr
    130                 135                 140
Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe
145                 150                 155                 160
Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp
                165                 170                 175
Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly
            180                 185                 190
Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val
        195                 200                 205
Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr
    210                 215                 220
Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly
225                 230                 235                 240
Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe
                245                 250                 255
Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly
            260                 265                 270
Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn
        275                 280                 285
His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile
    290                 295                 300
Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu
305                 310                 315                 320
Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn
                325                 330                 335
Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met
            340                 345                 350
Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr
        355                 360                 365
Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys
    370                 375                 380
Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp
385                 390                 395                 400
Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro
                405                 410                 415
Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr
            420                 425                 430
Cys Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val
        435                 440                 445
Leu Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala
    450                 455                 460
Arg Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly
465                 470                 475                 480
Ile Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys
                485                 490                 495
Tyr Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala
            500                 505                 510
Leu Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg
        515                 520                 525
Asn Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly
    530                 535                 540
Pro Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu
545                 550                 555                 560
Asp Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg
                565                 570                 575
Met Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val
            580                 585                 590
Val Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp
        595                 600                 605
Val Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu
    610                 615                 620
Gln Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly
625                 630                 635                 640
Leu Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg
                645                 650                 655
Leu Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val
            660                 665                 670
Ala Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr
        675                 680                 685
Glu Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly
    690                 695                 700
Pro Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly
705                 710                 715                 720
Gly Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu
                725                 730                 735
Asn Val Ala Ala Pro
            740
<210>11
<211>1515
<212>DNA
<213>玉蜀黍
<400>11
ggagagctat  gagacgtatg  tcctcaaagc  cactttgcat  tgtgtgaaac  caatatcgat  60
ctttgttact  tcatcatgca  tgaacatttg  tggaaactac  tagcttacaa  gcattagtga  120
cagctcagaa  aaaagttatc  tatgaaaggt  ttcatgtgta  ccgtgggaaa  tgagaaatgt  180
tgccaactca  aacaccttca  atatgttgtt  tgcaggcaaa  ctcttctgga  agaaaggtgt  240
ctaaaactat  gaacgggtta  cagaaaggta  taaaccacgg  ctgtgcattt  tggaagtatc  300
atctatagat  gtctgttgag  gggaaagccg  tacgccaacg  ttatttactc  agaaacagct  360
tcaacacaca  gttgtctgct  ttatgatggc  atctccaccc  aggcacccac  catcacctat  420
ctctcgtgcc  tgtttatttt  cttgcccttt  ctgatcataa  aaaaacatta  agagtttgca  480
aacatgcata  ggcatatcaa  tatgctcatt  tattaatttg  ctagcagatc  atcttcctac  540
tctttacttt  atttattgtt  tgaaaaatat  gtcctgcacc  tagggagctc  gtatacagta  600
ccaatgcatc  ttcattaaat  gtgaatttca  gaaaggaagt  aggaacctat  gagagtattt  660
ttcaaaatta  attagcggct  tctattatgt  ttatagcaaa  ggccaagggc  aaaattggaa  720
cactaatgat  ggttggttgc  atgagtctgt  cgattacttg  caagaaatgt  gaacctttgt  780
ttctgtgcgt  gggcataaaa  caaacagctt  ctagcctctt  ttacggtact  tgcacttgca  840
agaaatgtga  actccttttc  atttctgtat  gtggacataa  tgccaaagca  tccaggcttt  900
ttcatggttg  ttgatgtctt  tacacagttc  atctccacca  gtatgccctc  ctcatactct  960
atataaacac  atcaacagca  tcgcaattag  ccacaagatc  acttcgggag  gcaagtgcga  1020
tttcgatctc  gcagccacct  ttttttgttc  tgttgtaagt  ataccttccc  ttaccatctt  1080
tatctgttag  tttaatttgt  aattgggaag  tattagtgga  aagaggatga  gatgctatca  1140
tctatgtact  ctgcaaatgc  atctgacgtt  atatgggctg  cttcatataa  tttgaattgc  1200
tccattcttg  ccgacaatat  attgcaaggt  atatgcctag  ttccatcaaa  agttctgttt  1260
tttcattcta  aaagcatttt  agtggcacac  aatttttgtc  catgagggaa  aggaaatctg  1320
ttttggttac  tttgcttgag  gtgcattctt  catatgtcca  gttttatgga  agtaataaac  1380
ttcagtttgg  tcataagatg  tcatattaaa  gggcaaacat  atattcaatg  ttcaattcat  1440
cgtaaatgtt  ccctttttgt  aaaagattgc  atactcattt  atttgagttg  caggtgtatc  1500
tagtagttgg  aggag                                                       1515
<210>12
<211>673
<212>DNA
<213>玉蜀黍
<400>12
gatcatccag  gtgcaaccgt  ataagtccta  aagtggtgag  gaacacgaaa  caaccatgca  60
ttggcatgta  aagctccaag  aatttgttgt  atccttaaca  actcacagaa  catcaaccaa  120
aattgcacgt  caagggtatt  gggtaagaaa  caatcaaaca  aatcctctct  gtgtgcaaag  180
aaacacggtg  agtcatgccg  agatcatact  catctgatat  acatgcttac  agctcacaag  240
acattacaaa  caactcatat  tgcattacaa  agatcgtttc  atgaaaaata  aaataggccg  300
gacaggacaa  aaatccttga  cgtgtaaagt  aaatttacaa  caaaaaaaaa  gccatatgtc  360
aagctaaatc  taattcgttt  tacgtagatc  aacaacctgt  agaaggcaac  aaaactgagc  420
cacgcagaag  tacagaatga  ttccagatga  accatcgacg  tgctacgtaa  agagagtgac  480
gagtcatata  catttggcaa  gaaaccatga  agctgcctac  agccgtctcg  gtggcataag  540
aacacaagaa  attgtgttaa  ttaatcaaag  ctataaataa  cgctcgcatg  cctgtgcact  600
tctccatcac  caccactggg  tcttcagacc  attagcttta  tctactccag  agcgcagaag  660
aacccgatcg  aca                                                         673
<210>13
<211>454
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>13
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly
    450
<210>14
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>14
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>15
<211>518
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>15
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
 1               5                  10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met
65                  70                  75                  80
Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe
                85                  90                  95
Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln
            100                 105                 110
Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro
        115                 120                 125
Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro
    130                 135                 140
Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu
145                 150                 155                 160
Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala
                165                 170                 175
His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg
            180                 185                 190
Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp
        195                 200                 205
Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu
    210                 215                 220
Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly
225                 230                 235                 240
Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu
                245                 250                 255
Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile
            260                 265                 270
Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val
        275                 280                 285
Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp
    290                 295                 300
Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala
305                 310                 315                 320
Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp
                325                 330                 335
Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr
            340                 345                 350
Val Val Ser Arg Asp Pro Phe LVs Ala Val Thr Phe Val Ala Asn His
        355                 360                 365
Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu
    370                 375                 380
Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp
385                 390                 395                 400
Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu
                405                 410                 415
Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile
            420                 425                 430
Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile
        435                 440                 445
Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe
    450                 455                 460
Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val
465                 470                 475                 480
Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala
                485                 490                 495
Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys
            500                 505                 510
Gly Val Gly Thr Ser Ile
        515
<210>16
<211>820
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>16
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
 1               5                  10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met
65                  70                  75                  80
Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe
                85                  90                  95
Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln
            100                 105                 110
Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro
        115                 120                 125
Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro
    130                 135                 140
Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu
145                 150                 155                 160
Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala
                165                 170                 175
His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg
            180                 185                 190
Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp
        195                 200                 205
Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu
    210                 215                 220
Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly
225                 230                 235                 240
Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu
                245                 250                 255
Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile
            260                 265                 270
Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val
         275                 280                 285
Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp
    290                 295                 300
Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala
305                 310                 315                 320
Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp
                325                 330                 335
Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr
            340                 345                 350
Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His
        355                 360                 365
Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu
    370                 375                 380
Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp
385                 390                 395                 400
Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu
                405                 410                 415
Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile
            420                 425                 430
Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile
        435                 440                 445
Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe
    450                 455                 460
Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val
465                 470                 475                 480
Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala
                485                 490                 495
Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys
            500                 505                 510
Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val Leu
        515                 520                 525
Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg
    530                 535                 540
Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly Ile
545                 550                 555                 560
Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr
                565                 570                 575
Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala LVs Ala Leu
            580                 585                 590
Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg Asn
        595                 600                 605
Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro
    610                 615                 620
Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu Asp
625                 630                 635                 640
Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg Met
                645                 650                 655
Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val Val
            660                 665                 670
Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp Val
        675                 680                 685
Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln
    690                 695                 700
Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu
705                 710                 715                 720
Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg Leu
                725                 730                 735
Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val Ala
            740                 745                 750
Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr Glu
        755                 760                 765
Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly Pro
    770                 775                 780
Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly Gly
785                 790                 795                 800
Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn
                805                 810                 815
Val Ala Ala Pro
            820
<210>17
<211>19
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>17
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser
<210>18
<211>444
<212>PRT
<213>海栖热袍菌
<400>18
Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys
 1               5                  10                  15
Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val
            20                  25                  30
Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe
        35                  40                  45
Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr
    50                  55                  60
Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe
65                  70                  75                  80
Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu
                85                  90                  95
Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu
            100                 105                 110
Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu
        115                 120                 125
Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu
    130                 135                 140
Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala
145                 150                 155                 160
Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile
                165                 170                 175
Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu
            180                 185                 190
Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn
        195                 200                 205
Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly
    210                 215                 220
Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys
225                 230                 235                 240
His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn
                245                 250                 255
His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala
            260                 265                 270
Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile
        275                 280                 285
Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu
    290                 295                 300
Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu
305                 310                 315                 320
Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu
                325                 330                 335
Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu
            340                 345                 350
Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys
        355                 360                 365
Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu
    370                 375                 380
Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu
385                 390                 395                 400
Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu
                405                 410                 415
Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu
            420                 425                 430
Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg
        435                 440
<210>19
<211>1335
<212>DNA
<213>海栖热袍菌
<400>19
atggccgagt  tcttcccgga  gatcccgaag  atccagttcg  agggcaagga  gtccaccaac  60
ccgctcgcct  tccgcttcta  cgacccgaac  gaggtgatcg  acggcaagcc  gctcaaggac  120
cacctcaagt  tctccgtggc  cttctggcac  accttcgtga  acgagggccg  cgacccgttc  180
ggcgacccga  ccgccgagcg  cccgtggaac  cgcttctccg  acccgatgga  caaggccttc  240
gcccgcgtgg  acgccctctt  cgagttctgc  gagaagctca  acatcgagta  cttctgcttc  300
cacgaccgcg  acatcgcccc  ggagggcaag  accctccgcg  agaccaacaa  gatcctcgac  360
aaggtggtgg  agcgcatcaa  ggagcgcatg  aaggactcca  acgtgaagct  cctctggggc  420
accgccaacc  tcttctccca  cccgcgctac  atgcacggcg  ccgccaccac  ctgctccgcc  480
gacgtgttcg  cctacgccgc  cgcccaggtg  aagaaggccc  tggagatcac  caaggagctg  540
ggcggcgagg  gctacgtgtt  ctggggcggc  cgcgagggct  acgagaccct  cctcaacacc  600
gacctcggcc  tggagctgga  gaacctcgcc  cgcttcctcc  gcatggccgt  ggagtacgcc  660
aagaagatcg  gcttcaccgg  ccagttcctc  atcgagccga  agccgaagga  gccgaccaag  720
caccagtacg  acttcgacgt  ggccaccgcc  tacgccttcc  tcaagaacca  cggcctcgac  780
gagtacttca  agttcaacat  cgaggccaac  cacgccaccc  tcgccggcca  caccttccag  840
cacgagctgc  gcatggcccg  catcctcggc  aagctcggct  ccatcgacgc  caaccagggc  900
gacctcctcc  tcggctggga  caccgaccag  ttcccgacca  acatctacga  caccaccctc  960
gccatgtacg  aggtgatcaa  ggccggcggc  ttcaccaagg  gcggcctcaa  cttcgacgcc  1020
aaggtgcgcc  gcgcctccta  caaggtggag  gacctcttca  tcggccacat  cgccggcatg  1080
gacaccttcg  ccctcggctt  caagatcgcc  tacaagctcg  ccaaggacgg  cgtgttcgac  1140
aagttcatcg  aggagaagta  ccgctccttc  aaggagggca  tcggcaagga  gatcgtggag  1200
ggcaagaccg  acttcgagaa  gctggaggag  tacatcatcg  acaaggagga  catcgagctg  1260
ccgtccggca  agcaggagta  cctggagtcc  ctcctcaact  cctacatcgt  gaagaccatc  1320
gccgagctgc gctga                                                        1335
<210>20
<211>444
<212>PRT
<213>那不勒斯栖热袍菌
<400>20
Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys
 1               5                  10                  15
Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile
            20                  25                  30
Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe
        35                  40                  45
Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr
    50                  55                  60
Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe
65                  70                  75                  80
Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu
                85                  90                  95
Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu
            100                 105                 110
Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu
        115                 120                 125
Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu
    130                 135                 140
Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala
145                 150                 155                 160
Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile
                165                 170                 175
Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu
            180                 185                 190
Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn
        195                 200                 205
Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly
    210                 215                 220
Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys
225                 230                 235                 240
His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser
                245                 250                 255
His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala
            260                 265                 270
Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile
        275                 280                 285
Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu
    290                 295                 300
Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu
305                 310                 315                 320
Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu
                325                 330                 335
Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu
            340                 345                 350
Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys
        355                 360                 365
Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu
    370                 375                 380
Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu
385                 390                 395                 400
Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu
                405                 410                 415
Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile
            420                 425                 430
Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
        435                 440
<210>21
<211>1335
<212>DNA
<213>那不勒斯栖热袍菌
<400>21
atggccgagt  tcttcccgga  gatcccgaag  gtgcagttcg  agggcaagga  gtccaccaac  60
ccgctcgcct  tcaagttcta  cgacccggag  gagatcatcg  acggcaagcc  gctcaaggac  120
cacctcaagt  tctccgtggc  cttctggcac  accttcgtga  acgagggccg  cgacccgttc  180
ggcgacccga  ccgccgaccg  cccgtggaac  cgctacaccg  acccgatgga  caaggccttc  240
gcccgcgtgg  acgccctctt  cgagttctgc  gagaagctca  acatcgagta  cttctgcttc  300
cacgaccgcg  acatcgcccc  ggagggcaag  accctccgcg  agaccaacaa  gatcctcgac  360
aaggtggtgg  agcgcatcaa  ggagcgcatg  aaggactcca  acgtgaagct  cctctggggc  420
accgccaacc  tcttctccca  cccgcgctac  atgcacggcg  ccgccaccac  ctgctccgcc  480
gacgtgttcg  cctacgccgc  cgcccaggtg  aagaaggccc  tggagatcac  caaggagctg  540
ggcggcgagg  gctacgtgtt  ctggggcggc  cgcgagggct  acgagaccct  cctcaacacc  600
gacctcggct  tcgagctgga  gaacctcgcc  cgcttcctcc  gcatggccgt  ggactacgcc  660
aagcgcatcg  gcttcaccgg  ccagttcctc  atcgagccga  agccgaagga  gccgaccaag  720
caccagtacg  acttcgacgt  ggccaccgcc  tacgccttcc  tcaagtccca  cggcctcgac  780
gagtacttca  agttcaacat  cgaggccaac  cacgccaccc  tcgccggcca  caccttccag  840
cacgagctgc  gcatggcccg  catcctcggc  aagctcggct  ccatcgacgc  caaccagggc  900
gacctcctcc  tcggctggga  caccgaccag  ttcccgacca  acgtgtacga  caccaccctc  960
gccatgtacg  aggtgatcaa  ggccggcggc  ttcaccaagg  gcggcctcaa  cttcgacgcc  1020
aaggtgcgcc  gcgcctccta  caaggtggag  gacctcttca  tcggccacat  cgccggcatg  1080
gacaccttcg  ccctcggctt  caaggtggcc  tacaagctcg  tgaaggacgg  cgtgctcgac  1140
aagttcatcg  aggagaagta  ccgctccttc  cgcgagggca  tcggccgcga  catcgtggag  1200
ggcaaggtgg  acttcgagaa  gctggaggag  tacatcatcg  acaaggagac  catcgagctg  1260
ccgtccggca  agcaggagta  cctggagtcc  ctcatcaact  cctacatcgt  gaagaccatc  1320
ctggagctgc  gctga                                                       1335
<210>22
<211>28
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>22
agcgaattca  tggcggctct  ggccacgt                                         28
<210>23
<211>29
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>23
agctaagctt  cagggcgcgg  ccacgttct                                        29
<210>24
<211>825
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>24
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe
            20                  25                  30
Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met
        35                  40                  45
Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala
    50                  55                  60
Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala
65                  70                  75                  80
Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro
                85                  90                  95
Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val
            100                 105                 110
Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu
        115                 120                 125
Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu
    130                 135                 140
Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val
145                 150                 155                 160
Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu
                165                 170                 175
Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu
            180                 185                 190
Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu
        195                 200                 205
Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val
    210                 215                 220
Leu Leu Phe LVs Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn
225                 230                 235                 240
Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp
                245                 250                 255
Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile
            260                 265                 270
Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln
        275                 280                 285
Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu
    290                 295                 300
Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr
305                 310                 315                 320
Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys
                325                 330                 335
Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro
            340                 345                 350
Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr
        355                 360                 365
His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu
    370                 375                 380
Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu
385                 390                 395                 400
Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His
                405                 410                 415
Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His
            420                 425                 430
Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile
        435                 440                 445
Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg
    450                 455                 460
Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val
465                 470                 475                 480
Ile Ala Ser Glu Arg Pro Met Met Arg LVs Phe Ile Val Asp Thr Val
                485                 490                 495
Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln
            500                 505                 510
Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu
        515                 520                 525
His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly
    530                 535                 540
Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His
545                 550                 555                 560
Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val
                565                 570                 575
Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu
            580                 585                 590
Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys
        595                 600                 605
Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala
    610                 615                 620
Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala
625                 630                 635                 640
Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala
                645                 650                 655
Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe
            660                 665                 670
Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn
        675                 680                 685
Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys
    690                 695                 700
Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu
705                 710                 715                 720
Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys
                725                 730                 735
Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met
            740                 745                 750
Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile
        755                 760                 765
Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys
    770                 775                 780
Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu
785                 790                 795                 800
Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu
                805                 810                 815
Tyr Arg Glu Ser Glu Lys Asp Glu Leu
            820                 825
<210>25
<211>2478
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>25
atgagggtgt  tgctcgttgc  cctcgctctc  ctggctctcg  ctgcgagcgc  caccagcgct  60
ggccactggt  acaagcacca  gcgcgcctac  cagttcaccg  gcgaggacga  cttcgggaag  120
gtggccgtgg  tgaagctccc  gatggacctc  accaaggtgg  gcatcatcgt  gcgcctcaac  180
gagtggcagg  cgaaggacgt  ggccaaggac  cgcttcatcg  agatcaagga  cggcaaggcc  240
gaggtgtgga  tactccaggg  cgtggaggag  atcttctacg  agaagccgga  cacctccccg  300
cgcatcttct  tcgcccaggc  ccgctccaac  aaggtgatcg  aggccttcct  caccaacccg  360
gtggacacca  agaagaagga  gctgttcaag  gtgaccgtcg  acggcaagga  gatcccggtg  420
tcccgcgtgg  agaaggccga  cccgaccgac  atcgacgtga  ccaactacgt  gcgcatcgtg  480
ctctccgagt  ccctcaagga  ggaggacctc  cgcaaggacg  tggagctgat  catcgagggc  540
tacaagccgg  cccgcgtgat  catgatggag  atcctcgacg  actactacta  cgacggcgag  600
ctgggggcgg  tgtactcccc  ggagaagacc  atcttccgcg  tgtggtcccc  ggtgtccaag  660
tgggtgaagg  tgctcctctt  caagaacggc  gaggacaccg  agccgtacca  ggtggtgaac  720
atggagtaca  agggcaacgg  cgtgtgggag  gccgtggtgg  agggcgacct  cgacggcgtg  780
ttctacctct  accagctgga  gaactacggc  aagatccgca  ccaccgtgga  cccgtactcc  840
aaggccgtgt  acgccaacaa  ccaggagtct  gcagtggtga  acctcgcccg  caccaacccg  900
gagggctggg  agaacgaccg  cggcccgaag  atcgagggct  acgaggacgc  catcatctac  960
gagatccaca  tcgccgacat  caccggcctg  gagaactccg  gcgtgaagaa  caagggcctc  1020
tacctcggcc  tcaccgagga  gaacaccaag  gccccgggcg  gcgtgaccac  cggcctctcc  1080
cacctcgtgg  agctgggcgt  gacccacgtg  cacatcctcc  cgttcttcga  cttctacacc  1140
ggcgacgagc  tggacaagga  cttcgagaag  tactacaact  ggggctacga  cccgtacctc  1200
ttcatggtgc  cggagggccg  ctactccacc  gacccgaaga  acccgcacac  ccgaattcgc  1260
gaggtgaagg  agatggtgaa  ggccctccac  aagcacggca  tcggcgtgat  catggacatg  1320
gtgttcccgc  acacctacgg  catcggcgag  ctgtccgcct  tcgaccagac  cgtgccgtac  1380
tacttctacc  gcatcgacaa  gaccggcgcc  tacctcaacg  agtccggctg  cggcaacgtg  1440
atcgcctccg  agcgcccgat  gatgcgcaag  ttcatcgtgg  acaccgtgac  ctactgggtg  1500
aaggagtacc  acatcgacgg  cttccgcttc  gaccagatgg  gcctcatcga  caagaagacc  1560
atgctggagg  tggagcgcgc  cctccacaag  atcgacccga  ccatcatcct  ctacggcgag  1620
ccgtggggcg  gctggggggc  cccgatccgc  ttcggcaagt  ccgacgtggc  cggcacccac  1680
gtggccgcct  tcaacgacga  gttccgcgac  gccatccgcg  gctccgtgtt  caacccgtcc  1740
gtgaagggct  tcgtgatggg  cggctacggc  aaggagacca  agatcaagcg  cggcgtggtg  1800
ggctccatca  actacgacgg  caagctcatc  aagtccttcg  ccctcgaccc  ggaggagacc  1860
atcaactacg  ccgcctgcca  cgacaaccac  accctctggg  acaagaacta  cctcgccgcc  1920
aaggccgaca  agaagaagga  gtggaccgag  gaggagctga  agaacgccca  gaagctcgcc  1980
ggcgccatcc  tcctcactag  tcagggcgtg  ccgttcctcc  acggcggcca  ggacttctgc  2040
cgcaccacca  acttcaacga  caactcctac  aacgccccga  tctccatcaa  cggcttcgac  2100
tacgagcgca  agctccagtt  catcgacgtg  ttcaactacc  acaagggcct  catcaagctc  2160
cgcaaggagc  acccggcctt  ccgcctcaag  aacgccgagg  agatcaagaa  gcacctggag  2220
ttcctcccgg  gcgggcgccg  catcgtggcc  ttcatgctca  aggaccacgc  cggcggcgac  2280
ccgtggaagg  acatcgtggt  gatctacaac  ggcaacctgg  agaagaccac  ctacaagctc  2340
ccggagggca  agtggaacgt  ggtggtgaac  tcccagaagg  ccggcaccga  ggtgatcgag  2400
accgtggagg  gcaccatcga  gctggacccg  ctctccgcct  acgtgctcta  ccgcgagtcc  2460
gagaaggacg  agctgtga                                                    2478
<210>26
<211>718
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>26
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr
            20                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                  80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145                 150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                 175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr MetAsp Ser Tyr Lys  Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                 270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                 335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
        595                 600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660                 665                 670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu
705                 710                 715
<210>27
<211>712
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>27
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr
            20                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu  Phe ProLeu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                  80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145                 150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                 175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                 270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                 335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
        595                 600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660                 665                 670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu
705                 710
<210>28
<211>469
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>28
Met Arg Val  Leu  Leu Val  Ala  Leu Ala  Leu Leu Ala  Leu Ala  Ala  Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro
        35                  40                  45
Asn Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
65                  70                  75                  80
Asp Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                 110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg AspIle Ala  Pro Glu Gly
        115                 120                 125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys
225                 230                 235                 240
Lys Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu
                245                 250                 255
Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe
            260                 265                 270
Leu Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
    290                 295                 300
Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
        355                 360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu
                405                 410                 415
Ile Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
        435                 440                 445
Ser Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg Ser
    450                 455                 460
Glu Lys Asp Glu Leu
465
<210>29
<211>469
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>29
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro
        35                  40                  45
Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
65                  70                  75                  80
Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                 110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly
        115                 120                 125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys
225                 230                 235                 240
Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu
                245                 250                 255
ProThr Lys His Gln Tyr Asp Phe Asp Val Ala  Thr Ala Tyr Ala Phe
           260                 265                 270
Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
    290                 295                 300
Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
        355                 360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp
                405                 410                 415
Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
        435                 440                 445
Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg Ser
    450                 455                 460
Glu Lys Asp Glu Leu
465
<210>30
<211>463
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>30
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro
        35                  40                  45
Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
65                  70                  75                  80
Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                 110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly
        115                 120                 125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys
225                 230                 235                 240
Arg Ile Gly Phe Thr Gly Gln Phe LeuIle Glu  Pro Lys Pro Lys Glu
                245                 250                 255
Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe
            260                 265                 270
Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
    290                 295                 300
Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
        355                 360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp
                405                 410                 415
Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
        435                 440                 445
Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
    450                 455                 460
<210>31
<211>25
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>31
Met Gly Lys Asn Gly Asn Leu Cys Cys Phe Ser Leu Leu Leu Leu Leu
 1               5                  10                  15
Leu Ala Gly Leu Ala Ser Gly His Gln
            20                  25
<210>32
<211>30
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>32
Met Gly Phe Val Leu Phe Ser Gln Leu Pro Ser Phe Leu Leu Val Ser
 1               5                  10                  15
Thr Leu Leu Leu Phe Leu Val Ile Ser His Ser Cys Arg Ala
            20                  25                  30
<210>33
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>33
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val  ProSer Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro AspIle Cys His Asp Lys  Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr AspIle  Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val  Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>34
<211>825
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>34
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe
            20                  25                  30
Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met
        35                  40                  45
Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala
    50                  55                  60
Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala
65                  70                  75                  80
Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro
                85                  90                  95
Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val
            100                 105                 110
Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu
        115                 120                 125
Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu
    130                 135                 140
Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val
145                 150                 155                 160
Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu
                165                 170                 175
Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu
            180                 185                 190
Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu
        195                 200                 205
Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val
    210                 215                 220
Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn
225                 230                 235                 240
Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp
                245                 250                 255
Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile
            260                 265                 270
Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln
        275                 280                 285
Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu
    290                 295                 300
Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr
305                 310                 315                 320
Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys
                325                 330                 335
Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro
            340                 345                 350
Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr
        355                 360                 365
His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu
    370                 375                 380
Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu
385                 390                 395                 400
Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His
                405                 410                 415
Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His
            420                 425                 430
Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile
        435                 440                 445
Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg
    450                 455                 460
Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val
465                 470                 475                 480
Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val
                485                 490                 495
Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln
            500                 505                 510
Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu
        515                 520                 525
His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly
    530                 535                 540
Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His
545                 550                 555                 560
Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val
                565                 570                 575
Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu
            580                 585                 590
Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys
        595                 600                 605
Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala
    610                 615                 620
Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala
625                 630                 635                 640
Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala
                645                 650                 655
Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe
            660                 665                 670
Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn
        675                 680                 685
Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys
    690                 695                 700
Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu
705                 710                 715                 720
Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys
                725                 730                 735
Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met
            740                 745                 750
Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile
        755                 760                 765
Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys
    770                 775                 780
Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu
785                 790                 795                 800
Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu
                805                 810                 815
Tyr Arg Glu Ser Glu Lys Asp Glu Leu
            820                 825
<210>35
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>35
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr GlyIle Lys Val  Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Le uGlu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>36
<211>718
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>36
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr
            20                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                  80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145                 150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                 175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                 270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                 335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
        595                 600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660                 665                 670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu
705                 710                 715
<210>37
<211>1434
<212>DNA
<213>海栖热袍菌
<400>37
atgaaagaaa  ccgctgctgc  taaattcgaa  cgccagcaca  tggacagccc  agatctgggt  60
accctggtgc  cacgcggttc  catggccgag  ttcttcccgg  agatcccgaa  gatccagttc  120
gagggcaagg  agtccaccaa  cccgctcgcc  ttccgcttct  acgacccgaa  cgaggtgatc  180
gacggcaagc  cgctcaagga  ccacctcaag  ttctccgtgg  ccttctggca  caccttcgtg  240
aacgagggcc  gcgacccgtt  cggcgacccg  accgccgagc  gcccgtggaa  ccgcttctcc  300
gacccgatgg  acaaggcctt  cgcccgcgtg  gacgccctct  tcgagttctg  cgagaagctc  360
aacatcgagt  acttctgctt  ccacgaccgc  gacatcgccc  cggagggcaa  gaccctccgc  420
gagaccaaca  agatcctcga  caaggtggtg  gagcgcatca  aggagcgcat  gaaggactcc  480
aacgtgaagc  tcctctgggg  caccgccaac  ctcttctccc  acccgcgcta  catgcacggc  540
gccgccacca  cctgctccgc  cgacgtgttc  gcctacgccg  ccgcccaggt  gaagaaggcc  600
ctggagatca  ccaaggagct  gggcggcgag  ggctacgtgt  tctggggcgg  ccgcgagggc  660
tacgagaccc  tcctcaacac  cgacctcggc  ctggagctgg  agaacctcgc  ccgcttcctc  720
cgcatggccg  tggagtacgc  caagaagatc  ggcttcaccg  gccagttcct  catcgagccg  780
aagccgaagg  agccgaccaa  gcaccagtac  gacttcgacg  tggccaccgc  ctacgccttc  840
ctcaagaacc  acggcctcga  cgagtacttc  aagttcaaca  tcgaggccaa  ccacgccacc  900
ctcgccggcc  acaccttcca  gcacgagctg  cgcatggccc  gcatcctcgg  caagctcggc  960
tccatcgacg  ccaaccaggg  cgacctcctc  ctcggctggg  acaccgacca  gttcccgacc  1020
aacatctacg  acaccaccct  cgccatgtac  gaggtgatca  aggccggcgg  cttcaccaag  1080
ggcggcctca  acttcgacgc  caaggtgcgc  cgcgcctcct  acaaggtgga  ggacctcttc  1140
atcggccaca  tcgccggcat  ggacaccttc  gccctcggct  tcaagatcgc  ctacaagctc  1200
gccaaggacg  gcgtgttcga  caagttcatc  gaggagaagt  accgctcctt  caaggagggc  1260
atcggcaagg  agatcgtgga  gggcaagacc  gacttcgaga  agctggagga  gtacatcatc  1320
gacaaggagg  acatcgagct  gccgtccggc  aagcaggagt  acctggagtc  cctcctcaac  1380
tcctacatcg  tgaagaccat  cgccgagctg  cgctccgaga  aggacgagct  gtga        1434
<210>38
<211>477
<212>PRT
<213>海栖热袍菌
<400>38
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser
 1               5                  10                  15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe
            20                  25                  30
Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro
        35                  40                  45
Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val Ile Asp Gly Lys Pro
    50                  55                  60
Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val
65                  70                  75                  80
Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Glu Arg Pro Trp
                85                  90                  95
Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala
            100                 105                 110
Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His
        115                 120                 125
Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys
    130                 135                 140
Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser
145                 150                 155                 160
Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg
                165                 170                 175
Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr
            180                 185                 190
Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly
        195                 200                 205
Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu
    210                 215                 220
Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Ash Leu Ala Arg Phe Leu
225                 230                 235                 240
Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly Phe Thr Gly Gln Phe
                245                 250                 255
Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe
            260                 265                 270
Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn His Gly Leu Asp Glu
        275                 280                 285
Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His
    290                 295                 300
Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly
305                 310                 315                 320
Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp
                325                 330                 335
Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val
            340                 345                 350
Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys
        355                 360                 365
Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile
    370                 375                 380
Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Ile Ala Tyr Lys Leu
385                 390                 395                 400
Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser
                405                 410                 415
Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu Gly Lys Thr Asp Phe
            420                 425                 430
Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Asp Ile Glu Leu Pro
        435                 440                 445
Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu Asn Ser Tyr Ile Val
    450                 455                 460
Lys Thr Ile Ala Glu Leu Arg Ser Glu Lys Asp Glu Leu
465                 470                 475
<210>39
<211>1434
<212>DNA
<213>那不勒斯栖热袍菌
<400>39
atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60
accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa ggtgcagttc 120
gagggcaagg agtccaccaa cccgctcgcc ttcaagttct acgacccgga ggagatcatc 180
gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg 240
aacgagggcc gcgacccgtt cggcgacccg accgccgacc gcccgtggaa ccgctacacc 300
gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc 360
aacatcgagt  acttctgctt  ccacgaccgc  gacatcgccc  cggagggcaa  gaccctccgc  420
gagaccaaca  agatcctcga  caaggtggtg  gagcgcatca  aggagcgcat  gaaggactcc  480
aacgtgaagc  tcctctgggg  caccgccaac  ctcttctccc  acccgcgcta  catgcacggc  540
gccgccacca  cctgctccgc  cgacgtgttc  gcctacgccg  ccgcccaggt  gaagaaggcc  600
ctggagatca  ccaaggagct  gggcggcgag  ggctacgtgt  tctggggcgg  ccgcgagggc  660
tacgagaccc  tcctcaacac  cgacctcggc  ttcgagctgg  agaacctcgc  ccgcttcctc  720
cgcatggccg  tggactacgc  caagcgcatc  ggcttcaccg  gccagttcct  catcgagccg  780
aagccgaagg  agccgaccaa  gcaccagtac  gacttcgacg  tggccaccgc  ctacgccttc  840
ctcaagtccc  acggcctcga  cgagtacttc  aagttcaaca  tcgaggccaa  ccacgccacc  900
ctcgccggcc  acaccttcca  gcacgagctg  cgcatggccc  gcatcctcgg  caagctcggc  960
tccatcgacg  ccaaccaggg  cgacctcctc  ctcggctggg  acaccgacca  gttcccgacc  1020
aacgtgtacg  acaccaccct  cgccatgtac  gaggtgatca  aggccggcgg  cttcaccaag  1080
ggcggcctca  acttcgacgc  caaggtgcgc  cgcgcctcct  acaaggtgga  ggacctcttc  1140
atcggccaca  tcgccggcat  ggacaccttc  gccctcggct  tcaaggtggc  ctacaagctc  1200
gtgaaggacg  gcgtgctcga  caagttcatc  gaggagaagt  accgctcctt  ccgcgagggc  1260
atcggccgcg  acatcgtgga  gggcaaggtg  gacttcgaga  agctggagga  gtacatcatc  1320
gacaaggaga  ccatcgagct  gccgtccggc  aagcaggagt  acctggagtc  cctcatcaac  1380
tcctacatcg  tgaagaccat  cctggagctg  cgctccgaga  aggacgagct  gtga        1434
<210>40
<211>477
<212>PRT
<213>那不勒斯栖热袍菌
<400>40
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser
 1               5                  10                  15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe
            20                  25                  30
Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro
        35                  40                  45
Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile Ile Asp Gly Lys Pro
    50                  55                  60
Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val
65                  70                  75                  80
Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Asp Arg Pro Trp
                85                  90                  95
Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala
            100                 105                 110
Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His
        115                 120                 125
Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys
    130                 135                 140
Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser
145                 150                 155                 160
Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg
                165                 170                 175
Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr
            180                 185                 190
Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly
        195                 200                 205
Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu
    210                 215                 220
Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn Leu Ala Arg Phe Leu
225                 230                 235                 240
Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly Phe Thr Gly Gln Phe
                245                 250                 255
Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe
            260                 265                 270
Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser His Gly Leu Asp Glu
        275                 280                 285
Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His
    290                 295                 300
Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly
305                 310                 315                 320
Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp
                325                 330                 335
Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val
            340                 345                 350
Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys
        355                 360                 365
Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile
    370                 375                 380
Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Val Ala Tyr Lys Leu
385                 390                 395                 400
Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser
                405                 410                 415
Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu Gly Lys Val Asp Phe
            420                 425                 430
Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Thr Ile Glu Leu Pro
        435                 440                 445
Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile Asn Ser Tyr Ile Val
    450                 455                 460
Lys Thr Ile Leu Glu Leu Arg Ser Glu Lys Asp Glu Leu
465                 470                 475
<210>41
<211>1435
<212>DNA
<213>海栖热袍菌
<400>41
atgggcagca  gccatcatca  tcatcatcac  agcagcggcc  tggtgccgcg  cggcagccat  60
atggctagca  tgactggtgg  acagcaaatg  ggtcggatcc  ccatggccga  gttcttcccg  120
gagatcccga  agatccagtt  cgagggcaag  gagtccacca  acccgctcgc  cttccgcttc  180
tacgacccga  acgaggtgat  cgacggcaag  ccgctcaagg  accacctcaa  gttctccgtg  240
gccttctggc  acaccttcgt  gaacgagggc  cgcgacccgt  tcggcgaccc  gaccgccgag  300
cgcccgtgga  accgcttctc  cgacccgatg  gacaaggcct  tcgcccgcgt  ggacgccctc  360
ttcgagttct  gcgagaagct  caacatcgag  tacttctgct  tccacgaccg  cgacatcccc  420
cggagggcaa  gaccctccgc  gagaccaaca  agatcctcga  caaggtggtg  gagcgcatca  480
aggagcgcat  gaaggactcc  aacgtgaagc  tcctctgggg  caccgccaac  ctcttctccc  540
acccgcgcta  catgcacggc  gccgccacca  cctgctccgc  cgacgtgttc  gcctacgccg  600
ccgcccaggt  gaagaaggcc  ctggagatca  ccaaggagct  gggcggcgag  ggctacgtgt  660
tctggggcgg  ccgcgagggc  tacgagaccc  tcctcaacac  cgacctcggc  ctggagctgg  720
agaacctcgc  ccgcttcctc  cgcatggccg  tggagtacgc  caagaagatc  ggcttcaccg  780
gccagttcct  catcgagccg  aagccgaagg  agccgaccaa  gcaccagtac  gcttcgacgt  840
ggccaccgcc  tacgccttcc  tcaagaacca  cggcctcgac  gagtacttca  agttcaacat  900
cgaggccaac  cacgccaccc  tcgccggcca  caccttccag  cacgagctgc  gcatggcccg  960
catcctcggc  aagctcggct  ccatcgacgc  caaccagggc  gacctcctcc  tcggctggga  1020
caccgaccag  ttcccgacca  acatctacga  caccaccctc  gccatgtacg  aggtgatcaa  1080
ggccggcggc  ttcaccaagg  gcggcctcaa  cttcgacgcc  aaggtgcgcc  gcgcctccta  1140
caaggtggag  gacctcttca  tcggccacat  cgccggcatg  gacaccttcg  ccctcggctt  1200
caagatcgcc  tacaagctcg  ccaaggacgg  cgtgttcgac  aagttcatcg  aggagaagta  1260
ccgctccttc  aaggagggca  tcggcaagga  gatcgtggag  ggcaagaccg  acttcgagaa  1320
gctggaggag  tacatcatcg  acaaggagga  catcgagctg  ccgtccggca  agcaggagta  1380
cctggagtcc  ctcctcaact  cctacatcgt  gaagaccatc  gccgagctgc  gctga    1435
<210>42
<211>478
<212>PRT
<213>海栖热袍菌
<400>42
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
 1               5                  10                  15
Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
            20                  25                  30
Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu
        35                  40                  45
Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn
    50                  55                  60
Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val
65                  70                  75                  80
Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp
                85                  90                  95
Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys
            100                 105                 110
Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn
        115                 120                 125
Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys
    130                 135                 140
Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile
145                 150                 155                 160
Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala
                165                 170                 175
Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys
            180                 185                 190
Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu
        195                 200                 205
Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly
    210                 215                 220
Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu
225                 230                 235                 240
Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys
                245                 250                 255
Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro
            260                 265                 270
Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu
        275                 280                 285
Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn
    290                 295                 300
His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala
305                 310                 315                 320
Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu
                325                 330                 335
Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr
            340                 345                 350
Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly
        355                 360                 365
Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu
    370                 375                 380
Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly
385                 390                 395                 400
Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe
                405                 410                 415
Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile
            420                 425                 430
Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp
        435                 440                 445
Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser
    450                 455                 460
Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg
465                 470                 475
<210>43
<211>1436
<212>DNA
<213>那不勒斯栖热袍菌
<400>43
atgggcagca  gccatcatca  tcatcatcac  agcagcggcc  tggtgccgcg  cggcagccat  60
atggctagca  tgactggtgg  acagcaaatg  ggtcggatcc  ccatggccga  gttcttcccg  120
gagatcccga  aggtgcagtt  cgagggcaag  gagtccacca  acccgctcgc  cttcaagttc  180
tacgacccgg  aggagatcat  cgacggcaag  ccgctcaagg  accacctcaa  gttctccgtg  240
gccttctggc  acaccttcgt  gaacgagggc  cgcgacccgt  tcggcgaccc  gaccgccgac  300
cgcccgtgga  accgctacac  cgacccgatg  gacaaggcct  tcgcccgcgt  ggacgccctc  360
ttcgagttct  gcgagaagct  caacatcgag  tacttctgct  tccacgaccg  cgacatcccc  420
cggagggcaa  gaccctccgc  gagaccaaca  agatcctcga  caaggtggtg  gagcgcatca  480
aggagcgcat  gaaggactcc  aacgtgaagc  tcctctgggg  caccgccaac  ctcttctccc  540
acccgcgcta  catgcacggc  gccgccacca  cctgctccgc  cgacgtgttc  gcctacgccg  600
ccgcccaggt  gaagaaggcc  ctggagatca  ccaaggagct  gggcggcgag  ggctacgtgt  660
tctggggcgg  ccgcgagggc  tacgagaccc  tcctcaacac  cgacctcggc  ttcgagctgg  720
agaacctcgc  ccgcttcctc  cgcatggccg  tggactacgc  caagcgcatc  ggcttcaccg  780
gccagttcct  catcgagccg  aagccgaagg  agccgaccaa  gcaccagtac  gacttcgacg  840
tggccaccgc  ctacgccttc  ctcaagtccc  acggcctcga  cgagtacttc  aagttcaaca  900
tcgaggccaa  ccacgccacc  ctcgccggcc  acaccttcca  gcacgagctg  cgcatggccc  960
gcatcctcgg  caagctcggc  tccatcgacg  ccaaccaggg  cgacctcctc  ctcggctggg  1020
acaccgacca  gttcccgacc  aacgtgtacg  acaccaccct  cgccatgtac  gaggtgatca  1080
aggccggcgg  cttcaccaag  ggcggcctca  acttcgacgc  caaggtgcgc  cgcgcctcct  1140
acaaggtgga  ggacctcttc  atcggccaca  tcgccggcat  ggacaccttc  gccctcggct  1200
tcaaggtggc  ctacaagctc  gtgaaggacg  gcgtgctcga  caagttcatc  gaggagaagt  1260
accgctcctt  ccgcgagggc  atcggccgcg  acatcgtgga  gggcaaggtg  gacttcgaga  1320
agctggagga  gtacatcatc  gacaaggaga  ccatcgagct  gccgtccggc  aagcaggagt  1380
acctggagtc  cctcatcaac  tcctacatcg  tgaagaccat  cctggagctg  cgctga      1436
<210>44
<211>478
<212>PRT
<213>那不勒斯栖热袍菌
<400>44
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
 1               5                  10                  15
Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
            20                  25                  30
Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu
        35                  40                  45
Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu
    50                  55                  60
Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val
65                  70                  75                  80
Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp
                85                  90                  95
Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys
            100                 105                 110
Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn
        115                 120                 125
Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys
    130                 135                 140
Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile
145                 150                 155                 160
Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala
                165                 170                 175
Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys
            180                 185                 190
Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu
       195                 200                 205
Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly
    210                 215                 220
Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu
225                 230                 235                 240
Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg
                245                 250                 255
Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro
            260                 265                 270
Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu
        275                 280                 285
Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn
    290                 295                 300
His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala
305                 310                 315                 320
Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu
                325                 330                 335
Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr
            340                 345                 350
Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly
        355                 360                 365
Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu
    370                 375                 380
Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly
385                 390                 395                 400
Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe
                405                 410                 415
Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile
            420                 425                 430
Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp
        435                 440                 445
Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser
    450                 455                 460
Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
465                 470                 475
<210>45
<211>1095
<212>PRT
<213>Aspergillus  shirousami
<400>45
Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr Phe Leu Leu Thr
 1               5                  10                  15
Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Thr Cys Asn Thr
            20                  25                  30
Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile Asp Lys
        35                  40                  45
Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile Thr Pro
    50                  55                  60
Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly Asp Ala Tyr His
65                  70                  75                  80
Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu Asn Tyr Gly Thr
                85                  90                  95
Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His Glu Arg Gly Met
            100                 105                 110
Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asp Gly Ala
        115                 120                 125
Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe Ser Ser Gln Asp
    130                 135                 140
Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu Asp Gln Thr Gln
145                 150                 155                 160
Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser Leu Pro Asp Leu
                165                 170                 175
Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr Asp Trp Val Gly
            180                 185                 190
Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Ile Asp Thr Val
        195                 200                 205
Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala Ala Gly
    210                 215                 220
Val Tyr Cys Ile Gly Glu Val Leu Asp Val Asp Pro Ala Tyr Thr Cys
225                 230                 235                 240
Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr Pro Ile Tyr Tyr
                245                 250                 255
Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser Met Asp Asp Leu
            260                 265                 270
Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro Asp Ser Thr Leu
        275                 280                 285
Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg Phe Ala Ser Tyr
    290                 295                 300
Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala Phe Ile Ile Leu
305                 310                 315                 320
Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu Gln His Tyr Ala
                325                 330                 335
Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp Leu Ser Gly Tyr
            340                 345                 350
Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser Ala Asn Ala Ile
        355                 360                 365
Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val Thr Tyr Lys Asn
    370                 375                 380
Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met Arg Lys Gly Thr
385                 390                 395                 400
Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys Gly Ala Ser Gly
                405                 410                 415
Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr Thr Ala Gly Gln
            420                 425                 430
Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr Val Gly Ser Asp
        435                 440                 445
Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro Arg Val Leu Tyr
    450                 455                 460
Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser Ser Ser Lys Pro
465                 470                 475                 480
Ala Thr Leu Asp Ser Trp Leu Ser Asn Glu Ala Thr Val Ala Arg Thr
                485                 490                 495
Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ala Trp Val Ser Gly Ala
            500                 505                 510
Asp Ser Gly Ile Val Val Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr
        515                 520                 525
Phe Tyr Thr Trp Thr Arg Asp Ser Gly Ile Val Leu Lys Thr Leu Val
    530                 535                 540
Asp Leu Phe Arg Asn Gly Asp Thr Asp Leu Leu Ser Thr Ile Glu His
545                 550                 555                 560
Tyr Ile Ser Ser Gln Ala Ile Ile Gln Gly Val Ser Asn Pro Ser Gly
                565                 570                 575
Asp Leu Ser Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu
            580                 585                 590
Thr Ala Tyr Ala Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala
        595                 600                 605
Leu Arg Ala Thr Ala Met Ile Gly Phe Gly Gln Trp Leu Leu Asp Asn
    610                 615                 620
Gly Tyr Thr Ser Ala Ala Thr Glu Ile Val Trp Pro Leu Val Arg Asn
625                 630                 635                 640
Asp Leu Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu
                645                 650                 655
Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His
            660                 665                 670
Arg Ala Leu Val Glu Gly Ser Ala Phe Ala Thr Ala Val Gly Ser Ser
        675                 680                 685
Cys Ser Trp Cys Asp Ser Gln Ala Pro Gln Ile Leu Cys Tyr Leu Gln
    690                 695                 700
Ser Phe Trp Thr Gly Ser Tyr Ile Leu Ala Asn Phe Asp Ser Ser Arg
705                 710                 715                 720
Ser Gly Lys Asp Thr Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp
                725                 730                 735
Pro Glu Ala Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg
            740                 745                 750
Ala Leu Ala Asn His Lys Glu Val Val Asp Ser Phe Arg Ser Ile Tyr
        755                 760                 765
Thr Leu Asn Asp Gly Leu Ser Asp Ser Glu Ala Val Ala Val Gly Arg
    770                 775                 780
Tyr Pro Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Cys Thr
785                 790                 795                 800
Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Lys
                805                 810                 815
Gln Gly Ser Leu Glu Ile Thr Asp Val Ser Leu Asp Phe Phe Lys Ala
            820                 825                 830
Leu Tyr Ser Gly Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser Thr
        835                 840                 845
Tyr Ser Ser Ile Val Ser Ala Val Lys Thr Phe Ala Asp Gly Phe Val
    850                 855                 860
Ser Ile Val Glu Thr His Ala Ala Ser Asn Gly Ser Leu Ser Glu Gln
865                 870                 875                 880
Phe Asp Lys Ser Asp Gly Asp Glu Leu Ser Ala Arg Asp Leu Thr Trp
                885                 890                 895
Ser Tyr Ala Ala Leu Leu Thr Ala Asn Asn Arg Arg Asn Ser Val Val
            900                 905                 910
Pro Pro Ser Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr Cys
        915                 920                 925
Ala Ala Thr Ser Ala Ser Gly Thr Tyr Ser Ser Val Thr Val Thr Ser
    930                 935                 940
Trp Pro Ser Ile Val Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr
945                 950                 955                 960
Thr Gly Ser Gly Gly Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala
                965                 970                 975
Ser Lys Thr Ser Thr Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr
            980                 985                 990
Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu
        995                 1000                1005
Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr
    1010                1015                1020
Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asn Pro
1025                1030                1035                1040
Pro Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr
                1045                1050                1055
Lys Phe Ile Arg Val Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp
            1060                1065                1070
Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Glu Ser Thr Ala
        1075                1080                1085
Thr Val Thr Asp Thr Trp Arg
    1090                1095
<210>46
<211>3285
<212>DNA
<213>Aspergillus shirousami
<400>46
gccaccccgg  ccgactggcg  ctcccagtcc  atctacttcc  tcctcaccga  ccgcttcgcc  60
cgcaccgacg  gctccaccac  cgccacctgc  aacaccgccg  accagaagta  ctgcggcggc  120
acctggcagg  gcatcatcga  caagctcgac  tacatccagg  gcatgggctt  caccgccatc  180
tggatcaccc  cggtgaccgc  ccagctcccg  cagaccaccg  cctacggcga  cgcctaccac  240
ggctactggc  agcaggacat  ctactccctc  aacgagaact  acggcaccgc  cgacgacctc  300
aaggccctct  cctccgccct  ccacgagcgc  ggcatgtacc  tcatggtgga  cgtggtggcc  360
aaccacatgg  gctacgacgg  cgccggctcc  tccgtggact  actccgtgtt  caagccgttc  420
tcctcccagg  actacttcca  cccgttctgc  ttcatccaga  actacgagga  ccagacccag  480
gtggaggact  gctggctcgg  cgacaacacc  gtgtccctcc  cggacctcga  caccaccaag  540
gacgtggtga  agaacgagtg  gtacgactgg  gtgggctccc  tcgtgtccaa  ctactccatc  600
gacggcctcc  gcatcgacac  cgtgaagcac  gtgcagaagg  acttctggcc  gggctacaac  660
aaggccgccg  gcgtgtactg  catcggcgag  gtgctcgacg  tggacccggc  ctacacctgc  720
ccgtaccaga  acgtgatgga  cggcgtgctc  aactacccga  tctactaccc  gctcctcaac  780
gccttcaagt  ccacctccgg  ctcgatggac  gacctctaca  acatgatcaa  caccgtgaag  840
tccgactgcc  cggactccac  cctcctcggc  accttcgtgg  agaaccacga  caacccgcgc  900
ttcgcctcct  acaccaacga  catcgccctc  gccaagaacg  tggccgcctt  catcatcctc  960
aacgacggca  tcccgatcat  ctacgccggc  caggagcagc  actacgccgg  cggcaacgac  1020
ccggccaacc  gcgaggccac  ctggctctcc  ggctacccga  ccgactccga  gctgtacaag  1080
ctcatcgcct  ccgccaacgc  catccgcaac  tacgccatct  ccaaggacac  cggcttcgtg  1140
acctacaaga  actggccgat  ctacaaggac  gacaccacca  tcgccatgcg  caagggcacc  1200
gacggctccc  agatcgtgac  catcctctcc  aacaagggcg  cctccggcga  ctcctacacc  1260
ctctccctct  ccggcgccgg  ctacaccgcc  ggccagcagc  tcaccgaggt  gatcggctgc  1320
accaccgtga  ccgtgggctc  cgacggcaac  gtgccggtgc  cgatggccgg  cggcctcccg  1380
cgcgtgctct  acccgaccga  gaagctcgcc  ggctccaaga  tatgctcctc  ctccaagccg  1440
gccaccctcg  actcctggct  ctccaacgag  gccaccgtgg  cccgcaccgc  catcctcaac  1500
aacatcggcg  ccgacggcgc  ctgggtgtcc  ggcgccgact  ccggcatcgt  ggtggcctcc  1560
ccgtccaccg  acaacccgga  ctacttctac  acctggaccc  gcgactccgg  catcgtgctc  1620
aagaccctcg  tggacctctt  ccgcaacggc  gacaccgacc  tcctctccac  catcgagcac  1680
tacatctcct  cccaggccat  catccagggc  gtgtccaacc  cgtccggcga  cctctcctcc  1740
ggcggcctcg  gcgagccgaa  gttcaacgtg  gacgagaccg  cctacgccgg  ctcctggggc  1800
cgcccgcagc  gcgacggccc  ggccctccgc  gccaccgcca  tgatcggctt  cggccagtgg  1860
ctcctcgaca  acggctacac  ctccgccgcc  accgagatcg  tgtggccgct  cgtgcgcaac  1920
gacctctcct  acgtggccca  gtactggaac  cagaccggct  acgacctctg  ggaggaggtg  1980
aacggctcct  ccttcttcac  catcgccgtg  cagcaccgcg  ccctcgtgga  gggctccgcc  2040
ttcgccaccg  ccgtgggctc  ctcctgctcc  tggtgcgact  cccaggcccc  gcagatcctc  2100
tgctacctcc  agtccttctg  gaccggctcc  tacatcctcg  ccaacttcga  ctcctcccgc  2160
tccggcaagg  acaccaacac  cctcctcggc  tccatccaca  ccttcgaccc  ggaggccggc  2220
tgcgacgact  ccaccttcca  gccgtgctcc  ccgcgcgccc  tcgccaacca  caaggaggtg  2280
gtggactcct  tccgctccat  ctacaccctc  aacgacggcc  tctccgactc  cgaggccgtg  2340
gccgtgggcc  gctacccgga  ggactcctac  tacaacggca  acccgtggtt  cctctgcacc  2400
ctcgccgccg  ccgagcagct  ctacgacgcc  ctctaccagt  gggacaagca  gggctccctg  2460
gagatcaccg  acgtgtccct  cgacttcttc  aaggccctct  actccggcgc  cgccaccggc  2520
acctactcct  cctcctcctc  cacctactcc  tccatcgtgt  ccgccgtgaa  gaccttcgcc  2580
gacggcttcg  tgtccatcgt  ggagacccac  gccgcctcca  acggctccct  ctccgagcag  2640
ttcgacaagt  ccgacggcga  cgagctgtcc  gcccgcgacc  tcacctggtc  ctacgccgcc  2700
ctcctcaccg  ccaacaaccg  ccgcaactcc  gtggtgccgc  cgtcctgggg  cgagacctcc  2760
gcctcctccg  tgccgggcac  ctgcgccgcc  acctccgcct  ccggcaccta  ctcctccgtg  2820
accgtgacct  cctggccgtc  catcgtggcc  accggcggca  ccaccaccac  cgccaccacc  2880
accggctccg  gcggcgtgac  ctccacctcc  aagaccacca  ccaccgcctc  caagacctcc  2940
accaccacct  cctccacctc  ctgcaccacc  ccgaccgccg  tggccgtgac  cttcgacctc  3000
accgccacca  ccacctacgg  cgagaacatc  tacctcgtgg  gctccatctc  ccagctcggc  3060
gactgggaga  cctccgacgg  catcgccctc  tccgccgaca  agtacacctc  ctccaacccg  3120
ccgtggtacg  tgaccgtgac  cctcccggcc  ggcgagtcct  tcgagtacaa  gttcatccgc  3180
gtggagtccg  acgactccgt  ggagtgggag  tccgacccga  accgcgagta  caccgtgccg  3240
caggcctgcg  gcgagtccac  cgccaccgtg  accgacacct  ggcgc                   3285
<210>47
<211>679
<212>PRT
<213>热解糖热厌氧杆菌
<400>47
Val Leu Ser Gly Cys Ser Asn Asn Val Ser Ser Ile Lys Ile Asp Arg
 1               5                  10                  15
Phe Asn Asn Ile Ser Ala Val Asn Gly Pro Gly Glu Glu Asp Thr Trp
            20                  25                  30
Ala Ser Ala Gln Lys Gln Gly Val Gly Thr Ala Asn Asn Tyr Val Ser
        35                  40                  45
Arg Val Trp Phe Thr Leu Ala Asn Gly Ala Ile Ser Glu Val Tyr Tyr
    50                  55                  60
Pro Thr Ile Asp Thr Ala Asp Val Lys Glu Ile Lys Phe Ile Val Thr
65                  70                  75                  80
Asp Gly Lys Ser Phe Val Ser Asp Glu Thr Lys Asp Ala Ile Ser Lys
                85                  90                  95
Val Glu Lys Phe Thr Asp Lys Ser Leu Gly Tyr Lys Leu Val Asn Thr
            100                 105                 110
Asp Lys Lys Gly Arg Tyr Arg Ile Thr Lys Glu Ile Phe Thr Asp Val
        115                 120                 125
Lys Arg Asn Ser Leu Ile Met Lys Ala Lys Phe Glu Ala Leu Glu Gly
    130                 135                 140
Ser Ile His Asp Tyr Lys Leu Tyr Leu Ala Tyr Asp Pro His Ile Lys
145                 150                 155                 160
Asn Gln Gly Ser Tyr Asn Glu Gly Tyr Val Ile Lys Ala Asn Asn Asn
                165                 170                 175
Glu Met Leu Met Ala Lys Arg Asp Asn Val Tyr Thr Ala Leu Ser Ser
            180                 185                 190
Asn Ile Gly Trp Lys Gly Tyr Ser Ile Gly Tyr Tyr Lys Val Asn Asp
        195                 200                 205
Ile Met Thr Asp Leu Asp Glu Asn Lys Gln Met Thr Lys His Tyr Asp
    210                 215                 220
Ser Ala Arg Gly Asn Ile Ile Glu Gly Ala Glu Ile Asp Leu Thr Lys
225                 230                 235                 240
Asn Ser Glu Phe Glu Ile Val Leu Ser Phe Gly Gly Ser Asp Ser Glu
                245                 250                 255
Ala Ala Lys Thr Ala Leu Glu Thr Leu Gly Glu Asp Tyr Asn Asn Leu
            260                 265                 270
Lys Asn Asn Tyr Ile Asp Glu Trp Thr Lys Tyr Cys Asn  Thr Leu Asn
        275                 280                 285
Asn Phe Asn Gly Lys Ala Asn Ser Leu Tyr Tyr Asn Ser Met Met Ile
    290                 295                 300
Leu Lys Ala Ser Glu Asp Lys Thr Asn Lys Gly Ala Tyr Ile Ala Ser
305                 310                 315                 320
Leu Ser Ile Pro Trp Gly Asp Gly Gln Arg Asp Asp Asn Thr Gly Gly
                325                 330                 335
Tyr His Leu Val Trp Ser Arg Asp Leu Tyr His Val Ala Asn Ala Phe
            340                 345                 350
Ile Ala Ala Gly Asp Val Asp Ser Ala Asn Arg Ser Leu Asp Tyr Leu
        355                 360                 365
Ala Lys Val Val Lys Asp Asn Gly Met Ile Pro Gln Asn Thr Trp Ile
    370                 375                 380
Ser Gly Lys Pro Tyr Trp Thr Ser Ile Gln Leu Asp Glu Gln Ala Asp
385                 390                 395                 400
Pro Ile Ile Leu Ser Tyr Arg Leu Lys Arg Tyr Asp Leu Tyr Asp Ser
                405                 410                 415
Leu Val Lys Pro Leu Ala Asp Phe Ile Ile Lys Ile Gly Pro Lys Thr
            420                 425                 430
Gly Gln Glu Arg Trp Glu Glu Ile Gly Gly Tyr Ser Pro Ala Thr Met
        435                 440                 445
Ala Ala Glu Val Ala Gly Leu Thr Cys Ala Ala Tyr Ile Ala Glu Gln
    450                 455                 460
Asn Lys Asp Tyr Glu Ser Ala Gln Lys Tyr Gln Glu Lys Ala Asp Asn
465                 470                 475                 480
Trp Gln Lys Leu Ile Asp Asn Leu Thr Tyr Thr Glu Asn Gly Pro Leu
                485                 490                 495
Gly Asn Gly Gln Tyr Tyr Ile Arg Ile Ala Gly Leu Ser Asp Pro Asn
            500                 505                 510
Ala Asp Phe Met Ile Asn Ile Ala Asn Gly Gly Gly Val Tyr Asp Gln
        515                 520                 525
Lys Glu Ile Val Asp Pro Ser Phe Leu Glu Leu Val Arg Leu Gly Val
    530                 535                 540
Lys Ser Ala Asp Asp Pro Lys Ile Leu Asn Thr Leu Lys Val Val Asp
545                 550                 555                 560
Ser Thr Ile Lys Val Asp Thr Pro Lys Gly Pro Ser Trp Tyr Arg Tyr
                565                 570                 575
Asn His Asp Gly Tyr Gly Glu Pro Ser Lys Thr Glu Leu Tyr His Gly
            580                 585                 590
Ala Gly Lys Gly Arg Leu Trp Pro Leu Leu Thr Gly Glu Arg Gly Met
        595                 600                 605
Tyr Glu Ile Ala Ala Gly Lys Asp Ala Thr Pro Tyr Val Lys Ala Met
    610                 615                 620
Glu Lys Phe Ala Asn Glu Gly Gly Ile Ile Ser Glu Gln Val Trp Glu
625                 630                 635                 640
Asp Thr Gly Leu Pro Thr Asp Ser Ala Ser Pro Leu Asn Trp Ala His
                645                 650                 655
Ala Glu Tyr Val Ile Leu Phe Ala Ser Asn Ile Glu His Lys Val Leu
            660                 665                 670
Asp Met Pro Asp Ile Val Tyr
        675
<210>48
<211>2037
<212>DNA
<213>热解糖热厌氧杆菌
<220>
<223>合成的
<400>48
gtgctctccg  gctgctccaa  caacgtgtcc  tccatcaaga  tcgaccgctt  caacaacatc  60
tccgccgtga  acggcccggg  cgaggaggac  acctgggcct  ccgcccagaa  gcagggcgtg  120
ggcaccgcca  acaactacgt  gtcccgcgtg  tggttcaccc  tcgccaacgg  cgccatctcc  180
gaggtgtact  acccgaccat  cgacaccgcc  gacgtgaagg  agatcaagtt  catcgtgacc  240
gacggcaagt  ccttcgtgtc  cgacgagacc  aaggacgcca  tctccaaggt  ggagaagttc  300
accgacaagt  ccctcggcta  caagctcgtg  aacaccgaca  agaagggccg  ctaccgcatc  360
accaaggaaa  tcttcaccga  cgtgaagcgc  aactccctca  tcatgaaggc  caagttcgag  420
gccctcgagg  gctccatcca  cgactacaag  ctctacctcg  cctacgaccc  gcacatcaag  480
aaccagggct  cctacaacga  gggctacgtg  atcaaggcca  acaacaacga  gatgctcatg  540
gccaagcgcg  acaacgtgta  caccgccctc  tcctccaaca  tcggctggaa  gggctactcc  600
atcggctact  acaaggtgaa  cgacatcatg  accgacctcg  acgagaacaa  gcagatgacc  660
aagcactacg  actccgcccg  cggcaacatc  atcgagggcg  ccgagatcga  cctcaccaag  720
aactccgagt  tcgagatcgt  gctctccttc  ggcggctccg  actccgaggc  cgccaagacc  780
gccctcgaga  ccctcggcga  ggactacaac  aacctcaaga  acaactacat  cgacgagtgg  840
accaagtact  gcaacaccct  caacaacttc  aacggcaagg  ccaactccct  ctactacaac  900
tccatgatga  tcctcaaggc  ctccgaggac  aagaccaaca  agggcgccta  catcgcctcc  960
ctctccatcc  cgtggggcga  cggccagcgc  gacgacaaca  ccggcggcta  ccacctcgtg  1020
tggtcccgcg  acctctacca  cgtggccaac  gccttcatcg  ccgccggcga  cgtggactcc  1080
gccaaccgct  ccctcgacta  cctcgccaag  gtggtgaagg  acaacggcat  gatcccgcag  1140
aacacctgga  tctccggcaa  gccgtactgg  acctccatcc  agctcgacga  gcaggccgac  1200
ccgatcatcc  tctcctaccg  cctcaagcgc  tacgacctct  acgactccct  cgtgaagccg  1260
ctcgccgact  tcatcatcaa  gatcggcccg  aagaccggcc  aggagcgctg  ggaggagatc  1320
ggcggctact  ccccggccac  gatggccgcc  gaggtggccg  gcctcacctg  cgccgcctac  1380
atcgccgagc  agaacaagga  ctacgagtcc  gcccagaagt  accaggagaa  ggccgacaac  1440
tggcagaagc  tcatcgacaa  cctcacctac  accgagaacg  gcccgctcgg  caacggccag  1500
tactacatcc  gcatcgccgg  cctctccgac  ccgaacgccg  acttcatgat  caacatcgcc  1560
aacggcggcg  gcgtgtacga  ccagaaggag  atcgtggacc  cgtccttcct  cgagctggtg  1620
cgcctcggcg  tgaagtccgc  cgacgacccg  aagatcctca  acaccctcaa  ggtggtggac  1680
tccaccatca  aggtggacac  cccgaagggc  ccgtcctggt  atcgctacaa  ccacgacggc  1740
tacggcgagc  cgtccaagac  cgagctgtac  cacggcgccg  gcaagggccg  cctctggccg  1800
ctcctcaccg  gcgagcgcgg  catgtacgag  atcgccgccg  gcaaggacgc  caccccgtac  1860
gtgaaggcga  tggagaagtt  cgccaacgag  ggcggcatca  tctccgagca  ggtgtgggag  1920
gacaccggcc  tcccgaccga  ctccgcctcc  ccgctcaact  gggcccacgc  cgagtacgtg  1980
atcctcttcg  cctccaacat  cgagcacaag  gtgctcgaca  tgccggacat  cgtgtac     2037
<210>49
<211>579
<212>PRT
<213>米根霉
<400>49
Ala Ser Ile Pro Ser Ser Ala Ser Val Gln Leu Asp Ser Tyr Asn Tyr
 1               5                  10                  15
Asp Gly Ser Thr Phe Ser Gly Lys Ile Tyr Val Lys Asn Ile Ala Tyr
            20                  25                  30
Ser Lys Lys Val Thr Val Ile Tyr Ala Asp Gly Ser Asp Asn Trp Asn
        35                  40                  45
Asn Asn Gly Asn Thr Ile Ala Ala Ser Tyr Ser Ala Pro Ile Ser Gly
    50                  55                  60
Ser Asn Tyr Glu Tyr Trp Thr Phe Ser Ala Ser Ile Asn Gly Ile Lys
65                  70                  75                  80
Glu Phe Tyr Ile Lys Tyr Glu Val Ser Gly Lys Thr Tyr Tyr Asp Asn
                85                  90                  95
Asn Asn Ser Ala Asn Tyr Gln Val Ser Thr Ser Lys Pro Thr Thr Thr
            100                 105                 110
Thr Ala Thr Ala Thr Thr Thr Thr Ala Pro Ser Thr Ser Thr Thr Thr
        115                 120                 125
Pro Pro Ser Arg Ser Glu Pro Ala Thr Phe Pro Thr Gly Asn Ser Thr
    130                 135                 140
Ile Ser Ser Trp Ile Lys Lys Gln Glu Gly Ile Ser Arg Phe Ala Met
145                 150                 155                 160
Leu Arg Asn Ile Asn Pro Pro Gly Ser Ala Thr Gly Phe Ile Ala Ala
                165                 170                 175
Ser Leu Ser Thr Ala Gly Pro Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp
            180                 185                 190
Ala Ala Leu Thr Ser Asn Val Ile Val Tyr Glu Tyr Asn Thr Thr Leu
        195                 200                 205
Ser Gly Asn Lys Thr Ile Leu Asn Val Leu Lys Asp Tyr Val Thr Phe
    210                 215                 220
Ser Val Lys Thr Gln Ser Thr Ser Thr Val Cys Asn Cys Leu Gly Glu
225                 230                 235                 240
Pro Lys Phe Asn Pro Asp Ala Ser Gly Tyr Thr Gly Ala Trp Gly Arg
                245                 250                 255
Pro Gln Asn Asp Gly Pro Ala Glu Arg Ala Thr Thr Phe Ile Leu Phe
            260                 265                 270
Ala Asp Ser Tyr Leu Thr Gln Thr Lys Asp Ala Ser Tyr Val Thr Gly
        275                 280                 285
Thr Leu Lys Pro Ala Ile Phe Lys Asp Leu Asp Tyr Val Val Asn Val
    290                 295                 300
Trp Ser Asn Gly Cys Phe Asp Leu Trp Glu Glu Val Asn Gly Val His
305                 310                 315                 320
Phe Tyr Thr Leu Met Val Met Arg Lys Gly Leu Leu Leu Gly Ala Asp
                325                 330                 335
Phe Ala Lys Arg Asn Gly Asp Ser Thr Arg Ala Ser Thr Tyr Ser Ser
            340                 345                 350
Thr Ala Ser Thr Ile Ala Asn Lys Ile Ser Ser Phe Trp Val Ser Ser
        355                 360                 365
Asn Asn Trp Ile Gln Val Ser Gln Ser Val Thr Gly Gly Val Ser Lys
    370                 375                 380
Lys Gly Leu Asp Val Ser Thr Leu Leu Ala Ala Asn Leu Gly Ser Val
385                 390                 395                 400
Asp Asp Gly Phe Phe Thr Pro Gly Ser Glu Lys Ile Leu Ala Thr Ala
                405                 410                 415
Val Ala Val Glu Asp Ser Phe Ala Ser Leu Tyr Pro Ile Asn Lys Asn
            420                 425                 430
Leu Pro Ser Tyr Leu Gly Asn Ser Ile Gly Arg Tyr Pro Glu Asp Thr
        435                 440                 445
Tyr Asn Gly Asn Gly Asn Ser Gln Gly Asn Ser Trp Phe Leu Ala Val
    450                 455                 460
Thr Gly Tyr Ala Glu Leu Tyr Tyr Arg Ala Ile Lys Glu Trp Ile Gly
465                 470                 475                 480
Asn Gly Gly Val Thr Val Ser Ser Ile Ser Leu Pro Phe Phe Lys Lys
                485                 490                 495
Phe Asp Ser Ser Ala Thr Ser Gly Lys Lys Tyr Thr Val Gly Thr Ser
            500                 505                 510
Asp Phe Asn Asn Leu Ala Gln Asn Ile Ala Leu Ala Ala Asp Arg Phe
        515                 520                 525
Leu Ser Thr Val Gln Leu His Ala His Asn Asn Gly Ser Leu Ala Glu
    530                 535                 540
Glu Phe Asp Arg Thr Thr Gly Leu Ser Thr Gly Ala Arg Asp Leu Thr
545                 550                 555                 560
Trp Ser His Ala Ser Leu Ile Thr Ala Ser Tyr Ala Lys Ala Gly Ala
                565                 570                 575
Pro Ala Ala
<210>50
<211>1737
<212>DNA
<213>米根霉
<400>50
gcctccatcc  cgtcctccgc  ctccgtgcag  ctcgactcct  acaactacga  cggctccacc  60
ttctccggca  aaatctacgt  gaagaacatc  gcctactcca  agaaggtgac  cgtgatctac  120
gccgacggct  ccgacaactg  gaacaacaac  ggcaacacca  tcgccgcctc  ctactccgcc  180
ccgatctccg  gctccaacta  cgagtactgg  accttctccg  cctccatcaa  cggcatcaag  240
gagttctaca  tcaagtacga  ggtgtccggc  aagacctact  acgacaacaa  caactccgcc  300
aactaccagg  tgtccacctc  caagccgacc  accaccaccg  ccaccgccac  caccaccacc  360
gccccgtcca  cctccaccac  caccccgccg  tcccgctccg  agccggccac  cttcccgacc  420
ggcaactcca  ccatctcctc  ctggatcaag  aagcaggagg  gcatctcccg  cttcgccatg  480
ctccgcaaca  tcaacccgcc  gggctccgcc  accggcttca  tcgccgcctc  cctctccacc  540
gccggcccgg  actactacta  cgcctggacc  cgcgacgccg  ccctcacctc  caacgtgatc  600
gtgtacgagt  acaacaccac  cctctccggc  aacaagacca  tcctcaacgt  gctcaaggac  660
tacgtgacct  tctccgtgaa  gacccagtcc  acctccaccg  tgtgcaactg  cctcggcgag  720
ccgaagttca  acccggacgc  ctccggctac  accggcgcct  ggggccgccc  gcagaacgac  780
ggcccggccg  agcgcgccac  caccttcatc  ctcttcgccg  actcctacct  cacccagacc  840
aaggacgcct  cctacgtgac  cggcaccctc  aagccggcca  tcttcaagga  cctcgactac  900
gtggtgaacg  tgtggtccaa  cggctgcttc  gacctctggg  aggaggtgaa  cggcgtgcac  960
ttctacaccc t catggtgat  gcgcaagggc  ctcctcctcg  gcgccgactt  cgccaagcgc  1020
aacggcgact  ccacccgcgc  ctccacctac  tcctccaccg  cctccaccat  cgccaacaaa  1080
atctcctcct  tctgggtgtc  ctccaacaac  tggatacagg  tgtcccagtc  cgtgaccggc  1140
ggcgtgtcca  agaagggcct  cgacgtgtcc  accctcctcg  ccgccaacct  cggctccgtg  1200
gacgacggct  tcttcacccc  gggctccgag  aagatcctcg  ccaccgccgt  ggccgtggag  1260
gactccttcg  cctccctcta  cccgatcaac  aagaacctcc  cgtcctacct  cggcaactcc  1320
atcggccgct  acccggagga  cacctacaac  ggcaacggca  actcccaggg  caactcctgg  1380
ttcctcgccg  tgaccggcta  cgccgagctg  tactaccgcg  ccatcaagga  gtggatcggc  1440
aacggcggcg  tgaccgtgtc  ctccatctcc  ctcccgttct  tcaagaagtt  cgactcctcc  1500
gccacctccg  gcaagaagta  caccgtgggc  acctccgact  tcaacaacct  cgcccagaac  1560
atcgccctcg  ccgccgaccg  cttcctctcc  accgtgcagc  tccacgccca  caacaacggc  1620
tccctcgccg  aggagttcga  ccgcaccacc  ggcctctcca  ccggcgcccg  cgacctcacc  1680
tggtcccacg  cctccctcat  caccgcctcc  tacgccaagg  ccggcgcccc  ggccgcc     1737
<210>51
<211>439
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>51
Met Ala Lys His Leu Ala Ala Met Cys Trp Cys Ser Leu Leu Val Leu
 1               5                  10                  15
Val Leu Leu Cys Leu Gly Ser Gln Leu Ala Gln Ser Gln Val Leu Phe
            20                  25                  30
Gln Gly Phe Asn Trp Glu Ser Trp Lys Lys Gln Gly Gly Trp Tyr Asn
        35                  40                  45
Tyr Leu Leu Gly Arg Val Asp Asp Ile Ala Ala Thr Gly Ala Thr His
    50                  55                  60
Val Trp Leu Pro Gln Pro Ser His Ser Val Ala Pro Gln Gly Tyr Met
65                  70                  75                  80
Pro Gly Arg Leu Tyr Asp Leu Asp Ala Ser Lys Tyr Gly Thr His Ala
                85                  90                  95
Glu Leu Lys Ser Leu Thr Ala Ala Phe His Ala Lys Gly Val Gln Cys
            100                 105                 110
Val Ala Asp Val Val Ile Asn His Arg Cys Ala Asp Tyr Lys Asp Gly
        115                 120                 125
Arg Gly Ile Tyr Cys Val Phe Glu Gly Gly Thr Pro Asp Ser Arg Leu
    130                 135                 140
Asp Trp Gly Pro Asp Met Ile Cys Ser Asp Asp Thr Gln Tyr Ser Asn
145                 150                 155                 160
Gly Arg Gly His Arg Asp Thr Gly Ala Asp Phe Ala Ala Ala Pro Asp
                165                 170                 175
Ile Asp His Leu Asn Pro Arg Val Gln Gln Glu Leu Ser Asp Trp Leu
            180                 185                 190
Asn Trp Leu Lys Ser Asp Leu Gly Phe Asp Gly Trp Arg Leu Asp Phe
        195                 200                 205
Ala Lys Gly Tyr Ser Ala Ala Val Ala Lys Val Tyr Val Asp Ser Thr
    210                 215                 220
Ala Pro Thr Phe Val Val Ala Glu Ile Trp Ser Ser Leu His Tyr Asp
225                 230                 235                 240
Gly Asn Gly Glu Pro Ser Ser Asn Gln Asp Ala Asp Arg Gln Glu Leu
                245                 250                 255
Val Asn Trp Ala Gln Ala Val Gly Gly Pro Ala Ala Ala Phe Asp Phe
            260                 265                 270
Thr Thr Lys Gly Val Leu Gln Ala Ala Val Gln Gly Glu Leu Trp Arg
        275                 280                 285
Met Lys Asp Gly Asn Gly Lys Ala Pro Gly Met Ile Gly Trp Leu Pro
    290                 295                 300
Glu Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gly Ser Thr Gln
305                 310                 315                 320
Asn Ser Trp Pro Phe Pro Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr
                325                 330                 335
Ile Leu Thr His Pro Gly Thr Pro Cys Ile Phe Tyr Asp His Val Phe
            340                 345                 350
Asp Trp Asn Leu Lys Gln Glu Ile Ser Ala Leu Ser Ala Val Arg Ser
        355                 360                 365
Arg Asn Gly Ile His Pro Gly Ser Glu Leu Asn Ile Leu Ala Ala Asp
    370                 375                 380
Gly Asp Leu Tyr Val Ala Lys Ile Asp Asp Lys Val Ile Val Lys Ile
385                 390                 395                 400
Gly Ser Arg Tyr Asp Val Gly Asn Leu Ile Pro Ser Asp Phe His Ala
                405                 410                 415
Val Ala His Gly Asn Asn Tyr Cys Val Trp Glu Lys His Gly Leu Arg
            420                 425                 430
Val Pro Ala Gly Arg His His
        435
<210>52
<211>1320
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>52
atggcgaagc  acttggctgc  catgtgctgg  tgcagcctcc  tagtgcttgt  actgctctgc  60
ttgggctccc  agctggccca  atcccaggtc  ctcttccagg  ggttcaactg  ggagtcgtgg  120
aagaagcaag  gtgggtggta  caactacctc  ctggggcggg  tggacgacat  cgccgcgacg  180
ggggccacgc  acgtctggct  cccgcagccg  tcgcactcgg  tggcgccgca  ggggtacatg  240
cccggccggc  tctacgacct  ggacgcgtcc  aagtacggca  cccacgcgga  gctcaagtcg  300
ctcaccgcgg  cgttccacgc  caagggcgtc  cagtgcgtcg  ccgacgtcgt  gatcaaccac  360
cgctgcgccg  actacaagga  cggccgcggc  atctactgcg  tcttcgaggg  cggcacgccc  420
gacagccgcc  tcgactgggg  ccccgacatg  atctgcagcg  acgacacgca  gtactccaac  480
gggcgcgggc  accgcgacac  gggggccgac  ttcgccgccg  cgcccgacat  cgaccacctc  540
aacccgcgcg  tgcagcagga  gctctcggac  tggctcaact  ggctcaagtc  cgacctcggc  600
ttcgacggct  ggcgcctcga  cttcgccaag  ggctactccg  ccgccgtcgc  caaggtgtac  660
gtcgacagca  ccgcccccac  cttcgtcgtc  gccgagatat  ggagctccct  ccactacgac  720
ggcaacggcg  agccgtccag  caaccaggac  gccgacaggc  aggagctggt  caactgggcg  780
caggcggtgg  gcggccccgc  cgcggcgttc  gacttcacca  ccaagggcgt  gctgcaggcg  840
gccgtccagg  gcgagctgtg  gcgcatgaag  gacggcaacg  gcaaggcgcc  cgggatgatc  900
ggctggctgc  cggagaaggc  cgtcacgttc  gtcgacaacc  acgacaccgg  ctccacgcag  960
aactcgtggc  cattcccctc  cgacaaggtc  atgcagggct  acgcctatat  cctcacgcac  1020
ccaggaactc  catgcatctt  ctacgaccac  gttttcgact  ggaacctgaa  gcaggagatc  1080
agcgcgctgt  ctgcggtgag  gtcaagaaac  gggatccacc  cggggagcga  gctgaacatc  1140
ctcgccgccg  acggggatct  ctacgtcgcc  aagattgacg  acaaggtcat  cgtgaagatc  1200
gggtcacggt  acgacgtcgg  gaacctgatc  ccctcagact  tccacgccgt  tgcccctggc  1260
aacaactact  gcgtttggga  gaagcacggt  ctgagagttc  cagcggggcg  gcaccactag  1320
<210>53
<211>45
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>53
Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr Thr Gly Ser Gly Gly
 1               5                  10                  15
Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala Ser Lys Thr Ser Thr
            20                  25                  30
Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val
        35                  40                  45
<210>54
<211>137
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>54
gccaccggcg  gcaccaccac  caccgccacc  accaccggct  ccggcggcgt  gacctccacc  60
tccaagacca  ccaccaccgc  ctccaagacc  tccaccacca  cctcctccac  ctcctgcacc  120
accccgaccg  ccgtgt c                                                    137
<210>55
<211>300
<212>PRT
<213>激烈火球菌
<400>55
Ile Tyr Phe Val Glu Lys Tyr His Thr Ser Glu Asp Lys Ser Thr Ser
 1               5                  10                  15
Asn Thr Ser Ser Thr Pro Pro Gln Thr Thr Leu Ser Thr Thr Lys Val
            20                  25                  30
Leu Lys Ile Arg Tyr Pro Asp Asp Gly Glu Trp Pro Gly Ala Pro Ile
        35                  40                  45
Asp Lys Asp Gly Asp Gly Asn Pro Glu Phe Tyr Ile Glu Ile Asn Leu
    50                  55                  60
Trp Asn Ile Leu Asn Ala Thr Gly Phe Ala Glu Met Thr Tyr Asn Leu
65                  70                  75                  80
Thr Ser Gly Val Leu His Tyr Val Gln Gln Leu Asp Asn Ile Val Leu
                85                  90                  95
Arg Asp Arg Ser Asn Trp Val His Gly Tyr Pro Glu Ile Phe Tyr Gly
            100                 105                 110
Asn Lys Pro Trp Asn Ala Asn Tyr Ala Thr Asp Gly Pro Ile Pro Leu
        115                 120                 125
Pro Ser Lys Val Ser Asn Leu Thr Asp Phe Tyr Leu Thr Ile Ser Tyr
    130                 135                 140
Lys Leu Glu Pro Lys Asn Gly Leu Pro Ile Asn Phe Ala Ile Glu Ser
145                 150                 155                 160
Trp Leu Thr Arg Glu Ala Trp Arg Thr Thr Gly Ile Asn Ser Asp Glu
                165                 170                 175
Gln Glu Val Met Ile Trp Ile Tyr Tyr Asp Gly Leu Gln Pro Ala Gly
            180                 185                 190
Ser Lys Val Lys Glu Ile Val Val Pro Ile Ile Val Asn Gly Thr Pro
        195                 200                 205
Val Asn Ala Thr Phe Glu Val Trp Lys Ala Asn Ile Gly Trp Glu Tyr
    210                 215                 220
Val Ala Phe Arg Ile Lys Thr Pro Ile Lys Glu Gly Thr Val Thr Ile
225                 230                 235                 240
Pro Tyr Gly Ala Phe Ile Ser Val Ala Ala Asn Ile Ser Ser Leu Pro
                245                 250                 255
Asn Tyr Thr Glu Leu Tyr Leu Glu Asp Val Glu Ile Gly Thr Glu Phe
            260                 265                 270
Gly Thr Pro Ser Thr Thr Ser Ala His Leu Glu Trp Trp Ile Thr Asn
        275                 280                 285
Ile Thr Leu Thr Pro Leu Asp Arg Pro Leu Ile Ser
    290                 295                 300
<210>56
<211>903
<212>DNA
<213>激烈火球菌
<400>56
atctacttcg  tggagaagta  ccacacctcc  gaggacaagt  ccacctccaa  cacctcctcc  60
accccgccgc  agaccaccct  ctccaccacc  aaggtgctca  agatccgcta  cccggacgac  120
ggcgagtggc  ccggcgcccc  gatcgacaag  gacggcgacg  gcaacccgga  gttctacatc  180
gagatcaacc  tctggaacat  cctcaacgcc  accggcttcg  ccgagatgac  ctacaacctc  240
actagtggcg  tgctccacta  cgtgcagcag  ctcgacaaca  tcgtgctccg  cgaccgctcc  300
aactgggtgc  acggctaccc  ggaaatcttc  tacggcaaca  agccgtggaa  cgccaactac  360
gccaccgacg  gcccgatccc  gctcccgtcc  aaggtgtcca  acctcaccga  cttctacctc  420
accatctcct  acaagctcga  gccgaagaac  ggtctcccga  tcaacttcgc  catcgagtcc  480
tggctcaccc  gcgaggcctg  gcgcaccacc  ggcatcaact  ccgacgagca  ggaggtgatg  540
atctggatct  actacgacgg  cctccagccc  gcgggctcca  aggtgaagga  gatcgtggtg  600
ccgatcatcg  tgaacggcac  cccggtgaac  gccaccttcg  aggtgtggaa  ggccaacatc  660
ggctgggagt  acgtggcctt  ccgcatcaag  accccgatca  aggagggcac  cgtgaccatc  720
ccgtacggcg  ccttcatctc  cgtggccgcc  aacatctcct  ccctcccgaa  ctacaccgag  780
aagtacctcg  aggacgtgga  gatcggcacc  gagttcggca  ccccgtccac  cacctccgcc  840
cacctcgagt  ggtggatcac  caacatcacc  ctcaccccgc  tcgaccgccc  gctcatctcc  900
tag                                                                     903
<210>57
<211>387
<212>PRT
<213>黄栖热菌
<400>57
Met Tyr Glu Pro Lys Pro Glu His Arg Phe Thr Phe Gly Leu Trp Thr
 1               5                  10                  15
Val Asp Asn Val Asp Arg Asp Pro Phe Gly Asp Thr Val Arg Glu Arg
            20                  25                  30
Leu Asp Pro Val Tyr Val Val His Lys Leu Ala Glu Leu Gly Ala Tyr
        35                  40                  45
Gly Val Asn Leu His Asp Glu Asp Leu Ile Pro Arg Gly Thr Pro Pro
    50                  55                  60
Gln Glu Arg Asp Gln Ile Val Arg Arg Phe Lys Lys Ala Leu Asp Glu
65                  70                  75                  80
Thr Val Leu Lys Val Pro Met Val Thr Ala Asn Leu Phe Ser Glu Pro
                85                  90                  95
Ala Phe Arg Asp Gly Ala Ser Thr Thr Arg Asp Pro Trp Val Trp Ala
            100                 105                 110
Tyr Ala Leu Arg Lys Ser Leu Glu Thr Met Asp Leu Gly Ala Glu Leu
        115                 120                 125
Gly Ala Glu Ile Tyr Met Phe Trp Met Val Arg Glu Arg Ser Glu Val
    130                 135                 140
Glu Ser Thr Asp Lys Thr Arg Lys Val Trp Asp Trp Val Arg Glu Thr
145                 150                 155                 160
Leu Asn Phe Met Thr Ala Tyr Thr Glu Asp Gln Gly Tyr Gly Tyr Arg
                165                 170                 175
Phe Ser Val Glu Pro Lys Pro Asn Glu Pro Arg Gly Asp Ile Tyr Phe
            180                 185                 190
Thr Thr Val Gly Ser Met Leu Ala Leu Ile His Thr Leu Asp Arg Pro
        195                 200                 205
Glu Arg Phe Gly Leu Asn Pro Glu Phe Ala His Glu Thr Met Ala Gly
    210                 215                 220
Leu Asn Phe Asp His Ala Val Ala Gln Ala Val Asp Ala Gly Lys Leu
225                 230                 235                 240
Phe His Ile Asp Leu Asn Asp Gln Arg Met Ser Arg Phe Asp Gln Asp
                245                 250                 255
Leu Arg Phe Gly Ser Glu Asn Leu Lys Ala Gly Phe Phe Leu Val Asp
            260                 265                 270
Leu Leu Glu Ser Ser Gly Tyr Gln Gly Pro Arg His Phe Glu Ala His
        275                 280                 285
Ala Leu Arg Thr Glu Asp Glu Glu Gly Val Trp Thr Phe Val Arg Val
    290                 295                 300
Cys Met Arg Thr Tyr Leu Ile Ile Lys Val Arg Ala Glu Thr Phe Arg
305                 310                 315                 320
Glu Asp Pro Glu Val Lys Glu Leu Leu Ala Ala Tyr Tyr Gln Glu Asp
                325                 330                 335
Pro Ala Thr Leu Ala Leu Leu Asp Pro Tyr Ser Arg Glu Lys Ala Glu
            340                 345                 350
Ala Leu Lys Arg Ala Glu Leu Pro Leu Glu Thr Lys Arg Arg Arg Gly
        355                 360                 365
Tyr Ala Leu Glu Arg Leu Asp Gln Leu Ala Val Glu Tyr Leu Leu Gly
    370                 375                 380
Val Arg Gly
385
<210>58
<211>978
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>58
atggggaaga  acggcaacct  gtgctgcttc  tctctgctgc  tgcttcttct  cgccgggttg  60
gcgtccggcc  atcaaatcta  cttcgtggag  aagtaccaca  cctccgagga  caagtccacc  120
tccaacacct  cctccacccc  gccgcagacc  accctctcca  ccaccaaggt  gctcaagatc  180
cgctacccgg  acgacggtga  gtggcccggc  gccccgatcg  acaaggacgg  cgacggcaac  240
ccggagttct  acatcgagat  caacctctgg  aacatcctca  acgccaccgg  cttcgccgag  300
atgacctaca  acctcactag  tggcgtgctc  cactacgtgc  agcagctcga  caacatcgtg  360
ctccgcgacc  gctccaactg  ggtgcacggc  tacccggaaa  tcttctacgg  caacaagccg  420
tggaacgcca  actacgccac  cgacggcccg  atcccgctcc  cgtccaaggt  gtccaacctc  480
accgacttct  acctcaccat  ctcctacaag  ctcgagccga  agaacggtct  cccgatcaac  540
ttcgccatcg  agtcctggct  cacccgcgag  gcctggcgca  ccaccggcat  caactccgac  600
gagcaggagg  tgatgatctg  gatctactac  gacggcctcc  agcccgcggg  ctccaaggtg  660
aaggagatcg  tggtgccgat  catcgtgaac  ggcaccccgg  tgaacgccac  cttcgaggtg  720
tggaaggcca  acatcggctg  ggagtacgtg  gccttccgca  tcaagacccc  gatcaaggag  780
ggcaccgtga  ccatcccgta  cggcgccttc  atctccgtgg  ccgccaacat  ctcctccctc  840
ccgaactaca  ccgagaagta  cctcgaggac  gtggagatcg  gcaccgagtt  cggcaccccg  900
tccaccacct  ccgcccacct  cgagtggtgg  atcaccaaca  tcaccctcac  cccgctcgac  960
cgcccgctca  tctcctag                                                    978
<210>59
<211>1920
<212>DNA
<213>黑色曲霉
<400>59
atgtccttcc  gctccctcct  cgccctctcc  ggcctcgtgt  gcaccggcct  cgccaacgtg  60
atctccaagc  gcgccaccct  cgactcctgg  ctctccaacg  aggccaccgt  ggcccgcacc  120
gccatcctca  acaacatcgg  cgccgacggc  gcctgggtgt  ccggcgccga  ctccggcatc  180
gtggtggcct  ccccgtccac  cgacaacccg  gactacttct  acacctggac  ccgcgactcc  240
ggcctcgtgc  tcaagaccct  cgtggacctc  ttccgcaacg  gcgacacctc  cctcctctcc  300
accatcgaga  actacatctc  cgcccaggcc  atcgtgcagg  gcatctccaa  cccgtccggc  360
gacctctcct  ccggcgccgg  cctcggcgag  ccgaagttca  acgtggacga  gaccgcctac  420
accggctcct  ggggccgccc  gcagcgcgac  ggcccggccc  tccgcgccac  cgccatgatc  480
ggcttcggcc  agtggctcct  cgacaacggc  tacacctcca  ccgccaccga  catcgtgtgg  540
ccgctcgtgc  gcaacgacct  ctcctacgtg  gcccagtact  ggaaccagac  cggctacgac  600
ctctgggagg  aggtgaacgg  ctcctccttc  ttcaccatcg  ccgtgcagca  ccgcgccctc  660
gtggagggct  ccgccttcgc  caccgccgtg  ggctcctcct  gctcctggtg  cgactcccag  720
gccccggaga  tcctctgcta  cctccagtcc  ttctggaccg  gctccttcat  cctcgccaac  780
ttcgactcct  cccgctccgg  caaggacgcc  aacaccctcc  tcggctccat  ccacaccttc  840
gacccggagg  ccgcctgcga  cgactccacc  ttccagccgt  gctccccgcg  cgccctcgcc  900
aaccacaagg  aggtggtgga  ctccttccgc  tccatctaca  ccctcaacga  cggcctctcc  960
gactccgagg  ccgtggccgt  gggccgctac  ccggaggaca  cctactacaa  cggcaacccg  1020
tggttcctct  gcaccctcgc  cgccgccgag  cagctctacg  acgccctcta  ccagtgggac  1080
aagcagggct  ccctcgaggt  gaccgacgtg  tccctcgact  tcttcaaggc  cctctactcc  1140
gacgccgcca  ccggcaccta  ctcctcctcc  tcctccacct  actcctccat  cgtggacgcc  1200
gtgaagacct  tcgccgacgg  cttcgtgtcc  atcgtggaga  cccacgccgc  ctccaacggc  1260
tccatgtccg  agcagtacga  caagtccgac  ggcgagcagc  tctccgcccg  cgacctcacc  1320
tggtcctacg  ccgccctcct  caccgccaac  aaccgccgca  actccgtggt  gccggcctcc  1380
tggggcgaga  cctccgcctc  ctccgtgccg  ggcacctgcg  ccgccacctc  cgccatcggc  1440
acctactcct  ccgtgaccgt  gacctcctgg  ccgtccatcg  tggccaccgg  cggcaccacc  1500
accaccgcca  ccccgaccgg  ctccggctcc  gtgacctcca  cctccaagac  caccgccacc  1560
gcctccaaga  cctccacctc  cacctcctcc  acctcctgca  ccaccccgac  cgccgtggcc  1620
gtgaccttcg  acctcaccgc  caccaccacc  tacggcgaga  acatctacct  cgtgggctcc  1680
atctcccagc  tcggcgactg  ggagacctcc  gacggcatcg  ccctctccgc  cgacaagtac  1740
acctcctccg  acccgctctg  gtacgtgacc  gtgaccctcc  cggccggcga  gtccttcgag  1800
tacaagttca  tccgcatcga  gtccgacgac  tccgtggagt  gggagtccga  cccgaaccgc  1860
gagtacaccg  tgccgcaggc  ctgcggcacc  tccaccgcca  ccgtgaccga  cacctggcgc  1920
<210>60
<211>6
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>60
Ser Glu Lys Asp Glu Leu
 1               5

Claims (29)

1.表达盒,含有编码α-淀粉酶的多核苷酸、与酶编码多核苷酸可操作连接的启动子和编码与所述酶可操作连接的信号序列的多核苷酸,其中所述信号序列将α-淀粉酶导向特定区室,使该α-淀粉酶以不会与其底物相接触的方式定位。
2.权利要求1的表达盒,其中通过研磨或加热细胞或植物组织来破坏含有该α-淀粉酶的植物细胞或器官的完整性,能够使该酶接触其底物。
3.权利要求1或2的表达盒,所述酶编码多核苷酸a)包含SEQID NO:2或9或其互补序列,或b)与SEQ ID NO:2或9所示序列具有至少99%一致性并且编码具有α-淀粉酶活性的多肽。
4.权利要求3的表达盒,所述酶编码多核苷酸包含SEQ ID NO:2或9或其互补序列。
5.权利要求1的表达盒,其中所述启动子为组织特异性启动子。
6.权利要求5的表达盒,其中所述启动子为种子特异性启动子。
7.权利要求5的表达盒,其中所述启动子为胚乳特异性启动子。
8.权利要求7的表达盒,其中所述胚乳特异性启动子为玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子。
9.权利要求1的表达盒,其中所述信号序列将所述α-淀粉酶导向植物的液泡,内质网,叶绿体,种子或细胞壁。
10.权利要求9的表达盒,其中所述信号序列将所述α-淀粉酶导向植物的内质网。
11.权利要求1的表达盒,其中所述启动子是为胚乳特异性启动子,而所述信号序列将所述α-淀粉酶导向植物的内质网。
12.权利要求11的表达盒,其中所述胚乳特异性启动子为玉米γ-玉米醇溶蛋白启动子。
13.含有权利要求1-12任一项的表达盒的载体。
14.含有权利要求13的载体的细胞。
15.权利要求14的细胞,其中所述细胞选自:土壤杆菌属细胞,单子叶植物细胞,双子叶植物细胞,Liliopsida细胞,和Panicoideae细胞。
16.权利要求15的细胞,其中所述细胞为单子叶植物细胞。
17.权利要求15的细胞,其中所述细胞为谷类细胞。
18.权利要求17的细胞,其中所述细胞为玉米细胞。
19.制备转基因植物的方法,包括用权利要求13的载体转化植物细胞,并从所述被转化的植物细胞再生植物。
20.制备水解的淀粉产物溶液的方法,包括
a)将含有淀粉颗粒和α-淀粉酶的植物部分在活化所述α-淀粉酶的条件下处理,由此加工淀粉颗粒以形成含有水解的淀粉产物的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组中增加了权利要求1-12中任何一项的表达盒;以及
b)收集含有水解的淀粉产物的水性溶液。
21.制备乙醇的方法,包括如下步骤:
a)将含有α-淀粉酶的植物部分在能够活化所述α-淀粉酶的条件下处理,从而消化多糖以形成寡糖或可发酵糖,其中所述植物部分获自转化的植物,所述植物的基因组中增加了权利要求1-12中任何一项的表达盒;以及
b)在促进可发酵糖或寡糖转化为乙醇的条件下,孵育可发酵糖。
22.权利要求20或21的方法,其中所述α-淀粉酶是耐高温的。
23.权利要求20或21的方法,其中所述植物为单子叶植物。
24.权利要求23的方法,其中所述植物为谷类植物。
25.权利要求24的方法,其中所述植物为玉米。
26.权利要求20或21的方法,其中所述活化所述α-淀粉酶的条件选自研磨所述植物部分或加热所述植物部分。
27.一种不加入额外甜味剂而生产增甜谷粉制食品的方法,包括
a)将含有α-淀粉酶的植物部分在活化所述α-淀粉酶的条件下处理,由此加工植物部分中的淀粉颗粒为糖,从而形成增甜产品,其中所述植物部分获自转化的植物,所述植物的基因组中增加了权利要求1-12中任何一项的表达盒;以及
b)将所述增甜产品加工成谷粉制食品。
28.一种不加入甜味剂而增甜含淀粉产品的方法,包括
a)将含有α-淀粉酶的淀粉在能够活化所述α-淀粉酶的条件下处理,由此消化淀粉以形成糖从而形成增甜淀粉,其中所述淀粉获自转化的植物,所述植物的基因组中增加了权利要求1-12中任何一项的表达盒;以及
b)将所述增甜淀粉加入产品中以制成增甜的含淀粉产品。
29.增甜含多糖水果或蔬菜的方法,包括将含有α-淀粉酶的水果或蔬菜在活化所述α-淀粉酶的条件下处理,从而加工水果或蔬菜中的多糖以形成糖,产生增甜水果或蔬菜,其中所述水果或蔬菜获自转化的植物,所述植物的基因组中增加了权利要求1-12中任何一项的表达盒。
CN028198565A 2001-08-27 2002-08-27 自加工的植物及植物部分 Expired - Lifetime CN1564866B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US31528101P 2001-08-27 2001-08-27
US60/315,281 2001-08-27
PCT/US2002/027129 WO2003018766A2 (en) 2001-08-27 2002-08-27 Self-processing plants and plant parts

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNA2006100090338A Division CN1821412A (zh) 2001-08-27 2002-08-27 自加工的植物及植物部分

Publications (2)

Publication Number Publication Date
CN1564866A CN1564866A (zh) 2005-01-12
CN1564866B true CN1564866B (zh) 2010-09-08

Family

ID=23223692

Family Applications (2)

Application Number Title Priority Date Filing Date
CN028198565A Expired - Lifetime CN1564866B (zh) 2001-08-27 2002-08-27 自加工的植物及植物部分
CNA2006100090338A Pending CN1821412A (zh) 2001-08-27 2002-08-27 自加工的植物及植物部分

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA2006100090338A Pending CN1821412A (zh) 2001-08-27 2002-08-27 自加工的植物及植物部分

Country Status (17)

Country Link
US (4) US7102057B2 (zh)
EP (1) EP1432798B1 (zh)
JP (1) JP2005503153A (zh)
KR (1) KR20040029122A (zh)
CN (2) CN1564866B (zh)
AR (2) AR036370A1 (zh)
AT (1) ATE488585T1 (zh)
AU (1) AU2002332666B2 (zh)
BR (1) BR0212170A (zh)
CA (1) CA2457477C (zh)
DE (1) DE60238339D1 (zh)
HU (1) HU228266B1 (zh)
MX (1) MXPA04001802A (zh)
RS (1) RS18304A (zh)
RU (1) RU2312144C2 (zh)
WO (1) WO2003018766A2 (zh)
ZA (1) ZA200401480B (zh)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2263726C (en) * 1996-09-12 2009-12-29 Novartis Ag Transgenic plants expressing cellulolytic enzymes
US7612251B2 (en) 2000-09-26 2009-11-03 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
US7659102B2 (en) 2001-02-21 2010-02-09 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
WO2002068597A2 (en) * 2001-02-21 2002-09-06 Diversa Corporation Enzymes having alpha amylase activity and methods of use thereof
JP2005503153A (ja) * 2001-08-27 2005-02-03 シンジェンタ パーティシペーションズ アクチェンゲゼルシャフト 自己加工植物及び植物部分
US8558058B2 (en) * 2001-12-06 2013-10-15 Applied Biotechnology Institute Monocotyledonous seed expressing exo-1,4B-glucanase
CN1633501B (zh) 2002-01-08 2010-10-27 迈克尔·R·拉尔布 表达civps或内含肽修饰蛋白的转基因植物及其制备方法
CN1330770C (zh) * 2002-02-14 2007-08-08 诺维信公司 淀粉加工方法
AU2003285906A1 (en) * 2002-10-31 2004-06-07 Diversa Corporation Amylases, nucleic acids encoding them and methods for making and using them
SE0400565D0 (sv) * 2004-03-07 2004-03-07 Doris Staahle Reglering av teleskopiskt rörliga element
CA2515340C (en) * 2003-03-06 2016-04-26 Diversa Corporation Amylases, nucleic acids encoding them and methods for making and using them
CN102210376B (zh) * 2003-03-10 2014-12-31 波伊特研究股份有限公司 利用生淀粉生产乙醇的方法
US7667096B2 (en) 2003-06-03 2010-02-23 University Of Georgia Research Foundation, Inc. Conditional sterility in plants
US7306935B2 (en) 2003-06-25 2007-12-11 Novozymes North America, Inc Polypeptides having alpha-amylase activity and polypeptides encoding same
CA2530427C (en) * 2003-06-27 2015-02-10 Monsanto Technology Llc Elevation of oil levels in plants
US7491811B2 (en) * 2004-01-15 2009-02-17 University Of Georgia Research Foundation, Inc. Repressor-mediated tissue-specific gene expression in plants
US7855323B2 (en) * 2004-02-10 2010-12-21 Monsanto Technology Llc Recombinant DNA for gene suppression
CA2558621C (en) * 2004-03-08 2013-04-30 Syngenta Participations Ag Promoter from maize prolamin seed storage protein and uses thereof
RS20060506A (en) * 2004-03-08 2008-04-04 Syngenta Participations Ag., Self-processing plants and plant parts
US20080050775A1 (en) * 2004-04-13 2008-02-28 Burr John N Iii Methods for Recovering Products From Plants
AU2005235311B2 (en) * 2004-04-20 2009-10-08 Syngenta Participations Ag Regulatory sequences for expressing gene products in plant reproductive tissue
CN101094921A (zh) * 2004-05-19 2007-12-26 阿格芮维达有限公司 表达内含肽修饰蛋白的转基因植物及相关生物药物的生产过程
US7662918B2 (en) * 2005-03-03 2010-02-16 Simpson Biotech Co., Ltd. Recombinant protein comprising starch binding domain and use thereof
EP1868426B1 (en) * 2005-03-16 2018-02-21 Syngenta Participations AG Corn event 3272 and methods of detection thereof
US7919289B2 (en) 2005-10-10 2011-04-05 Poet Research, Inc. Methods and systems for producing ethanol using raw starch and selecting plant material
US20070269820A1 (en) * 2005-12-16 2007-11-22 Syngenta Participations Ag Methods for the detection of nucleic acid encoding ALPHA-amylase
EP1989303A2 (en) 2006-02-27 2008-11-12 Edenspace System Corporation Energy crops for improved biofuel feedstocks
US7968318B2 (en) 2006-06-06 2011-06-28 Genencor International, Inc. Process for conversion of granular starch to ethanol
AU2007262978A1 (en) * 2006-06-22 2007-12-27 Novozymes A/S Preparation of dough and baked products
DK2069389T3 (en) 2006-08-04 2015-01-12 Bp Corp North America Inc Glucanases, nucleic acids encoding them, and processes for their preparation and use
PL2617823T3 (pl) 2006-09-21 2015-12-31 Basf Enzymes Llc Fitazy, kodujące je kwasy nukleinowe oraz sposoby ich wytwarzania i stosowania
CN101605809A (zh) * 2006-10-31 2009-12-16 善笙生物科技股份有限公司 淀粉吸附区域及其用途
US8062872B2 (en) * 2006-11-01 2011-11-22 Inland Environmental Resources, Inc. Methods and compositions for optimizing fermentation
ES2620288T3 (es) 2006-12-21 2017-06-28 Basf Enzymes Llc Amilasas y glucoamilasas, ácidos nucleicos que las codifican y métodos para formarlas y utilizarlas
WO2008095033A2 (en) 2007-01-30 2008-08-07 Verenium Corporation Enzymes for the treatment of lignocellulosics, nucleic acids encoding them and methods for making and using them
US7914993B2 (en) * 2007-06-01 2011-03-29 Syngenta Participations Ag. Process for starch liquefaction and fermentation
US7915020B2 (en) * 2007-06-01 2011-03-29 Syngenta Participations Ag Process for starch liquefaction and fermentation
US7727726B2 (en) * 2007-06-01 2010-06-01 Syngenta Participations Ag Process for starch liquefaction and fermentation
CA2974319C (en) * 2007-06-01 2019-04-30 Syngenta Participations Ag Methods for the commercial production of transgenic plants
US20090047385A1 (en) * 2007-08-15 2009-02-19 The Quaker Oats Company Natural oat-derived sweetener
WO2009048917A2 (en) * 2007-10-12 2009-04-16 Archer-Daniels-Midland Company Increased fiber hydrolysis by protease addition
JP5695422B2 (ja) 2007-11-27 2015-04-08 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼーション デンプン代謝改変植物
US20090205075A1 (en) * 2008-01-30 2009-08-13 Stacy Miles Use of plastid transit peptides derived from glaucocystophytes
MX2010008358A (es) * 2008-02-04 2010-08-30 Danisco Us Inc Variantes de alfa-amilasa de bacillus stearothermophilus y usos de las mismas.
US9816119B2 (en) 2008-02-29 2017-11-14 Syngenta Participations Ag Methods for starch hydrolysis
US8252566B2 (en) * 2008-05-20 2012-08-28 Jj Florida Properties Llc Ethanol production from citrus waste through limonene reduction
WO2009143059A1 (en) * 2008-05-20 2009-11-26 Inventus Holdings, Llc Removal of fermentation inhibiting compounds from citrus waste using solvent extraction and production of ethanol
US8153006B1 (en) 2008-06-05 2012-04-10 Procorp Enterprises, Llc Anaerobic treatment process for ethanol production
US9127287B2 (en) * 2008-06-11 2015-09-08 Syngenta Participations Ag Compositions and methods for producing fermentable carbohydrates
WO2010006152A2 (en) * 2008-07-09 2010-01-14 The Board Of Regents For Oklahoma State University Thermocellulases for lignocellulosic degradation
WO2010022186A1 (en) * 2008-08-19 2010-02-25 The Regents Of The University Of California Production of cellulase enzymes in plant hosts using transient agroinfiltration
US8563931B2 (en) * 2008-11-25 2013-10-22 Syngenta Participations Ag System for providing a calibration for a testing device used to evaluate ethanol production yield, and associated method
EP2401385A4 (en) * 2009-02-25 2012-10-10 Syngenta Participations Ag METHOD FOR INCREASING THE STRENGTH CONTENT IN PLANT PISTONS
GB0903346D0 (en) 2009-02-27 2009-04-08 Cambridge Advanced Tech Transgenic Plants
US8450094B1 (en) 2009-03-03 2013-05-28 Poet Research, Inc. System for management of yeast to facilitate the production of ethanol
US9068206B1 (en) 2009-03-03 2015-06-30 Poet Research, Inc. System for treatment of biomass to facilitate the production of ethanol
US20100240082A1 (en) * 2009-03-18 2010-09-23 Syngenta Participations Ag Methods for detecting and measuring polysaccharide-hydrolyzing enzymes
AU2010249500B2 (en) 2009-05-21 2016-03-24 Basf Enzymes Llc Phytases, nucleic acids encoding them and methods for making and using them
US8278507B2 (en) * 2009-06-02 2012-10-02 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
JP5641179B2 (ja) * 2009-07-22 2014-12-17 公立大学法人大阪府立大学 浸透物質保持穀類
CN101629132B (zh) * 2009-07-25 2012-05-30 郭德军 一种用于啤酒发酵的玉米淀粉糖浆的制备方法
PE20121504A1 (es) 2009-08-19 2012-11-05 Dupont Nutrition Biosci Aps Variantes de glucoamilasa
US8420387B2 (en) * 2009-11-06 2013-04-16 Agrivida, Inc. Intein-modified enzymes, their production and industrial applications
US9464333B2 (en) 2009-11-06 2016-10-11 Agrivida, Inc. Intein-modified enzymes, their production and industrial applications
US10407742B2 (en) 2009-11-06 2019-09-10 Agrivida, Inc. Intein-modified enzymes, their production and industrial applications
US10443068B2 (en) 2010-06-25 2019-10-15 Agrivida, Inc. Plants with engineered endogenous genes
US9598700B2 (en) 2010-06-25 2017-03-21 Agrivida, Inc. Methods and compositions for processing biomass with elevated levels of starch
CA2811789A1 (en) 2010-10-06 2012-04-12 Bp Corporation North America Inc. Variant cbh i polypeptides with reduced product inhibition
CA2829207C (en) 2011-03-07 2022-10-11 Agrivida, Inc. Consolidated pretreatment and hydrolysis of plant biomass expressing cell wall degrading enzymes
US9512495B2 (en) 2011-04-07 2016-12-06 Virdia, Inc. Lignocellulose conversion processes and products
US10308948B2 (en) 2011-07-27 2019-06-04 Applied Biotechnology Institute, Inc. Method of increasing expression of nucleic acid molecules in plants using multiple transcription units
CA3060976C (en) 2012-05-03 2022-08-23 Virdia, Inc. Methods for treating lignocellulosic materials
CA2870830A1 (en) 2012-05-11 2013-11-14 Danisco Us Inc. Use of alpha-amylase from aspergillus clavatus for saccharification
WO2014042923A1 (en) 2012-09-13 2014-03-20 Indiana University Research & Technology Corporation Compositions and systems for conferring disease resistance in plants and methods of use thereof
AU2013344666B2 (en) * 2012-11-14 2019-05-02 Agrivida, Inc. Methods and compositions for processing biomass with elevated levels of starch
US9528097B2 (en) 2013-02-15 2016-12-27 Syngenta Participations Ag Method of extraction of an enzyme from plant or animal tissue
EP3795582B1 (en) 2014-12-12 2023-09-13 Syngenta Participations Ag Compositions and methods for controlling plant pests
CN112226466A (zh) 2015-01-07 2021-01-15 威尔迪亚公司 萃取和转化半纤维素糖的方法
BR112017021639A2 (pt) * 2015-04-10 2018-07-24 Syngenta Participations Ag composições de ração animal e métodos de uso
ES2951012T3 (es) * 2015-05-14 2023-10-17 Agrivida Inc Producción de glucanasa y métodos de uso de la misma
US11091815B2 (en) * 2015-05-27 2021-08-17 Virdia, Llc Integrated methods for treating lignocellulosic material
RU2590485C1 (ru) * 2015-08-12 2016-07-10 Олег Иванович Квасенков Способ производства хлебного кваса
CN105325285B (zh) * 2015-11-04 2017-08-01 文山壮族苗族自治州农业科学院 选育具有隐性双色颖壳标记水稻的方法
US11655311B2 (en) 2017-08-15 2023-05-23 Corn Products Development, Inc. Maltodextrin and process of making same
MX2020003483A (es) 2017-10-12 2020-07-20 Syngenta Participations Ag Composiciones de pienso para animales mejoradas y metodos de uso.
BR112020016306A2 (pt) 2018-02-12 2020-12-15 Curators Of The University Of Missouri Gene (saur) suprarregulado pequeno de auxina para o melhoramento da arquitetura do sistema radicular da planta, tolerância ao encharcamento, resistência à seca, e rendimento
CA3094764A1 (en) * 2018-03-26 2019-10-03 Lallemand Hungary Liquidity Management Llc Chimeric amylases comprising an heterologous starch binding domain
CN112522238A (zh) * 2020-12-30 2021-03-19 浙江大学 一种利用转基因玉米生产淀粉酶的方法
CN113584075B (zh) * 2021-08-31 2024-01-02 浙江大学 一种利用转基因大豆生产α-淀粉酶的方法及表达载体
WO2023130031A2 (en) * 2022-01-03 2023-07-06 Inari Agriculture Technology, Inc. Inot1824 transgenic maize
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
CN116178490A (zh) * 2022-07-08 2023-05-30 北京工商大学 一种高活性淀粉酶抑制活性肽及其制备方法和应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1513059A (zh) * 2001-02-21 2004-07-14 具有α淀粉酶活性的酶及其使用方法

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5096825A (en) * 1983-01-12 1992-03-17 Chiron Corporation Gene for human epidermal growth factor and synthesis and expression thereof
US5380831A (en) * 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
FI841500A0 (fi) 1984-04-13 1984-04-13 Valtion Teknillinen Foerfarande foer uppbygnande av cellulolytiska jaeststammar.
JP2530181B2 (ja) 1986-10-31 1996-09-04 花王株式会社 アルカリセルラ―ゼ遺伝子を含むdna断片並びに該dna断片を組み込んだ組換えプラスミド及び組換え微生物
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
DD282028A5 (de) 1989-02-16 1990-08-29 Akad Wissenschaften Ddr Verfahren zur herstellung einer thermostabilen, hybriden bacillus-beta-1,3-1,4-glukanase
AU638695B2 (en) 1989-02-16 1993-07-08 Akademie Der Wissenschaften Der Ddr A thermostable (1,3-1,4)-beta-glucanase
DK198089D0 (da) * 1989-04-24 1989-04-24 Danske Spritfabrikker Dna-materialer og anvendelse deraf
US5536655A (en) 1989-09-26 1996-07-16 Midwest Research Institute Gene coding for the E1 endoglucanase
PT97110B (pt) 1990-03-23 1998-11-30 Gist Brocades Nv Processo para catalisar reaccoes acelaraveis por enzimas, mediante adicao ao meio reaccional de sementes de plantas transgenicas e para obtencao das referidas sementes
US5543576A (en) 1990-03-23 1996-08-06 Mogen International Production of enzymes in seeds and their use
DE4009932A1 (de) * 1990-03-28 1991-10-02 Basf Lacke & Farben Verfahren zur herstellung eines mehrschichtigen ueberzuges, waessrige beschichtungszusammensetzungen, wasserverduennbare polyacrylatharze und verfahren zur herstellung von wasserverduennbaren polyacrylatharzen
US5168064A (en) 1990-04-20 1992-12-01 The Regents Of The University Of California Endo-1,4-β-glucanase gene and its use in plants
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
DK162790D0 (da) 1990-07-06 1990-07-06 Novo Nordisk As Plantecelle
US5705375A (en) * 1990-09-13 1998-01-06 Mogen International, N.V. Transgenic plants having a modified carbohydrate content
IE913215A1 (en) 1990-09-13 1992-02-25 Gist Brocades Nv Transgenic plants having a modified carbohydrate content
US5475101A (en) 1990-10-05 1995-12-12 Genencor International, Inc. DNA sequence encoding endoglucanase III cellulase
UA48104C2 (uk) * 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
US5366883A (en) * 1992-06-09 1994-11-22 Takara Shuzo Co., Ltd. α-amylase gene
US5578479A (en) * 1992-06-09 1996-11-26 The Johns Hopkins University Alpha-amylase from hyperthermophilic archaebacterium
US5670356A (en) * 1994-12-12 1997-09-23 Promega Corporation Modified luciferase
FR2736930B1 (fr) * 1995-07-17 1997-09-19 Biocem Procede de production, par des cellules vegetales, de proteines heminiques, proteines ainsi obtenues et produits contenant ces proteines
AU6504796A (en) * 1995-07-20 1997-02-18 Washington State University Research Foundation Production of secreted foreign polypeptides in plant cell culture
US5874304A (en) * 1996-01-18 1999-02-23 University Of Florida Research Foundation, Inc. Humanized green fluorescent protein genes and methods
CA2248023A1 (en) * 1996-03-05 1997-09-12 Friedrich Weissheimer Malzfabrik Process for the production of degradation and/or conversion products of storage substances present in transgenic plant material with the help of a malting process
US6366883B1 (en) * 1996-05-15 2002-04-02 Atr Interpreting Telecommunications Concatenation of speech segments by use of a speech synthesizer
CA2263726C (en) 1996-09-12 2009-12-29 Novartis Ag Transgenic plants expressing cellulolytic enzymes
US5981835A (en) * 1996-10-17 1999-11-09 Wisconsin Alumni Research Foundation Transgenic plants as an alternative source of lignocellulosic-degrading enzymes
AU2585297A (en) * 1997-03-20 1998-09-22 Prodigene, Inc. Methods of commercial production and extraction of protein from seed
NZ330940A (en) 1997-07-24 2000-02-28 F Production of consensus phytases from fungal origin using computer programmes
FR2778412B1 (fr) 1998-05-05 2002-08-09 Univ Reims Champagne Ardennes Procede pour preparer une enzyme alpha-amylase thermophile et enzyme ainsi obtenue
US6013860A (en) 1998-07-24 2000-01-11 Calgene Llc Expression of enzymes involved in cellulose modification
US6506592B1 (en) 1998-08-18 2003-01-14 Board Of Regents Of The University Of Nebraska Hyperthermophilic alpha-glucosidase gene and its use
WO2000011144A2 (en) * 1998-08-19 2000-03-02 Advanced Technologies (Cambridge) Limited Plastid-targeting nucleic acid sequence, beta-amylase sequence, a stimulus-responsive promoter and uses thereof
DK1165806T3 (da) 1999-03-31 2005-12-05 Cornell Res Foundation Inc Phosphataser med forbedret phytaseaktivitet
US6639126B1 (en) * 1999-12-06 2003-10-28 Pioneer Hi-Bred International, Inc. Production of modified polysaccharides
US20020006647A1 (en) * 2000-02-23 2002-01-17 Novozymes A/S Fermentation with a phytase
US6475101B2 (en) * 2000-07-17 2002-11-05 Bruce D. Burrows Metal wood golf club head with faceplate insert
WO2002034926A2 (en) 2000-10-20 2002-05-02 Michigan State University Transgenic plants containing ligninase and cellulase which degrade lignin and cellulose to fermentable sugars
JP2002138931A (ja) * 2000-11-06 2002-05-17 Denso Corp エンジン始動装置
US7560126B2 (en) * 2001-02-21 2009-07-14 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
JP2005503153A (ja) 2001-08-27 2005-02-03 シンジェンタ パーティシペーションズ アクチェンゲゼルシャフト 自己加工植物及び植物部分
US8558058B2 (en) 2001-12-06 2013-10-15 Applied Biotechnology Institute Monocotyledonous seed expressing exo-1,4B-glucanase
US6737563B2 (en) * 2002-01-16 2004-05-18 Academia Sinica Transgenic seeds expressing amylopullulanase and uses therefor
NL1020273C2 (nl) * 2002-03-28 2003-09-30 Ideepak Holding B V Sealinrichting.
CA2515340C (en) 2003-03-06 2016-04-26 Diversa Corporation Amylases, nucleic acids encoding them and methods for making and using them

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1513059A (zh) * 2001-02-21 2004-07-14 具有α淀粉酶活性的酶及其使用方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Leveque E,.Cloning and expression of an alpha-amylase encodinggenefrom the hyperthermophilic archaebacteriumThermococcushydrothermalis and biochemicalcharacterisation of therecombinant enzyme.FEMS MICROBIOLOGY LETTERS186 1.2000,186(1),67-71. *

Also Published As

Publication number Publication date
RS18304A (en) 2006-10-27
WO2003018766A2 (en) 2003-03-06
US20030135885A1 (en) 2003-07-17
RU2004109143A (ru) 2005-04-20
AU2002332666B2 (en) 2006-10-26
US20080045702A1 (en) 2008-02-21
US20090288232A1 (en) 2009-11-19
CA2457477C (en) 2014-07-08
JP2005503153A (ja) 2005-02-03
WO2003018766A3 (en) 2004-01-29
EP1432798A4 (en) 2005-10-12
MXPA04001802A (es) 2004-07-08
ZA200401480B (en) 2005-07-27
AR073856A2 (es) 2010-12-09
EP1432798A2 (en) 2004-06-30
CA2457477A1 (en) 2003-03-06
AR036370A1 (es) 2004-09-01
DE60238339D1 (de) 2010-12-30
CN1821412A (zh) 2006-08-23
US7102057B2 (en) 2006-09-05
US7855322B2 (en) 2010-12-21
US7919681B2 (en) 2011-04-05
EP1432798B1 (en) 2010-11-17
RU2312144C2 (ru) 2007-12-10
ATE488585T1 (de) 2010-12-15
HUP0600305A2 (en) 2006-07-28
HU228266B1 (en) 2013-02-28
US7557262B2 (en) 2009-07-07
BR0212170A (pt) 2005-05-10
CN1564866A (zh) 2005-01-12
WO2003018766A9 (en) 2004-03-04
KR20040029122A (ko) 2004-04-03
US20060200877A1 (en) 2006-09-07

Similar Documents

Publication Publication Date Title
CN1564866B (zh) 自加工的植物及植物部分
AU2004318207B2 (en) Self-processing plants and plant parts
AU2002332666A1 (en) Self-processing plants and plant parts
CN103987850B (zh) 用于产生发酵产物的方法
CN101910404A (zh) 提高植物淀粉含量的方法
US20140283215A1 (en) Methods for increasing starch content in plant cobs
AU2006225290B2 (en) Self-processing plants and plant parts
KR20070007817A (ko) 자가-가공 식물 및 식물 부분
NZ549679A (en) Self-processing plants and plant parts
BR122014007966B1 (pt) Expression cassette comprising an alpha-amylase and a method of obtaining a plant comprising the same
MXPA06010197A (en) Self-processing plants and plant parts
CN114867860A (zh) 用于生产发酵产物的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1072618

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1072618

Country of ref document: HK

CX01 Expiry of patent term

Granted publication date: 20100908

CX01 Expiry of patent term