CN1954072A - 自加工的植物和植物部分 - Google Patents

自加工的植物和植物部分 Download PDF

Info

Publication number
CN1954072A
CN1954072A CNA2004800429878A CN200480042987A CN1954072A CN 1954072 A CN1954072 A CN 1954072A CN A2004800429878 A CNA2004800429878 A CN A2004800429878A CN 200480042987 A CN200480042987 A CN 200480042987A CN 1954072 A CN1954072 A CN 1954072A
Authority
CN
China
Prior art keywords
enzyme
plant
starch
seq
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800429878A
Other languages
English (en)
Inventor
M·B·拉纳汉
S·S·巴苏
C·J·巴蒂
陈文�
J·克雷格
M·金凯玛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Syngenta Participations AG
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN1954072A publication Critical patent/CN1954072A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • C12N15/8246Non-starch polysaccharides, e.g. cellulose, fructans, levans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2422Alpha-amylase (3.2.1.1.) from plant source
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2428Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • C12N9/2457Pullulanase (3.2.1.41)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • C12N9/246Isoamylase (3.2.1.68)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01041Pullulanase (3.2.1.41)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01068Isoamylase (3.2.1.68)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Preparation Of Fruits And Vegetables (AREA)

Abstract

本发明提供针对在植物中的表达进行了优化的、编码加工酶的多核苷酸,优选地合成的多核苷酸。所述多核苷酸编码嗜温型、嗜热型、或嗜高热型的加工酶,该加工酶在适宜的激活条件下被激活而作用于期望的底物。本发明还提供表达这些酶中的一种或多种并具有利于植物和谷粒加工的改变的组成的、“自加工的”转基因植物和植物部分,例如,谷粒。本发明也提供制备和使用这些植物以例如产生具有改良味道的食品和产生用于乙醇和发酵饮料生产的发酵底物的方法。

Description

自加工的植物和植物部分
相关申请
本申请是2002年8月27日提交的、要求2001年8月27日提交的申请系列号60/315,281的优选权的10/228,063号美国专利申请的部分延续,在此将两个申请完整地并入作为参考。
技术领域
本发明一般地涉及植物分子生物学领域,更具体地,涉及表达加工酶的植物的构建,其中所述加工酶向所述植物或其部分提供期望的特征。
背景技术
酶被用于加工各种农业产品,例如木材、果实和蔬菜、淀粉、汁液等等。典型地,加工酶以工业规模自各种来源生产和回收,所述来源为例如微生物发酵(芽孢杆菌属α-淀粉酶)、或从植物分离(咖啡的β-半乳糖苷酶或来自植物部分的木瓜蛋白酶)。在不同的加工应用中通过将酶和底物在使得酶反应可以以商业可行方式实现的、适宜的湿度、温度、时间和机械混和条件下混和,而使用酶制备物。这些方法包括如下多个分开的步骤:生产酶、制备酶制备物、混和酶和底物、以及将混合物置于适宜条件下以利于酶促反应。减少或消除时间、能量、混和、资金花费、和/或酶的生产费用的方法,或者导致改良的或新的产品的方法,将是有用和有益的。需要此类改良的领域的一个实例是玉米碾磨领域。
现今碾磨玉米获得玉米淀粉和其它玉米碾磨副产物,例如玉米面筋(gluten)饲料、玉米面筋粉和玉米油。由此工艺获得的淀粉常常进一步加工成其它产品,例如衍生化的淀粉和糖(sugar),或者进一步发酵以制备各种产品,包括醇或乳酸。玉米淀粉的加工常常涉及到使用酶,尤其是将淀粉水解和转化成可发酵的糖或果糖的酶(α-和葡糖-淀粉酶、α-葡糖苷酶、葡萄糖异构酶等)。目前商业使用的加工工艺的资金昂贵,因为为了以合理的成本效益所需的规模加工玉米,需要构建非常大的磨坊。此外,该加工工艺需要分开制备淀粉水解或淀粉改性酶,然后机械混合酶和底物以生产淀粉水解产品。
从玉米粒中回收淀粉的方法是熟知的,涉及湿磨工艺。玉米湿磨包括步骤:浸渍玉米籽粒(kernel)、研磨玉米籽粒和分离籽粒的成分。这些籽粒在浸渍槽中在大约120_用逆向水流浸渍,籽粒在浸渍槽中放置24至48小时。此浸渍水典型地含有浓度为大约0.2%重量的二氧化硫。二氧化硫在此过程中用于帮助减少微生物生长以及还原胚乳蛋白中的二硫键以利于更有效地分离淀粉蛋白质。正常地,每蒲式耳玉米使用大约0.59加仑的浸渍水。浸渍水被认为是废水,其常常含有不期望的残余二氧化硫水平。
然后,浸渍后的玉米籽粒脱水,并使用成组的碾磨型磨机对其进行加工。第一组碾磨型磨机造成籽粒破裂,从而将胚芽从籽粒的剩余部分中释放出来。一种适于湿磨作业的商业碾磨型磨机以商标名称Bauer出售。通过离心将胚芽与籽粒的剩余部分分开。典型的商业离心分离器是Merco离心分离器。碾磨型磨机和离心分离器是使用能量进行作业的大型昂贵机器。
在该工艺的下一步骤,剩余的籽粒成分,包括淀粉、壳、纤维和面筋,在另一组碾磨型磨机上加工,并通过一组洗涤筛以将纤维成分与淀粉和面筋(胚乳蛋白)分开。淀粉和面筋通过筛子,而纤维不能通过。通过离心或者第三次碾磨后离心,从胚乳蛋白中分离出淀粉。离心产生淀粉浆,对该淀粉浆进行脱水,然后用新鲜的水洗涤并干燥至大约12%湿度。此基本上纯的淀粉典型地通过使用酶作进一步的加工。
由于除去种皮、胚和胚乳蛋白将允许淀粉与加工酶有效地接触,并且所获水解产物相对地没有来自其它籽粒成分的杂质,故分离淀粉与谷粒(grain)的其它成分。所述分离也确保谷粒的其它成分能够有效地回收以及能够随后作为副产物出售以增加磨坊的收入。
从湿磨工艺回收淀粉后,淀粉典型地经历糊化、液化和糊精化加工步骤用于生产麦芽糖糊精,并经历随后的糖化、异构化和精制(refining)步骤用于生产葡萄糖、麦芽糖和果糖。
由于目前可获得的酶不能快速地水解结晶淀粉,故在淀粉水解中使用糊化作用。为了使淀粉可适用于水解酶,典型地用水将淀粉制成浆(20-40%干固体)并在适当的凝胶化温度下加热。对于玉米淀粉,此温度为105至110℃。糊化后的淀粉典型地非常粘滞,因此在称作液化的下一步骤中使其稀薄化。液化作用造成淀粉的葡萄糖分子之间的一些键断开,液化可以通过酶促作用或通过使用酸来实现。热稳定的内切α-淀粉酶可以用于此步骤和随后的糊精化步骤中。在糊精化步骤中控制水解程度可以产生具有期望百分比的右旋糖(dextrose)的水解产物。
依据期望获得的产物,可以利用多种不同的外切淀粉酶和脱支酶,进一步水解来自液化步骤的糊精产物。最后,如果期望获得果糖,则典型地使用固定化的葡萄糖异构酶将葡萄糖转化为果糖。
从玉米淀粉制备可发酵糖(以及然后例如,生产乙醇)的干磨工艺,有利于外源酶与淀粉的有效接触。这些工艺与湿磨相比资金上所需较少,但是由于来源于这些工艺的副产物常常不如来源于湿磨的副产物有价值,故仍然期望实现显著的成本优势。例如,在干磨玉米时,将籽粒研磨成粉末以利于淀粉与降解酶进行有效地接触。在酶水解玉米面粉后,残余的固体由于含有蛋白质和一些其它成分而具有一定的饲料价值。Eckhoff近来在题为“使用快速胚芽方法从玉米发酵燃料乙醇及其成本”的文章(Appl.Biochem.Biotechnol.,94:41(2001))中描述了与干磨有关的改良可能性以及相关问题。“快速胚芽”方法(“quick-germ”method)允许使用减少的浸渍时间从淀粉分离富含油的胚芽。
通过植物中内源加工酶的调节和/或水平可以导致期望产物的一个实例是甜玉米。典型的甜玉米(sweet corn)品种与大田玉米(fieldcorn)品种的区别在于:甜玉米不能进行正常水平的淀粉生物合成这一事实。在甜玉米品种中典型地使用在编码淀粉合成中所涉及的酶的基因中的遗传突变,以限制淀粉的生物合成。此类突变位于编码淀粉合酶和ADP-葡萄糖焦磷酸化酶的基因中(例如甜的(sugary)和超甜的(super-sweet)突变)。果糖、葡萄糖和蔗糖是产生可食用新鲜玉米的消费者期望的可口甜味所必需的简单糖类,其在这些突变体的发育的胚乳中积累。然而,如果淀粉积累水平太高(例如,为使玉米成熟将玉米留置太长时间(收获后),或者在玉米食用前长期贮存玉米的情况),产品将丧失甜味并有生淀粉味和口感(mouthfeel)。因此,甜玉米的收获窗(harvest window)十分的窄,并且保存期限受到限制。
对于种植甜玉米品种的农民,另一显著缺点是这些品种的用途被仅仅限制于可食用食品。如果农民想要在种子发育过程中先行收获其甜玉米用作可食用食品,则将造成作物的实质性损失。谷粒产量和甜玉米的品质由于两个根本原因而不佳。第一个原因是:淀粉生物合成途径中的突变削弱了淀粉生物合成机器,谷粒不能完全饱满,从而对产量和品质造成损害。其次,由于谷粒中存在高水平的糖而这些糖不能以淀粉的形式隔绝,由此导致种子的整体库强度(sink strength)降低,而这将使谷粒中营养物贮存的减少加剧。甜玉米品种的胚乳缩小并塌陷,不经历彻底干燥,易于患病。甜玉米粒的不良品质带来进一步的农艺学牵连问题;由不充分的淀粉积累造成的各种因素组合起来引起不良的种子生存力、不良的萌芽、幼苗对疾病的易感性及不良的早期幼苗活力。因此,甜玉米的不良品质问题将影响消费者、农民/种植者、销售者和种子生产者。
因此,对于干磨,需要提高工艺效力和/或增加副产物的价值的方法。对于湿磨,需要对长期的浸渍、研磨、碾磨和/或分离籽粒成分所必需的设备不存在需求的淀粉加工方法。例如,需要修饰或消除湿磨中的浸渍步骤,因为这将减少需要处置的废水量,由此节约能量和时间并增加磨坊的生产量(玉米粒将在浸渍槽中花费较少时间)。此外,也需要消除或改进将含淀粉的胚乳与胚分离的工艺。
发明内容
本发明涉及自加工植物和植物部分及其使用方法。本发明的自加工植物和植物部分能够表达和激活酶(嗜温型的(mesophilic)、嗜热型的(thermophilic)和/或嗜高热型的(hyperthermophilic))。在所述酶(嗜温型的、嗜热型的或嗜高热型的)激活后,植物或植物部分能够自加工底物,对该底物的作用可以获得期望的结果。
本发明涉及分离的多核苷酸,其a)包含SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、或59或其互补序列,或与SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、或59之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸,或者b)编码包含SEQ ID NO:10、13、14、15、16、18、20、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49或51的多肽或其酶活性片段。优选地,分离的多核苷酸编码包含第一多肽和第二肽的融合多肽,其中所述第一多肽具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶或葡糖淀粉酶活性。最优选地,第二肽包含信号序列肽,该肽可以将第一多肽引导至植物的液泡、内质网、叶绿体、淀粉粒(starch granule)、种子或细胞壁。例如,信号序列可以是来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列、淀粉结合域、或C端淀粉结合域。本发明进一步包括与SEQ ID NO:2、9或52之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶活性的多肽的多核苷酸;与SEQ ID NO:4或25的互补序列在低严紧杂交条件下杂交并编码具有支链淀粉酶活性的多肽的多核苷酸;与SEQ ID NO:6的互补序列杂交并编码具有α-葡糖苷酶活性的多肽的多核苷酸;与SEQ ID NO:19、21、37、39、41或43之任一的互补序列在低严紧杂交条件下杂交并编码具有葡萄糖异构酶活性的多肽的多核苷酸;与SEQ ID NO:46、48、50或59之任一的互补序列在低严紧杂交条件下杂交并编码具有葡糖淀粉酶活性的多肽的多核苷酸。
本发明还涉及分离的多核苷酸,其a)包含SEQ ID NO:61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110或其互补序列,或者与SEQ ID NO:61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108或110之任一的互补序列在低严紧杂交条件下杂交并编码具有木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、酯酶或植酸酶活性的多肽的多核苷酸;b)编码包含SEQ ID NO:62、64、66、70、80、82、84、86、88、90、92、109或111的多肽或其酶活性片段。该分离的多核苷酸可以编码包含第一多肽和第二肽的融合多肽,其中所述第一多肽具有木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、蛋白酶或植酸酶活性。第二肽可以包含信号序列肽,该信号序列肽可以将第一多肽引导至植物的液泡、内质网、叶绿体、淀粉粒(starch granule)、种子或细胞壁。例如,信号序列可以是来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列、淀粉结合域或C端淀粉结合域。
在本发明中提供的、可用于本发明中的示例性木聚糖酶包括SEQID NO:61、63或65编码的木聚糖酶。本发明还提供SEQ ID NO:69编码的示例性蛋白酶,即,菠萝蛋白酶。示例性纤维素酶包括本文中提供的由SEQ ID NO:79、81、93和94编码的纤维二糖水解酶I和II。本发明提供示例性葡聚糖酶,即,本文中描述的由SEQ ID NO:85编码的6GPl。示例性β葡糖苷酶包括本文中描述的由SEQ ID NO:96和97编码的β葡糖苷酶2和D。还提供示例性酯酶,即,由SEQ ID NO:99编码的阿魏酸酯酶。还提供示例性植酸酶,即,SEQ ID NO:109-112编码的Nov9X。
本发明还包括包含如下多核苷酸的表达盒,所述多核苷酸a)具有SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52或59或其互补序列,或者与SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52或59之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸,或b)编码包含SEQ ID NO:10、13、14、15、16、18、20、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49或51的多肽或其酶活性片段。表达盒还包含与该多核苷酸可操作连接的启动子,例如诱导型启动子、组织特异性启动子、或优选地胚乳特异性启动子。优选地,胚乳特异性启动子是玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子或玉米Q启动子或稻的谷蛋白-1启动子。在一个优选实施方案中,启动子包含SEQ ID NO:11或SEQ ID NO:12或SEQ IDNO:67或SEQ ID NO:98。此外,在另一优选实施方案中,多核苷酸的取向相对于启动子为正义方向。本发明的表达盒还可以编码与多核苷酸编码的多肽可操作地连接的信号序列。信号序列优选将可操作连接的多肽引导至植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁。信号序列包括来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列或淀粉结合域。
而且,本发明包括包含如下多核苷酸的表达盒,所述多核苷酸a)具有SEQ ID NO:61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110或其互补序列,或者与SEQ ID NO:61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110之任一的互补序列在低严紧杂交条件下杂交并编码具有木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、脂酶或植酸酶活性的多肽的多核苷酸,或b)编码包含SEQ ID NO:62、64、66、70、80、82、84、86、88、90、92、109或111的多肽或其酶活性片段。该表达盒还包含与多核苷酸可操作地连接的启动子,例如诱导型启动子、组织特异性启动子、或优选地胚乳特异性启动子。胚乳特异性启动子可以是玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子或玉米Q启动子或稻的谷蛋白-1启动子。在一个实施方案中,启动子包含SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:67或SEQ ID NO:98。此外,在另一优选实施方案中,多核苷酸的取向相对于启动子为正义方向。本发明的表达盒还可以编码与多核苷酸编码的多肽可操作地连接的信号序列。信号序列优选将可操作连接的多肽引导至植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁。信号序列包括来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列或淀粉结合域。
本发明还涉及包含本发明表达盒的载体或细胞。细胞可以选自农杆菌属(Agrobacterium)、单子叶植物细胞、双子叶植物细胞、百合纲(Liliopsida)细胞、黍亚科(Panicoideae)细胞、玉米细胞和谷物细胞,例如稻细胞。
此外,本发明包括用本发明载体稳定转化的植物。本发明提供用包含α-淀粉酶的载体稳定转化的植物,其中所述α-淀粉酶具有SEQID NO:1、10、13、14、15、16、33、35或88之任一的氨基酸序列或由包含SEQ ID NO:2、9或87之任一的多核苷酸编码。
另一实施方案中,提供用包含支链淀粉酶的载体稳定转化的植物,其中所述支链淀粉酶具有SEQ ID NO:24或34的氨基酸序列或者由包含SEQ ID NO:4或25之任一的多核苷酸编码。本发明还提供用包含α-葡糖苷酶的载体稳定转化的植物,其中所述α-葡糖苷酶具有SEQID NO:26或27之任一的氨基酸序列或者由包含SEQ ID NO:6的多核苷酸编码。本文还描述了用包含葡萄糖异构酶的载体稳定转化的植物,其中所述葡萄糖异构酶具有SEQ ID NO:18、20、28、29、30、38、40、42或44之任一的氨基酸序列或者由包含SEQ ID NO:19、21、37、39、41或43之任一的多核苷酸编码。在另一实施方案中,描述用包含葡萄糖淀粉酶的载体稳定转化的植物,其中所述葡萄糖淀粉酶具有SEQ ID NO:45、47或49之任一的氨基酸序列或者由包含SEQ IDNO:46、48、50、或59之任一的多核苷酸编码。
另一实施方案提供用包含木聚糖酶的载体稳定转化的植物,其中所述木聚糖酶具有SEQ ID NO:62、64或66之任一的氨基酸序列或者由包含SEQ ID NO:61、63或65之任一的多核苷酸编码。此外,还提供用包含蛋白酶的载体稳定转化的植物。该蛋白酶可以是具有SEQ IDNO:70中所示的氨基酸序列或者由具有SEQ ID NO:69的多核苷酸编码的菠萝蛋白酶。在另一实施方案中,提供用包含纤维素酶的载体稳定转化的植物。该纤维素酶可以是由包含SEQ ID NO:79、80、81、82、93或94之任一的多核苷酸编码的纤维二糖水解酶。
另一实施方案提供用包含葡聚糖酶,例如内切葡聚糖酶的载体稳定转化的植物。该内切葡聚糖酶可以是具有SEQ ID NO:84所示的氨基酸序列或者由包含SEQ ID NO:83的多核苷酸编码的内切葡聚糖酶I。此外,还提供用包含β葡糖苷酶的载体稳定转化的植物。该β葡糖苷酶可以是具有SEQ ID NO:90或92中所示氨基酸序列或者由具有SEQ ID NO:89或91的多核苷酸编码的β葡糖苷酶2或β葡糖苷酶D。在另一实施方案中,提供用包含酯酶的载体稳定转化的植物。该酯酶可以是由包含SEQ ID NO:99的多核苷酸编码的阿魏酸酯酶。
本发明还提供来自本发明稳定转化的植物的植物产物,例如种子、果实或谷粒。
在另一实施方案中,本发明涉及转化的植物,所述植物的基因组增加了与启动子序列可操作连接的重组多核苷酸,该多核苷酸编码至少一种加工酶,该多核苷酸的序列针对在该植物中的表达而进行了优化。所述植物可以是单子叶植物,例如玉米或稻,或双子叶植物。该植物可以是谷类植物或商业栽培的植物。所述加工酶选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、葡聚糖酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶(neo-pullulanase)、异支链淀粉酶(iso-pullulanase)、淀粉型支链淀粉酶(amylopullulanase)、纤维素酶、外切-1,4-β-纤维二糖水解酶、外切-1,3-β-D-葡聚糖酶、β-葡糖苷酶、内切葡聚糖酶、L-阿拉伯糖酶、α-阿拉伯糖苷酶、半乳聚糖酶、半乳糖苷酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、木糖苷酶、蛋白酶、葡聚糖酶、木聚糖酶、酯酶、植酸酶和脂肪酶。所述加工酶是选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶和淀粉型支链淀粉酶的淀粉加工酶。该酶可以选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。加工酶可以是嗜高热型的。根据本发明此方面,该酶可以是选自蛋白酶、葡聚糖酶、木聚糖酶、酯酶、植酸酶、纤维素酶、β葡糖苷酶和脂肪酶的非淀粉降解酶(non-starch degrading enzyme)。此类酶可以是嗜高热型的。在一个实施方案中,酶聚积在植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁中。而且,在另一实施方案中,植物的基因组还可以增加包含非嗜高热型的酶的第二重组多核苷酸。
在本发明另一方面,提供转化的植物,该植物的基因组增加了编码至少一种加工酶的重组多核苷酸,其中所述加工酶选自:α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶、支链淀粉酶、木聚糖酶、纤维素酶、蛋白酶、葡聚糖酶、β葡糖苷酶、酯酶、植酸酶或脂肪酶,所述重组多核苷酸与启动子序列可操作地连接,该多核苷酸的序列针对在该植物中的表达而实行优化。
另一实施方案涉及转化的玉米植物,该植物的基因组增加了编码至少一种加工酶的重组多核苷酸,其中所述加工酶选自:α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶、支链淀粉酶、木聚糖酶、纤维素酶、蛋白酶、葡聚糖酶、植酸酶、β葡糖苷酶、酯酶或脂肪酶,所述重组多核苷酸与启动子序列可操作地连接,该多核苷酸的序列针对在该玉米植物中的表达而实行优化。
本发明提供转化的植物,该植物的基因组增加了与启动子以及信号序列可操作地连接的、具有SEQ ID NO:83的重组多核苷酸。此外,本发明还描述转化的植物,该植物的基因组增加了与启动子以及信号序列可操作地连接的、具有SEQ ID NO:93或94的重组多核苷酸。在另一实施方案中,提供转化的植物,该植物的基因组增加了具有SEQ IDNO:95的重组多核苷酸,该多核苷酸与启动子和信号序列可操作地连接。此外,还描述了基因组中增加了具有SEQ ID NO:96的重组多核苷酸的转化植物。还描述了基因组中增加了具有SEQ ID NO:97的重组多核苷酸的转化植物。还描述了基因组中增加了具有SEQ ID NO:99的重组多核苷酸的转化植物。
在此还预期到转化的植物的产物。所述产物包括例如种子、果实或谷粒。或者,产物可以是加工酶、淀粉或糖。
本发明还描述从本发明稳定转化的植物获得的植物。在此方面,该植物可以是杂种植物或近交/自交植物。
包含至少一种加工酶的淀粉组合物是本发明的再一实施方案,其中所述加工酶是蛋白酶、葡聚糖酶或酯酶。
包含至少一种加工酶的谷粒是本发明另一实施方案,所述加工酶是α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶、葡萄糖异构酶、木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、酯酶、蛋白酶、脂肪酶或植酸酶。
在另一实施方案中,提供制备淀粉粒的方法,包括:将包含至少一种非淀粉型加工酶的谷粒在激活所述至少一种酶的条件下进行处理,产生包含淀粉粒和非淀粉降解产物的混合物,其中所述谷粒从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和从混合物分离淀粉粒。其中,酶可以是蛋白酶、葡聚糖酶、木聚糖酶、植酸酶、脂肪酶、β葡糖苷酶、纤维素酶或酯酶。而且,该酶优选是嗜高热型的。谷粒可以是破碎的谷粒和/或可以在低或高湿度条件下处理。或者,谷粒可以用二氧化硫处理。本发明还可以包括从混合物分离非淀粉产物。本发明还描述通过此方法获得的淀粉产物和非淀粉产物。
在再一实施方案中,提供生产超甜玉米(hypersweet corn)的方法,包括处理转化的玉米或其部分,其中所述玉米在基因组中增加了编码至少一种淀粉降解酶或淀粉异构化酶的表达盒并在胚乳中表达该表达盒,其中所述处理在激活所述至少一种酶从而将玉米中的多糖转化成糖(sugar)的条件下进行,由此产生超甜玉米。表达盒还可以包含与编码所述酶的多核苷酸可操作地连接的启动子。启动子可以是例如,组成型启动子、种子特异性启动子、或胚乳特异性启动子。酶可以是嗜高热型的,并且可以是α-淀粉酶。在此处使用的表达盒还可以包含编码与所述至少一种酶可操作地连接的信号序列的多核苷酸。信号序列可以指引酶达到例如质外体或内质网。所述酶包含SEQ ID NO:13、14、15、16、33或35之任一。所述酶还可以包含SEQ ID NO:87。
在一个最优选的实施方案中,描述生产超甜玉米的方法,包括处理转化的玉米或其部分,其中所述玉米在基因组中增加了编码α-淀粉酶的表达盒并在胚乳中表达该表达盒,其中所述处理在激活所述至少一种酶从而将玉米中的多糖转化成糖(sugar)的条件下进行,由此产生超甜玉米。酶可以是嗜高热型的,并且嗜高热型的α-淀粉酶可以包含SEQ ID NO:10、13、14、15、16、33或35之任一的氨基酸序列或其具有α-淀粉酶活性的酶活性片段。该酶包含SEQ ID NO:87。
本文描述制备淀粉水解产物的溶液的方法,包括:将包含淀粉粒和至少一种加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成包含淀粉水解产物的水溶液,其中植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化植物获得;和收集含有该淀粉水解产物的水溶液。淀粉水解产物可以包含糊精、麦芽寡糖(maltooligosaccharide)、葡萄糖和/或其混合物。酶可以是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶、或其任何组合。而且,酶可以是嗜高热型的。另一方面,植物部分的基因组还可以增加编码非嗜高热型的淀粉加工酶的表达盒。非嗜高热型的淀粉加工酶可以选自淀粉酶、葡糖淀粉酶、α-葡糖苷酶、支链淀粉酶、葡萄糖异构酶或其组合。在另一方面,加工酶优选在胚乳中表达。植物部分可以是谷粒(grain),来自玉米、小麦、大麦、黑麦、燕麦、甘蔗或稻。所述至少一种加工酶与启动子和信号序列可操作地连接,该信号序列将酶引导至淀粉粒或内质网或引导至细胞壁。该方法还可以包括分离淀粉水解产物和/或发酵该淀粉水解产物。
在本发明另一方面,描述制备淀粉水解产物的方法,包括将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成包含淀粉水解产物的水溶液,其中植物部分从基因组增加了编码至少一种α-淀粉酶的表达盒的转化植物获得;和收集包含淀粉水解产物的水溶液。该α-淀粉酶可以是嗜高热型的,嗜高热型的α-淀粉酶包含SEQ ID NO:1、10、13、14、15、16、33、或35之任一的氨基酸序列或其具有α-淀粉酶活性的活性片段。表达盒可以包含选自SEQ ID NO:2、9、46或52或其互补序列的多核苷酸,或者与SEQ ID NO:2、9、46或52之任一在低严紧杂交条件下杂交并编码具有α-淀粉酶活性的多肽的多核苷酸。而且,本发明也提供该转化的植物的基因组,其还包含编码非嗜高热型的淀粉加工酶的多核苷酸。或者,植物部分可以用非嗜高热型的淀粉加工酶处理。
本发明还涉及在植物的细胞中包含至少一种淀粉加工酶的、转化的植物部分,其中植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化植物获得。优选地,酶是选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶和淀粉型支链淀粉酶的淀粉加工酶。而且,所述酶可以是嗜高热型的。所述植物可以是任何植物,例如玉米或稻。
本发明另一实施方案是在植物的细胞壁或细胞中包含有至少一种非淀粉加工酶的、转化的植物部分,其中植物部分从基因组中增加了编码所述至少一种非淀粉加工酶或至少一种非淀粉多糖加工酶的表达盒的转化植物获得。该酶可以是嗜高热型的。而且,非淀粉加工酶可以是蛋白酶、葡聚糖酶、木聚糖酶、酯酶、植酸酶、β葡糖苷酶、纤维素酶或脂肪酶。所述植物部分可以是任何植物部分,但优选是穗、种子、果实、谷粒、秸秆、谷壳(chaff)、或蔗渣。
本发明还涉及转化的植物部分。例如,描述了包含具有SEQ ID NO:1、10、13、14、15、16、33或35之任一的氨基酸序列或者由包含SEQID NO:2、9、46或52之任一的多核苷酸编码的α-淀粉酶的转化植物部分,包含具有SEQ ID NO:5、26或27之任一的氨基酸序列或者由包含SEQ ID NO:6的多核苷酸编码的α-葡糖苷酶的转化植物部分,包含具有SEQ ID NO:28、29、30、38、40、42或44之任一的氨基酸序列或者由包含SEQ ID NO:19、21、37、39、41或43之任一的多核苷酸编码的葡萄糖异构酶的转化植物部分,包含具有SEQ ID NO:45或SEQ ID NO:47或SEQ ID NO:49的氨基酸序列或者由包含SEQ IDNO:46、48、50或59之任一的多核苷酸编码的葡糖淀粉酶的转化植物部分,以及包含由含有SEQ ID NO:4或25之任一的多核苷酸编码的支链淀粉酶的转化植物部分。
本发明还涉及转化的植物部分。例如,描述了包含具有SEQ ID NO:62、64或66之任一的氨基酸序列或者由包含SEQ ID NO:61、63或65之任一的多核苷酸编码的木聚糖酶的转化植物部分。也提供包含蛋白酶的转化的植物部分。该蛋白酶可以是具有SEQ ID NO:70所示的氨基酸序列或由具有SEQ ID NO:69的多核苷酸编码的菠萝蛋白酶。在另一实施方案中,提供包含纤维素酶的转化的植物部分。纤维素酶可以是由包含SEQ ID NO:79、80、81、82、93或94之任一的多核苷酸编码的纤维二糖水解酶。
另一实施方案提供包含葡聚糖酶,例如内切葡聚糖酶的转化的植物部分。内切葡聚糖酶可以是具有SEQ ID NO:84所示的氨基酸序列或者由包含SEQ ID NO:83的多核苷酸编码的内切葡聚糖酶I。也提供包含β葡糖苷酶的转化的植物部分。β葡糖苷酶可以是具有SEQ IDNO:90或92中所示的氨基酸序列或者由具有SEQ ID NO:89或91的多核苷酸编码的β葡糖苷酶2或β葡糖苷酶D。在另一实施方案中,提供包含酯酶的转化的植物部分。酯酶可以是由包含SEQ ID NO:99的多核苷酸编码的阿魏酸酯酶。
另一实施方案是对转化的植物部分中的淀粉实施转化的方法,包括激活植物部分中所包含的淀粉加工酶。此外,还描述根据此方法产生的淀粉、糊精、麦芽寡糖或糖(sugar)。
本发明还描述使用转化的植物部分的方法,其中所述转化的植物部分在该植物部分的细胞壁或细胞中包含至少一种非淀粉加工酶,所述方法包括将包含至少一种非淀粉多糖加工酶的转化植物部分在激活所述至少一种酶由此消化非淀粉多糖以形成包含寡糖和/或糖(sugar)的水溶液的条件下进行处理,其中植物部分从基因组中增加了编码所述至少一种非淀粉多糖加工酶的表达盒的转化植物获得;和收集含有寡糖和/或糖(sugar)的水溶液。非淀粉多糖加工酶可以是嗜高热型的。
本发明提供使用包含至少一种加工酶的转化的种子的方法,包括将包含至少一种蛋白酶或脂肪酶的转化种子在激活所述至少一种酶的条件下进行处理,从而产生包含氨基酸和脂肪酸的含水混合物,其中种子从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和收集该含水混合物。优选地分离氨基酸、脂肪酸或两者。所述至少一种蛋白酶或脂肪酶可以是嗜高热型的。
本发明还描述制备乙醇的方法,包括将包含至少一种多糖加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此消化多糖以形成寡糖或可发酵糖,其中所述植物部分从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得;和在促进可发酵糖或寡糖转化成乙醇的条件下温育可发酵糖。植物部分可以是谷粒、果实、种子、茎秆、木材、蔬菜或根。植物部分可以从选自如下的植物获得:燕麦、大麦、小麦、浆果、葡萄、黑麦、玉米、稻、马铃薯、甜菜、甘蔗、凤梨、草和树。在另一优选实施方案中,多糖加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶、支链淀粉酶或其组合。
本发明提供制备乙醇的方法,包括将包含至少一种加工酶的植物部分在可以激活所述至少一种酶的时间长度和条件下进行热处理,由此消化多糖以形成可发酵糖,其中所述加工酶选自:α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶、或支链淀粉酶或其组合,其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和在促进可发酵糖转化成乙醇的条件下温育可发酵糖。所述至少一种酶可以是嗜高热型的或嗜温型的。
在另一实施方案中,提供制备乙醇的方法,包括将包含至少一种非淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此将非淀粉多糖消化成寡糖和可发酵糖,其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。非淀粉加工酶可以是木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、蛋白酶、酯酶、脂肪酶或植酸酶。
本发明还提供制备乙醇的方法,包括将包含至少一种酶的植物部分在激活所述至少一种酶的条件下进行处理,由此将多糖消化以形成可发酵糖,其中所述酶选自:α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶或支链淀粉酶、或其组合,其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。所述酶可以是嗜高热型的。
此外,还描述了在不添加额外的增甜剂的情况下制备甜的粉质食品(farinaceous food)的方法,包括将包含至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此将植物部分中的淀粉粒加工成糖(sugar)从而形成甜的产物,其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和将该甜的产物加工成粉质食品。所述粉质食品可以从甜的产物和水形成。而且,粉质食品可以含有麦芽、调味剂、维生素、矿物质、着色剂或其任何组合。所述至少一种酶可以是嗜高热型的。该酶可以选自:α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。植物还可以选自:大豆、黑麦、燕麦、大麦、小麦、玉米、稻和甘蔗。粉质食品可以是谷物食品、早餐食品、即食食品、或烘焙的食品。所述加工可以包括烘焙、煮沸、加热、蒸、放电(electrical discharge)或其任何组合。
本发明还涉及在不添加增甜剂的情况下甜化含淀粉产品的方法,包括将包含至少一种淀粉加工酶的淀粉在激活所述至少一种酶的条件下进行处理,由此消化该淀粉以形成糖(sugar)从而生成甜的淀粉,其中淀粉从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和将此甜的淀粉添加至产品中以产生甜的含淀粉产品。转化的植物可以选自玉米、大豆、黑麦、燕麦、小麦、稻和甘蔗。所述至少一种酶可以是嗜高热型的。所述至少一种酶可以是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶、或其任何组合。
在此提供粉质食品和甜的含淀粉产品。
本发明还涉及甜化含多糖的果实或蔬菜的方法,包括将包含至少一种多糖加工酶的果实或蔬菜在激活所述至少一种酶的条件下处理,由此加工果实或蔬菜中的多糖以形成糖(sugar),产生甜的果实或蔬菜,其中果实或蔬菜从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得。果实或蔬菜选自:马铃薯、番茄、香蕉、南瓜、豌豆和大豆。所述至少一种酶可以是嗜高热型的。
本发明还涉及制备含糖(sugar)的水溶液的方法,包括将获自该植物部分的淀粉粒在激活所述至少一种酶的条件下进行处理,由此产生含糖(sugar)的水溶液。
另一实施方案涉及从谷粒制备淀粉衍生产品的方法,其中所述方法不涉及在回收淀粉衍生产品之前对谷粒进行湿磨或干磨,所述方法包括将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液,其中植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化植物获得;和收集含有该淀粉衍生产品的水溶液。所述至少一种淀粉加工酶可以是嗜高热型的。
本发明还提供分离α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶的方法,包括培养含有该α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶或支链淀粉酶的转化植物,和从中分离该α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶或支链淀粉酶。本发明还提供分离木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、蛋白酶、酯酶、植酸酶或脂肪酶的方法,包括培养含有该木聚糖酶、纤维素酶、葡聚糖酶、β葡糖苷酶、蛋白酶、酯酶、植酸酶或脂肪酶的转化植物,和分离该木聚糖酶、纤维素酶、葡聚糖酶、酯酶、β葡糖苷酶、蛋白酶、酯酶、植酸酶或脂肪酶。
本发明也提供制备麦芽糖糊精的方法,包括将水和转基因谷粒混合,加热所述混合物,从产生的糊精浆液中分离出固体,和收集该麦芽糖糊精。该转基因谷粒包含至少一种淀粉加工酶。淀粉加工酶可以是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶和葡萄糖异构酶。而且,本发明还提供通过该方法产生的麦芽糖糊精以及通过该方法产生的组合物。
本发明提供从谷粒制备糊精或糖(sugar)的方法,所述方法不涉及在回收淀粉衍生产物之前机械破碎谷粒,所述方法包括:将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液,其中植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得;和收集含有糖(sugar)和/或糊精的水溶液。
本发明还涉及制备可发酵糖的方法,包括将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液,其中植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得;和收集含有可发酵糖的水溶液。
此外,本文还提供用包含嗜高热型的α-淀粉酶的载体稳定转化的玉米植物。例如,优选地,包括用包含编码α-淀粉酶的多核苷酸序列的载体稳定转化的玉米植物,其中所述α-淀粉酶与SEQ ID NO:1或SEQ ID NO:51有大于60%的同一性。
附图简述
图1A和1B说明在来自分离的T1籽粒的玉米籽粒及胚乳中表达的α-淀粉酶的活性,其中所述分离的T1籽粒来自pNOV6201植物和6个pNOV6200系。
图2说明在来自pNOV6201系的分离的T1籽粒中α-淀粉酶的活性。
图3描述含有热稳定797GL3α淀粉酶的转基因玉米的醪液在发酵时产生的乙醇量,其中醪液在85℃和95℃下的液化时间不超过60分钟。该图说明自液化的15分钟起至60分钟,发酵72小时的乙醇产量几乎未变。而且,该图还显示,95℃液化产生的醪液比85℃液化产生的醪液在每一个时间点上都产生更多的乙醇。
图4描述在含有热稳定α淀粉酶的转基因玉米醪液发酵后剩余的残余淀粉量(%),其中所述醪液在85℃和95℃下的液化时间不超过60分钟。该图说明,自液化的15分钟起至60分钟,72小时发酵的乙醇产量几乎不变。而且,该图还显示95℃液化产生的醪液比85℃液化产生的醪液在每一个时间点上都产生更多的乙醇。
图5描述转基因玉米、对照玉米和其各种混合物的醪液的乙醇产量,其中所述醪液在85℃和95℃下制备。该图说明包含α-淀粉酶的转基因玉米由于发酵后留下的淀粉减少,故其显著地提高了淀粉在发酵中的可利用率。
图6描述在发酵转基因谷粒、对照玉米和其各种混合物的醪液后在干燥的釜馏物中测量到的残余淀粉量,其中所述醪液在85℃和95℃制备。
图7描述在5.2至6.4的各种pH下在20小时至80小时期间作为样品发酵时间的函数的乙醇产量,其中所述样品包含3%转基因玉米。该图说明在较低pH下进行的发酵比在pH6.0或更高pH下进行的发酵进展快速。
图8描述在5.2至6.4的各种pH下醪液发酵过程中的乙醇产量,其中所述醪液含有从0至12wt%的各种重量百分比的转基因玉米。该图说明,乙醇产量独立于样品中所包含的转基因谷粒的量。
图9显示对来自不同pNOV7005转化事件的T2种子的分析。与非转基因对照比较,可以在多个事件中检测到支链淀粉酶活性的高表达。
图10A和10B显示水解产物的HPLC分析结果,所述水解产物通过表达的支链淀粉酶从转基因玉米面粉的淀粉中产生。75℃在反应缓冲液中温育表达支链淀粉酶的玉米的面粉30分钟,导致从玉米淀粉产生中等链长的寡糖(聚合度(DP)大约10-30)和短直链淀粉链(DP大约100-200)。图10A和10B也显示添加的钙离子对支链淀粉酶活性的影响。
图11A和11B描述从来自两个反应混合物的淀粉水解产物的HPLC分析得到的数据。第一反应以‘淀粉酶’标示,含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品的混合物[1∶1(w/w)];第二反应混合物‘淀粉酶+支链淀粉酶’包含表达α-淀粉酶的转基因玉米和表达支链淀粉酶的转基因玉米的玉米面粉样品的混合物[1∶1(w/w)]。
图12描述对于两个反应混合物而言在25μl反应混合物中的糖(sugar)产物量(μg)。第一反应以‘淀粉酶’表示,含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品的混合物[1∶1(w/w)];第二反应混合物‘淀粉酶+支链淀粉酶’包含表达α-淀粉酶的转基因玉米和表达支链淀粉酶的转基因玉米的玉米面粉样品的混合物[1∶1(w/w)]。
图13A和13B显示在85℃和95℃ 30分钟温育结束时从两组反应混合物得到的淀粉水解产物。对于每一组,都有两个反应混合物;第一反应以‘淀粉酶X支链淀粉酶’表示,含有表达α-淀粉酶和支链淀粉酶两者的转基因玉米(通过异花授粉产生)的面粉;第二反应以‘淀粉酶’表示,含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品的混合物,其中两种玉米面粉样品以可以获得与在杂交(淀粉酶X支链淀粉酶)中观察到的相同量的α-淀粉酶活性的比例混合。
图14描述使用非转基因玉米种子(对照)、含有797GL3α-淀粉酶的转基因玉米种子、以及797GL3转基因玉米种子和MalAα-葡糖苷酶的组合将淀粉降解为葡萄糖。
图15描述在室温或30℃转化生淀粉。在此图中,反应混合物1和2分别是水和淀粉在室温和30℃的组合。反应混合物3和4分别是大麦α-淀粉酶和淀粉在室温和30℃的组合。反应混合物5和6分别是热厌氧杆菌属(Thermoanaerobacterium)葡糖淀粉酶和淀粉在室温和30℃的组合。反应混合物7和8分别是大麦α-淀粉酶(sigma)和热厌氧杆菌属葡糖淀粉酶及淀粉在室温和30℃的组合。反应混合物9和10分别是大麦α-淀粉酶(sigma)对照和淀粉在室温和30℃的组合。图中指出热厌氧杆菌属葡糖淀粉酶的产物的聚合度(DP)。
图16描述使用实施例19中描述的α淀粉酶、α葡糖苷酶和葡萄糖异构酶的组合从淀粉酶转基因玉米面粉生产果糖。淀粉酶玉米面粉与酶溶液加上水或缓冲液混合。所有反应含有60mg淀粉酶面粉和总共600μl液体,在90℃温育2小时。
图17描述作为自90℃ 0至1200分钟的温育时间的函数、使用来自自加工籽粒的100%淀粉酶面粉得到的反应产物的峰面积。
图18描述作为自90℃ 0至1200分钟的温育时间的函数、使用来自自加工籽粒的10%转基因淀粉酶面粉和90%对照玉米面粉获得的反应产物的峰面积。
图19提供在70℃、80℃、90℃或100℃温育不超过90分钟的转基因淀粉酶面粉的HPLC分析结果,以评价温度对淀粉水解的影响。
图20描述含有60mg转基因淀粉酶面粉和酶溶液加水或缓冲液的混合物的样品在各种反应条件下的ELSD峰面积。一组反应用50mMMOPS(室温下pH7.0)加上10mM MgSO4和1mM CoCl2缓冲;在第二组反应中用水替换此含金属的缓冲溶液。所有反应在90℃温育2小时。
发明详述
根据本发明,“自加工”植物或植物部分在其中整合了编码加工酶的分离的多核苷酸,其中所述加工酶能够加工,例如修饰,植物中的淀粉、多糖、脂质、蛋白质等,其中该加工酶可以是嗜温型的、嗜热型的或嗜高热型的,并且可以通过研磨、加水、加热或以其它方式为酶的功能提供有利条件而激活。编码加工酶的分离的多核苷酸整合在植物或植物部分中用于在其中表达。一旦加工酶表达和激活后,本发明的植物或植物部分将对该加工酶所作用的底物实施加工。因此,本发明的植物或植物部分能够在其中所含的加工酶激活后自加工该酶的底物,而且该加工可以在加工这些底物时正常所需的外来来源缺乏或减少的情况下进行。照此,该转化的植物、转化的植物细胞和转化的植物部分具有通过根据本发明整合在其中的酶加工期望底物的“内在”加工能力。优选地,编码加工酶的多核苷酸是“遗传稳定的”,即,该多核苷酸在本发明转化的植物或植物部分中稳定地维持并通过后代稳定地遗传至后继世代。
根据本发明,使用这些植物和植物部分的方法在回收淀粉衍生产物之前可以无需碾磨或以其它方式物理破碎植物部分的完整性。例如,本发明提供加工玉米和其它谷粒以回收淀粉衍生产物的改良方法。本发明还提供允许回收在淀粉粒中或在淀粉粒上含有一定水平的淀粉降解酶的淀粉粒的方法,其中所述淀粉降解酶的水平足以导致对淀粉中特定键的水解而无需添加外源产生的淀粉水解酶。本发明还提供通过本发明方法从自加工植物或植物部分获得的改良产物。
此外,“自加工的”转化的植物部分,例如谷粒,和转化的植物避免了现有技术的主要问题,即,加工酶典型地通过发酵微生物而产生,这就需要花费金钱从培养上清液分离酶;该分离的酶需要针对特定的应用进行配制,并且必须开发用于酶及其底物的添加、混合和反应的工艺和机器。本发明的转化植物或其部分也是加工酶本身以及该酶的底物和产物,例如糖、氨基酸、脂肪酸和淀粉及非淀粉多糖的来源。本发明的植物也可以用于制备后代植物,例如杂种和近交系/自交系。
加工酶和编码其的多核苷酸
将编码加工酶(嗜温型的、嗜热型的和嗜高热型的)的多核苷酸引入植物或植物部分中。该加工酶基于存在于植物或转基因植物中的该酶所作用的期望底物和/或期望终产物进行选择。例如,加工酶可以是淀粉加工酶,例如淀粉降解或淀粉异构化酶,或者非淀粉加工酶。适宜的加工酶包括但不限于淀粉降解或异构化酶,包括例如α-淀粉酶、内切或外切-1,4或1,6-α-D葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶及其它外切淀粉酶;和淀粉脱支酶,例如异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶、淀粉型支链淀粉酶等,糖基转移酶例如环糊精糖基转移酶等,纤维素酶例如外切-1,4-β-纤维二糖水解酶、外切-1,3-β-D-葡聚糖酶、半纤维素酶、β-葡糖苷酶等;内切葡聚糖酶,例如内切-1,3-β-葡聚糖酶和内切-1,4-β-葡聚糖酶等;L-阿拉伯糖酶,例如内切-1,5-α-L-阿拉伯糖酶、α-阿拉伯糖苷酶等;半乳聚糖酶例如内切-1,4-β-D-半乳聚糖酶、内切-1,3-β-D半乳聚糖酶、β-半乳糖苷酶、α-半乳糖苷酶等;甘露聚糖酶,例如内切-1,4-β-D-甘露聚糖酶、β-甘露糖苷酶、α-甘露糖苷酶等;木聚糖酶,例如内切-1,4-β-木聚糖酶、β-D-木糖苷酶、1,3-β-D-木聚糖酶等;和果胶酶;以及非淀粉加工酶,包括蛋白酶、葡聚糖酶、木聚糖酶、硫氧还蛋白/硫氧还蛋白还原酶、酯酶、植酸酶和脂肪酶。
在一个实施方案中,加工酶是淀粉降解酶,选自:α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶或其组合。根据该实施方案,淀粉降解酶能够允许自加工的植物或植物部分在该植物或植物部分中所含的该酶激活后降解淀粉,这将在本文中进一步描述。淀粉降解酶基于期望的终产物选择。例如,可以选择葡萄糖异构酶以将葡萄糖(己糖)转化成果糖。或者,可以基于具有各种期望的链长度(基于例如加工程度的函数)或具有各种期望的分支模式的期望淀粉衍生终产物,选择酶。例如,可以使用α-淀粉酶、葡糖淀粉酶、或淀粉型支链淀粉酶在短温育时间下产生糊精产物而在较长的温育时间下产生较短链长的产物或糖(sugar)。可以使用支链淀粉酶特异地水解淀粉中的分支点,产生高直链淀粉的淀粉,或者可以使用新支链淀粉酶产生具有其中散布有α1,6连接的、α1,4连接的链的淀粉。可以使用葡糖苷酶产生极限糊精,或者使用不同酶的组合制备其它淀粉衍生物。
在另一实施方案中,加工酶是非淀粉加工酶,选自蛋白酶、葡聚糖酶、木聚糖酶、植酸酶、脂肪酶、纤维素酶、β葡糖苷酶和酯酶。这些非淀粉加工酶允许本发明自加工的植物或植物部分在植物的被靶向区域整合这些酶,并在激活后破坏植物而保留其中的淀粉粒完整。例如,在一个优选实施方案中,非淀粉降解酶靶向植物细胞的胚乳基质并在激活后破坏该胚乳基质而保留其中的淀粉粒完整并且使淀粉粒可以更容易地从所得物中回收。
本发明还考虑加工酶的组合。例如,可以组合使用淀粉加工酶和非淀粉加工酶。加工酶的组合可以通过使用分别编码各一种酶的多种基因构建体获得。或者,可以通过已知方法使利用这些酶分别地稳定转化的各单个转基因植物杂交以获得同时含有这些酶的植物。另一方法包括将外源酶和转基因植物一起使用。
加工酶可以从任何来源分离或获得,并且编码其的相应多核苷酸可以由本领域技术人员确定。例如,加工酶例如α-淀粉酶可以来源于炽热球菌属(Pyrococcus)(例如,强烈炽热球菌(Pyrococcusfuriosus))、栖热菌属(Thermus)、高温球菌属(Thermococcus)(例如,Thermococcus hydrothermalis)、硫化叶菌属(Sulfolobus)(例如,硫磺矿硫化叶菌(Sulfolobus sofataricus))、栖热袍菌属(Thermotoga)(例如,海栖热袍菌(Thermotoga maritima)和Thermotoga neapolitana)、热厌氧杆菌属(Thermoanaerobacterium)(例如,腾冲热厌氧杆菌(Thermoanaerobacter tengcongensis))、曲霉属(Aspergillus)(例如Aspergiusshirousami和黑曲霉)、根霉属(例如米根霉(Rhizopus oryzae))、热变形菌目(Thermoproteales)、除硫球菌属(Desulfurococcus)(例如,溶淀粉除硫球菌(Desulfurococcusamylolyticus))、热自养甲烷杆菌(Methanobacteriumthermoautothrophicum)、詹氏甲烷球菌(Methanococcusjannaschii)、Methanopyrus kandleri、Thermosynechococcuselongatus、嗜酸热原体(Thermoplasma acidophilum)、Thefmoplasmavolcanium、敏捷气热菌(Aeropyrum pernix)和植物例如玉米、大麦和稻。
本发明加工酶能够在引入植物基因组中和表达后被激活。激活酶的条件针对各不同的酶来确定,并且可以包括变化的条件,例如温度、pH、水合作用、金属的存在、激活化合物、失活化合物等。例如,温度依赖型酶可以包括嗜温型的、嗜热型的和嗜高热型的酶。嗜温酶(mesophilic enzyme)典型地在20℃至65℃的温度下具有最大活性,并在大于70℃的温度失活。嗜温酶在30至37℃具有显著的活性,30℃的活性优选是最大活性的至少10%,更优选是最大活性的至少20%。
嗜热酶(Thermophilic enzyme)在50℃至80℃的温度下具有最大活性,并在大于80℃的温度失活。嗜热酶优选在30℃具有不到20%的最大活性,更优选不到10%的最大活性。
“嗜高热”酶(hyperthermophilic enzyme)在甚至更高温度下仍具有活性。嗜高热酶在大于80℃的温度下具有最大活性,并在至少80℃的温度下保持活性,更优选地在至少90℃的温度下保持活性,最优选地在至少95℃的温度下保持活性。嗜高热酶在低温下也具有降低的活性。嗜高热酶在30℃可以具有不足最大活性的10%的活性,优选地该活性不足最大活性的5%。
优选地,修饰编码加工酶的多核苷酸以包括针对在所选生物体例如植物中的表达而优化的密码子(见例如,Wada等,Nucl.Acids Res.,18:2367(1990),Murray等,Nucl.Acids Res.,17:477(1989),美国专利号5,096,825、5,625,136、5,670,356和5,874,304)。密码子优化型序列是合成的序列,即,它们并不天然存在,并且优选地与编码加工酶的、密码子未优化的亲本多核苷酸编码相同的多肽(或与全长多肽具有基本上相同活性的全长多肽的酶活性片段)。优选地,该多肽在生物化学上与亲本来源多核苷酸截然不同,或者从亲本来源多核苷酸通过例如编码特定加工酶的DNA的递归诱变(recursivemutagenesis)而改良产生,从而使得其在工艺应用中的性能得以提高。优选的多核苷酸针对在靶宿主植物中的表达进行优化,并编码加工酶。制备这些酶的方法包括诱变,例如递归诱变和选择。用于诱变和核苷酸序列改变的方法是本领域熟知的。见例如,Kunkel,Proc.Natl.Acad.Sci.USA,82:488(1985);Kunkel等,Methods in Enzymol.154:367(1987);美国专利号4,873,192;Walker和Gaastra编(1983)Techniques in Molecular Biology(MacMillan Publishing Company,纽约)和其中引用的参考文献以及Arnold等,Chem.Eng.Sci.,51:5091(1996))。优化核酸区段在靶植物或生物体中的表达的方法是本领域熟知的。简而言之,获得指示靶生物所使用的最佳密码子的密码子使用表,并选择最佳密码子以替换靶多核苷酸中的密码子,然后化学合成此经过优化的序列。玉米的优选密码子描述在美国专利号5,625,136中。
本发明还考虑本发明多核苷酸的互补核酸。对于Southern印迹或Northern印迹中具有100个以上的互补残基的互补核酸在滤膜上的杂交,低严紧杂交条件的一个例子是50%甲酰胺,例如,在50%甲酰胺、1M NaCl、1%SDS中37℃杂交并在0.1X SSC中60℃至65℃洗涤。示例性低严紧条件包括用30至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液在37℃杂交,并在1X至2X SSC(20X SSC=3.0MNaCl/0.3M柠檬酸三钠)中50至55℃洗涤。示例性中等严紧条件包括在40至45%甲酰胺、1.0M NaCl、1%SDS中37℃杂交并在0.5X至1XSSC中55至60℃洗涤。
而且,本发明还考虑编码加工酶的“酶活性”片段的多核苷酸。本文中,“酶活性”指加工酶的多肽片段,该片段与该加工酶在修饰该加工酶于适当条件下正常所作用的底物方面具有基本上相同的生物学活性。
在一个优选实施方案中,本发明多核苷酸是编码α-淀粉酶的玉米优化型(maize-optimized)多核苷酸,例如SEQ ID NO:2、9、46和52中提供的多核苷酸。在另一优选实施方案中,多核苷酸是编码支链淀粉酶的玉米优化型多核苷酸,例如SEQ ID NO:4和25中提供的多核苷酸。在再一优选实施方案中,多核苷酸是编码α-葡糖苷酶的玉米优化型多核苷酸,例如SEQ ID NO:6中提供的多核苷酸。另一优选的多核苷酸是具有SEQ ID NO:19、21、37、39、41或43的、编码葡萄糖异构酶的玉米优化型多核苷酸。另一实施方案中,优选SEQ ID NO:46、48或50中给出的、编码葡糖淀粉酶的玉米优化型多核苷酸。而且,在SEQ ID NO:57中提供了编码葡聚糖酶/甘露聚糖酶融合多肽的玉米优化型多核苷酸。本发明还提供在中等或优选地低的严紧杂交条件下杂交并根据具体情况而定编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶、葡糖淀粉酶、葡聚糖酶或甘露聚糖酶活性的多肽的、这些多核苷酸的互补核酸。
多核苷酸可以与“核酸”或“polynucleic acid”互换使用,指脱氧核糖核苷酸或核糖核苷酸及其由单体(核苷酸)组成的、单链或双链形式的聚合物,其中所述单体(核苷酸)含有糖、磷酸和碱基,所述碱基是嘌呤或嘧啶。除非特别地限制,该术语包括含有天然核苷酸的已知类似物的核酸,所述核酸与参考核酸具有相似的结合性质并与天然存在的核苷酸以相似的方式代谢。除非另行指出,否则特定核酸序列也隐含其保守修饰的变体(例如,简并密码子替代)和互补序列以及明确指出的该序列。特别地,可以通过产生一个或多个选定的(或所有的)密码子的第三位被混合型碱基(mixed-base)和/或脱氧肌苷残基替代的序列,而实现简并密码子替代。
在此也包括“变体”或基本上相似的序列。对于核苷酸序列,变体包括由于遗传密码的简并性而编码天然蛋白质的相同氨基酸序列的那些序列。天然存在的等位变体例如这些变体可以使用熟知的分子生物学技术,例如聚合酶链式反应(PCR)、杂交技术和连接重组装技术而鉴定。变体核苷酸序列也包括合成来源的核苷酸序列,例如,通过例如使用定点诱变产生的编码天然蛋白质的核苷酸序列以及编码具有氨基酸替代的多肽的核苷酸序列。一般地,本发明的核苷酸序列变体与天然核苷酸序列具有至少40%、50%、60%,优选地70%,更优选地80%,甚至更优选地90%,最优选地99%的同一性,以及在这些等级基础上的单个最小正整数百分比的同一性。例如,71%、72%、73%等,直到至少90%等级。变体也可以包括相应于所鉴定的基因片段的全长基因。
调节序列:启动子/信号序列/选择标记
编码本发明加工酶的多核苷酸序列可以和编码定位信号或信号序列(在多肽的N端或C端)的多核苷酸序列可操作地连接,以便例如将嗜高热酶引导至植物中的特定区室。该靶的例子包括但不限于液泡、内质网、叶绿体、造粉体、淀粉粒、或细胞壁,或者特定组织,例如种子。编码具有信号序列的加工酶的多核苷酸在植物中的表达,尤其是在与组织特异性或诱导型启动子联用时,可以在植物中产生高水平的定位加工酶。已知多种信号序列可以影响多核苷酸朝向特定区室或在特定区室外的表达或靶向。适宜的信号序列和靶向启动子是本领域已知的,包括但不限于本文中提供的那些。
例如,当期望在特定组织或器官中表达时,可以使用组织特异性启动子。相反,如果期望基因响应刺激物而表达,诱导型启动子是特别好的调节元件。当期望在植物的所有细胞中实现连续表达时,使用组成型启动子。可以将玉米启动子序列上游和/或下游的其它调节序列包括在转化载体的表达构建体中以导致异源核苷酸序列在转基因植物中不同水平的表达。
具有各种表达特征的多种植物启动子已有描述。已有描述的一些组成型启动子的例子包括稻肌动蛋白1(Wang等,Mol.Cell.Biol.,12:3399(1992);美国专利号5,641,876)、CaMV35S(Odell等,Nature,313:810(1985))、CaMV19S(Lawton等,1987)、nos(Ebert等,1987)、Adh(Walker等,1987)、蔗糖合酶(Yang & Russell,1990)和泛素的启动子。
在转基因植物中用于基因的组织特异性靶向的载体典型地包括组织特异性启动子,也可以包括其它组织特异性控制元件例如增强子序列。基于本公开,在某些植物组织中指导特异的或增强的表达的启动子将是本领域技术人员已知的。这些启动子包括,例如,特异于绿色组织的rbcS启动子;在根或受伤的叶组织中具有较高活性的ocs、nos和mas启动子;在根中指导增强的表达的、截短的(-90至+8)35S启动子,在根中指导表达的α-微管蛋白基因,和来源于玉米醇溶蛋白贮存蛋白基因的、在胚乳中指导表达的启动子。
可以通过联合引入组成型表达的基因(所有组织)以及仅仅在不期望该基因产物出现的那些组织中表达的反义基因,而功能性地实现组织特异性表达。例如,可以将编码脂肪酶的基因引入,使用来自花椰菜花叶病毒的35S启动子使其在所有组织中表达。使用例如玉米醇溶蛋白启动子,在玉米籽粒中表达该脂肪酶基因的反义转录物,则将阻止该脂肪酶蛋白质在种子中积累。由此,由引入的基因编码的蛋白质将存在于除籽粒之外的所有组织中。
而且,已经报道了植物中的几种组织特异性调节的基因和/或启动子。已经报道的一些组织特异性基因包括编码种子贮存蛋白(例如napin、cruciferin、β-conglycinin和菜豆蛋白)、玉米醇溶蛋白或油体蛋白(例如,油质蛋白)的基因,或者参与脂肪酸生物合成的基因(包括酰基载体蛋白、硬脂酰ACP去饱和酶和脂肪酸去饱和酶(fad2-1))、和在胚胎发育过程表达的其它基因(例如Bce4,见例如EP255378和Kridl等Seed Science Research,1:209(1991))。已有描述的组织特异性启动子的例子包括凝集素启动子(Vodkin,Prog.Clin.Biol.Res.138:87(1983);Lindstrom等Der.Genet.,11:160(1990))、玉米醇脱氢酶1启动子(Vogel等,1989;Dennis等,NucleicAcids Res.12:3983(1984))、玉米集光复合体启动子(Simpson,1986;Bansal等,Proc.Natl.Acad.Sci.USA,89:3654(1992))、玉米热休克蛋白启动子(Odell等,1985;Rochester等,1986)、豌豆小亚基RuBP羧化酶启动子(Poulsen等,1986;Cashmore等,1983)、Ti质粒甘露碱合酶启动子(Langridge等,1989)、Ti质粒胭脂碱合酶启动子(Langridge等,1989)、矮牵牛查耳酮异构酶启动子(vanTunen等,EMBO J.,7:1257(1988))、菜豆富甘氨酸蛋白质1启动子(Keller等,Genes Dev.3:1639(1989))、截短的CaMV35s启动子(Odell等,Nature,313:810(1985))、马铃薯patatin启动子(Wenzler等,Plant Mol.Biol. 13:347(1989))、根细胞启动子(Yamamoto等,Nucleic Acids Res.,18:7499(1990))、玉米的玉米醇溶蛋白启动子(Reina等,Nucleic Acids Res.18:6425(1990);Kriz等,Mol.Gen.Genet.,207:90(1987);Wandelt等,Nucleic Acids Res.17:2354(1989);Langridge等Cell,34:1015(1983);Reina等,NucleicAcids Res.18:7449(1990))、球蛋白-1启动子(Belanger等,Genetics,129:863(1991))、α-微管蛋白启动子、cab启动子(Sullivan等,Mo1.Gen.Genet.215:431(1989))、PEPCase启动子(Hudspeth & Grula,1989)、R基因复合体相关启动子(Chandler等,Plant Cell,1:175(1989))、和查耳酮合酶启动子(Franken等,EMBO J.10:2605(1991))。对于种子特异性表达尤其有用的是豌豆的豌豆球蛋白启动子(Czako等,Mol.Gen.Genet.235:33(1992))。(也参见美国专利号5,625,136,在此并入作为参考。)对于在成熟叶中的表达有用的其它启动子是在衰老期开始时开关的那些启动子,例如来自拟南芥属(Arabidopsis)的SAG启动子(Gan等,Science,270:1986(1995))。
U.S.4,943,674(其公开内容特此并入作为参考)中讨论了一类在开花期或在开花期至果实发育(至少直到成熟开始)的过程中表达的果实特异性启动子。已经分离了优选在棉纤维中表达的cDNA克隆(John等,Proc.Natl.Acad.Sci.USA,89:5769(1992))。已经分离并表征了来自番茄的、在果实发育过程中展示出差异表达的cDNA克隆(Mansson等,Gen.Genet.200:356(1985),Slater等,PlantMol.Biol.5:137(1985))。多聚半乳糖醛酸酶基因的启动子在果实成熟中具有活性。多聚半乳糖醛酸酶基因描述在美国专利号4,535,060、美国专利号4,769,061、美国专利号4,801,590和美国专利号5,107,065中,这些专利的公开内容并入此处作为参考。
组织特异性启动子的其它例子包括在叶受损(例如,由昆虫咀嚼所致)后在叶细胞中指导表达的启动子、在块茎中指导表达的启动子(例如,patatin基因启动子)、和在纤维细胞中指导表达的启动子(发育调节的纤维细胞蛋白质的一个例子是E6(John等,Proc.Natl.Acad.Sci.USA,89:5769(1992)。E6基因在纤维中具有最大活性,但在叶、胚珠和花中存在低水平的转录物。
一些“组织特异性”启动子的组织特异性可能不是绝对的,并可以由本领域技术人员使用白喉毒素序列测试。也可以通过不同组织特异性启动子的组合,实现具有“渗漏”表达的组织特异性表达(Beals等,Plant Cell,9:1527(1997))。其它组织特异性启动子可以由本领域技术人员分离(见U.S.5,589,379)。
一个实施方案中,可以使多糖水解基因的产物,例如α-淀粉酶的方向定向于特定的细胞器,例如质外体而非细胞质。对于此的一个例子是使用赋予蛋白质质外体特异性靶向的玉米γ-玉米醇溶蛋白N端信号序列(SEQ ID NO:17)。指引蛋白质或酶达到特定区室将允许酶以不与底物接触的方式定位。以此方式,在酶接触其底物之前不发生酶的酶学反应。通过碾磨工艺(物理破碎细胞完整性)、或加热细胞或植物组织以破坏含有酶的植物细胞或器官的物理完整性,可以使酶与其底物接触。例如,可以将嗜温淀粉水解酶引导至质外体或内质网以免与造粉体中的淀粉粒接触。碾磨谷粒将破坏谷粒的完整性,然后淀粉水解酶将与淀粉粒接触。以此方式,可以规避酶和其底物共定位的潜在负作用。
在另一实施方案中,组织特异性启动子包括胚乳特异性启动子如玉米γ-玉米醇溶蛋白启动子(SEQ ID NO:12所示例的)或玉米ADP-gpp启动子(SEQ ID NO:11所示例的,该序列包括5’非翻译序列和内含子序列)或Q蛋白启动子(SEQ ID NO:98所示例的)或稻的谷蛋白1启动子(SEQ ID NO:67中所示例的)。因此,本发明包括包含含有SEQ IDNO:11、12、67或98的启动子的分离多核苷酸、与其互补物在低严紧杂交条件下杂交的多核苷酸、或其具有启动子活性(例如,具有SEQID NO:11、12、67或98的启动子的活性的至少10%,优选地至少50%)的片段。
在本发明另一实施方案中,多核苷酸编码嗜高热加工酶,该酶与叶绿体(造粉体)转运肽(CTP)和淀粉结合域(例如来自waxy基因)可操作地连接。在此实施方案中一个示例性多核苷酸编码SEQ ID NO:10(与来自waxy的淀粉结合域连接的α-淀粉酶)。其它示例性多核苷酸编码与将该酶引导至内质网并分泌至造粉体的信号序列连接的嗜高热加工酶(如,编码SEQ ID NO:13、27或30的多核苷酸,其分别包含与α-淀粉酶、α-葡糖苷酶、葡萄糖异构酶可操作连接的来自玉米γ-玉米醇溶蛋白的N端序列)、与将酶滞留于内质网的信号序列连接的嗜高热加工酶(如编码包含与嗜高热酶可操作连接的玉米γ-玉米醇溶蛋白N端序列的SEQ ID NO:14、26、28、29、33、34、35或36的多核苷酸,其中所述酶与SEKDEL可操作连接,其中所述酶是α-淀粉酶、malAα-葡糖苷酶、海栖热袍菌(T.maritima)葡萄糖异构酶、T.neapolitana葡萄糖异构酶)、与将酶引导至造粉体的N端序列连接的嗜高热加工酶(如编码SEQ ID NO:15的多核苷酸,其中SEQ ID NO:15包含与α-淀粉酶可操作连接的、来自waxy的N端造粉体引导序列)、将酶引导至淀粉粒的嗜高热融合多肽(如编码SEQ ID NO:16的多核苷酸,其中SEQ ID NO:16包含与含有waxy淀粉结合域的α-淀粉酶/waxy融合多肽可操作连接的、来自waxy的N端造粉体引导序列)、与ER滞留信号连接的嗜高热加工酶(如编码SEQ ID NO:38和39的多核苷酸)。而且,嗜高热加工酶可以与具有氨基酸序列(SEQ IDNO:53)的生淀粉结合位点连接,其中编码加工酶的多核苷酸与编码该结合位点的玉米优化型核酸序列(SEQ ID NO:54)连接。
已经报道了几种诱导型启动子。许多在以下文献中以综述形式进行描述:Gatz,Current Opinion in Biotechnology,7:168(1996)和Gatz,C.Annu.Rev.Plant Physiol.Plant Mol.Biol.48:89(1997)。例子包括四环素阻遏系统,Lac阻遏系统、铜诱导系统、水杨酸诱导系统(例如PRla系统)、糖皮质激素诱导(Aoyama T.等,N-HPlant Journal,11:605(1997))和蜕皮激素诱导系统。其它诱导型启动子包括ABA和膨压诱导启动子、生长素结合蛋白基因的启动子(Schwob等,Plant J.4:423(1993))、UDP葡萄糖类黄酮糖基转移酶基因启动子(Ralston等,Genetics,119:185(1988))、MPI蛋白酶抑制剂启动子(Cordero等,Plant J.6:141(1994))和甘油醛-3-磷酸脱氢酶基因启动子(Kohler等,Plant Mol.Biol.29:1293(1995);Quigley等,J.Mol.Evol.29:412(1989);Martinez等,J.Mol.Biol.208:551(1989))。也包括苯磺胺诱导型(U.S.5364,780)和醇诱导型(WO97/06269和WO97/06268)系统及谷胱甘肽S转移酶启动子。
其它研究集中于响应于环境压力或刺激物例如增加的盐度、干旱、病原体和损伤而被诱导调节的基因。(Graham等,J.Biol.Chem.260:6555(1985);Graham等,J.Biol.Chem.260:6561(1985);Smith等,Planta,168:94(1986))。已经报道了金属羧肽酶抑制剂蛋白质在损伤的马铃薯植物的叶中积累(Graham等,Biochem.Biophys.Res.Comm.,101:1164(1981))。已经报道了可以被茉莉酮酸甲酯、elicitor、热休克、缺氧应激或除草剂防护剂诱导的其它植物基因。
嵌合反式作用病毒复制蛋白质的调节性表达还可以通过其它遗传策略,例如Cre介导的基因激活来进行调节(Odell等,Mol.Gen.Genet.113:369(1990))。因此,位于启动子和复制蛋白编码序列之间阻断嵌合复制基因自启动子表达的、由lox位点界定的含有3’调节序列的DNA片段,可以通过Cre介导的切除作用而除去,导致反式作用复制基因表达。在此情况下,嵌合Cre基因、嵌合反式作用复制基因或两者可以在组织特异性和发育特异性或诱导型启动子的控制下。一个备用遗传策略是使用tRNA抑制基因。例如,tRNA抑制基因的调节性表达可以有条件地控制含有适当终止密码子的反式作用复制蛋白编码序列的表达(Ulmasov等,Plant.Mol.Biol.35:417(1997))。同样,嵌合tRNA抑制基因、嵌合反式作用复制基因或两者可以在组织特异性和发育特异性或诱导型启动子的控制下。
优选地,对于多细胞生物,启动子也可以对特定组织、器官或发育阶段是特异的。此类启动子的例子包括但不限于玉蜀黍(Zea mays)ADP-gpp和玉蜀黍γ-玉米醇溶蛋白启动子和玉蜀黍球蛋白启动子。
基因在转基因植物中的表达可能仅仅在植物发育过程中的某些时间段是期望的。发育的时间安排常常与组织特异性基因表达相关。例如,玉米醇溶蛋白贮存蛋白质在授粉后大约15天于胚乳中开始表达。
此外,可以构建并使用载体来实现特定基因产物在转基因植物细胞中的细胞内定向或者指引蛋白质到达细胞外环境。这一般可以通过将编码转运肽或信号肽的DNA序列与特定基因的编码序列连接而实现。所得转运肽或信号肽分别将蛋白质运送至特定的细胞内或细胞外目的地,然后被翻译后除去。转运肽或信号肽通过促进蛋白质跨细胞内膜,例如液泡、小泡、质体和线粒体膜的运输来起作用,而信号肽指引蛋白质通过细胞外膜。
信号序列如用于靶向内质网和在质外体中分泌的玉米γ-玉米醇溶蛋白N端信号序列可以可操作地与编码本发明嗜高热加工酶的多核苷酸连接(Torrent等,1997)。例如,SEQ ID NO:13、27和30提供编码与来自玉米γ玉米醇溶蛋白的N端序列可操作连接的嗜高热酶的多核苷酸。另一信号序列是将多肽滞留在内质网中的氨基酸序列SEKDEL(Munro和Pelham,1987)。例如,编码SEQ ID NO:14、26、28、29、33、34、35或36(含有与加工酶可操作连接的来自玉米γ玉米醇溶蛋白的N端序列,其中所述加工酶与SEKDEL可操作连接)的多核苷酸。多肽还可以通过与waxy造粉体引导肽(Klosgen等,1986)融合而被引导至造粉体或者可以被引导至淀粉粒。例如,编码嗜高热加工酶的多核苷酸可以与叶绿体(造粉体)转运肽(CTP)和淀粉结合域(例如来自waxy基因)可操作地连接。SEQ ID NO:10示例了与来自waxy的淀粉结合域连接的α-淀粉酶。SEQ ID NO:15示例了与α淀粉酶可操作连接的、来自waxy的N端序列造粉体引导序列。而且,编码加工酶的多核苷酸可以使用waxy淀粉结合域进行融合以靶向淀粉粒。例如,SEQ ID NO:16示例了含有来自waxy的N端造粉体引导序列的融合多肽,其中所述引导序列与包含waxy淀粉结合域的α-淀粉酶/waxy融合多肽可操作地连接。
除了加工信号外,本发明多核苷酸还可以包括本领域已知的其它调节序列。“调节序列”和“适宜的调节序列”均指位于编码序列上游(5’非编码序列)、内部或下游(3’非编码序列)并影响与之连接的编码序列的转录、RNA加工或稳定性或翻译的核苷酸序列。调节序列包括增强子、启动子、翻译前导序列、内含子和多聚腺苷酸化信号序列。这些序列包括天然的和合成的序列以及可以是天然序列和合成序列的组合的序列。
如本领域熟知的,也可以在本发明中使用选择标记以允许选择转化的植物和植物组织。可能期望将可选择或可甄别的标记基因用作可表达的目的基因,或者在可表达的目的基因之外还使用可选择或可甄别的标记基因。“标记基因”是赋予表达该标记基因的细胞独特表型由此允许将该转化的细胞与不具有该标记的细胞区分开来的基因。此类基因可以编码可选择的或可甄别的标记,这取决于该标记是否赋予可以通过化学手段(即,通过使用选择剂,如除草剂、抗生素等)进行选择的性状,或者其是否仅仅是可以通过观察或检查,即通过甄别而鉴定的性状(例如R基因座性状)。当然,适宜的标记基因的许多例子是本领域已知的,并可以用于实施本发明。
在术语可选择的或可甄别的标记基因中也包括编码“可分泌标记”的基因,其中可以通过检测所述可分泌标记的分泌作为鉴定或选择转化细胞的手段。实例包括编码可分泌抗原(能够通过抗体相互作用鉴定)或者甚至是可分泌酶(能够通过其催化活性检测)的标记。可分泌蛋白分为几类,包括能够通过例如ELISA检测的、小的、可扩散的蛋白质;能够在细胞外溶液中检测的、小的活性酶(例如,α-淀粉酶、β-内酰胺酶、膦丝菌素乙酰转移酶);和插入或陷入细胞壁中的蛋白质(例如,包括前导序列,如存在于伸展蛋白或马铃薯PR-S的表达单位中的前导序列的蛋白质)。
关于可选择或可甄别标记,使用编码包括独特表位并被隔离在细胞壁中的蛋白质的基因,被认为是尤其有利的。此类分泌型抗原标记理想地使用在植物组织中提供低背景的表位序列、以及可以造成有效的表达和跨越质膜的定向的启动子-前导序列,并且将产生结合在细胞壁中但仍可以被抗体接近的蛋白质。经过修饰包括独特表位的正常分泌型细胞壁蛋白质将满足所有这些需要。
适于以此方式修饰的蛋白质的一个例子是伸展蛋白、或富含羟基脯氨酸的糖蛋白(HPRG)。例如,玉米HPRG(Steifel等,The Plant Cell,2:785(1990))分子在分子生物学、表达和蛋白质结构上进行了充分的表征。然而,各种伸展蛋白和/或富含甘氨酸的细胞壁蛋白(Keller等,EMBO Journal,8:1309(1989))之任一种都可以通过添加抗原性位点进行修饰而产生可甄别的标记。
a.可选择标记
可以用于本发明的可选择标记包括,但不限于,编码卡那霉素抗性并可以使用卡那霉素、G418等选择的neo或nptII基因(Potrykus等,Mol.Gen.Genet.199:183(1985));赋予对除草剂膦丝菌素的抗性的bar基因;编码改变的EPSP合酶蛋白由此赋予草甘膦(glyphosate)抗性的基因(Hinchee等,Biotech.6:915(1988));赋予对溴苯腈(bromoxynil)的抗性的腈水解酶基因,例如来自臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn(Stalker等,Science,242:419(1998));赋予对咪唑啉酮、磺酰尿或其它ALS抑制化学药品的抗性的、突变的乙酰乳酸合酶基因(ALS)(欧洲专利申请154,204,1985);氨甲蝶呤抗性DHFR基因(Thillet等,J.Biol.Chem.,263:12500(1988));赋予对除草剂茅草枯的抗性的茅草枯脱卤素酶基因;磷酸甘露糖异构酶(PMI)基因;赋予对5-甲基色氨酸的抗性的、突变的邻氨基苯甲酸合酶基因;赋予对抗生素潮霉素的抗性的hph基因;或提供代谢甘露糖的能力的甘露糖-6-磷酸异构酶基因(在此也称作磷酸甘露糖异构酶基因)(美国专利号5,767,378和5,994,629)。本领域技术人员能够选择适宜的可选择标记基因用于本发明。当使用突变的EPSP合酶基因时,通过并入适宜的叶绿体转运肽CTP,可以获得额外的益处(欧洲专利申请0,218,571,1987)。
能够在系统中用于选择转化体的可选择标记基因的一个举例说明性实施方案是,编码膦丝菌素乙酰转移酶的基因,例如来自吸水链霉菌(Streptomyces hygroscopicus)的bar基因或来自产绿色链霉菌(Streptomyces Viridochromogenes)的pat基因。膦丝菌素乙酰转移酶(PAT)失活除草剂茅草枯中的活性成分,膦丝菌素(PPT)。PPT抑制谷氨酰胺合成酶(Murakami等,Mol.Gen.Genet.205:42(1986);Twell等,Plant Physiol.91:1270(1989)),从而造成快速的氨积累和细胞死亡。因为已经报道的存在于谷物转化中的主要困难(Potrykus,Trends Biotech.7:269(1989)),在单子叶植物中成功地使用此选择系统是尤其令人惊奇的。
当期望使用双丙氨膦(bialaphos)抗性基因实施本发明时,对于此目的尤其有用的基因是可以从链霉菌属(Streptomyces)物种(例如ATCC21,705)获得的bar或pat基因。Bar基因的克隆已有描述(Murakami等,Mol.Gen.Genet.205:42(1986);Thompson等,EMBOJourna l,6:2519(1987)),此外也描述了bar基因在单子叶植物以外的植物背景中的使用(DeBlock等,EMBO Journal,6:2513(1987);De Block等,Plant Physiol.91:694(1989))。
b.可甄别的标记
可以使用的可甄别标记包括但不限于β-葡糖醛酸糖苷酶或udiA基因(GUS),其编码具有多种已知的显色底物的酶;R-基因座基因,其编码在植物组织中调节花色素苷色素(红色)产生的产物(Dellaporta等,Chromosome Structure and Function,pp263-282(1988));β-内酰胺酶基因(Sutcliffe,PNAS USA,75:3737(1978)),其编码存在多种已知的显色底物(例如,PADAC,一种显色的头孢菌素)的酶;xy1E基因(Zukowsky等,PNAS USA80:1101(1983)),其编码能够转化显色儿茶酚的儿茶酚双加氧酶;α-淀粉酶基因(Ikuta等,Biotech.,8:241(1990));酪氨酸酶基因(Katz等,J.Gen.Microbiol.129:2703(1983)),其编码能够将酪氨酸氧化成DOPA和多巴醌的酶,其中多巴醌又缩合形成可以容易地检测的化合物黑色素;β-半乳糖苷酶基因,其编码存在显色底物的酶;萤光素酶(1ux)基因(Ow等,Science,234:856(1986)),其允许进行生物发光检测;或水母发光蛋白基因(Prasher等,Biochem.Biophys.Res.Comm.,126:1259(1985)),其可以用于钙敏感的生物发光检测;或绿色荧光蛋白基因(Niedz等,Plant Cell Reports,14:403(1995))。
预期来自玉米R基因复合体的基因作为可甄别标记将尤其有用。玉米中的R基因复合体编码起着调节大多数种子和植物组织中花色素苷色素生产的作用的蛋白质。来自R基因复合体的基因适用于玉米转化,因为该基因在转化细胞中的表达对细胞不会产生损害。因此,引入该细胞的R基因将造成红色色素的表达,并且,如果在稳定整合的情况下,能够以红色部分直观评分。如果玉米品系带有编码花色素苷生物合成途径中的酶促中间体的基因的显性等位基因(C2、A1、A2、Bz1和Bz2),但在R基因座带有隐性等位基因,则来自该品系的任何细胞用R转化将导致红色色素的形成。示例性品系包括Wisconsin 22(该品系含有rg-Stadler等位基因)和TR112,一种K55衍生物(其是r-g,b,P1)。或者,如果将C1和R等位基因一起引入,则可以使用任何玉米基因型。考虑用于本发明的另一可甄别标记是1ux基因编码的萤火虫萤光素酶。Lux基因在转化细胞中的存在可以通过使用例如X光片、闪烁计数、荧光分光光度测定法、低光照摄像机、光子计数照相机或多孔发光测定法检测。也设想到,可以发展该系统以便用于群体的生物发光筛选,例如在组织培养板上进行筛选,或甚至用于整株植物筛选。
用于转化植物的多核苷酸可以包括,但不限于,来自植物基因和非植物基因例如来自细菌、酵母、动物或病毒的那些基因的DNA。引入的DNA可以包括修饰的基因、基因的部分、或嵌合基因,包括来自相同或不同玉米基因型的基因。术语“嵌合基因”或“嵌合DNA”定义为包含来自物种的至少两种DNA序列或区段的基因或DNA序列或区段,其中所述至少两种DNA序列或区段在天然状况下不组合成DNA,或者所述至少两种DNA序列或区段以在未转化植物的天然基因组中正常不存在的方式定位或连接。
本发明还提供包含编码嗜高热加工酶的多核苷酸,优选地密码子优化的多核苷酸的表达盒。优选地,表达盒中多核苷酸(第一多核苷酸)与调节序列,例如启动子、增强子、内含子、终止序列或其任何组合以及任选地编码信号序列(N或C端)的第二多核苷酸可操作地连接,其中所述信号序列指导第一多核苷酸编码的酶到达特定的细胞或亚细胞位置。因此,启动子和一个或多个信号序列可以导致酶在植物、植物组织或植物细胞的特定位置进行高水平的表达。启动子可以是组成型启动子、诱导型(条件型)启动子或组织特异性启动子,例如胚乳特异性启动子如玉米的γ-玉米醇溶蛋白启动子(如SEQ ID NO:12)或玉米的ADP-gpp启动子(如SEQ ID NO:11,其包括5’非翻译序列和内含子序列)。本发明还提供包含含有SEQ ID NO:11或12的启动子的分离的多核苷酸,与其互补序列在低严紧杂交条件下杂交的多核苷酸、或其具有启动子活性(例如,该活性是具有SEQ ID NO:11或12的启动子的活性的至少10%,优选地至少50%)的片段。还提供包含本发明表达盒或多核苷酸的载体以及包含本发明多核苷酸、表达盒或载体的转化细胞。本发明载体可以包含编码一种以上本发明嗜高热加工酶的多核苷酸序列,所述序列可以采取正义方向或反义方向,并且转化的细胞可以包含一种或多种本发明载体。优选的载体是可用于将核酸引入植物细胞中的那些载体。
转化
可以将表达盒或含有表达盒的载体构建体插入细胞。表达盒或载体构建体可以以附加体的形式存在或者整合在细胞基因组中。然后可以将转化的细胞培养成转基因植物。因此,本发明提供转基因植物的产物。该产物可以包括但不限于种子、果实、后代和转基因植物后代的产物。
本领域技术人员已知并可以获得多种用于将构建体引入细胞宿主中的技术。细菌和许多真核细胞的转化可以通过使用聚乙二醇、氯化钙、病毒感染、噬菌体感染、电穿孔和本领域已知的其它方法来实现。转化植物细胞或组织的技术包括使用根癌农杆菌(A.tumefaciens)或发根农杆菌(A.rhizogenes)作为转化剂用DNA进行的转化、电穿孔、DNA注射、微粒轰击、粒子加速等(见例如EP295959和EP138341)。
在一个实施方案中,可以使用农杆菌属物种Ti衍生载体的Ti和Ri质粒的二元型载体,转化各种高等植物,包括单子叶植物和双子叶植物,例如大豆、棉、油菜、烟草和稻(Pacciotti等,Bio/Technology,3:241(1985);Byrne等,Plant Cell Tissue and Organ Culture,8:3(1987);Sukhapinda等Plant Mol.Biol.8:209(1987);Lorz等,Mol.Gen.Genet.199:178(1985);Potrykus Mol.Gen.Genet.199:183(1985);Park等,J.Plant Biol.38:365(1985);Hiei等,Plant J.6:271(1994))。对于使用T-DNA转化植物细胞已经有深入的研究和详细的描述(EP120516;Hoekema,The Binary PlantVector System.Offset-drukkerij Kanters B.V.;Alblasserdam(1985),第V章;Knauf等,Genetic Analysis of Host RangeExpression by Agr obacterium,Moleuclar Genetics of theBacteria-Plant Interaction,Puhler,A.编,Springer-Verlag,纽约,1983,245页;和An.等,EMBO J.4:277(1985))。
本领域技术人员可以获得其它转化方法,例如外源DNA构建体的直接摄取(见EP295959)、电穿孔技术(Fromm等,Nature(London)319:791(1986)、或用包被有核酸构建体的金属粒子进行的高速弹道轰击(Kline等,Nature(London)327:70(1987)和美国专利号4,945,050)。一旦转化后,细胞可以由本领域技术人员进行再生。尤其相关的是近来描述的将外源基因转化至商业重要作物中的方法,所述作物例如菜籽油菜(De Block等,Plant Physiol.91:694-710(1989))、向日葵(Everett等,Bio/Technology,5:1201(1987))、大豆(McCabe等,Bio/Technology,6:923(1988);Hinchee等,Bio/Technology,6:915(1988);Chee等,Plant Physiol.91:1212(1989);Christou等,Proc.Natl.Acad.Sci.USA,86:7500(1989),EP 301749)、稻(Hiei等,Plant J.6:271(1994))和玉米(Gordon Kamm等,Plant Cell,2:603(1990);Fromm等,Biotechnology8:833(1990))。
可以将含有基因组的或合成的片段的表达载体引入原生质体或引入完整的组织或分离的细胞中。优选地,将表达载体引入完整组织中。培养植物组织的一般方法可以参见例如Maki等,“将外源DNA引入植物中的方法”,《(Methods in Plant Moleuclar BiologyBiotechnology》,Glich等(编),pp.67-88 CRC Press(1993);和Phillips等,“细胞-组织培养和体外操作”,《(Corn & CornImprovement》,第3版10,Sprague等(编)pp345-387,AmericanSociety of Agronomy Inc.(1988)。
在一个实施方案中,可以使用直接基因转移方法,例如微粒(microprojectile)介导的递送、DNA注射、电穿孔等,将表达载体引入玉米或其它植物组织中。利用生物轰击(biolistic)装置使用微粒介导的递送,可以将表达载体引入植物组织中。见例如,Tomes等″通过微粒轰击直接将DNA直接转移至完整植物细胞中″,Gamborg andPhillips (Eds.)《(Plant Cell,Tissue and Organ Culture:Fundamental Methods》,Springer Verlag,Berlin(1995)。然而,本发明考虑根据已知转化方法利用嗜高热加工酶转化植物。也参见,Weissinger等,Annual Rev.Genet.,22:421(1988);Sanford等,Particulate Science and Technology.5:27(1987)(洋葱);Christou等,Plant Physiol.,87:671(1988)(大豆);McCabe等,Bio/Technology,6:923(1988)(大豆);Datta等,Bio/Technology,8:736(1990)(稻);Klein等,Proc.Natl.Acad.Sci.USA,85:4305(1988)(玉米);Klein等,Bio/Technology,6:559(1988)(玉米);Klein等,Plant Physiol.,91:440(1988)(玉米);Fromm等,Bio/Technology,8:833(1990)(玉米);和Gordon-Kamm等,Plant Cell,2,603(1990)(玉米);Svab等,Proc.Natl.Acad.Sci.USA,87:8526(1990)(烟草叶绿体);Koziel等,Biotechnology,11:194(1993)(玉米);Shimamoto等,Nature,338:274(1989)(稻);Christou等,Biotechnology,9:957(1991)(稻);欧洲专利申请EP 0332581(鸭茅(orchardgrass)和其它早熟禾亚科(Pooideae));Vasil等,Biotechnology,11:1553(1993)(小麦);Weeks等,Plant Physiol.,102:1077(1993)(小麦)。Methods inMolecular Biology,82.Arabidopsis Protocols,编者Martinez-Zapater和Salinas,1998Humana Press(拟南芥属植物)。
可以用单种DNA分子或多种DNA分子(即,共转化)转化植物,这两种技术均适用于本发明的表达盒和构建体。可以获得多种转化载体用于植物转化,并且可以联合使用本发明表达盒以及任何此类载体。载体的选择取决于优选的转化技术和用于转化的靶物种。
最后,对于引入单子叶植物基因组而言,最期望的DNA区段可能是编码期望性状(例如,水解蛋白质、脂质或多糖)并在新的启动子或增强子等的控制下或者可能地甚至在同源的或组织特异性的(例如,根、珠托/叶鞘、轮(whorl)、茎、穗秆(earshank)、籽粒或叶特异的)启动子或控制元件的控制下的同源基因或基因家族。事实上,可以想到本发明的一个特定用途是基因以组成型方式或以诱导型方式的定向。
适宜的转化载体的例子
可用于植物转化的许多转化载体是植物转化领域的普通技术人员所已知的,与本发明相关的基因可以和本领域已知的任何此类载体联用。载体的选择取决于优选的转化技术和转化的靶物种。
a.适用于农杆菌转化的载体
可获得许多载体用于使用根癌农杆菌的转化。这些载体典型地带有至少一个T-DNA边界序列,并包括载体例如pBIN19(Bevan,Nucl.Acids,Res.(1984))。以下描述适用于农杆菌转化的两个典型载体的构建。
pCIB200和pCIB2001
二元载体pcIB200和pCIB2001被用于构建与农杆菌联用的重组载体,这二个载体按以下方式构建。通过NarI消化pTJS75(Schmidhauser & Helinski,J.Bacteriol.164:446(1985)),允许切除四环素抗性基因,之后插入带有NPTII的来自pUC4K的AccI片段(Messing & Vierra,Gene,19:259(1982);Bevan等,Nature,304:184(1983);McBride等,Plant Molecular Biology,14:266(1990)),构建pTJS75kan。将XhoI接头与含有T-DNA左右边界、植物选择性nos/nptII嵌合基因和pUC多接头的、PCIB7的EcoRV片段(Rothstein等,Gene,53:153(1987))连接,将XhoI消化的片段克隆至SalI消化的pTJSkan中以构建pCIB200(也参见EP 0332104,实施例19)。pCIB200含有以下单一多接头限制性位点:EcoRI,SstI,KpnI,BglII,XbaI和SalI。pCIB2001是pCIB200的衍生物,其通过在多接头中插入额外的限制性位点而构建。pCIB2001多接头中的单一限制性位点是EcoRI,SstI,KpnI,BglII,XbaI,SalI,MluI,BclI,AvrII,ApaI,HpaI和StuI。Pcib2001除了含有这些单一限制性位点外,还具有植物和细菌卡那霉素选择、用于农杆菌介导的转化的T-DNA左右边界、用于在大肠杆菌(E.coli)和其它宿主之间移动的RK2衍生的trfA功能、以及也来自RK2的OriT和OriV功能。pCIB2001多接头适用于克隆含有自己的调节信号的植物表达盒。
pCIB10及其潮霉素选择衍生物
二元载体pCIB10含有编码用于植物中选择的卡那霉素抗性的基因和T-DNA左右边界序列,并整合了来自宽宿主范围的质粒pRK252的序列,从而使得其在大肠杆菌和农杆菌中均能够复制。该载体的构建已由Rothstein等(Gene,53:153(1987))描述。可以构建掺入Gritz等(Gene25:179(1983))描述的潮霉素B磷酸转移酶基因的各种pCIB10衍生物。这些衍生物使得可以仅仅在潮霉素上(pCIB743)或者在潮霉素和卡那霉素上(pCIB715,pCIB717)选择转基因植物细胞。
b.适用于非农杆菌转化的载体
在不使用根癌农杆菌的情况下进行的转化规避了所选转化载体对T-DNA序列的需要,因此,除了诸如以上含有T-DNA序列的载体外,也可以使用缺少这些序列的载体。不依赖于农杆菌的转化技术包括通过微粒轰击进行的转化、原生质体摄取(例如PEG和电穿孔)和显微注射。载体的选择很大程度上取决于对所转化的物种的优选选择。本文也描述了适用于非农杆菌转化的典型载体的构建的非限制性实例。
pCIB3064
pCIB3064是pUC衍生载体,其适用于直接基因转移技术和通过除草剂basta(或膦丝菌素)进行的选择。质粒pCIB246含有与大肠杆菌GUS基因以及CaMV 35S转录终止子操作性融合的CaMV 35S启动子,该质粒描述在PCT公布的申请WO93/07278中。该载体的35S启动子在起始位点5’含有两个ATG序列。这些位点使用标准PCR技术进行突变以除去ATG并产生限制性位点SspI和PvuII。这些新的限制性位点距离单一SalI位点96和37bp,并距离实际起始位点101和42bp。得到的该pCIB246衍生物命名为pCIB3025。然后通过用SalI和SacI消化,从pCIB3025中切除GUS基因,之后末端平端化并重新连接以产生质粒pCIB3060。质粒pJIT82可以从John Innes Centre,Norwich获得,切下含有来自产绿色链霉菌(Streptomyces viridochromogenes)的bar基因的400bp SmaI片段,并将其插入pCIB3060的HpaI位点(Thompson等,EMBO J.,6:2519(1987))。这产生pCIB3064,该质粒含有在CaMV 35S启动子和终止子控制下的bar基因用于除草剂选择、并含有氨苄青霉素抗性基因(用于在大肠杆菌中的选择)和具有单一位点SphI、PstI、HindIII和BamHI的多接头。该载体适用于克隆本身含有自己的调节信号的植物表达盒。
pSOG19和pSOG35:
质粒pSOG35是利用大肠杆菌基因二氢叶酸还原酶(DHFR)作为选择标记从而赋予对氨甲蝶呤的抗性的转化载体。使用PCR从pSOG10扩增35S启动子(-800bp)、来自玉米AdhI基因的内含子6(-550bp)和GUS非翻译前导序列的18bp。也通过PCR扩增编码大肠杆菌二氢叶酸还原酶II型基因的250bp片段,这两个PCR片段与来自pB1221(Clontech)(含有pUC19载体主链和胭脂碱合酶终止子)的SacI-PstI片段组装。这些片段的组装产生含有与内含子6、GUS前导序列、DHFR基因及胭脂碱合酶终止子融合的35S启动子的pSOG19。用来自玉米萎黄斑点病毒(Maize ch1orotic mottle virus,MCMV)的前导序列置换pSOG19中的GUS前导序列,产生载体pSOG35。pSOG19和pSOG35带有pUC的氨苄青霉素抗性基因,并具有可用于克隆外来物质的HindIII、SphI、PstI和EcoRI位点。
c.适用于叶绿体转化的载体
为了在植物质体中表达本发明核苷酸序列,可以使用质体转化载体pPH143(WO97/32011,实施例36)。将核苷酸序列插入pPH143中,由此置换PROTOX编码序列。然后可以将该载体用于质体转化和选择壮观霉素抗性转化体。或者,将核苷酸序列插入pPH143中以置换addH基因。在此情况下,选择对PROTOX抑制剂具有抗性的转化体。
用于转化方法的植物宿主
任何能够随后克隆繁殖(无论是通过器官发生还是通过胚胎发生)的植物组织,均可以用本发明构建体转化。术语器官发生是指从分生组织中心相继地发育出芽和根的过程,而术语胚胎发生是指芽和根以协同方式(不是相继地)一起发育(无论是从体细胞还是从配子)的过程。所选择的特定组织将随着对于所转化的该特定物种而言可获得的且是最适宜的克隆繁殖系统的不同而变化。示例性的组织靶标包括分化的和未分化的组织或植物,包括但不限于叶盘、根、茎、芽、叶、花粉、种子、胚胎、子叶、下胚轴、雌配子体、愈伤组织、现有的分生组织(例如,顶端分生组织、腋芽和根分生组织)、和诱导的分生组织(例如,子叶分生组织和下胚轴分生组织)、肿瘤组织、以及各种形式的细胞和培养物例如单细胞、原生质体、胚和愈伤组织。所述植物组织可以在植物中或在器官、组织或细胞培养物中。
本发明植物可以采取多种形式。该植物可以是转化的细胞和未转化的细胞的嵌合体;该植物可以是克隆的转化体(例如,所有细胞均被转化而含有表达盒);该植物可以包括转化的和未转化的组织的嫁接体(例如,柑橘类的植物物种中嫁接至未转化的接穗上的转化的根状茎)。转化的植物可以通过各种方式繁殖,例如通过克隆繁殖或经典的育种技术繁殖。例如,第一代(或T1)转化植物可以自交以产生纯合的第二代(或T2)转化植物,T2植物可以进一步通过经典育种技术繁殖。可以将显性选择标记(例如nptII)与表达盒相关联以辅助育种的进行。
本发明可以用于转化任何植物物种,包括单子叶植物或双子叶植物,包括,但不限于,玉米(玉蜀黍(Zea mays))、芸苔属物种(Brassicasp.)(例如,欧洲油菜(B.napus)、芜菁(B.rapa)、芥菜(B.junncea)),尤其是可用作种子油来源的那些芸苔属物种、紫苜蓿(Medicagosativa)、稻(Oryza sativa)、黑麦(Secale cereale)、高粱(Sorghumbicolor,Sorghum vulgare)、黍稷(如珍珠稷(Pennisetum glaucum)、黍糜(Panicum miliaceum)、小米(Setaria italica)、穇(Eleusinecoracana))、向日葵(Hilianthus annuus)、红花(Carthamustinctorius)、小麦(Triticum aestiyum)、大豆(Glycine max)、烟草(Nicotiana tabacum)、马铃薯(Solanum tuberosum)、落花生(Arachis hypogaea)、棉(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯(Ipomoea batatus)、木薯(Manihotesculenta)、咖啡(Cofea spp.)、椰子(Cocos nucifera)、凤梨(Ananascomosus)、柑橘树(Citrus spp.)、可可(Theobroma cacao)、茶(Camellia sinensis)、芭蕉(Musa spp.)、鳄梨(Persea americana)、无花果(Ficus casica)、番石榴(Psidium guajava)、芒果(Mangiferaindica)、油橄榄(Olea europaea)、番木瓜(Carica papaya)、腰果(Anacardium occidentale)、澳洲坚果(Macadamia integrifolia)、扁桃(Prunus amygdalus)、甜菜(Beta vulgaris)、甘蔗(Saccharumspp.)、燕麦、大麦、蔬菜、观赏植物、木本植物如针叶树和落叶树、南瓜(squash)、南瓜(pumpkin)、大麻、绿皮西葫芦(zucchini)、苹果、梨、温柏、香瓜、李、樱桃、桃、油桃、杏、草莓、葡萄、覆盆子、黑莓、大豆、高梁、甘蔗、菜籽油菜、苜蓿、胡萝卜和拟南芥(Arabidopsis thaliana)。
蔬菜包括番茄(Lycopersicon esculentum)、莴苣(例如,Lactucasativa)、菜豆(Phaseolus vulgaris)、利马豆(phaseolus limensis)、豌豆(山黧豆属(Lathyrus spp.))、花椰菜、花茎甘蓝(broccoll)、芜箐、萝卜、菠菜、芦笋、洋葱、大蒜、辣椒、芹菜、和香瓜属(Cucumis)成员,例如黄瓜(C.sativus)、罗马甜瓜(C.cantalupensis)和香瓜(C.melo)。观赏植物包括杜鹃(Rhododendron spp.)、绣球(Hydrangeamacrophylla)、木槿(朱槿(hibiscus rosasanensis))、蔷薇属物种(Rosa spp.)、郁金香(Tulipa spp.)、水仙(Narcissu sspp.)、碧冬茄(Petunia hybrida)、香石竹(Dianthus caryophyllus)、一品红(Euphorbia pulcherrima)和菊。可以用于实施本发明的针叶树包括例如,松如火炬松(Pinustaeda)、湿地松(Pinus elliotii)、西黄松(Pinus ponderosa)、扭叶松(Pinus contorta)、以及辐射松(Pinusradiate)、花旗松(Pseudostuga menziesii);Western hemlock(加拿大铁杉(Tsuga Canadensis));白云杉(Picea glauca);北美红杉(Sequoia sempervirens)、冷杉(true firs)如温哥华冷杉(Abiesamabilis)和香脂冷杉(Abies balsamea);以及柏如北美乔柏(Thujaplicata)和阿拉斯加花柏(Chamaecyparis nootkatensis)。豆类包括蚕豆和豌豆。蚕豆包括瓜尔豆、角豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、兵豆、鹰嘴豆等。豆科植物包括但不限于,落花生属(Arachis),如落花生,野豌豆属(Vicia),如广布野豌豆(crownvetch)、毛苕子、赤豆、绿豆和鹰嘴豆,羽扇豆属(Lupinus),如羽扇豆、三叶草,菜豆属(Phaseolus),如云扁豆(common bean)和利马豆,豌豆属(Pisum),如field bean,草木樨属(Melilotus),如cloVer,苜蓿属(Medicago),例如紫苜蓿,百脉根属(Lotus),如车轴草,兵豆属(Lens),如兵豆,以及紫穗槐。对于在本发明方法中的应用,优选的饲料草和草坪草包括紫苜蓿、鸭茅、高羊茅、多年生黑麦草、匍匐翦股颖(creeping bent grass)和红顶草(redtop)。
优选地,本发明植物包括作物植物,例如玉米、紫苜蓿、向日葵、芸苔属植物、大豆、棉、红花、落花生、高梁、小麦、稷、烟草、大麦、稻、番茄、马铃薯、南瓜、香瓜、豆科作物等。其它优选植物包括百合纲(Liliopsida)和黍亚科(Panicoideae)。
一旦期望的DNA序列被转化入特定植物物种中后,其可以在该物种中繁殖或者通过传统的育种技术移动至同一物种的其它品种(尤其包括商业品种)中。
以下描述用于转化双子叶植物和单子叶植物的代表性技术以及代表性的质体转化技术。
a.双子叶植物的转化
用于双子叶植物的转化技术是本领域熟知的,包括基于农杆菌的技术和不需要农杆菌的技术。非农杆菌技术涉及原生质体或细胞对外源遗传物质的直接摄取。这可以通过PEG或电穿孔介导的摄取、微粒轰击介导的递送、或显微注射来实现。这些技术的例子描述在Paszkowski等,EMBO J.3:2717(1984),Potrykus等,Mol.Gen.Genet.199:169(1985),Reich等,Biotechnology,4:1001(1986),和Klein等,Nature,327:70(1987)。在每一种情况下,转化的植物都可以使用本领域已知的标准技术再生为整株植物。
农杆菌介导的转化,由于其高的转化效率和其在许多不同物种中的宽范围应用,而是转化双子叶植物的优选技术。农杆菌转化典型地涉及将带有外来目的DNA的二元载体(例如pCIB200或pCIB2001)转移至适宜的农杆菌菌株中,所述菌株可能取决于宿主农杆菌菌株在共定居的Ti质粒上或在染色体上带有的vir基因的互补性(例如,菌株CIB542用于pCIB200和pCIB2001(Uknes等,Plant Cell,5:159(1993))。重组二元载体向农杆菌的转移可以通过三亲本杂交方法,使用带有重组二元载体的大肠杆菌、带有质粒如pRK2013并能够使重组二元载体移动至靶农杆菌菌株中的辅助大肠杆菌菌株来实现。或者,可以通过DNA转化,将重组二元载体转移至农杆菌中(Hofgen &Willmitzer,Nucl.Acids Res.16:9877(1988))。
重组农杆菌对靶植物的转化通常涉及农杆菌与来自植物的外植体的共培养,并遵循本领域熟知的方案进行。在选择培养基上再生带有二元质粒T-DNA边界之间存在的抗生素或除草剂抗性标记的转化组织。
可以按照已知的方式将载体引入植物细胞。优选用于转化的细胞包括农杆菌(Agrobacterium)、单子叶植物细胞和双子叶植物细胞,包括百合纲(Liliopsida)细胞和黍亚科(Panicoideae)细胞。优选的单子叶植物细胞是谷物细胞,例如玉米(corn,maize)、大麦和小麦,以及淀粉积累性双子叶植物细胞,例如马铃薯。
用基因转化植物细胞的另一方法涉及将惰性或生物活性粒子推进植物组织或细胞。该技术公开在美国专利号4,945,050、5,036,006和5,100,792中。一般地,该方法包括将惰性或生物活性粒子在可以有效地穿透细胞外表面和在其内部实现整合的条件下推进细胞。当利用惰性粒子时,可以通过用含有期望基因的载体包被粒子而将载体引入细胞中。或者,靶细胞可以被载体围绕,以便载体随着粒子而被带入细胞中。也可以将生物活性粒子(例如,干的酵母细胞、干的细菌或噬菌体,每种均含有待引入的DNA)推进植物细胞组织。
b.单子叶植物的转化
大多数单子叶植物物种的转化目前也已经成为常规技术。优选的技术包括使用聚乙二醇(PEG)或电穿孔技术直接将基因转移至原生质体中,以及使用微粒轰击将基因直接转移至愈伤组织中。可以采用一种DNA或多种DNA(即,共转化)进行转化,并且这两种技术都适用于本发明。共转化可以具有如下优点:避免完全载体构建,并产生目的基因和选择标记位于不连锁基因座的转基因植物,这使得,如果期望的话,可以在后续世代中除去选择标记。然而,使用共转化的缺点在于这些分开的DNA种类整合在基因组中的频率将不足100%(Schocher等,Biotechnology,4:1093(1986))。
专利申请EP 0292435、EP 0392225和WO 93/07278描述从玉米原种近交系制备愈伤组织和原生质体、使用PEG或电穿孔转化原生质体、和从转化的原生质体再生玉米植物的技术。Gordon-Kamm等(Plant Cell,2:603(1990)和Fromm等(Biotechnology,8:833(1990))公布了使用微粒轰击转化A188衍生玉米品系的技术。而且,WO 93/07278和Koziel等(Biotechnology,11:194(1993))描述了通过微粒轰击转化玉米的原种近交系的技术。该技术利用从授粉后14-15天的玉米穗上切下的长1.5-2.5mm的未成熟玉米胚和PDS-1000He生物轰击装置用于轰击。
稻的转化也可以采用原生质体或微粒轰击,通过直接基因转移技术而实现。原生质体介导的转化已经针对Japonica型和Indica型进行过描述(Zhang等,Plant Cell Rep,7:379(1988);Shimamoto等,Nature,338:274(1989);Datta等,Biotechnology,8:736(1990))。两种类型也可以使用微粒轰击进行常规转化(Christou等,Biotechnology,9:957(1991))。而且,WO 93/21335还描述了通过电穿孔转化稻的技术。专利申请EP 0332581描述了产生、转化和再生早熟禾亚科(Pooideae)原生质体的技术。这些技术允许转化鸭茅属(Dactylis)和小麦。而且,Vasil等(Biotechnology,10:667(1992))描述了使用微粒轰击C型长期可再生愈伤组织的细胞进行的小麦转化,Vasil等(Biotechnology,11:1553(1993))和Weeks等(PlantPhysiol.102:1077(1993))也描述了使用微粒轰击未成熟胚和未成熟胚来源的愈伤组织进行的小麦转化。然而,转化小麦的优选技术涉及通过微粒轰击未成熟胚进行的小麦转化,并包括在基因递送之前的高蔗糖或高麦芽糖步骤。在轰击之前,将任何数量的胚胎(长0.76-1mm)接种在具有3%蔗糖(Murashiga & Skoog,Physiologia Plantarum,15:473(1962))和3mg/l2,4-D的MS培养基上以诱导体细胞胚,这被允许在暗处进行。在选定的轰击日,将胚胎从诱导培养基中移出并放置在渗压剂(即,添加有期望浓度(典型地15%)的蔗糖或麦芽糖的诱导培养基)上。允许胚胎质壁分离2-3小时,然后轰击。每个靶板典型地20个胚胎,但这不是关键的。使用标准方法,将适宜的带有基因的质粒(例如pCIB3064或pSG35)沉淀在微米大小的金粒上。每个板的胚胎使用标准80目的筛子、利用DuPont Biolistics_氦装置以及大约1000psi的爆裂压力(burst pressure)进行射击。轰击后,将胚胎放回暗处,恢复大约24小时(仍然在渗压剂上)。24小时后,将胚胎从渗压剂上移走并放回诱导培养基上,胚胎在再生以前在诱导培养基上停留大约1个月。大约1个月后,将具有正在发育的胚发生愈伤组织的胚胎外植体转移至再生培养基上,该再生培养基(MS+1mg/升NAA,5mg/升GA)还含有适宜的选择剂(在pCIB3064的情况下为10mg/l0basta,在pSOG35的情况下为2mg/l氨甲蝶呤)。
大约1个月后,将发育的芽转移至含有一半浓度的MS、2%蔗糖和相同浓度的选择剂的更大无菌容器(称作“GA7s”)中。
使用农杆菌转化单子叶植物也已有描述。见WO 94/00977和美国专利号5,591,616,两份文献均并入此处作为参考。
c.质体的转化
按每板7个,以1’’圆形排列方式,在T琼脂培养基上萌芽烟草栽培品种(Nicotiana tabacumc.v.)‘Xanthi nc’的种子,并基本上按所述的(Svab和Maliga,PNAS,90:913(1993)),在撒播包被有来自质粒pPH143和pPH145的DNA的1μm钨粒(M10,Biorad,Hercules,CA)后12-14天,进行轰击。经过轰击的幼苗在T培养基上温育2天,之后切下叶,并以背轴侧朝上放置在亮光(350-500μmol光子/m2/s)中于含有500μg/ml壮观霉素二盐酸盐(Sigma,St.Louis,MO)的RMOP培养基(Svab,Hajdukiewicz和Maliga,PNAS,87:8526(1990))板上。将轰击后3至8周出现在变白的叶下面的抗性芽亚克隆至相同选择培养基上,允许形成愈伤组织,并分离和亚克隆次生芽。通过标准Southern印迹(Sambrook等,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory,Cold SpringHarbor(1989)),评价独立的亚克隆中转化的质体基因组拷贝的完全分离(同质性(homoplasmicity))。在1%Tris-硼酸(TBE)琼脂糖凝胶上分离BamHI/EcoRI消化的总细胞DNA(Mettler,J.J.Plant Mol.Biol.Reporter,5:346(1987)),转移至尼龙膜(Amersham),并用32P标记的、随机引物引发的DNA序列(相应于来自pC8的、含有rps7/12质体引导序列的一部分的、0.7kb BamHI/HindIII DNA片段)探测。在无菌条件下在含有壮观霉素的MS/IBA培养基(McBride等,PNAS,91:7301(1994))上让同质的芽生根,并转移至温室。
产生和表征稳定转化的植物
然后,将转化的植物细胞放置在适宜的选择培养基中以选择转基因细胞,然后允许转基因细胞生长成愈伤组织。从愈伤组织生芽并通过在生根培养基中培养从该芽产生小植株。正常地,各种构建体都与植物细胞中的选择标记连接。有利地,该标记可以是对杀生物剂(尤其是抗生素,如卡那霉素、G418、博来霉素、潮霉素、氯霉素,或除草剂等)的抗性。所使用的特定标记将允许相对于缺乏引入的DNA的细胞选择转化的细胞。DNA构建体的成分,包括本发明的转录/表达盒,可以从对于宿主而言天然的(内源)或外来的(外源)序列制备。“外来的”指该序列不存在于该结构待引入的野生型宿主中。异源构建体将包含至少一个对于转录-起始区所来源的基因而言非天然的区域。
为了验证转基因在转基因细胞和植物中的存在,可以使用本领域已知的方法,实施Southern印迹分析。通过Southern印迹可以对核苷酸区段在基因组中的整合进行检测和定量,这是因为通过使用适宜的限制性酶可以容易地将它们与含有该区段的构建体区分开来。取决于转基因的表达产物的性质,该产物可以以各种方式检测,包括Western印迹和酶分析试验。一种尤其有用的在不同植物组织中定量蛋白质表达和检测复制的方式是,使用报道基因,例如GUS。一旦获得转基因植物,可以培育该转基因植物以产生具有期望表型的植物组织或部分。可以收获该植物组织或植物部分,和/或收集种子。种子可以充当培育其它具有带期望特征的组织或部分的植物的来源。
本发明因此提供包含本发明至少一种多核苷酸、表达盒或载体的、转化的植物或植物部分,例如穗、种子、果实、谷粒、秸秆、谷壳、或蔗渣,制备该植物的方法和使用该植物或其部分的方法。该转化的植物或植物部分表达加工酶,任选地,该加工酶定位在某个组织的特定细胞区室或亚细胞区室或者定位在正在发育的谷粒中。例如,本发明提供在植物细胞中包含有至少一种淀粉加工酶的转化的植物部分,其中该植物部分从基因组中增加了编码该至少一种淀粉加工酶的表达盒的转化植物获得。该加工酶,除非被诸如加热、研磨或其它方法(这允许酶在使酶具有活性的条件下与底物接触)激活,否则不对靶底物产生作用。
示例性的本发明方法
本发明的自加工植物和植物部分可以用于其中使用所表达和活化的加工酶(嗜温型的、嗜热型的、嗜高热型的)的各种方法中。根据本发明,将从基因组中增加了至少一种加工酶的转基因植物获得的转基因植物部分,放置在使该加工酶表达和活化的条件下。一旦活化后,该加工酶被激活并对其正常所作用的底物发挥作用以获得期望结果。例如,淀粉加工酶在激活后将作用于淀粉进行降解、水解、异构化或其它方式的修饰,以获得期望的结果。非淀粉加工酶可以用于破坏植物细胞膜以便利于从植物中提取淀粉、脂质、氨基酸或其它产物。而且,非嗜高热型的和嗜高热型的酶都可以与本发明的自加工植物或植物部分联用。例如,可以激活嗜温型非淀粉降解酶来破坏植物细胞膜以便实施淀粉提取,随后,可以在该自加工植物中激活嗜高热型的淀粉降解酶来降解淀粉。
在谷粒中表达的酶可以通过将含有所述酶的植物或植物部分放置在促进酶活性的条件中而激活。例如,可以使用一种或多种以下技术:植物部分可以与为水解酶提供底物由此激活该酶的水接触。植物部分可以与允许酶从其在植物部分发育过程中沉积的区室中迁移出来并由此与其底物结合的水接触。由于在谷粒的成熟、干燥和再水合过程中区室化作用被打破,故酶可以移动。完整的或破裂的谷粒可以与允许酶从其在植物部分发育过程中沉积的区室迁移出来并由此与其底物结合的水接触。酶也可以通过添加激活化合物而活化。例如,钙依赖性酶可以通过添加钙而活化。其它激活化合物可以由本领域技术人员确定。酶可以通过灭活剂的除去而激活。例如,存在淀粉酶的已知肽抑制剂,该淀粉酶可以和淀粉酶抑制剂共表达,然后通过添加蛋白酶而激活。酶可以通过将pH改变至酶具有最大活性时的pH而激活。酶也可以通过增加温度而激活。一般,在不超过酶的最大温度时,酶的活性将增加。对于嗜温型酶,其活性将从室温活性水平上升,直到达到导致其活性丧失的温度(典型地小于或等于70℃)为止。相似地,嗜热型和嗜高热型酶也可以通过增加温度而激活。嗜热型酶可以通过将温度加热至不超过活性或稳定性的最大温度而激活。对于嗜热型酶,稳定性和活性的最大温度一般在70至85℃之间。嗜高热酶,由于具有从25℃至不超过85℃至95℃或甚至100℃的更大潜在温度变化,故将比嗜温型和嗜热型酶具有甚至更高的相对活性。可以通过任何方法,例如,通过加热,如烘焙、煮沸、加热、蒸、放电或其任何组合,升高温度。而且,在表达嗜温型或嗜热型酶的植物中,可以通过研磨由此允许酶与底物接触,而活化酶。
最适条件,例如温度、水合作用、pH等,可以由本领域技术人员确定,并且可能取决于所使用的各酶以及该酶的期望应用。
本发明还提供可以在特定方法中起辅助作用的外源酶的应用。例如,可以将本发明的自加工植物或植物部分与外源提供的酶联用以促进该反应。例如,可以联合使用转基因α-淀粉酶玉米和其它淀粉加工酶,例如支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶、甘露聚糖酶、半纤维素酶等,以水解淀粉或产生乙醇。事实上,已经发现,转基因α-淀粉酶玉米与此类酶的联合意想不到地提供了比转基因α-淀粉酶玉米单独使用时好的淀粉转化程度。
本文提供在此考虑的适宜方法的实例。
a.从植物提取淀粉
本发明提供利于从植物中提取淀粉的方法。具体地,将至少一种编码破坏胚乳的物理限制性基质(细胞壁、非淀粉多糖和蛋白质基质)的加工酶的多核苷酸引入植物,使该酶优选地在植物中处于紧靠淀粉粒的物理位置。在本发明的此实施方案中,转化的植物表达一种或多种蛋白酶、葡聚糖酶、木聚糖酶、硫氧还蛋白/硫氧还蛋白还原酶、纤维素酶、植酸酶、脂肪酶、β葡糖苷酶、酯酶等,但不表达具有任何淀粉降解活性的酶,由此保持淀粉粒的完整性。因此,这些酶在植物部分例如谷粒中的表达将改善谷粒的加工特征。加工酶可以是嗜温型的、嗜热型的或嗜高热型的。一个实例中,热干燥来自本发明转化植物的谷粒,从而可能地失活非嗜高热型的加工酶并改善种子的完整性。在低温或高温(在此时间是决定性的),在高或低湿度含量或条件(见Primary Cereal Processing,Gordon和Willm,编,pp.319-337(1994),其公开并入此处)下,在有或无二氧化硫的情况下,浸渍谷粒(破裂的谷粒)。一旦达到升高的温度时,任选地在一定的湿度条件下,胚乳基质的完整性将由于酶,例如蛋白酶、木聚糖酶、植酸酶或葡聚糖酶的活化而遭到破坏,其中所述酶降解胚乳中存在的蛋白质和非淀粉多糖而保留其中的淀粉粒的完整性,并且可以更容易地从所得物中回收。而且,流出物中的蛋白质和非淀粉多糖至少被部分地降解和高度浓缩,由此可以用于改良的动物饲料、食物,或用作发酵微生物的培养基成分。该流出物被认为是具有改良组成的玉米浆。
因此,本发明提供制备淀粉粒的方法。该方法包括将包含至少一种非淀粉加工酶的谷粒,例如破裂的谷粒,在激活所述至少一种酶的条件下进行处理,产生含有淀粉粒和非淀粉降解产物,例如消化的胚乳基质产物的混合物。非淀粉加工酶可以是嗜温型的、嗜热型的或嗜高热型的。在酶活化后,从混合物中分离淀粉粒。所述谷粒从基因组中包含(增加了)编码所述至少一种加工酶的表达盒的转化植物获得。例如,加工酶可以是蛋白酶、葡聚糖酶、木聚糖酶、植酸酶、硫氧还蛋白、硫氧还蛋白还原酶、酯酶、纤维素酶、脂肪酶或β葡糖苷酶。加工酶可以是嗜高热型的。谷粒可以在低或高湿度条件下,在有或无二氧化硫的情况下处理。根据加工酶在来自转基因植物的谷粒中的活性和表达水平,转基因谷粒可以在加工之前或期间与商品谷粒混合。本发明还提供通过该方法获得的产物,例如淀粉、非淀粉产物和包含至少一种额外成分的改良的浸渍水(steepwater)。
b.淀粉加工方法
本发明的转化植物或植物部分可以包含本文公开的、将淀粉粒降解为糊精、其它改性淀粉或己糖(例如α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶、淀粉型支链淀粉酶)或将葡萄糖转化成果糖(例如葡萄糖异构酶)的淀粉降解酶。优选地,淀粉降解酶选自:  α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、新支链淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶,并且可以使用其组合转化谷粒。而且,优选地,酶与启动子和将酶引导至淀粉粒、造粉体、质外体、或内质网的信号序列可操作地连接。最优选地,酶在胚乳中表达,尤其是在玉米胚乳中表达,并定位在一个或多个细胞区室,或者淀粉粒本身中。优选的植物部分是谷粒。优选的植物部分来自玉米、小麦、大麦、黑麦、燕麦、甘蔗或稻。
根据本发明的一种淀粉降解方法,转化的谷粒在淀粉粒中积累淀粉降解酶,在50℃至60℃的常规温度下浸渍,并按本领域已知的方式进行湿磨。优选地,淀粉降解酶是嗜高热型的。由于酶朝着淀粉粒的亚细胞定向,或者由于酶和淀粉粒的结合,通过在常温下湿磨工艺过程中酶和淀粉粒的接触,加工酶与淀粉粒被共纯化,从而获得淀粉粒/酶混合物。在回收淀粉粒/酶混合物后,然后可以通过提供对于酶活性有利的条件,激活该酶。例如,可以在各种湿度和/或温度条件下实施该加工,以利于淀粉部分地(为了制备衍生化的淀粉或糊精)或完全地水解为己糖。以此方式可以获得含有高的右旋糖或果糖当量的糖浆。该方法有效地降低了将淀粉转化成相应己糖的时间、能量和酶的消耗以及效率,并且产物,如高糖(sugar)浸渍水和更高右旋糖当量的糖浆,的生产效率增加。
在另一实施方案中,处理表达该酶的植物、或植物产物如果实或谷粒,或从谷粒制备的面粉,以激活酶并将植物中表达的和包含的多糖转化成糖(sugar)。优选地,酶与将酶引导至淀粉粒、造粉体、质外体或内质网的信号序列(见本文公开)融合。然后,可以从植物或植物产物中分离或回收所产生的糖(sugar)。另一实施方案中,根据本领域已知的和本文公开的方法,能够将多糖转化成糖(sugar)的加工酶被放置在诱导型启动子的控制下。加工酶可以是嗜温型的、嗜热型的、或嗜高热型的。让植物生长至期望阶段,诱导启动子从而造成酶的表达和植物或植物产物中的多糖向糖(sugar)的转化。优选地,酶与将酶引导至淀粉粒、造粉体、质外体或内质网的信号序列可操作地连接。另一实施方案中,产生表达能够将淀粉转化成糖(sugar)的加工酶的转化植物。该酶与将酶引导至植物中的淀粉粒的信号序列融合。然后从含有自该转化的植物表达的酶的转化植物中分离淀粉。然后,可以激活包含在分离的淀粉中的酶,以将淀粉转化成糖(sugar)。酶可以是嗜温型的、嗜热型的或嗜高热型的。在此提供能够将淀粉转化成糖(sugar)的嗜高热酶的例子。这些方法可以用于产生多糖并可以表达能够将多糖转化成糖(sugar)或淀粉水解产物如糊精、麦芽寡糖、葡萄糖和/或其混合物的酶的任何植物。
本发明提供从植物或植物产物产生糊精和改性(altered)淀粉的方法,其中所述植物已经转化了可以水解多糖的某些共价键从而形成多糖衍生物的加工酶。一个实施方案中,将表达该酶的植物或植物产物,例如果实或谷粒、或从谷粒制备的面粉,放置在足以激活该酶以及将植物中所含多糖转化成具有降低的分子量的多糖的条件下。优选地,酶与本文所公开的、将酶引导至淀粉粒、造粉体、质外体或内质网的信号序列融合。然后,可以从植物或植物产物中分离产生的糊精或淀粉衍生物。另一实施方案中,根据本领域已知的和本文公开的方法,将能够将多糖转化成糊精或改性淀粉的加工酶置于诱导型启动子的控制下。使植物生长至期望阶段,诱导启动子从而造成酶的表达和植物或植物产物中的多糖向糊精或改性淀粉的转化。优选地,酶是α-淀粉酶、支链淀粉酶、异或新支链淀粉酶,并且与将酶引导至淀粉粒、造粉体、质外体或内质网的信号序列可操作地连接。一个实施方案中,酶被引导至质外体或内质网(endoreticulum)。在再一实施方案中,制备表达能够将淀粉转化成糊精或改性淀粉的酶的转化植物。所述酶与将酶引导至植物中的淀粉粒的信号序列融合。然后从含有该转化植物所表达的酶的转化植物中分离淀粉。包含在分离的淀粉中的酶然后可以在足以导致激活作用以将淀粉转化成糊精或改性淀粉的条件下活化。在此提供例如能够将淀粉转化成淀粉水解产物的嗜高热酶的例子。这些方法可以用于产生多糖并可以表达能够将多糖转化成糖(sugar)的酶的任何植物。
另一实施方案中,来自积累淀粉降解酶的本发明转化植物的谷粒在利于淀粉降解酶活性的条件下浸渍不同时间,其中所述淀粉降解酶可以降解淀粉粒中的键从而形成糊精、改性淀粉或己糖(例如,α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶、淀粉型支链淀粉酶)。所得混合物可以含有高水平的淀粉衍生产物。该谷粒的应用:1)消除了碾磨谷粒或以其它方式加工谷粒以首先获得淀粉粒的需要,2)由于将酶直接置于谷粒的胚乳组织中,故使得淀粉更容易接近酶,和3)消除了对微生物生产的淀粉水解酶的需要。因此,通过在有水存在的情况下简单的加热谷粒,优选地玉米谷粒,以允许酶作用于淀粉,即可以去除己糖回收之前的整个湿磨过程。
该方法也可以用于乙醇、高果糖糖浆、含己糖(葡萄糖)的发酵培养基的生产、以及无需精炼谷粒成分的任何其它的淀粉用途。
本发明还提供制备糊精、麦芽寡糖、和/或糖(sugar)的方法,包括将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此消化淀粉粒以形成含有糖(sugar)的水溶液。所述植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得。然后,收集含有糊精、麦芽寡糖和/或糖(sugar)的水溶液。一个实施方案中,加工酶是α-淀粉酶、α-葡糖苷酶、支链淀粉酶、葡糖淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶或其任何组合。优选地,酶是嗜高热型的。另一实施方案中,该方法还包括分离糊精、麦芽寡糖和/或糖(sugar)。
c.改良的玉米品种
本发明还提供改良的玉米品种(以及其它作物品种)的生产,其中所述品种具有正常水平的淀粉积累,并在其胚乳或淀粉积累器官中积累足够水平的淀粉水解酶,由此当激活其中所含的酶(例如在嗜高热酶的情况下,通过煮沸、加热植物或其部分来激活)时,酶被活化并促进淀粉快速地转化成简单的糖(simple sugar)。这些简单的糖(主要是葡萄糖)将向所处理的玉米提供甜味。所得玉米植物是可以作为谷粒生产杂种以及作为甜玉米进行双重应用的改良品种。因此,本发明提供产生超甜玉米的方法,包括处理转化的玉米或其部分,其中所述转化的玉米在基因组中增加了包含与编码至少一种淀粉水解酶的第一多核苷酸可操作连接的启动子的表达盒,并在胚乳中表达该表达盒,其中所述处理在激活所述至少一种酶从而将玉米中的多糖转化成糖(sugaf)的条件下进行,从而产生超甜玉米。所述启动子可以是组成型启动子、种子特异性启动子或胚乳特异性启动子,其与编码加工酶例如α-淀粉酶(如包含SEQ ID NO:13、14或16的α-淀粉酶)的多核苷酸序列连接。优选地,酶是嗜高热型的。一个实施方案中,表达盒还包含编码信号序列的第二多核苷酸,其中所述信号序列与第一多核苷酸编码的酶可操作地连接。在本发明此实施方案中,示例性信号序列指导酶到达质外体、内质网、淀粉粒或造粉体。培育玉米植物以便形成具有籽粒(kernel)的穗,然后,诱导启动子以造成酶表达并将植物中所含的多糖转化成糖(sugar)。
d.自发酵植物
在本发明另一实施方案中,对植物,如玉米、稻、小麦和甘蔗进行工程化改变以在它们的细胞壁中积累大量的加工酶,例如木聚糖酶、纤维素酶、半纤维素酶、葡聚糖酶、果胶酶、脂肪酶、酯酶、β-葡糖苷酶、植酸酶、蛋白酶等(非淀粉的多糖降解酶)。收获谷粒成分(或者在甘蔗的情况下糖(sugar))后,使用秸秆、谷壳或蔗渣作为酶(其中所述酶被引导在细胞壁中表达和积累)的来源以及作为生物质的来源。秸秆(或其它剩下的组织)可以用作工艺中的给料以回收可发酵糖。获得可发酵糖的工艺由激活所述非淀粉的多糖加工酶组成。例如,激活可以包括在有水存在下加热植物组织一段时间,所述时间足以导致非淀粉的多糖水解成所得糖(sugar)。因此,当该自加工秸秆作为给料成分时,其基本上以无边际成本的方式产生将多糖转化成单糖所需的酶。而且,该温度依赖性酶对植物的生长和发育无有害影响,并且细胞壁靶向,甚至是通过与蛋白质融合的纤维素/木糖结合域靶向多糖微丝,可以提高底物的酶可接近性。
因此,本发明也提供使用在植物细胞的细胞壁中包含至少一种非淀粉多糖加工酶的转化植物部分的方法。该方法包括处理包含至少一种非淀粉多糖加工酶的转化的植物部分,其中所述处理在激活所述至少一种酶的条件下进行,由此消化淀粉粒以形成含有糖(sugar)的水溶液,其中所述植物部分从基因组中增加了编码所述至少一种非淀粉多糖加工酶的表达盒的转化植物获得;和收集含有糖(sugar)的水溶液。本发明也包括转化的植物或植物部分,其中该植物或植物部分在其细胞或细胞壁中包含至少一种非淀粉多糖加工酶。植物部分从基因组中增加了编码所述至少一种非淀粉加工酶(例如木聚糖酶、纤维素酶、葡聚糖酶、果胶酶、脂肪酶、酯酶、β-葡糖苷酶、植酸酶、蛋白酶或其任何组合)的表达盒的转化植物获得。
e.蛋白质和糖(sugar)含量高的水相
在再一实施方案中,对蛋白酶和脂肪酶进行工程化改造以便其聚集在种子如大豆种子中。在激活(例如,通过加热)该蛋白酶或脂肪酶后,种子中的这些酶将在加工期间水解大豆中存在的脂肪和贮存蛋白。由此可以获得含有氨基酸的可溶性产物(该产物可以用作饲料、食物或发酵培养基)以及脂肪酸。多糖典型地存在于加工后的谷粒的不溶级分中。然而,通过在种子中组合进行多糖降解酶的表达和积累,蛋白质和多糖均可以被水解并存在于水相中。例如,可以以此方式使来自玉米的玉米醇溶蛋白和来自大豆的贮存蛋白和非淀粉多糖溶解。水相和疏水相的成分可以容易地通过用有机溶剂和超临界二氧化碳提取而分离。因此,提供制备含有较高水平的蛋白质、氨基酸、糖(sugar)或糖(saccharide)的谷粒水提取物。
f.自加工发酵
本发明提供生产乙醇、发酵饮料或其它发酵衍生产物的方法。该方法涉及获得其中表达将多糖转化成糖(sugar)的加工酶的植物、或植物产物或植物部分、或植物衍生物如谷粒面粉。处理该植物或其产物,使得如上述通过多糖转化产生糖(sugar)。然后,根据本领域已知的方法,发酵糖(sugar)和植物的其它成分以形成乙醇或发酵饮料、或其它发酵衍生产物。见例如美国专利号4,929,452。简单而言,在促进糖(sugar)转化成乙醇的条件下,将多糖转化产生的糖(sugar)与酵母一起孵育。适宜的酵母包括高醇(alcohol)耐受性和高糖(sugar)耐受性酵母菌株,例如,酿酒酵母(S.cerevisiae)ATCC No.20867。该菌株于1987年9月17日保藏在美国典型培养物保藏中心(Rockville,MD),保藏号ATCC NO.20867。然后可以蒸馏该发酵产物或发酵饮料,以分离乙醇或蒸馏饮料,或者以其方式回收的发酵产物。在此方法中使用的植物可以是含有多糖并能够表达本发明酶的任何植物。本文中公开了许多此类植物。优选地,植物是商业栽培的植物。更优选地,植物是正常用于产生乙醇或发酵饮料或发酵产物的植物,例如小麦、大麦、玉米、黑麦、马铃薯、葡萄或稻。
该方法包括处理包含至少一种多糖加工酶的植物部分,其中所述处理在激活所述至少一种酶由此消化植物部分中的多糖以形成可发酵糖的条件下进行。多糖加工酶可以是嗜温型的、嗜热型的或嗜高热型的。该植物部分从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得。用于本发明此实施方案的植物部分包括但不限于,谷粒、果实、种子、茎秆、木材、蔬菜或根。植物包括但不限于燕麦、大麦、小麦、浆果、葡萄、黑麦、玉米、稻、马铃薯、甜菜、甘蔗、凤梨、草和树。该植物部分可以与商品谷粒或其它商业可获得的底物组合;用于加工的底物的来源可以是除自加工植物之外的来源。然后在促进可发酵糖转化成乙醇的条件下,例如与酵母和/或其它微生物一起,孵育可发酵糖。一个实施方案中,植物部分来源于α-淀粉酶转化的玉米,已经发现该玉米可以降低发酵的时间和成本量。
已经发现,当例如在发酵中使用根据本发明制备的表达热稳定α-淀粉酶的转基因玉米时,可以减少残余淀粉的量。这说明,在发酵过程中溶解了更多淀粉。残余淀粉量的减少导致具有按重量计更高的蛋白质含量和更高的价值的酒糟。而且,发酵本发明转基因玉米允许液化过程在较低pH(由此节省了用于调整pH的化学药品的花费)、较高温度,例如大于85℃,优选地大于90℃,更优选地95℃或更高温度(由此导致较短的液化时间和淀粉更完全的溶解),以及减少的液化时间下进行,所有这些均导致有效的发酵反应以及更高的乙醇产量。
而且,已经发现,常规植物部分与甚至一小部分根据本发明的转基因植物接触都可以减少发酵时间和与此相关的费用。因此,本发明涉及减少植物的发酵时间,包括处理来自包含多糖加工酶的植物的转基因植物部分和不含该多糖加工酶的植物部分,其中所述多糖加工酶可以将多糖转化成糖(sugar)。
g.生淀粉加工酶和编码其的多核苷酸
将编码嗜温型加工酶的多核苷酸引入植物或植物部分。一个实施方案中,本发明多核苷酸是针对玉米优化的多核苷酸,例如SEQ ID NO:48、50和59中提供的多核苷酸,其编码葡糖淀粉酶,例如SEQ ID NO:47和49中提供的葡糖淀粉酶。另一实施方案中,本发明多核苷酸是针对玉米优化的多核苷酸,例如SEQ ID NO:52中提供的多核苷酸,其编码α-淀粉酶,例如SEQ ID NO:51中提供的α-淀粉酶。而且,还考虑加工酶的融合产物。一个实施方案中,本发明多核苷酸是针对玉米优化的多核苷酸,例如SEQ ID NO:46中提供的多核苷酸,其编码α-淀粉酶和葡糖淀粉酶的融合物,例如SEQ ID NO:45中提供的融合物。本发明还想到加工酶的组合。例如,在此考虑淀粉加工酶和非淀粉加工酶的组合。加工酶的此类组合可以通过使用分别编码各酶的多个基因构建体而获得。或者,可以通过已知方法,使这些酶稳定转化的各单个植物杂交,以获得包含两者酶的植物。另一方法包括使用外源酶和转基因植物。
淀粉加工酶和非淀粉加工酶的来源可以分离或得自任何来源,相应于其的多核苷酸可以由本领域技术人员确定。α-淀粉酶可以来源于曲霉属(Aspergillus)(例如,Aspergillus shirousami和黑曲霉)、根霉属(例如米根霉)和嗜热厌氧杆菌(Thermoanaerobacter)(例如,Thermoanaerobacter thermosaccharolyticum)。
在本发明另一实施方案中,多核苷酸编码嗜温型淀粉加工酶,该酶与编码生淀粉结合域(例如SEQ ID NO:53中提供的结合域)的、针对玉米优化的多核苷酸(例如SEQ ID NO:54中提供的多核苷酸)可操作地连接。
另一实施方案中,组织特异性启动子包括胚乳特异性启动子,例如玉米的γ-玉米醇溶蛋白启动子(如SEQ ID NO:12)或玉米ADP-gpp启动子(如SEQ ID NO:11,其包括5’非翻译序列和内含子序列)或Q蛋白启动子(如SEQ ID NO:98)或稻的谷蛋白启动子(如SEQ ID NO:67)。因此,本发明包括含有包含SEQ ID NO:11、12、67或98的启动子的分离多核苷酸,与其互补序列在低严紧杂交条件下杂交的多核苷酸,或其具有启动子活性(例如,具有SEQ ID NO:11、12、67或68的启动子的活性的至少10%,优选地至少50%)的片段。
一个实施方案中,可以将来自淀粉水解基因的产物,例如α-淀粉酶、葡糖淀粉酶、或α-淀粉酶/葡糖淀粉酶融合物,引导至特定的细胞器或位置,例如内质网或质外体,而非细胞质。这可以通过如下例子举例说明:使用玉米的γ-玉米醇溶蛋白N端信号序列(SEQ ID NO:71),其使蛋白质具有质外体特异的定向;和使用与加工酶可操作连接的γ-玉米醇溶蛋白的N端信号序列,其中所述加工酶与用于在内质网中滞留的序列SEKDEL可操作连接。指导蛋白质或酶到达特定区室将允许酶以不和底物接触的方式定位。以此方式,在酶接触其底物之前,酶的酶促作用都不会发生。可以通过碾磨(物理破坏细胞完整性)和水合的方法,而使酶与其底物接触。例如,可以将嗜温型淀粉水解酶引导至质外体或内质网,由此不与造粉体中的淀粉粒接触。碾磨谷粒将破坏谷粒的完整性,之后淀粉水解酶将与淀粉粒接触。以此方式,可以规避酶和其底物共定位所带来的潜在负面影响。
h.不添加增甜剂的食品
本发明也提供制备不添加增甜剂的、甜的粉质食品(farinaceousfood product)。粉质食品的例子包括但不限于,早餐食品、即食食品、烘焙的食品、通心面(pasta)和谷物产品如谷物早餐。该方法包括将包含至少一种淀粉加工酶的植物部分在激活该淀粉加工酶的条件下进行处理,由此将植物部分中的淀粉粒加工成糖(sugar),从而,例如,相对于通过加工来自不含该嗜高热酶的植物部分的淀粉粒产生的产品而言,形成甜的产品。优选地,淀粉加工酶是嗜高热型的,并通过加热,例如烘焙、煮沸、加热、蒸、放电或其任何组合而激活。所述植物部分从基因组中增加了表达所述至少一种嗜高热淀粉加工酶(例如,α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合)的表达盒的转化植物(例如,转化的大豆、黑麦、燕麦、大麦、小麦、玉米、稻或甘蔗)获得。然后可以将该甜产品加工成粉质食品。本发明也提供通过此方法制备的粉质食品,例如,谷物食品、早餐食品、即食食品、或烘焙食品。该粉质食品可以从所述甜产品和水形成,并可以含有麦芽、调味剂、维生素、矿物质、着色剂或其任何组合。
可以在将植物材料包括在谷物产品中之前或者在谷物产品加工期间,激活酶以将植物材料中所包含的多糖转化成糖(sugar)。因此,可以在将植物材料包括在粉质产品中之前,通过活化该材料,例如在嗜高热酶的情况下通过加热,使植物材料中所包含的多糖转化成糖(sugar)。然后,将含有通过多糖转化产生的糖(sugar)的植物材料,加入产品以产生甜的产品。或者,可以在粉质产品的加工过程中,通过酶将多糖转化成糖(sugar)。用于制备谷物产品的工艺的例子是本领域熟知的,包括加热、烘焙、煮沸等,参见美国专利号:6,183,788、6,159,530、6,149,965;4,988,521和5,368,870。
简而言之,面团的制备可以通过将各种干成分与水一起混合并蒸煮以糊化含淀粉成分和产生煮熟香味而进行。然后可以将煮熟的材料机械加工以形成煮熟的面团,例如谷物面团。干成分可以包括各种添加剂,例如糖(sugar)、淀粉、盐、维生素、矿物质、着色剂、调味剂、盐等。除了水,还可以添加各种液体成分,例如,玉米(corn,maize)或麦芽糖浆。粉质材料可以包括来自本发明转化植物的谷物谷粒,小麦、稻、玉米、燕麦、大麦、黑麦或其它谷物谷粒的切粒(cut grain)、粗磨谷粉或面粉,以及其混合物。然后可以通过诸如挤出或冲压等工艺将面团加工成期望的形状,并使用诸如James蒸煮器、烤箱或放电设备等手段进一步蒸煮。
本发明还提供不添加增甜剂而甜化含淀粉产品的方法。该方法包括将包含至少一种淀粉加工酶的淀粉在激活该至少一种酶的条件下进行处理,由此消化淀粉以形成糖(sugar),从而例如相对于通过处理不含该嗜高热酶的淀粉产生的产品而言,形成处理的(甜化的)淀粉。本发明淀粉从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得。酶包括α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。酶可以是嗜高热型的,并可以通过加热来活化。优选的转化植物包括玉米、大豆、黑麦、燕麦、大麦、小麦、稻和甘蔗。然后,将处理的淀粉加入产品以产生甜的含淀粉产品,例如,粉质食品。本发明也提供通过此方法产生的甜的含淀粉产品。
本发明还提供甜化含多糖的果实或蔬菜的方法,包括:将包含至少一种多糖加工酶的果实或蔬菜在激活该至少一种酶的条件下进行处理,由此加工果实或蔬菜中的多糖以形成糖(sugar),从而产生甜的果实或蔬菜(例如,相对于来自不含该多糖加工酶的植物的果实或蔬菜而言)。本发明的果实或蔬菜从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得。果实和蔬菜包括马铃薯、番茄、香蕉、南瓜、豌豆和大豆。酶包括α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。酶可以是嗜高热型的。
i.甜化含多糖的植物或植物产物
该方法涉及获得表达如上所述将多糖加工成糖(sugar)的多糖加工酶的植物。因此,该酶在植物以及植物的产物,如果实或蔬菜中表达。一个实施方案中,酶被置于诱导型启动子的控制之下,从而可以通过外来刺激物诱导酶的表达。此类诱导型启动子和构建体是本领域熟知的,并在本文中进行了描述。酶在植物或其产物中的表达造成植物或其产物中所包含的多糖被转化成糖(sugar)以及该植物或其产物变甜。另一实施方案中,多糖加工酶组成型表达。因此,可以在足以激活酶的条件下活化该植物或其产物,以便通过酶的作用将多糖转化成糖(sugar)以甜化该植物或其产物。结果,果实或蔬菜中该多糖自加工形成糖(sugar),从而产生甜的果实或蔬菜(例如,相对于来自不含该多糖加工酶的植物的果实或蔬菜而言)。本发明的果实或蔬菜从基因组中增加编码所述至少一种多糖加工酶的表达盒的转化植物获得。果实和蔬菜包括马铃薯、番茄、香蕉、南瓜、豌豆和大豆。酶包括α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。多糖加工酶可以是嗜高热型的。
j.从含有可以破坏胚乳基质的酶的转化谷粒分离淀粉
本发明提供从转化的谷粒分离淀粉的方法,其中在所述转化的谷粒中表达可以破坏胚乳基质的酶。该方法涉及获得表达可以通过修饰如细胞壁、非淀粉多糖和/或蛋白质而破坏胚乳基质的酶的植物。此类酶的例子包括但不限于蛋白酶、葡聚糖酶、硫氧化蛋白、硫氧化蛋白还原酶、植酸酶、脂肪酶、纤维素酶、β葡糖苷酶、木聚糖酶和酯酶。此类酶不包括表现出淀粉降解活性的任何酶,从而维持了淀粉粒的完整性。酶可以与将酶引导至淀粉粒的信号序列融合。一个实施方案中,加热干燥谷粒以激活所述酶而失活谷粒中所包含的内源性酶。热处理造成所述酶的活化,该酶产生作用而破坏胚乳基质,之后胚乳基质可以容易地与淀粉粒分开。在另一实施方案中,在低温或高温、高或低湿度含量、以及有或无二氧化硫的情况下,浸渍谷粒。然后热处理谷粒以破坏胚乳基质和允许容易地分离淀粉粒。另一实施方案中,构建合适的温度和湿度条件以允许蛋白酶进入淀粉粒和降解颗粒中所包含的蛋白质。此类处理将产生高产量和几乎无污染蛋白的淀粉粒。
k.具有高糖(sugar)当量的糖浆和该糖浆在生产乙醇或发酵饮料 中的用途
该方法涉及获得表达如上所述将多糖加工成糖(sugar)的多糖加工酶的植物。在所表达的酶可以将植物或其产物中包含的多糖转化成糊精、麦芽寡糖、和/或糖(sugar)的条件下,在水蒸汽中浸渍植物或其产物。然后分离含有通过多糖转化产生的糊精、麦芽寡糖和/或糖(sugar)的水蒸汽,产生具有高糖(sugar)当量的糖浆。该方法可以包括或可以不包括湿磨植物或其产物以获得淀粉粒的额外步骤。可以用于此方法的酶的例子包括但不限于α-淀粉酶、葡糖淀粉酶、支链淀粉酶和α-葡糖苷酶。该酶可以是嗜高热型的。根据此方法产生的糖(sugar)包括但不限于己糖、葡萄糖和果糖。可以用于此方法的植物的例子包括但不限于玉米、小麦或大麦。可以使用的植物产物的例子包括但不限于果实、谷粒和蔬菜。一个实施方案中,多糖加工酶被置于诱导型启动子的控制之下。因此,在浸渍工艺之前或期间,诱导启动子以造成酶的表达,然后该酶导致多糖转化成糖(sugar)。本领域熟知并且本文中提供了诱导型启动子和包含其的构建体的例子。因此,当多糖加工酶是嗜高热型的时,在高温下进行浸渍以激活该嗜高热酶和失活植物或其产物中存在的内源性酶。另一实施方案中,能够将多糖转化成糖(sugar)的嗜高热酶组成型地表达。该酶可以通过使用信号序列而靶向或可以不靶向植物中的区室。在高温条件下浸渍植物或其产物,造成植物中的多糖转化成糖(sugar)。
本发明也提供从具有高糖(sugar)当量的糖浆生产乙醇或发酵饮料的方法。该方法涉及在允许糖浆中所包含的糖(sugar)转化成乙醇或发酵饮料的条件下将糖浆与酵母一起孵育。此类发酵饮料的例子包括但不限于,啤酒和酒(wine)。发酵条件是本领域熟知的,描述在美国专利号:4,929,452以及本文中。优选地,酵母是高醇耐受性和高糖耐受性酵母菌株,例如酿酒酵母ATCC NO.20867。可以蒸馏该发酵的产物或发酵饮料以分离乙醇或蒸馏饮料。
1.在植物的细胞壁中积累嗜高热酶
本发明提供在植物的细胞壁中积累嗜高热酶的方法。该方法涉及在植物中表达与细胞壁引导信号融合的嗜高热酶,这样该被定向的酶在细胞壁中积累。优选地,酶能够将多糖转化成单糖。引导序列的例子包括但不限于纤维素或木糖结合域。嗜高热酶的例子包括SEQ ID NO:1、3、5、10、13、14、15或16中列出的那些。可以添加含有细胞壁的植物材料作为从给料中回收糖(sugar)的工艺中的期望酶的来源,或者作为将源于其它来源的多糖转化成单糖的酶的来源。此外,细胞壁可以充当来源以从中可以纯化出酶。纯化酶的方法是本领域熟知的,包括但不限于凝胶过滤、离子交换层析、层析聚焦、等电聚焦、亲和层析、FPLC、HPLC、盐沉淀、透析等。因此,本发明也提供从植物的细胞壁分离的纯化的酶。
m.制备和分离加工酶的方法
根据本发明,本发明的重组产生的加工酶可以通过转化植物组织或植物细胞使之包含能够在该植物中激活的本发明加工酶,选择转化的植物组织或细胞,将该转化的植物组织或细胞培植成整株植物,和从该转化的植物或其部分分离加工酶。重组产生的酶可以是α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶、支链淀粉酶、木聚糖酶、蛋白酶、葡聚糖酶、β葡糖苷酶、酯酶、脂肪酶或植酸酶。酶可以由选自SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97或99之任一的多核苷酸编码。
本发明通过以下实施例进一步描述,这些实施例不旨在以任何方式限制本发明的范围。
实施例
实施例1
构建针对玉米优化的嗜高热淀粉加工/异构酶基因
根据酶的期望活性谱,选择参与淀粉降解或葡萄糖异构化的酶,α-淀粉酶、支链淀粉酶、α-葡糖苷酶和葡萄糖异构酶。所述活性谱包括例如,室温的最小活性、高温活性/稳定性、以及低pH下的活性。然后通过使用美国专利号5,625,136中描述的玉米优选密码子,设计相应的基因,并由Integrated DNA Technologies,Inc.(Coralville,IA)合成。
具有SEQ ID NO:1氨基酸序列的797GL3α-淀粉酶由于其嗜高热活性而被选择。推导出该酶的核酸序列并针对玉米优化为SEQ ID NO:2。相似地,选择具有SEQ ID NO:3中所示氨基酸序列的6gp3支链淀粉酶。推导出6gp3支链淀粉酶的核酸序列并针对玉米优化为SEQ ID NO:4。
从文献J.Bact.177:482-485(1995);J.Bact.180:1287-1295(1998),获得硫磺矿硫化叶菌(Sulfolobus solfataricus)的malAα-葡糖苷酶氨基酸序列。基于公布的该蛋白质的氨基酸序列(SEQ ID NO:5),设计了针对玉米优化的、编码malA -葡糖苷酶的合成基因(SEQID No:6)。
选择了几种葡萄糖异构酶。基于具有登录号NC_000853的公布的DNA序列,预测了来源于海栖热袍菌的葡萄糖异构酶的氨基酸序列(SEQ ID NO:18),并设计了针对玉米优化的合成基因(SEQ ID NO:19)。类似地,基于Appl.Envir.Microbiol.61(5):1867-1875(1995)、登录号L38994公布的DNA序列,预测了来源于Thermotoganeapolitana的葡萄糖异构酶的氨基酸序列(SEQ ID NO:20)。设计了编码该Thermotoga neapolitana葡萄糖异构酶的、针对玉米优化的合成基因(SEQ ID NO:21)。
实施例2
在大肠杆菌中表达797GL3α-淀粉酶和淀粉包囊化区域(starchencapsulating region)的融合物
将编码与来自玉米颗粒结合型淀粉合酶(waxy)的淀粉包囊化区域(SER)融合的嗜高热797GL3α-淀粉酶的构建体,引入大肠杆菌并在其中表达。编码氨基酸序列(SEQ ID NO:8)(Klosgen RB,等,1986)的玉米颗粒结合型淀粉合酶cDNA(SEQ ID NO:7)被克隆作为淀粉结合域和淀粉包囊化区域(SER)的来源。通过RT-PCR从制备自玉米种子的RNA,使用自GenBank登录号X03935设计的引物SV57(5’AGCGAATTCATGGCGGCTCTGGCCACGT3’)(SEQ ID NO:22)和SV58(5’AGCTAAGCTTCAGGGCGCGGCCACGTTCT3’)(SEQ ID NO:23),扩增全长cDNA。将整个cDNA以EcoRI/HindIII片段形式克隆至pBluescript中,质粒命名为pNOV4022。
自pNOV4022扩增包括淀粉结合域的waxy cDNA的C端部分(由bp919-1818编码),将其以符合阅读框的形式融合至全长的玉米优化型797GL3基因(SEQ ID NO:2)的3’末端。具有核酸SEQ ID NO:9并编码氨基酸序列SEQ ID NO:10的融合基因产物797GL3/Waxy,以NcoI/XbaI片段克隆至已经用NcoI/NheI切割的pET28b(Novagen,Madison,WI)中。797GL3基因也被单独地以NcoI/XbaI片段形式克隆在pET28b载体中。
将pET28/797GL3和pET28/797GL3/Waxy载体转化至BL21/DE3大肠杆菌细胞(NOVAGEN)中,并根据厂商说明进行培养和诱导。PAGE/考马斯染色分析揭示在两种提取物中存在分别相应于预定大小的融合淀粉酶和未融合淀粉酶的诱导蛋白质。
按如下所述分析总细胞提取物的嗜高热淀粉酶活性:将5mg淀粉悬浮在20μl水,然后用25μl乙醇稀释。将标准淀粉酶阳性对照或待测样品加入该混合物中,并添加水至500μl终反应体积。80℃实施反应15-45分钟。然后将反应冷却至室温,加入500μl邻联二茴香胺和葡萄糖氧化酶/过氧化物酶混合物(Sigma)。混合物在37℃温育30分钟。加入500μl的12N硫酸以终止反应。测定540nm的吸光度以定量通过淀粉酶/样品所释放的葡萄糖量。融合的和未融合的淀粉酶提取物的试验给出了相似水平的嗜高热淀粉酶活性,而对照提取物未阴性。这说明,797GL3α-淀粉酶在与waxy蛋白C端部分融合后仍具有活性(在高温下)。
实施例3
分离用于在玉米中进行胚乳特异性表达的启动子片段
从玉米基因组DNA,使用自GenBank登录号M81603设计的引物,扩增玉蜀黍(Zea mays)ADP-gpp(ADP-葡萄糖焦磷酸化酶)大亚基的启动子和5’非编码区I(包括第一个内含子),产生1515碱基对片段(SEQID No;11)。已经证明,ADP-gpp启动子是胚乳特异性的(Shaw和Hannah,1992)。
从质粒pGZ27.3(获自Dr.Brian Larkins)扩增673bp片段的玉蜀黍γ-玉米醇溶蛋白基因启动子(SEQ ID NO:12)。已经证明该γ-玉米醇溶蛋白启动子是胚乳特异性的(Torrent等,1997)。
实施例4
构建用于797GL3嗜高热α-淀粉酶的转化载体
按照如下所述,使用各种引导信号,构建表达盒以在玉米胚乳中表达797GL3嗜高热淀粉酶:
pNOV6200(SEQ ID NO:13)包含与以上实施例1中所述的合成797GL3淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向内质网和在质外体中分泌(Torrent等,1997)。将该融合体克隆在玉米ADP-gpp启动子后面用于在胚乳中特异性表达。
pNOV6201(SEQ ID NO:14)包含与C端添加了序列SEKDEL(Munro和Pelham,1987)的合成797GL3淀粉酶融合的γ-玉米醇溶蛋白N端信号序列以便靶向和滞留在内质网(ER)中。将该融合物克隆在玉米ADP-gpp启动子后以便在胚乳中特异地表达。
pNOV7013包含与C端添加了序列SEKDEL的合成797GL3淀粉酶融合的γ-玉米醇溶蛋白N端信号序列以便靶向和滞留在内质网(ER)中。除了使用玉米γ-玉米醇溶蛋白启动子(SEQ ID NO:12)代替玉米ADP-gpp启动子来实现融合物在胚乳中的表达外,pNOV7013与pNOV6201相同。
pNOV4029(SEQ ID NO:15)包含与合成的797GL3淀粉酶融合的waxy造粉体引导肽(Klosgen等,1986),以便靶向造粉体。将该融合物克隆在玉米ADP-gpp启动子后以便在胚乳中特异地表达。
pNOV4031(SEQ ID NO:16)包含与合成的797GL3/waxy融合蛋白融合的waxy造粉体引导肽,以便靶向淀粉粒。将该融合物克隆在玉米ADP-gpp启动子后以便在胚乳中特异地表达。
通过将这些融合物克隆在玉米γ-玉米醇溶蛋白启动子后以获得更高水平的酶表达,还构建了其它构建体。将所有这些表达盒移入二元载体中,以便通过农杆菌感染转化玉米。二元载体含有磷酸甘露糖异构酶(PMI)基因,该基因允许用甘露糖选择转基因细胞。使转化的玉米植物自交或者远交,收集种子进行分析。
通过将以上引导信号与6gp3支链淀粉酶或340g12α-葡糖苷酶以正如针对α-淀粉酶所述的相同方式融合,还构建了其它构建体。这些融合物被克隆在玉米ADP-gpp启动子和/或γ-玉米醇溶蛋白启动子之后,并按上述转化至玉米中。使转化的玉米植物自交或远交,收集种子进行分析。
可以通过使分别表达各酶的植物杂交,或者通过将几种表达盒克隆在相同的二元载体中以便能够实现共转化,来产生酶的组合。
实施例5
构建用于6GP3嗜热支链淀粉酶的植物转化载体
按如下所述,构建表达盒以在玉米胚乳内质网中表达6GP3嗜热支链淀粉酶。
pNOV7005(SEQ ID NO:24和25)包含与C端添加了序列SEKDEL的合成6GP3支链淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向和滞留在ER中。使用设计用于扩增合成的基因并同时在该蛋白质的C末端添加6个氨基酸的引物,通过PCR,将氨基酸肽SEKDEL融合在酶的C末端。将融合物克隆在玉米γ-玉米醇溶蛋白启动子后,以便在胚乳中特异地表达。
实施例6
构建用于malA嗜高热α-葡糖苷酶的植物转化载体
按如下所述,使用各种引导信号,构建表达盒,以便在玉米胚乳中表达硫磺矿硫化叶菌malA嗜高热α-葡糖苷酶:
pNOV4831(SEQ ID NO:26)包含与C端添加了序列SEKDEL(Munro和Pelham,1987)的合成malAα-葡糖苷酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向和滞留在内质网(ER)中。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后,用于在胚乳中特异地表达。
pNOV4839(SEQ ID NO:27)包含与合成的malAα-葡糖苷酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQID NO:17),以便靶向内质网并在质外体中分泌(Torrent等,1997)。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后以便特异地在胚乳中表达。
pNOV4837包含与C端添加了序列SEKDEL的合成malAα-葡糖苷酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向和滞留在内质网(ER)中。该融合物被克隆在玉米ADPgpp启动子后以便在胚乳中特异地表达。用于该克隆的此氨基酸序列与pNOV4831中的是相同的(SEQ ID NO:26)。
实施例7
构建用于嗜高热型的海栖热袍菌和Thefmotoga neapolitana葡萄糖异构酶的植物转化载体
按如下所述,使用各种引导信号,构建表达盒,以便在玉米胚乳中表达海栖热袍菌和Thermotoga neapolitana的嗜高热葡萄糖异构酶:
pNOV4832(SEQ ID NO:28)包含与C端添加了序列SEKDEL的合成海栖热袍菌葡萄糖异构酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向和滞留在内质网(ER)中。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后以便在胚乳中特异地表达。
pNOV4833(SEQ ID NO:29)包含与C端添加了序列SEKDEL的合成Thermotoga neapolitana葡萄糖异构酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向和滞留在内质网(ER)中。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后以便在胚乳中特异地表达。
pNOV4840(SEQ ID NO:30)包含与合成的Thermotoga neapolitana葡萄糖异构酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向内质网并在质外体中分泌。该融合物被克隆在玉米γ-玉米醇溶蛋白启动子后以便在胚乳中特异地表达。
pNOV4838包含与C端添加了序列SEKDEL的合成的Thermotoganeapolitana葡萄糖异构酶融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向和滞留在ER中。该融合物被克隆在玉米ADPgpp启动子后以便在胚乳中特异地表达。用于该克隆的此氨基酸序列与pNOV4833中的(SEQ ID NO:29)相同。
实施例8
构建用于表达嗜高热葡聚糖酶EglA的植物转化载体
pNOV4800(SEQ ID NO:58)包含与EglA成熟蛋白序列融合的大麦α淀粉酶AMY32b信号序列(MGKNGNLCCFSLLLLLLAGLASGHQ)(SEQ IDNO:31),以便实现在造粉体的定位。该融合物被克隆在玉米γ玉米醇溶蛋白启动子后以便特异地在胚乳中表达。
实施例9
构建用于表达多种嗜高热酶的植物转化载体
pNOV4841包含具有797GL3α淀粉酶融合物和6GP3支链淀粉酶融合物的双重基因构建体。797GL3融合物(SEQ ID NO:33)和6GP3融合物(SEQ ID NO:34)两者都具有用于靶向和滞留在ER中的玉米γ玉米醇溶蛋白N端信号序列和SEKDEL序列。每个融合物被分别地克隆在分开的玉米γ玉米醇溶蛋白启动子后以便在胚乳中特异地表达。
pNOV4842包含具有797GL3α淀粉酶融合物和malAα-葡糖苷酶融合物的双重基因构建体。797GL3融合多肽(SEQ ID NO:35)和malAα-葡糖苷酶融合多肽(SEQ ID NO:36)两者都具有用于靶向和滞留在ER中的玉米γ玉米醇溶蛋白N端信号序列和SEKDEL序列。每个融合物被分别地克隆在分开的玉米γ玉米醇溶蛋白启动子后以便在胚乳中特异地表达。
pNOV4843包含具有797GL3α淀粉酶融合物和malAα-葡糖苷酶融合物的双重基因构建体。797GL3融合物和malAα-葡糖苷酶融合物两者都具有用于靶向和滞留在ER中的玉米γ玉米醇溶蛋白N端信号序列和SEKDEL序列。797GL3融合物被克隆在玉米γ玉米醇溶蛋白启动子后而malA融合物被克隆在玉米ADPgpp启动子后以便在胚乳中特异地表达。此797GL3融合物和malA融合物的氨基酸序列与pNOV4842中的(分别是SEQ ID NO:35和36)相同。
pNOV4844包含具有797GL3α淀粉酶融合物、6GP3支链淀粉酶融合物和malAα-葡糖苷酶融合物的三重基因构建体。797GL3、malA和6GP3都具有用于靶向和滞留在ER中的玉米γ玉米醇溶蛋白N端信号序列和SEKDEL序列。797GL3融合物和malA融合物被分别克隆在2个分开的玉米γ玉米醇溶蛋白启动子后而6GP3融合物被克隆在玉米ADPgpp启动子后以便在胚乳中特异地表达。此797GL3融合物和malA融合物的氨基酸序列与pNOV4842中的(分别是SEQ ID NO:35和36)相同。此6GP3融合物的氨基酸序列与pNOV4841中的(SEQ ID NO:34)相同。
本实施例以及以下实施例中给出的所有表达盒都被移入二元载体中,以便通过农杆菌感染转化玉米。pNOV2117包含磷酸甘露糖异构酶(PMI)基因,由此允许使用甘露糖选择转基因细胞。pNOV2117是具有pVS1和ColE1复制起点的二元载体。该载体含有来自pAD1289(Hans en,G等,PNAS USA 91:7603-7607(1994),并入此处作为参考)组成型VirG基因以及来自Tn7的壮观霉素抗性基因。pNOV117(Negrotto,D.,等,PLant Cell Reports 19:798-803(2000),并入此处作为参考)的玉米泛素启动子、PMI编码区和胭脂碱合酶终止子被克隆在左右边界之间的多接头中。使转化的玉米植物自交或远交,收集种子用于分析。可以通过使分别表达各酶的植物杂交,或者通过用这些多基因盒中的一个转化植物,产生不同酶的组合。
实施例1O
构建细菌和毕赤酵母(Pichia)表达载体
按如下所述,构建表达盒以在毕赤酵母或细菌中表达嗜高热α-葡糖苷酶和葡萄糖异构酶:
pNOV4829(SEQ ID NO:37和38)在细菌表达载体pET29a中包含与ER滞留信号融合的合成海栖热袍菌葡萄糖异构酶。该葡萄糖异构酶融合基因被克隆在pET29a的NcoI和SacI位点中,从而导致用于蛋白质纯化的N端S-标签的添加。
pNOV4830(SEQ ID NO:39和40)在细菌表达载体pET29a中包含与ER滞留信号融合的合成Thermotoga neapolitana葡萄糖异构酶。该葡萄糖异构酶融合基因被克隆在pET29a的NcoI和SacI位点中,从而导致用于蛋白质纯化的N端S-标签的添加。
pNOV4835(SEQ ID NO:41和42)包含克隆在细菌表达载体pET28C的BamHI和EcoRI位点中的合成海栖热袍菌葡萄糖异构酶基因。这导致His标签(用于蛋白质纯化)与葡萄糖异构酶的N末端融合。
pNOV4836(SEQ ID NO:43和44)包含克隆在细菌表达载体pET28C的BamHI和EcoRI位点中的合成Thermotoga neapolitana葡萄糖异构酶基因。这导致His标签(用于蛋白质纯化)与葡萄糖异构酶的N末端融合。
实施例11
基本上按照Negrotto等PLant Cell Reports 19:798-803所述,转化未成熟的玉米胚胎。对于此实施例,所有的培养基成分均如Negrotto等,前述引文中所述的。然而,可以替代该文献中描述的各种培养基成分。
A.转化质粒和选择标记
将用于转化的基因克隆在适于玉米转化的载体中。用于此实施例的载体含有用于选择转基因株系的磷酸甘露糖异构酶(PMI)基因(Negrotto等(2000)Plant Cell Reports 19:798-803)。
B.制备农杆菌
将含有植物转化质粒的农杆菌菌株LBA4404(pSB1)在YEP(酵母提取物(5g/L)、蛋白胨(10g/L)、NaCl(5g/L)、15g/L琼脂,pH6.8)固体培养基上28℃培养2-4天。将大约0.8×109农杆菌悬浮在补加有100μM As的LS-inf培养基(Negrotto等(2000)Plant Cell Rep19:798-803)中。在此培养基中预诱导细菌30-60分钟。
C.接种
从8至12天龄穗切下A188或其它适宜基因型的未成熟胚,放入液体LS-inf+100μM As中。用新鲜的感染培养基洗涤胚胎一次。然后添加农杆菌溶液,涡旋胚胎30秒,并允许和细菌一起沉淀5分钟。然后将胚胎以盾片侧朝上转移至LSA培养基,暗处培养2至3天。随后,将每培养皿20至25个胚胎转移至补加有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中,暗处28℃培养10天。
D.选择转化的细胞和再生转化的植物
将产生胚发生愈伤组织的未成熟胚胎转移至LSD1M0.5S培养基。在此培养基上选择培养物6周,其中在第3周作传代培养。将存活的愈伤组织转移至补加有甘露糖的Reg1培养基。在光下培养(16小时光/8小时暗方案),之后将绿色组织转移至无生长调节剂的Reg2培养基,孵育1-2周。将小植物转移至含有Reg3培养基的Magenta GA-7盒(Magenta Corp,Chicago I11.),光下培养。2至3周后,PCR测试植物是否存在PMI基因和其它目的基因。将PCR试验的阳性植物转移至温室。
实施例12
分析来自表达靶向质外体或ER的α-淀粉酶的玉米植物的T1种子
从使用实施例4描述的pNOV6200或pNOV6201转化的自花授粉玉米植物,获得T1种子。基于视觉观察和在任何高温暴露之前碘溶液对淀粉的正常染色,这些籽粒(kernel)中的淀粉积累似乎是正常的。解剖未成熟的籽粒,将纯化的胚乳分别单独地放置在离心管中,浸泡在200μl 50mM NaPO4缓冲液中。将管子放入85℃水浴20分钟,然后在冰上冷却。将20μl的1%碘溶液加入各管并混合。大约25%的分离籽粒有正常的淀粉染色。剩余的75%未能染色,说明淀粉已经降解成不被碘染色的低分子量糖(sugar)。发现,pNOV6200和pNOV6201的T1籽粒正在自水解玉米淀粉。37℃温育后没有可检测到的淀粉减少。
在PAGE/考马斯染色后,通过从胚乳分离嗜高热蛋白质级分,进一步分析淀粉酶的表达。观察到正确分子量(50kD)的分离蛋白质带。使用商业可获得的经染色的直链淀粉(AMYLAZYME,来自Megazyme,Ireland),在α-淀粉酶试验中分析这些样品。高水平的嗜高热淀粉酶活性与50kD蛋白质的存在有关。
还发现,在来自大多数表达靶向造粉体的嗜高热α-淀粉酶的转基因玉米的籽粒中,淀粉在室温下具有足够的活性,以致如果允许该酶与淀粉粒直接接触,则可以水解大多数淀粉。在具有靶向造粉体的嗜高热α-淀粉酶的80个株系中,鉴定出4个株系在籽粒中积累淀粉。使用比色amylazyme试验(Megazyme),分析了这些株系中的三个株系的热稳定α-淀粉酶活性。该淀粉酶试验说明,这三个株系具有低水平的热稳定淀粉酶活性。当用适当的湿度和热条件处理来自这三个株系的纯化淀粉时,淀粉被水解,这说明存在足以促进制备自这些株系的淀粉自水解的α-淀粉酶水平。
从pNOV6200和pNOV6201转化体的多个独立株系获得T1种子。解剖来自各株系的各单个籽粒,并在300μl 50mM NaPO4缓冲液中将纯化的胚乳分开单独地匀浆。85℃分析胚乳悬浮液的等分试样的α-淀粉酶活性。大约80%的株系的嗜高热活性发生分离(见图1A、1B和2)。
100℃加热来自野生型植物或转化了pNOV6201的植物的籽粒1、2、3或6小时,然后用碘溶液染色淀粉。分别在3或6小时后在成熟的籽粒中检测到几乎没有或完全没有淀粉。因此,在高温孵育时,在来自表达靶向内质网的嗜高热淀粉酶的转基因玉米的籽粒中,淀粉被水解。
另一实验中,将来自pNOV6201植物的成熟T1籽粒的部分纯化的淀粉于50℃浸渍16小时,该淀粉在85℃加热5分钟后被水解。这说明,被引导至内质网的α-淀粉酶在籽粒研磨后与淀粉结合,并能够在加热时水解淀粉。碘染色显示,50℃浸渍16小时后成熟种子中的淀粉保持完整。
另一实验中,95℃加热来自转化了pNOV6201的植物的、分离的成熟籽粒16小时,然后干燥。在表达嗜高热α-淀粉酶的种子中,由于淀粉水解为糖(sugar),从而导致干燥后起皱的外观。
实施例13
分析来自表达靶向造粉体的α-淀粉酶的玉米植物的T1种子
从按实施例4所述转化了pNOV4029或pNOV4031的自花授粉玉米植物获得T1种子。在来自这些株系的籽粒中淀粉的积累明显地不正常。针对非常低的淀粉表型或无淀粉的表型,所有株系分离,严重程度上存在一些差异。从未成熟籽粒纯化的胚乳在暴露于高温之前仅仅被碘弱染色。85℃ 20分钟后,无染色存在。当干燥穗时,籽粒皱缩。如果被允许与谷粒直接接触,此特定淀粉酶清楚地在温室温度下具有足以水解淀粉的活性。
实施例14
发酵来自表达α-淀粉酶的玉米植物的谷粒
100%转基因谷粒85℃对95℃,变化的液化时间
在不添加外源α-淀粉酶的情况下,包含热稳定α-淀粉酶的转基因玉米(pNOV6201)在发酵中表现良好,需要短得多的液化时间,并导致淀粉更完全的溶解。按照具有如下步骤(以下详细描述)的操作方案,实施实验室规模的发酵:1)研磨,2)湿度分析,3)制备含有研磨后的玉米、水、回流液(backset)和α-淀粉酶的浆液,4)液化和5)同时糖化和发酵(SSF)。在此实施例中,液化步骤的温度和时间如下述进行变化。此外,在有和无外源α-淀粉酶的情况下进行转基因玉米的液化,将此乙醇生产性能与用商业可获得α-淀粉酶处理的对照玉米进行比较。
用于此实施例中的转基因玉米根据实施例4中所示方法,使用包含α-淀粉酶基因和PMI选择标记的载体(即,pNOV6201)制备。通过用来自表达高水平热稳定α-淀粉酶的转基因系的花粉给商业杂种授粉,产生转基因玉米。将该玉米干燥至11%湿度并室温贮存。转基因玉米面粉的α-淀粉酶含量为95单位/g,在此,1单位酶在pH6.0 MES缓冲液中85℃下每分钟从玉米面粉产生1μmol还原端。所用的对照玉米为已知在乙醇生产中表现良好的黄色马齿形玉米。
1)研磨:在装备有2.0mm筛子的Perten 3100锤磨机中研磨转基因玉米(1180g),由此产生转基因玉米面粉。彻底清洗以防止由转基因玉米造成污染后,在相同磨机中研磨对照玉米。
2)湿度分析:在铝称量舟皿中称取转基因和对照玉米样品(20g),100℃加热4h。再次称量样品,从重量的损失计算含湿量。转基因面粉的含湿量为9.26%,对照面粉的为12.54%。
3)制备浆液:设计浆液的组成以便在SSF开始时产生具有36%固体的醪液。在100ml塑料瓶中制备对照样品,其含有21.50g对照玉米面粉、23ml去离子水、6.0ml回流液(按重量计8%固体)和0.30ml以水1/50稀释的商业可获得的α-淀粉酶。作为工业应用的代表,选择了该α-淀粉酶剂量。当在上述用于分析转基因α-淀粉酶的条件下进行分析时,对照α-淀粉酶的剂量为2U/g玉米面粉。通过添加氢氧化铵,将pH调整为6.0。以相同的方式制备转基因样品,但是由于转基因面粉具有较低的含湿量,其包含20g玉米面粉。在有与对照样品相同剂量的α-淀粉酶或无外源α-淀粉酶的情况下,制备转基因面粉的浆液。
4)液化:将含有转基因玉米面粉的瓶子浸泡在85℃或95℃的水浴中5、15、30、45或60分钟。对照浆液在85℃温育60分钟。在高温温育期间,每5分钟剧烈地手动混合浆液一次。高温步骤后,在冰上冷却浆液。
5)同时糖化和发酵:液化产生醪液与葡糖淀粉酶(0.65ml 1/50稀释的商业可获得的L-400葡糖淀粉酶)、蛋白酶(0.60mL 1,000倍稀释的商业可获得蛋白酶)、0.2mg Lactocide &尿素(0.85ml 10倍稀释的50%尿素液体(Urea Liquor))。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定在90F的水浴中孵育。发酵24小时后,将温度降低至86F;在48小时时,将温度设定为82F。
通过制备含有酵母(0.12g)和70g麦芽糖糊精、230ml水、100ml回流液、葡糖淀粉酶(0.88ml 10倍稀释的商业可获得的葡糖淀粉酶)、蛋白酶(1.76ml 100倍稀释的商业可获得的蛋白酶)、尿素(1.07g)、青霉素(0.67mg)和硫酸锌(0.13g)的混合物,使接种的酵母繁殖。在需要前一天起始繁殖培养物,并在混合下90_温育该培养物。
于24、48、和72小时,从每个发酵容器中采取样品,通过0.2μm滤器过滤,HPLC分析乙醇和糖(sugar)。72小时时,分析样品的总的溶解的固体和残余淀粉。
HPLC分析在配备有折光率检测器、柱加热器和Bio-Rad AminexHPX-87H柱子的二元梯度系统上实施。该系统使用水中的0.005M H2SO4以1ml/min进行平衡。柱温为50℃。样品注射体积为5μl;在相同溶剂中洗脱。通过注射已知标准,校正RI反应。在每一个注射中测量乙醇和葡萄糖。
残余淀粉按如下所述进行测量。在烤箱中50℃干燥样品和标准,然后在样品磨(samplemill)中研磨成粉。称取粉末(0.2g)放在15ml带刻度的离心管中。用10ml乙醇水溶液(80%v/v),通过涡旋之后离心并弃上清液,洗涤该粉末3次。向沉淀加入DMSO(2.0ml),之后加入3.0ml在MOPS缓冲液中的热稳定α-淀粉酶(300单位)。剧烈地混合后,85℃水浴中温育管子60分钟。温育期间,混合管子4次。冷却样品并加入4.0ml乙酸钠缓冲液(200mM,pH 4.5),之后加入0.1ml葡糖淀粉酶(20U)。50℃温育样品2小时,混合,然后3,500rpm离心5分钟。通过0.2μm滤器过滤上清液,通过上述HPLC方法分析葡萄糖。对于具有低残余淀粉(<20%固体)的样品,使用50μl注射体积。
结果在不添加α-淀粉酶的情况下转基因玉米在发酵中表现良好。如表1中所示,72小时时的乙醇产量在添加或不添加外源α-淀粉酶的情况下基本上相同。这些数据也说明,当液化温度较高时可以获得较高的乙醇产量;转基因玉米中表达的本发明酶与商业使用的其它酶(例如液化芽孢杆菌(Bacillus liquefaciens)α-淀粉酶)相比在较高温度下具有活性。
表 1
 液化温度℃  液化时间min    外源α-淀粉酶 #重复  平均乙醇%v/v  标准差%v/v
 85  60    是 4  17.53  0.18
 85  60    否 4  17.78  0.27
 95  60    是 2  18.22  ND
 95  60    否 2  18.25  ND
当改变液化时间时,发现有效的乙醇生产所需的液化时间比常规方法所需的小时数少得多。图3显示,从15分钟至60分钟的液化,72小时发酵的乙醇产量几乎不变。此外,95℃液化比85℃液化在每个时间点上都给出更多的乙醇。此观察结果说明利用嗜高热酶获得了工艺改良。
对照玉米比转基因玉米给出更高的最终乙醇产量,但是对照是由于其在发酵中的良好表现而被选择的。相反地,转基因玉米具有针对有利于转化而选择的遗传背景。利用熟知的育种技术将此α-淀粉酶性状导入原种玉米的种质中应会消除此差异。
检查72小时产生的啤酒(beer)的残余淀粉水平(图4),显示转基因α-淀粉酶显著提高了淀粉可用于发酵的利用度;发酵后剩下少得多的淀粉。
使用乙醇水平和残余淀粉水平两者时,最佳的液化时间是95℃ 15分钟和85℃ 30分钟。在本实验中,这些时间是发酵容器放置在水浴中的总时间,因此包括样品温度从室温增加至85℃或95℃的时间段。较短的液化时间在使用仪器例如蒸汽加压锅快速加热醪液的大规模工业生产中可能是最佳的。常规工业液化工艺需要收集槽以允许高温孵育醪液1个或多个小时。本发明消除了对此类收集槽的需要,并且将增加液化仪器的生产力。
α-淀粉酶在发酵工艺中的一个重要功能是降低醪液的粘度。在所有的时间点上,含有转基因玉米面粉的样品都比对照样品具有显著小的粘度。此外,转基因样品看起来未经历在所有对照样品中都观察到的凝胶相;糊化作用正常发生在蒸煮玉米浆时。因此,让α-淀粉酶遍布于胚乳的所有部分,将导致醪液在蒸煮期间通过避免大凝胶而具有有利的物理性质,其中所述大凝胶将减缓扩散和增加混合和抽吸醪液的能量消耗。
转基因玉米中α-淀粉酶的高剂量也可以有助于转基因醪液的此有利性质。85℃下,转基因玉米的α-淀粉酶活性比对照中使用的外源α-淀粉酶剂量的活性高许多倍。后者是作为商业使用率的代表而选择的。
实施例15
当与对照玉米混合时转基因玉米的有效功能
以5%至100%转基因玉米面粉的不同水平,将转基因玉米面粉与对照玉米面粉混合。按实施例14进行处理。含有转基因表达的α-淀粉酶的醪液在85℃液化30分钟或在95℃液化15分钟;对照醪液按照实施例14所述制备并在85℃液化30分钟或60分钟(各一)或在95℃液化15分钟或60分钟(各一)。
表2给出了48小时和72小时的乙醇数据以及残余淀粉数据。48小时的乙醇水平被绘制在图5的曲线图中;图6中显示残余淀粉的测定值。这些数据说明,转基因表达的热稳定α-淀粉酶在乙醇生产中具有非常好的表现,甚至在转基因谷粒仅仅在醪液中占总谷粒的一小部分(低至5%)时也是如此。该数据也说明,当转基因谷粒占总谷粒的至少40%时,残余淀粉比对照醪液中的显著地低。
表 2
                    85℃液化                     95℃液化
  转基因谷粒wt%      残余淀粉      乙醇48h    乙醇%v/v72h      残余淀粉      乙醇48h    乙醇%v/v72h
  100      3.58      16.71    18.32      4.19      17.72    21.14
  80      4.06      17.04    19.2      3.15      17.42    19.45
  60      3.86      17.16    19.67      4.81      17.58    19.57
  40      5.14      17.28    19.83      8.69      17.56    19.51
  20      8.77      17.11    19.5      11.05      17.71    19.36
  10      10.03      18.05    19.76      10.8      17.83    19.28
  5      10.67      18.08    19.41      12.44      17.61    19.38
  0*      7.79      17.64    20.11      11.23      17.88    19.87
*对照样品。2次测定的平均值
实施例16
以总玉米的1.5至12%的比率使用转基因玉米时作为液化pH的函数的乙醇产量
由于发酵中转基因玉米在总玉米的5%至10%的水平时表现良好,故又进行了一系列其中转基因玉米占总玉米的1.5%至12%的额外发酵。pH从6.4至5.2变化,并且转基因玉米中表达的α-淀粉酶根据在比常规工业使用的pH低的pH下的活性进行了优化。
除了以下例外情况外,按实施例15所述实施这些实验:
1)将转基因面粉以1.5%至12%(总干重的百分数)的水平与对照面粉混合。
2)对照玉米是N3030BT,其比实施例14和15中使用的对照更类似于转基因玉米。
3)未向包含转基因面粉的样品添加外源α-淀粉酶。
4)在液化前将样品的pH调整为5.2、5.6、6.0或6.4。针对每个pH,制备至少5个跨0%转基因玉米面粉至12%转基因玉米面粉的样品。
5)所有样品的液化都在85℃实施60分钟。
图7显示了作为发酵时间的函数的乙醇含量的变化。该图显示从含有3%转基因玉米的样品获得的数据。在较低pH,发酵比在pH6.0及更高时进展更快;在具有其它转基因谷粒剂量的样品中观察到类似行为。转基因酶活性的此pH谱与高水平表达联合将允许较低pH的液化作用,从而导致与常规pH6.0工艺下可能的情况相比更快的发酵和由此更高的生产量。
图8显示72小时时的乙醇产量。正如可以看到的,基于乙醇产量,这些结果显示出几乎与样品中所包括的转基因谷粒的量无关。因此,该谷粒含有丰富的淀粉酶以利于乙醇的发酵生产。此外,也证明较低pH的液化可以导致更高的乙醇产量。
检测样品在液化后的粘度,观察到在pH6.0,6%转基因谷粒足以实现粘度的充分降低。在pH5.2和5.6,12%转基因谷粒时的粘度等于对照的粘度,但是更低百分数的转基因谷粒则不等于。
实施例17
使用嗜热酶从玉米面粉生产果糖
表达嗜高热α-淀粉酶797GL3的玉米被证实当与α-葡糖苷酶(MalA)和木糖异构酶(XylA)混合时可以促进果糖的产生。
将来自表达797GL3的pNOV6201转基因植物的种子在Kleco槽中研磨成面粉,由此产生淀粉酶面粉。将非转基因玉米的籽粒以相同方式研磨以产生对照面粉。
所述α-葡糖苷酶MalA(来自硫磺矿硫化叶菌)在大肠杆菌中表达。将收获的细菌悬浮在含有1mM 4-(2-氨基乙基)苯磺酰氟的50mM磷酸钾缓冲液pH7.0中,然后在弗氏细胞压碎器中裂解。裂解物在4℃23,000×g离心15分钟。移出上清液,并70℃加热10分钟,冰上冷却10分钟,然后4℃ 34,000×g离心30分钟。移出上清液,在Centricon10装置中将MalA浓缩2倍。保留Centricon10步骤的滤过物作为MalA的阴性对照。
通过在大肠杆菌中表达T.neapolitana的xylA基因,制备木糖(葡萄糖)异构酶。将细菌悬浮在100mM磷酸钠pH7.0中,通过弗氏细胞压碎器裂解。沉淀细胞碎片后,80℃加热提取物10分钟,然后离心。上清液含有XylA酶促活性。与XylA提取物平行地制备空载体对照提取物。
将玉米面粉(每份样品60mg)与缓冲液及来自大肠杆菌的提取物混合。如表3中所示,样品含有淀粉酶玉米面粉(淀粉酶)或对照玉米面粉(对照)、50μl MalA提取物(+)或滤过物(-)、以及20μl XylA提取物(+)或空载体对照(-)。所有样品还含有230μl 50mM MOPS、10mMMgSO4和1mM CoCl2;室温下缓冲液的pH为7.0。
样品85℃温育18小时。温育时间结束时,用0.9ml 85℃的水稀释样品,离心以除去不溶性物质。然后通过Centricon3超滤装置过滤上清液级分,并通过带有ELSD检测的HPLC进行分析。
该梯度HPLC系统配备有Astec Polymer Amino柱、5微米粒径、250×4.6mm和Altech ELSD 2000检测器。该系统预先用水∶乙腈的15∶85混合物平衡。流速为1ml/min。初始条件在注射后维持5分钟,之后20分钟的梯度至50∶50水∶乙腈,之后10分钟的相同溶剂。用20min的80∶20水∶乙腈洗涤该系统,然后用起始溶剂重新平衡。果糖在5.8min洗脱,葡萄糖在8.7min洗脱。
表 3
 样品  玉米面粉   MalA  XylA   果糖峰面积×10-6  葡萄糖峰面积×10-6
 1  淀粉酶   +  +   25.9  110.3
 2  淀粉酶   -  +   7.0  12.4
 3  淀粉酶   +  -   0.1  147.5
 4  淀粉酶   -  -   0  25.9
 5  对照   +  +   0.8  0.5
 6  对照   -  +   0.3  0.2
 7  对照   +  -   1.3  1.7
 8  对照   -  -   0.2  0.3
HPLC结果也说明在含有α-淀粉酶的所有样品中存在更大的麦芽寡糖。这些结果证明,三种嗜热酶可以在高温下一起发挥功能从玉米产生果糖。
实施例18
具有异构酶的淀粉酶面粉
另一实施例中,将淀粉酶面粉与纯化的MalA以及分别地两种细菌木糖异构酶(海栖热袍菌的XylA和从Diversa获得的命名为BD8037的酶)之每一种混合。按实施例18制备淀粉酶面粉。
在大肠杆菌中表达具有6His纯化标签的硫磺矿硫化叶菌。按实施例18制备细胞裂解物,然后使用镍亲和树脂(Probond,Invitrogen)按照生产商针对天然蛋白质纯化的教导,纯化至表观同质性。
在大肠杆菌中表达添加了S标签和ER滞留信号的海栖热袍菌XylA,并按实施例18中所述用与T.neapolitana XylA相同的方式制备。
木糖异构酶BD8037以冻干粉末形式获得,并重悬在0.4×最初体积的水中。
淀粉酶玉米面粉与酶溶液加水或缓冲液混合。所有反应含有60mg淀粉酶面粉和总共600μl的液体。一组反应使用室温pH7.0的50mMMOPS加上10mM MgSO4和1mM CoCl2缓冲;第二组反应中用水代替该含金属的缓冲液。如表4中所示,变化异构酶的量。所有反应90℃温育2小时。离心制备反应上清液级分。再用600μl H2O洗涤沉淀并再次离心。将来自每个反应的上清液级分合并,通过Centricon10过滤,并利用带有ELSD检测的HPLC按照实施例17进行分析。图15为观察到的葡萄糖和果糖量的曲线图。
表 4
 样品  淀粉酶面粉  MalA  异构酶
 1  60mg  +  无
 2  60mg  +  海栖热袍菌,100μl
 3  60mg  +  海栖热袍菌,10μl
 4  60mg  +  海栖热袍菌,2μl
 5  60mg  +  BD8037,100μl
 7  60mg  +  BD8037,2μl
 C  60mg  无  无
当反应中存在-淀粉酶和α-葡糖苷酶时,利用每一种异构酶都从玉米面粉以剂量依赖性方式产生了果糖。这些结果说明,谷粒表达的淀粉酶797GL3能够与MalA以及各种不同的嗜热异构酶在添加金属离子或不添加金属离子的情况下一起作用,以在高温下从玉米面粉产生果糖。在存在添加的金属离子的情况下,这些异构酶能够在90℃达到大约55%果糖的预期果糖∶葡萄糖平衡。这将优于需要色谱分离以增加果糖浓度的使用嗜温型异构酶的常规工艺。
实施例19
在玉米中表达支链淀粉酶
pNOV7013或pNOV7005纯合的转基因植物杂交,产生表达797GL3α-淀粉酶和6GP3支链淀粉酶两者的转基因玉米种子。
从转化了pNOV7005或pNOV7013的自花授粉玉米植物获得T1或T2种子。pNOV4093是6GP3的玉米优化型合成基因(SEQ ID NO:3,4)与用于融合蛋白在造粉体定位的造粉体引导序列(SEQ ID NO:7,8)的融合物。该融合蛋白在ADPgpp启动子(SEQ ID NO:11)的控制之下,以便在胚乳中特异地表达。pNOV7005构建体使支链淀粉酶的表达靶向胚乳的内质网中。该酶在ER中的定位允许淀粉在籽粒中正常积累。在任何高温接触前,也观察到碘溶液对淀粉的正常染色。
正如α-淀粉酶的情况中描述的,靶向造粉体的支链淀粉酶的表达导致籽粒中异常的淀粉积累。当干燥玉米穗时,籽粒皱缩。显然,此嗜热型支链淀粉酶在低温下具有充足的活性,如果允许其与种子胚乳中的淀粉粒直接接触,则其将水解淀粉。
从玉米面粉制备酶或提取酶:通过在Kleco研磨机中研磨转基因种子,然后在50mM NaOAc pH5.5缓冲液中不停振摇下室温温育面粉,从该转基因种子提取支链淀粉酶。然后14000rpm离心温育的混合物15min。使用上清液作为酶的来源。
支链淀粉酶试验:该试验反应在96孔板中进行。从玉米面粉提取的酶(100μl)用900μl含有40mM CaCl2的50mM NaOAc pH5.5缓冲液稀释10倍。涡旋混合物,向每个反应混合物中加入1片Limit-Dextrizyme(天青蛋白(azurine)交联的支链淀粉,来自Megazyme),75℃温育30分钟(或如所提及的)。在温育结束时,3500rpm离心反应混合物15分钟。稀释上清液5倍,并转移至96孔平底板用于590nm的吸光度测量。支链淀粉酶水解天青蛋白交联的支链淀粉底物产生水溶性染料片断,这些片断的释放速度(以590nm吸光度的增加来测量)直接与酶活性相关。
图9显示对来自不同pNOV7005转化事件的T2种子的分析。与非转基因对照相比,能够在许多事件中检测到支链淀粉酶活性的高表达。
向测定量(~100μg)的、来自转基因(表达支链淀粉酶或淀粉酶或两种酶)和/或对照(非转基因的)的干玉米面粉中,加入1000μl含有40mM CaCl2的50mM NaOAc pH5.5缓冲液。涡旋反应混合物,摇床上孵育1小时。通过转移孵育混合物至高温(75℃,支链淀粉酶的最适反应温度或如图中所述温度)一段如图中所示的时间长度,启始酶促反应。通过在冰上冷却,终止反应。然后14000rpm离心反应混合物10分钟。将上清液的等分试样(100μl)稀释3倍,通过0.2微米过滤器过滤用于HPLC分析。
使用以下条件通过HPLC分析样品:
柱子:Alltech Prevall Carbohydrate E55微米250×4.6mm
检测器:Alltech ELSD2000
泵:Gilson322
注射器:Gilson215注射器/稀释剂
溶剂:HPLC级乙腈(Fisher Scientific)和水(由WatersMillipore System纯化)。
用于低聚合度(DP1-15)的寡糖的梯度:
时间 %水 %乙腈
0 15 85
5 15 85
25 50 50
35 50 50
36 80 20
55 80 20
56 15 85
76 15 85
用于高聚合度(DP20-100及以上)的糖的梯度:
时间 %水 %乙腈
0 35 65
60 85 15
70 85 15
85 35 65
100 35 65
用于数据分析的系统:Gilson Unipoint软件系统3.2版
图10A和10B显示在转基因玉米面粉中通过表达的支链淀粉酶从淀粉产生的水解产物的HPLC分析结果。表达支链淀粉酶的玉米的面粉在75℃反应缓冲液中温育30分钟,导致从玉米淀粉产生中等链长的寡糖(DP~10-30)和短链直链淀粉(DP~100-200)。该图也显示支链淀粉酶活性对钙离子存在的依赖性。
可以使用表达支链淀粉酶的转基因玉米产生脱支(α1-6键被切割)并因此具有高水平的直链淀粉/直链糊精的改性淀粉/糊精。此外,取决于所用淀粉的类型(例如,蜡质的、高直链淀粉等),由支链淀粉酶产生的直链淀粉/糊精的链长度分布将发生变化,并因此将是该改性淀粉/糊精的特性。
使用支链淀粉作为底物,也证明了α1-6键的水解。从玉米面粉分离的该支链淀粉酶有效地水解了支链淀粉。对孵育结束时产生的产物的HPLC分析(如所述进行)显示出,如预期的,由于来自玉米的酶对支链淀粉分子中α1-6键的水解而导致的麦芽三糖的产生。
实施例20
在玉米中表达支链淀粉酶
通过从玉米面粉中提取接着进行PAGE和考马斯染色来进一步分析6gp 3支链淀粉酶的表达。通过Kleco研磨器中研磨种子30秒来制备玉米面粉。用1ml 50mM NaOAc pH5.5缓冲液从大约150mg面粉中提取酶。将混合物涡旋振荡,并在振摇器上于室温孵育1小时,随后在70℃孵育15分钟。然后离心混合物(室温下14000rpm 15分钟),将上清液用于SDS-PAGE分析。观察到了大约95kD分子量的蛋白条带。使用商购获得的缀合染料的 limit-糊精(LIMIT-DEXTRIZYME,来自Megazyme,Ireland)对这些样品进行支链淀粉酶分析。高水平的嗜热型支链淀粉酶活性与95kD蛋白的存在相关。
转基因玉米种子的Western印迹和ELISA分析也证明了大约95kD蛋白的表达(表达于大肠杆菌),所述蛋白与针对支链淀粉酶而产生的抗体反应。
实施例21
通过添加表达支链淀粉酶的玉米而增加淀粉水解速度和提高小链长(可发酵的)寡糖的产量
对来自两个反应混合物的淀粉水解产物实施如上所述的HPLC分析,产生图11A和11B中显示的数据。第一反应标示为“淀粉酶”,含有例如根据实施例4描述的方法制备的表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品混合物[1∶1(w/w)];第二反应混合物‘淀粉酶+支链淀粉酶’含有表达α-淀粉酶的转基因玉米和根据实施例19中所述方法制备的表达支链淀粉酶的转基因玉米的玉米面粉样品混合物[1∶1(w/w)]。获得结果支持在淀粉水解工艺期间联合使用支链淀粉酶和α-淀粉酶的益处。这些益处来自于淀粉水解速度的增加(图11A)以及具有低DP的可发酵寡糖的产量增加(图11B)。
已经发现,玉米中单独表达的α-淀粉酶或联合表达的α-淀粉酶与支链淀粉酶(或任何其它淀粉水解酶组合)都可以用于产生麦芽糖糊精(直链的或支链的寡糖)(图11A、11B、12和13A)。取决于反应条件、水解酶的类型以及其组合、和所用的淀粉类型,产生的麦芽糖糊精的组成以及由此它们的性质都将发生变化。
图12描述以类似于针对图11描述的方式实施实验的结果。图中显示了在温育反应期间使用的不同温度和时间方案。支链淀粉酶的最适反应温度是75℃,α-淀粉酶的是>95℃。因此,采用所示方案以便理解支链淀粉酶和/或α-淀粉酶在其各自最适反应温度下实施的催化。从所示结果可以清楚地推导出,α-淀粉酶和支链淀粉酶的联合在60分钟的温育期结束时在水解玉米淀粉方面表现更好。
HPLC分析(如上述,除了在这些反应中使用~150mg玉米面粉外)30分钟温育结束时来自两组反应混合物的淀粉水解产物,结果显示在图13A和13B中。第一组反应在85℃温育,第二组反应在95℃温育。对于每一组,都存在两个反应混合物;第一个反应标示为‘淀粉酶×支链淀粉酶’,其含有来自表达α-淀粉酶和支链淀粉酶两者的转基因玉米(通过异花传粉产生)的面粉;第二个反应标示为‘淀粉酶’,其含有表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米面粉样品混合物,在此两种玉米面粉样品的混合比例使得可以获得与杂种(淀粉酶×支链淀粉酶)中观察到的相同量的α-淀粉酶活性。当在85℃温育玉米面粉样品时,低DP寡糖的总产量在α-淀粉酶和支链淀粉酶杂交的情况下大于单独表达α-淀粉酶的玉米。95℃的温育温度使支链淀粉酶失活(至少部分地),因此在‘淀粉酶×支链淀粉酶’和‘淀粉酶’之间几乎观察不到差异。然而,与单独表达α-淀粉酶的玉米相比,当使用α-淀粉酶和支链淀粉酶的玉米面粉时,来自两个温育温度的数据均表现出在温育期结束时产生的葡萄糖量有显著的改进(图13B)。因此,使用表达α-淀粉酶和支链淀粉酶两者的玉米可能对于其中重要的是将淀粉完全水解成葡萄糖的工艺而言尤其有利。
以上实施例提供了丰富的依据来支持当与α-淀粉酶联用时玉米种子中表达支链淀粉酶可以改善淀粉水解过程。支链淀粉酶活性是α1-6键特异的,其比α-淀粉酶(α-1-4键特异的酶)在使淀粉脱分支方面远远更为有效,由此降低了支链寡糖(例如,极限糊精、潘糖;这些通常是不可发酵的)的量并增加了直链短寡糖(可以容易地发酵成乙醇等)的量。其次,由于支链淀粉酶催化的脱分支导致的淀粉分子的片段化,增加了α-淀粉酶的底物可接近性,由此导致α-淀粉酶催化反应的效率增加。
实施例22
为了确定797GL3α淀粉酶和malAα葡糖苷酶可以在相似的pH和温度条件下起作用以相对于单独任一种酶而言产生增加量的葡萄糖,将大约0.35μg malAα葡糖苷酶(在细菌中产生)加入含有1%淀粉以及从非转基因玉米种子(对照)或797GL3转基因玉米种子(在797GL3转基因玉米种子中α淀粉酶与淀粉共纯化)纯化的淀粉的溶液中。此外,在无任何malA酶存在的情况下,将从非转基因的和797GL3转基因的玉米种子纯化的淀粉加入1%玉米淀粉。混合物在90℃,pH6.0温育1小时,离心除去任何不溶性物质,通过HPLC分析可溶性级分的葡萄糖水平。如图14中所示,797GL3α-淀粉酶和malAα-葡糖苷酶在相似的pH和温度下起作用,将淀粉分解为葡萄糖。所产生的葡萄糖量显著地高于单独任一种酶所产生的葡萄糖量。
实施例23
测定热厌氧杆菌属葡糖淀粉酶在生淀粉水解中的用途。如图15中所示,用水、大麦α-淀粉酶(来自Sigma的商业制品)、热厌氧杆菌属葡糖淀粉酶测定生淀粉的水解转化,在室温和30℃确定其组合。如所示,大麦α-淀粉酶和热厌氧杆菌属葡糖淀粉酶的组合能够将生淀粉水解成葡萄糖。而且,通过大麦淀粉酶和热厌氧杆菌属GA产生的葡萄糖量高于单独任一种酶所产生的葡萄糖量。
实施例24
用于生淀粉水解的玉米优化型基因和序列以及用于植物转化的载体
基于在大约20℃至50℃的温度下水解生淀粉的能力,选择酶。然后通过使用玉米优化的密码子设计相应的基因或基因片段以便如实施例1中所述构建合成的基因。
选择Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合多肽(无信号序列),其具有Biosci.Biotech.Biochem.,56:884-889(1992);Agric.Biol.Chem.545:1905-14(1990);Biosci.Biotechol.Biochem.56:174-79(1992)中鉴定的、SEQ ID NO:45中所示的氨基酸序列。设计玉米优化型核酸,并以SEQ ID NO:46给出。
相似地,选择Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶,其具有Biosci.Biotech.Biochem.62:302-308(1998)公布的SEQ ID NO:47的氨基酸。设计玉米优化型核酸(SEQ ID NO:48)。
选择具有文献(Agric.Biol.Chem.(1986)50,pg957-964)中描述的氨基酸序列(无信号序列)(SEQ ID NO:50)的米根霉葡糖淀粉酶。设计玉米优化型核酸,在SEQ ID NO:51中给出。
此外,选择玉米α-淀粉酶,从文献获得氨基酸序列(SEQ ID NO:51)和核酸序列(SEQ ID NO:52)。见例如Plant Physiol.105:759-760(1994)。
构建表达盒,以从SEQ ID NO:46中给出的经设计的玉米优化型核酸表达Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合多肽、从SEQ ID NO:48中给出的经设计的玉米优化型核酸表达Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶、从SEQ ID NO:50中给出的经设计的玉米优化型核酸表达具有氨基酸序列(无信号序列)(SEQ ID NO:49)的选定米根霉葡糖淀粉酶、以及表达α-淀粉酶。
含有玉米γ玉米醇溶蛋白N端信号序列(MRVLLVALALLALAA SATS)(SEQ ID NO:17)的质粒与编码酶的合成基因融合。任选地,将序列SEKDEL融合于合成基因的C端,以便靶向并滞留在ER中。将融合物克隆在植物转化质粒中用于在胚乳中获得特异表达的玉米γ玉米醇溶蛋白启动子之后。融合物通过农杆菌转染递送至玉米组织。
实施例25
构建含有选定的酶的表达盒以表达这些酶。含有生淀粉结合位点的序列的质粒与编码酶的合成基因融合。生淀粉结合位点允许酶融合物与未糊化的淀粉结合。基于文献确定了该生淀粉结合位点氨基酸序列(SEQID NO:53),并基于玉米优化了核酸序列,给出SEQ ID NO:54。玉米优化型核酸序列与编码酶的合成基因在用于植物中表达的质粒中融合。
实施例26
构建玉米优化型基因和用于植物转化的载体
利用玉米优选的密码子设计基因或基因片段,以便如实施例1中所述构建合成基因。
选择强烈炽热球菌EGLA——嗜高热内切葡聚糖酶氨基酸序列(无信号序列),其具有Journal of Bacteriology(1999)181,284-290页)中鉴定的、SEQ ID NO:55中所示的氨基酸序列。设计玉米优化型核酸并在SEQ ID NO:56中给出。
选择The rmus flavus木糖异构酶,其具有Applied Biochemistryand Biotechnology 62:15-27(1997)中所述的、SEQ ID NO:57中所示氨基酸序列。
构建表达盒,以从玉米优化型核酸(SEQ ID NO:56)表达强烈炽热球菌EGLA(内切葡聚糖酶),从编码氨基酸序列SEQ ID NO:57的玉米优化型核酸表达Thermus flavus木糖异构酶。含有玉米γ玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)的质粒与编码酶的玉米优化型合成基因融合。任选地,将序列SEKDEL融合于合成基因的C端以便靶向和滞留在ER中。在植物转化质粒中,将融合物克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。融合物通过农杆菌转染而递送至玉米组织。
实施例27
使用玉米中表达的嗜热酶从玉米面粉产生葡萄糖
已经证实,嗜高热α-淀粉酶797GL3和α-葡糖苷酶(MalA)的表达可以导致当与水性溶液混合并90℃温育时产生葡萄糖。
通过测定α-葡糖苷酶活性(以对硝基苯基-α-葡萄糖的水解指示),鉴定表达MalA酶的转基因玉米系(168A10B系,pNOV4831)。
将来自表达797GL3的转基因植物的玉米籽粒在Kleco槽中研磨成面粉,由此产生淀粉酶面粉。将来自表达MalA的转基因植物的玉米籽粒在Kleco槽中研磨成面粉,由此产生MalA面粉。以相同方式研磨非转基因的玉米籽粒,以产生对照面粉。
缓冲液是50mM MES缓冲液,pH6.0。
玉米面粉水解反应:按下表5所示制备样品。将玉米面粉(每份样品大约60mg)与40ml 50mM MES缓冲液pH6.0混合。样品在设定于90℃的水浴中温育2.5和14小时。在所示温育时间,取出样品并分析葡萄糖含量。
通过基于葡萄糖氧化酶/辣根过氧化物酶的实验,分析样品中的葡萄糖。GOPOD试剂含有:0.2mg/ml邻联二茴香胺、100mM Tris pH7.5、100U/ml葡萄糖氧化酶&10U/ml辣根过氧化物酶。20μl样品或稀释的样品在96孔板中与葡萄糖标准品(从0至0.22mg/ml变化)一起进行分析。在混合下向每孔加入100μl GOPOD试剂,37℃温育板子30分钟。加入100μl硫酸(9M),读取540nm的吸光度。参考标准曲线,确定样品的葡萄糖浓度。表5中显示了每个样品中观察到的葡萄糖量。
表 5
  样品   WT面粉mg  淀粉酶面粉mg     MalA面粉mg   缓冲液ml   葡萄糖2.5hmg   葡萄糖14hmg
  1   66  0     0   40   0   0
  2   31  30     0   40   0.26   0.50
  3   30  0     31.5   40   0   0.09
  4   0  32.2     30.0   40   2.29   12.30
  5   0  6.1     56.2   40   1.16   8.5 2
这些数据说明,当嗜高热α淀粉酶和α葡糖苷酶在玉米中表达时将导致在适当条件下水合及加热玉米产物时该玉米产物产生葡萄糖。
实施例28
产生麦芽糖糊精
使用表达嗜热α-淀粉酶的谷粒制备麦芽糖糊精。此示例性方法既无需淀粉的预先分离也无需添加外源酶。
将来自表达797GL3的转基因植物的玉米籽粒在Kleco槽中研磨成面粉,产生“淀粉酶面粉”。以相同方式研磨10%转基因的/90%非转基因的籽粒的混合物,产生“10%淀粉酶面粉”。
将淀粉酶面粉和10%淀粉酶面粉(大约60mg/样品)与水按照每mg面粉5μl水的比例混合。如表6所示,所得浆液在90℃温育不超过20小时。85℃添加0.9ml 50mM EDTA以终止反应,并通过抽吸进行混合。取出0.2ml浆液的样品,离心除去不溶性物质,并在水中稀释3倍。
利用带有ELSD检测的HPLC分析样品的糖(sugar)和麦芽糖糊精。该梯度HPLC系统配备有Astec Polymer Amino柱、5微米粒径、250×4.6mm以及Altech ELSD 2000检测器。系统使用水∶乙腈的15∶85混合物预先平衡。流速为1ml/min。注射后维持初始条件5分钟,之后20分钟的梯度至50∶50水∶乙腈,之后10分钟的相同溶剂。系统使用20min 80∶20水∶乙腈洗涤,然后使用起始溶剂重新平衡。
所得峰面积基于面粉的体积和重量进行标化。每μg碳水化合物的ELSD反应因子随着DP的增加而降低,因此较高DP的麦芽糖糊精比峰面积所示的在总体中占有更高的百分比。
图17显示具有100%淀粉酶面粉的反应的产物的相对峰面积。图18显示具有10%淀粉酶面粉的反应的产物的相对峰面积。
这些数据说明,通过变化加热时间可以产生各种麦芽糖糊精混合物。通过将表达α-淀粉酶的转基因玉米与野生型玉米混合,可以改变α-淀粉酶活性的水平,从而改变麦芽糖糊精谱。
此实施例中描述的水解反应的产物可以利用各种被充分阐述的方法,包括:离心、过滤、离子交换、凝胶渗透、超滤、纳米过滤、反渗透、利用碳颗粒脱色、喷雾干燥和本领域已知的其它标准技术,浓缩和纯化以用于食物和其它应用。
实施例29
时间和温度对麦芽糖糊精生产的影响
通过含有嗜热α-淀粉酶的谷粒的自水解产生的麦芽糖糊精产物的组成可以通过变化反应的时间和温度而改变。
另一实验中,按以上实施例28中所述制备淀粉酶面粉,并与水按照每60mg面粉300μl水的比例混合。样品70℃、80℃、90℃或100℃温育不超过90分钟。90℃添加900ml 50mM EDTA终止反应,离心除去不溶性物质,并通过0.45μm尼龙滤器过滤。按照实施例28中所述,利用HPLC分析滤过物。
图19中给出了此分析的结果。DP数命名法指聚合度。DP2是麦芽糖;DP3是麦芽三糖等。在靠近洗脱末尾的单峰中洗脱的、较大DP的麦芽糖糊精被标记为“>DP12”。此集合物包括通过0.45μm滤器并通过保护柱的糊精,并且不包括被滤器和保护柱挡住的任何非常大的淀粉片断。
该实验证明,产物的麦芽糖糊精组成可以通过变化温度和温育时间而改变,从而获得期望的麦芽寡糖或麦芽糖糊精产物。
实施例30
麦芽糖糊精的生产
从含有嗜热α-淀粉酶的转基因玉米产生的麦芽糖糊精产物的组成,也可以通过添加其它的酶,例如α-葡糖苷酶和木糖异构酶以及通过在热处理之前于面粉水混合物中包括盐类,而改变。
另一实验中,将按上述制备的淀粉酶面粉与纯化的MalA和/或命名为BD8037的细菌木糖异构酶混合。具有6His纯化标签的硫磺矿硫化叶菌MalA在大肠杆菌中表达。按实施例28中所述制备细胞裂解物,然后使用镍亲和树脂(Probond,Invitrogen),按照生产商提供的用于天然蛋白质纯化的说明书,纯化至表观同质性。木糖异构酶BD8037以冻干粉末形式从Diversa获得,并重悬在0.4倍最初体积的水中。
将淀粉酶玉米面粉与酶溶液加水或缓冲液混合。所有反应均含有60mg淀粉酶面粉和总共600μl液体。一组反应采用室温pH7.0的50mMMOPS加10mM MgSO4和1mM CoCl2缓冲;在第二组反应中,用水替代此含金属的缓冲溶液。所有反应在90℃温育2小时。离心制备反应上清液级分。再使用600μl H2O洗涤沉淀,并重新离心。将来自每个反应的上清液级分分别合并,通过Centricon 10过滤,并使用带有ELSD检测的HPLC按上述进行分析。
结果绘制在图20中。它们说明,表达淀粉酶797GL3的谷粒可以与其它嗜热酶一起在有或无添加的金属离子的情况下一起发挥作用,在高温下从玉米面粉产生各种麦芽糖糊精混合物。尤其是,将葡糖淀粉酶或α-葡糖苷酶包括在内可以导致具有更多葡萄糖和其它低DP产物的产物。将具有葡萄糖异构酶活性的酶包括在内可以导致具有果糖并由此比单独淀粉酶或淀粉酶加α-葡糖苷酶产生的产物更甜的产物。此外,这些数据也说明,通过包括二价阳离子盐,例如CoCl2和MgSO4,可以增加DP5、DP6和DP7麦芽寡糖的比例。
改变在诸如此处所述的反应中产生的麦芽糖糊精的组成的其它方式包括:变化反应pH、变化转基因的或非转基因的谷粒中的淀粉类型、变化固体比率、或添加有机溶剂。
实施例31
在回收淀粉衍生产物之前不经机械破碎谷粒而从谷粒制备糊精或糖(sugar)
通过将表达α-淀粉酶797GL3的转基因谷粒与水接触并加热至90℃过夜(>14小时),由此制备糖(sugar)和麦芽糖糊精。然后通过过滤将液体与谷粒分开。利用实施例15中所述方法,通过HPLC分析液体产物。表6给出检测到的产物谱。
表 6
分子种类   产物浓度μg/25μl注射
果糖   0.4
葡萄糖   18.0
麦芽糖   56.0
DP3*   26.0
DP4*   15.9
DP5*   11.3
DP6*   5.3
DP7*   1.5
*DP3的定量包括麦芽三糖并可能包括具有代替α(1→4)键的α(1→6)键的麦芽三糖异构体。类似地,DP4至DP7的定量包括给定链长的线性麦芽寡糖以及具有一个或多个代替α(1→4)键的α(1→6)键的异构体。
这些数据说明,可以通过使完整的表达α-淀粉酶的谷粒与水接触并加热,而制备糖(sugar)和麦芽糖糊精。这些产物然后可以通过过滤或离心或通过重力沉降与完整谷粒分开。
实施例32
发酵表达米根霉葡糖淀粉酶的玉米中的生淀粉
从按实施例29所述制备的转基因植物收获转基因玉米籽粒。将籽粒研磨成面粉。该玉米籽粒表达含有被引导至内质网的米根霉葡糖淀粉酶活性片段(SEQ ID NO:49)的蛋白质。
按实施例15所述,将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例33
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。将籽粒研磨成面粉。该玉米籽粒表达含有被引导至内质网的米根霉葡糖淀粉酶活性片段(SEQ ID NO:49)的蛋白质。
按实施例15所述,将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例34
在添加外源α-淀粉酶的情况下发酵表达米根霉葡糖淀粉酶的玉米的完整籽粒中的生淀粉的实例
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的米根霉葡糖淀粉酶活性片段(SEQ ID NO:49)的蛋白质。
玉米籽粒与20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)接触。添加氢氧化铵调节pH至6.0。加入以下成分:购自Sigma的大麦α-淀粉酶(2mg)、蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mg Lactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有此混合物的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种混合物,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例35
表达米根霉葡糖淀粉酶和玉蜀黍淀粉酶的玉米中的生淀粉的发酵
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的米根霉葡糖淀粉酶活性片段(SEQ ID NO:49)的蛋白质。该籽粒也表达具有如实施例28中所述的生淀粉结合域的玉米淀粉酶。
按实施例14所述,将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定于90F的水浴中温育。24小时发酵后,将温度降至86F;在48小时时将温度设定在82F。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例36
表达Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶的玉米中的生淀粉的发酵实例
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的Thermoanaerobacterthermosaccharolyticum葡糖淀粉酶活性片段(SEQ ID NO:47)的蛋白质。
按实施例15所述,将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例37
表达黑曲霉葡糖淀粉酶的玉米中的生淀粉的发酵实例
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有黑曲霉葡糖淀粉酶活性片段(Fiil,N.P.,“从两种不同但紧密相关的mRNA合成黑曲霉的葡糖淀粉酶G1和G2”,EMBOJ3(5),1097-1102(1984),登录号P04064)的蛋白质。编码该葡糖淀粉酶的玉米优化型核酸具有SEQ ID NO:59,并被引导至内质网。
按实施例14所述,将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例38
表达黑曲霉葡糖淀粉酶和玉蜀黍淀粉酶的玉米中的生淀粉的发酵实例
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有黑曲霉葡糖淀粉酶活性片段(Fiil,N.P.,“从两种不同但紧密相关的mRNA合成黑曲霉的葡糖淀粉酶G1和G2”,EMBOJ3(5),1097-1102(1984),登录号P04064)(SEQ ID NO:59,玉米优化型核酸)并被引导至内质网的蛋白质。该籽粒也表达具有实施例28中所述的生淀粉结合域的玉米淀粉酶。
按实施例14所述,将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例39
表达Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶和大麦淀粉酶的玉米中的生淀粉的发酵实例
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的Thermoanaerobacterthermosaccharolyticum葡糖淀粉酶活性片段(SEQ ID NO:47)的蛋白质。该籽粒也表达低pI大麦淀粉酶amyl基因(Rogers,J.C.和Milliman,C.“分离和序列分析大麦α-淀粉酶cDNA克隆”,J.Biol.Chem.258(13),8169-8174(1983),该基因经过修饰使得该蛋白质靶向内质网表达。
按实施例14所述,将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例40
表达Thermoanaerobacter thermosaccharolyticum葡糖淀粉酶和大麦淀粉酶的玉米的完整籽粒中的生淀粉的发酵实例
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达含有被引导至内质网的Thermoanaerobacterthermosaccharolyticum葡糖淀粉酶活性片段(SEQ ID NO:47)的蛋白质。该籽粒也表达低pI大麦淀粉酶amyl基因(Rogers,J.C.和Milliman,C.“分离和序列分析大麦α-淀粉酶cDNA克隆”,J.Biol.Chem.258(13),8169-8174(1983),该基因经过修饰使得该蛋白质靶向内质网表达。
玉米籽粒与20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)接触。添加氢氧化铵调节pH至6.0。向混合物中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mg Lactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有该醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种此混合物,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例41
表达α-淀粉酶和葡糖淀粉酶的玉米中的生淀粉发酵实例
从按照实施例28中所述制备的转基因植物收获转基因玉米籽粒。该玉米籽粒表达诸如SEQ ID NO:46中提供的玉米优化型多核苷酸,该多核苷酸编码诸如SEQ ID NO:45中提供的、被引导至内质网的α-淀粉酶和葡糖淀粉酶融合物。
按实施例14所述,将玉米籽粒研磨成面粉。然后制备含有20g玉米面粉、23ml去离子水、6.0ml回流液(backset)(按重量计8%固体)的醪液。添加氢氧化铵调节pH至6.0。向醪液中加入以下成分:蛋白酶(0.60ml 1,000倍稀释的商业可获得的蛋白酶)、0.2mgLactocide &尿素(0.85ml 10倍稀释的50%尿素液体)。在含有醪液的100ml瓶子的盖上挖一个洞,以允许CO2排出。然后用酵母(1.44ml)接种醪液,在设定于90℃的水浴中温育。24小时发酵后,将温度降至86℃;在48小时时将温度设定在82℃。
用于接种的酵母按实施例14繁殖。
按实施例14中所述取样品,然后通过实施例14中所述方法分析。
实施例42
构建转化载体
构建下述表达盒以在玉米中表达嗜高热β-葡聚糖酶EglA:
pNOV4800含有与EglAβ-葡聚糖酶的合成基因融合的大麦Amy32b信号肽(MGKNGNLCCFSLLLLLLAGLASGHQ),以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
pNOV4803含有与EglAβ-葡聚糖酶的合成基因融合的大麦Amy32b信号肽,以便靶向内质网和在质外体中分泌。融合物被克隆在用于在整个植物中实现表达的玉米泛素启动子之后。
构建下述表达盒,以便在玉米中表达嗜热β-葡聚糖酶/甘露聚糖6GPl(SEQ ID NO:85):
pNOV4819含有与6GPlβ-葡聚糖酶/甘露聚糖酶的合成基因融合的烟草PRla信号肽(MGFVLFSQLPSFLLVSTLLLFLVISHSCRA),以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
pNOV4820含有克隆在用于细胞质定位和胚乳中特异表达的玉米γ-玉米醇溶蛋白启动子之后的6GP1合成基因。
pNOV4823含有与C端添加了序列KDEL的6GP1β-葡聚糖酶/甘露聚糖酶合成基因融合的烟草PR1a信号肽,以便靶向和滞留在内质网中。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
pNOV4825包含与C端添加了序列KDEL的6GP1β-葡聚糖酶/甘露聚糖酶合成基因融合的烟草PR1a信号肽,以便靶向和滞留在内质网中。融合物被克隆在用于在整个植物中实现表达的玉米泛素启动子之后。
构建下述表达盒以在玉米中表达大麦Amy1α-淀粉酶(SEQ ID NO:87):
pNOV4867含有与C端添加了序列SEKDEL的大麦AmyIα-淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向和滞留在内质网中。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
pNOV4879含有与C端添加了序列SEKDEL的大麦AmyIα-淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向和滞留在内质网中。融合物被克隆在用于在胚中实现特异表达的玉米球蛋白启动子之后。
pNOV4897含有与大麦AmyIα-淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚中实现特异表达的玉米球蛋白启动子之后。
pNOV4895含有与大麦AmyIα-淀粉酶融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
pNOV4901含有克隆在用于细胞质定位和胚中特异表达的玉米球蛋白启动子之后的大麦AmyIα-淀粉酶基因。
构建如下的表达盒以在玉米中表达根霉属葡糖淀粉酶(SEQ ID NO:50):
pNOV4872含有与C端添加了序列SEKDEL的根霉属葡糖淀粉酶合成基因融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向和滞留在内质网中。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
pNOV4880含有与C端添加了序列SEKDEL的根霉属葡糖淀粉酶合成基因融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向和滞留在内质网中。融合物被克隆在用于在胚中实现特异表达的玉米球蛋白启动子之后。
pNOV4889含有与根霉属葡糖淀粉酶合成基因融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚中实现特异表达的玉米球蛋白启动子之后。
pNOV4890含有与根霉属葡糖淀粉酶合成基因融合的玉米γ-玉米醇溶蛋白N端信号序列,以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
pNOV4891含有克隆在用于细胞质定位和胚乳中特异表达的玉米γ-玉米醇溶蛋白启动子之后的根霉属葡糖淀粉酶合成基因。
实施例43
在玉米中表达嗜温型根霉属葡糖淀粉酶
制备用于在玉米中表达根霉属葡糖淀粉酶的各种构建体。使用玉米γ-玉米醇溶蛋白启动子和球蛋白启动子分别在胚乳或胚中特异地表达葡糖淀粉酶。此外,使用玉米γ-玉米醇溶蛋白信号序列和合成的ER滞留信号调节葡糖淀粉酶蛋白的亚细胞定位。所有5个构建体(pNOV4872、pNOV4880、pNOV4889、pNOV4890和pNOV4891)均产生在种子中检测到葡糖淀粉酶活性的转基因植物。表7和8分别显示各单个转基因种子(构建体pNOV4872)和汇合的种子(构建体pNOV4889)的结果。对于表达此根霉属葡糖淀粉酶的任何转基因植物,均未观察到有害的表型。
葡糖淀粉酶试验:将种子研磨成面粉,将面粉悬浮在水中。30度温育样品50分钟,以允许葡糖淀粉酶与淀粉反应。沉淀不溶性物质,测定上清液中葡萄糖的浓度。以每个样品中释放的葡萄糖量指示存在的葡糖淀粉酶水平。通过样品与DOHOD试剂(300mM Tris/Cl pH7.5,葡萄糖氧化酶(20U/ml)、辣根过氧化物酶(20U/ml)、邻联二茴香胺0.1mg/ml)一起37℃温育30分钟,添加0.5体积的12N H2SO4和测定OD540,确定葡萄糖的浓度。
表7显示在各单个转基因玉米种子中(构建体pNOV4872)的根霉属葡糖淀粉酶活性。
表 7
                U/g
种子            面粉
野生型#1        0.07
野生型#2        0.55
野生型#3        0.25
野生型#4        0.33
野生型#5        0.30
野生型#6        0.42
野生型#7        -0.01
野生型#8        0.31
MD9L022156#1    5.17
MD9L022156#2    1.66
MD9L022156#3    7.66
MD9L022156 #4   1.77
MD9L022156#5    7.08
MD9L022156#6    4.46
MD9L022156#7    2.20
MD9L022156#8    3.50
MD9L023377#1    9.23
MD9L023377#2    4.30
MD9L023377#3    6.72
MD9L023377#4    3.35
MD9L023377#5    0.56
MD9L023377#6    4.79
MD9L023377#7    4.60
MD9L023377#8    6.01
MD9L023043#1    4.93
MD9L023043#2    8.74
MD9L023043#3    2.70
MD9L023043#4    0.72
MD9L023043#5   3.33
MD9L023043#6   3.53
MD9L023043#7   3.94
MD9L023043#8   11.51
MD9L023334#1   4.28
MD9L023334#2   2.86
MD9L023334#3   0.56
MD9L023334#4   6.96
MD9L023334#5   3.29
MD9L023334#6   3.18
MD9L023334#7   4.57
MD9L023334#8   7.44
MD9L022039#1   6.25
MD9L022039#2   2.85
MD9L022039#3   4.32
MD9L022039#4   2.51
MD9L022039#5   5.06
MD9L022039#6   5.03
MD9L022039#7   2.79
MD9L022039#8   2.98
表8显示在汇合的转基因玉米种子中(构建体pNOV4889)根霉属葡糖淀粉酶的活性
表 8
               U/g
种子           面粉
野生型        0.38
MD9L023347    2.14
MD9L023352    2.34
MD9L023369    1.66
MD9L023469    1.42
MD9L023477    1.33
MD9L023482    1.95
MD9L023484    1.32
MD9L024170    1.35
MD9L024177    1.48
MD9L024184    1.60
MD9L024186    1.34
MD9L024196    1.38
MD9L024228    1.69
MD9L024263    1.70
MD9L024315    1.32
MD9L024325    1.73
MD9L024333    1.41
MD9L024339    1.84
将所有的表达盒都插入二元载体pNOV2117中,以便通过农杆菌感染转染至玉米中。该二元载体含有允许使用甘露糖选择转基因细胞的磷酸甘露糖异构酶(PMI)基因。使转化的玉米植物自花授粉或远交,收集种子用于分析。
实施例44
在玉米中表达嗜高热β-葡聚糖酶Eg1A
为了在玉米中表达嗜高热β-葡聚糖酶Eg1A,我们使用了用于在整个植物中实现表达的泛素启动子和用于在玉米种子的胚乳中实现特异表达的γ-玉米醇溶蛋白启动子。大麦Amy32b信号肽与Eg1A融合以实现在质外体中的定位。
使用酶学试验和Western印迹,在转基因玉米种子和叶中分析嗜高热β-葡聚糖酶Eg1A的表达。
使用针对β-葡聚糖酶的western印迹和酶学试验,分析基于构建体pNOV4800或pNOV4803分离的转基因种子。在水中浸渍48小时后,从各单个种子中分离胚乳。通过在50mM NaPO4缓冲液(pH6.0)中研磨胚乳,提取蛋白质。通过50℃加热提取物15分钟,之后沉淀不溶性物质,而分离热稳定的蛋白质。含有热稳定蛋白质的上清液使用氮(azo)-大麦葡聚糖方法(megazyme)分析β葡聚糖酶活性。样品100℃预先温育10分钟,之后使用氮-大麦葡聚糖底物在100℃进行10分钟试验。温育后,向每个样品添加3体积的沉淀溶液,离心样品1分钟,测定每个上清液的OD590。此外,通过SDS-PAGE分离5μg蛋白质,印迹在硝化纤维素上使用抗Eg1A蛋白质的抗体进行western印迹分析。Western印迹分析在Eg1A阳性胚乳提取物中而非在阴性提取物中检测到特定的热稳定蛋白质。Western印迹信号与酶学检测到的Eg1A活性水平相关。
在分别含有转基因构建体pNOV4803和pNOV4800的植物的叶和种子中分析Eg1A活性。这些试验(如上述实施)显示,在转基因植物的叶(表9)和种子(表10)中热稳定β-葡聚糖酶Eg1A以各种水平表达,而在非转基因的对照植物中没有检测到活性。利用构建体pNOV4800和pNOV4803在玉米中实现的Eg1A表达不导致任何可检测的负面表型。
表9显示在转基因玉米植物的叶中嗜高热β-葡聚糖酶Eg1A的活性。对来自pNOV4803转基因植物叶的提取物实施酶学分析,以检测嗜高热β-葡聚糖酶活性。使用氮-大麦葡聚糖方法(megazyme),在100℃实施试验。结果说明,转基因叶具有变化水平的嗜高热β-葡聚糖酶活性。
表 9
植物          Abs590
野生型        0
266A-17D      0.008
266A-18E      0.184
266A-13C      0.067
266A-15E      0.003
266A-11E      0
265C-1B       0.024
265C-1C       0.065
265C-2D       0.145
265C-5C       0.755
265C-5D       0.133
265C-3A       0.076
266A-4B       0.045
266A-12B      0.066
266A-11C      0.096
266A-14B      0.074
266A-4C       0.107
266A-4A       0.084
266A-12A      0.054
266A-15B      0.052
266A-11A      0.109
266A-20C      0.044
266A-19D      0.02
266A-12C      0.098
266A-4E       0.248
266A-18B      0.367
265C-3D       0.066
266A-20E      0.163
266A-13D      0.084
265C-3B       0.065
266A-15A      0.131
266A-13A      0.169
265C-3E       0.116
266A-20A      0.365
266A-20B      0.521
266A-19C     0.641
266A-20D     0.561
266A-4D      0.363
266A-18A     0.676
265C-5E      0.339
266A-17E     0.221
266A-11B     0.251
265C-4E      0.138
265C-4D      0.242
表10显示转基因玉米植物种子中嗜高热β-葡聚糖酶Eg1A的活性。在来自pNOV4800转基因植物的各单个分离种子的提取物上实施酶学分析,以检测嗜高热β-葡聚糖酶活性。使用氮-大麦葡聚糖方法(megazyme)在100℃进行试验。结果说明,转基因种子具有变化水平的嗜高热β-葡聚糖酶活性。
表 10
种子     Abs590
野生型   0
1A       1.1
1B       0
1C       1.124
1D       1.323
2A       0
2B       1.354
2C       1.307
2D       0
3A       0.276
3B       0.089
3C       0.463
3D       0
4A       0.026
4B       0.605
4C       0.599
4D       0.642
5A       1.152
5B       1.359
5C       1.035
5D       0
6A       0.006
6B       1.201
6C       0.034
6D       1.227
7A       0.465
7B       0
7C       0.366
7D     0.77
8A     1.494
8B     1.427
8C     0.003
8D     1.413
内切葡聚糖酶Eg1A的转基因表达对细胞壁组成的影响以及体外消化性分析
在温室中分别栽培来自不表达或表达Eg1a(pNOV4803)的两个系#263和#266之每一个的各5颗种子。从来自未成熟植物的小叶样品制备蛋白质提取物,用于验证#266植物中内在而#263植物中不存在转基因内切葡聚糖酶活性。在完全植物成熟时,授粉后大约30天,收获整个地上植物,粗略地剁碎,烤箱干燥72小时。将每个样品分成2个相同的样品(分别标记为A和B),并且使用粗滤的瘤胃液,按照通常的方法(饲料纤维分析装置、试剂、方法和一些应用,H.K.Goering和P.J.Van Soest,Goering,H.Keith 1941(Washington,D.C.):美国农业部,农业研究部门,1970.iv,20p:ill.AgricultureHandbook;no.379),但是在体外消化性分析之前将材料于40℃或90℃作预先温育处理,由此进行体外消化性分析。体外消化性分析按如下进行:
利用Wiley磨将样品切成大约1mm,然后再分成16个称重后的等分试验用于分析。将材料悬浮在缓冲液中,40℃或90℃温育2小时,然后过夜冷却。添加微量营养物、胰胨&酪蛋白&亚硫酸钠,之后加入粗滤的瘤胃液,37℃温育30小时。使用标准重量分析方法(Van Soest&Wine,使用去污剂分析含纤维饲料,IV.植物细胞壁成分的测定,P.J.Van Soest & R.H.Wine(1967),Journal of The AOAC,50:50-55;也参见Methods for dietry fiber,neutral detergent fiberand nonstarch polysaccharides in relationto animal nutrition(1991).P.J.Van Soest,J.B.Roberston & B.A.Lewis.J.DairyScience,74:3583-3597),分析中性去污剂纤维(NDF)、酸性去污剂纤维(ADF)和酸性去污剂木质素(AD-L)。
数据显示,表达Eg1A的转基因(#266)比对照植物(#233)含有更多的NDF,而ADF和木质素相对不变。转基因植物的NDF级分比非转基因植物的NDF级分更容易被消化,这是因为纤维素(NDF-ADF-AD-L)的消化性增加(与转基因表达内切葡聚糖酶导致的细胞壁纤维素“自消化”相符)所致。
实施例45
在玉米中表达嗜热型β-葡聚糖酶/甘露聚糖酶(6GPl)
使用氮-大麦葡聚糖方法(megazyme),分析pNOV4820和pNOV4823的转基因种子的6GP1β葡聚糖酶活性。在50℃进行的酶学试验说明,转基因种子具有嗜热性6GP1β-葡聚糖酶活性,而在非转基因种子中检测不到活性(阳性信号是与此试验相关的背景噪音)。
表11显示转基因玉米种子中嗜热型β-葡聚糖酶/甘露聚糖酶6GP1的活性。pNOV4820(事件1-6)和pNOV4823(事件7-9)的转基因种子使用氮-大麦葡聚糖方法(megazyme)分析6GP1β-葡聚糖酶活性。在50℃实施酶学试验,结果说明,转基因种子具有嗜热性6GP1β-葡聚糖酶活性,而在非转基因的种子中没有检测到活性。
表 11
 种子   Abs 590
 野生型   0
 1   0.21
 2   0.31
 3   0.36
 4   0.23
 5   0.16
 6   0.14
 7   0.52
 8   0.54
 9   0.49
实施例46
在玉米中表达嗜温型大麦AmyI淀粉酶
为了在玉米中表达大麦AmyIα-淀粉酶,制备了各种构建体。使用玉米γ-玉米醇溶蛋白启动子和球蛋白启动子以分别在胚乳或胚中实现特异表达。此外,使用玉米γ-玉米醇溶蛋白信号序列和合成的ER滞留信号调节淀粉酶蛋白的亚细胞定位。所有5个构建体(pNOV4867、pNOV4879、pNOV4897、pNOV4895、pNOV4901)均产生在种子中检测到α-淀粉酶活性的转基因植物。表12显示5个独立的分离事件(构建体pNOV4879和pNOV4897)的各单个种子中的活性。所有的构建体都产生一些具有皱缩种子表型的转基因事件,说明大麦AmyI淀粉酶的合成可以影响淀粉形成、积累或分解。
表12显示在各单个玉米种子中的大麦AmyIα-淀粉酶活性(构建体pNOV4879和pNOV4897)。如前所述,分析了构建体pNOV4879(种子样品1和2)和pNOV4897(种子样品3-5)的分离种子的α-淀粉酶活性。
表 12
种子       U/g玉米面粉
1A         19.29
1B         1.49
1C         18.36
1D         1.15
1E         1.62
1F         14.99
1G         1.88
1H         1.83
2A         2.05
2B         36.79
2C         30.11
2D         2.25
2E         32.37
2F         1.92
2G         20.24
2H         35.76
3A         22.99
3B         1.72
3C         25.38
3D         18.41
3E         28.51
3F         2.11
3G         16.67
3H         1.89
4A         1.57
4B         36.14
4C         23.35
4D         1.70
4E         1.94
4F         14.38
4G         2.09
4H         1.83
5A         11.64
5B         18.20
5C         1.87
5D         2.07
5E         1.71
5F         1.92
5G         12.94
5H         15.25
实施例47
制备木聚糖酶构建体
表13列出9个二元载体,其中的每个二元载体都含有独特的木聚糖酶表达盒。这些木聚糖酶表达盒包括启动子、合成的木聚糖酶基因(编码序列)、内含子(PEPC,反向)和终止子(35S)。
在二元载体pNOV2117中克隆两个合成的玉米优化型内切木聚糖酶基因。这两个木聚糖酶基因命名为BD7436(SEQ ID NO:61)和BD6002A(SEQ ID NO:63)。可以制备含有第三玉米优化型序列BD6002B(SEQ ID NO:65)的其它二元载体。
使用两个启动子:玉米的谷蛋白-2启动子(27-kDγ-玉米醇溶蛋白启动子(SEQ ID NO:12)和稻的谷蛋白-1(Osgt1)启动子(SEQ ID NO:67)。表1中列出的前6个载体已经用于制备转基因植物。可以制备后3个载体,并将其用于产生转基因植物。
载体11560和11562编码SEQ ID NO:62(BD7436)中所示的多肽。构建体11559和11561编码由与SEQ ID NO:62的N端融合的SEQ IDNO:17组成的多肽。SEQ ID NO:17是来自27kDγ-玉米醇溶蛋白的19个氨基酸的信号序列。
载体12175编码SEQ ID NO:64(BD6002A)中所示的多肽。载体12174编码由与SEQ ID NO:64的N端融合的γ-玉米醇溶蛋白信号序列(SEQ ID NO:17)组成的融合蛋白。
载体pWIN062和pWIN064编码SEQ ID NO:66(BD6002B)中所示的多肽。载体pWIN058编码由与SEQ ID NO:66的N端融合的玉米waxy蛋白叶绿体转运肽(SEQ ID NO:68)组成的融合蛋白。
表13 木聚糖酶二元载体
 载体    启动子   信号序列来源  木聚糖酶基因
 11559    27kDγ-玉米醇溶蛋白   27kDγ-玉米醇溶蛋白  BD7436
 11560    27kDγ-玉米醇溶蛋白   无  BD7436
 11561    0sGt1   27kDγ-玉米醇溶蛋白  BD7436
 11562    0sGt1   无  BD7436
 12174    27kDγ-玉米醇溶蛋白   27kDγ-玉米醇溶蛋白  BD6002A
 12175    27kDγ-玉米醇溶蛋白   无  BD6002A
 PWIN058    27kDγ-玉米醇溶蛋白   玉米waxy蛋白  BD6002B
 PWIN062    OsGt1   无  BD6002B
 PWIN064    27kDγ-玉米醇溶蛋白   无  BD6002B
所有构建体均包括PMI的表达盒,以允许在含有甘露糖的培养基上阳性选择再生的转基因组织。
实施例48
木聚糖酶活性试验结果
表14和15显示的数据说明,木聚糖酶活性在T1代种子中积累,其中所述T1种子收获自稳定转化了含有木聚糖酶基因BD7436(SEQ IDNO:61,实施例47中)和BD6002A(SEQ ID NO:63,实施例47)的二元载体的再生(T0)玉米植物。使用Azo-WAXY试验(Megazyme),在来自汇合的(分离的)转基因种子和单个转基因种子的提取物中检测到活性。
将T1种子研磨成粉,使用柠檬酸-磷酸缓冲液(pH 5.4)从面粉样品中提取蛋白质。室温搅拌面粉悬浮液60分钟,离心除去不溶性物质。使用Azo-WAXY试验(McCleary,B.V.“饲料酶和动物饲料中β-木聚糖酶、β-葡聚糖酶和α-淀粉酶测定的问题”,《(Proceedings of SecondEuropean Symposium on Feed Enzymes》(W.van Hartingsveldt,M.Hessing,J.P.vander Jugt,和W.A.C Somers编),Noordwiijkerhout,Netherlands,25-27,1995年10月)测定上清液级分的木聚糖酶活性。提取物和底物在37℃预先温育。向1体积1×提取物上清液中加入1体积底物(1%Azo-小麦阿拉伯木聚糖S-AWAXP),然后37℃温育5分钟。玉米面粉提取物中的木聚糖酶活性通过内切机制使Azo-小麦阿拉伯木聚糖解聚,产生木糖寡糖形式的低分子量染色的片断。5分钟温育后,加入5体积95%EtOH,终止反应。醇的添加造成未解聚的染色的底物沉淀,这样仅仅低分子量的木糖寡糖保留在溶液中。通过离心除去不溶性物质。590nm测定上清液级分的吸光度,通过与使用具有已知活性的木聚糖酶标准品从相同试验获得的吸光度值比较,确定每克面粉的木聚糖酶单位。此标准品的活性由BCA试验确定。使用小麦阿拉伯木聚糖作为底物,通过还原端与2,2’-二金鸡宁酸(BCA)反应以测定还原端的释放,从而确定标准品的酶活性。底物制备为在含有0.02%叠氮化钠的100mM乙酸钠缓冲液pH5.30中的1.4%w/w小麦阿拉伯木聚糖(Megazyme P-WAXYM)溶液。通过将50份试剂A与1份试剂B(试剂A和B分别来自Pierce,产品号23223和23224)混合,制备BCA试剂。这些试剂在使用前不超过4小时时混合。通过将200微升底物与80微升酶样品混合,实施试验。在期望温度温育期望的时间长度后,添加2.80毫升BCA试剂。混合内容物并放置于80℃ 30-45分钟。使内容物冷却,然后转移至杯中,并相对于已知的木糖浓度测定560nm的吸光度。可以由本领域技术人员变化酶稀释度、温育时间和温育温度的选择。
表14中显示的实验结果说明在制备自T代玉米种子的面粉中存在重组木聚糖酶活性。分析来自12个T0植物(来源于独立的T-DNA整合事件)的种子。这12个转基因事件来源于所示的6个不同载体(关于载体的描述参考实施例47中表13)。非转基因(阴性对照)玉米面粉的提取物不含可测量的木聚糖酶活性(见表15)。在这12个样品中木聚糖酶活性为10至87单位/g面粉。
表14 分析汇合的T1种子
  载体     样品     木聚糖酶单位/g面粉
  11559   MD9L013800             63
  11559   MD9L012428             58
  11560   MD9L011296             33
  11560   MD9L011322             21
  11561   MD9L012413             87
  11561   MD9L012443             83
  11562   MD9L012890             13
  11562   MD9L013788             12
  12174   MD9L022080             16
  12174   MD9L022195             10
  12175   MD9L022061             74
  12175   MD9L022134             69
表15中的结果说明在来源单个籽粒的玉米面粉中存在木聚糖酶活性。分析了来自两个含有载体11561和11559的T0植物的T1种子。这些载体描述在实施例47中。将来自两个植物之每一个的各8颗种子研磨成粉,提取每颗种子的面粉样品。表中显示每个提取物的单次试验的结果。在两个转基因事件的种子1、5和8的提取物试验中均未发现木聚糖酶活性。这些种子是无效分离子。两个转基因事件的种子2、3、4、6和7都积累可测量的木聚糖酶活性,该活性可归因于重组BD7436基因的表达。所有测定为阳性木聚糖酶活性(>10单位/克面粉)的10颗种子都具有明显的皱缩或不饱满的外观。相反地,测试为阴性木聚糖酶活性(≤1单位/克面粉)的6颗种子具有正常外观。此结果提示,在种子发育和/或成熟期间重组木聚糖酶造成内源性(阿拉伯)木聚糖底物解聚。
 表15 分析单个T1种子
       载体11561        载体11559
   种子编号     木聚糖酶单位/克面粉    种子编号    木聚糖酶单位/克面粉
    1       0     1      1
    2       45     2      52
    3       38     3      21
    4       40     4      13
    5       0     5      0
    6       40     6      28
    7       32     7      23
    8       0     8      0
实施例49
使用酶增加从玉米种子回收淀粉
玉米湿磨包括步骤:浸渍玉米籽粒、研磨玉米籽粒、和分离籽粒的成分。开发桌面试验(the Cracked Corn Assay)以模拟玉米湿磨工艺。
使用“碎玉米试验”鉴定可以增加来自玉米种子的淀粉产量从而提高玉米湿磨工艺的效率的酶。通过外源添加、转基因玉米种子、或两者的组合来递送酶。除了酶在促进玉米成分分离中的用途外,还证实可以自该工艺中消除SO2
碎玉米试验(cfacked corn assay)
在4000、2000、1000、500、400、40或0ppm SO2中50℃或37℃浸渍一克种子过夜。将种子切成两半,除去胚芽。再次将每一半种子切成两半。保留来自每个浸渍种子样品的浸渍水,并稀释至400ppm至0ppm SO2的最终浓度。向有或无酶存在的两毫升浸渍水中加入去胚芽的种子,并将样品放置在50℃或37℃2至3小时。以每份样品10个单位,分别添加每一种酶。所有样品大约每15分钟涡旋一次。2至3小时后,通过Mira布过滤至50ml离心管中。用2ml水洗涤种子,并将该样品与第一份上清液合并。15分钟离心样品3000rpm。离心后,倒掉上清液,沉淀37℃放置干燥。记录所有沉淀的重量。也测定了样品的淀粉和蛋白质以确定处理过程中释放的淀粉:蛋白比率(数据未显示)。
在碎玉米试验中分析来自表达6GP1内切葡聚糖酶的玉米植物的T1和T2种子
当在碎玉米试验中分析时,含有热稳定内切葡聚糖酶的转基因玉米(pNOV4819和pNOV4823)表现良好。当在2000ppm SO2中浸渍时,在表达内切葡聚糖酶的种子中发现从pNOV4819系获得高2倍的淀粉回收。与对照种子相比,向内切葡聚糖酶种子添加蛋白酶和纤维二糖水解酶使淀粉回收增加了大约7倍。见表16。
表16胞质表达的内切葡聚糖酶(pNOV4820)的碎玉米试验结果。对照株系,A188/HiII;PNOV4819株系,42C6A-1-21和27
     玉米株系   处理  淀粉沉淀重量(mg)
     A188/HiII对照   无酶        28.4
     A188/HiII对照   菠萝蛋白酶/C8546 10U        109.3
     42C6A-1-21   无酶        52.6
     42C6A-1-21   菠萝蛋白酶/C8546 10U        170.4
     42C6A-1-27   无酶        60.5
     42C6A-1-27   菠萝蛋白酶/C8546 10U        207.5
在含有靶向胚乳ER的内切葡聚糖酶的转基因种子(pNOV4823)中观察到相似结果,再次在与对照种子相比时导致淀粉回收增加2至7倍。见表17
表17:ER表达内切葡聚糖酶(pNOV4823)的碎玉米试验。对照株系,A188/HiII;PNOV4823株系,101D11A-1-28。
     株系   处理  淀粉沉淀重量(mg)  淀粉沉淀重量(mg)  平均重量
     A188/HiII   无酶   22.5  19.1  20.8
     101D11A-1-28   无酶   41.2  32  36.6
     A188/HiII   10U菠萝蛋白酶/C8546   78.6  73.8  76.2
     101D11A-1-28   10U菠萝蛋白酶/C8546   169.8  132.6  151.2
这些结果证实,内切葡聚糖酶的表达可以增强玉米种子的淀粉和蛋白质成分的分离。而且,可以看到,在浸渍过程中减少或除去SO2导致了与正常浸渍的对照种子相当或更好的淀粉回收。见表18。从湿磨工艺中除去高水平SO2可以提供增值的益处。
表18:基于自转基因6GP1种子的淀粉回收,比较各种浓度的SO2
   株系     处理 淀粉沉淀重量(mg)
   A188 Control     2000 ppm SO2     18.5
   JHAF Control     2000 ppm SO2     29.1
   42C(pNOV4820)     2000 ppm SO2     29.5
   101C(eNOV4823)     2000 ppm SO2     73.1
   101D(pNOV4823)     2000 pprn SO2     42.5
   136A(pNOV4825)     2000 ppm SO2     36.6
   137A(pNOV4825)     2000 ppm SO2     38.8
   42C(pNOV4820)     400 ppm SO2     18.5
   101C(pNOV4823)     400 ppm SO2     20.4
   101D(pNOV4823)     400 ppm SO2     39.7
   136A(pNOV4825)     400 ppmSO2     26
   37A(pNOV4825)     400 ppm SO2     26.9
   42C(pNOV4820)     0 ppm SO2     21.9
   101C(pNOV4823)     0 ppm SO2     32.5
   101D(pNOV4823)     0 ppm SO2     39
   36A(pNOV4825)     0 ppm SO2     17.8
   137A(pNOV4825)     0 ppm SO2     29.2
实施例50
构建用于玉米优化型菠萝蛋白酶的转化载体
按下述,使用各种引导信号构建表达盒,以在玉米胚乳中表达玉米优化型菠萝蛋白酶:
pSYN11000(SEQ ID NO:73)含有菠萝蛋白酶信号序列(MAWKVQVVFLFLFLCVMWASPSAASA)(SEQ ID NO:72)以及合成的菠萝蛋白酶序列,其中该合成的菠萝蛋白酶序列通过融合在C端添加了用于靶向和滞留在PVS中的序列VFAEAIAANSTLVAE(Vitale和Raikhel,Trends in Plant Science,Vol 4,no.4,pg149-155)。融合物被克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。
pSYN11587(SEQ ID NO:75)包含菠萝蛋白酶N端信号序列(MAWKVQVVFLFLFLCVMWASPSAASA)以及合成的菠萝蛋白酶序列,其中该合成的菠萝蛋白酶序列在C端添加了用于靶向和滞留在内质网(ER)中的序列SEKDEL(Munro和Pelham,1987)。融合物被克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。
pSYN11589(SEQ ID NO:74)含有与裂解性液泡(lytic vacuole)引导序列SSSSFADSNPIRVTDRAAST(Neuhaus和Rogers PlantMolecular Biology 38:127-144,1998)融合的菠萝蛋白酶信号序列(MAWKVQVVFLFLFLCVMWASPSAASA)(SEQ ID NO:72)以及合成的菠萝蛋白酶序列,以便靶向裂解性液泡。融合物被克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。
pSYN12169(SEQ ID NO:76)包含与合成的菠萝蛋白酶融合的玉米y-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向内质网和在质外体中分泌(Torrent等,1997)。融合物被克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之启。
pSYN12575(SEQ ID NO:77)包含与合成的菠萝蛋白酶融合的waxy造粉体引导肽(Klosgen等人,1986),以便靶向造粉体。将该融合物克隆在用于胚乳中特异表达的γ玉米醇溶蛋白启动子之后。
pSM270(SEQ ID NO:78)包含与裂解性液泡(lytic vaCUole)引导序列SSSSFADSNPIRVTDRAAST(Neuhaus和Rogers Plant MolecularBiology 38:127-144,1998)融合的菠萝蛋白酶N端信号序列以及合成的菠萝蛋白酶序列,以便靶向裂解性液泡。融合物被克隆在用于在糊粉层(aleurone)中特异表达的糊粉层特异启动子P19(美国专利6392123)。
实施例51
在玉米中表达菠萝蛋白酶
分析来自转化了含有菠萝蛋白酶合成基因的载体的T1转基因株系的种子的蛋白酶活性,其中所述菠萝蛋白酶合成基因具有用于实现在种子的不同亚细胞位置表达的引导序列。在Kleco研磨机中研磨种子30秒,制备玉米面粉。使用含有1mM EDTA和5mM DTT的1ml 50mMNaOAc pH4.8或50mM Tris pH7.0缓冲液,从100mg面粉提取酶。涡旋样品,然后不停振摇下置于4℃ 30分钟。使用试卤灵标记的树脂(Roche,Cat.No.1080733)如产品小册子中所述的,分析来自每个转基因株系的提取物。使用菠萝蛋白酶特异试验,按照具有如下修改之处的Methods in Enzymology,Vol.244:Pg557-558中给出的方法,分析来自T2种子的面粉。用1ml 50mM Na2HPO4/50mM NaH2PO4,pH7.0、1mM EDTA+/-1μM亮酶抑肽于4℃提取1000mg玉米种子面粉15分钟。14,000rpm,4℃离心提取物5分钟。实施一式两份提取。使用Z-Arg-Arg-NHMec(Sigma)作为底物,分析来自T2转基因株系的面粉的菠萝蛋白酶活性。将100μl/玉米种子提取物的4个等分试样加入含有50μl 100mM Na2HPO4/100mM NaH2PO4,pH7.0、2mM EDTA、8mM DTT/孔的96孔平底板(Corning)中。加入50μl 20μMZ-Arg-Arg-NHMec以开始反应。使用安装有360nm激发波长和465nm发射波长滤波器的SpectraFluorPlus(Tecan)在40℃每隔2.5分钟检测反应速度一次。
表19显示对来自不同T1菠萝蛋白酶事件的种子的分析。发现与A188和JHAF对照株系相比,菠萝蛋白酶的表达高2至7倍。再种植T1转基因株系,获得T2种子。T2种子的分析结果显示菠萝蛋白酶的表达。图21显示使用Z-Arg-Arg-NHMec在T2种子中针对ER靶向的(11587)和裂解性液泡靶向的(11589)菠萝蛋白酶进行的菠萝蛋白酶活性试验。
分析来自表达菠萝蛋白酶的玉米植物的T2种子
在碎玉米试验中分析来自T2转基因菠萝蛋白酶株系11587-2的种子的增加的玉米回收。使用外源添加的菠萝蛋白酶的前面实验已经证实,当单独和与其它酶(尤其是纤维素酶)测试时淀粉酶回收增加。当在37℃/2000ppm SO2浸渍过夜时,来自11587-2系的T2种子显示出比对照种子增加了1.3倍的淀粉回收。更重要的是,当添加纤维素酶(C8546)并在37℃/2000ppm SO2浸渍种子时,在来自T2菠萝蛋白酶株系11587-2的淀粉中存在2倍的增加。
当在37℃/400ppm SO2浸渍种子时,转基因株系显示出高于对照种子的相似淀粉增加趋势。在转基因种子中观察到与对照相比回收的淀粉增加1.6倍,并且在添加纤维素酶(C8546)的情况下淀粉增加2.1倍。见表20。
这些结果的意义在于证明了在湿磨工艺期间使用表达菠萝蛋白酶的转基因种子可以降低温度和SO2水平而同时也增强淀粉回收。
表19
T1玉米中菠萝蛋白酶的谷粒特异性表达的总结
  株系编号  靶向    构建体  “比活性”ng菠萝蛋白酶/蛋白
  11000-1  液泡    GZP/菠萝蛋白酶原/大麦PVS  252
  11000-2  液泡    GZP/菠萝蛋白酶原/大麦PVs  277
  11000-3  液泡    GZP/菠萝蛋白酶原/大麦PVS  284
  11587-1  ER    GZP/菠萝蛋白酶原/KDEL  174
  11587-1  ER    GZP/菠萝蛋白酶原/KDEL  153
  11589-1  裂解性液泡    GZP/aleurain SS/菠萝蛋白酶原  547
  11589-2  裂解性液泡    GZP/aleurain SS/菠萝蛋白酶原  223
   A188对照  56
   JHAF对照  75
表20:T2菠萝蛋白酶种子的碎玉米试验结果
  浸渍条件   株系  淀粉沉淀重量(mg)
  2000 ppm SO2   A188  41.3
  2000 ppm SO2   A188/C8546(10单位)  44
  2000 ppm SO2   11587-2  57.4
  2000 ppm SO2   11587-2/C8546(10单位)  94.6
  400 ppm   A188  30.7
  400 ppm   A188/C8546(10单位)  35.8
  400 ppm   11587-2  50.5
  400 ppm   11587-2/C8546(10单位)  86.6
实施例52
构建用于玉米优化型阿魏酸酯酶的转化载体
按如下所述,使用或不使用各种引导信号,构建表达盒,以便在玉米胚乳中表达玉米优化型阿魏酸酯酶。
质粒13036(SEQ ID NO:101)包含玉米优化型阿魏酸酯酶(FAE)序列(SEQ ID NO:99)。将该序列克隆在用于在胚乳胞质中实现特异表达的、不带任何引导序列的玉米γ玉米醇溶蛋白启动子之后。
质粒13038(SEQ ID NO:103)包含与合成的FAE融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向内质网并在质外体中分泌(Torrent等,1997)。将融合物克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。
质粒13039(SEQ ID NO:105)包含与合成FAE融合的waxy造粉体引导肽(MLAALATSQL VATRA GLGVPDASTF RRGAA Q GLRG ARASA AADTLSMRTS ARAAP RHQHQ QARRG ARRFPS LVVCA SAGA)(Klosgen等人,1986),以便于靶向造粉体。将该融合物克隆在用于胚乳特异性表达的γ玉米醇溶蛋白启动子之后。
质粒13347(SEQ ID NO:107)包含与C端添加了序列SEKDEL的合成FAE序列融合的玉米γ玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向并滞留在内质网(ER)中(Munro和Pelham,1987)。将融合物克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。
将所有表达盒移至二元载体pNOV2117中以便通过农杆菌感染转化入玉米。该二元载体含有允许使用甘露糖选择转基因细胞的磷酸甘露糖异构酶(PMI)。使转化的玉米植物自花授粉或远交,收集种子用于分析。
可以通过使分别表达各单个酶的植物杂交,或者通过将几个表达盒克隆在相同二元载体中实现共转化来产生酶的组合。
合成的阿魏酸酯酶序列(SEQ ID NO:99)
atggccgcctccctcccgaccatgccgccgtccggctacgaccaggtgcgcaacggcgtgccgcgcggccaggtggtgaacatctcctacttctccaccgccaccaa
ctccacccgcccggcccgcgtgtacctcccgccgggctactccaaggacaagaagtactccgtgctctacctcctccacggcatcggcggctccgagaacgactggtt
cgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgagggcaagatcaagccgctcatcatcgtgaccccgaacaccaacgccgccggcccgg
gcatcgccgacggctacgagaacaacaccaaaaacctcctcaactccctcatcccgtacatcgagtccaactactccgtgtacaccgaccgcgagcaccgcgccatcgc
cggcctctctaggcggcggccagtccttcaacatcggcctcaccaacctcgacaagttcgcctacatcggcccgatctccgccgccccgaacacctacccgaacga
gcgcctcttcccggacggcggcaaggccgcccgcgagaagctcaagctcctcttcatcgcctgcggcaccaacgactccctcatcggctgcggccagcgcgtgcacg
agtactgcgtggccaacaacatcaaccacgtgtactggctcatccagggcggcggccacgacttcaacgtgtggaagccgggcctctggaacttcctccagatggcccg
acgaggccggcctcacccgcgacggcaacaccccggtgccgaccccgtccccgaagccggccaacacccgcatcgaggccgaggactacgacggcatcaatcc
tcctccatcgagatcatcggcgtgccgccggagggcggccgcggcatcggctacatcacctccggcgactacctcgtgtacaagtccatcgacttcggacggcgcc
acctccttcaaggccaaggtggccaacgccaacacctccaacatcgagcttcgcctcaacggcccgaacggcaccctcatcggcaccctctccgtgaagtccaccggc
gactggaacacctacgaggagcagacctgctccatctccaaggtgaccggcatcaacgacctctacctcgtgttcaagggcccggtgaacatcgactggttcaccttcg
gcgtgtag
合成的阿魏酸酯酶氨基酸序列(SEQ ID NO:100)
maaslpttmppsgydqvrngvprgqvvnisyfstatnstrparvyinngyskdkkysvlyllhgiggsendwfegggranviadnliaegkikpliivtpntnaagp
giadgyenftkdllnslipyiesnysvytcdrehraiaglsmgggqsfnigltnldkfayigpisaapntypnerlfpdggkaareklkllfiacgtndsligfgqrvheyc
vanninhvywliqggghdfnvwkpglwnflqmadeagltrdgntpvptpspkpantrieaedydginsssieiigyppeggrgigyitsgdylyyksidfgngat
sfkakvanantsnielrlngpngtligtlsvkstgdwntyeeqtcsiskvtgindlylvfkgpvnidwftfgv*
13036序列(SEQ ID NO:101)
atggccgcctccctcccgaccatgccgccgtccggctacgaccaggtgcgcaacggcgtgccgcgcggccaggtggtgaacatctcctacttctccaccgccaccaa
ctccacccgcccggcccgcgtgtacctcccgccgggctactccaaggacaagaagtactccgtgctctacctcctccacgggcatcggcggctccgagaacgactggtt
cgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgggggcaaggtcaagccgctcatcatcgtgaccccgaacaccaacgccgccggcccg
gcatcgccgacggctacgagaacttcaccaaggacctcctcaactccctcatcccgtacatcgagtccaactactccgtgtacaccgaccgcgagcaccgcgccatcg
cggcctctctatgggcggcggccagtccttcaacatcggcctcaccacctcgacaagttcgcctacatcggcccgatctccgccctacccgaacga
gcgcctcttcccggacggcggaaggccgcccgcgagaagctcaagctcctcttcatcgcctgcggcaccaacgactccctcatcggcttcggccagcgcgtgcacg
agtactgcgtggccaacaacatcaaccacgtgtactggctcatccagggcggcggccacgacttcaacgtgtggaagccgggcctctggaacttcctccagatggccg
acgaggccggcctcacccgcgacggcaacaccccggtgccgaccccgtccccgaagccggccaacacccgcatcgaggccgaggactacgacggcatcaactcc
tcctccatcgagatcatcggcgtgccgccggagggcggccgcggcatcggctacatcacctccggcgactacctcgtgtacaagtccatcgacttcggcaacggcgcc
acctccttcaaggccaaggccaacgccaacacctccaacatcgagcttcgcctcaacggcccgaacggcaccctcatcggcaccctctccgtgaagtccaccgg
gactggaacacctacgaggagcagacctgctccatctccaaggtgaccggcatcaacgacctctacctcgtgttcaagggcccggtgaacatcgactggttcaccttcg
gcgtgtag
13036AA序列(SEQ ID NO:102)
maaslptmppsgydqvrngvprgqvvnisyfstatnstrparvylppgyskdkkyvlyllhgiggsendwfegggranviadnliaegkikpliivtpntnaagp
giadgyenftkdllnslipyiesnysvytdrehraiaglsmgggsfnigltnldkfayigpisaapntypnerlfpddggkaareklkllfiacgtndsligfgqrvheyc
vanninhvywliqggghdfnvwkpglwnflqmadeagltrdgntpvptpspkpantrieaedydginsssieiigvppeggrgigyitsgdylvyksidfgngat
sfkakvanantsnielrlngpngtligtlsvkstgdwntyeeqtcsiskkvtgindlylvfkgpvnidwftfgv*
13038序列(SEQ ID NO:103)
atgagggtgttgctcgttgccctcgctctcctggctctcgctgcgagcgccacctccatggccgcctccctcccgaccatgccgccgtccggctacgaccaggtgcgca
acggcgtgccgcgcggccaggtggtgaacatctcctacttctccaccgcccacccaactccacccgcccggcccgcgtgtacctcccgccgggtactccaaaggacaag
aagtactccgtgctctacctcctccacggcatcggcggctccgagaacgactggcgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgaggg
caagatcaagccgctcatcatcgtgaccccgaacaccaacgccgccggcccgggcatcgccgacggctacgagaacttcaccaaggacctcctcaactccctcatccc
gtacatcgagtccaactactccgtgtacaccgaccgcgagcaccgcgccatcgccggcctctctatgggcggcggccagtccttcaacatcggcctcaaccaacctcgac
aagttcgcctacatcggcccgatctccgccgccccgaacacctacccgaacgagcgcctcttcccggacggcggcaaggccgcccgcgagaagctcsagctcctctt
catcgcctgcggcaccaacgactccctcatcggcttcggccagcgcgtgcacgagtactgcgtggccaacaacatcaaccacgtgtactggctcatccagggcggcgg
ccacgacttcaacgtgtggaagccgggcctctggaacttcctccagatggccgacgaggccggcctcacccgcgacggcaacaccccggtgccgaccccgtccccg
aagccggccaacacccgcatcgaggccgaggactacgaacggcatcaactcctcctccatcgagatcatcggcgtgccgccggagggcggccgcggcatcggctac
atcacctccggcgactacctcgtgtacaagtccatcgacttcggcaacggcgccacctccttcaaggccaaggtggccaacgccaacacctccaacatcgagcttcgcc
tcaacggcccgaacggcaccctcatcggcaccctctccgtgaagtccaccggcgactggaacacctacgaggagcagacctgctccatctccaaggtgaccggcatc
aacgacctctacctcgtgttcaagggcccggtgaacatcgactggttcaccttcggcgtgtag
13038AA序列(SEQ ID NO:104)
mrvllvalallalaasatsmaaslptmppsgydqvrngvprgqvvnisyfstatnstrparvylppgyskdkkysvlyllhgiggsendwfeggmanviadnlia
gkikpliivtpntnaaggpgiadgyenftkdllnslipviesnysvytdrehraiaglsmgggqsfnigltnldkfayigpisaapntypnerlfpdggkaareklkllfi
cgmdsligfgqrvheycvanninhvywliqggghdfnvwkpglwnflqmadeagltrdgntpvptpspkpantrieaedydginsssieiigvppeggrgigyi
tsgdylvyksidfgngatsfkakvanantsnielrlngpngtligtlsvkstgdwntyeeqtcsiskvtgindlylvfkggpvnidwftfgv*
13039序列(SEQ ID NO:105)
atgctggcggctctggccacgtcgcagctcgtcgcaacgcgcgccggcctgggcgtcccggacgcmccacgttccgccgcggcgccgcgcagggcctgagggg
ggcccgggcgtcggcggcggcggacacgctcagcatgcggaccagcgcgcgcgcggcgcccaggcaccagcaccagcaggcgcgccgcggggccaggltcc
cgtcgctcgtcgtgtgcgccagcgccggcgccatggccgcctccctcccgaccatgccgccgtccggctacgaccaggtgcgcaacggcgtgccgcgcggcaggt
ggtgaacatctcctacttctccaccgccaccaactccacccgcccggcccgcgtgtacctcccgccgggctactccaaggacaagaaggtactccgtgctctcctcctcc
acggcatcggcggctccgagaacggactggttcgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgagggcaagatcaagccgctcatcatcgt
gaccccgaacaccaacgccgccggcccgggcatcgccgacggctacgagaacttcaccaaggacctcctcaactccctcatcccgtacatcgagtccaactactccgt
gtacaccgaccgcgagcaccgcgccatcgccggcctctctatgggcggcggccagtccttcaacatcggcctcaccaacctcgacaagttcgcctacatcggcccgat
ctccgccgccccgaacacctacccgaacgagcgcctcttcccggacggcggcaaggccgcccgcgagaagctcgagctcctcttcatcgcctgcggcaccacgact
ccctcatcggcttcggccagcgcgtgcacgagtactgcgtggccaacaacatcaaccacgtgtactggctcatccagggcggcggccacgacttcaacgtgtggaagc
cgggcctctggaacttcctccagatggccgacgaggccggcctcacccgcgacggcaacaccccggtgccgaccccgtccccgaagccggccaacacccgcatcg
aggccgaggactacgacggcatcaactcctcctccatcgagatcatcggcgtgccgccggagggcggccgcggcgtcggctacatcacctccggcgactacctcgtgg
tacaagtccatcgacttcggcaacggcgccacctccttcaaggccaaggtggccaacgccagcacctccaacatcgagcttcgcctcaacgggccgaacggcaccctc
atcggcaccctctccgtgaagtccaccggcgactggaacacctacgaggagcagacctgctccatctccaaggtgaccggcatcaacgacctctacctcgtgttcaagg
gcccggtgaacatcgactggttcaccttcggcgtgtag
13039AA序列(SEQ ID NO:106)
mlaalatsqlvatraglgvpdastfrrgaaqglrgarasaaadtlsrrrtsaraaprhqhqqarrgarfpslvvcasagamaaslptnppsgvdqvrngvprgqvvni
syfstatnshparvylppgyskdkkysvlyllhgiggsendwfeggggranwadnliaegkikpliitpntmaaggpgiadgyenftkdllmlipyiesnysvytdre
hraiaglsmgggqsfinigltnldkfayigpisaapntypnerlfpdggkaareklkllfiacgtnddigfgqrvheycvanninhvywliqggghdfnvwkkpglw
nflqmadeagltrdgntpvptpspkpantrieaedydginsssieiigvppeggrgigyitsgdylvyksidfgngatsfkakvanantsnielrlmgnngtligtlsvk
stgdwntyeeqtcsiskvtgindlylvfkgpvnidwftfgv*
13347序列(SEQ ID NO:107)
atgagggtgttgctcgttgccctcgctctcctggctctcgctgcgagcgccacctccatggccgcctccctcccgaccatgccgccgtccggcta1cgaccaggtgcgca
acggcgtgccgcgcggccaggtggtgaacatctcctacltctccaccgccaccaactccacccgcccggccgcgtgtacctcccgccgggctactccaaggacaag
aagtactccgtgctctacctcctccacggcatcggcggclccgagaacgactggttcgagggcggcggccgcgccaacgtgatcgccgacaacctcatcgccgaggg
caagatcaagccgctcatcatcgtgaccccgaacaccaacgccgccggcccgggcatcgccgacggctacgagaacttcaccaaggacctcctcaactccctcatccc
gtacatcgagtccaactactccglgtacgccgaccgcgagcaccgcgccatcgccggcctctctatgggcggcggcccagtccttcaacatcggcctcaccaacctcgac
aagttcgcctacatcggcccgatctccgccgccccgaacacctacccgaaacgagcgcctcttcccggacggcggcaaggccgcccgcgagaagctcaagctcctct
catcgcctgcggcaccaacgactccctcatcggcttcggccagcgcgtgcacgagtactgcgtggccaacacatcaaccacgtgtactggctcatccagggcggcgg
ccacggacttcaacgtgtggaagccgggcctctgggaacttcctccagatgggccgacggggccggcctcacccgcggcggcaacaccccggtgccgaccccgtccccg
agccggccaaacacccgcacgaggccgaggactacgacggcatcaactcctcctccatcgagatcatcggcgtgccgccggagggcggccgcggcatcggctac
atcacctccgcgcgactacctcgtgtacaagtccatcgacttcggcaacggcgccacctccttcaaggccaaggtggccaacgccaacacctccaacatcgagcttcgcc
tcaacggcccgaacggcaccctcatcggcaccctctccgtgaagtccaccggcgactggaacacctacgaggagcagacctgctccatctccaaggtgaccggcatc
aacgacctctacctcgtgttcaagggcccggtgaacatcgactggttcaccttcggcgtgtccgagaaggacgaactctag
13347AA序列(SEQ ID NO:108)
mrvllvalallalaasatsmaaslptmppsgydqvrngvprgqvvnisyfstatnstrparvylppgyskdkkysvlyllhgiggsendwfeggranviadnliae
gkikpliivtpntnaagpgiadgyenftkdllnslinyiesnysvytdrehraiaglsmgggqsfnigltnldkfayigpisaapntypperlfpdggkaareklkllfia
cgtndsligfgqrvheycvanninhvywliqggghdfnvwkpglwnflqmadeagltrdgnwpvptpspkpantrieaedydginsssieiigvppeggrgigyi
tsgdylvyksidfgngatsfkakvanantsnielrlngpngtligtlsvkstgdwntyeeqtcsiskvtgindlyvfkgpvnidwfgvsekdel*
实施例53
阿魏酸酯酶对玉米纤维的水解降解
玉米纤维是玉米湿磨和干磨的主要副产品。该纤维成分主要由产生自种子的果皮(pericarp)(壳)和糊粉层的粗纤维以及较小一部分的来自胚乳细胞壁的细纤维组成。阿魏酸,一种羟基肉桂酸,以高浓度存在于谷物谷粒的细胞壁中,导致细胞壁的木质素、半纤维素和纤维素成分交联。酶促降解阿魏酸交联是水解玉米纤维的一个重要步骤,其可以导致其它水解酶的进一步酶促降解的可达性。
阿魏酸酯酶活性试验
在大肠杆菌中表达阿魏酸酯酶FAE-1(来自嗜热纤维梭状芽孢秆菌(C.thermocellum)的玉米优化型合成基因)。收获细胞并-80℃贮存过夜。将收获的细菌悬浮在50mM Tris缓冲液pH7.5中。加入溶菌酶至200μg/ml终浓度,在轻柔振摇下室温温育样品10分钟。4℃以4000rpm离心样品15分钟。离心后,将上清液转移至50mL圆锥管,放在70℃水浴中30分钟。然后4000rpm离心样品15分钟,将澄清的上清液转移至圆锥管(B1um等,J Bacteriology,2000年3月,pg1346-1351)。
如Mastihubova等(2002)Analytical Biochemistry309:96-101所述,使用阿魏酸4-甲基伞形酮酰基酯(4-methylumbelliferylferulate),检查重组FAE-1的活性。将重组蛋白质FAE-1(104-3)稀释10、100和1000倍进行检测。活性试验结果显示在图22中。
制备玉米种子纤维
将黄色马齿形玉米#2籽粒在2000ppm偏亚硫酸氢钠(Aldrich)中50℃浸渍48小时,以分离玉米果皮粗纤维。将籽粒与水以等分混合,在具有叶片的Waring实验室重型搅拌器中反向搅拌。搅拌器使用可调自耦变压器(Staco Energy)以50%的电压输出控制2分钟。在标准的测试筛#7(Fisher scientific)上用自来水洗涤搅拌后的材料,以从淀粉级分中分离粗纤维。通过在4L烧杯使纤维漂离胚胎,分离粗纤维和胚胎。然后将纤维浸泡在乙醇中,之后在真空炉(Precision)中60℃干燥过夜。来源于玉米籽粒果皮的玉米粗纤维使用装备有磨机进料器的实验室磨机3100碾磨至0.5mm粒径。
玉米纤维水解试验
以30mg/5ml缓冲液,将粗纤维(CF)悬浮在50mM柠檬酸-磷酸缓冲液pH 5.2中。涡旋此CF原液,并转移至40ml定型贮液器(Beckman,Cat.No.372790)。充分地混合溶液,然后将100μl转移至96孔板(CorningInc.,Cat.No.9017,聚苯乙烯,平底)。以1-10μl/孔加入酶并使用缓冲液调节终体积至110μl。CF背景对照仅含有10μl缓冲液。用铝箔密封板子,37℃持续振摇下温育18小时。4000rpm离心板子15分钟。将1-10μl CF上清液转移至预先加载了100μl BCA试剂(BCA试剂:试剂A(Pierce,Prod.#23223)、试剂 B(Pierce,Prod.#23224))的96孔板。将终体积调整至110μl。用铝箔密封板子,85℃放置30分钟。85℃温育后,板子以2500rpm离心5分钟。读取(MolecularDevices,Spectramax Plus)562nm吸光度。样品使用D-葡萄糖和D-木糖(Sigma)校正曲线定量。试验结果以释放的总糖(sugar)报道。
在玉米种子纤维水解试验中测定通过阿魏酸酯酶释放的总糖
从重组FAE-1纤维水解试验得到的结果显示总还原糖不增加(数据未显示)。由于文献中已经报道过仅在联合FAE使用其它水解酶时才可以检测到总还原糖的增加(Yu等,J.Agric.Food Chem.2003,51,218-223),故这些结果并非是意料之外的。图23显示向玉米纤维上培养的真菌上清液添加FAE-2,显示出总还原糖的增加。这提示FAE确实在玉米纤维水解中起重要作用。
图23显示玉米纤维水解试验结果,说明向真菌上清液(FS9)添加FAE-2可以增加自玉米纤维释放的总还原糖。
分析通过FAE-1自玉米种子纤维释放的阿魏酸
按照稍有修饰的Walfron和Parr(1996)(Waldron,KW,ParrAJ1996 Vol 7,305-312页,Phytochem Anal)中所述方法,通过跟踪阿魏酸的释放,检查FAE对玉米纤维的活性。将来源于玉米籽粒果皮的玉米粗纤维用装备有磨机进料器3170的实验室磨机3100(Perteninstruments)碾磨至0.5mm粒径,并以10mg/ml用作底物。在24孔Becton Dickenson MultiWellTM中实施1ml试验。在有和无重组FAE存在下,在50mM柠檬酸磷酸pH5.4中50℃以110rpm温育底物18小时。温育期之后,13,000rpm离心样品,之后乙酸乙酯提取。所用的所有溶剂和酸均来自Fisher Scientific。用0.5ml冰醋酸酸化0.8ml上清液,用等体积的乙酸乙酯萃取三次。合并有机级分,利用Speed vac于40℃干燥。然后使用100μl甲醇悬浮样品用于HPLC分析。
按如下实施HPLC色谱。在HPLC分析中使用阿魏酸(ICNBiomedicals)作为标准品。使用Hewlett Packard系列1100 HPLC系统实施HPLC分析。该方法使用C18完全封端的反向柱(XterraRp18,150mm×3.9mm内径,5μm粒径),该柱子在40℃以1.0ml min-1运转。使用32分钟25至70%B的梯度(溶剂A:H2O,0.01%b TFA;溶剂B:MeCN,0.0075%)洗脱阿魏酸。
如图24中所示,当使用10或100μl FAE-1处理时,从玉米纤维释放的FA比对照高2-3倍。这些结果清楚地说明,FAE-1能够水解玉米纤维。
实施例54
表达葡糖淀粉酶和淀粉酶的玉米在发酵中的功能
该实施例阐明,玉米表达的酶可以支持在不添加酶且不蒸煮玉米浆的情况下发酵玉米浆中的淀粉。含有米根霉葡糖淀粉酶(ROGA)(SEQID NO:49)玉米籽粒按实施例32所述制备。含有大麦低pI的α-淀粉酶(AMYI)(SEQ ID NO:88)的玉米籽粒按照实施例46中所述制备。在此实施例中使用以下材料:
黑曲霉葡糖淀粉酶(ANGA)购自Sigma。
根霉属物种的葡糖淀粉酶(RxGA)以干晶体粉末形式购自Wako,并在10mM乙酸钠pH5.2、5mM CaCl2中配制成10mg/ml。
MAMYI,微生物生产的AMYI,在10mM乙酸钠pH5.2、5mM CaCl2中配制为大约0.25mg/ml。
酵母是酿酒酵母(Saccharomyces cereviceae)。
YE是酵母提取物在水中的无菌5%溶液。
酵母起子在总体积300ml的水中含有50g麦芽糖糊精、1.5g酵母提取物、0.2mg ZnSO4。在制备后通过高压灭菌消毒培养基。冷却至室温后,加入1ml四环素(10mg/ml,在乙醇中)、100μl AMG300葡糖淀粉酶和155mg活性干酵母。然后30℃振摇混合物22h。此过夜的酵母培养物以1/10用水稀释,并按照Current Protocols in MolecularBiology中所述,测定A600以确定酵母数量。
ROGA面粉:将来自几个被证实具有活性葡糖淀粉酶的T0株系的籽粒汇合。在Kleco中碾磨这些种子,并将所有的面粉汇合在一起。
AMYI面粉:将来自表达AMYI的T0玉米的籽粒汇合,并按以上所述碾磨。
对照面粉:以和ROGA表达玉米相同的方式,碾磨具有相似遗传背景的籽粒。
在无菌试管中制备接种混合物;其含有每1.65ml:酵母细胞(1×107)、酵母提取物(8.6mg)、四环素(55μg)。按每克面粉1.65ml加入每个发酵试管。
发酵预备:以1.8g/管称取面粉,放入配衡17×100mm无菌聚丙烯管中。加入50μl 0.9M H2SO4以便在发酵前使最终pH达到5。每管加入接种混合物(2.1ml)以及如下所述的RXGA、AMYI-P和淀粉酶脱盐缓冲液。基于每种面粉的含湿量调整缓冲液的量,以便每个管子中的总固体含量不变。彻底混合管子,称重并放入塑料袋,30℃温育。
表 21
               面粉 接种 微生物酶  淀粉酶脱盐缓冲液
    试管     对照     ROGA     AMYl     Mix   RXGA  AMYl-P
    g     g     g     ml   ml  ml  ml
    A     1.8     2.1   0  0
    B     1.8     2.1   0.036  0  1
    C     1.8     2.1   0.036  1  0
    D     1.8     2.1   0  1  0.036
    E     1.6     0.2     2.1   0.036  0  1
    F     0.2     1.6     2.1  1
    G     0.2     1.6     2.1   0  1  0
    H     0     1.6     0.2     2.1  0  1
在67小时时程中不时称重发酵管。重量的损失对应于发酵过程中放出的CO2。样品的乙醇含量在发酵67小时后利用DCL乙醇试验方法确定。该试剂盒(目录号#229-29)购自Diagnostic Chemicals Limited,Charlottetown,PE,加拿大,DIE 1B0。从每个发酵管中取样品(10μl)一式三份,稀释在990μl水中。将10μl稀释的样品与试验缓冲液/ADH-NAD试剂的12.5/l混合物1.25ml混合。稀释标准品(0、5、10、15和20%v/v ETOH),平行地进行试验。37℃温育反应物10分钟,然后读取A340。标准品按一式两份制备,来自每个发酵的样品以一式三份制备(包括最初的稀释)。如下表中详细描述的,样品重量随时间而变化。重量的损失表示为0时间的初始样品重量的百分数。
表 22
                          时间(h)
  0   18   24    42    48    67
    样品   面粉组成                             %重量损失
    A   对照   0.00   8.09   9.38    12.96    13.83    16.85
    B   对照+RXGA   0.00   11.48   14.20    21.79    23.83    24.63
    C   对照+RXGA+MAMYI   0.00   17.90   23.27    36.48    39.07    47.59
    D   对照+MAMYI   0.00   13.70   17.72    28.27    30.80    38.27
    E   对照+RXGA+AMYI面粉   0.00   16.85   21.60    33.95    36.98    45.74
    F   R0GA面粉   0.00   9.81   11.74    16.96    18.39    23.17
    G   R0GA面粉+MAMYI   0.00   15.53   19.69    29.75    32.11    39.94
    H   R0GA面粉+AMYI面粉   0.00   13.35   16.27    23.60    25.53    31.68
这些数据说明,玉米中表达的ROGA酶相对于无酶对照可以增加发酵速度。这也验证了前面说明玉米籽粒中表达的AMYI酶是玉米中淀粉发酵的有利激活剂的数据。
以下详细给出了乙醇含量。
表 23
 样品  面粉组成  ETOH%v/v   标准差
 A  对照  2.09   0.08
 B  对照+RXGA  7.97   0.18
 C  对照+RXGA+MAMYI  13.47   0.27
 D  对照+MAMYI  11.26   0.12
 E  对照+RXGA+AMYI面粉  12.28   0.08
 F  ROGA面粉  3.55   0.05
 G  ROGA面粉+MAMYI  11.29   0.18
 H  ROGA面粉+AMYI面粉  8.58   0.13
这些数据也说明,在玉米中表达米根霉葡糖淀粉酶可以利于玉米中的淀粉的发酵增加。类似地,在玉米中表达大麦淀粉酶也可以使玉米淀粉在不添加外源酶的情况下更能够被发酵。
实施例55
纤维二糖水解酶I
基于公布的数据库序列(登录号#E00389),通过RT-PCR扩增和克隆Trichoderma reesei纤维二糖水解酶I(CBHI)基因。利用SignalP程序分析此cDNA序列是否存在信号序列,该程序预测到17个氨基酸的信号序列。如序列(SEQ ID NO:79)中所示,通过PCR将编码此信号序列的DNA序列替换成ATG。此cDNA序列用于制备随后的构建体。通过替换成该基因的玉米优化型版本(SEQ ID NO:93),还制备其它构建体。
实施例56
纤维二糖水解酶II
基于公布的数据库序列(登录号#M55080),通过RT-PCR扩增和克隆Trichoderma reesei纤维二糖水解酶II(CBH II)基因。利用SignalP程序分析此cDNA序列是否存在信号序列,该程序预测到18个氨基酸的信号序列。如序列(SEQ ID NO:81)中所示,通过PCR将编码此信号序列的DNA序列替换成ATG。此cDNA序列用于制备随后的构建体。通过替换成该基因的玉米优化型版本(SEQ ID NO:94),还制备其它构建体。
实施例57
构建用于Trichoderma reesii纤维二糖水解酶I和纤维二糖水解酶II的转化载体
在实施例55中描述了无天然N端信号序列的Trichoderma reesii纤维二糖水解酶I(cbhi)cDNA的克隆。按如下所述,使用各种引导信号,构建表达盒,以在玉米胚乳中表达Trichoderma reesii纤维二糖水解酶I cDNA:
质粒12392包含克隆在用于在细胞质中实现表达以及在胚乳中实现特异表达的γ玉米醇溶蛋白启动子之后的Trichoderma reesiicbhi cDNA。
质粒12391包含按实施例1中所述与Trichoderma reesii cbhicDNA融合的玉米γ-玉米醇溶蛋白N端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),以便靶向内质网和在质外体中分泌(Torrent等,1997)。将融合物克隆在用于在胚乳中实现特异表达的γ玉米醇溶蛋白启动子之后。
质粒12392包含与C端添加了序列KDEL的Trichoderma reesiicbhi cDNA融合的γ玉米醇溶蛋白N端信号序列,以便靶向和滞留在内质网(ER)中(Munro和Pelham,1987)。将融合物克隆在用于在胚乳中实现特异表达的玉米γ玉米醇溶蛋白启动子之后。
质粒12656包含与Trichoderma reesii cbhi cDNA融合的造粉体引导肽,以便靶向造粉体(Torrent等,1997)。将融合物克隆在用于在胚乳中实现特异表达的γ玉米醇溶蛋白启动子之后。
将所有表达盒移入二元载体(pNOV2117)中,以便通过农杆菌感染转染至玉米中。该二元载体含有允许使用甘露糖选择转基因细胞的磷酸甘露糖异构酶(PMI)基因。使转化的玉米植物自花授粉或远交,收集种子用于分析。
完全按照针对Trichoderma reesii cbhi cDNA描述的方式,使用与Trichoderma reesii纤维二糖水解酶II(cbhii)cDNA融合的上述引导信号,制备了其它的构建体(质粒12652、12653、12654和12655)。这些融合物被克隆在用于在胚乳中实现特异表达的玉米Q蛋白启动子(50Kdγ玉米醇溶蛋白)之后,并按上述方法转化至玉米中。使转化的玉米植物自花授粉或远交,收集种子用于分析。
可以通过使分别表达各单个酶的植物杂交,或者通过将几个表达盒克隆在相同二元载体中实现共转化,而产生酶的组合。
实施例58
在玉米中表达cbhi
从转化了质粒12390、12391或12392的自花授粉玉米植物,获得T1种子。12390构建体使CbhI的表达靶向胚乳的内质网中,12391构建体使CbhI的表达靶向胚乳的质外体中,12392构建体使CbhI的表达靶向胚乳的细胞质中。
从玉米面粉提取和检测CbhI:根据已建立的方案,在山羊中产生CbhI和CbhII的多克隆抗体。通过在Autogizer研磨机中研磨CbhI转基因种子,自这些种子获得面粉。将大约50mg面粉悬浮在0.5ml20mM NaPO4缓冲液(pH7.4)、150mM NaCl中,之后不停振摇下RT温育15分钟。然后10,000×g离心该温育混合物10分钟。使用上清液作为酶的来源。将30μl该提取物加载至4-12%NuPAGE凝胶(Invitrogen)上,在NuPAGE MES电泳缓冲液(Invitrogen)中分离。将蛋白质印迹在硝化纤维素膜上,使用上述特异抗体,之后使用碱性磷酸酶缀合的兔抗山羊IgG(H+L),遵循已经建立的操作方案实施Western印迹。通过膜与来自Moss Inc.的即用型BCIP/MBT(plus)底物一起温育,检测碱性磷酸酶活性。
对来自质粒12390转化的不同事件的T1种子实施Western印迹分析。将CbhI蛋白质的表达与非转基因对照比较,并在多个事件中对其进行检测。
基本上按照实施例49中所述,使用表达Cbhi的转基因种子进行碎玉米试验。测定从转基因种子回收的淀粉,结果显示在表24中。
表 24
 株系3-非表达对照  株系4-表达CBHI
 条件  淀粉  (mg)
 400ppm SO2-无菠萝蛋白酶  40.2  78.1
 400ppm SO2-加菠萝蛋白酶  48.1  118.7
 2000ppm SO2-无菠萝蛋白酶  47.5  73.1
 2000ppm SO2-加菠萝蛋白酶  49.2  109
实施例59
制备内切葡聚糖酶I构建体
基于公布的数据库序列(登录号#M15665;Penttila等,1986),通过PCR扩增和克隆Trichoderma reesii内切葡聚糖酶I(EGLI)基因。由于仅仅获得基因组序列,故通过使用重叠PCR除去2个内含子,从基因组序列产生cDNA。所得cDNA使用Signal程序分析是否存在信号序列,该程序预测到一个22个氨基酸的信号序列。如序列(SEQ ID NO:83)中所示,通过PCR将编码该信号序列的DNA序列替换成ATG。如下述,该cDNA序列用于制备随后的构建体。
重叠PCR(overlap PCR)
重叠PCR是用于将两个或多个PCR产物的互补末端融合在一起的技术(Ho等,1989),其可以用于改变碱基对(bp)、添加bp或缺失bp。在期望的bp改变的位点,制备正向和反向诱变引物(Mut-F和Mut-R),所述引物含有期望的变化以及在所述变化的任一侧的各15bp序列。例如,为了除去内含子,引物由与外显子2的头15bp融合的外显子1的最后15bp组成。还制备与待扩增的序列的末端退火的引物,例如ATG和STOP密码子引物。在独立的反应中使用ATG/Mut-R引物对和Mut-F/STOP引物对进行产物的PCR扩增。凝胶纯化产物,在PCR中不添加引物的情况下将这些产物融合在一起。在凝胶上分离融合反应物,凝胶纯化正确大小的条带,并克隆。可以通过添加其它诱变引物对,同时实现多个变化。
EGLI植物表达构建体
按如下所述,制备表达盒以在玉米胚乳中表达Trichodermareesei ELGI cDNA:
13025包含克隆在用于细胞质定位和在胚乳中特异性表达的玉米γ玉米醇溶蛋白启动子之后的T.reesei EGLI基因。
13026包含与T.reesei EGLI基因融合的玉米γ-玉米醇溶蛋白N端信号肽(MRVLLVALALLALAASATS),以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
13027包含与C端添加了序列KDEL的T.reesei EGLI基因融合的玉米γ-玉米醇溶蛋白N端信号肽,以便靶向和滞留在内质网中。该融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
13028包含与T.reesei EGLI基因融合的玉米颗粒结合型淀粉合酶I(GBSSI)N端信号肽(N端77个氨基酸),以便靶向造粉体的内腔。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
13029包含与C端添加了玉米6BSSI基因的淀粉结合域(C端301个氨基酸)的T.reesei EGLI基因融合的玉米GBSSIN端信号肽,以便靶向淀粉粒。该融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
使用ELGI的玉米优化型版本(SEQ ID NO:95),还可以制备其它表达盒。
EGLI酶试验
使用麦芽β-葡聚糖酶试验试剂盒(Cat# K-MBGL)(MegazymeInternational Ireland Ltd.),在转基因玉米中测定EGLI酶活性。按实施例53中所述,在玉米纤维水解试验中,检查EGLI表达者的酶促活性。
实施例60
β-葡糖苷酶2
基于序列登录号#AB003110(Takashima等,1999),通过RT-PCR扩增和克隆Trichoderma reesei的β-葡糖苷酶2(BGL2)基因。
BGL2植物表达构建体
按如下制备表达盒以在玉米胚乳中表达Trichoderma reesei的BGL2 cDNA(SEQ ID NO:89):
13030包含克隆在用于细胞质定位和在胚乳中特异表达的玉米γ-玉米醇溶蛋白启动子之后的T.reesei BGL2基因。
13031包含与T.reesei BGL2基因融合的玉米γ-玉米醇溶蛋白N端信号肽(MRVLLVALALLALAASATS),以便靶向内质网和在质外体中分泌。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
13032包含与C端添加了序列KDEL的T.reesei BGL2基因融合的玉米γ-玉米醇溶蛋白N端信号肽,以便靶向和滞留在内质网中。该融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
13033包含与T.reesei BGL2基因融合的玉米颗粒结合型淀粉合酶I(GBSSI)N端信号肽(N端77个氨基酸),以便靶向造粉体的内腔。融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
13034包含与C端添加了玉米GBSSI基因的淀粉结合域(C端301个氨基酸)的T.reesei BGL2基因融合的玉米GBSSI N端信号肽,以便靶向淀粉粒。该融合物被克隆在用于在胚乳中实现特异表达的玉米γ-玉米醇溶蛋白启动子之后。
替换BGL2的玉米优化型版本(SEQ ID NO:96),还可以制备其它表达盒。
将所有表达盒插入二元载体pNOV2117,以便通过农杆菌感染转化入玉米。该二元载体含有磷酸甘露糖异构酶(PMI)基因,该基因允许用甘露糖选择转基因细胞。转化的玉米植物自交或远交,并收集种子用于分析。
BGL2酶试验
使用从Bauer和Kelly(Bguer,M.W.和Kelly,R.M.,1998,来自Pyrococcus furiosus和Agrobacterium faecalis的β-葡糖苷酶家族1具有共同的催化机制,Biochemistry37:17170-17178)改良的方案,在转基因玉米中测定BGL2酶活性。可以修饰该方案以在37℃而非100℃温育样品。在纤维水解试验中,检查BGL2表达者的酶促活性。
实施例61
β-葡糖苷酶D
基于公布的数据库序列(登录号#AY281378;Foreman等,2003),通过PCR扩增和克隆Trichoderma reesei的β-葡糖苷酶D(CEL3D)基因。由于仅仅获得基因组序列,故通过使用如实施例58所述的重叠PCR除去2个内含子,而从该基因组序列产生cDNA。所得cDNA(SEQ IDNO:91)可用于随后的构建体。也可以将玉米优化型版本(SEQ ID NO:97)用于构建体。
按照实施例60中针对BGL2所述的方法,通过用CEL3D替换BGL2,可以产生植物构建体并可以实施β-葡糖苷酶试验。
实施例62
脂肪酶
使用来自登录号#D85895、AF04488和AF04489(Tsuchiya等,1996;Yu等,2003)的序列以及实施例59和60中所述方法学,产生编码脂肪酶的cDNA。
使用荧光脂肪酶试验试剂盒(Cat #M0621)(Marker GeneTechnologies,Inc.),在转基因玉米中测定脂肪酶活性。也可以使用荧光底物1,2-二油酰基-3-(芘-1-基)癸酰基-rac甘油(M0258)(也来自Marker Gene Technologies,Inc.),体内测定脂肪酶活性。
实施例63
在稻中表达植酸酶
载体11267和11268包含编码Nov9x植酸酶的二元载体。在两个载体中Nov9x植酸酶基因的表达处于稻的谷蛋白-1启动子(SEQ ID NO:67)的控制之下。载体11267和11268来源于pNOV2117。
载体11267中Nov9x植酸酶表达盒包含稻的谷蛋白-1启动子、具有质外体引导信号的Nov9x植酸酶基因、PEPC内含子和35S终止子。载体11267中的Nov9x植酸酶编码序列的产物显示在SEQ ID NO:110中。
载体11268中Nov9x植酸酶表达盒包含稻的谷蛋白-1启动子、具有ER滞留信号的Nov9x植酸酶基因(SEQ ID NO:111)、PEPC内含子和35S终止子。载体11268中的Nov9x植酸酶编码序列的产物显示在SEQ ID NO:112中。
具有质外体引导DNA序列的11267 Nov9x植酸酶(SEQ ID NO:109)。下划线处为翻译起始和终止密码子。编码27kDγ-玉米醇溶蛋白信号序列的序列为粗体。
atgagggtgttgctcgttgccctcgctctcctggctctcgctgcgagcgccaccagcgctgcgcagtccgagccggagctgaagctgg
agtccgtggtgatcgtgtcccgccacggcgtgcgcgccccgaccaaggccacccagctcatgcaggacgtgaccccggacgcctggcc
gacctggccggtgaagctcggcgagctgaccccgcgcggcggcgagctgatcgcctacctcggccactactggcgccagcgcctcgtg
gccgacggcctcctcccgaagtgcggctgcccgcagtccggccaggtggccatcatcgccgacgtggacgagcgcacccgcaagacc
ggcgaggccttcgccgccggcctcgccccggactgcgccatcaccgtgcacacccaggccgacacctcctccccggacccgctcttc aa
cccgctcaagaccggcgtgtgccagctcgacaacgccaacgtgaccgacgccatcctggagcgcgccggcggctccatcgccgacttc
accggccactaccagaccgccttccgcgagctggagcgcgtgctcaacttcccgcagtccaacctctgcctcaagcgcgagaagcagga
cgagtcctgctccctcacccaggccctcccgtccgagctgaaggtgtccgccgactgcgtgtccctcaccggcgccgtgtccctcgcctcc
atgctcaccgaaatcttcctcctccagcaggcccagggcatgccggagccgggctggggccgcatcaccgactcccaccagtggaacac
cctcctctccctccacaacgcccagttcgacctcctccagcgcaccccggaggtggcccgctcccgcgccaccccgctcctcgacctcatc
aagaccgccctcaccccgcacccgccgcagaagcaggcctacggcgtgaccctcccgacctccgtgctcttcatcgccggccacgacac
caacctcgccaacctcggcggcgccctggagctgaactggaccctcccgggccagccggacaacaccccgccgggcggcgagctggt
gttcgagcgctggcgccgcctctccgacaactcccagtggattcaggtgtccctcgtgttccagaccctccagcagatgcgcgacaagacc
ccgctctccctcaacaccccgccgggcgaggtgaagctcaccctcgccggctgcgaggagcgcaacgcccagggcatgtgctccctcg
ccggcttcacccagatcgtgaacgaggcccgcatcccggcctgctccctctaa
具有质外体引导基因产物的11267 Nov9x植酸酶(SEQ ID NO:110)。27kDγ-玉米醇溶蛋白信号序列为粗体。
mrvllvalallalaasatsaaqslkoelklesvvivsrhgvraptkatqlmqdvtpdawptwpvklgeltprggeliaylghywrqrlva
dgllpkcgcpqsgqvaiiadvdertrktgealaaglapdcaitvhtqadtsspdplfinplktgvcqldnanvtdaileraggsiadnghy
qtafrelervlnfpqsnlclkrekqdescsltqalpselkvsadcvsltgavslasmlteiflqqaqgmpepgwgritdshqwntllslhn
aqfdllqrtpevarsratplldliktaltphppqkqaygvtlptsvlfiaghdtnlanlggalelnwtlpgqpdntppggelvferwrrlsdn
sqwiqvslvfqtlqqmrdktplslntppgevkltlagceernaqgmcslagftqivnearipacsl
具有ER滞留DNA序列的11268 Nov9x植酸酶(SEQ ID NO:111)。编码27kDγ-玉米醇溶蛋白信号序列的序列为粗体。编码SEKDEL六肽ER滞留信号的序列加有下划线。
atgagggtgttgctcgttgccctcgctctcctggctctcgctgcgagcgccaccagcgctgcgcagtccgagccggagctgaagctgg
agtccgtggtgatcgtgtcccgccacggcgtgcgcgccccgaccaaggccacccagctcatgcaggacgtgaccccggacgcctggcc
gacctggccggtgaagctcggcgagctgaccccgcgcggcggcgagctgatcgcctacctcggccactactggcgccagcgcctcgtg
gccgacggcctcctcccgaagtgcggctgcccgcagtccggccaggtggccatcatcgccgacgtggacgagcgcacccgcaagacc
ggcgaggccttcgccgccggcctcgccccggactgcgccatcaccgtgcacacccaggccgacacctcctccccggacccgctcttcaa
cccgctcaagaccggcgtgtgccagctcgacaacgccaacgtgaccgacgccatcctggagcgcgccggcggctccatcgccgacttc
accggccactaccagaccgccttccgcgagctggagcgcgtgctcaacttcccgcagtccaacctctgcctcaagcgcgagaagcagga
cgagtcctgctccctcacccaggccctcccgtccgagctgaaggtgtccgccgactgcgtgtccctcaccggcgccgtgtccctcgcctcc
atgctcaccgaaatcttcctcctccagcaggcccagggcatgccggagccgggctggggccgcatcaccgactcccaccagtggaacac
cctcctctccctccacaacgcccagttcgacctcctccagcgcaccccggaggtggcccgctcccgcgccaccccgctcctcgacctcatc
aagaccgccctcaccccgcacccgccgcagaagcaggcctacggcgtgaccctcccgacctccgtgctcttcatcgccggccacgacac
caacctcgccaacctcggcggcgccctggagctgaactggaccctcccgggccagccggacaacaccccgccgggcggcgagctggt
gttcgagcgctggcgccgcctctccgacaactcccagtggattcaggtgtccctcgtgttccagaccctccagcagatgcgcgacaagacc
ccgctctccctcaacaccccgccgggcgaggtgaagctcaccctcgccggctgcgaggagcgcaacgcccagggcatgtgctccctcg
ccggcttcacccagatcgtgaacgaggcccgcatcccggcctgctccctc tccgagaaggacgagctgtaa
具有ER滞留的11268 Nov9x植酸酶基因产物(SEQ ID NO:112)。27kDγ-玉米醇溶蛋白信号序列为粗体。ER滞留信号加有下划线。
mrvllvalallalaasatsaaqsepelklesvvivsrhgvraptkatqlmqdvtpdawptwpvklgeltprggeliaylghywrqrlva
dgllpkcgcpqsgqvaiiadvdertrktgeafaaglapdcaitvhtqadtsspdplfnplktgvcqldnanvtdaileraggsiadftghy
qtafrelervlnfpqsnlclkrekqdescsltqalpselkvsadcvsltgavslasmlteifllqqaqgmpepgwgritdshqwntllslhn
aqfdllqrtpevarsratplldliktaltphppqkqaygvtlptsvlfiaghdtnlanlggalelnwtlpgqpdntppggelvferwrrlsdn
snwinvslvfqtlqqmrdktplslntppgevkltlagceemaqgmncslagftqivnearipacsl sekdel
产生转基因稻植物
使用稻(Oryza sativa)产生转基因植物。各种稻栽培品种都可以使用(Hiei等,1994,Plant Journa l6:271-282;Dong等,1996,Molecular Breeding2:267-276;Hiei等,1997,Plant MolecularBiology,35:205-218)。此外,可以变化下述各种培养基成分的浓度或替换这些培养基成分。通过在MS-CIM培养基(MS基础盐,4.3g/升;B5维生素(200×),5ml/升;蔗糖,30g/升;脯氨酸,500mg/升;谷氨酰胺,500mg/升;酪蛋白水解物,300mg/升;2,4-D(1mg/ml),2ml/升;用1N KOH调节pH至5.8;Phytagel,3g/升)上培养,从成熟胚起动胚发生反应和/或建立培养物。接种处于培养反应的初始阶段的成熟胚或者已建立的培养系,将其与含有期望的载体构建体的农杆菌菌株LBA4404共培养。农杆菌自甘油贮存物出发在固体YPC培养基(100mg/L壮观霉素和任何其它适宜的抗生素)上28℃培养大约2天。在液体MS-CIM培养基中重悬农杆菌。将农杆菌培养物稀释至OD600等于0.2至0.3,加入乙酰丁香酮至200μM终浓度。用乙酰丁香酮诱导农杆菌,之后该溶液与稻培养物混合。为了接种,将培养物浸没在此细菌悬浮液中。除去液体细菌悬浮液,将接种后的培养物置于共培养培养基上,22℃孵育2天。然后将培养物转移至具有Ticarcillin(400mg/升)的MS-CIM培养基上,以抑制农杆菌生长。对于使用PMI选择标记基因(Reed等,In Vitro Cell.Dev.Biol.-Plant,37:127-132)的构建体,7天后将培养物转移至含有甘露糖作为碳水化合物的来源的选择培养基(具有2%甘露糖、300mg/升Ticarcillin的MS)上,并在暗处培养3至4周。然后将抗性集落转移至再生诱导培养基(不具有2,4-D、具有0.5mg/升IAA、1mg/升玉米素、200mg/升Ticarcillin、2%甘露糖和3%山梨糖醇的MS),在暗处培养14天。然后将增殖的集落转移至另一轮再生诱导培养基上,并移动至亮生长室。将再生的芽转移至GA7-1培养基(不带激素但具有2%山梨糖醇的MS)2周,然后在它们足够大并具有充足的根时移至温室。将植物移栽在温室的土壤中并栽培至成熟。
实施例64
分析表达Nov9x植酸酶的转基因稻种子
用于定量来自稻种子的Nov9x植酸酶的ELISA
通过ELISA分析转基因稻种子中表达的植酸酶的量。将1颗(1g)稻种子在Kleco种子研磨机中研磨成面粉。在实施例中针对Nov9x植酸酶活性试验描述的乙酸钠缓冲液中重悬50mg面粉,并按照免疫测定试验的要求进行稀释。Nov9x免疫测定试验是一种使用两种多克隆抗体检测植酸酶的定量三明治试验。兔抗体使用蛋白质A进行纯化,而山羊抗体使用在大肠杆菌包函体中产生的重组植酸酶(Nov9x)蛋白质进行免疫亲和纯化。使用这些高度特异的抗体,该试验可以测定转基因植物中皮克水平的植酸酶。该试验有三个基本部分。使用兔抗体将样品中的植酸酶蛋白质捕获在固相微量滴定板孔上。然后在固相抗体、植酸酶蛋白质和已经添加在孔中的二抗之间形成“三明治”。洗涤步骤(在此除去未结合的二抗)后,使用碱性磷酸酶标记的抗体检测结合的抗体。添加该酶的底物,并通过读取每孔的吸光度,测定颜色的显现。标准曲线使用4参数曲线拟合以绘制出浓度对吸光度的曲线图。
植酸酶活性试验
可以按照Engelen,A.J.等,J.AOAC.Inter.,84,269(2001)的方法,基于对植酸水解所释放的无机磷酸的估计,37℃测定植酸酶活性。一单位酶活性定义为在试验条件下每分钟释放1μmol无机磷酸的酶量。例如,可以通过与在补加有1mM CaCl2的250mM乙酸钠缓冲液pH5.5中将2.0ml酶制备物与4.0ml 9.1mM植酸钠在37℃温育60分钟,测定植酸酶活性。温育后,加入4.0ml由等份的10%(w/v)钼酸铵和0.235%(w/v)钒酸铵原液组成的颜色终止试剂,终止反应。离心除去沉淀,相对于一组磷酸标准品,通过分光光度法于415nm测定释放的磷酸。使用产生的磷酸标准曲线,通过外推从含有植酸酶的样品获得的A415nm吸光度值,计算植酸酶活性。
该操作方案可以按比例缩小以适应更小的体积,并且可以进行适应性调整以适合优选的容器。优选的容器包括玻璃试管和塑料微量板。将反应容器部分浸没在水浴中是在酶反应过程中维持恒定温度所必需的。
表 24
 转基因株系 μg植酸酶每g面粉* 植酸酶活性单位每克面粉**  通过蒸煮去壳的稻种子所释放的内源无机磷酸(μmol/g种子)  通过蒸煮经过去壳和碾米处理的稻种子所释放的内源无机磷酸(μmol/g种子)
 野生型 0 0  1.442  0.469
 1 510 916  1.934  0.840
 2 1518 2800  2.894  1.073
*通过三明治ELISA测定植酸酶μg数。
**通过上述的植酸酶活性检测法检测植酸酶活性。
在表达植酸酶的转基因稻的蒸煮过程中分析无机磷酸的释放
来自选定的稻转基因株系和对照野生型株系的两个1g种子样品,使用台式Kett TR200自动稻脱壳机去壳。然后一个样品在Kett稻碾米机(polisher)中进行30秒的碾米处理(polish)。向每一份样品加入两体积H2O,将管子浸在有水的烧杯中进行稻的蒸煮。将水煮沸,并保持在完全沸腾的煮沸状态10分钟。然后将“蒸煮的”稻种研磨成糊,用水使浆液的总体积达到6ml。15,000×g离心浆液10分钟,测定清澈的上清液中释放的内源性无机磷酸。对释放的磷酸的分析基于由钼酸盐和钒酸盐离子与无机磷酸络合引起的颜色形成而进行,按照实施例中针对植酸酶活性而描述的方法通过分光光度法在415nm实施测定。结果在表24中。
所有出版物、专利、专利申请均并入此处作为参考。尽管在前面的说明书中已经联系本发明的某些优选实施方案对本发明进行了描述,而且为了举例说明的目的阐述了许多细节,但是本领域技术人员明了,本发明可以允许其它的实施方案,并且可以对本文描述的某些细节进行相当大的改变而不偏离本发明的基本原则。
序列表
<110>Lanahan,Mike
<120>自加工植物和植物部分
<130>109846.317
<140>US 60/315,281
<141>2001-08-27
<160>60
<170>FastSEQ for Windows Version 4.0
<210>1
<211>436
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>1
Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala
 1               5                  10                  15
Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg
            20                  25                  30
Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile
        35                  40                  45
Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp
    50                  55                  60
Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val
65                  70                  75                  80
Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr
                85                  90                  95
Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His
            100                 105                 110
Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr
        115                 120                 125
Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr
    130                 135                     140
Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe
145                 150                 155                 160
Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp
                165                 170                 175
Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly
            180                 185                 190
Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val
        195                 200                 205
Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr
    210                 215                 220
Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly
225                 230                 235                 240
Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe
                245                 250                 255
Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly
            260                 265                 270
Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn
        275                 280                 285
His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile
    290             295                     300
Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu
305                 310                 315                 320
Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn
                325                 330                 335
Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met
            340                 345                 350
Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr
        355                 360                 365
Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys
    370                 375                 380
Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp
385                 390                 395                 400
Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro
                405                 410                 415
Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr
            420                 425                 430
Cys Gly Val Gly
        435
<210>2
<211>1308
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>2
atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac 60
gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac 120
gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg 180
atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg 240
gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac 300
ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg 360
aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac 420
accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc 480
ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg 540
caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac 600
gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg 660
gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc 720
gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac 780
atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc 840
aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg 900
tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag 960
tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc 1020
tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc 1080
tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg 1140
tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg 1200
gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc 1260
gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggc              1308
<210>3
<211>800
<212>PRT
<2l3>人工序列
<220>
<223>合成的
<400>3
Met Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe Thr Gly Glu
 1               5                  10                  15
Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met Asp Leu Thr
            20              25                      30
Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala Lys Asp Val
        35                  40                  45
Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala Glu Val Trp
    50                  55                      60
Ile Leu Gln Gly Val Glu Glu Ile phe Tyr Glu Lys Pro Asp Thr Ser
65                  70                  75                  80
Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val Ile Glu Ala
                85                  90                  95
Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu Phe Lys Val
            100                 105                 110
Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu Lys Ala Asp
        115                 120                 125
Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val Leu Ser Glu
    130                 135                 140
Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu Ile Ile Glu
145                 150                 155                 160
Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu Asp Asp Tyr
                165                 170                 175
Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu Lys Thr Ile
            180                 185                 190
Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val Leu Leu Phe
        195                 200                 205
Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn Met Glu Tyr
    210                 215                 220
Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp Leu Asp Gly
225                 230                 235                 240
Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile Arg Thr Thr
                245                 250                 255
Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala ASn Asn Gln Glu Ser Ala
            260                 265                 270
Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu Asn Asp Arg
        275                 280                 285
Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr Glu Ile His
    290                 295                 300
Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys Asn Lys Gly
305                 310                 315                 320
Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Gly Pro Gly Gly Val
                325                 330                 335
Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr His Val His
            340                 345                 350
Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu Asp Lys Asp
        355                 360                 365
Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu Phe Met Val
    370                 375                 380
Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His Thr Arg Ile
385                 390                 395                 400
Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His Gly Ile Gly
                405                 410                 415
Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile Gly Glu Leu
            420                 425                 430
Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg Ile Asp Lys
        435                 440                 445
Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val Ile Ala Ser
    450                 455                 460
Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val Thr Tyr Trp
465                 470                 475                 480
Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln Met Gly Leu
                485                 490                 495
Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu His Lys Ile
            500                 505                 510
Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly Trp Gly Ala
        515                 520                 525
Pro Ile Arg Phe Gly Lys Ser Asp Val Ala gly Thr His Val Ala Ala
    530                 535                 540
Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val Phe Asn Pro
545                 550                 555                 560
Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu Thr Lys Ile
                565                 570                 575
Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys Leu Ile Lys
            580                 585                 90
Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala Ala Cys His
        595                 600                     605
Asp Asn His Thr Leu Trp Asp Lys Ash Tyr Leu Ala Ala Lys Ala Asp
    610                 615                     620
Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala Gln Lys Leu
625                 630                 635                 640
Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe Leu His Gly
                645                 650                 655
Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn Ser Tyr Asn
            660                 665                 670
Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys Leu Gln Phe
        675                 680                 685
Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu Arg Lys Glu
    690                 695                 700
His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys Lys His Leu
705                 710                 715                 720
Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met Leu Lys Asp
                725                 730                 735
His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile Tyr Asn Gly
            740                 745                 750
Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys Trp Asn Val
        755                 760                     765
Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu Thr Val Glu
    770                 775                 780
Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu Tyr Arg Glu
785                 790                 795                 800
<210>4
<211>2400
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>4
atgggccact ggtacaagca ccagcgcgcc taccagttca ccggcgagga cgacttcggg 60
aaggtggccg tggtgaagct cccgatggac ctcaccaagg tgggcatcat cgtgcgcctc 120
aacgagtggc aggcgaagga cgtggccaag gaccgcttca tcgagatcaa ggacggcaag 180
gccgaggtgt ggatactcca gggcgtggag gagatcttct acgagaagcc ggacacctcc 240
ccgcgcatct tcttcgccca ggcccgctcc aacaaggtga tcgaggcctt cctcaccaac 300
ccggtggaca ccaagaagaa ggagctgttc aaggtgaccg tcgacggcaa ggagatcccg 360
gtgtcccgcg tggagaaggc cgacccgacc gacatcgacg tgaccaacta cgtgcgcatc 420
gtgctctccg agtccctcaa ggaggaggac ctccgcaagg acgtggagct gatcatcgag 480
ggctacaagc cggcccgcgt gatcatgatg gagatcctcg acgactacta ctacgacggc 540
gagctggggg cggtgtactc cccggagaag accatcttcc gcgtgtggtc cccggtgtcc 600
aagtgggtga aggtgctcct cttcaagaac ggcgaggaca ccgagccgta ccaggtggtg 660
aacatggagt acaagggcaa cggcgtgtgg gaggccgtgg tggagggcga cctcgacggc 720
gtgttctacc tctaccagct ggagaactac ggcaagatcc gcaccaccgt ggacccgtac 780
tccaaggccg tgtacgccaa caaccaggag tctgcagtgg tgaacctcgc ccgcaccaac 840
ccggagggct gggagaacga ccgcggcccg aagatcgagg gctacgagga cgccatcatc 900
tacgagatcc acatcgccga catcaccggc ctggagaact ccggcgtgaa gaacaagggc 960
ctctacctcg gcctcaccga ggagaacacc aaggccccgg gcggcgtgac caccggcctc 1020
tcccacctcg tggagctggg cgtgacccac gtgcacatcc tcccgttctt cgacttctac 1080
accggcgacg agctggacaa ggacttcgag aagtactaca actggggcta cgacccgtac 1140
ctcttcatgg tgccggaggg ccgctactcc accgacccga agaacccgca cacccgaatt 1200
cgcgaggtga aggagatggt gaaggccctc cacaagcacg gcatcggcgt gatcatggac 1260
atggtgttcc cgcacaccta cggcatcggc gagctgtccg ccttcgacca gaccgtgccg 1320
tactacttct accgcatcga caagaccggc gcctacctca acgagtccgg ctgcggcaac 1380
gtgatcgcct ccgagcgccc gatgatgcgc aagttcatcg tggacaccgt gacctactgg 1440
gtgaaggagt accacatcga cggcttccgc ttcgaccaga tgggcctcat cgacaagaag 1500
accatgctgg aggtggagcg cgccctccac aagatcgacc cgaccatcat cctctacggc 1560
gagccgtggg gcggctgggg ggccccgatc cgcttcggca agtccgacgt ggccggcacc 1620
cacgtggccg ccttcaacga cgagttccgc gacgccatcc gcggctccgt gttcaacccg 1680
tccgtgaagg gcttcgtgat gggcggctac ggcaaggaga ccaagatcaa gcgcggcgtg 1740
gtgggctcca tcaactacga cggcaagctc atcaagtcct tcgccctcga cccggaggag 1800
accatcaact acgccgcctg ccacgacaac cacaccctct gggacaagaa ctacctcgcc 1860
gccaaggccg acaagaagaa ggagtggacc gaggaggagc tgaagaacgc ccagaagctc 1920
gccggcgcca tcctcctcac tagtcagggc gtgccgttcc tccacggcgg ccaggacttc 1980
tgccgcacca ccaacttcaa cgacaactcc tacaacgccc cgatctccat caacggcttc 2040
gactacgagc gcaagctcca gttcatcgac gtgttcaact accacaaggg cctcatcaag 2100
ctccgcaagg agcacccggc cttccgcctc aagaacgccg aggagatcaa gaagcacctg 2160
gagttcctcc cgggcgggcg ccgcatcgtg gccttcatgc tcaaggacca cgccggcggc 2220
gacccgtgga aggacatcgt ggtgatctac aacggcaacc tggagaagac cacctacaag 2280
ctcccggagg gcaagtggaa cgtggtggtg aactcccaga aggccggcac cgaggtgatc 2340
gagaccgtgg agggcaccat cgagctggac ccgctctccg cctacgtgct ctaccgcgag 2400
<210>5
<211>693
<212>PRT
<213>硫磺矿硫化叶菌
<400>5
Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr Lys Val Val
 1               5                  10                  15
Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu Gln Lys Ile
            20                  25                  30
Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile Val Gln Gln
        35                  40                  45
Gly Asn Lys Val lle Val Glu Lys Ser Leu Asp Leu Lys Glu His lle
    50                  55                  60
Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys Arg Lys Arg
65                  70                  75                  80
Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys Tyr Gln Asp
                85                  90                  95
Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys Asp Gly Val
            100                 105                 110
Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile Phe Asp Val
        115                 120                 125
Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro Glu Asp Ser
    130                 135                 140
Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp Val Leu Glu
145                 150                 155                 160
Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro Met Trp Ala
                165                 170                 175
Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln Asp Lys Val
            180                 185                 190
Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg Val Ala Gly
        195                 200                 205
Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu Phe Thr Trp
    210                 215                 220
His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp Glu Leu His
225                 230                 235                 240
Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly Ile Arg Val
                245                 250                 255
Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys Phe Cys Glu
            260                 265                 270
Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro Gly Thr Thr
        275                 280                 285
Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp Trp Ala Gly
    290                 295                 300
Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile Trp Leu Asp
305                 310                 315                 320
Met Asn Glu Pro Thr Asp Phe Ser Arg Ala lle Glu Ile Arg Asp Val
                325                 330                 335
Leu Ser Set Leu Pro Val Gln Phe Arg Asp Asp Arg Leu Val Thr Thr
            340                 345                 350
Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg Val Lys His
        355                 360                 365
Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met Ala Thr Phe
    370                 375                         380
Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile Leu Ser Arg
385                 390                 395                 400
Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp Thr Gly Asp
                405                 410                 415
Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln Leu Val Leu
            420                 425                 430
Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp Ile Gly Gly
        435                 440                 445
Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Ash Ser Met Asp Leu Leu
    450                 455                 460
Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr Arg Ser His
465                 470                 475                 480
Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu Pro Asp Tyr
                485                 490                 495
Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr Lys Phe Leu
            500                 505                 510
Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys Gly His Pro
        515                 520                 525
Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp Asp Met Tyr
    530                 535                 540
Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu Tyr Ala Pro
545                 550                 555                 560
Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro Arg Gly Lys
                565                 570                 575
Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys Ser Val Val
            580                 585                 590
Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly Ser Ile Ile
        595                 600                 605
Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr Ser Phe Lys
    610                 615                 620
Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu Ile Lys Phe
625                 630                 635                 640
Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser Glu Lys Pro
                645                 650                     655
Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln Val Glu Lys
            660                 665                 670
Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys Ile Arg Gly
        675                 680                 685
Lys Ile Asn Leu Glu
    690
<210>6
<211>2082
<212>DNA
<213>硫磺矿硫化叶菌
<400>6
atggagacca tcaagatcta cgagaacaag ggcgtgtaca aggtggtgat cggcgagccg 60
ttcccgccga tcgagttccc gctcgagcag aagatctcct ccaacaagtc cctctccgag 120
ctgggcctca ccatcgtgca gcagggcaac aaggtgatcg tggagaagtc cctcgacctc 180
aaggagcaca tcatcggcct cggcgagaag gccttcgagc tggaccgcaa gcgcaagcgc 240
tacgtgatgt acaacgtgga cgccggcgcc tacaagaagt accaggaccc gctctacgtg 300
tccatcccgc tcttcatctc cgtgaaggac ggcgtggcca ccggctactt cttcaactcc 360
gcctccaagg tgatcttcga cgtgggcctc gaggagtacg acaaggtgat cgtgaccatc 420
ccggaggact ccgtggagtt ctacgtgatc gagggcccgc gcatcgagga cgtgctcgag 480
aagtacaccg agctgaccgg caagccgttc ctcccgccga tgtgggcctt cggctacatg 540
atctcccgct actcctacta cccgcaggac aaggtggtgg agctggtgga catcatgcag 600
aaggagggct tccgcgtggc cggcgtgttc ctcgacatcc actacatgga ctcctacaag 660
ctcttcacct ggcacccgta ccgcttcccg gagccgaaga agctcatcga cgagctgcac 720
aagcgcaacg tgaagctcat caccatcgtg gaccacggca tccgcgtgga ccagaactac 780
tccccgttcc tctccggcat gggcaagttc tgcgagatcg agtccggcga gctgttcgtg 840
ggcaagatgt ggccgggcac caccgtgtac ccggacttct tccgcgagga cacccgcgag 900
tggtgggccg gcctcatctc cgagtggctc tcccagggcg tggacggcat ctggctcgac 960
atgaacgagc cgaccgactt ctcccgcgcc atcgagatcc gcgacgtgct ctcctccctc 1020
ccggtgcagt tccgcgacga ccgcctcgtg accaccttcc cggacaacgt ggtgcactac 1080
ctccgcggca agcgcgtgaa gcacgagaag gtgcgcaacg cctacccgct ctacgaggcg 1140
atggccacct tcaagggctt ccgcacctcc caccgcaacg agatcttcat cctctcccgc 1200
gccggctacg ccggcatcca gcgctacgcc ttcatctgga ccggcgacaa caccccgtcc 1260
tgggacgacc tcaagctcca gctccagctc gtgctcggcc tctccatctc cggcgtgccg 1320
ttcgtgggct gcgacatcgg cggcttccag ggccgcaact tcgccgagat cgacaactcg 1380
atggacctcc tcgtgaagta ctacgccctc gccctcttct tcccgttcta ccgctcccac 1440
aaggccaccg acggcatcga caccgagccg gtgttcctcc cggactacta-caaggagaag 1500
gtgaaggaga tcgtggagct gcgctacaag ttcctcccgt acatctactc cctcgccctc 1560
gaggcctccg agaagggcca cccggtgatc cgcccgctct tctacgagtt ccaggacgac 1620
gacgacatgt accgcatcga ggacgagtac atggtgggca agtacctcct ctacgccccg 1680
atcgtgtcca aggaggagtc ccgcctcgtg accctcccgc gcggcaagtg gtacaactac 1740
tggaacggcg agatcatcaa cggcaagtcc gtggtgaagt ccacccacga gctgccgatc 1800
tacctccgcg agggctccat catcccgctc gagggcgacg agctgatcgt gtacggcgag 1860
acctccttca agcgctacga caacgccgag atcacctcct cctccaacga gatcaagttc 1920
tcccgcgaga tctacgtgtc caagctcacc atcacctccg agaagccggt gtccaagatc 1980
atcgtggacg actccaagga gatccaggtg gagaagacca tgcagaacac ctacgtggcc 2040
aagatcaacc agaagatccg cggcaagatc aacctcgagt ga                    2082
<210>7
<211>1818
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>7
atggcggctc tggccacgtc gcagctcgtc gcaacgcgcg ccggcctggg cgtcccggac 60
gcgtccacgt tccgccgcgg cgccgcgcag ggcctgaggg gggcccgggc gtcggcggcg 120
gcggacacgc tcagcatgcg gaccagcgcg cgcgcggcgc ccaggcacca gcaccagcag 180
gcgcgccgcg gggccaggtt cccgtcgctc gtcgtgtgcg ccagcgccgg catgaacgtc 240
gtcttcgtcg gcgccgagat ggcgccgtgg agcaagaccg gaggcctcgg cgacgtcctc 300
ggcggcctgc cgccggccat ggccgcgaac gggcaccgtg tcatggtcgt ctctccccgc 360
tacgaccagt acaaggacgc ctgggacacc agcgtcgtgt ccgagatcaa gatgggagac 420
gggtacgaga cggtcaggtt cttccactgc tacaagcgcg gagtggaccg cgtgttcgtt 480
gaccacccac tgttcctgga gagggtttgg ggaaagaccg aggagaagat ctacgggcct 540
gtcgctggaa cggactacag ggacaaccag ctgcggttca gcctgctatg ccaggcagca 600
cttgaagctc caaggatcct gagcctcaac aacaacccat acttctccgg accatacggg 660
gaggacgtcg tgttcgtctg caacgactgg cacaccggcc ctctctcgtg ctacctcaag 720
agcaactacc agtcccacgg catctacagg gacgcaaaga ccgctttctg catccacaac 780
atctcctacc agggccggtt cgccttctcc gactacccgg agctgaacct ccccgagaga 840
ttcaagtcgt ccttcgattt catcgacggc tacgagaagc ccgtggaagg ccggaagatc 900
aactggatga aggccgggat cctcgaggcc gacagggtcc tcaccgtcag cccctactac 960
gccgaggagc tcatctccgg catcgccagg ggctgcgagc tcgacaacat catgcgcctc 1020
accggcatca ccggcatcgt caacggcatg gacgtcagcg agtgggaccc cagcagggac 1080
aagtacatcg ccgtgaagta cgacgtgtcg acggccgtgg aggccaaggc gctgaacaag 1140
gaggcgctgc aggcggaggt cgggctcccg gtggaccgga acatcccgct ggtggcgttc 1200
atcggcaggc tggaagagca gaagggcccc gacgtcatgg cggccgccat cccgcagctc 1260
atggagatgg tggaggacgt gcagatcgtt ctgctgggca cgggcaagaa gaagttcgag 1320
cgcatgctca tgagcgccga ggagaagttc ccaggcaagg tgcgcgccgt ggtcaagttc 1380
aacgcggcgc tggcgcacca catcatggcc ggcgccgacg tgctcgccgt caccagccgc 1440
ttcgagccct gcggcctcat ccagctgcag gggatgcgat acggaacgcc ctgcgcctgc 1500
gcgtccaccg gtggactcgt cgacaccatc atcgaaggca agaccgggtt ccacatgggc 1560
cgcctcagcg tcgactgcaa cgtcgtggag ccggcggacg tcaagaaggt ggccaccacc 1620
ttgcagcgcg ccatcaaggt ggtcggcacg ccggcgtacg aggagatggt gaggaactgc 1680
atgatccagg atctctcctg gaagggccct gccaagaact gggagaacgt gctgctcagc 1740
ctcggggtcg ccggcggcga gccaggggtt gaaggcgagg agatcgcgcc gctcgccaag 1800
gagaacgtgg ccgcgccc                                               1818
<210>8
<211>606
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>8
Met Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly Leu
 1               5                  10                  15
Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly Leu
            20                  25                  30
Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg Thr
        35                  40                  45
Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg Gly
    50                  55                  60
Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Met Asn Val
65                  70                  75                  80
Val Phe Val Gly Ala Glu Met Ala Pro Trp Ser Lys Thr Gly Gly Leu
                85                  90                  95
Gly Asp Val Leu Gly Gly Leu Pro Pro Ala Met Ala Ala Asn Gly His
            100                 105                 110
Arg Val Met Val Val Ser Pro Arg Tyr Asp Gln Tyr Lys Asp Ala Trp
        115                 120                 125
Asp Thr Ser Val Val Ser Glu Ile Lys Met Gly Asp Gly Tyr Glu Thr
    130                 135                 140
Val Arg Phe Phe His Cys Tyr Lys Arg Gly Val Asp Arg Val Phe Val
145                 150                 155                 160
Asp His Pro Leu Phe Leu Glu Arg Val Trp Gly Lys Thr Glu Glu Lys
                165                 170                 175
Ile Tyr Gly Pro Val Ala Gly Thr Asp Tyr Arg Asp Asn Gln Leu Arg
            180                 185                 190
Phe Ser Leu Leu Cys Gln Ala Ala Leu Glu Ala Pro Arg Ile Leu Ser
        195                 200                 205
Leu Asn Asn Asn Pro Tyr Phe Ser Gly Pro Tyr Gly Glu Asp Val Val
    210                 215                 220
Phe Val Cys Asn Asp Trp His Thr Gly Pro Leu Ser Cys Tyr Leu Lys
225                 230                 235                 240
Ser Asn Tyr Gln Ser His Gly Ile Tyr Arg Asp Ala Lys Thr Ala Phe
                245                 250                 255
Cys Ile His Asn Ile Ser Tyr Gln Gly Arg Phe Ala Phe Ser Asp Tyr
            260                 265                 270
Pro Glu Leu Asn Leu Pro Glu Arg Phe Lys Ser Ser Phe Asp Phe Ile
        275                 280                 285
Asp Gly Tyr Glu Lys Pro Val Glu Gly Arg Lys Ile Asn Trp Met Lys
    290                 295                 300
Ala Gly Ile Leu Glu Ala Asp Arg Val Leu Thr Val Ser Pro Tyr Tyr
305                 310                 315                 320
Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg Gly Cys Glu Leu Asp Asn
                325                 330                 335
Ile Met Arg Leu Thr Gly Ile Thr Gly Ile Val Asn Gly Met Asp Val
            340                 345                 350
Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr Ile Ala Val Lys Tyr Asp
        355                 360                 365
Val Ser Thr Ala Val Glu Ala Lys Ala 5eu Asn Lys Glu Ala Leu Gln
    370                 375                 380
Ala Glu Val Gly Leu Pro Val Asp Arg Asn Ile Pro Leu Val Ala Phe
385                 390                 395                 400
Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro Asp Val Met Ala Ala Ala
                405                 410             415
Ile Pro Gln Leu Met Glu Met Val Glu Asp Val Gln Ile Val Leu Leu
            420                 425                 430
Gly Thr Gly Lys Lys Lys Phe Glu Arg Met Leu Met ser Ala Glu Glu
        435                 440                 445
Lys Phe Pro Gly Lys Val Arg Ala Val Val Lys Phe Asn Ala Ala Leu
    450                 455                 460
Ala His His Ile Met Ala Gly Ala Asp Val Leu Ala Val Thr Ser Arg
465                 470                 475                 480
Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln Gly Met Arg Tyr Gly Thr
                485                 490                 495
Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu Val Asp Thr Ile Ile Glu
            500                 505                 510
Gly Lys Thr Gly Phe His Met Gly Arg Leu Ser Val Asp Cys Asn Val
        515                 520                 525
Val Glu Pro Ala Asp Val Lys Lys Val Ala Thr Thr Leu Gln Arg Ala
    530                 535                 540
Ile Lys Val Val Gly Thr Pro Ala Tyr Glu Glu Met Val Arg Asn Cys
545                 550                 555                 560
Met Ile Gln Asp Leu Ser Trp Lys Gly Pro Ala Lys Asn Trp Glu Asn
                565                 570                 575
Val Leu Leu Ser Leu Gly Val Ala Gly Gly Glu Pro Gly Val Glu Gly
            580                 585                 590
Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn Val Ala Ala Pro
        595                 600                 605
<210>9
<211>2223
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>9
atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac 60
gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac 120
gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg 180
atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg 240
gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac 300
ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg 360
aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac 420
accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc 480
ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg 540
caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac 600
gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg 660
gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc 720
gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac 780
atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc 840
aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg 900
tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag 960
tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc 1020
tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc 1080
tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg 1140
tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg 1200
gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc 1260
gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggcac atcgattgct 1320
ggcatcctcg aggccgacag ggtcctcacc gtcagcccct actacgccga ggagctcatc 1380
tccggcatcg ccaggggctg cgagctcgac aacatcatgc gcctcaccgg catcaccggc 1440
atcgtcaacg gcatggacgt cagcgagtgg gaccccagca gggacaagta catcgccgtg 1500
aagtacgacg tgtcgacggc cgtggaggcc aaggcgctga acaaggaggc gctgcaggcg 1560
gaggtcgggc tcccggtgga ccggaacatc ccgctggtgg cgttcatcgg caggctggaa 1620
gagcagaagg gccccgacgt catggcggcc gccatcccgc agctcatgga gatggtggag 1680
gacgtgcaga tcgttctgct gggcacgggc aagaagaagt tcgagcgcat gctcatgagc 1740
gccgaggaga agttcccagg caaggtgcgc gccgtggtca agttcaacgc ggcgctggcg 1800
caccacatca tggccggcgc cgacgtgctc gccgtcacca gccgcttcga gccctgcggc 1860
ctcatccagc tgcaggggat gcgatacgga acgccctgcg cctgcgcgtc caccggtgga 1920
ctcgtcgaca ccatcatcga aggcaagacc gggttccaca tgggccgcct cagcgtcgac 1980
tgcaacgtcg tggagccggc ggacgtcaag aaggtggcca ccaccttgca gcgcgccatc 2040
aaggtggtcg gcacgccggc gtacgaggag atggtgagga actgcatgat ccaggatctc 2100
tcctggaagg gccctgccaa gaactgggag aacgtgctgc tcagcctcgg ggtcgccggc 2160
ggcgagccag gggttgaagg cgaggagatc gcgccgctcg ccaaggagaa cgtggccgcg 2220
ccc                                                               2223
<210>10
<211>741
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>10
Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala
 1               5                  10                  15
Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg
            20                  25                  30
Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile
        35                  40                  45
Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp
    50                  55                  60
Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val
65                  70                  75                  80
Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu lle Asn Met Ile Asn Thr
                85                  90                  95
Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His
            100                 105                 110
Arg Ala Gly Gly Asp Leu Glu Trp Asn pro Phe Val Gly Asp Tyr Thr
        115                 120                 125
Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr
    130                 135                 140
Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe
145                 150                 155                 160
Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp
                165                 170                 175
Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly
            180                 185                 190
Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val
        195                 200                 205
Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr
    210                 215                 220
Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly
225                 230                 235                 240
Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe
                245                 250                 255
Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly
            260                 265                 270
Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn
        275                 280                 285
His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile
    290                 295                 300
Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu
305                 310                 315                 320
Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn
                325                 330                 335
Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met
            340                 345                 350
Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr
        355                 360                 365
Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys
    370                 375                 380
Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp
385                 390                 395                 400
Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro
                405                 410                 415
Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr
             420                425                 430
Cys Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val
        435                 440                 445
Leu Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala
    450                 455                 460
Arg Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly
465                 470                 475                 480
Ile Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys
                485                 490                 495
Tyr Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala
            500                 505                 510
Leu Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg
        515                 520                 525
Asn Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly
    530                 535                 540
Pro Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu
545                     550             555                 560
Asp Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg
                565                 570                 575
Met Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val
            580                 585                 590
Val Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp
        595                 600                 605
Val Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu
    610                 615                 620
Gln Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly
625                 630                 635                 640
Leu Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg
                645                 650                 655
Leu Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val
            660                 665                 670
Ala Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr
        675                 680                 685
Glu Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly
    690                 695                 700
Pro Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly
705                 710                 715                 720
Gly Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu
                725                 730                 735
Asn Val Ala Ala Pro
            740
<210>11
<211>1515
<212>DNA
<213>玉蜀黍
<400>11
ggagagctat gagacgtatg tcctcaaagc cactttgcat tgtgtgaaac caatatcgat 60
ctttgttact tcatcatgca tgaacatttg tggaaactac tagcttacaa gcattagtga 120
cagctcagaa aaaagttatc tatgaaaggt ttcatgtgta ccgtgggaaa tgagaaatgt 180
tgccaactca aacaccttca atatgttgtt tgcaggcaaa ctcttctgga agaaaggtgt 240
ctaaaactat gaacgggtta cagaaaggta taaaccacgg ctgtgcattt tggaagtatc 300
atctatagat gtctgttgag gggaaagccg tacgccaacg ttatttactc agaaacagct 360
tcaacacaca gttgtctgct ttatgatggc atctccaccc aggcacccac catcacctat 420
ctctcgtgcc tgtttatttt cttgcccttt ctgatcataa aaaaacatta agagtttgca 480
aacatgcata ggcatatcaa tatgctcatt tattaatttg ctagcagatc atcttcctac 540
tctttacttt atttattgtt tgaaaaatat gtcctgcacc tagggagctc gtatacagta 600
ccaatgcatc ttcattaaat gtgaatttca gaaaggaagt aggaacctat gagagtattt 660
ttcaaaatta attagcggct tctattatgt ttatagcaaa ggccaagggc aaaattggaa 720
cactaatgat ggttggttgc atgagtctgt cgattacttg caagaaatgt gaacctttgt 780
ttctgtgcgt gggcataaaa caaacagctt ctagcctctt ttacggtact tgcacttgca 840
agaaatgtga actccttttc atttctgtat gtggacataa tgccaaagca tccaggcttt 900
ttcatggttg ttgatgtctt tacacagttc atctccacca gtatgccctc ctcatactct 960
atataaacac atcaacagca tcgcaattag ccacaagatc acttcgggag gcaagtgcga 1020
tttcgatctc gcagccacct ttttttgttc tgttgtaagt ataccttccc ttaccatctt 1080
tatctgttag tttaatttgt aattgggaag tattagtgga aagaggatga gatgctatca 1140
tctatgtact ctgcaaatgc atctgacgtt atatgggctg cttcatataa tttgaattgc 1200
tccattcttg ccgacaatat attgcaaggt atatgcctag ttccatcaaa agttctgttt 1260
tttcattcta aaagcatttt agtggcacac aatttttgtc catgagggaa aggaaatctg 1320
ttttggttac tttgcttgag gtgcattctt catatgtcca gttttatgga agtaataaac 1380
ttcagtttgg tcataagatg tcatattaaa gggcaaacat atattcaatg ttcaattcat 1440
cgtaaatgtt ccctttttgt aaaagattgc atactcattt atttgagttg caggtgtatc 1500
tagtagttgg aggag                                                 1515
<210>12
<211>673
<212>DNA
<213>玉蜀黍
<400>12
gatcatccag gtgcaaccgt ataagtccta aagtggtgag gaacacgaaa caaccatgca 60
ttggcatgta aagctccaag aatttgttgt atccttaaca actcacagaa catcaaccaa 120
aattgcacgt caagggtatt gggtaagaaa caatcaaaca aatcctctct gtgtgcaaag 180
aaacacggtg agtcatgccg agatcatact catctgatat acatgcttac agctcacaag 240
acattacaaa caactcatat tgcattacaa agatcgtttc atgaaaaata aaataggccg 300
gacaggacaa aaatccttga cgtgtaaagt aaatttacaa caaaaaaaaa gccatatgtc 360
aagctaaatc taattcgttt tacgtagatc aacaacctgt agaaggcaac aaaactgagc 420
cacgcagaag tacagaatga ttccagatga accatcgacg tgctacgtaa agagagtgac 480
gagtcatata catttggcaa gaaaccatga agctgcctac agccgtctcg gtggcataag 540
aacacaagaa attgtgttaa ttaatcaaag ctataaataa cgctcgcatg cctgtgcact 600
tctccatcac caccactggg tcttcagacc attagcttta tctactccag agcgcagaag 660
aacccgatcg aca                                                    673
<2l0>13
<211>454
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>13
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                   10                 15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu lle Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                     175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly
    450
<210>14
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>14
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                      10              15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gjy Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>15
<211>518
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>15
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
 1               5                  10                  15
Leu Gly Val Pro Asp Ala ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met
65                  70                  75                  80
Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe
                85                  90                  95
Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln
            100                 105                 110
Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro
        115                 120                 125
Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro
    130                 135                 140
Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu
145                 150                 155                 160
Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met lle Asn Thr Ala
                165                 170                 175
His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg
            180                 185                 190
Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp
        195                 200                 205
Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu
    210                 215                 220
Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly
225                 230                 235                 240
Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu
                245                 250                 255
Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile
            260             265                     270
Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val
        275                 280                 285
Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp
    290                 295                 300
Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala
305                 310                 315                 320
Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp
                325                 330                 335
Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr
            340                 345                 350
Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala ASn His
        355                 360                 365
ASp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu
    370                 375                 380
Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp
385                 390                 395                 400
Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp ASn Leu
                405             410                     415
Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile
            420                 425                 430
Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile
        435                 440                 445
Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe
    450                 455                 460
Ala Gly Ala Cys lle His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val
465                 470                 475                 480
Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala
                485                 490                 495
Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys
            500                 505                 510
Gly Val Gly Thr Ser Ile
        515
<210>16
<211>820
<212>PRT
<2l3>人工序列
<220>
<223>合成的
<400>16
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
 1               5                  10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                 40                  45
Thr Ser Ala Arg Ala AlaPro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met
65                  70                  75                  80
Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe
                85                  90                  95
Tyr Trp Asp Val Pro Ser Gly Gly lle Trp Trp Asp Thr lle Arg Gln
            100                 105                 110
Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro
        115                 120                 125
Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro
    130                 135                 140
Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu
145                 150                 155                 160
Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala
                165                 170                 175
His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg
            180                 185                 190
Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp
        195                 200                 205
Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu
    210                 215                 220
Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly
225                 230                 235                 240
Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu
                245                 250                 255
Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile
            260                 265                 270
Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val
        275                 280                 285
Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp
    290                 295                 300
Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala
305                 310                 315                 320
Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp
                325                 330                 335
Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr
            340                 345                 350
Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His
        355                 360                 365
Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu
    370                 375                 380
Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp
385                 390                 395                 400
Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu
                405                 410                 415
Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile
            420                 425                 430
Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile
        435                 440                 445
Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe
    450                 455                 460
Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val
465                 470                 475                 480
Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala
                485                 490                 495
Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys
            500                 505                 510
Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val Leu
        515                 520                 525
Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu lle Ser Gly Ile Ala Arg
    530                 535                 540
Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly Ile
545                 550                 555                 560
Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr
                565                 570                 575
Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala Leu
            580                 585                 590
Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg Asn
        595                 600                 605
Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro
    610                 615                 620
Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu Asp
625                 630                 635                 640
Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg Met
                645                 650                 655
Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val Val
            660                 665                 670
Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp Val
        675                 680                 685
Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln
    690                 695                 700
Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu
705                 710                 715                 720
Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg Leu
                725                 730                 735
Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val Ala
            740                 745                 750
Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr Glu
        755                 760                 765
Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly Pro
    770                 775                 780
Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly Gly
785                 790                 795                 800
Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn
                805                 810                 815
Val Ala Ala Pro
            820
<210>17
<211>19
<212>pRT
<213>人工序列
<220>
<223>合成的
<400>17
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 I              5                   10                  15
Ala Thr Ser
<210>18
<211>444
<212>PRT
<213>海栖热袍菌
<400>18
Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys
 1              5                   10                  15
Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val
            20                  25                  30
Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe
        35                  40                  45
Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr
    50                  55                  60
Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe
65                  70                  75                  80
Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu
                85                  90                  95
Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu
            100                 105                 110
Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu
        115                 120                 125
Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu
    130                 135                 140
Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala
145                 150                 155                 160
Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile
                165                 170                 175
Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu
            180                 185                 190
Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn
        195                 200                 205
Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly
    210                 215                 220
Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys
225                 230                 235                 240
His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn
                245                 250                 255
His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala
            260                 265                 270
Thr Leu Ala GIy His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile
        275                 280                 285
Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu
    290                 295                 300
Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu
305                 310                 315                 320
Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu
                325                 330                 335
Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu
            340                 345                 350
Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys
        355                 360                 365
Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu
    370                 375                 380
Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu
385                 390                 395                 400
Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu
                405                 410                 415
Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu
            420                 425                 430
Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg
        435                 440
<210>19
<211>1335
<212>DNA
<213>海栖热袍菌
<400>19
atggccgagt tcttcccgga gatcccgaag atccagttcg agggcaagga gtccaccaac 60
ccgctcgcct tccgcttcta cgacccgaac gaggtgatcg acggcaagcc gctcaaggac 120
cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc 180
ggcgacccga ccgccgagcg cccgtggaac cgcttctccg acccgatgga caaggccttc 240
gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc 300
cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac 360
aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc 420
accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc 480
gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg 540
ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc 600
gacctcggcc tggagctgga gaacctcgcc cgcttcctcc gcatggccgt ggagtacgcc 660
aagaagatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag 720
caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagaacca cggcctcgac 780
gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag 840
cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc 900
gacctcctcc tcggctggga caccgaccag ttcccgacca acatctacga caccaccctc 960
gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc 1020
aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg 1080
gacaccttcg ccctcggctt caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac 1140
aagttcatcg aggagaagta ccgctccttc aaggagggca tcggcaagga gatcgtggag 1200
ggcaagaccg acttcgagaa gctggaggag tacatcatcg acaaggagga catcgagctg 1260
ccgtccggca agcaggagta cctggagtcc ctcctcaact cctacatcgt gaagaccatc 1320
gccgagctgc gctga                                                  1335
<210>20
<211>444
<212>PRT
<213>那不勒斯栖热袍菌
<400>20
Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys
 1               5                  10                  15
Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile
            20                  25                  30
Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe
        35                  40                  45
Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr
    50                  55                  60
Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe
65                  70                  75                  80
Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu
                85                  90                  95
Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu
            100                 105                 110
Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu
        115                 120                 125
Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu
    130                 135                 140
Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala
145                 150                 155                 160
Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile
                165                 170                 175
Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu
            180                 185                 190
Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn
        195                 200                 205
Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly
    210                 215                 220
Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys
225                 230                 235                 240
His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser
                245                 250                 255
His Gly Leu Asp Glu Tyr Phe Lys Phe Ash Ile Glu Ala Asn His Ala
            260                 265                 270
Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile
        275                 280                 285
Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu
    290                 295                 300
Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu
305                 310                 315                 320
Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu
                325                 330                 335
Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu
            340                 345                 350
Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys
        355                 360                 365
Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu
    370                 375                 380
Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu
385                 390                 395                  400
Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu
                405                 410                 415
Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile
            420                 425                 430
Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
        435                 440
<210>21
<211>1335
<212>DNA
<213>那不勒斯栖热袍菌
<400>21
atggccgagt tcttcccgga gatcccgaag gtgcagttcg agggcaagga gtccaccaac 60
ccgctcgcct tcaagttcta cgacccggag gagatcatcg acggcaagcc gctcaaggac 120
cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc 180
ggcgacccga ccgccgaccg cccgtggaac cgctacaccg acccgatgga caaggccttc 240
gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc 300
cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac 360
aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc 420
accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc 480
gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg 540
ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc 600
gacctcggct tcgagctgga gaacctcgcc cgcttcctcc gcatggccgt ggactacgcc 660
aagcgcatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag 720
caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagtccca cggcctcgac 780
gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag 840
cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc 900
gacctcctcc tcggctggga caccgaccag ttcccgacca acgtgtacga caccaccctc 960
gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc 1020
aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg 1080
gacaccttcg ccctcggctt caaggtggcc tacaagctcg tgaaggacgg cgtgctcgac 1140
aagttcatcg aggagaagta ccgctccttc cgcgagggca tcggccgcga catcgtggag 1200
ggcaaggtgg acttcgagaa gctggaggag tacatcatcg acaaggagac catcgagctg 1260
ccgtccggca agcaggagta cctggagtcc ctcatcaact cctacatcgt gaagaccatc 1320
ctggagcgc gctga                                                   1335
<210>22
<211>28
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>22
agcgaattca tggcggctct ggccacgt    28
<210>23
<211>29
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>23
agctaagctt cagggcgcgg ccacgttct    29
<210>24
<211>825
<212>pRT
<213>人工序列
<220>
<223>合成的
<400>24
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe
            20                  25                  30
Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met
        35                  40                  45
Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala
    50                  55                  60
Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala
65                  70                  75                  80
Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro
                85                  90                  95
Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val
            100                 105                 110
Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu
        115                 120                 125
Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu
    130                 135                 140
Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val
145                 150                 155                 160
Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu
                165                 170                 175
Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu
            180                 185                 190
Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu
        195                 200                 205
Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val
    210                 215                 220
Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn
225                 230                 235                240
Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala ValVal Glu Gly Asp
                245                 250                 255
Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile
            260                 265                 270
Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln
        275                 280                 285
Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu
    290                 295                 300
Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr
305                 310                 315                 320
Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys
                325                 330                 335
Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro
            340                 345                 350
Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr
        355                 360                 365
His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu
      370                375                380
Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu
385                 390                 395                 400
Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His
                405                 410                 415
Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His
            420                 425                430
Gly Ile Gly Val Ile Met Asp Met Val Phe Pro HisThr Tyr Gly Ile
        435                 440                 445
Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg
    450                 455                 460
lle Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val
465                 470                 475                 480
Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val
                485                 490                 495
Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln
            500                 505                 510
Net Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu
        515                 520                 525
His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly
     530                535                 540
Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His
545                 550                 555                 560
Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val
                565                 570                 575
Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu
            580                 585                 590
Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys
        595                 600                 605
Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala
    610                 615                 620
Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala
625                 630                 635                 640
Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala
                645                 650                 655
Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe
            660                 665                 670
Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn
        675                 680                 685
Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys
    690                 695                 700
Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu
705                 710                 715                 720
Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys
                725                 730                 735
Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met
            740                 745                 750
Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile
        755                 760                 765
Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys
    770                 775                 780
Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu
785                 790                 795                 800
Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu
                805                 810                 815
Tyr Arg Glu Ser Glu Lys Asp Glu Leu
            820                 825
<210>25
<211>2478
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>25
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct 60
ggccactggt acaagcacca gcgcgcctac cagttcaccg gcgaggacga cttcgggaag 120
gtggccgtgg tgaagctccc gatggacctc accaaggtgg gcatcatcgt gcgcctcaac 180
gagtggcagg cgaaggacgt ggccaaggac cgcttcatcg agatcaagga cggcaaggcc 240
gaggtgtgga tactccaggg cgtggaggag atcttctacg agaagccgga cacctccccg 300
cgcatcttct tcgcccaggc ccgctccaac aaggtgatcg aggccttcct caccaacccg 360
gtggacacca agaagaagga gctgttcaag gtgaccgtcg acggcaagga gatcccggtg 420
tcccgcgtgg agaaggccga cccgaccgac atcgacgtga ccaactacgt gcgcatcgtg 480
ctctccgagt ccctcaagga ggaggacctc cgcaaggacg tggagctgat catcgagggc 540
tacaagccgg cccgcgtgat catgatggag atcctcgacg actactacta cgacggcgag 600
ctgggggcgg tgtactcccc ggagaagacc atcttccgcg tgtggtcccc ggtgtccaag 660
tgggtgaagg tgctcctctt caagaacggc gaggacaccg agccgtacca ggtggtgaac 720
atggagtaca agggcaacgg cgtgtgggag gccgtggtgg agggcgacct cgacggcgtg 780
ttctacctct accagctgga gaactacggc aagatccgca ccaccgtgga cccgtactcc 840
aaggccgtgt acgccaacaa ccaggagtct gcagtggtga acctcgcccg caccaacccg 900
gagggctggg agaacgaccg cggcccgaag atcgagggct acgaggacgc catcatctac 960
gagatccaca tcgccgacat caccggcctg gagaactccg gcgtgaagaa caagggcctc 1020
tacctcggcc tcaccgagga gaacaccaag gccccgggcg gcgtgaccac cggcctctcc 1080
cacctcgtgg agctgggcgt gacccacgtg cacatcctcc cgttcttcga cttctacacc 1140
ggcgacgagc tggacaagga cttcgagaag tactacaact ggggctacga cccgtacctc 1200
ttcatggtgc cggagggccg ctactccacc gacccgaaga acccgcacac ccgaattcgc 1260
gaggtgaagg agatggtgaa ggccctccac aagcacggca tcggcgtgat catggacatg 1320
gtgttcccgc acacctacgg catcggcgag ctgtccgcct tcgaccagac cgtgccgtac 1380
tacttctacc gcatcgacaa gaccggcgcc tacctcaacg agtccggctg cggcaacgtg 1440
atcgcctccg agcgcccgat gatgcgcaag ttcatcgtgg acaccgtgac ctactgggtg 1500
aaggagtacc acatcgacgg cttccgcttc gaccagatgg gcctcatcga caagaagacc 1560
atgctggagg tggagcgcgc cctccacaag atcgacccga ccatcatcct ctacggcgag 1620
ccgtggggcg gctggggggc cccgatccgc ttcggcaagt ccgacgtggc cggcacccac 1680
gtggccgcct tcaacgacga gttccgcgac gccatccgcg gctccgtgtt caacccgtcc 1740
gtgaagggct tcgtgatggg cggctacggc aaggagacca agatcaagcg cggcgtggtg 1800
ggctccatca actacgacgg caagctcatc aagtccttcg ccctcgaccc ggaggagacc 1860
atcaactacg ccgcctgcca cgacaaccac accctctggg acaagaacta cctcgccgcc 1920
aaggccgaca agaagaagga gtggaccgag gaggagctga agaacgccca gaagctcgcc 1980
ggcgccatcc tcctcactag tcagggcgtg ccgttcctcc acggcggcca ggacttctgc 2040
cgcaccacca acttcaacga caactcctac aacgccccga tctccatcaa cggcttcgac 2100
tacgagcgca agctccagtt catcgacgtg ttcaactacc acaagggcct catcaagctc 2160
cgcaaggagc acccggcctt ccgcctcaag aacgccgagg agatcaagaa gcacctggag 2220
ttcctcccgg gcgggcgccg catcgtggcc ttcatgctca aggaccacgc cggcggcgac 2280
ccgtggaagg acatcgtggt gatctacaac ggcaacctgg agaagaccac ctacaagctc 2340
ccggagggca agtggaacgt ggtggtgaac tcccagaagg ccggcaccga ggtgatcgag 2400
accgtggagg gcaccatcga gctggacccg ctctccgcct acgtgctcta ccgcgagtcc 2460
gagaaggacg agctgtga                                               2478
<210>26
<211>718
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>26
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr
            25                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                   80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145               150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                 270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                 335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
        595                 600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660                 665                 670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu
705                 710                 715
<210>27
<21l>712
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>27
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr
            20                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                  80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145                 150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                 175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                 270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Set Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                 335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
        595                 600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660                 665                 670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu
705                 710
<210>28
<211>469
<212>PRT
<2l3>人工序列
<220>
<223>合成的
<400>28
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro
        35                  40                  45
Asn Glu Val lle Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
65                  70                  75                  80
Asp Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                 110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly
        115                 120                 125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys
225                 230                 235                 240
Lys Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu
                245                 250                 255
Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe
            260                 265                 270
Leu Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
     290                295                 300
Ala Arg Ile Leu GIy Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
        355                 360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg ser Phe Lys Glu Gly Ile Gly Lys Glu
                405                 410                 415
Ile Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
        435                 440                 445
Ser Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg Ser
    450                 455                 460
Glu Lys Asp Glu Leu
465
<210>29
<21l>469
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>29
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro
        35                  40                  45
Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
65                  70                  75                  80
Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                 110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly
        115                 120                 125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys
225                 230                 235                 240
Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu
                245                 250                 255
Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe
            260                 265                 270
Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
    290                 295                 300
Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
        355                 360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp
                405                 410                 415
Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
        435                 440                 445
Ser Leu lle Asn Ser Tyr lle Val Lys Thr Ile Leu Glu Leu Arg Ser
    450                 455                 460
Glu Lys Asp Glu Leu
465
<210>30
<211>463
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>30
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro
        35                  40                  45
Glu Glu lle Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
 65                 70                  75                  80
Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                 110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly
        115                 120                 125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys
225                 230                 235                 240
Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu
                245                 250                 255
Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe
            260                 265                 270
Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
    290                 295                300
Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
        355                 360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp
                405                 410                 415
Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
            435             440                 445
Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
    450                 455                 460
<210>31
<211>25
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>31
Met Gly Lys Asn Gly Asn Leu Cys Cys Phe Ser Leu Leu Leu Leu Leu
 1               5                  10                  15
Leu Ala Gly Leu Ala Ser Gly His Gln
            20                  25
<210>32
<211>30
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>32
Met Gly Phe Val Leu Phe Ser Gln Leu Pro Ser Phe Leu Leu Val Ser
 1              5                   10                  15
Thr Leu Leu Leu Phe Leu Val Ile Ser His Ser Cys Arg Ala
            20              25                  30
<210>33
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>33
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp lle Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu lle Trp lle His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                365
Glu Met Ile Phe Val Arg Asn Gly TyrGly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>34
<211>825
<212>PRT
<2l3>人工序列
<220>
<223>合成的
<400>34
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe
            20                  25                  30
Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met
        35                  40                  45
Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala
    50                  55                  60
Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala
65                  70                  75                  80
Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro
                85                  90                  95
Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val
            100                 105                 110
Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu
        115                 120                 125
Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu
    130                 135                 140
Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val
145                 150                 155                 160
Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu
                165                 170                 175
Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu
            180                 185                 190
Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu
        195                 200                 205
Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val
    210                 215                 220
Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn
225                 230                 235                 240
Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp
                245                 250                  255
Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile
            260                 265                 270
Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln
        275                 280                 285
Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu
    290                 295                 300
Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr
305                 310                 315                 320
Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys
                325                 330                 335
Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro
            340                 345                 350
Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr
        355                 360                 365
His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu
    370                 375                 380
Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu
385                 390                 395                 400
Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His
                405                 410                 415
Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His
            420                 425                 430
Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile
        435                 440                 445
Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg
    450                 455                 460
Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val
465                 470                 475                 480
Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val
                485                 490                 495
Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln
            500                 505                 510
Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu
        515                 520                 525
His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly
    530                 535                 540
Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His
545                 550                 555                 560
Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val
                565                 570                 575
Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu
            580                 585                 590
Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys
        595                 600                 605
Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala
    610                 615                 620
Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala
625                 630                 635                 640
Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala
                645                 650                 655
Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe
            660                 665                 670
Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn
        675                 680                 685
Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys
    690                 695                 700
Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu
705                 710                 715                 720
Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys
                725                 730                 735
Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met
            740                 745                 750
Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile
        755                 760                 765
Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys
    770                 775                 780
Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu
785                 790                 795                 800
Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu
                805                 810                     815
Tyr Arg Glu Ser Glu Lys Asp Glu Leu
            820                 825
<2l0>35
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>35
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
 305                310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>36
<211>718
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>36
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr lle Lys lle Tyr Glu Asn Lys Gly Val Tyr
            20                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                  80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145                 150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                 175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                 270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                 335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val GIy Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
        595                 600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660                 665                 670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu
705                 710                 715
<2l0>37
<211>1434
<212>DNA
<213>海栖热袍菌
<400>37
atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60
accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa gatccagttc 120
gagggcaagg agtccaccaa cccgctcgcc ttccgcttct acgacccgaa cgaggtgatc 180
gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg 240
aacgagggcc gcgacccgtt cggcgacccg accgccgagc gcccgtggaa ccgcttctcc 300
gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc 360
aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc 420
gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc 480
aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc 540
gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc 600
ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc 660
tacgagaccc tcctcaacac cgacctcggc ctggagctgg agaacctcgc ccgcttcctc 720
cgcatggccg tggagtacgc caagaagatc ggcttcaccg gccagttcct catcgagccg 780
aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc 840
ctcaagaacc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc 900
ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc 960
tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc 1020
aacatctacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag 1080
ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc 1140
atcggccaca tcgccggcat ggacaccttc gccctcggct tcaagatcgc ctacaagctc 1200
gccaaggacg gcgtgttcga caagttcatc gaggagaagt accgctcctt caaggagggc 1260
atcggcaagg agatcgtgga gggcaagacc gacttcgaga agctggagga gtacatcatc 1320
gacaaggagg acatcgagct gccgtccggc aagcaggagt acctggagtc cctcctcaac 1380
tcctacatcg tgaagaccat cgccgagctg cgctccgaga aggacgagct gtga       1434
<210>38
<211>477
<212>PRT
<213>海栖热袍菌
<400>38
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser
 1               5                  10                  15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe
            20                  25                  30
Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro
        35                  40                  45
Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val lle Asp Gly Lys Pro
    50                  55                  60
Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val
65                  70                  75                  80
Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Glu Arg Pro Trp
                85                  90                  95
Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala
            100                 105                 110
Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His
        115                 120                 125
Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys
    130                 135                 140
Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser
145                 150                 155                 160
Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg
                165                 170                 175
Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr
            180                 185                 190
Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly
        195                 200                 205
Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu
    210                 215                 220
Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn Leu Ala Arg Phe Leu
225                 230                 235                 240
Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly Phe Thr Gly Gln Phe
                245                 250                 255
Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe
            260                 265                 270
Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn His Gly Leu Asp Glu
        275                 280                 285
Tyr Phe Lys Phe Asn Ile Glu Ala Ash His Ala Thr Leu Ala Gly His
    290                 295                 300
Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly
305                 310                 315                 320
Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp
                325                 330                 335
Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val
            340                 345                 350
Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys
        355                 360                 365
Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile
    370                 375                 380
Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Ile Ala Tyr Lys Leu
385                 390                 395                 400
Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser
                405                 410                 415
Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu Gly Lys Thr Asp Phe
            420                 425                 430
Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Asp Ile Glu Leu Pro
        435                 440                 445
Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu Asn Ser Tyr Ile Val
    450                 455                 460
Lys Thr Ile Ala Glu Leu Arg Ser Glu Lys Asp Glu Leu
465                 470                 475
<210>39
<211>1434
<212>DNA
<213>那不勒斯栖热袍菌
<400>39
atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60
accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa ggtgcagttc 120
gagggcaagg agtccaccaa cccgctcgcc ttcaagttct acgacccgga ggagatcatc 180
gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg 240
aacgagggcc gcgacccgtt cggcgacccg accgccgacc gcccgtggaa ccgctacacc 300
gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc 360
aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc 420
gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc 480
aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc 540
gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc 600
ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc 660
tacgagaccc tcctcaacac cgacctcggc ttcgagctgg agaacctcgc ccgcttcctc 720
cgcatggccg tggactacgc caagcgcatc ggcttcaccg gccagttcct catcgagccg 780
aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc 840
ctcaagtccc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc 900
ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc 960
tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc 1020
aacgtgtacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag 1080
ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc 1140
atcggccaca tcgccggcat ggacaccttc gccctcggct tcaaggtggc ctacaagctc 1200
gtgaaggacg gcgtgctcga caagttcatc gaggagaagt accgctcctt ccgcgagggc 1260
atcggccgcg acatcgtgga gggcaaggtg gacttcgaga agctggagga gtacatcatc 1320
gacaaggaga ccatcgagct gccgtccggc aagcaggagt acctggagtc cctcatcaac 1380
tcctacatcg tgaagaccat cctggagctg cgctccgaga aggacgagct gtga       1434
<210>40
<211>477
<212>PRT
<213>那不勒斯栖热袍菌
<400>  40
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser
 1               5                  10                  15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe
            20                  25                  30
Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro
        35                  40                  45
Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile Ile Asp Gly Lys Pro
    50                  55                  60
Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val
65                  70                  75                  80
Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Asp Arg Pro Trp
                85                  90                  95
Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala
            100                 105                 110
Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His
        115                 120                 125
Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys
    130                 135                 140
Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser
145                 150                 155                  160
Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg
                165                 170                 175
Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr
            180                 185                 190
Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly
        195                 200                 205
GIy Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu
    210                 215                 220
Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn Leu Ala Arg Phe Leu
225                 230                 235                 240
Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly Phe Thr Gly Gln Phe
                245                 250                 255
Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe
            260                 265                 270
Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser His Gly Leu Asp Glu
        275                 280                 285
Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His
    290                 295                 300
Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly
305                 310                 315                 320
Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp
                325                 330                 335
Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val
            340                 345                 350
Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys
        355                 360                 365
Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile
    370                 375                 380
Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Val Ala Tyr Lys Leu
385                 390                 395                 400
Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser
                405                 410                 415
Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu Gly Lys Val Asp Phe
            420                 425                 430
Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Thr Ile Glu Leu Pro
        435                 440                 445
Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile Asn Ser Tyr Ile Val
    450                 455                 460
Lys Thr lle Leu Glu Leu Arg Ser Glu Lys Asp Glu Leu
465                 470                 475
<210>41
<211>1435
<212>DNA
<213>海栖热袍菌
<400>41
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg 120
gagatcccga agatccagtt cgagggcaag gagtccacca acccgctcgc cttccgcttc 180
tacgacccga acgaggtgat cgacggcaag ccgctcaagg accacctcaa gttctccgtg 240
gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgag 300
cgcccgtgga accgcttctc cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc 360
ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc 420
cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca 480
aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc 540
acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg 600
ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt 660
tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ctggagctgg 720
agaacctcgc ccgcttcctc cgcatggccg tggagtacgc caagaagatc ggcttcaccg 780
gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gcttcgacgt 840
ggccaccgcc tacgccttcc tcaagaacca cggcctcgac gagtacttca agttcaacat 900
cgaggccaac cacgccaccc tcgccggcca caccttccag cacgagctgc gcatggcccg 960
catcctcggc aagctcggct ccatcgacgc caaccagggc gacctcctcc tcggctggga 1020
caccgaccag ttcccgacca acatctacga caccaccctc gccatgtacg aggtgatcaa 1080
ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc aaggtgcgcc gcgcctccta 1140
caaggtggag gacctcttca tcggccacat cgccggcatg gacaccttcg ccctcggctt 1200
caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac aagttcatcg aggagaagta 1260
ccgctccttc aaggagggca tcggcaagga gatcgtggag ggcaagaccg acttcgagaa 1320
gctggaggag tacatcatcg acaaggagga catcgagctg ccgtccggca agcaggagta 1380
cctggagtcc ctcctcaact cctacatcgt gaagaccatc gccgagctgc gctga      1435
<210>42
<211>478
<212>PRT
<213>海栖热袍菌
<400>42
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
 1               5                  10                  15
Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
            20                  25                  30
Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu
        35                  40                  45
Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn
    50                  55                  60
Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val
65                  70                  75                  80
Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp
                85                  90                  95
Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys
            100                 105                 110
Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn
        115                 120                 125
Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys
    130                 135                 140
Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile
145                 150                 155                 160
Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala
                165                 170                 175
Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys
            180                 185                 190
Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu
        195                 200                 205
Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly
    210                 215                 220
Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu
 225                230                 235                 240
Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys
                245                 250                 255
Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro
            260                 265                 270
Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu
        275                 280                 285
Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn
    290                 295                 300
His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala
305                 310                 315                 320
Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu
                325                 330                 335
Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr
            340                 345                 350
Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly
        355                 360                 365
Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu
    370                 375                 380
Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly
385                 390                 395                 400
Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe
                405                 410                 415
Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile
            420                 425                 430
Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp
        435                 440                 445
Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser
    450                 455                 460
Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg
465                 470                 475
<210>43
<211>1436
<212>DNA
<213>那不勒斯栖热袍菌
<400>43
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg 120
gagatcccga aggtgcagtt cgagggcaag gagtccacca acccgctcgc cttcaagttc 180
tacgacccgg aggagatcat cgacggcaag ccgctcaagg accacctcaa gttctccgtg 240
gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgac 300
cgcccgtgga accgctacac cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc 360
ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc 420
cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca 480
aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc 540
acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg 600
ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt 660
tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ttcgagctgg 720
agaacctcgc ccgcttcctc cgcatggccg tggactacgc caagcgcatc ggcttcaccg 780
gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gacttcgacg 840
tggccaccgc ctacgccttc ctcaagtccc acggcctcga cgagtacttc aagttcaaca 900
tcgaggccaa ccacgccacc ctcgccggcc acaccttcca gcacgagctg cgcatggccc 960
gcatcctcgg caagctcggc tccatcgacg ccaaccaggg cgacctcctc ctcggctggg 1020
acaccgacca gttcccgacc aacgtgtacg acaccaccct cgccatgtac gaggtgatca 1080
aggccggcgg cttcaccaag ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct 1140
acaaggtgga ggacctcttc atcggccaca tcgccggcat ggacaccttc gccctcggct 1200
tcaaggtggc ctacaagctc gtgaaggacg gcgtgctcga caagttcatc gaggagaagt 1260
accgctcctt ccgcgagggc atcggccgcg acatcgtgga gggcaaggtg gacttcgaga 1320
agctggagga gtacatcatc gacaaggaga ccatcgagct gccgtccggc aagcaggagt 1380
acctggagtc cctcatcaac tcctacatcg tgaagaccat cctggagctg cgctga     1436
<210>44
<211>478
<212>pRT
<213>那不勒斯栖热袍菌
<400>44
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
 1               5                   10                 15
Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
            20                  25                  30
Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu
        35                  40                  45
Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu
    50                  55                  60
Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val
65                  70                  75                  80
Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp
                85                  90                  95
Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys
            100                 105                 110
Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn
        115                 120                 125
Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys
    130                 135                 140
Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile
145                 150                 155                 160
Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala
                165                 170                 175
Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys
            180                 185                 190
Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu
        195                 200                 205
Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly
    210                 215                 220
Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu
225                 230                 235                 240
Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg
                245                 250                 255
Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro
            260                 265                 270
Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu
        275                 280                 285
Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn
    290                 295                 300
HiS Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala
305                 310                 315                 320
Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu
                325                 330                 335
Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr
            340                 345                 350
Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly
        355                 360                 365
Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu
    370                 375                 380
Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly
385                 390                 395                 400
Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe
                405                 410                 415
Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile
            420                 425                 430
Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp
        435                 440                 445
Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser
    450                 455                 460
Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
465                 470                 475
<210>45
<211>1095
<212>PRT
<213>Aspergillus shirousami
<400>45
Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser lle Tyr Phe Leu Leu Thr
 1               5                  10                  15
Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Thr Cys Asn Thr
            20                  25                  30
Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile Asp Lys
        35              40                      45
Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile Thr Pro
    50                  55                  60
Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly Asp Ala Tyr His
65                  70                  75                  80
Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu Asn Tyr Gly Thr
                85                  90                  95
Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His Glu Arg Gly Met
            100                 105                 110
Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asp Gly Ala
        115                 120                 125
Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe Ser Ser Gln Asp
    130                 135                 140
Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu Asp Gln Thr Gln
145                 150                 155                 160
Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser Leu Pro Asp Leu
                165                 170                 175
Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr Asp Trp Val Gly
            180                 185                 190
Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Ile Asp Thr Val
        195                 200                 205
Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala Ala Gly
    210                 215                 220
Val Tyr Cys Ile Gly Glu Val Leu Asp Val Asp Pro Ala Tyr Thr Cys
225                 230                 235                 240
Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr Pro Ile Tyr Tyr
                245                 250                 255
Pro Leu Leu Asn Ala Phe Lys ser Thr Ser Gly Ser Met Asp Asp Leu
            260                 265                     270
Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro Asp Ser Thr Leu
        275                 280                 285
Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg Phe Ala Ser Tyr
    290                 295                 300
Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala Phe Ile Ile Leu
305                 310                 315                 320
Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu Gln His Tyr Ala
                325                 330                 335
Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp Leu Ser Gly Tyr
            340                 345                 350
Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser Ala Asn Ala Ile
        355                 360                 365
Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val Thr Tyr Lys Asn
    370                 375                 380
Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met Arg Lys Gly Thr
385                 390                 395                 400
Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys Gly Ala Ser Gly
                405                 410                 415
Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr Thr Ala Gly Gln
            420                 425                 430
Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr Val Gly Ser Asp
        435                 440                 445
Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro Arg Val Leu Tyr
    450                 455                 460
Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser Ser Ser Lys Pro
465                 470                 475                 480
Ala Thr Leu Asp Ser Trp Leu Ser Asn Glu Ala Thr Val Ala Arg Thr
                485                 490                 495
Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ala Trp Val Ser Gly Ala
            500                 505                 510
Asp Ser Gly Ile Val Val Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr
        515                 520                 525
Phe Tyr Thr Trp Thr Arg Asp Ser Gly Ile Val Leu Lys Thr Leu Val
    530                 535                 540
Asp Leu Phe Arg Asn Gly Asp Thr Asp Leu Leu Ser Thr Ile Glu His
545                 550                 555                 560
Tyr Ile Ser Ser Gln Ala Ile Ile Gln Gly Val Ser Asn Pro Ser Gly
                565                 570                 575
Asp Leu Ser Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu
            580                 585                 590
Thr Ala Tyr Ala Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala
        595                 600                 605
Leu Arg Ala Thr Ala Met Ile Gly Phe Gly Gln Trp Leu Leu Asp Asn
    610                 615                 620
Gly Tyr Thr Ser Ala Ala Thr Glu Ile Val Trp Pro Leu Val Arg Asn
625             630                     635                 640
Asp Leu Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu
                645                 650                 655
Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His
            660                 665                 670
Arg Ala Leu Val Glu Gly Ser Ala Phe Ala Thr Ala Val Gly Ser Ser
        675                 680                 685
Cys Ser Trp Cys Asp Ser Gln Ala Pro Gln Ile Leu Cys Tyr Leu Gln
    690                 695                 700
Ser Phe Trp Thr Gly Ser Tyr Ile Leu Ala Asn Phe Asp Ser Ser Arg
705                 710                 715                 720
Ser Gly Lys Asp Thr Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp
                725                 730                 735
Pro Glu Ala Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg
            740                 745                 750
Ala Leu Ala Asn His Lys Glu Val Val Asp Ser Phe Arg Ser Ile Tyr
        755                 760                 765
Thr Leu Asn Asp Gly Leu Ser Asp Ser Glu Ala Val Ala Val Gly Arg
    770                 775                 780
Tyr Pro Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Cys Thr
785                 790                 795                 800
Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Lys
                805                 810                 815
Gln Gly Ser Leu Glu Ile Thr Asp Val Ser Leu Asp Phe Phe Lys Ala
            820                 825                 830
Leu Tyr Ser Gly Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser Thr
        835                 840                 845
Tyr Ser Ser Ile Val Ser Ala Val Lys Thr Phe Ala Asp Gly Phe Val
    850                 855                 860
Ser Ile Val Glu Thr His Ala Ala Ser Asn Gly Ser Leu Ser Glu Gln
865                 870                 875                 880
Phe Asp Lys Ser Asp Gly Asp Glu Leu Ser Ala Arg Asp Leu Thr Trp
                885                 890                 895
Ser Tyr Ala Ala Leu Leu Thr Ala Asn Asn Arg Arg Asn Ser Val Val
            900                 905                 910
Pro Pro Ser Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr Cys
        915                 920                 925
Ala Ala Thr Ser Ala Ser GIy Thr Tyr Ser Ser Val Thr Val Thr Ser
    930                 935                 940
Trp Pro Ser Ile Val Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr
945                 950                 955                 960
Thr Gly Ser Gly Gly Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala
                965                 970                 975
Ser Lys Thr Ser Thr Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr
                     980                985                 990
Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu
        995                 1000                1005
Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr
    1010                1015                1020
Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asn Pro
1025                1030                1035                1040
Pro Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr
                1045                1050                1055
Lys Phe Ile Arg Val Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp
            1060            1065                    1070
Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Glu Ser Thr Ala
        1075                1080                1085
Thr Val Thr Asp Thr Trp Arg
    1090                1095
<210>46
<211>3285
<212>DNA
<213>Aspergillus shirousami
<400>46
gccaccccgg ccgactggcg ctcccagtcc atctacttcc tcctcaccga ccgcttcgcc 60
cgcaccgacg gctccaccac cgccacctgc aacaccgccg accagaagta ctgcggcggc 120
acctggcagg gcatcatcga caagctcgac tacatccagg gcatgggctt caccgccatc 180
tggatcaccc cggtgaccgc ccagctcccg cagaccaccg cctacggcga cgcctaccac 240
ggctactggc agcaggacat ctactccctc aacgagaact acggcaccgc cgacgacctc 300
aaggccctct cctccgccct ccacgagcgc ggcatgtacc tcatggtgga cgtggtggcc 360
aaccacatgg gctacgacgg cgccggctcc tccgtggact actccgtgtt caagccgttc 420
tcctcccagg actacttcca cccgttctgc ttcatccaga actacgagga ccagacccag 480
gtggaggact gctggctcgg cgacaacacc gtgtccctcc cggacctcga caccaccaag 540
gacgtggtga agaacgagtg gtacgactgg gtgggctccc tcgtgtccaa ctactccatc 600
gacggcctcc gcatcgacac cgtgaagcac gtgcagaagg acttctggcc gggctacaac 660
aaggccgccg gcgtgtactg catcggcgag gtgctcgacg tggacccggc ctacacctgc 720
ccgtaccaga acgtgatgga cggcgtgctc aactacccga tctactaccc gctcctcaac 780
gccttcaagt ccacctccgg ctcgatggac gacctctaca acatgatcaa caccgtgaag 840
tccgactgcc cggactccac cctcctcggc accttcgtgg agaaccacga caacccgcgc 900
ttcgcctcct acaccaacga catcgccctc gccaagaacg tggccgcctt catcatcctc 960
aacgacggca tcccgatcat ctacgccggc caggagcagc actacgccgg cggcaacgac 1020
ccggccaacc gcgaggccac ctggctctcc ggctacccga ccgactccga gctgtacaag 1080
ctcatcgcct ccgccaacgc catccgcaac tacgccatct ccaaggacac cggcttcgtg 1140
acctacaaga actggccgat ctacaaggac gacaccacca tcgccatgcg caagggcacc 1200
gacggctccc agatcgtgac catcctctcc aacaagggcg cctccggcga ctcctacacc 1260
ctctccctct ccggcgccgg ctacaccgcc ggccagcagc tcaccgaggt gatcggctgc 1320
accaccgtga ccgtgggctc cgacggcaac gtgccggtgc cgatggccgg cggcctcccg 1380
cgcgtgctct acccgaccga gaagctcgcc ggctccaaga tatgctcctc ctccaagccg 1440
gccaccctcg actcctggct ctccaacgag gccaccgtgg cccgcaccgc catcctcaac 1500
aacatcggcg ccgacggcgc ctgggtgtcc ggcgccgact ccggcatcgt ggtggcctcc 1560
ccgtccaccg acaacccgga ctacttctac acctggaccc gcgactccgg catcgtgctc 1630
aagaccctcg tggacctctt ccgcaacggc gacaccgacc tcctctccac catcgagcac 1680
tacatctcct cccaggccat catccagggc gtgtccaacc cgtccggcga cctctcctcc 1740
ggcggcctcg gcgagccgaa gttcaacgtg gacgagaccg cctacgccgg ctcctggggc 1800
cgcccgcagc gcgacggccc ggccctccgc gccaccgcca tgatcggctt cggccagtgg 1860
ctcctcgaca acggctacac ctccgccgcc accgagatcg tgtggccgct cgtgcgcaac 1920
gacctctcct acgtggccca gtactggaac cagaccggct acgacctctg ggaggaggtg 1980
aacggctcct ccttcttcac catcgccgtg cagcaccgcg ccctcgtgga gggctccgcc 2040
ttcgccaccg ccgtgggctc ctcctgctcc tggtgcgact cccaggcccc gcagatcctc 2100
tgctacctcc agtccttctg gaccggctcc tacatcctcg ccaacttcga ctcctcccgc 2160
tccggcaagg acaccaacac cctcctcggc tccatccaca ccttcgaccc ggaggccggc 2220
tgcgacgact ccaccttcca gccgtgctcc ccgcgcgccc tcgccaacca caaggaggtg 2280
gtggactcct tccgctccat ctacaccctc aacgacggcc tctccgactc cgaggccgtg 2340
gccgtgggcc gctacccgga ggactcctac tacaacggca acccgtggtt cctctgcacc 2400
ctcgccgccg ccgagcagct ctacgacgcc ctctaccagt gggacaagca gggctccctg 2460
gagatcaccg acgtgtccct cgacttcttc aaggccctct actccggcgc cgccaccggc 2520
acctactcct cctcctcctc cacctactcc tccatcgtgt ccgccgtgaa gaccttcgcc 2580
gacggcttcg tgtccatcgt ggagacccac gccgcctcca acggctccct ctccgagcag 2640
ttcgacaagt ccgacggcga cgagctgtcc gcccgcgacc tcacctggtc ctacgccgcc 2700
ctcctcaccg ccaacaaccg ccgcaactcc gtggtgccgc cgtcctgggg cgagacctcc 2760
gcctcctccg tgccgggcac ctgcgccgcc acctccgcct ccggcaccta ctcctccgtg 2820
accgtgacct cctggccgtc catcgtggcc accggcggca ccaccaccac cgccaccacc 2880
accggctccg gcggcgtgac ctccacctcc aagaccacca ccaccgcctc caagacctcc 2940
accaccacct cctccacctc ctgcaccacc ccgaccgccg tggccgtgac cttcgacctc 3000
accgccacca ccacctacgg cgagaacatc tacctcgtgg gctccatctc ccagctcggc 3060
gactgggaga cctccgacgg catcgccctc tccgccgaca agtacacctc ctccaacccg 3120
ccgtggtacg tgaccgtgac cctcccggcc ggcgagtcct tcgagtacaa gttcatccgc 3180
gtggagtccg acgactccgt ggagtgggag tccgacccga accgcgagta caccgtgccg 3240
caggcctgcg gcgagtccac cgccaccgtg accgacacct ggcgc                 3285
<210>47
<211>679
<212>PRT
<213>Thermoanaerobacterium thermosaccharolyticum
<400>47
Val Leu Ser Gly Cys Ser Asn Asn Val Ser Ser Ile Lys Ile Asp Arg
 1               5                  10                  15
Phe Asn Asn Ile Ser Ala Val Asn Gly Pro Gly Glu Glu Asp Thr Trp
            20                  25                  30
Ala Ser Ala Gln Lys Gln Gly Val Gly Thr Ala Asn Asn Tyr Val Ser
        35                  40                  45
Arg Val Trp Phe Thr Leu Ala Asn Gly Ala Ile Ser Glu Val Tyr Tyr
    50                  55                  60
Pro Thr Ile Asp Thr Ala Asp Val Lys Glu Ile Lys Phe Ile Val Thr
65                  70                  75                  80
Asp Gly Lys Ser Phe Val Ser Asp Glu Thr Lys Asp Ala Ile Ser Lys
                85                  90                  95
Val Glu Lys Phe Thr Asp Lys Ser Leu Gly Tyr Lys Leu Val Asn Thr
            100                 105                 110
Asp Lys Lys Gly Arg Tyr Arg Ile Thr Lys Glu Ile Phe Thr Asp Val
        115                 120                 125
Lys Arg Asn Ser Leu Ile Met Lys Ala Lys Phe Glu Ala Leu Glu Gly
    130                 135                 140
Ser Ile His Asp Tyr Lys Leu Tyr Leu Ala Tyr Asp Pro His Ile Lys
145                 150                 155                 160
Asn Gln Gly Ser Tyr Asn Glu Gly Tyr Val Ile Lys Ala Asn Asn Asn
                165                 170                 175
Glu Met Leu Met Ala Lys Arg Asp Asn Val Tyr Thr Ala Leu Ser Ser
            180                 185                 190
Asn Ile Gly Trp Lys Gly Tyr Ser Ile Gly Tyr Tyr Lys Val Asn Asp
        195                 200                 205
Ile Met Thr Asp Leu Asp Glu Asn Lys Gln Met Thr Lys His Tyr Asp
    210                 215                 220
Ser Ala Arg Gly Asn Ile Ile Glu Gly Ala Glu Ile Asp Leu Thr Lys
225                 230                 235                 240
Asn Ser Glu Phe Glu Ile Val Leu Ser Phe Gly Gly Ser Asp Ser Glu
                245                 250                 255
Ala Ala Lys Thr Ala Leu Glu Thr Leu Gly Glu Asp Tyr Asn Asn Leu
            260                 265                 270
Lys Asn Asn Tyr Ile Asp Glu Trp Thr Lys Tyr Cys Asn Thr Leu Asn
        275                 280                 285
Asn Phe Asn Gly Lys Ala Asn Ser Leu Tyr Tyr Asn Ser Met Met Ile
    290                 295                 300
Leu Lys Ala Ser Glu Asp Lys Thr Asn Lys Gly Ala Tyr Ile Ala Ser
305                 310                 315                 320
Leu Ser Ile Pro Trp Gly Asp Gly Gln Arg Asp Asp Asn Thr Gly Gly
                325                 330                 335
Tyr His Leu Val Trp Ser Arg Asp Leu Tyr His Val Ala Asn Ala Phe
            340                 345                 350
Ile Ala Ala Gly Asp Val Asp Ser Ala Asn Arg Ser Leu Asp Tyr Leu
        355                 360                 365
Ala Lys Val Val Lys Asp Asn Gly Met Ile Pro Gln Asn Thr Trp Ile
    370                 375                 380
Ser Gly Lys Pro Tyr Trp Thr Ser Ile Gln Leu Asp Glu Gln Ala Asp
385                 390                 395                 400
Pro Ile Ile Leu Ser Tyr Arg Leu Lys Arg Tyr Asp Leu Tyr Asp Ser
                405                 410                 415
Leu Val Lys Pro Leu Ala Asp Phe Ile Ile Lys Ile Gly Pro Lys Thr
            420                 425                 430
Gly Gln Glu Arg Trp Glu Glu Ile Gly Gly Tyr Ser Pro Ala Thr Met
        435                 440                 445
Ala Ala Glu Val Ala Gly Leu Thr Cys Ala Ala Tyr Ile Ala Glu Gln
    450                 455                 460
Asn Lys Asp Tyr Glu Ser Ala Gln Lys Tyr Gln Glu Lys Ala Asp Asn
465                 470                 475                 480
Trp Gln Lys Leu Ile Asp Asn Leu Thr Tyr Thr Glu Asn Gly Pro Leu
                485                 490                 495
Gly Asn Gly Gln Tyr Tyr Ile Arg Ile Ala Gly Leu Ser Asp Pro Asn
            500                 505                 510
Ala Asp Phe Met Ile Asn Ile Ala Asn Gly Gly Gly Val Tyr Asp Gln
        515                 520                 525
Lys Glu Ile Val Asp Pro Ser Phe Leu Glu Leu Val Arg Leu Gly Val
    530                 535                 540
Lys Ser Ala Asp Asp Pro Lys Ile Leu Asn Thr Leu Lys Val Val Asp
545                 550                 555                 560
Ser Thr Ile Lys Val Asp Thr Pro Lys Gly Pro Ser Trp Tyr Arg Tyr
                565                 570                 575
Asn His Asp Gly Tyr Gly Glu Pro Ser Lys Thr Glu Leu Tyr His Gly
            580                 585                 590
Ala Gly Lys Gly Arg Leu Trp Pro Leu Leu Thr Gly Glu Arg Gly Met
        595                 600                 605
Tyr Glu Ile Ala Ala Gly Lys Asp Ala Thr Pro Tyr Val Lys Ala Met
    610                 615                 620
Glu Lys Phe Ala Asn Glu Gly Gly Ile Ile Ser Glu Gln Val Trp Glu
625                 630                 635                 640
Asp Thr Gly Leu Pro Thr Asp Ser Ala Ser Pro Leu Asn Trp Ala His
                645                 650                 655
Ala Glu Tyr Val Ile Leu Phe Ala Ser Asn Ile Glu His Lys Val Leu
            660                 665                 670
Asp Met Pro Asp Ile Val Tyr
        675
<210>48
<211>2037
<212>DNA
<213>Thermoanaerobacterium thermosaccharolyticum
<220>
<223>合成的
<400>48
gtgctctccg gctgctccaa caacgtgtcc tccatcaaga tcgaccgctt caacaacatc 60
tccgccgtga acggcccggg cgaggaggac acctgggcct ccgcccagaa gcagggcgtg 120
ggcaccgcca acaactacgt gtcccgcgtg tggttcaccc tcgccaacgg cgccatctcc 180
gaggtgtact acccgaccat cgacaccgcc gacgtgaagg agatcaagtt catcgtgacc 240
gacggcaagt ccttcgtgtc cgacgagacc aaggacgcca tctccaaggt ggagaagttc 300
accgacaagt ccctcggcta caagctcgtg aacaccgaca agaagggccg ctaccgcatc 360
accaaggaaa tcttcaccga cgtgaagcgc aactccctca tcatgaaggc caagttcgag 420
gccctcgagg gctccatcca cgactacaag ctctacctcg cctacgaccc gcacatcaag 480
aaccagggct cctacaacga gggctacgtg atcaaggcca acaacaacga gatgctcatg 540
gccaagcgcg acaacgtgta caccgccctc tcctccaaca tcggctggaa gggctactcc 600
atcggctact acaaggtgaa cgacatcatg accgacctcg acgagaacaa gcagatgacc 660
aagcactacg actccgcccg cggcaacatc atcgagggcg ccgagatcga cctcaccaag 720
aactccgagt tcgagatcgt gctctccttc ggcggctccg actccgaggc cgccaagacc 780
gccctcgaga ccctcggcga ggactacaac aacctcaaga acaactacat cgacgagtgg 840
accaagtact gcaacaccct caacaacttc aacggcaagg ccaactccct ctactacaac 900
tccatgatga tcctcaaggc ctccgaggac aagaccaaca agggcgccta catcgcctcc 960
ctctccatcc cgtggggcga cggccagcgc gacgacaaca ccggcggcta ccacctcgtg 1020
tggtcccgcg acctctacca cgtggccaac gccttcatcg ccgccggcga cgtggactcc 1080
gccaaccgct ccctcgacta cctcgccaag gtggtgaagg acaacggcat gatcccgcag 1140
aacacctgga tctccggcaa gccgtactgg acctccatcc agctcgacga gcaggccgac 1200
ccgatcatcc tctcctaccg cctcaagcgc tacgacctct acgactccct cgtgaagccg 1260
ctcgccgact tcatcatcaa gatcggcccg aagaccggcc aggagcgctg ggaggagatc 1320
ggcggctact ccccggccac gatggccgcc gaggtggccg gcctcacctg cgccgcctac 1380
atcgccgagc agaacaagga ctacgagtcc gcccagaagt accaggagaa ggccgacaac 1440
tggcagaagc tcatcgacaa cctcacctac accgagaacg gcccgctcgg caacggccag 1500
tactacatcc gcatcgccgg cctctccgac ccgaacgccg acttcatgat caacatcgcc 1560
aacggcggcg gcgtgtacga ccagaaggag atcgtggacc cgtccttcct cgagctggtg 1620
cgcctcggcg tgaagtccgc cgacgacccg aagatcctca acaccctcaa ggtggtggac 1680
tccaccatca aggtggacac cccgaagggc ccgtcctggt atcgctacaa ccacgacggc 1740
tacggcgagc cgtccaagac cgagctgtac cacggcgccg gcaagggccg cctctggccg 1800
ctcctcaccg gcgagcgcgg catgtacgag atcgccgccg gcaaggacgc caccccgtac 1860
gtgaaggcga tggagaagtt cgccaacgag ggcggcatca tctccgagca ggtgtgggag 1920
gacaccggcc tcccgaccga ctccgcctcc ccgctcaact gggcccacgc cgagtacgtg 1980
atcctcttcg cctccaacat cgagcacaag gtgctcgaca tgccggacat cgtgtac    2037
<210>49
<211>579
<212>PRT
<213>Rhizopus oryzae
<400>49
Ala Ser Ile Pro Ser Ser Ala Ser Val Gln Leu Asp Ser Tyr Asn Tyr
 1               5                  10                  15
Asp Gly Ser Thr Phe Ser Gly Lys Ile Tyr Val Lys Asn Ile Ala Tyr
            20                  25                  30
Ser Lys Lys Val Thr Val Ile Tyr Ala Asp Gly Ser Asp Asn Trp Asn
        35                  40                  45
Asn Asn Gly Asn Thr Ile Ala Ala Ser Tyr Ser Ala Pro Ile Ser Gly
    50                  55                  60
Ser Asn Tyr Glu Tyr Trp Thr Phe Ser Ala Ser Ile Asn Gly Ile Lys
65              70                      75                  80
Glu Phe Tyr Ile Lys Tyr Glu Val Ser Gly Lys Thr Tyr Tyr Asp Asn
                85                  90                  95
Asn Asn Ser Ala Asn Tyr Gln Val Ser Thr Ser Lys Pro Thr Thr Thr
            100                 105                 110
Thr Ala Thr Ala Thr Thr Thr Thr Ala Pro Ser Thr Ser Thr Thr Thr
            115             120                 125
Pro Pro Ser Arg Ser Glu Pro Ala Thr Phe Pro Thr Gly Asn Ser Thr
    130                 135                 140
Ile Ser Ser Trp Ile Lys Lys Gln Glu Gly Ile Ser Arg Phe Ala Met
145                 150                 155                 160
Leu Arg Asn Ile Asn Pro Pro Gly Ser Ala Thr Gly Phe Ile Ala Ala
                165                 170                 175
Ser Leu Ser Thr Ala Gly Pro Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp
            180                 185                 190
Ala Ala Leu Thr Ser Asn Val Ile Val Tyr Glu Tyr Asn Thr Thr Leu
        195                 200                 205
Ser Gly Asn Lys Thr Ile Leu Asn Val Leu Lys Asp Tyr Val Thr Phe
    210                 21S                 220
Ser Val Lys Thr Gln Ser Thr Ser Thr Val Cys Asn Cys Leu Gly Glu
225                 230                 235                 240
Pro Lys Phe Asn Pro Asp Ala Ser Gly Tyr Thr Gly Ala Trp Gly Arg
                245                 250                 255
Pro Gln Asn Asp Gly Pro Ala Glu Arg Ala Thr Thr Phe Ile Leu Phe
            260                 265                 270
Ala Asp Ser Tyr Leu Thr Gln Thr Lys Asp Ala Ser Tyr Val Thr Gly
        275                 280                 285
Thr Leu Lys Pro Ala Ile Phe Lys Asp Leu Asp Tyr Val Val Asn Val
    290                 295                 300
Trp Ser Asn Gly Cys Phe Asp Leu Trp Glu Glu Val Asn Gly Val His
305                 310                 315                 320
Phe Tyr Thr Leu Met Val Met Arg Lys Gly Leu Leu Leu Gly Ala Asp
                325                 330                 335
Phe Ala Lys Arg Asn Gly Asp Ser Thr Arg Ala Ser Thr Tyr Ser Ser
            340                 345                 350
Thr Ala Ser Thr Ile Ala Asn Lys Ile Ser Ser Phe Trp Val Ser Ser
        355                 360                 365
Asn Asn Trp Ile Gln Val Ser Gln Ser Val Thr Gly Gly Val Ser Lys
    370                 375                 380
Lys Gly Leu Asp Val Ser Thr Leu Leu Ala Ala Asn Leu Gly Ser Val
385                 390                 395                 400
Asp Asp Gly Phe Phe Thr Pro Gly Ser Glu Lys Ile Leu Ala Thr Ala
                405                 410                 415
Val Ala Val Glu Asp Ser Phe Ala Ser Leu Tyr Pro Ile Asn Lys Asn
            420                 425                 430
Leu Pro Ser Tyr Leu Gly Asn Ser Ile Gly Arg Tyr Pro Glu Asp Thr
        435                 440                 445
Tyr Asn Gly Asn Gly Asn Ser Gln Gly Asn Ser Trp Phe Leu Ala Val
    450                 455                 460
Thr Gly Tyr Ala Glu Leu Tyr Tyr Arg Ala Ile Lys Glu Trp Ile Gly
465                 470                 475                 480
Asn Gly Gly Val Thr Val Ser Ser Ile Ser Leu Pro Phe Phe Lys Lys
                485                 490                 495
Phe Asp Ser Ser Ala Thr Ser Gly Lys Lys Tyr Thr Val Gly Thr Ser
            500                 505                 510
Asp Phe Asn Asn Leu Ala Gln Asn Ile Ala Leu Ala Ala Asp Arg Phe
        515                 520                 525
Leu Ser Thr Val Gln Leu His Ala His Asn Asn Gly Ser Leu Ala Glu
    530                 535                 540
Glu Phe Asp Arg Thr Thr Gly Leu Ser Thr Gly Ala Arg Asp Leu Thr
545                 550                 555                 560
Trp Ser His Ala Ser Leu Ile Thr Ala Ser Tyr Ala Lys Ala Gly Ala
                565                 570                 575
Pro Ala Ala
<210>50
<211>1737
<212>DNA
<213>Rhizopus oryzae
<400>50
gcctccatcc cgtcctccgc ctccgtgcag ctcgactcct acaactacga cggctccacc 60
ttctccggca aaatctacgt gaagaacatc gcctactcca agaaggtgac cgtgatctac 120
gccgacggct ccgacaactg gaacaacaac ggcaacacca tcgccgcctc ctactccgcc 180
ccgatctccg gctccaacta cgagtactgg accttctccg cctccatcaa cggcatcaag 240
gagttctaca tcaagtacga ggtgtccggc aagacctact acgacaacaa caactccgcc 300
aactaccagg tgtccacctc caagccgacc accaccaccg ccaccgccac caccaccacc 360
gccccgtcca cctccaccac caccccgccg tcccgctccg agccggccac cttcccgacc 420
ggcaactcca ccatctcctc ctggatcaag aagcaggagg gcatctcccg cttcgccatg 480
ctccgcaaca tcaacccgcc gggctccgcc accggcttca tcgccgcctc cctctccacc 540
gccggcccgg actactacta cgcccggacc cgcgacgccg ccctcacctc caacgtgatc 600
gtgtacgagt acaacaccac cctctccggc aacaagacca tcctcaacgt gctcaaggac 660
tacgtgacct tctccgtgaa gacccagtcc acctccaccg tgtgcaactg cctcggcgag 720
ccgaagttca acccggacgc ctccggctac accggcgcct ggggccgccc gcagaacgac 780
ggcccggccg agcgcgccac caccttcatc ctcttcgccg actcctacct cacccagacc 840
aaggacgcct cctacgtgac cggcaccctc aagccggcca tcttcaagga cctcgactac 900
gtggtgaacg tgtggtccaa cggctgcttc gacctctggg aggaggtgaa cggcgtgcac 960
ttctacaccc tcatggtgat gcgcaagggc ctcctcctcg gcgccgactt cgccaagcgc 1020
aacggcgact ccacccgcgc ctccacctac tcctccaccg cctccaccat cgccaacaaa 1080
atctcctcct tctgggtgtc ctccaacaac tggatacagg tgtcccagtc cgtgaccggc 1140
ggcgtgtcca agaagggcct cgacgtgtcc accctcctcg ccgccaacct cggctccgtg 1200
gacgacggct tcttcacccc gggctccgag aagatcctcg ccaccgccgt ggccgtggag 1260
gactccttcg cctccctcta cccgatcaac aagaacctcc cgtcctacct cggcaactcc 1320
atcggccgct acccggagga cacctacaac ggcaacggca actcccaggg caactcctgg 1380
ttcctcgccg tgaccggcta cgccgagctg tactaccgcg ccatcaagga gtggatcggc 1440
aacggcggcg tgaccgtgtc ctccatctcc ctcccgttct tcaagaagtt cgactcctcc 1500
gccacctccg gcaagaagta caccgtgggc acctccgact tcaacaacct cgcccagaac 1560
atcgccctcg ccgccgaccg cttcctctcc accgtgcagc tccacgccca caacaacggc 1620
tccctcgccg aggagttcga ccgcaccacc ggcctctcca ccggcgcccg cgacctcacc 1680
tggtcccacg cctccctcat caccgcctcc tacgccaagg ccggcgcccc ggccgcc    1737
<210>51
<211>439
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>51
Met Ala Lys His Leu Ala Ala Met Cys Trp Cys Ser Leu Leu Val Leu
 1               5                  10                  15
Val Leu Leu Cys Leu Gly Ser Gln Leu Ala Gln Ser Gln Val Leu Phe
            20                  25                  30
Gln Gly Phe Asn Trp Glu Ser Trp Lys Lys Gln Gly Gly Trp Tyr Asn
        35                  40              45
Tyr Leu Leu Gly Arg Val Asp Asp Ile Ala Ala Thr Gly Ala Thr His
    50                  55                  60
Val Trp Leu Pro Gln Pro Ser His Ser Val Ala Pro Gln Gly Tyr Met
65                  70                  75                  80
Pro Gly Arg Leu Tyr Asp Leu Asp Ala Ser Lys Tyr Gly Thr His Ala
                85                  90                  95
Glu Leu Lys Ser Leu Thr Ala Ala Phe His Ala Lys Gly Val Gln Cys
            100                 105                 110
Val Ala Asp Val Val Ile Asn His Arg Cys Ala Asp Tyr Lys Asp Gly
        115                 120                 125
Arg Gly Ile Tyr Cys Val Phe Glu Gly Gly Thr Pro Asp Ser Arg Leu
    130                 135                 140
Asp Trp Gly Pro Asp Met Ile Cys Ser Asp Asp Thr Gln Tyr Ser Asn
145                 150                 155                 160
Gly Arg Gly His Arg Asp Thr Gly Ala Asp Phe Ala Ala Ala Pro Asp
                165                 170                 175
Ile Asp His Leu Asn Pro Arg Val Gln Gln Glu Leu Ser Asp Trp Leu
            l80                 185                 190
Asn Trp Leu Lys ser Asp Leu Gly Phe Asp Gly Trp Arg Leu Asp Phe
        195                 200                 205
Ala Lys Gly Tyr Ser Ala Ala Val Ala Lys Val Tyr Val Asp Ser Thr
    210                 215                 220
Ala Pro Thr Phe Val Val Ala Glu Ile Trp Ser Ser Leu His Tyr Asp
225                 230                 235                 240
Gly Asn Gly Glu Pro Ser Ser Asn Gln Asp Ala Asp Arg Gln Glu Leu
                245                 250                 255
Val Asn Trp Ala Gln Ala Val Gly Gly Pro Ala Ala Ala Phe Asp Phe
            260                 265                 270
Thr Thr Lys Gly Val Leu Gln Ala Ala Val Gln Gly Glu Leu Trp Arg
            275             280                 285
Met Lys Asp Gly Asn Gly Lys Ala Pro Gly Met Ile Gly Trp Leu Pro
    290                 295                 300
Glu Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gly Ser Thr Gln
305                 310                 315                 320
Asn Ser Trp Pro Phe Pro Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr
                325                 330                 335
Ile Leu Thr His Pro Gly Thr Pro Cys Ile Phe Tyr Asp His Val Phe
            340                 345                 350
Asp Trp Asn Leu Lys Gln Glu Ile Ser Ala Leu Ser Ala Val Arg Ser
        355                 360                 365
Arg Asn Gly Ile His Pro Gly Ser Glu Leu Asn Ile Leu Ala Ala Asp
    370                 375                 380
Gly Asp Leu Tyr Val Ala Lys Ile Asp Asp Lys Val Ile Val Lys Ile
385                 390                 395                 400
Gly Ser Arg Tyr Asp Val Gly Asn Leu Ile Pro Ser Asp Phe His Ala
                405                 410                 415
Val Ala His Gly Asn Asn Tyr Cys Val Trp Glu Lys His Gly Leu Arg
            420                 425                 430
Val Pro Ala Gly Arg His His
        435
<210>52
<211>1320
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>52
atggcgaagc acttggctgc catgtgctgg tgcagcctcc tagtgcttgt actgctctgc 60
ttgggctccc agctggccca atcccaggtc ctcttccagg ggttcaactg ggagtcgtgg 120
aagaagcaag gtgggtggta caactacctc ctggggcggg tggacgacat cgccgcgacg 180
ggggccacgc acgtctggct cccgcagccg tcgcactcgg tggcgccgca ggggtacatg 240
cccggccggc tctacgacct ggacgcgtcc aagtacggca cccacgcgga gctcaagtcg 300
ctcaccgcgg cgttccacgc caagggcgtc cagtgcgtcg ccgacgtcgt gatcaaccac 360
cgctgcgccg actacaagga cggccgcggc atctactgcg tcttcgaggg cggcacgccc 420
gacagccgcc tcgactgggg ccccgacatg atctgcagcg acgacacgca gtactccaac 480
gggcgcgggc accgcgacac gggggccgac ttcgccgccg cgcccgacat cgaccacctc 540
aacccgcgcg tgcagcagga gctctcggac tggctcaact ggctcaagtc cgacctcggc 600
ttcgacggct ggcgcctcga ctccgccaag ggctactccg ccgccgtcgc caaggtgtac 660
gtcgacagca ccgcccccac cttcgtcgtc gccgagatat ggagctccct ccactacgac 720
ggcaacggcg agccgtccag caaccaggac gccgacaggc aggagctggt caactgggcg 780
caggcggtgg gcggccccgc cgcggcgttc gacttcacca ccaagggcgt gctgcaggcg 840
gccgtccagg gcgagctgtg gcgcatgaag gacggcaacg gcaaggcgcc cgggatgatc 900
ggctggctgc cggagaaggc cgtcacgttc gtcgacaacc acgacaccgg ctccacgcag 960
aactcgtggc cattcccctc cgacaaggtc atgcagggct acgcctatat cctcacgcac 1020
ccaggaactc catgcatctt ctacgaccac gttttcgact ggaacctgaa gcaggagatc 1080
agcgcgctgt ctgcggtgag gtcaagaaac gggatccacc cggggagcga gctgaacatc 1140
ctcgccgccg acggggatct ctacgtcgcc aagattgacg acaaggtcat cgtgaagatc 1200
gggtcacggt acgacgtcgg gaacctgatc ccctcagact tccacgccgt tgcccctggc 1260
aacaactact gcgtttggga gaagcacggt ctgagagttc cagcggggcg gcaccactag 1320
<210>53
<211>45
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>53
Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr Thr Gly Ser Gly Gly
 1               5                  10                  15
Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala Ser Lys Thr Ser Thr
            20                  25                  30
Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val
        35                  40                  45
<210>54
<211>137
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>54
gccaccggcg gcaccaccac caccgccacc accaccggct ccggcggcgt gacctccacc 60
tccaagacca ccaccaccgc ctccaagacc tccaccacca cctcctccac ctcctgcacc 120
accccgaccg ccgtgtc                                                137
<210>55
<211>300
<212>pRT
<213>激烈火球菌
<400>55
Ile Tyr Phe Val Glu Lys Tyr His Thr Ser Glu Asp Lys Ser Thr Ser
 1               5                  10                  15
Asn Thr Ser Ser Thr Pro Pro Gln Thr Thr Leu Ser Thr Thr Lys Val
            20                  25                  30
Leu Lys Ile Arg Tyr Pro Asp Asp Gly Glu Trp Pro Gly Ala Pro Ile
        35                  40                  45
Asp Lys Asp Gly Asp Gly Asn Pro Glu Phe Tyr Ile Glu Ile Asn Leu
    50                  55                  60
Trp Asn Ile Leu Asn Ala Thr Gly Phe Ala Glu Met Thr Tyr Asn Leu
65                  70                  75                  80
Thr Ser Gly Val Leu His Tyr Val Gln Gln Leu Asp Asn Ile Val Leu
                85                  90                  95
Arg Asp Arg Ser Asn Trp Val His Gly Tyr Pro Glu Ile Phe Tyr Gly
            100                 105                 110
Asn Lys Pro Trp Asn Ala Asn Tyr Ala Thr Asp Gly Pro Ile Pro Leu
        115                 120                 125
Pro Ser Lys Val Ser Asn Leu Thr Asp Phe Tyr Leu Thr Ile Ser Tyr
    130                 135                 140
Lys Leu Glu Pro Lys Asn Gly Leu Pro Ile Asn Phe Ala Ile Glu Ser
145                 150                 155                 160
Trp Leu Thr Arg Glu Ala Trp Arg Thr Thr Gly Ile Asn Ser Asp Glu
                165                 170                 175
Gln Glu Val Met Ile Trp Ile Tyr Tyr Asp Gly Leu Gln Pro Ala Gly
            180                 185                 190
Ser Lys Val Lys Glu lle Val Val Pro lle Ile Val Asn Gly Thr Pro
            195             200                 205
Val Asn Ala Thr Phe Glu Val Trp Lys Ala Asn Ile Gly Trp Glu Tyr
    210                 215                 220
Val Ala Phe Arg Ile Lys Thr Pro Ile Lys Glu Gly Thr Val Thr Ile
225                 230                 235                 240
Pro Tyr Gly Ala Phe Ile Ser Val Ala Ala Asn Ile Ser Ser Leu Pro
                245                 250                 255
Asn Tyr Thr Glu Leu Tyr Leu Glu Asp Val Glu Ile Gly Thr Glu Phe
            260                 265                 270
Gly Thr Pro Ser Thr Thr Ser Ala His Leu Glu Trp Trp Ile Thr Asn
        275                 280                 285
Ile Thr Leu Thr Pro Leu Asp Arg Pro Leu Ile Ser
    290                 295                 300
<210>56
<211>903
<212>DNA
<213>激烈火球菌
<400>56
atctacttcg tggagaagta ccacacctcc gaggacaagt ccacctccaa cacctcctcc 60
accccgccgc agaccaccct ctccaccacc aaggtgctca agatccgcta cccggacgac 120
ggcgagtggc ccggcgcccc gatcgacaag gacggcgacg gcaacccgga gttctacatc 180
gagatcaacc tctggaacat cctcaacgcc accggcttcg ccgagatgac ctacaacctc 240
actagtggcg tgctccacta cgtgcagcag ctcgacaaca tcgtgctccg cgaccgctcc 300
aactgggtgc acggctaccc ggaaatcttc tacggcaaca agccgtggaa cgccaactac 360
gccaccgacg gcccgatccc gctcccgtcc aaggtgtcca acctcaccga cttctacctc 420
accatctcct acaagctcga gccgaagaac ggtctcccga tcaacttcgc catcgagtcc 480
tggctcaccc gcgaggcctg gcgcaccacc ggcatcaact ccgacgagca ggaggtgatg 540
atctggatct actacgacgg cctccagccc gcgggctcca aggtgaagga gatcgtggtg 600
ccgatcatcg tgaacggcac cccggtgaac gccaccttcg aggtgtggaa ggccaacatc 660
ggctgggagt acgtggcctt ccgcatcaag accccgatca aggagggcac cgtgaccatc 720
ccgtacggcg ccttcatctc cgtggccgcc aacatctcct ccctcccgaa ctacaccgag 780
aagtacctcg aggacgtgga gatcggcacc gagttcggca ccccgtccac cacctccgcc 840
cacctcgagt ggtggatcac caacatcacc ctcaccccgc tcgaccgccc gctcatctcc 900
tag                                                               903
<210>57
<211>387
<212>PRT
<213>黄栖热菌
<400>57
Met Tyr Glu Pro Lys Pro Glu His Arg Phe Thr Phe Gly Leu Trp Thr
 1               5                  10                  15
Val Asp Asn Val Asp Arg Asp Pro Phe Gly Asp Thr Val Arg Glu Arg
            20                  25                  30
Leu Asp Pro Val Tyr Val Val His Lys Leu Ala Glu Leu Gly Ala Tyr
        35                  40                  45
Gly Val Asn Leu His Asp Glu Asp Leu Ile Pro Arg Gly Thr Pro Pro
    50                  55                  60
Gln Glu Arg Asp Gln Ile Val Arg Arg Phe Lys Lys Ala Leu Asp Glu
65                  70                  75                  80
Thr Val Leu Lys Val Pro Met Val Thr Ala Asn Leu Phe Ser Glu Pro
                85                  90                  95
Ala Phe Arg Asp Gly Ala Ser Thr Thr Arg Asp Pro Trp Val Trp Ala
            100                 105                 110
Tyr Ala Leu Arg Lys Ser Leu Glu Thr Met Asp Leu Gly Ala Glu Leu
        115                 120                 125
Gly Ala Glu Ile Tyr Met Phe Trp Met Val Arg Glu Arg Ser Glu Val
    130                 135                 140
Glu Ser Thr Asp Lys Thr Arg Lys Val Trp Asp Trp Val Arg Glu Thr
145                 150                 155                 160
Leu Asn Phe Met Thr Ala Tyr Thr Glu Asp Gln Gly Tyr Gly Tyr Arg
                165                 170                 175
Phe Ser Val Glu Pro Lys Pro Asn Glu Pro Arg Gly Asp Ile Tyr Phe
            180                 185                 190
Thr Thr Val Gly Ser Met Leu Ala Leu Ile His Thr Leu Asp Arg Pro
        195                 200                 205
Glu Arg Phe Gly Leu Asn Pro Glu Phe Ala His Glu Thr Met Ala Gly
    210                 215                 220
Leu Asn Phe Asp His Ala Val Ala Gln Ala Val Asp Ala Gly Lys Leu
225                 230                 235                 240
Phe His Ile Asp Leu Asn Asp Gln Arg Met Ser Arg Phe Asp Gln Asp
                245                 250                 255
Leu Arg Phe Gly Ser Glu Asn Leu Lys Ala Gly Phe Phe Leu Val Asp
            260                 265                 270
Leu Leu Glu Ser Ser Gly Tyr Gln Gly Pro Arg His Phe Glu Ala His
        275                 280                 285
Ala Leu Arg Thr Glu Asp Glu Glu Gly Val Trp Thr Phe Val Arg Val
    290                 295                 300
Cys Met Arg Thr Tyr Leu Ile Ile Lys Val Arg Ala Glu Thr Phe Arg
305                 310                 315                 320
Glu Asp Pro Glu Val Lys Glu Leu Leu Ala Ala Tyr Tyr Gln Glu Asp
                325                 330                 335
Pro Ala Thr Leu Ala Leu Leu Asp Pro Tyr Ser Arg Glu Lys Ala Glu
            340                 345                 350
Ala Leu Lys Arg Ala Glu Leu Pro Leu Glu Thr Lye Arg Arg Arg Gly
        355                 360                 365
Tyr Ala Leu Glu Arg Leu Asp Gln Leu Ala Val Glu Tyr Leu Leu Gly
    370                 375                 380
Val Arg Gly
385
<210>58
<211>978
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>58
atggggaaga acggcaacct gtgctgcttc tctctgctgc tgcttcttct cgccgggttg 60
gcgtccggcc atcaaatcta cttcgtggag aagtaccaca cctccgagga caagtccacc 120
tccaacacct cctccacccc gccgcagacc accctctcca ccaccaaggt gctcaagatc l80
cgctacccgg acgacggtga gtggcccggc gccccgatcg acaaggacgg cgacggcaac 240
ccggagttct acatcgagat caacctctgg aacatcctca acgccaccgg cttcgccgag 300
atgacctaca acctcactag tggcgtgctc cactacgtgc agcagctcga caacatcgtg 360
ctccgcgacc gctccaactg ggtgcacggc tacccggaaa tcttctacgg caacaagccg 420
tggaacgcca actacgccac cgacggcccg atcccgctcc cgtccaaggt gtccaacctc 480
accgacttct acctcaccat ctcctacaag ctcgagccga agaacggtct cccgatcaac 540
ttcgccatcg agtcctggct cacccgcgag gcctggcgca ccaccggcat caactccgac 600
gagcaggagg tgatgatctg gatctactac gacggcctcc agcccgcggg ctccaaggtg 660
aaggagatcg tggtgccgat catcgtgaac ggcaccccgg tgaacgccac cttcgaggtg 720
tggaaggcca acatcggctg ggagtacgtg gccttccgca tcaagacccc gatcaaggag 780
ggcaccgtga ccatcccgta cggcgccttc atctccgtgg ccgccaacat ctcctccctc 840
ccgaactaca ccgagaagta cctcgaggac gtggagatcg gcaccgagtt cggcaccccg 900
tccaccacct ccgcccacct cgagtggtgg atcaccaaca tcaccctcac cccgctcgac 960
cgcccgctca tctcctag                                               978
<210>59
<211>1920
<212>DNA
<213>黑曲霉
<400>59
atgtccttcc gctccctcct cgccctctcc ggcctcgtgt gcaccggcct cgccaacgtg 60
atctccaagc gcgccaccct cgactcctgg ctctccaacg aggccaccgt ggcccgcacc 120
gccatcctca acaacatcgg cgccgacggc gcctgggtgt ccggcgccga ctccggcatc 180
gtggtggcct ccccgtccac cgacaacccg gactacttct acacctggac ccgcgactcc 240
ggcctcgtgc tcaagaccct cgtggacctc ttccgcaacg gcgacacctc cctcctctcc 300
accatcgaga actacatctc cgcccaggcc atcgtgcagg gcatctccaa cccgtccggc 360
gacctctcct ccggcgccgg cctcggcgag ccgaagttca acgtggacga gaccgcctac 420
accggctcct ggggccgccc gcagcgcgac ggcccggccc tccgcgccac cgccatgatc 480
ggcttcggcc agtggctcct cgacaacggc tacacctcca ccgccaccga catcgtgtgg 540
ccgctcgtgc gcaacgacct ctcctacgtg gcccagtact ggaaccagac cggctacgac 600
ctctgggagg aggtgaacgg ctcctccttc ttcaccatcg ccgtgcagca ccgcgccctc 660
gtggagggct ccgccttcgc caccgccgtg ggctcctcct gctcctggtg cgactcccag 720
gccccggaga tcctctgcta cctccagtcc ttctggaccg gctccttcat cctcgccaac 780
ttcgactcct cccgctccgg caaggacgcc aacaccctcc tcggctccat ccacaccttc 840
gacccggagg ccgcctgcga cgactccacc ttccagccgt gctccccgcg cgccctcgcc 900
aaccacaagg aggtggtgga ctccttccgc tccatctaca ccctcaacga cggcctctcc 960
gactccgagg ccgtggccgt gggccgctac ccggaggaca cctactacaa cggcaacccg 1020
tggttcctct gcaccctcgc cgccgccgag cagctctacg acgccctcta ccagtgggac 1080
aagcagggct ccctcgaggt gaccgacgtg tccctcgact tcttcaaggc cctctactcc 1140
gacgccgcca ccggcaccta ctcctcctcc tcctccacct actcctccat cgtggacgcc 1200
gtgaagacct tcgccgacgg cttcgtgtcc atcgtggaga cccacgccgc ctccaacggc 1260
tccatgtccg agcagtacga caagtccgac ggcgagcagc tctccgcccg cgacctcacc 1320
tggtcctacg ccgccctcct caccgccaac aaccgccgca actccgtggt gccggcctcc 1380
tggggcgaga cctccgcctc ctccgtgccg ggcacctgcg ccgccacctc cgccatcggc 1440
acctactcct ccgtgaccgt gacctcctgg ccgtccatcg tggccaccgg cggcaccacc 1500
accaccgcca ccccgaccgg ctccggctcc gtgacctcca cctccaagac caccgccacc 1560
gcctccaaga cctccacctc cacctcctcc acctcctgca ccaccccgac cgccgtggcc 1620
gtgaccttcg acctcaccgc caccaccacc tacggcgaga acatctacct cgtgggctcc 1680
atctcccagc tcggcgactg ggagacctcc gacggcatcg ccctctccgc cgacaagtac 1740
acctcctccg acccgctctg gtacgtgacc gtgaccctcc cggccggcga gtccttcgag 1800
tacaagttca tccgcatcga gtccgacgac tccgtggagt gggagtccga cccgaaccgc 1860
gagtacaccg tgccgcaggc ctgcggcacc tccaccgcca ccgtgaccga cacctggcgc 1920
<210>60
<211>6
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>60
Ser Glu Ly8 Asp Glu Leu
 1               5
<210>61
<211>561
<212>DNA
<213>人工序列
<220>
<223>木聚糖酶BD7436
<220>
<221>CDS
<222>(1)..(561)
<400>61
atg gct agc acc ttc tac tgg cat ttg tgg acc gac ggc atc ggc acc    48
Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly Ile Gly Thr
1               5                   10                  15
gtg aac gct acc aac ggc agc gac ggc aac tac agc gtg agc tgg agc    96
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
aac tgc ggc aac ctc gtg gtg ggc aag ggc tgg acc acc ggc agc gct    144
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
acc agg gtg atc aac tac aac gct cat gct ttc agc gtg gtg ggc aac    192
Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val Val Gly Asn
    50                  55                  60
gct tac ttg gct ttg tac ggc tgg acc agg aac agc ttg atc gag tac    240
Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
tac gtg gtg gac agc tgg ggc acc tac agg cca acc ggc acc tac aag    288
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
ggc acc gtg acc agc gac ggc ggc acc tac gac atc tac acc acc acc    336
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
agg acc aac gct cca agc atc gac ggc aac aac acc acc ttc acc caa    384
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
ttc tgg agc gtg agg caa agc aag agg cca atc ggc acc aac aac acc    432
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
atc acc ttc agc aac cat gtg aac gct tgg aag agc aag ggc atg aac    480
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
ttg ggc agc agc tgg agc tac caa gtg ttg gct acc gag ggc tac caa    528
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
agc agc ggc tac agc aac gtg acc gtg tgg tag                        561
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>62
<211>186
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>62
Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly Ile Gly Thr
1               5                   10                  15
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val Val Gly Asn
    50                  55                  60
Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
Arg Thr Asn Ala Pro Ser Ile Asp G1y Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>63
<211>561
<212>DNA
<213>人工序列
<220>
<223>木聚糖酶BD6002A
<220>
<221>CDS
<222>(1).. (561)
<400>63
atg gct agc acc gac tac tgg caa aac tgg acc gac ggc ggc ggc acc    48
Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr
1               5                   10                  15
gtg aac gct acc aac ggc agc gac ggc aac Lac agc gtg agc tgg agc    96
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc agc gct    144
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
acc agg gtg atc aac tac aac gct ggc gct ttc agc cca agc ggc aac    192
Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn
    50                  55                  60
ggc tac ttg gct ttg tac ggc tgg acc agg aac agc ttg atc gag tac    240
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
tac gtg gtg gac agc tgg ggc acc tac agg cca acc ggc acc Lac aag    288
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr G1y Thr Tyr Lys
                85                  90                  95
ggc acc gtg acc agc gac ggc ggc acc Lac gac atc Lac acc acc acc    336
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
agg acc aac gct cca agc atc gac ggc aac aac acc acc ttc acc caa    384
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
ttc tgg agc gtg agg caa agc aag agg cca arc ggc acc aac aac acc    432
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
atc acc ttc agc aac cat gtg aac gct tgg aag agc aag ggc atg aac    480
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
ttg ggc agc agc tgg agc tac caa gtg ttg gct acc gag ggc tac caa    528
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
agc agc ggc tac agc aac gtg acc gtg tgg tag                        561
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>64
<211>186
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>64
Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr
1               5                   10                  15
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn
    50                  55                  60
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>  65
<211>  561
<212>DNA
<213>人工序列
<220>
<223>木聚糖酶BD6002B
<220>
<221>CDS
<222>(1)..(561)
<400>65
atg gcc tcc acc gac tac tgg cag aac tgg acc gac ggc ggc ggc acc    48
Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr
1               5                   10              15
gtg aac gcc acc aac ggc tcc gac ggc aac tac tcc gtg tcc tgg tcc    96
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc tcc gcc    144
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
acc cgc gtg atc aac tac aac gcc ggc gcc ttc tcc ccg tcc ggc aac    192
Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn
    50              55                      60
ggc tac ctc gcc ctc tac ggc tgg acc cgc aac tcc ctc atc gag tac    240
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
tac gtg gtg gac tcc tgg ggc acc tac cgc ccg acc ggc acc tac aag    288
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
ggc acc gtg acc tcc gac ggc ggc acc tac gac atc tac acc acc acc    336
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
cgc acc aac gcc ccg tcc atc gac ggc aac aac acc acc ttc acc cag    384
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
ttc tgg tcc gtg cgc cag tcc aag cgc ccg atc ggc acc aac aac acc    432
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                         140
atc acc ttc tcc aac cac gtg aac gcc tgg aag tcc aag ggc atg aac    480
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
ctc ggc tcc tcc tgg tcc tac cag gtg ctc gcc acc gag ggc tac cag    528
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
tcc tcc ggc tac tcc aac gtg acc gtg tgg tga                        561
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>66
<211>186
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>66
Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr
1               5                   10              15
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn
    50                  55                  60
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                         125
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>67
<211>2071
<212>DNA
<213>稻
<220>
<221>misc feature
<222>(1)..(2071)
<223>启动子
<400>67
tccatgctgt cctactactt gcttcatccc cttctacatt ttgttctggt ttttggcctg     60
catttcggat catgatgtat gtgatttcca atctgctgca atatgaatgg agactctgtg     120
ctaaccatca acaacatgaa atgcttatga ggcctttgct gagcagccaa tcttgcctgt     180
gtttatgtct tcacaggccg aattcctctg ttttgttttt caccctcaat atttggaaac     240
atttatctag gttgtttgtg tccaggccta taaatcatac atgatgttgt cgtattggat     300
gtgaatgtgg tggcgtgttc agtgccttgg atttgagttt gatgagagtt gcttctgggt     360
caccactcac cattatcgat gctcctcttc agcataaggt aaaagtcttc cctgtttacg     420
ttattttacc cactatggtt gcttgggttg gttttttcct gattgcttat gccatggaaa     480
gtcatttgat atgttgaact tgaattaact gtagaattgt atacatgttc catttgtgtt     540
gtacttcctt cttttctatt agtagcctca gatgagtgtg aaaaaaacag attatataac     600
ttgccctata aatcatttga aaaaaatatt gtacagtgag aaattgatat atagtgaatt     660
tttaagagca tgttttccta aagaagtata tattttctat gtacaaaggc cattgaagta     720
attgtagata caggataatg tagacttttt ggacttacac tgctaccttt aagtaacaat     780
catgagcaat agtgttgcaa tgatatttag gctgcattcg tttactctct tgatttccat     840
gagcacgctt cccaaactgt taaactctgt gttttttgcc aaaaaaaaat gcataggaaa     900
gttgctttta aaaaatcata tcaatccatt ttttaagtta tagctaatac ttaattaatc     960
atgcgctaat aagtcactct gtttttcgta ctagagagat tgttttgaac cagcactcaa     1020
gaacacagcc ttaacccagc caaataatgc tacaacctac cagtccacac ctcttgtaaa     1080
gcatttgttg catggaaaag ctaagatgac agcaacctgt tcaggaaaac aactgacaag     1140
gtcataggga gagggagctt ttggaaaggt gccgtgcagt tcaaacaatt agttagcagt     1200
agggtgttgg tttttgctca cagcaataag aagttaatca tggtgtaggc aacccaaata    1260
aaacaccaaa atatgcacaa ggcagtttgt tgtattctgt agtacagaca aaactaaaag    1320
taatgaaaga agatgtggtg ttagaaaagg aaacaatatc atgagtaatg tgtgggcatt    1380
atgggaccac gaaataaaaa gaacattttg atgagtcgtg tatcctcgat gagcctcaaa    1440
agttctctca ccccggataa gaaaccctta agcaatgtgc aaagtttgca ttctccactg    1500
acataatgca aaataagata tcatcgatga catagcaact catgcatcat atcatgcctc    1560
tctcaaccta ttcattccta ctcatctaca taagtatctt cagctaaatg ttagaacata    1620
aacccataag tcacgtttga tgagtattag gcgtgacaca tgacaaatca cagactcaag    1680
caagataaag caaaatgatg tgtacataaa actccagagc tatatgtcat attgcaaaaa    1740
gaggagagct tataagacaa ggcatgactc acaaaaattc atttgccttt cgtgtcaaaa    1800
agaggagggc tttacattat ccatgtcata ttgcaaaaga aagagagaaa gaacaacaca    1860
atgctgcgtc aattatacat atctgtatgt ccatcattat tcatccacct ttcgtgtacc    1920
acacttcata tatcatgagt cacttcatgt ctggacatta acaaactcta tcttaacatt    1980
tagatgcaag agcctttatc tcactataaa tgcacgatga tttctcattg tttctcacaa    2040
aaagcattca gttcattagt cctacaacaa c                                   2071
<210>68
<211>79
<212>PRT
<213>玉蜀黍
<220>
<221>SIGNAL
<222>(1)..(79)
<223>玉米waxy信号序列
<400>68
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
1               5                   10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser lla Arg Ala Ala Pro Arg His Gln His Gln Gln lla Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala
65                  70                  75
<210>69
<211>1005
<212>DNA
<213>人工序列
<220>
<223>合成的菠萝蛋白酶序列
<220>
<221>CDS
<222>(1)..(1005)
<223>合成的菠萝蛋白酶
<400>69
atg gcc tgg aag gtg cag gtg gtg ttc ctc ttc ctc ttc ctc tgc gtg    48
Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val
1               5                   10                  15
atg tgg gcc tcc ccg tcc gcc gcc tcc gcg gac gag ccg tcc gac ccg    96
Met Trp Ala Ser Pro Ser Ala Ala Ser Ala Asp Glu Pro Ser Asp Pro
            20                  25                  30
atg atg aag cgc ttc gag gag tgg atg gtg gag tac ggc cgc gtg tac    144
Met Met Lys Arg Phe Glu Glu Trp Met Val Glu Tyr Gly Arg Val Tyr
        35                  40                  45
aag gac aac gac gag aag atg cgc cgc ttc cag atc ttc aag aac aac    192
Lys Asp Asn Asp Glu Lys Met Arg Arg Phe Gln Ile Phe Lys Asn Asn
    50                  55                  60
gtg aac cac atc gag acc ttc aac tcc cgc aac gag aac tcc tac acc    240
Val Asn His Ile Glu Thr Phe Asn Ser Arg Asn Glu Asn Ser Tyr Thr
65                  70                  75                  80
ctc ggc atc aac cag ttc acc gac atg acc aac aac gag ttc atc gcc    288
Leu Gly Ile Asn Gln Phe Thr Asp Met Thr Asn Asn Glu Phe Ile Ala
                85                  90                  95
cag tac acc ggc ggc atc tcc cgc ccg ctc aac atc gag cgc gag ccg    336
Gln Tyr Thr Gly Gly Ile Ser Arg Pro Leu Asn Ile Glu Arg Glu Pro
            100                 105                 110
gtg gtg tcc ttc gac gac gtg gac atc tcc gcc gtg ccg cag tcc atc    384
Val Val Ser Phe Asp Asp Val Asp Ile Ser Ala Val Pro Gln Ser Ile
        115                 120                 125
gac tgg cgc gac tac ggc gcc gtg acc tcc gtg aag aac cag aac ccg    432
Asp Trp Arg Asp Tyr Gly Ala Val Thr Ser Val Lys Asn Gln Asn Pro
    130                135                140
tgc ggc gcc tgc tgg gcc ttc gcc gcc atc gcc acc gtg gag tcc atc     480
Cys Gly Ala Cys Trp Ala Phe Ala Ala Ile Ala Thr Val Glu Ser Ile
145                 150                 155                 160
tac aag atc aag aag ggc atc ctc gag ccg ctc tcc gag cag cag gtg     528
Tyr Lys Ile Lys Lys Gly Ile Leu Glu Pro Leu Ser Glu Gln Gln Val
                165                 170                 175
ctc gac tgc gcc aag ggc tac ggc tgc aag ggc ggc tgg gag ttc cgc     576
Leu Asp Cys Ala Lys Gly Tyr Gly Cys Lys Gly Gly Trp Glu Phe Arg
            180                 185                 190
gcc ttc gag ttc atc atc tcc aac aag ggc gtg gcc tcc ggc gcc atc     624
Ala Phe Glu Phe Ile Ile Ser Asn Lys Gly Val Ala Ser Gly Ala Ile
        195                 200                 205
tac ccg tac aag gcc gcc aag ggc acc tgc aag acc gac ggc gtg ccg     672
Tyr Pro Tyr Lys Ala Ala Lys Gly Thr Cys Lys Thr Asp G1y Val Pro
    210                 215                 220
aac tcc gcc tac atc acc ggc tac gcc cgc gtg ccg cgc aac aac gag     720
Asn Ser Ala Tyr Ile Thr Gly Tyr Ala Arg Val Pro Arg Asn ASn Glu
225                 230                 235                 240
tcc tcc atg atg tac gcc gtg tcc aag cag ccg atc acc gtg gcc gtg     768
Ser Ser Met Met Tyr Ala Val Ser Lys Gln Pro Ile Thr Val Ala Val
                245                 250                 255
gac gcc aac gcc aac ttc cag tac tac aag tcc ggc gtg ttc aac ggc     816
Asp Ala Asn Ala Asn phe Gln Tyr Tyr Lys Ser Gly Val Phe Asn Gly
            260                 265                 270
ccg tgc ggc acc tcc ctc aac cac gcc gtg acc gcc atc ggc tac ggc     864
Pro Cys Gly Thr Ser Leu Asn His Ala Val Thr Ala Ile Gly Tyr Gly
        275                 280                 285
cag gac tcc atc atc tac ccg aag aag tgg ggc gcc aag tgg ggc gag     912
Gln Asp Ser Ile Ile Tyr Pro Lys Lys Trp Gly Ala Lys Trp Gly Glu
    290                 295                 300
gcc ggc tac atc cgc atg gcc cgc gac gtg tcc tcc tcc tcc ggc atc     960
Ala Gly Tyr Ile Arg Met Ala Arg Asp Val Ser Ser Ser Ser Gly Ile
305                 310                 315                 320
tgc ggc atc gcc atc gac ccg ctc tac ccg acc ctc gag gag tag         1005
Cys Gly Ile Ala Ile Asp Pro Leu Tyr Pro Thr Leu Glu Glu
                325                 330
<2l0>70
<211>334
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>70
Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val
1               5                   10                  15
Met Trp Ala Ser Pro Ser Ala Ala Ser Ala Asp Glu Pro Ser Asp Pro
            20                  25                  30
Met Met Lys Arg Phe Glu Glu Trp Met Val Glu Tyr Gly Arg Val Tyr
        35                  40                  45
Lys Asp Asn Asp Glu Lys Met Arg Arg Phe Gln Ile Phe Lys Asn Asn
    50                  55                  60
Val Asn His Ile Glu Thr Phe Asn Ser Arg Asn Glu Asn Ser Tyr Thr
65                  70                  75                  80
Leu Gly Ile Asn Gln Phe Thr Asp Met Thr Asn Asn Glu Phe Ile Ala
                85                  90                  95
Gln Tyr Thr Gly Gly Ile Ser Arg Pro Leu Asn Ile Glu Arg Glu Pro
            100                 105                 110
Val Val Ser Phe Asp Asp Val Asp Ile Ser Ala Val Pro Gln Ser Ile
        115                 120                 125
Asp Trp Arg Asp Tyr Gly Ala Val Thr Ser Val Lys Asn Gln Asn Pro
    130                 135                 140
Cys Gly Ala Cys Trp Ala Phe Ala Ala Ile Ala Thr Val Glu Ser Ile
145                 150                 155                 160
Tyr Lys Ile Lys Lys Gly Ile Leu Glu Pro Leu Ser Glu Gln Gln Val
                165                 170                 175
Leu Asp Cys Ala Lys Gly Tyr Gly Cys Lys Gly Gly Trp Glu Phe Arg
            180                 185                 190
Ala Phe Glu Phe Ile Ile Ser Ash Lys Gly Val Ala Ser Gly Ala Ile
        195                 200                 205
Tyr Pro Tyr Lys Ala Ala Lys Gly Thr Cys Lys Thr Asp Gly Val Pro
    210                 215                 220
Asn Ser Ala Tyr Ile Thr Gly Tyr Ala Arg Val Pro Arg Asn Asn Glu
225                 230                 235                 240
Ser Ser Met Met Tyr Ala Val Ser Lys Gln Pro Ile Thr Val Ala Val
                245                 250                 255
Asp Ala Asn Ala Asn Phe Gln Tyr Tyr Lys Ser Gly Val Phe Ash Gly
            260                 265                 270
Pro Cys Gly Thr Ser Leu Asn His Ala Val Thr Ala Ile Gly Tyr Gly
        275                 280                 285
Gln Asp Ser Ile Ile Tyr Pro Lys Lys Trp Gly Ala Lys Trp Gly Glu
    290                 295                 300
Ala Gly Tyr Ile Arg Met Ala Arg Asp Val Ser Ser Ser Ser Gly Ile
305                 310                 315                 320
Cys Gly Ile Ala Ile Asp Pro Leu Tyr Pro Thr Leu Glu Glu
                325                 330
<210>71
<21l>78
<212>DNA
<2l3>人工序列
<220>
<223>菠萝蛋白酶信号序列
<400>71
atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc      60
ccgtccgccg cctccgcc                                                    78
<210>72
<211>26
<212>PRT
<213>人工序列
<220>
<223>菠萝蛋白酶信号肽
<400>72
Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val
1               5                   10                  15
Met Trp Ala Ser Pro Ser Ala Ala Ser Ala
             20                  25
<210>73
<211>1050
<212>DNA
<213>人工序列
<220>
<223>pSYNll000
<400>73
atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc     60
ccgtccgccg cctccgcgga cgagccgtcc gacccgatga tgaagcgctt cgaggagtgg     120
atggtggagt acggccgcgt gtacaaggac aacgacgaga agatgcgccg cttccagatc     180
ttcaagaaca acgtgaacca catcgagacc ttcaactccc gcaacgagaa ctcctacacc     240
ctcggcatca accagttcac cgacatgacc aacaacgagt tcatcgccca gtacaccggc     300
ggcatctccc gcccgctcaa catcgagcgc gagccggtgg tgtccttcga cgacgtggac     360
atctccgccg tgccgcagtc catcgactgg cgcgactacg gcgccgtgac ctccgtgaag     420
aaccagaacc cgtgcggcgc ctgctgggcc ttcgccgcca tcgccaccgt ggagtccatc     480
tacaagatca agaagggcat cctcgagccg ctctccgagc agcaggtgct cgactgcgcc     540
aagggctacg gctgcaaggg cggctgggag ttccgcgcct tcgagttcat catctccaac     600
aagggcgtgg cctccggcgc catctacccg tacaaggccg ccaagggcac ctgcaagacc     660
gacggcgtgc cgaactccgc ctacatcacc ggctacgccc gcgtgccgcg caacaacgag     720
tcctccatga tgtacgccgt gtccaagcag ccgatcaccg tggccgtgga cgccaacgcc     780
aacttccagt actacaagtc cggcgtgttc aacggcccgt gcggcacctc cctcaaccac     840
gccgtgaccg ccatcggcta cggccaggac tccatcatct acccgaagaa gtggggcgcc     900
aagtggggcg aggccggcta catccgcatg gcccgcgacg tgtcctcctc ctccggcatc     960
tgcggcatcg ccatcgaccc gctctacccg accctcgagg aggtgttcgc cgaggccatc     1020
gccgccaact ccaccctcgt ggccgagtag                                      1050
<210>74
<211>1067
<212>DNA
<213>人工序列
<220>
<223>pSYN11589
<400>74
tggcctggaa ggtgcaggtg gtgttcctct tcctcttcct ctgcgtgatg tgggcctccc     60
cgtccgccgc ctccgcctcc tcctcctcct tcgccgactc caacccgatc cgcccggtga    120
ccgaccgcgc cgcctccacc gacgagccgt ccgacccgat gatgaagcgc ttcgaggagt    180
ggatggtgga gtacggccgc gtgtacaagg acaacgacga gaagatgcgc cgcttccaga    240
tcttcaagaa caacgtgaac cacatcgaga ccttcaactc ccgcaacgag aactcctaca    300
ccctcggcat caaccagttc accgacatga ccaacaacga gttcatcgcc cagtacaccg    360
gcggcatctc ccgcccgctc aacatcgagc gcgagccggt ggtgtccttc gacgacgtgg    420
acatctccgc cgtgccgcag tccatcgact ggcgcgacta cggcgccgtg acctccgtga    480
agaaccagaa cccgtgcggc gcctgctggg ccttcgccgc catcgccacc gtggagtcca    540
tctacaagat caagaagggc atcctcgagc cgctctccga gcagcaggtg ctcgactgcg    600
ccaagggcta cggctgcaag ggcggctggg agttccgcgc cttcgagttc atcatctcca    660
acaagggcgt ggcctccggc gccatctacc cgtacaaggc cgccaagggc acctgcaaga    720
ccgacggcgt gccgaactcc gcctacatca ccggctacgc ccgcgtgccg cgcaacaacg    780
agtcctccat gatgtacgcc gtgtccaagc agccgatcac cgtggccgtg gacgccaacg    840
ccaacttcca gtactacaag tccggcgtgt tcaacggccc gtgcggcacc tccctcaacc    900
acgccgtgac cgccatcggc tacggccagg actccatcat ctacccgaag aagtggggcg    960
ccaagtgggg cgaggccggc tacatccgca tggcccgcga cgtgtcctcc tcctccggca   1020
tctgcggcat cgccatcgac ccgctctacc cgaccctcga ggagtag                 1067
<210>75
<211>1023
<212>DNA
<213>人工序列
<220>
<223>pSYN11587  序列
<400>75
atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc    60
ccgtccgccg cctccgcgga cgagccgtcc gacccgatga tgaagcgctt cgaggagtgg   120
atggtggagt acggccgcgt gtacaaggac aacgacgaga agatgcgccg cttccagatc   180
ttcaagaaca acgtgaacca catcgagacc ttcaactccc gcaacgagaa ctcctacacc   240
ctcggcatca accagttcac cgacatgacc aacaacgagt tcatcgccca gtacaccggc    300
ggcatctccc gcccgctcaa catcgagcgc gagccggtgg tgtccttcga cgacgtggac    360
atctccgccg tgccgcagtc catcgactgg cgcgactacg gcgccgtgac ctccgtgaag    420
aaccagaacc cgtgcggcgc ctgctgggcc ttcgccgcca tcgccaccgt ggagtccatc    480
tacaagatca agaagggcat cctcgagccg ctctccgagc agcaggtgct cgactgcgcc    540
aagggctacg gctgcaaggg cggctgggag ttccgcgcct tcgagttcat catctccaac    600
aagggcgtgg cctccggcgc catctacccg tacaaggccg ccaagggcac ctgcaagacc    660
gacggcgtgc cgaactccgc ctacatcacc ggctacgccc gcgtgccgcg caacaacgag    720
tcctccatga tgtacgccgt gtccaagcag ccgatcaccg tggccgtgga cgccaacgcc    780
aacttccagt actacaagtc cggcgtgttc aacggcccgt gcggcacctc cctcaaccac    840
gccgtgaccg ccatcggcta cggccaggac tccatcatct acccgaagaa gtggggcgcc    900
aagtggggcg aggccggcta catccgcatg gcccgcgacg tgtcctcctc ctccggcatc    960
tgcggcatcg ccatcgaccc gctctacccg accctcgagg agtccgagaa ggacgagctg   1020
tag                                                                 1023
<210>76
<211>990
<212>DNA
<213>人工序列
<220>
<223>pSYN12169  序列
<400>76
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg     60
gcggacgagc cgtccgaccc gatgatgaag cgcttcgagg agtggatggt ggagtacggc    120
cgcgtgtaca aggacaacga cgagaagatg cgccgcttcc agatcttcaa gaacaacgtg    180
aaccacatcg agaccttcaa ctcccgcaac gagaactcct acaccctcgg catcaaccag    240
ttcaccgaca tgaccaacaa cgagttcatc gcccagtaca ccggcggcat ctcccgcccg    300
ctcaacatcg agcgcgagcc ggtggtgtcc ttcgacgacg tggacatctc cgccgtgccg    360
cagtccatcg actggcgcga ctacggcgcc gtgacctccg tgaagaacca gaacccgtgc    420
ggcgcctgct gggccttcgc cgccatcgcc accgtggagt ccatctacaa gatcaagaag    480
ggcatcctcg agccgctctc cgagcagcag gtgctcgact gcgccaaggg ctacggctgc    540
aagggcggct gggagttccg cgccttcgag ttcatcatct ccaacaaggg cgtggcctcc    600
ggcgccatct acccgtacaa ggccgccaag ggcacctgca agaccgacgg cgtgccgaac    660
tccgcctaca tcaccggcta cgcccgcgtg ccgcgcaaca acgagtcctc catgatgtac    720
gccgtgtcca agcagccgat caccgtggcc gtggacgcca acgccaactt ccagtactac    780
aagtccggcg tgttcaacgg cccgtgcggc acctccctca accacgccgt gaccgccatc    840
ggctacggcc aggactccat catctacccg aagaagtggg gcgccaagtg gggcgaggcc    900
ggctacatcc gcatggcccg cgacgtgtcc tcctcctccg gcatctgcgg catcgccatc    960
gacccgctct acccgaccct cgaggagtag                                     990
<210>77
<211>1170
<212>DNA
<213>人工序列
<220>
<223>pSYN12575  序列
<400>77
atgctggcgg ctctggccac gtcgcagctc gtcgcaacgc gcgccggcct gggcgtcccg     60
gacgcgtcca cgttccgccg cggcgccgcg cagggcctga ggggggcccg ggcgtcggcg    120
gcggcggaca cgctcagcat gcggaccagc gcgcgcgcgg cgcccaggca ccagcaccag    180
caggcgcgcc gcggggccag gttcccgtcg ctcgtcgtgt gcgccagcgc cggcgccatg    240
gcggacgagc cgtccgaccc gatgatgaag cgcttcgagg agtggatggt ggagtacggc    300
cgcgtgtaca aggacaacga cgagaagatg cgccgcttcc agatcttcaa gaacaacgtg    360
aaccacatcg agaccttcaa ctcccgcaac gagaactcct acaccctcgg catcaaccag    420
ttcaccgaca tgaccaacaa cgagttcatc gcccagtaca ccggcggcat ctcccgcccg    480
ctcaacatcg agcgcgagcc ggtggtgtcc ttcgacgacg tggacatctc cgccgtgccg    540
cagtccatcg actggcgcga ctacggcgcc gtgacctccg tgaagaacca gaacccgtgc    600
ggcgcctgct gggccttcgc cgccatcgcc accgtggagt ccatctacaa gatcaagaag    660
ggcatcctcg agccgctctc cgagcagcag gtgctcgact gcgccaaggg ctacggctgc    720
aagggcggct gggagttccg cgccttcgag ttcatcatct ccaacaaggg cgtggcctcc    780
ggcgccatct acccgtacaa ggccgccaag ggcacctgca agaccgacgg cgtgccgaac    840
tccgcctaca tcaccggcta cgcccgcgtg ccgcgcaaca acgagtcctc catgatgtac    900
gccgtgtcca agcagccgat caccgtggcc gtggacgcca acgccaactt ccagtactac    960
aagtccggcg tgttcaacgg cccgtgcggc acctccctca accacgccgt gaccgccatc   1020
ggctacggcc aggactccat catctacccg aagaagtggg gcgccaagtg gggcgaggcc   1080
ggctacatcc gcatggcccg cgacgtgtcc tcctcctccg gcatctgcgg catcgccatc   1140
gacccgctct acccgaccct cgaggagtag                                    1170
<210>78
<211>1068
<212>DNA
<213>人工序列
<220>
<223>pSM270  序列
<400>78
atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc      60
ccgtccgccg cctccgcctc ctcctcctcc ttcgccgact ccaacccgat ccgcccggtg     120
accgaccgcg ccgcctccac cgacgagccg tccgacccga tgatgaagcg cttcgaggag     180
tggatggtgg agtacggccg cgtgtacaag gacaacgacg agaagatgcg ccgcttccag     240
atcttcaaga acaacgtgaa ccacatcgag accttcaact cccgcaacga gaactcctac     300
accctcggca tcaaccagtt caccgacatg accaacaacg agttcatcgc ccagtacacc     360
ggcggcatct cccgcccgct caacatcgag cgcgagccgg tggtgtcctt cgacgacgtg     420
gacatctccg ccgtgccgca gtccatcgac tggcgcgact acggcgccgt gacctccgtg     480
aagaaccaga acccgtgcgg cgcctgctgg gccttcgccg ccatcgccac cgtggagtcc     540
atctacaaga tcaagaaggg catcctcgag ccgctctccg agcagcaggt gctcgactgc     600
gccaagggct acggctgcaa gggcggctgg gagttccgcg ccttcgagtt catcatctcc     660
aacaagggcg tggcctccgg cgccatctac ccgtacaagg ccgccaaggg cacctgcaag     720
accgacggcg tgccgaactc cgcctacatc accggctacg cccgcgtgcc gcgcaacaac     780
gagtcctcca tgatgtacgc cgtgtccaag cagccgatca ccgtggccgt ggacgccaac     840
gccaacttcc agtactacaa gtccggcgtg ttcaacggcc cgtgcggcac ctccctcaac     900
cacgccgtga ccgccatcgg ctacggccag gactccatca tctacccgaa gaagtggggc     960
gccaagtggg gcgaggccgg ctacatccgc atggcccgcg acgtgtcctc ctcctccggc    1020
atctgcggca tcgccatcga cccgctctac ccgaccctcg aggagtag                 1068
<210>79
<211>1497
<212>DNA
<213>Trichoderma reesei
<220>
<221>CDS
<222>(1)..(1497)
<223>Trichoderma reesei  纤维二糖水解酶 I
<400>79
atg cag tcg gcg tgt act ctc caa tcg gag act cac ccg cct ctg aca     48
Met Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
1               5                   10                  15
tgg cag aaa tgc tcg tct ggt ggc acg tgc act caa cag aca ggc tcc     96
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
            20                  25                  30
gtg gtc atc gac gcc aac tgg cgc tgg act cac gct acg aac agc agc    144
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
        35                  40                  45
acg aac tgc tac gat ggc aac act tgg agc tcg acc cta tgt cct gac    192
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
    50                  55                  60
aac gag acc tgc gcg aag aac tgc tgt ctg gac ggt gcc gcc tac gcg    240
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
65                  70                  75                  80
tcc acg tac gga gtt acc acg agc ggt aac agc ctc tcc att ggc ttt    288
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
                85                  90                  95
gtc acc cag tct gcg cag aag aac gtt ggc gct cgc ctt tac ctt atg    336
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
            100                 105                 110
gcg agc gac acg acc tac cag gaa ttc acc ctg ctt ggc aac gag ttc    384
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
        115                 120                 125
tct ttc gat gtt gat gtt tcg cag ctg ccg tgc ggc ttg aac gga gct    432
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
    130                 135                 140
ctc tac ttc gtg tcc atg gac gcg gat ggt ggc gtg agc aag tat ccc    480
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
145                 150                 155                 160
acc aac acc gct ggc gcc aag tac ggc acg ggg tac tgt gac agc cag    528
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
                165                 170                 175
tgt ccc cgc gat ctg aag ttc atc aat ggc cag gcc aac gtt gag ggc    576
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
            180                 185                 190
tgg gag ccg tca tcc aac aac gcg aac acg ggc att gga gga cac gga    624
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
        195                 200                 205
agc tgc tgc tct gag atg gat atc tgg gag gcc aac tcc atc tcc gag    672
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
    210                 215                 220
gct ctt acc ccc cac cct tgc acg act gtc ggc cag gag atc tgc gag    720
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
225                 230                 235                 240
ggt gat ggg tgc ggc gga act tac tcc gat aac aga tat ggc ggc act    768
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
                245                 250                 255
tgc gat ccc gat ggc tgc gac tgg aac cca tac cgc ctg ggc aac acc    816
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
            260                 265                 270
agc ttc tac ggc cct ggc tct agc ttt acc ctc gat acc acc aag aaa    864
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
        275                 280                 285
ttg acc gtt gtc acc cag ttc gag acg tcg ggt gcc atc aac cga tac    912
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
    290                 295                 300
tat gtc cag aat ggc gtc act ttc cag cag ccc aac gcc gag ctt ggt    960
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
305                 310                 315                 320
agt tac tct ggc aac gag ctc aac gat gat tac tgc aca gct gag gag   1008
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
                325                 330                 335
gca gaa ttc ggc gga tcc tct ttc tca gac aag ggc ggc ctg act cag   1056
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
            340                 345                 350
ttc aag aag gct acc tct ggc ggc atg gtt ctg gtc atg agt ctg tgg   1104
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
        355                 360                 365
gat gat tac tac gcc aac atg ctg tgg ctg gac tcc acc tac ccg aca   1152
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
    370                 375                 380
aac gag acc tcc tcc aca ccc ggt gcc gtg cgc gga agc tgc tcc acc   1200
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
385                 390                 395                 400
agc tcc ggt gtc cct gct cag gtc gaa tct cag tct ccc aac gcc aag   1248
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
                405                 410                 415
gtc acc ttc tcc aac atc aag ttc gga ccc att ggc agc acc ggc aac   1296
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
            420                 425                 430
cct agc ggc ggc aac cct ccc ggc gga aac ccg cct ggc acc acc acc   1344
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
        435                 440                 445
acc cgc cgc cca gcc act acc act gga agc tct ccc gga cct acc cag   1392
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
    450             455                     460
tct cac tac ggc cag tgc ggc ggt att ggc tac agc ggc ccc acg gtc   1440
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
465                 470                 475                 480
tgc gcc agc ggc aca act tgc cag gtc ctg aac cct tac tac tct cag   1488
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
                485                 490                 495
tgc ctg taa                                                       1497
Cys Leu
<210>80
<211>498
<212>PRT
<213>Trichoderma reesei
<400>80
Met Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
1               5                   10                  15
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
            20                  25                  30
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
        35                  40                  45
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
    50                  55                  60
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
65                  70                  75                  80
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
                85                  90                  95
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
            100                 105                 110
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
        115                 120                 125
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
    130                 135                 140
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
145                 150                 155                 160
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
                165                 170                 175
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
            180                 185                 190
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
        195                 200                 205
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
    210                 215                 220
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
225                 230                 235                 240
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
                245                 250                 255
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
            260                 265                 270
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
        275                 280                 285
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
    290                 295                 300
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
305                 310                 315                 320
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
                325                 330                 335
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
            340                 345                 350
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
        355                 360                 365
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
    370                 375                 380
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
385                 390                 395                 400
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
                405                 410                 415
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
            420                 425                 430
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
        435                 440                 445
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
    450                 455                 460
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
465                 470                 475                 480
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
                485                 490                 495
Cys Leu
<210>81
<211>1365
<212>DNA
<213>Trichoderma reesei
<220>
<221>CDS
<222>(1)..(1365)
<223>trichoderma reesei  纤维二糖水解酶 II
<400>81
atg gtg cct cra gag gag cgg caa gct tgc tca agc gtc tgg ggc caa    48
Met Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly Gln
1               5                   10                  15
tgt ggt ggc cag aat tgg tcg ggt ccg act tgc tgt gct tcc gga agc    96
Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly Ser
            20                  25                  30
aca tgc gtc tac tcc aac gac tat tac tcc cag tgt ctt ccc ggc gct   144
Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly Ala
        35                  40                  45
gca agc tca agc tcg tcc acg cgc gcc gcg tcg acg act tca cga gta   192
Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg Val
    50                  55                  60
tcc ccc aca aca tcc cgg tcg agc tcc gcg acg cct cca cct ggt tct   240
Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly Ser
65                  70                  75                  80
acc act acc aga gta cct cca gtc gga tcg gga acc gct acg tat tca   288
Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr Ser
                85                  90                  95
ggc aac cct ttt gtt ggg gtc act cct tgg gcc aat gca tat tac gcc   336
Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala
            100                 105                 110
tct gaa gtt agc agc ctc gct att cct agc ttg act gga gcc atg gcc   384
Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala
        115                 120                 125
act gct gca gca gct gtc gca aag gtt ccc tct ttt atg tgg cta gat   432
Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp
    130                 135                 140
act ctt gac aag acc cct ctc atg gag caa acc ttg gcc gac atc cgc   480
Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg
145                 150                 155                 160
acc gcc aac aag aat ggc ggt aac tat gcc gga cag ttt gtg gtg tat   528
Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr
                165                 170                 175
gac ttg ccg gat cgc gat tgc gct gcc ctt gcc tcg aat ggc gaa tac   576
Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr
            180                 185                 190
tct att gcc gat ggt ggc gtc gcc aaa tat aag aac tat atc gac acc   624
Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr
        195                 200                 205
att cgt caa att gtc gtg gaa tat tcc gat atc cgg acc ctc ctg gtt   672
Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val
    210                 215                 220
att gag cct gac tct ctt gcc aac ctg gtg acc aac ctc ggt act cca    720
Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro
225                 230                 235                 240
aag tgt gcc aat gct cag tca gcc tac ctt gag tgc atc aac tac gcc    768
Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala
                245                 250                 255
gtc aca cag ctg aac ctt cca aat gtt gcg atg tat ttg gac gct ggc    816
Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly
            260                 265                 270
cat gca gga tgg ctt ggc tgg ccg gca aac caa gac ccg gcc gct cag    864
His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln
        275                 280                 285
cta ttt gca aat gtt tac aag aat gca tcg tct ccg aga gct ctt cgc    912
Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg
    290                 295                 300
gga ttg gca acc aat gtc gcc aac tac aac ggg tgg aac att acc agc    960
Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser
305                 310                 315                 320
ccc cca tcg tac acg caa ggc aac gct gtc tac aac gag aag ctg tac   1008
Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr
                325                 330                 335
atc cac gct att gga cct ctt ctt gcc aat cac ggc tgg tcc aac gcc   1056
Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala
            340                 345                 350
ttc ttc atc act gat caa ggt cga tcg gga aag cag cct acc gga cag   1104
Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln
        355                 360                 365
caa cag tgg gga gac tgg tgc aat gtg atc ggc acc gga ttt ggt att   1152
Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile
    370                 375                 380
cgc cca tcc gca aac act ggg gac tcg ttg ctg gat tcg ttt gtc tgg   1200
Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp
385                 390                 395                 400
gtc aag cca ggc ggc gag tgt gac ggc acc agc gac agc agt gcg cca   1248
Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro
                405                 410                 415
cga ttt gac tcc cac tgt gcg ctc cca gat gcc ttg caa ccg gcg cct   1296
Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro
            420                 425                 430
caa gct ggt gct tgg ttc caa gcc tac ttt gtg cag ctt ctc aca aac   1344
Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn
        435                 440                 445
gca aac cca tcg ttc ctg tag                                       1365
Ala Asn Pro Ser Phe Leu
    450
<210>82
<211>454
<212>PRT
<213>Trichoderma reesei
<400>82
Met Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly Gln
1               5                   10                  15
Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly Ser
            20                  25                  30
Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly Ala
        35                  40                  45
Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg Val
    50                  55                  60
Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly Ser
65                  70                  75                  80
Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr Ser
                85                  90                  95
Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala
            100                 105                 110
Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala
        115                 120                 125
Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp
    130                 135                 140
Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg
145                 150                 155                 160
Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr
                165                 170                 175
Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr
            180                 185                 190
Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr
        195                 200                 205
Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val
    210                 215                 220
Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro
225                 230                 235                 240
Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala
                245                 250                 255
Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly
            260                 265                 270
His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln
        275                 280                 285
Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg
    290                 295                 300
Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser
305                 310                 315                 320
Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr
                325                 330                 335
Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala
            340                 345                 350
Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln
        355                 360                 365
Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile
    370                 375                 380
Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp
385                 390                 395                 400
Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro
                405                 410                 415
Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro
            420                 425                 430
Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn
        435                 440                 445
Ala Asn Pro Ser Phe Leu
    450
<210>83
<211>1317
<212>DNA
<213>Trichoderma reesei
<220>
<221>CDS
<222>(1)..(1317)
<223>Trichoderma reesei  内切葡聚糖酶 I
<400>83
atg cag caa ccg gga acc agc acc ccc gag gtc cat ccc aag ttg aca    48
Met Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys Leu Thr
1               5                   10                  15
acc tac aag tgc aca aag tcc ggg ggg tgc gtg gcc cag gac acc tcg    96
Thr Tyr Lys Cys Thr Lys Sar Gly Gly Cys Val Ala Gln Asp Thr Ser
            20                  25                  30
gtg gtc ctt gac tgg aac tac cgc tgg atg cac gac gca aac tac aac   144
Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Asn Tyr Asn
        35                  40                  45
tcg tgc acc gtc aac ggc ggc gtc aac acc acg ctc tgc cct gac gag   192
Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro Asp Glu
    50                  55                  60
gcg acc tgt ggc aag aac tgc ttc atc gag ggc gtc gac tac gcc gcc   240
Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr Ala Ala
65                  70                  75                  80
tcg ggc gtc acg acc tcg ggc agc agc ctc acc atg aac cag tac atg   288
Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln Tyr Met
                85                  90                  95
ccc agc agc tct ggc ggc tac agc agc gtc tct cct cgg ctg tat ctc   336
Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu Tyr Leu
            100                 105                 110
ctg gac tct gac ggt gag tac gtg atg ctg aag ctc aac ggc cag gag   384
Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly Gln Glu
        115                 120                 125
ctg agc ttc gac gtc gac ctc tct gct ctg ccg tgt gga gag aac ggc    432
Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu Asn Gly
    130                 135                 140
tcg ctc tac ctg tct cag atg gac gag aac ggg ggc gcc aac cag tat    480
Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn Gln Tyr
145                 150                 155                 160
aac acg gcc ggt gcc aac tac ggg agc ggc tac tgc gat gct cag tgc    528
Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala Gln Cys
                165                 170                 175
ccc gtc cag aca tgg agg aac ggc acc ctc aac act agc cac cag ggc    576
Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His Gln Gly
            180                 185                 190
ttc tgc tgc aac gag atg gat atc ctg gag ggc aac tcg agg gcg aat    624
Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg Ala Asn
        195                 200                 205
gcc ttg acc cct cac tct tgc acg gcc acg gcc tgc gac tct gcc ggt    672
Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser Ala Gly
    210                 215                 220
tgc ggc ttc aac ccc tat ggc agc ggc tac aaa agc tac tac ggc ccc    720
Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr Gly Pro
225                 230                 235                 240
gga gat acc gtt gac acc tcc aag acc ttc acc atc atc acc cag ttc    768
Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr Gln Phe
                245                 250                 255
aac acg gac aac ggc tcg ccc tcg ggc aac ctt gtg agc atc acc cgc    816
Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu Val Ser Ile Thr Arg
            260                 265                 270
aag tac cag caa aac ggc gtc gac atc ccc agc gcc cag ccc ggc ggc    864
Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro Gly Gly
        275                 280                 285
gac acc atc tcg tcc tgc ccg tcc gcc tca gcc tac ggc ggc ctc gcc    912
Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly Leu Ala
    290                 295                 300
acc atg ggc aag gcc ctg agc agc ggc atg gtg ctc gtg ttc agc att    960
Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe Ser Ile
305                 310                 315                 320
tgg aac gac aac agc cag tac atg aac tgg ctc gac agc ggc aac gcc   1008
Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly Asn Ala
                325                 330                 335
ggc ccc tgc agc agc acc gag ggc aac cca tcc aac acc ctg gcc aac   1056
Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Thr Leu Ala Asn
            340                 345                 350
aac ccc aac acg cac gtc gtc ttc tcc aac atc cgc tgg gga gac att   1104
Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly Asp Ile
        355                 360                 365
ggg tct act acg aac tcg act gcg ccc ccg ccc ccg cct gcg tcc agc   1152
Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala Ser Ser
    370                 375                 380
acg acg ttt tcg act aca cgg agg agc tcg acg act tcg agc agc ccg   1200
Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser Ser Pro
385                 390                 395                 400
agc tgc acg cag act cac tgg ggg cag tgc ggt ggc att ggg tac agc   1248
Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly Tyr Ser
                405                 410                 415
ggg tgc aag acg tgc acg tcg ggc act acg tgc cag tat agc aac gac   1296
Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser Asn Asp
            420                 425                 430
tac tac tcg caa tgc ctt tag                                       1317
Tyr Tyr Ser Gln Cys Leu
        435
<210>84
<211>438
<212>PRT
<213>Trichoderma reesei
<400>84
Met Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys Leu Thr
1               5                   10                  15
Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val Ala Gln Asp Thr Ser
            20                  25                  30
Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Asn Tyr Asn
        35                  40                  45
Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro Asp Glu
    50                  55                  60
Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr Ala Ala
65                  70                  75                  80
Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln Tyr Met
                85                  90                  95
Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu Tyr Leu
            100                 105                 110
Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly Gln Glu
        115                 120                 125
Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu Asn Gly
    130                 135                 140
Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn Gln Tyr
145                 150                 155                 160
Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala Gln Cys
                165                 170                 175
Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His Gln Gly
            180                 185                 190
Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg Ala Asn
        195                 200                 205
Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser Ala Gly
    210                 215                 220
Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr Gly Pro
225                 230                 235                 240
Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr Gln Phe
                245                 250                 255
Asn Thr Asp Ash Gly Ser Pro Ser Gly Asn Leu Val Ser Ile Thr Arg
            260                 265                 270
Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro Gly Gly
        275                 280                 285
Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly Leu Ala
    290                 295                 300
Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe Ser Ile
305                 310                 315                 320
Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly Asn Ala
                325                 330                 335
Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Thr Leu Ala Asn
            340                 345                 350
Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly Asp Ile
        355                 360                 365
Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala Ser Ser
    370                 375                 380
Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser Ser Pro
385                 390                 395                 400
Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly Tyr Ser
                405                 410                 415
Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser Asn Asp
            420                 425                 430
Tyr Tyr Ser Gln Cys Leu
        435
<210>85
<211>954
<212>DNA
<213>人工序列
<220>
<223>6GP1
<220>
<221>CDS
<222>(1)..(954)
<223>6GP1
<400>85
atg ggc gtg gac ccg ttc gag cgc aac aag atc ctc ggc cgc ggc atc    48
Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile
1               5                   10                  15
aac atc ggc aac gcc ctg gag gcc ccg aac gag ggc gac tgg ggc gtg    96
Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val
            20                  25                  30
gtg atc aag gac gag ttc ttc gac atc atc aag gag gcc ggc ttc tcc   144
Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser
        35                  40                  45
cac gtg cgc atc ccg atc cgc tgg tcc acc cac gcc tac gcc ttc ccg   192
His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro
    50                  55                  60
ccg tac aag atc atg gac cgc ttc ttc aag cgc gtg gac gag gtg atc    240
Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile
65                  70                  75                  80
aac ggc gcc ctc aag cgc ggc ctc gcc gtg gcc atc aac atc cac cac    288
Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Ala Ile Asn Ile His His
                85                  90                  95
tac gag gag ctc atg aac gac ccg gag gag cac aag gag cgc ttc ctc    336
Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu
            100                 105                 110
gcc ctc tgg aag cag atc gcc gac cgc tac aag gac tac ccg gag acc    384
Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr
        115                 120                 125
ctc ttc ttc gag atc ctc aac gag ccg cac ggc aac ctc acc ccg gag    432
Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu
    130                 135                 140
aag tgg aac gag ctg ctc gag gag gcc ctc aag gtg atc cgc tcc atc    480
Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile
145                 150                 155                 160
gac aag aag cac acc atc atc att ggc acc gca gag tgg gga ggc atc    528
Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile
                165                 170                 175
tcc gcc ctc gag aag ctc tcc gtg ccg aag tgg gag aag aat tcc atc    576
Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile
            180                 185                 190
gtg acc atc cac tac tac aac ccg ttc gag ttc acg cac cag ggc gcc    624
Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala
        195                 200                 205
gag tgg gtg gag ggc tcc gag aag tgg ctt ggc cgc aag tgg ggc tcc    672
Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser
    210                 215                 220
ccg gac gac cag aag cac ctc atc gag gag ttc aac ttc atc gag gag    720
Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu
225                 230                 235                 240
tgg tcc aag aag aac aag cgc ccg atc tac atc ggc gag ttt ggc gcc    768
Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala
                245                 250                 255
tac cgc aag gcc gac ctc gag tcc cgc atc aag tgg acc tcc ttc gtg    816
Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val
            260                 265                 270
gtg cgt gag atg gag aag cgc cgc tgg tcc tgg gcc tac tgg gag ttc    864
Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe
        275                 280                 285
tgc tcc ggc ttc ggc gtg tac gac acc ctc cgc aag acc tgg aac aag    912
Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys
    290                 295                 300
gac ctc ctc gag gcc ctc atc ggc ggc gac tcc atc gag tag            954
Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu
305                 310                 315
<210>86
<211>317
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>86
Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile
1               5                   10                  15
Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val
            20                  25                  30
Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser
        35                  40                  45
His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro
    50                  55                  60
Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile
65                  70                  75                  80
Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Ala Ile Asn Ile His His
                85                  90                  95
Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu
            100                 105                 110
Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr
        115                 120                 125
Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu
    130                 135                 140
Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile
145                 150                 155                 160
Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile
                165                 170                 175
Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile
            180                 185                 190
Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala
        195                 200                 205
Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser
    210                 215                 220
Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu
225                 230                 235                 240
Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala
                245                 250                 255
Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val
            260                 265                 270
Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe
        275                 280                 285
Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys
    290                 295                 300
Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu
305                 310                 315
<210>87
<211>1248
<212>DNA
<213>Hordeum vulgare
<220>
<221>CDS
<222>(1)..(1248)
<223>大麦AmyI淀粉酶
<400>87
atg gca cac caa gtc ctc ttt cag ggg ttc aac tgg gag tcg tgg aag    48
Met Ala His Gln Val Leu Phe Gln Gly Phe Asn Trp Glu Ser Trp Lys
1               5                   10                  15
cag agc ggc ggg tgg tac aac atg atg atg ggc aag gtc gac gac atc    96
Gln ser Gly Gly Trp Tyr Asn Met Met Met Gly Lys Val Asp Asp Ile
            20                  25                  30
gcc gct gcc gga gtc acc cac gtc tgg ctg cca ccg ccg tcg cac tcc   144
Ala Ala Ala Gly Val Thr His Val Trp Leu Pro Pro Pro Ser His Ser
        35                  40                  45
gtc tcc aac gaa ggt tac atg cct ggt cgg ctg tac gac atc gac gcg   192
Val Ser Asn Glu Gly Tyr Met Pro Gly Arg Leu Tyr Asp Ile Asp Ala
    50                  55                  60
tcc aag tac ggc aac gcg gcg gag ctc aag tcg ctc atc ggc gcg ctc   240
Ser Lys Tyr Gly Asn Ala Ala Glu Leu Lys Ser Leu Ile Gly Ala Leu
65                  70                  75                  80
cac ggc aag ggc gtg cag gcc atc gcc gac atc gtc atc aac cac cgc   288
His Gly Lys Gly Val Gln Ala Ile Ala Asp Ile Val Ile Asn His Arg
                85                  90                  95
tgc gcc gac tac aag gat agc cgc ggc atc tac tgc atc ttc gag ggc   336
Cys Ala Asp Tyr Lys Asp Ser Arg Gly Ile Tyr Cys Ile Phe Glu Gly
            100                 105                 110
ggc acc tcc gac ggc cgc ctc gac tgg ggc ccc cac atg atc tgt cgc   384
Gly Thr Ser Asp Gly Arg Leu Asp Trp Gly Pro His Met Ile Cys Arg
        115                 120                 125
gac gac acc aaa tac tcc gat ggc acc gca aac ctc gac acc gga gcc   432
Asp Asp Thr Lys Tyr Ser Asp Gly Thr Ala Asn Leu Asp Thr Gly Ala
    130                 135                 140
gac ttc gcc gcc gcg ccc gac atc gac cac ctc aac gac cgg gtc cag   480
Asp Phe Ala Ala Ala Pro Asp Ile Asp His Leu Asn Asp Arg Val Gln
145                 150                 155                 160
cgc gag ctc aag gag tgg ctc ctc tgg ctc aag agc gac ctc ggc ttc   528
Arg Glu Leu Lys Glu Trp Leu Leu Trp Leu Lys Ser Asp Leu Gly Phe
                165                 170                 175
gac gcg tgg cgc ctt gac ttc gcc agg ggc tac tcg ccg gag atg gcc   576
Asp Ala Trp Arg Leu Asp Phe Ala Arg Gly Tyr Ser Pro Glu Met Ala
            180                 185                 190
aag gtg tac atc gac ggc aca tcc ccg agc ctc gcc gtg gcc gag gtg   624
Lys Val Tyr Ile Asp Gly Thr Ser Pro Ser Leu Ala Val Ala Glu Val
        195                 200                 205
tgg gac aat atg gcc acc ggc ggc gac ggc aag ccc aac tac gac cag   672
Trp Asp Asn Met Ala Thr Gly Gly Asp Gly Lys Pro Asn Tyr Asp Gln
    210                 215                 220
gac gcg cac cgg cag aat ctg gtg aac tgg gtg gac aag gtg ggc ggc   720
Asp Ala His Arg Gln Asn Leu Val Asn Trp Val Asp Lys Val Gly Gly
225                 230                 235                 240
gcg gcc tcg gca ggc atg gtg ttc gac ttc acg acc aaa ggg ata ctg    768
Ala Ala Ser Ala Gly Met Val Phe Asp Phe Thr Thr Lys Gly Ile Leu
                245                 250                 255
aac gct gcc gtg gag ggc gag ctg tgg agg ctg atc gac ccg cag ggg    816
Asn Ala Ala Val Glu Gly Glu Leu Trp Arg Leu Ile Asp Pro Gln Gly
            260                 265                 270
aag gcc ccc ggc gtg atg gga tgg tgg ccg gcc aag gcc gtc acc ttc    864
Lys Ala Pro Gly Val Met Gly Trp Trp Pro Ala Lys Ala Val Thr Phe
        275                 280                 285
gtc gac aac cac gat aca ggc tcc acg cag gcc atg tgg cca ttc ccc    912
Val Asp Asn His Asp Thr Gly Ser Thr Gln Ala Met Trp Pro Phe Pro
    290                 295                 300
tcc gac aag gtc atg cag ggc tac gcg tac atc ctc acc cac ccc ggc    960
Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly
305                 310                 315                 320
atc cca tgc atc ttc tac gac cat ttc ttc aac tgg ggg ttt aag gac   1008
Ile Pro Cys Ile Phe Tyr Asp His Phe Phe Asn Trp Gly Phe Lys Asp
                325                 330                 335
cag atc gcg gcg ctg gtg gcg atc agg aag cgc aac ggc atc acg gcg   1056
Gln Ile Ala Ala Leu Val Ala Ile Arg Lys Arg Asn Gly Ile Thr Ala
            340                 345                 350
acg agc gct ctg aag atc ctc atg cac gaa gga gat gcc tac gtc gcc   1104
Thr Ser Ala Leu Lys Ile Leu Met His Glu Gly Asp Ala Tyr Val Ala
        355                 360                 365
gag ata gac ggc aag gtg gtg gtg aag atc ggg tcc agg tac gac gtc   1152
Glu Ile Asp Gly Lys Val Val Val Lys Ile Gly Ser Arg Tyr Asp Val
    370                 375                 380
ggg gcg gtg atc ccg gcc ggg ttc gtg acc tcg gca cac ggc aac gac   1200
Gly Ala Val Ile Pro Ala Gly Phe Val Thr Ser Ala His Gly Asn Asp
385                 390                 395                 400
tac gcc gtc tgg gag aag aac ggt gcc gcg gca aca cra caa cgg agc   1248
Tyr Ala Val Trp Glu Lys Asn Gly Ala Ala Ala Thr Leu Gln Arg Ser
                405                 410                 415
<210>88
<211>416
<212>PRT
<213>Hordeum vulgare
<400>88
Met Ala His Gln Val Leu Phe Gln Gly Phe Asn Trp Glu Ser Trp Lys
1               5                   10                  15
Gln Ser Gly Gly Trp Tyr Asn Met Met Met Gly Lys Val Asp Asp Ile
            20                  25                  30
Ala Ala Ala Gly Val Thr His Val Trp Leu Pro Pro Pro Ser His Ser
        35                  40                  45
Val Ser Asn Glu Gly Tyr Met Pro Gly Arg Leu Tyr Asp Ile Asp Ala
    50                  55                  60
Ser Lys Tyr Gly Asn Ala Ala Glu Leu Lys Ser Leu Ile Gly Ala Leu
65                  70                  75                  80
His Gly Lys Gly Val Gln Ala Ile Ala Asp Ile Val Ile Asn His Arg
                85                  90                  95
Cys Ala Asp Tyr Lys Asp Ser Arg Gly Ile Tyr Cys Ile Phe Glu Gly
            100                 105                 110
Gly Thr Ser Asp Gly Arg Leu Asp Trp Gly Pro His Met Ile Cys Arg
        115                 120                 125
Asp Asp Thr Lys Tyr Ser Asp Gly Thr Ala Asn Leu Asp Thr Gly Ala
    130                 135                 140
Asp Phe Ala Ala Ala Pro Asp Ile Asp His Leu Asn Asp Arg Val Gln
145                 150                 155                 160
Arg Glu Leu Lys Glu Trp Leu Leu Trp Leu Lys Ser Asp Leu Gly Phe
                165                 170                 175
Asp Ala Trp Arg Leu Asp Phe Ala Arg Gly Tyr Ser Pro Glu Met Ala
            180                 185                 190
Lys Val Tyr Ile Asp Gly Thr Ser Pro Ser Leu Ala Val Ala Glu Val
        195                 200                 205
Trp Asp Asn Met Ala Thr Gly Gly Asp Gly Lys Pro Asn Tyr Asp Gln
    210                 215                 220
Asp Ala His Arg Gln Asn Leu Val Asn Trp Val Asp Lys Val Gly Gly
225                 230                 235                 240
Ala Ala Ser Ala Gly Met Val Phe Asp Phe Thr Thr Lys Gly Ile Leu
                245                 250                 255
Asn Ala Ala Val Glu Gly Glu Leu Trp Arg Leu Ile Asp Pro Gln Gly
            260                 265                 270
Lys Ala Pro Gly Val Met Gly Trp Trp Pro Ala Lys Ala Val Thr Phe
        275                 280                 285
Val Asp Asn His Asp Thr Gly Ser Thr Gln Ala Met Trp Pro Phe Pro
    290                 295                 300
Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly
305                 310                 315                 320
Ile Pro Cys Ile Phe Tyr Asp His Phe Phe Asn Trp Gly Phe Lys Asp
                325                 330                 335
Gln Ile Ala Ala Leu Val Ala Ile Arg Lys Arg Asn Gly Ile Thr Ala
            340                 345                 350
Thr Ser Ala Leu Lys Ile Leu Met His Glu Gly Asp Ala Tyr Val Ala
        355                 360                 365
Glu Ile Asp Gly Lys Val Val Val Lys Ile Gly Ser Arg Tyr Asp Val
    370                 375                 380
Gly Ala Val Ile Pro Ala Gly Phe Val Thr Ser Ala His Gly Asn Asp
385                 390                 395                 400
Tyr Ala Val Trp Glu Lys Asn Gly Ala Ala Ala Thr Leu Gln Arg Ser
                405                 410                 415
<210>89
<211>1401
<212>DNA
<213>人工序列
<220>
<223>Trichoderma reesei β-葡糖苷酶 2
<220>
<221>CDS
<222>(1)..(1401)
<223>Trichoderma reesei β-葡糖苷酶 2
<400>89
atg ttg ccc aag gac ttt cag tgg ggg ttc gcc acg gct gcc tac cag    48
Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln
1               5                   10                  15
atc gag ggc gcc gtc gac cag gac ggc cgc ggc ccc agc atc tgg gac    96
Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp
            20                  25                  30
acg ttc tgc gcg cag ccc ggc aag atc gcc gac ggc tcg tcg ggc gtg   144
Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val
        35                  40                  45
acg gcg tgc gac tcg tac aac cgc acg gcc gag gac att gcg ctg ctg   192
Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu
    50                  55                  60
aag tcg ctc ggg gcc aag agc tac cgc ttc tcc atc tcg tgg tcg cgc   240
Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg
65                  70                  75                  80
atc atc ccc gag ggc ggc cgc ggc gat gcc gtc aac cag gcg ggc atc   288
Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile
                85                  90                  95
gac cac tac gtc aag ttc gtc gac gac ctg ctc gac gcc ggc atc acg   336
Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr
            100                 105                 110
ccc ttc atc acc ctc ttc cac tgg gac ctg ccc gag ggc ctg cat cag   384
Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln
        115                 120                 125
cgg tac ggg ggg ctg ctg aac cgc acc gag ttc ccg ctc gac ttt gaa   432
Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu
    130                 135                 140
aac tac gcc cgc gtc atg ttc agg gcg ctg ccc aag gtg cgc aac tgg   480
Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp
145                 150                 155                 160
atc acc ttc aac gag ccg ctg tgc tcg gcc atc ccg ggc tac ggc tcc   528
Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser
                165                 170                 175
ggc acc ttc gcc ccc ggc cgg cag agc acc tcg gag ccg tgg acc gtc   576
Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val
            180                 185                 190
ggc cac aac atc ctc gtc gcc cac ggc cgc gcc gtc aag gcg tac cgc   624
Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg
        195                 200                 205
gac gac ttc aag ccc gcc agc ggc gac ggc cag atc ggc atc gtc ctc   672
Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu
    210                 215                 220
aac ggc gac ttc acc tac ccc tgg gac gcc gcc gac ccg gcc gac aag    720
Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys
225                 230                 235                 240
gag gcg gcc gag cgg cgc ctc gag ttc ttc acg gcc tgg ttc gcg gac    768
Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp
                245                 250                 255
ccc atc tac ttg ggc gac tac ccg gcg tcg atg cgc aag cag ctg ggc    816
Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly
            260                 265                 270
gac cgg ctg ccg acc ttt acg ccc gag gag cgc gcc ctc gtc cac ggc    864
Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly
        275                 280                 285
tcc aac gac ttt tac ggc atg aac cac tac acg tcc aac tac atc cgc    912
Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg
    290                 295                 300
cac cgc agc tcg ccc gcc tcc gcc gac gac acc gtc ggc aac gtc gac    960
His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp
305                 310                 315                 320
gtg ctc ttc acc aac aag cag ggc aac tgc atc ggc ccc gag acg cag   1008
Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln
                325                 330                 335
tcc ccc tgg ctg cgc ccc tgt gcc gcc ggc ttc cgc gac ttc ctg gtg   1056
Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val
            340                 345                 350
tgg atc agc aag agg tac ggc tac ccg ccc atc tac gtg acg gag aac   1104
Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn
        355                 360                 365
ggc acg agc atc aag ggc gag agc gac ttg ccc aag gag aag att ctc   1152
Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu
    370                 375                 380
gaa gat gac ttc agg gtc aag tac tat aac gag tac atc cgt gcc atg   1200
Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met
385                 390                 395                 400
gtt acc gcc gtg gag ctg gac ggg gtc aac gtc aag ggg tac ttt gcc   1248
Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala
                405                 410                 415
tgg tcg ctc atg gac aac ttt gag tgg gcg gac ggc tac gtg acg agg   1296
Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg
            420                 425                 430
ttt ggg gtt acg tat gtg gat tat gag aat ggg cag aag cgg ttc ccc   1344
Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro
        435                 440                 445
aag aag agc gca aag agc ttg aag ccg ctg ttt gac gag ctg att gcg   1392
Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala
    450                 455                 460
gcg gcg tga
Ala Ala
465
<210>90
<211>466
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>90
Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln
1               5                   10                  15
Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp
            20                  25                  30
Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val
        35                  40                  45
Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu
    50                  55                  60
Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg
65                  70                  75                  80
Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile
                85                  90                  95
Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr
            100                 105                 110
Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln
        115                 120                 125
Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu
    130                 135                 140
Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp
145                 150                 155                 160
Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser
                165                 170                 175
Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val
            180                 185                 190
Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg
        195                 200                 205
Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu
    210                 215                 220
Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys
225                 230                 235                 240
Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp
                245                 250                 255
Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly
            260                 265                 270
Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly
        275                 280                 285
Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg
    290                 295                 300
His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp
305                 310                 315                 320
Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln
                325                 330                 335
Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val
            340                 345                 350
Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn
        355                 360                 365
Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu
    370                 375                 380
Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met
385                 390                 395                 400
Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala
                405                 410                 415
Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg
            420                 425                 430
Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro
        435                 440                 445
Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala
    450                 455                 460
Ala Ala
465
<210>91
<211>2103
<212>DNA
<213>人工序列
<220>
<223>Trichoderma reesei  β-葡糖苷酶 D
<220>
<221>CDS
<222>(1)..(2103)
<223>Trichoderma reesei  β-葡糖苷酶 D
<400>91
atg att ctc ggc tgt gaa agc aca ggt gtc atc tct gcc gtc aaa cac    48
Met Ile Leu Gly Cys Glu Ser Thr Gly Val Ile Ser Ala Val Lys His
1               5                   10                  15
ttt gtc gcc aac gac cag gag cac gag cgg cga gcg gtc gac tgt ctc    96
Phe Val Ala Asn Asp Gln Glu His Glu Arg Arg Ala Val Asp Cys Leu
            20                  25                  30
atc acc cag cgg gct ctc cgg gag gtc tat ctg cga ccc ttc cag atc   144
Ile Thr Gln Arg Ala Leu Arg Glu Val Tyr Leu Arg Pro Phe Gln Ile
        35                  40                  45
gta gcc cga gat gca agg ccc ggc gca ttg atg aca tcc tac aac aag   192
Val Ala Arg Asp Ala Arg Pro Gly Ala Leu Met Thr Ser Tyr Asn Lys
    50                  55                  60
gtc aat ggc aag cac gtc gct gac agc gcc gag ttc ctt cag ggc att   240
Val Asn Gly Lys His Val Ala Asp Ser Ala Glu Phe Leu Gln Gly Ile
65                  70                  75                  80
ctc cgg act gag tgg aat tgg gac cct ctc att gtc agc gac tgg tac   288
Leu Arg Thr Glu Trp Asn Trp Asp Pro Leu Ile Val Ser Asp Trp Tyr
                85                  90                  95
ggc acc tac acc act att gat gcc atc aaa gcc ggc ctt gat ctc gag   336
Gly Thr Tyr Thr Thr Ile Asp Ala Ile Lys Ala Gly Leu Asp Leu Glu
            100                 105                 110
atg ccg ggc gtt tea cga tat cgc ggc aaa tac atc gag tct gct ctg   384
Met Pro Gly Val Ser Arg Tyr Arg Gly Lys Tyr Ile Glu Ser Ala Leu
        115                 120                 125
cag gcc cgt ttg ctg aag cag tcc act atc gat gag cgc gct cgc cgc   432
Gln Ala Arg Leu Leu Lys Gln Ser Thr Ile Asp Glu Arg Ala Arg Arg
    130                 135                 140
gtg ctc agg ttc gcc cag aag gcc agc cat ctc aag gtc tcc gag gta   480
Val Leu Arg Phe Ala Gln Lys Ala Ser His Leu Lys Val Ser Glu Val
145                 150                 155                 160
gag caa ggc cgt gac ttc cca gag gat cgc gtc ctc aac cgt cag atc   528
Glu Gln Gly Arg Asp Phe Pro Glu Asp Arg Val Leu Asn Arg Gln Ile
                165                 170                 175
tgc ggc agc agc att gtc cta ctg aag aat gag aac tcc atc tta cct   576
Cys Gly Ser Ser Ile Val Leu Leu Lys Asn Glu Asn Ser Ile Leu Pro
            180                 185                 190
ctc ccc aag tcc gtc aag aag gtc gcc ctt gtt ggt tcc cac gtg cgt   624
Leu Pro Lys Ser Val Lys Lys Val Ala Leu Val Gly Ser His Val Arg
        195                 200                 205
cta ccg gct atc tcg gga gga ggc agc gcc tct ctt gtc cct tac tat   672
Leu Pro Ala Ile Ser Gly Gly Gly Ser Ala Ser Leu Val Pro Tyr Tyr
    210                 215                 220
gcc ata tct cta tac gat gcc gtc tct gag gta cta gcc ggt gcc acg   720
Ala Ile Ser Leu Tyr Asp Ala Val Ser Glu Val Leu Ala Gly Ala Thr
225                 230                 235                 240
atc acg cac gag gtc ggt gcc tat gcc cac caa atg ctg ccc gtc atc   768
Ile Thr His Glu Val Gly Ala Tyr Ala His Gln Met Leu Pro Val Ile
                245                 250                 255
gac gca atg atc agc aac gcc gta atc cac ttc tac aac gac ccc atc   816
Asp Ala Met Ile Ser Asn Ala Val Ile His Phe Tyr Asn Asp Pro Ile
            260                 265                 270
gat gtc aaa gac aga aag crc ctt ggc agt gag aac gta tcg tcg aca   864
Asp Val Lys Asp Arg Lys Leu Leu Gly Ser Glu Asn Val Ser Ser Thr
        275                 280                 285
tcg ttc cag ctc atg gat tac aac aac atc cca acg ctc aac aag gcc   912
Ser Phe Gln Leu Met Asp Tyr Asn Asn Ile Pro Thr Leu Asn Lys Ala
    290                 295                 300
atg ttc tgg ggt act ctc gtg ggc gag ttt atc cct acc gcc acg gga    960
Met Phe Trp Gly Thr Leu Val Gly Glu Phe Ile Pro Thr Ala Thr Gly
305                 310                 315                 320
att tgg gaa ttt ggc ctc agt gtc ttt ggc act gcc gac ctt tat att   1008
Ile Trp Glu Phe Gly Leu Ser Val Phe Gly Thr Ala Asp Leu Tyr Ile
                325                 330                 335
gat aat gag ctc gtg att gaa aat aca aca cat cag acg cgt gga acc   1056
Asp Asn Glu Leu Val Ile Glu Asn Thr Thr His Gln Thr Arg Gly Thr
            340                 345                 350
gcc ttt ttc gga aag gga acg acg gaa aaa gtc gct acc agg agg atg   1104
Ala Phe Phe Gly Lys Gly Thr Thr Glu Lys Val Ala Thr Arg Arg Met
        355                 360                 365
gtg gcc ggc agc acc tac aag ctg cgt ctc gag ttt ggg tct gcc aac   1152
Val Ala Gly Ser Thr Tyr Lys Leu Arg Leu Glu Phe Gly Ser Ala Asn
    370                 375                 380
acg acc aag atg gag acg acc ggt gtt gtc aac ttt ggc ggc ggt gcc   1200
Thr Thr Lys Met Glu Thr Thr Gly Val Val Asn Phe Gly Gly Gly Ala
385                 390                 395                 400
gta cac ctg ggt gcc tgt ctc aag gtc gac cca cag gag atg att gcg   1248
Val His Leu Gly Ala Cys Leu Lys Val Asp Pro Gln Glu Met Ile Ala
                405                 410                 415
cgg gcc gtc aag gcc gca gcc gat gcc gac tac acc atc atc tgc acg   1296
Arg Ala Val Lys Ala Ala Ala Asp Ala Asp Tyr Thr Ile Ile Cys Thr
            420                 425                 430
gga ctc agc ggc gag tgg gag tct gag ggt ttt gac cgg cct cac atg   1344
Gly Leu Ser Gly Glu Trp Glu Ser Glu Gly Phe Asp Arg Pro His Met
        435                 440                 445
gac ctg ccc cct ggt gtg gac acc atg atc tcg caa gtt ctt gac gcc   1392
Asp Leu Pro Pro Gly Val Asp Thr Met Ile Ser Gln Val Leu Asp Ala
    450                 455                 460
gct ccc aat gct gta gtc gtc aac cag tca ggc acc cca gtg aca atg   1440
Ala Pro Asn Ala Val Val Val Asn Gln Ser Gly Thr Pro Val Thr Met
465                 470                 475                 480
agc tgg gct cat aaa gca aag gcc att gtg cag gct tgg tat ggt ggt   1488
Ser Trp Ala His Lys Ala Lys Ala Ile Val Gln Ala Trp Tyr Gly Gly
                485                 490                 495
aac gag aca ggc cac gga atc tcc gat gtg ctc ttt ggc aac gtc aac   1536
Asn Glu Thr Gly His Gly Ile Ser Asp Val Leu Phe Gly Asn Val Asn
            500                 505                 510
ccg tcg ggg aaa ctc tcc cta tcg tgg cca gtc gat gtg aag cac aac   1584
Pro Ser Gly Lys Leu Ser Leu Ser Trp Pro Val Asp Val Lys His Asn
        515                 520                 525
cca gca tat ctc aac tac gcc agc gtt ggt gga cgg gtc ttg tat ggc   1632
Pro Ala Tyr Leu Asn Tyr Ala Ser Val Gly Gly Arg Val Leu Tyr Gly
    530                 535                 540
gag gat gtt tac gtt ggc tac aag ttc tac gac aaa acg gag agg gag   1680
Glu Asp Val Tyr Val Gly Tyr Lys Phe Tyr Asp Lys Thr Glu Arg Glu
545                 550                 555                 560
gtt ctg ttt cct ttt ggg cat ggc ctg tct tac gct acc ttc aag ctc   1728
Val Leu Phe Pro Phe Gly His Gly Leu Ser Tyr Ala Thr Phe Lys Leu
                565                 570                 575
cca gat tct acc gtg agg acg gtc ccc gaa acc ttc cac ccg gac cag   1776
Pro Asp Ser Thr Val Arg Thr Val Pro Glu Thr Phe His Pro Asp Gln
            580                 585                 590
ccc aca gta gcc att gtc aag atc aag aac acg agc agt gtc ccg ggc   1824
Pro Thr Val Ala Ile Val Lys Ile Lys Asn Thr Ser Ser Val Pro Gly
        595                 600                 605
gcc cag gtc ctg cag tta tac att tcg gcc cca aac tcg cct aca cat   1872
Ala Gln Val Leu Gln Leu Tyr Ile Ser Ala Pro Asn Ser Pro Thr His
    610                 615                 620
cgc ccg gtc aag gag ctg cac gga ttc gaa aag gtg tat ctt gaa gct   1920
Arg Pro Val Lys Glu Leu His Gly Phe Glu Lys Val Tyr Leu Glu Ala
625                 630                 635                 640
ggc gag gag aag gag gta caa ata ccc att gac cag tac gct act agc   1968
Gly Glu Glu Lys Glu Val Gln Ile Pro Ile Asp Gln Tyr Ala Thr Ser
                645                 650                 655
ttc tgg gac gag att gag agc atg tgg aag agc gag agg ggc att tat   2016
Phe Trp Asp Glu Ile Glu Ser Met Trp Lys Ser Glu Arg Gly Ile Tyr
            660                 665                 670
gat gtg ctt gta gga ttc tcg agt cag gaa atc tcg ggc aag ggg aag   2064
Asp Val Leu Val Gly Phe Ser Ser Gln Glu Ile Ser Gly Lys Gly Lys
        675                 680                 685
ctg att gtg cct gaa acg cga ttc tgg atg ggg ctg tag               2103
Leu Ile Val Pro Glu Thr Arg Phe Trp Met Gly Leu
    690                 695                 700
<210>92
<211>700
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>92
Met Ile Leu Gly Cys Glu Ser Thr Gly Val Ile Ser Ala Val Lys His
1               5                   10                  15
Phe Val Ala Asn Asp Gln Glu His Glu Arg Arg Ala Val Asp Cys Leu
            20                  25                  30
Ile Thr Gln Arg Ala Leu Arg Glu Val Tyr Leu Arg Pro Phe Gln Ile
        35                  40                  45
Val Ala Arg Asp Ala Arg Pro Gly Ala Leu Met Thr Ser Tyr Asn Lys
    50                  55                  60
Val Asn Gly Lys His Val Ala Asp Ser Ala Glu Phe Leu Gln Gly Ile
65                  70                  75                  80
Leu Arg Thr Glu Trp Asn Trp Asp Pro Leu Ile Val Ser Asp Trp Tyr
                85                  90                  95
Gly Thr Tyr Thr Thr Ile Asp Ala Ile Lys Ala Gly Leu Asp Leu Glu
            100                 105                 110
Met Pro Gly Val Ser Arg Tyr Arg Gly Lys Tyr Ile Glu Ser Ala Leu
        115                 120                 125
Gln Ala Arg Leu Leu Lys Gln Ser Thr Ile Asp Glu Arg Ala Arg Arg
    130                 135                 140
Val Leu Arg Phe Ala Gln Lys Ala Ser His Leu Lys Val Ser Glu Val
145                 150                 155                 160
Glu Gln Gly Arg Asp Phe Pro Glu Asp Arg Val Leu Asn Arg Gln Ile
                165                 170                 175
Cys Gly Ser Ser Ile Val Leu Leu Lys Asn Glu Asn Ser Ile Leu Pro
            180                 185                 190
Leu Pro Lys Ser Val Lys Lys Val Ala Leu Val Gly Ser His Val Arg
        195                 200                 205
Leu Pro Ala Ile Ser Gly Gly Gly Ser Ala Ser Leu Val Pro Tyr Tyr
    210                 215                 220
Ala Ile Ser Leu Tyr Asp Ala Val Ser Glu Val Leu Ala Gly Ala Thr
225                 230                 235                 240
Ile Thr His Glu Val Gly Ala Tyr Ala His Gln Met Leu Pro Val Ile
                245                 250                 255
Asp Ala Met Ile Ser Asn Ala Val Ile His Phe Tyr Asn Asp Pro Ile
            260                 265                 270
Asp Val Lys Asp Arg Lys Leu Leu Gly Ser Glu Asn Val Ser Ser Thr
        275                 280                 285
Ser Phe Gln Leu Met Asp Tyr Asn Asn Ile Pro Thr Leu Asn Lys Ala
    290                 295                 300
Met Phe Trp Gly Thr Leu Val Gly Glu Phe Ile Pro Thr Ala Thr Gly
305                 310                 315                 320
Ile Trp Glu Phe Gly Leu Ser Val Phe Gly Thr Ala Asp Leu Tyr Ile
                325                 330                 335
Asp Asn Glu Leu Val Ile Glu Asn Thr Thr His Gln Thr Arg Gly Thr
            340                 345                 350
Ala Phe Phe Gly Lys Gly Thr Thr Glu Lys Val Ala Thr Arg Arg Met
        355                 360                 365
Val Ala Gly Ser Thr Tyr Lys Leu Arg Leu Glu Phe Gly Ser Ala Asn
    370                 375                 380
Thr Thr Lys Met Glu Thr Thr Gly Val Val Asn Phe Gly Gly Gly Ala
385                 390                 395                 400
Val His Leu Gly Ala Cys Leu Lys Val Asp Pro Gln Glu Met Ile Ala
                405                 410                 415
Arg Ala Val Lys Ala Ala Ala Asp Ala Asp Tyr Thr Ile Ile Cys Thr
            420                 425                 430
Gly Leu Ser Gly Glu Trp Glu Ser Glu Gly Phe Asp Arg Pro His Met
        435                 440                 445
Asp Leu Pro Pro Gly Val Asp Thr Met Ile Ser Gln Val Leu Asp Ala
    450                 455                 460
Ala Pro Asn Ala Val Val Val Asn Gln Ser Gly Thr Pro Val Thr Met
465                 470                 475                 480
Ser Trp Ala His Lys Ala Lys Ala Ile Val Gln Ala Trp Tyr Gly Gly
                485                 490                 495
Asn Glu Thr Gly His Gly Ile Ser Asp Val Leu Phe Gly Asn Val Asn
            500                 505                 510
Pro Ser Gly Lys Leu Ser Leu Ser Trp Pro Val Asp Val Lys His Asn
        515                 520                 525
Pro Ala Tyr Leu Asn Tyr Ala Ser Val Gly Gly Arg Val Leu Tyr Gly
    530                 535                 540
Glu Asp Val Tyr Val Gly Tyr Lys Phe Tyr Asp Lys Thr Glu Arg Glu
545                 550                 555                 560
Val Leu Phe Pro Phe Gly His Gly Leu Ser Tyr Ala Thr Phe Lys Leu
                565                 570                 575
Pro Asp Ser Thr Val Arg Thr Val Pro Glu Thr Phe His Pro Asp Gln
            580                 585                 590
Pro Thr Val Ala Ile Val Lys Ile Lys Asn Thr Ser Ser Val Pro Gly
        595                 600                 605
Ala Gln Val Leu Gln Leu Tyr Ile Ser Ala Pro Asn Ser Pro Thr His
    610                 615                 620
Arg Pro Val Lys Glu Leu His Gly Phe Glu Lys Val Tyr Leu Glu Ala
625                 630                 635                 640
Gly Glu Glu Lys Glu Val Gln Ile Pro Ile Asp Gln Tyr Ala Thr Ser
                645                 650                 655
Phe Trp Asp Glu Ile Glu Ser Met Trp Lys Ser Glu Arg Gly Ile Tyr
            660                 665                 670
Asp Val Leu Val Gly Phe Ser Ser Gln Glu Ile Ser Gly Lys Gly Lys
        675                 680                 685
Leu Ile Val Pro Glu Thr Arg Phe Trp Met Gly Leu
    690                 695                 700
<210>93
<211>1496
<212>DNA
<213>人工序列
<220>
<223>玉米优化的CBHI
<400>93
tgcagtccgc ctgcaccctc cagtccgaga cccacccgcc gctcacctgg cagaagtgct     60
cctccggcgg cacctgcacc cagcagaccg gctccgtggt gatcgacgcc aactggcgct    120
ggacccacgc caccaactcc tccaccaact gctacgacgg caacacctgg tcctccaccc    180
tctgcccgga caacgagacc tgcgccaaga actgctgcct cgacggcgcc gcctacgcct    240
ccacctacgg cgtgaccacc tccggcaact ccctctccat cggcttcgtg acccagtccg    300
cccagaagaa cgtgggcgcc cgcctctacc tcatggcctc cgacaccacc taccaggagt    360
tcaccctcct cggcaacgag ttctccttcg acgtggacgt gtcccagctc ccgtgcggcc    420
tcaacggcgc cctctacttc gtgtccatgg acgccgacgg cggcgtgtcc aagtacccga    480
ccaacaccgc cggcgccaag tacggcaccg gctactgcga ctcccagtgc ccgcgcgacc    540
tcaagttcat caacggccag gccaacgtgg agggctggga gccgtcctcc aacaacgcca    600
acaccggcat cggcggccac ggctcctgct gctccgagat ggacatctgg gaggccaact    660
ccatctccga ggccctcacc ccgcacccgt gcaccaccgt gggccaggag atctgcgagg    720
gcgacggctg cggcggcacc tactccgaca accgctacgg cggcacctgc gacccggacg    780
gctgcgactg gaacccgtac cgcctcggca acacctcctt ctacggcccg ggctcctcct    840
tcaccctcga caccaccaag aagctcaccg tggtgaccca gttcgagacc tccggcgcca    900
tcaaccgcta ctacgtgcag aacggcgtga ccttccagca gccgaacgcc gagctcggct    960
cctactccgg caacgagctc aacgacgact actgcaccgc cgaggaggcc gagttcggcg   1020
gctcctcctt ctccgacaag ggcggcctca cccagttcaa gaaggccacc tccggcggca   1080
tggtgctcgt gatgtccctc tgggacgact actacgccaa catgctctgg ctcgactcca   1140
cctacccgac caacgagacc tcctccaccc cgggcgccgt gcgcggctcc tgctccacct   1200
cctccggcgt gccggcccag gtggagtccc agtccccgaa cgccaaggtg accttctcca   1260
acatcaagtt cggcccgatc ggctccaccg gcaacccgtc cggcggcaac ccgccgggcg   1320
gcaacccgcc gggcaccacc accacccgcc gcccggccac caccaccggc tcctccccgg   1380
gcccgaccca gtcccactac ggccagtgcg gcggcatcgg ctactccggc ccgaccgtgt   1440
gcgcctccgg caccacctgc caggtgctca acccgtacta ctcccagtgc ctctag       1496
<210>94
<211>1365
<212>DNA
<213>人工序列
<220>
<223>玉米优化的CBHII
<400>94
atggtgccgc tcgaggagcg ccaggcctgc tcctccgtgt ggggccagtg cggcggccag     60
aactggtccg gcccgacctg ctgcgcctcc ggctccacct gcgtgtactc caacgactac    120
tactcccagt gcctcccggg cgccgcctcc tcctcctcct ccacccgcgc cgcctccacc    180
acctcccgcg tgtccccgac cacctcccgc tcctcctccg ccaccccgcc gccgggctcc    240
accaccaccc gcgtgccgcc ggtgggctcc ggcaccgcca cctactccgg caacccgttc    300
gtgggcgtga ccccgtgggc caacgcctac tacgcctccg aggtgtcctc cctcgccatc    360
ccgtccctca ccggcgccat ggccaccgcc gccgccgccg tggccaaggt gccgtccttc    420
atgtggctcg acaccctcga caagaccccg ctcatggagc agaccctcgc cgacatccgc    480
accgccaaca agaacggcgg caactacgcc ggccagttcg tggtgtacga cctcccggac    540
cgcgactgcg ccgccctcgc ctccaacggc gagtactcca tcgccgacgg cggcgtggcc    600
aagtacaaga actacatcga caccatccgc cagatcgtgg tggagtactc cgacatccgc    660
accctcctcg tgatcgagcc ggactccctc gccaacctcg tgaccaacct cggcaccccg    720
aagtgcgcca acgcccagtc cgcctacctc gagtgcatca actacgccgt gacccagctc    780
aacctcccga acgtggccat gtacctcgac gccggccacg ccggctggct cggctggccg    840
gccaaccagg acccggccgc ccagctcttc gccaacgtgt acaagaacgc ctcctccccg    900
cgcgccctcc gcggcctcgc caccaacgtg gccaactaca acggctggaa catcacctcc    960
ccgccgtcct acacccaggg caacgccgtg tacaacgaga agctctacat ccacgccatc   1020
ggcccgctcc tcgccaacca cggctggtcc aacgccttct tcatcaccga ccagggccgc   1080
tccggcaagc agccgaccgg ccagcagcag tggggcgact ggtgcaacgt gatcggcacc   1140
ggcttcggca tccgcccgtc cgccaacacc ggcgactccc tcctcgactc cttcgtgtgg   1200
gtgaagccgg gcggcgagtg cgacggcacc tccgactcct ccgccccgcg cttcgactcc   1260
cactgcgccc tcccggacgc cctccagccg gccccgcagg ccggcgcctg gttccaggcc   1320
tacttcgtgc agctcctcac caacgccaac ccgtccttcc tctag                   1365
<210>95
<211>1317
<212>DNA
<213>人工序列
<220>
<223>玉米优化的EGLI
<400>95
atgcagcagc cgggcacctc caccccggag gtgcacccga agctcaccac ctacaagtgc     60
accaagtccg gcggctgcgt ggcccaggac acctccgtgg tgctcgactg gaactaccgc    120
tggatgcacg acgccaacta caactcctgc accgtgaacg gcggcgtgaa caccaccctc    180
tgcccggacg aggccacctg cggcaagaac tgcttcatcg agggcgtgga ctacgccgcc    240
tccggcgtga ccacctccgg ctcctccctc accatgaacc agtacatgcc gtcctcctcc    300
ggcggctact cctccgtgtc cccgcgcctc tacctcctcg actccgacgg cgagtacgtg    360
atgctcaagc tcaacggcca ggagctctcc ttcgacgtgg acctctccgc cctcccgtgc    420
ggcgagaacg gctccctcta cctctcccag atggacgaga acggcggcgc caaccagtac    480
aacaccgccg gcgccaacta cggctccggc tactgcgacg cccagtgccc ggtgcagacc    540
tggcgcaacg gcaccctcaa cacctcccac cagggcttct gctgcaacga gatggacatc    600
ctcgagggca actcccgcgc caacgccctc accccgcact cctgcaccgc caccgcctgc    660
gactccgccg gctgcggctt caacccgtac ggctccggct acaagtccta ctacggcccg    720
ggcgacaccg tggacacctc caagaccttc accatcatca cccagttcaa caccgacaac    780
ggctccccgt ccggcaacct cgtgtccatc acccgcaagt accagcagaa cggcgtggac    840
atcccgtccg cccagccggg cggcgacacc atctcctcct gcccgtccgc ctccgcctac    900
ggcggcctcg ccaccatggg caaggccctc tcctccggca tggtgctcgt gttctccatc    960
tggaacgaca actcccagta catgaactgg ctcgactccg gcaacgccgg cccgtgctcc   1020
tccaccgagg gcaacccgtc caacaccctc gccaacaacc cgaacaccca cgtggtgttc   1080
tccaacatcc gctggggcga catcggctcc accaccaact ccaccgcccc gccgccgccg   1140
ccggcctcct ccaccacctt ctccaccacc cgccgctcct ccaccacctc ctcctccccg   1200
tcctgcaccc agacccactg gggccagtgc ggcggcatcg gctactccgg ctgcaagacc   1260
tgcacctccg gcaccacctg ccagtactcc aacgactact actcccagtg cctctag   1317
<210>96
<211>1401
<212>DNA
<213>人工序列
<220>
<223>玉米优化的BGLII
<400>96
atgctcccga aggacttcca gtggggcttc gccaccgccg cctaccagat cgagggcgcc     60
gtggaccagg acggccgcgg cccgtccatc tgggacacct tctgcgccca gccgggcaag    120
atcgccgacg gctcctccgg cgtgaccgcc tgcgactcct acaaccgcac cgccgaggac    180
atcgccctcc tcaagtccct cggcgccaag tcctaccgct tctccatctc ctggtcccgc    240
atcatcccgg agggcggccg cggcgacgcc gtgaaccagg ccggcatcga ccactacgtg    300
aagttcgtgg acgacctcct cgacgccggc atcaccccgt tcatcaccct cttccactgg    360
gacctcccgg agggcctcca ccagcgctac ggcggcctcc tcaaccgcac cgagttcccg    420
ctcgacttcg agaactacgc ccgcgtgatg ttccgcgccc tcccgaaggt gcgcaactgg    480
atcaccttca acgagccgct ctgctccgcc atcccgggct acggctccgg caccttcgcc    540
ccgggccgcc agtccacctc cgagccgtgg accgtgggcc acaacatcct cgtggcccac    600
ggccgcgccg tgaaggccta ccgcgacgac ttcaagccgg cctccggcga cggccagatc    660
ggcatcgtgc tcaacggcga cttcacctac ccgtgggacg ccgccgaccc ggccgacaag    720
gaggccgccg agcgccgcct cgagttcttc accgcctggt tcgccgaccc gatctacctc    780
ggcgactacc cggcctccat gcgcaagcag ctcggcgacc gcctcccgac cttcaccccg    840
gaggagcgcg ccctcgtgca cggctccaac gacttctacg gcatgaacca ctacacctcc    900
aactacatcc gccaccgctc ctccccggcc tccgccgacg acaccgtggg caacgtggac    960
gtgctcttca ccaacaagca gggcaactgc atcggcccgg agacccagtc cccgtggctc   1020
cgcccgtgcg ccgccggctt ccgcgacttc ctcgtgtgga tctccaagcg ctacggctac   1080
ccgccgatct acgtgaccga gaacggcacc tccatcaagg gcgagtccga cctcccgaag   1140
gagaagatcc tcgaggacga cttccgcgtg aagtactaca acgagtacat ccgcgccatg   1200
gtgaccgccg tggagctcga cggcgtgaac gtgaagggct acttcgcctg gtccctcatg   1260
gacaacttcg agtgggccga cggctacgtg acccgcttcg gcgtgaccta cgtggactac   1320
gagaacggcc agaagcgctt cccgaagaag tccgccaagt ccctcaagcc gctcttcgac   1380
gagctcatcg ccgccgccta g                                             1401
<210>97
<211>2103
<212>DNA
<213>人工序列
<220>
<223>玉米优化的CEL3D
<400>97
atgatcctcg gctgcgagtc caccggcgtg atctccgccg tgaagcactt cgtggccaac     60
gaccaggagc acgagcgccg cgccgtggac tgcctcatca cccagcgcgc cctccgcgag    120
gtgtacctcc gcccgttcca gatcgtggcc cgcgacgccc gcccgggcgc cctcatgacc    180
tcctacaaca aggtgaacgg caagcacgtg gccgactccg ccgagttcct ccagggcatc    240
ctccgcaccg agtggaactg ggacccgctc atcgtgtccg actggtacgg cacctacacc    300
accatcgacg ccatcaaggc cggcctcgac ctcgagatgc cgggcgtgtc ccgctaccgc    360
ggcaagtaca tcgagtccgc cctccaggcc cgcctcctca agcagtccac catcgacgag    420
cgcgcccgcc gcgtgctccg cttcgcccag aaggcctccc acctcaaggt gtccgaggtg    480
gagcagggcc gcgacttccc ggaggaccgc gtgctcaacc gccagatctg cggctcctcc    540
atcgtgctcc tcaagaacga gaactccatc ctcccgctcc cgaagtccgt gaagaaggtg    600
gccctcgtgg gctcccacgt gcgcctcccg gccatctccg gcggcggctc cgcctccctc    660
gtgccgtact acgccatctc cctctacgac gccgtgtccg aggtgctcgc cggcgccacc    720
atcacccacg aggtgggcgc ctacgcccac cagatgctcc cggtgatcga cgccatgatc    780
tccaacgccg tgatccactt ctacaacgac ccgatcgacg tgaaggaccg caagctcctc    840
ggctccgaga acgtgtcctc cacctccttc cagctcatgg actacaacaa catcccgacc    900
ctcaacaagg ccatgttctg gggcaccctc gtgggcgagt tcatcccgac cgccaccggc    960
atctgggagt tcggcctctc cgtgttcggc accgccgacc tctacatcga caacgagctc   1020
gtgatcgaga acaccaccca ccagacccgc ggcaccgcct tcttcggcaa gggcaccacc   1080
gagaaggtgg ccacccgccg catggtggcc ggctccacct acaagctccg cctcgagttc   1140
ggctccgcca acaccaccaa gatggagacc accggcgtgg tgaacttcgg cggcggcgcc   1200
gtgcacctcg gcgcctgcct caaggtggac ccgcaggaga tgatcgcccg cgccgtgaag   1260
gccgccgccg acgccgacta caccatcatc tgcaccggcc tctccggcga gtgggagtcc   1320
gagggcttcg accgcccgca catggacctc ccgccgggcg tggacaccat gatctcccag   1380
gtgctcgacg ccgccccgaa cgccgtggtg gtgaaccagt ccggcacccc ggtgaccatg   1440
tcctgggccc acaaggccaa ggccatcgtg caggcctggt acggcggcaa cgagaccggc   1500
cacggcatct ccgacgtgct cttcggcaac gtgaacccgt ccggcaagct ctccctctcc   1560
tggccggtgg acgtgaagca caacccggcc tacctcaact acgcctccgt gggcggccgc   1620
gtgctctacg gcgaggacgt gtacgtgggc tacaagttct acgacaagac cgagcgcgag   1680
gtgctcttcc cgttcggcca cggcctctcc tacgccacct tcaagctccc ggactccacc   1740
gtgcgcaccg tgccggagac cttccacccg gaccagccga ccgtggccat cgtgaagatc   1800
aagaacacct cctccgtgcc gggcgcccag gtgctccagc tctacatctc cgccccgaac   1860
tccccgaccc accgcccggt gaaggagctc cacggcttcg agaaggtgta cctcgaggcc   1920
ggcgaggaga aggaggtgca gatcccgatc gaccagtacg ccacctcctt ctgggacgag   1980
atcgagtcca tgtggaagtc cgagcgcggc atctacgacg tgctcgtggg cttctcctcc   2040
caggagatct ccggcaaggg caagctcatc gtgccggaga cccgcttctg gatgggcctc   2100
tag                                                                 2103
<210>98
<211>420
<212>DNA
<213>玉蜀黍
<220>
<223>Q蛋白启动子
<400>98
gggctggtaa attacttggg agcaatggta tgcaaatcct ttgcatgtac gcaaaactag     60
ctagttgtca caagttgtat atcgattcgt cgcgtttcaa caactcatgc aacattacaa    120
acaagtaaca caatattaca aagttagttt catacaaagc aagaaaagga caataatact    180
tgacatgtaa agtgaagctt attatacttc ctaatccaac acaaaacaaa aaaaagttgc    240
acaaaggtcc aaaaatccac atcaaccatt aacctatacg taaagtgagt gatgagtcac    300
attatccaac aaatgtttat caatgtggta tcatacaagc attgacatcc cataaatgca    360
agaaattgtg ccaacaaagc tataagtaac cctcatatgt atttgcactc atgcatcaca    420
<210>99
<211>1188
<212>DNA
<213>人工序列
<220>
<223>合成的阿魏酸酯酶
<400>99
atggccgcct ccctcccgac catgccgccg tccggctacg accaggtgcg caacggcgtg     60
ccgcgcggcc aggtggtgaa catctcctac ttctccaccg ccaccaactc cacccgcccg    120
gcccgcgtgt acctcccgcc gggctactcc aaggacaaga agtactccgt gctctacctc    180
ctccacggca tcggcggctc cgagaacgac tggttcgagg gcggcggccg cgccaacgtg    240
atcgccgaca acctcatcgc cgagggcaag atcaagccgc tcatcatcgt gaccccgaac    300
accaacgccg ccggcccggg catcgccgac ggctacgaga acttcaccaa ggacctcctc    360
aactccctca tcccgtacat cgagtccaac tactccgtgt acaccgaccg cgagcaccgc    420
gccatcgccg gcctctctat gggcggcggc cagtccttca acatcggcct caccaacctc    480
gacaagttcg cctacatcgg cccgatctcc gccgccccga acacctaccc gaacgagcgc    540
ctcttcccgg acggcggcaa ggccgcccgc gagaagctca agctcctctt catcgcctgc    600
ggcaccaacg actccctcat cggcttcggc cagcgcgtgc acgagtactg cgtggccaac    660
aacatcaacc acgtgtactg gctcatccag ggcggcggcc acgacttcaa cgtgtggaag    720
ccgggcctct ggaacttcct ccagatggcc gacgaggccg gcctcacccg cgacggcaac    780
accccggtgc cgaccccgtc cccgaagccg gccaacaccc gcatcgaggc cgaggactac    840
gacggcatca actcctcctc catcgagatc atcggcgtgc cgccggaggg cggccgcggc    900
atcggctaca tcacctccgg cgactacctc gtgtacaagt ccatcgactt cggcaacggc    960
gccacctcct tcaaggccaa ggtggccaac gccaacacct ccaacatcga gcttcgcctc   1020
aacggcccga acggcaccct catcggcacc ctctccgtga agtccaccgg cgactggaac   1080
acctacgagg agcagacctg ctccatctcc aaggtgaccg gcatcaacga cctctacctc   1140
gtgttcaagg gcccggtgaa catcgactgg ttcaccttcg gcgtgtag                1188
<210>100
<211>395
<212>PRT
<213>人工序列
<220>
<223>合成的阿魏酸酯酶
<400>100
Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val
1               5                   10                  15
Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser
            20                  25                  30
Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly
        35                  40                  45
Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile
    50                  55                  60
Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val
65                  70                  75                  80
Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile
                85                  90                  95
Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr
            100                 105                 110
Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu
        115                 120                 125
Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly
    130                 135                 140
Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu
145                 150                 155                 160
Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr
                165                 170                 175
Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys
            180                 185                 190
Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly
        195                 200                 205
Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His
    210                 215                 220
Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys
225                 230                 235                 240
Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr
                245                 250                 255
Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn
            260                 265                 270
Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile
        275                 280                 285
Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile
    290                 295                 300
Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly
305                 310                 315                 320
Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile
                325                 330                 335
Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser
            340                 345                 350
Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser
        355                 360                 365
Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly
    370                 375                 380
Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val
385                 390                 395
<210>101
<211>1188
<212>DNA
<213>人工序列
<220>
<223>质粒13036
<400>101
atggccgcct ccctcccgac catgccgccg tccggctacg accaggtgcg caacggcgtg     60
ccgcgcggcc aggtggtgaa catctcctac ttctccaccg ccaccaactc cacccgcccg    120
gcccgcgtgt acctcccgcc gggctactcc aaggacaaga agtactccgt gctctacctc    180
ctccacggca tcggcggctc cgagaacgac tggttcgagg gcggcggccg cgccaacgtg    240
atcgccgaca acctcatcgc cgagggcaag atcaagccgc tcatcatcgt gaccccgaac    300
accaacgccg ccggcccggg catcgccgac ggctacgaga acttcaccaa ggacctcctc    360
aactccctca tcccgtacat cgagtccaac tactccgtgt acaccgaccg cgagcaccgc    420
gccatcgccg gcctctctat gggcggcggc cagtccttca acatcggcct caccaacctc    480
gacaagttcg cctacatcgg cccgatctcc gccgccccga acacctaccc gaacgagcgc    540
ctcttcccgg acggcggcaa ggccgcccgc gagaagctca agctcctctt catcgcctgc    600
ggcaccaacg actccctcat cggcttcggc cagcgcgtgc acgagtactg cgtggccaac    660
aacatcaacc acgtgtactg gctcatccag ggcggcggcc acgacttcaa cgtgtggaag    720
ccgggcctct ggaacttcct ccagatggcc gacgaggccg gcctcacccg cgacggcaac    780
accccggtgc cgaccccgtc cccgaagccg gccaacaccc gcatcgaggc cgaggactac    840
gacggcatca actcctcctc catcgagatc atcggcgtgc cgccggaggg cggccgcggc    900
atcggctaca tcacctccgg cgactacctc gtgtacaagt ccatcgactt cggcaacggc    960
gccacctcct tcaaggccaa ggtggccaac gccaacacct ccaacatcga gcttcgcctc   1020
aacggcccga acggcaccct catcggcacc ctctccgtga agtccaccgg cgactggaac   1080
acctacgagg agcagacctg ctccatctcc aaggtgaccg gcatcaacga cctctacctc   1140
gtgttcaagg gcccggtgaa catcgactgg ttcaccttcg gcgtgtag                1188
<210>102
<211>395
<212>PRT
<213>人工序列
<220>
<223>质粒13036
<400>102
Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val
1               5                   10                  15
Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser
            20                  25                  30
Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly
        35                  40                  45
Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile
    50                  55                  60
Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val
65                  70                  75                  80
Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile
                85                  90                  95
Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr
            100                 105                 110
Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu
        115                 120                 125
Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly
    130                 135                 140
Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu
145                 150                 155                 160
Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr
                165                 170                 175
Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys
            180                 185                 190
Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly
        195                 200                 205
Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His
    210                 215                 220
Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys
225                 230                 235                 240
Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr
                245                 250                 255
Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn
            260                 265                 270
Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile
        275                 280                 285
Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile
    290                 295                 300
Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly
305                 310                 315                 320
Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile
                325                 330                 335
Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser
            340                 345                 350
Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser
        355                 360                 365
Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly
    370                 375                 380
Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val
385                 390                 395
<210>103
<211>1245
<212>DNA
<213>人工序列
<220>
<223>质粒13038
<400>103
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg     60
gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg    120
cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc    180
cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc    240
cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc    300
gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc    360
aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac    420
tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc    480
atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac    540
aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc    600
ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc    660
accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtacggcgt ggccaacaac    720
atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg    780
ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc    840
ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac    900
ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc    960
ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc   1020
acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac   1080
ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc   1140
tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg   1200
ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtag                   1245
<210>104
<211>414
<212>PRT
<213>人工序列
<220>
<223>质粒13038 aa
<400>104
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr
            20                  25                  30
Asp Gln Val Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser
        35                  40                  45
Tyr Phe Ser Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu
    50                  55                  60
Pro Pro Gly Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu
65                  70                  75                  80
His Gly Ile Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg
                85                  90                  95
Ala Asn Val Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro
            100                 105                 110
Leu Ile Ile Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala
        115                 120                 125
Asp Gly Tyr Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro
    130                 135                 140
Tyr Ile Glu Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala
145                 150                 155                 160
Ile Ala Gly Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu
                165                 170                 175
Thr Asn Leu Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro
            180                 185                 190
Asn Thr Tyr Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala
        195                 200                 205
Arg Glu Lys Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser
    210                 215                 220
Leu Ile Gly Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn
225                 230                 235                 240
Ile Asn His Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn
                245                 250                 255
Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala
            260                 265                 270
Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys
        275                 280                 285
Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser
    290                 295                 300
Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile
305                 310                 315                 320
Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe
                325                 330                 335
Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr
            340                 345                 350
Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly
        355                 360                 365
Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln
    370                 375                 380
Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val
385                 390                 395                 400
Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val
                405                 410
<210>105
<211>1425
<212>DNA
<213>人工序列
<220>
<223>质粒13039
<400>105
atgctggcgg ctctggccac gtcgcagctc gtcgcaacgc gcgccggcct gggcgtcccg     60
gacgcgtcca cgttccgccg cggcgccgcg cagggcctga ggggggcccg ggcgtcggcg    120
gcggcggaca cgctcagcat gcggaccagc gcgcgcgcgg cgcccaggca ccagcaccag    180
caggcgcgcc gcggggccag gttcccgtcg ctcgtcgtgt gcgccagcgc cggcgccatg    240
gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg    300
cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc    360
cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc    420
cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc    480
gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc    540
aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac    600
tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc    660
atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac    720
aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc    780
ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc    840
accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac    900
atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg    960
ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc   1020
ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac   1080
ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc   1140
ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc   1200
acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac   1260
ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc   1320
tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg   1380
ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtag                   1425
<210>106
<211>474
<212>PRT
<213>人工序列
<220>
<223>质粒13039 aa
<400>106
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
1               5                   10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met
65                  70                  75                  80
Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val Arg
                85                  90                  95
Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser Thr
            100                 105                 110
Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly Tyr
        115                 120                 125
Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile Gly
    130                 135                 140
Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val Ile
145                 150                 155                 160
Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile Val
                165                 170                 175
Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr Glu
            180                 185                 190
Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu Ser
        195                 200                 205
Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly Leu
    210                 215                 220
Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu Asp
225                 230                 235                 240
Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr Pro
                245                 250                 255
Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys Leu
            260                 265                 270
Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly Phe
        275                 280                 285
Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His Val
    290                 295                 300
Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys Pro
305                 310                 315                 320
Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr Arg
                325                 330                 335
Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn Thr
            340                 345                 350
Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile Glu
        355                 360                 365
Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile Thr
    370                 375                 380
Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly Ala
385                 390                 395                 400
Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile Glu
                405                 410                 415
Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser Val
            420                 425                 430
Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser Ile
        435                 440                 445
Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly Pro
    450                 455                 460
Val Asn Ile Asp Trp Phe Thr Phe Gly Val
465                 470
<210>107
<211>1263
<212>DNA
<213>人工序列
<220>
<223>质粒13347
<400>107
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg     60
gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg    120
cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc    180
cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc    240
cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc    300
gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc    360
aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac    420
tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc    480
atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac    540
aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc    600
ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc    660
accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac    720
atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg    780
ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc    840
ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac    900
ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc    960
ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc   1020
acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac   1080
ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc   1140
tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg   1200
ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtccgagaa ggacgaactc   1260
tag                                                                 1263
<210>108
<211>420
<212>PRT
<213>人工序列
<220>
<223>质粒13347
<400>108
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr
            20                  25                  30
Asp Gln Val Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser
        35                  40                  45
Tyr Phe Ser Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu
    50                  55                  60
Pro Pro Gly Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu
65                  70                  75                  80
His Gly Ile Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg
                85                  90                  95
Ala Asn Val Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro
            100                 105                 110
Leu Ile Ile Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala
        115                 120                 125
Asp Gly Tyr Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro
    130                 135                 140
Tyr Ile Glu Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala
145                 150                 155                 160
Ile Ala Gly Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu
                165                 170                 175
Thr Asn Leu Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro
            180                 185                 190
Asn Thr Tyr Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala
        195                 200                 205
Arg Glu Lys Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser
    210                 215                 220
Leu Ile Gly Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn
225                 230                 235                 240
Ile Asn His Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn
                245                 250                 255
Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala
            260                 265                 270
Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys
        275                 280                 285
Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser
    290                 295                 300
Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile
305                 310                 315                 320
Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe
                325                 330                 335
Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr
            340                 345                 350
Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly
        355                 360                 365
Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln
    370                 375                 380
Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val
385                 390                 395                 400
Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val Ser Glu
                405                 410                 415
Lys Asp Glu Leu
            420
<210>109
<211>1296
<212>DNA
<213>人工序列
<220>
<223>质粒11267
<400>109
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct     60
gcgcagtccg agccggagct gaagctggag tccgtggtga tcgtgtcccg ccacggcgtg    120
cgcgccccga ccaaggccac ccagctcatg caggacgtga ccccggacgc ctggccgacc    180
tggccggtga agctcggcga gctgaccccg cgcggcggcg agctgatcgc ctacctcggc    240
cactactggc gccagcgcct cgtggccgac ggcctcctcc cgaagtgcgg ctgcccgcag    300
tccggccagg tggccatcat cgccgacgtg gacgagcgca cccgcaagac cggcgaggcc    360
ttcgccgccg gcctcgcccc ggactgcgcc atcaccgtgc acacccaggc cgacacctcc    420
tccccggacc cgctcttcaa cccgctcaag accggcgtgt gccagctcga caacgccaac    480
gtgaccgacg ccatcctgga gcgcgccggc ggctccatcg ccgacttcac cggccactac    540
cagaccgcct tccgcgagct ggagcgcgtg ctcaacttcc cgcagtccaa cctctgcctc    600
aagcgcgaga agcaggacga gtcctgctcc ctcacccagg ccctcccgtc cgagctgaag    660
gtgtccgccg actgcgtgtc cctcaccggc gccgtgtccc tcgcctccat gctcaccgaa    720
atcttcctcc tccagcaggc ccagggcatg ccggagccgg gctggggccg catcaccgac    780
tcccaccagt ggaacaccct cctctccctc cacaacgccc agttcgacct cctccagcgc    840
accccggagg tggcccgctc ccgcgccacc ccgctcctcg acctcatcaa gaccgccctc    900
accccgcacc cgccgcagaa gcaggcctac ggcgtgaccc tcccgacctc cgtgctcttc    960
atcgccggcc acgacaccaa cctcgccaac ctcggcggcg ccctggagct gaactggacc   1020
ctcccgggcc agccggacaa caccccgccg ggcggcgagc tggtgttcga gcgctggcgc   1080
cgcctctccg acaactccca gtggattcag gtgtccctcg tgttccagac cctccagcag   1140
atgcgcgaca agaccccgct ctccctcaac accccgccgg gcgaggtgaa gctcaccctc   1200
gccggctgcg aggagcgcaa cgcccagggc atgtgctccc tcgccggctt cacccagatc   1260
gtgaacgagg cccgcatccc ggcctgctcc ctctaa                             1296
<210>110
<211>431
<212>PRT
<213>人工序列
<220>
<223>质粒11267 aa序列
<400>110
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val
            20                  25                  30
Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln
        35                  40                  45
Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys
    50                  55                  60
Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly
65                  70                  75                  80
His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys
                85                  90                  95
Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu
            100                 105                 110
Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp
        115                 120                 125
Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro
    130                 135                 140
Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn
145                 150                 155                 160
Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe
                165                 170                 175
Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn
            180                 185                 190
Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser
        195                 200                 205
Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp
    210                 215                 220
Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu
225                 230                 235                 240
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly
                245                 250                 255
Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn
            260                 265                 270
Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg
        275                 280                 285
Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro
    290                 295                 300
Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe
305                 310                 315                 320
Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu
                325                 330                 335
Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly
            340                 345                 350
Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp
        355                 360                 365
Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys
    370                 375                 380
Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu
385                 390                 395                 400
Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly
                405                 410                 415
Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu
            420                 425                 430
<210>111
<211>1314
<212>DNA
<213>人工序列
<220>
<223>质粒11268
<400>111
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct     60
gcgcagtccg agccggagct gaagctggag tccgtggtga tcgtgtcccg ccacggcgtg    120
cgcgccccga ccaaggccac ccagctcatg caggacgtga ccccggacgc ctggccgacc    180
tggccggtga agctcggcga gctgaccccg cgcggcggcg agctgatcgc ctacctcggc    240
cactactggc gccagcgcct cgtggccgac ggcctcctcc cgaagtgcgg ctgcccgcag    300
tccggccagg tggccatcat cgccgacgtg gacgagcgca cccgcaagac cggcgaggcc    360
ttcgccgccg gcctcgcccc ggactgcgcc atcaccgtgc acacccaggc cgacacctcc    420
tccccggacc cgctcttcaa cccgctcaag accggcgtgt gccagctcga caacgccaac    480
gtgaccgacg ccatcctgga gcgcgccggc ggctccatcg ccgacttcac cggccactac    540
cagaccgcct tccgcgagct ggagcgcgtg ctcaacttcc cgcagtccaa cctctgcctc    600
aagcgcgaga agcaggacga gtcctgctcc ctcacccagg ccctcccgtc cgagctgaag    660
gtgtccgccg actgcgtgtc cctcaccggc gccgtgtccc tcgcctccat gctcaccgaa    720
atcttcctcc tccagcaggc ccagggcatg ccggagccgg gctggggccg catcaccgac    780
tcccaccagt ggaacaccct cctctccctc cacaacgccc agttcgacct cctccagcgc    840
accccggagg tggcccgctc ccgcgccacc ccgctcctcg acctcatcaa gaccgccctc    900
accccgcacc cgccgcagaa gcaggcctac ggcgtgaccc tcccgacctc cgtgctcttc    960
atcgccggcc acgacaccaa cctcgccaac ctcggcggcg ccctggagct gaactggacc   1020
ctcccgggcc agccggacaa caccccgccg ggcggcgagc tggtgttcga gcgctggcgc   1080
cgcctctccg acaactccca gtggattcag gtgtccctcg tgttccagac cctccagcag   1140
atgcgcgaca agaccccgct ctccctcaac accccgccgg gcgaggtgaa gctcaccctc   1200
gccggctgcg aggagcgcaa cgcccagggc atgtgctccc tcgccggctt cacccagatc   1260
gtgaacgagg cccgcatccc ggcctgctcc ctctccgaga aggacgagct gtaa         1314
<210>112
<211>437
<212>PRT
<213>人工序列
<220>
<223>质粒11268氨基酸序列
<400>112
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val
            20                  25                  30
Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln
        35                  40                  45
Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys
    50                  55                  60
Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly
65                  70                  75                  80
His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys
                85                  90                  95
Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu
            100                 105                 110
Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp
        115                 120                 125
Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro
    130                 135                 140
Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn
145                 150                 155                 160
Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe
                165                 170                 175
Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn
            180                 185                 190
Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser
        195                 200                 205
Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp
    210                 215                 220
Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu
225                 230                 235                 240
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly
                245                 250                 255
Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn
            260                 265                 270
Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg
        275                 280                 285
Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro
    290                 295                 300
Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe
305                 310                 315                 320
Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu
                325                 330                 335
Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly
            340                 345                 350
Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp
        355                 360                 365
Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys
    370                 375                 380
Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu
385                 390                 395                 400
Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly
                405                 410                 415
Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu Ser
            420                 425                 430
Glu Lys Asp Glu Leu
        435
序列表
<110>Lanahan,Mike
<120>自加工植物和植物部分
<130>109846.317
<140>US 60/315,281
<141>2001-08-27
<160>112
<170>FastSEQ for Windows Version 4.0
<210>1
<211>436
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>1
Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala
1               5                   10                  15
Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg
            20                  25                  30
Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile
        35                  40                  45
Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp
    50                  55                  60
Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val
65                  70                  75                  80
Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr
                85                  90                  95
Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His
            100                 105                 110
Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr
        115                 120                 125
Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr
    130                 135                 140
Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe
145                 150                 155                 160
Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp
                165                 170                 175
Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly
            180                 185                 190
Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val
        195                 200                 205
Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr
    210                 215                 220
Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly
225                 230                 235                 240
Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe
                245                 250                 255
Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly
            260                 265                 270
Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn
        275                 280                 285
His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile
    290                 295                 300
Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu
305                 310                 315                 320
Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn
                325                 330                 335
Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met
            340                 345                 350
Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr
        355                 360                 365
Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys
    370                 375                 380
Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp
385                 390                 395                 400
Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro
                405                 410                 415
Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr
            420                 425                 430
Cys Gly Val Gly
        435
<210>2
<211>1308
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>2
atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac     60
gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac    120
gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg    180
atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg    240
gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac    300
ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg    360
aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac    420
accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc    480
ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg    540
caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac    600
gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg    660
gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc    720
gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac    780
atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc    840
aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg    900
tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag    960
tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc   1020
tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc   1080
tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg   1140
tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg   1200
gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc   1260
gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggc                1308
<210>3
<211>800
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>3
Met Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe Thr Gly Glu
1               5                   10                  15
Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met Asp Leu Thr
            20                  25                  30
Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala Lys Asp Val
        35                  40                  45
Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala Glu Val Trp
    50                  55                  60
Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro Asp Thr Ser
65                  70                  75                  80
Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val Ile Glu Ala
                85                  90                  95
Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu Phe Lys Val
            100                 105                 110
Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu Lys Ala Asp
        115                 120                 125
Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val Leu Ser Glu
    130                 135                 140
Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu Ile Ile Glu
145                 150                 155                 160
Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu Asp Asp Tyr
                165                 170                 175
Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu Lys Thr Ile
            180                 185                 190
Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val Leu Leu Phe
        195                 200                 205
Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn Met Glu Tyr
    210                 215                 220
Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp Leu Asp Gly
225                 230                 235                 240
Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile Arg Thr Thr
                245                 250                 255
Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln Glu Ser Ala
            260                 265                 270
Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu Asn Asp Arg
        275                 280                 285
Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr Glu Ile His
    290                 295                 300
Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys Asn Lys Gly
305                 310                 315                 320
Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Gly Pro Gly Gly Val
                325                 330                 335
Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr His Val His
            340                 345                 350
Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu Asp Lys Asp
        355                 360                 365
Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu Phe Met Val
    370                 375                 380
Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His Thr Arg Ile
385                 390                 395                 400
Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His Gly Ile Gly
                405                 410                 415
Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile Gly Glu Leu
            420                 425                 430
Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg Ile Asp Lys
        435                 440                 445
Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val Ile Ala Ser
    450                 455                 460
Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val Thr Tyr Trp
465                 470                 475                 480
Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln Met Gly Leu
                485                 490                 495
Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu His Lys Ile
            500                 505                 510
Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly Trp Gly Ala
        515                 520                 525
Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His Val Ala Ala
    530                 535                 540
Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val Phe Asn Pro
545                 550                 555                 560
Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu Thr Lys Ile
                565                 570                 575
Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys Leu Ile Lys
            580                 585                 590
Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala Ala Cys His
        595                 600                 605
Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala Lys Ala Asp
    610                 615                 620
Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala Gln Lys Leu
625                 630                 635                 640
Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe Leu His Gly
                645                 650                 655
Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn Ser Tyr Asn
            660                 665                 670
Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys Leu Gln Phe
        675                 680                 685
Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu Arg Lys Glu
    690                 695                 700
His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys Lys His Leu
705                 710                 715                 720
Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met Leu Lys Asp
                725                 730                 735
His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile Tyr Asn Gly
            740                 745                 750
Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys Trp Asn Val
        755                 760                 765
Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu Thr Val Glu
    770                 775                 780
Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu Tyr Arg Glu
785                 790                 795                 800
<210>4
<211>2400
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>4
atgggccact ggtacaagca ccagcgcgcc taccagttca ccggcgagga cgacttcggg     60
aaggtggccg tggtgaagct cccgatggac ctcaccaagg tgggcatcat cgtgcgcctc    120
aacgagtggc aggcgaagga cgtggccaag gaccgcttca tcgagatcaa ggacggcaag    180
gccgaggtgt ggatactcca gggcgtggag gagatcttct acgagaagcc ggacacctcc    240
ccgcgcatct tcttcgccca ggcccgctcc aacaaggtga tcgaggcctt cctcaccaac    300
ccggtggaca ccaagaagaa ggagctgttc aaggtgaccg tcgacggcaa ggagatcccg    360
gtgtcccgcg tggagaaggc cgacccgacc gacatcgacg tgaccaacta cgtgcgcatc    420
gtgctctccg agtccctcaa ggaggaggac ctccgcaagg acgtggagct gatcatcgag    480
ggctacaagc cggcccgcgt gatcatgatg gagatcctcg acgactacta ctacgacggc    540
gagctggggg cggtgtactc cccggagaag accatcttcc gcgtgtggtc cccggtgtcc    600
aagtgggtga aggtgctcct cttcaagaac ggcgaggaca ccgagccgta ccaggtggtg    660
aacatggagt acaagggcaa cggcgtgtgg gaggccgtgg tggagggcga cctcgacggc    720
gtgttctacc tctaccagct ggagaactac ggcaagatcc gcaccaccgt ggacccgtac    780
tccaaggccg tgtacgccaa caaccaggag tctgcagtgg tgaacctcgc ccgcaccaac    840
ccggagggct gggagaacga ccgcggcccg aagatcgagg gctacgagga cgccatcatc    900
tacgagatcc acatcgccga catcaccggc ctggagaact ccggcgtgaa gaacaagggc    960
ctctacctcg gcctcaccga ggagaacacc aaggccccgg gcggcgtgac caccggcctc   1020
tcccacctcg tggagctggg cgtgacccac gtgcacatcc tcccgttctt cgacttctac   1080
accggcgacg agctggacaa ggacttcgag aagtactaca actggggcta cgacccgtac   1140
ctcttcatgg tgccggaggg ccgctactcc accgacccga agaacccgca cacccgaatt   1200
cgcgaggtga aggagatggt gaaggccctc cacaagcacg gcatcggcgt gatcatggac   1260
atggtgttcc cgcacaccta cggcatcggc gagctgtccg ccttcgacca gaccgtgccg   1320
tactacttct accgcatcga caagaccggc gcctacctca acgagtccgg ctgcggcaac   1380
gtgatcgcct ccgagcgccc gatgatgcgc aagttcatcg tggacaccgt gacctactgg   1440
gtgaaggagt accacatcga cggcttccgc ttcgaccaga tgggcctcat cgacaagaag   1500
accatgctgg aggtggagcg cgccctccac aagatcgacc cgaccatcat cctctacggc   1560
gagccgtggg gcggctgggg ggccccgatc cgcttcggca agtccgacgt ggccggcacc   1620
cacgtggccg ccttcaacga cgagttccgc gacgccatcc gcggctccgt gttcaacccg   1680
tccgtgaagg gcttcgtgat gggcggctac ggcaaggaga ccaagatcaa gcgcggcgtg   1740
gtgggctcca tcaactacga cggcaagctc atcaagtcct tcgccctcga cccggaggag   1800
accatcaact acgccgcctg ccacgacaac cacaccctct gggacaagaa ctacctcgcc   1860
gccaaggccg acaagaagaa ggagtggacc gaggaggagc tgaagaacgc ccagaagctc   1920
gccggcgcca tcctcctcac tagtcagggc gtgccgttcc tccacggcgg ccaggacttc   1980
tgccgcacca ccaacttcaa cgacaactcc tacaacgccc cgatctccat caacggcttc   2040
gactacgagc gcaagctcca gttcatcgac gtgttcaact accacaaggg cctcatcaag   2100
ctccgcaagg agcacccggc cttccgcctc aagaacgccg aggagatcaa gaagcacctg   2160
gagttcctcc cgggcgggcg ccgcatcgtg gccttcatgc tcaaggacca cgccggcggc   2220
gacccgtgga aggacatcgt ggtgatctac aacggcaacc tggagaagac cacctacaag   2280
ctcccggagg gcaagtggaa cgtggtggtg aactcccaga aggccggcac cgaggtgatc   2340
gagaccgtgg agggcaccat cgagctggac ccgctctccg cctacgtgct ctaccgcgag   2400
<210>5
<211>693
<212>PRT
<213>硫磺矿硫化叶菌
<400>5
Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr Lys Val Val
 1               5                  10                  15
Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu Gln Lys Ile
            20                  25                  30
Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile Val Gln Gln
        35                  40                  45
Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys Glu His Ile
    50                  55                  60
Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys Arg Lys Arg
65                  70                  75                  80
Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys Tyr Gln Asp
                85                  90                  95
Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys Asp Gly Val
            100                 105                 110
Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile Phe Asp Val
        115                 120                 125
Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro Glu Asp Ser
    130                 135                 140
Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp Val Leu Glu
145                 150                 155                 160
Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro Met Trp Ala
                165                 170                 175
Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln Asp Lys Val
            180                 185                 190
Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg Val Ala Gly
        195                 200                 205
Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu Phe Thr Trp
    210                 215                 220
His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp Glu Leu His
225                 230                 235                 240
Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly Ile Arg Val
                245                 250                 255
Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys Phe Cys Glu
            260                 265                 270
Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro Gly Thr Thr
        275                 280                 285
Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp Trp Ala Gly
    290                 295                 300
Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile Trp Leu Asp
305                 310                 315                 320
Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile Arg Asp Val
                325                 330                 335
Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu Val Thr Thr
            340                 345                 350
Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg Val Lys His
        355                 360                 365
Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met Ala Thr Phe
    370                 375                 380
Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile Leu Ser Arg
385                 390                 395                 400
Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp Thr Gly Asp
                405                 410                 415
Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln Leu Val Leu
            420                 425                 430
Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp Ile Gly Gly
        435                 440                 445
Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met Asp Leu Leu
    450                 455                 460
Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr Arg Ser His
465                 470                 475                 480
Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu Pro Asp Tyr
                485                 490                 495
Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr Lys Phe Leu
            500                 505                 510
Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys Gly His Pro
        515                 520                 525
Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp Asp Met Tyr
    530                 535                 540
Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu Tyr Ala Pro
545                 550                 555                 560
Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro Ara Gly Lys
                565                 570                 575
Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys Ser Val Val
            580                 585                 590
Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly Ser Ile Ile
        595                 600                 605
Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr Ser Phe Lys
    610                 615                 620
Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu Ile Lys Phe
625                 630                 635                 640
Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser Glu Lys Pro
                645                 650                 655
Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln Val Glu Lys
            660                 665                 670
Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys Ile Arg Gly
        675                 680                 685
Lys Ile Asn Leu Glu
    690
<210>6
<211>2082
<212>DNA
<213>硫磺矿硫化叶菌
<400>6
atggagacca tcaagatcta cgagaacaag ggcgtgtaca aggtggtgat cggcgagccg     60
ttcccgccga tcgagttccc gctcgagcag aagatctcct ccaacaagtc cctctccgag    120
ctgggcctca ccatcgtgca gcagggcaac aaggtgatcg tggagaagtc cctcgacctc    180
aaggagcaca tcatcggcct cggcgagaag gccttcgagc tggaccgcaa gcgcaagcgc    240
tacgtgatgt acaacgtgga cgccggcgcc tacaagaagt accaggaccc gctctacgtg    300
tccatcccgc tcttcatctc cgtgaaggac ggcgtggcca ccggctactt cttcaactcc    360
gcctccaagg tgatcttcga cgtgggcctc gaggagtacg acaaggtgat cgtgaccatc    420
ccggaggact ccgtggagtt ctacgtgatc gagggcccgc gcatcgagga cgtgctcgag    480
aagtacaccg agctgaccgg caagccgttc ctcccgccga tgtgggcctt cggctacatg    540
atctcccgct actcctacta cccgcaggac aaggtggtgg agctggtgga catcatgcag    600
aaggagggct tccgcgtggc cggcgtgttc ctcgacatcc actacatgga ctcctacaag    660
ctcttcacct ggcacccgta ccgcttcccg gagccgaaga agctcatcga cgagctgcac    720
aagcgcaacg tgaagctcat caccatcgtg gaccacggca tccgcgtgga ccagaactac    780
tccccgttcc tctccggcat gggcaagttc tgcgagatcg agtccggcga gctgttcgtg    840
ggcaagatgt ggccgggcac caccgtgtac ccggacttct tccgcgagga cacccgcgag    900
tggtgggccg gcctcatctc cgagtggctc tcccagggcg tggacggcat ctggctcgac    960
atgaacgagc cgaccgactt ctcccgcgcc atcgagatcc gcgacgtgct ctcctccctc   1020
ccggtgcagt tccgcgacga ccgcctcgtg accaccttcc cggacaacgt ggtgcactac   1080
ctccgcggca agcgcgtgaa gcacgagaag gtgcgcaacg cctacccgct ctacgaggcg   1140
atggccacct tcaagggctt ccgcacctcc caccgcaacg agatcttcat cctctcccgc   1200
gccggctacg ccggcatcca gcgctacgcc ttcatctgga ccggcgacaa caccccgtcc   1260
tgggacgacc tcaagctcca gctccagctc gtgctcggcc tctccatctc cggcgtgccg   1320
ttcgtgggct gcgacatcgg cggcttccag ggccgcaact tcgccgagat cgacaactcg   1380
atggacctcc tcgtgaagta ctacgccctc gccctcttct tcccgttcta ccgctcccac   1440
aaggccaccg acggcatcga caccgagccg gtgttcctcc cggactacta caaggagaag   1500
gtgaaggaga tcgtggagct gcgctacaag ttcctcccgt acatctactc cctcgccctc   1560
gaggcctccg agaagggcca cccggtgatc cgcccgctct tctacgagtt ccaggacgac   1620
gacgacatgt accgcatcga ggacgagtac atggtgggca agtacctcct ctacgccccg   1680
atcgtgtcca aggaggagtc ccgcctcgtg accctcccgc gcggcaagtg gtacaactac   1740
tggaacggcg agatcatcaa cggcaagtcc gtggtgaagt ccacccacga gctgccgatc   1800
tacctccgcg agggctccat catcccgctc gagggcgacg agctgatcgt gtacggcgag   1860
acctccttca agcgctacga caacgccgag atcacctcct cctccaacga gatcaagttc   1920
tcccgcgaga tctacgtgtc caagctcacc atcacctccg agaagccggt gtccaagatc   1980
atcgtggacg actccaagga gatccaggtg gagaagacca tgcagaacac ctacgtggcc   2040
aagatcaacc agaagatccg cggcaagatc aacctcgagt ga                      2082
<210>7
<211>1818
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>7
atggcggctc tggccacgtc gcagctcgtc gcaacgcgcg ccggcctggg cgtcccggac     60
gcgtccacgt tccgccgcgg cgccgcgcag ggcctgaggg gggcccgggc gtcggcggcg    120
gcggacacgc tcagcatgcg gaccagcgcg cgcgcggcgc ccaggcacca gcaccagcag    180
gcgcgccgcg gggccaggtt cccgtcgctc gtcgtgtgcg ccagcgccgg catgaacgtc    240
gtcttcgtcg gcgccgagat ggcgccgtgg agcaagaccg gaggcctcgg cgacgtcctc    300
ggcggcctgc cgccggccat ggccgcgaac gggcaccgtg tcatggtcgt ctctccccgc    360
tacgaccagt acaaggacgc ctgggacacc agcgtcgtgt ccgagatcaa gatgggagac    420
gggtacgaga cggtcaggtt cttccactgc tacaagcgcg gagtggaccg cgtgttcgtt    480
gaccacccac tgttcctgga gagggtttgg ggaaagaccg aggagaagat ctacgggcct    540
gtcgctggaa cggactacag ggacaaccag ctgcggttca gcctgctatg ccaggcagca    600
cttgaagctc caaggatcct gagcctcaac aacaacccat acttctccgg accatacggg    660
gaggacgtcg tgttcgtctg caacgactgg cacaccggcc ctctctcgtg ctacctcaag    720
agcaactacc agtcccacgg catctacagg gacgcaaaga ccgctttctg catccacaac    780
atctcctacc agggccggtt cgccttctcc gactacccgg agctgaacct ccccgagaga    840
ttcaagtcgt ccttcgattt catcgacggc tacgagaagc ccgtggaagg ccggaagatc    900
aactggatga aggccgggat cctcgaggcc gacagggtcc tcaccgtcag cccctactac    960
gccgaggagc tcatctccgg catcgccagg ggctgcgagc tcgacaacat catgcgcctc   1020
accggcatca ccggcatcgt caacggcatg gacgtcagcg agtgggaccc cagcagggac   1080
aagtacatcg ccgtgaagta cgacgtgtcg acggccgtgg aggccaaggc gctgaacaag   1140
gaggcgctgc aggcggaggt cgggctcccg gtggaccgga acatcccgct ggtggcgttc   1200
atcggcaggc tggaagagca gaagggcccc gacgtcatgg cggccgccat cccgcagctc   1260
atggagatgg tggaggacgt gcagatcgtt ctgctgggca cgggcaagaa gaagttcgag   1320
cgcatgctca tgagcgccga ggagaagttc ccaggcaagg tgcgcgccgt ggtcaagttc   1380
aacgcggcgc tggcgcacca catcatggcc ggcgccgacg tgctcgccgt caccagccgc   1440
ttcgagccct gcggcctcat ccagctgcag gggatgcgat acggaacgcc ctgcgcctgc   1500
gcgtccaccg gtggactcgt cgacaccatc atcgaaggca agaccgggtt ccacatgggc   1560
cgcctcagcg tcgactgcaa cgtcgtggag ccggcggacg tcaagaaggt ggccaccacc   1620
ttgcagcgcg ccatcaaggt ggtcggcacg ccggcgtacg aggagatggt gaggaactgc   1680
atgatccagg atctctcctg gaagggccct gccaagaact gggagaacgt gctgctcagc   1740
ctcggggtcg ccggcggcga gccaggggtt gaaggcgagg agatcgcgcc gctcgccaag   1800
gagaacgtgg ccgcgccc                                                 1818
<210>8
<211>606
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>8
Met Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly Leu
 1               5                  10                  15
Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly Leu
            20                  25                  30
Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg Thr
        35                  40                  45
Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg Gly
    50                  55                  60
Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Met Asn Val
65                  70                  75                  80
Val Phe Val Gly Ala Glu Met Ala Pro Trp Ser Lys Thr Gly Gly Leu
                85                  90                  95
Gly Asp Val Leu Gly Gly Leu Pro Pro Ala Met Ala Ala Asn Gly His
            100                 105                 110
Arg Val Met Val Val Ser Pro Arg Tyr Asp Gln Tyr Lys Asp Ala Trp
        115                 120                 125
Asp Thr Ser Val Val Ser Glu Ile Lys Met Gly Asp Gly Tyr Glu Thr
    130                 135                 140
Val Arg Phe Phe His Cys Tyr Lys Arg Gly Val Asp Arg Val Phe Val
145                 150                 155                 160
Asp His Pro Leu Phe Leu Glu Arg Val Trp Gly Lys Thr Glu Glu Lys
                165                 170                 175
Ile Tyr Gly Pro Val Ala Gly Thr Asp Tyr Arg Asp Asn Gln Leu Arg
            180                 185                 190
Phe Ser Leu Leu Cys Gln Ala Ala Leu Glu Ala Pro Arg Ile Leu Ser
        195                 200                 205
Leu Asn Asn Asn Pro Tyr Phe Ser Gly Pro Tyr Gly Glu Asp Val Val
    210                 215                 220
Phe Val Cys Asn Asp Trp His Thr Gly Pro Leu Ser Cys Tyr Leu Lys
225                 230                 235                 240
Ser Asn Tyr Gln Ser His Gly Ile Tyr Arg Asp Ala Lys Thr Ala Phe
                245                 250                 255
Cys Ile His Asn Ile Ser Tyr Gln Gly Arg Phe Ala Phe Ser Asp Tyr
            260                 265                 270
Pro Glu Leu Asn Leu Pro Glu Arg Phe Lys Ser Ser Phe Asp Phe Ile
        275                 280                 285
Asp Gly Tyr Glu Lys Pro Val Glu Gly Arg Lys Ile Asn Trp Met Lys
    290                 295                 300
Ala Gly Ile Leu Glu Ala Asp Arg Val Leu Thr Val Ser Pro Tyr Tyr
305                 310                 315                 320
Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg Gly Cys Glu Leu Asp Asn
                325                 330                 335
Ile Met Arg Leu Thr Gly Ile Thr Gly Ile Val Asn Gly Met Asp Val
            340                 345                 350
Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr Ile Ala Val Lys Tyr Asp
        355                 360                 365
Val Ser Thr Ala Val Glu Ala Lys Ala Leu Asn Lys Glu Ala Leu Gln
    370                 375                 380
Ala Glu Val Gly Leu Pro Val Asp Arg Asn Ile Pro Leu Val Ala Phe
385                 390                 395                 400
Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro Asp Val Met Ala Ala Ala
                405                 410                 415
Ile Pro Gln Leu Met Glu Met Val Glu Asp Val Gln Ile Val Leu Leu
            420                 425                 430
Gly Thr Gly Lys Lys Lys Phe Glu Arg Met Leu Met Ser Ala Glu Glu
        435                 440                 445
Lys Phe Pro Gly Lys Val Arg Ala Val Val Lys Phe Asn Ala Ala Leu
   450               455               460
Ala His His Ile Met Ala Gly Ala Asp Val Leu Ala Val Thr Ser Arg
465                 470                 475                 480
Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln Gly Met Arg Tyr Gly Thr
                485                 490                 495
Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu Val Asp Thr Ile Ile Glu
            500                 505                 510
Gly Lys Thr Gly Phe His Met Gly Arg Leu Ser Val Asp Cys Asn Val
        515                 520                 525
Val Glu Pro Ala Asp Val Lys Lys Val Ala Thr Thr Leu Gln Arg Ala
    530                 535                 540
Ile Lys Val Val Gly Thr Pro Ala Tyr Glu Glu Met Val Arg Asn Cys
545                 550                 555                 560
Met Ile Gln Asp Leu Ser Trp Lys Gly Pro Ala Lys Asn Trp Glu Asn
                565                 570                 575
Val Leu Leu Ser Leu Gly Val Ala Gly Gly Glu Pro Gly Val Glu Gly
            580                 585                 590
Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn Val Ala Ala Pro
        595                 600                 605
<210>9
<211>2223
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>9
atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac     60
gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac    120
gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg    180
atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg    240
gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac    300
ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg    360
aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac    420
accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc    480
ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg    540
caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac    600
gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg    660
gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc    720
gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac    780
atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc    840
aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg    900
tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag    960
tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc   1020
tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc   1080
tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg   1140
tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg   1200
gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc   1260
gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggcac atcgattgct   1320
ggcatcctcg aggccgacag ggtcctcacc gtcagcccct actacgccga ggagctcatc   1380
tccggcatcg ccaggggctg cgagctcgac aacatcatgc gcctcaccgg catcaccggc   1440
atcgtcaacg gcatggacgt cagcgagtgg gaccccagca gggacaagta catcgccgtg   1500
aagtacgacg tgtcgacggc cgtggaggcc aaggcgctga acaaggaggc gctgcaggcg   1560
gaggtcgggc tcccggtgga ccggaacatc ccgctggtgg cgttcatcgg caggctggaa   1620
gagcagaagg gccccgacgt catggcggcc gccatcccgc agctcatgga gatggtggag   1680
gacgtgcaga tcgttctgct gggcacgggc aagaagaagt tcgagcgcat gctcatgagc   1740
gccgaggaga agttcccagg caaggtgcgc gccgtggtca agttcaacgc ggcgctggcg   1800
caccacatca tggccggcgc cgacgtgctc gccgtcacca gccgcttcga gccctgcggc   1860
ctcatccagc tgcaggggat gcgatacgga acgccctgcg cctgcgcgtc caccggtgga   1920
ctcgtcgaca ccatcatcga aggcaagacc gggttccaca tgggccgcct cagcgtcgac   1980
tgcaacgtcg tggagccggc ggacgtcaag aaggtggcca ccaccttgca gcgcgccatc   2040
aaggtggtcg gcacgccggc gtacgaggag atggtgagga actgcatgat ccaggatctc   2100
tcctggaagg gccctgccaa gaactgggag aacgtgctgc tcagcctcgg ggtcgccggc   2160
ggcgagccag gggttgaagg cgaggagatc gcgccgctcg ccaaggagaa cgtggccgcg   2220
ccc                                                                 2223
<210>10
<211>741
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>10
Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala
 1               5                  10                  15
Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Ara
            20                  25                  30
Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile
        35                  40                  45
Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp
    50                  55                  60
Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val
65                  70                  75                  80
Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr
                85                  90                  95
Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His
            100                 105                 110
Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr
        115                 120                 125
Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr
    130                 135                 140
Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe
145                 150                 155                 160
Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp
                165                 170                 175
Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly
            180                 185                 190
Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val
        195                 200                 205
Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr
    210                 215                 220
Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly
225                 230                 235                 240
Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe
                245                 250                 255
Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly
            260                 265                 270
Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn
        275                 280                 285
His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile
    290                 295                 300
Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu
305                 310                 315                 320
Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn
                325                 330                 335
Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met
            340                 345                 350
Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr
        355                 360                 365
Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys
    370                 375                 380
Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp
385                 390                 395                 400
Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro
                405                 410                 415
Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr
            420                 425                 430
Cys Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val
        435                 440                 445
Leu Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala
    450                 455                 460
Arg Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly
465                 470                 475                 480
Ile Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys
                485                 490                 495
Tyr Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala
            500                 505                 510
Leu Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg
        515                 520                 525
Asn Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly
    530                 535                 540
Pro Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu
545                 550                 555                 560
Asp Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg
                565                 570                 575
Met Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val
            580                 585                 590
Val Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp
        595                 600                 605
Val Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu
    610                 615                 620
Gln Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly
625                 630                 635                 640
Leu Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg
                645                 650                 655
Leu Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val
            660                 665                 670
Ala Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr
        675                 680                 685
Glu Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly
    690                 695                 700
Pro Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly
705                 710                 715                 720
Gly Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu
                725                 730                 735
Asn Val Ala Ala Pro
            740
<210>11
<211>1515
<212>DNA
<213>玉蜀黍
<400>11
ggagagctat gagacgtatg tcctcaaagc cactttgcat tgtgtgaaac caatatcgat     60
ctttgttact tcatcatgca tgaacatttg tggaaactac tagcttacaa gcattagtga    120
cagctcagaa aaaagttatc tatgaaaggt ttcatgtgta ccgtgggaaa tgagaaatgt    180
tgccaactca aacaccttca atatgttgtt tgcaggcaaa ctcttctgga agaaaggtgt    240
ctaaaactat gaacgggtta cagaaaggta taaaccacgg ctgtgcattt tggaagtatc    300
atctatagat gtctgttgag gggaaagccg tacgccaacg ttatttactc agaaacagct    360
tcaacacaca gttgtctgct ttatgatggc atctccaccc aggcacccac catcacctat    420
ctctcgtgcc tgtttatttt cttgcccttt ctgatcataa aaaaacatta agagtttgca    480
aacatgcata ggcatatcaa tatgctcatt tattaatttg ctagcagatc atcttcctac    540
tctttacttt atttattgtt tgaaaaatat gtcctgcacc tagggagctc gtatacagta    600
ccaatgcatc ttcattaaat gtgaatttca gaaaggaagt aggaacctat gagagtattt    660
ttcaaaatta attagcggct tctattatgt ttatagcaaa ggccaagggc aaaattggaa    720
cactaatgat ggttggttgc atgagtctgt cgattacttg caagaaatgt gaacctttgt    780
ttctgtgcgt gggcataaaa caaacagctt ctagcctctt ttacggtact tgcacttgca    840
agaaatgtga actccttttc atttctgtat gtggacataa tgccaaagca tccaggcttt    900
ttcatggttg ttgatgtctt tacacagttc atctccacca gtatgccctc ctcatactct    960
atataaacac atcaacagca tcgcaattag ccacaagatc acttcgggag gcaagtgcga   1020
tttcgatctc gcagccacct ttttttgttc tgttgtaagt ataccttccc ttaccatctt   1080
tatctgttag tttaatttgt aattgggaag tattagtgga aagaggatga gatgctatca   1140
tctatgtact ctgcaaatgc atctgacgtt atatgggctg cttcatataa tttgaattgc   1200
tccattcttg ccgacaatat attgcaaggt atatgcctag ttccatcaaa agttctgttt   1260
tttcattcta aaagcatttt agtggcacac aatttttgtc catgagggaa aggaaatctg   1320
ttttggttac tttgcttgag gtgcattctt catatgtcca gttttatgga agtaataaac   1380
ttcagtttgg tcataagatg tcatattaaa gggcaaacat atattcaatg ttcaattcat   1440
cgtaaatgtt ccctttttgt aaaagattgc atactcattt atttgagttg caggtgtatc   1500
tagtagttgg aggag                                                    1515
<210>12
<211>673
<212>DNA
<213>玉蜀黍
<400>12
gatcatccag gtgcaaccgt ataagtccta aagtggtgag gaacacgaaa caaccatgca     60
ttggcatgta aagctccaag aatttgttgt atccttaaca actcacagaa catcaaccaa    120
aattgcacgt caagggtatt gggtaagaaa caatcaaaca aatcctctct gtgtgcaaag    180
aaacacggtg agtcatgccg agatcatact catctgatat acatgcttac agctcacaag    240
acattacaaa caactcatat tgcattacaa agatcgtttc atgaaaaata aaataggccg    300
gacaggacaa aaatccttga cgtgtaaagt aaatttacaa caaaaaaaaa gccatatgtc    360
aagctaaatc taattcgttt tacgtagatc aacaacctgt agaaggcaac aaaactgagc    420
cacgcagaag tacagaatga ttccagatga accatcgacg tgctacgtaa agagagtgac    480
gagtcatata catttggcaa gaaaccatga agctgcctac agccgtctcg gtggcataag    540
aacacaagaa attgtgttaa ttaatcaaag ctataaataa cgctcgcatg cctgtgcact    600
tctccatcac caccactggg tcttcagacc attagcttta tctactccag agcgcagaag    660
aacccgatcg aca                                                       673
<210>13
<211>454
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>13
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                  440                  445
Ser Tyr Cys Gly Val Gly
    450
<210>14
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>14
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>15
<211>518
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>15
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
 1               5                  10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met
65                  70                  75                  80
Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe
                85                  90                  95
Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln
            100                 105                 110
Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro
        115                 120                 125
Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro
    130                 135                 140
Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu
145                 150                 155                 160
Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala
                165                 170                 175
His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg
            180                 185                 190
Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp
        195                 200                 205
Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu
    210                 215                 220
Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly
225                 230                 235                 240
Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu
                245                 250                 255
Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile
            260                 265                 270
Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val
        275                 280                 285
Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp
    290                 295                 300
Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala
305                 310                 315                 320
Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp
                325                 330                 335
Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr
            340                 345                 350
Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His
        355                 360                 365
Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu
    370                 375                 380
Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp
385                 390                 395                 400
Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu
                405                 410                 415
Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile
            420                 425                 430
Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile
        435                 440                 445
Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe
    450                 455                 460
Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val
465                 470                 475                 480
Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala
                485                 490                 495
Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys
            500                 505                 510
Gly Val Gly Thr Ser Ile
        515
<210>16
<211>820
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>16
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
 1               5                  10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met
65                  70                  75                  80
Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe
                85                  90                  95
Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln
            100                 105                 110
Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro
        115                 120                 125
Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro
    130                 135                 140
Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu
145                 150                 155                 160
Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala
                165                 170                 175
His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg
            180                 185                 190
Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp
        195                 200                 205
Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu
    210                 215                 220
Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly
225                 230                 235                 240
Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu
                245                 250                 255
Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile
            260                 265                 270
Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val
        275                 280                 285
Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp
    290                 295                 300
Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala
305                 310                 315                 320
Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp
                325                 330                 335
Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr
            340                 345                 350
Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His
        355                 360                 365
Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu
    370                 375                 380
Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp
385                 390                 395                 400
Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu
                405                 410                 415
Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile
            420                 425                 430
Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile
        435                 440                 445
Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe
    450                 455                 460
Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val
465                 470                 475                 480
Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala
                485                 490                 495
Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys
            500                 505                 510
Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val Leu
        515                 520                 525
Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg
    530                 535                 540
Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly Ile
545                 550                 555                 560
Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr
                565                 570                 575
Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala Leu
            580                 585                 590
Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg Asn
        595                 600                 605
Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro
    610                 615                 620
Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu Asp
625                 630                 635                 640
Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg Met
                645                 650                 655
Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val Val
            660                 665                 670
Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp Val
        675                 680                 685
Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln
    690                 695                 700
Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu
705                 710                 715                 720
Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg Leu
                725                 730                 735
Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val Ala
            740                 745                 750
Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr Glu
        755                 760                 765
Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly Pro
    770                 775                 780
Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly Gly
785                 790                 795                 800
Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn
                805                 810                 815
Val Ala Ala Pro
            820
<210>17
<211>19
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>17
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser
<210>18
<211>444
<212>PRT
<213>海栖热袍菌
<400>18
Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys
 1               5                  10                  15
Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val
            20                  25                  30
Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe
        35                  40                  45
Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr
    50                  55                  60
Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe
65                  70                  75                  80
Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu
                85                  90                  95
Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu
            100                 105                 110
Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu
        115                 120                 125
Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu
    130                 135                 140
Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala
145                 150                 155                 160
Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile
                165                 170                 175
Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu
            180                 185                 190
Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn
        195                 200                 205
Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly
    210                 215                 220
Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys
225                 230                 235                 240
His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn
                245                 250                 255
His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala
            260                 265                 270
Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile
        275                 280                 285
Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu
    290                 295                 300
Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu
305                 310                 315                 320
Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu
                325                 330                 335
Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu
            340                 345                 350
Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys
            355             360                 365
Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu
    370                 375                 380
Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu
385                 390                 395                 400
Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu
                405                 410                 415
Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu
            420                 425                 430
Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg
        435                 440
<210>19
<211>1335
<212>DNA
<213>海栖热袍菌
<400>19
atggccgagt tcttcccgga gatcccgaag atccagttcg agggcaagga gtccaccaac     60
ccgctcgcct tccgcttcta cgacccgaac gaggtgatcg acggcaagcc gctcaaggac    120
cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc    180
ggcgacccga ccgccgagcg cccgtggaac cgcttctccg acccgatgga caaggccttc    240
gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc    300
cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac    360
aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc    420
accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc    480
gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg    540
ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc    600
gacctcggcc tggagctgga gaacctcgcc cgcttcctcc gcatggccgt ggagtacgcc    660
aagaagatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag    720
caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagaacca cggcctcgac    780
gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag    840
cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc    900
gacctcctcc tcggctggga caccgaccag ttcccgacca acatctacga caccaccctc    960
gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc   1020
aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg   1080
gacaccttcg ccctcggctt caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac   1140
aagttcatcg aggagaagta ccgctccttc aaggagggca tcggcaagga gatcgtggag   1200
ggcaagaccg acttcgagaa gctggaggag tacatcatcg acaaggagga catcgagctg   1260
ccgtccggca agcaggagta cctggagtcc ctcctcaact cctacatcgt gaagaccatc   1320
gccgagctgc gctga                                                    1335
<210>20
<211>444
<212>PRT
<213>那不勒斯栖热袍菌
<400>20
Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys
 1               5                  10                  15
Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile
            20                  25                  30
Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe
        35                  40                  45
Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr
    50                  55                  60
Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe
65                  70                  75                  80
Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu
                85                  90                  95
Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu
            100                 105                 110
Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu
        115                 120                 125
Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu
    130                 135                 140
Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala
145                 150                 155                 160
Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile
                165                 170                 175
Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu
            180                 185                 190
Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn
        195                 200                 205
Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly
    210                 215                 220
Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys
225                 230                 235                 240
His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser
                245                 250                 255
His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala
            260                 265                 270
Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile
        275                 280                 285
Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu
    290                 295                 300
Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu
305                 310                 315                 320
Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu
                325                 330                 335
Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu
            340                 345                 350
Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys
        355                 360                 365
Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu
    370                 375                 380
Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu
385                 390                 395                 400
Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu
                405                 410                 415
Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile
            420                 425                 430
Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
        435                 440
<210>21
<211>1335
<212>DNA
<213>那不勒斯栖热袍菌
<400>21
atggccgagt tcttcccgga gatcccgaag gtgcagttcg agggcaagga gtccaccaac     60
ccgctcgcct tcaagttcta cgacccggag gagatcatcg acggcaagcc gctcaaggac    120
cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc    180
ggcgacccga ccgccgaccg cccgtggaac cgctacaccg acccgatgga caaggccttc    240
gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc    300
cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac    360
aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc    420
accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc    480
gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg    540
ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc    600
gacctcggct tcgagctgga gaacctcgcc cgcttcctcc gcatggccgt ggactacgcc    660
aagcgcatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag    720
caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagtccca cggcctcgac    780
gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag    840
cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc    900
gacctcctcc tcggctggga caccgaccag ttcccgacca acgtgtacga caccaccctc    960
gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc   1020
aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg   1080
gacaccttcg ccctcggctt caaggtggcc tacaagctcg tgaaggacgg cgtgctcgac   1140
aagttcatcg aggagaagta ccgctccttc cgcgagggca tcggccgcga catcgtggag   1200
ggcaaggtgg acttcgagaa gctggaggag tacatcatcg acaaggagac catcgagctg   1260
ccgtccggca agcaggagta cctggagtcc ctcatcaact cctacatcgt gaagaccatc   1320
ctggagctgc gctga                                                    1335
<210>22
<211>28
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>22
agcgaattca tggcggctct ggccacgt                                        28
<210>23
<211>29
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>23
agctaagctt cagggcgcgg ccacgttct                                       29
<210>24
<211>825
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>24
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe
            20                  25                  30
Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met
        35                  40                  45
Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala
    50                  55                  60
Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala
65                  70                  75                  80
Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro
                85                  90                  95
Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val
            100                 105                 110
Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu
        115                 120                 125
Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu
    130                 135                 140
Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val
145                 150                 155                 160
Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu
                165                 170                 175
Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu
            180                 185                 190
Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu
        195                 200                 205
Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val
    210                 215                 220
Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn
225                 230                 235                 240
Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp
                245                 250                 255
Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile
            260                 265                 270
Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Ash Asn Gln
        275                 280                 285
Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu
    290                 295                 300
Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr
305                 310                 315                 320
Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys
                325                 330                 335
Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro
            340                 345                 350
Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr
        355                 360                 365
His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu
    370                 375                 380
Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu
385                 390                 395                 400
Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His
                405                 410                 415
Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His
            420                 425                 430
Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile
        435                 440                 445
Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg
    450                 455                 460
Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val
465                 470                 475                 480
Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val
                485                 490                 495
Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln
            500                 505                 510
Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu
        515                 520                 525
His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly
    530                 535                 540
Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His
545                 550                 555                 560
Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val
                565                 570                 575
Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu
            580                 585                 590
Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys
        595                 600                 605
Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala
    610                 615                 620
Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala
625                 630                 635                 640
Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala
                645                 650                 655
Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe
            660                 665                 670
Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn
        675                 680                 685
Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys
    690                 695                 700
Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu
705                 710                 715                 720
Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys
                725                 730                 735
Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met
            740                 745                 750
Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile
        755                 760                 765
Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys
    770                 775                 780
Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu
785                 790                 795                 800
Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu
                805                 810                 815
Tyr Arg Glu Ser Glu Lys Asp Glu Leu
            820                 825
<210>25
<211>2478
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>25
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct     60
ggccactggt acaagcacca gcgcgcctac cagttcaccg gcgaggacga cttcgggaag    120
gtggccgtgg tgaagctccc gatggacctc accaaggtgg gcatcatcgt gcgcctcaac    180
gagtggcagg cgaaggacgt ggccaaggac cgcttcatcg agatcaagga cggcaaggcc    240
gaggtgtgga tactccaggg cgtggaggag atcttctacg agaagccgga cacctccccg    300
cgcatcttct tcgcccaggc ccgctccaac aaggtgatcg aggccttcct caccaacccg    360
gtggacacca agaagaagga gctgttcaag gtgaccgtcg acggcaagga gatcccggtg    420
tcccgcgtgg agaaggccga cccgaccgac atcgacgtga ccaactacgt gcgcatcgtg    480
ctctccgagt ccctcaagga ggaggacctc cgcaaggacg tggagctgat catcgagggc    540
tacaagccgg cccgcgtgat catgatggag atcctcgacg actactacta cgacggcgag    600
ctgggggcgg tgtactcccc ggagaagacc atcttccgcg tgtggtcccc ggtgtccaag    660
tgggtgaagg tgctcctctt caagaacggc gaggacaccg agccgtacca ggtggtgaac    720
atggagtaca agggcaacgg cgtgtgggag gccgtggtgg agggcgacct cgacggcgtg    780
ttctacctct accagctgga gaactacggc aagatccgca ccaccgtgga cccgtactcc    840
aaggccgtgt acgccaacaa ccaggagtct gcagtggtga acctcgcccg caccaacccg    900
gagggctggg agaacgaccg cggcccgaag atcgagggct acgaggacgc catcatctac    960
gagatccaca tcgccgacat caccggcctg gagaactccg gcgtgaagaa caagggcctc   1020
tacctcggcc tcaccgagga gaacaccaag gccccgggcg gcgtgaccac cggcctctcc   1080
cacctcgtgg agctgggcgt gacccacgtg cacatcctcc cgttcttcga cttctacacc   1140
ggcgacgagc tggacaagga cttcgagaag tactacaact ggggctacga cccgtacctc   1200
ttcatggtgc cggagggccg ctactccacc gacccgaaga acccgcacac ccgaattcgc   1260
gaggtgaagg agatggtgaa ggccctccac aagcacggca tcggcgtgat catggacatg   1320
gtgttcccgc acacctacgg catcggcgag ctgtccgcct tcgaccagac cgtgccgtac   1380
tacttctacc gcatcgacaa gaccggcgcc tacctcaacg agtccggctg cggcaacgtg   1440
atcgcctccg agcgcccgat gatgcgcaag ttcatcgtgg acaccgtgac ctactgggtg   1500
aaggagtacc acatcgacgg cttccgcttc gaccagatgg gcctcatcga caagaagacc   1560
atgctggagg tggagcgcgc cctccacaag atcgacccga ccatcatcct ctacggcgag   1620
ccgtggggcg gctggggggc cccgatccgc ttcggcaagt ccgacgtggc cggcacccac   1680
gtggccgcct tcaacgacga gttccgcgac gccatccgcg gctccgtgtt caacccgtcc   1740
gtgaagggct tcgtgatggg cggctacggc aaggagacca agatcaagcg cggcgtggtg   1800
ggctccatca actacgacgg caagctcatc aagtccttcg ccctcgaccc ggaggagacc   1860
atcaactacg ccgcctgcca cgacaaccac accctctggg acaagaacta cctcgccgcc   1920
aaggccgaca agaagaagga gtggaccgag gaggagctga agaacgccca gaagctcgcc   1980
ggcgccatcc tcctcactag tcagggcgtg ccgttcctcc acggcggcca ggacttctgc   2040
cgcaccacca acttcaacga caactcctac aacgccccga tctccatcaa cggcttcgac   2100
tacgagcgca agctccagtt catcgacgtg ttcaactacc acaagggcct catcaagctc   2160
cgcaaggagc acccggcctt ccgcctcaag aacgccgagg agatcaagaa gcacctggag   2220
ttcctcccgg gcgggcgccg catcgtggcc ttcatgctca aggaccacgc cggcggcgac   2280
ccgtggaagg acatcgtggt gatctacaac ggcaacctgg agaagaccac ctacaagctc   2340
ccggagggca agtggaacgt ggtggtgaac tcccagaagg ccggcaccga ggtgatcgag   2400
accgtggagg gcaccatcga gctggacccg ctctccgcct acgtgctcta ccgcgagtcc   2460
gagaaggacg agctgtga                                                 2478
<210>26
<211>718
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>26
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr
            20                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                  80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145                 150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                 175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                  335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Ash Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
            595             600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660                 665                 670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu
705                 710                 715
<210>27
<211>712
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>27
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr
            20                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                  80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145                 150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                 175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                 270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                 335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
        595                 600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660             665                     670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu
705                 710
<210>28
<211>469
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>28
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro
        35                  40                  45
Asn Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
65                  70                  75                  80
Asp Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                 110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly
        115                 120                 125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys
225                 230                 235                 240
Lys Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu
                245                 250                 255
Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe
            260                 265                 270
Leu Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
    290                 295                 300
Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
            355             360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu
                405                 410                 415
Ile Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
        435                 440                 445
Ser Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg Ser
    450                 455                 460
Glu Lys Asp Glu Leu
465
<210>29
<211>469
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>29
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro
        35                  40                  45
Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
65                  70                  75                  80
Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                 110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly
        115                 120                 125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys
225                 230                 235                 240
Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu
                245                 250                 255
Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe
            260                 265                 270
Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Ash His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
    290                 295                 300
Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
        355                 360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp
                405                 410                 415
Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
        435                 440                 445
Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg Ser
    450                 455                 460
Glu Lys Asp Glu Leu
465
<210>30
<211>463
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>30
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe
            20                  25                  30
Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro
        35                  40                  45
Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser
    50                  55                  60
Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly
65                  70                  75                  80
Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp
                85                  90                  95
Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu
            100                 105                  110
Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly
        115                 120             125
Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg
    130                 135                 140
Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr
145                 150                 155                 160
Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr
                165                 170                 175
Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala
            180                 185                 190
Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly
        195                 200                 205
Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu
    210                 215                 220
Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys
225                 230                 235                 240
Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu
                245                 250                 255
Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe
            260                 265                 270
Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala
        275                 280                 285
Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met
    290                 295                 300
Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp
305                 310                 315                 320
Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp
                325                 330                 335
Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys
            340                 345                 350
Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val
        355                 360                 365
Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu
    370                 375                 380
Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys
385                 390                 395                 400
Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp
                405                  410                415
Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile
            420                 425                 430
Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu
        435                 440                 445
Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
    450                 455                 460
<210>31
<211>25
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>31
Met Gly Lys Asn Gly Asn Leu Cys Cys Phe Ser Leu Leu Leu Leu Leu
 1               5                  10                  15
Leu Ala Gly Leu Ala Ser Gly His Gln
            20                  25
<210>32
<211>30
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>32
Met Gly Phe Val Leu Phe Ser Gln Leu Pro Ser Phe Leu Leu Val Ser
 1               5                  10                  15
Thr Leu Leu Leu Phe Leu Val Ile Ser His Ser Cys Arg Ala
        20                      25                  30
<210>33
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>33
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>34
<211>825
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>34
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe
            20                  25                  30
Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met
        35                  40                  45
Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala
    50                  55                  60
Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala
65                  70                  75                  80
Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro
                85                  90                  95
Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val
            100                 105                 110
Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu
        115                 120                 125
Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu
    130                 135                 140
Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val
145                 150                 155                 160
Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu
                165                 170                 175
Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu
            180                 185                 190
Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu
        195                 200                 205
Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val
    210                 215                 220
Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn
225                 230                 235                 240
Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp
                245                 250                 255
Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile
            260                 265                 270
Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln
        275                 280                 285
Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu
    290                 295                 300
Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr
305                 310                 315                 320
Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys
                325                 330                 335
Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro
            340                 345                 350
Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr
            355             360                 365
His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu
    370                 375                 380
Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu
385                 390                 395                 400
Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His
                405                 410                 415
Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His
            420                 425                 430
Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile
        435                 440                 445
Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg
    450                 455                 460
Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val
465                 470                 475                 480
Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val
                485                 490                 495
Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln
            500                 505                 510
Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu
        515                 520                 525
His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly
    530                 535                 540
Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His
545                 550                 555                 560
Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val
                565                 570                 575
Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu
            580                 585                 590
Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys
        595                 600                 605
Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala
    610                 615                 620
Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala
625                 630                 635                 640
Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala
                645                 650                 655
Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe
            660                 665                 670
Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn
        675                 680                 685
Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys
    690                 695                 700
Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu
705                 710                 715                 720
Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys
                725                 730                 735
Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met
            740                 745                 750
Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile
        755                 760                 765
Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys
    770                 775                 780
Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu
785                 790                 795                 800
Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu
                805                 810                 815
Tyr Arg Glu Ser Glu Lys Asp Glu Leu
            820             825
<210>35
<211>460
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>35
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met
            20                  25                  30
Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr
        35                  40                  45
Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile
    50                  55                  60
Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly
65                  70                  75                  80
Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly
                85                  90                  95
Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile
            100                 105                 110
Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile
        115                 120                 125
Asn His Arg Ala Gly Gly Asp Leu Glu Trp Ash Pro Phe Val Gly Asp
    130                 135                 140
Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala
145                 150                 155                 160
Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly
                165                 170                 175
Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln
            180                 185                 190
Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser
        195                 200                 205
Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala
    210                 215                 220
Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly
225                 230                 235                 240
Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser
                245                 250                 255
Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala
            260                 265                 270
Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn
        275                 280                 285
Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val
    290                 295                 300
Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala
305                 310                 315                 320
Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr
                325                 330                 335
Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His
            340                 345                 350
Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp
        355                 360                 365
Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile
    370                 375                 380
Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val
385                 390                 395                 400
Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly
                405                 410                 415
Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu
            420                 425                 430
Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp
        435                 440                 445
Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu
    450                 455                 460
<210>36
<211>718
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>36
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
 1               5                  10                  15
Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr
            20                  25                  30
Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu
        35                  40                  45
Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile
    50                  55                  60
Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys
65                  70                  75                  80
Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys
                85                  90                  95
Arg Lys Arg Tyr Val Mer Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys
            100                 105                 110
Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys
        115                 120                 125
Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile
    130                 135                 140
Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro
145                 150                 155                 160
Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp
                165                 170                 175
Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro
            180                 185                 190
Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln
        195                 200                 205
Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg
    210                 215                 220
Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu
225                 230                 235                 240
Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp
                245                 250                 255
Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly
            260                 265                 270
Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys
        275                 280                 285
Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro
    290                 295                 300
Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp
305                 310                 315                 320
Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile
                325                 330                 335
Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile
            340                 345                 350
Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu
        355                 360                 365
Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg
    370                 375                 380
Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met
385                 390                 395                 400
Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile
                405                 410                 415
Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp
            420                 425                 430
Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln
        435                 440                 445
Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp
    450                 455                 460
Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met
465                 470                 475                 480
Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr
                485                 490                 495
Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu
            500                 505                 510
Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr
        515                 520                 525
Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys
    530                 535                 540
Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp
545                 550                 555                 560
Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Va1 Gly Lys Tyr Leu Leu
                565                 570                 575
Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro
            580                 585                 590
Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys
        595                 600                 605
Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly
    610                 615                 620
Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr
625                 630                 635                 640
Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu
                645                 650                 655
Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser
            660                 665                 670
Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln
        675                 680                 685
Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys
    690                 695                 700
Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu
705                 710                 715
<210>37
<211>1434
<212>DNA
<213>海栖热袍菌
<400>37
atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt     60
accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa gatccagttc    120
gagggcaagg agtccaccaa cccgctcgcc ttccgcttct acgacccgaa cgaggtgatc    180
gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg    240
aacgagggcc gcgacccgtt cggcgacccg accgccgagc gcccgtggaa ccgcttctcc    300
gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc    360
aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc    420
gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc    480
aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc    540
gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc    600
ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc    660
tacgagaccc tcctcaacac cgacctcggc ctggagctgg agaacctcgc ccgcttcctc    720
cgcatggccg tggagtacgc caagaagatc ggcttcaccg gccagttcct catcgagccg    780
aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc    840
ctcaagaacc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc    900
ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc    960
tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc   1020
aacatctacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag   1080
ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc   1140
atcggccaca tcgccggcat ggacaccttc gccctcggct tcaagatcgc ctacaagctc   1200
gccaaggacg gcgtgttcga caagttcatc gaggagaagt accgctcctt caaggagggc   1260
atcggcaagg agatcgtgga gggcaagacc gacttcgaga agctggagga gtacatcatc   1320
gacaaggagg acatcgagct gccgtccggc aagcaggagt acctggagtc cctcctcaac   1380
tcctacatcg tgaagaccat cgccgagctg cgctccgaga aggacgagct gtga         1434
<210>38
<211>477
<212>PRT
<213>海栖热袍菌
<400>38
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser
 1               5                  10                  15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe
            20                  25                  30
Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro
        35                  40                  45
Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val Ile Asp Gly Lys Pro
    50                  55                  60
Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val
65                  70                  75                  80
Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Glu Arg Pro Trp
                85                  90                  95
Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala
            100                 105                 110
Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His
        115                 120                 125
Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys
    130                 135                 140
Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser
145                 150                 155                 160
Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg
                165                 170                 175
Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr
            180                 185                 190
Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly
        195                 200                 205
Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu
    210                 215                 220
Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn Leu Ala Arg Phe Leu
225                 230                 235                 240
Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly Phe Thr Gly Gln Phe
                245                 250                 255
Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe
            260                 265                 270
Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn His Gly Leu Asp Glu
        275                 280                 285
Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His
    290                 295                 300
Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly
305                 310                 315                 320
Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp
                325                 330                 335
Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val
            340                 345                 350
Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys
        355                 360                 365
Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile
    370                 375                 380
Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Ile Ala Tyr Lys Leu
385                 390                 395                 400
Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser
                405                 410                 415
Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu Gly Lys Thr Asp Phe
            420                 425                 430
Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Asp Ile Glu Leu Pro
        435                 440                 445
Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu Asn Ser Tyr Ile Val
    450                 455                 460
Lys Thr Ile Ala Glu Leu Arg Ser Glu Lys Asp Glu Leu
465                 470                475
<210>39
<211>1434
<212>DNA
<213>那不勒斯栖热袍菌
<400>39
atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt     60
accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa ggtgcagttc    120
gagggcaagg agtccaccaa cccgctcgcc ttcaagttct acgacccgga ggagatcatc    180
gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg    240
aacgagggcc gcgacccgtt cggcgacccg accgccgacc gcccgtggaa ccgctacacc    300
gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc    360
aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc    420
gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc    480
aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc    540
gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc    600
ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc    660
tacgagaccc tcctcaacac cgacctcggc ttcgagctgg agaacctcgc ccgcttcctc    720
cgcatggccg tggactacgc caagcgcatc ggcttcaccg gccagttcct catcgagccg    780
aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc    840
ctcaagtccc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc    900
ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc    960
tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc   1020
aacgtgtacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag   1080
ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc   1140
atcggccaca tcgccggcat ggacaccttc gccctcggct tcaaggtggc ctacaagctc   1200
gtgaaggacg gcgtgctcga caagttcatc gaggagaagt accgctcctt ccgcgagggc   1260
atcggccgcg acatcgtgga gggcaaggtg gacttcgaga agctggagga gtacatcatc   1320
gacaaggaga ccatcgagct gccgtccggc aagcaggagt acctggagtc cctcatcaac   1380
tcctacatcg tgaagaccat cctggagctg cgctccgaga aggacgagct gtga         1434
<210>40
<211>477
<212>PRT
<213>那不勒斯栖热袍菌
<400>40
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser
 1               5                  10                  15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe
            20                  25                  30
Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro
        35                  40                  45
Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile Ile Asp Gly Lys Pro
    50                  55                  60
Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val
65                  70                  75                  80
Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Asp Arg Pro Trp
                85                  90                  95
Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala
            100                 105                 110
Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His
        115                 120                 125
Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys
    130                 135                 140
Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser
145                 150                 155                 160
Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg
                165                 170                 175
Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr
            180                 185                 190
Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly
        195                 200                 205
Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu
    210                 215                 220
Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn Leu Ala Arg Phe Leu
225                 230                 235                 240
Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly Phe Thr Gly Gln Phe
                245                 250                 255
Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe
            260                 265                 270
Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser His Gly Leu Asp Glu
        275                 280                 285
Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His
    290                 295                 300
Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly
305                 310                 315                 320
Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp
                325                 330                 335
Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val
            340                 345                 350
Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys
        355                 360                 365
Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile
    370                 375                 380
Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Val Ala Tyr Lys Leu
385                 390                 395                 400
Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser
                405                 410                 415
Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu Gly Lys Val Asp Phe
            420                 425                 430
Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Thr Ile Glu Leu Pro
        435                 440                 445
Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile Asn Ser Tyr Ile Val
    450                 455                 460
Lys Thr Ile Leu Glu Leu Arg Ser Glu Lys Asp Glu Leu
465                 470                 475
<210>41
<211>1435
<212>DNA
<213>海栖热袍菌
<400>41
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat     60
atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg    120
gagatcccga agatccagtt cgagggcaag gagtccacca acccgctcgc cttccgcttc    180
tacgacccga acgaggtgat cgacggcaag ccgctcaagg accacctcaa gttctccgtg    240
gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgag    300
cgcccgtgga accgcttctc cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc    360
ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc    420
cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca    480
aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc    540
acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg    600
ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt    660
tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ctggagctgg    720
agaacctcgc ccgcttcctc cgcatggccg tggagtacgc caagaagatc ggcttcaccg    780
gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gcttcgacgt    840
ggccaccgcc tacgccttcc tcaagaacca cggcctcgac gagtacttca agttcaacat    900
cgaggccaac cacgccaccc tcgccggcca caccttccag cacgagctgc gcatggcccg    960
catcctcggc aagctcggct ccatcgacgc caaccagggc gacctcctcc tcggctggga   1020
caccgaccag ttcccgacca acatctacga caccaccctc gccatgtacg aggtgatcaa   1080
ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc aaggtgcgcc gcgcctccta   1140
caaggtggag gacctcttca tcggccacat cgccggcatg gacaccttcg ccctcggctt   1200
caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac aagttcatcg aggagaagta   1260
ccgctccttc aaggagggca tcggcaagga gatcgtggag ggcaagaccg acttcgagaa   1320
gctggaggag tacatcatcg acaaggagga catcgagctg ccgtccggca agcaggagta   1380
cctggagtcc ctcctcaact cctacatcgt gaagaccatc gccgagctgc gctga   1435
<210>42
<211>478
<212>PRT
<213>海栖热袍菌
<400>42
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
 1               5                  10                  15
Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
            20                  25                  30
Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile G1n Phe Glu
        35                  40                  45
Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn
    50                  55                  60
Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val
65                  70                  75                  80
Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp
                85                  90                  95
Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys
            100                 105                 110
Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn
        115                 120                 125
Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys
    130                 135                 140
Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile
145                 150                 155                 160
Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala
                165                 170                 175
Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys
            180                 185                 190
Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu
        195                 200                 205
Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly
    210                 215                 220
Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu
225                 230                 235                 240
Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys
                245                 250                 255
Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro
            260                 265                 270
Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu
        275                 280                 285
Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn
    290                 295                 300
His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala
305                 310                 315                 320
Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu
                325                 330                 335
LeL Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr
            340                 345                 350
Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly
        355                 360                 365
Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu
    370                 375                 380
Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly
385                 390                 395                 400
Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe
                405                 410                 415
Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile
            420                 425                 430
Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp
        435                 440                 445
Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser
    450                 455                 460
Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg
465                 470                 475
<210>43
<211>1436
<212>DNA
<213>那不勒斯栖热袍菌
<400>43
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat     60
atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg    120
gagatcccga aggtgcagtt cgagggcaag gagtccacca acccgctcgc cttcaagttc    180
tacgacccgg aggagatcat cgacggcaag ccgctcaagg accacctcaa gttctccgtg    240
gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgac    300
cgcccgtgga accgctacac cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc    360
ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc    420
cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca    480
aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc    540
acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg    600
ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt    660
tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ttcgagctgg    720
agaacctcgc ccgcttcctc cgcatggccg tggactacgc caagcgcatc ggcttcaccg    780
gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gacttcgacg    840
tggccaccgc ctacgccttc ctcaagtccc acggcctcga cgagtacttc aagttcaaca    900
tcgaggccaa ccacgccacc ctcgccggcc acaccttcca gcacgagctg cgcatggccc    960
gcatcctcgg caagctcggc tccatcgacg ccaaccaggg cgacctcctc ctcggctggg   1020
acaccgacca gttcccgacc aacgtgtacg acaccaccct cgccatgtac gaggtgatca   1080
aggccggcgg cttcaccaag ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct   1140
acaaggtgga ggacctcttc atcggccaca tcgccggcat ggacaccttc gccctcggct   1200
tcaaggtggc ctacaagctc gtgaaggacg gcgtgctcga caagttcatc gaggagaagt   1260
accgctcctt ccgcgagggc atcggccgcg acatcgtgga gggcaaggtg gacttcgaga   1320
agctggagga gtacatcatc gacaaggaga ccatcgagct gccgtccggc aagcaggagt   1380
acctggagtc cctcatcaac tcctacatcg tgaagaccat cctggagctg cgctga       1436
<210>44
<211>478
<212>PRT
<213>那不勒斯栖热袍菌
<400>44
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
 1               5                  10                  15
Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
            20                  25                  30
Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu
        35                  40                  45
Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu
    50                  55                  60
Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val
65                  70                  75                  80
Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp
                85                  90                  95
Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys
            100                 105                 110
Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn
        115                 120                 125
Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys
    130                 135                 140
Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile
145                 150                 155                 160
Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala
                165                 170                 175
Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys
            180                 185                 190
Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu
        195                 200                 205
Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly
    210                 215                 220
Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu
225                 230                 235                 240
Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg
                245                 250                 255
Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro
            260                 265                 270
Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu
        275                 280                 285
Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn
    290                 295                 300
His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala
305                 310                 315                 320
Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu
                325                 330                 335
Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr
            340                 345                 350
Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly
        355                 360                 365
Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu
    370                 375                 380
Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly
385                 390                 395                 400
Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe
                405                 410                 415
Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile
            420                 425                 430
Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp
        435                 440                 445
Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser
    450                 455                 460
Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg
465                 470                 475
<210>45
<211>1095
<212>PRT
<213>Aspergillus shirousami
<400>45
Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr Phe Leu Leu Thr
 1               5                  10                  15
Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Thr Cys Asn Thr
            20                  25                  30
Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile Asp Lys
        35                  40                  45
Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile Thr Pro
    50                  55                  60
Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly Asp Ala Tyr His
65                  70                  75                  80
Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu Asn Tyr Gly Thr
                85                  90                  95
Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His Glu Arg Gly Met
            100                 105                 110
Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asp Gly Ala
        115                 120                 125
Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe Ser Ser Gln Asp
    130                 135                 140
Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu Asp Gln Thr Gln
145                 150                 155                 160
Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser Leu Pro Asp Leu
                165                 170                 175
Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr Asp Trp Val Gly
            180                 185                 190
Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Ile Asp Thr Val
        195                 200                 205
Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala Ala Gly
    210                 215                 220
Val Tyr Cys Ile Gly Glu Val Leu Asp Val Asp Pro Ala Tyr Thr Cys
225                 230                 235                 240
Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr Pro Ile Tyr Tyr
                245                 250                 255
Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser Met Asp Asp Leu
            260                 265                 270
Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro Asp Ser Thr Leu
        275                 280                 285
Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg Phe Ala Ser Tyr
    290                 295                 300
Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala Phe Ile Ile Leu
305                 310                 315                 320
Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu Gln His Tyr Ala
                325                 330                 335
Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp Leu Ser Gly Tyr
            340                 345                 350
Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser Ala Asn Ala Ile
        355                 360                 365
Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val Thr Tyr Lys Asn
    370                 375                 380
Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met Arg Lys Gly Thr
385                 390                 395                 400
Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys Gly Ala Ser Gly
                405                 410                 415
Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr Thr Ala Gly Gln
            420                 425                 430
Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr Val Gly Ser Asp
        435                 440                 445
Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro Arg Val Leu Tyr
    450                 455                 460
Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser Ser Ser Lys Pro
465                 470                 475                 480
Ala Thr Leu Asp Ser Trp Leu Ser Asn Glu Ala Thr Val Ala Arg Thr
                485                 490                 495
Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ala Trp Val Ser Gly Ala
            500                 505                 510
Asp Ser Gly Ile Val Val Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr
        515                 520                 525
Phe Tyr Thr Trp Thr Arg Asp Ser Gly Ile Val Leu Lys Thr Leu Val
    530                 535                 540
Asp Leu Phe Arg Asn Gly Asp Thr Asp Leu Leu Ser Thr Ile Glu His
545                 550                 555                 560
Tyr Ile Ser Ser Gln Ala Ile Ile Gln Gly Val Ser Asn Pro Ser Gly
                565                 570                 575
Asp Leu Ser Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu
            580                 585                 590
Thr Ala Tyr Ala Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala
        595                 600                 605
Leu Arg Ala Thr Ala Met Ile Gly Phe Gly Gln Trp Leu Leu Asp Asn
    610                 615                 620
Gly Tyr Thr Ser Ala Ala Thr Glu Ile Val Trp Pro Leu Val Arg Asn
625                 630                 635                 640
Asp Leu Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu
                645                 650                 655
Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His
            660                 665                 670
Arg Ala Leu Val Glu Gly Ser Ala Phe Ala Thr Ala Val Gly Ser Ser
        675                 680                 685
Cys Ser Trp Cys Asp Ser Gln Ala Pro Gln Ile Leu Cys Tyr Leu Gln
    690                 695                 700
Ser Phe Trp Thr Gly Ser Tyr Ile Leu Ala Asn Phe Asp Ser Ser Arg
705                 710                 715                 720
Ser Gly Lys Asp Thr Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp
                725                 730                 735
Pro Glu Ala Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg
            740                 745                 750
Ala Leu Ala Asn His Lys Glu Val Val Asp Ser Phe Arg Ser Ile Tyr
        755                 760                 765
Thr Leu Asn Asp Gly Leu Ser Asp Ser Glu Ala Val Ala Val Gly Arg
    770                 775                 780
Tyr Pro Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Cys Thr
785                 790                 795                 800
Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Lys
                805                 810                 815
Gln Gly Ser Leu Glu Ile Thr Asp Val Ser Leu Asp Phe Phe Lys Ala
            820                 825                 830
Leu Tyr Ser Gly Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser Thr
        835                 840                 845
Tyr Ser Ser Ile Val Ser Ala Val Lys Thr Phe Ala Asp Gly Phe Val
    850                 855                 860
Ser Ile Val Glu Thr His Ala Ala Ser Asn Gly Ser Leu Ser Glu Gln
865                 870                 875                 880
Phe Asp Lys Ser Asp Gly Asp Glu Leu Ser Ala Arg Asp Leu Thr Trp
                885                 890                 895
Ser Tyr Ala Ala Leu Leu Thr Ala Asn Asn Arg Arg Asn Ser Val Val
            900                 905                 910
Pro Pro Ser Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr Cys
        915                 920                 925
Ala Ala Thr Ser Ala Ser Gly Thr Tyr Ser Ser Val Thr Val Thr Ser
    930                 935                 940
Trp Pro Ser Ile Val Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr
945                 950                 955                 960
Thr Gly Ser Gly Gly Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala
                965                 970                 975
Ser Lys Thr Ser Thr Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr
            980                 985                 990
Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu
        995                 1000                1005
Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr
    1010                1015                1020
Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asn Pro
1025                1030                1035                1040
Pro Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr
                1045                1050                1055
Lys Phe Ile Arg Val Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp
            1060                1065                1070
Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Glu Ser Thr Ala
        1075                1080                1085
Thr Val Thr Asp Thr Trp Arg
    1090                1095
<210>46
<211>3285
<212>DNA
<213>Aspergillus shirousami
<400>46
gccaccccgg ccgactggcg ctcccagtcc atctacttcc tcctcaccga ccgcttcgcc     60
cgcaccgacg gctccaccac cgccacctgc aacaccgccg accagaagta ctgcggcggc    120
acctggcagg gcatcatcga caagctcgac tacatccagg gcatgggctt caccgccatc    180
tggatcaccc cggtgaccgc ccagctcccg cagaccaccg cctacggcga cgcctaccac    240
ggctactggc agcaggacat ctactccctc aacgagaact acggcaccgc cgacgacctc    300
aaggccctct cctccgccct ccacgagcgc ggcatgtacc tcatggtgga cgtggtggcc    360
aaccacatgg gctacgacgg cgccggctcc tccgtggact actccgtgtt caagccgttc    420
tcctcccagg actacttcca cccgttctgc ttcatccaga actacgagga ccagacccag    480
gtggaggact gctggctcgg cgacaacacc gtgtccctcc cggacctcga caccaccaag    540
gacgtggtga agaacgagtg gtacgactgg gtgggctccc tcgtgtccaa ctactccatc    600
gacggcctcc gcatcgacac cgtgaagcac gtgcagaagg acttctggcc gggctacaac    660
aaggccgccg gcgtgtactg catcggcgag gtgctcgacg tggacccggc ctacacctgc    720
ccgtaccaga acgtgatgga cggcgtgctc aactacccga tctactaccc gctcctcaac    780
gccttcaagt ccacctccgg ctcgatggac gacctctaca acatgatcaa caccgtgaag    840
tccgactgcc cggactccac cctcctcggc accttcgtgg agaaccacga caacccgcgc    900
ttcgcctcct acaccaacga catcgccctc gccaagaacg tggccgcctt catcatcctc    960
aacgacggca tcccgatcat ctacgccggc caggagcagc actacgccgg cggcaacgac   1020
ccggccaacc gcgaggccac ctggctctcc ggctacccga ccgactccga gctgtacaag   1080
ctcatcgcct ccgccaacgc catccgcaac tacgccatct ccaaggacac cggcttcgtg   1140
acctacaaga actggccgat ctacaaggac gacaccacca tcgccatgcg caagggcacc   1200
gacggctccc agatcgtgac catcctctcc aacaagggcg cctccggcga ctcctacacc   1260
ctctccctct ccggcgccgg ctacaccgcc ggccagcagc tcaccgaggt gatcggctgc   1320
accaccgtga ccgtgggctc cgacggcaac gtgccggtgc cgatggccgg cggcctcccg   1380
cgcgtgctct acccgaccga gaagctcgcc ggctccaaga tatgctcctc ctccaagccg   1440
gccaccctcg actcctggct ctccaacgag gccaccgtgg cccgcaccgc catcctcaac   1500
aacatcggcg ccgacggcgc ctgggtgtcc ggcgccgact ccggcatcgt ggtggcctcc   1560
ccgtccaccg acaacccgga ctacttctac acctggaccc gcgactccgg catcgtgctc   1620
aagaccctcg tggacctctt ccgcaacggc gacaccgacc tcctctccac catcgagcac   1680
tacatctcct cccaggccat catccagggc gtgtccaacc cgtccggcga cctctcctcc   1740
ggcggcctcg gcgagccgaa gttcaacgtg gacgagaccg cctacgccgg ctcctggggc   1800
cgcccgcagc gcgacggccc ggccctccgc gccaccgcca tgatcggctt cggccagtgg   1860
ctcctcgaca acggctacac ctccgccgcc accgagatcg tgtggccgct cgtgcgcaac   1920
gacctctcct acgtggccca gtactggaac cagaccggct acgacctctg ggaggaggtg   1980
aacggctcct ccttcttcac catcgccgtg cagcaccgcg ccctcgtgga gggctccgcc   2040
ttcgccaccg ccgtgggctc ctcctgctcc tggtgcgact cccaggcccc gcagatcctc   2100
tgctacctcc agtccttctg gaccggctcc tacatcctcg ccaacttcga ctcctcccgc   2160
tccggcaagg acaccaacac cctcctcggc tccatccaca ccttcgaccc ggaggccggc   2220
tgcgacgact ccaccttcca gccgtgctcc ccgcgcgccc tcgccaacca caaggaggtg   2280
gtggactcct tccgctccat ctacaccctc aacgacggcc tctccgactc cgaggccgtg   2340
gccgtgggcc gctacccgga ggactcctac tacaacggca acccgtggtt cctctgcacc   2400
ctcgccgccg ccgagcagct ctacgacgcc ctctaccagt gggacaagca gggctccctg   2460
gagatcaccg acgtgtccct cgacttcttc aaggccctct actccggcgc cgccaccggc   2520
acctactcct cctcctcctc cacctactcc tccatcgtgt ccgccgtgaa gaccttcgcc   2580
gacggcttcg tgtccatcgt ggagacccac gccgcctcca acggctccct ctccgagcag   2640
ttcgacaagt ccgacggcga cgagctgtcc gcccgcgacc tcacctggtc ctacgccgcc   2700
ctcctcaccg ccaacaaccg ccgcaactcc gtggtgccgc cgtcctgggg cgagacctcc   2760
gcctcctccg tgccgggcac ctgcgccgcc acctccgcct ccggcaccta ctcctccgtg   2820
accgtgacct cctggccgtc catcgtggcc accggcggca ccaccaccac cgccaccacc   2880
accggctccg gcggcgtgac ctccacctcc aagaccacca ccaccgcctc caagacctcc   2940
accaccacct cctccacctc ctgcaccacc ccgaccgccg tggccgtgac cttcgacctc   3000
accgccacca ccacctacgg cgagaacatc tacctcgtgg gctccatctc ccagctcggc   3060
gactgggaga cctccgacgg catcgccctc tccgccgaca agtacacctc ctccaacccg   3120
ccgtggtacg tgaccgtgac cctcccggcc ggcgagtcct tcgagtacaa gttcatccgc   3180
gtggagtccg acgactccgt ggagtgggag tccgacccga accgcgagta caccgtgccg   3240
caggcctgcg gcgagtccac cgccaccgtg accgacacct ggcgc                   3285
<210>47
<211>679
<212>PRT
<213>Thermoanaerobacterium thermosaccharolyticum
<400>47
Val Leu Ser Gly Cys Ser Asn Asn Val Ser Ser Ile Lys Ile Asp Arg
 1               5                  10                  15
Phe Asn Asn Ile Ser Ala Val Asn Gly Pro Gly Glu Glu Asp Thr Trp
            20                  25                  30
Ala Ser Ala Gln Lys Gln Gly Val Gly Thr Ala Asn Asn Tyr Val Ser
        35                  40                  45
Arg Val Trp Phe Thr Leu Ala Asn Gly Ala Ile Ser Glu Val Tyr Tyr
    50                  55                  60
Pro Thr Ile Asp Thr Ala Asp Val Lys Glu Ile Lys Phe Ile Val Thr
65                  70                  75                  80
Asp Gly Lys Ser Phe Val Ser Asp Glu Thr Lys Asp Ala Ile Ser Lys
                85                  90                  95
Val Glu Lys Phe Thr Asp Lys Ser Leu Gly Tyr Lys Leu Val Asn Thr
            100                 105                 110
Asp Lys Lys Gly Arg Tyr Arg Ile Thr Lys Glu Ile Phe Thr Asp Val
        115                 120                 125
Lys Arg Asn Ser Leu Ile Met Lys Ala Lys Phe Glu Ala Leu Glu Gly
    130                 135                 140
Ser Ile His Asp Tyr Lys Leu Tyr Leu Ala Tyr Asp Pro His Ile Lys
145                 150                 155                 160
Asn Gln Gly Ser Tyr Asn Glu Gly Tyr Val Ile Lys Ala Asn Asn Asn
                165                 170                 175
Glu Met Leu Met Ala Lys Arg Asp Asn Val Tyr Thr Ala Leu Ser Ser
            180                 185                 190
Asn Ile Gly Trp Lys Gly Tyr Ser Ile Gly Tyr Tyr Lys Val Asn Asp
        195                 200                 205
Ile Met Thr Asp Leu Asp Glu Asn Lys Gln Met Thr Lys His Tyr Asp
    210                 215                 220
Ser Ala Arg Gly Asn Ile Ile Glu Gly Ala Glu Ile Asp Leu Thr Lys
225                 230                 235                 240
Asn Ser Glu Phe Glu Ile Val Leu Ser Phe Gly Gly Ser Asp Ser Glu
                245                 250                 255
Ala Ala Lys Thr Ala Leu Glu Thr Leu Gly Glu Asp Tyr Asn Asn Leu
            260                 265                 270
Lys Asn Asn Tyr Ile Asp Glu Trp Thr Lys Tyr Cys Asn Thr Leu Asn
        275                 280                 285
Asn Phe Asn Gly Lys Ala Asn Ser Leu Tyr Tyr Asn Ser Met Met Ile
    290                 295                 300
Leu Lys Ala Ser Glu Asp Lys Thr Asn Lys Gly Ala Tyr Ile Ala Ser
305                 310                 315                 320
Leu Ser Ile Pro Trp Gly Asp Gly Gln Arg Asp Asp Asn Thr Gly Gly
                325                 330                 335
Tyr His Leu Val Trp Ser Arg Asp Leu Tyr His Val Ala Asn Ala Phe
            340                 345                 350
Ile Ala Ala Gly Asp Val Asp Ser Ala Asn Arg Ser Leu Asp Tyr Leu
        355                 360                 365
Ala Lys Val Val Lys Asp Asn Gly Met Ile Pro Gln Asn Thr Trp Ile
    370                 375                 380
Ser Gly Lys Pro Tyr Trp Thr Ser Ile Gln Leu Asp Glu Gln Ala Asp
385                 390                 395                 400
Pro Ile Ile Leu Ser Tyr Arg Leu Lys Arg Tyr Asp Leu Tyr Asp Ser
                405                 410                 415
Leu Val Lys Pro Leu Ala Asp Phe Ile Ile Lys Ile Gly Pro Lys Thr
            420                 425                 430
Gly Gln Glu Arg Trp Glu Glu Ile Gly Gly Tyr Ser Pro Ala Thr Met
        435                 440                 445
Ala Ala Glu Val Ala Gly Leu Thr Cys Ala Ala Tyr Ile Ala Glu Gln
    450                 455                 460
Asn Lys Asp Tyr Glu Ser Ala Gln Lys Tyr Gln Glu Lys Ala Asp Asn
465                 470                 475                 480
Trp Gln Lys Leu Ile Asp Asn Leu Thr Tyr Thr Glu Asn Gly Pro Leu
                485                 490                 495
Gly Asn Gly Gln Tyr Tyr Ile Arg Ile Ala Gly Leu Ser Asp Pro Asn
            500                 505                 510
Ala Asp Phe Met Ile Asn Ile Ala Asn Gly Gly Gly Val Tyr Asp Gln
        515                 520                 525
Lys Glu Ile Val Asp Pro Ser Phe Leu Glu Leu Val Arg Leu Gly Val
    530                 535                 540
Lys Ser Ala Asp Asp Pro Lys Ile Leu Asn Thr Leu Lys Val Val Asp
545                 550                 555                 560
Ser Thr Ile Lys Val Asp Thr Pro Lys Gly Pro Ser Trp Tyr Arg Tyr
                565                 570                 575
Asn His Asp Gly Tyr Gly Glu Pro Ser Lys Thr Glu Leu Tyr His Gly
            580                 585                 590
Ala Gly Lys Gly Arg Leu Trp Pro Leu Leu Thr Gly Glu Arg Gly Met
        595                 600                 605
Tyr Glu Ile Ala Ala Gly Lys Asp Ala Thr Pro Tyr Val Lys Ala Met
    610                 615                 620
Glu Lys Phe Ala Asn Glu Gly Gly Ile Ile Ser Glu Gln Val Trp Glu
625                 630                 635                 640
Asp Thr Gly Leu Pro Thr Asp Ser Ala Ser Pro Leu Asn Trp Ala His
                645                 650                 655
Ala Glu Tyr Val Ile Leu Phe Ala Ser Asn Ile Glu His Lys Val Leu
            660                 665                 670
Asp Met Pro Asp Ile Val Tyr
        675
<210>48
<211>2037
<212>DNA
<213>Thermoanaerobacterium thermosaccharolyticum
<220>
<223>合成的
<400>48
gtgctctccg gctgctccaa caacgtgtcc tccatcaaga tcgaccgctt caacaacatc     60
tccgccgtga acggcccggg cgaggaggac acctgggcct ccgcccagaa gcagggcgtg    120
ggcaccgcca acaactacgt gtcccgcgtg tggttcaccc tcgccaacgg cgccatctcc    180
gaggtgtact acccgaccat cgacaccgcc gacgtgaagg agatcaagtt catcgtgacc    240
gacggcaagt ccttcgtgtc cgacgagacc aaggacgcca tctccaaggt ggagaagttc    300
accgacaagt ccctcggcta caagctcgtg aacaccgaca agaagggccg ctaccgcatc    360
accaaggaaa tcttcaccga cgtgaagcgc aactccctca tcatgaaggc caagttcgag    420
gccctcgagg gctccatcca cgactacaag ctctacctcg cctacgaccc gcacatcaag    480
aaccagggct cctacaacga gggctacgtg atcaaggcca acaacaacga gatgctcatg    540
gccaagcgcg acaacgtgta caccgccctc tcctccaaca tcggctggaa gggctactcc    600
atcggctact acaaggtgaa cgacatcatg accgacctcg acgagaacaa gcagatgacc    660
aagcactacg actccgcccg cggcaacatc atcgagggcg ccgagatcga cctcaccaag    720
aactccgagt tcgagatcgt gctctccttc ggcggctccg actccgaggc cgccaagacc    780
gccctcgaga ccctcggcga ggactacaac aacctcaaga acaactacat cgacgagtgg    840
accaagtact gcaacaccct caacaacttc aacggcaagg ccaactccct ctactacaac    900
tccatgatga tcctcaaggc ctccgaggac aagaccaaca agggcgccta catcgcctcc    960
ctctccatcc cgtggggcga cggccagcgc gacgacaaca ccggcggcta ccacctcgtg   1020
tggtcccgcg acctctacca cgtggccaac gccttcatcg ccgccggcga cgtggactcc   1080
gccaaccgct ccctcgacta cctcgccaag gtggtgaagg acaacggcat gatcccgcag   1140
aacacctgga tctccggcaa gccgtactgg acctccatcc agctcgacga gcaggccgac   1200
ccgatcatcc tctcctaccg cctcaagcgc tacgacctct acgactccct cgtgaagccg   1260
ctcgccgact tcatcatcaa gatcggcccg aagaccggcc aggagcgctg ggaggagatc   1320
ggcggctact ccccggccac gatggccgcc gaggtggccg gcctcacctg cgccgcctac   1380
atcgccgagc agaacaagga ctacgagtcc gcccagaagt accaggagaa ggccgacaac   1440
tggcagaagc tcatcgacaa cctcacctac accgagaacg gcccgctcgg caacggccag   1500
tactacatcc gcatcgccgg cctctccgac ccgaacgccg acttcatgat caacatcgcc   1560
aacggcggcg gcgtgtacga ccagaaggag atcgtggacc cgtccttcct cgagctggtg   1620
cgcctcggcg tgaagtccgc cgacgacccg aagatcctca acaccctcaa ggtggtggac   1680
tccaccatca aggtggacac cccgaagggc ccgtcctggt atcgctacaa ccacgacggc   1740
tacggcgagc cgtccaagac cgagctgtac cacggcgccg gcaagggccg cctctggccg   1800
ctcctcaccg gcgagcgcgg catgtacgag atcgccgccg gcaaggacgc caccccgtac   1860
gtgaaggcga tggagaagtt cgccaacgag ggcggcatca tctccgagca ggtgtgggag   1920
gacaccggcc tcccgaccga ctccgcctcc ccgctcaact gggcccacgc cgagtacgtg   1980
atcctcttcg cctccaacat cgagcacaag gtgctcgaca tgccggacat cgtgtac      2037
<210>49
<211>579
<212>PRT
<213>Rhizopus oryzae
<400>49
Ala Ser Ile Pro Ser Ser Ala Ser Val Gln Leu Asp Ser Tyr Asn Tyr
 1               5                  10                  15
Asp Gly Ser Thr Phe Ser Gly Lys Ile Tyr Val Lys Asn Ile Ala Tyr
            20                  25                  30
Ser Lys Lys Val Thr Val Ile Tyr Ala Asp Gly Ser Asp Asn Trp Asn
        35                  40                  45
Asn Asn Gly Asn Thr Ile Ala Ala Ser Tyr Ser Ala Pro Ile Ser Gly
    50                  55                  60
Ser Asn Tyr Glu Tyr Trp Thr Phe Ser Ala Ser Ile Asn Gly Ile Lys
65                  70                  75                  80
Glu Phe Tyr Ile Lys Tyr Glu Val Ser Gly Lys Thr Tyr Tyr Asp Asn
                85                  90                  95
Asn Asn Ser Ala Asn Tyr Gln Val Ser Thr Ser Lys Pro Thr Thr Thr
            100                 105                 110
Thr Ala Thr Ala Thr Thr Thr Thr Ala Pro Ser Thr Ser Thr Thr Thr
        115                 120                 125
Pro Pro Ser Arg Ser Glu Pro Ala Thr Phe Pro Thr Gly Asn Ser Thr
    130                 135                 140
Ile Ser Ser Trp Ile Lys Lys Gln Glu Gly Ile Ser Arg Phe Ala Met
145                 150                 155                 160
Leu Arg Asn Ile Asn Pro Pro Gly Ser Ala Thr Gly Phe Ile Ala Ala
                165                 170                 175
Ser Leu Ser Thr Ala Gly Pro Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp
            180                 185                 190
Ala Ala Leu Thr Ser Asn Val Ile Val Tyr Glu Tyr Asn Thr Thr Leu
        195                 200                 205
Ser Gly Asn Lys Thr Ile Leu Asn Val Leu Lys Asp Tyr Val Thr Phe
    210                 215                 220
Ser Val Lys Thr Gln Ser Thr Ser Thr Val Cys Asn Cys Leu Gly Glu
225                 230                 235                 240
Pro Lys Phe Asn Pro Asp Ala Ser Gly Tyr Thr Gly Ala Trp Gly Arg
                245                 250                 255
Pro Gln Asn Asp Gly Pro Ala Glu Arg Ala Thr Thr Phe Ile Leu Phe
            260                 265                 270
Ala Asp Ser Tyr Leu Thr Gln Thr Lys Asp Ala Ser Tyr Val Thr Gly
        275                 280                 285
Thr Leu Lys Pro Ala Ile Phe Lys Asp Leu Asp Tyr Val Val Asn Val
    290                 295                 300
Trp Ser Asn Gly Cys Phe Asp Leu Trp Glu Glu Val Asn Gly Val His
305                 310                 315                 320
Phe Tyr Thr Leu Met Val Met Arg Lys Gly Leu Leu Leu Gly Ala Asp
                325                 330                 335
Phe Ala Lys Arg Asn Gly Asp Ser Thr Arg Ala Ser Thr Tyr Ser Ser
            340                 345                 350
Thr Ala Ser Thr Ile Ala Asn Lys Ile Ser Ser Phe Trp Val Ser Ser
        355                 360                 365
Asn Asn Trp Ile Gln Val Ser Gln Ser Val Thr Gly Gly Val Ser Lys
    370                 375                 380
Lys Gly Leu Asp Val Ser Thr Leu Leu Ala Ala Asn Leu Gly Ser Val
385                 390                 395                 400
Asp Asp Gly Phe Phe Thr Pro Gly Ser Glu Lys Ile Leu Ala Thr Ala
                405                 410                 415
Val Ala Val Glu Asp Ser Phe Ala Ser Leu Tyr Pro Ile Asn Lys Asn
            420                 425                 430
Leu Pro Ser Tyr Leu Gly Asn Ser Ile Gly Arg Tyr Pro Glu Asp Thr
        435                 440                 445
Tyr Asn Gly Asn Gly Asn Ser Gln Gly Asn Ser Trp Phe Leu Ala Val
    450                 455                 460
Thr Gly Tyr Ala Glu Leu Tyr Tyr Arg Ala Ile Lys Glu Trp Ile Gly
465                 470                 475                 480
Asn Gly Gly Val Thr Val Ser Ser Ile Ser Leu Pro Phe Phe Lys Lys
                485                 490                 495
Phe Asp Ser Ser Ala Thr Ser Gly Lys Lys Tyr Thr Val Gly Thr Ser
            500                 505                 510
Asp Phe Asn Asn Leu Ala Gln Asn Ile Ala Leu Ala Ala Asp Arg Phe
        515                 520                 525
Leu Ser Thr Val Gln Leu His Ala His Asn Asn Gly Ser Leu Ala Glu
    530                 535                 540
Glu Phe Asp Arg Thr Thr Gly Leu Ser Thr Gly Ala Arg Asp Leu Thr
545                 550                 555                 560
Trp Ser His Ala Ser Leu Ile Thr Ala Ser Tyr Ala Lys Ala Gly Ala
                565                 570                 575
Pro Ala Ala
<210>50
<211>1737
<212>DNA
<213>Rhizopus oryzae
<400>50
gcctccatcc cgtcctccgc ctccgtgcag ctcgactcct acaactacga cggctccacc     60
ttctccggca aaatctacgt gaagaacatc gcctactcca agaaggtgac cgtgatctac    120
gccgacggct ccgacaactg gaacaacaac ggcaacacca tcgccgcctc ctactccgcc    180
ccgatctccg gctccaacta cgagtactgg accttctccg cctccatcaa cggcatcaag    240
gagttctaca tcaagtacga ggtgtccggc aagacctact acgacaacaa caactccgcc    300
aactaccagg tgtccacctc caagccgacc accaccaccg ccaccgccac caccaccacc    360
gccccgtcca cctccaccac caccccgccg tcccgctccg agccggccac cttcccgacc    420
ggcaactcca ccatctcctc ctggatcaag aagcaggagg gcatctcccg cttcgccatg    480
ctccgcaaca tcaacccgcc gggctccgcc accggcttca tcgccgcctc cctctccacc    540
gccggcccgg actactacta cgcctggacc cgcgacgccg ccctcacctc caacgtgatc    600
gtgtacgagt acaacaccac cctctccggc aacaagacca tcctcaacgt gctcaaggac    660
tacgtgacct tctccgtgaa gacccagtcc acctccaccg tgtgcaactg cctcggcgag    720
ccgaagttca acccggacgc ctccggctac accggcgcct ggggccgccc gcagaacgac    780
ggcccggccg agcgcgccac caccttcatc ctcttcgccg actcctacct cacccagacc    840
aaggacgcct cctacgtgac cggcaccctc aagccggcca tcttcaagga cctcgactac    900
gtggtgaacg tgtggtccaa cggctgcttc gacctctggg aggaggtgaa cggcgtgcac    960
ttctacaccc tcatggtgat gcgcaagggc ctcctcctcg gcgccgactt cgccaagcgc   1020
aacggcgact ccacccgcgc ctccacctac tcctccaccg cctccaccat cgccaacaaa   1080
atctcctcct tctgggtgtc ctccaacaac tggatacagg tgtcccagtc cgtgaccggc   1140
ggcgtgtcca agaagggcct cgacgtgtcc accctcctcg ccgccaacct cggctccgtg   1200
gacgacggct tcttcacccc gggctccgag aagatcctcg ccaccgccgt ggccgtggag   1260
gactccttcg cctccctcta cccgatcaac aagaacctcc cgtcctacct cggcaactcc   1320
atcggccgct acccggagga cacctacaac ggcaacggca actcccaggg caactcctgg   1380
ttcctcgccg tgaccggcta cgccgagctg tactaccgcg ccatcaagga gtggatcggc   1440
aacggcggcg tgaccgtgtc ctccatctcc ctcccgttct tcaagaagtt cgactcctcc   1500
gccacctccg gcaagaagta caccgtgggc acctccgact tcaacaacct cgcccagaac   1560
atcgccctcg ccgccgaccg cttcctctcc accgtgcagc tccacgccca caacaacggc   1620
tccctcgccg aggagttcga ccgcaccacc ggcctctcca ccggcgcccg cgacctcacc   1680
tggtcccacg cctccctcat caccgcctcc tacgccaagg ccggcgcccc ggccgcc      1737
<210>51
<211>439
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>51
Met Ala Lys His Leu Ala Ala Met Cys Trp Cys Ser Leu Leu Val Leu
 1               5                  10                  15
Val Leu Leu Cys Leu Gly Ser Gln Leu Ala Gln Ser Gln Val Leu Phe
            20                  25                  30
Gln Gly Phe Asn Trp Glu Ser Trp Lys Lys Gln Gly Gly Trp Tyr Asn
        35                  40                  45
Tyr Leu Leu Gly Arg Val Asp Asp Ile Ala Ala Thr Gly Ala Thr His
    50                  55                  60
Val Trp Leu Pro Gln Pro Ser His Ser Val Ala Pro Gln Gly Tyr Met
65                  70                  75                  80
Pro Gly Arg Leu Tyr Asp Leu Asp Ala Ser Lys Tyr Gly Thr His Ala
                85                  90                  95
Glu Leu Lys Ser Leu Thr Ala Ala Phe His Ala Lys Gly Val Gln Cys
            100                 105                 110
Val Ala Asp Val Val Ile Asn His Arg Cys Ala Asp Tyr Lys Asp Gly
        115                 120                 125
Arg Gly Ile Tyr Cys Val Phe Glu Gly Gly Thr Pro Asp Ser Arg Leu
    130                 135                 140
Asp Trp Gly Pro Asp Met Ile Cys Ser Asp Asp Thr Gln Tyr Ser Asn
145                 150                 155                 160
Gly Arg Gly His Arg Asp Thr Gly Ala Asp Phe Ala Ala Ala Pro Asp
                165                 170                 175
Ile Asp His Leu Asn Pro Arg Val Gln Gln Glu Leu Ser Asp Trp Leu
            180                 185                 190
Asn Trp Leu Lys Ser Asp Leu Gly Phe Asp Gly Trp Arg Leu Asp Phe
        195                 200                 205
Ala Lys Gly Tyr Ser Ala Ala Val Ala Lys Val Tyr Val Asp Ser Thr
    210                 215                 220
Ala Pro Thr Phe Val Val Ala Glu Ile Trp Ser Ser Leu His Tyr Asp
225                 230                 235                 240
Gly Asn Gly Glu Pro Ser Ser Asn Gln Asp Ala Asp Arg Gln Glu Leu
                245                 250                 255
Val Asn Trp Ala Gln Ala Val Gly Gly Pro Ala Ala Ala Phe Asp Phe
            260                 265                 270
Thr Thr Lys Gly Val Leu Gln Ala Ala Val Gln Gly Glu Leu Trp Arg
        275                 280                 285
Met Lys Asp Gly Asn Gly Lys Ala Pro Gly Met Ile Gly Trp Leu Pro
    290                 295                 300
Glu Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gly Ser Thr Gln
305                 310                 315                 320
Asn Ser Trp Pro Phe Pro Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr
                325                 330                 335
Ile Leu Thr His Pro Gly Thr Pro Cys Ile Phe Tyr Asp His Val Phe
            340                 345                 350
Asp Trp Asn Leu Lys Gln Glu Ile Ser Ala Leu Ser Ala Val Arg Ser
        355                 360                 365
Arg Asn Gly Ile His Pro Gly Ser Glu Leu Asn Ile Leu Ala Ala Asp
    370                 375                 380
Gly Asp Leu Tyr Val Ala Lys Ile Asp Asp Lys Val Ile Val Lys Ile
385                 390                 395                 400
Gly Ser Arg Tyr Asp Val Gly Asn Leu Ile Pro Ser Asp Phe His Ala
                405                 410                 415
Val Ala His Gly Asn Asn Tyr Cys Val Trp Glu Lys His Gly Leu Arg
            420                 425                 430
Val  Pro Ala Gly Arg His His
         435
<210>52
<211>1320
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>52
atggcgaagc acttggctgc catgtgctgg tgcagcctcc tagtgcttgt actgctctgc     60
ttgggctccc agctggccca atcccaggtc ctcttccagg ggttcaactg ggagtcgtgg    120
aagaagcaag gtgggtggta caactacctc ctggggcggg tggacgacat cgccgcgacg    180
ggggccacgc acgtctggct cccgcagccg tcgcactcgg tggcgccgca ggggtacatg    240
cccggccggc tctacgacct ggacgcgtcc aagtacggca cccacgcgga gctcaagtcg    300
ctcaccgcgg cgttccacgc caagggcgtc cagtgcgtcg ccgacgtcgt gatcaaccac    360
cgctgcgccg actacaagga cggccgcggc atctactgcg tcttcgaggg cggcacgccc    420
gacagccgcc tcgactgggg ccccgacatg atctgcagcg acgacacgca gtactccaac    480
gggcgcgggc accgcgacac gggggccgac ttcgccgccg cgcccgacat cgaccacctc    540
aacccgcgcg tgcagcagga gctctcggac tggctcaact ggctcaagtc cgacctcggc    600
ttcgacggct ggcgcctcga cttcgccaag ggctactccg ccgccgtcgc caaggtgtac    660
gtcgacagca ccgcccccac cttcgtcgtc gccgagatat ggagctccct ccactacgac    720
ggcaacggcg agccgtccag caaccaggac gccgacaggc aggagctggt caactgggcg    780
caggcggtgg gcggccccgc cgcggcgttc gacttcacca ccaagggcgt gctgcaggcg    840
gccgtccagg gcgagctgtg gcgcatgaag gacggcaacg gcaaggcgcc cgggatgatc    900
ggctggctgc cggagaaggc cgtcacgttc gtcgacaacc acgacaccgg ctccacgcag    960
aactcgtggc cattcccctc cgacaaggtc atgcagggct acgcctatat cctcacgcac   1020
ccaggaactc catgcatctt ctacgaccac gttttcgact ggaacctgaa gcaggagatc   1080
agcgcgctgt ctgcggtgag gtcaagaaac gggatccacc cggggagcga gctgaacatc   1140
ctcgccgccg acggggatct ctacgtcgcc aagattgacg acaaggtcat cgtgaagatc   1200
gggtcacggt acgacgtcgg gaacctgatc ccctcagact tccacgccgt tgcccctggc   1260
aacaactact gcgtttggga gaagcacggt ctgagagttc cagcggggcg gcaccactag   1320
<210>53
<211>45
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>53
Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr Thr Gly Ser Gly Gly
 1               5                  10                  15
Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala Ser Lys Thr Ser Thr
            20                  25                  30
Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val
        35              40                      45
<210>54
<211>137
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>54
gccaccggcg gcaccaccac caccgccacc accaccggct ccggcggcgt gacctccacc     60
tccaagacca ccaccaccgc ctccaagacc tccaccacca cctcctccac ctcctgcacc    120
accccgaccg ccgtgtc                                                   137
<210>55
<211>300
<212>PRT
<213>激烈火球菌
<400>55
Ile Tyr Phe Val Glu Lys Tyr His Thr Ser Glu Asp Lys Ser Thr Ser
 1               5                  10                  15
Asn Thr Ser Ser Thr Pro Pro Gln Thr Thr Leu Ser Thr Thr Lys Val
            20                  25                  30
Leu Lys Ile Arg Tyr Pro Asp Asp Gly Glu Trp Pro Gly Ala Pro Ile
        35                  40                  45
Asp Lys Asp Gly Asp Gly Asn Pro Glu Phe Tyr Ile Glu Ile Asn Leu
    50                  55                  60
Trp Asn Ile Leu Asn Ala Thr Gly Phe Ala Glu Met Thr Tyr Asn Leu
65                  70                  75                  80
Thr Ser Gly Val Leu His Tyr Val Gln Gln Leu Asp Asn Ile Val Leu
                85                  90                  95
Arg Asp Arg Ser Asn Trp Val His Gly Tyr Pro Glu Ile Phe Tyr Gly
            100                 105                 110
Asn Lys Pro Trp Asn Ala Asn Tyr Ala Thr Asp Gly Pro Ile Pro Leu
        115                 120                 125
Pro Ser Lys Val Ser Asn Leu Thr Asp Phe Tyr Leu Thr Ile Ser Tyr
    130                 135                 140
Lys Leu Glu Pro Lys Asn Gly Leu Pro Ile Asn Phe Ala Ile Glu Ser
145                 150                 155                 160
Trp Leu Thr Arg Glu Ala Trp Arg Thr Thr Gly Ile Asn Ser Asp Glu
                165                 170                 175
Gln Glu Val Met Ile Trp Ile Tyr Tyr Asp Gly Leu Gln Pro Ala Gly
            180                 185                 190
Ser Lys Val Lys Glu Ile Val Val Pro Ile Ile Val Asn Gly Thr Pro
        195                 200                 205
Val Asn Ala Thr Phe Glu Val Trp Lys Ala Asn Ile Gly Trp Glu Tyr
    210                 215                 220
Val Ala Phe Arg Ile Lys Thr Pro Ile Lys Glu Gly Thr Val Thr Ile
225                 230                 235                 240
Pro Tyr Gly Ala Phe Ile Ser Val Ala Ala Asn Ile Ser Ser Leu Pro
                245                 250                 255
Asn Tyr Thr Glu Leu Tyr Leu Glu Asp Val Glu Ile Gly Thr Glu Phe
            260                 265                 270
Gly Thr Pro Ser Thr Thr Ser Ala His Leu Glu Trp Trp Ile Thr Asn
        275                 280                 285
Ile Thr Leu Thr Pro Leu Asp Arg Pro Leu Ile Ser
    290                 295                 300
<210>56
<211>903
<212>DNA
<213>激烈火球菌
<400>56
atctacttcg tggagaagta ccacacctcc gaggacaagt ccacctccaa cacctcctcc     60
accccgccgc agaccaccct ctccaccacc aaggtgctca agatccgcta cccggacgac    120
ggcgagtggc ccggcgcccc gatcgacaag gacggcgacg gcaacccgga gttctacatc    180
gagatcaacc tctggaacat cctcaacgcc accggcttcg ccgagatgac ctacaacctc    240
actagtggcg tgctccacta cgtgcagcag ctcgacaaca tcgtgctccg cgaccgctcc    300
aactgggtgc acggctaccc ggaaatcttc tacggcaaca agccgtggaa cgccaactac    360
gccaccgacg gcccgatccc gctcccgtcc aaggtgtcca acctcaccga cttctacctc    420
accatctcct acaagctcga gccgaagaac ggtctcccga tcaacttcgc catcgagtcc    480
tggctcaccc gcgaggcctg gcgcaccacc ggcatcaact ccgacgagca ggaggtgatg    540
atctggatct actacgacgg cctccagccc gcgggctcca aggtgaagga gatcgtggtg    600
ccgatcatcg tgaacggcac cccggtgaac gccaccttcg aggtgtggaa ggccaacatc    660
ggctgggagt acgtggcctt ccgcatcaag accccgatca aggagggcac cgtgaccatc    720
ccgtacggcg ccttcatctc cgtggccgcc aacatctcct ccctcccgaa ctacaccgag    780
aagtacctcg aggacgtgga gatcggcacc gagttcggca ccccgtccac cacctccgcc    840
cacctcgagt ggtggatcac caacatcacc ctcaccccgc tcgaccgccc gctcatctcc    900
tag                                                                  903
<210>57
<211>387
<212>PRT
<213>黄栖热菌
<400>57
Met Tyr Glu Pro Lys Pro Glu His Arg Phe Thr Phe Gly Leu Trp Thr
 1               5                  10                  15
Val Asp Asn Val Asp Arg Asp Pro Phe Gly Asp Thr Val Arg Glu Arg
            20                  25                  30
Leu Asp Pro Val Tyr Val Val His Lys Leu Ala Glu Leu Gly Ala Tyr
        35                  40                  45
Gly Val Asn Leu His Asp Glu Asp Leu Ile Pro Arg Gly Thr Pro Pro
    50                  55                  60
Gln Glu Arg Asp Gln Ile Val Arg Arg Phe Lys Lys Ala Leu Asp Glu
65                  70                  75                  80
Thr Val Leu Lys Val Pro Met Val Thr Ala Asn Leu Phe Ser Glu Pro
                85                  90                  95
Ala Phe Arg Asp Gly Ala Ser Thr Thr Arg Asp Pro Trp Val Trp Ala
            100                 105                 110
Tyr Ala Leu Arg Lys Ser Leu Glu Thr Met Asp Leu Gly Ala Glu Leu
        115                 120                 125
Gly Ala Glu Ile Tyr Met Phe Trp Met Val Arg Glu Arg Ser Glu Val
    130                 135                 140
Glu Ser Thr Asp Lys Thr Arg Lys Val Trp Asp Trp Val Arg Glu Thr
145                 150                 155                 160
Leu Asn Phe Met Thr Ala Tyr Thr Glu Asp Gln Gly Tyr Gly Tyr Arg
                165                 170                 175
Phe Ser Val Glu Pro Lys Pro Asn Glu Pro Arg Gly Asp Ile Tyr Phe
            180                 185                 190
Thr Thr Val Gly Ser Met Leu Ala Leu Ile His Thr Leu Asp Arg Pro
        195                 200                 205
Glu Arg Phe Gly Leu Asn Pro Glu Phe Ala His Glu Thr Met Ala Gly
    210                 215                 220
Leu Asn Phe Asp His Ala Val Ala Gln Ala Val Asp Ala Gly Lys Leu
225                 230                 235                 240
Phe His Ile Asp Leu Asn Asp Gln Arg Met Ser Arg Phe Asp Gln Asp
                245                 250                 255
Leu Arg Phe Gly Ser Glu Asn Leu Lys Ala Gly Phe Phe Leu Val Asp
            260                 265                 270
Leu Leu Glu Ser Ser Gly Tyr Gln Gly Pro Arg His Phe Glu Ala His
        275                 280                 285
Ala Leu Arg Thr Glu Asp Glu Glu Gly Val Trp Thr Phe Val Arg Val
    290                 295                 300
Cys Met Arg Thr Tyr Leu Ile Ile Lys Val Arg Ala Glu Thr Phe Arg
305                 310                 315                 320
Glu Asp Pro Glu Val Lys Glu Leu Leu Ala Ala Tyr Tyr Gln Glu Asp
                325                 330                 335
Pro Ala Thr Leu Ala Leu Leu Asp Pro Tyr Ser Arg Glu Lys Ala Glu
            340                 345                 350
Ala Leu Lys Arg Ala Glu Leu Pro Leu Glu Thr Lys Arg Arg Arg Gly
        355                 360                 365
Tyr Ala Leu Glu Arg Leu Asp Gln Leu Ala Val Glu Tyr Leu Leu Gly
    370                 375                 380
Val Arg Gly
385
<210>58
<211>978
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>58
atggggaaga acggcaacct gtgctgcttc tctctgctgc tgcttcttct cgccgggttg     60
gcgtccggcc atcaaatcta cttcgtggag aagtaccaca cctccgagga caagtccacc    120
tccaacacct cctccacccc gccgcagacc accctctcca ccaccaaggt gctcaagatc    180
cgctacccgg acgacggtga gtggcccggc gccccgatcg acaaggacgg cgacggcaac    240
ccggagttct acatcgagat caacctctgg aacatcctca acgccaccgg cttcgccgag    300
atgacctaca acctcactag tggcgtgctc cactacgtgc agcagctcga caacatcgtg    360
ctccgcgacc gctccaactg ggtgcacggc tacccggaaa tcttctacgg caacaagccg    420
tggaacgcca actacgccac cgacggcccg atcccgctcc cgtccaaggt gtccaacctc    480
accgacttct acctcaccat ctcctacaag ctcgagccga agaacggtct cccgatcaac    540
ttcgccatcg agtcctggct cacccgcgag gcctggcgca ccaccggcat caactccgac    600
gagcaggagg tgatgatctg gatctactac gacggcctcc agcccgcggg ctccaaggtg    660
aaggagatcg tggtgccgat catcgtgaac ggcaccccgg tgaacgccac cttcgaggtg    720
tggaaggcca acatcggctg ggagtacgtg gccttccgca tcaagacccc gatcaaggag    780
ggcaccgtga ccatcccgta cggcgccttc atctccgtgg ccgccaacat ctcctccctc    840
ccgaactaca ccgagaagta cctcgaggac gtggagatcg gcaccgagtt cggcaccccg    900
tccaccacct ccgcccacct cgagtggtgg atcaccaaca tcaccctcac cccgctcgac    960
cgcccgctca tctcctag                                                  978
<210>59
<211>1920
<212>DNA
<213>黑曲霉
<400>59
atgtccttcc gctccctcct cgccctctcc ggcctcgtgt gcaccggcct cgccaacgtg     60
atctccaagc gcgccaccct cgactcctgg ctctccaacg aggccaccgt ggcccgcacc    120
gccatcctca acaacatcgg cgccgacggc gcctgggtgt ccggcgccga ctccggcatc    180
gtggtggcct ccccgtccac cgacaacccg gactacttct acacctggac ccgcgactcc    240
ggcctcgtgc tcaagaccct cgtggacctc ttccgcaacg gcgacacctc cctcctctcc    300
accatcgaga actacatctc cgcccaggcc atcgtgcagg gcatctccaa cccgtccggc    360
gacctctcct ccggcgccgg cctcggcgag ccgaagttca acgtggacga gaccgcctac    420
accggctcct ggggccgccc gcagcgcgac ggcccggccc tccgcgccac cgccatgatc    480
ggcttcggcc agtggctcct cgacaacggc tacacctcca ccgccaccga catcgtgtgg    540
ccgctcgtgc gcaacgacct ctcctacgtg gcccagtact ggaaccagac cggctacgac    600
ctctgggagg aggtgaacgg ctcctccttc ttcaccatcg ccgtgcagca ccgcgccctc    660
gtggagggct ccgccttcgc caccgccgtg ggctcctcct gctcctggtg cgactcccag    720
gccccggaga tcctctgcta cctccagtcc ttctggaccg gctccttcat cctcgccaac    780
ttcgactcct cccgctccgg caaggacgcc aacaccctcc tcggctccat ccacaccttc    840
gacccggagg ccgcctgcga cgactccacc ttccagccgt gctccccgcg cgccctcgcc    900
aaccacaagg aggtggtgga ctccttccgc tccatctaca ccctcaacga cggcctctcc    960
gactccgagg ccgtggccgt gggccgctac ccggaggaca cctactacaa cggcaacccg   1020
tggttcctct gcaccctcgc cgccgccgag cagctctacg acgccctcta ccagtgggac   1080
aagcagggct ccctcgaggt gaccgacgtg tccctcgact tcttcaaggc cctctactcc   1140
gacgccgcca ccggcaccta ctcctcctcc tcctccacct actcctccat cgtggacgcc   1200
gtgaagacct tcgccgacgg cttcgtgtcc atcgtggaga cccacgccgc ctccaacggc   1260
tccatgtccg agcagtacga caagtccgac ggcgagcagc tctccgcccg cgacctcacc   1320
tggtcctacg ccgccctcct caccgccaac aaccgccgca actccgtggt gccggcctcc   1380
tggggcgaga cctccgcctc ctccgtgccg ggcacctgcg ccgccacctc cgccatcggc   1440
acctactcct ccgtgaccgt gacctcctgg ccgtccatcg tggccaccgg cggcaccacc   1500
accaccgcca ccccgaccgg ctccggctcc gtgacctcca cctccaagac caccgccacc   1560
gcctccaaga cctccacctc cacctcctcc acctcctgca ccaccccgac cgccgtggcc   1620
gtgaccttcg acctcaccgc caccaccacc tacggcgaga acatctacct cgtgggctcc   1680
atctcccagc tcggcgactg ggagacctcc gacggcatcg ccctctccgc cgacaagtac   1740
acctcctccg acccgctctg gtacgtgacc gtgaccctcc cggccggcga gtccttcgag   1800
tacaagttca tccgcatcga gtccgacgac tccgtggagt gggagtccga cccgaaccgc   1860
gagtacaccg tgccgcaggc ctgcggcacc tccaccgcca ccgtgaccga cacctggcgc   1920
<210>60
<211>6
<212>PRT
<213>人工序列
<220>
<223>合成的
<400>60
Ser Glu Lys Asp Glu Leu
 1               5
<210>61
<211>561
<212>DNA
<213>人工序列
<220>
<223>木聚糖酶BD7436
<220>
<221>CDS
<222>(1)..(561)
<400>61
atg gct agc acc ttc tac tgg cat ttg tgg acc gac ggc arc ggc acc    48
Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly Ile Gly Thr
1               5                   10                  15
gtg aac gct acc aac ggc agc gac ggc aac tac agc gtg agc tgg agc    96
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc agc gct   144
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
acc agg gtg atc aac tac aac gct cat gct ttc agc gtg gtg ggc aac   192
Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val Val Gly Asn
    50                  55                  60
gct tac ttg gct ttg tac ggc tgg acc agg aac agc ttg atc gag tac   240
Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
tac gtg gtg gac agc tgg ggc acc tac agg cca acc ggc acc tac aag   288
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
ggc acc gtg acc agc gac ggc ggc acc tac gac atc tac acc acc acc   336
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
agg acc aac gct cca agc atc gac ggc aac aac acc acc ttc acc caa   384
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
ttc tgg agc gtg agg caa agc aag agg cca atc ggc acc aac aac acc   432
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
atc acc ttc agc aac cat gtg aac gct tgg aag agc aag ggc atg aac   480
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
ttg ggc agc agc tgg agc tac caa gtg ttg gct acc gag ggc tac caa   528
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
agc agc ggc tac agc aac gtg acc gtg tgg tag                       561
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>62
<211>186
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>62
Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly Ile Gly Thr
1               5                   10                  15
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val Val Gly Asn
    50                  55                  60
Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
Set Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>63
<211>561
<212>DNA
<213>人工序列
<220>
<223>木聚糖酶BD6002A
<220>
<221>CDS
<222>(1)..(561)
<400>63
atg gct agc acc gac tac tgg caa aac tgg acc gac ggc ggc ggc acc    48
Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr
1               5                   10                  15
gtg aac gct acc aac ggc agc gac ggc aac tac agc gtg agc tgg agc    96
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc agc gct   144
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
acc agg gtg atc aac tac aac gct ggc gct ttc agc cca agc ggc aac   192
Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn
    50                  55                  60
ggc tac ttg gct ttg tac ggc tgg acc agg aac agc ttg atc gag tac   240
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
tac gtg gtg gac agc tgg ggc acc tac agg cca acc ggc acc tac aag   288
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
ggc acc gtg acc agc gac ggc ggc acc tac gac atc tac acc acc acc   336
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
agg acc aac gct cca agc atc gac ggc aac aac acc acc ttc acc caa   384
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
ttc tgg agc gtg agg caa agc aag agg cca atc ggc acc aac aac acc   432
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
atc acc ttc agc aac cat gtg aac gct tgg aag agc aag ggc atg aac   480
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
ttg ggc agc agc tgg agc tac caa gtg ttg gct acc gag ggc tac caa   528
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
agc agc ggc tac agc aac gtg acc gtg tgg tag                       561
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>64
<211>186
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>64
Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr
1               5                   10                  15
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn
    50                  55                  60
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>65
<211>561
<212>DNA
<213>人工序列
<220>
<223>木聚糖酶BD6002B
<220>
<221>CDS
<222>(1)..(561)
<400>65
atg gcc tcc acc gac tac tgg cag aac tgg acc gac ggc ggc ggc acc    48
Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr
1               5                   10                  15
gtg aac gcc acc aac ggc tcc gac ggc aac tac tcc gtg tcc tgg tcc    96
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
aac tgc ggc aac ttc gtg gtg ggc aag ggc tgg acc acc ggc tcc gcc   144
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
acc cgc gtg atc aac tac aac gcc ggc gcc ttc tcc ccg tcc ggc aac   192
Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn
    50                  55                  60
ggc tac ctc gcc ctc tac ggc tgg acc cgc aac tcc ctc atc gag tac   240
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
tac gtg gtg gac tcc tgg ggc acc tac cgc ccg acc ggc acc tac aag   288
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
ggc acc gtg acc tcc gac ggc ggc acc tac gac atc tac acc acc acc   336
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
cgc acc aac gcc ccg tcc atc gac ggc aac aac acc acc ttc acc cag   384
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
ttc tgg tcc gtg cgc cag tcc aag cgc ccg atc ggc acc aac aac acc   432
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
atc acc ttc tcc aac cac gtg aac gcc tgg aag tcc aag ggc atg aac   480
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
ctc ggc tcc tcc tgg tcc tac cag gtg ctc gcc acc gag ggc tac cag   528
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
tcc tcc ggc tac tcc aac gtg acc gtg tgg tga                       561
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>66
<211>186
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>66
Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr
1               5                   10                  15
Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val Ser Trp Ser
            20                  25                  30
Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala
        35                  40                  45
Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn
    50                  55                  60
Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr
65                  70                  75                  80
Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys
                85                  90                  95
Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr
            100                 105                 110
Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr Phe Thr Gln
        115                 120                 125
Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr
    130                 135                 140
Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn
145                 150                 155                 160
Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln
                165                 170                 175
Ser Ser Gly Tyr Ser Asn Val Thr Val Trp
            180                 185
<210>67
<211>2071
<212>DNA
<213>稻
<220>
<221>misc_feature
<222>(1)..(2071)
<223>启动子
<400>67
tccatgctgt cctactactt gcttcatccc cttctacatt ttgttctggt ttttggcctg     60
catttcggat catgatgtat gtgatttcca atctgctgca atatgaatgg agactctgtg    120
ctaaccatca acaacatgaa atgcttatga ggcctttgct gagcagccaa tcttgcctgt    180
gtttatgtct tcacaggccg aattcctctg ttttgttttt caccctcaat atttggaaac    240
atttatctag gttgtttgtg tccaggccta taaatcatac atgatgttgt cgtattggat    300
gtgaatgtgg tggcgtgttc agtgccttgg atttgagttt gatgagagtt gcttctgggt    360
caccactcac cattatcgat gctcctcttc agcataaggt aaaagtcttc cctgtttacg    420
ttattttacc cactatggtt gcttgggttg gttttttcct gattgcttat gccatggaaa    480
gtcatttgat atgttgaact tgaattaact gtagaattgt atacatgttc catttgtgtt    540
gtacttcctt cttttctatt agtagcctca gatgagtgtg aaaaaaacag attatataac    600
ttgccctata aatcatttga aaaaaatatt gtacagtgag aaattgatat atagtgaatt    660
tttaagagca tgttttccta aagaagtata tattttctat gtacaaaggc cattgaagta    720
attgtagata caggataatg tagacttttt ggacttacac tgctaccttt aagtaacaat    780
catgagcaat agtgttgcaa tgatatttag gctgcattcg tttactctct tgatttccat    840
gagcacgctt cccaaactgt taaactctgt gttttttgcc aaaaaaaaat gcataggaaa    900
gttgctttta aaaaatcata tcaatccatt ttttaagtta tagctaatac ttaattaatc    960
atgcgctaat aagtcactct gtttttcgta ctagagagat tgttttgaac cagcactcaa   1020
gaacacagcc ttaacccagc caaataatgc tacaacctac cagtccacac ctcttgtaaa   1080
gcatttgttg catggaaaag ctaagatgac agcaacctgt tcaggaaaac aactgacaag   1140
gtcataggga gagggagctt ttggaaaggt gccgtgcagt tcaaacaatt agttagcagt   1200
agggtgttgg tttttgctca cagcaataag aagttaatca tggtgtaggc aacccaaata   1260
aaacaccaaa atatgcacaa ggcagtttgt tgtattctgt agtacagaca aaactaaaag   1320
taatgaaaga agatgtggtg ttagaaaagg aaacaatatc atgagtaatg tgtgggcatt   1380
atgggaccac gaaataaaaa gaacattttg atgagtcgtg tatcctcgat gagcctcaaa   1440
agttctctca ccccggataa gaaaccctta agcaatgtgc aaagtttgca ttctccactg   1500
acataatgca aaataagata tcatcgatga catagcaact catgcatcat atcatgcctc   1560
tctcaaccta ttcattccta ctcatctaca taagtatctt cagctaaatg ttagaacata   1620
aacccataag tcacgtttga tgagtattag gcgtgacaca tgacaaatca cagactcaag   1680
caagataaag caaaatgatg tgtacataaa actccagagc tatatgtcat attgcaaaaa   1740
gaggagagct tataagacaa ggcatgactc acaaaaattc atttgccttt cgtgtcaaaa   1800
agaggagggc tttacattat ccatgtcata ttgcaaaaga aagagagaaa gaacaacaca   1860
atgctgcgtc aattatacat atctgtatgt ccatcattat tcatccacct ttcgtgtacc   1920
acacttcata tatcatgagt cacttcatgt ctggacatta acaaactcta tcttaacatt   1980
tagatgcaag agcctttatc tcactataaa tgcacgatga tttctcattg tttctcacaa   2040
aaagcattca gttcattagt cctacaacaa c                                  2071
<210>68
<211>79
<212>PRT
<213>玉蜀黍
<220>
<221>SIGNAL
<222>(1)..(79)
<223>玉米waxy信号序列
<400>68
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
1               5                   10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala
65                  70                  75
<210>69
<211>1005
<212>DNA
<213>人工序列
<220>
<223>合成的菠萝蛋白酶序列
<220>
<221>CDS
<222>(1)..(1005)
<223>合成的菠萝蛋白酶
<400>69
atg gcc tgg aag gtg cag gtg gtg ttc ctc ttc ctc ttc ctc tgc gtg    48
Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val
1               5                   10                  15
atg tgg gcc tcc ccg tcc gcc gcc tcc gcg gac gag ccg tcc gac ccg    96
Met Trp Ala Ser Pro Ser Ala Ala Ser Ala Asp Glu Pro Ser Asp Pro
            20                  25                  30
atg atg aag cgc ttc gag gag tgg atg gtg gag tac ggc cgc gtg tac   144
Met Met Lys Arg Phe Glu Glu Trp Met Val Glu Tyr Gly Arg Val Tyr
        35                  40                  45
aag gac aac gac gag aag atg cgc cgc ttc cag atc ttc aag aac aac   192
Lys Asp Asn Asp Glu Lys Met Arg Arg Phe Gln Ile Phe Lys Asn Asn
    50                  55                  60
gtg aac cac atc gag acc ttc aac tcc cgc aac gag aac tcc tac acc   240
Val Asn His Ile Glu Thr Phe Asn Ser Arg Asn Glu Asn Ser Tyr Thr
65                  70                  75                  80
ctc ggc atc aac cag ttc acc gac atg acc aac aac gag ttc atc gcc   288
Leu Gly Ile Asn Gln Phe Thr Asp Met Thr Asn Asn Glu Phe Ile Ala
                85                  90                  95
cag tac acc ggc ggc atc tcc cgc ccg ctc aac atc gag cgc gag ccg   336
Gln Tyr Thr Gly Gly Ile Ser Arg Pro Leu Asn Ile Glu Arg Glu Pro
            100                 105                 110
gtg gtg tcc ttc gac gac gtg gac atc tcc gcc gtg ccg cag tcc atc   384
Val Val Ser Phe Asp Asp Val Asp Ile Ser Ala Val Pro Gln Ser Ile
        115                 120                 125
gac tgg cgc gac tac ggc gcc gtg acc tcc gtg aag aac cag aac ccg   432
Asp Trp Arg Asp Tyr Gly Ala Val Thr Ser Vel Lys Asn Gln Asn Pro
    130                 135                 140
tgc ggc gcc tgc tgg gcc ttc gcc gcc atc gcc acc gtg gag tcc atc   480
Cys Gly Ala Cys Trp Ala Phe Ala Ala Ile Ala Thr Val Glu Ser Ile
145                 150                 155                 160
tac aag atc aag aag ggc atc ctc gag ccg ctc tcc gag cag cag gtg   528
Tyr Lys Ile Lys Lys Gly Ile Leu Glu Pro Leu Ser Glu Gln Gln Val
                165                 170                 175
ctc gac tgc gcc aag ggc tac ggc tgc aag ggc ggc tgg gag ttc cgc   576
Leu Asp Cys Ala Lys Gly Tyr Gly Cys Lys Gly Gly Trp Glu Phe Arg
            180                 185                 190
gcc ttc gag ttc atc atc tcc aac aag ggc gtg gcc tcc ggc gcc atc   624
Ala Phe Glu Phe Ile Ile Ser Asn Lys Gly Val Ala Ser Gly Ala Ile
        195                 200                 205
tac ccg tac aag gcc gcc aag ggc acc tgc aag acc gac ggc gtg ccg   672
Tyr Pro Tyr Lys Ala Ala Lys Gly Thr Cys Lys Thr Asp Gly Val Pro
    210                 215                 220
aac tcc gcc tac atc acc ggc tac gcc cgc gtg ccg cgc aac aac gag   720
Asn Ser Ala Tyr Ile Thr Gly Tyr Ala Arg Val Pro Arg Asn Asn Glu
225                 230                 235                 240
tcc tcc atg atg tac gcc gtg tcc aag cag ccg atc acc gtg gcc gtg   768
Ser Ser Met Met Tyr Ala Val Ser Lys Gln Pro Ile Thr Val Ala Val
                245                 250                 255
gac gcc aac gcc aac ttc cag tac tac aag tcc ggc gtg ttc aac ggc   816
Asp Ala Asn Ala Asn Phe Gln Tyr Tyr Lys Ser Gly Val Phe Asn Gly
            260                 265                 270
cog tgc ggc acc tcc ctc aac cac gcc gtg acc gcc atc ggc tac ggc   864
Pro Cys Gly Thr Ser Leu Asn His Ala Val Thr Ala Ile Gly Tyr Gly
        275                 280                 285
cag gac tcc atc atc tac ccg aag aag tgg ggc gcc aag tgg ggc gag   912
Gln Asp Ser Ile Ile Tyr Pro Lys Lys Trp Gly Ala Lys Trp Gly Glu
    290                 295                 300
gcc ggc tac atc cgc atg gcc cgc gac gtg tcc tcc tcc tcc ggc atc   960
Ala Gly Tyr Ile Arg Met Ala Arg Asp Val Ser Ser Ser Ser Gly Ile
305                 310                 315                 320
tgc ggc atc gcc atc gac ccg ctc tac ccg acc ctc gag gag tag      1005
Cys Gly Ile Ala Ile Asp Pro Leu Tyr Pro Thr Leu Glu Glu
                325                 330
<210>70
<211>334
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>70
Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val
1               5                   10                  15
Met Trp Ala Ser Pro Ser Ala Ala Ser Ala Asp Glu Pro Ser Asp Pro
            20                  25                  30
Met Met Lys Arg Phe Glu Glu Trp Met Val Glu Tyr Gly Arg Val Tyr
        35                  40                  45
Lys Asp Asn Asp Glu Lys Met Arg Arg Phe Gln Ile Phe Lys Asn Asn
    50                  55                  60
Val Asn His Ile Glu Thr Phe Asn Ser Arg Asn Glu Asn Ser Tyr Thr
65                  70                  75                   80
Leu Gly Ile Asn Gln Phe Thr Asp Met Thr Asn Asn Glu Phe Ile Ala
                85                  90                  95
Gln Tyr Thr Gly Gly Ile Ser Arg Pro Leu Asn Ile Glu Arg Glu Pro
            100                 105                 110
Val Val Ser Phe Asp Asp Val Asp Ile Ser Ala Val Pro Gln Ser Ile
        115                 120                 125
Asp Trp Arg Asp Tyr Gly Ala Val Thr Ser Val Lys Asn Gln Asn Pro
    130                 135                 140
Cys Gly Ala Cys Trp Ala Phe Ala Ala Ile Ala Thr Val Glu Ser Ile
145                 150                 155                 160
Tyr Lys Ile Lys Lys Gly Ile Leu Glu Pro Leu Ser Glu Gln Gln Val
                165                 170                 175
Leu Asp Cys Ala Lys Gly Tyr Gly Cys Lys Gly Gly Trp Glu Phe Arg
            180                 185                 190
Ala Phe Glu Phe Ile Ile Ser Asn Lys Gly Val Ala Ser Gly Ala Ile
        195                 200                 205
Tyr Pro Tyr Lys Ala Ala Lys Gly Thr Cys Lys Thr Asp Gly Val Pro
    210                 215                 220
Asn Ser Ala Tyr Ile Thr Gly Tyr Ala Arg Val Pro Arg Asn Asn Glu
225                 230                 235                 240
Ser Ser Met Met Tyr Ala Val Ser Lys Gln Pro Ile Thr Val Ala Val
                245                 250                 255
Asp Ala Asn Ala Asn Phe Gln Tyr Tyr Lys Ser Gly Val Phe Asn Gly
            260                 265                 270
Pro Cys Gly Thr Ser Leu Asn His Ala Val Thr Ala Ile Gly Tyr Gly
        275                 280                 285
Gln Asp Ser Ile Ile Tyr Pro Lys Lys Trp Gly Ala Lys Trp Gly Glu
    290                 295                 300
Ala Gly Tyr Ile Arg Met Ala Arg Asp Val Ser Ser Ser Ser Gly Ile
305                 310                 315                 320
Cys Gly Ile Ala Ile Asp Pro Leu Tyr Pro Thr Leu Glu Glu
                325                 330
<210>71
<211>78
<212>DNA
<213>人工序列
<220>
<223>菠萝蛋白酶信号序列
<400>71
atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc     60
ccgtccgccg cctccgcc                                                   78
<210>72
<211>26
<212>PRT
<213>人工序列
<220>
<223>菠萝蛋白酶信号肽
<400>72
Met Ala Trp Lys Val Gln Val Val Phe Leu Phe Leu Phe Leu Cys Val
1               5                   10                  15
Met Trp Ala Ser Pro Ser Ala Ala Ser Ala
            20                  25
<210>73
<211>1050
<212>DNA
<213>人工序列
<220>
<223>pSYN11000
<400>73
atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc     60
ccgtccgccg cctccgcgga cgagccgtcc gacccgatga tgaagcgctt cgaggagtgg    120
atggtggagt acggccgcgt gtacaaggac aacgacgaga agatgcgccg cttccagatc    180
ttcaagaaca acgtgaacca catcgagacc ttcaactccc gcaacgagaa ctcctacacc    240
ctcggcatca accagttcac cgacatgacc aacaacgagt tcatcgccca gtacaccggc    300
ggcatctccc gcccgctcaa catcgagcgc gagccggtgg tgtccttcga cgacgtggac    360
atctccgccg tgccgcagtc catcgactgg cgcgactacg gcgccgtgac ctccgtgaag    420
aaccagaacc cgtgcggcgc ctgctgggcc ttcgccgcca tcgccaccgt ggagtccatc    480
tacaagatca agaagggcat cctcgagccg ctctccgagc agcaggtgct cgactgcgcc    540
aagggctacg gctgcaaggg cggctgggag ttccgcgcct tcgagttcat catctccaac    600
aagggcgtgg cctccggcgc catctacccg tacaaggccg ccaagggcac ctgcaagacc    660
gacggcgtgc cgaactccgc ctacatcacc ggctacgccc gcgtgccgcg caacaacgag    720
tcctccatga tgtacgccgt gtccaagcag ccgatcaccg tggccgtgga cgccaacgcc    780
aacttccagt actacaagtc cggcgtgttc aacggcccgt gcggcacctc cctcaaccac    840
gccgtgaccg ccatcggcta cggccaggac tccatcatct acccgaagaa gtggggcgcc    900
aagtggggcg aggccggcta catccgcatg gcccgcgacg tgtcctcctc ctccggcatc    960
tgcggcatcg ccatcgaccc gctctacccg accctcgagg aggtgttcgc cgaggccatc   1020
gccgccaact ccaccctcgt ggccgagtag                                    1050
<210>74
<211>1067
<212>DNA
<213>人工序列
<220>
<223>pSYN11589
<400>74
tggcctggaa ggtgcaggtg gtgttcctct tcctcttcct ctgcgtgatg tgggcctccc     60
cgtccgccgc ctccgcctcc tcctcctcct tcgccgactc caacccgatc cgcccggtga    120
ccgaccgcgc cgcctccacc gacgagccgt ccgacccgat gatgaagcgc ttcgaggagt    180
ggatggtgga gtacggccgc gtgtacaagg acaacgacga gaagatgcgc cgcttccaga    240
tcttcaagaa caacgtgaac cacatcgaga ccttcaactc ccgcaacgag aactcctaca    300
ccctcggcat caaccagttc accgacatga ccaacaacga gttcatcgcc cagtacaccg    360
gcggcatctc ccgcccgctc aacatcgagc gcgagccggt ggtgtccttc gacgacgtgg    420
acatctccgc cgtgccgcag tccatcgact ggcgcgacta cggcgccgtg acctccgtga    480
agaaccagaa cccgtgcggc gcctgctggg ccttcgccgc catcgccacc gtggagtcca    540
tctacaagat caagaagggc atcctcgagc cgctctccga gcagcaggtg ctcgactgcg    600
ccaagggcta cggctgcaag ggcggctggg agttccgcgc cttcgagttc atcatctcca    660
acaagggcgt ggcctccggc gccatctacc cgtacaaggc cgccaagggc acctgcaaga    720
ccgacggcgt gccgaactcc gcctacatca ccggctacgc ccgcgtgccg cgcaacaacg    780
agtcctccat gatgtacgcc gtgtccaagc agccgatcac cgtggccgtg gacgccaacg    840
ccaacttcca gtactacaag tccggcgtgt tcaacggccc gtgcggcacc tccctcaacc    900
acgccgtgac cgccatcggc tacggccagg actccatcat ctacccgaag aagtggggcg    960
ccaagtgggg cgaggccggc tacatccgca tggcccgcga cgtgtcctcc tcctccggca   1020
tctgcggcat cgccatcgac ccgctctacc cgaccctcga ggagtag                 1067
<210>75
<211>1023
<212>DNA
<213>人工序列
<220>
<223>pSYN11587 序列
<400>75
atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc     60
ccgtccgccg cctccgcgga cgagccgtcc gacccgatga tgaagcgctt cgaggagtgg    120
atggtggagt acggccgcgt gtacaaggac aacgacgaga agatgcgccg cttccagatc    180
ttcaagaaca acgtgaacca catcgagacc ttcaactccc gcaacgagaa ctcctacacc    240
ctcggcatca accagttcac cgacatgacc aacaacgagt tcatcgccca gtacaccggc    300
ggcatctccc gcccgctcaa catcgagcgc gagccggtgg tgtccttcga cgacgtggac    360
atctccgccg tgccgcagtc catcgactgg cgcgactacg gcgccgtgac ctccgtgaag    420
aaccagaacc cgtgcggcgc ctgctgggcc ttcgccgcca tcgccaccgt ggagtccatc    480
tacaagatca agaagggcat cctcgagccg ctctccgagc agcaggtgct cgactgcgcc    540
aagggctacg gctgcaaggg cggctgggag ttccgcgcct tcgagttcat catctccaac    600
aagggcgtgg cctccggcgc catctacccg tacaaggccg ccaagggcac ctgcaagacc    660
gacggcgtgc cgaactccgc ctacatcacc ggctacgccc gcgtgccgcg caacaacgag    720
tcctccatga tgtacgccgt gtccaagcag ccgatcaccg tggccgtgga cgccaacgcc    780
aacttccagt actacaagtc cggcgtgttc aacggcccgt gcggcacctc cctcaaccac    840
gccgtgaccg ccatcggcta cggccaggac tccatcatct acccgaagaa gtggggcgcc    900
aagtggggcg aggccggcta catccgcatg gcccgcgacg tgtcctcctc ctccggcatc    960
tgcggcatcg ccatcgaccc gctctacccg accctcgagg agtccgagaa ggacgagctg   1020
tag                                                                 1023
<210>76
<211>990
<212>DNA
<213>人工序列
<220>
<223>pSYN12169 序列
<400>76
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg     60
gcggacgagc cgtccgaccc gatgatgaag cgcttcgagg agtggatggt ggagtacggc    120
cgcgtgtaca aggacaacga cgagaagatg cgccgcttcc agatcttcaa gaacaacgtg    180
aaccacatcg agaccttcaa ctcccgcaac gagaactcct acaccctcgg catcaaccag    240
ttcaccgaca tgaccaacaa cgagttcatc gcccagtaca ccggcggcat ctcccgcccg    300
ctcaacatcg agcgcgagcc ggtggtgtcc ttcgacgacg tggacatctc cgccgtgccg    360
cagtccatcg actggcgcga ctacggcgcc gtgacctccg tgaagaacca gaacccgtgc    420
ggcgcctgct gggccttcgc cgccatcgcc accgtggagt ccatctacaa gatcaagaag    480
ggcatcctcg agccgctctc cgagcagcag gtgctcgact gcgccaaggg ctacggctgc    540
aagggcggct gggagttccg cgccttcgag ttcatcatct ccaacaaggg cgtggcctcc    600
ggcgccatct acccgtacaa ggccgccaag ggcacctgca agaccgacgg cgtgccgaac    660
tccgcctaca tcaccggcta cgcccgcgtg ccgcgcaaca acgagtcctc catgatgtac    720
gccgtgtcca agcagccgat caccgtggcc gtggacgcca acgccaactt ccagtactac    780
aagtccggcg tgttcaacgg cccgtgcggc acctccctca accacgccgt gaccgccatc    840
ggctacggcc aggactccat catctacccg aagaagtggg gcgccaagtg gggcgaggcc    900
ggctacatcc gcatggcccg cgacgtgtcc tcctcctccg gcatctgcgg catcgccatc    960
gacccgctct acccgaccct cgaggagtag                                     990
<210>77
<211>1170
<212>DNA
<213>人工序列
<220>
<223>pSYN12575 序列
<400>77
atgctggcgg ctctggccac gtcgcagctc gtcgcaacgc gcgccggcct gggcgtcccg     60
gacgcgtcca cgttccgccg cggcgccgcg cagggcctga ggggggcccg ggcgtcggcg    120
gcggcggaca cgctcagcat gcggaccagc gcgcgcgcgg cgcccaggca ccagcaccag    180
caggcgcgcc gcggggccag gttcccgtcg ctcgtcgtgt gcgccagcgc cggcgccatg    240
gcggacgagc cgtccgaccc gatgatgaag cgcttcgagg agtggatggt ggagtacggc    300
cgcgtgtaca aggacaacga cgagaagatg cgccgcttcc agatcttcaa gaacaacgtg    360
aaccacatcg agaccttcaa ctcccgcaac gagaactcct acaccctcgg catcaaccag    420
ttcaccgaca tgaccaacaa cgagttcatc gcccagtaca ccggcggcat ctcccgcccg    480
ctcaacatcg agcgcgagcc ggtggtgtcc ttcgacgacg tggacatctc cgccgtgccg    540
cagtccatcg actggcgcga ctacggcgcc gtgacctccg tgaagaacca gaacccgtgc    600
ggcgcctgct gggccttcgc cgccatcgcc accgtggagt ccatctacaa gatcaagaag    660
ggcatcctcg agccgctctc cgagcagcag gtgctcgact gcgccaaggg ctacggctgc    720
aagggcggct gggagttccg cgccttcgag ttcatcatct ccaacaaggg cgtggcctcc    780
ggcgccatct acccgtacaa ggccgccaag ggcacctgca agaccgacgg cgtgccgaac    840
tccgcctaca tcaccggcta cgcccgcgtg ccgcgcaaca acgagtcctc catgatgtac    900
gccgtgtcca agcagccgat caccgtggcc gtggacgcca acgccaactt ccagtactac    960
aagtccggcg tgttcaacgg cccgtgcggc acctccctca accacgccgt gaccgccatc   1020
ggctacggcc aggactccat catctacccg aagaagtggg gcgccaagtg gggcgaggcc   1080
ggctacatcc gcatggcccg cgacgtgtcc tcctcctccg gcatctgcgg catcgccatc   1140
gacccgctct acccgaccct cgaggagtag                                    1170
<210>78
<211>1068
<212>DNA
<213>人工序列
<220>
<223>pSM270序列
<400>78
atggcctgga aggtgcaggt ggtgttcctc ttcctcttcc tctgcgtgat gtgggcctcc     60
ccgtccgccg cctccgcctc ctcctcctcc ttcgccgact ccaacccgat ccgcccggtg    120
accgaccgcg ccgcctccac cgacgagccg tccgacccga tgatgaagcg cttcgaggag    180
tggatggtgg agtacggccg cgtgtacaag gacaacgacg agaagatgcg ccgcttccag    240
atcttcaaga acaacgtgaa ccacatcgag accttcaact cccgcaacga gaactcctac    300
accctcggca tcaaccagtt caccgacatg accaacaacg agttcatcgc ccagtacacc    360
ggcggcatct cccgcccgct caacatcgag cgcgagccgg tggtgtcctt cgacgacgtg    420
gacatctccg ccgtgccgca gtccatcgac tggcgcgact acggcgccgt gacctccgtg    480
aagaaccaga acccgtgcgg cgcctgctgg gccttcgccg ccatcgccac cgtggagtcc    540
atctacaaga tcaagaaggg catcctcgag ccgctctccg agcagcaggt gctcgactgc    600
gccaagggct acggctgcaa gggcggctgg gagttccgcg ccttcgagtt catcatctcc    660
aacaagggcg tggcctccgg cgccatctac ccgtacaagg ccgccaaggg cacctgcaag    720
accgacggcg tgccgaactc cgcctacatc accggctacg cccgcgtgcc gcgcaacaac    780
gagtcctcca tgatgtacgc cgtgtccaag cagccgatca ccgtggccgt ggacgccaac    840
gccaacttcc agtactacaa gtccggcgtg ttcaacggcc cgtgcggcac ctccctcaac    900
cacgccgtga ccgccatcgg ctacggccag gactccatca tctacccgaa gaagtggggc    960
gccaagtggg gcgaggccgg ctacatccgc atggcccgcg acgtgtcctc ctcctccggc   1020
atctgcggca tcgccatcga cccgctctac ccgaccctcg aggagtag                1068
<210>79
<211>1497
<212>DNA
<213>Trichoderma reesei
<220>
<221>CDS
<222>(1)..(1497)
<223>Trichoderma reesei  纤维二糖水解酶 I
<400>79
atg cag tcg gcg tgt act ctc caa tcg gag act cac ccg cct ctg aca    48
Met Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
1               5                   10                  15
tgg cag aaa tgc tcg tct ggt ggc acg tgc act caa cag aca ggc tcc    96
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
            20                  25                  30
gtg gtc atc gac gcc aac tgg cgc tgg act cac gct acg aac agc agc    144
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
        35                  40                  45
acg aac tgc tac gat ggc aac act tgg agc tcg acc cta tgt cct gac    192
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
    50                  55                  60
aac gag acc tgc gcg aag aac tgc tgt ctg gac ggt gcc gcc tac gcg    240
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
65                  70                  75                  80
tcc acg tac gga gtt acc acg agc ggt aac agc ctc tcc att ggc ttt    288
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
                85                  90                  95
gtc acc cag tct gcg cag aag aac gtt ggc gct cgc ctt tac ctt atg    336
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
            100                 105                 110
gcg agc gac acg acc tac cag gaa ttc acc ctg ctt ggc aac gag ttc    384
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
        115                 120                 125
tct ttc gat gtt gat gtt tcg cag ctg ccg tgc ggc ttg aac gga gct    432
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
    130                 135                 140
ctc tac ttc gtg tcc atg gac gcg gat ggt ggc gtg agc aag tat ccc    480
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
145                 150                 155                 160
acc aac acc gct ggc gcc aag tac ggc acg ggg tac tgt gac agc cag    528
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
                165                 170                 175
tgt ccc cgc gat ctg aag ttc atc aat ggc cag gcc aac gtt gag ggc    576
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
            180                 185                 190
tgg gag ccg tca tcc aac aac gcg aac acg ggc att gga gga cac gga    624
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
        195                 200                 205
agc tgc tgc tct gag atg gat atc tgg gag gcc aac tcc atc tcc gag    672
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
    210                 215                 220
gct ctt acc ccc cac cct tgc acg act gtc ggc cag gag atc tgc gag    720
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
225                 230                 235                 240
ggt gat ggg tgc ggc gga act tac tcc gat aac aga tat ggc ggc act    768
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
                245                 250                 255
tgc gat ccc gat ggc tgc gac tgg aac cca tac cgc ctg ggc aac acc    816
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
            260                 265                 270
agc ttc tac ggc cct ggc tct agc ttt acc ctc gat acc acc aag aaa    864
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
        275                 280                 285
ttg acc gtt gtc acc cag ttc gag acg tcg ggt gcc atc aac cga tac    912
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
    290                 295                 300
tat gtc cag aat ggc gtc act ttc cag cag ccc aac gcc gag ctt ggt    960
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
305                 310                 315                 320
agt tac tct ggc aac gag ctc aac gat gat tac tgc aca gct gag gag   1008
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
                325                 330                 335
gca gaa ttc ggc gga tcc tct ttc tca gac aag ggc ggc ctg act cag   1056
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
            340                 345                 350
ttc aag aag gct acc tct ggc ggc atg gtt ctg gtc atg agt ctg tgg   1104
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
        355                 360                 365
gat gat tac tac gcc aac atg ctg tgg ctg gac tcc acc tac ccg aca   1152
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
    370                 375                 380
aac gag acc tcc tcc aca ccc ggt gcc gtg cgc gga agc tgc tcc acc   1200
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
385                 390                 395                 400
agc tcc ggt gtc cct get cag gtc gaa tct cag tct ccc aac gcc aag   1248
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
                405                 410                 415
gtc acc ttc tcc aac atc aag ttc gga ccc att ggc agc acc ggc aac   1296
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
            420                 425                 430
cct agc ggc ggc aac cct ccc ggc gga aac ccg cct ggc acc acc acc   1344
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
        435                 440                 445
acc cgc cgc cca gcc act acc act gga agc tct ccc gga cct acc cag   1392
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
    450                 455                 460
tct cac tac ggc cag tgc ggc ggt att ggc tac agc ggc ccc acg gtc   1440
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
465                 470                 475                 480
tgc gcc agc ggc aca act tgc cag gtc ctg aac cct tac tac tct cag   1488
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
                485                 490                 495
tgc ctg taa
Cys Leu
<210>80
<211>498
<212>PRT
<213>Trichoderma reesei
<400>80
Met Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
1                   5               10                  15
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
            20                  25                  30
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
        35                  40                  45
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
    50                  55                  60
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
65                  70                  75                  80
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
                85                  90                  95
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
            100                 105                 110
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
        115                 120                 125
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
    130                 135                 140
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
145                 150                 155                 160
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
                165                 170                 175
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
            180                 185                 190
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
        195                 200                 205
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
    210                 215                 220
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
225                 230                 235                 240
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
                245                 250                 255
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
            260                 265                 270
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
        275                 280                 285
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
    290                 295                 300
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
305                 310                 315                 320
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
                325                 330                 335
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
            340                 345                 350
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
        355                 360                 365
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
    370                 375                 380
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
385                 390                 395                 400
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
                405                 410                 415
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
            420                 425                 430
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
        435                 440                 445
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
    450                 455                 460
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
465                 470                 475                 480
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
                485                 490                 495
Cys Leu
<210>81
<211>1365
<212>DNA
<213>Trichoderma reesei
<220>
<221>CDS
<222>(1)..(1365)
<223>trichoderma reesei  纤维二糖水解酶 II
<400>81
atg gtg cct cta gag gag cgg caa gct tgc tca agc gtc tgg ggc caa    48
Met Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly Gln
1               5                   10                  15
tgt ggt ggc cag aat tgg tcg ggt ccg act tgc tgt gct tcc gga agc    96
Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly Ser
            20                  25                  30
aca tgc gtc tac tcc aac gac tat tac tcc cag tgt ctt ccc ggc gct   144
Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly Ala
        35                  40                  45
gca agc tca agc tcg tcc acg cgc gcc gcg tcg acg act tca cga gta   192
Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg Val
    50                  55                  60
tcc ccc aca aca tcc cgg tcg agc tcc gcg acg cct cca cct ggt tct   240
Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly Ser
65                  70                  75                  80
acc act acc aga gta cct cca gtc gga tcg gga acc gct acg tat tca   288
Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr Ser
                85                  90                  95
ggc aac cct ttt gtt ggg gtc act cct tgg gcc aat gca tat tac gcc   336
Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala
            100                 105                 110
tct gaa gtt agc agc crc gct att cct agc ttg act gga gcc atg gcc   384
Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala
        115                 120                 125
act gct gca gca gct gtc gca aag gtt ccc tct ttt atg tgg cta gat   432
Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp
    130                 135                 140
act ctt gac aag acc cct ctc atg gag caa acc ttg gcc gac atc cgc   480
Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg
145                 150                 155                 160
acc gcc aac aag aat ggc ggt aac tat gcc gga cag ttt gtg gtg tat   528
Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr
                165                 170                 175
gac ttg ccg gat cgc gat tgc gct gcc ctt gcc tcg aat ggc gaa tac   576
Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr
            180                 185                 190
tct att gcc gat ggt ggc gtc gcc aaa tat aag aac tat atc gac acc   624
Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr
        195                 200                 205
att cgt caa att gtc gtg gaa tat tcc gat atc cgg acc ctc ctg gtt   672
Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val
    210                 215                 220
att gag cct gac tct ctt gcc aac ctg gtg acc aac ctc ggt act cca   720
Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro
225                 230                 235                 240
aag tgt gcc aat gct cag tca gcc tac ctt gag tgc atc aac tac gcc   768
Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala
                245                 250                 255
gtc aca cag ctg aac ctt cca aat gtt gcg atg tat ttg gac gct ggc   816
Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly
            260                 265                 270
cat gca gga tgg ctt ggc tgg ccg gca aac caa gac ccg gcc gct cag   864
His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln
        275                 280                 285
cta ttt gca aat gtt tac aag aat gca tcg tct ccg aga gct ctt cgc   912
Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg
    290                 295                 300
gga ttg gca acc aat gtc gcc aac tac aac ggg tgg aac att acc agc   960
Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser
305                 310                 315                 320
ccc cca tcg tac acg caa ggc aac gct gtc tac aac gag aag ctg tac  1008
Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr
                325                 330                 335
atc cac gct att gga cct ctt ctt gcc aat cac ggc tgg tcc aac gcc  1056
Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala
            340                 345                 350
ttc ttc atc act gat caa ggt cga tcg gga aag cag cct acc gga cag  1104
Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln
        355                 360                 365
caa cag tgg gga gac tgg tgc aat gtg atc ggc acc gga ttt ggt att  1152
Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile
    370                 375                 380
cgc cca tcc gca aac act ggg gac tcg ttg ctg gat tcg ttt gtc tgg  1200
Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp
385                 390                 395                 400
gtc aag cca ggc ggc gag tgt gac ggc acc agc gac agc agt gcg cca  1248
Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro
                405                 410                 415
cga ttt gac tcc cac tgt gcg ctc cca gat gcc ttg caa ccg gcg cct  1296
Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro
            420                 425                 430
caa gct ggt gct tgg ttc caa gcc tac ttt gtg cag ctt ctc aca aac  1344
Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn
        435                 440                 445
gca aac cca tcg ttc ctg tag                                      1365
Ala Asn Pro Ser Phe Leu
    450
<210>82
<211>454
<212>PRT
<213>Trichoderma reesei
<400>82
Met Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly Gln
1               5                   10                  15
Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly Ser
            20                  25                  30
Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly Ala
        35                  40                  45
Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg Val
    50                  55                  60
Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly Ser
65                  70                  75                  80
Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr Ser
                85                  90                  95
Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr Ala
            100                 105                 110
Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met Ala
        115                 120                 125
Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu Asp
    130                 135                 140
Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile Arg
145                 150                 155                 160
Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val Tyr
                165                 170                 175
Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu Tyr
            180                 185                 190
Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp Thr
        195                 200                 205
Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu Val
    210                 215                 220
Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr Pro
225                 230                 235                 240
Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr Ala
                245                 250                 255
Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly
            260                 265                 270
His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala Gln
        275                 280                 285
Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu Arg
    290                 295                 300
Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr Ser
305                 310                 315                 320
Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu Tyr
                325                 330                 335
Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn Ala
            340                 345                 350
Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln
        355                 360                 365
Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Ile
    370                 375                 380
Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val Trp
385                 390                 395                 400
Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala Pro
                405                 410                 415
Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala Pro
            420                 425                 430
Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr Asn
        435                 440                 445
Ala Asn Pro Ser Phe Leu
    450
<210>83
<211>1317
<212>DNA
<213>Trichoderma reesei
<220>
<221>CDS
<222>(1)..(1317)
<223>Trichoderma reesei  内切葡聚糖酶 I
<400>83
atg cag caa ccg gga acc agc acc ccc gag gtc cat ccc aag ttg aca    48
Met Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys Leu Thr
1               5                   10                  15
acc tac aag tgc aca aag tcc ggg ggg tgc gtg gcc cag gac acc tcg    96
Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val Ala Gln Asp Thr Ser
            20                  25                  30
gtg gtc ctt gac tgg aac tac cgc tgg atg cac gac gca aac tac aac   144
Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Asn Tyr Asn
        35                  40                  45
tcg tgc acc gtc aac ggc ggc gtc aac acc acg ctc tgc cct gac gag   192
Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro Asp Glu
    50                  55                  60
gcg acc tgt ggc aag aac tgc ttc atc gag ggc gtc gac tac gcc gcc   240
Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr Ala Ala
65                  70                  75                  80
tcg ggc gtc acg acc tcg ggc agc agc ctc acc atg aac cag tac atg   288
Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln Tyr Met
                85                  90                  95
ccc agc agc tct ggc ggc tac agc agc gtc tct cct cgg ctg tat ctc   336
Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu Tyr Leu
            100                 105                 110
ctg gac tct gac ggt gag tac gtg atg ctg aag ctc aac ggc cag gag   384
Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly Gln Glu
        115                 120                 125
ctg agc ttc gac gtc gac ctc tct gct ctg ccg tgt gga gag aac ggc   432
Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu Asn Gly
    130                 135                 140
tcg ctc tac ctg tct cag atg gac gag aac ggg ggc gcc aac cag tat   480
Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn Gln Tyr
145                 150                 155                 160
aac acg gcc ggt gcc aac tac ggg agc ggc tac tgc gat gct cag tgc   528
Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala Gln Cys
                165                 170                 175
ccc gtc cag aca tgg agg aac ggc acc ctc aac act agc cac cag ggc   576
Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His Gln Gly
            180                 185                 190
ttc tgc tgc aac gag atg gat atc ctg gag ggc aac tcg agg gcg aat   624
Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg Ala Asn
        195                 200                 205
gcc ttg acc cct cac tct tgc acg gcc acg gcc tgc gac tct gcc ggt   672
Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser Ala Gly
    210                 215                 220
tgc ggc ttc aac ccc tat ggc agc ggc tac aaa agc tac tac ggc ccc   720
Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr Gly Pro
225                 230                 235                 240
gga gat acc gtt gac acc tcc aag acc ttc acc arc atc acc cag ttc   768
Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr Gln Phe
                245                 250                 255
aac acg gac aac ggc tcg ccc tcg ggc aac ctt gtg agc atc acc cgc   816
Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu Val Ser Ile Thr Arg
            260                 265                 270
aag tac cag caa aac ggc gtc gac atc ccc agc gcc cag ccc ggc ggc   864
Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro Gly Gly
        275                 280                 285
gac acc atc tcg tcc tgc ccg tcc gcc tca gcc tac ggc ggc ctc gcc   912
Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly Leu Ala
    290                 295                 300
acc atg ggc aag gcc ctg agc agc ggc atg gtg ctc gtg ttc agc att   960
Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe Ser Ile
305                 310                 315                 320
tgg aac gac aac agc cag tac atg aac tgg ctc gac agc ggc aac gcc  1008
Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly Asn Ala
                325                 330                 335
ggc ccc tgc agc agc acc gag ggc aac cca tcc aac acc ctg gcc aac  1056
Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Thr Leu Ala Asn
            340                 345                 350
aac ccc aac acg cac gtc gtc ttc tcc aac atc cgc tgg gga gac att  1104
Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly Asp Ile
        355                 360                 365
ggg tct act acg aac tcg act gcg ccc ccg ccc ccg cct gcg tcc agc  1152
Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala Ser Ser
    370                 375                 380
acg acg ttt tcg act aca cgg agg agc tcg acg act tcg agc agc ccg  1200
Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser Ser Pro
385                 390                 395                 400
agc tgc acg cag act cac tgg ggg cag tgc ggt ggc att ggg tac agc  1248
Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly Tyr Ser
                405                 410                 415
ggg tgc aag acg tgc acg tcg ggc act acg tgc cag tat agc aac gac  1296
Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser Asn Asp
            420                 425                 430
tac tac tcg caa tgc crt tag                                      1317
Tyr Tyr Ser Gln Cys Leu
        435
<210>84
<211>438
<212>PRT
<213>Trichoderma reesei
<400>84
Met Gln Gln Pro Gly Thr Ser Thr Pro Glu Val His Pro Lys Leu Thr
1               5                   10                  15
Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val Ala Gln Asp Thr Ser
            20                  25                  30
Val Val Leu Asp Trp Asn Tyr Arg Trp Met His Asp Ala Ash Tyr Asn
        35                  40                  45
Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr Leu Cys Pro Asp Glu
    50                  55                  60
Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly Val Asp Tyr Ala Ala
65                  70                  75                  80
Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr Met Asn Gln Tyr Met
                85                  90                  95
Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser Pro Arg Leu Tyr Leu
            100                 105                 110
Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys Leu Asn Gly Gln Glu
            115             120                 125
Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro Cys Gly Glu Asn Gly
    130                 135                 140
Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly Gly Ala Asn Gln Tyr
145                 150                 155                 160
Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr Cys Asp Ala Gln Cys
                165                 170                 175
Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn Thr Ser His Gln Gly
            180                 185                 190
Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly Asn Ser Arg Ala Asn
        195                 200                 205
Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala Cys Asp Ser Ala Gly
    210                 215                 220
Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys Ser Tyr Tyr Gly Pro
225                 230                 235                 240
Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr Ile Ile Thr Gln Phe
                245                 250                 255
Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu Val Ser Ile Thr Arg
            260                 265                 270
Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser Ala Gln Pro Gly Gly
        275                 280                 285
Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala Tyr Gly Gly Leu Ala
    290                 295                 300
Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val Leu Val Phe Ser Ile
305                 310                 315                 320
Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu Asp Ser Gly Asn Ala
                325                 330                 335
Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser Asn Thr Leu Ala Asn
            340                 345                 350
Asn Pro Asn Thr His Val Val Phe Ser Asn Ile Arg Trp Gly Asp Ile
        355                 360                 365
Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro Pro Pro Ala Ser Ser
    370                 375                 380
Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr Thr Ser Ser Ser Pro
385                 390                 395                 400
Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly Gly Ile Gly Tyr Ser
                405                 410                 415
Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys Gln Tyr Ser Asn Asp
            420                 425                 430
Tyr Tyr Ser Gln Cys Leu
        435
<210>85
<211>954
<212>DNA
<213>人工序列
<220>
<223>6GP1
<220>
<221>CDS
<222>(1)..(954)
<223>6GP1
<400>85
atg ggc gtg gac ccg ttc gag cgc aac aag atc ctc ggc cgc ggc atc    48
Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile
1               5                   10                  15
aac atc ggc aac gcc ctg gag gcc ccg aac gag ggc gac tgg ggc gtg    96
Asn Ile Gly Asn Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val
            20                  25                  30
gtg atc aag gac gag ttc ttc gac atc atc aag gag gcc ggc ttc tcc   144
Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser
        35                  40                  45
cac gtg cgc atc ccg atc cgc tgg tcc acc cac gcc tac gcc ttc ccg   192
His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro
    50                  55                  60
ccg tac aag atc atg gac cgc ttc ttc aag cgc gtg gac gag gtg atc   240
Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile
65                  70                  75                  80
aac ggc gcc ctc aag cgc ggc ctc gcc gtg gcc atc aac atc cac cac   288
Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Ala Ile Asn Ile His His
                85                  90                  95
tac gag gag ctc atg aac gac ccg gag gag cac aag gag cgc ttc ctc   336
Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu
            100                 105                 110
gcc ctc tgg aag cag atc gcc gac cgc tac aag gac tac ccg gag acc   384
Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr
        115                 120                 125
ctc ttc ttc gag atc ctc aac gag ccg cac ggc aac ctc acc ccg gag   432
Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu
    130                 135                 140
aag tgg aac gag ctg ctc gag gag gcc ctc aag gtg atc cgc tcc atc   480
Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile
145                 150                 155                 160
gac aag aag cac acc atc atc att ggc acc gca gag tgg gga ggc atc   528
Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile
                165                 170                 175
tcc gcc ctc gag aag ctc tcc gtg ccg aag tgg gag aag aat tcc atc   576
Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile
            180                 185                 190
gtg acc atc cac tac tac aac ccg ttc gag ttc acg cac cag ggc gcc   624
Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala
        195                 200                 205
gag tgg gtg gag ggc tcc gag aag tgg ctt ggc cgc aag tgg ggc tcc   672
Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser
    210                 215                 220
ccg gac gac cag aag cac ctc atc gag gag ttc aac ttc atc gag gag   720
Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu
225                 230                 235                 240
tgg tcc aag aag aac aag cgc ccg atc tac atc ggc gag ttt ggc gcc   768
Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala
                245                 250                 255
tac cgc aag gcc gac ctc gag tcc cgc atc aag tgg acc tcc ttc gtg   816
Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val
            260                 265                 270
gtg cgt gag atg gag aag cgc cgc tgg tcc tgg gcc tac tgg gag ttc   864
Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe
        275                 280                 285
tgc tcc ggc ttc ggc gtg tac gac acc ctc cgc aag acc tgg aac aag   912
Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys
    290                 295                 300
gac ctc ctc gag gcc ctc atc ggc ggc gac tcc atc gag tag           954
Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu
305                 310                 315
<210>86
<211>317
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>86
Met Gly Val Asp Pro Phe Glu Arg Asn Lys Ile Leu Gly Arg Gly Ile
1               5                   10                  15
Asn Ile Gly Asa Ala Leu Glu Ala Pro Asn Glu Gly Asp Trp Gly Val
            20                  25                  30
Val Ile Lys Asp Glu Phe Phe Asp Ile Ile Lys Glu Ala Gly Phe Ser
        35                  40                  45
His Val Arg Ile Pro Ile Arg Trp Ser Thr His Ala Tyr Ala Phe Pro
    50                  55                  60
Pro Tyr Lys Ile Met Asp Arg Phe Phe Lys Arg Val Asp Glu Val Ile
65                  70                  75                  80
Asn Gly Ala Leu Lys Arg Gly Leu Ala Val Ala Ile Asn Ile His His
                85                  90                  95
Tyr Glu Glu Leu Met Asn Asp Pro Glu Glu His Lys Glu Arg Phe Leu
            100                 105                 110
Ala Leu Trp Lys Gln Ile Ala Asp Arg Tyr Lys Asp Tyr Pro Glu Thr
        115                 120                 125
Leu Phe Phe Glu Ile Leu Asn Glu Pro His Gly Asn Leu Thr Pro Glu
    130                 135                 140
Lys Trp Asn Glu Leu Leu Glu Glu Ala Leu Lys Val Ile Arg Ser Ile
145                 150                 155                 160
Asp Lys Lys His Thr Ile Ile Ile Gly Thr Ala Glu Trp Gly Gly Ile
                165                 170                 175
Ser Ala Leu Glu Lys Leu Ser Val Pro Lys Trp Glu Lys Asn Ser Ile
            180                 185                 190
Val Thr Ile His Tyr Tyr Asn Pro Phe Glu Phe Thr His Gln Gly Ala
        195                 200                 205
Glu Trp Val Glu Gly Ser Glu Lys Trp Leu Gly Arg Lys Trp Gly Ser
    210                 215                 220
Pro Asp Asp Gln Lys His Leu Ile Glu Glu Phe Asn Phe Ile Glu Glu
225                 230                 235                 240
Trp Ser Lys Lys Asn Lys Arg Pro Ile Tyr Ile Gly Glu Phe Gly Ala
                245                 250                 255
Tyr Arg Lys Ala Asp Leu Glu Ser Arg Ile Lys Trp Thr Ser Phe Val
            260                 265                 270
Val Arg Glu Met Glu Lys Arg Arg Trp Ser Trp Ala Tyr Trp Glu Phe
        275                 280                 285
Cys Ser Gly Phe Gly Val Tyr Asp Thr Leu Arg Lys Thr Trp Asn Lys
    290                 295                 300
Asp Leu Leu Glu Ala Leu Ile Gly Gly Asp Ser Ile Glu
305                 310                 315
<210>87
<211>1248
<212>DNA
<213>Hordeun vulaare
<220>
<221>CDS
<222>(1)..(1248)
<223>大麦AmyI淀粉酶
<400>87
atg gca cac caa gtc ctc ttt cag ggg ttc aac tgg gag tcg tgg aag    48
Met Ala His Gln Val Leu Phe Gln Gly Phe Asn Trp Glu Ser Trp Lys
1               5                   10                  15
cag agc ggc ggg tgg tac aac atg atg atg ggc aag gtc gac gac atc    96
Gln Ser Gly Gly Trp Tyr Asn Met Met Met Gly Lys Val Asp Asp Ile
            20                  25                  30
gcc gct gcc gga gtc acc cac gtc tgg ctg cca ccg ccg tcg cac tcc   144
Ala Ala Ala Gly Val Thr His Val Trp Leu Pro Pro Pro Ser His Ser
        35                  40                  45
gtc tcc aac gaa ggt tac atg cct ggt cgg ctg tac gac atc gac gcg   192
Val Ser Asn Glu Gly Tyr Met Pro Gly Arg Leu Tyr Asp Ile Asp Ala
    50                  55                  60
tcc aag tac ggc aac gcg gcg gag ctc aag tcg ctc atc ggc gcg ctc   240
Ser Lys Tyr Gly Asn Ala Ala Glu Leu Lys Ser Leu Ile Gly Ala Leu
65                  70                  75                  80
cac ggc aag ggc gtg cag gcc atc gcc gac atc gtc atc aac cac cgc   288
His Gly Lys Gly Val Gln Ala Ile Ala Asp Ile Val Ile Asn His Arg
                85                  90                  95
tgc gcc gac tac aag gat agc cgc ggc atc tac tgc atc ttc gag ggc   336
Cys Ala Asp Tyr Lys Asp Ser Arg Gly Ile Tyr Cys Ile Phe Glu Gly
            100                 105                 110
ggc acc tcc gac ggc cgc ctc gac tgg ggc ccc cac atg atc tgt cgc   384
Gly Thr Ser Asp Gly Arg Leu Asp Trp Gly Pro His Met Ile Cys Arg
        115                 120                 125
gac gac acc aaa tac tcc gat ggc acc gca aac ctc gac acc gga gcc   432
Asp Asp Thr Lys Tyr Ser Asp Gly Thr Ala Asn Leu Asp Thr Gly Ala
    130                 135                 140
gac ttc gcc gcc gcg ccc gac atc gac cac ctc aac gac cgg gtc cag   480
Asp Phe Ala Ala Ala Pro Asp Ile Asp His Leu Asn Asp Arg Val Gln
145                 150                 155                 160
cgc gag ctc aag gag tgg ctc ctc tgg ctc aag agc gac ctc ggc ttc   528
Arg Glu Leu Lys Glu Trp Leu Leu Trp Leu Lys Ser Asp Leu Gly Phe
                165                 170                 175
gac gcg tgg cgc ctt gac ttc gcc agg ggc tac tcg ccg gag atg gcc   576
Asp Ala Trp Arg Leu Asp Phe Ala Arg Gly Tyr Ser Pro Glu Met Ala
            180                 185                 190
aag gtg tac atc gac ggc aca tcc ccg agc ctc gcc gtg gcc gag gtg   624
Lys Val Tyr Ile Asp Gly Thr Ser Pro Ser Leu Ala Val Ala Glu Val
        195                 200                 205
tgg gac aat atg gcc acc ggc ggc gac ggc aag ccc aac tac gac cag   672
Trp Asp Asn Met Ala Thr Gly Gly Asp Gly Lys Pro Asn Tyr Asp Gln
    210                 215                 220
gac gcg cac cgg cag aat ctg gtg aac tgg gtg gac aag gtg ggc ggc   720
Asp Ala His Arg Gln Asn Leu Val Asn Trp Val Asp Lys Val Gly Gly
225                 230                 235                 240
gcg gcc tcg gca ggc atg gtg ttc gac ttc acg acc aaa ggg ata ctg   768
Ala Ala Ser Ala Gly Met Val Phe Asp Phe Thr Thr Lys Gly Ile Leu
                245                 250                 255
aac gct gcc gtg gag ggc gag ctg tgg agg ctg atc gac ccg cag ggg   816
Asn Ala Ala Val Glu Gly Glu Leu Trp Arg Leu Ile Asp Pro Gln Gly
            260                 265                 270
aag gcc ccc ggc gtg atg gga tgg tgg ccg gcc aag gcc gtc acc ttc   864
Lys Ala Pro Gly Val Met Gly Trp Trp Pro Ala Lys Ala Val Thr Phe
        275                 280                 285
gtc gac aac cac gat aca ggc tcc acg cag gcc atg tgg cca ttc ccc   912
Val Asp Asn His Asp Thr Gly Ser Thr Gln Ala Met Trp Pro Phe Pro
    290                 295                 300
tcc gac aag gtc atg cag ggc tac gcg tac atc ctc acc cac ccc ggc   960
Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly
305                 310                 315                 320
atc cca tgc atc ttc tac gac cat ttc ttc aac tgg ggg ttt aag gac  1008
Ile Pro Cys Ile Phe Tyr Asp His Phe Phe Asn Trp Gly Phe Lys Asp
                325                 330                 335
cag atc gcg gcg ctg gtg gcg atc agg aag cgc aac ggc atc acg gcg  1056
Gln Ile Ala Ala Leu Val Ala Ile Arg Lys Arg Asn Gly Ile Thr Ala
            340                 345                 350
acg agc gct ctg aag atc ctc atg cac gaa gga gat gcc tac gtc gcc  1104
Thr Ser Ala Leu Lys Ile Leu Met His Glu Gly Asp Ala Tyr Val Ala
        355                 360                 365
gag ata gac ggc aag gtg gtg gtg aag atc ggg tcc agg tac gac gtc  1152
Glu Ile Asp Gly Lys Val Val Val Lys Ile Gly Ser Arg Tyr Asp Val
    370                 375                 380
ggg gcg gtg atc ccg gcc ggg ttc gtg acc tcg gca cac ggc aac gac  1200
Gly Ala Val Ile Pro Ala Gly Phe Val Thr Ser Ala His Gly Asn Asp
385                 390                 395                 400
tac gcc gtc tgg gag aag aac ggt gcc gcg gca aca cta caa cgg agc  1248
Tyr Ala Val Trp Glu Lys Asn Gly Ala Ala Ala Thr Leu Gln Arg Ser
                405                 410                 415
<210>88
<211>416
<212>PRT
<213>Hordeum vulgare
<400>88
Met Ala His Gln Val Leu Phe Gln Gly Phe Asn Trp Glu Ser Trp Lys
1               5                   10                  15
Gln Ser Gly Gly Trp Tyr Asn Met Met Met Gly Lys Val Asp Asp Ile
            20                  25                  30
Ala Ala Ala Gly Val Thr His Val Trp Leu Pro Pro Pro Ser His Ser
        35                  40                  45
Val Ser Asn Glu Gly Tyr Met Pro Gly Arg Leu Tyr Asp Ile Asp Ala
    50                  55                  60
Ser Lys Tyr Gly Asn Ala Ala Glu Leu Lys Ser Leu Ile Gly Ala Leu
65                  70                  75                  80
His Gly Lys Gly Val Gln Ala Ile Ala Asp Ile Val Ile Asn His Arg
                85                  90                  95
Cys Ala Asp Tyr Lys Asp Ser Arg Gly Ile Tyr Cys Ile Phe Glu Gly
            100                 105                 110
Gly Thr Ser Asp Gly Arg Leu Asp Trp Gly Pro His Met Ile Cys Arg
        115                 120                 125
Asp Asp Thr Lys Tyr Ser Asp Gly Thr Ala Asn Leu Asp Thr Gly Ala
    130                 135                 140
Asp Phe Ala Ala Ala Pro Asp Ile Asp His Leu Asn Asp Arg Val Gln
145                 150                 155                 160
Arg Glu Leu Lys Glu Trp Leu Leu Trp Leu Lys Ser Asp Leu Gly Phe
                165                 170                 175
Asp Ala Trp Arg Leu Asp Phe Ala Arg Gly Tyr Ser Pro Glu Met Ala
            180                 185                 190
Lys Val Tyr Ile Asp Gly Thr Ser Pro Ser Leu Ala Val Ala Glu Val
        195                 200                 205
Trp Asp Asn Met Ala Thr Gly Gly Asp Gly Lys Pro Asn Tyr Asp Gln
    210                 215                 220
Asp Ala His Arg Gln Asn Leu Val Asn Trp Val Asp Lys Val Gly Gly
225                 230                 235                 240
Ala Ala Ser Ala Gly Met Val Phe Asp Phe Thr Thr Lys Gly Ile Leu
                245                 250                  255
Asn Ala Ala Val Glu Gly Glu Leu Trp Arg Leu Ile Asp Pro Gln Gly
            260                 265                 270
Lys Ala Pro Gly Val Met Gly Trp Trp Pro Ala Lys Ala Val Thr Phe
        275                 280                 285
Val Asp Asn His Asp Thr Gly Ser Thr Gln Ala Met Trp Pro Phe Pro
    290                 295                 300
Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr Ile Leu Thr His Pro Gly
305                 310                 315                 320
Ile Pro Cys Ile Phe Tyr Asp His Phe Phe Asn Trp Gly Phe Lys Asp
                325                 330                 335
Gln Ile Ala Ala Leu Val Ala Ile Arg Lys Arg Asn Gly Ile Thr Ala
            340                 345                 350
Thr Ser Ala Leu Lys Ile Leu Met His Glu Gly Asp Ala Tyr Val Ala
        355                 360                 365
Glu Ile Asp Gly Lys Val Val Val Lys Ile Gly Ser Arg Tyr Asp Val
    370                 375                 380
Gly Ala Val Ile Pro Ala Gly Phe Val Thr Ser Ala His Gly Asn Asp
385                 390                 395                 400
Tyr Ala Val Trp Glu Lys Asn Gly Ala Ala Ala Thr Leu Gln Arg Ser
                405                 410                 415
<210>89
<211>1401
<212>DNA
<213>人工序列
<220>
<223>Trichoderma reesei β-葡糖苷酶 2
<220>
<221>CDS
<222>(1)..(1401)
<223>Trichoderma reesei β-葡糖苷酶 2
<400>89
atg ttg ccc aag gac ttt cag tgg ggg ttc gcc acg gct gcc tac cag    48
Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln
1               5                   10                  15
atc gag ggc gcc gtc gac cag gac ggc cgc ggc ccc agc atc tgg gac    96
Ile Glu Gly Ala Val Asp Gln Asp Gly Arg G1y Pro Ser Ile Trp Asp
            20                  25                  30
acg ttc tgc gcg cag ccc ggc aag atc gcc gac ggc tcg tcg ggc gtg   144
Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val
        35                  40                  45
acg gcg tgc gac tcg tac aac cgc acg gcc gag gac att gcg ctg ctg   192
Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu
    50                  55                  60
aag tcg ctc ggg gcc aag agc tac cgc ttc tcc atc tcg tgg tcg cgc   240
Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg
65                  70                  75                  80
atc atc ccc gag ggc ggc cgc ggc gat gcc gtc aac cag gcg ggc atc   288
Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile
                85                  90                  95
gac cac tac gtc aag ttc gtc gac gac ctg ctc gac gcc ggc atc acg   336
Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr
            100                 105                 110
ccc ttc atc acc ctc ttc cac tgg gac ctg ccc gag ggc ctg cat cag   384
Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln
        115                 120                 125
cgg tac ggg ggg ctg ctg aac cgc acc gag ttc ccg ctc gac ttt gaa   432
Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu
    130                 135                 140
aac tac gcc cgc gtc atg ttc agg gcg ctg ccc aag gtg cgc aac tgg   480
Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp
145                 150                 155                 160
atc acc ttc aac gag ccg ctg tgc tcg gcc atc ccg ggc tac ggc tcc   528
Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser
                165                 170                 175
ggc acc ttc gcc ccc ggc cgg cag agc acc tcg gag ccg tgg acc gtc   576
Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val
            180                 185                 190
ggc cac aac atc ctc gtc gcc cac ggc cgc gcc gtc aag gcg tac cgc   624
Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg
        195                 200                 205
gac gac ttc aag ccc gcc agc ggc gac ggc cag atc ggc atc gtc ctc   672
Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu
    210                 215                 220
aac ggc gac ttc acc tac ccc tgg gac gcc gcc gac ccg gcc gac aag   720
Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys
225                 230                 235                 240
gag gcg gcc gag cgg cgc ctc gag ttc ttc acg gcc tgg ttc gcg gac   768
Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp
                245                 250                 255
ccc atc tac ttg ggc gac tac ccg gcg tcg atg cgc aag cag ctg ggc   816
Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly
            260                 265                 270
gac cgg ctg ccg acc ttt acg ccc gag gag cgc gcc ctc gtc cac ggc   864
Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly
        275                 280                 285
tcc aac gac ttt tac ggc atg aac cac tac acg tcc aac tac atc cgc   912
Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg
    290                 295                 300
cac cgc agc tcg ccc gcc tcc gcc gac gac acc gtc ggc aac gtc gac   960
His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp
305                 310                 315                 320
gtg ctc ttc acc aac aag cag ggc aac tgc atc ggc ccc gag acg cag  1008
Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln
                325                 330                 335
tcc ccc tgg ctg cgc ccc tgt gcc gcc ggc ttc cgc gac ttc ctg gtg  1056
Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val
            340                 345                 350
tgg atc agc aag agg tac ggc tac ccg ccc atc tac gtg acg gag aac  1104
Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn
        355                 360                 365
ggc acg agc atc aag ggc gag agc gac ttg ccc aag gag aag att ctc  1152
Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu
    370                 375                 380
gaa gat gac ttc agg gtc aag tac tat aac gag tac atc cgt gcc atg  1200
Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met
385                 390                 395                 400
gtt acc gcc gtg gag ctg gac ggg gtc aac gtc aag ggg tac ttt gcc  1248
Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala
                405                 410                 415
tgg tcg ctc atg gac aac ttt gag tgg gcg gac ggc tac gtg acg agg  1296
Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg
            420                 425                 430
ttt ggg gtt acg tat gtg gat tat gag aat ggg cag aag cgg ttc ccc  1344
Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro
        435                 440                 445
aag aag agc gca aag agc ttg aag ccg ctg ttt gac gag ctg att gcg  1392
Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala
    450                 455                 460
gcg gcg tga                                                      1401
Ala Ala
465
<210>90
<211>466
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>90
Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln
1               5                   10                  15
Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp
            20                  25                  30
Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val
        35                  40                  45
Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu
    50                  55                  60
Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg
65                  70                  75                  80
Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile
                85                  90                  95
Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr
            100                 105                 110
Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln
        115                 120                 125
Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu
    130                 135                 140
Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp
145                 150                 155                 160
Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser
                165                 170                 175
Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val
            180                 185                 190
Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg
        195                 200                 205
Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu
    210                 215                 220
Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys
225                 230                 235                 240
Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp
                245                 250                 255
Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly
            260                 265                 270
Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly
        275                 280                 285
Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg
    290                 295                 300
His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp
305                 310                 315                 320
Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln
                325                 330                 335
Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val
            340                 345                 350
Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn
        355                 360                 365
Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu
    370                 375                 380
Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met
385                 390                 395                 400
Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala
                405                 410                 415
Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg
            420                 425                 430
Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro
        435                 440                 445
Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala
    450                 455                 460
Ala Ala
465
<210>91
<211>2103
<212>DNA
<213>人工序列
<220>
<223>Trichoderma reesei β-葡糖苷酶 D
<220>
<221>CDS
<222>(1)..(2103)
<223>Trichoderma reesei β-葡糖苷酶 D
<400>91
atg att ctc ggc tgt gaa agc aca ggt gtc atc tct gcc gtc aaa cac    48
Met Ile Leu Gly Cys Glu Ser Thr Gly Val Ile Ser Ala Val Lys His
1               5                   10                  15
ttt gtc gcc aac gac cag gag cac gag cgg cga gcg gtc gac tgt ctc    96
Phe Val Ala Asn Asp Gln Glu His Glu Arg Arg Ala Val Asp Cys Leu
            20                  25                  30
atc acc cag cgg gct ctc cgg gag gtc tat ctg cga ccc ttc cag atc   144
Ile Thr Gln Arg Ala Leu Arg Glu Val Tyr Leu Arg Pro Phe Gln Ile
        35                  40                  45
gta gcc cga gat gca agg ccc ggc gca ttg atg aca tcc tac aac aag   192
Val Ala Arg Asp Ala Arg Pro Gly Ala Leu Met Thr Ser Tyr Asn Lys
    50                  55                  60
gtc aat ggc aag cac gtc gct gac agc gcc gag ttc ctt cag ggc att   240
Val Asn Gly Lys His Val Ala Asp Ser Ala Glu Phe Leu Gln Gly Ile
65                  70                  75                  80
ctc cgg act gag tgg aat tgg gac cct ctc att gtc agc gac tgg tac   288
Leu Arg Thr Glu Trp Asn Trp Asp Pro Leu Ile Val Ser Asp Trp Tyr
                85                  90                  95
ggc acc tac acc act att gat gcc atc aaa gcc ggc ctt gat ctc gag   336
Gly Thr Tyr Thr Thr Ile Asp Ala Ile Lys Ala Gly Leu Asp Leu Glu
            100                 105                 110
atg ccg ggc gtt tca cga tat cgc ggc aaa tac atc gag tct gct ctg   384
Met Pro Gly Val Ser Arg Tyr Arg Gly Lys Tyr Ile Glu Ser Ala Leu
        115                 120                 125
cag gcc cgt ttg ctg aag cag tcc act atc gat gag cgc gct cgc cgc   432
Gln Ala Arg Leu Leu Lys Gln Ser Thr Ile Asp Glu Arg Ala Arg Arg
    130                 135                 140
gtg ctc agg ttc gcc cag aag gcc agc cat ctc aag gtc tcc gag gta   480
Val Leu Arg Phe Ala Gln Lys Ala Ser His Leu Lys Val Ser Glu Val
145                 150                 155                 160
gag caa ggc cgt gac ttc cca gag gat cgc gtc ctc aac cgt cag atc   528
Glu Gln Gly Arg Asp Phe Pro Glu Asp Arg Val Leu Asn Arg Gln Ile
                165                 170                 175
tgc ggc agc agc att gtc cta ctg aag aat gag aac tcc atc tta cct   576
Cys Gly Ser Ser Ile Val Leu Leu Lys Asn Glu Asn Ser Ile Leu Pro
            180                 185                 190
ctc ccc aag tcc gtc aag aag gtc gcc ctt gtt ggt tcc cac gtg cgt   624
Leu Pro Lys Ser Val Lys Lys Val Ala Leu Val Gly Ser His Val Arg
        195                 200                 205
cta ccg gct atc tcg gga gga ggc agc gcc tct ctt gtc cct tac tat   672
Leu Pro Ala Ile Ser Gly Gly Gly Ser Ala Ser Leu Val Pro Tyr Tyr
    210                 215                 220
gcc ata tct cta tac gat gcc gtc tct gag gta cta gcc ggt gcc acg   720
Ala Ile Ser Leu Tyr Asp Ala Val Ser Glu Val Leu Ala Gly Ala Thr
225                 230                 235                 240
atc acg cac gag gtc ggt gcc tat gcc cac caa atg ctg ccc gtc atc   768
Ile Thr His Glu Val Gly Ala Tyr Ala His Gln Met Leu Pro Val Ile
                245                 250                 255
gac gca atg atc agc aac gcc gta atc cac ttc tac aac gac ccc atc   816
Asp Ala Met Ile Ser Asn Ala Val Ile His Phe Tyr Asn Asp Pro Ile
            260                 265                 270
gat gtc aaa gac aga aag ctc ctt ggc agt gag aac gta tcg tcg aca   864
Asp Val Lys Asp Arg Lys Leu Leu Gly Ser Glu Asn Val Ser Ser Thr
        275                 280                 285
tcg ttc cag ctc atg gat tac aac aac atc cca acg ctc aac aag gcc   912
Ser Phe Gln Leu Met Asp Tyr Asn Asn Ile Pro Thr Leu Asn Lys Ala
    290                 295                 300
atg ttc tgg ggt act ctc gtg ggc gag ttt atc cct acc gcc acg gga   960
Met Phe Trp Gly Thr Leu Val Gly Glu Phe Ile Pro Thr Ala Thr Gly
305                 310                 315                 320
att tgg gaa ttt ggc ctc agt gtc ttt ggc act gcc gac ctt tat att  1008
Ile Trp Glu Phe Gly Leu Ser Val Phe Gly Thr Ala Asp Leu Tyr Ile
                325                 330                 335
gat aat gag ctc gtg att gaa aat aca aca cat cag acg cgt gga acc  1056
Asp Asn Glu Leu Val Ile Glu Asn Thr Thr His Gln Thr Arg Gly Thr
            340                 345                 350
gcc ttt ttc gga aag gga acg acg gaa aaa gtc gct acc agg agg atg  1104
Ala Phe Phe Gly Lys Gly Thr Thr Glu Lys Val Ala Thr Arg Arg Met
        355                 360                 365
gtg gcc ggc agc acc tac aag ctg cgt ctc gag ttt ggg tct gcc aac  1152
Val Ala Gly Ser Thr Tyr Lys Leu Arg Leu Glu Phe Gly Ser Ala Asn
    370                 375                 380
acg acc aag atg gag acg acc ggt gtt gtc aac ttt ggc ggc ggt gcc  1200
Thr Thr Lys Met Glu Thr Thr Gly Val Val Asn Phe Gly Gly Gly Ala
385                 390                 395                 400
gta cac ctg ggt gcc tgt ctc aag gtc gac cca cag gag atg att gcg  1248
Val His Leu Gly Ala Cys Leu Lys Val Asp Pro Gln Glu Met Ile Ala
                405                 410                 415
cgg gcc gtc aag gcc gca gcc gat gcc gac tac acc atc atc tgc acg  1296
Arg Ala Val Lys Ala Ala Ala Asp Ala Asp Tyr Thr Ile Ile Cys Thr
            420                 425                 430
gga ctc agc ggc gag tgg gag tct gag ggt ttt gac cgg cct cac atg  1344
Gly Leu Ser Gly Glu Trp Glu Ser Glu Gly Phe Asp Arg Pro His Met
        435                 440                 445
gac ctg ccc cct ggt gtg gac acc atg atc tcg caa gtt ctt gac gcc  1392
Asp Leu Pro Pro Gly Val Asp Thr Met Ile Ser Gln Val Leu Asp Ala
    450                 455                 460
gct ccc aat gct gta gtc gtc aac cag tca ggc acc cca gtg aca atg  1440
Ala Pro Asn Ala Val Val Val Asn Gln Ser Gly Thr Pro Val Thr Met
465                 470                 475                 480
agc tgg gct cat aaa gca aag gcc att gtg cag gct tgg tat ggt ggt  1488
Ser Trp Ala His Lys Ala Lys Ala Ile Val Gln Ala Trp Tyr Gly Gly
                485                 490                 495
aac gag aca ggc cac gga atc tcc gat gtg ctc ttt ggc aac gtc aac  1536
Asn Glu Thr Gly His Gly Ile Ser Asp Val Leu Phe Gly Asn Val Asn
            500                 505                 510
ccg tcg ggg aaa ctc tcc cta tcg tgg cca gtc gat gtg aag cac aac  1584
Pro Ser Gly Lys Leu Ser Leu Ser Trp Pro Val Asp Val Lys His Asn
        515                 520                 525
cca gca tat ctc aac tac gcc agc gtt ggt gga cgg gtc ttg tat ggc  1632
Pro Ala Tyr Leu Asn Tyr Ala Ser Val Gly Gly Arg Val Leu Tyr Gly
    530                 535                 540
gag gat gtt tac gtt ggc tac aag ttc tac gac aaa acg gag agg gag  1680
Glu Asp Val Tyr Val Gly Tyr Lys Phe Tyr Asp Lys Thr Glu Arg Glu
545                 550                 555                 560
gtt ctg ttt cct ttt ggg cat ggc ctg tct tac gct acc ttc aag ctc  1728
Val Leu Phe Pro Phe Gly His Gly Leu Ser Tyr Ala Thr Phe Lys Leu
                565                 570                 575
cca gat tct acc gtg agg acg gtc ccc gaa acc ttc cac ccg gac cag  1776
Pro Asp Ser Thr Val Arg Thr Val Pro Glu Thr Phe His Pro Asp Gln
            580                 585                 590
ccc aca gta gcc att gtc aag atc aag aac acg agc agt gtc ccg ggc  1824
Pro Thr Val Ala Ile Val Lys Ile Lys Asn Thr Ser Ser Val Pro Gly
        595                 600                 605
gcc cag gtc ctg cag tta tac att tcg gcc cca aac tcg cct aca cat  1872
Ala Gln Val Leu Gln Leu Tyr Ile Ser Ala Pro Asn Ser Pro Thr His
    610                 615                 620
cgc ccg gtc aag gag ctg cac gga ttc gaa aag gtg tat ctt gaa gct  1920
Arg Pro Val Lys Glu Leu His Gly Phe Glu Lys Val Tyr Leu Glu Ala
625                 630                 635                 640
ggc gag gag aag gag gta caa ata ccc att gac cag tac gct act agc  1968
Gly Glu Glu Lys Glu Val Gln Ile Pro Ile Asp Gln Tyr Ala Thr Ser
                645                 650                 655
ttc tgg gac gag att gag agc atg tgg aag agc gag agg ggc att tat  2016
Phe Trp Asp Glu Ile Glu Ser Met Trp Lys Ser Glu Arg Gly Ile Tyr
            660                 665                 670
gat gtg ctt gta gga ttc tog agt cag gaa atc tcg ggc aag ggg aag  2064
Asp Val Leu Val Gly Phe Ser Ser Gln Glu Ile Ser Gly Lys Gly Lys
        675                 680                 685
ctg att gtg cct gaa acg cga ttc tgg atg ggg ctg tag              2103
Leu Ile Val Pro Glu Thr Arg Phe Trp Met Gly Leu
    690                 695                 700
<210>92
<211>700
<212>PRT
<213>人工序列
<220>
<223>合成的构建体
<400>92
Met Ile Leu Gly Cys Glu Ser Thr Gly Val Ile Ser Ala Val Lys His
1               5                   10                  15
Phe Val Ala Asn Asp Gln Glu His Glu Arg Arg Ala Val Asp Cys Leu
            20                  25              30
Ile Thr Gln Arg Ala Leu Arg Glu Val Tyr Leu Arg Pro Phe Gln Ile
        35                  40                  45
Val Ala Arg Asp Ala Arg Pro Gly Ala Leu Met Thr Ser Tyr Asn Lys
    50                  55                  60
Val Asn Gly Lys His Val Ala Asp Ser Ala Glu Phe Leu Gln Gly Ile
65                  70                  75                  80
Leu Arg Thr Glu Trp Asn Trp Asp Pro Leu Ile Val Ser Asp Trp Tyr
                85                  90                  95
Gly Thr Tyr Thr Thr Ile Asp Ala Ile Lys Ala Gly Leu Asp Leu Glu
            100                 105                 110
Met Pro Gly Val Ser Arg Tyr Arg Gly Lys Tyr Ile Glu Ser Ala Leu
        115                 120                 125
Gln Ala Arg Leu Leu Lys Gln Ser Thr Ile Asp Glu Arg Ala Arg Arg
    130                 135                 140
Val Leu Arg Phe Ala Gln Lys Ala Ser His Leu Lys Val Ser Glu Val
145                 150                 155                 160
Glu Gln Gly Arg Asp Phe Pro Glu Asp Arg Val Leu Asn Arg Gln Ile
                165                 170                 175
Cys Gly Ser Ser Ile Val Leu Leu Lys Asn Glu Asn Ser Ile Leu Pro
            180                 185                 190
Leu Pro Lys Ser Val Lys Lys Val Ala Leu Val Gly Ser His Val Arg
        195                 200                 205
Leu Pro Ala Ile Ser Gly Gly Gly Ser Ala Ser Leu Val Pro Tyr Tyr
    210                 215                 220
Ala Ile Ser Leu Tyr Asp Ala Val Ser Glu Val Leu Ala Gly Ala Thr
225                 230                 235                 240
Ile Thr His Glu Val Gly Ala Tyr Ala His Gln Met Leu Pro Val Ile
                245                 250                 255
Asp Ala Met Ile Ser Asn Ala Val Ile His Phe Tyr Asn Asp Pro Ile
            260                 265                 270
Asp Val Lys Asp Arg Lys Leu Leu Gly Ser Glu Asn Val Ser Ser Thr
        275                 280                 285
Ser Phe Gln Leu Met Asp Tyr Asn Asn Ile Pro Thr Leu Asn Lys Ala
    290                 295                 300
Met Phe Trp Gly Thr Leu Val Gly Glu Phe Ile Pro Thr Ala Thr Gly
305                 310                 315                 320
Ile Trp Glu Phe Gly Leu Ser Val Phe Gly Thr Ala Asp Leu Tyr Ile
                325                 330                 335
Asp Asn Glu Leu Val Ile Glu Asn Thr Thr His Gln Thr Arg Gly Thr
            340                 345                 350
Ala Phe Phe Gly Lys Gly Thr Thr Glu Lys Val Ala Thr Arg Arg Met
        355                 360                 365
Val Ala Gly Ser Thr Tyr Lys Leu Arg Leu Glu Phe Gly Ser Ala Asn
    370                 375                 380
Thr Thr Lys Met Glu Thr Thr Gly Val Val Asn Phe Gly Gly Gly Ala
385                 390                 395                 400
Val His Leu Gly Ala Cys Leu Lys Val Asp Pro Gln Glu Met Ile Ala
                405                 410                 415
Arg Ala Val Lys Ala Ala Ala Asp Ala Asp Tyr Thr Ile Ile Cys Thr
            420                 425                 430
Gly Leu Ser Gly Glu Trp Glu Ser Glu Gly Phe Asp Arg Pro His Met
        435                 440                 445
Asp Leu Pro Pro Gly Val Asp Thr Met Ile Ser Gln Val Leu Asp Ala
    450                 455                 460
Ala Pro Asn Ala Val Val Val Asn Gln Ser Gly Thr Pro Val Thr Met
465                 470                 475                 480
Ser Trp Ala His Lys Ala Lys Ala Ile Val Gln Ala Trp Tyr Gly Gly
                485                 490                 495
Asn Glu Thr Gly His Gly Ile Ser Asp Val Leu Phe Gly Asn Val Asn
            500                 505                 510
Pro Ser Gly Lys Leu Ser Leu Ser Trp Pro Val Asp Val Lys His Asn
        515                 520                 525
Pro Ala Tyr Leu Asn Tyr Ala Ser Val Gly Gly Arg Val Leu Tyr Gly
    530                 535                 540
Glu Asp Val Tyr Val Gly Tyr Lys Phe Tyr Asp Lys Thr Glu Arg Glu
545                 550                 555                 560
Val Leu Phe Pro Phe Gly His Gly Leu Ser Tyr Ala Thr Phe Lys Leu
                565                 570                 575
Pro Asp Ser Thr Val Arg Thr Val Pro Glu Thr Phe His Pro Asp Gln
            580                 585                 590
Pro Thr Val Ala Ile Val Lys Ile Lys Asn Thr Ser Ser Val Pro Gly
        595                 600                 605
Ala Gln Val Leu Gln Leu Tyr Ile Ser Ala Pro Asn Ser Pro Thr His
    610                 615                 620
Arg Pro Val Lys Glu Leu His Gly Phe Glu Lys Val Tyr Leu Glu Ala
625                 630                 635                 640
Gly Glu Glu Lys Glu Val Gln Ile Pro Ile Asp Gln Tyr Ala Thr Ser
                645                 650                 655
Phe Trp Asp Glu Ile Glu Ser Met Trp Lys Ser Glu Arg Gly Ile Tyr
            660                 665                 670
Asp Val Leu Val Gly Phe Ser Ser Gln Glu Ile Ser Gly Lys Gly Lys
        675                 680                 685
Leu Ile Val Pro Glu Thr Arg Phe Trp Met Gly Leu
    690                 695                 700
<210>93
<211>1496
<212>DNA
<213>人工序列
<220>
<223>玉米优化的CBHI
<400>93
tgcagtccgc ctgcaccctc cagtccgaga cccacccgcc gctcacctgg cagaagtgct     60
cctccggcgg cacctgcacc cagcagaccg gctccgtggt gatcgacgcc aactggcgct    120
ggacccacgc caccaactcc tccaccaact gctacgacgg caacacctgg tcctccaccc    180
tctgcccgga caacgagacc tgcgccaaga actgctgcct cgacggcgcc gcctacgcct    240
ccacctacgg cgtgaccacc tccggcaact ccctctccat cggcttcgtg acccagtccg    300
cccagaagaa cgtgggcgcc cgcctctacc tcatggcctc cgacaccacc taccaggagt    360
tcaccctcct cggcaacgag ttctccttcg acgtggacgt gtcccagctc ccgtgcggcc    420
tcaacggcgc cctctacttc gtgtccatgg acgccgacgg cggcgtgtcc aagtacccga    480
ccaacaccgc cggcgccaag tacggcaccg gctactgcga ctcccagtgc ccgcgcgacc    540
tcaagttcat caacggccag gccaacgtgg agggctggga gccgtcctcc aacaacgcca    600
acaccggcat cggcggccac ggctcctgct gctccgagat ggacatctgg gaggccaact    660
ccatctccga ggccctcacc ccgcacccgt gcaccaccgt gggccaggag atctgcgagg    720
gcgacggctg cggcggcacc tactccgaca accgctacgg cggcacctgc gacccggacg    780
gctgcgactg gaacccgtac cgcctcggca acacctcctt ctacggcccg ggctcctcct    840
tcaccctcga caccaccaag aagctcaccg tggtgaccca gttcgagacc tccggcgcca    900
tcaaccgcta ctacgtgcag aacggcgtga ccttccagca gccgaacgcc gagctcggct    960
cctactccgg caacgagctc aacgacgact actgcaccgc cgaggaggcc gagttcggcg   1020
gctcctcctt ctccgacaag ggcggcctca cccagttcaa gaaggccacc tccggcggca   1080
tggtgctcgt gatgtccctc tgggacgact actacgccaa catgctctgg ctcgactcca   1140
cctacccgac caacgagacc tcctccaccc cgggcgccgt gcgcggctcc tgctccacct  1200
cctccggcgt gccggcccag gtggagtccc agtccccgaa cgccaaggtg accttctcca  1260
acatcaagtt cggcccgatc ggctccaccg gcaacccgtc cggcggcaac ccgccgggcg  1320
gcaacccgcc gggcaccacc accacccgcc gcccggccac caccaccggc tcctccccgg  1380
gcccgaccca gtcccactac ggccagtgcg gcggcatcgg ctactccggc ccgaccgtgt  1440
gcgcctccgg caccacctgc caggtgctca acccgtacta ctcccagtgc ctctag      1496
<210>94
<211>1365
<212>DNA
<213>人工序列
<220>
<223>玉米优化的CBHII
<400>94
atggtgccgc tcgaggagcg ccaggcctgc tcctccgtgt ggggccagtg cggcggccag     60
aactggtccg gcccgacctg ctgcgcctcc ggctccacct gcgtgtactc caacgactac    120
tactcccagt gcctcccggg cgccgcctcc tcctcctcct ccacccgcgc cgcctccacc    180
acctcccgcg tgtccccgac cacctcccgc tcctcctccg ccaccccgcc gccgggctcc    240
accaccaccc gcgtgccgcc ggtgggctcc ggcaccgcca cctactccgg caacccgttc    300
gtgggcgtga ccccgtgggc caacgcctac tacgcctccg aggtgtcctc cctcgccatc    360
ccgtccctca ccggcgccat ggccaccgcc gccgccgccg tggccaaggt gccgtccttc    420
atgtggctcg acaccctcga caagaccccg ctcatggagc agaccctcgc cgacatccgc    480
accgccaaca agaacggcgg caactacgcc ggccagttcg tggtgtacga cctcccggac    540
cgcgactgcg ccgccctcgc ctccaacggc gagtactcca tcgccgacgg cggcgtggcc    600
aagtacaaga actacatcga caccatccgc cagatcgtgg tggagtactc cgacatccgc    660
accctcctcg tgatcgagcc ggactccctc gccaacctcg tgaccaacct cggcaccccg    720
aagtgcgcca acgcccagtc cgcctacctc gagtgcatca actacgccgt gacccagctc    780
aacctcccga acgtggccat gtacctcgac gccggccacg ccggctggct cggctggccg    840
gccaaccagg acccggccgc ccagctcttc gccaacgtgt acaagaacgc ctcctccccg    900
cgcgccctcc gcggcctcgc caccaacgtg gccaactaca acggctggaa catcacctcc    960
ccgccgtcct acacccaggg caacgccgtg tacaacgaga agctctacat ccacgccatc   1020
ggcccgctcc tcgccaacca cggctggtcc aacgccttct tcatcaccga ccagggccgc   1080
tccggcaagc agccgaccgg ccagcagcag tggggcgact ggtgcaacgt gatcggcacc  1140
ggcttcggca tccgcccgtc cgccaacacc ggcgactccc tcctcgactc cttcgtgtgg  1200
gtgaagccgg gcggcgagtg cgacggcacc tccgactcct ccgccccgcg cttcgactcc  1260
cactgcgccc tcccggacgc cctccagccg gccccgcagg ccggcgcctg gttccaggcc  1320
tacttcgtgc agctcctcac caacgccaac ccgtccttcc tctag                  1365
<210>95
<211>1317
<212>DNA
<213>人工序列
<220>
<223>玉米优化的EGLI
<400>95
atgcagcagc cgggcacctc caccccggag gtgcacccga agctcaccac ctacaagtgc    60
accaagtccg gcggctgcgt ggcccaggac acctccgtgg tgctcgactg gaactaccgc   120
tggatgcacg acgccaacta caactcctgc accgtgaacg gcggcgtgaa caccaccctc   180
tgcccggacg aggccacctg cggcaagaac tgcttcatcg agggcgtgga ctacgccgcc   240
tccggcgtga ccacctccgg ctcctccctc accatgaacc agtacatgcc gtcctcctcc   300
ggcggctact cctccgtgtc cccgcgcctc tacctcctcg actccgacgg cgagtacgtg   360
atgctcaagc tcaacggcca ggagctctcc ttcgacgtgg acctctccgc cctcccgtgc   420
ggcgagaacg gctccctcta cctctcccag atggacgaga acggcggcgc caaccagtac   480
aacaccgccg gcgccaacta cggctccggc tactgcgacg cccagtgccc ggtgcagacc   540
tggcgcaacg gcaccctcaa cacctcccac cagggcttct gctgcaacga gatggacatc   600
ctcgagggca actcccgcgc caacgccctc accccgcact cctgcaccgc caccgcctgc   660
gactccgccg gctgcggctt caacccgtac ggctccggct acaagtccta ctacggcccg   720
ggcgacaccg tggacacctc caagaccttc accatcatca cccagttcaa caccgacaac   780
ggctccccgt ccggcaacct cgtgtccatc acccgcaagt accagcagaa cggcgtggac   840
atcccgtccg cccagccggg cggcgacacc atctcctcct gcccgtccgc ctccgcctac   900
ggcggcctcg ccaccatggg caaggccctc tcctccggca tggtgctcgt gttctccatc   960
tggaacgaca actcccagta catgaactgg ctcgactccg gcaacgccgg cccgtgctcc  1020
tccaccgagg gcaacccgtc caacaccctc gccaacaacc cgaacaccca cgtggtgttc  1080
tccaacatcc gctggggcga catcggctcc accaccaact ccaccgcccc gccgccgccg  1140
ccggcctcct ccaccacctt ctccaccacc cgccgctcct ccaccacctc ctcctccccg  1200
tcctgcaccc agacccactg gggccagtgc ggcggcatcg gctactccgg ctgcaagacc  1260
tgcacctccg gcaccacctg ccagtactcc aacgactact actcccagtg cctctag     1317
<210>96
<211>1401
<212>DNA
<213>人工序列
<220>
<223>玉米优化的BGLII
<400>96
atgctcccga aggacttcca gtggggcttc gccaccgccg cctaccagat cgagggcgcc     60
gtggaccagg acggccgcgg cccgtccatc tgggacacct tctgcgccca gccgggcaag    120
atcgccgacg gctcctccgg cgtgaccgcc tgcgactcct acaaccgcac cgccgaggac    180
atcgccctcc tcaagtccct cggcgccaag tcctaccgct tctccatctc ctggtcccgc    240
atcatcccgg agggcggccg cggcgacgcc gtgaaccagg ccggcatcga ccactacgtg    300
aagttcgtgg acgacctcct cgacgccggc atcaccccgt tcatcaccct cttccactgg    360
gacctcccgg agggcctcca ccagcgctac ggcggcctcc tcaaccgcac cgagttcccg    420
ctcgacttcg agaactacgc ccgcgtgatg ttccgcgccc tcccgaaggt gcgcaactgg    480
atcaccttca acgagccgct ctgctccgcc atcccgggct acggctccgg caccttcgcc    540
ccgggccgcc agtccacctc cgagccgtgg accgtgggcc acaacatcct cgtggcccac    600
ggccgcgccg tgaaggccta ccgcgacgac ttcaagccgg cctccggcga cggccagatc    660
ggcatcgtgc tcaacggcga cttcacctac ccgtgggacg ccgccgaccc ggccgacaag    720
gaggccgccg agcgccgcct cgagttcttc accgcctggt tcgccgaccc gatctacctc    780
ggcgactacc cggcctccat gcgcaagcag ctcggcgacc gcctcccgac cttcaccccg    840
gaggagcgcg ccctcgtgca cggctccaac gacttctacg gcatgaacca ctacacctcc    900
aactacatcc gccaccgctc ctccccggcc tccgccgacg acaccgtggg caacgtggac    960
gtgctcttca ccaacaagca gggcaactgc atcggcccgg agacccagtc cccgtggctc   1020
cgcccgtgcg ccgccggctt ccgcgacttc ctcgtgtgga tctccaagcg ctacggctac   1080
ccgccgatct acgtgaccga gaacggcacc tccatcaagg gcgagtccga cctcccgaag   1140
gagaagatcc tcgaggacga cttccgcgtg aagtactaca acgagtacat ccgcgccatg   1200
gtgaccgccg tggagctcga cggcgtgaac gtgaagggct acttcgcctg gtccctcatg   1260
gacaacttcg agtgggccga cggctacgtg acccgcttcg gcgtgaccta cgtggactac  1320
gagaacggcc agaagcgctt cccgaagaag tccgccaagt ccctcaagcc gctcttcgac  1380
gagctcatcg ccgccgccta g                                            1401
<210>97
<211>2103
<212>DNA
<213>人工序列
<220>
<223>玉米优化的CEL3D
<400>97
atgatcctcg gctgcgagtc caccggcgtg atctccgccg tgaagcactt cgtggccaac     60
gaccaggagc acgagcgccg cgccgtggac tgcctcatca cccagcgcgc cctccgcgag    120
gtgtacctcc gcccgttcca gatcgtggcc cgcgacgccc gcccgggcgc cctcatgacc    180
tcctacaaca aggtgaacgg caagcacgtg gccgactccg ccgagttcct ccagggcatc    240
ctccgcaccg agtggaactg ggacccgctc atcgtgtccg actggtacgg cacctacacc    300
accatcgacg ccatcaaggc cggcctcgac ctcgagatgc cgggcgtgtc ccgctaccgc    360
ggcaagtaca tcgagtccgc cctccaggcc cgcctcctca agcagtccac catcgacgag    420
cgcgcccgcc gcgtgctccg cttcgcccag aaggcctccc acctcaaggt gtccgaggtg    480
gagcagggcc gcgacttccc ggaggaccgc gtgctcaacc gccagatctg cggctcctcc    540
atcgtgctcc tcaagaacga gaactccatc ctcccgctcc cgaagtccgt gaagaaggtg    600
gccctcgtgg gctcccacgt gcgcctcccg gccatctccg gcggcggctc cgcctccctc    660
gtgccgtact acgccatctc cctctacgac gccgtgtccg aggtgctcgc cggcgccacc    720
atcacccacg aggtgggcgc ctacgcccac cagatgctcc cggtgatcga cgccatgatc    780
tccaacgccg tgatccactt ctacaacgac ccgatcgacg tgaaggaccg caagctcctc    840
ggctccgaga acgtgtcctc cacctccttc cagctcatgg actacaacaa catcccgacc    900
ctcaacaagg ccatgttctg gggcaccctc gtgggcgagt tcatcccgac cgccaccggc    960
atctgggagt tcggcctctc cgtgttcggc accgccgacc tctacatcga caacgagctc   1020
gtgatcgaga acaccaccca ccagacccgc ggcaccgcct tcttcggcaa gggcaccacc   1080
gagaaggtgg ccacccgccg catggtggcc ggctccacct acaagctccg cctcgagttc   1140
ggctccgcca acaccaccaa gatggagacc accggcgtgg tgaacttcgg cggcggcgcc   1200
gtgcacctcg gcgcctgcct caaggtggac ccgcaggaga tgatcgcccg cgccgtgaag   1260
gccgccgccg acgccgacta caccatcatc tgcaccggcc tctccggcga gtgggagtcc  1320
gagggcttcg accgcccgca catggacctc ccgccgggcg tggacaccat gatctcccag  1380
gtgctcgacg ccgccccgaa cgccgtggtg gtgaaccagt ccggcacccc ggtgaccatg  1440
tcctgggccc acaaggccaa ggccatcgtg caggcctggt acggcggcaa cgagaccggc  1500
cacggcatct ccgacgtgct cttcggcaac gtgaacccgt ccggcaagct ctccctctcc  1560
tggccggtgg acgtgaagca caacccggcc tacctcaact acgcctccgt gggcggccgc  1620
gtgctctacg gcgaggacgt gtacgtgggc tacaagttct acgacaagac cgagcgcgag  1680
gtgctcttcc cgttcggcca cggcctctcc tacgccacct tcaagctccc ggactccacc  1740
gtgcgcaccg tgccggagac cttccacccg gaccagccga ccgtggccat cgtgaagatc  1800
aagaacacct cctccgtgcc gggcgcccag gtgctccagc tctacatctc cgccccgaac  1860
tccccgaccc accgcccggt gaaggagctc cacggcttcg agaaggtgta cctcgaggcc  1920
ggcgaggaga aggaggtgca gatcccgatc gaccagtacg ccacctcctt ctgggacgag  1980
atcgagtcca tgtggaagtc cgagcgcggc atctacgacg tgctcgtggg cttctcctcc  2040
caggagatct ccggcaaggg caagctcatc gtgccggaga cccgcttctg gatgggcctc  2100
tag                                                                2103
<210>98
<211>420
<212>DNA
<213>玉蜀黍
<220>
<223>Q蛋白启动子
<400>98
gggctggtaa attacttggg agcaatggta tgcaaatcct ttgcatgtac gcaaaactag     60
ctagttgtca caagttgtat atcgattcgt cgcgtttcaa caactcatgc aacattacaa    120
acaagtaaca caatattaca aagttagttt catacaaagc aagaaaagga caataatact    180
tgacatgtaa agtgaagctt attatacttc ctaatccaac acaaaacaaa aaaaagttgc    240
acaaaggtcc aaaaatccac atcaaccatt aacctatacg taaagtgagt gatgagtcac    300
attatccaac aaatgtttat caatgtggta tcatacaagc attgacatcc cataaatgca    360
agaaattgtg ccaacaaagc tataagtaac cctcatatgt atttgcactc atgcatcaca    420
<210>99
<211>1188
<212>DNA
<213>人工序列
<220>
<223>合成的阿魏酸酯酶
<400>99
atggccgcct ccctcccgac catgccgccg tccggctacg accaggtgcg caacggcgtg     60
ccgcgcggcc aggtggtgaa catctcctac ttctccaccg ccaccaactc cacccgcccg    120
gcccgcgtgt acctcccgcc gggctactcc aaggacaaga agtactccgt gctctacctc    180
ctccacggca tcggcggctc cgagaacgac tggttcgagg gcggcggccg cgccaacgtg    240
atcgccgaca acctcatcgc cgagggcaag atcaagccgc tcatcatcgt gaccccgaac    300
accaacgccg ccggcccggg catcgccgac ggctacgaga acttcaccaa ggacctcctc    360
aactccctca tcccgtacat cgagtccaac tactccgtgt acaccgaccg cgagcaccgc    420
gccatcgccg gcctctctat gggcggcggc cagtccttca acatcggcct caccaacctc    480
gacaagttcg cctacatcgg cccgatctcc gccgccccga acacctaccc gaacgagcgc    540
ctcttcccgg acggcggcaa ggccgcccgc gagaagctca agctcctctt catcgcctgc    600
ggcaccaacg actccctcat cggcttcggc cagcgcgtgc acgagtactg cgtggccaac    660
aacatcaacc acgtgtactg gctcatccag ggcggcggcc acgacttcaa cgtgtggaag    720
ccgggcctct ggaacttcct ccagatggcc gacgaggccg gcctcacccg cgacggcaac    780
accccggtgc cgaccccgtc cccgaagccg gccaacaccc gcatcgaggc cgaggactac    840
gacggcatca actcctcctc catcgagatc atcggcgtgc cgccggaggg cggccgcggc    900
atcggctaca tcacctccgg cgactacctc gtgtacaagt ccatcgactt cggcaacggc    960
gccacctcct tcaaggccaa ggtggccaac gccaacacct ccaacatcga gcttcgcctc   1020
aacggcccga acggcaccct catcggcacc ctctccgtga agtccaccgg cgactggaac   1080
acctacgagg agcagacctg ctccatctcc aaggtgaccg gcatcaacga cctctacctc   1140
gtgttcaagg gcccggtgaa catcgactgg ttcaccttcg gcgtgtag                1188
<210>100
<211>395
<212>PRT
<213>人工序列
<220>
<223>合成的阿魏酸酯酶
<400>100
Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val
1               5                   10                  15
Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser
            20                  25                  30
Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly
        35                  40                  45
Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile
    50                  55                  60
Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val
65                  70                  75                  80
Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile
                85                  90                  95
Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr
            100                 105                 110
Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu
        115                 120                 125
Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly
    130                 135                 140
Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu
145                 150                 155                 160
Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr
                165                 170                 175
Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys
            180                 185                 190
Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly
        195                 200                 205
Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His
    210                 215                 220
Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys
225                 230                 235                 240
Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr
                245                 250                 255
Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn
            260                 265                 270
Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile
        275                 280                 285
Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile
    290                 295                 300
Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly
305                 310                 315                 320
Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile
                325                 330                 335
Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser
            340                 345                 350
Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser
        355                 360                 365
Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly
    370                 375                 380
Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val
385                 390                 395
<210>101
<211>1188
<212>DNA
<213>人工序列
<220>
<223>质粒13036
<400>101
atggccgcct ccctcccgac catgccgccg tccggctacg accaggtgcg caacggcgtg     60
ccgcgcggcc aggtggtgaa catctcctac ttctccaccg ccaccaactc cacccgcccg    120
gcccgcgtgt acctcccgcc gggctactcc aaggacaaga agtactccgt gctctacctc    180
ctccacggca tcggcggctc cgagaacgac tggttcgagg gcggcggccg cgccaacgtg    240
atcgccgaca acctcatcgc cgagggcaag atcaagccgc tcatcatcgt gaccccgaac    300
accaacgccg ccggcccggg catcgccgac ggctacgaga acttcaccaa ggacctcctc    360
aactccctca tcccgtacat cgagtccaac tactccgtgt acaccgaccg cgagcaccgc    420
gccatcgccg gcctctctat gggcggcggc cagtccttca acatcggcct caccaacctc    480
gacaagttcg cctacatcgg cccgatctcc gccgccccga acacctaccc gaacgagcgc    540
ctcttcccgg acggcggcaa ggccgcccgc gagaagctca agctcctctt catcgcctgc    600
ggcaccaacg actccctcat cggcttcggc cagcgcgtgc acgagtactg cgtggccaac    660
aacatcaacc acgtgtactg gctcatccag ggcggcggcc acgacttcaa cgtgtggaag    720
ccgggcctct ggaacttcct ccagatggcc gacgaggccg gcctcacccg cgacggcaac    780
accccggtgc cgaccccgtc cccgaagccg gccaacaccc gcatcgaggc cgaggactac    840
gacggcatca actcctcctc catcgagatc atcggcgtgc cgccggaggg cggccgcggc    900
atcggctaca tcacctccgg cgactacctc gtgtacaagt ccatcgactt cggcaacggc    960
gccacctcct tcaaggccaa ggtggccaac gccaacacct ccaacatcga gcttcgcctc   1020
aacggcccga acggcaccct catcggcacc ctctccgtga agtccaccgg cgactggaac   1080
acctacgagg agcagacctg ctccatctcc aaggtgaccg gcatcaacga cctctacctc   1140
gtgttcaagg gcccggtgaa catcgactgg ttcaccttcg gcgtgtag                1188
<210>102
<211>395
<212>PRT
<213>人工序列
<220>
<223>质粒13036
<400>102
Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val
1               5                   10                  15
Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser
            20                  25                  30
Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly
        35                  40                  45
Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile
    50                  55                  60
Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val
65                  70                  75                  80
Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile
                85                  90                  95
Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr
            100                 105                 110
Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu
        115                 120                 125
Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly
    130                 135                 140
Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu
145                 150                 155                 160
Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr
                165                 170                 175
Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys
            180                 185                 190
Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly
        195                 200                 205
Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His
    210                 215                 220
Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys
225                 230                 235                 240
Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr
                245                 250                 255
Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn
            260                 265                 270
Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile
        275                 280                 285
Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile
    290                 295                 300
Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly
305                 310                 315                 320
Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile
                325                 330                 335
Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser
            340                 345                 350
Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser
        355                 360                 365
Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly
    370                 375                 380
Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val
385                 390                 395
<210>103
<211>1245
<212>DNA
<213>人工序列
<220>
<223>质粒13038
<400>103
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg     60
gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg    120
cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc    180
cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc    240
cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc    300
gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc    360
aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac    420
tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc    480
atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac    540
aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc    600
ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc    660
accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac    720
atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg    780
ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc    840
ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac    900
ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc    960
ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc   1020
acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac   1080
ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc   1140
tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg   1200
ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtag                   1245
<210>104
<211>414
<212>PRT
<213>人工序列
<220>
<223>质粒13038 aa
<400>104
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr
            20                  25                  30
Asp Gln Val Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser
        35                  40                  45
Tyr Phe Ser Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu
    50                  55                  60
Pro Pro Gly Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu
65                  70                  75                  80
His Gly Ile Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg
                85                  90                  95
Ala Asn Val Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro
            100                 105                 110
Leu Ile Ile Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala
        115                 120                 125
Asp Gly Tyr Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro
    130                 135                 140
Tyr Ile Glu Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala
145                 150                 155                 160
Ile Ala Gly Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu
                165                 170                 175
Thr Asn Leu Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro
            180                 185                 190
Asn Thr Tyr Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala
        195                 200                 205
Arg Glu Lys Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser
    210                 215                 220
Leu Ile Gly Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn
225                 230                 235                 240
Ile Asn His Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn
                245                 250                 255
Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala
            260                 265                 270
Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys
        275                 280                 285
Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser
    290                 295                 300
Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile
305                 310                 315                 320
Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe
                325                 330                 335
Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr
            340                 345                 350
Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly
        355                 360                 365
Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln
    370                 375                 380
Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val
385                 390                 395                 400
Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val
                405                 410
<210>105
<211>1425
<212>DNA
<213>人工序列
<220>
<223>质粒13039
<400>105
atgctggcgg ctctggccac gtcgcagctc gtcgcaacgc gcgccggcct gggcgtcccg     60
gacgcgtcca cgttccgccg cggcgccgcg cagggcctga ggggggcccg ggcgtcggcg    120
gcggcggaca cgctcagcat gcggaccagc gcgcgcgcgg cgcccaggca ccagcaccag    180
caggcgcgcc gcggggccag gttcccgtcg ctcgtcgtgt gcgccagcgc cggcgccatg    240
gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg    300
cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc    360
cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc    420
cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc    480
gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc    540
aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac    600
tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc    660
atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac    720
aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc    780
ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc    840
accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac    900
atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg    960
ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc   1020
ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac   1080
ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc   1140
ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc   1200
acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac   1260
ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc   1320
tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg   1380
ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtag                   1425
<210>106
<211>474
<212>PRT
<213>人工序列
<220>
<223>质粒13039 aa
<400>106
Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly
1               5                   10                  15
Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly
            20                  25                  30
Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg
        35                  40                  45
Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg
    50                  55                  60
Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met
65                  70                  75                  80
Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr Asp Gln Val Arg
                85                  90                  95
Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser Tyr Phe Ser Thr
            100                 105                 110
Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu Pro Pro Gly Tyr
        115                 120                 125
Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu His Gly Ile Gly
    130                 135                 140
Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg Ala Asn Val Ile
145                 150                 155                 160
Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro Leu Ile Ile Val
                165                 170                 175
Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly Ile Ala Asp Gly Tyr Glu
            180                 185                 190
Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro Tyr Ile Glu Ser
        195                 200                 205
Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala Ile Ala Gly Leu
    210                 215                 220
Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu Thr Asn Leu Asp
225                 230                 235                 240
Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro Asn Thr Tyr Pro
                245                 250                 255
Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala Arg Glu Lys Leu
            260                 265                 270
Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser Leu Ile Gly Phe
        275                 280                 285
Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn Ile Asn His Val
    290                 295                 300
Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn Val Trp Lys Pro
305                 310                 315                 320
Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala Gly Leu Thr Arg
                325                 330                 335
Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys Pro Ala Asn Thr
            340                 345                 350
Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser Ser Ser Ile Glu
        355                 360                 365
Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile Gly Tyr Ile Thr
    370                 375                 380
Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe Gly Asn Gly Ala
385                 390                 395                 400
Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr Ser Asn Ile Glu
                405                 410                 415
Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly Thr Leu Ser Val
            420                 425                 430
Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln Thr Cys Ser Ile
        435                 440                 445
Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val Phe Lys Gly Pro
    450                 455                 460
Val Asn Ile Asp Trp Phe Thr Phe Gly Val
465                 470
<210>107
<211>1263
<212>DNA
<213>人工序列
<220>
<223>质粒13347
<400>107
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccatg     60
gccgcctccc tcccgaccat gccgccgtcc ggctacgacc aggtgcgcaa cggcgtgccg    120
cgcggccagg tggtgaacat ctcctacttc tccaccgcca ccaactccac ccgcccggcc    180
cgcgtgtacc tcccgccggg ctactccaag gacaagaagt actccgtgct ctacctcctc    240
cacggcatcg gcggctccga gaacgactgg ttcgagggcg gcggccgcgc caacgtgatc    300
gccgacaacc tcatcgccga gggcaagatc aagccgctca tcatcgtgac cccgaacacc    360
aacgccgccg gcccgggcat cgccgacggc tacgagaact tcaccaagga cctcctcaac    420
tccctcatcc cgtacatcga gtccaactac tccgtgtaca ccgaccgcga gcaccgcgcc    480
atcgccggcc tctctatggg cggcggccag tccttcaaca tcggcctcac caacctcgac    540
aagttcgcct acatcggccc gatctccgcc gccccgaaca cctacccgaa cgagcgcctc    600
ttcccggacg gcggcaaggc cgcccgcgag aagctcaagc tcctcttcat cgcctgcggc    660
accaacgact ccctcatcgg cttcggccag cgcgtgcacg agtactgcgt ggccaacaac    720
atcaaccacg tgtactggct catccagggc ggcggccacg acttcaacgt gtggaagccg    780
ggcctctgga acttcctcca gatggccgac gaggccggcc tcacccgcga cggcaacacc    840
ccggtgccga ccccgtcccc gaagccggcc aacacccgca tcgaggccga ggactacgac    900
ggcatcaact cctcctccat cgagatcatc ggcgtgccgc cggagggcgg ccgcggcatc    960
ggctacatca cctccggcga ctacctcgtg tacaagtcca tcgacttcgg caacggcgcc   1020
acctccttca aggccaaggt ggccaacgcc aacacctcca acatcgagct tcgcctcaac   1080
ggcccgaacg gcaccctcat cggcaccctc tccgtgaagt ccaccggcga ctggaacacc   1140
tacgaggagc agacctgctc catctccaag gtgaccggca tcaacgacct ctacctcgtg   1200
ttcaagggcc cggtgaacat cgactggttc accttcggcg tgtccgagaa ggacgaactc   1260
tag                                                                 1263
<210>108
<211>420
<212>PRT
<213>人工序列
<220>
<223>质粒13347
<400>108
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Met Ala Ala Ser Leu Pro Thr Met Pro Pro Ser Gly Tyr
            20                  25                  30
Asp Gln Val Arg Asn Gly Val Pro Arg Gly Gln Val Val Asn Ile Ser
        35                  40                  45
Tyr Phe Ser Thr Ala Thr Asn Ser Thr Arg Pro Ala Arg Val Tyr Leu
    50                  55                  60
Pro Pro Gly Tyr Ser Lys Asp Lys Lys Tyr Ser Val Leu Tyr Leu Leu
65                  70                  75                  80
His Gly Ile Gly Gly Ser Glu Asn Asp Trp Phe Glu Gly Gly Gly Arg
                85                  90                  95
Ala Asn Val Ile Ala Asp Asn Leu Ile Ala Glu Gly Lys Ile Lys Pro
            100                 105                 110
Leu Ile Ile Val Thr Pro Asn Thr Asn Ala Ala Gly Pro Gly lle Ala
        115                 120                 125
Asp Gly Tyr Glu Asn Phe Thr Lys Asp Leu Leu Asn Ser Leu Ile Pro
    130                 135                 140
Tyr Ile Glu Ser Asn Tyr Ser Val Tyr Thr Asp Arg Glu His Arg Ala
145                 150                 155                 160
Ile Ala Gly Leu Ser Met Gly Gly Gly Gln Ser Phe Asn Ile Gly Leu
                165                 170                 175
Thr Asn Leu Asp Lys Phe Ala Tyr Ile Gly Pro Ile Ser Ala Ala Pro
            180                 185                 190
Asn Thr Tyr Pro Asn Glu Arg Leu Phe Pro Asp Gly Gly Lys Ala Ala
        195                 200                 205
Arg Glu Lys Leu Lys Leu Leu Phe Ile Ala Cys Gly Thr Asn Asp Ser
    210                 215                 220
Leu Ile Gly Phe Gly Gln Arg Val His Glu Tyr Cys Val Ala Asn Asn
225                 230                 235                 240
Ile Asn His Val Tyr Trp Leu Ile Gln Gly Gly Gly His Asp Phe Asn
                245                 250                 255
Val Trp Lys Pro Gly Leu Trp Asn Phe Leu Gln Met Ala Asp Glu Ala
            260                 265                 270
Gly Leu Thr Arg Asp Gly Asn Thr Pro Val Pro Thr Pro Ser Pro Lys
        275                 280                 285
Pro Ala Asn Thr Arg Ile Glu Ala Glu Asp Tyr Asp Gly Ile Asn Ser
    290                 295                 300
Ser Ser Ile Glu Ile Ile Gly Val Pro Pro Glu Gly Gly Arg Gly Ile
305                 310                 315                 320
Gly Tyr Ile Thr Ser Gly Asp Tyr Leu Val Tyr Lys Ser Ile Asp Phe
                325                 330                 335
Gly Asn Gly Ala Thr Ser Phe Lys Ala Lys Val Ala Asn Ala Asn Thr
            340                 345                 350
Ser Asn Ile Glu Leu Arg Leu Asn Gly Pro Asn Gly Thr Leu Ile Gly
        355                 360                 365
Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn Thr Tyr Glu Glu Gln
    370                 375                 380
Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val
385                 390                 395                 400
Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val Ser Glu
                405                 410                 415
Lys Asp Glu Leu
            420
<210>109
<211>1296
<212>DNA
<213>人工序列
<220>
<223>质粒11267
<400>109
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct     60
gcgcagtccg agccggagct gaagctggag tccgtggtga tcgtgtcccg ccacggcgtg    120
cgcgccccga ccaaggccac ccagctcatg caggacgtga ccccggacgc ctggccgacc    180
tggccggtga agctcggcga gctgaccccg cgcggcggcg agctgatcgc ctacctcggc    240
cactactggc gccagcgcct cgtggccgac ggcctcctcc cgaagtgcgg ctgcccgcag    300
tccggccagg tggccatcat cgccgacgtg gacgagcgca cccgcaagac cggcgaggcc    360
ttcgccgccg gcctcgcccc ggactgcgcc atcaccgtgc acacccaggc cgacacctcc    420
tccccggacc cgctcttcaa cccgctcaag accggcgtgt gccagctcga caacgccaac    480
gtgaccgacg ccatcctgga gcgcgccggc ggctccatcg ccgacttcac cggccactac    540
cagaccgcct tccgcgagct ggagcgcgtg ctcaacttcc cgcagtccaa cctctgcctc    600
aagcgcgaga agcaggacga gtcctgctcc ctcacccagg ccctcccgtc cgagctgaag    660
gtgtccgccg actgcgtgtc cctcaccggc gccgtgtccc tcgcctccat gctcaccgaa    720
atcttcctcc tccagcaggc ccagggcatg ccggagccgg gctggggccg catcaccgac    780
tcccaccagt ggaacaccct cctctccctc cacaacgccc agttcgacct cctccagcgc    840
accccggagg tggcccgctc ccgcgccacc ccgctcctcg acctcatcaa gaccgccctc    900
accccgcacc cgccgcagaa gcaggcctac ggcgtgaccc tcccgacctc cgtgctcttc    960
atcgccggcc acgacaccaa cctcgccaac ctcggcggcg ccctggagct gaactggacc   1020
ctcccgggcc agccggacaa caccccgccg ggcggcgagc tggtgttcga gcgctggcgc   1080
cgcctctccg acaactccca gtggattcag gtgtccctcg tgttccagac cctccagcag   1140
atgcgcgaca agaccccgct ctccctcaac accccgccgg gcgaggtgaa gctcaccctc   1200
gccggctgcg aggagcgcaa cgcccagggc atgtgctccc tcgccggctt cacccagatc   1260
gtgaacgagg cccgcatccc ggcctgctcc ctctaa                             1296
<210>110
<211>431
<212>PRT
<213>人工序列
<220>
<223>质粒11267 aa序列
<400>110
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val
            20                  25                  30
Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln
        35                  40                  45
Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys
    50                  55                  60
Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly
65                  70                  75                  80
His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys
                85                  90                  95
Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu
            100                 105                 110
Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp
        115                 120                 125
Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro
    130                 135                 140
Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn
145                 150                 155                 160
Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe
                165                 170                 175
Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn
            180                 185                 190
Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser
        195                 200                 205
Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp
    210                 215                 220
Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu
225                 230                 235                 240
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly
                245                 250                 255
Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn
            260                 265                 270
Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg
        275                 280                 285
Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro
    290                 295                 300
Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe
305                 310                 315                 320
Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu
                325                 330                 335
Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly
            340                 345                 350
Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp
        355                 360                 365
Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys
    370                 375                 380
Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu
385                 390                 395                 400
Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly
                405                 410                 415
Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu
            420                 425                 430
<210>111
<211>1314
<212>DNA
<213>人工序列
<220>
<223>质粒11268
<400>111
atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct     60
gcgcagtccg agccggagct gaagctggag tccgtggtga tcgtgtcccg ccacggcgtg    120
cgcgccccga ccaaggccac ccagctcatg caggacgtga ccccggacgc ctggccgacc    180
tggccggtga agctcggcga gctgaccccg cgcggcggcg agctgatcgc ctacctcggc    240
cactactggc gccagcgcct cgtggccgac ggcctcctcc cgaagtgcgg ctgcccgcag    300
tccggccagg tggccatcat cgccgacgtg gacgagcgca cccgcaagac cggcgaggcc    360
ttcgccgccg gcctcgcccc ggactgcgcc atcaccgtgc acacccaggc cgacacctcc    420
tccccggacc cgctcttcaa cccgctcaag accggcgtgt gccagctcga caacgccaac    480
gtgaccgacg ccatcctgga gcgcgccggc ggctccatcg ccgacttcac cggccactac    540
cagaccgcct tccgcgagct ggagcgcgtg ctcaacttcc cgcagtccaa cctctgcctc    600
aagcgcgaga agcaggacga gtcctgctcc ctcacccagg ccctcccgtc cgagctgaag    660
gtgtccgccg actgcgtgtc cctcaccggc gccgtgtccc tcgcctccat gctcaccgaa    720
atcttcctcc tccagcaggc ccagggcatg ccggagccgg gctggggccg catcaccgac    780
tcccaccagt ggaacaccct cctctccctc cacaacgccc agttcgacct cctccagcgc    840
accccggagg tggcccgctc ccgcgccacc ccgctcctcg acctcatcaa gaccgccctc    900
accccgcacc cgccgcagaa gcaggcctac ggcgtgaccc tcccgacctc cgtgctcttc    960
atcgccggcc acgacaccaa cctcgccaac ctcggcggcg ccctggagct gaactggacc   1020
ctcccgggcc agccggacaa caccccgccg ggcggcgagc tggtgttcga gcgctggcgc   1080
cgcctctccg acaactccca gtggattcag gtgtccctcg tgttccagac cctccagcag   1140
atgcgcgaca agaccccgct ctccctcaac accccgccgg gcgaggtgaa gctcaccctc   1200
gccggctgcg aggagcgcaa cgcccagggc atgtgctccc tcgccggctt cacccagatc   1260
gtgaacgagg cccgcatccc ggcctgctcc ctctccgaga aggacgagct gtaa         1314
<210>112
<211>437
<212>PRT
<213>人工序列
<220>
<223>质粒11268氨基酸序列
<400>112
Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser
1               5                   10                  15
Ala Thr Ser Ala Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val
            20                  25                  30
Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln
        35                  40                  45
Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys
    50                  55                  60
Leu Gly Glu Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly
65                  70                  75                  80
His Tyr Trp Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Pro Lys Cys
                85                  90                  95
Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu
            100                 105                 110
Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp
        115                 120                 125
Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro
    130                 135                 140
Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn
145                 150                 155                 160
Val Thr Asp Ala Ile Leu Glu Arg Ala Gly Gly Ser Ile Ala Asp Phe
                165                 170                 175
Thr Gly His Tyr Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn
            180                 185                 190
Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser
        195                 200                 205
Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala Asp
    210                 215                 220
Cys Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu
225                 230                 235                 240
Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly
                245                 250                 255
Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His Asn
            260                 265                 270
Ala Gln Phe Asp Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg
        275                 280                 285
Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro
    290                 295                 300
Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe
305                 310                 315                 320
Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu
                325                 330                 335
Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly
            340                 345                 350
Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp
        355                 360                 365
Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys
    370                 375                 380
Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu
385                 390                 395                 400
Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly
                405                 410                 415
Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu Ser
            420                 425                 430
Glu Lys Asp Glu Leu
        435

Claims (233)

1.分离的多核苷酸,其a)包含SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110或其互补序列,或与SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108和110之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶、葡糖淀粉酶、木聚糖酶、蛋白酶、纤维素酶、葡聚糖酶、β葡糖苷酶或植酸酶活性的多肽的多核苷酸,或者b)编码包含SEQ ID NO:10、13、14、15、16、18、20、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49、51、62、64、66、70、80、82、84、86、88、90、92、109或111或其酶活性片段的多肽。
2.权利要求1的分离的多核苷酸,其中所述多核苷酸编码包含第一多肽和第二肽的融合多肽,其中所述第一多肽具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶或葡糖淀粉酶活性。
3.权利要求2的分离的多核苷酸,其中所述第二肽包含信号序列肽。
4.权利要求3的分离的多核苷酸,其中所述信号序列肽将第一多肽引导至植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁。
5.权利要求3的分离的多核苷酸,其中所述信号序列是来自waxy的N端信号序列、来自γ-玉米醇溶蛋白的N端信号序列、淀粉结合域或C端淀粉结合域。
6.权利要求1的分离的多核苷酸,其中所述多核苷酸与SEQ ID NO:2、9或52之任一的互补序列在低严紧杂交条件下杂交,并编码具有α-淀粉酶活性的多肽。
7.权利要求1的分离的多核苷酸,其中所述多核苷酸与SEQ IDNO:4或25之任一的互补序列在低严紧杂交条件下杂交,并编码具有支链淀粉酶活性的多肽。
8.权利要求1的分离的多核苷酸,其中所述多核苷酸与SEQ IDNO:6的互补序列杂交,并编码具有α-葡糖苷酶活性的多肽。
9.权利要求1的分离的多核苷酸,其中所述多核苷酸与SEQ ID NO:19、21、37、39、41或43之任一的互补序列在低严紧杂交条件下杂交,并编码具有葡萄糖异构酶活性的多肽。
10.权利要求1的分离的多核苷酸,其中所述多核苷酸与SEQ IDNO:46、48、50或59之任一的互补序列在低严紧杂交条件下杂交,并编码具有葡糖淀粉酶活性的多肽。
11.包含SEQ ID NO:2或9之任一或其互补序列的分离的多核苷酸。
12.包含SEQ ID NO:4或25之任一或其互补序列的分离的多核苷酸。
13.包含SEQ ID NO:6或其互补序列的分离的多核苷酸。
14.包含SEQ ID NO:19、21、37、39、41、或43之任一或其互补序列的分离的多核苷酸。
15.包含SEQ ID NO:46、48、50或59之任一或其互补序列的分离的多核苷酸。
16.包含多核苷酸的表达盒,其中所述多核苷酸a)具有SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108或110或其互补序列,或与SEQ ID NO:2、4、6、9、19、21、25、37、39、41、43、46、48、50、52、59、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108或110之任一的互补序列在低严紧杂交条件下杂交并编码具有α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡萄糖异构酶、葡糖淀粉酶、木聚糖酶、蛋白酶、纤维素酶、葡聚糖酶、β葡糖苷酶或植酸酶活性的多肽的多核苷酸,或者b)编码包含SEQ ID NO:10、13、14、15、16、18、20、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49、51、62、64、66、70、80、82、84、86、88、90、92、109或111或其酶活性片段的多肽。
17.权利要求16的表达盒,其与启动子可操作地连接。
18.权利要求17的表达盒,其中所述启动子是诱导型启动子。
19.权利要求17的表达盒,其中所述启动子是组织特异性启动子。
20.权利要求19的表达盒,其中所述启动子是胚乳特异性启动子。
21.权利要求20的表达盒,其中所述胚乳特异性启动子是玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子。
22.权利要求21的表达盒,其中所述启动子包含SEQ ID NO:11或SEQ ID NO:12。
23.权利要求16的表达盒,其中所述多核苷酸相对于所述启动子采取正义方向。
24.权利要求16的表达盒,其中a)的多核苷酸还编码与该多核苷酸所编码的多肽可操作地连接的信号序列。
25.权利要求24的表达盒,其中所述信号序列将可操作地连接的多肽引导至植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁。
26.权利要求25的表达盒,其中所述信号序列是来自waxy的N端信号序列或来自γ-玉米醇溶蛋白的N端信号序列。
27.权利要求25的表达盒,其中所述信号序列是淀粉结合域。
28.权利要求16的表达盒,其中b)的多核苷酸与组织特异性启动子可操作地连接。
29.权利要求28的表达盒,其中组织特异性启动子是玉蜀黍γ-玉米醇溶蛋白启动子或玉蜀黍ADP-gpp启动子。
30.包含多核苷酸的表达盒,其中所述多核苷酸包含SEQ ID NO:2或9之任一或其互补序列。
31.包含多核苷酸的表达盒,其中所述多核苷酸包含SEQ ID NO:6或其互补序列。
32.包含多核苷酸的表达盒,其中所述多核苷酸包含SEQ ID NO:19、21、37、39、41、或43之任一或其互补序列。
33.包含多核苷酸的表达盒,其中所述多核苷酸包含SEQ ID NO:46、48、50或59之任一或其互补序列。
34.包含多核苷酸的表达盒,其中所述多核苷酸包含SEQ ID NO:4或25之任一或其互补序列。
35.包含多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:10、13、14、15、16、24、26、27、28、29、30、33、34、35、36、38、40、42、44、45、47、49、51、61、63、65、79、81、83、85、87、89、91、93、94、95、96、97、99、108或110之任一的氨基酸序列的多肽或其酶活性片段。
36.包含多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:10、13、14、15、16、33、35或51之任一的氨基酸序列的多肽或其具有α-淀粉酶活性的活性片段。
37.包含多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:3、24或34之任一的氨基酸序列的多肽或其具有支链淀粉酶活性的活性片段。
38.包含多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:5、26或27之任一的氨基酸序列的多肽或其具有α-葡糖苷酶活性的活性片段。
39.包含多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:18、20、28、29、30、38、40、42或44之任一的氨基酸序列的多肽或其具有葡萄糖异构酶活性的活性片段。
40.包含多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:45、47或49之任一的氨基酸序列的多肽或其具有葡糖淀粉酶活性的活性片段。
41.包含权利要求16的表达盒的载体。
42.包含权利要求30-40之任一的表达盒的载体。
43.包含权利要求16的表达盒的细胞。
44.包含权利要求30-40之任一的表达盒的细胞。
45.权利要求44的细胞,其中所述细胞选自:农杆菌、单子叶植物细胞、双子叶植物细胞、百合纲(Liluipsida)细胞、黍亚科(Panicoideae)细胞、玉米细胞和谷物细胞。
46.权利要求45的细胞,其中所述细胞是玉米细胞或稻细胞。
47.权利要求45的细胞,其中所述细胞选自:农杆菌、单子叶植物细胞、双子叶植物细胞、百合纲(Liliopsida)细胞、黍亚科(Panicoideae)细胞、玉米细胞和谷物细胞。
48.权利要求47的细胞,其中所述细胞是玉米细胞。
49.稳定地转化了权利要求41的载体的植物。
50.稳定地转化了权利要求42的载体的植物。
51.稳定地转化了包含α-淀粉酶的载体的植物,其中所述α-淀粉酶具有SEQ ID NO:1、10、13、14、15、16、33或35之任一的氨基酸序列或由包含SEQ ID NO:2或9之任一的多核苷酸编码。
52.权利要求51的植物,其中所述α-淀粉酶是嗜高热型的。
53.稳定地转化了包含支链淀粉酶的载体的植物,其中所述支链淀粉酶具有SEQ ID NO:24或34之任一的氨基酸序列或者由包含SEQID NO:4或25之任一的多核苷酸编码。
54.稳定地转化了包含α-葡糖苷酶的载体的植物,其中所述α-葡糖苷酶具有SEQ ID NO:26或27之任一的氨基酸序列或者由包含SEQ ID NO:6的多核苷酸编码。
55.权利要求54的植物,其中所述α-葡糖苷酶是嗜高热型的。
56.稳定地转化了包含葡萄糖异构酶的载体的植物,其中所述葡萄糖异构酶具有SEQ ID NO:18、20、28、29、30、38、40、42或44之任一的氨基酸序列,或者由包含SEQ ID NO:19、21、37、39、41或43之任一的多核苷酸编码。
57.权利要求56的植物,其中所述α-葡糖苷酶是嗜高热型的。
58.稳定地转化了包含葡萄糖淀粉酶的载体的植物,其中所述葡萄糖淀粉酶具有SEQ ID NO:45、47或49之任一的氨基酸序列或者由包含SEQ ID NO:46、48、50或59之任一的多核苷酸编码。
59.权利要求58的植物,其中所述葡萄糖淀粉酶是嗜高热型的。
60.来自权利要求49的植物的种子、果实或谷粒。
61.来自权利要求50的植物的种子、果实或谷粒。
62.来自权利要求51的植物的种子、果实或谷粒。
63.来自权利要求53的植物的种子、果实或谷粒。
64.来自权利要求54的植物的种子、果实或谷粒。
65.来自权利要求56的植物的种子、果实或谷粒。
66.来自权利要求58的植物的种子、果实或谷粒。
67.转化的植物,其基因组中增加了与启动子序列可操作地连接的、编码至少一种加工酶的重组多核苷酸。
68.权利要求67的植物,其中植物是单子叶植物。
69.权利要求68的植物,其中单子叶植物是玉米或稻。
70.权利要求67的植物,其中植物是双子叶植物。
71.权利要求67的植物,其中植物是谷类植物或商业栽培的植物。
72.权利要求67的植物,其中加工酶选自:α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、葡聚糖酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶、淀粉型支链淀粉酶、纤维素酶、外切-1,4-β-纤维二糖水解酶、外切-1,3-β-D-葡聚糖酶、β-葡糖苷酶、内切葡聚糖酶、L-阿拉伯聚糖酶、α-阿拉伯糖苷酶、半乳聚糖酶、半乳糖苷酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、木糖苷酶、蛋白酶、葡聚糖酶、酯酶、植酸酶和脂肪酶。
73.权利要求72的植物,其中加工酶是淀粉加工酶,选自:α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶和淀粉型支链淀粉酶。
74.权利要求73的植物,其中酶选自:α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。
75.权利要求74的植物,其中酶是嗜高热型的。
76.权利要求72的植物,其中酶是非淀粉降解酶,选自:蛋白酶、葡聚糖酶、木聚糖酶、纤维素酶、β-葡糖苷酶、酯酶、植酸酶和脂肪酶。
77.权利要求76的植物,其中酶是嗜高热型的。
78.权利要求67的植物,其中酶积累在植物的液泡、内质网、叶绿体、淀粉粒、种子或细胞壁中。
79.权利要求78的植物,其中酶积累在内质网中。
80.权利要求78的植物,其中酶积累在淀粉粒中。
81.权利要求67的植物,其基因组中还增加了包含非嗜高热型的酶的第二重组多核苷酸。
82.转化的植物,其基因组中增加了与启动子序列可操作地连接的、编码至少一种加工酶的重组多核苷酸,其中所述加工酶选自:α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。
83.权利要求82的转化的植物,其中加工酶是嗜高热型的。
84.权利要求82的转化的植物,其中植物是玉米或稻。
85.转化的玉米植物,其基因组中增加了与启动子序列可操作地连接的、编码至少一种加工酶的重组多核苷酸,其中所述加工酶选自:α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。
86.权利要求85的转化的玉米植物,其中加工酶是嗜高热型的。
87.转化的植物,其基因组中增加了与启动子和信号序列可操作地连接的、具有SEQ ID NO:2、9或52的重组多核苷酸。
88.转化的植物,其基因组中增加了与启动子和信号序列可操作地连接的、具有SEQ ID NO:4或25的重组多核苷酸。
89.转化的植物,其基因组中增加了与启动子和信号序列可操作地连接的、具有SEQ ID NO:6的重组多核苷酸。
90.转化的植物,其基因组中增加了具有SEQ ID NO:19、21、37、39、41或43的重组多核苷酸。
91.转化的植物,其基因组中增加了具有SEQ ID NO:46、48、50或59的重组多核苷酸。
92.权利要求82的转化的植物的产物。
93.权利要求85的转化的植物的产物。
94.权利要求87-91之任一的转化的植物的产物。
95.权利要求92的产物,其中产物是种子、果实或谷粒。
96.权利要求92的产物,其中产物是加工酶、淀粉或糖。
97.从权利要求82的植物获得的植物。
98.从权利要求85的植物获得的植物。
99.从权利要求87-91之任一的植物获得的植物。
100.权利要求97的植物,其是杂种植物。
101.权利要求98的植物,其是杂种植物。
102.权利要求99的植物,其是杂种植物。
103.权利要求97的植物,其是近交/自交植物。
104.权利要求98的植物,其是近交/自交植物。
105.权利要求99的植物,其是近交/自交植物。
106.包含至少一种加工酶的淀粉组合物,其中所述加工酶是蛋白酶、葡聚糖酶、植酸酶、脂肪酶、木聚糖酶、纤维素酶、β-葡糖苷酶或酯酶。
107.权利要求106的淀粉组合物,其中酶是嗜高热型的。
108.包含至少一种加工酶的谷粒,其中所述酶是α-淀粉酶、支链淀粉酶、α-葡糖苷酶、葡糖淀粉酶或葡萄糖异构酶。
109.权利要求108的谷粒,其中酶是嗜高热型的。
110.制备淀粉粒的方法,包括:
a)将包含至少一种非淀粉加工酶的谷粒在激活所述至少一种酶的条件下进行处理,从而产生包含淀粉粒和非淀粉降解产物的混合物,其中所述谷粒从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和
b)从混合物中分离淀粉粒。
111.权利要求110的方法,其中酶是蛋白酶、葡聚糖酶、植酸酶、脂肪酶、木聚糖酶、纤维素酶、β-葡糖苷酶或酯酶。
112.权利要求111的方法,其中酶是嗜高热型的。
113.权利要求110的方法,其中谷粒是破碎的谷粒。
114.权利要求110的方法,其中谷粒在低湿度条件下处理。
115.权利要求110的方法,其中谷粒在高湿度条件下处理。
116.权利要求110的方法,其中谷粒用二氧化硫处理。
117.权利要求110的方法,还包括从混合物中分离非淀粉产物。
118.通过权利要求110的方法获得的淀粉。
119.通过权利要求112的方法获得的淀粉。
120.通过权利要求110的方法获得的非淀粉产物。
121.通过权利要求112的方法获得的非淀粉产物。
122.制备超甜玉米的方法,包括将基因组中增加了编码至少一种淀粉降解酶或淀粉异构化酶的表达盒并在胚乳中表达该表达盒的转化的玉米或其部分,在激活所述至少一种酶的条件下进行处理,以致将玉米中的多糖转化成糖(sugar),从而产生超甜玉米。
123.权利要求122的方法,其中表达盒还包含与编码该酶的多核苷酸可操作地连接的启动子。
124.权利要求123的方法,其中启动子是组成型启动子。
125.权利要求123的方法,其中启动子是种子特异性启动子。
126.权利要求123的方法,其中启动子是胚乳特异性启动子。
127.权利要求123的方法,其中酶是嗜高热型的。
128.权利要求127的方法,其中酶是α-淀粉酶。
129.权利要求122的方法,其中表达盒还包含编码与所述至少一种酶可操作地连接的信号序列的多核苷酸。
130.权利要求129的方法,其中信号序列指引嗜高热酶到达质外体。
131.权利要求129的方法,其中信号序列指引嗜高热酶到达内质网。
132.权利要求122的方法,其中酶包含SEQ ID NO:13、14、15、16、33或35之任一。
133.制备超甜玉米的方法,包括将基因组中增加了编码α-淀粉酶的表达盒并在胚乳中表达该表达盒的转化的玉米或其部分,在激活所述至少一种酶的条件下进行处理,以致将玉米中的多糖转化成糖(sugar),从而产生超甜玉米。
134.权利要求133的方法,其中酶是嗜高热型的。
135.权利要求134的方法,其中嗜高热型的α-淀粉酶包含SEQID NO:10、13、14、15、16、33或35之任一的氨基酸序列或者其具有α-淀粉酶活性的酶活性片段。
136.权利要求134的方法,其中表达盒包含选自SEQ ID NO:2、9或52之任一或其互补序列的多核苷酸,或与SEQ ID NO:2、9或52之任一在低严紧杂交条件下杂交并编码具有α-淀粉酶活性的多肽的多核苷酸。
137.制备淀粉水解产物的溶液的方法,包括:
a)将包含淀粉粒和至少一种加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成包含淀粉水解产物的水溶液,其中所述植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化的植物获得;和
b)收集含有淀粉水解产物的水溶液。
138.权利要求137的方法,其中淀粉水解产物包括糊精、麦芽寡糖、糖(sugar)和/或其混合物。
139.权利要求137的方法,其中酶是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、淀粉型支链淀粉酶、葡萄糖异构酶、β-淀粉酶、异淀粉酶、新支链淀粉酶、异支链淀粉酶、或其任何组合。
140.权利要求137的方法,其中所述至少一种加工酶是嗜高热型的。
141.权利要求139的方法,其中所述至少一种加工酶是嗜高热型的。
142.权利要求137的方法,其中植物部分的基因组中还增加了编码非嗜高热型淀粉加工酶的表达盒。
143.权利要求142的方法,其中非嗜高热型淀粉加工酶选自:淀粉酶、葡糖淀粉酶、α-葡糖苷酶、支链淀粉酶、葡萄糖异构酶、或其组合。
144.权利要求137的方法,其中所述至少一种加工酶在胚乳中表达。
145.权利要求137的方法,其中植物部分是谷粒。
146.权利要求137的方法,其中植物部分来自玉米、小麦、大麦、黑麦、燕麦、甘蔗或稻。
147.权利要求137的方法,其中所述至少一种加工酶与启动子和信号序列可操作地连接,其中所述信号序列可以将酶引导至淀粉粒或内质网或细胞壁。
148.权利要求137的方法,还包括分离淀粉水解产物。
149.权利要求137的方法,还包括发酵淀粉水解产物。
150.制备淀粉水解产物的方法,包括:
a)将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成含有淀粉水解产物的水溶液,其中所述植物部分从基因组中增加了编码至少一种α-淀粉酶的表达盒的转化的植物获得;和
b)收集含有淀粉水解产物的水溶液。
151.权利要求150的方法,其中α-淀粉酶是嗜高热型的。
152.权利要求151的方法,其中嗜高热型的α-淀粉酶包含SEQ IDNO:1、10、13、14、15、16、33或35之任一的氨基酸序列或者其具有α-淀粉酶活性的活性片段。
153.权利要求151的方法,其中表达盒包含选自SEQ ID NO:2、9、46或52之任一或其互补序列的多核苷酸,或者与SEQ ID NO:2、9、46或52之任一在低严紧杂交条件下杂交并编码具有α-淀粉酶活性的多肽的多核苷酸。
154.权利要求150的方法,其中转化的植物的基因组中还包含编码非嗜热型淀粉加工酶的多核苷酸。
155.权利要求150的方法,还包括用非嗜高热型淀粉加工酶处理植物部分。
156.转化的植物部分,其包含存在于该植物的细胞中的至少一种淀粉加工酶,其中所述植物部分从基因组中增加了编码所述至少一种淀粉加工酶的表达盒的转化的植物获得。
157.权利要求156的植物部分,其中酶是选自α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、β-淀粉酶、α-葡糖苷酶、异淀粉酶、支链淀粉酶、新支链淀粉酶、异支链淀粉酶和淀粉型支链淀粉酶的淀粉加工酶。
158.权利要求156的植物部分,其中酶是嗜高热型的。
159.权利要求156的植物部分,其中植物是玉米。
160.转化的植物部分,其包含至少一种存在于该植物的细胞壁或细胞中的非淀粉加工酶,其中所述植物部分从基因组中增加了编码所述至少一种非淀粉加工酶或至少一种非淀粉多糖加工酶的表达盒的转化植物获得。
161.权利要求160的植物部分,其中酶是嗜高热型的。
162.权利要求160的植物部分,其中非淀粉加工酶选自:蛋白酶、葡聚糖酶、木聚糖酶、酯酶、植酸酶、纤维素酶、β-葡糖苷酶或脂肪酶。
163.权利要求156或160的植物部分,其是穗、种子、果实、谷粒、秸秆、谷壳、或蔗渣。
164.转化的植物部分,其包含具有SEQ ID NO:1、10、11、13、14、15、16、33或35之任一的氨基酸序列或由包含SEQ ID NO:2、9、46或52之任一的多核苷酸编码的α-淀粉酶。
165.转化的植物部分,其包含具有SEQ ID NO:5、26或27之任一的氨基酸序列或由包含SEQ ID NO:6的多核苷酸编码的α-葡糖苷酶。
166.转化的植物部分,其包含具有SEQ ID NO:28、29、30、38、40、42或44之任一的氨基酸序列或由包含SEQ ID NO:19、21、37、39、41或43之任一的多核苷酸编码的葡萄糖异构酶。
167.转化的植物部分,其包含具有SEQ ID NO:45或SEQ ID NO:47或SEQ ID NO:49的氨基酸序列或由包含SEQ ID NO:46、48、50或59之任一的多核苷酸编码的葡糖淀粉酶。
168、转化的植物部分,其包含由包含SEQ ID NO:4或25之任一的多核苷酸编码的支链淀粉酶。
169.在权利要求156的转化的植物部分中转化淀粉的方法,包括激活其中所包含的淀粉加工酶。
170.在权利要求164-168之任一项的转化的植物部分中将淀粉转化成淀粉衍生产物的方法,包括激活其中所含的酶。
171.根据权利要求169的方法产生的淀粉、糊精、麦芽寡糖或糖(sugar)。
172.根据权利要求170的方法产生的淀粉、糊精、麦芽寡糖或糖(sugar)。
173.使用转化的植物部分的方法,其中所述转化的植物部分在该植物部分的细胞壁或细胞中包含至少一种非淀粉加工酶,所述方法包括:
a)将包含至少一种非淀粉多糖加工酶的转化的植物部分在激活所述至少一种酶的条件下进行处理,由此消化非淀粉多糖以形成含有寡糖和/或糖(sugar)的水溶液,其中植物部分从基因组中增加了编码所述至少一种非淀粉多糖加工酶的表达盒的转化植物获得;和
b)收集合有寡糖和/或糖(sugar)的水溶液。
174.权利要求173的方法,其中非淀粉多糖加工酶是蛋白酶、葡聚糖酶、植酸酶、脂肪酶、木聚糖酶、纤维素酶、β-葡糖苷酶或酯酶。
175.使用包含至少一种加工酶的转化种子的方法,包括:
a)将包含至少一种蛋白酶或脂肪酶的转化种子在激活所述至少一种酶的条件下进行处理,从而产生包含氨基酸和脂肪酸的含水混合物,其中种子从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和
b)收集含水混合物。
176.权利要求175的方法,其中分离氨基酸、脂肪酸或两者。
177.权利要求175的方法,其中所述至少一种蛋白酶或脂肪酶是嗜高热型的。
178.制备乙醇的方法,包括:
a)将包含至少一种多糖加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此消化多糖以形成寡糖或可发酵糖,其中植物部分从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得;和
b)在促进可发酵糖或寡糖转化成乙醇的条件下孵育可发酵糖。
179.权利要求178的方法,其中植物部分是谷粒、果实、种子、秸秆、木材、蔬菜或根。
180.权利要求178的方法,其中植物部分从选自燕麦、大麦、小麦、浆果、葡萄、黑麦、玉米、稻、马铃薯、甜菜、甘蔗、凤梨、草和树的植物获得。
181.权利要求178的方法,其中多糖加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶、支链淀粉酶或其组合。
182.权利要求178的方法,其中多糖加工酶是嗜高热型的。
183.权利要求178的方法,其中多糖加工酶是嗜温型的。
184.权利要求181的方法,其中多糖加工酶是嗜高热型的。
185.制备乙醇的方法,包括:
a)将包含选自α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶或支链淀粉酶或其组合的至少一种酶的植物部分,在足以激活所述至少一种酶的条件和时间长度下进行热处理,由此消化多糖以形成可发酵糖,其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和
b)在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。
186.权利要求185的方法,其中所述至少一种酶是嗜高热型的。
187、权利要求185的方法,其中所述至少一种酶是嗜温型的。
188.权利要求185的方法,其中α-淀粉酶具有SEQ ID NO:1、10、13、14、15、16、33或35之任一的氨基酸序列,或者由包含SEQID NO:2或9的多核苷酸编码。
189.权利要求185的方法,其中α-葡糖苷酶具有SEQ ID NO:5、26或27之任一的氨基酸序列,或者由包含SEQ ID NO:6的多核苷酸编码。
190.权利要求185的方法,其中葡萄糖异构酶具有SEQ ID NO:28、29、30、38、40、42或44之任一的氨基酸序列,或者由包含SEQ ID NO:19、21、37、39、41或43之任一的多核苷酸编码。
191.权利要求185的方法,其中葡糖淀粉酶具有SEQ ID NO:45的氨基酸序列,或者由包含SEQ ID NO:46、48或50之任一的多核苷酸编码。
192.权利要求185的方法,其中支链淀粉酶具有SEQ ID NO:24或34的氨基酸序列,或者由包含SEQ ID NO:4或25之任一的多核苷酸编码。
193.制备乙醇的方法,包括:
a)将包含至少一种非淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此将非淀粉多糖消化成寡糖和可发酵糖,其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和
b)在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。
194.权利要求193的方法,其中非淀粉加工酶是蛋白酶、葡聚糖酶、植酸酶、脂肪酶、木聚糖酶、纤维素酶、β-葡糖苷酶或酯酶。
195.制备乙醇的方法,包括:
a)将包含选自α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、葡萄糖异构酶或支链淀粉酶或其组合的至少一种酶的植物部分,在激活所述至少一种酶的条件下进行处理,由此消化多糖以形成可发酵糖,其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和
b)在促进可发酵糖转化成乙醇的条件下孵育可发酵糖。
196.权利要求195的方法,其中所述至少一种酶是嗜高热型的。
197.在不添加额外增甜剂的情况下制备甜的粉质食品的方法,包括:
a)将包含至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此将植物部分中的淀粉粒加工成糖(sugar)以形成甜的产物,其中植物部分从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和
b)将所述甜的产物加工成粉质食品。
198.权利要求197的方法,其中粉质食品由所述甜的产物和水形成。
199.权利要求197的方法,其中粉质食品含有麦芽、调味剂、维生素、矿物质、着色剂、或其任何组合。
200.权利要求197的方法,其中所述至少一种酶是嗜高热型的。
201.权利要求197的方法,其中酶是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶或其任何组合。
202.权利要求197的方法,其中植物选自:大豆、黑麦、燕麦、大麦、小麦、玉米、稻和甘蔗。
203.权利要求197的方法,其中粉质食品是谷物食品。
204.权利要求197的方法,其中粉质食品是早餐食品。
205.权利要求197的方法,其中粉质食品是即食食品。
206.权利要求197的方法,其中粉质食品是烘焙的食品。
207.权利要求197的方法,其中所述加工是烘焙、煮沸、加热、蒸、放电或其任何组合。
208.在不添加增甜剂的情况下甜化含淀粉产品的方法,包括:
a)将包含至少一种淀粉加工酶的淀粉在激活所述至少一种酶的条件下处理,由此消化淀粉以形成糖(sugar),从而形成甜的淀粉,其中所述淀粉从基因组中增加了编码所述至少一种酶的表达盒的转化植物获得;和
b)将此甜的淀粉加入产品以产生甜化的含淀粉产品。
209.权利要求208的方法,其中转化的植物选自:玉米、大豆、黑麦、燕麦、大麦、小麦、稻和甘蔗。
210.权利要求208的方法,其中所述至少一种酶是嗜高热型的。
211.权利要求208的方法,其中所述至少一种酶是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶、或其任何组合。
212.通过权利要求197的方法获得的粉质食品。
213.通过权利要求208的方法获得的甜的含淀粉产品。
214.甜化含多糖的果实或蔬菜的方法,包括:将包含至少一种多糖加工酶的果实或蔬菜在激活所述至少一种酶的条件下进行处理,由此加工果实或蔬菜中的多糖以形成糖(sugar),从而产生甜的果实或蔬菜,其中所述果实或蔬菜从基因组中增加了编码所述至少一种多糖加工酶的表达盒的转化植物获得。
215.权利要求214的方法,其中果实或蔬菜选自:马铃薯、番茄、香蕉、南瓜、豌豆和大豆。
216.权利要求214的方法,其中所述至少一种酶是嗜高热型的。
217.权利要求214的方法,其中酶是α-淀粉酶、α-葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶、或其任何组合。
218.制备含有糖(sugar)的水溶液的方法,包括将获自权利要求156的植物部分的淀粉粒在激活所述至少一种酶的条件下进行处理,由此产生含有糖(sugar)的水溶液。
219.从谷粒制备淀粉衍生产物的方法,其中所述方法不包括在回收淀粉衍生产物之前对谷粒进行湿磨或干磨,所述方法包括:
a)将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液,其中植物部分从基因组中增加了编码所述至少一种淀粉加工酶的转化植物获得;和
b)收集含有淀粉衍生产物的水溶液。
220.权利要求219的方法,其中所述至少一种淀粉加工酶是嗜高热型的。
221.分离α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶的方法,包括培养权利要求82的转化的植物,和从其中分离α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶。
222.权利要求221的方法,其中α-淀粉酶、葡糖淀粉酶、葡萄糖异构酶、α-葡糖苷酶和支链淀粉酶是嗜高热型的。
223.制备麦芽糖糊精的方法,包括:
a)将转基因谷粒与水混合;
b)加热所述混合物;
c)从(b)中产生的糊精糖浆分离固体;和
d)收集麦芽糖糊精。
224.权利要求223的方法,其中转基因谷粒包含至少一种淀粉加工酶。
225.权利要求224的方法,其中淀粉加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶和葡萄糖异构酶。
226.权利要求225的方法,其中所述淀粉加工酶的至少一种是嗜高热型的。
227.通过权利要求223-226之任一项的方法产生的麦芽糖糊精。
228.通过权利要求223-226之任一项的方法产生的麦芽糖糊精组合物。
229.从谷粒制备糊精或糖(sugar)的方法,其中所述方法不包括在回收淀粉衍生产物之前机械破碎谷粒,所述方法包括:
a)将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液,其中植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得;和
b)收集含有糖(sugar)和/或糊精的水溶液。
230.权利要求229的方法,其中淀粉加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶和葡萄糖异构酶。
231.制备可发酵糖的方法,包括:
a)将包含淀粉粒和至少一种淀粉加工酶的植物部分在激活所述至少一种酶的条件下进行处理,由此加工淀粉粒以形成含有糊精或糖(sugar)的水溶液,其中植物部分从基因组中增加了编码所述至少一种加工酶的表达盒的转化植物获得;和
b)收集含有可发酵糖的水溶液。
232.权利要求231的方法,其中淀粉加工酶是α-淀粉酶、葡糖淀粉酶、α-葡糖苷酶和葡萄糖异构酶。
233.稳定地转化了包含嗜高热型α-淀粉酶的载体的玉米植物。
234.稳定地转化了含有编码α-淀粉酶的多核苷酸序列的载体的玉米植物,其中所述α-淀粉酶与SEQ ID NO:1或SEQ ID NO:51有大于60%的同一性。
CNA2004800429878A 2004-03-08 2004-03-08 自加工的植物和植物部分 Pending CN1954072A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2004/007182 WO2005096804A2 (en) 2004-03-08 2004-03-08 Self-processing plants and plant parts

Publications (1)

Publication Number Publication Date
CN1954072A true CN1954072A (zh) 2007-04-25

Family

ID=35125575

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800429878A Pending CN1954072A (zh) 2004-03-08 2004-03-08 自加工的植物和植物部分

Country Status (9)

Country Link
US (2) US20080289066A1 (zh)
EP (1) EP1730284A4 (zh)
JP (1) JP2007527726A (zh)
CN (1) CN1954072A (zh)
AU (1) AU2004318207B2 (zh)
BR (1) BRPI0418622B1 (zh)
CA (1) CA2558603A1 (zh)
RS (1) RS20060506A (zh)
WO (1) WO2005096804A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105462999A (zh) * 2015-12-08 2016-04-06 江西省农业科学院农业应用微生物研究所 基于宏基因技术从霉变的甘蔗叶中筛选β-葡萄糖苷酶基因的方法
CN107723309A (zh) * 2009-11-06 2018-02-23 谷万达公司 转基因植物和动物饲料
US10988788B2 (en) 2009-11-06 2021-04-27 Agrivida, Inc. Plants expressing cell wall degrading enzymes and expression vectors
CN113373174A (zh) * 2009-12-17 2021-09-10 先锋国际良种公司 玉米事件dp-004114-3及其检测方法

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7612251B2 (en) 2000-09-26 2009-11-03 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
MX2007010036A (es) 2005-03-16 2007-10-04 Syngenta Participations Ag Maiz evento 3272 y metodos para la deteccion del mismo.
EP1989303A2 (en) * 2006-02-27 2008-11-12 Edenspace System Corporation Energy crops for improved biofuel feedstocks
US7968318B2 (en) 2006-06-06 2011-06-28 Genencor International, Inc. Process for conversion of granular starch to ethanol
CN101528766A (zh) * 2006-08-04 2009-09-09 维莱尼姆公司 葡聚糖酶、编码它们的核酸及制备和使用它们的方法
EP2617818B1 (en) 2006-09-21 2016-03-23 BASF Enzymes LLC Phytases, nucleic acids encoding them and methods for making and using them
NZ598285A (en) * 2007-01-30 2013-10-25 Syngenta Participations Ag Enzymes for the treatment of lignocellulosics, nucleic acids encoding them and methods for making and using them
US8021863B2 (en) 2007-02-19 2011-09-20 Novozymes A/S Polypeptides with starch debranching activity
EP2036978A1 (en) * 2007-09-14 2009-03-18 URSAPHARM Arzneimittel GmbH & Co. KG Recombinant preparation of selected bromelain fractions
EA025360B1 (ru) 2007-11-27 2016-12-30 Коммонвелт Сайентифик Энд Индастриал Рисерч Органайзейшн Растения с модифицированным метаболизмом крахмала
BRPI0906959A2 (pt) * 2008-01-18 2015-07-14 Iogen Energy Corp Variantes de celulase com inibição reduzida por glicose
US20090205075A1 (en) * 2008-01-30 2009-08-13 Stacy Miles Use of plastid transit peptides derived from glaucocystophytes
US9816119B2 (en) 2008-02-29 2017-11-14 Syngenta Participations Ag Methods for starch hydrolysis
US20100017916A1 (en) * 2008-05-30 2010-01-21 Edenspace Systems Corporation Systems for reducing biomass recalcitrance
AU2009257484B2 (en) 2008-06-11 2015-09-03 Syngenta Participations Ag Compositions and methods for producing fermentable carbohydrates in plants
US8124841B2 (en) * 2008-10-22 2012-02-28 Syngenta Participations Ag Truncation of the C-terminal end of alpha-amylase
MX347545B (es) * 2008-12-23 2017-05-02 Dupont Nutrition Biosci Aps Polipeptidos con actividad xilanasa.
CN102317451A (zh) 2008-12-23 2012-01-11 丹尼斯科公司 具有木聚糖酶活性的多肽
US20120040410A1 (en) * 2009-01-19 2012-02-16 The Board Of Regents For Oklahoma State University Thermohemicellulases for lignocellulosic degradation
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
WO2010129485A2 (en) * 2009-05-04 2010-11-11 San Diego State University Foundation Compositions and methods for identifying enzyme and transport protein inhibitors
WO2010135588A2 (en) 2009-05-21 2010-11-25 Verenium Corporation Phytases, nucleic acids encoding them and methods for making and using them
US8420387B2 (en) 2009-11-06 2013-04-16 Agrivida, Inc. Intein-modified enzymes, their production and industrial applications
US10407742B2 (en) 2009-11-06 2019-09-10 Agrivida, Inc. Intein-modified enzymes, their production and industrial applications
US9598700B2 (en) 2010-06-25 2017-03-21 Agrivida, Inc. Methods and compositions for processing biomass with elevated levels of starch
US10443068B2 (en) 2010-06-25 2019-10-15 Agrivida, Inc. Plants with engineered endogenous genes
EP2611914A1 (en) * 2010-08-30 2013-07-10 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US9169312B2 (en) 2010-09-21 2015-10-27 San Diego State University Research Foundation Compositions and methods for identifying enzyme and transport protein inhibitors
ES2610923T3 (es) 2011-03-07 2017-05-04 Agrivida, Inc. Pretratamiento consolidado e hidrólisis de biomasa vegetal que expresa enzimas de degradación de pared celular
US8951764B2 (en) * 2011-08-05 2015-02-10 Danisco Us Inc. Production of isoprenoids under neutral pH conditions
BR112015011152A2 (pt) * 2012-11-14 2017-08-29 Agrivida Inc Planta geneticamente modificada, construção genética e método de processamento agrícola ou preparação de alimentação para animais
CA2892786A1 (en) 2012-12-12 2014-06-19 Danisco Us Inc. Variants of cellobiohydrolases
RU2019134734A (ru) * 2014-02-07 2019-11-18 Новозимс А/С Композиции для получения глюкозных сиропов
JP6937699B2 (ja) 2015-04-10 2021-09-22 シンジェンタ パーティシペーションズ アーゲー 動物飼料組成物および使用方法
CA2981500A1 (en) * 2015-05-14 2016-11-17 Agrivida, Inc. Glucanase production and methods of using the same
GB201509149D0 (en) * 2015-05-28 2015-07-15 Sintef Thermostatable Cellulases
CN109072170A (zh) 2016-03-08 2018-12-21 巴斯夫酶有限责任公司 在乙醇生产中使用肌醇六磷酸酶的方法
US11371052B2 (en) 2016-11-08 2022-06-28 Agrivida, Inc. Phytase production and methods of using the same
CN106566860A (zh) * 2016-11-12 2017-04-19 安徽顺鑫盛源生物食品有限公司 一种利用大米渣制备高纯度大米蛋白和大米多肽的方法
US11793216B2 (en) 2017-10-12 2023-10-24 Syngenta Participations Ag Animal feed compositions and methods of use
WO2021239206A1 (en) * 2020-05-25 2021-12-02 N.V. Nutricia Process for lowering phytic acid in cereals
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
WO2023220362A2 (en) * 2022-05-13 2023-11-16 Agrivida, Inc. Plants expressing proteins of animal origin and associated processes and methods

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380831A (en) * 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
FI841500A0 (fi) * 1984-04-13 1984-04-13 Valtion Teknillinen Foerfarande foer uppbygnande av cellulolytiska jaeststammar.
JP2530181B2 (ja) * 1986-10-31 1996-09-04 花王株式会社 アルカリセルラ―ゼ遺伝子を含むdna断片並びに該dna断片を組み込んだ組換えプラスミド及び組換え微生物
US4907599A (en) * 1988-02-01 1990-03-13 Hart Enterprises, Inc. Soft tissue core biopsy instrument
US5614395A (en) * 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
DD282028A5 (de) * 1989-02-16 1990-08-29 Akad Wissenschaften Ddr Verfahren zur herstellung einer thermostabilen, hybriden bacillus-beta-1,3-1,4-glukanase
DK198089D0 (da) * 1989-04-24 1989-04-24 Danske Spritfabrikker Dna-materialer og anvendelse deraf
US5536655A (en) * 1989-09-26 1996-07-16 Midwest Research Institute Gene coding for the E1 endoglucanase
US5543576A (en) * 1990-03-23 1996-08-06 Mogen International Production of enzymes in seeds and their use
US5168064A (en) * 1990-04-20 1992-12-01 The Regents Of The University Of California Endo-1,4-β-glucanase gene and its use in plants
DK115890D0 (da) * 1990-05-09 1990-05-09 Novo Nordisk As Enzym
US5705375A (en) * 1990-09-13 1998-01-06 Mogen International, N.V. Transgenic plants having a modified carbohydrate content
IE913215A1 (en) * 1990-09-13 1992-02-25 Gist Brocades Nv Transgenic plants having a modified carbohydrate content
US5475101A (en) * 1990-10-05 1995-12-12 Genencor International, Inc. DNA sequence encoding endoglucanase III cellulase
US5366883A (en) * 1992-06-09 1994-11-22 Takara Shuzo Co., Ltd. α-amylase gene
JP2002095470A (ja) * 1994-12-21 2002-04-02 Oji Paper Co Ltd 耐熱性キシラナーゼ
EP0925362B1 (en) * 1996-09-12 2005-07-20 Syngenta Participations AG Transgenic plants expressing cellulolytic enzymes
US5981835A (en) * 1996-10-17 1999-11-09 Wisconsin Alumni Research Foundation Transgenic plants as an alternative source of lignocellulosic-degrading enzymes
US6013860A (en) * 1998-07-24 2000-01-11 Calgene Llc Expression of enzymes involved in cellulose modification
US6506592B1 (en) * 1998-08-18 2003-01-14 Board Of Regents Of The University Of Nebraska Hyperthermophilic alpha-glucosidase gene and its use
CA2254494A1 (en) * 1998-11-19 2000-05-19 Netron Inc. Method of identifying recurring code constructs
US6566125B2 (en) * 2000-06-02 2003-05-20 The United States Of America As Represented By The Secretary Of Agriculture Use of enzymes to reduce steep time and SO2 requirements in a maize wet-milling process
AU2002211798A1 (en) * 2000-10-20 2002-05-06 Michigan State University Transgenic plants containing ligninase and cellulase which degrade lignin and cellulose to fermentable sugars
US7560126B2 (en) * 2001-02-21 2009-07-14 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
CA3032990C (en) * 2001-02-21 2020-07-14 Basf Enzymes Llc Enzymes having alpha amylase activity and methods of use thereof
ATE488585T1 (de) * 2001-08-27 2010-12-15 Syngenta Participations Ag Selbstprozessierende pflanzen und pflanzenteile
WO2003049538A2 (en) * 2001-12-06 2003-06-19 Prodigene, Inc. Methods for the cost-effective saccharification of lignocellulosic biomass
US8558058B2 (en) * 2001-12-06 2013-10-15 Applied Biotechnology Institute Monocotyledonous seed expressing exo-1,4B-glucanase
US6737563B2 (en) * 2002-01-16 2004-05-18 Academia Sinica Transgenic seeds expressing amylopullulanase and uses therefor

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107723309A (zh) * 2009-11-06 2018-02-23 谷万达公司 转基因植物和动物饲料
US10988788B2 (en) 2009-11-06 2021-04-27 Agrivida, Inc. Plants expressing cell wall degrading enzymes and expression vectors
CN107723309B (zh) * 2009-11-06 2022-02-01 谷万达公司 转基因植物和动物饲料
CN113373174A (zh) * 2009-12-17 2021-09-10 先锋国际良种公司 玉米事件dp-004114-3及其检测方法
CN113373174B (zh) * 2009-12-17 2024-06-11 先锋国际良种公司 玉米事件dp-004114-3及其检测方法
CN105462999A (zh) * 2015-12-08 2016-04-06 江西省农业科学院农业应用微生物研究所 基于宏基因技术从霉变的甘蔗叶中筛选β-葡萄糖苷酶基因的方法

Also Published As

Publication number Publication date
BRPI0418622B1 (pt) 2020-01-28
EP1730284A2 (en) 2006-12-13
US20090320831A1 (en) 2009-12-31
RS20060506A (en) 2008-04-04
BRPI0418622A (pt) 2007-05-02
CA2558603A1 (en) 2005-10-20
AU2004318207A1 (en) 2005-10-20
US20080289066A1 (en) 2008-11-20
AU2004318207B2 (en) 2009-12-17
EP1730284A4 (en) 2008-04-30
WO2005096804A3 (en) 2005-11-24
WO2005096804A2 (en) 2005-10-20
JP2007527726A (ja) 2007-10-04

Similar Documents

Publication Publication Date Title
CN1564866B (zh) 自加工的植物及植物部分
AU2004318207B2 (en) Self-processing plants and plant parts
AU2002332666A1 (en) Self-processing plants and plant parts
US20120054915A1 (en) Methods for increasing starch content in plant cobs
JP2009528033A (ja) 改善されたバイオ燃料原料のためのエネルギー作物
CA2704016A1 (en) Methods for increasing starch content in plants
AU2006225290B2 (en) Self-processing plants and plant parts
KR20070007817A (ko) 자가-가공 식물 및 식물 부분
NZ549679A (en) Self-processing plants and plant parts
BR122014007966B1 (pt) Expression cassette comprising an alpha-amylase and a method of obtaining a plant comprising the same
MXPA06010197A (en) Self-processing plants and plant parts

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication