CN1688711A - 在遗传修饰生物中制备酮类胡萝卜素的方法 - Google Patents

在遗传修饰生物中制备酮类胡萝卜素的方法 Download PDF

Info

Publication number
CN1688711A
CN1688711A CNA038242249A CN03824224A CN1688711A CN 1688711 A CN1688711 A CN 1688711A CN A038242249 A CNA038242249 A CN A038242249A CN 03824224 A CN03824224 A CN 03824224A CN 1688711 A CN1688711 A CN 1688711A
Authority
CN
China
Prior art keywords
leu
sequence
seq
ketolase
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038242249A
Other languages
English (en)
Inventor
M·绍尔
R·弗拉赫曼
M·克勒布萨特尔
C·R·朔普费尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SunGene GmbH
Original Assignee
SunGene GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SunGene GmbH filed Critical SunGene GmbH
Publication of CN1688711A publication Critical patent/CN1688711A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0093Oxidoreductases (1.) acting on CH or CH2 groups (1.17)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K10/00Animal feeding-stuffs
    • A23K10/30Animal feeding-stuffs from material of plant origin, e.g. roots, seeds or hay; from material of fungal origin, e.g. mushrooms
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/179Colouring agents, e.g. pigmenting or dyeing agents
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K50/00Feeding-stuffs specially adapted for particular animals
    • A23K50/80Feeding-stuffs specially adapted for particular animals for aquatic animals, e.g. fish, crustaceans or molluscs
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L5/00Preparation or treatment of foods or foodstuffs, in general; Food or foodstuffs obtained thereby; Materials therefor
    • A23L5/40Colouring or decolouring of foods
    • A23L5/42Addition of dyes or pigments, e.g. in combination with optical brighteners
    • A23L5/43Addition of dyes or pigments, e.g. in combination with optical brighteners using naturally occurring organic dyes or pigments, their artificial duplicates or their derivatives
    • A23L5/44Addition of dyes or pigments, e.g. in combination with optical brighteners using naturally occurring organic dyes or pigments, their artificial duplicates or their derivatives using carotenoids or xanthophylls
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/825Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving pigment biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P23/00Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish
    • Y02A40/818Alternative feeds for fish, e.g. in aquacultures

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Polymers & Plastics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Husbandry (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Nutrition Science (AREA)
  • Insects & Arthropods (AREA)
  • Reproductive Health (AREA)
  • Pregnancy & Childbirth (AREA)
  • Physiology (AREA)
  • Mycology (AREA)
  • Botany (AREA)
  • Birds (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明涉及通过培养遗传修饰的生物来制备酮类胡萝卜素的方法、还涉及遗传修饰的生物和它们作为食品和饲料的用途以及用于制备酮类胡萝卜素提取物的用途,其中,所述遗传修饰的生物与野生型相比具有改变的酮酶活性。

Description

在遗传修饰生物中制备酮类胡萝卜素的方法
发明领域
本发明涉及通过培养遗传修饰的生物来制备酮类胡萝卜素的方法、还涉及遗传修饰的生物和它们作为人和动物食物的用途,以及用于制备酮类胡萝卜素提取物的用途,所述遗传修饰的生物与野生型相比具有改变的酮酶活性。
背景技术
类胡萝卜素从头合成于细菌、藻类、真菌和植物中。酮类胡萝卜素(ketocarotenoid,即至少含有一个酮基的类胡萝卜素,例如虾青素(Astaxanthin)、角黄素(Canthaxanthin)、海胆酮(echinenone)、3-羟基海胆酮(3-Hydroxyechinenon)、3’-羟基海胆酮(3′-Hydroxyechinenone)、adonirubin和金盏花黄质(adonixanthin))是由一些藻类和微生物作为次生代谢物产生的天然抗氧化剂和色素。
由于其着色特征,酮类胡萝卜素(特别是虾青素)被作为畜禽营养物的色素辅料,特别是用于鲑鱼、大马哈鱼和虾的饲养中。
目前主要通过化学合成方法制备虾青素。天然酮类胡萝卜素(如天然虾青素)目前通过培养藻类(如雨生红球藻(Haematococcus pluvialis))或发酵遗传优化的微生物并随后分离的生物技术方法少量获得。
因此,经济的制备天然酮类胡萝卜素的生物技术方法非常重要。
已从多种生物中分离出编码酮酶的核酸和相应的蛋白质序列,并进行了注释,如来自Agrobacterium aurantiacum(EP 735 137,注册号D58420)、产碱菌属种PC-1(Alcaligenes sp.PC-1)(EP 735137,注册号D58422)、雨生红球藻Flotow em.Wille(Haematococcus pluvialis Flotow em.Wille)、雨生红球藻,NIES-144(EP 725137,WO 98/18910和Lotan等人,FEBS Letters1995,364,125-128,注册号:X86782和D45881)、Paracoccus marcusii(注册号:Y15112)、集胞藻属PC6803株(Synechocystis sp.Strain PC6803)(注册号:NP_442491)、慢生根瘤菌属种(Bradyrhizobium sp.)(注册号:AF218415)和念珠藻属种(Nostoc sp.)PCC 7120(Kaneko等人,DNA Res.2001,8(5),205-213;注册号:AP003592,BAB74888)的编码酮酶的核酸。
EP 735 137描述了通过向微生物引入来自Agrobacteriumaurantiacum或碱杆菌属PC-1的酮酶基因(crtW),在微生物(如大肠杆菌)中制备叶黄素(xanthophylls)的方法。
EP 725 137、WO 98/18910、Kajiwara等人(Plant Mol.Biol.1995,29,343-352)和Hirschberg等人(FEBS Letters 1995,364,125-128)公开了通过向大肠杆菌引入来自雨生红球藻的酮酶基因(crtW、crtO或bkt)来制备虾青素的方法。
Hirschberg等人(FEBS Letters 1997,404,129-134)描述了通过引入来自雨生红球藻的酮酶基因(crtO)在聚球藻(Synechococcus)中制备虾青素的方法。Sandmann等人(Photochemistry and Photobiology 2001,73(5),551-55)描述了一种类似的方法,然而这种方法导致角黄素的产生,并只获得痕量的虾青素。
WO 98/18910和Hirschberg等人(Nature Biotechnology 2000,18(8),888-892)描述了通过向烟草引入来自雨生红球藻的酮酶基因(crtO),在烟草花的蜜腺中合成酮类胡萝卜素。
WO 01/20011描述了在油料种子作物(如欧洲油菜、向日葵、大豆和芥菜)的种子中产生酮类胡萝卜素的DNA构建体,所述构建体使用种子特异的启动子和来自雨生红球藻的酮酶。
现有技术中描述的所有制备酮类胡萝卜素的方法(特别是描述的制备虾青素的方法)具有转基因生物产生大量羟化副产物(如玉米黄质和金盏花黄质)的缺点。
发明概述
本发明的目的之一是提供通过培养遗传修饰的生物来制备酮类胡萝卜素的方法,并且还提供产生酮类胡萝卜素的遗传修饰生物,本发明的生物体彻底杜绝以上描述的现有技术的缺点,或将其降到更小的程度。
我们发现利用通过培养遗传修饰的生物来制备酮类胡萝卜素的方法能够实现这一目标,所述遗传修饰生物的酮酶活性相对于野生型的发生改变,改变的酮酶活性来自含有SEQ.ID.NO:2氨基酸序列或对SEQ.ID.NO:2序列进行置换、插入或缺失氨基酸后产生的在氨基酸水平上与这一序列具有至少42%一致性的序列的酮酶。
本发明生物(如微生物或植物)优选能够作为起始生物天然产生类胡萝卜素(如β-胡萝卜素或玉米黄质)或能够通过遗传修饰(如调节代谢途径或互补)来产生类胡萝卜素(如β-胡萝卜素或玉米黄质)。
一些生物作为起始或野生型生物已经能够产生酮类胡萝卜素(如虾青素或角黄素)。这些生物(如雨生红球藻、paracoccus marcusii、Xanthophyllomyces dendrorhous、环状芽孢杆菌(Bacillus circulans)、绿球藻(Chlorococcum)、Phaffia rhodozyma、侧金盏花属(adonis)、Neochloriswimmeri、原管藻(Protosiphon botryoides)、Scotiellopsis oocystiformis、Scenedesmus vacuolatus、Chlorela zofingiensis、Ankistrodesmus braunii、血红裸藻(Euglena sanguinea)、Bacillus atrophaeus、布拉霉(Blakeslea))作为起始或野生型生物已经具有酮酶活性。
因此,在本发明方法的一个实施方案中,使用的起始生物是作为野生型或起始生物已经具有酮酶活性的生物。在此实施方案中,遗传修饰使酮酶活性相对于野生型或起始生物而言增强。
酮酶活性指的是酮酶的酶活性。
酮酶指的是一种蛋白质,该蛋白质具有在类胡萝卜素的β-芷香酮环(任选取代的)上引入酮基的酶活性。
酮酶尤其指具有将β-胡萝卜素转变成角黄素的酶活性的蛋白质。
因此,酮酶活力指一定时间内由酮酶蛋白质转化的β-胡萝卜素的量或生成的角黄素的量。
因此,当酮酶活力相对于野生型增强时,在一定时间内由酮酶蛋白质转化的β-胡萝卜素的量或生成的角黄素的量相对于野生型而言增加。
高出的酮酶活力优选至少是野生型酮酶活力的5%,更优选的至少20%、更优选的至少50%、更优选的至少100%、优选至少300%、更优选至少500%,特别是至少600%。
根据本发明,术语“野生型”指的是相应的起始生物。
根据上下文,术语“生物”可以指起始生物(野生型)或本发明遗传修饰的生物,或指二者。
在任何情况下,“野生型”指用作酮酶活力的增加或产生、此后描述的羟化酶活力的增加、此后描述的β-环化酶活力的增加及酮类胡萝卜素含量的增加的参照的参照生物,优选并且特别是在不能明确指定生物或野生型的情况下。
对于作为野生型已具有酮酶活力的微生物而言,参照生物优选雨生红球藻。
对于作为野生型不具有酮酶活力的微生物而言,参照生物优选布拉霉。
对于作为野生型已具有酮酶活力的植物而言,参照生物优选夏侧金盏花(Adonis aestivalis)、火焰金盏花(Adonis flammeus)或Adonis annuus,特别优选的是夏侧金盏花。
对于作为野生型在花瓣中不具有酮酶活力的植物而言,参照生物优选万寿菊(Tagetes erecta)、孔雀草(Tagetes patula)、香叶万寿菊(Tageteslucida)、Tagetes pringlei、Tagetes palmeri、Tagetes minuta或Tagetescampanulata,特别优选的是万寿菊。
优选在以下条件测定本发明遗传修饰的生物和野生型以及参照生物的酮酶活力:
植物或微生物材料中酮酶活力的测定基于Frazer等人的方法(J.Biol.Chem.272(10):6128-6135,1997)。使用β-胡萝卜素和角黄素底物,在脂质(大豆卵磷脂)和去污剂(胆酸钠)存在的情况下测定植物或微生物提取物的酮酶活力。通过HPLC手段测量酮酶试验的底物/产物比例。
有多种可以增加酮酶活力的方式,如通过在翻译和蛋白质水平关闭抑制性调节机制或通过相对于野生型增加编码酮酶的核酸的基因表达(如通过激活剂诱导酮酶基因或通过向生物引入编码酮酶的核酸)。
在此实施方案中,根据本发明,增加编码酮酶的核酸的基因表达也指操纵生物体自身的内源酮酶的表达。可以通过如修饰酮酶编码基因的启动子DNA序列来实现这一点。也可以通过缺失或插入DNA序列来实现这类导致至少改变或优选地增加一种内源酮酶基因的表达率的修饰。
如前文所述,可以通过应用外源刺激来改变至少一种内源酮酶的表达。可以通过特定的生理条件(即通过应用外源物质)来实现这一点。
还有的实现至少增加一种内源酮酶基因表达的可能方案是使用在野生型生物中不具有的或被修饰后与酮酶基因的启动子相作用的调节蛋白。
这类调节物可以是如WO 96/06166中所描述的由DNA结合域和转录激活域所组成的嵌合蛋白质。
在一个优选的实施方案中,通过增加编码酮酶的核酸的基因表达来实现酮酶活力相对于野生型的增加,所述核酸编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列。
在另一优选的实施方案中,通过向生物引入编码酮酶的核酸来增加编码酮酶的核酸的基因表达,其中所述酮酶具有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列。
因此,在此实施方案中,相对于野生型,至少还有一个酮酶基因存在于本发明转基因生物中,该基因编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列。
因此,在此实施方案中,本发明遗传修饰的生物具有至少一个编码酮酶的外源(即异源)核酸,或具有至少两个编码酮酶的内源核酸,其中所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列。
在本发明方法的另一优选实施方案中,用作起始生物的生物在野生型时不具有酮酶活性。
在此优选的实施方案中,遗传修饰使生物具有酮酶活性。因此,在此优选的实施方案中,本发明遗传修饰的生物相对于未经遗传修饰的野生型具有酮酶活性,并因此优选能够转基因表达含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列的酮酶。
在此优选的实施方案中,类似于前文描述的增加编码酮酶的核酸的基因表达,优选地通过向起始生物引入编码酮酶的核酸来造成编码酮酶的核酸的基因表达,其中所述核酸编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列。
在两个实施方案中对于这一目的而言,原则上可以使用所有编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列的核酸。
令人吃惊的是,相对于应用现有技术中使用的酮酶基因,使用本发明编码酮酶的核酸在本发明方法中导致具有更少量的羟化副产物的酮类胡萝卜素。
在本说明书中提及的所有核酸可以是如RNA、DNA或cDNA序列。
对于来源于真核生物并含有内含子的基因组酮酶序列,在宿主生物不能或不能通过改造来表达相应酮酶时,优选使用已经被加工的核酸序列,如相应的cDNA。
可以有利地用于本发明方法中的编码酮酶的核酸及含有SEQ.ID.NO:2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列的相应酮酶的例子有来自以下的序列:
念珠藻(Nostoc sp.)PCC7120株(注册号:AP003592、BAB74888;核酸:SEQ ID NO:1,蛋白质SEQID NO:2),
点形念珠藻(Nostoc punctiforme)ATTC 29133,核酸:Acc.No.NZ_AABC01000195,碱基对55,604到55,392(SEQ ID NO:3);蛋白质:Acc.No.ZP_00111258(SEQ ID NO:4)(注释为推定的蛋白质)或
点形念珠藻(Nostoc punctiforme)ATTC 29133,核酸:Acc.No.NZ_AABC01000196,碱基对140,571到139,810(SEQ ID NO:5),蛋白质:(SEQ ID NO:6)(无注释)
聚球藻属种(Synechococcus sp.)WH8102,核酸:Acc.No.NZ_AABD01000001,碱基对1,354,725-1,355,528(SEQ ID NO:46),蛋白质:Acc.No.ZP_00115639(SEQ ID NO:47)(注释为推定的蛋白质),
泡沫节球藻(Nodularia spumigena)NSOR10,(注册号:AY210783,AAO64399;核酸:SEQ ID NO:52,蛋白质:SEQ ID NO:53)
或衍生自所述序列的酮酶序列,如:
分别来自例如序列SEQ ID NO:4和SEQ ID NO:3的变异/突变的、序列SEQ ID NO:8或10的酮酶和相应核酸编码序列SEQ ID NO:7或SEQ ID NO:9,
分别来自如序列SEQ ID NO:6和SEQ ID NO:5的变异/突变的、序列SEQ ID NO:12或14的酮酶和相应核酸编码序列SEQ ID NO:11或SEQ ID NO:13,
分别来自如序列SEQ ID NO:47和SEQ ID NO:46的变异/突变的、序列SEQ ID NO:49或51的酮酶和相应核酸编码序列SEQ ID NO:48或SEQ ID NO:50,
可以容易的发现能够用于本发明方法的其它酮酶和酮酶基因的天然例子,例如比较数据库中的氨基酸序列或相应的反向翻译的核酸序列与前文描述的SEQ ID NO:2序列的一致性,可以从多种已知基因组序列的生物中发现其它酮酶和酮酶基因。
此外,还可以根据上述核酸序列,特别是根据SEQ ID NO:1序列,通过众所周知的杂交技术从多种未知基因组序列的生物中容易的发现其它酮酶及酮酶基因的天然例子。
可以在温和(低严紧性)或优选严紧(高严紧性)的条件下进行杂交。
这些类型的杂交条件描述于如Sambrook,J.,Fritsch,E.F.,Maniatis,T.,《Molecular Cloning(A Laboratory Manual)》,第二版,Cold SpringHarbor Laboratory Press,1989,9.31-9.57页或Current Protocols inMolecular Biology,John Wiley & Sons,N.Y.(1989),6.3.1-6.3.6。
例如,洗涤步骤的条件可以从低严紧性(在50℃使用2X SSC)和高严紧性(在50℃,优选在65℃使用0.2X SSC)所限定的条件范围中选泽(20X SSC:0.3M柠檬酸钠,3M氯化钠,pH 7.0)。
在洗涤步骤中还可以将温度从温和条件的室温(22℃)上升到严紧条件的65℃。
可以同时改变盐浓度和温度参数,也可以保持两参数中的一个恒定,只改变另一个。在杂交过程中也可以使用变性剂,如甲酰胺或SDS。优选在42℃下进行存在50%甲酰胺的杂交。
以下给出了一些杂交条件和洗涤步骤的例子:
(1)杂交条件的例子
(i)65℃、4X SSC,或
(ii)45℃、6X SSC,或
(iii)68℃、6X SSC、100mg/ml变性鱼精DNA,或
(iv)68℃、6X SSC、0.5% SDS、100mg/ml变性并片段化的鲑精DNA,或
(v)42℃、6X SSC、0.5% SDS、100mg/ml变性并片段化的鲑精DNA、50%甲酰胺,或
(vi)42℃、50%甲酰胺、4X SSC,或
(vii)42℃、50%(vol/vol)甲酰胺、0.1%牛血清白蛋白、0.1%Ficoll、0.1%聚乙烯吡咯烷酮、50mM磷酸钠缓冲液(pH 6.5)、750mM NaCl、75mM柠檬酸钠,或
(viii)50℃、2X或4X SSC(温和条件),或
(ix)42℃、30到40%甲酰胺、2X或4X SSC(温和条件)。
(2)使用如下条件的洗涤步骤,各10分钟
(i)50℃、0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS,或
(ii)65℃、0.1X SSC,或
(iii)68℃、0.1X SSC、0.5%SDS,或
(iv)42℃、0.1X SSC、0.5%SDS、50%甲酰胺,或
(v)42℃、0.2X SSC、0.1%SDS,或
(vi)65℃、2X SSC(温和条件)。
在本发明方法的一个优选实施方案中,引入编码酮酶的核酸,其中所述酮酶含有SEQ.ID.NO:2氨基酸序列或对SEQ.ID.NO:2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少50%、优选至少60%、优选至少65%、优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、特别优选具有至少98%一致性的序列。
酮酶序列还可以是天然序列,该序列可以通过前文描述的方式利用序列一致性比较从其它生物发现,或者酮酶序列可以是对SEQ.ID.NO:2序列通过人工变异(如氨基酸的置换、插入或缺失)进行修饰而成的人工序列。
术语“置换”在本说明书中指一个或多个氨基酸被一个或多个氨基酸所替换。优选实施所谓的保守置换,其中替代的氨基酸与原来的氨基酸具有相似的性质,如Glu被Asp、Gln被Asn、Val被Ile、Leu被Ile、Ser被Thr所置换。
“缺失”是用直接的键接置换氨基酸。优选的缺失位置是多肽的末端和独立的蛋白质结构域之间的连接部位。
“插入”是通过用一个或多个氨基酸在形式上置换直接的键接来向多肽链引入氨基酸。
两个蛋白质之间的一致性指的是跨越各蛋白质全长的氨基酸的一致性,尤其是使用Informax(USA)提供的vector NTI 7.1版软件和clustal方法(Higgins DG,Sharp PM.Fast and sensitive multiple sequencealignments on a microcomputer.Comput Appl.Biosci.1989 Apr;5(2):151-1),设定下述参数,通过比较计算出的一致性:
序列多重比对参数:
空位开放罚分(gap opening penalty)          10
空位扩展罚分(gap extension penalty)        10
空位分离罚分范围                           8
空位分离罚分(gap separation penalty)       关闭
用于序列比对延迟的一致性%                 40
(%identity for alignment delay)
残基特异性空位(Residue specific gap)       关闭
亲水残基空位(Hydrophilic residue gap)      关闭
转换权重(transition weighing)              0
成对序列比对参数:
FAST运算法则                               使用
K-tuple尺寸                                1
空位罚分                                   3
窗口尺寸                                   5
最佳对角线数目(Number of best diagonals)   5
因此,与SEQ ID NO:2序列在氨基酸水平上具有至少42%一致性的酮酶指的是该酮酶的序列与SEQ ID NO:2序列相比(特别是使用基于以上设置的参数的上述程序对数)具有至少42%的一致性。
例如,使用基于以上设置的参数的上述程序对数,来自点形念珠藻(Nostoc punctiforme)A TTC 29133的酮酶序列(SEQ ID NO:4)表现出与来自念珠藻属种PCC7120株的酮酶序列(SEQ ID NO:2)有64%的一致性。
来自梅型念珠藻ATCC 29133的第二种酮酶的序列(SEQ ID NO:6)与例如来自念珠藻属种PCC7120株的酮酶序列(SEQ ID NO:2)具有58%的一致性。
来自聚球藻属种(Synechococcus sp.)WH8102的酮酶的序列(SEQ IDNO:47)与例如来自念珠藻属种PCC7120株的酮酶序列(SEQ ID NO:2)具有44%的一致性。
合适的核酸序列可以例如依据遗传密码,通过反向翻译多肽序列获得。
优选用于这一目的的密码子是基于生物特异的密码子选择被频繁使用的密码子。通过用计算机分析相关生物的其它已知基因,可以容易的发现此密码子选择。
在一特别优选的实施方案中,将含有SEQ ID NO:1序列的核酸引入生物。
此外,通过从核苷酸单元开始进行化学合成,可以以本身已知的方式制备上述所有酮酶基因,例如可以利用各单个重叠互补的双螺旋核酸单元的片段缩合来制备。可以化学合成寡核苷酸,例如通过已知方式的亚磷酰胺法(Voet,Voet,第二版,Wiley Press New York,896-897页)。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补间隙及连接反应和一般的克隆方法被描述于Sambrook等人(1989),Molecular cloning:Alaboratory manual,Cold Spring Harbor Laboratory Press。
来自念珠藻属PCC7120株的酮酶序列(SEQ ID NO:2)与现有技术方法中使用的酮酶序列表现出39%(Agrobacterium aurantiacum(EP 735137),注册号:D58420)、40%(产碱菌属种PC-1(EP 735137),注册号:D58422)和20到21%(雨生红球藻Flotow em.Wille和雨生红球藻,NIES144(EP 725137,WO 98/18910和Lotan等人,FEBS Letters 1995,364,125-128),注册号:X86782和D45881)的一致性。
在一个优选的实施方案中,培养相对于野生型除具有增强的酮酶活力外,还具有增强的羟化酶活力和/或β-环化酶活力的生物。
羟化酶活力指的是羟化酶的酶活力。
羟化酶指的是一种蛋白质,所述蛋白质具有在类胡萝卜素的β-芷香酮环(任选取代的)上引入羟基的酶活性。
羟化酶尤其指的是这样一种蛋白质,所述蛋白质具有将β-胡萝卜素转化成玉米黄质或将角黄素转化成虾青素的酶活性。
因此,羟化酶活力指的是由羟化酶蛋白质转化的β-胡萝卜素或角黄素的量,或生成的玉米黄质或虾青素的量。
因此,当羟化酶活力相对于野生型增加时,在一定时间内由羟化酶蛋白质转化的β-胡萝卜素或角黄素的量或生成的玉米黄质或虾青素的量相对于野生型而言增加。
高出的羟化酶活力优选至少是野生型羟化酶活力的5%,进一步优选至少20%、进一步优选至少50%、进一步优选至少100%、更优选至少300%、甚至更优选至少500%,特别是至少600%。
β-环化酶活力指的是β-环化酶的酶活力。
β-环化酶指的是一种蛋白质,所述蛋白质具有将末端的线性番茄红素残基转化成β-芷香酮环的酶活性。
β-环化酶尤其指的是这样一种蛋白质,所述蛋白质具有将γ-胡萝卜素转化成β-胡萝卜素的酶活性。
因此,β-环化酶活力指的是在一定时间内由β-环化酶蛋白质转变的γ-胡萝卜素的量,或生成的β-胡萝卜素的量。
因此,当β-环化酶活力相对于野生型增加时,在一定时间内由β-环化酶蛋白质转化的番茄红素或γ-胡萝卜素的量或从番茄红素产生的γ-胡萝卜素的量或从γ-胡萝卜素产生的β-胡萝卜素的量相对于野生型而言增加。
高出的β-环化酶活力优选至少是野生型β-环化酶活力的5%,进一步优选至少20%、进一步优选至少50%、进一步优选至少100%、更优选至少300%、甚至更优选至少500%,特别是至少600%。
优选在以下条件测定本发明遗传修饰生物和野生型以及参照生物的羟化酶活力:
由Bouvier等人的方法(Biochim.Biophys.Acta 1391(1998),320-328)体外测定羟化酶活力。向规定量的生物提取物加入铁氧还蛋白、铁氧还蛋白-NADP氧化还原酶、过氧化氢酶、NADPH和β-胡萝卜素以及单和双半乳糖甘油酯。
特别优选在Bouvier、Keller、d′Harlingue和Camara(Xanthophyllbiosynthesis:molecular and functional characterization of carotenoidhydroxylases from pepper fruits(Capsicum annuum L.);Biochim.Biophys.Acta 1391(1998),320-328)的下述条件测定羟化酶活力:
在0.250ml的体积中进行体外分析。混合物含有50mM磷酸钾(pH7.6)、0.025mg菠菜铁氧还蛋白、0.5单位铁氧还蛋白-NADP+氧化还原酶、0.25mM NADPH、0.010mg β-胡萝卜素(在0.1mg Tween 80中乳化)、0.05mM的单和双半乳糖甘油酯混合物(1∶1)、1单位的过氧化氢酶(catalysis)、200单和双半乳糖甘油酯(1∶1)、0.2mg牛血清白蛋白和不同体积的生物提取物。在30℃将反应混合物孵育2小时。使用有机溶剂(如丙酮或氯仿/甲醇(2∶1))抽提反应产物,并通过HPLC测定。
优选在以下条件测定本发明遗传修饰生物和野生型以及参照生物的β-环化酶活力:
由Fraser和Sandmann的方法(Biochem.Biophys.Res.Comm.185(1)(1992)9-15)体外测定β-环化酶活力。向规定量的生物提取物加入作为缓冲液的磷酸钾(pH 7.6)、作为底物的番茄红素、以及红辣椒(paprika)基质蛋白质、NADP+、NADPH和ATP。
特别优选在Bouvier、d′Harlingue和Camara (Molecular Analysis ofcarotenoid cyclase inhibition;Arch.Biochem.Biophys.346(1)(1997)53-64)的下述条件测定β-环化酶活力:
在250μl的体积中进行体外分析。混合物含有50mM磷酸钾(pH 7.6)、不同量的生物提取物、20nM番茄红素、250μg红辣椒有色体基质蛋白质、0.2mM NADP+、0.2mM NADPH和1mM ATP。将NADP/NADPH和ATP溶解于含有1mg Tween 80的10ml乙醇后立即加入孵育介质。在30℃反应60分钟后,加入氯仿/甲醇(2∶1)终止反应。用氯仿抽提反应产物,并通过HPLC分析。
Fraser和Sandmann描述了一种使用放射性底物的替代性分析(Biochem.Biophys.Res.Comm.185(1)(1992)9-15)。
可以通过多种方式增加羟化酶和/或β-环化酶的活力,如通过在表达和蛋白质水平关闭抑制性调节机制或相对于野生型增加编码羟化酶和/或β-环化酶的核酸的基因表达。
同样有多种方式可以相对于野生型增加编码羟化酶和/或β-环化酶的核酸的基因表达,例如通过激活剂诱导羟化酶基因和/或β-环化酶基因,或向生物引入一个或多个羟化酶基因拷贝和/或β-环化酶基因拷贝,即向生物引入至少一个编码羟化酶的核酸和/或至少一个编码β-环化酶的核酸。
根据本发明,增加编码羟化酶和/或β-环化酶的核酸的基因表达也指操纵生物自身的内源羟化酶和/或β-环化酶的表达。
可以通过如修饰羟化酶和/或β-环化酶编码基因的启动子DNA序列来实现这一点。也可以通过如缺失或插入DNA序列来实现这类导致基因表达率增加的修饰。
如前文所述,可以通过应用外源刺激来修饰内源羟化酶和/或β-环化酶的表达。这可以通过特定生理条件(即通过应用外源物质)来实现。
还有的用于修饰或增加内源羟化酶和/或β-环化酶基因表达的可能方案是使调节蛋白与此基因的启动子相互作用,所述调节蛋白不存在于未转化的生物中。
这类调节物可以是如WO 96/06166中所描述的由DNA结合域和转录激活域组成的嵌合蛋白质。
在一个优选的实施方案中,通过向生物引入至少一个编码羟化酶的核酸和/或引入至少一个编码β-环化酶的核酸来增加编码羟化酶和/或β-环化酶的核酸的基因表达。
原则上,任何羟化酶基因或任何β-环化酶基因(即任何编码羟化酶的核酸和任何编码β-环化酶的核酸)都可用于此目的。
对于来源于真核并含有内含子的羟化酶或β-环化酶基因组核酸序列,在宿主生物不能或不能通过改造来表达相应羟化酶或β-环化酶时,优选使用已经被加工的核酸序列,如相应的cDNA。
羟化酶基因的例子之一是来自雨生红球藻的编码羟化酶的核酸(注册号:AX038729,WO0061764);(核酸:SEQ ID NO:15,蛋白质:SEQ ID NO:16)。
β-环化酶基因的例子之一是来自番茄的编码β-环化酶的核酸(注册号:X86452)(核酸:SEQ ID NO:17,蛋白质:SEQ ID NO:18)。
因此,在此优选实施方案中,相对于野生型,本发明优选的转基因生物中具有至少一个另外的羟化酶基因和/或β-环化酶基因。
在此优选的实施方案中,遗传修饰的生物具有例如至少一个编码羟化酶的外源核酸,或至少两个编码羟化酶的内源核酸,和/或至少一个编码β-环化酶的外源核酸,或至少两个编码β-环化酶的内源核酸。
用于以上描述的优选实施方案的优选羟化酶基因是编码如下蛋白质的核酸,所述蛋白质含有SEQ ID NO:16氨基酸序列或对此序列进行置换、插入或缺失氨基酸后产生的具有羟化酶的酶学性质并与SEQ ID NO:16序列在氨基酸水平上具有至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%的一致性的序列。
羟化酶和羟化酶基因的其他例子可以例如如前文所述,通过将数据库中的氨基酸序列或反向翻译的相应核酸序列与SEQ ID NO:16进行同源性比较,从多种已知基因组序列的生物中容易的发现。
此外,羟化酶和羟化酶基因的其它例子还可以如前文所述,例如基于SEQ ID NO:15,通过杂交和PCR技术,以本身已知的方式从多种未知基因组序列的生物中容易的发现。
在另一特别优选的实施方案中,通过向生物引入编码蛋白质的核酸来增加羟化酶活力,所述蛋白质含有SEQ ID NO:16的羟化酶氨基酸序列。
合适的核酸序列可以例如,依据遗传密码,通过反向翻译多肽序列获得。
用于这一目的的密码子优选是根据生物特异的密码子选择而频繁使用的密码子。通过用计算机分析相关生物的其它已知基因,可以容易的发现此密码子选择。
在一特别优选的实施方案中,将含有SEQ.ID.NO:15序列的核酸引入生物。
优选的用于以上描述的优选实施方案的β-环化酶基因是编码如下蛋白质的核酸,所述蛋白质含有SEQ ID NO:18氨基酸序列或对此序列进行置换、插入或缺失氨基酸后产生的具有β-环化酶的酶学性质并与SEQ ID NO:18序列在氨基酸水平上具有至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%、最优选至少95%的一致性的序列。
β-环化酶和β-环化酶基因的其他例子可以如前文所述,例如通过将数据库中的氨基酸序列或反向翻译的相应核酸序列与SEQ ID NO:18进行同源性比较,从多种已知基因组序列的生物中容易的发现。
此外,β-环化酶和β-环化酶基因的其它例子还可以如前文所述,例如基于SEQ ID NO:17,通过杂交和PCR技术,以本身已知的方式从多种未知基因组序列的生物中容易的发现。
在另一特别优选的实施方案中,通过向生物引入编码蛋白质的核酸来增加β-环化酶活力,所述蛋白质含有SEQ ID NO:18的β-环化酶氨基酸序列。
合适的核酸序列可以例如,依据遗传密码,通过反向翻译多肽序列获得。
用于这一目的的密码子优选是依据生物特异的密码子选择而频繁使用的密码子。通过用计算机分析相关生物的其它已知基因,可以容易的发现此密码子选择。
在一特别优选的实施方案中,将含有SEQ.ID.NO:17序列的核酸引入生物。
此外,可以以本身已知的方式,通过化学合成,从核苷酸单元制备上述所有羟化酶或β-环化酶基因,例如通过对各重叠的互补双螺旋核酸单元进行片段缩合来制备。可以化学合成寡核苷酸,例如以已知方式通过亚磷酰胺法(Voet,Voet,第二版,Wiley Press New York,896-897页)制备。添加合成的寡核苷酸、使用DNA聚合酶的Klenow片段填补间隙及连接反应以及一般的克隆方法被描述于Sambrook等人(1989),Molecular cloning:Alaboratory manual,Cold Spring Harbor Laboratory Press。
特别优选的用于本发明方法的遗传修饰生物具有以下的遗传修饰组合:
遗传修饰的生物相对于野生型具有增加的或造成的酮酶活力以及增加的羟化酶活力。
遗传修饰的生物相对于野生型具有增加的或造成的酮酶活力以及增加的β-环化酶活力,和
遗传修饰的生物相对于野生型具有增加的或造成的酮酶活力以及增加的羟化酶活力和增加的β-环化酶活力。
如此后所描述的,可以通过如引入各单个核酸构建体(表达盒)或引入包含2种或3种所述活力的多重构建体来产生这些遗传修饰生物。
根据本发明,优选地,生物指的是作为野生型或起始生物能够天然产生或通过遗传互补和/或代谢路径的调节来产生类胡萝卜素、特别是β-胡萝卜素和/或玉米黄质和/或新黄素和/或紫黄质和/或黄体素的生物。
还有的优选生物作为野生型或起始生物已经具有羟化酶活力,因此作为野生型或起始生物能够产生玉米黄质。
优选的生物是植物或微生物,如细菌、酵母、藻类或真菌。
能够利用的细菌是由于引入生产类胡萝卜素的生物的类胡萝卜素生物合成基因而能合成叶黄素的细菌(如含有例如欧文氏菌(Erwinia)来源的crt基因的埃希氏杆菌属(Escherichia)细菌)和自身能够合成叶黄素的细菌(如欧文氏菌属、农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium)、产碱菌属(Alcaligenes)、副球菌属(Paracoccus)、念珠藻属的细菌或集胞藻属的蓝细菌(Cyanobacteria))。
优选的细菌是大肠杆菌(Escherichia coli)、草生欧文氏菌(Erwiniaherbicola)、噬夏孢欧文氏菌(Erwinia uredovora)、Agrobacteriumaurantiacum、产碱菌属种PC-1、黄杆菌属种R1534菌株、集胞藻属蓝细菌PCC6803、Paracoccus marcusii或Paracoccus carotinifaciens。
优选的酵母是假丝酵母(Candida)、酵母(Saccharomyces)、汉逊酵母(Hansenula)、毕赤酵母(Pichia)或法夫酵母(Phaffia)。特别优选的酵母有Xanthophyllomyces dendrorhous或Phaffia rhodozyma。
优选的真菌有曲霉(Aspergillus)、木霉(Trichoderma)、阿舒囊霉(Ashbya)、脉孢菌(Neurospora)、布拉霉(Blakeslea)、须霉(Phycomyces)、镰孢霉(Fusarium)或描述于Indian Chem.Engr.Section B.Vol.37,No.1,2(1995)15页,表6的其它真菌。
优选的藻类有绿藻,如红球藻属(Haematococcus)、三角褐指藻(Phaedactylum tricornatum)、团藻属(Volvox)或杜氏藻属(Dunaliella)的藻。特别优选的藻类有雨生红球藻或Dunaliella bardawil。
为了实行本发明方法,可使用的其它微生物及其制备公开于例如,这里引入为参考的DE-A-199 16 140。
特别优选的植物选自毛茛科(Ranunculaceae)、小檗科(Berberidaceae)、罂粟科(Papaveraceae)、大麻科(Cannabaceae)、蔷薇科(Rosaceae)、Fabaceae、亚麻科(Linaceae)、葡萄科(Vitaceae)、十字花科(Brassicaceae)、葫芦科(Cucurbitaceae)、报春花科(Primulaceae)、石竹科(Caryophyllaceae)、苋科(Amaranthaceae)、龙胆科(Gentianaceae)、牻牛儿苗科(Geraniaceae)、忍冬科(Caprifoliaceae)、木犀科(Oleaceae)、旱金莲科(Tropaeolaceae)、茄科(Solanaceae)、玄参科(Scrophulariaceae)、菊科(Asteraceae)、百合科(Liliaceae)、石蒜科(Amaryllidaceae)、禾本科(Poaceae)、兰科(Orchidaceae)、锦葵科(Malvaceae)、Illiaceae或唇形科(Lamiaceae)。
极其优选的植物选自万寿菊属(Marigold)、万寿菊(Tagetes erecta)、孔雀草(Tagetespatula)、金合欢属(Acacia)、乌头属(Aconitum)、侧金盏花属(Adonis)、阿尼菊属(Arnica)、耧斗菜属(Aquilegia)、紫菀属(Aster)、黄芪属(Astragalus)、紫葳属(Bignonia)、金盏花属(Calendula)、驴蹄草属(Caltha)、风铃草属(Campanula)、美人蕉属(Canna)、矢车菊属(Centaurea)、桂竹香属(Cheiranthus)、茼蒿属(Chrysanthemum)、柑桔属(Citrus)、还阳参属(Crepis)、番红花属(Crocus)、南瓜属(Curcurbita)、金雀儿属(Cytisus)、Delonia属、翠雀属(Delphinium)、石竹属(Dianthus)、康乃馨属(Dimorphotheca)、多榔菊属(Doronicum)、花菱草属(Eschscholtzia)、连翘属(Forsythia)、Fremontia属、勋章菊属(Gazania)、钩吻属(Gelsemium)、染料木属(Genista)、龙胆属(Gentiana)、老鹳草属(Geranium)、非洲菊属(Gerbera)、路边青属(Geum)、银桦属(Grevillea)、堆心菊属(Helenium)、向日葵属(Helianthus)、细辛属(Hepatica)、独活属(Heracleum)、木槿属(Hisbiscus)、赛菊芋属(Heliopsis)、金丝桃属(Hypericum)、黄金菊属(Hypochoeris)、凤仙花属(Impatiens)、鸢尾属(Iris)、蓝花楹属(Jacaranda)、棣堂属(Kerria)、毒豆属(Laburnum)、山黧豆属(Lathyrus)、猫耳草属(Leontodon)、百合属(Lilium)、亚麻属(Linum)、百脉根属(Lotus)、番茄属(Lycopersicon)、珍珠菜属(Lysimachia)、Maratia属、苜蓿属(Medicago)、沟酸浆属(Mimulus)、水仙属(Narcissus)、月见草属(Oenothera)、木犀属(Osmanthus)、碧冬茄属(Petunia)、石楠属(Photinia)、酸浆属(Physalis)、牧根草属(Phyteuma)、委陵草属(Potentilla)、火棘属(Pyracantha)、毛茛属(Ranunculus)、杜鹃花属(Rhododendron)、蔷薇属(Rosa)、金光菊属(Rudbeckia)、千里光属(Senecio)、蝇子草属(Silene)、松香草属(Silphium)、Sinapsis属、花楸属(Sorbus)、鹰爪豆属(Spartium)、黄钟花属(Tecoma)、蝴蝶草属(Torenia)、婆罗们参属(Tragopogon)、金莲花属(Trollius)、旱金莲属(Tropaeolum)、郁金香属(Tulipa)、款冬属(Tussilago)、荆豆属(Ulex)、堇菜属(Viola)或百日草属(Zinnia)植物,特别优选万寿菊属(Marigold)、万寿菊(Tagetes erecta)、孔雀草(Tagetes patula)、番茄属(Lycopersicon)、蔷薇属(Rosa)、金盏花属(Calendula)、酸浆属(Physalis)、苜蓿属(Medicago)、向日葵属(Helianthus)、茼蒿属(Chrysanthemum)、紫菀属(Aster)、郁金香属(Tulipa)、水仙属(Narcissus)、碧冬茄属(Petunia)、老鹳草属(Geranium)、旱金莲属(Tropaeolum)或侧金盏花属(Adonis)植物。
在本发明制备酮类胡萝卜素的方法中,优选在培养遗传修饰的生物之后收获生物,并进一步优选从生物中分离酮类胡萝卜素。
收获生物可以以众所周知的适合特定生物的方式进行。可以通过例如离心、滗析或过滤移走在液体营养培养基中发酵培养的微生物,如细菌、酵母、藻类或真菌或植物细胞。植物可以以众所周知的方式生长于营养培养基中,并适当时收获。
优选在有氧、至少约20℃的培养温度(例如20℃到40℃)、pH约6-9的条件下培养遗传修饰的微生物。对于遗传修饰的微生物,优选最初于有氧条件下复杂培养基(如TB或LB培养基)中在约20℃或更高温度、pH约6到9条件下培养,直到达到足够的细胞密度。为了能更好的控制氧化反应,优选使用可诱导的启动子。诱导酮酶表达后继续在有氧条件下培养如12小时到3天。
可以用已知的方式从收获的生物质中分离酮类胡萝卜素,如通过抽提,并适当时经进一步的化学或物理纯化方法,例如沉淀法、结晶、热分离法(如精馏法)或物理分离法(如层析)。
如以下所提及,可以在本发明遗传修饰的植物中特异地产生酮类胡萝卜素,优选在多种植物组织(如种子、叶、果实、花,特别是花瓣)中产生。
可以以已知的方式从收获的花瓣中分离酮类胡萝卜素,例如通过干燥并随后抽提,以及适当时进一步利用化学或物理纯化方法,例如沉淀法、结晶、热分离法(如精馏法)或物理分离法(如层析)。例如,优选使用有机溶剂(如丙酮、己烷、乙醚或叔-丁基甲基醚)从花瓣中分离酮类胡萝卜素。
还有的分离酮类胡萝卜素的方法(特别是从花瓣中分离)描述于如Egger和Kleinig(Phytochemistry(1967)6,437-440)和Egger(Phytochemistry(1965)4,609-618)中。
优选的酮类胡萝卜素选自虾青素、角黄素、海胆酮、3-羟基海胆酮、3’-羟基海胆酮、adonirubin和金盏花黄质。
虾青素是特别优选的酮类胡萝卜素。
依赖于所使用的生物,获得游离或脂肪酸酯的形式的酮类胡萝卜素。
可以以本发明方法从植物花瓣中获得酮类胡萝卜素与脂肪酸形成的单酯或二酯的形式。一些检测到的脂肪酸的例子是豆蔻酸、棕榈酸、硬脂酸、油酸、亚麻酸和月桂酸(Kamata和Simpson(1987)Comp.Biochem.Physio.Vol.86B(3),587-591)。
可以在整个植物或特定在含有有色体的植物组织中(在优选的实施方案中)生产酮类胡萝卜素。优选的植物组织例如有根、种子、叶、果实、花,特别是蜜腺和花瓣。
在本发明方法的一个特别优选的实施方案中,使用了在花中表现出最高的酮酶表达率的遗传修饰植物。
优选通过在花特异的启动子的控制下表达酮酶基因来实现这一点。为了这一目的,例如,可以如以下详细描述的,向植物引入前文描述的核酸,其中所述核酸在核酸构建体中与花特异的启动子功能性地连接。
在本发明方法的另一特别优选的实施方案中,使用了在果实中表现出最高的酮酶表达率的遗传修饰植物。
优选通过在果实特异的启动子控制下表达酮酶基因来实现这一点。为了这一目的,例如,可以如以下详细描述的,向植物引入前文描述的核酸,所述核酸在核酸构建体中与果实特异的启动子功能性连接。
在本发明方法的另一特别优选的实施方案中,使用了在种子中表现出最高的酮酶表达率的遗传修饰种子。
优选通过在种子特异的启动子控制下表达酮酶基因来实现这一点。为了这一目的,例如,可以如以下详细描述的,向植物引入前文描述的核酸,所述核酸在核酸构建体中与种子特异的启动子功能性连接。
通过与质体转运肽的功能性连接可以实现向有色体的靶向转移。
通过以下实例描述了具有增加的或造成的酮酶活力的遗传修饰植物的产生。其它活性,如羟化酶活力和/或β-环化酶活力可以使用编码羟化酶或β-环化酶的核酸序列替代编码酮酶的核酸序列以类似方式增加。对于遗传修饰组合,转化可以单个地或通过多重构建体完成。
优选使用含有以上描述的编码酮酶的核酸的核酸构建体转化起始植物来产生转基因植物,所述核酸与一个或多个确保在植物中转录和翻译的调节信号功能性地连接。
以下也将其中的编码核酸序列与一个或多个确保在植物中转录和翻译的调节信号功能性连接的这些核酸构建体称为表达盒。
优选调节信号含有一个或多个确保在植物中转录和翻译的启动子。
表达盒含有调节信号,即控制编码序列在宿主细胞中表达的核酸调节序列。在一个优选的实施方案中,表达盒包含上游启动子(即位于编码序列5’端)和下游多腺苷酸化信号(即位于编码序列3’端),并在适当时还含有与位于两者之间的至少一种以上描述的基因的编码序列有效连接的其它调节元件。“有效连接”指的是启动子、编码序列、终止子和适当时其它调节元件以各调节元件能够在编码序列的表达中发挥其预期功能的方式依次排列。
以下举例描述了优选的用于植物的核酸构建体、表达盒和载体,以及产生转基因植物的方法和转基因植物自身。
优选的用于有效连接的序列(但并不排除其它)有确保在质外体、液泡、质体、线粒体、内质网(ER)、细胞核、油质体或其它区室中亚细胞定位的靶向序列和翻译增强子(如烟草花叶病毒来源的5’前导序列)(Gallie等人,Nucl.Acids Res.15(1987),8693-8711)。
原则上任何能够在植物中控制外源基因表达的启动子都适合用于表达盒。
“组成型”启动子指的是在植物发育过程中的相对宽时期(优选植物发育的全部时期),在许多组织(优选所有组织)中确保表达的启动子。
具体而言,优选使用植物启动子或植物病毒来源的启动子。特别优选花椰菜花叶病毒35S转录物的CaMV启动子(Franck等人(1980)Cell 21:285-294;Odell等人(1985)Nature 313:810-812;Shewmaker等人(1985)Virology 140:281-288;Gardner等人(1986)Plant Mol Biol 6:221-228)、19SCaMV启动子(US 5,352,605;WO 84/02913;Benfey等人(1989)EMBO J 8:2195-2202)、拟南芥(Arabidopsis thaliana)来源的丙糖磷酸转运蛋白(TPT)启动子(Acc.No.AB006698,碱基对53242到55281,起始于bp 55282的基因被注释为“磷酸/丙糖磷酸转运蛋白”),或玄参(figwort)花叶病毒来源的34S启动子(Acc.No.X16673,碱基对1到554)。
另外的合适的组成型启动子有pds启动子(Pecker等人(1992)Proc.Natl.Acad.Sci USA 89:4962-4966)或核酮糖二磷酸羧化酶-加氧酶小亚基(SSU)启动子(US 4,962,028)、豆球蛋白B启动子(GenBank Acc.No.X03677)、农杆菌胭脂碱合成酶启动子、TR双启动子(dual promoter)、农杆菌OCS(章鱼碱合成酶)启动子、泛素启动子(Holtorf S等人(1995)Plant Mol Biol 29:637-639)、泛素1启动子(Christensen等人(1992)PlantMol Biol 18:675-689;Bruce等人(1989)Proc Natl Acad Sci USA 86:9692-9696)、Smas启动子、桂醇脱氢酶启动子(US 5,683,439)、液泡ATP酶亚基的启动子或小麦来源的富含脯氨酸的蛋白质的启动子(WO91/13991)、Pnit启动子(Y07648.L,Hillebrand等人(1998),Plant.Mol.Biol.36,89-99,Hillebrand等人(1996),Gene,170,197-200)和技术人员已知的在植物中组成型表达的其它基因的启动子。
表达盒还可以包含化学诱导型启动子(综述文章:Gatz等人(1997)Annu Rev Plant Physiol Plant Mol Biol 48:89-108),通过这种启动子可以在特定时间控制酮酶基因在植物中表达。这种类型的启动子,如PRP1启动子(Ward等人(1993)Plant Mol Biol 22:361-366)、水杨酸诱导的启动子(WO 95/19443)、苯磺酰胺诱导的启动子(EP 0 388 186)、四环素诱导的启动子(Gatz等人(1992)Plant J 2:397-404)、脱落酸诱导的启动子(EP 0 335528)或乙醇或环己酮诱导的启动子(WO 93/21334)同样可以使用。
优选的启动子还有被生物或非生物压力诱导的启动子,如PRP1基因的病原体诱导的启动子(Ward等人(1993)Plant Mol Biol 22:361-366),热诱导的番茄hsp70或hsp80启动子(US 5,187,267)、冷诱导的马铃薯α-淀粉酶启动子(WO 96/12814)、光诱导的PPDK启动子或损伤诱导的pinII启动子(EP375091)。
病原体诱导的启动子包括由病原体攻击诱导的基因的启动子,如PR蛋白质、SAR蛋白质、β-1,3-葡聚糖酶、壳多糖酶等的基因的启动子(例如Redolfi等人(1983)Neth J Plant Pathol 89:245-254;Uknes等人(1992)The Plant Cell 4:645-656;Van Loon(1985)Plant Mol Viral 4:111-116;Marineau等人(1987)Plant Mol Biol 9:335-342;Matton等人(1987)Molecular Plant-Microbe Interactions 2:325-342;Somssich等人(1986)Proc Natl Acad Sci USA 83:2427-2430;Somssich等人(1988)Mol GenGenetics 2:93-98;Chen等人(1996)Plant J 10:955-966;Zhang和Sing(1994)Proc Natl Acad Sci USA 91:2507-2511;Warner等人(1993)Plant J3:191-201;Siebertz等人(1989)Plant Cell 1:961-968(1989))。
也包括损伤诱导的启动子,如pinII基因启动子(Ryan(1990)Ann RevPhytopath 28:425-449;Duan等人(1996)Nat Biotech 14:494-498)、wun1和wun2基因启动子(US 5,428,148)、win1和win2基因启动子(Stanford等人(1989)Mol Gen Genet 215:200-208)、系统素(systemin)基因启动子(McGurl等人(1992)Science 225:1570-1573)、WIP1基因启动子(Rohmeier等人(1993)Plant Mol Biol 22:783-792;Ekelkamp等人(1993)FEBSLetters 323:73-76)、MPI基因启动子(Corderok等人(1994)The Plant J 6(2):141-150)等。
其它合适的启动子的例子有果实成熟特异性启动子,如番茄果实成熟特异性启动子(WO 94/21794、EP 409 625)。发育依赖的启动子包括某些组织特异性启动子,因为一些组织的形成天然依赖于发育。
还有的特别优选的启动子是确保在例如生物合成酮类胡萝卜素或其前体的植物组织或部位中表达的启动子。优选的例子有特异于花药、子房、花瓣、萼片、花、叶、茎、种子和根以及它们的组合的启动子。
对块茎、贮藏根或根特异的启动子的例子有I类patatin启动子(B33)或马铃薯组织蛋白酶D抑制物启动子。
叶特异的启动子的例子有马铃薯胞质FBP酶启动子(WO 97/05900)、核酮糖二磷酸羧化酶-加氧酶(核酮糖-1,5-二磷酸羧化酶)SSU启动子(小亚基)或马铃薯ST-LSI启动子(Stockhaus等人(1989)EMBO J 8:2445-2451)。
花特异的启动子的例子有八氢番茄红素合成酶启动子(WO 92/16635)或P-rr基因启动子(WO 98/22593)、拟南芥AP3启动子(见实施例5)、CHRC启动子(黄瓜(Cucumis sativus)来源的有色体特异的类胡萝卜素相关蛋白质(CHRC)基因启动子Acc.No.AF099501,碱基对1到1532)、EPSP合成酶启动子(碧冬茄(Petunia hybrida)来源的5-烯醇丙酮酸莽草酸-3-磷酸合成酶基因启动子Acc.No.M37029,碱基对1到1788)、PDS启动子(番茄(Solanum Lycopersicum)来源的八氢番茄红素去饱和酶基因启动子Acc.No.U46919,碱基对1到2078)、DFR-A启动子(碧冬茄来源的二氢黄酮醇4-还原酶基因A启动子,Acc.No.X79723,碱基对32到1902)或FBP1启动子(碧冬茄来源的花结合蛋白1基因启动子,Acc.No.L10115,碱基对52到1069)。
花药特异的启动子的例子有5126启动子(US 5,689,049、US 5,689,051)、glob-I启动子或g-玉米醇溶蛋白启动子。
种子特异的启动子的例子有ACP05启动子(酰基载体蛋白基因,WO9218634)、拟南芥属AtS1和AtS3启动子(WO 9920775)、蚕豆(Vicia faba)LeB4启动子(WO 9729200和US 06403371)、欧洲油菜(Brassica napus)启动子(US 5608152;EP 255378;US 5420034)、蚕豆SBP启动子(DE 9903432)或玉米End1和End2启动子(WO 0011177)。
其它适宜在植物中表达的启动子描述于Rogers等人(1987)Meth inEnzymol 153:253-277;Schardl等人(1987)Gene 61:1-11和Berger等人(1989)Proc Natl Acad Sci USA 86:8402-8406。
本发明方法中特别优选种子特异、果实特异、花特异、特别是花瓣特异的组成型启动子。
因此,本发明尤其涉及含有功能性连接的花特异性或特别是花瓣特异性启动子和编码酮酶的核酸的核酸构建体,其中所述酮酶含有SEQ.ID.NO:2氨基酸序列或对SEQ.ID.NO:2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列。
优选通过如T.Maniatis、E.F.Fritsch和J.Sambrook,MolecularCloning:A Laboratory Manual,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1989)及T.J.Silhavy、M.L.Berman和L.W.Enquist,Experiments with Gene Fusions,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1984)和Ausubel,F.M.等人,Current Protocols inMolecular Biology,Greene Publishing Assoc.and Wiley-Interscience(1987)描述的常规重组和克隆技术,将合适的启动子与上文描述的编码酮酶的核酸及优选地与在启动子与核酸序列之间插入的编码质体特异性转运肽的核酸及与多腺苷酸化信号相融合来生成表达盒。
优选插入的编码质体转运肽的核酸确保定位于质体(特别是有色体)。
也可以使用其核酸序列编码酮酶融合蛋白质的表达盒,其中融合蛋白质的一部分是控制多肽转运的转运肽。转运肽可以是有色体特异的,并且在酮酶转移进有色体之后其可以被酶从酮酶部分中除去。
特别优选的转运肽来自烟草(Nicotiana tabacum)质体转酮酶或其它转运肽(如核酮糖二磷酸羧化酶-加氧酶小亚基(rbcS)的转运肽或铁氧还蛋白-NADP氧化还原酶的转运肽,以及异戊烯-焦磷酸异构酶2的转运肽)或它的功能等价物。
特别优选KpnI/BamHI片段形式的处于三种读框中的三种烟草质体转酮酶质体转运肽盒子的核酸序列,其中ATG密码子位于NcoI切割位点中:
pTP09
KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC
CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCTCACTTTTTCCGGCCTTAA
ATCCAATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGT
CGTAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGC
GGGATCC_BamHI
pTP10
KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC
CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCTCACTTTTTCCGGCCTTAA
ATCCAATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGT
CGTAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGC
GCTGGATCC_BamHI
pTP11
KpnI_GGTACCATGGCGTCTTCTTCTTCTCTCACTCTCTCTCAAGCTATCCTCTCTCGTTCTGTC
CCTCGCCATGGCTCTGCCTCTTCTTCTCAACTTTCCCCTTCTTCTCTCACTTTTTCCGGCCTTAA
ATCCAATCCCAATATCACCACCTCCCGCCGCCGTACTCCTTCCTCCGCCGCCGCCGCCGCCGT
CGTAAGGTCACCGGCGATTCGTGCCTCAGCTGCAACCGAAACCATAGAGAAAACTGAGACTGC
GGGGATCC_BamHI
其它的质体转运肽的例子有拟南芥质体异戊烯-焦磷酸异构酶2(IPP-2)的转运肽和豌豆来源的核酮糖二磷酸羧化酶小亚基(rbcS)的转运肽(Guerineau,F,Woolston,S,Brooks,L,Mullineaux,P(1988)An expressioncassette for targeting foreign proteins into the chloroplasts.Nucl.Acids Res.16:11380)。
本发明核酸可以通过合成方式制备或从天然获得,或者可以含有由合成的和天然的核酸组分组成的混合物,并可以由不同生物来源的多个异源基因部分组成。
如上所述,优选具有植物优选的密码子的合成核苷酸序列。可以从表达于大多数感兴趣的植物物种中的具有最高蛋白质频率的密码子中鉴定植物优选的密码子。
为了制备表达盒,可以利用多种DNA片段以便获得便于从正确方向阅读并装备有正确阅读框的核苷酸序列。可以在片段上附加衔接子或接头,以便DNA片段的彼此连接。
可以且适宜的是,以转录的方向提供具有接头或多接头的启动子和终止子区域,所述接头含有用于插入该核酸序列的一个或多个限制位点。一般地,接头具有1到10,通常1到8,优选2到6个限制位点。接头在调节区内一般小于100bp,常常小于60bp,但至少长5bp。对于宿主植物,启动子可以是天然的(或同源的)和外源的(或异源的)。优选表达盒以5’-3’转录方向含有启动子、核酸编码序列或核酸构建体,以及转录终止区。各种终止区可以按需要互换。
终止子的例子有35S终止子(Guerineau等人(1988)Nucl Acids Res.16:11380)、nos终止子(Depicker A,Stachel S,Dhaese P,Zambryski P,Goodman HM.Nopaline synthase:transcript mapping and DNA sequence.J Mol Appl Genet.1982;1(6):561-73)或ocs终止子(Gielen,J,deBeuckeleer,M,Seurinck,J,Debroek,H,de Greve,H,Lemmers,M,vanMontagu,M,Schell,J(1984)The complete sequence of the TL-DNA of theAgrobacterium tumefaciens plasmid pTiAch5.EMBO J.3:835-846)。
此外还可以使用提供适当的限制性切割位点或删除冗余DNA或限制性切割位点的操作。关于插入、缺失或置换(如转换和颠换),可以使用体外诱变、引物修补、限制(性酶切)或连接。
可以通过适当的操作(如限制(性酶切)、回嚼(chewing back)或将突出端填补成平端)来提供片段的互补末端以进行连接。
优选的多腺苷酸化信号是植物多腺苷酸化信号,优选那些基本上相应于根癌农杆菌来源的T-DNA多腺苷酸化信号的信号,特别是Ti质粒pTiACH5(Gielen等人,EMBO J.3(1984),835ff)的T-DNA(章鱼碱合成酶)基因3的多腺苷酸化信号或其功能等价物。
将外源基因转移进植物基因组被称为转化。
为此目的,可以使用本身已知的转化和从植物组织或植物细胞再生植物的方法,以便实现瞬时或稳定转化。
适合转化植物的方法有通过聚乙二醇诱导DNA摄取的原生质体转化、使用基因枪的生物轰击法——称为粒子轰击法——电穿孔、在含有DNA的溶液中孵育干胚、显微注射及上文所述农杆菌介导的基因转移。所述方法描述于例如B.Jenes等人,Techniques for Gene Transfer,《TransgenicPlants》,Vol.1,Engineering and Utilization,S.D.Kung和R.Wu编辑,Academic Press(1993),128-143和Potrykus,Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991),205-225。
优选将要表达的构建体克隆进适宜转化根癌农杆菌的载体,如pBin19(Bevan等人,Nucl.Acids Res.12(1984),8711)或特别优选的pSUN2、pSUN3、pSUN4或pSUN5(WO 02/00900)。
用表达质粒转化的农杆菌可以通过已知的方式用于转化植物,例如在农杆菌溶液中浸浴损伤的叶子或叶子的片段,并随后在适当的培养基中培育。
对于遗传修饰植物(此后也称为转基因植物)的优选制备而言,表达酮酶的融合表达盒被克隆进适于转化根癌农杆菌的载体,如pBin19,或特别是pSUN5和pSUN3。然后可以通过在农杆菌溶液中浸浴损伤的叶子或叶子的片段,并随后在适当的培养基中培养,从而以已知方式将使用所述载体转化的农杆菌用于转化植物(特别是农作物)。
通过农杆菌的植物转化尤其公开于F.F.White,Vectors for GeneTransfer in Higher Plants;in Transgenic Plants,Vol.1,Engineering andUtilization,S.D.Kung和R.Wu编辑,Academic Press,1993,15-38页。可以以已知的方式从损伤的叶子或叶片段的转化细胞再生转基因植物,所述转基因植物含有整合进表达盒用于表达编码酮酶的核酸的基因。
为了用编码酮酶的核酸转化宿主细胞,组建表达盒并将表达盒插入其DNA中含有额外的功能调节信号(如用于复制或整合的序列)的重组载体。合适的载体尤其描述于″Methods in Plant Molecular Biology andBiotechnology″(CRC Press),6/7章,71-119页(1993)。
使用上文引用的重组和克隆技术,可以将表达盒克隆进能够在如大肠杆菌中复制的适当载体中。合适的克隆载体有例如pJIT117(Guerineau等人(1988)Nucl.Acids Res.16:11380)、pBR332、pUC系列、M13mp系列和pACYC184。特别适宜的是能够在大肠杆菌和农杆菌中复制的二元载体。
以下更详细的描述了本发明遗传修饰微生物的产生:
优选将上文描述的编码酮酶或β-羟化酶或β-环化酶的核酸整合进表达构建体(该构建体含有处于核酸调节序列遗传控制之下的编码本发明酶的核酸序列)和载体(该载体至少含有一个这样的表达构建体)。
优选本发明的这类构建体含有上游启动子(即位于特定编码序列5’端)和下游终止子信号(即位于3’端),并且适当时还含有与编码序列有效连接的其它常规调节元件。“有效连接”指的是启动子、编码序列、终止子及适当时其它调节元件以各调节元件能够在编码序列的表达中发挥其预期功能的方式依次排列。
可有效连接的序列的例子有引导序列和翻译增强子、增强子、多腺苷酸化信号等等。其它的调节元件包括选择性标记、扩增信号、复制起点等等。
除了人工调节序列之外,在实际的结构基因前面还可以仍然保留天然的调节序列。适当时可以通过遗传修饰关闭这一天然调节作用,并增加或降低基因的表达。然而基因构建体也可以具有更简单的结构,即在结构基因的前面没有插入额外的调节信号,并且没有除去天然启动子及其调节作用。反之,天然的调节序列可以被突变,以便不再产生调节作用,从而增加或降低基因表达。基因构建体中可以具有单或多拷贝的这些核酸序列。
可以使用的启动子有例如:有利于用于革兰氏阴性细菌的cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、laclq、T7、T5、T3、gal、trc、ara、SP6、λ-PR或λ-PL启动子;和革兰氏阳性启动子amy和SPO2或酵母启动子ADC1、MFα、AC、P-60、CYC1、GAPDH。特别优选使用可诱导的启动子,如光、特别是温度诱导的启动子(如PrPl启动子)。
原则上可以使用所有天然的启动子和它们的调节序列。此外,也可以有利的使用合成的启动子。
所述调节序列旨在使核酸序列可以特异表达以及蛋白质可以表达。这可能意味着,例如,取决于宿主生物,基因只在诱导之后被表达或过表达,或者立即被表达和/或过表达。
此外,可能优选调节序列或因子具有正面影响,并因此增加或降低表达。因此,通过使用如启动子和/或增强子之类的强转录信号,可以在转录水平上有利地实现调节元件的增强作用。然而,也可以例如通过提高mRNA的稳定性,增强翻译。
通过将适当的启动子与以上描述的编码酮酶、β-羟化酶或β-环化酶的核酸序列和终止子信号或多腺苷酸化信号融合,产生表达盒。如描述于T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)及T.J.Silhavy,M.L.Berman和L.W.Enquist,Experiments with GeneFusions,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1984)以及Ausubel,F.M.等人,Current Protocols in Molecular Biology,GreenePublishing Assoc.and Wiley-Interscience(1987)的常规重组和克隆技术被用于此目的。
为了在合适的宿主生物中表达,将重组核酸构建体或基因构建体有利的插入能够使基因在宿主中最佳表达的宿主特异载体。载体是本领域技术人员所熟知的,并且可以在例如″Cloning Vectors″(Pouwels P.H.等人,编辑,Elsevier,Amsterdam-New York-Oxford,1985)中找到。载体不仅指质粒,也指本领域技术人员已知的所有其它载体,如噬菌体、病毒(如SV40、CMV、杆状病毒和腺病毒)、转座子、IS元件、质粒、粘粒和线性或环状DNA。这些载体可以在宿主生物中自主复制或随染色体复制。
可以提及的合适的表达载体的例子有:
常规融合表达载体,如pGEX(Pharmacia Biotech Inc;Smith,D.B.和Johnson,K.S.(1988)Gene 67:31-40)、pMAL(New England Biolabs,Beverly,MA)和pRIT 5(Pharmacia,Piscataway,NJ),这些载体中重组目的蛋白质分别与谷胱甘肽S-转移酶(GST)、麦芽糖E-结合蛋白和蛋白质A融合。
非融合蛋白质表达载体,如pTrc(Amann等人,(1988)Gene 69:301-315)和pET 11d(Studier等人Gene Expression Technology:Methodsin Enzymology 185,Academic Press,San Diego,California(1990)60-89)。
用于在酿酒酵母中表达的酵母表达载体,如pYepSecl(Baldari等人,(1987)Embo J.6:229-234)、pMFα(Kurjan和Herskowitz(1982)Cell 30:933-943)、pJRY88(Schultz等人(1987)Gene 54:113-123)和pYES2(Invitrogen Corporation,San Diego,CA)。
适合用于其它真菌(如丝状真菌)的载体以及构建载体的方法包括详细描述于:van den Hondel,C.A.M.J.J.& Punt,P.J.(1991)″Genetransfer systems and vector development for filamentous fungi.《AppliedMolecular Genetics of Fungi》,J.F.Peberdy等人编辑,pp.1-28,Cambridge University Press:Camb ridge的载体和方法。
可用于在培养的昆虫细胞(如Sf9细胞)中表达蛋白质的杆状病毒载体,包括pAc系列(Smith等人,(1983)Mol.Cell Biol.3:2156-2165)和pVL系列(Lucklow和Summers(1989)Virology 170:31-39)。
其它合适的原核和真核细胞表达系统描述于Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular cloning:A Laboratory Manual,第二版,ColdSpring Harbor Laboratory,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1989的第16和17章。
本发明表达构建体或载体可用于产生遗传修饰微生物,所述微生物被例如至少一种本发明载体所转化。
将上述本发明重组构建体有利地引入合适的宿主系统,并在其中表达。优选使用技术人员熟悉的克隆和转染方法(如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等)来引起所述核酸在特定表达系统中的表达。合适的系统描述于如Current Protocols in Molecular Biology,F.Ausubel等人编辑,Wiley Interscience,New York 1997。
可以通过同样存在于载体或表达盒中的标记基因来挑选成功转化的生物。这类标记基因例如有抗生素抗性基因、催化导致转染细胞染色的颜色形成反应的酶基因。然后可以通过自动细胞分拣进行挑选。
可以通过含有适当抗生素的培养基或营养培养基来选择被载体成功转化并带有适当抗生素抗性基因(如G418或潮霉素)的微生物。存在于细胞表面的标记蛋白质可被用于通过亲和层析手段的选择。
宿主生物与适用于生物的载体(如质粒、病毒或噬菌体,如具有RNA聚合酶/启动子系统的质粒、噬菌体8或其它温和噬菌体或转座子)和/或其它有利的调节序列的组合形成了表达系统。
本发明还涉及产生遗传修饰生物的方法,包括向起始生物的基因组中或以染色体外形式向起始生物中引入含有功能连接的启动子和编码酮酶的核酸的核酸构建体,适当时,构建体也含有终止子,其中所述酮酶含有SEQ.ID.NO:2氨基酸序列或对SEQ.ID.NO:2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%的一致性的序列。
本发明还涉及遗传修饰的生物,其中遗传修饰:
A在野生型生物已经具有酮酶活力的情况下,相对于野生型增加酮酶活力,和
B在野生型生物不具有酮酶活力的情况下,相对于野生型造成酮酶活力,
并且在A中增加的或在B中造成的酮酶活力,是由含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%一致性的序列的酮酶引起的。
如上所述,酮酶活力的增加或出现是通过相比于野生型增加或造成编码酮酶的核酸的基因表达来实现的,其中所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%的一致性的序列。
在另一优选的实施方案中,如上所述,通过向植物引入编码酮酶的核酸来增加或造成编码酮酶的核酸的基因表达,并因此优选过表达或转基因表达编码如下酮酶的核酸,所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%的一致性的序列。
本发明还涉及至少含有一个编码酮酶的转基因核酸的遗传修饰的生物,所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%的一致性的序列。这是起始生物不具有酮酶或内源酮酶,并且转基因酮酶被过表达时的情况。
本发明还涉及至少含有两个编码酮酶的内源核酸的遗传修饰生物,所述酮酶含有SEQ.ID.NO:2氨基酸序列或对SEQ.ID.NO:2序列进行置换、插入或缺失氨基酸后产生的与这一序列在氨基酸水平上具有至少42%的一致性的序列。这是起始生物具有内源酮酶,并且内源酮酶被过表达时的情况。
如上提及的,特别优选的遗传修饰的生物相比于野生型生物还具有增加的羟化酶活力和/或β-环化酶活力。其它的优选的实施方案描述于前文本发明方法中。
根据本发明,优选地,生物指的是作为野生型或起始生物能够天然产生或通过遗传互补和/或代谢路径的调节产生类胡萝卜素、特别是β-胡萝卜素和/或玉米黄质和/或新黄素和/或紫黄质和/或黄体素的生物。
还有的优选生物作为野生型或起始生物已经具有羟化酶活力,因此作为野生型或起始生物能够产生玉米黄质。
优选的生物是植物或微生物,如细菌、酵母、藻类或真菌。
能够使用的细菌是由于引入生产类胡萝卜素的生物的类胡萝卜素生物合成基因而能合成叶黄素的细菌(如含有例如欧文氏菌来源的crt基因的埃希氏菌属细菌)和自身能够合成叶黄素的细菌(如欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属的细菌,或集胞藻属的蓝细菌)。
优选的细菌有大肠杆菌、草生欧文氏菌、噬夏孢欧文氏菌、Agrobacterium aurantiacum、产碱菌属(Alcaligenes sp.)PC-1、黄杆菌属R1534菌株、集胞藻属蓝细菌PCC6803、Paracoccus marcusii或Paracoccuscarotinifaciens。
优选的酵母有假丝酵母、酵母、汉逊酵母、毕赤酵母或法夫酵母(Phaffia)。特别优选的酵母有Xanthophyllomyces dendrorhous或Phaffiarhodozyma。
优选的真菌有曲霉、木霉、阿舒囊霉、脉孢菌、布拉霉、须霉、镰孢霉或描述于Indian Chem.Engr.Section B.Vol.37,No.1,2(1995)15页,表6的其它真菌。
优选的藻类有绿藻,如红球藻属、三角褐指藻、团藻属或杜氏藻属。特别优选的藻类有雨生红球藻或Dunaliella bardawil。
为了实行本发明方法,其它可使用的微生物及其制备被例如这里引入为参考的(例如)DE-A-199 16 140所公开。
特别优选的植物选自毛茛科、小檗科、罂粟科、大麻科、蔷薇科、Fabaceae、亚麻科、葡萄科、十字花科、葫芦科、报春花科、石竹科、苋科、龙胆科、牻牛儿苗科、忍冬科、木犀科、旱金莲科、茄科、玄参科、菊科、百合科、石蒜科、禾本科、兰科、锦葵科、Illiaceae或唇形科。
极其优选的植物选自万寿菊属(Marigold)、万寿菊(Tagetes errecta)、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属植物,特别优选万寿菊属(Marigold)、万寿菊(Tagetes errecta)、孔雀草、番茄属、蔷薇属、金盏花属、酸浆属、苜蓿属、向日葵属、茼蒿属、紫菀属、郁金香属、水仙属、碧冬茄属、老鹳草属、旱金莲属或侧金盏花属植物。
极其特别优选的遗传修饰的植物选自万寿菊属(Marigold)、万寿菊(Tagetes errecta)、孔雀草、侧金盏花属、番茄属、蔷薇属、金盏花属、酸浆属、苜蓿属、向日葵属、茼蒿属、紫菀属、郁金香属、水仙属、碧冬茄属、老鹳草属或旱金莲属植物,遗传修饰植物至少含有一个编码酮酶的转基因核酸。
本发明还涉及转基因植物、它们的繁殖材料和它们的植物细胞、组织或部分,特别是它们的果实、种子、花和花瓣。
如上所述,可以使用遗传修饰的植物制备酮类胡萝卜素,特别是虾青素。
可以被人或动物食用的具有增加的酮类胡萝卜素(特别是虾青素)含量的本发明遗传修饰生物,特别是植物或植物的部分(例如特别是花瓣),可以直接使用或经过已知的方式加工后作为人或动物的食品或人和动物的食品增补剂使用。
也可以使用遗传修饰生物制备含有酮类胡萝卜素的生物提取物和/或制备动物和人的食品增补剂。
相比于野生型,遗传修饰生物的酮类胡萝卜素含量增加。
酮类胡萝卜素含量的增加通常指酮类胡萝卜素总含量的增加。
然而,酮类胡萝卜素含量的增加还尤其指优选的酮类胡萝卜素的含量改变,而总的类胡萝卜素含量无需增加。
在一个特别优选的实施方案中,本发明遗传修饰的植物相比于野生型具有增加的虾青素含量。
在这种情况下,增加的含量也指造成的酮类胡萝卜素(如虾青素)的含量。
本发明还涉及新的酮酶和编码其的新核酸。
本发明尤其涉及含有SEQ.ID NO:8氨基酸序列的酮酶或含有对SEQ.ID NO:8序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO:2序列在氨基酸水平上具有至少70%、优选至少75%、特别优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%一致性的序列的酮酶,前提是不存在SEQ ID NO:8的氨基酸序列。如上所述,SEQ.ID NO:4序列在数据库中被注释为推定的蛋白质。
本发明还涉及含有SEQ.ID.NO:6氨基酸序列或对SEQ.ID.NO:6序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO:6序列在氨基酸水平上具有至少70%一致性的序列的酮酶。如上所述,SEQ.ID.NO:6序列在数据库中没有注释。
在另一实施方案中,本发明涉及含有SEQ ID NO:12的氨基酸序列的酮酶或含有对SEQ ID.NO:12序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO:12序列在氨基酸水平上具有至少70%、优选至少75%、特别优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%一致性的序列的酮酶,前提是不存在SEQ ID NO:6氨基酸序列。
本发明还涉及含有SEQ ID NO:49氨基酸序列的酮酶或含有对SEQ.ID.NO:49序列进行置换、插入或缺失氨基酸后产生的在氨基酸水平上与SEQ ID NO:49具有至少50%、优选至少60%、特别优选至少70%、更优选至少80%、更优选至少90%、更优选至少95%一致性的序列的酮酶,前提是不存在氨基酸序列SEQ ID NO:47。如上所述,SEQ ID NO:47序列在数据库中被注释为推定的蛋白质。
本发明还涉及编码以上所述蛋白质的核酸,条件是所述核酸不包括序列SEQ ID NO:5。
已令人惊奇的发现,含有SEQ ID NO.4氨基酸序列或对SEQ ID NO.4序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO:4序列在氨基酸水平上具有至少70%、优选至少75%、特别优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%一致性并具有酮酶性质的序列的蛋白质具有酮酶的性质。
本发明因此也涉及含有SEQ.ID.NO.4氨基酸序列或对SEQ.ID.NO.4序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO:4序列在氨基酸水平上具有至少70%、优选至少75%、特别优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%一致性并具有酮酶性质的序列的蛋白质作为酮酶的用途。
还令人惊奇的发现,含有SEQ.ID.NO.6氨基酸序列或对SEQ.ID.NO.6序列进行置换、插入或缺失氨基酸后产生的序列的蛋白质具有酮酶的性质,其中所述修饰的序列与SEQ.ID.NO.6序列在氨基酸水平上具有至少65%、优选至少70%、优选至少75%、特别优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%的一致性,并具有酮酶的性质。
本发明因此也涉及含有SEQ.ID.NO:6氨基酸序列或对SEQ.ID.NO:6序列进行置换、插入或缺失氨基酸后产生的序列的蛋白质作为酮酶的用途,其中所述修饰的序列与SEQ.ID.NO:6序列在氨基酸水平上具有至少65%、优选至少70%、优选至少75%、特别优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%的一致性,并具有酮酶的性质。
还令人惊奇的发现,含有SEQ ID NO:47氨基酸序列或对SEQ ID NO:47序列进行置换、插入或缺失氨基酸后产生的序列的蛋白质具有酮酶的性质,其中所述修饰的序列与SEQ ID NO:47序列在氨基酸水平上具有至少50%、优选至少60%、优选至少70%、特别优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%的一致性,并具有酮酶的性质。
本发明因此也涉及含有SEQ ID NO:47氨基酸序列或对SEQ ID NO:47序列进行置换、插入或缺失氨基酸后产生的序列的蛋白质作为酮酶的用途,其中所述修饰的序列与SEQ ID NO:47序列在氨基酸水平上具有至少50%、优选至少60%、优选至少70%、特别优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%的一致性,并具有酮酶的性质。
与现有技术的方法相比,本发明方法更大量的提供具有少量羟化副产物的酮类胡萝卜素,特别是虾青素。
现在通过以下实施例来解释本发明,但并不限于此:
一般实验条件:
重组DNA的序列分析
使用来自Licor(MWG Biotech所售,Ebersbach,Germany)的激光荧光DNA测序仪,按照Sanger的方法(Sanger等人,Proc.Natl.Acad.Sci.USA 74 (1977),5463-5467)对重组DNA分子进行测序。
实施例1
扩增编码NOST酮酶完整一级序列的DNA,所述酮酶来自念珠藻属PCC 7120。
通过PCR手段从念珠藻属PCC 7120(″Pasteur Culture Collection ofCyanobacterium″菌株)中扩增编码念珠藻属PCC 7120 NOST酮酶的DNA。
为了从在25℃、恒定振荡(150rpm)并连续光照条件下生长于BG11培养基(1.5g/l NaNO3、0.04g/l K2PO4x3H2O、0.075g/l MgSO4xH2O、0.036g/l CaCl2x2H2O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na2CO3、1ml痕量金属混合物A5+Co(2.86g/l H3BO3、1.81g/l MnCl2x4H2O、0.222g/l ZnSO4x7H2O、0.39g/l NaMoO4x2H2O、0.079g/lCuSO4x5H2O、0.0494g/l Co(NO3)2x6H2O))中1周的念珠藻属PCC 7120悬浮培养物制备基因组DNA,离心收集细胞,冷冻于液氮,并在研钵中将细胞碾磨成粉。
从念珠藻PCC 7120中分离DNA的方法:
通过8000rpm离心10分钟,从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中破碎并碾磨细胞。用1ml 10mM Tris HCI(pH 7.5)重悬浮细胞材料,并转移到Eppendorf反应试管(体积2ml)内。加入100μl蛋白酶K(浓度:20mg/ml)后,将细胞悬浮液在37℃孵育3小时。然后用500μl苯酚抽提悬浮液。13000rpm离心5分钟后将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA,然后用70%的乙醇洗涤。在室温干燥DNA沉淀,加入25μl水,并加热到65℃溶解。
通过聚合酶链式反应(PCR)的手段,使用有义特异引物(NOSTF,SEQID NO.19)和反义特异引物(NOSTG SEQ ID NO.20)从念珠藻属PCC 7120中扩增编码念珠藻属PCC 7120酮酶的核酸。
PCR条件如下:
在50μl反应混合物中进行扩增DNA的PCR,所述DNA编码由完整一级序列组成的酮酶蛋白质,PCR反应混合物含有:
-1μl念珠藻属PCC 7120 DNA(按如上描述制备)
-0.25mM dNTPs
-0.2mM NOSTF(SEQ ID NO.19)
-0.2mM NOSTG(SEQ ID NO.20)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-25.8μl蒸馏水
在以下循环条件下进行PCR:
1X   94℃  2分钟
35X  94℃  1分钟
     55℃  1分钟
     72℃  3分钟
1X   72℃  10分钟
使用SEQ ID NO.19和SEQ ID NO.20的PCR扩增产生了805bp的片段,所述片段编码由完整一级序列组成的蛋白质(SEQ ID NO.21)。使用标准方法,将扩增子克隆进PCR克隆载体pGEM-T(Promega),产生pNOSTF-G克隆。
使用M 13F和M 13R引物对pNOSTF-G克隆的测序确证了与数据库条目AP003592的88,886-89,662之DNA序列一致的序列。在独立扩增实验中此核苷酸序列重复产生并由此代表使用的念珠藻属PCC 7120中的核苷酸序列。
因此,所述pNOSTF-G克隆被用于克隆进表达载体pJIT117(Guerineau等人1988,Nucl.Acids Res.16:11380)。通过从pNOSTF-G分离799 bp SphI片段并连接进SphI切割的pJIT117载体,从而完成克隆。以正确方向含有念珠藻属PCC 7120酮酶的克隆被称为pJNOST,所述酮酶的N-末端与rbcS转运肽翻译融合。
实施例2
用于在大肠杆菌中合成玉米黄质的质粒pMCL-CrtYIBZ/idi/gps的构建。
经中间体pMCL-CrtYIBZ和pMCL-CrtYIBZ/idi,通过3个步骤构建成pMCL-CrtYIBZ/idi/gps。使用的载体是与高拷贝数载体相容的pMCL200质粒(Nakano,Y.,Yoshida,Y.,Yamashita,Y.和Koga,T.;Construction of a series of pACYC-derived plasmid vectors;Gene 162(1995),157-158)。
实施例2.1:pMCL-CrtYIBZ的构建
生物合成基因crtY、crtB、crtI和crtZ来自噬夏孢欧文氏菌,并通过PCR手段扩增。作为提供服务的一部分,Deutsche Sammlung vonMikroorganismen und Zellkuturen(DSMZ,Brunswick,Germany)制备噬夏孢欧文氏菌(DSM 30080)基因组DNA。根据制造商提供的信息进行PCR(Roche,Long Template PCR:Procedure for amplification of 5-20kbtargets with the expand long template PCR system)。扩增噬夏孢欧文氏菌生物合成簇的PCR条件如下:
Master Mix 1:
-1.75μl dNTPs(终浓度350μM)
-0.3μM引物Crt1(SEQ ID NO.22)
-0.3μM引物Crt2(SEQ ID NO.23)
-250-500ng DSM 30080基因组DNA
加蒸馏水至总体积50μl
Master Mix 2:
-5μl 10x PCR缓冲液1(终浓度1x,含1.75mM Mg2+)
-10x PCR缓冲液2(终浓度1x,含2.25mM Mg2+)
-10x PCR缓冲液3(终浓度1x,含2.25mM Mg2+)
-0.75μl Expand Long Template Enzyme Mix(终浓度2.6单位)
加蒸馏水至总体积50μl
用吸管将两种混合物“Master Mix 1”和“Master Mix 2”混合。在50μl的总体积中以如下循环条件进行PCR:
1X   94℃两分钟
30X  94℃30秒
     58℃1分钟
     68℃4分钟
1X   72℃10分钟
使用SEQ ID NO.22和SEQ ID NO.23的PCR扩增产生了编码基因CrtY(蛋白质:SEQ ID NO.25)、CrtI(蛋白质:SET NID NO.26)、crtB(蛋白质:SEQ ID NO.27)和CrtZ(iDNA)的片段(SEQ ID NO.24)。使用标准方法,将扩增子克隆进PCR克隆载体pCR2.1(Invitrogen),产生pCR2.1-CrtYIBZ克隆。
用SalI和HindIII切割pCR2.1-CrtYIBZ质粒,分离产生的SalI/HindIII片段,并通过连接将其转移进SalI/HindIII切割的pMCL200载体。克隆进pMCL 200的pCR2.1-CrtYIBZ SalI/HindIII片段长为4624bp,编码CrtY、CrtI、crtB和CrtZ基因,相应于D90087中2295位点到6918位点的序列(SEQ ID NO.24)。产生的克隆被称为pMCL-CrtYIBZ。
实施例2.2:pMCL-CrtYIBZ/idi的构建
通过PCR手段从大肠杆菌中扩增idi(异戊烯-二磷酸异构酶;IPP异构酶)基因。使用有义特异引物(sense-specific primer)(5′-idi SEQ ID NO.28)和反义特异引物(antisense-specific primer)(3′-idi SEQ ID NO.29),通过聚合酶链式反应(PCR)的手段,从大肠杆菌中扩增包括idi启动子和核糖体结合位点的编码完整idi基因的核酸。
PCR条件如下:
在50μl反应混合物中进行扩增DNA的PCR,反应混合物含有:
-1μl大肠杆菌TOP10悬浮液
-0.25mM dNTPs
-0.2mM 5′-idi(SEQ ID NO.28)
-0.2mM 3′-idi(SEQ ID NO.29)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-28.8μl蒸馏水
以如下循环条件进行PCR:
1X   94℃两分钟
20X  94℃1分钟
     62℃1分钟
     72℃1分钟
1X   72℃10分钟
使用SEQ ID NO.28和SEQ ID NO.29的PCR扩增产生679bp的片段,所述片段编码由完整一级序列(SEQ ID NO.30)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR2.1(Invitrogen),产生pCR2.1-idi克隆。
对pCR2.1-idi克隆的测序确证了与发表的AE000372序列8774到9440位点无异的序列。这一区域包括启动子区域、可能的核糖体结合位点和完整的IPP异构酶开放阅读框。由于在idi基因的5’端插入了XhoI切割位点和在3’端插入了SalI切割位点,克隆进pCR2.1-idi的片段总长679bp。
因此,使用这一克隆将idi基因克隆进pMCL-CrtYIBZ载体。通过从pCR2.1-idi分离XhoI/SalI片段并连接进XhoI/SalI切割的pMCL-CrtYIBZ载体进行克隆。产生的克隆被称为pMCL-CrtYIBZ/idi。
实施例2.3.:pMCL-CrtYIBZ/idi/gps的构建
通过PCR手段从Archaeoglobus fulgidus中扩增gps(香叶基香叶基-焦磷酸合酶;GGPP合酶)基因。使用有义特异引物(5′-gps SEQ ID NO.32)和反义特异引物(5′-gps SEQ ID NO.33),通过聚合酶链式反应(PCR)的手段扩增Archaeoglobus fulgidus gps基因。
作为提供服务的一部分,Deutschen Sammlung von Mikroorganismenund Zellkuturen(DSMZ,Brunswick,Germany)制备Archaeoglobusfulgidus DNA。PCR条件如下:
在50μl反应混合物中进行扩增DNA的PCR,所述DNA编码由完整一级序列组成的GGPP合酶蛋白质,PCR反应混合物含有:
-1μl Archaeoglobus fulgidus DNA
-0.25mM dNTPs
-0.2mM 5′-gps(SEQ ID NO.32)
-0.2mM 3′-gps(SEQ ID NO.33)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-28.8μl蒸馏水
以如下循环条件进行PCR:
1X   94℃两分钟
20X  94℃1分钟
     56℃1分钟
     72℃1分钟
1X  72℃10分钟
用已知方法从琼脂糖凝胶中洗脱通过PCR手段和SEQ ID NO.32和SEQ ID NO.33引物扩增的DNA片段,并用限制酶NcoI和HindIII切割。由此产生962bp的片段,此片段编码由完整一级序列(SEQ ID NO.34)组成的蛋白质。使用标准方法将NcoI/HindIII切割的扩增子克隆进pCB97-30载体,产生pCB-gps克隆。
对pCB-gps克隆的测序确证了与发表的AF120272序列有一个核苷酸差异的A.fulgidus GGPP合酶序列。在gps基因中引入一个NcoI切点改变了GGPP合酶的第二个密码子。在发表的AF120272序列中,CTG(4-6位点)编码亮氨酸。使用SEQ ID NO.32和SEQ ID NO.33两引物的扩增将此第二密码子改变为编码缬氨酸的GTG。
因此,使用pCB-gps克隆将gps基因克隆进pMCL-CrtYIBZ/idi载体。通过从pCB-gps中分离KpnI/XhoI片段并连接进用KpnI和XhoI切割的pMCL-CrtYIBZ/idi载体来进行克隆。克隆的KpnI/XhoI片段(SEQ ID NO.34)携带rbcL的最小5’UTR序列及Prrn 16启动子、延伸GGPP合酶N末端的前6个rbcL密码子和gps基因3’端的psbA序列。因此不同于具有Met-Leu-Lys-Glu的天然氨基酸序列(AF120272的1到4位氨基酸),此GGPP合酶的N末端具有改变的氨基酸序列Met-Thr-Pro-Gln-Thr-Ala-Met-Val-Lys-Glu。这导致重组GGPP合酶,其从位点3(在AF120272中)的Lys开始在氨基酸序列上具有一致性,并且不具有其它改变。根据Eibl等人的参考文献(Plant J.19.(1999),1-13)使用rbcL和psbA序列。产生的克隆被称为pMCL-CrtYIBZ/idi/gps。
实施例3:
在重组大肠杆菌菌株中生物转化玉米黄质
通过制备由于异源互补而能产生玉米黄质的重组大肠杆菌菌株来进行玉米黄质的生物转化。以大肠杆菌TOP10菌株作为用质粒pNOSTF-G和pMCL-CrtYIBZ/idi/gps进行互补实验的宿主细胞。
为了制备能够合成高浓度玉米黄质的大肠杆菌菌株,构建了pMCL-CrtYIBZ/idi/gps质粒。所述质粒携带噬夏孢欧文氏菌的生物合成基因crtY、crtB、crtI和crtY、Archaeoglobus fulgidus基因gps(香叶基香叶基-焦磷酸合成酶)和大肠杆菌idi(异戊烯-二磷酸异构酶)基因。此构建体用于消除限制类胡萝卜素以及它们的生物合成前体高聚积的步骤。这一点已被Wang等人在之前以相似的方式,使用若干质粒进行了描述(Wang,C.-W.,Oh,M.-K.和Liao,J.C.;Engineered isoprenoid pathway enhancesastaxanthin production in Escherichia coli.Biotechnology andBioengineering 62(1999),235-241)。
使用pNOSTF-G和pMCL-CrtYIBZ/idi/gps两种质粒,以已知的方式转化大肠杆菌TOP10培养物,并分别过夜培养于30℃和37℃的LB培养基。同样地以已知的方式在过夜培养中加入氨苄青霉素(50μg/ml)、氯霉素(50μg/ml)和异丙基-β-硫代半乳糖苷(1mmol)。
通过用丙酮抽提细胞,蒸发有机溶剂至干燥,并通过HPLC的手段使用C30柱对类胡萝卜素进行分级分离,从重组菌株中分离类胡萝卜素。设置了以下的工艺条件。
分离柱:Prontosil C30柱、250×4.6mm(Bischoff,Leonberg,Germany)
流速:1.0ml/min
洗脱液:洗脱液A-100%甲醇
洗脱液B-80%甲醇、0.2%醋酸胺
洗脱液C-100%叔丁基甲基醚
梯度曲线:
    时间     流速    %洗脱液A    %洗脱液B    %洗脱液C
    1.00     1.0    95.0    5.0    0
    1.05     1.0    80.0    5.0    15.0
    14.00     1.0    42.0    5.0    53.0
    14.05     1.0    95.0    5.0    0
    17.00     1.0    95.0    5.0    0
    18.00     1.0    95.0    5.0    0
检测:300-500nm
使用光(电)二极管阵列检测器直接从洗脱峰检测光谱。
通过与标准样品比较,由吸收光谱和保留时间来鉴定分离的物质。
图1描述样品的层析分析结果,所述样品来自用pNOSTF-G和pMCL-CrtYIBZ/idi/gps转化的大肠杆菌菌株。由于异源互补,这一菌株表现出能够合成多种酮类胡萝卜素。随停留时间的增加,洗脱出虾青素(峰1)、adonirubin(峰2)和角黄素(峰3)。
实施例3.1
比较实施例
作为比较实施例,相似于先前的实施例制备大肠杆菌菌株,所述大肠杆菌菌株表达雨生红球藻Flotow em.Wille来源的酮酶。为此目的,扩增编码雨生红球藻Flotow em.Wille酮酶完整一级序列的cDNA,并将此cDNA按照实施例1克隆进同样的表达载体。通过PCR手段,从雨生红球藻(″Sammlung von Algenkulturen der Universitt Gttingen″的192.80菌株)悬浮培养物中扩增编码雨生红球藻酮酶的cDNA。为了从在室温间接日光条件下于红球藻培养基(1.2g/l醋酸钠、2g/l酵母提取物、0.2g/lMgCl2x6H2O、0.02 CaCl2x2H2O;pH 6.8;高压灭菌后加入400mg/l的L-天冬酰胺、10mg/l FeSO4xH2O)中生长两周的雨生红球藻(192.80菌株)悬浮培养物中制备总RNA,收获细胞,在液氮中冷冻,并在研钵中碾磨成粉。随后将100mg冷冻的藻类细胞粉末转移到反应容器内并加入0.8ml Trizol缓冲液(Life Technologies)。用0.2ml氯仿抽提悬浮液。12000g离心15分钟后,将水相上清液转移到干净的反应容器内,并用一体积的乙醇抽提。用一体积异丙醇沉淀RNA,用75%的乙醇洗涤并将沉淀溶解于DEPC水(用1/1000体积焦碳酸二乙酯在室温孵育水过夜,然后高压灭菌)。通过分光光度法测定RNA浓度。
为合成cDNA,在60℃将2.5μg总RNA变性10分钟,冰上冷却两分钟,并按照制造商的信息,使用反义特异引物PR1(gcaagctcga cagctacaaacc),通过cDNA试剂盒(Ready-to-go-you-prime-beads,Pharmacia Biotech)转录成cDNA。
通过聚合酶链式反应(PCR)的手段,使用有义特异引物PR2(gaagcatgca gctagcagcg acag)和反义特异引物PR1从雨生红球藻扩增编码雨生红球藻(192.80菌株)的酮酶的核酸。
PCR条件如下:
在50ml反应混合物中进行扩增cDNA的PCR,此cDNA编码由完整一级序列组成的酮酶蛋白质,PCR反应混合物含有:
-4ml雨生红球藻cDNA(按如上描述制备)
-0.25mM dNTPs
-0.2mM PR1
-0.2mM PR2
-5ml 10X PCR缓冲液(TAKARA)
-0.25ml R Taq聚合酶(TAKARA)
-28.8ml蒸馏水
以如下循环条件进行PCR:
1X    94℃两分钟
35X   94℃1分钟
      53℃2分钟
      72℃3分钟
1X    72℃10分钟
使用PR1和PR2的PCR扩增产生1155bp的片段,此片段编码由完整一级序列组成的蛋白质:
gaagcatgca gctagcagcg acagtaatgt tggagcagct taccggaagc gctgaggcac      60
tcaaggagaa ggagaaggag gttgcaggca gctctgacgt gttgcgtaca tgggcgaccc     120
agtactcgct tccgtcagag gagtcagacg cggcccgccc gggactgaag aatgcctaca     180
agccaccacc ttccgacaca aagggcatca caatggcgct agctgtcatc ggctcctggg     240
ccgcagtgtt cctccacgcc atttttcaaa tcaagcttcc gacctccttg gaccagctgc     300
actggctgcc cgtgtcagat gccacagctc agctggttag cggcagcagc agcctgctgc     360
acatcgtcgt agtattcttt gtcctggagt tcctgtacac aggccttttt atcaccacgc     420
atgatgctat gcatggcacc atcgccatga gaaacaggca gcttaatgac ttcttgggca     480
gagtatgcat ctccttgtac gcctggtttg attacaacat gctgcaccgc aagcattggg     540
agcaccacaa ccacactggc gaggtgggca aggaccctga cttccacagg ggaaaccctg     600
gcattgtgcc ctggtttgcc agcttcatgt ccagctacat gtcgatgtgg cagtttgcgc     660
gcctcgcatg gtggacggtg gtcatgcagc tgctgggtgc gccaatggcg aacctgctgg     720
tgttcatggc ggccgcgccc atcctgtccg ccttccgctt gttctacttt ggcacgtaca     780
tgccccacaa gcctgagcct ggcgccgcgt caggctctcc accagccgtc atgaactggt     840
ggaagtcgcg cactagccag gcgtccgacc tggtcagctt tctgacctgc taccacttcg     900
acctgcactg ggagcaccac cgctggccct ttgccccctg gtgggagctg cccaactgcc     960
gccgcctgtc tggccgaggt ctggttcctg cctagctgga cacactgcag tgggccctgc    1020
tgccagctgg gcatgcaggt tgtggcagga ctgggtgagg tgaaaagctg caggcgctgc    1080
tgccggacac gctgcatggg ctaccctgtg tagctgccgc cactagggga gggggtttgt    1140
agctgtcgag cttgc
使用标准方法,将扩增子克隆进PCR克隆载体pGEM-Teasy(Promega),产生pGKETO2克隆。
使用T7和SP6引物对pGKETO2克隆测序,确证了仅在73、114和119三个密码子中各有一个碱基与发表的X86782序列不同的序列。在独立的扩增实验中这些核苷酸置换重复产生,并因此代表在所用雨生红球藻192.80菌株中的核苷酸序列。
这一克隆被用于克隆进实施例1中描述的表达载体。以相似于实施例1中描述的方式进行克隆。按照实施例3中的描述进行大肠杆菌菌株的转化、培养和类胡萝卜素分布图的分析。
图2描述样品的层析分析,此样品得自用所述表达载体和pMCL-CrtYIBZ/idi/gps转化的大肠杆菌菌株。使用如EP 725137中描述的雨生红球藻酮酶,随停留时间的增加洗脱出虾青素(峰1)、金盏花黄质(峰2)和未反应的玉米黄质(峰3)。EP 0725137中已经描述了这一类胡萝卜素分布图。
表1比较了细菌产生的类胡萝卜素量:
表1:比较使用两种不同酮酶,即根据本发明(实施例3)的念珠藻属PCC7120 NOST酮酶和作为比较实施例(实施例3.1)的雨生红球藻酮酶时的细菌酮类胡萝卜素合成。类胡萝卜素的量以ng/ml培养物液体表示。
酮酶来源   虾青素   adonirubin   金盏花黄质   角黄素   玉米黄质
雨生红球藻Flotow em.Wille(比较实施例) 13 102 738
念珠藻PCC7120株   491   186   120
根据本发明的念珠藻属PCC7120株酮酶的表达产生了一种类胡萝卜素模式,所述模式与雨生红球藻酮酶表达之后的类胡萝卜素模式显著不同。尽管现有技术的酮酶只能以数量非常有限的方式提供目的类萝卜素酮虾青素,但当使用根据本发明的酮酶时,虾青素是主要的产物。本发明方法中出现明显更少量的羟化副产物。
实施例4:制备在番茄(Lycopersicon esculentum)和万寿菊中组成性表达念珠藻属PCC7120株NOST酮酶的表达载体。
在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶,数据库条目AB011474,70127到69493位点;WO03/006660)的控制下,于番茄和万寿菊中表达念珠藻属PCC7120株NOST酮酶。FNR基因起始于69492碱基对,并被注释为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等人1986,Biochem J.240:709-715)进行表达。
通过PCR手段,使用基因组DNA(通过标准方法从拟南芥中分离)和引物FNR-A(SEQ ID NO.38)及FNR-B(SEQ ID NO.39)制备含有拟南芥FNR启动子区域的DNA片段。
PCR条件如下:
在50μl反应混合物中进行扩增DNA的PCR,此DNA包含FNR启动子片段FNR#1,反应混合物含有:
-100ng拟南芥基因组DNA
-0.25mM dNTPs
-0.2mM FNR-A(SEQ ID NO.38)
-0.2mM FNR-B(SEQ ID NO.39)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu聚合酶(Stratagene)
-28.8μl蒸馏水
以如下循环条件进行PCR:
1X   94℃两分钟
35X  94℃1分钟
     50℃1分钟
     72℃1分钟
1X   72℃10分钟
使用标准方法将647bp扩增子克隆进PCR克隆载体PCR 2.1(Invitrogen),产生pFNR#1质粒。
对pFNR#1克隆的测序确证了相应于拟南芥染色体5上从70127到69493位点之序列部分(数据库条目AB011474;WO03/006660)的序列。FNR基因起始于碱基对69492并被注释名为“铁氧还蛋白-NADP+还原酶”。
因此,pFNR被用于克隆进表达载体pJIT117(Guerineau等人1988,Nucl.Acids Res.16:11380)。
通过从pFNR#1分离637bp SacI-HindIII片段(SacI部分水解)并连接进SacI-HindIII切割的pJIT117载体,从而进行克隆。含有FNR#1启动子而不是原初的d35S启动子的克隆被称为pJITFNR。
通过将799bp的SpHI片段NOSTF-G(描述于实施例1)克隆进SpHI切割的pJITFNR载体,制备成表达盒pJFNRNOST。以正确方向含有NOSTF-G片段的克隆被称为pJFNRNOST,其中所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO02/00900)制备用于通过农杆菌介导向番茄转化念珠藻酮酶的表达盒。
通过将来自pJFNRNOST的2.425bp SacI-XhoI片段(SacI部分水解)与SacI-XhoI切割的pSUN3载体连接,从而制备表达载体pS3FNR:NOST(MSP101)(图3,构建体图谱)。在图3中,FNR启动子片段含有FNR启动子(635bp),rbcS TP片段含有豌豆rbcS转运肽(194bp),Nost酮酶CDS片段(777bp)含有编码念珠藻酮酶的完整一级序列,35S Term片段(746bp)含有CaMV多聚腺苷酸化信号。
使用二元载体pSUN5(WO02/00900)制备用于通过农杆菌介导向万寿菊转化含有念珠藻酮酶的表达载体的表达盒。
通过将来自pJFNRNOST的2.425bp SacI-XhoI片段(SacI部分水解)与SacI-XhoI切割的pSUN5载体连接,从而制备万寿菊表达载体pS5FNR:NOST(MSP102)(图4,构建体图谱)。在图4中,FNR启动子片段含有FNR启动子(635bp),rbcS转运肽片段含有豌豆rbcS转运肽(194bp),Nost酮酶片段(777bp)含有编码念珠藻酮酶的完整一级序列,35S终止子片段(746bp)含有CaMV多聚腺苷酸化信号。
实施例5:
制备用于在番茄和万寿菊的花中特异性表达念珠藻属PCC 7120株NOST酮酶的表达载体。
使用豌豆rbcS转运肽(Anderson等人1986,Biochem J.240:709-715)实现念珠藻酮酶在番茄和万寿菊中的表达。在修改形式的花特异性拟南芥AP3启动子AP3P(AL132971:9298-10200核苷酸区域;Hill等人(1998)Development 125:1711-1721)的控制下进行表达。
通过PCR手段,使用基因组DNA(通过标准方法从拟南芥中分离)及引物AP3-1(SEQ ID NO.41)和AP3-2(SEQ ID NO.42)制备含有拟南芥AP3启动子区域(-902到+15)的DNA片段。
PCR条件如下:
在50μl反应混合物中进行扩增DNA的PCR,此DNA含有AP3启动子片段(-902到+15),反应混合物含有:
-100ng拟南芥基因组DNA
-0.25mM dNTPs
-0.2mM AP3-1(SEQ ID NO.41)
-0.2mM AP3-2(SEQ ID NO.42)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu聚合酶(Stratagene)
-28.8μl蒸馏水
以如下循环条件进行PCR:
1X   94℃两分钟
35X  94℃1分钟
     50℃1分钟
     72℃1分钟
1X   72℃10分钟
使用标准方法将929bp扩增子克隆进PCR克隆载体PCR 2.1(Invitrogen),产生pAP3质粒。
对pAP3克隆的测序确证了所述序列仅因一个插入(在AL132971序列的9765位点插入一个G)和一个碱基置换(AL132971序列9765位点的A被G置换)而不同于发表的AP3序列(AL132971,9298-10200核苷酸区域)。在独立扩增实验中这些核苷酸差异重复产生,并因此代表在所用拟南芥植物中实际的核苷酸序列。
通过重组PCR手段,使用pAP3质粒制备修饰的形式AP3P。使用引物AP3-1(SEQ ID NO.41)和引物AP3-4(SEQ ID NO.44)扩增10200-9771区域(扩增子A1/4),并使用AP3-3(SEQ ID NO.43)和AP3-2(SEQ ID NO.42)扩增9526-9285区域(扩增子A2/3)。
PCR条件如下:
在50μl反应混合物中进行PCR,以扩增含有AP3启动子10200-9771区域和9526-9285区域的DNA片段,反应混合物含有:
-100ng AP3扩增子(如上描述)
-0.25mM dNTPs
-0.2mM有义引物(AP3-1 SEQ ID NO.41或AP3-3 SEQ ID NO.43)
-0.2mM反义引物(AP3-4 SEQ ID NO.44或AP3-2 SEQ ID NO.42)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu Taq聚合酶(Stratagene)
-28.8μl蒸馏水
以如下循环条件进行PCR:
1X   94℃两分钟
35X  94℃1分钟
     50℃1分钟
     72℃1分钟
1X   72℃10分钟
重组PCR包括将有25个核苷酸相重叠的A1/4和A2/3扩增子退火、完善成双链并随后扩增。由此产生缺失9670-9526位点的修饰形式的AP3启动子AP3P。
在17.6μl反应混合物中变性(95℃,5分钟)和退火(于室温缓慢冷却到40℃)A1/4和A2/3两扩增子,反应混合物含有:
-0.5μg A1/4扩增子
-0.25μg A2/3扩增子
在20μl反应混合物中填补3’端(30℃,30分钟),反应混合物含有:
-17.6μl A1/4和A2/3退火反应物(按如上描述制备)
-50μM dNTPs
-2μl 1X Klenow缓冲液
-2U Klenow酶
使用有义特异引物(AP3-1 SEQ ID NO.41)和反义特异引物(AP3-2SEQ ID NO.42),通过PCR手段扩增编码修饰的启动子形式(AP3P)的核酸。
PCR条件如下:
在50μl反应混合物中进行扩增AP3P片段的PCR,反应混合物含有:
-1μl退火反应产物(按如上描述制备)
-0.25mM dNTPs
-0.2mM AP3-1(SEQ ID NO.41)
-0.2mM AP3-2(SEQ ID NO.42)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu Taq聚合酶(Stratagene)
-28.8μl蒸馏水
以如下循环条件进行PCR:
1X   94℃两分钟
35X  94℃1分钟
     50℃1分钟
     72℃1分钟
1X   72℃10分钟
使用SEQ ID NO.41(AP3-1)和SEQ ID NO.42(AP3-2)的PCR扩增产生777bp片段,该片段编码修饰的启动子形式——AP3P。将扩增子克隆进克隆载体pCR2.1(Invitrogen),产生pAP3P质粒。使用引物T7和M13的测序反应确证了与已缺失9285-9526内部区域的AL132971序列10200-9298区域一致的序列。由此,此克隆被用于克隆进表达载体pJIT117(Guerineau等人1988,Nucl.Acids Res.16:11380)。
通过从pAP3P分离767bp的SacI-HindIII片段,并将其连接进SacI-HindIII切割的pJIT117载体来完成克隆。含有AP3P启动子而不是原初的d35S启动子的克隆被称为pJITAP3P。通过将799bp的SpHI片段——NOSTF-G(描述于实施例1)克隆进SpHI切割的pJITAP3P载体,从而制备表达盒pJAP3NOST。以正确方向含有NOSTF-G片段的克隆被称为pJAP3PNOST,其中所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO02/00900)制备用于通过农杆菌介导向番茄转化AP3P控制的念珠藻酮酶的表达载体。
通过将来自pJAP3PNOST的2.555bp SacI-XhoI片段与SacI-XhoI切割的pSUN3载体连接,从而制备表达载体pS3AP3:NOST(MSP103)(图5,构建体图谱)。在图5中,AP3P PROMOTER片段含有修饰的AP3P启动子(765bp),rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp),Nost KETOLASE CDS片段(777bp)含有编码念珠藻酮酶的完整一级序列,35S TERM片段(746bp)含有CaMV多聚腺苷酸化信号。
使用二元载体pSUN5(WO02/00900)制备用于通过农杆菌介导向万寿菊转化AP3P控制的念珠藻酮酶的表达载体。
通过将来自pS5AP3PNOST的2.555bp SacI-XhoI片段与SacI-XhoI切割的pSUN5载体连接,从而制备表达载体pS5AP3:NOST(MSP104)(图6,构建体图谱)。在图6中,AP3P PROMOTER片段含有修饰的AP3P启动子(765bp),rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(207bp),Nost KETOLASE CDS片段(777bp)含有编码念珠藻酮酶的完整一级序列,35S TERM片段(746bp)含有CaMV多聚腺苷酸化信号。
实施例6:
扩增编码点形念珠藻ATCC 29133来源的NP196酮酶完整一级序列的DNA。
通过PCR手段,从点形念珠藻ATCC 29133(″美国典型培养物保葳中心″菌株)扩增编码点形念珠藻ATCC 29133 NP196酮酶的DNA。0
为了从在25℃、恒定振荡(150rpm)并连续光照下于BG11培养基(1.5g/l NaNO3、0.04g/l k2PO4x3H2O、0.075g/l MgSO4xH2O、0.036g/lCaCl2x2H2O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na2CO3、1ml痕量金属混合物A5+Co(2.86g/l H3BO3、1.81g/l MnCl2x4H2O、0.222g/l ZnSO4x7H2O、0.39g/l NaMoO4x2H2O、0.079g/lCuSO4x5H2O、0.0494g/l Co(NO3)2x6H2O)生长1周的点形念珠藻ATCC29133悬浮培养物中制备基因组DNA,离心收集细胞,于液氮冷冻,并在研钵中碾磨成粉。
从点形念珠藻ATCC 29133中分离DNA的方法:
通过8000rpm离心10分钟从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中破碎并碾磨细菌细胞。用1ml 10mM Tris HCI(pH 7.5)重悬浮细胞材料,并转移进Eppendorf反应试管(体积2ml)。加入100μl蛋白酶K(浓度:20mg/ml)后,将细胞悬浮液在37℃孵育3小时。然后用500μl苯酚抽提悬浮液。13000rpm离心5分钟后将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA,然后用70%的乙醇洗涤。在室温干燥DNA沉淀,加入25μl水,并加热到65℃溶解。
通过聚合酶链式反应(PCR)的手段,使用有义特异引物(NP196-1,SEQID NO.54)和反义特异引物(NP196-2 SEQ ID NO.55)从点形念珠藻ATCC29133中扩增编码点形念珠藻ATCC 29133酮酶的核酸。
PCR条件如下:
在50μl反应混合物中进行扩增DNA的PCR,此DNA编码由完整一级序列组成的酮酶蛋白质,反应混合物含有:
-1μl点形念珠藻ATCC 29133 DNA(按如上描述制备)
-0.25mM dNTPs
-0.2mM NP196-1(SEQ ID NO.54)
-0.2mM NP196-2(SEQ ID NO.55)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-25.8μl蒸馏水
在以下循环条件下进行PCR:
1X   94℃2分钟
35X  94℃1分钟
     55℃1分钟
     72℃3分钟
1X   72℃10分钟
使用SEQ ID NO.54和SEQ ID NO.55的PCR扩增产生792bp的片段,所述片段编码由完整一级序列(NP196,SEQ ID NO.56)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),产生pNP196克隆。
使用引物M13F和M13R对pNP196克隆的测序确证了与数据库NZ AABC01000196条目140,571-139,810的DNA序列一致(除在140,571位点的G被A替代以产生标准的ATG起始密码子外)的序列(与发表的数据库条目方向相反)。在独立扩增实验中此核苷酸序列重复产生,并因此代表所用的点形念珠藻ATCC 29133中的核苷酸序列。
因此,所述pNP196克隆被用于克隆进pJIT117表达载体(Guerineau等人1988,Nucl.Acids Res.16:11380)。
用根癌农杆菌Ti质粒pTi15955的OCS终止子(章鱼碱合酶)(数据库条目X00493,12,541-12,350位点,Gielen等人(1984)EMBO J.3 835-846)替换35S终止子来修饰pJIT117。
使用质粒pHELLSGATE(数据库条目AJ311874,Wesley等人(2001)Plant J.27 581-590,通过标准方法从大肠杆菌中分离)以及引物OCS-1(SEQ ID NO.58)和OCS-2(SEQ ID NO.59),通过PCR手段制备含有OCT终止子区域的DNA片段。
PCR条件如下:
在50μl反应混合物中进行PCR,以扩增含有章鱼碱合酶(OCS)终止子区域(SEQ ID NO:60)的DNA,反应混合物含有:
-1ng pHELLSGATE质粒DNA
-0.25mM dNTPs
-0.2mM OCS-1(SEQ ID NO.58)
-0.2mM OCS-2(SEQ ID NO.59)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu聚合酶(Stratagene)
-28.8μl蒸馏水
在以下循环条件下进行PCR:
1X   94℃2分钟
35X  94℃1分钟
     50℃1分钟
     72℃1分钟
1X   72℃10分钟
使用标准方法,将210bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),产生pOCS质粒。
对pOCS克隆测序确证了所述序列相应于根癌农杆菌Ti质粒pTi15955(数据库条目X00493)12541-12350位点的序列部分。
从pOCS分离210bp的SalI-XhoI片段,并将其与SalI-XhoI切割的pJIT117载体连接,从而完成克隆。
这一克隆被称为pJO,并因此用于克隆进表达载体pJONP196。
从pNP 196分离782bp的SphI片段,并将其与SphI切割的pJO载体连接,从而完成克隆。以正确方向含有点形念珠藻NP196酮酶的这一克隆被称为pJONP196,所述酮酶的N-末端与rbcS转运肽翻译融合。
实施例7:
制备在番茄和万寿菊中组成性表达点形念珠藻ATCC 29133来源的NP196酮酶的表达载体。
在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶,数据库条目AB011474,70127到69493位点;WO03/006660)的控制下,于番茄和万寿菊中表达点形念珠藻NP196酮酶。FNR基因起始于69492碱基对并被命名为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等人1986,Biochem J.240:709-715)进行表达。
使用基因组DNA(通过标准方法从拟南芥中分离)及引物FNR-1(SEQID NO.61)和FNR-2(SEQ ID NO.62),通过PCR手段制备含有拟南芥FNR启动子区域的DNA片段。
PCR条件如下:
在50μl反应混合物中进行PCR,以扩增含有FNR启动子片段FNR的DNA(SEQ ID NO.63),反应混合物含有:
-100ng拟南芥基因组DNA
-0.25mM dNTPs
-0.2mM FNR-1(SEQ ID NO.61)
-0.2mM FNR-2(SEQ ID NO.62)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu聚合酶(Stratagene)
-28.8μl蒸馏水
以如下循环条件进行PCR:
1X   94℃两分钟
35X  94℃1分钟
     50℃1分钟
     72℃1分钟
1X   72℃10分钟
使用标准方法将652bp的扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),产生pFNR质粒。
对pFNR克隆的测序确证了相应于拟南芥染色体5上从70127到69493位点的序列片段(数据库条目AB011474)。
这一克隆被称为pFNR,并因此被用于克隆进表达载体pJONP196(描述于实施例6)。
通过从pFNR分离644bp的SmaI-HindIII片段,并将其连接进Ecl136II-HindIII切割的pJONP196载体来完成克隆。含有FNR启动子而不是原初的d35S启动子并且以正确方向含有NP196片段的这一克隆被称为pJOFNR:NP196,所述NP196片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO02/00900)制备用于通过农杆菌介导向番茄转化念珠藻NP196酮酶的表达盒。
通过将来自pJOFNR:NP196的1839bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体连接,从而制备MSP105表达载体(图7,构建体图谱)。在图7中,FNR启动子片段含有FNR启动子(635bp),rbcSTP FRAGMENT片段含有豌豆rbcS转运肽(194bp),NP196 KETO CDS片段(761bp)编码点形念珠藻NP196酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO02/00900)制备表达盒,所述表达盒用于通过农杆菌介导向万寿菊转化含有点形念珠藻NP196酮酶的表达载体。
通过将来自pJOFNR:NP196的1839bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体连接,从而制备MSP106万寿菊表达载体(图8,构建体图谱)。在图8中,FNR启动子片段含有FNR启动子(635bp),rbcS TP FRA GMENT片段含有豌豆rbcS转运肽(194bp),NP196KETO CDS片段(761bp)编码点形念珠藻NP196酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
实施例8:
制备用于在番茄和万寿菊的花中特异表达点形念珠藻ATCC 29133来源的NP196酮酶的表达载体。
使用豌豆rbcS转运肽(Anderson等人1986,Biochem J.240:709-715),在番茄和万寿菊中表达点形念珠藻NP196酮酶。在碧冬茄来源的花特异性EPSPS启动子(数据库条目M37029;核苷酸区域7-1787;Benfey等人(1990)Plant Cell 2:849-856)的控制下进行表达。
使用基因组DNA(通过标准方法从碧冬茄中分离)及引物EPSPS-1(SEQ ID NO.64)和EPSPS-2(SEQ ID NO.65),通过PCR手段制备含有碧冬茄EPSPS启动子区域的DNA片段(SEQ ID NO.66)。
PCR条件如下:
在50μl反应混合物中进行PCR,以扩增含有EPSPS启动子片段(数据库条目M37029:核苷酸区域7-1787)的DNA,反应混合物含有:
-100ng拟南芥基因组DNA
-0.25mM dNTPs
-0.2mM EPSPS-1(SEQ ID NO.64)
-0.2mM EPSPS-2(SEQ ID NO.65)
-5μl 10X PCR缓冲液(Stratagene)
-0.25μl Pfu聚合酶(Stratagene)
-28.8μl蒸馏水
以如下循环条件进行PCR:
1X   94℃两分钟
35X  94℃1分钟
     50℃1分钟
     72℃2分钟
1X   72℃10分钟
使用标准方法将1773bp扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),产生pEPSPS质粒。
对pEPSPS克隆的测序确证了所述序列仅由于两个缺失(M37029序列46-58位点的ctaagtttcagga碱基;M37029序列1422-1429位点的aaaaatat碱基)和碱基置换(T替代M37029序列1447位点的G;A替代M37029序列1525位点的C;A替代M37029序列1627位点的G)而不同于发表的EPSPS序列(数据库条目M37029:核苷酸区域7-1787)。在独立扩增实验中此两缺失和M37029序列1447及1627位点的两个碱基置换重复产生,并因此代表所用的碧冬茄植物中的实际核苷酸序列。
因此,pEPSPS克隆被用于克隆进pJONP196表达载体(描述于实施例6)。
通过从pEPSPS分离1763 bp的SacI-HindIII片段,并将其连接进SacI-HindIII切割的JONP196载体来完成克隆。含有EPSPS启动子而不是原初的d35S启动子的克隆被称为pJOESP:NP196。这一表达盒以正确方向含有NP196片段,其中所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO02/00900)制备表达载体,所述载体用于通过农杆菌介导向番茄转化EPSPS控制的点形念珠藻ATCC 29133 NP196酮酶。
将来自pJOESP:NP196的2961bp的SachI-XhoI片段与SacI-XhoI切割的pSUN3载体连接,从而制备MSP107表达载体(图9,构建体图谱)。在图9中,EPSPS片段含有EPSPS启动子(1761bp),rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp),NP196 KETO CDS片段(761bp)编码点形念珠藻NP196酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO02/00900)制备表达载体,所述载体用于通过农杆菌介导向万寿菊转化EPSPS控制的点形念珠藻NP196酮酶。
将来自pJOESP:NP196的2961 kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体连接,从而制备MSP108表达载体(图10,构建体图谱)。在图10中,EPSPS片段含有EPSPS启动子(1761bp),rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp),NP196 KETO CDS片段(761bp)编码点形念珠藻NP196酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
实施例9:
扩增编码点形念珠藻ATCC 29133来源的NP195酮酶完整一级序列的DNA。
通过PCR手段,从点形念珠藻ATCC 29133(美国典型培养物保藏中心菌株)扩增DNA,所述DNA编码点形念珠藻ATCC 29133的NP195酮酶。从点形念珠藻ATCC 29133悬浮培养物中制备基因组DNA已被描述于实施例19。
使用有义特异引物(NP195-1,SEQ ID NO.67)和反义特异引物(NP195-2 SEQ ID NO.68),通过聚合酶链式反应(PCR)的手段从点形念珠藻ATCC 29133中扩增编码点形念珠藻ATCC 29133酮酶的核酸。
PCR条件如下:
在50μl反应混合物中进行扩增DNA的PCR,所述DNA编码由完整一级序列组成的酮酶蛋白质,反应混合物含有:
-1μl点形念珠藻ATCC 29133 DNA(按如上描述制备)
-0.25mM dNTPs
-0.2mM NP195-1(SEQ ID NO.67)
-0.2mM NP195-2(SEQ ID NO.68)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-25.8μl蒸馏水
在以下循环条件下进行PCR:
1X   94℃2分钟
35X  94℃1分钟
     55℃1分钟
     72℃3分钟
1X   72℃10分钟
使用SEQ ID NO.67和SEQ ID NO.68的PCR扩增产生819bp的片段,所述片段编码由完整一级序列(NP195,SEQ ID NO.69)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),产生pNP195克隆。
使用M13F和M13R引物对pNP195克隆的测序确证了与数据库NZ_AABC01000195条目55604-56392的DNA序列一致(除在55604位点的T被A替代以产生标准的ATG起始密码子外)的序列。在独立扩增实验中此核苷酸序列重复产生并因此代表所用的点形念珠藻ATCC 29133中的核苷酸序列。
因此,所述pNP195克隆被用于克隆进表达载体pJO(描述于实施例6)。通过从pNP195分离809bp的SphI片段,并将其连接进SphI切割的pJO载体来完成克隆。以正确方向含有点形念珠藻NP195酮酶的克隆被称为pJONP195,所述酮酶的N-末端与rbcS转运肽翻译融合。
实施例10:
制备在番茄和万寿菊中组成性表达点形念珠藻ATCC 29133来源的NP195酮酶的表达载体。
在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶,数据库条目AB011474,70127到69493位点;WO03/006660)的控制下,于番茄和万寿菊中表达点形念珠藻NP195酮酶。FNR基因起始于69492碱基对,并被注释为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等人1986,Biochem J.240:709-715)进行表达。
因此,将pFNR克隆(描述于实施例7)用于克隆进表达载体pJONP195(描述于实施例10)。
通过从pFNR分离644bp的Sma-HindIII片段,并将其连接进Ecl136II-HindIII切割的pJONP195载体来完成克隆。含有FNR启动子而不是原初的d35S启动子并以正确方向含有NP195片段的克隆被称为pJOFNR:NP195,所述NP195片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO02/00900)制备表达盒,所述表达盒用于通过农杆菌介导向番茄转化点形念珠藻NP195酮酶。
通过将来自pJOFNR:NP195的1866bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体连接,从而制备MSP109表达载体(图11,构建体图谱)。在图11中,FNR启动子片段含有FNR启动子(635bp),rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp),NP195 KETOCDS片段(789bp)编码点形念珠藻NP195酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO02/00900)制备表达盒,所述表达盒用于通过农杆菌介导向万寿菊转化含有点形念珠藻NP195酮酶的表达载体。
通过将来自pJOFNR:NP195的1866bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体连接,从而制备MSP110万寿菊表达载体(图12,构建体图谱)。在图12中,FNR启动子片段含有FNR启动子(635bp),rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp),NP195KETO CDS片段(789bp)编码点形念珠藻NP195酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
实施例11:
制备用于在番茄和万寿菊中花特异性表达点形念珠藻ATCC 29133来源的NP195酮酶的表达载体。
使用豌豆rbcS转运肽(Anderson等人1986,Biochem J.240:709-715)在番茄和万寿菊中表达点形念珠藻NP195酮酶。在碧冬茄来源的花特异性EPSPS启动子(数据库条目M37029;核苷酸区域7-1787;Benfey等人(1990)Plant Cell 2:849-856)的控制下进行表达。
因此,将pEPSPS克隆(描述于实施例8)用于克隆进表达载体pJONP195(描述于实施例10)。
通过从pEPSPS分离1763bp的SacI-HindIII片段,并将其连接进SacI-HindIII切割的pJONP195载体来完成克隆。含有EPSPS启动子而不是原初的d35S启动子的克隆被称为pJOESP:NP195。这一表达盒以正确方向含有NP195片段,所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO02/00900)制备表达载体,所述载体用于通过农杆菌介导向番茄转化EPSPS控制的点形念珠藻ATCC 29133 NP195酮酶。
将来自pJOESP:NP195的2988kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN3载体连接,从而制备MSP111表达载体(图13,构建体图谱)。在图13中,EPSPS片段含有EPSPS启动子(1761bp),rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp),NP195 KETO CDS片段(789bp)编码点形念珠藻NP195酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO02/00900)制备表达载体,所述载体用于通过农杆菌介导向万寿菊转化EPSPS控制的点形念珠藻NP195酮酶。
将来自pJOESP:NP195的2988kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体连接,从而制备MSP112表达载体(图14,构建体图谱)。在图14中,EPSPS片段含有EPSPS启动子(1761bp),rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp),NP195 KETO CDS片段(789bp)编码点形念珠藻NP195酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
实施例12:
扩增编码泡沫节球藻NSOR10来源的NODK酮酶完整一级序列的DNA。
通过PCR手段,从泡沫节球藻NSOR10扩增编码泡沫节球藻NSOR10酮酶的DNA。
为了从在25℃、恒定振荡(150rpm)并连续光照下于BG 11培养基(1.5g/l NaNO3、0.04g/l K2PO4x3H2O、0.075g/l MgSO4xH2O、0.036g/lCaCl2x2H2O、0.006g/l柠檬酸、0.006g/l柠檬酸铁铵、0.001g/l EDTA二钠镁、0.04g/l Na2CO3、1ml痕量金属混合物A5+Co(2.86g/l H3BO3、1.81g/lMnCl2x4H2O、0.222g/l ZnSO4x7H2O、0.39g/l NaMoO4x2H2O、0.079g/lCuSO4x5H2O、0.0494g/l Co(NO3)2x6H2O)生长1周的泡沫节球藻NSOR10悬浮培养物中制备基因组DNA,通过离心收集细胞,于液氮中冷冻,并在研钵中碾磨成粉。
从泡沫节球藻NSOR10中分离DNA的方法:
通过在8000rpm离心10分钟,从10ml液体培养物中沉淀细菌细胞。然后用研钵在液氮中破碎并碾磨细胞。用1ml 10mM Tris HCI(pH 7.5)重悬浮细胞材料,并转移进Eppendorf反应试管(体积2ml)。加入100μl蛋白酶K(浓度:20mg/ml)后,将细胞悬浮液在37℃孵育3小时。然后用500μl苯酚抽提悬浮液。13000rpm离心5分钟后将上层水相转移到新的2ml Eppendorf反应试管中。用苯酚反复抽提3次。加入1/10体积的3M醋酸钠(pH 5.2)和0.6体积的异丙醇沉淀DNA,然后用70%的乙醇洗涤。在室温干燥DNA沉淀,加入25μl水,并在加热到65℃溶解。
使用有义特异引物(NODK-1,SEQ ID NO.71)和反义特异引物(NODK-2,SEQ ID NO.72),通过聚合酶链式反应(PCR)的手段从泡沫节球藻NSOR10中扩增编码泡沫节球藻NSOR10酮酶的核酸。
PCR条件如下:
在50μl反应混合物中进行扩增DNA的PCR,此DNA编码由完整一级序列组成的酮酶蛋白质,反应混合物含有:
-1μl泡沫节球藻NSOR10 DNA(按如上描述制备)
-0.25mM dNTPs
-0.2mM NODK-1(SEQ ID NO.71)
-0.2mM NODK-2(SEQ ID NO.72)
-5μl 10X PCR缓冲液(TAKARA)
-0.25μl R Taq聚合酶(TAKARA)
-25.8μl蒸馏水
在以下循环条件下进行PCR:
1X   94℃2分钟
35X  94℃1分钟
     55℃ 1分钟
     72℃ 3分钟
1X   72℃ 10分钟
使用SEQ ID NO.71和SEQ ID NO.72的PCR扩增产生720bp的片段,此片段编码由完整一级序列(NODK,SEQ ID NO.73)组成的蛋白质。使用标准方法,将扩增子克隆进PCR克隆载体pCR 2.1(Invitrogen),产生pNODK克隆。
使用M13F和M13R引物对pNODK克隆的测序确证了与数据库AY210783条目2130-2819的DNA序列一致的序列(与发表的数据库条目方向相反)。在独立扩增实验中此核苷酸序列重复产生,并因代表所用的泡沫节球藻NSOR10中的核苷酸序列。
因此,所述pNODK克隆被用于克隆进表达载体pJO(描述于实施例6)。通过从pNODK分离710bp的SphI片段并将其与SphI切割的pJO载体连接,从而完成克隆。以正确方向含有泡沫节球藻NODK酮酶的克隆被称为pJONODK,所述酮酶的N-末端与rbcS转运肽翻译融合。
实施例13:
制备在番茄和万寿菊中组成性表达泡沫节球藻NSOR10来源的NODK酮酶的表达载体。
在拟南芥来源的组成型启动子FNR(铁氧还蛋白NADPH氧化还原酶,数据库条目AB011474,70127到69493位点;WO03/006660)的控制下,于番茄和万寿菊中表达泡沫节球藻NSOR10 NODK酮酶。FNR基因起始于69492碱基对并被命名为“铁氧还蛋白-NADP+还原酶”。使用豌豆转运肽rbcS(Anderson等人1986,Biochem J.240:709-715)进行表达。
因此,将pFNR克隆(描述于实施例7)用于克隆进表达载体pJONODK(描述于实施例12)。
通过从pFNR分离644bp的Sma-HindIII片段,并将其连接进Ecl136II-HindIII切割的pJONODK载体来完成克隆。含有FNR启动子而不是原初的d35S启动子并且以正确方向含有NODK片段的克隆被称为pJOFNR:NODK,所述NODK片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO02/00900)制备表达盒,所述表达盒用于通过农杆菌介导向番茄转化泡沫节球藻NSOR10 NODK酮酶。
通过将来自pJOFNR:NODK的1767bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN3载体连接,从而制备MSP113表达载体(图15,构建体图谱)。在图15中,FNR启动子片段含有FNR启动子(635bp),rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp),NODK KETOCDS片段(690bp)编码泡沫节球藻NSOR10 NODK酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO02/00900)制备表达盒,所述表达盒用于通过农杆菌介导向万寿菊转化含有泡沫节球藻NSOR10 NODK酮酶的表达载体。
通过将来自pJOFNR:NODK的1767bp的EcoRI-XhoI片段与EcoRI-XhoI切割的pSUN5载体连接,从而制备MSP114万寿菊表达载体(图16,构建体图谱)。在图16中,FNR启动子片段含有FNR启动子(635bp),rbcS TP FRAGMENT片段含有豌豆rbcS转运肽(194bp),NODKKETO CDS片段(690bp)编码泡沫节球藻NSOR10 NODK酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
实施例14:
制备用于在番茄和万寿菊中花特异性表达泡沫节球藻NSOR10来源的NODK酮酶的表达载体。
使用豌豆rbcS转运肽(Anderson等人1986,Biochem J.240:709-715)在番茄和万寿菊中表达泡沫节球藻NSOR10 NODK酮酶。在碧冬茄来源的花特异性EPSPS启动子(数据库条目M37029;核苷酸区域7-1787;Benfey等人(1990)Plant Cell 2:849-856)的控制下进行表达。
因此,将pEPSPS克隆(描述于实施例8)用于克隆进pJONODK表达载体(描述于实施例12)。
通过从pEPSPS分离1763bp的SacI-HindIII片段,并将其连接进SacI-HindIII切割的pJONODK载体来完成克隆。含有EPSPS启动子而不是原初的d35S启动子的克隆被称为pJOESP:NODK。这一表达盒以正确方向含有NODK片段,所述片段的N-末端与rbcS转运肽融合。
使用二元载体pSUN3(WO02/00900)制备表达载体,所述载体用于通过农杆菌介导向番茄转化EPSPS控制的泡沫节球藻NSOR10 NODK酮酶。
将来自pJOESP:NODK的2889kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN3载体连接,从而制备MSP115表达载体(图17,构建体图谱)。在图17中,EPSPS片段含有EPSPS启动子(1761bp),rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp),NODK KETO CDS片段(690bp)编码泡沫节球藻NSOR10NODK酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
使用二元载体pSUN5(WO02/00900)制备表达载体,所述载体用于通过农杆菌介导向万寿菊转化EPSPS控制的泡沫节球藻NSOR10 NODK酮酶。
将来自pJOESP:NODK的2889kbp的SachI-XhoI片段与SacI-XhoI切割的pSUN5载体连接,从而制备MSP116表达载体(图18,构建体图谱)。在图18中,EPSPS片段含有EPSPS启动子(1761bp),rbcS TPFRAGMENT片段含有豌豆rbcS转运肽(194bp),NODK KETO CDS片段(690bp)编码泡沫节球藻NSOR10 NODK酮酶,OCS终止子片段(192bp)含有章鱼碱合酶的多聚腺苷酸化信号。
实施例15:
转基因番茄植物的制备
根据Ling及其合作者发表的方法(Plant Cell Reports(1998),17:843-847)转化并再生番茄植物。对于品种Microtom,使用更高浓度的卡那霉素(100mg/l)进行选择。使用Microtom系的7到10天龄幼苗的子叶和下胚轴作为用于转化的最初外植体。萌发使用含2%蔗糖、pH 6.1的Murashige和Skoog的培养基(1962:Murashige and Skoog,1962,Physiol.Plant 15,473-)。在21℃、低光照(20-100μE)的情况下进行萌发。7到10天后,横向分割子叶,将下胚轴切成约5-10mm长的节段,并置于MSBN培养基(MS,pH 6.1,3%蔗糖+1mg/l BAP,0.1mg/l NAA)上,在一天前预先对所述培养基装载悬浮培养的番茄细胞。用无菌滤纸覆盖番茄细胞(无气泡)。在所述培养基上将外植体预培养3到5天。单独使用pS3FNR:NOST、pS3AP3:NOST、pS3FNR:NP196、pS3EPS:NP196、pS3FNR:NP195、pS3EPS:NP195、pS3FNR:NODK和pS3EPS:NODK质粒分别转化根癌农杆菌LBA4404株细胞。在每种情况下,将用二元载体pS3FNRNOST、pS3AP3NOST、pS3FNR:NP196、pS3EPS:NP196、pS3FNR:NP195、pS3EPS:NP195、pS3FNR:NODK和pS3EPS:NODK转化的各农杆菌菌株的过夜培养物在28℃培养于含有卡那霉素(20mg/l)的YEB培养基中,离心细胞。将细菌沉淀重悬浮于液体MS培养基(3%蔗糖,pH 6.1),并调节到0.3的光密度(在600nm)。将预培养的外植体转移到悬浮液中,并在室温于温和振荡的条件下孵育30分钟。随后,用无菌滤纸干燥外植体,并将其返回预培养培养基共培养3天(21℃)。
共培养后,将外植体转移到MSZ2培养基(MS pH 6.1+3%蔗糖、2mg/l玉米素、100mg/l卡那霉素、160mg/l替曼汀(timentin))并储存,用于在21℃、弱光条件(20-100μE、光节律16h/8h)下选择性再生。在芽形成以前每两到3周转移一次外植体。可以从外植体上分离小芽,并让其在MS(pH 6.1+3%蔗糖)、160mg/l替曼汀、30mg/l卡那霉素、0.1mg/lIAA上生根。将生根的植物转移到温室。
根据以上描述的转化方法,用以下表达构建体获得了如下株系:
用pS3FNR:NOST获得的株系是:MSP101-1、MSP101-2、MSP101-3
用pS3AP3:NOST获得的株系是:MSP103-1、MSP103-2、MSP103-3
用pS3FNR:NP196获得的株系是:MSP105-1、MSP105-2、MSP105-3
用pS3EPS:NP196获得的株系是:MSP107-1、MSP107-2、MSP107-3
用pS3FNR:NP195获得的株系是:MSP109-1、MSP109-2、MSP109-3
用pS3EPS:NP195获得的株系是:MSP111-1、MSP111-2、MSP111-3
用pS3FNR:NODK获得的株系是:MSP113-1、MSP113-2、MSP113-3
用pS3EPS:NODK获得的株系是:MSP115-1、MSP115-2、MSP115-3
实施例16:
转基因万寿菊植物的制备
将万寿菊种子灭菌并置于萌发培养基(MS培养基;Murashige和Skoog,Physio.Plant.15(1962),473-497)pH 5.8,2%蔗糖)上。萌发发生的温度/光照/时间间隔为18-28℃/20-200μE/3-16周、但是优选在21℃、20-70μE、持续4-8周。
到时收获体外发育的植物的所有叶子,并从中部横切。在制备过程中将由此产生的10-60mm2大小的叶外植体储存于室温下的液体MS培养基中,并且不超过两小时。
过夜培养任何一种具有适当二元质粒的根癌农杆菌菌株,并用于与叶子材料共培养,其中优选超毒力菌株,如EHA 105,所述二元质粒可以携带选择性标记基因(优选bar或pat)和一种或多种性状或报告基因(pS5FNR:NOST、pS5AP3:NOST、pS5FNR:NP196、pS5EPS:NP196、pS5FNR:NP195、pS5EPS:NP195、pS5FNR:NODK和pS5EPS:NODK)。可以如下培养细菌菌株:将适当菌株的单菌落接种于具有25mg/l卡那霉素的YEB(0.1%酵母提取物、0.5%牛肉膏、0.5%蛋白胨、0.5%蔗糖、0.5%硫酸镁x 7 H2O),并在28℃培养16到20小时。然后以6000g离心10分钟收获细菌悬浮液,并重新悬浮于液体MS培养基,以至产生约0.1到0.8的OD600。将这一悬浮液与叶子材料共培养。
临在共培养之前,用细菌悬浮液替换储存叶子的MS培养基。以室温下温和振荡30分钟在农杆菌悬浮液中孵育叶子。然后将感染的外植体置于用琼脂(如0.8%的植物琼脂(Duchefa,NL))固化的具有生长调节剂(如3mg/l的苄基氨基嘌呤(Benzylaminopurin)(BAP)和1mg/l吲哚乙酸(IAA))的MS培养基上。叶子在培养基上的方向是无关紧要的。外植体的培养进行1到8天,但是优选6天,在此过程中可应用以下条件:光强度:30-80μmol/m2 x秒,温度:22-24℃,16/8小时明/暗交替。然后,将共培养的外植体转移到新鲜MS培养基,优选具有同样的生长调节剂,此第二培养基额外含有抗生素来抑制细菌生长。浓度为200到500mg/l的替曼汀特别适合这一目的。使用的第二选择性组分用于选择成功的转化。1到5mg/l浓度的膦丝菌素选择特别有效,但是也可以根据所用方法考虑其它选择性组分。
在每种情况下1到3周后,将外植体转移到新鲜培养基直到发育出胚芽和小芽,然后将其转移到具生长调节剂(即如0.5mg/l的吲哚丁酸(IBA)和0.5mg/l的赤霉酸GA3)的同样基础培养基进行生根,所述培养基含有替曼汀和PPT或含有替代组分。生根的芽可以被转移到温室。
除了描述的方法,可以进行以下有利的修改:
在用细菌感染外植体以前,可以将外植体预孵育于上述用于共培养的培养基上1到12天(优选3-4天)。随后是如上描述的感染、共培养和选择性再生。
可以将用于再生的pH值(通常为5.8)降到5.2。这样能提高对农杆菌生长的控制。
向再生培养基加入AgNO3(3-10mg/l)能提高包括再生自身在内的培养条件。
技术人员所知的降低苯酚形成的组分(如柠檬酸、抗坏血酸、PVP和许多其它组分)对于培养具有有利的作用。
整个方法可以使用液体培养基。也可以在置于液体培养基上的商业可获得的支持物上孵育培养物。
根据以上描述的转化方法,用以下表达构建体获得了下述株系:
用pS5FNR:NOST获得的株系是:例如MSP102-1、MSP102-2、MSP102-3
用pS5AP3:NOST获得的株系是:例如MSP104-1、MSP104-2、MSP104-3
用pS5FNR:NP196获得的株系是:MSP106-1、MSP106-2、MSP106-3
用pS5EPS:NP196获得的株系是:MSP108-1、MSP108-2、MSP108-3
用pS5FNR:NP195获得的株系是:MSP110-1、MSP110-2、MSP110-3
用pS5EPS:NP195获得的株系是:MSP112-1、MSP112-2、MSP112-3
用pS5FNR:NODK获得的株系是:MSP114-1、MSP114-2、MSP114-3
用pS5EPS:NODK获得的株系是:MSP116-1、MSP116-2、MSP116-3
实施例17
转基因植物花的特征描述
实施例9.1
从转基因植物的花瓣中分离类胡萝卜素酯
一般方法:
在液氮中碾磨转基因植物的花瓣,并用100%的丙酮(3次,每次500μl)抽提花瓣粉末(约40mg)。蒸发掉溶剂并将类胡萝卜素重悬浮于100-200μl的石油醚/丙酮(5∶1,v/v)。
根据类胡萝卜素的疏水性(phobicity),通过Silica60 F254平板(Merck)上的薄层层析(TLC),在有机溶剂(石油醚/丙酮;5∶1)中以浓缩形式对类胡萝卜素进行分级分离。挖取TLC上黄色(叶黄素酯)、红素(酮类胡萝卜素酯)和橙色(叶黄素和酮类胡萝卜素酯的混合物)的带。
用500μl丙酮对与二氧化硅结合的类胡萝卜素进行3次洗脱,蒸发掉溶剂,并通过HPLC的手段分级分离和鉴定类胡萝卜素。
可以通过C30反相柱区分类胡萝卜素的单酯和二酯。HPLC运行条件与发表的方法(Frazer等人(2000),Plant Journal 24(4):551-558)实质上一致。设定了以下方法条件。
分离柱:Prontosil C30柱,250×4.6mm,(Bischoff,Leonberg,Germany)
流速:1.0ml/min
洗脱液:洗脱液A-100%甲醇
        洗脱液B-80%甲醇、0.2%乙酸铵
        洗脱液C-100%叔丁基甲基醚
梯度曲线:
    时间     流速    %洗脱液A  %洗脱液B  %洗脱液C
    12.0     1.0    95.0  5.0  0
    12.1     1.0    80.0  5.0  15.0
    22.0     1.0    76.0  5.0  19.0
    22.0     1.0    66.5  5.0  28.5
    38.0     1.0    15.0  5.0  80.0
    45.0     1.0    95.0  5.0  0
    46.0     1.0    95.0  5.0  0
    46.1     1.0    95.0  5.0  0
检测:300-500nm
可以基于UV-VIS光谱鉴定类胡萝卜素。
碾磨转基因番茄植物的花瓣材料并用丙酮抽提。通过TLC手段对抽提的类胡萝卜素进行分级分离,在此品系中可以检测到酮类胡萝卜素的单酯和二酯;单酯具有比二酯明显更低的浓度。
实施例18
类胡萝卜素酯的酶水解以及类胡萝卜素的鉴定
一般的方法
用100%的丙酮抽提(3次500μl;每次振荡约15分钟)碾磨的花瓣材料(30-100mg鲜重)。蒸发掉溶剂。然后用495μl丙酮吸收类胡萝卜素,在加入4.95ml磷酸钾缓冲液(100mM,pH 7.4)后彻底混合。然后加入17mg胆汁盐(Sigma)和149μl NaCl/CaCl2溶液(3M NaCl和75mMCaCl2)。将悬浮液在37℃孵育30分钟。为了酶促水解类胡萝卜素酯,加入595μl脂酶溶液(50mg/ml Candida rugosa来源的7型脂酶(Sigma))并在振荡下孵育于37℃。约21小时后,进一步加入595μl脂酶,再度在37℃孵育至少5小时。然后在溶液中溶解约700mg Na2SO4x10H2O。加入1800μl石油醚后,通过剧烈混合将类胡萝卜素抽提进有机相。重复这一抽提,直到有机相保持无色。合并石油醚级分并蒸发掉石油醚。用100-120μl丙酮吸收游离的类胡萝卜素。可以通过HPLC和C30反相柱的手段,基于停留时间和UV-VIS光谱鉴定游离的类胡萝卜素。
                                 序列表
<110>太阳基因两合公司(SunGene GmbH & Co.KgaA)
<120>在遗传修饰生物中制备酮类胡萝卜素的方法
<130>20020636
<160>74
<170>PatentIn version 3.1
<210>1
<211>777
<212>DNA
<213>念珠藻PCC7120
<220>
<221>CDS
<222>(1)..(777)
<223>
<400>1
atg gtt cag tgt caa cca tca tct ctg cat tca gaa aaa ctg gtg tta        48
Met Val Gln Cys Gln Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu
1               5                   10                  15
ttg tca tcg aca atc aga gat gat aaa aat att aat aag ggt ata ttt        96
Leu Ser Ser Thr Ile Arg Asp Asp Lys Asn Ile Asn Lys Gly Ile Phe
            20                  25                  30
att gcc tgc ttt atc tta ttt tta tgg gca att agt tta atc tta tta       144
Ile Ala Cys Phe Ile Leu Phe Leu Trp Ala Ile Ser Leu Ile Leu Leu
        35                  40                  45
ctc tca ata gat aca tcc ata att cat aag agc tta tta ggt ata gcc       192
Leu Ser Ile Asp Thr Ser Ile Ile His Lys Ser Leu Leu Gly Ile Ala
    50                  55                  60
atg ctt tgg cag acc ttc tta tat aca ggt tta ttt att act gct cat       240
Met Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
65                  70                  75                  80
gat gcc atg cac ggc gta gtt tat ccc aaa aat ccc aga ata aat aat       288
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg Ile Asn Asn
                85                  90                  95
ttt ata ggt aag ctc act cta atc ttg tat gga cta ctc cct tat aaa       336
Phe Ile Gly Lys Leu Thr Leu Ile Leu Tyr Gly Leu Leu Pro Tyr Lys
            100                 105                 110
gat tta ttg aaa aaa cat tgg tta cac cac gga cat cct ggt act gat       384
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp
        115                 120                 125
tta gac cct gat tat tac aat ggt cat ccc caa aac ttc ttt ctt tgg       432
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gln Asn Phe Phe Leu Trp
    130                 135                 140
tat cta cat ttt atg aag tct tat tgg cga tgg acg caa att ttc gga       480
Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gln Ile Phe Gly
145                 150                 155                 160
tta gtg atg att ttt cat gga ctt aaa aat ctg gtg cat ata cca gaa       528
Leu Val Met Ile Phe His Gly Leu Lys Asn Leu Val His Ile Pro Glu
                165                 170                 175
aat aat tta att ata ttt tgg atg ata cct tct att tta agt tca gta       576
Asn Asn Leu Ile Ile Phe Trp Met Ile Pro Ser Ile Leu Ser Ser Val
            180                 185                 190
caa cta ttt tat ttt ggt aca ttt ttg cct cat aaa aag cta gaa ggt       624
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly
        195                 200                 205
ggt tat act aac ccc cat tgt gcg cgc agt atc cca tta cct ctt ttt       672
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser Ile Pro Leu Pro Leu Phe
    210                 215                 220
tgg tct ttt gtt act tgt tat cac ttc ggc tac cac aag gaa cat cac       720
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His
225                 230                 235                 240
gaa tac cct caa ctt cct tgg tgg aaa tta cct gaa gct cac aaa ata       768
Glu Tyr Pro Gln Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys Ile
                245                 250                 255
tct tta taa                                                           777
Ser Leu
<210>2
<211>258
<212>PRT
<213>念珠藻PCC7120
<400>2
Met Val Gln Cys Gln Pro Ser Ser Leu His Ser Glu Lys Leu Val Leu
1               5                   10                  15
Leu Ser Ser Thr Ile Arg Asp Asp Lys Asn Ile Asn Lys Gly Ile Phe
            20                  25                  30
Ile Ala Cys Phe Ile Leu Phe Leu Trp Ala Ile Ser Leu Ile Leu Leu
        35                  40                  45
Leu Ser Ile Asp Thr Ser Ile Ile His Lys Ser Leu Leu Gly Ile Ala
    50                  55                  60
Met Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
65                  70                  75                  80
Asp Ala Met His Gly Val Val Tyr Pro Lys Asn Pro Arg Ile Asn Asn
                85                  90                  95
Phe Ile Gly Lys Leu Thr Leu I1e Leu Tyr Gly Leu Leu Pro Tyr Lys
            100                 105                 110
Asp Leu Leu Lys Lys His Trp Leu His His Gly His Pro Gly Thr Asp
        115                 120                 125
Leu Asp Pro Asp Tyr Tyr Asn Gly His Pro Gln Asn Phe Phe Leu Trp
    130                 135                 140
Tyr Leu His Phe Met Lys Ser Tyr Trp Arg Trp Thr Gln Ile Phe Gly
145                 150                 155                 160
Leu Val Met Ile Phe His Gly Leu Lys Asn Leu Val His Ile Pro Glu
                165                 170                 175
Asn Asn Leu Ile Ile Phe Trp Met Ile Pro Ser Ile Leu Ser Ser Val
            180                 185                 190
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Lys Lys Leu Glu Gly
        195                 200                 205
Gly Tyr Thr Asn Pro His Cys Ala Arg Ser Ile Pro Leu Pro Leu Phe
    210                 215                 220
Trp Ser Phe Val Thr Cys Tyr His Phe Gly Tyr His Lys Glu His His
225                 230                 235                 240
Glu Tyr Pro Gln Leu Pro Trp Trp Lys Leu Pro Glu Ala His Lys Ile
                245                 250                 255
Ser Leu
<210>3
<211>789
<212>DNA
<213>点形念珠藻
<220>
<221>CDS
<222>(1)..(789)
<223>
<400>3
ttg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa        48
Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta        96
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat       144
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
tat gcc aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa       192
Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat       240
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca       288
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag       336
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
aat cat tgc tta cat cat cgt cat cct gct agc gaa gtt gac cca gat       384
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp
        115                 120                 125
ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc       432
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta       480
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc       528
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat       576
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat       624
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc       672
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat       720
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac       768
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
aat tca gta acc aat tcg taa                                           789
Asn Ser Val Thr Asn Ser
            260
<210>4
<211>262
<212>PRT
<213>点形念珠藻
<400>4
Leu Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp
        115                 120                 125
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
Asn Ser Val Thr Asn Ser
            260
<210>5
<211>762
<212>DNA
<213>点形念珠藻
<220>
<221>CDS
<222>(1)..(762)
<223>
<400>5
gtg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca        48
Val Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc        96
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac       144
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
atc tca aag cta aaa ttt tgg atg tta ttg cct gtt ata cta tgg caa       192
Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat       240
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca       288
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa       336
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
aaa cat tgg tta cac cac cac aat cca gca agc tca ata gac ccg gat       384
Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp
        115                 120                 125
ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt       432
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att       480
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act       528
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat       576
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag       624
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc       672
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat       720
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag               762
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>6
<211>253
<212>PRT
<213>点形念珠藻
<400>6
Val Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp
        115                 120                 125
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>7
<211>789
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(789)
<223>
<400>7
atg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa          48
Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta        96
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat       144
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
tat gcc aaa att cat aag tgg ttg ata cct att gca ata gtt tgg caa       192
Tyr Ala Lys Ile His Lys Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat       240
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca       288
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag       336
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
aat cat tgc tta cat cat cgt cat cct gct agc gaa gtt gac cca gat       384
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp
        115                 120                 125
ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc       432
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta       480
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc       528
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat       576
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat       624
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc       672
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat       720
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac       768
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
aat tca gta acc aat tcg taa                                           789
Asn Ser Val Thr Asn Ser
            260
<210>8
<211>262
<212>PRT
<213>人工序列
<400>8
Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
Tyr Ala Lys Ile His Lys Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
Asn His Cys Leu His His Arg His Pro Ala Ser Glu Val Asp Pro Asp
        115                 120                 125
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
Asn Ser Val Thr Asn Ser
            260
<210>9
<211>789
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(789)
<223>
<400>9
atg aat ttt tgt gat aaa cca gtt agc tat tat gtt gca ata gag caa        48
Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
tta agt gct aaa gaa gat act gtt tgg ggg ctg gtg att gtc ata gta        96
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
att att agt ctt tgg gta gct agt ttg gct ttt tta cta gct att aat       144
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
tat gcc aaa gtc cca att tgg ttg ata cct att gca ata gtt tgg caa       192
Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
atg ttc ctt tat aca ggg cta ttt att act gca cat gat gct atg cat       240
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
ggg tca gtt tat cgt aaa aat ccc aaa att aat aat ttt atc ggt tca       288
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
cta gct gta gcg ctt tac gct gtg ttt cca tat caa cag atg tta aag       336
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
aat cat tgc tta cat cat cgt cat cct gct agc gat tta gac cca gat       384
Asn His Cys Leu His His Arg His Pro Ala Ser Asp Leu Asp Pro Asp
        115                 120                 125
ttt cat gat ggt aag aga aca aac gct att ttc tgg tat ctc cat ttc       432
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
atg ata gaa tac tcc agt tgg caa cag tta ata gta cta act atc cta       480
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
ttt aat tta gct aaa tac gtt ttg cac atc cat caa ata aat ctc atc       528
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
tta ttt tgg agt att cct cca att tta agt tcc att caa ctg ttt tat       576
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
ttc gga aca ttt ttg cct cat cga gaa ccc aag aaa gga tat gtt tat       624
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
ccc cat tgc agc caa aca ata aaa ttg cca act ttt ttg tca ttt atc       672
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
gct tgc tac cac ttt ggt tat cat gaa gaa cat cat gag tat ccc cat       720
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
gta cct tgg tgg caa ctt cca tct gta tat aag cag aga gta ttc aac       768
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
                245                 250                 255
aat tca gta acc aat tcg taa                                           789
Asn Ser Val Thr Asn Ser
            260
<210>10
<211>262
<212>PRT
<213>人工序列
<400>10
Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val Ala Ile Glu Gln
1               5                   10                  15
Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val Ile Val Ile Val
            20                  25                  30
Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu Leu Ala Ile Asn
        35                  40                  45
Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala Ile Val Trp Gln
    50                  55                  60
Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His Asp Ala Met His
65                  70                  75                  80
Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn Phe Ile Gly Ser
                85                  90                  95
Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln Gln Met Leu Lys
            100                 105                 110
Asn His Cys Leu His His Arg His Pro Ala Ser Asp Leu Asp Pro Asp
        115                 120                 125
Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp Tyr Leu His Phe
    130                 135                 140
Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val Leu Thr Ile Leu
145                 150                 155                 160
Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln Ile Asn Leu Ile
                165                 170                 175
Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys Gly Tyr Val Tyr
        195                 200                 205
Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe Leu Ser Phe Ile
    210                 215                 220
Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln Arg Val Phe Asn
Asn Ser Val Thr Asn Ser
            260
<210>11
<211>762
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(762)
<223>
<400>11
atg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca        48
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc        96
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac       144
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
atc tca aag att cat aag tgg atg tta ttg cct gtt ata cta tgg caa       192
Ile Ser Lys Ile His Lys Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat       240
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca       288
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa       336
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
aaa cat tgg tta cac cac cac aat cca gca agc tca ata gac ccg gat       384
Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp
        115                 120                 125
ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt       432
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att       480
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act       528
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat       576
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag       624
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc       672
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat       720
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag               762
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>12
<211>253
<212>PRT
<213>人工序列
<400>12
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
Ile Ser Lys Ile His Lys Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
Lys His Trp Leu His His His Asn Pro Ala Ser Ser Ile Asp Pro Asp
        115                 120                 125
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>13
<211>762
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(762)
<223>
<400>13
atg atc cag tta gaa caa cca ctc agt cat caa gca aaa ctg act cca        48
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
gta ctg aga agt aaa tct cag ttt aag ggg ctt ttc att gct att gtc        96
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
att gtt agc gca tgg gtc att agc ctg agt tta tta ctt tcc ctt gac       144
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
atc tca aag cta aaa ttt tgg atg tta ttg cct gtt ata cta tgg caa       192
Ile Ser Lys Leu Lys phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
aca ttt tta tat acg gga tta ttt att aca tct cat gat gcc atg cat       240
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
ggc gta gta ttt ccc caa aac acc aag att aat cat ttg att gga aca       288
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
ttg acc cta tcc ctt tat ggt ctt tta cca tat caa aaa cta ttg aaa       336
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
aaa cat tgg tta cac cac cac aat cca gca agc gat tta gac ccg gat       384
Lys His Trp Leu His His His Asn Pro Ala Ser Asp Leu Asp Pro Asp
        115                 120                 125
ttt cac aat ggt aaa cac caa agt ttc ttt gct tgg tat ttt cat ttt       432
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
atg aaa ggt tac tgg agt tgg ggg caa ata att gcg ttg act att att       480
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
tat aac ttt gct aaa tac ata ctc cat atc cca agt gat aat cta act       528
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
tac ttt tgg gtg cta ccc tcg ctt tta agt tca tta caa tta ttc tat       576
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
ttt ggt act ttt tta ccc cat agt gaa cca ata ggg ggt tat gtt cag       624
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
cct cat tgt gcc caa aca att agc cgt cct att tgg tgg tca ttt atc       672
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
acg tgc tat cat ttt ggc tac cac gag gaa cat cac gaa tat cct cat       720
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
att tct tgg tgg cag tta cca gaa att tac aaa gca aaa tag               762
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>14
<211>253
<212>PRT
<213>人工序列
<400>14
Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala Lys Leu Thr Pro
1               5                   10                  15
Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe Ile Ala Ile Val
            20                  25                  30
Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu Leu Ser Leu Asp
        35                  40                  45
Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val Ile Leu Trp Gln
    50                  55                  60
Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His Asp Ala Met His
65                  70                  75                  80
Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His Leu Ile Gly Thr
                85                  90                  95
Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln Lys Leu Leu Lys
            100                 105                 110
Lys His Trp Leu His His His Asn Pro Ala Ser Asp Leu Asp Pro Asp
        115                 120                 125
Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp Tyr Phe His Phe
    130                 135                 140
Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala Leu Thr Ile Ile
145                 150                 155                 160
Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser Asp Asn Leu Thr
                165                 170                 175
Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu Gln Leu Phe Tyr
            180                 185                 190
Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly Gly Tyr Val Gln
        195                 200                 205
Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp Trp Ser Phe Ile
    210                 215                 220
Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His Glu Tyr Pro His
225                 230                 235                 240
Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala Lys
                245                 250
<210>15
<211>1608
<212>DNA
<213>雨生红球藻(Haematococcus pluvialis)
<220>
<221>CDS
<222>(3)..(971)
<223>
<400>15
ct aca ttt cac aag ccc gtg agc ggt gca agc gct ctg ccc cac atc         47
   Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His Ile
   1               5                   10                  15
ggc cca cct cct cat ctc cat cgg tca ttt gct gct acc acg atg ctg        95
Gly Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu
                20                  25                  30
tcg aag ctg cag tca atc agc gtc aag gcc cgc cgc gtt gaa cta gcc       143
Ser Lys Leu Gln Ser Ile Ser Val Lys Ala Arg Arg Val Glu Leu Ala
            35                  40                  45
cgc gac atc acg cgg ccc aaa gtc tgc ctg cat gct cag cgg tgc tcg       191
Arg Asp Ile Thr Arg Pro Lys Val Cys Leu His Ala Gln Arg Cys Ser
        50                  55                  60
tta gtt cgg ctg cga gtg gca gca cca cag aca gag gag gcg ctg gga       239
Leu Val Arg Leu Arg Val Ala Ala Pro Gln Thr Glu Glu Ala Leu Gly
    65                  70                  75
acc gtg cag gct gcc ggc gcg ggc gat gag cac agc gcc gat gta gca       287
Thr Val Gln Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala
80                  85                  90                  95
ctc cag cag ctt gac cgg gct atc gca gag cgt cgt gcc cgg cgc aaa       335
Leu Gln Gln Leu Asp Arg Ala Ile Ala Glu Arg Arg Ala Arg Arg Lys
                100                 105                 110
cgg gag cag ctg tca tac cag gct gcc gcc att gca gca tca att ggc       383
Arg Glu Gln Leu Ser Tyr Gln Ala Ala Ala Ile Ala Ala Ser Ile Gly
            115                 120                 125
gtg tca ggc att gcc atc ttc gcc acc tac ctg aga ttt gcc atg cac       431
Val Ser Gly Ile Ala Ile Phe Ala Thr Tyr Leu Arg Phe Ala Met His
        130                 135                 140
atg acc gtg ggc ggc gca gtg cca tgg ggt gaa gtg gct ggc act ctc       479
Met Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu
    145                 150                 155
ctc ttg gtg gtt ggt ggc gcg ctc ggc atg gag atg tat gcc cgc tat       527
Leu Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr
160                 165                 170                 175
gca cac aaa gcc atc tgg cat gag tcg cct ctg ggc tgg ctg ctg cac       575
Ala His Lys Ala Ile Trp His Glu Ser Pro Leu Gly Trp Leu Leu His
                180                 185                 190
aag agc cac cac aca cct cgc act gga ccc ttt gaa gcc aac gac ttg       623
Lys Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu
            195                 200                 205
ttt gca atc atc aat gga ctg ccc gcc atg ctc ctg tgt acc ttt ggc       671
Phe Ala Ile Ile Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly
        210                 215                 220
ttc tgg ctg ccc aac gtc ctg ggg gcg gcc tgc ttt gga gcg ggg ctg       719
Phe Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu
    225                 230                 235
ggc atc acg cta tac ggc atg gca tat atg ttt gta cac gat ggc ctg       767
Gly Ile Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu
240                 245                 250                 255
gtg cac agg cgc ttt ccc acc ggg ccc atc gct ggc ctg ccc tac atg       815
Val His Arg Arg Phe Pro Thr Gly Pro Ile Ala Gly Leu Pro Tyr Met
                260                 265                 270
aag cgc ctg aca gtg gcc cac cag cta cac cac agc ggc aag tac ggt       863
Lys Arg Leu Thr Val Ala His Gln Leu His His Ser Gly Lys Tyr Gly
            275                 280                 285
ggc gcg ccc tgg ggt atg ttc ttg ggt cca cag gag ctg cag cac att       911
Gly Ala Pro Trp Gly Met Phe Leu Gly Pro Gln Glu Leu Gln His Ile
        290                 295                 300
cca ggt gcg gcg gag gag gtg gag cga ctg gtc ctg gaa ctg gac tgg       959
Pro Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp
    305                 310                 315
tcc aag cgg tag ggtgcggaac caggcacgct ggtttcacac ctcatgcctg          1011
Ser Lys Arg
320
tgataaggtg tggctagagc gatgcgtgtg agacgggtat gtcacggtcg actggtctga    1071
tggccaatgg catcggccat gtctggtcat cacgggctgg ttgcctgggt gaaggtgatg    1131
cacatcatca tgtgcggttg gaggggctgg cacagtgtgg gctgaactgg agcagttgtc    1191
caggctggcg ttgaatcagt gagggtttgt gattggcggt tgtgaagcaa tgactccgcc    1251
catattctat ttgtgggagc tgagatgatg gcatgcttgg gatgtgcatg gatcatggta    1311
gtgcagcaaa ctatattcac ctagggctgt tggtaggatc aggtgaggcc ttgcacattg    1371
catgatgtac tcgtcatggt gtgttggtga gaggatggat gtggatggat gtgtattctc    1431
agacgtagac cttgactgga ggcttgatcg agagagtggg ccgtattctt tgagagggga    1491
ggctcgtgcc agaaatggtg agtggatgac tgtgacgctg tacattgcag gcaggtgaga    1551
tgcactgtct cgattgtaaa atacattcag atgcaaaaaa aaaaaaaaaa aaaaaaa       1608
<210>16
<211>322
<212>PRT
<213>雨生红球藻
<400>16
Thr Phe His Lys Pro Val Ser Gly Ala Ser Ala Leu Pro His Ile Gly
1               5                   10                  15
Pro Pro Pro His Leu His Arg Ser Phe Ala Ala Thr Thr Met Leu Ser
            20                  25                  30
Lys Leu Gln Ser Ile Ser Val Lys Ala Arg Arg Val Glu Leu Ala Arg
        35                  40                  45
Asp Ile Thr Arg Pro Lys Val Cys Leu His Ala Gln Arg Cys Ser Leu
    50                  55                  60
Val Arg Leu Arg Val Ala Ala Pro Gln Thr Glu Glu Ala Leu Gly Thr
65                  70                  75                  80
Val Gln Ala Ala Gly Ala Gly Asp Glu His Ser Ala Asp Val Ala Leu
                85                  90                  95
Gln Gln Leu Asp Arg Ala Ile Ala Glu Arg Arg Ala Arg Arg Lys Arg
            100                 105                 110
Glu Gln Leu Ser Tyr Gln Ala Ala Ala Ile Ala Ala Ser Ile Gly Val
        115                 120                 125
Ser Gly Ile Ala Ile Phe Ala Thr Tyr Leu Arg Phe Ala Met His Met
    130                 135                 140
Thr Val Gly Gly Ala Val Pro Trp Gly Glu Val Ala Gly Thr Leu Leu
145                 150                 155                 160
Leu Val Val Gly Gly Ala Leu Gly Met Glu Met Tyr Ala Arg Tyr Ala
                165                 170                 175
His Lys Ala Ile Trp His Glu Ser Pro Leu Gly Trp Leu Leu His Lys
            180                 185                 190
Ser His His Thr Pro Arg Thr Gly Pro Phe Glu Ala Asn Asp Leu Phe
        195                 200                 205
Ala Ile Ile Asn Gly Leu Pro Ala Met Leu Leu Cys Thr Phe Gly Phe
    210                 215                 220
Trp Leu Pro Asn Val Leu Gly Ala Ala Cys Phe Gly Ala Gly Leu Gly
225                 230                 235                 240
Ile Thr Leu Tyr Gly Met Ala Tyr Met Phe Val His Asp Gly Leu Val
                245                 250                 255
His Arg Arg Phe Pro Thr Gly Pro Ile Ala Gly Leu Pro Tyr Met Lys
            260                 265                 270
Arg Leu Thr Val Ala His Gln Leu His His Ser Gly Lys Tyr Gly Gly
        275                 280                 285
Ala Pro Trp Gly Met Phe Leu Gly Pro Gln Glu Leu Gln His Ile Pro
    290                 295                 300
Gly Ala Ala Glu Glu Val Glu Arg Leu Val Leu Glu Leu Asp Trp Ser
305                 310                 315                 320
Lys Arg
<210>17
<211>1650
<212>DNA
<213>番茄(Lycopersicon esculentum)
<220>
<221>CDS
<222>(112)..(1614)
<223>
<400>17
ggcacgagga aacttttctc tcttcactag ctgtttacat gcttgaaatt tcaagatttt      60
aggaccccat ttgaagtttt cttgaaacaa atattaccct gttggaaaaa g atg gat      117
                                                         Met Asp
                                                         1
act ttg ttg aaa acc cca aat aac ctt gaa ttt ctg aac cca cat cat       165
Thr Leu Leu Lys Thr Pro Asn Asn Leu Glu Phe Leu Asn Pro His His
        5                   10                  15
ggt ttt gct gtt aaa gct agt acc ttt aga tct gag aag cat cat aat       213
Gly Phe Ala Val Lys Ala Ser Thr Phe Arg Ser Glu Lys His His Asn
    20                  25                  30
ttt ggt tct agg aag ttt tgt gaa act ttg ggt aga agt gtt tgt gtt       261
Phe Gly Ser Arg Lys Phe Cys Glu Thr Leu Gly Arg Ser Val Cys Val
35                  40                  45                  50
aag ggt agt agt agt gct ctt tta gag ctt gta cct gag acc aaa aag       309
Lys Gly Ser Ser Ser Ala Leu Leu Glu Leu Val Pro Glu Thr Lys Lys
                55                  60                  65
gag aat ctt gat ttt gag ctt cct atg tat gac cct tca aaa ggg gtt       357
Glu Asn Leu Asp Phe Glu Leu Pro Met Tyr Asp Pro Ser Lys Gly Val
            70                  75                  80
gtt gtg gat ctt gct gtg gtt ggt ggt ggc cct gca gga ctt gct gtt       405
Val Val Asp Leu Ala Val Val Gly Gly Gly Pro Ala Gly Leu Ala Val
        85                  90                  95
gca cag caa gtt tct gaa gca gga ctc tct gtt tgt tca att gat ccg       453
Ala Gln Gln Val Ser Glu Ala Gly Leu Ser Val Cys Ser Ile Asp Pro
    100                 105                 110
aat cct aaa ttg ata tgg cct aat aac tat ggt gtt tgg gtg gat gaa       501
Asn Pro Lys Leu Ile Trp Pro Asn Asn Tyr Gly Val Trp Val Asp Glu
115                 120                 125                 130
ttt gag gct atg gac ttg tta gat tgt cta gat gct acc tgg tct ggt       549
Phe Glu Ala Met Asp Leu Leu Asp Cys Leu Asp Ala Thr Trp Ser Gly
                135                 140                 145
gca gca gtg tac att gat gat aat acg gct aaa gat ctt cat aga cct       597
Ala Ala Val Tyr Ile Asp Asp Asn Thr Ala Lys Asp Leu His Arg Pro
            150                 155                 160
tat gga agg gtt aac cgg aaa cag ctg aaa tcg aaa atg atg cag aaa       645
Tyr Gly Arg Val Asn Arg Lys Gln Leu Lys Ser Lys Met Met Gln Lys
        165                 170                 175
tgt ata atg aat ggt gtt aaa ttc cac caa gcc aaa gtt ata aag gtg       693
Cys Ile Met Asn Gly Val Lys Phe His Gln Ala Lys Val Ile Lys Val
    180                 185                 190
att cat gag gaa tcg aaa tcc atg ttg ata tgc aat gat ggt att act       741
Ile His Glu Glu Ser Lys Ser Met Leu Ile Cys Asn Asp Gly Ile Thr
195                 200                 205                 210
att cag gca acg gtg gtg ctc gat gca act ggc ttc tct aga tct ctt       789
Ile Gln Ala Thr Val Val Leu Asp Ala Thr Gly Phe Ser Arg Ser Leu
                215                 220                 225
gtt cag tat gat aag cct tat aac ccc ggg tat caa gtt gct tat ggc       837
Val Gln Tyr Asp Lys Pro Tyr Asn Pro Gly Tyr Gln Val Ala Tyr Gly
            230                 235                 240
att ttg gct gaa gtg gaa gag cac ccc ttt gat gta aac aag atg gtt       885
Ile Leu Ala Glu Val Glu Glu His Pro Phe Asp Val Asn Lys Met Val
        245                 250                 255
ttc atg gat tgg cga gat tct cat ttg aag aac aat act gat ctc aag       933
Phe Met Asp Trp Arg Asp Ser His Leu Lys Asn Asn Thr Asp Leu Lys
    260                 265                 270
gag aga aat agt aga ata cca act ttt ctt tat gca atg cca ttt tca       981
Glu Arg Asn Ser Arg Ile Pro Thr Phe Leu Tyr Ala Met Pro Phe Ser
275                 280                 285                 290
tcc aac agg ata ttt ctt gaa gaa aca tca ctc gta gct cgt cct ggc      1029
Ser Asn Arg Ile Phe Leu Glu Glu Thr Ser Leu Val Ala Arg Pro Gly
                295                 300                 305
ttg cgt ata gat gat att caa gaa cga atg gtg gct cgt tta aac cat      1077
Leu Arg Ile Asp Asp Ile Gln Glu Arg Met Val Ala Arg Leu Asn His
            310                 315                 320
ttg ggg ata aaa gtg aag agc att gaa gaa gat gaa cat tgt cta ata      1125
Leu Gly Ile Lys Val Lys Ser Ile Glu Glu Asp Glu His Cys Leu Ile
        325                 330                 335
cca atg ggt ggt cca ctt cca gta tta cct cag aga gtc gtt gga atc      1173
Pro Met Gly Gly Pro Leu Pro Val Leu Pro Gln Arg Val Val Gly Ile
    340                 345                 350
ggt ggt aca gct ggc atg gtt cat cca tcc acc ggt tat atg gtg gca      1221
Gly Gly Thr Ala Gly Met Val His Pro Ser Thr Gly Tyr Met Val Ala
355                 360                 365                 370
agg aca cta gct gcg gct cct gtt gtt gcc aat gcc ata att caa tac      1269
Arg Thr Leu Ala Ala Ala Pro Val Val Ala Asn Ala Ile Ile Gln Tyr
                375                 380                 385
ctc ggt tct gaa aga agt cat tcg ggt aat gaa tta tcc aca gct gtt      1317
Leu Gly Ser Glu Arg Ser His Ser Gly Asn Glu Leu Ser Thr Ala Val
            390                 395                 400
tgg aaa gat ttg tgg cct ata gag agg aga cgt caa aga gag ttc ttc      1365
Trp Lys Asp Leu Trp Pro Ile Glu Arg Arg Arg Gln Arg Glu Phe Phe
        405                 410                 415
tgc ttc ggt atg gat att ctt ctg aag ctt gat tta cct gct aca aga      1413
Cys Phe Gly Met Asp Ile Leu Leu Lys Leu Asp Leu Pro Ala Thr Arg
    420                 425                 430
agg ttc ttt gat gca ttc ttt gac tta gaa cct cgt tat tgg cat ggc      1461
Arg Phe Phe Asp Ala Phe Phe Asp Leu Glu Pro Arg Tyr Trp His Gly
435                 440                 445                 450
ttc tta tcg tct cga ttg ttt cta cct gaa ctc ata gtt ttt ggg ctg      1509
Phe Leu Ser Ser Arg Leu Phe Leu Pro Glu Leu Ile Val Phe Gly Leu
                455                 460                 465
tct cta ttc tct cat gct tca aat act tct aga ttt gag ata atg aca      1557
Ser Leu Phe Ser His Ala Ser Asn Thr Ser Arg Phe Glu Ile Met Thr
            470                 475                 480
aag gga act gtt cca tta gta aat atg atc aac aat ttg tta cag gat      1605
Lys Gly Thr Val Pro Leu Val Asn Met Ile Asn Asn Leu Leu Gln Asp
        485                 490                 495
aaa gaa tga atccgagtaa ttcggaatct tgtccaatct cgtgcc                  1650
Lys Glu
    500
<210>18
<211>500
<212>PRT
<213>番茄
<400>18
Met Asp Thr Leu Leu Lys Thr Pro Asn Asn Leu Glu Phe Leu Asn Pro
1               5                   10                  15
His His Gly Phe Ala Val Lys Ala Ser Thr Phe Arg Ser Glu Lys His
            20                  25                  30
His Asn Phe Gly Ser Arg Lys Phe Cys Glu Thr Leu Gly Arg Ser Val
        35                  40                  45
Cys Val Lys Gly Ser Ser Ser Ala Leu Leu Glu Leu Val Pro Glu Thr
    50                  55                  60
Lys Lys Glu Asn Leu Asp Phe Glu Leu Pro Met Tyr Asp Pro Ser Lys
65                  70                  75                  80
Gly Val Val Val Asp Leu Ala Val Val Gly Gly Gly Pro Ala Gly Leu
                85                  90                  95
Ala Val Ala Gln Gln Val Ser Glu Ala Gly Leu Ser Val Cys Ser Ile
            100                 105                 110
Asp Pro Asn Pro Lys Leu Ile Trp Pro Asn Asn Tyr Gly Val Trp Val
        115                 120                 125
Asp Glu Phe Glu Ala Met Asp Leu Leu Asp Cys Leu Asp Ala Thr Trp
    130                 135                 140
Ser Gly Ala Ala Val Tyr Ile Asp Asp Asn Thr Ala Lys Asp Leu His
145                 150                 155                 160
Arg Pro Tyr Gly Arg Val Asn Arg Lys Gln Leu Lys Ser Lys Met Met
                165                 170                 175
Gln Lys Cys Ile Met Asn Gly Val Lys Phe His Gln Ala Lys Val Ile
            180                 185                 190
Lys Val Ile His Glu Glu Ser Lys Ser Met Leu Ile Cys Asn Asp Gly
        195                 200                 205
Ile Thr Ile Gln Ala Thr Val Val Leu Asp Ala Thr Gly Phe Ser Arg
    210                 215                 220
Ser Leu Val Gln Tyr Asp Lys Pro Tyr Asn Pro Gly Tyr Gln Val Ala
225                 230                 235                 240
Tyr Gly Ile Leu Ala Glu Val Glu Glu His Pro Phe Asp Val Asn Lys
                245                 250                 255
Met Val Phe Met Asp Trp Arg Asp Ser His Leu Lys Asn Asn Thr Asp
            260                 265                 270
Leu Lys Glu Arg Asn Ser Arg Ile Pro Thr Phe Leu Tyr Ala Met Pro
        275                 280                 285
Phe Ser Ser Asn Arg Ile Phe Leu Glu Glu Thr Ser Leu Val Ala Arg
    290                 295                 300
Pro Gly Leu Arg Ile Asp Asp Ile Gln Glu Arg Met Val Ala Arg Leu
305                 310                 315                 320
Asn His Leu Gly Ile Lys Val Lys Ser Ile Glu Glu Asp Glu His Cys
                325                 330                 335
Leu Ile Pro Met Gly Gly Pro Leu Pro Val Leu Pro Gln Arg Val Val
            340                 345                 350
Gly Ile Gly Gly Thr Ala Gly Met Val His Pro Ser Thr Gly Tyr Met
        355                 360                 365
Val Ala Arg Thr Leu Ala Ala Ala Pro Val Val Ala Asn Ala Ile Ile
    370                 375                 380
Gln Tyr Leu Gly Ser Glu Arg Ser His Ser Gly Asn Glu Leu Ser Thr
385                 390                 395                 400
Ala Val Trp Lys Asp Leu Trp Pro Ile Glu Arg Arg Arg Gln Arg Glu
                405                 410                 415
Phe Phe Cys Phe Gly Met Asp Ile Leu Leu Lys Leu Asp Leu Pro Ala
            420                 425                 430
Thr Arg Arg Phe Phe Asp Ala Phe Phe Asp Leu Glu Pro Arg Tyr Trp
        435                 440                 445
His Gly Phe Leu Ser Ser Arg Leu Phe Leu Pro Glu Leu Ile Val Phe
    450                 455                 460
Gly Leu Ser Leu Phe Ser His Ala Ser Asn Thr Ser Arg Phe Glu Ile
465                 470                 475                 480
Met Thr Lys Gly Thr Val Pro Leu Val Asn Met Ile Asn Asn Leu Leu
                485                 490                 495
Gln Asp Lys Glu
            500
<210>19
<211>33
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(33)
<223>
<400>19
gcatgctcta gaccttataa agatattttg tga                                   33
<210>20
<211>33
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(33)
<223>
<400>20
gcatgcatct agaaatggtt cagtgtcaac cat                                   33
<210>21
<211>805
<212>DNA
<213>念珠藻PCC7120
<220>
<221>variation
<222>(1)..(805)
<223>
<400>21
gcatgcatct agaaatggtt cagtgtcaac catcatctct gcattcagaa aaactggtgt      60
tattgtcatc gacaatcaga gatgataaaa atattaataa gggtatattt attgcctgct     120
ttatcttatt tttatgggca attagtttaa tcttattact ctcaatagat acatccataa     180
ttcataagag cttattaggt atagccatgc tttggcagac cttcttatat acaggtttat     240
ttattactgc tcatgatgcc atgcacggcg tagtttatcc caaaaatccc agaataaata     300
attttatagg taagctcact ctaatcttgt atggactact cccttataaa gatttattga     360
aaaaacattg gttacaccac ggacatcctg gtactgattt agaccctgat tattacaatg     420
gtcatcccca aaacttcttt ctttggtatc tacattttat gaagtcttat tggcgatgga     480
cgcaaatttt cggattagtg atgatttttc atggacttaa aaatctggtg catataccag     540
aaaataattt aattatattt tggatgatac cttctatttt aagttcagta caactatttt     600
attttggtac atttttgcct cataaaaagc tagaaggtgg ttatactaac ccccattgtg     660
cgcgcagtat cccattacct cttttttggt cttttgttac ttgttatcac ttcggctacc     720
acaaggaaca tcacgaatac cctcaacttc cttggtggaa attacctgaa gctcacaaaa     780
tatctttata aggtctagag catgc                                           805
<210>22
<211>24
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(24)
<223>
<400>22
aggtaccgca cggtctgcca atcc                                             24
<210>23
<211>26
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(26)
<223>
<400>23
aagcttgacc tgattatcag cacggt                                           26
<210>24
<211>4624
<212>DNA
<213>噬夏孢欧文氏菌(Erwinia uredovora)
<220>
<221>CDS
<222>(128)..(1267)
<223>
<220>
<221>CDS
<222>(1288)..(2766)
<223>
<220>
<221>CDS
<222>(2802)..(3689)
<223>
<220>
<221>iDNA
<222>(3631)..(4158)
<223>
<400>24
gtcgactttc agcagcgcat ggcgaaaatc cagacagccc ttcgtttggc agggggcacc      60
atggccgctg ccgatatcat tgagcaggtt atgtgcaccg gtcagcctgt cttaagtggg     120
agcggct atg caa ccg cat tat gat ctg att ctc gtg ggg gct gga ctc       169
        Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu
        1               5                   10
gcg aat ggc ctt atc gcc ctg cgt ctt cag cag cag caa cct gat atg       217
Ala Asn Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met
15                  20                  25                  30
cgt att ttg ctt atc gac gcc gca ccc cag gcg ggc ggg aat cat acg       265
Arg Ile Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr
                35                  40                  45
tgg tca ttt cac cac gat gat ttg act gag agc caa cat cgt tgg ata       313
Trp Ser Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile
            50                  55                  60
gct ccg ctg gtg gtt cat cac tgg ccc gac tat cag gta cgc ttt ccc       361
Ala Pro Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro
        65                  70                  75
aca cgc cgt cgt aag ctg aac agc ggc tac ttt tgt att act tct cag       409
Thr Arg Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln
    80                  85                  90
cgt ttc gct gag gtt tta cag cga cag ttt ggc ccg cac ttg tgg atg       457
Arg Phe Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met
95                  100                 105                 110
gat acc gcg gtc gca gag gtt aat gcg gaa tct gtt cgg ttg aaa aag       505
Asp Thr Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys
                115                 120                 125
ggt cag gtt atc ggt gcc cgc gcg gtg att gac ggg cgg ggt tat gcg       553
Gly Gln Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala
            130                 135                 140
gca aat tca gca ctg agc gtg ggc ttc cag gcg ttt att ggc cag gaa       601
Ala Asn Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu
        145                 150                 155
tgg cga ttg agc cac ccg cat ggt tta tcg tct ccc att atc atg gat       649
Trp Arg Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp
    160                 165                 170
gcc acg gtc gat cag caa aat ggt tat cgc ttc gtg tac agc ctg ccg       697
Ala Thr Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro
175                 180                 185                 190
ctc tcg ccg acc aga ttg tta att gaa gac acg cac tat att gat aat       745
Leu Ser Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn
                195                 200                 205
gcg aca tta gat cct gaa tgc gcg cgg caa aat att tgc gac tat gcc       793
Ala Thr Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala
            210                 215                 220
gcg caa cag ggt tgg cag ctt cag aca ctg ctg cga gaa gaa cag ggc       841
Ala Gln Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly
        225                 230                 235
gcc tta ccc att act ctg tcg ggc aat gcc gac gca ttc tgg cag cag       889
Ala Leu Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln
    240                 245                 250
cgc ccc ctg gcc tgt agt gga tta cgt gcc ggt ctg ttc cat cct acc       937
Arg Pro Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr
255                 260                 265                 270
acc ggc tat tca ctg ccg ctg gcg gtt gcc gtg gcc gac cgc ctg agt       985
Thr Gly Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser
                275                 280                 285
gca ctt gat gtc ttt acg tcg gcc tca att cac cat gcc att acg cat      1033
Ala Leu Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His
            290                 295                 300
ttt gcc cgc gag cgc tgg cag cag cag ggc ttt ttc cgc atg ctg aat      1081
Phe Ala Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn
        305                 310                 315
cgc atg ctg ttt tta gcc gga ccc gcc gat tca cgc tgg cgg gtt atg      1129
Arg Met Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met
    320                 325                 330
cag cgt ttt tat ggt tta cct gaa gat tta att gcc cgt ttt tat gcg      1177
Gln Arg Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala
335                 340                 345                 350
gga aaa ctc acg ctg acc gat cgg cta cgt att ctg agc ggc aag ccg      1225
Gly Lys Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro
                355                 360                 365
cct gtt ccg gta tta gca gca ttg caa gcc att atg acg act              1267
Pro Val Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr
            370                 375                 380
catcgttaaa gagcgactac atg aaa cca act acg gta att ggt gca ggc ttc    1320
                      Met Lys Pro Thr Thr Val Ile Gly Ala Gly Phe
                                      385                 390
ggt ggc ctg gca ctg gca att cgt cta caa gct gcg ggg atc ccc gtc      1368
Gly Gly Leu Ala Leu Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Val
            395                 400                 405
tta ctg ctt gaa caa cgt gat aaa ccc ggc ggt cgg gct tat gtc tac      1416
Leu Leu Leu Glu Gln Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr
        410                 415                 420
gag gat cag ggg ttt acc ttt gat gca ggc ccg acg gtt atc acc gat      1464
Glu Asp Gln Gly Phe Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp
    425                 430                 435
ccc agt gcc att gaa gaa ctg ttt gca ctg gca gga aaa cag tta aaa      1512
Pro Ser Ala Ile Glu Glu Leu Phe Ala Leu Ala Gly Lys Gln Leu Lys
440                 445                 450                 455
gag tat gtc gaa ctg ctg ccg gtt acg ccg ttt tac cgc ctg tgt tgg      1560
Glu Tyr Val Glu Leu Leu Pro Val Thr Pro Phe Tyr Arg Leu Cys Trp
                460                 465                 470
gag tca ggg aag gtc ttt aat tac gat aac gat caa acc cgg ctc gaa      1608
Glu Ser Gly Lys Val Phe Asn Tyr Asp Asn Asp Gln Thr Arg Leu Glu
            475                 480                 485
gcg cag att cag cag ttt aat ccc cgc gat gtc gaa ggt tat cgt cag      1656
Ala Gln Ile Gln Gln Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Gln
        490                 495                 500
ttt ctg gac tat tca cgc gcg gtg ttt aaa gaa ggc tat cta aag ctc      1704
Phe Leu Asp Tyr Ser Arg Ala Val Phe Lys Glu Gly Tyr Leu Lys Leu
    505                 510                 515
ggt act gtc cct ttt tta tcg ttc aga gac atg ctt cgc gcc gca cct      1752
Gly Thr Val Pro Phe Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro
520                 525                 530                 535
caa ctg gcg aaa ctg cag gca tgg aga agc gtt tac agt aag gtt gcc      1800
Gln Leu Ala Lys Leu Gln Ala Trp Arg Ser Val Tyr Ser Lys Val Ala
                540                 545                 550
agt tac atc gaa gat gaa cat ctg cgc cag gcg ttt tct ttc cac tcg      1848
Ser Tyr Ile Glu Asp Glu His Leu Arg Gln Ala Phe Ser Phe His Ser
            555                 560                 565
ctg ttg gtg ggc ggc aat ccc ttc gcc acc tca tcc att tat acg ttg      1896
Leu Leu Val Gly Gly Asn Pro Phe Ala Thr Ser Ser Ile Tyr Thr Leu
        570                 575                 580
ata cac gcg ctg gag cgt gag tgg ggc gtc tgg ttt ccg cgt ggc ggc      1944
Ile His Ala Leu Glu Arg Glu Trp Gly Val Trp Phe Pro Arg Gly Gly
    585                 590                 595
acc ggc gca tta gtt cag ggg atg ata aag ctg ttt cag gat ctg ggt      1992
Thr Gly Ala Leu Val Gln Gly Met Ile Lys Leu Phe Gln Asp Leu Gly
600                 605                 610                 615
ggc gaa gtc gtg tta aac gcc aga gtc agc cat atg gaa acg aca gga      2040
Gly Glu Val Val Leu Asn Ala Arg Val Ser His Met Glu Thr Thr Gly
                620                 625                 630
aac aag att gaa gcc gtg cat tta gag gac ggt cge agg ttc ctg acg      2088
Asn Lys Ile Glu Ala Val His Leu Glu Asp Gly Arg Arg Phe Leu Thr
            635                 640                 645
caa gcc gtc gcg tca aat gca gat gtg gtt cat acc tat cgc gac ctg      2136
Gln Ala Val Ala Ser Asn Ala Asp Val Val His Thr Tyr Arg Asp Leu
        650                 655                 660
tta agc cag cac cct gcc gcg gtt aag cag tcc aac aaa ctg cag act      2184
Leu Ser Gln His Pro Ala Ala Val Lys Gln Ser Asn Lys Leu Gln Thr
    665                 670                 675
aag cgc atg agt aac tct ctg ttt gtg ctc tat ttt ggt ttg aat cac      2232
Lys Arg Met Ser Asn Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His
680                 685                 690                 695
cat cat gat cag ctc gcg cat cac acg gtt tgt ttc ggc ccg cgt tac      2280
His His Asp Gln Leu Ala His His Thr Val Cys Phe Gly Pro Arg Tyr
                700                 705                 710
cgc gag ctg att gac gaa att ttt aat cat gat ggc ctc gca gag gac      2328
Arg Glu Leu Ile Asp Glu Ile Phe Asn His Asp Gly Leu Ala Glu Asp
            715                 720                 725
ttc tca ctt tat ctg cac gcg ccc tgt gtc acg gat tcg tca ctg gcg      2376
Phe Ser Leu Tyr Leu His Ala Pro Cys Val Thr Asp Ser Ser Leu Ala
        730                 735                 740
cct gaa ggt tgc ggc agt tac tat gtg ttg gcg ccg gtg ccg cat tta      2424
Pro Glu Gly Cys Gly Ser Tyr Tyr Val Leu Ala Pro Val Pro His Leu
    745                 750                 755
ggc acc gcg aac ctc gac tgg acg gtt gag ggg cca aaa cta cgc gac      2472
Gly Thr Ala Asn Leu Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp
760                 765                 770                 775
cgt att ttt gcg tac ctt gag cag cat tac atg cct ggc tta cgg agt      2520
Arg Ile Phe Ala Tyr Leu Glu Gln His Tyr Met Pro Gly Leu Arg Ser
                780                 785                 790
cag ctg gtc acg cac cgg atg ttt acg ccg ttt gat ttt cgc gac cag      2568
Gln Leu Val Thr His Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gln
            795                 800                 805
ctt aat gcc tat cat ggc tca gcc ttt tct gtg gag ccc gtt ctt acc      2616
Leu Asn Ala Tyr His Gly Ser Ala Phe Ser Val Glu Pro Val Leu Thr
        810                 815                 820
cag agc gcc tgg ttt cgg ccg cat aac cgc gat aaa acc att act aat      2664
Gln Ser Ala Trp Phe Arg Pro His Asn Arg Asp Lys Thr Ile Thr Asn
    825                 830                 835
ctc tac ctg gtc ggc gca ggc acg cat ccc ggc gca ggc att cct ggc      2712
Leu Tyr Leu Val Gly Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly
840                 845                 850                 855
gtc atc ggc tcg gca aaa gcg aca gca ggt ttg atg ctg gag gat ctg      2760
Val Ile Gly Ser Ala Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu
                860                 865                 870
att tga ataatccgtc gttactcaat catgcggtcg aaacg atg gca gtt ggc       2813
Ile                                            Met Ala Val Gly
                                                       875
tcg aaa agt ttt gcg aca gcc tca aag tta ttt gat gca aaa acc cgg      2861
Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp Ala Lys Thr Arg
            880                 885                 890
cgc agc gta ctg atg ctc tac gcc tgg tgc cgc cat tgt gac gat gtt      2909
Arg Ser Val Leu Met Leu Tyr Ala Trp Cys Arg His Cys Asp Asp Val
        895                 900                 905
att gac gat cag acg ctg ggc ttt cag gcc cgg cag cct gcc tta caa      2957
Ile Asp Asp Gln Thr Leu Gly Phe Gln Ala Arg Gln Pro Ala Leu Gln
    910                 915                 920
acg ccc gaa caa cgt ctg atg caa ctt gag atg aaa acg cgc cag gcc      3005
Thr Pro Glu Gln Arg Leu Met Gln Leu Glu Met Lys Thr Arg Gln Ala
925                 930                 935                 940
tat gca gga tcg cag atg cac gaa ccg gcg ttt gcg gct ttt cag gaa      3053
Tyr Ala Gly Ser Gln Met His Glu Pro Ala Phe Ala Ala Phe Gln Glu
                945                 950                 955
gtg gct atg gct cat gat atc gcc ccg gct tac gcg ttt gat cat ctg      3101
Val Ala Met Ala His Asp Ile Ala Pro Ala Tyr Ala Phe Asp His Leu
            960                 965                 970
gaa ggc ttc gcc atg gat gta cgc gaa gcg caa tac agc caa ctg gat      3149
Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gln Tyr Ser Gln Leu Asp
        975                 980                 985
gat acg ctg cgc tat tgc tat cac gtt gca ggc gtt gtc ggc ttg atg      3197
Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val Val Gly Leu Met
    990                 995                 1000
atg gcg caa atc atg ggc gtg cgg gat aac gcc acg ctg gac cgc          3242
Met Ala Gln Ile Met Gly Val Arg Asp Asn Ala Thr Leu Asp Arg
1005                1010                1015
gcc tgt gac ctt ggg ctg gca ttt cag ttg acc aat att gct cgc          3287
Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile Ala Arg
1020                1025                1030
gat att gtg gac gat gcg cat gcg ggc cgc tgt tat ctg ccg gca          3332
Asp Ile Val Asp Asp Ala His Ala Gly Arg Cys Tyr Leu Pro Ala
1035                1040                1045
agc tgg ctg gag cat gaa ggt ctg aac aaa gag aat tat gcg gca          3377
Ser Trp Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala
1050                1055                1060
cct gaa aac cgt cag gcg ctg agc cgt atc gcc cgt cgt ttg gtg          3422
Pro Glu Asn Arg Gln Ala Leu Ser Arg Ile Ala Arg Arg Leu Val
1065                1070                1075
cag gaa gca gaa cct tac tat ttg tct gcc aca gcc ggc ctg gca          3467
Gln Glu Ala Glu Pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala
1080                1085                1090
ggg ttg ccc ctg cgt tcc gcc tgg gca atc gct acg gcg aag cag          3512
Gly Leu Pro Leu Arg Ser Ala Trp Ala Ile Ala Thr Ala Lys Gln
1095                1100                1105
gtt tac cgg aaa ata ggt gtc aaa gtt gaa cag gcc ggt cag caa          3557
Val Tyr Arg Lys Ile Gly Val Lys Val Glu Gln Ala Gly Gln Gln
1110                1115                1120
gcc tgg gat cag cgg cag tca acg acc acg ccc gaa aaa tta acg          3602
Ala Trp Asp Gln Arg Gln Ser Thr Thr Thr Pro Glu Lys Leu Thr
1125                1130                1135
ctg ctg ctg gcc gcc tct ggt cag gcc ctt act tcc cgg atg cgg          3647
Leu Leu Leu Ala Ala Ser Gly Gln Ala Leu Thr Ser Arg Met Arg
1140                1145                1150
gct cat cct ccc cgc cct gcg cat ctc tgg cag cgc ccg ctc              3689
Ala His Pro Pro Arg Pro Ala His Leu Trp Gln Arg Pro Leu
1155                1160                1165
tagcgccatg tctttcccgg agcgtcgcct gaagttttga caggggcggc gcatagagga    3749
agccaaaaga aacacaacct tctttgcccc tgacggcgtg atgcatacgg tgcgccatat    3809
acaaccgttt gaggtagccc ttgcgtggaa tatagcggaa tggccaacgt tgatgcacca    3869
gcccgtcgtg caccataaaa tagagtaatc catacgccgt catacctgcg ccaatccact    3929
ggagcggcca cattcctgta ctgcccagat aaatcagcag gatcgataat gcagcaaaaa    3989
ccacggcata aagatcgtta acttcaaacg cacctttacg cggttcatga tgtgaaagat    4049
gccatcccca accccagccg tgcatgatgt atttgtgtgc cagtgcagca atcacttcca    4109
tgccaatcac ggtaacgaaa acgatcaggg cattccaaat ccacaacata atttctccgg    4169
tagagacgtc tggcagcagg cttaaggatt caattttaac agagattagc cgatctggcg    4229
gcgggaaggg aaaaaggcgc gccagaaagg cgcgccaggg atcagaagtc ggctttcaga    4289
accacacggt agttggcttt acctgcacga acatggtcca gtgcatcgtt gattttcgac    4349
atcgggaagt actccactgt cggcgcaata tctgtacggc cagccagctt cagcagtgaa    4409
cgcagctgcg caggtgaacc ggttgaagaa cccgtcacgg cgcggtcgcc taaaatcagg    4469
ctgaaagccg ggcacgtcaa acggcttcag tacggcaccc acggtatgga acttaccgcg    4529
aggcgccagg gccgcaaagt agggttgcca gtcgagatcg acggcgaccg tgctgataat    4589
caggtcaaac tggcccgcca ggctttttaa agctt                               4624
<210>25
<211>380
<212>PRT
<213>噬夏孢欧文氏菌
<400>25
Met Gln Pro His Tyr Asp Leu Ile Leu Val Gly Ala Gly Leu Ala Asn
1                5                  10                  15
Gly Leu Ile Ala Leu Arg Leu Gln Gln Gln Gln Pro Asp Met Arg Ile
            20                  25                  30
Leu Leu Ile Asp Ala Ala Pro Gln Ala Gly Gly Asn His Thr Trp Ser
        35                  40                  45
Phe His His Asp Asp Leu Thr Glu Ser Gln His Arg Trp Ile Ala Pro
    50                  55                  60
Leu Val Val His His Trp Pro Asp Tyr Gln Val Arg Phe Pro Thr Arg
65                  70                  75                  80
Arg Arg Lys Leu Asn Ser Gly Tyr Phe Cys Ile Thr Ser Gln Arg Phe
                85                  90                  95
Ala Glu Val Leu Gln Arg Gln Phe Gly Pro His Leu Trp Met Asp Thr
            100                 105                 110
Ala Val Ala Glu Val Asn Ala Glu Ser Val Arg Leu Lys Lys Gly Gln
        115                 120                 125
Val Ile Gly Ala Arg Ala Val Ile Asp Gly Arg Gly Tyr Ala Ala Asn
    130                 135                 140
Ser Ala Leu Ser Val Gly Phe Gln Ala Phe Ile Gly Gln Glu Trp Arg
145                 150                 155                 160
Leu Ser His Pro His Gly Leu Ser Ser Pro Ile Ile Met Asp Ala Thr
                165                 170                 175
Val Asp Gln Gln Asn Gly Tyr Arg Phe Val Tyr Ser Leu Pro Leu Ser
            180                 185                 190
Pro Thr Arg Leu Leu Ile Glu Asp Thr His Tyr Ile Asp Asn Ala Thr
        195                 200                 205
Leu Asp Pro Glu Cys Ala Arg Gln Asn Ile Cys Asp Tyr Ala Ala Gln
    210                 215                 220
Gln Gly Trp Gln Leu Gln Thr Leu Leu Arg Glu Glu Gln Gly Ala Leu
225                 230                 235                 240
Pro Ile Thr Leu Ser Gly Asn Ala Asp Ala Phe Trp Gln Gln Arg Pro
                245                 250                 255
Leu Ala Cys Ser Gly Leu Arg Ala Gly Leu Phe His Pro Thr Thr Gly
            260                 265                 270
Tyr Ser Leu Pro Leu Ala Val Ala Val Ala Asp Arg Leu Ser Ala Leu
        275                 280                 285
Asp Val Phe Thr Ser Ala Ser Ile His His Ala Ile Thr His Phe Ala
    290                 295                 300
Arg Glu Arg Trp Gln Gln Gln Gly Phe Phe Arg Met Leu Asn Arg Met
305                 310                 315                 320
Leu Phe Leu Ala Gly Pro Ala Asp Ser Arg Trp Arg Val Met Gln Arg
                325                 330                 335
Phe Tyr Gly Leu Pro Glu Asp Leu Ile Ala Arg Phe Tyr Ala Gly Lys
            340                 345                 350
Leu Thr Leu Thr Asp Arg Leu Arg Ile Leu Ser Gly Lys Pro Pro Val
        355                 360                 365
Pro Val Leu Ala Ala Leu Gln Ala Ile Met Thr Thr
    370                 375                 380
<210>26
<211>492
<212>PRT
<213>噬夏孢欧文氏菌
<400>26
Met Lys Pro Thr Thr Val Ile Gly Ala Gly Phe Gly Gly Leu Ala Leu
1               5                   10                  15
Ala Ile Arg Leu Gln Ala Ala Gly Ile Pro Val Leu Leu Leu Glu Gln
            20                  25                  30
Arg Asp Lys Pro Gly Gly Arg Ala Tyr Val Tyr Glu Asp Gln Gly Phe
        35                  40                  45
Thr Phe Asp Ala Gly Pro Thr Val Ile Thr Asp Pro Ser Ala Ile Glu
    50                  55                  60
Glu Leu Phe Ala Leu Ala Gly Lys Gln Leu Lys Glu Tyr Val Glu Leu
65                  70                  75                  80
Leu Pro Val Thr Pro Phe Tyr Arg Leu Cys Trp Glu Ser Gly Lys Val
                85                  90                  95
Phe Asn Tyr Asp Asn Asp Gln Thr Arg Leu Glu Ala Gln Ile Gln Gln
            100                 105                 110
Phe Asn Pro Arg Asp Val Glu Gly Tyr Arg Gln Phe Leu Asp Tyr Ser
        115                 120                 125
Arg Ala Val Phe Lys Glu Gly Tyr Leu Lys Leu Gly Thr Val Pro Phe
    130                 135                 140
Leu Ser Phe Arg Asp Met Leu Arg Ala Ala Pro Gln Leu Ala Lys Leu
145                 150                 155                 160
Gln Ala Trp Arg Ser Val Tyr Ser Lys Val Ala Ser Tyr Ile Glu Asp
                165                 170                 175
Glu His Leu Arg Gln Ala Phe Ser Phe His Ser Leu Leu Val Gly Gly
            180                 185                 190
Asn Pro Phe Ala Thr Ser Ser Ile Tyr Thr Leu Ile His Ala Leu Glu
        195                 200                 205
Arg Glu Trp Gly Val Trp Phe Pro Arg Gly Gly Thr Gly Ala Leu Val
    210                 215                 220
Gln Gly Met Ile Lys Leu Phe Gln Asp Leu Gly Gly Glu Val Val Leu
225                 230                 235                 240
Asn Ala Arg Val Ser His Met Glu Thr Thr Gly Asn Lys Ile Glu Ala
                245                 250                 255
Val His Leu Glu Asp Gly Arg Arg Phe Leu Thr Gln Ala Val Ala Ser
            260                 265                 270
Asn Ala Asp Val Val His Thr Tyr Arg Asp Leu Leu Ser Gln His Pro
        275                 280                 285
Ala Ala Val Lys Gln Ser Asn Lys Leu Gln Thr Lys Arg Met Ser Asn
    290                 295                 300
Ser Leu Phe Val Leu Tyr Phe Gly Leu Asn His His His Asp Gln Leu
305                 310                 315                 320
Ala His His Thr Val Cys Phe Gly Pro Arg Tyr Arg Glu Leu Ile Asp
                325                 330                 335
Glu Ile Phe Asn His Asp Gly Leu Ala Glu Asp Phe Ser Leu Tyr Leu
            340                 345                 350
His Ala Pro Cys Val Thr Asp Ser Ser Leu Ala Pro Glu Gly Cys Gly
        355                 360                 365
Ser Tyr Tyr Val Leu Ala Pro Val Pro His Leu Gly Thr Ala Asn Leu
    370                 375                 380
Asp Trp Thr Val Glu Gly Pro Lys Leu Arg Asp Arg Ile Phe Ala Tyr
385                 390                 395                 400
Leu Glu Gln His Tyr Met Pro Gly Leu Arg Ser Gln Leu Val Thr His
                405                 410                 415
Arg Met Phe Thr Pro Phe Asp Phe Arg Asp Gln Leu Asn Ala Tyr His
            420                 425                 430
Gly Ser Ala Phe Ser Val Glu Pro Val Leu Thr Gln Ser Ala Trp Phe
        435                 440                 445
Arg Pro His Asn Arg Asp Lys Thr Ile Thr Asn Leu Tyr Leu Val Gly
    450                 455                 460
Ala Gly Thr His Pro Gly Ala Gly Ile Pro Gly Val Ile Gly Ser Ala
465                 470                 475                 480
Lys Ala Thr Ala Gly Leu Met Leu Glu Asp Leu Ile
                485                 490
<210>27
<211>296
<212>PRT
<213>噬夏孢欧文氏菌
<400>27
Met Ala Val Gly Ser Lys Ser Phe Ala Thr Ala Ser Lys Leu Phe Asp
1               5                   10                  15
Ala Lys Thr Arg Arg Ser Val Leu Met Leu Tyr Ala Trp Cys Arg His
            20                  25                  30
Cys Asp Asp Val Ile Asp Asp Gln Thr Leu Gly Phe Gln Ala Arg Gln
        35                  40                  45
Pro Ala Leu Gln Thr Pro Glu Gln Arg Leu Met Gln Leu Glu Met Lys
    50                  55                  60
Thr Arg Gln Ala Tyr Ala Gly Ser Gln Met His Glu Pro Ala Phe Ala
65                  70                  75                  80
Ala Phe Gln Glu Val Ala Met Ala His Asp Ile Ala Pro Ala Tyr Ala
                85                  90                  95
Phe Asp His Leu Glu Gly Phe Ala Met Asp Val Arg Glu Ala Gln Tyr
            100                 105                 110
Ser Gln Leu Asp Asp Thr Leu Arg Tyr Cys Tyr His Val Ala Gly Val
        115                 120                 125
Val Gly Leu Met Met Ala Gln Ile Met Gly Val Arg Asp Asn Ala Thr
    130                 135                 140
Leu Asp Arg Ala Cys Asp Leu Gly Leu Ala Phe Gln Leu Thr Asn Ile
145                 150                 155                 160
Ala Arg Asp Ile Val Asp Asp Ala His Ala Gly Arg Cys Tyr Leu Pro
                165                 170                 175
Ala Ser Trp Leu Glu His Glu Gly Leu Asn Lys Glu Asn Tyr Ala Ala
            180                 185                 190
Pro Glu Asn Arg Gln Ala Leu Ser Arg Ile Ala Arg Arg Leu Val Gln
        195                 200                 205
Glu Ala Glu Pro Tyr Tyr Leu Ser Ala Thr Ala Gly Leu Ala Gly Leu
    210                 215                 220
Pro Leu Arg Ser Ala Trp Ala Ile Ala Thr Ala Lys Gln Val Tyr Arg
225                 230                 235                 240
Lys Ile Gly Val Lys Val Glu Gln Ala Gly Gln Gln Ala Trp Asp Gln
                245                 250                 255
Arg Gln Ser Thr Thr Thr Pro Glu Lys Leu Thr Leu Leu Leu Ala Ala
            260                 265                 270
Ser Gly Gln Ala Leu Thr Ser Arg Met Arg Ala His Pro Pro Arg Pro
        275                 280                 285
Ala His Leu Trp Gln Arg Pro Leu
    290                 295
<210>28
<211>32
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(32)
<223>
<400>28
tttttctcga gcgataaacg ctcacttggt ta                                    32
<210>29
<211>32
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(32)
<223>
<400>29
tttttgtcga cacgttatgc tcacaacccc gg                                    32
<210>30
<211>679
<212>DNA
<213>大肠杆菌(Escherichia coli)
<220>
<221>CDS
<222>(87)..(635)
<223>
<400>30
ctcgagcgat aaacgctcac ttggttaatc atttcactct tcaattatct ataatgatga     60
gtgatcagaa ttacatgtga gaaatt atg caa acg gaa cac gtc att tta ttg     113
                             Met Gln Thr Glu His Val Ile Leu Leu
                             1               5
aat gca cag gga gtt ccc acg ggt acg ctg gaa aag tat gcc gca cac      161
Asn Ala Gln Gly Val Pro Thr Gly Thr Leu Glu Lys Tyr Ala Ala His
10                  15                  20                  25
acg gca gac acc cgc tta cat ctc gcg ttc tcc agt tgg ctg ttt aat      209
Thr Ala Asp Thr Arg Leu His Leu Ala Phe Ser Ser Trp Leu Phe Asn
                30                  35                  40
gcc aaa gga caa tta tta gtt acc cgc cgc gca ctg agc aaa aaa gca      257
Ala Lys Gly Gln Leu Leu Val Thr Arg Arg Ala Leu Ser Lys Lys Ala
            45                  50                  55
tgg cct ggc gtg tgg act aac tcg gtt tgt ggg cac cca caa ctg gga      305
Trp Pro Gly Val Trp Thr Asn Ser Val Cys Gly His Pro Gln Leu Gly
        60                  65                  70
gaa agc aac gaa gac gca gtg atc cgc cgt tgc cgt tat gag ctt ggc      353
Glu Ser Asn Glu Asp Ala Val Ile Arg Arg Cys Arg Tyr Glu Leu Gly
    75                  80                  85
gtg gaa att acg cct cct gaa tct atc tat cct gac ttt cgc tac cgc      401
Val Glu Ile Thr Pro Pro Glu Ser Ile Tyr Pro Asp Phe Arg Tyr Arg
90                  95                  100                 105
gcc acc gat ccg agt ggc att gtg gaa aat gaa gtg tgt ccg gta ttt      449
Ala Thr Asp Pro Ser Gly Ile Val Glu Asn Glu Val Cys Pro Val Phe
                110                 115                 120
gcc gca cgc acc act agt gcg tta cag atc aat gat gat gaa gtg atg      497
Ala Ala Arg Thr Thr Ser Ala Leu Gln Ile Asn Asp Asp Glu Val Met
            125                 130                 135
gat tat caa tgg tgt gat tta gca gat gta tta cac ggt att gat gcc      545
Asp Tyr Gln Trp Cys Asp Leu Ala Asp Val Leu His Gly Ile Asp Ala
        140                 145                 150
acg ccg tgg gcg ttc agt ccg tgg atg gtg atg cag gcg aca aat cgc       593
Thr Pro Trp Ala Phe Ser Pro Trp Met Val Met Gln Ala Thr Asn Arg
    155                 160                 165
gaa gcc aga aaa cga tta tct gca ttt acc cag ctt aaa taa               635
Glu Ala Arg Lys Arg Leu Ser Ala Phe Thr Gln Leu Lys
170                 175                 180
aaaaaccccg acatttgccg gggttgtgag cataacgtgt cgac                      679
<210>31
<211>182
<212>PRT
<213>大肠杆菌
<400>31
Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Thr
1               5                   10                  15
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
            20                  25                  30
Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val
        35                  40                  45
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
    50                  55                  60
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65                  70                  75                  80
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu
                85                  90                  95
Ser Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
            100                 105                 110
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
        115                 120                 125
Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
    130                 135                 140
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145                 150                 155                 160
Trp Met Val Met Gln Ala Thr Asn Arg Glu Ala Arg Lys Arg Leu Ser
                165                 170                 175
Ala Phe Thr Gln Leu Lys
            180
<210>32
<211>31
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(31)
<223>
<400>32
tttttccatg gtgaaggagg aaatagcgaa a                                     31
<210>33
<211>32
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(32)
<223>
<400>33
tttttaagct ttcacttttt tcttgtaacc aa                                    32
<210>34
<211>962
<212>DNA
<213>Archaeoglobus fulgidus
<220>
<221>CDS
<222>(3)..(956)
<223>
<400>34
cc atg gtg aag gag gaa ata gcg aaa agg gcc gaa ata atc aac aaa         47
   Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys
   1               5                   10                  15
gcc att gaa gag ctt ctg ccc gaa agg gag ccg att gga ctc tac aaa        95
Ala Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys
                20                  25                  30
gcc gca agg cat ctg atc aaa gca ggt ggc aag agg cta agg cct gta       143
Ala Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val
            35                  40                  45
ata agc ctc tta gca gtc gaa gcc ctt ggg aaa gac tac aga aag att       191
Ile Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile
        50                  55                  60
atc ccg gct gct gtc agc att gaa aca atc cac aac ttc acc ctc gtg       239
Ile Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val
    65                  70                  75
cat gac gac ata atg gac agg gac gag atg agg agg gga gtt ccg acg       287
His Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr
80                  85                  90                  95
gta cac agg gtt tat ggg gaa gcg acg gcc att tta gca ggc gac aca       335
Val His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr
                100                 105                 110
ctc ttt gct gaa gcc ttc aag ctg ctg aca aag tgc gat gtt gag agc       383
Leu Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser
            115                 120                 125
gag gga atc aga aaa gct aca gaa atg ctt tcg gac gtt tgc ata aaa       431
Glu Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys
        130                 135                 140
ata tgc gag ggg cag tac tac gac atg agc ttt gag aaa aag gag agc       479
Ile Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser
    145                 150                 155
gtt tcc gag gag gag tat ctc agg atg gtc gag ctg aag acc gga gtg       527
Val Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val
160                 165                 170                 175
ctg att gca gct tct gca gca tta cct gcg gtg ctt ttt ggg gag agc       575
Leu Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser
                180                 185                 190
gag gaa att gta aag gcg ctg tgg gac tac gga gtt ctt agc ggt att       623
Glu Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile
            195                 200                 205
ggc ttc cag atc cag gac gac ctg ctt gac ctg act gag gag acc gga       671
Gly Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly
        210                 215                 220
aag gac tgg gga agc gac ctg ctt aaa ggg aag aaa acc ctg att gtc       719
Lys Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val
    225                 230                 235
ata aag gcg ttc gaa aag gga gtg aag cta aag acg ttt gga aag gaa       767
Ile Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu
240                 245                 250                 255
aag gcg gac gtc tct gag att aga gat gat atc gaa aag tta aga gag       815
Lys Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu
                260                 265                 270
tgt ggt gcg att gat tac gct gcc agc atg gca aga aag atg gct gaa       863
Cys Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu
            275                 280                 285
gag gcg aaa aga aag ctc gaa gtt ctg cct gaa agc aaa gcc aag gaa       911
Glu Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu
        290                 295                 300
aca ctg ctg gaa ctt acc gac ttc ttg gtt aca aga aaa aag tga           956
Thr Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys
    305                 310                 315
aagctt                                                                962
<210>35
<211>317
<212>PRT
<213>Archaeoglobus  fulgidus
<400>35
Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys Ala
1               5                   10                  15
Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys Ala
            20                  25                  30
Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val Ile
        35                  40                  45
Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile Ile
    50                  55                  60
Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val His
65                  70                  75                  80
Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr Val
                85                  90                  95
His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr Leu
            100                 105                 110
Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser Glu
        115                 120                 125
Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys Ile
    130                 135                 140
Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser Val
145                 150                 155                 160
Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val Leu
                165                 170                 175
Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser Glu
            180                 185                 190
Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile Gly
        195                 200                 205
Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly Lys
    210                 215                 220
Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val Ile
225                 230                 235                 240
Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu Lys
                245                 250                 255
Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu Cys
            260                 265                 270
Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu Glu
        275                 280                 285
Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu Thr
    290                 295                 300
Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys
305                 310                 315
<210>36
<211>1293
<212>DNA
<213>Archaeoglobus fulgidus
<220>
<221>CDS
<222>(206)..(1159)
<223>
<400>36
taaaacgacg gccagtgagc gcgcgtaata cgactcacta tagggcgaat tgggtaccgg      60
gccccccctc gacgccgtcg ttcaatgaga atggataaga ggctcgtggg attgacgtga     120
gggggcaggg atggctatat ttctgggagc gaactccggg cgaggatcta gttgtaggga     180
gggattcatg acaccacaaa cagcc atg gtg aag gag gaa ata gcg aaa agg       232
                            Met Val Lys Glu Glu Ile Ala Lys Arg
                            1               5
gcc gaa ata atc aac aaa gcc att gaa gag ctt ctg ccc gaa agg gag       280
Ala Glu Ile Ile Asn Lys Ala Ile Glu Glu Leu Leu Pro Glu Arg Glu
10                  15                  20                  25
ccg att gga ctc tac aaa gcc gca agg cat ctg atc aaa gca ggt ggc       328
Pro Ile Gly Leu Tyr Lys Ala Ala Arg His Leu Ile Lys Ala Gly Gly
                30                  35                  40
aag agg cta agg cct gta ata agc ctc tta gca gtc gaa gcc ctt ggg       376
Lys Arg Leu Arg Pro Val Ile Ser Leu Leu Ala Val Glu Ala Leu Gly
            45                  50                  55
aaa gac tac aga aag att atc ccg gct gct gtc agc att gaa aca atc       424
Lys Asp Tyr Arg Lys Ile Ile Pro Ala Ala Val Ser Ile Glu Thr Ile
        60                  65                  70
cac aac ttc acc ctc gtg cat gac gac ata atg gac agg gac gag atg       472
His Asn Phe Thr Leu Val His Asp Asp Ile Met Asp Arg Asp Glu Met
    75                  80                  85
agg agg gga gtt ccg acg gta cac agg gtt tat ggg gaa gcg acg gcc       520
Arg Arg Gly Val Pro Thr Val His Arg Val Tyr Gly Glu Ala Thr Ala
90                  95                  100                 105
att tta gca ggc gac aca ctc ttt gct gaa gcc ttc aag ctg ctg aca       568
Ile Leu Ala Gly Asp Thr Leu Phe Ala Glu Ala Phe Lys Leu Leu Thr
                110                 115                 120
aag tgc gat gtt gag agc gag gga atc aga aaa gct aca gaa atg ctt       616
Lys Cys Asp Val Glu Ser Glu Gly Ile Arg Lys Ala Thr Glu Met Leu
            125                 130                 135
tcg gac gtt tgc ata aaa ata tgc gag ggg cag tac tac gac atg agc       664
Ser Asp Val Cys Ile Lys Ile Cys Glu Gly Gln Tyr Tyr Asp Met Ser
        140                 145                 150
ttt gag aaa aag gag agc gtt tcc gag gag gag tat ctc agg atg gtc       712
Phe Glu Lys Lys Glu Ser Val Ser Glu Glu Glu Tyr Leu Arg Met Val
    155                 160                 165
gag ctg aag acc gga gtg ctg att gca gct tct gca gca tta cct gcg       760
Glu Leu Lys Thr Gly Val Leu Ile Ala Ala Ser Ala Ala Leu Pro Ala
170                 175                 180                 185
gtg ctt ttt ggg gag agc gag gaa att gta aag gcg ctg tgg gac tac       808
Val Leu Phe Gly Glu Ser Glu Glu Ile Val Lys Ala Leu Trp Asp Tyr
                190                 195                 200
gga gtt ctt agc ggt att ggc ttc cag atc cag gac gac ctg ctt gac       856
Gly Val Leu Ser Gly Ile Gly Phe Gln Ile Gln Asp Asp Leu Leu Asp
            205                 210                 215
ctg act gag gag acc gga aag gac tgg gga agc gac ctg ctt aaa ggg       904
Leu Thr Glu Glu Thr Gly Lys Asp Trp Gly Ser Asp Leu Leu Lys Gly
        220                 225                 230
aag aaa acc ctg att gtc ata aag gcg ttc gaa aag gga gtg aag cta       952
Lys Lys Thr Leu Ile Val Ile Lys Ala Phe Glu Lys Gly Val Lys Leu
    235                 240                 245
aag acg ttt gga aag gaa aag gcg gac gtc tct gag att aga gat gat      1000
Lys Thr Phe Gly Lys Glu Lys Ala Asp Val Ser Glu Ile Arg Asp Asp
250                 255                 260                 265
atc gaa aag tta aga gag tgt ggt gcg att gat tac gct gcc agc atg      1048
Ile Glu Lys Leu Arg Glu Cys Gly Ala Ile Asp Tyr Ala Ala Ser Met
                270                 275                 280
gca aga aag atg gct gaa gag gcg aaa aga aag ctc gaa gtt ctg cct      1096
Ala Arg Lys Met Ala Glu Glu Ala Lys Arg Lys Leu Glu Val Leu Pro
            285                 290                 295
gaa agc aaa gcc aag gaa aca ctg ctg gaa ctt acc gac ttc ttg gtt      1144
Glu Ser Lys Ala Lys Glu Thr Leu Leu Glu Leu Thr Asp Phe Leu Val
        300                 305                 310
aca aga aaa aag tga aagcttcaat tgcatgctct agatgatcaa agaattcctg      1199
Thr Arg Lys Lys
    315
gcctagtcta taggaggttt tgaaaagaaa ggagcaataa tcattttctt gttctatcaa    1259
gagggtgcta ttgctccttt ctttttttct cgag                                1293
<210>37
<211>317
<212>PRT
<213>Archaeoglobus fulgidus
<400>37
Met Val Lys Glu Glu Ile Ala Lys Arg Ala Glu Ile Ile Asn Lys Ala
1               5                   10                  15
Ile Glu Glu Leu Leu Pro Glu Arg Glu Pro Ile Gly Leu Tyr Lys Ala
            20                  25                  30
Ala Arg His Leu Ile Lys Ala Gly Gly Lys Arg Leu Arg Pro Val Ile
        35                  40                  45
Ser Leu Leu Ala Val Glu Ala Leu Gly Lys Asp Tyr Arg Lys Ile Ile
    50                  55                  60
Pro Ala Ala Val Ser Ile Glu Thr Ile His Asn Phe Thr Leu Val His
65                  70                  75                  80
Asp Asp Ile Met Asp Arg Asp Glu Met Arg Arg Gly Val Pro Thr Val
                85                  90                  95
His Arg Val Tyr Gly Glu Ala Thr Ala Ile Leu Ala Gly Asp Thr Leu
            100                 105                 110
Phe Ala Glu Ala Phe Lys Leu Leu Thr Lys Cys Asp Val Glu Ser Glu
        115                 120                 125
Gly Ile Arg Lys Ala Thr Glu Met Leu Ser Asp Val Cys Ile Lys Ile
    130                 135                 140
Cys Glu Gly Gln Tyr Tyr Asp Met Ser Phe Glu Lys Lys Glu Ser Val
145                 150                 155                 160
Ser Glu Glu Glu Tyr Leu Arg Met Val Glu Leu Lys Thr Gly Val Leu
                165                 170                 175
Ile Ala Ala Ser Ala Ala Leu Pro Ala Val Leu Phe Gly Glu Ser Glu
            180                 185                 190
Glu Ile Val Lys Ala Leu Trp Asp Tyr Gly Val Leu Ser Gly Ile Gly
        195                 200                 205
Phe Gln Ile Gln Asp Asp Leu Leu Asp Leu Thr Glu Glu Thr Gly Lys
    210                 215                 220
Asp Trp Gly Ser Asp Leu Leu Lys Gly Lys Lys Thr Leu Ile Val Ile
225                 230                 235                 240
Lys Ala Phe Glu Lys Gly Val Lys Leu Lys Thr Phe Gly Lys Glu Lys
                245                 250                 255
Ala Asp Val Ser Glu Ile Arg Asp Asp Ile Glu Lys Leu Arg Glu Cys
            260                 265                 270
Gly Ala Ile Asp Tyr Ala Ala Ser Met Ala Arg Lys Met Ala Glu Glu
        275                 280                 285
Ala Lys Arg Lys Leu Glu Val Leu Pro Glu Ser Lys Ala Lys Glu Thr
    290                 295                 300
Leu Leu Glu Leu Thr Asp Phe Leu Val Thr Arg Lys Lys
305                 310                 315
<210>38
<211>35
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(35)
<223>
<400>38
gagctcttca ttatttcgat tttgatttcg tgacc                                 35
<210>39
<211>38
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(38)
<223>
<400>39
aagcttggtt gatcagaaga agaagaagaa gatgaact                              38
<210>40
<211>647
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<220>
<221>启动子
<222>(1)..(647)
<223>
<400>40
gagctcttca ttatttcgat tttgatttcg tgaccagcga acgcagaata ccttgttgtg      60
taatacttta cccgtgtaaa tcaaaaacaa aaaggctttt gagctttttg tagttgaatt     120
tctctggctg atcttttctg tacagattca tatatctgca gagacgatat cattgattat     180
ttgagcttct tttgaactat ttcgtgtaat ttgggatgag agctctatgt atgtgtgtaa     240
actttgaaga caacaagaaa ggtaacaagt gagggaggga tgactccatg tcaaaataga     300
tgtcataaga ggcccatcaa taagtgcttg agcccattag ctagcccagt aactaccaga     360
ttgtgagatg gatgtgtgaa cagttttttt tttgatgtag gactgaaatg tgaacaacag     420
gcgcatgaaa ggctaaatta ggacaatgat aagcagaaat aacttatcct ctctaacact     480
tggcctcaca ttgcccttca cacaatccac acacatccaa tcacaacctc atcatatatc     540
tcccgctaat ctttttttct ttgatctttt tttttttgct tattattttt ttgactttga     600
tctcccatca gttcatcttc ttcttcttct tctgatcaac caagctt                   647
<210>41
<211>28
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(28)
<223>
<400>41
gagctcactc actgatttcc attgcttg                                         28
<210>42
<211>23
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(23)
<223>
<400>42
aagcttttgt tgaagagatt tgg                                              23
<210>43
<211>37
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(37)
<223>
<400>43
cgccgttaag tcgatgtccg ttgatttaaa cagtgtc                               37
<210>44
<211>34
<212>DNA
<213>人工序列
<220>
<221>primer_bind
<222>(1)..(34)
<223>
<400>44
atcaacggac atcgacttaa cggcgtttgt aaac                                  34
<210>45
<211>777
<212>DNA
<213>拟南芥
<220>
<221>启动子
<222>(1)..(777)
<223>
<400>45
gagctcactc actgatttcc attgcttgaa aattgatgat gaactaagat caatccatgt      60
tagtttcaaa acaacagtaa ctgtggccaa cttagttttg aaacaacact aactggtcga     120
agcaaaaaga aaaaagagtt tcatcatata tctgatttga tggactgttt ggagttagga     180
ccaaacatta tctacaaaca aagacttttc tcctaacttg tgattccttc ttaaacccta     240
ggggtaatat tctattttcc aaggatcttt agttaaaggc aaatccggga aattattgta     300
atcatttggg gaaacatata aaagatttga gttagatgga agtgacgatt aatccaaaca     360
tatatatctc tttcttctta tttcccaaat taacagacaa aagtagaata ttggctttta     420
acaccaatat aaaaacttgc ttcacaccta aacacttttg tttactttag ggtaagtgca     480
aaaagccaac caaatccacc tgcactgatt tgacgtttac aaacgccgtt aagtcgatgt     540
ccgttgattt aaacagtgtc ttgtaattaa aaaaatcagt ttacataaat ggaaaattta     600
tcacttagtt ttcatcaact tctgaactta cctttcatgg attaggcaat actttccatt     660
tttagtaact caagtggacc ctttacttct tcaactccat ctctctcttt ctatttcact     720
tctttcttct cattatatct cttgtcctct ccaccaaatc tcttcaacaa aaagctt        777
<210>46
<211>804
<212>DNA
<213>聚球藻(Synechococcus)WH8102
<220>
<221>CDS
<222>(1)..(804)
<223>
<400>46
atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac        48
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc        96
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc       144
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg       192
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
ttg att ggc agc ttg att ctg ctc aga gca ttt ctg cac acc ggg ctg       240
Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu
65                  70                  75                  80
ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat       288
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca       336
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac ctg       384
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu
        115                 120                 125
gca ccg gag acg ttc cag gat cct gac tac caa cgt tgc acc aat aac       432
Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg       480
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc       528
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc       576
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc       624
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg       672
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac       720
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt       768
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
cag ctg cca caa ctt cga aat gaa tca ttc act tga                       804
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>47
<211>267
<212>PRT
<213>聚球藻WH8102
<400>47
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu
65                  70                  75                  80
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu
        115                 120                 125
Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>48
<211>804
<212>DNA
<213>人工变体
<220>
<221>CDS
<222>(1)..(804)
<223>
<400>48
atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac        48
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc        96
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc       144
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg       192
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
ttg att ggc agc ttg att ctg tgg cag acc ttt ctg cac acc ggg ctg       240
Leu Ile Gly Ser Leu Ile Leu Trp Gln Thr Phe Leu His Thr Gly Leu
65                  70                  75                  80
ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat       288
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca       336
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac ctg       384
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu
        115                 120                 125
gca ccg gag acg ttc cag gat cct gac tac caa cgt tgc acc aat aac       432
Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg       480
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc       528
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc       576
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc       624
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg       672
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac       720
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt       768
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
cag ctg cca caa ctt cga aat gaa tca ttc act tga                       804
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>49
<211>267
<212>PRT
<213>人工变体
<400>49
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
Leu Ile Gly Ser Leu Ile Leu Trp Gln Thr Phe Leu His Thr Gly Leu
65                  70                  75                  80
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Leu
        115                 120                 125
Ala Pro Glu Thr Phe Gln Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>50
<211>804
<212>DNA
<213>人工变体
<220>
<221>CDS
<222>(1)..(804)
<223>
<400>50
atg aaa acg aca aga tct att tcg tgg cca tcg act tgc tgg cat cac        48
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
cag ccg agt tgc tca agc tgg gtg gca aat gag ttc agc cct cag gcc        96
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
ctc aaa ggg ttg gct ctg gct ggt ctg att gga tca gcc tgg ctg ctc       144
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
tcc ctg ggc ctg agc tac acc ctg cca ctt gat cag acg cct ggg ctg       192
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
ttg att ggc agc ttg att ctg ctc aga gca ttt ctg cac acc ggg ctg       240
Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu
65                  70                  75                  80
ttc atc gtt gcc cac gat tcc atg cac gcc agt ctg gtt ccg ggt cat       288
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
ccc gga ttg aac cgc tgg atc ggc aaa gtg tat ttg ttg gtg tat gca       336
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
ggc ttg tct tat gag cgt tgt tcc cgc aac cac aga cgt cat cac gga       384
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Gly
        115                 120                 125
cat cct ggt act gat tta gat cct gac tac caa cgt tgc acc aat aac       432
His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
aac atc cta gat tgg tat gtt cac ttc atg ggc aac tat ctg ggc atg       480
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
cgg caa ctg tta aat cta agc tgt ctt tgg ctg gcg cta atc att ctc       528
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
aac ggt tct gat ctc cct gct cag atc atg cat ctg ctg ttg ttc agc       576
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
gtt ctg ccg ttg atc atc agt tcc tgt caa ttg ttt cta gtg gga acc       624
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
tgg tta ccc cac cga cgt ggg gcc acg aca cga ccg ggc gtg aca acg       672
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
cgc agc ctg gct ttg cat cca gcc ctc tct ttc gca gct tgt tac aac       720
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
ttt ggc tat cat cgt gaa cat cat gaa tcg cct tcc aca ccc tgg ttt       768
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
cag ctg cca caa ctt cga aat gaa tca ttc act tga                       804
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>51
<211>267
<212>PRT
<213>人工变体
<400>51
Met Lys Thr Thr Arg Ser Ile Ser Trp Pro Ser Thr Cys Trp His His
1               5                   10                  15
Gln Pro Ser Cys Ser Ser Trp Val Ala Asn Glu Phe Ser Pro Gln Ala
            20                  25                  30
Leu Lys Gly Leu Ala Leu Ala Gly Leu Ile Gly Ser Ala Trp Leu Leu
        35                  40                  45
Ser Leu Gly Leu Ser Tyr Thr Leu Pro Leu Asp Gln Thr Pro Gly Leu
    50                  55                  60
Leu Ile Gly Ser Leu Ile Leu Leu Arg Ala Phe Leu His Thr Gly Leu
65                  70                  75                  80
Phe Ile Val Ala His Asp Ser Met His Ala Ser Leu Val Pro Gly His
                85                  90                  95
Pro Gly Leu Asn Arg Trp Ile Gly Lys Val Tyr Leu Leu Val Tyr Ala
            100                 105                 110
Gly Leu Ser Tyr Glu Arg Cys Ser Arg Asn His Arg Arg His His Gly
        115                 120                 125
His Pro Gly Thr Asp Leu Asp Pro Asp Tyr Gln Arg Cys Thr Asn Asn
    130                 135                 140
Asn Ile Leu Asp Trp Tyr Val His Phe Met Gly Asn Tyr Leu Gly Met
145                 150                 155                 160
Arg Gln Leu Leu Asn Leu Ser Cys Leu Trp Leu Ala Leu Ile Ile Leu
                165                 170                 175
Asn Gly Ser Asp Leu Pro Ala Gln Ile Met His Leu Leu Leu Phe Ser
            180                 185                 190
Val Leu Pro Leu Ile Ile Ser Ser Cys Gln Leu Phe Leu Val Gly Thr
        195                 200                 205
Trp Leu Pro His Arg Arg Gly Ala Thr Thr Arg Pro Gly Val Thr Thr
    210                 215                 220
Arg Ser Leu Ala Leu His Pro Ala Leu Ser Phe Ala Ala Cys Tyr Asn
225                 230                 235                 240
Phe Gly Tyr His Arg Glu His His Glu Ser Pro Ser Thr Pro Trp Phe
                245                 250                 255
Gln Leu Pro Gln Leu Arg Asn Glu Ser Phe Thr
            260                 265
<210>52
<211>690
<212>DNA
<213>泡沫节球藻(Nodularia spumigena)NSOR10
<220>
<221>CDS
<222>(1)..(690)
<223>
<400>52
atg gcg atc gcc att att agt ata tgg gct atc agc cta ggt ttg tta        48
Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser Leu Gly Leu Leu
1               5                   10                  15
ctt tat att gat ata tcc caa ttc aag ttt tgg atg ttg tta ccg ctc        96
Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met Leu Leu Pro Leu
            20                  25                  30
ata ttt tgg caa aca ttt tta tat acg gga tta ttt att aca gct cat       144
Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
        35                  40                  45
gat gcc atg cat ggg gta gtt ttt ccc aaa aat ccc aaa atc aac cat       192
Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys Ile Asn His
    50                  55                  60
ttc att ggc tca ttg tgc ctg ttt ctt tat ggt ctt tta cct tat caa       240
Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gln
65                  70                  75                  80
aaa ctt tta aaa aag cat tgg cta cat cac cat aat cca gcc agt gaa       288
Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu
                85                  90                  95
aca gat cca gat ttt cac aac ggg aag cag aaa aac ttt ttt gct tgg       336
Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn Phe Phe Ala Trp
            100                 105                 110
tat tta tat ttt atg aag cgt tac tgg agt tgg tta caa att atc aca       384
Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gln Ile Ile Thr
        115                 120                 125
tta atg att att tat aac tta cta aaa tat ata tgg cat ttt cca gag       432
Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp His Phe Pro Glu
    130                 135                 140
gat aat atg act tat ttt tgg gta gtt ccc tca att tta agt tct tta       480
Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile Leu Ser Ser Leu
145                 150                 155                 160
caa tta ttt tat ttt gga act ttt cta ccc cac agt gag cct gta gaa       528
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu
                165                 170                 175
ggt tat aaa gag cct cat cgt tcc caa act att agc cgt ccc att tgg       576
Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser Arg Pro Ile Trp
            180                 185                 190
tgg tca ttt ata act tgt tac cat ttt ggt tat cat tac gaa cat cat       624
Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His
        195                 200                 205
gaa tac ccc cat gtt cct tgg tgg caa tta cca gaa att tat aaa atg       672
Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu Ile Tyr Lys Met
    210                 215                 220
tct aaa tca aat ttg tga                                               690
Ser Lys Ser Asn Leu
225
<210>53
<211>229
<212>PRT
<213>泡沫节球藻NSOR10
<400>53
Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser Leu Gly Leu Leu
1               5                   10                  15
Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met Leu Leu Pro Leu
            20                  25                  30
Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
        35                  40                  45
Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro Lys Ile Asn His
    50                  55                  60
Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu Leu Pro Tyr Gln
65                  70                  75                  80
Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Glu
                85                  90                  95
Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn Phe Phe Ala Trp
            100                 105                 110
Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu Gln Ile Ile Thr
        115                 120                 125
Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp His Phe Pro Glu
    130                 135                 140
Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile Leu Ser Ser Leu
145                 150                 155                 160
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Val Glu
                165                 170                 175
Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser Arg Pro Ile Trp
            180                 185                 190
Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Tyr Glu His His
        195                 200                 205
Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu Ile Tyr Lys Met
    210                 215                 220
Ser Lys Ser Asn Leu
225
<210>54
<211>37
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(37)
<223>
<400>54
gcgcatgcat ctagaaatga tccagttaga acaacca                               37
<210>55
<211>37
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(37)
<223>
<400>55
gcgcatgctc tagactattt tgctttgtaa atttctg                               37
<210>56
<211>792
<212>DNA
<213>点形念珠藻ATCC 29133
<220>
<221>CDS
<222>(5)..(775)
<223>
<400>56
gcgc atg cat cta gaa atg atc cag tta gaa caa cca ctc agt cat caa       49
     Met His Leu Glu Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln
     1                5                  10                  15
gca aaa ctg act cca gta ctg aga agt aaa tct cag ttt aag ggg ctt        97
Ala Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu
                20                  25                  30
ttc att gct att gtc att gtt agc gca tgg gtc att agc ctg agt tta       145
Phe Ile Ala Ile Val Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu
            35                  40                  45
tta ctt tcc ctt gac atc tca aag cta aaa ttt tgg atg tta ttg cct       193
Leu Leu Ser Leu Asp Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro
        50                  55                  60
gtt ata cta tgg caa aca ttt tta tat acg gga tta ttt att aca tct       241
Val Ile Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser
    65                  70                  75
cat gat gcc atg cat ggc gta gta ttt ccc caa aac acc aag att aat       289
His Asp Ala Met His Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn
80                  85                  90                  95
cat ttg att gga aca ttg acc cta tcc ctt tat ggt ctt tta cca tat       337
His Leu Ile Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr
                100                 105                 110
caa aaa cta ttg aaa aaa cat tgg tta cac cac cac aat cca gca agc       385
Gln Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser
            115                 120                 125
tca ata gac ccg gat ttt cac aat ggt aaa cac caa agt ttc ttt gct       433
Ser Ile Asp Pro Asp Phe His Asn Gly Lys His Gln Ser Phe Phe Ala
        130                 135                 140
tgg tat ttt cat ttt atg aaa ggt tac tgg agt tgg ggg caa ata att       481
Trp Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile
    145                 150                 155
gcg ttg act att att tat aac ttt gct aaa tac ata ctc cat atc cca       529
Ala Leu Thr Ile Ile Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro
160                 165                 170                 175
agt gat aat cta act tac ttt tgg gtg cta ccc tcg ctt tta agt tca       577
Ser Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser
                180                 185                 190
tta caa tta ttc tat ttt ggt act ttt tta ccc cat agt gaa cca ata       625
Leu Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile
            195                 200                 205
ggg ggt tat gtt cag cct cat tgt gcc caa aca att agc cgt cct att       673
Gly Gly Tyr Val Gln Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile
        210                 215                 220
tgg tgg tca ttt atc acg tgc tat cat ttt ggc tac cac gag gaa cat       72l
Trp Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Glu Glu His
    225                 230                 235
cac gaa tat cct cat att tct tgg tgg cag tta cca gaa att tac aaa       769
His Glu Tyr Pro His Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys
240                 245                 250                 255
gca aaa tagtctagag catgcgc                                            792
Ala Lys
<210>57
<211>257
<212>PRT
<213>点形念珠藻ATCC 29133
<400>57
Met His Leu Glu Met Ile Gln Leu Glu Gln Pro Leu Ser His Gln Ala
1               5                   10                  15
Lys Leu Thr Pro Val Leu Arg Ser Lys Ser Gln Phe Lys Gly Leu Phe
            20                  25                  30
Ile Ala Ile Val Ile Val Ser Ala Trp Val Ile Ser Leu Ser Leu Leu
        35                  40                  45
Leu Ser Leu Asp Ile Ser Lys Leu Lys Phe Trp Met Leu Leu Pro Val
    50                  55                  60
Ile Leu Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ser His
65                  70                  75                  80
Asp Ala Met His Gly Val Val Phe Pro Gln Asn Thr Lys Ile Asn His
                85                  90                  95
Leu Ile Gly Thr Leu Thr Leu Ser Leu Tyr Gly Leu Leu Pro Tyr Gln
            100                 105                 110
Lys Leu Leu Lys Lys His Trp Leu His His His Asn Pro Ala Ser Ser
        115                 120                 125
Ile Asp Pro Asp Phe His Asn Gly Lys His Gln Ser Phe Phe Ala Trp
    130                 135                 140
Tyr Phe His Phe Met Lys Gly Tyr Trp Ser Trp Gly Gln Ile Ile Ala
145                 150                 155                 160
Leu Thr Ile Ile Tyr Asn Phe Ala Lys Tyr Ile Leu His Ile Pro Ser
                165                 170                 175
Asp Asn Leu Thr Tyr Phe Trp Val Leu Pro Ser Leu Leu Ser Ser Leu
            180                 185                 190
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser Glu Pro Ile Gly
        195                 200                 205
Gly Tyr Val Gln Pro His Cys Ala Gln Thr Ile Ser Arg Pro Ile Trp
    210                 215                 220
Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His Glu Glu His His
225                 230                 235                 240
Glu Tyr Pro His Ile Ser Trp Trp Gln Leu Pro Glu Ile Tyr Lys Ala
                245                 250                 255
Lys
<210>58
<211>26
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(26)
<223>
<400>58
gtcgaccctg ctttaatgag atatgc                                           26
<210>59
<211>27
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(27)
<223>
<400>59
ctcgagcttg gacaatcagt aaattga                                          27
<210>60
<211>210
<212>DNA
<213>根癌农杆菌(Agrobacterium tumefaciens)
<220>
<221>终止子
<222>(1)..(210)
<223>
<400>60
gtcgaccctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa      60
ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt     120
tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc     180
cgttcaattt actgattgtc caagctcgag                                      210
<210>61
<211>37
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(37)
<223>
<400>61
cccgggaatt cttcattatt tcgattttga tttcgtg                               37
<210>62
<211>38
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(38)
<223>
<400>62
aagcttggtt gatcagaaga agaagaagaa gatgaact                              38
<210>63
<211>652
<212>DNA
<213>拟南芥
<220>
<221>启动子
<222>(1)..(652)
<223>
<400>63
cccgggaatt cttcattatt tcgattttga tttcgtgacc agcgaacgca gaataccttg      60
ttgtgtaata ctttacccgt gtaaatcaaa aacaaaaagg cttttgagct ttttgtagtt     120
gaatttctct ggctgatctt ttctgtacag attcatatat ctgcagagac gatatcattg     180
attatttgag cttcttttga actatttcgt gtaatttggg atgagagctc tatgtatgtg     240
tgtaaacttt gaagacaaca agaaaggtaa caagtgaggg agggatgact ccatgtcaaa     300
atagatgtca taagaggccc atcaataagt gcttgagccc attagctagc ccagtaacta     360
ccagattgtg agatggatgt gtgaacagtt ttttttttga tgtaggactg aaatgtgaac     420
aacaggcgca tgaaaggcta aattaggaca atgataagca gaaataactt atcctctcta     480
acacttggcc tcacattgcc cttcacacaa tccacacaca tccaatcaca acctcatcat     540
atatctcccg ctaatctttt tttctttgat cttttttttt ttgcttatta tttttttgac     600
tttgatctcc catcagttca tcttcttctt cttcttctga tcaaccaagc tt             652
<210>64
<211>29
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(29)
<223>
<400>64
gagctctagc gcaatcttat gtggtacaa                                        29
<210>65
<211>29
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(29)
<223>
<400>65
aagcttttct tgaaagtaaa gattgagtc                                        29
<210>66
<211>1773
<212>DNA
<213>碧冬茄(Petunia hybrida)
<220>
<221>启动子
<222>(1)..(1773)
<223>
<400>66
gagctctagc gcaatcttat gtggtacaaa tcttgattag tcgggaaaaa atgatgtggc      60
cctacaaatg gttggaggat gggagatttg gctctatcta gagttatgtg gttgttgaag     120
catttggtta ctctctgctg tggtagttgg catatccaca ttgtctcctt ccacttttat     180
gacaattacg tgaaagttat gggttgtttt gtctattttt gtcgaggcct ttcttttcct     240
tccaggttgt tgaagatggt ccaattcgat tagaataatg ttttgagctt tagcatattc     300
tctctcgttt acacgattat agtaataatg atataggatg acagaagttg acacataaat     360
tttttattct ctccatttac tttaatccaa atctcaccta ccctaaactt ctttaatatg     420
tattcaatag tctatccgag taaattgtaa atttaacaac cattgataat attgacacct     480
actaacatat actagtaaag agaatattaa catggcacat ataatttgat gcaaaatgag     540
tatgatgaaa tttaaaccca aaatctcttg attttgacag tgtcaccttg acttgttaac     600
taataagtca tgttttagtg gcagaaagac aaactcatcc accaactgta tagcaataaa     660
aaatagaaga atcttcctga ggcaaagttt tggaaaaatt aagagtggct gagatttaat     720
ttcaacagga attagttcca cttaactttt aggttacgat acagtgctaa ttaaataact     780
taattgtatt agatatttct tgcacctaaa aaatttaaaa actgaaaaaa ggtagcaatc     840
aaaataaaca aaaggacaaa ataagtgaaa ggtacagcca ccaaccctgg cggctcactg     900
tttgttggtt aaaacgtaga cttacaccta ccaaaatcta caactaaaat gaggcaataa     960
tactttgccc aaaattacca agaaaagaaa aagaaaggaa tcccttaata ttactctcct    1020
ccatttcaca ataaatatcc tagtttgact taaattagag tttaaaaaat gaaagacgac    1080
ttttaaaact tgtaatctaa aataaatcat agttaaatgt gtggctataa atcattgtat    1140
taacggtaaa gtggtaagtt taaaagttaa ttgttttcaa atataaaatt gtactatcat    1200
tctttttgga atggactaat aagaaaacta tgacatccat tatggagcgg agggagtatc    1260
tccttttaac aataaccttt gtcccttcaa ttcaattatc agtatgcaaa cattaaaaat    1320
tattattgat gttaagtacc acatcatcct taatgataga atcatcgtag aacgcttttc    1380
caggcacaca ttcaaactag ttagaccagt accacacatc gaatattcca gacttctttg    1440
tttgaatagt cgactacatt ggataatgga acttctcgaa ttaacttcga attagtcgag    1500
cccaaaataa tatatacgtc gggtggaaaa ctataaaatg tttgacaaaa atgtcaaatt    1560
aatatatcaa tctgcaacaa ccttttcacc ttgagaacac agctgaaatt ttttacaaag    1620
gtagttggtg aagctagtca gcgaatccca ttaccttcca ctctacctaa cccccttcac    1680
caacaacaaa tttctgtaat ttaaaaacta gccaaaaaag aactctcttt tacaaagagc    1740
caaagactca atctttactt tcaagaaaag ctt                                 1773
<210>67
<211>39
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(39)
<223>
<400>67
gcgcatgcat ctagaaatga atttttgtga taaaccagt                             39
<210>68
<211>37
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(37)
<223>
<400>68
gcgcatgctc tagattacga attggttact gaattgt                               37
<210>69
<211>819
<212>DNA
<213>点形念珠藻ATCC 29133
<220>
<221>CDS
<222>(5)..(802)
<223>
<400>69
gcgc atg cat cta gaa atg aat ttt tgt gat aaa cca gtt agc tat tat       49
     Met His Leu Glu Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr
     1               5                   10                  15
gtt gca ata gag caa tta agt gct aaa gaa gat act gtt tgg ggg ctg        97
Val Ala Ile Glu Gln Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu
                20                  25                  30
gtg att gtc ata gta att att agt ctt tgg gta gct agt ttg gct ttt       145
Val Ile Val Ile Val Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe
            35                  40                  45
tta cta gct att aat tat gcc aaa gtc cca att tgg ttg ata cct att       193
Leu Leu Ala Ile Asn Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile
        50                  55                  60
gca ata gtt tgg caa atg ttc ctt tat aca ggg cta ttt att act gca       241
Ala Ile Val Trp Gln Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala
    65                  70                  75
cat gat gct atg cat ggg tca gtt tat cgt aaa aat ccc aaa att aat       289
His Asp Ala Met His Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn
80                  85                  90                  95
aat ttt atc ggt tca cta gct gta gcg ctt tac gct gtg ttt cca tat       337
Asn Phe Ile Gly Ser Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr
                100                 105                 110
caa cag atg tta aag aat cat tgc tta cat cat cgt cat cct gct agc       385
Gln Gln Met Leu Lys Asn His Cys Leu His His Arg His Pro Ala Ser
            115                 120                 125
gaa gtt gac cca gat ttt cat gat ggt aag aga aca aac gct att ttc       433
Glu Val Asp Pro Asp Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe
        130                 135                 140
tgg tat ctc cat ttc atg ata gaa tac tcc agt tgg caa cag tta ata       481
Trp Tyr Leu His Phe Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile
    145                 150                 155
gta cta act atc cta ttt aat tta gct aaa tac gtt ttg cac atc cat       529
Val Leu Thr Ile Leu Phe Asn Leu Ala Lys Tyr Val Leu His Ile His
160                 165                 170                 175
caa ata aat ctc atc tta ttt tgg agt att cct cca att tta agt tcc       577
Gln Ile Asn Leu Ile Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser
                180                 185                 190
att caa ctg ttt tat ttc gga aca ttt ttg cct cat cga gaa ccc aag       625
Ile Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys
            195                 200                 205
aaa gga tat gtt tat ccc cat tgc agc caa aca ata aaa ttg cca act       673
Lys Gly Tyr Val Tyr Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr
        210                 215                 220
ttt ttg tca ttt atc gct tgc tac cac ttt ggt tat cat gaa gaa cat       721
Phe Leu Ser Phe Ile Ala Cys Tyr His Phe Gly Tyr His Glu Glu His
    225                 230                 235
cat gag tat ccc cat gta cct tgg tgg caa ctt cca tct gta tat aag       769
His Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys
240                 245                 250                 255
cag aga gta ttc aac aat tca gta acc aat tcg taatctagag catgcgc        819
Gln Arg Val Phe Asn Asn Ser Val Thr Asn Ser
                260                 265
<210>70
<211>266
<212>PRT
<213>点形念珠藻ATCC 29133
<400>70
Met His Leu Glu Met Asn Phe Cys Asp Lys Pro Val Ser Tyr Tyr Val
1               5                   10                  15
Ala Ile Glu Gln Leu Ser Ala Lys Glu Asp Thr Val Trp Gly Leu Val
            20                  25                  30
Ile Val Ile Val Ile Ile Ser Leu Trp Val Ala Ser Leu Ala Phe Leu
        35                  40                  45
Leu Ala Ile Asn Tyr Ala Lys Val Pro Ile Trp Leu Ile Pro Ile Ala
    50                  55                  60
Ile Val Trp Gln Met Phe Leu Tyr Thr Gly Leu Phe Ile Thr Ala His
65                  70                  75                  80
Asp Ala Met His Gly Ser Val Tyr Arg Lys Asn Pro Lys Ile Asn Asn
                85                  90                  95
Phe Ile Gly Ser Leu Ala Val Ala Leu Tyr Ala Val Phe Pro Tyr Gln
            100                 105                 110
Gln Met Leu Lys Asn His Cys Leu His His Arg His Pro Ala Ser Glu
        115                 120                 125
Val Asp Pro Asp Phe His Asp Gly Lys Arg Thr Asn Ala Ile Phe Trp
    130                 135                 140
Tyr Leu His Phe Met Ile Glu Tyr Ser Ser Trp Gln Gln Leu Ile Val
145                 150                 155                 160
Leu Thr Ile Leu Phe Asn Leu Ala Lys Tyr Val Leu His Ile His Gln
                165                 170                 175
Ile Asn Leu Ile Leu Phe Trp Ser Ile Pro Pro Ile Leu Ser Ser Ile
            180                 185                 190
Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Arg Glu Pro Lys Lys
        195                 200                 205
Gly Tyr Val Tyr Pro His Cys Ser Gln Thr Ile Lys Leu Pro Thr Phe
    210                 215                 220
Leu Ser Phe Ile Ala Cys Tyr His Phe Gly Tyr His Glu Glu His His
225                 230                 235                 240
Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Ser Val Tyr Lys Gln
                245                 250                 255
Arg Val Phe Asn Asn Ser Val Thr Asn Ser
            260                 265
<210>71
<211>33
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(33)
<223>
<400>71
gcgcatgcat ctagaaatgg cgatcgccat tat                                   33
<210>72
<211>32
<212>DNA
<213>人工序列
<220>
<221>引物
<222>(1)..(32)
<223>
<400>72
gcgcatgctc tagatcacaa atttgattta ga                                    32
<210>73
<211>720
<212>DNA
<213>泡沫节球藻NSOR10
<220>
<221>CDS
<222>(5)..(703)
<223>
<400>73
gcgc atg cat cta gaa atg gcg atc gcc att att agt ata tgg gct atc       49
     Met His Leu Glu Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile
     1               5                   10                  15
agc cta ggt ttg tta ctt tat att gat ata tcc caa ttc aag ttt tgg        97
Ser Leu Gly Leu Leu Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp
                20                  25                  30
atg ttg tta ccg ctc ata ttt tgg caa aca ttt tta tat acg gga tta       145
Met Leu Leu Pro Leu Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu
            35                  40                  45
ttt att aca gct cat gat gcc atg cat ggg gta gtt ttt ccc aaa aat       193
Phe Ile Thr Ala His Asp Ala Met His Gly Val Val Phe Pro Lys Asn
        50                  55                  60
ccc aaa atc aac cat ttc att ggc tca ttg tgc ctg ttt ctt tat ggt       241
Pro Lys Ile Asn His Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly
    65                  70                  75
ctt tta cct tat caa aaa ctt tta aaa aag cat tgg cta cat cac cat       289
Leu Leu Pro Tyr Gln Lys Leu Leu Lys Lys His Trp Leu His His His
80                  85                  90                  95
aat cca gcc agt gaa aca gat cca gat ttt cac aac ggg aag cag aaa       337
Asn Pro Ala Ser Glu Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys
                100                 105                 110
aac ttt ttt gct tgg tat tta tat ttt atg aag cgt tac tgg agt tgg       385
Asn Phe Phe Ala Trp Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp
            115                 120                 125
tta caa att atc aca tta atg att att tat aac tta cta aaa tat ata       433
Leu Gln Ile Ile Thr Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile
        130                 135                 140
tgg cat ttt cca gag gat aat atg act tat ttt tgg gta gtt ccc tca       481
Trp His Phe Pro Glu Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser
    145                 150                 155
att tta agt tct tta caa tta ttt tat ttt gga act ttt cta ccc cac       529
Ile Leu Ser Ser Leu Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His
160                 165                 170                 175
agt gag cct gta gaa ggt tat aaa gag cct cat cgt tcc caa act att       577
Ser Glu Pro Val Glu Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile
                180                 185                 190
agc cgt ccc att tgg tgg tca ttt ata act tgt tac cat ttt ggt tat       625
Ser Arg Pro Ile Trp Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr
            195                 200                 205
cat tac gaa cat cat gaa tac ccc cat gtt cct tgg tgg caa tta cca       673
His Tyr Glu His His Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro
        210                 215                 220
gaa att tat aaa atg tct aaa tca aat ttg tgatctagag catgcgc            720
Glu Ile Tyr Lys Met Ser Lys Ser Asn Leu
    225                 230
<210>74
<211>233
<212>PRT
<213>泡沫节球藻NSOR10
<400>74
Met His Leu Glu Met Ala Ile Ala Ile Ile Ser Ile Trp Ala Ile Ser
1                5                  10                  15
Leu Gly Leu Leu Leu Tyr Ile Asp Ile Ser Gln Phe Lys Phe Trp Met
            20                  25                  30
Leu Leu Pro Leu Ile Phe Trp Gln Thr Phe Leu Tyr Thr Gly Leu Phe
        35                  40                  45
Ile Thr Ala His Asp Ala Met His Gly Val Val Phe Pro Lys Asn Pro
    50                  55                  60
Lys Ile Asn His Phe Ile Gly Ser Leu Cys Leu Phe Leu Tyr Gly Leu
65                  70                  75                  80
Leu Pro Tyr Gln Lys Leu Leu Lys Lys His Trp Leu His His His Asn
                85                  90                  95
Pro Ala Ser Glu Thr Asp Pro Asp Phe His Asn Gly Lys Gln Lys Asn
            100                 105                 110
Phe Phe Ala Trp Tyr Leu Tyr Phe Met Lys Arg Tyr Trp Ser Trp Leu
        115                 120                 125
Gln Ile Ile Thr Leu Met Ile Ile Tyr Asn Leu Leu Lys Tyr Ile Trp
    130                 135                 140
His Phe Pro Glu Asp Asn Met Thr Tyr Phe Trp Val Val Pro Ser Ile
145                 150                 155                 160
Leu Ser Ser Leu Gln Leu Phe Tyr Phe Gly Thr Phe Leu Pro His Ser
                165                 170                 175
Glu Pro Val Glu Gly Tyr Lys Glu Pro His Arg Ser Gln Thr Ile Ser
            180                 185                 190
Arg Pro Ile Trp Trp Ser Phe Ile Thr Cys Tyr His Phe Gly Tyr His
        195                 200                 205
Tyr Glu His His Glu Tyr Pro His Val Pro Trp Trp Gln Leu Pro Glu
    210                 215                 220
Ile Tyr Lys Met Ser Lys Ser Asn Leu
225                 230

Claims (46)

1.通过培养遗传修饰的生物制备酮类胡萝卜素的方法,所述遗传修饰的生物与野生型相比具有改变的酮酶活力,此改变的酮酶活力由含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列的酮酶引起。
2.权利要求1的方法,其中使用作为野生型已经具有酮酶活力而遗传修饰使得相对于野生型而言酮酶活力增加的生物。
3.权利要求1的方法,其中相比于野生型,通过增加编码酮酶的核酸的基因表达来增强酮酶活力,其中所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列。
4.权利要求3的方法,其中相比于野生型,通过向生物引入编码酮酶的核酸来增强酮酶活力,所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列。
5.权利要求1的方法,其中使用作为野生型不具有酮酶活力的生物,而相对于此野生型而言遗传修饰造成酮酶活力。
6.权利要求5的方法,其中使用遗传修饰的生物,所述生物转基因表达含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列的酮酶。
7.权利要求5或6的方法,其中通过向生物引入编码酮酶的核酸造成基因表达,所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列。
8.权利要求5或7的方法,其中引入含有SEQ.ID.NO.1序列的核酸。
9.权利要求1到8之任一项的方法,其中所述生物相比于野生型还具有增加的至少一种选自羟化酶活力和β-环化酶活力的活力。
10.权利要求9的方法,其中为了额外增加至少一种所述活力,相比于野生型而言增加至少一种选自编码羟化酶的核酸和编码β-环化酶的核酸的核酸的基因表达。
11.权利要求10的方法,其中通过向生物引入至少一种核酸来增加基因表达,所述核酸选自编码羟化酶的核酸和编码β-环化酶的核酸。
12.权利要求11的方法,其中引入编码含有SEQ ID NO:16氨基酸序列或对SEQ ID NO:16序列进行置换、插入或缺失氨基酸后产生的与SEQID NO:16序列在氨基酸水平上具有至少20%一致性的序列的羟化酶的核酸作为编码羟化酶的核酸。
13.权利要求12的方法,其中引入含有SEQ ID NO:15序列的核酸。
14.权利要求11的方法,其中引入编码含有SEQ.ID.NO:18氨基酸序列或对SEQ.ID.NO:18序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO:18序列在氨基酸水平上具有至少20%一致性的序列的β-环化酶的核酸作为编码β-环化酶的核酸。
15.权利要求14的方法,其中引入含有SEQ ID NO:17序列的核酸。
16.权利要求1到15中任一项的方法,其中在培养后收获遗传修饰的生物,并随后从生物中分离酮类胡萝卜素。
17.权利要求1到16中任一项的方法,其中使用作为起始生物能够天然产生类胡萝卜素或通过遗传互补或代谢途径的调节而产生类胡萝卜素的生物。
18.权利要求1到17中任一项的方法,其中使用的生物是微生物或植物。
19.权利要求18的方法,其中使用的微生物是细菌、酵母、藻类或真菌。
20.权利要求19的方法,其中微生物选自埃希氏杆菌属、欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属、集胞藻属蓝细菌、假丝酵母属、酵母属、汉逊酵母属、法夫酵母属、毕赤酵母属、曲霉属、木霉属、阿舒囊霉属、脉孢菌属、布拉霉属、须霉属、镰孢霉属、红球藻属、三角褐指藻、团藻属和杜氏藻属。
21.权利要求18的方法,其中使用的生物是植物。
22.权利要求21的方法,其中使用选自毛茛科、小檗科、罂粟科、大麻科、蔷薇科、Fabaceae、亚麻科、葡萄科、十字花科、葫芦科、报春花科、石竹科、苋科、龙胆科、牻牛儿苗科、忍冬科、木犀科、旱金莲科、茄科、玄参科、菊科、百合科、石蒜科、禾本科、兰科、锦葵科、Illiaceae和唇形科的植物。
23.权利要求22的方法,其中使用选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属或百日草属的植物。
24.权利要求1到23中任一项的方法,其中酮类胡萝卜素选自虾青素、角黄素、海胆酮、3-羟基海胆酮、3’-羟基海胆酮、adonirubin和金盏花黄质。
25.遗传修饰的生物,其中遗传修饰:
A在野生型生物已经具有酮酶活力的情况下,相对于野生型增加酮酶活力,和
B在野生型生物不具有酮酶活力的情况下,相对于野生型造成酮酶活力,
并且在A中增加的或在B中造成的酮酶活力是由含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO:2序列在氨基酸水平上具有至少42%一致性的序列的酮酶引起的。
26.如权利要求25的遗传修饰生物,其中酮酶活力的增加或造成是通过相比于野生型,增加或造成编码酮酶的核酸的基因表达来实现的,其中所述核酸编码的酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列。
27.如权利要求26的遗传修饰生物,其中向生物引入编码酮酶的核酸来增加或造成该基因表达,所述酮酶含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列。
28.含有至少一个转基因核酸的遗传修饰的生物,所述核酸编码含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列的酮酶。
29.含有至少两个编码酮酶的内源核酸的遗传修饰的生物,所述核酸编码含有SEQ.ID.NO.2氨基酸序列或对SEQ.ID.NO.2序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.2序列在氨基酸水平上具有至少42%一致性的序列的酮酶。
30.如权利要求25到29中任一项的遗传修饰的生物,其中相比于野生型,遗传修饰还使至少一种选自羟化酶活力和β-环化酶活力的活力增加。
31.如权利要求25到30中任一项的遗传修饰的生物,其中作为起始生物时所述生物已能够天然产生类胡萝卜素或通过遗传互补来产生类胡萝卜素。
32.如权利要求25到31中任一项的遗传修饰的生物,其中所述生物选自微生物和植物。
33.权利要求32的遗传修饰的生物,其中微生物选自细菌、酵母、藻类和真菌。
34.权利要求33的遗传修饰的微生物,其中所述微生物选自埃希氏杆菌属、欧文氏菌属、农杆菌属、黄杆菌属、产碱菌属、副球菌属、念珠藻属、集胞藻属蓝细菌、假丝酵母属、酵母属、汉逊酵母属、毕赤酵母属、曲霉属、木霉属、阿舒囊霉属、脉孢菌属、布拉霉属、须霉属、镰孢霉属、红球藻属、三角褐指藻、团藻属和杜氏藻属。
35.权利要求32的遗传修饰的植物,其中所述植物选自毛茛科、小檗科、罂粟科、大麻科、蔷薇科、Fabaceae、亚麻科、葡萄科、十字花科、葫芦科、报春花科、石竹科、苋科、龙胆科、牻牛儿苗科、忍冬科、木犀科、旱金莲科、茄科、玄参科、菊科、百合科、石蒜科、禾本科、兰科、锦葵科、Illiaceae和唇形科。
36.权利要求35的遗传修饰的植物,其中所述植物选自万寿菊属、万寿菊、孔雀草、金合欢属、乌头属、侧金盏花属、阿尼菊属、耧斗菜属、紫菀属、黄芪属、紫葳属、金盏花属、驴蹄草属、风铃草属、美人蕉属、矢车菊属、桂竹香属、茼蒿属、柑桔属、还阳参属、番红花属、南瓜属、金雀儿属、Delonia属、翠雀属、石竹属、康乃馨属、多榔菊属、花菱草属、连翘属、Fremontia属、勋章菊属、钩吻属、染料木属、龙胆属、老鹳草属、非洲菊属、路边青属、银桦属、堆心菊属、向日葵属、细辛属、独活属、木槿属、赛菊芋属、金丝桃属、黄金菊属、凤仙花属、鸢尾属、蓝花楹属、棣堂属、毒豆属、山黧豆属、猫耳草属、百合属、亚麻属、百脉根属、番茄属、珍珠菜属、Maratia、苜蓿属、沟酸浆属、水仙属、月见草属、木犀属、碧冬茄属、石楠属、酸浆属、牧根草属、委陵草属、火棘属、毛茛属、杜鹃花属、蔷薇属、金光菊属、千里光属、蝇子草属、松香草属、Sinapsis、花楸属、鹰爪豆属、黄钟花属、蝴蝶草属、婆罗们参属、金莲花属、旱金莲属、郁金香属、款冬属、荆豆属、堇菜属和百日草属植物。
37.如权利要求25到36中任一项的遗传修饰的生物作为动物或人类食品的用途。
38.如权利要求25到36中任一项的遗传修饰的生物在生产含有酮类胡萝卜素的提取物或生产动物和人类食品增补剂中的用途。
39.一种酮酶,其含有SEQ.ID.NO.8的氨基酸序列或含有对SEQ.ID.NO.8序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.8序列在氨基酸水平上具有至少70%一致性的序列,条件是SEQ.ID NO.4氨基酸序列不存在。
40.一种酮酶,其含有SEQ.ID.NO.6的氨基酸序列或含有对SEQ.ID.NO.6序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.6序列在氨基酸水平上具有至少70%一致性的序列。
41.一种酮酶,其含有SEQ ID NO.12的氨基酸序列或含有对SEQ IDNO.12序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO.12序列在氨基酸水平上具有至少70%一致性的序列,条件是SEQ ID NO.6氨基酸序列不存在。
42.一种酮酶,其含有SEQ ID NO.49的氨基酸序列或含有对SEQ IDNO.49序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO.49序列在氨基酸水平上具有至少50%一致性的序列,条件是SEQ ID NO.47氨基酸序列不存在。
43.编码权利要求39到42中任一项的蛋白质的核酸,条件是SEQ IDNO:5序列不存在。
44.含有SEQ.ID.NO.4的氨基酸序列或对SEQ.ID.NO.4序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.4序列在氨基酸水平上具有至少70%一致性并具有酮酶性质的序列的蛋白质作为酮酶的用途。
45.含有SEQ.ID.NO.6氨基酸序列或对SEQ.ID.NO.6序列进行置换、插入或缺失氨基酸后产生的与SEQ.ID.NO.6序列在氨基酸水平上具有至少65%一致性并具有酮酶性质的序列的蛋白质作为酮酶的用途。
46.含有SEQ ID NO.47氨基酸序列或对SEQ ID NO.47序列进行置换、插入或缺失氨基酸后产生的与SEQ ID NO.47序列在氨基酸水平上具有至少50%一致性并具有酮酶性质的序列的蛋白质作为酮酶的用途。
CNA038242249A 2002-08-20 2003-08-18 在遗传修饰生物中制备酮类胡萝卜素的方法 Pending CN1688711A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
DE10238979.9 2002-08-20
DE10238980.2 2002-08-20
DE2002138980 DE10238980A1 (de) 2002-08-20 2002-08-20 Verfahren zur Herstellung von Ketocarotinoiden in Blütenblättern von Pflanzen
DE10238978.0 2002-08-20
DE10253112.9 2002-11-13
DE10258971.2 2002-12-16

Publications (1)

Publication Number Publication Date
CN1688711A true CN1688711A (zh) 2005-10-26

Family

ID=31197369

Family Applications (3)

Application Number Title Priority Date Filing Date
CNA038242249A Pending CN1688711A (zh) 2002-08-20 2003-08-18 在遗传修饰生物中制备酮类胡萝卜素的方法
CNA038243318A Pending CN1688712A (zh) 2002-08-20 2003-08-18 用于在植物的花中产生酮式类胡萝卜素的方法
CNA038243504A Pending CN1688713A (zh) 2002-08-20 2003-08-18 在植物果实中生产酮类胡萝卜素的方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CNA038243318A Pending CN1688712A (zh) 2002-08-20 2003-08-18 用于在植物的花中产生酮式类胡萝卜素的方法
CNA038243504A Pending CN1688713A (zh) 2002-08-20 2003-08-18 在植物果实中生产酮类胡萝卜素的方法

Country Status (2)

Country Link
CN (3) CN1688711A (zh)
DE (1) DE10238980A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104059008A (zh) * 2014-06-09 2014-09-24 上海交通大学 水仙花中β-胡萝卜素的提取分离方法
CN104293874B (zh) * 2014-09-23 2017-12-01 中国海洋大学 一种制备游离虾青素的方法
CN111909851A (zh) * 2020-07-09 2020-11-10 华南理工大学 基于杜氏盐藻代谢途径和雨生红球藻bkt的产虾青素工程菌及其构建方法与应用

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004007622A1 (de) * 2004-02-17 2005-08-25 Sungene Gmbh & Co. Kgaa Verfahren zur Herstellung von Ketocarotinoiden in genetisch veränderten, nicht-humanen Organismen
DE102004007623A1 (de) * 2004-02-17 2005-08-25 Sungene Gmbh & Co. Kgaa Promotoren zur Expression von Genen in Tagetes
CA2614659A1 (en) * 2005-07-11 2007-01-18 Commonwealth Scientific And Industrial Research Organisation Wheat pigment
CA3109156C (en) * 2014-05-16 2023-08-15 Academia Sinica Recombinant polynucleotide sequence for producing astaxanthin and uses thereof
US20190345520A1 (en) * 2016-12-16 2019-11-14 Deinove Methods of producing phytoene
CN117757815A (zh) * 2023-12-11 2024-03-26 昆明理工大学 一种华丽龙胆vigs体系的构建方法及其应用
CN117904151A (zh) * 2024-01-23 2024-04-19 宁夏农林科学院枸杞科学研究所 一种促进玉米黄素含量积累的LbaBCH2基因及其应用

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104059008A (zh) * 2014-06-09 2014-09-24 上海交通大学 水仙花中β-胡萝卜素的提取分离方法
CN104059008B (zh) * 2014-06-09 2016-08-24 上海交通大学 水仙花中β-胡萝卜素的提取分离方法
CN104293874B (zh) * 2014-09-23 2017-12-01 中国海洋大学 一种制备游离虾青素的方法
CN111909851A (zh) * 2020-07-09 2020-11-10 华南理工大学 基于杜氏盐藻代谢途径和雨生红球藻bkt的产虾青素工程菌及其构建方法与应用
CN111909851B (zh) * 2020-07-09 2022-06-14 华南理工大学 基于杜氏盐藻代谢途径和雨生红球藻bkt的产虾青素工程菌及其构建方法与应用

Also Published As

Publication number Publication date
CN1688712A (zh) 2005-10-26
CN1688713A (zh) 2005-10-26
DE10238980A1 (de) 2004-03-04

Similar Documents

Publication Publication Date Title
CN1675367A (zh) 制备玉米黄素和/或其生物合成中间体和/或次级产物的方法
CN1735686A (zh) 通过培养基因修饰生物制备酮类胡萝卜素的方法
CN1551914A (zh) 脂肪酸去饱和酶家族成员fad4、fad5、fad5-2和fad6及它们的应用
CN1656226A (zh) 用于产生不饱和脂肪酸的方法
CN1688711A (zh) 在遗传修饰生物中制备酮类胡萝卜素的方法
US20060194274A1 (en) Method for producing ketocarotinoids in genetically modified, non-human organisms
JP2007502605A6 (ja) 遺伝子的に改変された非ヒト生物におけるケトカロテノイドの製造方法
CN1863922A (zh) 在遗传修饰的非人生物中制备酮类胡萝卜素的方法
CN1688206A (zh) 含虾青素的万寿菊属植物或植物部分作为饲料的用途
US20080060096A1 (en) Novel Ketolases and Method for Producing Ketocarotinoids
EP2199399A1 (en) Production of ketocarotenoids in plants
DE10253112A1 (de) Verfahren zur Herstellung von Ketocarotinoiden in genetisch veränderten Organismen
CN1717173A (zh) 花瓣中的4-酮类胡萝卜素
WO2003080844A2 (de) Erhöhung des vitamin-e-gehalts in organismen durch erhöhung der 2-methyl-6-phytylhydrochinon-methyltransferase-aktivität
AU2004267196A1 (en) Method for producing ketocarotinoids in genetically modified, non-human organisms
EP1658372A2 (de) Ketolasen und verfahren zur herstellung von ketocarotinoiden
EP1658377A1 (de) VERFAHREN ZUR HERSTELLUNG VON KETOCAROTINOIDEN IN GENETISCH VER&amp;Auml;NDERTEN, NICHTHUMANEN ORGANISMEN

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication